Разделы документации

Безопасность и гуардрейлы

Раздел Настройки → Безопасность защищает виджет от злоупотреблений: ограничивает, где он работает, сколько сообщений принимает и как фильтрует нежелательное. Большинству достаточно настроек по умолчанию — но важно понимать, зачем они нужны.

Где можно показывать чат (разрешённые домены)

Белый список доменов, на которых виджету разрешено открываться. На других сайтах он просто не запустится.

  • Ваш сайт (из поля «Сайт компании» в «Общих» и адрес с онбординга) уже в списке — вместе со всеми поддоменами (*.example.com).
  • Добавить домен можно вручную: example.com или *.example.com.

Почему это важно. Ключ виджета виден в коде страницы. Без ограничения по доменам кто угодно может вставить ваш виджет на свой сайт и расходовать ваши кредиты. Поэтому держите в списке только свои домены.

⚠️ Если список пуст, чат открывается с любого сайта. Добавьте хотя бы один домен, чтобы защитить баланс.

Публичная ссылка на чат (/chat/...) — это отдельный канал, она доступна всем по дизайну и не зависит от списка доменов.

Защита от спама

Ограничивает, сколько сообщений один посетитель (один IP) может отправить за минуту — по умолчанию 30. Это не даёт ботам и скриптам заваливать агента запросами и жечь кредиты. Если замечаете подозрительную активность, лимит можно снизить.

Расширенные настройки (для разработчиков)

Свёрнутый блок с двумя группами: идентификация пользователя и защитные фильтры.

Идентификация пользователя

Относится к персонализации — когда данные залогиненного пользователя передаются виджету подписанным токеном.

  • Требовать валидную подпись. Если включить, данные без корректной подписи игнорируются (чат считается анонимным). По умолчанию выключено: данные сохраняются, но помечаются неподтверждёнными и не попадают в ответы бота.
  • Добавлять данные пользователя в промпт. Разрешает боту использовать имя, тариф и другие поля — только для подтверждённых пользователей.

Защитные фильтры (гуардрейлы)

Дополнительный слой проверок поверх модели — и на сообщениях посетителя, и на ответах бота. По умолчанию включены только базовые (защита от взлома промпта на входе и от утечки данных на выходе) — этого достаточно почти всем. Остальные правила — строгий режим, который включают вручную для чувствительных ниш; он может иногда заменять и нормальный ответ при ложном срабатывании.

Есть общий переключатель и выбор каналов, к которым применять фильтры (виджет, публичная ссылка, песочница). Сбор контактов (телефон, email, имя) работает всегда, независимо от фильтров.

Входные проверки (до ответа модели):

  • Prompt injection / jailbreakвключено по умолчанию. Жёстко блокирует попытки «взломать» агента: «забудь все инструкции», подмена роли и т.п.
  • Не по теме — выключено, режим «только мониторинг»: помечает оффтоп для аналитики, а отказывает мягко сама модель.
  • Оскорбления / угрозы — выключено, тоже только мониторинг.

Выходные проверки (на готовом ответе бота):

  • PII / секретывключено по умолчанию. Скрывает в ответе ключи, токены, номера карт, IBAN и не даёт случайно раскрыть данные других клиентов.
  • Недопустимые обещания — выключено. Аудитор может заменить ответ, если сочтёт цены, гарантии или сроки неподтверждёнными.
  • Держаться контекста (анти-галлюцинация) — выключено. Если мини-аудитор решит, что бот выдумал факты не из базы знаний, ответ заменяется на честный отказ. Повышает задержку ответа.

У каждого «жёсткого» правила есть своё сообщение-замена — что увидит посетитель при срабатывании.

Рекомендации

  • Обязательно держите свой домен в списке разрешённых — это главная защита кредитов.
  • Базовых фильтров (injection + PII) хватает большинству бизнесов.
  • Строгие проверки (анти-галлюцинация, недопустимые обещания) включайте точечно для чувствительных ниш — медицина, финансы, право — помня о возможных ложных срабатываниях и росте задержки.

Что дальше