Безопасность и гуардрейлы
Раздел Настройки → Безопасность защищает виджет от злоупотреблений: ограничивает, где он работает, сколько сообщений принимает и как фильтрует нежелательное. Большинству достаточно настроек по умолчанию — но важно понимать, зачем они нужны.
Где можно показывать чат (разрешённые домены)
Белый список доменов, на которых виджету разрешено открываться. На других сайтах он просто не запустится.
- Ваш сайт (из поля «Сайт компании» в «Общих» и адрес с онбординга) уже в списке — вместе со всеми поддоменами (
*.example.com). - Добавить домен можно вручную:
example.comили*.example.com.
Почему это важно. Ключ виджета виден в коде страницы. Без ограничения по доменам кто угодно может вставить ваш виджет на свой сайт и расходовать ваши кредиты. Поэтому держите в списке только свои домены.
⚠️ Если список пуст, чат открывается с любого сайта. Добавьте хотя бы один домен, чтобы защитить баланс.
Публичная ссылка на чат (/chat/...) — это отдельный канал, она доступна всем по дизайну и не зависит от списка доменов.
Защита от спама
Ограничивает, сколько сообщений один посетитель (один IP) может отправить за минуту — по умолчанию 30. Это не даёт ботам и скриптам заваливать агента запросами и жечь кредиты. Если замечаете подозрительную активность, лимит можно снизить.
Расширенные настройки (для разработчиков)
Свёрнутый блок с двумя группами: идентификация пользователя и защитные фильтры.
Идентификация пользователя
Относится к персонализации — когда данные залогиненного пользователя передаются виджету подписанным токеном.
- Требовать валидную подпись. Если включить, данные без корректной подписи игнорируются (чат считается анонимным). По умолчанию выключено: данные сохраняются, но помечаются неподтверждёнными и не попадают в ответы бота.
- Добавлять данные пользователя в промпт. Разрешает боту использовать имя, тариф и другие поля — только для подтверждённых пользователей.
Защитные фильтры (гуардрейлы)
Дополнительный слой проверок поверх модели — и на сообщениях посетителя, и на ответах бота. По умолчанию включены только базовые (защита от взлома промпта на входе и от утечки данных на выходе) — этого достаточно почти всем. Остальные правила — строгий режим, который включают вручную для чувствительных ниш; он может иногда заменять и нормальный ответ при ложном срабатывании.
Есть общий переключатель и выбор каналов, к которым применять фильтры (виджет, публичная ссылка, песочница). Сбор контактов (телефон, email, имя) работает всегда, независимо от фильтров.
Входные проверки (до ответа модели):
- Prompt injection / jailbreak — включено по умолчанию. Жёстко блокирует попытки «взломать» агента: «забудь все инструкции», подмена роли и т.п.
- Не по теме — выключено, режим «только мониторинг»: помечает оффтоп для аналитики, а отказывает мягко сама модель.
- Оскорбления / угрозы — выключено, тоже только мониторинг.
Выходные проверки (на готовом ответе бота):
- PII / секреты — включено по умолчанию. Скрывает в ответе ключи, токены, номера карт, IBAN и не даёт случайно раскрыть данные других клиентов.
- Недопустимые обещания — выключено. Аудитор может заменить ответ, если сочтёт цены, гарантии или сроки неподтверждёнными.
- Держаться контекста (анти-галлюцинация) — выключено. Если мини-аудитор решит, что бот выдумал факты не из базы знаний, ответ заменяется на честный отказ. Повышает задержку ответа.
У каждого «жёсткого» правила есть своё сообщение-замена — что увидит посетитель при срабатывании.
Рекомендации
- Обязательно держите свой домен в списке разрешённых — это главная защита кредитов.
- Базовых фильтров (injection + PII) хватает большинству бизнесов.
- Строгие проверки (анти-галлюцинация, недопустимые обещания) включайте точечно для чувствительных ниш — медицина, финансы, право — помня о возможных ложных срабатываниях и росте задержки.
Что дальше
- Персонализация — данные залогиненных пользователей.
- Сбор лидов — как агент собирает контакты.