
Как не отдать рецепт крабсбургера ИИ: Guardrails-фильтр против утечек данных
sleshstesh 26 минут назад Как не отдать рецепт крабсбургера ИИ: Guardrails-фильтр против утечек данных Простой 8 мин 1.3K Блог компании Cloud.ru Искусственный интеллект Информационная безопасность * Управление...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. sleshstesh 26 минут назад Как не отдать рецепт крабсбургера ИИ: Guardrails-фильтр против утечек данных Простой 8 мин 1. 3K Блог компании Cloud. ru Искусственный интеллект Информационная безопасность * Управление разработкой * Разработка публичных облаков * Мнение ИИ, большие языковые модели, ассистенты, агенты — нам обещали безграничную свободу и автоматизацию, но на практике отсыпали еще больше ограничений, правил и страхов.
В итоге мы получаем длинные списки запретов, требований по безопасности и постоянно переживаем, что любой промпт может случайно спровоцировать утечку. Но я не хочу добавлять вам головной боли и нагнетать, поэтому расскажу про Guardrails как концепцию, а также про Guardrails-фильтр, который мы делаем в Cloud. Этот инструмент хоть и не снимает вообще все риски, но делает работу закрытого контура с ИИ предсказуемой и безопасной в разумных пределах.
Технические детали
А покажу его на примере всеми любимых мультфильмов и сказок (мы же не грустить сюда пришли? Что такое утечка и что такое GuardrailsНо чуть-чуть подушнить придется. Начнем с того, что вообще вызвало потребность в фильтрации и ограничениях.
Какие утечки нас должны пугатьВыделю три основных:Утечка через промпт. Когда сотрудник сам по ошибке или намеренно включает персональные данные, реквизиты, внутренние инструкции в запрос к БЯМ. Утечка через модель или сервис.
Модель обучалась на логах, которые не должны были туда попасть, и в некоторых ситуациях может раскрыть чужие данные. Утечка через интеграции. Логи, мониторинг, внешние подрядчики.
Отраслевые последствия
Что за зверь GuardrailsГлавная идея самой концепции Guardrails (ограничителя ИИ) — это слой правил и фильтров вокруг LLM, который контролирует, какие данные попадают в нее и что выходит из нее. В этом помогают три действия ограничителей:фильтрация и маскирование чувствительных данных на входе;проверка и фильтрация ответов, перед тем как отдать их пользователю;логирование, трассировка и аудит для расследований инцидентов. Здесь может возникнуть вопрос: в чем отличие Guardrails от DLP?
У DLP другая механика: он заточен под структурированные данные и классические каналы утечек — почту, файлообменники, USB-порты. А ИИ-ограничители работают с неструктурированным текстом и с требованиями к минимальной латентности — ответ не должен зависать на полминуты из-за проверки, иначе весь смысл быстрой и незаметной мидлвары пропадает. Как работает наш Guardrails-фильтрНа нашей апрельской конференции GoCloud 2026 мы рассказали про Guardrails-фильтр — конкретную реализацию Guardrails‑подхода, который помогает компаниям с закрытым контуром работать с популярными внешними моделями в сервисе Evolution Foundation Models (OpenAI, Claude, Gemini и др.
), но при этом контролировать, чтобы конфиденциальные данные случайно не утекли в открытый мир и не использовались для дообучения моделей.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





