Как определить LLM под капотом чат-бота: учебный эксперимент по black-box fingerprinting

Когда мы тестируем LLM‑приложение в режиме black box, мы видим только интерфейс: отправили сообщение — получили ответ. При этом модель под капотом может быть любой: DeepSeek, Qwen, GLM, Mistral, Llama, Claude, GPT,...

Related Prediction Markets

<5 — 2026'da uzaya kaç SpaceX Starship fırlatması ulaşacak?

→

Значимый прорыв формирует отрасль ИИ: Когда мы тестируем LLM‑приложение в режиме black box, мы видим только интерфейс: отправили сообщение — получили ответ. При этом модель под капотом может быть любой: DeepSeek, Qwen, GLM, Mistral, Llama, Claude, GPT, Gemini или локальная fine‑tuned модель.

Для обычного пользователя это часто неважно. Для security‑тестирования — важно.

Технические детали

В AI cybersecurity это часть reconnaissance: перед тем как оценивать устойчивость приложения к prompt injection, jailbreak‑попыткам, утечкам системного промпта или ошибкам в RAG‑слое, полезно понимать, какая модельная семья работает внутри. Разные модели по‑разному отвечают на странные Unicode‑строки, mixed‑language запросы, вопросы о собственной идентичности, спорные утверждения и безопасные отказы.

Я попробовал воспроизвести идею статьи LLMmap: Fingerprinting For Large Language Models в упрощённом виде: собрать одинаковые probe‑промпты с нескольких моделей OpenRouter и проверить, можно ли отличать модели по совокупности ответов.

Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.

SezgiX News — sezgix.com

Как определить LLM под капотом чат-бота: учебный эксперимент по black-box fingerprinting

Технические детали

Related Prediction Markets

Related News