
Как нейросети решают, чей бренд процитировать: разбор RAG-архитектуры поиска и что из этого следует для GEO
MaksimFomin 4 минуты назад Как нейросети решают, чей бренд процитировать: разбор RAG-архитектуры поиска и что из этого следует для GEO Средний 10 мин 147 Поисковая оптимизация * Машинное обучение * Развитие стартапа...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Вот важная новость с фронта ИИ: MaksimFomin 4 минуты назад Как нейросети решают, чей бренд процитировать: разбор RAG-архитектуры поиска и что из этого следует для GEO Средний 10 мин 147 Поисковая оптимизация * Машинное обучение * Развитие стартапа Аналитика Когда Алиса, ChatGPT или Perplexity отвечают пользователю и называют конкретный бренд, за этим стоит конвейер из нескольких алгоритмов извлечения и ранжирования. Я разобрал, как он устроен в Google, Bing и Яндексе, и собрал из этого практические выводы для GEO. Все ключевые цифры проверял по первоисточникам - где факт доказан публикацией, а где это исследовательское направление или вторичные данные, помечено отдельно.
Небольшой оффтоп - как я в это ввязалсяЯ всё ещё Макс Фомин из агентства Vverh. Прежде чем нырнём в архитектуру — небольшой оффтоп, как я вообще в это ввязался. Продвижением в нейросетях я заинтересовался ещё в сентябре 2024 года, и причина была почти бытовая.
Технические детали
Я заметил, что наша команда зумеров всё чаще идёт со своими вопросами - и личными, и профессиональными - не в поиск, а к нейронкам. Уже потом я разобрался, что в их решениях, помимо самих ответов ИИ, большую роль играют инфлюенсеры - но тогда меня зацепило именно смещение от поисковой строки к диалогу с моделью. Я сложил два и два и начал копать: как вообще продвигаться в нейросетях и на чём строятся их ответы.
И тут поймал момент, который всё запустил, - увидел, что один из ответов нейросеть собрала на нашем же контенте из блога Vverh. ответ нейросети, построенный на контенте блога Vverh. Digital Стало по-настоящему интересно.
Сам термин GEO тогда только набирал вес на Западе, а у нас о нём и слышать не хотели - зато все дружно начали терять трафик. С тех пор я и занимаюсь этим вплотную. Дальше - про то, как именно нейросети выбирают, чей контент процитировать Ещё небольшой нюанс, я ввожу вот такое разграничение: потому что по факту, факторы ранжирование либо из слива или из данных личного наблюдения и наши практиков.
Отраслевые последствия
Жирный шрифт - подтверждено первоисточником (arXiv, блог вендора)Курсив - research-направление или данные из вторичных публикацийОт списка ссылок к синтезу ответаКлассический поиск работал по схеме «сканирование - индексирование - ранжирование - список ссылок». SEO под него оптимизировало плотность ключевых слов, мета-теги, ссылочный профиль и поведенческие факторы. Генеративные движки - Google AI Overviews, Microsoft Copilot, Яндекс Нейро - работают иначе: они читают несколько источников и компилируют единый ответ.
Технологическое ядро этого сдвига - RAG. Модель не полагается только на веса, полученные при обучении, а динамически обращается к внешнему индексу: запрос трансформируется, извлекаются релевантные фрагменты (чанки), они объединяются с запросом в расширенный промпт, и генерируется ответ, заземлённый на извлечённых фактах с указанием источников. Это решает главную болезнь изолированных LLM - галлюцинации и отсутствие свежих данных.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





