Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата.Пользователь открывает статью и хочет найти похожие материалы. Покупатель просматривает карточку товара и ищет...

В сфере искусственного интеллекта произошло заметное событие. Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата. Пользователь открывает статью и хочет найти похожие материалы. Покупатель просматривает карточку товара и ищет близкие варианты.

Инженер поддержки разбирает инцидент и хочет увидеть прошлые случаи с теми же симптомами. Во всех этих ситуациях у пользователя уже есть релевантный документ для начала поиска. Этот сценарий традиционно называют More Like This (MLT): функцией поиска документов, похожих на выбранный.

Технические детали

В статье под MLT понимается поиск от уже известного документа, а не от заново введённого запроса. Классический подход MLT (поиск похожих документов) основывался на сравнении текстовых совпадений. Современные реализации всё чаще используют эмбеддинги: числовые представления документов.

Поисковый индекс хранит эмбеддинги в виде векторов, а поисковая система может находить документы с близкими векторными представлениями.

Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.

Эволюция 'More Like This'

Технические детали

Related Prediction Markets

Related News