
Эволюция 'More Like This'
Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата.Пользователь открывает статью и хочет найти похожие материалы. Покупатель просматривает карточку товара и ищет...
В сфере искусственного интеллекта произошло заметное событие. Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата. Пользователь открывает статью и хочет найти похожие материалы. Покупатель просматривает карточку товара и ищет близкие варианты.
Инженер поддержки разбирает инцидент и хочет увидеть прошлые случаи с теми же симптомами. Во всех этих ситуациях у пользователя уже есть релевантный документ для начала поиска. Этот сценарий традиционно называют More Like This (MLT): функцией поиска документов, похожих на выбранный.
Технические детали
В статье под MLT понимается поиск от уже известного документа, а не от заново введённого запроса. Классический подход MLT (поиск похожих документов) основывался на сравнении текстовых совпадений. Современные реализации всё чаще используют эмбеддинги: числовые представления документов.
Поисковый индекс хранит эмбеддинги в виде векторов, а поисковая система может находить документы с близкими векторными представлениями.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.




