×
Россия +7 (909) 261-97-71

Как поисковик может определить релевантность по связанным запросам

Россия +7 (909) 261-97-71
Шрифт:
0 8367
Подпишитесь на нас в MAX

Знаете ли вы, что поисковики могут пытаться убедиться в релевантности собственной выдачи? Как именно они это делают можно узнать из недавно одобренного патента Yahoo.

Прежде, чем перейти к описанию автоматической проверки релевантности и вариативности (распределения результатов по значениям в случае многозначного запроса), в патенте описываются недостатки ручной проверки и определения релевантности на основе данных о переходах.

Ручная проверка релевантности

Одним из вариантов проверки релевантности результатов поиска является проверка человеком результатов по каждому запросу. Это занимает довольно много времени, существует вероятность человеческой ошибки, а покрыть проверкой все запросы, встречающиеся в сети просто невозможно.

Даже сейчас можно найти объявления о вакансиях «Internet Judges». В частности, такие объявления размещала компания LionbridgeTechnologies, с которой ранее сотрудничали Google. Да, поисковые машины используют ручную проверку и систему «интернет судей». Людьми являются и футбольные судьи. Они никогда не ошибаются, правда?

Отслеживание переходов

В одном из патентов Yahoo описывается система ранжирования изображений, основанная на кликах по ним пользователей. Предполагается, что по релевантным запросу изображениям пользователь кликнет и перейдет на интересующую его страницу. Следовательно, в выдаче по запросу картинки, по которым чаще кликали, поднимались, а те, которые «незаслуженно» занимали высокие места, постепенно опускались вниз.

Что ж, с картинками, где существует предварительный просмотр, эта система вполне может работать эффективно. А что насчет текстовых страниц? Проблема в том, что люди видят в выдаче лишь заголовок страницы, краткую аннотацию и адрес страницы. Эти данные не обязательно адекватно представляют содержание страницы. Следовательно, даже переход по ссылке не гарантирует релевантность страницы в выдаче.

Алгоритм для определения релевантности и вариативности поисковых результатов

Процесс, запатентованный Yahoo, использует информацию недавних поисков для определения сочетаемости результатов поиска с текущим запросом.

Автоматическая проверка релевантности и вариативности для веб и вертикальных поисковых машин

Изобретено Jignashu G. Parikh

Принадлежит Yahoo

US Patent 7,558,787

Одобрено 7 июля, 2009

Подано на рассмотрение 5 июля, 2006

Аннотация

Представлена техника автоматической проверки релевантности и вариативности поисковых результатов.

Поисковой машине направляется запрос, на основании которого при помощи поискового алгоритма машина выдает поисковые результаты. Определяется набор топовых и связанных терминов для запроса. Для каждого связанного термина определяется его частота относительно остальных терминов в наборе. Если термин не встречается ни в одном из результатов, то случилась потеря в вариативности пропорциональная относительной частоте связанного термина.

Иначе, релевантность поисковых результатов вычисляется сравнением пропорции результатов, содержащих термин, с относительной частотой термина. Этот процесс повторяется для всех терминов в наборе или связанных терминов для того, чтобы получить полную картину релевантности и вариативности результатов.

После того, как пользователь нажимает кнопку поиска, поисковая машина выдает набор результатов, ранжированных согласно поисковому алгоритму. Алгоритм, используемый для ранжирования этих результатов, обычно включает в себя элементы измеряющие релевантность и важность страниц соответствующих искомому запросу.

Этот патент описывает интерфейс тестирования, который поисковые алгоритмы и разработчики поисковых машин смогут использовать для проверки вариативности и релевантности поисковых результатов.

Использование связанных терминов

Этот процесс определения релевантности и вариативности поисковых результатов начинается с определения терминов, которые могут быть связаны с искомым запросом.

Кто-то ищет «Amazon», поисковая машина получает результаты, связанные с запросом, и отображает их пользователю.

Появившиеся результаты могут относиться к магазину «Amazon.com» или к реке Амазонке. Автоматически точно определить требуется ли пользователю информация о первом, втором или чем-то третьем невозможно. Но поисковая машина может обратиться к логам запросов и сессий и другим наборам данных для определения различных значений запроса.

Именно эти суб-концепции вы можете увидеть в поисковом предположении поисковой машины. О том, как они формируются, мы уже писали ранее.

Также поисковые машины отслеживают время поиска запросов, что может быть полезным при поиске информации, зависящей от времени.

Так что если на Амазонке два месяца назад случилось землетрясение, то логи запросов того времени могут содержать много запросов «Amazon earthquake». Через месяц количество поисков по этому запросу будет гораздо меньше и «amazon earthquake» может уже не считаться связанным запросом, каковым он, несомненно, считался сразу после описанных событий.

Поиск в логах недавних запросов покажет, как много раз вводились запросы, влючавшие в себя или вводившиеся вместе с «Amazon». Так что если запросы «amazon books», «amazon river» и «amazon rainforest» часто встречались в исследуемых логах, то они будут отображены как связанные. Также поисковые машины могут проверять в логах, какие запросы вводились за одну сессию с запросом «Amazon».

Относительная частота терминов и проверка релевантности

Как только поисковая машина определила набор связанных терминов для запроса, она может вычислить относительную частоту каждого из этих терминов относительно оригинального запроса в логах поиска. Вот пример того, как может проходить такой подсчет. Выдержка из патента:

Например, обращаясь к таблице 216, F.sub.term термина «books» равняется 25. Это означает, что «books» встречается вместе с «Amazon» 25 раз в выбранной части лога запросов 210, показанного в таблице 212. Далее, F.sub.total равно 50, соответствуя общему числу совместных появлений для всех терминов в наборе таблицы 216.

Следовательно, можно сделать вывод, что F.sub.relative для термина «books» является 25/50 или 50%. Далее в таблице 216 содержатся относительные частоты всех терминов в наборе связанных терминов. Конкретнее, частота «rainforest» равна 12/50 или 24%, «river» 8/50 или 16%, и «fish» 5/50 или 10%.

Относительная частота терминов для каждого связанного термина в наборе также используется для определения вариативности. Эти соотношения могут быть использованы для оценки результатов поиска.

Если вы смотрите на топ-10 страницы выдачи (или контент найденных страниц) по запросу «amazon», то содержит ли половина результатов слово «books»? Содержит ли четверть из них слово «rainforest»? Упоминается ли слово «river» в двух из них? И есть ли хоть одно с упоминанием слова «fish»?

Если соотношения между логами запросов и результатами поиска почти совпадают, то это может служить признаком высокой релевантности выдачи. Также это свидетельствует о правильной вариативности.

В патенте также содержится предупреждение о том, что некоторые результаты поиска могут быть в высшей степени релевантны, но при этом страдать от недостатка вариативности в случае, если запрос не содержит множества значений, и связанные термины не относятся к различным темам.


Переводной материал, источник


Есть о чем рассказать? Тогда присылайте свои материалы Марине Ибушевой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Как ИИ усиливает маркетинг и помогает общаться с пользователем
Иван
1
комментарий
0
читателей
Полный профиль
Иван - Классная статья, забрал Хотелось бы услышать еще от эксперта мнение про модели в таком случае и дисперсию
Тренды e-commerce 2026: рынок ждет отток с маркетплейсов?
Арина
1
комментарий
0
читателей
Полный профиль
Арина - Мы пробовали разные сервисы, но уже давно используем этот сервис tryon.mall-er.com у них есть и Визуальный поиск и Виртуальная примерка. Мы пользуемся Виртуальной примеркой очков и поиском и внедрили себе на сайт, сейчас порядка 80% нашего трафика с удовольствием пользуются данными функциями.
SEO-анализ сайта – новый сервис для технического аудита сайта
Олег Алексеев
1
комментарий
0
читателей
Полный профиль
Олег Алексеев - Сюда t.me/obivaaan или сюда t.me/olegalexeyev
Накрутка ПФ vs Бизнес: как накрутка поведенческих факторов «убьет» ваш бизнес в интернете
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Вообще бред несут-пункт позиции и там и там суотрудничать,банов нет,риски и остальные пункты просто смешно,пф гораздо эффективнее чем платить в пиксель)))
Что будет с SEO в 2026: эксперты рынка подводят итоги и делают прогнозы на этот год
Марал Гаипова
142
комментария
0
читателей
Полный профиль
Марал Гаипова - Дмитрий, спасибо, эксперты и правда - топ)
Мы сократили рутину SEO-специалиста на 95% – вот архитектура, которая это сделала
Гостьkorayaskin
2
комментария
0
читателей
Полный профиль
Гостьkorayaskin - Можно также посмотреть разбор инструментов типа KeywordKick — помогает быстрее понять, где именно конфликт сигналов.
Классические ML-алгоритмы vs. GPT в SEO: сравнение подходов, плюсы и ограничения
Дмитрий Севальнев
0
комментариев
0
читателей
Полный профиль
Дмитрий Севальнев - Монументально!
Битрикс24 запускает бесплатный курс по вайбкодингу для гуманитариев
Ирина
1
комментарий
0
читателей
Полный профиль
Ирина - Хорошее решение для бизнеса
Полгода в MAX: взрывной рост каналов и аудитории
Игорь
2
комментария
0
читателей
Полный профиль
Игорь - Когда нужно быстро понять, что происходит с каналами в MAX можно зайти на сервис maxdash.ru/ Пользоваться очень удобно: видно рост подписчиков, охваты, вовлечённость, какие каналы сейчас реально растут. Всё собрано в одном месте, без лишней возни с таблицами. Помогает трезво оценивать результаты и принимать решения не «на глаз», а по цифрам.
Yandex Cloud сменил логотип и визуальный стиль
Гостьфы
1
комментарий
0
читателей
Полный профиль
Гостьфы - это че такое
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
393
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
142
Комментариев
130
Комментариев
121
Комментариев
100
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
66
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!