×
Россия +7 (495) 139-20-33

Как поисковик может определить релевантность по связанным запросам

Россия +7 (495) 139-20-33
Шрифт:
0 7318
Подпишитесь на нас в Telegram

Знаете ли вы, что поисковики могут пытаться убедиться в релевантности собственной выдачи? Как именно они это делают можно узнать из недавно одобренного патента Yahoo.

Прежде, чем перейти к описанию автоматической проверки релевантности и вариативности (распределения результатов по значениям в случае многозначного запроса), в патенте описываются недостатки ручной проверки и определения релевантности на основе данных о переходах.

Ручная проверка релевантности

Одним из вариантов проверки релевантности результатов поиска является проверка человеком результатов по каждому запросу. Это занимает довольно много времени, существует вероятность человеческой ошибки, а покрыть проверкой все запросы, встречающиеся в сети просто невозможно.

Даже сейчас можно найти объявления о вакансиях «Internet Judges». В частности, такие объявления размещала компания LionbridgeTechnologies, с которой ранее сотрудничали Google. Да, поисковые машины используют ручную проверку и систему «интернет судей». Людьми являются и футбольные судьи. Они никогда не ошибаются, правда?

Отслеживание переходов

В одном из патентов Yahoo описывается система ранжирования изображений, основанная на кликах по ним пользователей. Предполагается, что по релевантным запросу изображениям пользователь кликнет и перейдет на интересующую его страницу. Следовательно, в выдаче по запросу картинки, по которым чаще кликали, поднимались, а те, которые «незаслуженно» занимали высокие места, постепенно опускались вниз.

Что ж, с картинками, где существует предварительный просмотр, эта система вполне может работать эффективно. А что насчет текстовых страниц? Проблема в том, что люди видят в выдаче лишь заголовок страницы, краткую аннотацию и адрес страницы. Эти данные не обязательно адекватно представляют содержание страницы. Следовательно, даже переход по ссылке не гарантирует релевантность страницы в выдаче.

Алгоритм для определения релевантности и вариативности поисковых результатов

Процесс, запатентованный Yahoo, использует информацию недавних поисков для определения сочетаемости результатов поиска с текущим запросом.

Автоматическая проверка релевантности и вариативности для веб и вертикальных поисковых машин

Изобретено Jignashu G. Parikh

Принадлежит Yahoo

US Patent 7,558,787

Одобрено 7 июля, 2009

Подано на рассмотрение 5 июля, 2006

Аннотация

Представлена техника автоматической проверки релевантности и вариативности поисковых результатов.

Поисковой машине направляется запрос, на основании которого при помощи поискового алгоритма машина выдает поисковые результаты. Определяется набор топовых и связанных терминов для запроса. Для каждого связанного термина определяется его частота относительно остальных терминов в наборе. Если термин не встречается ни в одном из результатов, то случилась потеря в вариативности пропорциональная относительной частоте связанного термина.

Иначе, релевантность поисковых результатов вычисляется сравнением пропорции результатов, содержащих термин, с относительной частотой термина. Этот процесс повторяется для всех терминов в наборе или связанных терминов для того, чтобы получить полную картину релевантности и вариативности результатов.

После того, как пользователь нажимает кнопку поиска, поисковая машина выдает набор результатов, ранжированных согласно поисковому алгоритму. Алгоритм, используемый для ранжирования этих результатов, обычно включает в себя элементы измеряющие релевантность и важность страниц соответствующих искомому запросу.

Этот патент описывает интерфейс тестирования, который поисковые алгоритмы и разработчики поисковых машин смогут использовать для проверки вариативности и релевантности поисковых результатов.

Использование связанных терминов

Этот процесс определения релевантности и вариативности поисковых результатов начинается с определения терминов, которые могут быть связаны с искомым запросом.

Кто-то ищет «Amazon», поисковая машина получает результаты, связанные с запросом, и отображает их пользователю.

Появившиеся результаты могут относиться к магазину «Amazon.com» или к реке Амазонке. Автоматически точно определить требуется ли пользователю информация о первом, втором или чем-то третьем невозможно. Но поисковая машина может обратиться к логам запросов и сессий и другим наборам данных для определения различных значений запроса.

Именно эти суб-концепции вы можете увидеть в поисковом предположении поисковой машины. О том, как они формируются, мы уже писали ранее.

Также поисковые машины отслеживают время поиска запросов, что может быть полезным при поиске информации, зависящей от времени.

Так что если на Амазонке два месяца назад случилось землетрясение, то логи запросов того времени могут содержать много запросов «Amazon earthquake». Через месяц количество поисков по этому запросу будет гораздо меньше и «amazon earthquake» может уже не считаться связанным запросом, каковым он, несомненно, считался сразу после описанных событий.

Поиск в логах недавних запросов покажет, как много раз вводились запросы, влючавшие в себя или вводившиеся вместе с «Amazon». Так что если запросы «amazon books», «amazon river» и «amazon rainforest» часто встречались в исследуемых логах, то они будут отображены как связанные. Также поисковые машины могут проверять в логах, какие запросы вводились за одну сессию с запросом «Amazon».

Относительная частота терминов и проверка релевантности

Как только поисковая машина определила набор связанных терминов для запроса, она может вычислить относительную частоту каждого из этих терминов относительно оригинального запроса в логах поиска. Вот пример того, как может проходить такой подсчет. Выдержка из патента:

Например, обращаясь к таблице 216, F.sub.term термина «books» равняется 25. Это означает, что «books» встречается вместе с «Amazon» 25 раз в выбранной части лога запросов 210, показанного в таблице 212. Далее, F.sub.total равно 50, соответствуя общему числу совместных появлений для всех терминов в наборе таблицы 216.

Следовательно, можно сделать вывод, что F.sub.relative для термина «books» является 25/50 или 50%. Далее в таблице 216 содержатся относительные частоты всех терминов в наборе связанных терминов. Конкретнее, частота «rainforest» равна 12/50 или 24%, «river» 8/50 или 16%, и «fish» 5/50 или 10%.

Относительная частота терминов для каждого связанного термина в наборе также используется для определения вариативности. Эти соотношения могут быть использованы для оценки результатов поиска.

Если вы смотрите на топ-10 страницы выдачи (или контент найденных страниц) по запросу «amazon», то содержит ли половина результатов слово «books»? Содержит ли четверть из них слово «rainforest»? Упоминается ли слово «river» в двух из них? И есть ли хоть одно с упоминанием слова «fish»?

Если соотношения между логами запросов и результатами поиска почти совпадают, то это может служить признаком высокой релевантности выдачи. Также это свидетельствует о правильной вариативности.

В патенте также содержится предупреждение о том, что некоторые результаты поиска могут быть в высшей степени релевантны, но при этом страдать от недостатка вариативности в случае, если запрос не содержит множества значений, и связанные термины не относятся к различным темам.


Переводной материал, источник


Друзья, теперь вы можете поддержать SEOnews https://pay.cloudtips.ru/p/8828f772
Ваши донаты помогут нам развивать издание и дальше радовать вас полезным контентом.

Есть о чем рассказать? Тогда присылайте свои материалы Марине Ибушевой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Примеры использования ChatGPT в SEO-стратегии
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Если кто то хочет протестировать Cat GPT в SЕО проектах на базе нашего агенства, приглашаем наудалкнную работу Tg: @thegoodlink
Почему сайтам нужно переезжать с конструкторов на полноценные CMS
Анна
1
комментарий
0
читателей
Полный профиль
Анна - Ха, занятно. А я еще видела полезное описание тут digitalproweb.ru/sozdanie-sajtov-vybrat-konstruktory-ili-cms
Как показывать рекламу посетителям сайтов конкурентов
Павел
2
комментария
0
читателей
Полный профиль
Павел - Спасибо за комментарий. Гипотеза была в том, что с указанными счетчиками конкурентов показы будут не просто похожей аудитории их сайтов (как при рекламе по доменам), а именно на аудиторию которую Яндекс для себя разметил как целевая дл сайтов конкурентов. Важно, это гипотеза. А про белые нитки, как говорится, доверяй, но проверяй))
Как мы увеличили для клиента трафик из поиска в 7 раз. Кейс
Кирилл Половников
2
комментария
0
читателей
Полный профиль
Кирилл Половников - Оба этих статуса (редирект и малополезная) преобладали в качестве проблем с индексацией. Помогла работа с .htaccess (в нем были ошибки и его чистили), работа над корректировкой редиректов, каноникалами и прочими техническими ошибками. Нельзя сказать, что только редиректы были ключевым препятствием.
Как в перегретой нише получать заявки и добиться конверсии в 19%
ZRZ8GCHIZ6 www.yandex.ru
1
комментарий
0
читателей
Полный профиль
ZRZ8GCHIZ6 www.yandex.ru - ZRZ8GCHIZ6 www.yandex.ru
Что такое Яндекс Советник, и кому от него жить хорошо
Мама Стифлера
1
комментарий
0
читателей
Полный профиль
Мама Стифлера - Вызывает сожаление, что вы не осознаете, что Яндекс.Советник может быть рассмотрен как форма рэкета, которая заставляет компании, размещающиеся в Яндекс.Маркете, выплачивать дополнительные финансовые средства, повышая в конечном итоге прибыль Яндекс.Маркета, но не принесет пользы для посетителей сайта.
Самые быстрорастущие доменные зоны в 2023 году. Исследование RU-CENTER
Станислав
1
комментарий
0
читателей
Полный профиль
Станислав - С 2019 года количество доменов в зоне .ru остается на одном и том же уровне - около 5 млн. Все изменения на уровне 1% от этого объема в плюс или минус
Как дожать сайт до ТОПа? Выжимаем весь сок из SEO под Яндекс и Google
Фанит
2
комментария
0
читателей
Полный профиль
Фанит - Спасибо автору за статью, полезно! По поводу сниппета сайта, для увеличения CTR можно дополнительно внедрить основные схемы микроразметки и улучшить его, чтобы выделялся на фоне конкурентов, особенно заметно в Google.
Особенности внутренней перелинковки для крупных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Haaaa! Articol despre "перелинковка" cu scopul de a acapara BackLink-uri. Înțeleg cu exemplele din zona ru, da chiar sa folosiți și md, panda, serios?
Можно ли продвигать сайт спонсорскими ссылками: разбор кейса
Александр
1
комментарий
0
читателей
Полный профиль
Александр - Хм.... ооочень сомнительный результат. За 10 000 в месяц получить 1 запрос в топ10, да ещё и в google, который на ссылки всегда лучше Яндекса реагировал - такое себе.... При этом достаточно странно были отобраны запросы с местами за ТОП50. Ведь давно известно же, что ссылки так быстро не сработают, к тому же за такое короткое время максимально, на что можно рассчитывать - это небольшое повышение средней. Поэтому тут логично было бы подобрать запросы, либо те, которые находятся близко к ТОП10, например на 11-15 местах, и посмотреть на их динамику. Либо на запросы, которые уже в топ10 находятся (5-10 места). Ведь после отключения контекста CTR в google кратно вырос и, например, разница 1 и 2-х местах отличается почти в два раза! Поэтому, если бы ссылки сработали на рост позиций с 5-10 мест, на 1-4 - это был бы кратный толк как в росте трафика, так и с точки зрения отдачи от вложений. Тем более как раз подвижки в 2-3 позиции уже дали бы ощутимый результат (если это, конечно не НЧ и микроНЧ запросы).... Так что считаю, эксперимент изначально был провальным уже на этапе отбора запросов.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
386
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
118
Комментариев
100
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
64
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!