Релевантность: оптимизатор знает, как повысят релевантность выдачи поисковые системы

Россия+7 (495) 960-65-87
Шрифт:
0 2237

Несмотря на столь “громкое” название, это лишь частная попытка рассмотрения такого основополагающего понятия как “релевантность”. Несмотря на это, я попытаюсь наиболее полно раскрыть это понятие, а также то, что непосредственно с ним связано.

Итак, релевантность есть степень соответствия результата поиска заданному запросу.

На первый взгляд, понятие это более чем очевидное для большинства. Но только на первый взгляд. На самом деле, в этом понятии не учтен один из ключевых элементов, точнее, он замаскирован за понятием “запрос”. Этот элемент - пользователь. Именно он задает запрос и ожидает получить определенный результат. Исходя из этого, мы можем дать более корректное определение: релевантность - степень соответствия результата поиска ожиданиям пользователя, выраженным в форме запроса. И разница между первым и вторым определением - огромна, т.к. в первом случае мы имеем дело с формальной релевантностью, а во втором - с реальной. Из этого мы получаем, что релевантность поиска изначально субъективна, т.е. ориентирована на конкретного пользователя. Но и это определение, на самом деле, не является исчерпывающим. Но, впрочем, обо всем по порядку.

Релевантость и типы запросов

Если рассмотреть запросы пользователей, то их принято делить на высокочастотные (ВЧ), среднечастотные (СЧ) и низкочастотные (НЧ). Разделение это происходит на основании оценки популярности того или иного запроса в определенной тематике. Но оно же весьма четко соответствует степени абстракции запросов. ВЧ - более абстрактные (в силу одно-двусловности), НЧ - более конкретные. Большая конкретность НЧ запросов подразумевает более четкое выражение пользователем своих ожиданий, а значит, задача сводится только к правильному пониманию запроса и выдачи соответствующего результата. Степень соответствия ожиданиям пользователя в этом случае будет максимальной.

Совершенно иная ситуация в случае ВЧ-запросов. Их высокая степень абстракции не позволяет однозначно определить ожидания пользователя, а значит, и предоставить ему релевантный результат. Исходя из этого, становится понятным, что принципы формирования результатов поиска по НЧ и ВЧ запросам должны серьезно отличаться.

Далее рассмотрим ВЧ запросы как самые неоднозначные и трудные в плане формирования результатов поиска. Для рассмотрения возьмем пример. Пользователь вводит запрос “работа”. Что это означает? А это означает, что его может интересовать:

а) поиск работы (сайты по устройству на работу, рекрутинговые агентства);

б) курсовая работа (сайты с рефератами, курсовыми и т.п., услуги по написанию курсовых);

в) удаленная работа (соответствующие ресурсы для фрилансеров);

г) исследования рынка труда и т.д.

Каждый из этих вариантов подразумевает принципиально разные категории сайтов. И узнать, что именно из этого ищет пользователь, основываясь только на анализе этого запроса, мы, в принципе, не можем. Точнее, это дело светлого будущего, когда станет внедряться персонализированный поиск, но пока до этого еще далеко.

Остается только одно - выдавать пользователю все подряд, чтобы он сам выбрал из этого то, что ему требуется. Вопрос только в том, что этого “всего подряд” может быть очень много. И тут может быть два варианта:

1) пользователь оказался настойчивым или ему повезло - и нужный результат оказался в числе первых. В этом случае он переходит по ссылке и с определенной натяжкой такой результат можно считать релевантным.

2) пользователь не захотел долго искать или нужного результата не было вообще. В этом случае он вводит новый запрос, более точно сформулированный.

И в первом, и во втором случае пользователь так или иначе указал, что именно он хотел найти. Со временем происходит накопление статистики в виде данных о переходах по ссылкам выдачи и более точных запросов. Их объединение позволяет получить общую картину распределения ожиданий пользователей. В этом случае можно пренебречь менее значимыми ожиданиями и формировать выдачу таким образом, чтобы учитывались основные. В этом случае выдача будет удовлетворять ожиданиям большинства пользователей, а значит, станет более релевантной. Казалось бы, все - проблема решена. Но, увы, не все так просто.

Самые внимательные, наверное, уже заметили изъян в ходе рассуждений. Переходы пользователя по ссылкам в выдаче говорят лишь о том, на какой сайт перешел пользователь, но это не говорит в явном, формализованном виде, что именно он искал. Для этого необходимо проанализировать уже сам сайт (страницу) и попытаться понять, что именно нашел там для себя пользователь. И тут нам на помощь приходит классификация. Именно она позволит нам классифицировать все сайты (страницы) и соотнести их с определенной группой или несколькими группами. Аналогичную классификацию можно провести и для уточняющих запросов. Например, запросы, содержащие “купить”, “продать”, можно соотнести с коммерческими сайтами, “где найти” - с навигационными и т.д. Таким образом, мы можем выражать ожидания пользователей уже не в виде конкретных запросов, многие из которых могут откровенно дублироваться (куплю слона, продажа слонов), а в виде однозначных классов. Это однозначно позволит улучшить релевантность результатов поиска для большинства пользователей. Но и это далеко не все. Вполне очевидно, что сайты, относящиеся к разным классам, необходимо по-разному оценивать при расчете их релевантности.

Релевантность и математика

В этом месте мы сталкиваемся еще с одним понятием релевантности, назовем ее математической, о котором я специально не стал говорить в начале. Эта релевантность является конкретной математической величиной, выражающей степень соответствия выбранного документа по заданному запросу методике ее оценки. Методика в данном случае выступает в роли абстрактного пользователя или даже группы пользователей. Т.е. она играет роль своеобразной модели ожиданий пользователей и их оценок релевантности. Замечу, что само соответствие модели и реальных ожиданий пользователей играет весьма важную роль, т.к. ее погрешность значительным образом влияет на итоговую, пользовательскую релевантность, определение которой давалось в самом начале.

После небольшого отступления возвращаемся к классификации документов (сайтов/страниц). Как уже говорил, разные типы сайтов оцениваются пользователями по- разному, а значит, и соответствующая модель, оценивающая релевантность сайтов данной группы, будет иметь свои отличия. Это, в свою очередь, означает несовпадение “шкал” оценки релевантности по разным моделям. С практической точки зрения это означает следующее.

Пользователь приходит в поисковую систему и задает свой запрос. Поисковая система получает его, анализирует и определяет основные группы документов, наиболее соответствующих ожиданиям пользователя. Далее по каждой группе документов осуществляется первичный отбор документов, содержащих искомое слово в тексте самого документа, либо соответствующего ему анкор-файла. Далее, среди групп отобранных документов, осуществляется расчет релевантности по модели, соответствующей определенной группе. Получаем несколько отранжированных групп, которые затем сливаются в общий список с учетом общих оценок ожиданий пользователя (методика слияния сама по себе представляет большой интерес, но в рамках этой статьи не вижу смысла останавливаться на этом подробнее).

Таким образом, на выходе мы получаем единый список документов, отранжированный по тематическим моделям и с учетом ожиданий пользователя. Как видно, приведения “шкал” разных тематических моделей к единой не потребовалось. И это вполне корректно, т.к. нельзя привести к единой шкале, например, оценки красоты картин и их стоимостей. Более того, попытка такого приведения только ухудшила бы поиск, т.к. нередкими могли быть ситуации, когда сайты одной группы (например, коммерческие) вытесняли полностью другие за счет большого значения математической релевантности.

Резюмируя все вышесказанное отмечу, что понятие релевантности отнюдь не такое простое, как кажется на первый взгляд. И уж тем более нельзя назвать простой задачу ее определения. Поисковые системы должны уметь не только считать математическую релевантность сайта (алгоритмы расчета которой так мечтают узнать оптимизаторы), но и строить точные математические модели ожиданий пользователей (пользовательская релевантность). Большинство оптимизаторов о второй не то что не думают, а даже не догадываются. А ведь она влияет на результаты поисковой выдачи не в меньшей степени, а может быть, и в большей.

P.S. Все написанное выше является результатом логических умозаключений, а потому может в какой-то степени расходиться с реальностью, либо полностью ей не соответствовать. И даже то, что написано, я не могу назвать полным и избыточным. Очень многие моменты затронуты поверхностно, либо обойдены вниманием. Но, как известно, нельзя объять необъятное.

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
    ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
    Рейтинг «Известность бренда SEO-компаний 2017»: народное голосование
    Иван
    1
    комментарий
    0
    читателей
    Полный профиль
    Иван - 1) IT-Agency 2) Пиксели 3) 1ps 4) Ингейт 5) Нетпики
    «Баден-Баден»: как выйти из-под фильтра
    Сергей Дембицкий «Sima-Land.ru»
    17
    комментариев
    0
    читателей
    Полный профиль
    Сергей Дембицкий «Sima-Land.ru» - Скрины Метрики показывать не буду, но мы (sima-land.ru - 1,5 млн. стр. в поиске Яндекс) в сентябре загремели под ББ, в разгар сезона и вышли из-под фильтра, спустя 50 дней, удалив все тексты с сайта: категории + карточки товаров (описание). Трафик с Google только вырос. Тексты возвращать собираемся, но процесс будет длительный, тексты будем теперь писать исключительно полезные, т.к. было больно :-))
    Второе дыхание ссылочного продвижения
    Автопилот
    14
    комментариев
    0
    читателей
    Полный профиль
    Автопилот - Еще лучше, когда продвижение осуществляется комплексно :)
    Кейс: продвигаем бизнес по продаже пластиковых окон в Москве
    Иван Стороженко
    5
    комментариев
    0
    читателей
    Полный профиль
    Иван Стороженко - 1. По началу вообще не использовали, сейчас уже много каналов используется. 2. Все может быть, в принципе сайты должны быть удобны для пользователя, для этого и нужна схожесть между собой. Честно говоря старались брать все самое интересное у конкурентов + подкреплять своими идеями.
    Западные специалисты выяснили, как повысить позиции ресурса в выдаче Google
    Максим Мирошник
    2
    комментария
    0
    читателей
    Полный профиль
    Максим Мирошник -
    «Прямая линия» с Александром Алаевым («АлаичЪ и Ко»): отвечаем на вопросы
    Александр Алаев
    13
    комментариев
    0
    читателей
    Полный профиль
    Александр Алаев - Роман. Тут ответ очень простой. Каждый запрос можно четко разделить на коммерческий или некоммерческий. "Купить слона" и его длинные хвосты - коммерческий. "Как выбрать слона" и подобные - информационные. Вот под коммерческие ключи должны быть страницы услуг или каталога товаров. А под информационку - блог. Очень важно не путать их, тем более несоответствующая коммерческим факторам страниц просто не продвинется, то есть по запросу с "купить" блог никогда не будет показываться в выдаче, так же как и страница услуги/товаров не покажется по "как выбрать". Понятно примерно?
    Инфографика: самые распространенные SEO-ошибки Рунета
    Dmitro Grunt
    2
    комментария
    0
    читателей
    Полный профиль
    Dmitro Grunt - Кстати, у проектов которые продвигает Нетпик все тайтлы не более 65 символов? Или вы надеетесь что кто то послушает советов и отдаст вам часть трафика? :-)
    7 причин не работать на биржах копирайтинга
    Dasha Shkaruba
    6
    комментариев
    0
    читателей
    Полный профиль
    Dasha Shkaruba - Спасибо за мнение! Кстати, на бирже главреда прием анкет закрыт
    «Прямая линия» с Артуром Латыповым: отвечаем на вопросы
    God Koss
    1
    комментарий
    0
    читателей
    Полный профиль
    God Koss - Добрый день! Есть сайты одной компании продвигающиеся в разных странах. .ru .com .net. На российском сайте два языка ru и en, на остальных до 10 языков. Недавно сайт ru по основному брендовому запросу выпал из выдачи Яндекс но после апа вернулся на вторую позицию. На вопрос аффилирования в тех поддержку, получит ответ, что всё в порядке и сайт com не учавствует в выдаче. Но он есть и занимает 1 место. Как быть в данной ситуации? Так же, после возврата в топ 10 по этому запросу зашла еще одна внутренняя страница. Могло ли это случиться из-за каннибализации запроса? Немного изменил description на внутренней, исключил вхождения брендового запроса. Жду апа. Хотел бы услышать ваше мнение. Заранее благодарю!
    Google.ru внесли в реестр запрещенных сайтов
    Гость
    1
    комментарий
    0
    читателей
    Полный профиль
    Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
    ТОП КОММЕНТАТОРОВ
    Комментариев
    910
    Комментариев
    834
    Комментариев
    554
    Комментариев
    540
    Комментариев
    483
    Комментариев
    373
    Комментариев
    314
    Комментариев
    262
    Комментариев
    229
    Комментариев
    171
    Комментариев
    156
    Комментариев
    137
    Комментариев
    121
    Комментариев
    97
    Комментариев
    97
    Комментариев
    95
    Комментариев
    80
    Комментариев
    78
    Комментариев
    67
    Комментариев
    60
    Комментариев
    59
    Комментариев
    55
    Комментариев
    54
    Комментариев
    52
    Комментариев
    49

    Отправьте отзыв!
    Отправьте отзыв!