Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:

Релевантность: оптимизатор знает, как повысят релевантность выдачи поисковые системы

Россия +7 (495) 960-65-87
Шрифт:
0 1894

Несмотря на столь “громкое” название, это лишь частная попытка рассмотрения такого основополагающего понятия как “релевантность”. Несмотря на это, я попытаюсь наиболее полно раскрыть это понятие, а также то, что непосредственно с ним связано.

Итак, релевантность есть степень соответствия результата поиска заданному запросу.

На первый взгляд, понятие это более чем очевидное для большинства. Но только на первый взгляд. На самом деле, в этом понятии не учтен один из ключевых элементов, точнее, он замаскирован за понятием “запрос”. Этот элемент - пользователь. Именно он задает запрос и ожидает получить определенный результат. Исходя из этого, мы можем дать более корректное определение: релевантность - степень соответствия результата поиска ожиданиям пользователя, выраженным в форме запроса. И разница между первым и вторым определением - огромна, т.к. в первом случае мы имеем дело с формальной релевантностью, а во втором - с реальной. Из этого мы получаем, что релевантность поиска изначально субъективна, т.е. ориентирована на конкретного пользователя. Но и это определение, на самом деле, не является исчерпывающим. Но, впрочем, обо всем по порядку.

Релевантость и типы запросов

Если рассмотреть запросы пользователей, то их принято делить на высокочастотные (ВЧ), среднечастотные (СЧ) и низкочастотные (НЧ). Разделение это происходит на основании оценки популярности того или иного запроса в определенной тематике. Но оно же весьма четко соответствует степени абстракции запросов. ВЧ - более абстрактные (в силу одно-двусловности), НЧ - более конкретные. Большая конкретность НЧ запросов подразумевает более четкое выражение пользователем своих ожиданий, а значит, задача сводится только к правильному пониманию запроса и выдачи соответствующего результата. Степень соответствия ожиданиям пользователя в этом случае будет максимальной.

Совершенно иная ситуация в случае ВЧ-запросов. Их высокая степень абстракции не позволяет однозначно определить ожидания пользователя, а значит, и предоставить ему релевантный результат. Исходя из этого, становится понятным, что принципы формирования результатов поиска по НЧ и ВЧ запросам должны серьезно отличаться.

Далее рассмотрим ВЧ запросы как самые неоднозначные и трудные в плане формирования результатов поиска. Для рассмотрения возьмем пример. Пользователь вводит запрос “работа”. Что это означает? А это означает, что его может интересовать:

а) поиск работы (сайты по устройству на работу, рекрутинговые агентства);

б) курсовая работа (сайты с рефератами, курсовыми и т.п., услуги по написанию курсовых);

в) удаленная работа (соответствующие ресурсы для фрилансеров);

г) исследования рынка труда и т.д.

Каждый из этих вариантов подразумевает принципиально разные категории сайтов. И узнать, что именно из этого ищет пользователь, основываясь только на анализе этого запроса, мы, в принципе, не можем. Точнее, это дело светлого будущего, когда станет внедряться персонализированный поиск, но пока до этого еще далеко.

Остается только одно - выдавать пользователю все подряд, чтобы он сам выбрал из этого то, что ему требуется. Вопрос только в том, что этого “всего подряд” может быть очень много. И тут может быть два варианта:

1) пользователь оказался настойчивым или ему повезло - и нужный результат оказался в числе первых. В этом случае он переходит по ссылке и с определенной натяжкой такой результат можно считать релевантным.

2) пользователь не захотел долго искать или нужного результата не было вообще. В этом случае он вводит новый запрос, более точно сформулированный.

И в первом, и во втором случае пользователь так или иначе указал, что именно он хотел найти. Со временем происходит накопление статистики в виде данных о переходах по ссылкам выдачи и более точных запросов. Их объединение позволяет получить общую картину распределения ожиданий пользователей. В этом случае можно пренебречь менее значимыми ожиданиями и формировать выдачу таким образом, чтобы учитывались основные. В этом случае выдача будет удовлетворять ожиданиям большинства пользователей, а значит, станет более релевантной. Казалось бы, все - проблема решена. Но, увы, не все так просто.

Самые внимательные, наверное, уже заметили изъян в ходе рассуждений. Переходы пользователя по ссылкам в выдаче говорят лишь о том, на какой сайт перешел пользователь, но это не говорит в явном, формализованном виде, что именно он искал. Для этого необходимо проанализировать уже сам сайт (страницу) и попытаться понять, что именно нашел там для себя пользователь. И тут нам на помощь приходит классификация. Именно она позволит нам классифицировать все сайты (страницы) и соотнести их с определенной группой или несколькими группами. Аналогичную классификацию можно провести и для уточняющих запросов. Например, запросы, содержащие “купить”, “продать”, можно соотнести с коммерческими сайтами, “где найти” - с навигационными и т.д. Таким образом, мы можем выражать ожидания пользователей уже не в виде конкретных запросов, многие из которых могут откровенно дублироваться (куплю слона, продажа слонов), а в виде однозначных классов. Это однозначно позволит улучшить релевантность результатов поиска для большинства пользователей. Но и это далеко не все. Вполне очевидно, что сайты, относящиеся к разным классам, необходимо по-разному оценивать при расчете их релевантности.

Релевантность и математика

В этом месте мы сталкиваемся еще с одним понятием релевантности, назовем ее математической, о котором я специально не стал говорить в начале. Эта релевантность является конкретной математической величиной, выражающей степень соответствия выбранного документа по заданному запросу методике ее оценки. Методика в данном случае выступает в роли абстрактного пользователя или даже группы пользователей. Т.е. она играет роль своеобразной модели ожиданий пользователей и их оценок релевантности. Замечу, что само соответствие модели и реальных ожиданий пользователей играет весьма важную роль, т.к. ее погрешность значительным образом влияет на итоговую, пользовательскую релевантность, определение которой давалось в самом начале.

После небольшого отступления возвращаемся к классификации документов (сайтов/страниц). Как уже говорил, разные типы сайтов оцениваются пользователями по- разному, а значит, и соответствующая модель, оценивающая релевантность сайтов данной группы, будет иметь свои отличия. Это, в свою очередь, означает несовпадение “шкал” оценки релевантности по разным моделям. С практической точки зрения это означает следующее.

Пользователь приходит в поисковую систему и задает свой запрос. Поисковая система получает его, анализирует и определяет основные группы документов, наиболее соответствующих ожиданиям пользователя. Далее по каждой группе документов осуществляется первичный отбор документов, содержащих искомое слово в тексте самого документа, либо соответствующего ему анкор-файла. Далее, среди групп отобранных документов, осуществляется расчет релевантности по модели, соответствующей определенной группе. Получаем несколько отранжированных групп, которые затем сливаются в общий список с учетом общих оценок ожиданий пользователя (методика слияния сама по себе представляет большой интерес, но в рамках этой статьи не вижу смысла останавливаться на этом подробнее).

Таким образом, на выходе мы получаем единый список документов, отранжированный по тематическим моделям и с учетом ожиданий пользователя. Как видно, приведения “шкал” разных тематических моделей к единой не потребовалось. И это вполне корректно, т.к. нельзя привести к единой шкале, например, оценки красоты картин и их стоимостей. Более того, попытка такого приведения только ухудшила бы поиск, т.к. нередкими могли быть ситуации, когда сайты одной группы (например, коммерческие) вытесняли полностью другие за счет большого значения математической релевантности.

Резюмируя все вышесказанное отмечу, что понятие релевантности отнюдь не такое простое, как кажется на первый взгляд. И уж тем более нельзя назвать простой задачу ее определения. Поисковые системы должны уметь не только считать математическую релевантность сайта (алгоритмы расчета которой так мечтают узнать оптимизаторы), но и строить точные математические модели ожиданий пользователей (пользовательская релевантность). Большинство оптимизаторов о второй не то что не думают, а даже не догадываются. А ведь она влияет на результаты поисковой выдачи не в меньшей степени, а может быть, и в большей.

P.S. Все написанное выше является результатом логических умозаключений, а потому может в какой-то степени расходиться с реальностью, либо полностью ей не соответствовать. И даже то, что написано, я не могу назвать полным и избыточным. Очень многие моменты затронуты поверхностно, либо обойдены вниманием. Но, как известно, нельзя объять необъятное.

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
SEOnews и Serpstat запускают конкурс для интернет-маркетологов
Анна Ольяная
4
комментария
0
читателей
Полный профиль
Анна Ольяная - благодарю :)
Как построить качественную ссылочную массу сайта
Айрат Рахимзянов
39
комментариев
0
читателей
Полный профиль
Айрат Рахимзянов - Спасибо Кирилл. Сейчас восстановилась работа сервиса: take.ms/ttXrw
«Я оптимизировал сайт, а он не в ТОП! Что делать?»
Павел Горбунов
7
комментариев
0
читателей
Полный профиль
Павел Горбунов - Как можно в инструменте tools.pixelplus.ru/tools/text-natural сравнить текст со страницы конкурента и со своей страницы? Я вижу возможность только для проверки одного урла.
Мир глазами поисковых систем
Александр Рунов
4
комментария
0
читателей
Полный профиль
Александр Рунов - Какой регион, если не секрет? В Мск, в ряде ВК тематик (в тех же "окнах" или "колесах"), без работы с внешними факторами по ВЧ запросам в ТОП не выплывешь. Хотя в большинстве направлений вполне реально.
Влияние HTTPS на ранжирование региональных поддоменов в Яндексе
Екатерина Иванова
1
комментарий
0
читателей
Полный профиль
Екатерина Иванова - Посмотрите на сколько упал трафик и на сколько потом вырос:упал на 10-20% на 1 месяц, а вырос в итоге в 5 раз. Одним мартовским трафиком всё падение перекрыли. Или можно ждать Яндекс неопределённое количество времени со стартовым уровнем трафика. Упущенные возможности и всё-такое.
Google.ru внесли в реестр запрещенных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
Монетизация сайта. Как, когда, сколько?
Ruslan Baybekov
2
комментария
0
читателей
Полный профиль
Ruslan Baybekov - Максим, добавили возможность вывода дохода на Яндекс Деньги и WMR.
Интеграция call tracking и CRM: углубленный анализ данных о звонках и продажах
Денис
2
комментария
0
читателей
Полный профиль
Денис - Какой смысл вообще в облачных CRM, обрезанный фугкционал, свое дописать невозможно, слив клиентов другим компаниям. Серверные бесплатные CRM куда надежней и кастамизируй как хочешь.
SEMrush: факторы ранжирования в Google в 2017 году
Анна Макарова
292
комментария
0
читателей
Полный профиль
Анна Макарова - Уважаемый S1, я тоже понимаю, что есть такие люди, которые заметив допущенную неточность несутся на всех парусах продемонстрировать "силу" своего ума. Спасибо вам за пристальное внимание. Это поможет нам быть лучше.
Дашборд Метрика 2.0 – мониторинг проблем на сайте в режиме реального времени
Константин Сокол
24
комментария
0
читателей
Полный профиль
Константин Сокол - Есть динамика трафика по разделам. Этот виджет показывает некоторые фильтры, в результате которых с поиска выпадают целые разделы.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
292
Комментариев
262
Комментариев
219
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
52
Комментариев
48
Комментариев
45

Отправьте отзыв!
Отправьте отзыв!