Рекламные кампании для вашего бизнеса
Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:

Релевантность: оптимизатор знает, как повысят релевантность выдачи поисковые системы

Россия +7 (495) 960-65-87
Шрифт:
0 1609

Несмотря на столь “громкое” название, это лишь частная попытка рассмотрения такого основополагающего понятия как “релевантность”. Несмотря на это, я попытаюсь наиболее полно раскрыть это понятие, а также то, что непосредственно с ним связано.

Итак, релевантность есть степень соответствия результата поиска заданному запросу.

На первый взгляд, понятие это более чем очевидное для большинства. Но только на первый взгляд. На самом деле, в этом понятии не учтен один из ключевых элементов, точнее, он замаскирован за понятием “запрос”. Этот элемент - пользователь. Именно он задает запрос и ожидает получить определенный результат. Исходя из этого, мы можем дать более корректное определение: релевантность - степень соответствия результата поиска ожиданиям пользователя, выраженным в форме запроса. И разница между первым и вторым определением - огромна, т.к. в первом случае мы имеем дело с формальной релевантностью, а во втором - с реальной. Из этого мы получаем, что релевантность поиска изначально субъективна, т.е. ориентирована на конкретного пользователя. Но и это определение, на самом деле, не является исчерпывающим. Но, впрочем, обо всем по порядку.

Релевантость и типы запросов

Если рассмотреть запросы пользователей, то их принято делить на высокочастотные (ВЧ), среднечастотные (СЧ) и низкочастотные (НЧ). Разделение это происходит на основании оценки популярности того или иного запроса в определенной тематике. Но оно же весьма четко соответствует степени абстракции запросов. ВЧ - более абстрактные (в силу одно-двусловности), НЧ - более конкретные. Большая конкретность НЧ запросов подразумевает более четкое выражение пользователем своих ожиданий, а значит, задача сводится только к правильному пониманию запроса и выдачи соответствующего результата. Степень соответствия ожиданиям пользователя в этом случае будет максимальной.

Совершенно иная ситуация в случае ВЧ-запросов. Их высокая степень абстракции не позволяет однозначно определить ожидания пользователя, а значит, и предоставить ему релевантный результат. Исходя из этого, становится понятным, что принципы формирования результатов поиска по НЧ и ВЧ запросам должны серьезно отличаться.

Далее рассмотрим ВЧ запросы как самые неоднозначные и трудные в плане формирования результатов поиска. Для рассмотрения возьмем пример. Пользователь вводит запрос “работа”. Что это означает? А это означает, что его может интересовать:

а) поиск работы (сайты по устройству на работу, рекрутинговые агентства);

б) курсовая работа (сайты с рефератами, курсовыми и т.п., услуги по написанию курсовых);

в) удаленная работа (соответствующие ресурсы для фрилансеров);

г) исследования рынка труда и т.д.

Каждый из этих вариантов подразумевает принципиально разные категории сайтов. И узнать, что именно из этого ищет пользователь, основываясь только на анализе этого запроса, мы, в принципе, не можем. Точнее, это дело светлого будущего, когда станет внедряться персонализированный поиск, но пока до этого еще далеко.

Остается только одно - выдавать пользователю все подряд, чтобы он сам выбрал из этого то, что ему требуется. Вопрос только в том, что этого “всего подряд” может быть очень много. И тут может быть два варианта:

1) пользователь оказался настойчивым или ему повезло - и нужный результат оказался в числе первых. В этом случае он переходит по ссылке и с определенной натяжкой такой результат можно считать релевантным.

2) пользователь не захотел долго искать или нужного результата не было вообще. В этом случае он вводит новый запрос, более точно сформулированный.

И в первом, и во втором случае пользователь так или иначе указал, что именно он хотел найти. Со временем происходит накопление статистики в виде данных о переходах по ссылкам выдачи и более точных запросов. Их объединение позволяет получить общую картину распределения ожиданий пользователей. В этом случае можно пренебречь менее значимыми ожиданиями и формировать выдачу таким образом, чтобы учитывались основные. В этом случае выдача будет удовлетворять ожиданиям большинства пользователей, а значит, станет более релевантной. Казалось бы, все - проблема решена. Но, увы, не все так просто.

Самые внимательные, наверное, уже заметили изъян в ходе рассуждений. Переходы пользователя по ссылкам в выдаче говорят лишь о том, на какой сайт перешел пользователь, но это не говорит в явном, формализованном виде, что именно он искал. Для этого необходимо проанализировать уже сам сайт (страницу) и попытаться понять, что именно нашел там для себя пользователь. И тут нам на помощь приходит классификация. Именно она позволит нам классифицировать все сайты (страницы) и соотнести их с определенной группой или несколькими группами. Аналогичную классификацию можно провести и для уточняющих запросов. Например, запросы, содержащие “купить”, “продать”, можно соотнести с коммерческими сайтами, “где найти” - с навигационными и т.д. Таким образом, мы можем выражать ожидания пользователей уже не в виде конкретных запросов, многие из которых могут откровенно дублироваться (куплю слона, продажа слонов), а в виде однозначных классов. Это однозначно позволит улучшить релевантность результатов поиска для большинства пользователей. Но и это далеко не все. Вполне очевидно, что сайты, относящиеся к разным классам, необходимо по-разному оценивать при расчете их релевантности.

Релевантность и математика

В этом месте мы сталкиваемся еще с одним понятием релевантности, назовем ее математической, о котором я специально не стал говорить в начале. Эта релевантность является конкретной математической величиной, выражающей степень соответствия выбранного документа по заданному запросу методике ее оценки. Методика в данном случае выступает в роли абстрактного пользователя или даже группы пользователей. Т.е. она играет роль своеобразной модели ожиданий пользователей и их оценок релевантности. Замечу, что само соответствие модели и реальных ожиданий пользователей играет весьма важную роль, т.к. ее погрешность значительным образом влияет на итоговую, пользовательскую релевантность, определение которой давалось в самом начале.

После небольшого отступления возвращаемся к классификации документов (сайтов/страниц). Как уже говорил, разные типы сайтов оцениваются пользователями по- разному, а значит, и соответствующая модель, оценивающая релевантность сайтов данной группы, будет иметь свои отличия. Это, в свою очередь, означает несовпадение “шкал” оценки релевантности по разным моделям. С практической точки зрения это означает следующее.

Пользователь приходит в поисковую систему и задает свой запрос. Поисковая система получает его, анализирует и определяет основные группы документов, наиболее соответствующих ожиданиям пользователя. Далее по каждой группе документов осуществляется первичный отбор документов, содержащих искомое слово в тексте самого документа, либо соответствующего ему анкор-файла. Далее, среди групп отобранных документов, осуществляется расчет релевантности по модели, соответствующей определенной группе. Получаем несколько отранжированных групп, которые затем сливаются в общий список с учетом общих оценок ожиданий пользователя (методика слияния сама по себе представляет большой интерес, но в рамках этой статьи не вижу смысла останавливаться на этом подробнее).

Таким образом, на выходе мы получаем единый список документов, отранжированный по тематическим моделям и с учетом ожиданий пользователя. Как видно, приведения “шкал” разных тематических моделей к единой не потребовалось. И это вполне корректно, т.к. нельзя привести к единой шкале, например, оценки красоты картин и их стоимостей. Более того, попытка такого приведения только ухудшила бы поиск, т.к. нередкими могли быть ситуации, когда сайты одной группы (например, коммерческие) вытесняли полностью другие за счет большого значения математической релевантности.

Резюмируя все вышесказанное отмечу, что понятие релевантности отнюдь не такое простое, как кажется на первый взгляд. И уж тем более нельзя назвать простой задачу ее определения. Поисковые системы должны уметь не только считать математическую релевантность сайта (алгоритмы расчета которой так мечтают узнать оптимизаторы), но и строить точные математические модели ожиданий пользователей (пользовательская релевантность). Большинство оптимизаторов о второй не то что не думают, а даже не догадываются. А ведь она влияет на результаты поисковой выдачи не в меньшей степени, а может быть, и в большей.

P.S. Все написанное выше является результатом логических умозаключений, а потому может в какой-то степени расходиться с реальностью, либо полностью ей не соответствовать. И даже то, что написано, я не могу назвать полным и избыточным. Очень многие моменты затронуты поверхностно, либо обойдены вниманием. Но, как известно, нельзя объять необъятное.

internet-dlya-biznesa

Есть о чем рассказать? Тогда присылайте свои материалы в редакцию.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
23 действительно эффективных совета по продвижению интернет-магазина
Гость - Троль Гуру паНгинации - Что такое паНгинация?))))
Конкурс: угадайте пятерку лидеров рейтинга «SEO глазами клиентов 2016»
Марина
1
комментарий
0
читателей
Полный профиль
Марина - Ingate i-Media SEO.RU Netpeak 1PS.RU
Анализ ссылок: сравнение многофункциональных платформ по размеру их баз
Михаил - Хватит пениться на каждый аргументированный отзыв. Это не придает вашей компании чести.
Как создать интернет-магазин: сколько стоит открытие?
Гость - да у битрикса что ни обновление - то сплошные баги. недавно знакомый обновился на лицензии интернет-магазина, про***лись заказы за последнюю неделю, слетели все связи по складам. одним словом, жопа. при этом обновился на сразу, а спустя месяц после выкатывания, надеялся, успеют все поправить
Как упростить продвижение вечными ссылками?
Coursh - Зарегестрировался. Накинули 1100 рубликов за пополнение на 10к. Очень неплохо!
Вопрос недели: почему сайт хорошо ранжируется в Google и не интересует Яндекс?
Nina S.Dzh. - У вас достаточно конкурентная тематика для рунета и по главной странице домена расположена англоязычная версия. Полагаю, в этих двух фактах вся проблема. Поскольку Яндекс в данном случае считает английскую версию сайта приоритетной, а среди ваших конкурентов в выдаче достаточно много хороших русскоязычных сайтов, то он и не ранжирует ваш сайт высоко. Грубо говоря, ему есть что предложить пользователю и без вашего сайта. На мой взгляд, в данном случае версии нужно разводить по разным доменам, русскую вешать на RU и продвигать там.
Кому и зачем нужен маркетплейс от Яндекса
Дарья Калинская
203
комментария
0
читателей
Полный профиль
Дарья Калинская - Максим, спасибо, рада, что статья оказалась полезной )
Конкурс: угадай победителя рейтинга «Известность бренда SEO-компаний»
Андрей
1
комментарий
0
читателей
Полный профиль
Андрей - Оптимизм Дэмис Кокос Ашманов и Партнеры Раш эдженси
ТОП-10 автоматизированных сервисов контекстной рекламы
Жанна Рожкова
155
комментариев
0
читателей
Полный профиль
Жанна Рожкова - Научитесь отличать рекламу от PR-активности. Если следовать вашей логике, на этом сайте (и на всех остальных информационных ресурсах в принципе) кроме рекламы ничего и нет. Так что насчет статьи от понимающего эксперта? Будем рады, если подготовите
Тест: Продвинь сайт в Google с одной попытки
Гость15 - Спасибо)
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
285
Комментариев
262
Комментариев
203
Комментариев
171
Комментариев
155
Комментариев
137
Комментариев
123
Комментариев
97
Комментариев
97
Комментариев
93
Комментариев
80
Комментариев
70
Комментариев
67
Комментариев
60
Комментариев
55
Комментариев
52
Комментариев
49
Комментариев
45
Комментариев
44

Отправьте отзыв!
Отправьте отзыв!