Rookee
Россия+7 (495) 960-65-87

Релевантность: оптимизатор знает, как повысят релевантность выдачи поисковые системы

Россия+7 (495) 960-65-87
Шрифт:
0 3067

Несмотря на столь “громкое” название, это лишь частная попытка рассмотрения такого основополагающего понятия как “релевантность”. Несмотря на это, я попытаюсь наиболее полно раскрыть это понятие, а также то, что непосредственно с ним связано.

Итак, релевантность есть степень соответствия результата поиска заданному запросу.

На первый взгляд, понятие это более чем очевидное для большинства. Но только на первый взгляд. На самом деле, в этом понятии не учтен один из ключевых элементов, точнее, он замаскирован за понятием “запрос”. Этот элемент - пользователь. Именно он задает запрос и ожидает получить определенный результат. Исходя из этого, мы можем дать более корректное определение: релевантность - степень соответствия результата поиска ожиданиям пользователя, выраженным в форме запроса. И разница между первым и вторым определением - огромна, т.к. в первом случае мы имеем дело с формальной релевантностью, а во втором - с реальной. Из этого мы получаем, что релевантность поиска изначально субъективна, т.е. ориентирована на конкретного пользователя. Но и это определение, на самом деле, не является исчерпывающим. Но, впрочем, обо всем по порядку.

Релевантость и типы запросов

Если рассмотреть запросы пользователей, то их принято делить на высокочастотные (ВЧ), среднечастотные (СЧ) и низкочастотные (НЧ). Разделение это происходит на основании оценки популярности того или иного запроса в определенной тематике. Но оно же весьма четко соответствует степени абстракции запросов. ВЧ - более абстрактные (в силу одно-двусловности), НЧ - более конкретные. Большая конкретность НЧ запросов подразумевает более четкое выражение пользователем своих ожиданий, а значит, задача сводится только к правильному пониманию запроса и выдачи соответствующего результата. Степень соответствия ожиданиям пользователя в этом случае будет максимальной.

Совершенно иная ситуация в случае ВЧ-запросов. Их высокая степень абстракции не позволяет однозначно определить ожидания пользователя, а значит, и предоставить ему релевантный результат. Исходя из этого, становится понятным, что принципы формирования результатов поиска по НЧ и ВЧ запросам должны серьезно отличаться.

Далее рассмотрим ВЧ запросы как самые неоднозначные и трудные в плане формирования результатов поиска. Для рассмотрения возьмем пример. Пользователь вводит запрос “работа”. Что это означает? А это означает, что его может интересовать:

а) поиск работы (сайты по устройству на работу, рекрутинговые агентства);

б) курсовая работа (сайты с рефератами, курсовыми и т.п., услуги по написанию курсовых);

в) удаленная работа (соответствующие ресурсы для фрилансеров);

г) исследования рынка труда и т.д.

Каждый из этих вариантов подразумевает принципиально разные категории сайтов. И узнать, что именно из этого ищет пользователь, основываясь только на анализе этого запроса, мы, в принципе, не можем. Точнее, это дело светлого будущего, когда станет внедряться персонализированный поиск, но пока до этого еще далеко.

Остается только одно - выдавать пользователю все подряд, чтобы он сам выбрал из этого то, что ему требуется. Вопрос только в том, что этого “всего подряд” может быть очень много. И тут может быть два варианта:

1) пользователь оказался настойчивым или ему повезло - и нужный результат оказался в числе первых. В этом случае он переходит по ссылке и с определенной натяжкой такой результат можно считать релевантным.

2) пользователь не захотел долго искать или нужного результата не было вообще. В этом случае он вводит новый запрос, более точно сформулированный.

И в первом, и во втором случае пользователь так или иначе указал, что именно он хотел найти. Со временем происходит накопление статистики в виде данных о переходах по ссылкам выдачи и более точных запросов. Их объединение позволяет получить общую картину распределения ожиданий пользователей. В этом случае можно пренебречь менее значимыми ожиданиями и формировать выдачу таким образом, чтобы учитывались основные. В этом случае выдача будет удовлетворять ожиданиям большинства пользователей, а значит, станет более релевантной. Казалось бы, все - проблема решена. Но, увы, не все так просто.

Самые внимательные, наверное, уже заметили изъян в ходе рассуждений. Переходы пользователя по ссылкам в выдаче говорят лишь о том, на какой сайт перешел пользователь, но это не говорит в явном, формализованном виде, что именно он искал. Для этого необходимо проанализировать уже сам сайт (страницу) и попытаться понять, что именно нашел там для себя пользователь. И тут нам на помощь приходит классификация. Именно она позволит нам классифицировать все сайты (страницы) и соотнести их с определенной группой или несколькими группами. Аналогичную классификацию можно провести и для уточняющих запросов. Например, запросы, содержащие “купить”, “продать”, можно соотнести с коммерческими сайтами, “где найти” - с навигационными и т.д. Таким образом, мы можем выражать ожидания пользователей уже не в виде конкретных запросов, многие из которых могут откровенно дублироваться (куплю слона, продажа слонов), а в виде однозначных классов. Это однозначно позволит улучшить релевантность результатов поиска для большинства пользователей. Но и это далеко не все. Вполне очевидно, что сайты, относящиеся к разным классам, необходимо по-разному оценивать при расчете их релевантности.

Релевантность и математика

В этом месте мы сталкиваемся еще с одним понятием релевантности, назовем ее математической, о котором я специально не стал говорить в начале. Эта релевантность является конкретной математической величиной, выражающей степень соответствия выбранного документа по заданному запросу методике ее оценки. Методика в данном случае выступает в роли абстрактного пользователя или даже группы пользователей. Т.е. она играет роль своеобразной модели ожиданий пользователей и их оценок релевантности. Замечу, что само соответствие модели и реальных ожиданий пользователей играет весьма важную роль, т.к. ее погрешность значительным образом влияет на итоговую, пользовательскую релевантность, определение которой давалось в самом начале.

После небольшого отступления возвращаемся к классификации документов (сайтов/страниц). Как уже говорил, разные типы сайтов оцениваются пользователями по- разному, а значит, и соответствующая модель, оценивающая релевантность сайтов данной группы, будет иметь свои отличия. Это, в свою очередь, означает несовпадение “шкал” оценки релевантности по разным моделям. С практической точки зрения это означает следующее.

Пользователь приходит в поисковую систему и задает свой запрос. Поисковая система получает его, анализирует и определяет основные группы документов, наиболее соответствующих ожиданиям пользователя. Далее по каждой группе документов осуществляется первичный отбор документов, содержащих искомое слово в тексте самого документа, либо соответствующего ему анкор-файла. Далее, среди групп отобранных документов, осуществляется расчет релевантности по модели, соответствующей определенной группе. Получаем несколько отранжированных групп, которые затем сливаются в общий список с учетом общих оценок ожиданий пользователя (методика слияния сама по себе представляет большой интерес, но в рамках этой статьи не вижу смысла останавливаться на этом подробнее).

Таким образом, на выходе мы получаем единый список документов, отранжированный по тематическим моделям и с учетом ожиданий пользователя. Как видно, приведения “шкал” разных тематических моделей к единой не потребовалось. И это вполне корректно, т.к. нельзя привести к единой шкале, например, оценки красоты картин и их стоимостей. Более того, попытка такого приведения только ухудшила бы поиск, т.к. нередкими могли быть ситуации, когда сайты одной группы (например, коммерческие) вытесняли полностью другие за счет большого значения математической релевантности.

Резюмируя все вышесказанное отмечу, что понятие релевантности отнюдь не такое простое, как кажется на первый взгляд. И уж тем более нельзя назвать простой задачу ее определения. Поисковые системы должны уметь не только считать математическую релевантность сайта (алгоритмы расчета которой так мечтают узнать оптимизаторы), но и строить точные математические модели ожиданий пользователей (пользовательская релевантность). Большинство оптимизаторов о второй не то что не думают, а даже не догадываются. А ведь она влияет на результаты поисковой выдачи не в меньшей степени, а может быть, и в большей.

P.S. Все написанное выше является результатом логических умозаключений, а потому может в какой-то степени расходиться с реальностью, либо полностью ей не соответствовать. И даже то, что написано, я не могу назвать полным и избыточным. Очень многие моменты затронуты поверхностно, либо обойдены вниманием. Но, как известно, нельзя объять необъятное.

(Нет голосов)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
    ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
    Рейтинг Известности 2018: старт народного голосования
    Михаил Р
    1
    комментарий
    LANG_NO
    читателей
    Полный профиль
    Михаил Р - 1. Demis 2. кокс 3. Ашманов 4. Скобеев 5. Digital Strategy
    Сколько ссылок помогут продвинуть молодой сайт
    Павел Андрейчук
    31
    комментарий
    LANG_NO
    читателей
    Полный профиль
    Павел Андрейчук - Дело в том, что вряд ли в ваших платных "качественных" кейсах найдётся хоть пару % действительно новой и полезной информации которой бы не было на общедоступных источниках.
    Рейтинг Известности 2018: второй этап народного голосования
    Константин Сокол
    3
    комментария
    LANG_NO
    читателей
    Полный профиль
    Константин Сокол - Кто был ответственный за дизайн таблицы голосования? Копирайтер?
    Сайт на WordPress: за и против
    Мира Смурков
    1
    комментарий
    LANG_NO
    читателей
    Полный профиль
    Мира Смурков - Людмила, я согласен с большинством комментаторов. Вы хоть один полноценный магазин сделали на этих движках? Woocommerce это система с супер возможностями. И к ней есть дополнительные модули, с функционалом, который вряд ли появиться на Битрикс. А самому это программировать - сотни тысяч рублей на разработку. А приведя в пример сложности с robots.txt и Sitemap вы ставите под вопрос вашу компетенцию в понимании Интернет-бизнеса и веб-разработки в целом. Во-первых это такие мелочи, а во-вторых это все делается на вордпресса за 2 минуты, и опять же с возможностями многократно превышающими Битрикс.
    Кейс: вывод лендинга по изготовлению флагов на заказ в ТОП 1 по Санкт-Петербургу
    utka21
    5
    комментариев
    LANG_NO
    читателей
    Полный профиль
    utka21 - Кейс как кейс. Для некоторых станет вполне возможно полезным. ( Для конкурентов точно) . А вот с комментариями , что то пошло не так )
    Обзор популярных CMS: плюсы и минусы
    Гость
    1
    комментарий
    LANG_NO
    читателей
    Полный профиль
    Гость - У Битрикса техническое seo сильно страдает, чтоб оно там было нормальным придется все переделать. Безопасность у Битрикса тоже низкая, особено если надо дорабатывать функционал, как только правиться функционал у Битрикс , то уровень ее безопасности определяет тот разработчик , который этим занимается. Самые безопасные движки те, что нет в общем доступе и где нельзя ничего редактировать в коде. =)
    Google обошел Яндекс по популярности в России в 2018 году: исследование SEO Auditor
    Рамблер
    1
    комментарий
    LANG_NO
    читателей
    Полный профиль
    Рамблер - Вот вроде отечественный - это сказано верно.. «Я́ндекс» — российская транснациональная компания, зарегистрированная в Нидерландах. Так говорится в Википедии. И с хрена ли ОТЕЧЕСТВЕННЫЙ поисковик зарегистрирован в Европе? И где платится основная часть налогов? Ну-ууу, точно не в России. И если запахнет жаренным, то был Яндекс и нет Яндекса!
    8 методик в SEO, от которых давно пора отказаться
    Евгений Сметанин
    11
    комментариев
    LANG_NO
    читателей
    Полный профиль
    Евгений Сметанин - Факторов вообще очень много, согласитесь, вы будете использовать максимальное их количество, особенно, если в ТОПе засели агрегаторы с сумасшедшими ПФ. В таких случаях, вхождение ключа в домен для маленького профильного сайта, сыграет свою положительную роль. Конечно же, если контент на страницах хорошего качества. У меня есть несколько успешных кейсов на эту тему. На сайте продают несколько видов товаров, а выстреливает в ТОП тот, название которого присутствует в доменном имени. Как корабль назовешь, так он и поплывет, верно?))
    Инструкция: настраиваем цели Яндекс.Метрики через Google Tag Manager
    Roman Gorkunenko
    1
    комментарий
    LANG_NO
    читателей
    Полный профиль
    Roman Gorkunenko - Здравствуйте. Подскажите, пожалуйста, можно с айпи метрики вытащить среднюю стоимость клика по утм меткам? В метрике есть такой шаблон tags_u_t_m, но он не совместим с меткой директа, у них разные префиксы.
    Аудит структуры интернет-магазина мебели от «Ашманов и партнеры»
    Дмитрий
    10
    комментариев
    LANG_NO
    читателей
    Полный профиль
    Дмитрий - Сергей, а вы допускаете, что вся ваша жизнь - seo-миф?
    ТОП КОММЕНТАТОРОВ
    Комментариев
    910
    Комментариев
    834
    Комментариев
    554
    Комментариев
    540
    Комментариев
    483
    Комментариев
    373
    Комментариев
    344
    Комментариев
    262
    Комментариев
    246
    Комментариев
    171
    Комментариев
    156
    Комментариев
    137
    Комментариев
    121
    Комментариев
    100
    Комментариев
    97
    Комментариев
    97
    Комментариев
    96
    Комментариев
    80
    Комментариев
    73
    Комментариев
    67
    Комментариев
    60
    Комментариев
    59
    Комментариев
    57
    Комментариев
    56
    Комментариев
    55

    Отправьте отзыв!
    Отправьте отзыв!