×
Россия +7 (495) 139-20-33

Семинар: «Как пользователи могут влиять на ранжирование»: обзор

Россия +7 (495) 139-20-33
Шрифт:
0 2799

Семинар: «Как пользователи могут влиять на ранжирование»«Внимание: это не то, как работает Яндекс!». Именно с такого слайда начался доклад Игоря Кураленка «Анализ поведения пользователей для улучшения качества ранжирования». Докладчик сразу оговорился, что не будет рассказывать, как работает поисковая система. Сказано – сделано. На откровение никто не рассчитывал, но надежда узнать что-нибудь этакое теплилась до конца семинара. Но даже провоцирующие вопросы Константина Каширина типа «а не проговорились ли Вы, сказав …» и глубокие (в попытке докопаться до сути) от Евгения Трофименко не пробили броню корпоративной политики конфиденциальности.

Семинар, состоявшийся в эту пятницу в столовой Яндекса, был посвящен околопоисковому исследованию компании, а именно влиянию пользователей на поиск (как отметил Игорь, этим занимаются многие западные компании). Собравшимся был продемонстрирован один из возможных способов применения данных о поведении пользователей и объяснена актуальность данного направления для Яндекса. На повестку дня были вынесены следующие пункты:

• Что такое пользовательское поведение.
• Модель поиска (прототип), которая используется для анализа данных.
• Немного о технике использования статистики.
• Ссылки на результаты.

Начало можно назвать вводным, собравшимся напомнили о том, какими бывают пользовательские данные: информация о посещаемости страниц, статистика поведения пользователей на страницах поисковой системы (например, сколько времени было проведено на странице), клики на выдаче и сессии запросов. Именно на два последних типа данных опирался Яндекс в исследовании.

Пользовательское поведение, по словам Игоря, рассматривается Яндексом в двух направлениях – персонализация (под конкретного пользователя подбирается дополнительная информация на его запрос, например, подсказки) и генерализация. Именно на нее было обращено особое внимание в ходе исследования. Примечательно, что эти данные могут быть использованы как фактор ранжирования, отмечая, на какие ресурсы пользователи кликают чаще. Однако в этом случае следует опасаться накрутки кликов. Генерализация может использоваться и «поверх» ранжирования, т.е. не всегда самый релевантный ответ может оказаться на первом месте.

Итак, какие данные о пользовательском поведении использовались в ходе исследования? Это клики и сессии запросов.

Самым распространенным источником данных о поведении пользователей продолжают оставаться клики. Они представляют огромную статистику, однако здесь много подводных камней таких как
- большая инертность запросов (например, информационных, которые могут быстро терять свою актуальность);
- зависимость от качества сниппета, которое может способствовать или не способствовать клику.
- зависимость от ранжирования: если показать два одинаковых магазина в разном порядке, кликабельность у них будет разной. Это определяется верой в систему, пользователь склонен кликать на более ранние результаты.
- смена темы поиска: на странице с результатами поиска пользователь может встретить очень привлекательный сниппет, уводящий от запроса, либо из-за очень информативного сниппета, в котором уже содержался ответ на запрос.
- и артефакты, к которым относятся клик-роботы, и различные флешмобовые акции, которые могут подходить под запрос пользователя, но не сообщать нужную ему информацию.

Сессии запросов
Данный источник информации о поведении пользователей также имеет свои плюсы и минусы, последних, по сравнению с кликами, меньше. Итак, сессии запросов - это большой объем данных, отличающихся своей достоверностью. Но пользователь может очень быстро менять свои интересы поиска, поэтому отсутствуют четкие границы сессий. Внутри одной сессии может произойти сужение или расширение темы, такая ситуация актуальна для информационных запросов, когда может произойти смещение или углубление в тему (возможные причины были описаны выше).

Идея исследования
Она заключается в том, что есть источник «вкусных» данных, которые хочется использовать. Ведь, как отмечает Игорь Кураленок, благодаря статистике поведения пользователей можно будет прогнозировать поведение новых пользователей. «Зная цепочки запросов других пользователей, можно дополнить выдачу наиболее вероятными ответами. Например, документы, на которые никто никогда не кликал, при достаточной частоте самого запроса можно исключить, а вместо них выдавать документы, которые по цепочке запросов можно назвать хорошими», - говорит Игорь.

Для большей наглядности докладчик предложил рассмотреть «страшный объект», который называется графом запросов, где узел – это запрос, ребро – количество пользователей, переформировавших один запрос в другой, поиск – это случайное блуждание по данному графу. При этом выдача формируется на основе наиболее вероятных точек остановки поиска. Т.е. рассматриваются все варианты поведения пользователя, для того чтобы найти точки, где предыдущие пользователи вероятней всего нашли ответы. Дальше последовали не менее «страшные» формулы расчетов.

Результатами исследования стали большая привлекательность (не релевантность, а вероятность клика) выдачи и большее разнообразие выдачи. Однако есть проблемы, которые не дают в полной мере заявить о гениальности идеи. Например, поиск становится менее понятным: в SERP могут появляться URLs, в сниппетах которых нет слов запроса. Только вникнув в суть эксперимента, можно понять, почему так происходит. Это существенно меняет поисковую практику

В заключение выступления Игорь делает следующие выводы: исследование поведения пользователя – это исследование среднего пользователя. Это хороший источник полезной информации, с которым нужно очень аккуратно работать. Где «хороший источник» означает полезный с точки зрения ранжирования, разнообразия результатов и т.д. Использование, полученных в ходе исследования, данных может привести Яндекс к совершенно другой модели поиска.

Рикардо Баеса-ЯтесПроводя такие просветительские семинары, Яндекс не ограничивается докладами своих сотрудников. Так, 15 августа в этой же самой столовой выступал со докладом «Mining Web Queries» известный ученый в области информационного поиска, вице-президент Yahoo! по исследованиям в Европе и Латинской Америке, автор Modern Information Retrieval доктор Рикардо Баеса-Ятес.

Рикардо рассказывал о целях проводимых его командой исследований поисковых запросов. Анализ и применение его результатов на практике должны, по замыслу Рикардо, решить проблему несовпадения поискового запроса и реального интереса пользователя, который он не может выразить в запросе из-за ограничений современного уровня развития поисковых систем.

Предложение Рикардо – учитывать при составлении выдачи возраст, пол, профессию, местожительства, поисковую историю и т.п.

Результатом исследования докладчик называл возможность кластериазации поисковых запросов, которая в свою очередь усовершенствует алгоритмы ранжирования сайтов, позволит ввести систему подсказок, предлагающих не просто расширение запроса, а именно реальные варианты запросов (которые можно будет составлять с учетом синонимии, веб-сленга и других лингвистических факторов).

Сама кластеризация запросов проводилась по сопоставлению похожих слов в запросах и похожих урлов, которые открывались по разным запросам. Соответственно, для улучшения ранжирования в дальнейшем предпочтение отдается тем страницам, на которые чаще кликали по этому зарпосу, а также вводится система рекомендации похожих популярных запросов (related searches).

Таким образом, Рикардо создает поиск, основанный не столько на запросе пользователя, сколько на его намерении (Intention Search) – и экспериментальной площадкой для всех исследований в этом направлении является Yahoo! Mindset Beta

Скриншот Yahoo!Mindset
Как видите, речь идет о том, что тестировщикам поисковой системы предоставляется возможность оценить ссылку из выдачи как коммерческую или информационную по определенной шкале.
Шкала оценки полезности ссылки в выдаче
Вот как выглядит полученная в ходе эксперимента выдача Yahoo!Mindset
Скриншот Yahoo!Mindset выдача
Рикардо несколько раз, предупреждая каверзные вопросы из зала, акцентировал внимание на том, что задача подобных исследований не слежка за человеком (т.е. анализируется не поведение пользователя), а определение его намерений, целей и попытка различными способами (как улучшением качества выдачи по запросу, так и рекомендацией схожих запросов) привести пользователя к этой цели.



Материал подготовили Анна Макарова и Анастасия Гутникова, SEOnews
(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Как выбрать CMS для интернет-магазина
demimurych
18
комментариев
0
читателей
Полный профиль
demimurych - Очередное волшебство, а не материал. все что ниже, сказано человеком который больше 20 лет своей жизни посвятил ковырянию исходных кодов систем. Битрикс по качеству кода и функциональности ровно такое же говно как и вордпресс. Заявить что он разрабатывается группой крутых программистов может только человек, который не знает что такое программирование. Единтсвенное отличие битрикса от вордпресса, это сертифицированнось на определенном локальном рынке. поставить Друпал в один ряд с вордпрессом, это видимо в продолжении предыдущей бугогашечки про крутых программистов в битриксе. тут важно отметить, что если битрикс и вордпресс являлись говном одного сорта весь цикл своего существования, то друпал имеет минимум 4 принципаильно разных кодовых базы. При этом даже самая примитивная из них - друпал 5 ветки, которому больше 12 лет, на голову выше текущих вп с битриксом вместе взятых. с точки зрения разработки - конечно. А не востребовтных на текущий момент плагинов. теория про разработку кода группой крутых программистов, не выдерживает никакой критики. достаточно просто оглянуться назад и увидеть, что в мире опенсорса есть как примеры эталонного говна - вордпресс, так и полная противоположность им типа РОР ставшего фактически во многом и на долго эталоном веб разработки. И это я еще ненапомнил автору о том, что есть такие вещи как питон, миникс и т.д. примеров качественного по в мире разработки открытым сообществом на порядки больше, чем наоборот. и тому есть ряд очень простых обьяснений. первое из которых, никто вам не даст просто так закомитить в ядро любой свой говнокод. даже в вордпресе. словом, информация в статье, как и ее выводы - это из области работы со своим воображением, чем с текущей ситуацией на рынке.
«Юзабилити-лаборатория»: оставляйте заявку на участие!
Анна Макарова
378
комментариев
0
читателей
Полный профиль
Анна Макарова - Антон, добрый день! Ваш сайт не попал в основную выборку для юзабилити-анализа, но эксперты постараются сделать по вашему сайту видеоразбор (ю-ревью). Будем держать вас в курсе )
Тест по SEO – проверь свой уровень знаний
Артем Дорофеев
8
комментариев
0
читателей
Полный профиль
Артем Дорофеев - Полный текст вопроса со скриншотом панели прикладываю. Итого, что имеем: - на скриншоте отмечено, что это фильтр МПК - сайт коммерческий - рекламы на сайте нет С вероятностью 95% это ошибка (которая уже дважды случалась в Яндексе), когда они случайно "закосили" неповинные сайты. Тогда по запросу Платону фильтр быстренько снимали. Но вопрос даже не на знание этого нюанса. В любой непонятной ситуации, прежде чем что-либо предпринимать (особенно переписывать весь контент на сайте или менять дизайн, как указано в других вариантах) - фильтр следует подтвердить. Правильный ответ: "Написать письмо в техподдержку Яндекса".
Автоматические SEO-аудиты: как напугать некорректными выводами
Trydogolik
25
комментариев
0
читателей
Полный профиль
Trydogolik - спасибо
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Trydogolik
25
комментариев
0
читателей
Полный профиль
Trydogolik - К мифу 1 добавлю Google optimize optimize.google.com Удобен для сотрудников со спец. знаниями и без них. Подмена контента настраивается за счет многих вариантов страниц и условий настроек распределения трафика. Варианты страниц можно легко создать копипастом. На мой взгляд удобно и бесплатно. Тот же Calibri и программисты в любом случае, пусть не за это, но где-то берут свою комиссию. (чисто мое мнение). В качестве цены отдаешь такой ресурс как личное время и копейки за внесение двух первоначальных изменений в html шаблон страниц. Но если ваша digital-кампания имеет совесть то оплата максимум час, а то и бесплатно. Интернет-маркетолог сам должен уметь это делать. Все просто + подробную инструкцию прилагают на языке пользователя. + за поддомены платить не надо, они вообще не нужны. + взаимодействие с: - Google Ads; - Google Tag; - Google Analytics просто прекрасно отслеживается по всем вариантам параллельно. Это помогает до деталей нарисовать профиль ЦА по любому "кредиту - отдельно на машину и отдельно на бизнес". Что с аналитикой у Calibri на этот счет? Сам с Calibri не разу не работал, всегда работаю с первоисточником. + к мифу 3 в том что это и есть детище поисковой системы и рекламного инструмента. Яша тоже спокоен будет так как сам везде навязывает Турбо-страницы (считаю их не удобными).- Как "-" (минус) вижу то, что может повлиять на скорость загрузки сайта. Но если у вас не конструктор, а темболее Landing Page, то о скорости можно не волноваться. Но это чисто мое мнение. В остальном согласен с автором.
100+ ресурсов по SEO для изучения поисковой оптимизации с нуля
Марина Ибушева
59
комментариев
0
читателей
Полный профиль
Марина Ибушева - Спасибо за добавление. Мы уже работаем над отдельным материалом про курсы, потому что одной статьи мало, чтобы охватить все крутое по обучению)
7 способов увеличить авторитетность сайта «в глазах» поисковых систем
Grigo5
4
комментария
0
читателей
Полный профиль
Grigo5 - Понятно.
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
SEO must go on! Почему в кризис нельзя останавливать продвижение сайта
everystraus
28
комментариев
0
читателей
Полный профиль
everystraus - Мы даже варианты не рассматривали. Если проект неустойчив, сразу предлагали сбавить обороты до минимума, но и так, чтоб не свалиться в штопор. Именно по СЕО чаще всего.
Кейс Hansa: как увеличить органический трафик в 1,5 раза
Алексей Порфирьев
3
комментария
0
читателей
Полный профиль
Алексей Порфирьев - Спасибо за замечание, о данной проблеме известно, но она не стоит в порядке приоритетных. Вопрос, на самом деле, дискуссионный. В тематике конкуренция не настолько велика, а в топе выдачи часто встречаются сайты с более серьёзными техническими проблемами. По этому, именно в статьях, более важно работать над релевантностью контента, отношением времени пользователя на странице к уровню доскрола, и различным пользовательским функционалом (рейтинг материала, просмотры и т. п.).
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
378
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
140
Комментариев
121
Комментариев
111
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
88
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
59
Комментариев
57

Отправьте отзыв!
Отправьте отзыв!