Россия+7 (495) 960-65-87

Фактор текстовой релевантности YMW: как не загубить оптимизацию под длинный хвост ключей

Россия+7 (495) 960-65-87
Шрифт:
3 4471

На этой неделе Яндекс начал использовать алгоритм «Баден-Баден» для определения нарушений, связанных с переоптимизацией, дополнив им предыдущие способы определения этой проблемы.

Поэтому мы решили вспомнить недавнюю статью Алексея Трудова, посвященную фактору текстовой релевантности — YMW.

Cеошная общественность бурно обсуждает новый алгоритм Яндекса «Баден-Баден». Не особо продуктивное занятие, на мой взгляд. Слишком мало времени прошло. Вряд ли у кого-то накопились достоверные наблюдения по хорошей выборке пострадавших сайтов. Тем более наивно ждать эффективную методику снятия. Да что там, пока даже неизвестно, включен ли алгоритм на полную мощность.

Ясно только одно: оптимизацию теперь нужно делать еще аккуратнее и тщательнее. Поэтому нелишне будет разобраться в достаточно редко упоминаемом факторе текстовой релевантности — YMW. Он основан на размере минимального куска текста, включающего максимальное количество встречающихся в документе слов запроса.

Статья Александра Сафронова «Тестирование простой ранжирующей формулы»

В публикации описана формула ранжирования, разработанная сотрудниками Яндекса для экспериментальной оценки отдельных факторов. Среди них — в первую очередь хорошо знакомые оптимизаторам вариации BM25 а также пара метрик, оценивающих близость слов запроса.

Вот описание одной из них — YMW:

YMW 1.png

Впали в уныние от нагромождения формул? Напрасно! Разобраться не так сложно. Внимательно читаем легенду:

YMW 2.png

Вторая же часть формулы представляет поправку на тот случай, если в тексте документа содержатся не все слова запроса. Она оперирует понятием «вес слова». IDF (inverse document frequency) — оценка частоты встречаемости слова во всей базе документов в поисковой системе. Эта величина используется во многих других факторах текстовой релевантности.

Теперь опустим конкретные знаки действий и логарифмы, просто отметим, какие параметры увеличивают итоговую оценку, а какие уменьшают.

  • Минимальный размер «окна» в котором встречаются все слова запроса — находится в знаменателе дроби. Чем он меньше, тем выше значение фактора.
  • Количество слов запроса, встречающиеся в документе — вычитаются из знаменателя. Чем больше, тем выше значение фактора.

Видите? От всей сложной формулы остается всего два параметра, специфичных для рассматриваемого фактора. Чуть ниже будет еще более наглядное объяснение, а пока проясним важный вопрос:

Стоит ли вообще учитывать этот фактор?

Рассматриваемая статья достаточно старая, выпущена еще в 2010 году. Тем не менее я считаю, что по крайней мере общие тенденции, выделенные выше, остаются актуальными. Вот несколько причин:

  • Судя по свежему докладу об устройстве поиска Яндекса, статья описывает вполне актуальные подходы к тестированию новых факторов ранжирования (вторая часть публикации).
  • Фактор упоминается в ТЗ на SEO-текст сравнительно редко. Поэтому поисковым системам не было нужды его отбрасывать под давлением оптимизаторов. Вообще он актуален для длинных запросов, под которые редко продвигают специально.
  • Группировка слов запроса в пределах абзаца-двух характерна для качественного профессионального контента. Очевидно, что слова, связанные с конкретной темой, будут сами по себе тянуться друг к другу: их связывает общая мысль.
  • В той же статье указан фактор «кучности». То есть близость слов — это реально важный фактор, поисковик пытается «зацепить» его разными способами.

Думаю, достаточно. Переходим к самому интересному — практике и выводам.

Как неосторожный оптимизатор может уменьшить релевантность текста

Если мы имеем дело со страницами, которые не претендуют на другие ключи, кроме вставленных в title, то фактор не будет особо значим. Ясно, что в этом случае мы получим очень маленькое «окно» — сам title. А вот если мы хотим сэкономить на создании страниц и одной статьей охватить десяток-другой среднечастотников и сотни их мелких НЧ-расширений — то учитывать YMW необходимо.

Сначала пример как делать НЕ надо (заодно буквально в картинках разберем суть фактора).

Допустим, у нас есть статья, в которой упомянут определенный ключевик:

YMW 3.png

Потом до нее дотянулись шаловливые ручки оптимизатора, и он решил расширить семантику а также напичкать текст модными LSI-словами. Загнал запросы в сервис генерации ТЗ, вытащил уйму расширений и тематичных слов. Отдал копирайтеру. Копирайтер, не заморачиваясь, дописал лишний абзац, куда густо натыкал затребованные термины. На выходе получилось это:

YMW 4.png

Все что надо — упомянуто. Ура?

Не совсем. Давайте прикинем YMW для «запрос из трех слов + расширение 1» до и после доработки. Смотрим сделанный выше вывод из формулы: чем меньше размер «окна» содержащего все слова запроса и чем больше слов из запроса встречается в документе — тем сильнее оценка фактора.

До:

  • размер окна, включающего все слова: 3 (они просто идут вместе).
  • число слов: 3 из 4

После:

Окно резко выросло!

YMW 5.png

То есть мы что-то добавили к итоговой оценке YMW за счет вхождения всех слов запроса и одновременно убавили, сделав окно огромным. Итоговое значение при этом могло упасть. Оцените порядок цифр в знаменателе первой дроби: для первого случая это (3 — 3 + α), а во втором что-то вроде (500 — 4 + α).

Конечно, другие факторы при этом могут сыграть в плюс (вхождение всех слов запроса — сильный сигнал). Но полного эффекта, который могло бы дать расширение семантики, мы не получим.

Заметьте, кстати: негативное влияние бездумного добавления ключей прослеживается на примере даже простого фактора ранжирования, без привлечения факторов антиспама.

Выводы

  • Фактор YMW имеет смысл учитывать в текстовой оптимизации. Особенно с учетом резко негативного отношения поисковых систем к традиционным методикам, опирающимся на число вхождений.
  • При продвижении под кластер ключей необходимо следить за близостью ключевых слов и расширений запроса в пределах страницы. Принцип максимального сокращения межсловных расстояний нужно применять не только к основным ключевым словам. Требуется проектировать страницу так, чтобы ей соответствовал весь набор поисковых фраз, включая микро-НЧ, предусмотреть которые невозможно.
  • Добавление на страницу связанной лексики без учета расположения основных ключей не даст полного эффекта.
  • Для оптимизации под длинный хвост в отношении YMW лучше всего подходят тексты с четкой структурой, разбитые заголовками на небольшие блоки. При этом каждый блок должен быть посвящен раскрытию конкретной под-темы и содержать максимум лексики, которая с ней связана. Нежелательна ситуация, когда запрос используется в одном блоке, а важное расширение в другом.

Источник: http://alexeytrudov.com/web-marketing/seo/faktor-ymw.html

(Нет голосов)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Михаил Войнов
    1
    комментарий
    0
    читателей
    Михаил Войнов
    больше года назад
    Как расшифровывается аббревиатура YMW?
    -
    0
    +
    Ответить
  • Andy
    1
    комментарий
    0
    читателей
    Andy
    больше года назад
    >>Заметьте, кстати: негативное влияние бездумного добавления ключей прослеживается на примере даже простого фактора ранжирования, без привлечения факторов антиспама.
    Речь о том, что большое окно не даст достигнуть максимального эффекта? Или к чему тут антиспам упомянут?

    >>...страницу так, чтобы ей соответствовал весь набор поисковых фраз,
    включая микро-НЧ, предусмотреть которые невозможно.
    Непонятный пассаж, поясните.
    -
    0
    +
    Ответить
    • Alexey Trudov
      6
      комментариев
      0
      читателей
      Alexey Trudov
      Andy
      больше года назад
      >>Речь о том, что большое окно не даст достигнуть максимального эффекта?
      Правильно.
      Антиспам упомянут, потому что с подобными текстами по идее как раз он должен бороться. То есть отдельные факторы, нацеленные на выявление неестественных текстов и штрафующие за них. Но как видим, даже обычный фактор может страдать от такой оптимизации.

      >>Непонятный пассаж, поясните.
      Смотрите. Все эти микро-НЧ как раз берутся из текста. Мы естественным образом употребл...
      >>Речь о том, что большое окно не даст достигнуть максимального эффекта?
      Правильно.
      Антиспам упомянут, потому что с подобными текстами по идее как раз он должен бороться. То есть отдельные факторы, нацеленные на выявление неестественных текстов и штрафующие за них. Но как видим, даже обычный фактор может страдать от такой оптимизации.

      >>Непонятный пассаж, поясните.
      Смотрите. Все эти микро-НЧ как раз берутся из текста. Мы естественным образом употребляем синонимы и вариации слов, входящих в запрос.
      Если четко структурировать контент на странице и не использовать «воду», то расстояния между основным запросом (например, в подзаголовке) и его расширениями (в тексте под ним) будут небольшими, что и увеличит YMW.
      Если же страницу вообще никак не проектировать и писать в стиле «что вижу то пою», то слова будут рассеяны по тексту и размер окна для всех бесчисленных комбинаций "основной запрос + слово" будет большим.
      -
      0
      +
      Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Сколько ссылок помогут продвинуть молодой сайт
Павел Андрейчук
38
комментариев
0
читателей
Полный профиль
Павел Андрейчук - Дело в том, что вряд ли в ваших платных "качественных" кейсах найдётся хоть пару % действительно новой и полезной информации которой бы не было на общедоступных источниках.
Сайт на WordPress: за и против
Мира Смурков
1
комментарий
0
читателей
Полный профиль
Мира Смурков - Людмила, я согласен с большинством комментаторов. Вы хоть один полноценный магазин сделали на этих движках? Woocommerce это система с супер возможностями. И к ней есть дополнительные модули, с функционалом, который вряд ли появиться на Битрикс. А самому это программировать - сотни тысяч рублей на разработку. А приведя в пример сложности с robots.txt и Sitemap вы ставите под вопрос вашу компетенцию в понимании Интернет-бизнеса и веб-разработки в целом. Во-первых это такие мелочи, а во-вторых это все делается на вордпресса за 2 минуты, и опять же с возможностями многократно превышающими Битрикс.
Обзор популярных CMS: плюсы и минусы
Андрей Литвиненко
2
комментария
0
читателей
Полный профиль
Андрей Литвиненко - + там где нужно прописать каноникал, там где нужно поставить мета тег ноиндекс (т.к. Гугл не всегда следует правилам robots.txt) ну и то что выше, к техническим сео возможнлстям можно еще отнести легкое и хотя бы полуавтоматическое добавление микроразметки по сайту, увы "из коробки" такого функционала нет ни в одной cms, все на допиливаниях
Google обошел Яндекс по популярности в России в 2018 году: исследование SEO Auditor
Рамблер
1
комментарий
0
читателей
Полный профиль
Рамблер - Вот вроде отечественный - это сказано верно.. «Я́ндекс» — российская транснациональная компания, зарегистрированная в Нидерландах. Так говорится в Википедии. И с хрена ли ОТЕЧЕСТВЕННЫЙ поисковик зарегистрирован в Европе? И где платится основная часть налогов? Ну-ууу, точно не в России. И если запахнет жаренным, то был Яндекс и нет Яндекса!
8 методик в SEO, от которых давно пора отказаться
Евгений Сметанин
12
комментариев
0
читателей
Полный профиль
Евгений Сметанин - Факторов вообще очень много, согласитесь, вы будете использовать максимальное их количество, особенно, если в ТОПе засели агрегаторы с сумасшедшими ПФ. В таких случаях, вхождение ключа в домен для маленького профильного сайта, сыграет свою положительную роль. Конечно же, если контент на страницах хорошего качества. У меня есть несколько успешных кейсов на эту тему. На сайте продают несколько видов товаров, а выстреливает в ТОП тот, название которого присутствует в доменном имени. Как корабль назовешь, так он и поплывет, верно?))
Google Data Studio: делаем красивые отчеты по контекстной рекламе для клиентов
Сергей Провоженко
7
комментариев
0
читателей
Полный профиль
Сергей Провоженко - Добрый день, Сергей. Рад, что статья оказалась полезной. Алгоритм следующий: 1) В Гугл таблице формируем нужную структуру для выводы комментариев, в нашем отчете это следующие столбцы - i.imgur.com/mEnt7Hv.png Можно оставить один из столбцов страница или название страницы, они нужны чтоб фильтровать вывод нужно комментария на нужной странице отчета. Столбец дата нужен для выводы комментария в нужны период. 2) Подключаем эту таблицу как еще один источник данных - i.imgur.com/GrmNAgp.png Вот так выглядят поля из этого источника данных - i.imgur.com/BHqEiv7.png 3) Добавляем элемент "Таблица" в отчет Дата Студио, в качестве источника указываем нашу Гугл таблицу со следующими параметрами - i.imgur.com/tovqiqE.png 4) Создаем и добавляем фильтр для вывода нужно комментария на нужной странице отчета - i.imgur.com/4m141kF.png 5) Если дата комментария попадает в выбранный период в отчете он будет отображен. Если в период попадает несколько дат, будет выведено несколько комментариев - i.imgur.com/1jWu0X6.png Если остались вопросы - пишите, постараюсь помочь.
Инструкция: настраиваем цели Яндекс.Метрики через Google Tag Manager
Roman Gorkunenko
1
комментарий
0
читателей
Полный профиль
Roman Gorkunenko - Здравствуйте. Подскажите, пожалуйста, можно с айпи метрики вытащить среднюю стоимость клика по утм меткам? В метрике есть такой шаблон tags_u_t_m, но он не совместим с меткой директа, у них разные префиксы.
Аудит структуры интернет-магазина мебели от «Ашманов и партнеры»
Дмитрий
11
комментариев
0
читателей
Полный профиль
Дмитрий - Сергей, а вы допускаете, что вся ваша жизнь - seo-миф?
Как выбрать подрядчика для продвижения сайта: 7 уровней воронки поиска
aashutosh
1
комментарий
0
читателей
Полный профиль
aashutosh - data science training institute in noida- Webtrackker Technology (8802820025) providing Data Science Training in Noida. Get ✓ 40 Hours Learning training✓ 70 Hrs Projects ✓ 24 X 7 Support ✓ Job Assistance. WEBTRACKKER TECHNOLOGY (P) LTD. C - 67, sector- 63, Noida, India. E-47 Sector 3, Noida, India. +91 - 8802820025 0120-433-0760 +91 - 8810252423 012 - 04204716 EMAIL:info@webtrackker.com webtrackker.com/Best-Data-Science-Training-Institute-in-Noida.php
Как построить качественный ссылочный профиль на основе конкурентов
Ирина
2
комментария
0
читателей
Полный профиль
Ирина - Давно сотрудничаю с megaindex.com и считаю данный сервис одним из лучших в сео сегменте рунета да и не только рунета. Пользуюсь их инструментами для аналитики своих работ и выявлению своих и чужих ошибок. Да и ссылочный профиль, как и говорится в данной статье сделать гораздо проще и правильней при помощи как раз мегаиндекса. Добавлю еще что инструмент для поиска конкурентов у мегаиндекса очень удобный и простой в применении.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
345
Комментариев
262
Комментариев
247
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
101
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!