Фактор текстовой релевантности YMW: как не загубить оптимизацию под длинный хвост ключей

Россия+7 (495) 960-65-87
Шрифт:
3 3502

На этой неделе Яндекс начал использовать алгоритм «Баден-Баден» для определения нарушений, связанных с переоптимизацией, дополнив им предыдущие способы определения этой проблемы.

Поэтому мы решили вспомнить недавнюю статью Алексея Трудова, посвященную фактору текстовой релевантности — YMW.

Cеошная общественность бурно обсуждает новый алгоритм Яндекса «Баден-Баден». Не особо продуктивное занятие, на мой взгляд. Слишком мало времени прошло. Вряд ли у кого-то накопились достоверные наблюдения по хорошей выборке пострадавших сайтов. Тем более наивно ждать эффективную методику снятия. Да что там, пока даже неизвестно, включен ли алгоритм на полную мощность.

Ясно только одно: оптимизацию теперь нужно делать еще аккуратнее и тщательнее. Поэтому нелишне будет разобраться в достаточно редко упоминаемом факторе текстовой релевантности — YMW. Он основан на размере минимального куска текста, включающего максимальное количество встречающихся в документе слов запроса.

Статья Александра Сафронова «Тестирование простой ранжирующей формулы»

В публикации описана формула ранжирования, разработанная сотрудниками Яндекса для экспериментальной оценки отдельных факторов. Среди них — в первую очередь хорошо знакомые оптимизаторам вариации BM25 а также пара метрик, оценивающих близость слов запроса.

Вот описание одной из них — YMW:

YMW 1.png

Впали в уныние от нагромождения формул? Напрасно! Разобраться не так сложно. Внимательно читаем легенду:

YMW 2.png

Вторая же часть формулы представляет поправку на тот случай, если в тексте документа содержатся не все слова запроса. Она оперирует понятием «вес слова». IDF (inverse document frequency) — оценка частоты встречаемости слова во всей базе документов в поисковой системе. Эта величина используется во многих других факторах текстовой релевантности.

Теперь опустим конкретные знаки действий и логарифмы, просто отметим, какие параметры увеличивают итоговую оценку, а какие уменьшают.

  • Минимальный размер «окна» в котором встречаются все слова запроса — находится в знаменателе дроби. Чем он меньше, тем выше значение фактора.
  • Количество слов запроса, встречающиеся в документе — вычитаются из знаменателя. Чем больше, тем выше значение фактора.

Видите? От всей сложной формулы остается всего два параметра, специфичных для рассматриваемого фактора. Чуть ниже будет еще более наглядное объяснение, а пока проясним важный вопрос:

Стоит ли вообще учитывать этот фактор?

Рассматриваемая статья достаточно старая, выпущена еще в 2010 году. Тем не менее я считаю, что по крайней мере общие тенденции, выделенные выше, остаются актуальными. Вот несколько причин:

  • Судя по свежему докладу об устройстве поиска Яндекса, статья описывает вполне актуальные подходы к тестированию новых факторов ранжирования (вторая часть публикации).
  • Фактор упоминается в ТЗ на SEO-текст сравнительно редко. Поэтому поисковым системам не было нужды его отбрасывать под давлением оптимизаторов. Вообще он актуален для длинных запросов, под которые редко продвигают специально.
  • Группировка слов запроса в пределах абзаца-двух характерна для качественного профессионального контента. Очевидно, что слова, связанные с конкретной темой, будут сами по себе тянуться друг к другу: их связывает общая мысль.
  • В той же статье указан фактор «кучности». То есть близость слов — это реально важный фактор, поисковик пытается «зацепить» его разными способами.

Думаю, достаточно. Переходим к самому интересному — практике и выводам.

Как неосторожный оптимизатор может уменьшить релевантность текста

Если мы имеем дело со страницами, которые не претендуют на другие ключи, кроме вставленных в title, то фактор не будет особо значим. Ясно, что в этом случае мы получим очень маленькое «окно» — сам title. А вот если мы хотим сэкономить на создании страниц и одной статьей охватить десяток-другой среднечастотников и сотни их мелких НЧ-расширений — то учитывать YMW необходимо.

Сначала пример как делать НЕ надо (заодно буквально в картинках разберем суть фактора).

Допустим, у нас есть статья, в которой упомянут определенный ключевик:

YMW 3.png

Потом до нее дотянулись шаловливые ручки оптимизатора, и он решил расширить семантику а также напичкать текст модными LSI-словами. Загнал запросы в сервис генерации ТЗ, вытащил уйму расширений и тематичных слов. Отдал копирайтеру. Копирайтер, не заморачиваясь, дописал лишний абзац, куда густо натыкал затребованные термины. На выходе получилось это:

YMW 4.png

Все что надо — упомянуто. Ура?

Не совсем. Давайте прикинем YMW для «запрос из трех слов + расширение 1» до и после доработки. Смотрим сделанный выше вывод из формулы: чем меньше размер «окна» содержащего все слова запроса и чем больше слов из запроса встречается в документе — тем сильнее оценка фактора.

До:

  • размер окна, включающего все слова: 3 (они просто идут вместе).
  • число слов: 3 из 4

После:

Окно резко выросло!

YMW 5.png

То есть мы что-то добавили к итоговой оценке YMW за счет вхождения всех слов запроса и одновременно убавили, сделав окно огромным. Итоговое значение при этом могло упасть. Оцените порядок цифр в знаменателе первой дроби: для первого случая это (3 — 3 + α), а во втором что-то вроде (500 — 4 + α).

Конечно, другие факторы при этом могут сыграть в плюс (вхождение всех слов запроса — сильный сигнал). Но полного эффекта, который могло бы дать расширение семантики, мы не получим.

Заметьте, кстати: негативное влияние бездумного добавления ключей прослеживается на примере даже простого фактора ранжирования, без привлечения факторов антиспама.

Выводы

  • Фактор YMW имеет смысл учитывать в текстовой оптимизации. Особенно с учетом резко негативного отношения поисковых систем к традиционным методикам, опирающимся на число вхождений.
  • При продвижении под кластер ключей необходимо следить за близостью ключевых слов и расширений запроса в пределах страницы. Принцип максимального сокращения межсловных расстояний нужно применять не только к основным ключевым словам. Требуется проектировать страницу так, чтобы ей соответствовал весь набор поисковых фраз, включая микро-НЧ, предусмотреть которые невозможно.
  • Добавление на страницу связанной лексики без учета расположения основных ключей не даст полного эффекта.
  • Для оптимизации под длинный хвост в отношении YMW лучше всего подходят тексты с четкой структурой, разбитые заголовками на небольшие блоки. При этом каждый блок должен быть посвящен раскрытию конкретной под-темы и содержать максимум лексики, которая с ней связана. Нежелательна ситуация, когда запрос используется в одном блоке, а важное расширение в другом.

Источник: http://alexeytrudov.com/web-marketing/seo/faktor-ymw.html

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Михаил Войнов
    1
    комментарий
    0
    читателей
    Михаил Войнов
    6 месяцев назад
    Как расшифровывается аббревиатура YMW?
    -
    0
    +
    Ответить
  • Andy
    1
    комментарий
    0
    читателей
    Andy
    6 месяцев назад
    >>Заметьте, кстати: негативное влияние бездумного добавления ключей прослеживается на примере даже простого фактора ранжирования, без привлечения факторов антиспама.
    Речь о том, что большое окно не даст достигнуть максимального эффекта? Или к чему тут антиспам упомянут?

    >>...страницу так, чтобы ей соответствовал весь набор поисковых фраз,
    включая микро-НЧ, предусмотреть которые невозможно.
    Непонятный пассаж, поясните.
    -
    0
    +
    Ответить
    • Alexey Trudov
      6
      комментариев
      0
      читателей
      Alexey Trudov
      Andy
      6 месяцев назад
      >>Речь о том, что большое окно не даст достигнуть максимального эффекта?
      Правильно.
      Антиспам упомянут, потому что с подобными текстами по идее как раз он должен бороться. То есть отдельные факторы, нацеленные на выявление неестественных текстов и штрафующие за них. Но как видим, даже обычный фактор может страдать от такой оптимизации.

      >>Непонятный пассаж, поясните.
      Смотрите. Все эти микро-НЧ как раз берутся из текста. Мы естественным образом употребл...
      >>Речь о том, что большое окно не даст достигнуть максимального эффекта?
      Правильно.
      Антиспам упомянут, потому что с подобными текстами по идее как раз он должен бороться. То есть отдельные факторы, нацеленные на выявление неестественных текстов и штрафующие за них. Но как видим, даже обычный фактор может страдать от такой оптимизации.

      >>Непонятный пассаж, поясните.
      Смотрите. Все эти микро-НЧ как раз берутся из текста. Мы естественным образом употребляем синонимы и вариации слов, входящих в запрос.
      Если четко структурировать контент на странице и не использовать «воду», то расстояния между основным запросом (например, в подзаголовке) и его расширениями (в тексте под ним) будут небольшими, что и увеличит YMW.
      Если же страницу вообще никак не проектировать и писать в стиле «что вижу то пою», то слова будут рассеяны по тексту и размер окна для всех бесчисленных комбинаций "основной запрос + слово" будет большим.
      -
      0
      +
      Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Кейс: как продвинуть сайт производителя мебели на заказ в Москве
Art Moderator
2
комментария
0
читателей
Полный профиль
Art Moderator -
Рейтинг «Известность бренда SEO-компаний 2017»: народное голосование
Гость
1
комментарий
0
читателей
Полный профиль
Гость - 1) Ingate 2) Ашманов 3) Кокос 4) Russian Promo 5) Netpeak
«Баден-Баден»: как выйти из-под фильтра
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Здравствуйте! У меня совсем новый сайт (около месяца). Как только добавила страницы - были на 64, 45 и т.д. местах в выдаче яндекса по нч и сч запросам, но через несколько дней улетели за пределы 200. Что это баден - баден или песочница? Текст вроде не спамный, но мне трудно судить. Сайт portretnazakaz.ru
Второе дыхание ссылочного продвижения
Rookee.ru
24
комментария
0
читателей
Полный профиль
Rookee.ru - Еще лучше, когда продвижение осуществляется комплексно :)
32 инструмента в помощь SEO-специалисту
Alex Wise
5
комментариев
0
читателей
Полный профиль
Alex Wise - Данис, я тысячу раз извиняюсь насчёт имени! :( Хотя уверен, что лучше всех вас понимаю по этому поводу, ибо меня всегда называют "Алексеем", хотя я Александр: всё из-за сокращения Alex ;) Жду фидбека по новой версии 3.0!
Исследование: влияние smart-ссылок на продвижение по СЧ-запросам
Анатолий Шевчик
1
комментарий
0
читателей
Полный профиль
Анатолий Шевчик - +1097988
Контекст под SEO. Как поисковая реклама помогает позициям в органической выдаче
Сергей Дембицкий «Sima-Land.ru»
22
комментария
0
читателей
Полный профиль
Сергей Дембицкий «Sima-Land.ru» - Боже мой, неужели SEO-маги вернулись??? Открыть в роботс utm-метки для индексации и наплодить дублей...что? А расчеты в конце статьи про бюджет на SEO и контекст...откуда эти пропорции? Как по мне, SEO-магия вне Хогвартс. Спасибо, развеселили!
Западные специалисты выяснили, как повысить позиции ресурса в выдаче Google
Максим Мирошник
2
комментария
0
читателей
Полный профиль
Максим Мирошник -
Все, что нужно SEO-специалисту. Обзор инструментов
Администратор Сайта
1
комментарий
1
читатель
Полный профиль
Администратор Сайта - Шаришь в seo! Сервис реально хороший
«Прямая линия» с Артуром Латыповым: отвечаем на вопросы
God Koss
1
комментарий
0
читателей
Полный профиль
God Koss - Добрый день! Есть сайты одной компании продвигающиеся в разных странах. .ru .com .net. На российском сайте два языка ru и en, на остальных до 10 языков. Недавно сайт ru по основному брендовому запросу выпал из выдачи Яндекс но после апа вернулся на вторую позицию. На вопрос аффилирования в тех поддержку, получит ответ, что всё в порядке и сайт com не учавствует в выдаче. Но он есть и занимает 1 место. Как быть в данной ситуации? Так же, после возврата в топ 10 по этому запросу зашла еще одна внутренняя страница. Могло ли это случиться из-за каннибализации запроса? Немного изменил description на внутренней, исключил вхождения брендового запроса. Жду апа. Хотел бы услышать ваше мнение. Заранее благодарю!
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
321
Комментариев
262
Комментариев
234
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
86
Комментариев
80
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55
Комментариев
54
Комментариев
53

Отправьте отзыв!
Отправьте отзыв!