Фактор текстовой релевантности YMW: как не загубить оптимизацию под длинный хвост ключей

Россия+7 (495) 960-65-87
Шрифт:
3 3822

На этой неделе Яндекс начал использовать алгоритм «Баден-Баден» для определения нарушений, связанных с переоптимизацией, дополнив им предыдущие способы определения этой проблемы.

Поэтому мы решили вспомнить недавнюю статью Алексея Трудова, посвященную фактору текстовой релевантности — YMW.

Cеошная общественность бурно обсуждает новый алгоритм Яндекса «Баден-Баден». Не особо продуктивное занятие, на мой взгляд. Слишком мало времени прошло. Вряд ли у кого-то накопились достоверные наблюдения по хорошей выборке пострадавших сайтов. Тем более наивно ждать эффективную методику снятия. Да что там, пока даже неизвестно, включен ли алгоритм на полную мощность.

Ясно только одно: оптимизацию теперь нужно делать еще аккуратнее и тщательнее. Поэтому нелишне будет разобраться в достаточно редко упоминаемом факторе текстовой релевантности — YMW. Он основан на размере минимального куска текста, включающего максимальное количество встречающихся в документе слов запроса.

Статья Александра Сафронова «Тестирование простой ранжирующей формулы»

В публикации описана формула ранжирования, разработанная сотрудниками Яндекса для экспериментальной оценки отдельных факторов. Среди них — в первую очередь хорошо знакомые оптимизаторам вариации BM25 а также пара метрик, оценивающих близость слов запроса.

Вот описание одной из них — YMW:

YMW 1.png

Впали в уныние от нагромождения формул? Напрасно! Разобраться не так сложно. Внимательно читаем легенду:

YMW 2.png

Вторая же часть формулы представляет поправку на тот случай, если в тексте документа содержатся не все слова запроса. Она оперирует понятием «вес слова». IDF (inverse document frequency) — оценка частоты встречаемости слова во всей базе документов в поисковой системе. Эта величина используется во многих других факторах текстовой релевантности.

Теперь опустим конкретные знаки действий и логарифмы, просто отметим, какие параметры увеличивают итоговую оценку, а какие уменьшают.

  • Минимальный размер «окна» в котором встречаются все слова запроса — находится в знаменателе дроби. Чем он меньше, тем выше значение фактора.
  • Количество слов запроса, встречающиеся в документе — вычитаются из знаменателя. Чем больше, тем выше значение фактора.

Видите? От всей сложной формулы остается всего два параметра, специфичных для рассматриваемого фактора. Чуть ниже будет еще более наглядное объяснение, а пока проясним важный вопрос:

Стоит ли вообще учитывать этот фактор?

Рассматриваемая статья достаточно старая, выпущена еще в 2010 году. Тем не менее я считаю, что по крайней мере общие тенденции, выделенные выше, остаются актуальными. Вот несколько причин:

  • Судя по свежему докладу об устройстве поиска Яндекса, статья описывает вполне актуальные подходы к тестированию новых факторов ранжирования (вторая часть публикации).
  • Фактор упоминается в ТЗ на SEO-текст сравнительно редко. Поэтому поисковым системам не было нужды его отбрасывать под давлением оптимизаторов. Вообще он актуален для длинных запросов, под которые редко продвигают специально.
  • Группировка слов запроса в пределах абзаца-двух характерна для качественного профессионального контента. Очевидно, что слова, связанные с конкретной темой, будут сами по себе тянуться друг к другу: их связывает общая мысль.
  • В той же статье указан фактор «кучности». То есть близость слов — это реально важный фактор, поисковик пытается «зацепить» его разными способами.

Думаю, достаточно. Переходим к самому интересному — практике и выводам.

Как неосторожный оптимизатор может уменьшить релевантность текста

Если мы имеем дело со страницами, которые не претендуют на другие ключи, кроме вставленных в title, то фактор не будет особо значим. Ясно, что в этом случае мы получим очень маленькое «окно» — сам title. А вот если мы хотим сэкономить на создании страниц и одной статьей охватить десяток-другой среднечастотников и сотни их мелких НЧ-расширений — то учитывать YMW необходимо.

Сначала пример как делать НЕ надо (заодно буквально в картинках разберем суть фактора).

Допустим, у нас есть статья, в которой упомянут определенный ключевик:

YMW 3.png

Потом до нее дотянулись шаловливые ручки оптимизатора, и он решил расширить семантику а также напичкать текст модными LSI-словами. Загнал запросы в сервис генерации ТЗ, вытащил уйму расширений и тематичных слов. Отдал копирайтеру. Копирайтер, не заморачиваясь, дописал лишний абзац, куда густо натыкал затребованные термины. На выходе получилось это:

YMW 4.png

Все что надо — упомянуто. Ура?

Не совсем. Давайте прикинем YMW для «запрос из трех слов + расширение 1» до и после доработки. Смотрим сделанный выше вывод из формулы: чем меньше размер «окна» содержащего все слова запроса и чем больше слов из запроса встречается в документе — тем сильнее оценка фактора.

До:

  • размер окна, включающего все слова: 3 (они просто идут вместе).
  • число слов: 3 из 4

После:

Окно резко выросло!

YMW 5.png

То есть мы что-то добавили к итоговой оценке YMW за счет вхождения всех слов запроса и одновременно убавили, сделав окно огромным. Итоговое значение при этом могло упасть. Оцените порядок цифр в знаменателе первой дроби: для первого случая это (3 — 3 + α), а во втором что-то вроде (500 — 4 + α).

Конечно, другие факторы при этом могут сыграть в плюс (вхождение всех слов запроса — сильный сигнал). Но полного эффекта, который могло бы дать расширение семантики, мы не получим.

Заметьте, кстати: негативное влияние бездумного добавления ключей прослеживается на примере даже простого фактора ранжирования, без привлечения факторов антиспама.

Выводы

  • Фактор YMW имеет смысл учитывать в текстовой оптимизации. Особенно с учетом резко негативного отношения поисковых систем к традиционным методикам, опирающимся на число вхождений.
  • При продвижении под кластер ключей необходимо следить за близостью ключевых слов и расширений запроса в пределах страницы. Принцип максимального сокращения межсловных расстояний нужно применять не только к основным ключевым словам. Требуется проектировать страницу так, чтобы ей соответствовал весь набор поисковых фраз, включая микро-НЧ, предусмотреть которые невозможно.
  • Добавление на страницу связанной лексики без учета расположения основных ключей не даст полного эффекта.
  • Для оптимизации под длинный хвост в отношении YMW лучше всего подходят тексты с четкой структурой, разбитые заголовками на небольшие блоки. При этом каждый блок должен быть посвящен раскрытию конкретной под-темы и содержать максимум лексики, которая с ней связана. Нежелательна ситуация, когда запрос используется в одном блоке, а важное расширение в другом.

Источник: http://alexeytrudov.com/web-marketing/seo/faktor-ymw.html

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Михаил Войнов
    1
    комментарий
    0
    читателей
    Михаил Войнов
    больше года назад
    Как расшифровывается аббревиатура YMW?
    -
    0
    +
    Ответить
  • Andy
    1
    комментарий
    0
    читателей
    Andy
    больше года назад
    >>Заметьте, кстати: негативное влияние бездумного добавления ключей прослеживается на примере даже простого фактора ранжирования, без привлечения факторов антиспама.
    Речь о том, что большое окно не даст достигнуть максимального эффекта? Или к чему тут антиспам упомянут?

    >>...страницу так, чтобы ей соответствовал весь набор поисковых фраз,
    включая микро-НЧ, предусмотреть которые невозможно.
    Непонятный пассаж, поясните.
    -
    0
    +
    Ответить
    • Alexey Trudov
      6
      комментариев
      0
      читателей
      Alexey Trudov
      Andy
      больше года назад
      >>Речь о том, что большое окно не даст достигнуть максимального эффекта?
      Правильно.
      Антиспам упомянут, потому что с подобными текстами по идее как раз он должен бороться. То есть отдельные факторы, нацеленные на выявление неестественных текстов и штрафующие за них. Но как видим, даже обычный фактор может страдать от такой оптимизации.

      >>Непонятный пассаж, поясните.
      Смотрите. Все эти микро-НЧ как раз берутся из текста. Мы естественным образом употребл...
      >>Речь о том, что большое окно не даст достигнуть максимального эффекта?
      Правильно.
      Антиспам упомянут, потому что с подобными текстами по идее как раз он должен бороться. То есть отдельные факторы, нацеленные на выявление неестественных текстов и штрафующие за них. Но как видим, даже обычный фактор может страдать от такой оптимизации.

      >>Непонятный пассаж, поясните.
      Смотрите. Все эти микро-НЧ как раз берутся из текста. Мы естественным образом употребляем синонимы и вариации слов, входящих в запрос.
      Если четко структурировать контент на странице и не использовать «воду», то расстояния между основным запросом (например, в подзаголовке) и его расширениями (в тексте под ним) будут небольшими, что и увеличит YMW.
      Если же страницу вообще никак не проектировать и писать в стиле «что вижу то пою», то слова будут рассеяны по тексту и размер окна для всех бесчисленных комбинаций "основной запрос + слово" будет большим.
      -
      0
      +
      Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Тест: Кто как пробежал, или Итоги клиентского рейтинга SEOnews 2018
Анна Макарова
335
комментариев
0
читателей
Полный профиль
Анна Макарова - Друзья, спасибо всем за участие! Мы определили победителей. Кто ими стал - вы найдете по ссылке: www.seonews.ru/events/darim-knigi-ot-mif-pobediteli-opredeleny/ Если вы стали одним из победителей, обязательно свяжитесь с нами по указанной в новости (по ссылке выше) почте. Всем хороших выходных! =)
32 инструмента в помощь SEO-специалисту
luthorscorploanfirm
2
комментария
0
читателей
Полный профиль
luthorscorploanfirm - Я - г-н Марк Джо из корпорации corp, мы являемся законной, зарегистрированной и гарантированной кредитной компанией, мы предоставляем 3% -ые кредиты частным лицам, компаниям, государственным учреждениям и деловым организациям и людям всех родов. Свободные кредиты - это решение всех ваших финансовых проблем. свяжитесь с нами по электронной почте: mjoe0123@gmail.com
SEO глазами клиентов 2018
Konstantin I
1
комментарий
0
читателей
Полный профиль
Konstantin I - >сейчас же сложно найти агентства, которые специализируются только на SEO. Тем не менее, такие есть, например www.iconsult.agency. То есть, мы ) А, коль рейтинг носит название "SEO глазами клиентов", то нужно, чтобы его содержание соответствовало названию.
Комплексный аудит интернет-магазина от «Ашманов и партнеры». Часть 1
Александр Сова
1
комментарий
0
читателей
Полный профиль
Александр Сова - А вот и сеошники подъехали, покидать на вентилятор :D
Не очень удачный кейс продвижения сайта по услуге «Трезвый водитель» в Москве
Кирилл Щербаков
3
комментария
0
читателей
Полный профиль
Кирилл Щербаков - "даже пришлось подключить отслеживание звонков с сайта" "Даже" - как будто это что-то нереальное
Два идеальных способа разориться на старте интернет-магазина
Стас
4
комментария
0
читателей
Полный профиль
Стас - Seonews в последнее время такую чушь несет! Где вы таких афторов находите? Статья ничего не стоит и несет чушь! Кто хоть немного понимает в этом так вам и скажет, и такие де комментаторы горе-сеошники, просто смешно читать, вы хоть модерируете ваши статьи или просто для воды на сайте?! Бред сивой кобылы эта статья до самой последней точки!!!
Эксперимент: как уникальность контента влияет на продвижение сайта
Ilia Nazmutdinov
2
комментария
0
читателей
Полный профиль
Ilia Nazmutdinov - Кстати, ПФ не работают на нулевом трафике. Пока на сайт не льются тысячи показов по одним и тем же запросам влияние оказывает ток ссылочное\внешнее и внутреннее\ и внутренняя оптимизация.
Яндекс перестал индексировать сайты, созданные на Wix
Константин Даткунас
3
комментария
0
читателей
Полный профиль
Константин Даткунас - Было бы интересно посмотреть саму выборку из 10 000 и методику анализа.
Как мы разработали и вывели в ТОП сайт курсов рисования
Иван Стороженко
25
комментариев
0
читателей
Полный профиль
Иван Стороженко - Добрый день. 1)Чаще всего основная проблема заключается, в согласовании с клиентом добавляемого контента и то как он будет отображаться. На данном сайте фото и услуги конечно предоставлял клиент, все остальное уже делали мы. 2)Да в принципе, когда есть команда и понимание, что нужно делать, все идет быстро (опять же основная заминка идет на согласовании с клиентом) 3)Смысла делать новый в данном случает нет. В принципе доделывался полноценный сайт. 4)Когда клиент уже не предоставляет информацию, приходится искать у конкурентов (например с других стран или регионов). Но чаще всего клиент, хоть что-то "подкидывает".
Расчет трафика из поисковых систем по брендовым и небрендовым запросам
Дарья Калинская
238
комментариев
0
читателей
Полный профиль
Дарья Калинская - А вот и статья :) www.seonews.ru/analytics/raschet-trafika-po-nebrendovym-zaprosam-pri-pomoshchi-r/
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
335
Комментариев
262
Комментариев
238
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
87
Комментариев
80
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
57
Комментариев
55
Комментариев
54

Отправьте отзыв!
Отправьте отзыв!