Хочешь повысить отдачу от Директа?
Включи «Автопилот»

Baltic Digital Days 2017: Исследование качества сервисов кластеризации по поисковой выдаче

Россия+7 (495) 960-65-87
Шрифт:
6 4210

Продолжаем обзор программной части конференции Baltic Digital Days, которая уже в пятый раз проходит в Калининграде. В рамках секции «SEO в русскоязычном интернете» Александр Ожгибесов представил доклад на тему «Исследование качества сервисов кластеризации по поисковой выдаче».

sasha.png

Свое выступление спикер начал с цитирования самых распространенных вопросов клиентов:

  • Какой кластеризатор лучше?
  • Какая степень лучше?
  • Как им пользоваться и так далее.

Когда я начал вести вебинары, эти вопросы мне стали задавать каждый день. Вот почему я решил взять на себя ответственность и сделать правдивый, объективный рейтинг существующих ТОП-овых кластеризаторов, – пояснил он.

Существует проблема в кластеризации: чтобы сделать качественное ядро, нужно проанализировать нишу, понять, чем занимается клиент, свести данные воедино, подготовить запросы для парсинга, вытащить множество запросов из источников, все это посмотреть по кластеризации по ТОПу, а потом еще вручную доанализировать, сгруппировать по контенту. В результате проект получается нереально долгим и затратным.

Таким образом, большую часть времени при составлении семантического ядра занимает:

1. Предварительный анализ структуры сайтов конкурентов.

2. Подготовка входных групп для парсинга и дальнейшая очистка данных от мусора.

3. Кластеризация запросов.

Кластеризаторы призваны решить эту проблему.

Рейтинг 8 кластеризаторов

Рис 1 (1).png

В ходе исследования перед экспертами стояла задача получить рейтинг не по конкретной тематике, а сразу по нескольким тематикам. Поэтому брали примерно по 30% каждого из этих параметров. Были и низкочастотные запросы. Изначально на входе было 116 тематических ядер общим объемом на 102 тысячи запросов.

Рис 2.png

Но есть проблема: запросы собирала моя команда, и они не идеальны, – добавил Александр. – Но при этом нам нужно было представить выборку идеальной и репрезентативной для доклада. Что мы делаем дальше? Мы предполагаем, что нельзя оценивать правильность кластеризации во всему ядру в целом. Мы будем сравнивать не по семантике, а по каждому конкретному кластеру.

Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП.

У нас был пул запросов, все данные поисковой выдачи были получены через прокси, и по каждому URL сформировали ТОП-10 сайтов.

Рис 3 (1).png

Далее необходимо отыскать наилучшие по количеству совпадений запросы из общего числа.

Рис 4 (1).png

Выделенные сайты нужно проанализировать с точки зрения позиции в выдаче:

Рис 5 (1).png

По итогам анализа видно, что по кластеру «расчет ОСАГО» в ТОПе выдачи находится следующий сайт:

Рис 6 (1).png

Всего 189 запросов, на одной странице по одному кластеру, из них в ТОП-1 – 69, ТОП-10 – 31.

Что касается одной известной всем компании, то для нее результат оказался чуть хуже:

Рис 7 (1).png

Далее следует полуинформационный-полукоммерческий сайт, здесь результаты гораздо хуже:

Рис 8.png

Для дальнейшего разбора кластеризаторов будет использоваться ресурс www.bonus-malus.ru.

Что делаем дальше?

Далее необходимо обратиться к сервису кластеризации и выгрузить все запросы по странице, которая, согласно приведенным выше данным, была идеальной. С этой целью был выполнен экспорт запросов из Serpstat по странице https://www.bonus- malus.ru/osago/kalkuljator.html.

При этом позиции ниже ТОП-10 в расчет брать не нужно. Далее производят сравнение исходного кластера, который был представлен в семантике, с кластером сайта. Аналогичное сравнение производится по каждому кластеру в исходном семантическом ядре. Только после этого будет получен результат.

Тематика «ОСАГО страхование» очень популярна, и здесь данные идеальные.

Рис 9.png

Однако и здесь не бывает идеальной ситуации. Так, например, в ходе эксперимента возникли проблемы: часть семантических ядер была не так хороша, как того бы хотелось.

Рис 10.png

К нам обращаются совсем разные бизнесы. 37% тех, с которыми все получилось: во-первых, это узкая тематика, – пояснил Александр:

Рис 11.png

Во-вторых, тематика и регион.

Рис 12.png

Представители сервисов кластеризации нередко подчеркивают, что SEO-специалисты неправильно работают с ними. Не нужно подавать голые парсинги из Вордстат, подсказок и всего прочего, нужно изначально делать оценку, убирать лишнее, предоставлять на вход более-менее правильные данные, и тогда вы получите реальный, крутой результат.

Так и есть, мы используем данные кластеризации, но только в таком фоне, а не в фоне «спарсили и отдали на вход». Поэтому данные, которые мы подавали на вход — это наши ядра, которые мы продали, которые прошли оценку качества, у которых все круто, – согласился с позицией сервисов спикер.

Иными словами, данные, которые подаются на вход, являются максимально объективными по требованию самих же кластеризаторов. Это не только очищенные от мусора запросы, а готовая группировка, на основе которых строится структура и продвижение реальных сайтов. Данные, которые вы получите, применив эту методику на «голом» парсинге, никак не могут соотноситься с текущим исследованием!

Кластеризация проводилась в каждом из сервисов в одно и то же время.

Но прежде чем представить слушателям рейтинг сервисов, Александр продемонстрировал проблемные моменты, с которыми столкнулся во время проведения анализа.

На слайде представлены 3 кластера

Прежде всего, это дублирование кластеров:

Рис 13.png

Важно понимать, что:

  1. салют
  2. фейерверки
  3. салют и фейерверки

Это три разных кластера.

В то же время рядовой специалист работает по следующей схеме: выгружает ядро из 60 тыс. запросов и отдает это на вход. Кластеризаторы выдают самый большой кластер, по которому и формируется ТОП. При таком подходе получить качественный результат невозможно.

Вот как должна проводиться работа по кластеризации в идеале:

Рис 14.png

Рис 15.png

Еще одна существенная проблема - это отсутствие кластеризации в регионах. Стоит лишь копнуть чуть глубже и можно получить абсолютно разные кластеры. На слайде видна статистика по 2400 запросам.

Рис 16.png

Рис 17.png

Поскольку отдельные запросы нередко «прыгают» по кластерам, важно сформировать структуру запросов, статьи, сайта и распределить некластеризованные запросы:

Рис 18.png

Важно понимать, что есть множество запросов, которые в принципе не кластеризуются.

Рис 19.png

Дополнительно спикер пояснил, что сбор семантики — это отдельный бизнес-процесс, и в каждой уважающей себя SEO-компании есть целый отдел, который им занимается.

Я не призываю вас не использовать кластеризацию, я призываю думать своей головой. Кластеризация это круто, — пояснил Александр.

Семь параметров оценки

В ходе анализа кластеризаторов использовали 7 параметров оценки:

1 параметр — это сильное совпадение. К примеру, есть исходный кластер и есть кластер кластеризатор, он на 60% повторяет наш кластер, от 60 до 100% — это хороший показатель.

2 параметр — слабое совпадение, когда процент совпадений из кластера сервиса составляет от 59 до 21% с исходным кластером. Это тоже неплохо.

3 параметр — когда идет сильное несовпадение (от 20 до 0%). Это не круто.

4 параметр — процент некластеризованного. То есть процент запросов из кластеризации сервиса, которые оказались непригодными для кластеризации по сравнению с исходным кластером.

5 параметр — совпадение по важным запросам. То есть совпадения по частотным запросам в тематике.

6 параметр — совпадение по второстепенным запросам. Этот параметр характерен только для очень крупных бизнесов.

7 параметр — совпадение по ТОПу. Сравнение проводится по методологии оценки исходной группировки, но с учетом дублей по кластерам.

Вот такие данные удалось получить по каждому ядру.

Рис 20.png

Key Collector крут!

Рис 21.png

Что касается сильного совпадения, здесь данные оказались следующими:

Рис 22.png

Далее сравниваем слабое совпадение:

Рис 23.png

Сильное несовпадение:

Рис 24.png

Некластиризовано:

Рис 25.png

Совпадение по важным:

Рис 26.png

Совпадение по второстепенным:

Рис 27.png

Вхождение в ТОП:

Рис 28.png

Далее были выбраны лучшие кластеризации, которые будут представлены ниже:

Рис 29.png

Итоговая оценка получилась такой:

Рис 30.png

Что касается вхождения по ТОПу, то у 40% кластеризаторов проблем с этим параметром нет. Однако в целом кластеризаторы уступают специалистам и всем сервисам есть, куда расти.

Сделать однозначный вывод о том, какой из кластеризаторов лучший, невозможно. Ведь следует учитывать все предыдущие параметры, на основе которых проводился эксперимент: где-то Rush Soft реально проигрывает Just-Magic, а где-то Топвизор выигрывает у Rush Soft, но это исключение из правил.

В таблицах представлены общие данные по 116 тысячам запросов. Я считаю, это объективно, – подвел итог исследования спикер. 

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Алиэкспресс Профи
    2
    комментария
    0
    читателей
    Алиэкспресс Профи
    1 месяц назад
    Я правильно понял, что для точности данных в Key Assort нужно работать с SOFT 5 ?
    -
    0
    +
    Ответить
  • Сергей Иванов
    19
    комментариев
    0
    читателей
    Сергей Иванов
    1 месяц назад
    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."

    Как я понял - запросы от 170 по 180 занимают позиции с 5 по 10. Т.е. нам интересна группа запросов с 1 по 170, так как они в ТОП5
    -
    0
    +
    Ответить
    • Саша Ожгибесов
      2
      комментария
      0
      читателей
      Ребят, посмотрите презентацию, она есть у меня на странице www.facebook.com/aozhgibesov/posts/1444042752340262

      Мысль в том, что не всегда сайт, которых находится в ТОПе по наибольшому количеству запросов, должен быть самым идеальным. Цитирую, как это было написано в презентации:

      "Ищем сайт из ТОП 10 с наибольшим совпадением по списку запросов, при этом сайт с 9 совпадению из 10 с позицией с 5 по 10 считается менее репрезентативным, нежели сайт с 8 совпадениями с...
      Ребят, посмотрите презентацию, она есть у меня на странице www.facebook.com/aozhgibesov/posts/1444042752340262

      Мысль в том, что не всегда сайт, которых находится в ТОПе по наибольшому количеству запросов, должен быть самым идеальным. Цитирую, как это было написано в презентации:

      "Ищем сайт из ТОП 10 с наибольшим совпадением по списку запросов, при этом сайт с 9 совпадению из 10 с позицией с 5 по 10 считается менее репрезентативным, нежели сайт с 8 совпадениями с позициями с 1 по 4. "
      -
      0
      +
      Ответить
  • lusie
    2
    комментария
    0
    читателей
    lusie
    1 месяц назад
    Местами создается впечатление, что либо писавший статью не вполне понимает, о чем пишет, либо не вполне четко выражает свою мысль.

    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."
    О каком варианте речь? Сайт "смог попасть в топ10"  и по 170 запросам, что хотел сказать автор?....
    Местами создается впечатление, что либо писавший статью не вполне понимает, о чем пишет, либо не вполне четко выражает свою мысль.

    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."
    О каком варианте речь? Сайт "смог попасть в топ10"  и по 170 запросам, что хотел сказать автор?...

    "У нас был пул запросов, все данные поисковой выдачи были получены через прокси, и по каждому URL сформировали ТОП-10 сайтов."
    Может, по каждому запросу?
    -
    1
    +
    Ответить
    • Саша Ожгибесов
      2
      комментария
      0
      читателей
      Саша Ожгибесов
      lusie
      1 месяц назад
      Посмотрите ответ к первому комментарию, а лучше изучить всю презентацию целиком
      -
      -2
      +
      Ответить
  • Emin Reklama
    8
    комментариев
    0
    читателей
    Emin Reklama
    1 месяц назад
    Очень интересный материал, каждый день что-то новое. amalgoo.blogspot.com/
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
SEOnews и Serpstat запускают конкурс для интернет-маркетологов
Marina Lagutina
1
комментарий
0
читателей
Полный профиль
Marina Lagutina - Добрый день! Видимо я из тех, кто пытается последней вскочить в уходящий поезд. Ночью написала статью на тему "обзор инструментов контент-маркетинга". Своего блога нет. Отправила вам не мейл. Я еще могу у вас разместиться или искать, кто возьмет статью к себе в блог?
Влияние HTTPS на ранжирование региональных поддоменов в Яндексе
NiK Malefictum
3
комментария
0
читателей
Полный профиль
NiK Malefictum - Стакивался лишь с тем, что выдачу немного лихорадит первые 2-3 недели, и если у сайта была низкая скорость загрузки - ее нужно поправить. Региональным сайтам НУЖНО ставить HTTPS немного внутряк поправить / микроразметку и прочее прописать мета и пересмотреть контент зарегать компанию в каталогах предприятий и картографии и уже делать просто сделать статейные ссылки бесплатные. и все
Мир глазами поисковых систем
Александр Рунов
17
комментариев
0
читателей
Полный профиль
Александр Рунов - Какой регион, если не секрет? В Мск, в ряде ВК тематик (в тех же "окнах" или "колесах"), без работы с внешними факторами по ВЧ запросам в ТОП не выплывешь. Хотя в большинстве направлений вполне реально.
Инфографика: самые распространенные SEO-ошибки Рунета
Dmitro Grunt
2
комментария
0
читателей
Полный профиль
Dmitro Grunt - Кстати, у проектов которые продвигает Нетпик все тайтлы не более 65 символов? Или вы надеетесь что кто то послушает советов и отдаст вам часть трафика? :-)
День рождения SEOnews: 12 лет в эфире!
Анна Макарова
309
комментариев
0
читателей
Полный профиль
Анна Макарова - Ура )
7 причин не работать на биржах копирайтинга
Dasha Shkaruba
6
комментариев
0
читателей
Полный профиль
Dasha Shkaruba - Спасибо за мнение! Кстати, на бирже главреда прием анкет закрыт
Google.ru внесли в реестр запрещенных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
SEMrush: факторы ранжирования в Google в 2017 году
Анна Макарова
309
комментариев
0
читателей
Полный профиль
Анна Макарова - Уважаемый S1, я тоже понимаю, что есть такие люди, которые заметив допущенную неточность несутся на всех парусах продемонстрировать "силу" своего ума. Спасибо вам за пристальное внимание. Это поможет нам быть лучше.
Сердитый маркетолог: как вы сами хороните свой сайт, или 16 принципов, которые нужно усвоить заказчикам SEO
Руслан Латыпов
2
комментария
0
читателей
Полный профиль
Руслан Латыпов - Можно совершенно бесплатно заказать SEO-аудит своего сайта и получить все рекомендации по его продвижению a-erp.com/
Конкурс: угадайте пятерку лидеров рейтинга «SEO глазами клиентов 2017»
Оля
1
комментарий
0
читателей
Полный профиль
Оля - 1 Ingate 2 Wezom 3 Bynjg vtlbf 4 seo energy 5 директ лайн
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
309
Комментариев
262
Комментариев
225
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
53
Комментариев
52
Комментариев
47

Отправьте отзыв!
Отправьте отзыв!