Baltic Digital Days 2017: Исследование качества сервисов кластеризации по поисковой выдаче

Россия+7 (495) 960-65-87
Шрифт:
6 4557

Продолжаем обзор программной части конференции Baltic Digital Days, которая уже в пятый раз проходит в Калининграде. В рамках секции «SEO в русскоязычном интернете» Александр Ожгибесов представил доклад на тему «Исследование качества сервисов кластеризации по поисковой выдаче».

sasha.png

Свое выступление спикер начал с цитирования самых распространенных вопросов клиентов:

  • Какой кластеризатор лучше?
  • Какая степень лучше?
  • Как им пользоваться и так далее.

Когда я начал вести вебинары, эти вопросы мне стали задавать каждый день. Вот почему я решил взять на себя ответственность и сделать правдивый, объективный рейтинг существующих ТОП-овых кластеризаторов, – пояснил он.

Существует проблема в кластеризации: чтобы сделать качественное ядро, нужно проанализировать нишу, понять, чем занимается клиент, свести данные воедино, подготовить запросы для парсинга, вытащить множество запросов из источников, все это посмотреть по кластеризации по ТОПу, а потом еще вручную доанализировать, сгруппировать по контенту. В результате проект получается нереально долгим и затратным.

Таким образом, большую часть времени при составлении семантического ядра занимает:

1. Предварительный анализ структуры сайтов конкурентов.

2. Подготовка входных групп для парсинга и дальнейшая очистка данных от мусора.

3. Кластеризация запросов.

Кластеризаторы призваны решить эту проблему.

Рейтинг 8 кластеризаторов

Рис 1 (1).png

В ходе исследования перед экспертами стояла задача получить рейтинг не по конкретной тематике, а сразу по нескольким тематикам. Поэтому брали примерно по 30% каждого из этих параметров. Были и низкочастотные запросы. Изначально на входе было 116 тематических ядер общим объемом на 102 тысячи запросов.

Рис 2.png

Но есть проблема: запросы собирала моя команда, и они не идеальны, – добавил Александр. – Но при этом нам нужно было представить выборку идеальной и репрезентативной для доклада. Что мы делаем дальше? Мы предполагаем, что нельзя оценивать правильность кластеризации во всему ядру в целом. Мы будем сравнивать не по семантике, а по каждому конкретному кластеру.

Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП.

У нас был пул запросов, все данные поисковой выдачи были получены через прокси, и по каждому URL сформировали ТОП-10 сайтов.

Рис 3 (1).png

Далее необходимо отыскать наилучшие по количеству совпадений запросы из общего числа.

Рис 4 (1).png

Выделенные сайты нужно проанализировать с точки зрения позиции в выдаче:

Рис 5 (1).png

По итогам анализа видно, что по кластеру «расчет ОСАГО» в ТОПе выдачи находится следующий сайт:

Рис 6 (1).png

Всего 189 запросов, на одной странице по одному кластеру, из них в ТОП-1 – 69, ТОП-10 – 31.

Что касается одной известной всем компании, то для нее результат оказался чуть хуже:

Рис 7 (1).png

Далее следует полуинформационный-полукоммерческий сайт, здесь результаты гораздо хуже:

Рис 8.png

Для дальнейшего разбора кластеризаторов будет использоваться ресурс www.bonus-malus.ru.

Что делаем дальше?

Далее необходимо обратиться к сервису кластеризации и выгрузить все запросы по странице, которая, согласно приведенным выше данным, была идеальной. С этой целью был выполнен экспорт запросов из Serpstat по странице https://www.bonus- malus.ru/osago/kalkuljator.html.

При этом позиции ниже ТОП-10 в расчет брать не нужно. Далее производят сравнение исходного кластера, который был представлен в семантике, с кластером сайта. Аналогичное сравнение производится по каждому кластеру в исходном семантическом ядре. Только после этого будет получен результат.

Тематика «ОСАГО страхование» очень популярна, и здесь данные идеальные.

Рис 9.png

Однако и здесь не бывает идеальной ситуации. Так, например, в ходе эксперимента возникли проблемы: часть семантических ядер была не так хороша, как того бы хотелось.

Рис 10.png

К нам обращаются совсем разные бизнесы. 37% тех, с которыми все получилось: во-первых, это узкая тематика, – пояснил Александр:

Рис 11.png

Во-вторых, тематика и регион.

Рис 12.png

Представители сервисов кластеризации нередко подчеркивают, что SEO-специалисты неправильно работают с ними. Не нужно подавать голые парсинги из Вордстат, подсказок и всего прочего, нужно изначально делать оценку, убирать лишнее, предоставлять на вход более-менее правильные данные, и тогда вы получите реальный, крутой результат.

Так и есть, мы используем данные кластеризации, но только в таком фоне, а не в фоне «спарсили и отдали на вход». Поэтому данные, которые мы подавали на вход — это наши ядра, которые мы продали, которые прошли оценку качества, у которых все круто, – согласился с позицией сервисов спикер.

Иными словами, данные, которые подаются на вход, являются максимально объективными по требованию самих же кластеризаторов. Это не только очищенные от мусора запросы, а готовая группировка, на основе которых строится структура и продвижение реальных сайтов. Данные, которые вы получите, применив эту методику на «голом» парсинге, никак не могут соотноситься с текущим исследованием!

Кластеризация проводилась в каждом из сервисов в одно и то же время.

Но прежде чем представить слушателям рейтинг сервисов, Александр продемонстрировал проблемные моменты, с которыми столкнулся во время проведения анализа.

На слайде представлены 3 кластера

Прежде всего, это дублирование кластеров:

Рис 13.png

Важно понимать, что:

  1. салют
  2. фейерверки
  3. салют и фейерверки

Это три разных кластера.

В то же время рядовой специалист работает по следующей схеме: выгружает ядро из 60 тыс. запросов и отдает это на вход. Кластеризаторы выдают самый большой кластер, по которому и формируется ТОП. При таком подходе получить качественный результат невозможно.

Вот как должна проводиться работа по кластеризации в идеале:

Рис 14.png

Рис 15.png

Еще одна существенная проблема - это отсутствие кластеризации в регионах. Стоит лишь копнуть чуть глубже и можно получить абсолютно разные кластеры. На слайде видна статистика по 2400 запросам.

Рис 16.png

Рис 17.png

Поскольку отдельные запросы нередко «прыгают» по кластерам, важно сформировать структуру запросов, статьи, сайта и распределить некластеризованные запросы:

Рис 18.png

Важно понимать, что есть множество запросов, которые в принципе не кластеризуются.

Рис 19.png

Дополнительно спикер пояснил, что сбор семантики — это отдельный бизнес-процесс, и в каждой уважающей себя SEO-компании есть целый отдел, который им занимается.

Я не призываю вас не использовать кластеризацию, я призываю думать своей головой. Кластеризация это круто, — пояснил Александр.

Семь параметров оценки

В ходе анализа кластеризаторов использовали 7 параметров оценки:

1 параметр — это сильное совпадение. К примеру, есть исходный кластер и есть кластер кластеризатор, он на 60% повторяет наш кластер, от 60 до 100% — это хороший показатель.

2 параметр — слабое совпадение, когда процент совпадений из кластера сервиса составляет от 59 до 21% с исходным кластером. Это тоже неплохо.

3 параметр — когда идет сильное несовпадение (от 20 до 0%). Это не круто.

4 параметр — процент некластеризованного. То есть процент запросов из кластеризации сервиса, которые оказались непригодными для кластеризации по сравнению с исходным кластером.

5 параметр — совпадение по важным запросам. То есть совпадения по частотным запросам в тематике.

6 параметр — совпадение по второстепенным запросам. Этот параметр характерен только для очень крупных бизнесов.

7 параметр — совпадение по ТОПу. Сравнение проводится по методологии оценки исходной группировки, но с учетом дублей по кластерам.

Вот такие данные удалось получить по каждому ядру.

Рис 20.png

Key Collector крут!

Рис 21.png

Что касается сильного совпадения, здесь данные оказались следующими:

Рис 22.png

Далее сравниваем слабое совпадение:

Рис 23.png

Сильное несовпадение:

Рис 24.png

Некластиризовано:

Рис 25.png

Совпадение по важным:

Рис 26.png

Совпадение по второстепенным:

Рис 27.png

Вхождение в ТОП:

Рис 28.png

Далее были выбраны лучшие кластеризации, которые будут представлены ниже:

Рис 29.png

Итоговая оценка получилась такой:

Рис 30.png

Что касается вхождения по ТОПу, то у 40% кластеризаторов проблем с этим параметром нет. Однако в целом кластеризаторы уступают специалистам и всем сервисам есть, куда расти.

Сделать однозначный вывод о том, какой из кластеризаторов лучший, невозможно. Ведь следует учитывать все предыдущие параметры, на основе которых проводился эксперимент: где-то Rush Soft реально проигрывает Just-Magic, а где-то Топвизор выигрывает у Rush Soft, но это исключение из правил.

В таблицах представлены общие данные по 116 тысячам запросов. Я считаю, это объективно, – подвел итог исследования спикер. 

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Алиэкспресс Профи
    4
    комментария
    0
    читателей
    Алиэкспресс Профи
    2 месяца назад
    Я правильно понял, что для точности данных в Key Assort нужно работать с SOFT 5 ?
    -
    0
    +
    Ответить
  • Сергей Иванов
    29
    комментариев
    0
    читателей
    Сергей Иванов
    3 месяца назад
    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."

    Как я понял - запросы от 170 по 180 занимают позиции с 5 по 10. Т.е. нам интересна группа запросов с 1 по 170, так как они в ТОП5
    -
    0
    +
    Ответить
    • Саша Ожгибесов
      2
      комментария
      0
      читателей
      Ребят, посмотрите презентацию, она есть у меня на странице www.facebook.com/aozhgibesov/posts/1444042752340262

      Мысль в том, что не всегда сайт, которых находится в ТОПе по наибольшому количеству запросов, должен быть самым идеальным. Цитирую, как это было написано в презентации:

      "Ищем сайт из ТОП 10 с наибольшим совпадением по списку запросов, при этом сайт с 9 совпадению из 10 с позицией с 5 по 10 считается менее репрезентативным, нежели сайт с 8 совпадениями с...
      Ребят, посмотрите презентацию, она есть у меня на странице www.facebook.com/aozhgibesov/posts/1444042752340262

      Мысль в том, что не всегда сайт, которых находится в ТОПе по наибольшому количеству запросов, должен быть самым идеальным. Цитирую, как это было написано в презентации:

      "Ищем сайт из ТОП 10 с наибольшим совпадением по списку запросов, при этом сайт с 9 совпадению из 10 с позицией с 5 по 10 считается менее репрезентативным, нежели сайт с 8 совпадениями с позициями с 1 по 4. "
      -
      0
      +
      Ответить
  • lusie
    2
    комментария
    0
    читателей
    lusie
    3 месяца назад
    Местами создается впечатление, что либо писавший статью не вполне понимает, о чем пишет, либо не вполне четко выражает свою мысль.

    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."
    О каком варианте речь? Сайт "смог попасть в топ10"  и по 170 запросам, что хотел сказать автор?....
    Местами создается впечатление, что либо писавший статью не вполне понимает, о чем пишет, либо не вполне четко выражает свою мысль.

    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."
    О каком варианте речь? Сайт "смог попасть в топ10"  и по 170 запросам, что хотел сказать автор?...

    "У нас был пул запросов, все данные поисковой выдачи были получены через прокси, и по каждому URL сформировали ТОП-10 сайтов."
    Может, по каждому запросу?
    -
    1
    +
    Ответить
    • Саша Ожгибесов
      2
      комментария
      0
      читателей
      Саша Ожгибесов
      lusie
      3 месяца назад
      Посмотрите ответ к первому комментарию, а лучше изучить всю презентацию целиком
      -
      -2
      +
      Ответить
  • Emin Reklama
    9
    комментариев
    0
    читателей
    Emin Reklama
    3 месяца назад
    Очень интересный материал, каждый день что-то новое. amalgoo.blogspot.com/
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
«Баден-Баден»: как выйти из-под фильтра
Александр
27
комментариев
0
читателей
Полный профиль
Александр - Сергей, будем рады увидеть исследование, которое докажет мифичность.
«Прямая линия» с Александром Алаевым («АлаичЪ и Ко»): отвечаем на вопросы
Александр Алаев
13
комментариев
0
читателей
Полный профиль
Александр Алаев - Роман. Тут ответ очень простой. Каждый запрос можно четко разделить на коммерческий или некоммерческий. "Купить слона" и его длинные хвосты - коммерческий. "Как выбрать слона" и подобные - информационные. Вот под коммерческие ключи должны быть страницы услуг или каталога товаров. А под информационку - блог. Очень важно не путать их, тем более несоответствующая коммерческим факторам страниц просто не продвинется, то есть по запросу с "купить" блог никогда не будет показываться в выдаче, так же как и страница услуги/товаров не покажется по "как выбрать". Понятно примерно?
Кейс: продвигаем бизнес по продаже пластиковых окон в Москве
Иван Стороженко
5
комментариев
0
читателей
Полный профиль
Иван Стороженко - 1. По началу вообще не использовали, сейчас уже много каналов используется. 2. Все может быть, в принципе сайты должны быть удобны для пользователя, для этого и нужна схожесть между собой. Честно говоря старались брать все самое интересное у конкурентов + подкреплять своими идеями.
Инфографика: самые распространенные SEO-ошибки Рунета
Dmitro Grunt
2
комментария
0
читателей
Полный профиль
Dmitro Grunt - Кстати, у проектов которые продвигает Нетпик все тайтлы не более 65 символов? Или вы надеетесь что кто то послушает советов и отдаст вам часть трафика? :-)
7 причин не работать на биржах копирайтинга
Dasha Shkaruba
6
комментариев
0
читателей
Полный профиль
Dasha Shkaruba - Спасибо за мнение! Кстати, на бирже главреда прием анкет закрыт
День рождения SEOnews: 12 лет в эфире!
Анна Макарова
0
комментариев
0
читателей
Полный профиль
Анна Макарова - Ура )
Google.ru внесли в реестр запрещенных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
Западные специалисты выяснили, как повысить позиции ресурса в выдаче Google
Serhii Diachenko
1
комментарий
0
читателей
Полный профиль
Serhii Diachenko - Спасибо Бернис!
Как бесплатно публиковать гостевые посты без миралинкс и бирж ссылок
Александра Емец
1
комментарий
0
читателей
Полный профиль
Александра Емец - Некоторые сеошники почему-то забывают о таком эффективном бесплатном способе продвижения, как гостевые посты. Все внешнее продвижение заключается в закупке ссылок и раскрутке групп в соцсетях. Первое уже начало изживать себя, нужно искать что-то новое. Хорошо, что вы напомнили о гостевых постах. Будем пробовать и развиваться.
SEMrush: факторы ранжирования в Google в 2017 году
Анна Макарова
0
комментариев
0
читателей
Полный профиль
Анна Макарова - Уважаемый S1, я тоже понимаю, что есть такие люди, которые заметив допущенную неточность несутся на всех парусах продемонстрировать "силу" своего ума. Спасибо вам за пристальное внимание. Это поможет нам быть лучше.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
310
Комментариев
262
Комментариев
228
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
53
Комментариев
52
Комментариев
48

Отправьте отзыв!
Отправьте отзыв!