×
Россия +7 (495) 139-20-33

Baltic Digital Days 2017: Исследование качества сервисов кластеризации по поисковой выдаче

Россия +7 (495) 139-20-33
Шрифт:
6 7882

Продолжаем обзор программной части конференции Baltic Digital Days, которая уже в пятый раз проходит в Калининграде. В рамках секции «SEO в русскоязычном интернете» Александр Ожгибесов представил доклад на тему «Исследование качества сервисов кластеризации по поисковой выдаче».

sasha.png

Свое выступление спикер начал с цитирования самых распространенных вопросов клиентов:

  • Какой кластеризатор лучше?
  • Какая степень лучше?
  • Как им пользоваться и так далее.

Когда я начал вести вебинары, эти вопросы мне стали задавать каждый день. Вот почему я решил взять на себя ответственность и сделать правдивый, объективный рейтинг существующих ТОП-овых кластеризаторов, – пояснил он.

Существует проблема в кластеризации: чтобы сделать качественное ядро, нужно проанализировать нишу, понять, чем занимается клиент, свести данные воедино, подготовить запросы для парсинга, вытащить множество запросов из источников, все это посмотреть по кластеризации по ТОПу, а потом еще вручную доанализировать, сгруппировать по контенту. В результате проект получается нереально долгим и затратным.

Таким образом, большую часть времени при составлении семантического ядра занимает:

1. Предварительный анализ структуры сайтов конкурентов.

2. Подготовка входных групп для парсинга и дальнейшая очистка данных от мусора.

3. Кластеризация запросов.

Кластеризаторы призваны решить эту проблему.

Рейтинг 8 кластеризаторов

Рис 1 (1).png

В ходе исследования перед экспертами стояла задача получить рейтинг не по конкретной тематике, а сразу по нескольким тематикам. Поэтому брали примерно по 30% каждого из этих параметров. Были и низкочастотные запросы. Изначально на входе было 116 тематических ядер общим объемом на 102 тысячи запросов.

Рис 2.png

Но есть проблема: запросы собирала моя команда, и они не идеальны, – добавил Александр. – Но при этом нам нужно было представить выборку идеальной и репрезентативной для доклада. Что мы делаем дальше? Мы предполагаем, что нельзя оценивать правильность кластеризации во всему ядру в целом. Мы будем сравнивать не по семантике, а по каждому конкретному кластеру.

Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП.

У нас был пул запросов, все данные поисковой выдачи были получены через прокси, и по каждому URL сформировали ТОП-10 сайтов.

Рис 3 (1).png

Далее необходимо отыскать наилучшие по количеству совпадений запросы из общего числа.

Рис 4 (1).png

Выделенные сайты нужно проанализировать с точки зрения позиции в выдаче:

Рис 5 (1).png

По итогам анализа видно, что по кластеру «расчет ОСАГО» в ТОПе выдачи находится следующий сайт:

Рис 6 (1).png

Всего 189 запросов, на одной странице по одному кластеру, из них в ТОП-1 – 69, ТОП-10 – 31.

Что касается одной известной всем компании, то для нее результат оказался чуть хуже:

Рис 7 (1).png

Далее следует полуинформационный-полукоммерческий сайт, здесь результаты гораздо хуже:

Рис 8.png

Для дальнейшего разбора кластеризаторов будет использоваться ресурс www.bonus-malus.ru.

Что делаем дальше?

Далее необходимо обратиться к сервису кластеризации и выгрузить все запросы по странице, которая, согласно приведенным выше данным, была идеальной. С этой целью был выполнен экспорт запросов из Serpstat по странице https://www.bonus- malus.ru/osago/kalkuljator.html.

При этом позиции ниже ТОП-10 в расчет брать не нужно. Далее производят сравнение исходного кластера, который был представлен в семантике, с кластером сайта. Аналогичное сравнение производится по каждому кластеру в исходном семантическом ядре. Только после этого будет получен результат.

Тематика «ОСАГО страхование» очень популярна, и здесь данные идеальные.

Рис 9.png

Однако и здесь не бывает идеальной ситуации. Так, например, в ходе эксперимента возникли проблемы: часть семантических ядер была не так хороша, как того бы хотелось.

Рис 10.png

К нам обращаются совсем разные бизнесы. 37% тех, с которыми все получилось: во-первых, это узкая тематика, – пояснил Александр:

Рис 11.png

Во-вторых, тематика и регион.

Рис 12.png

Представители сервисов кластеризации нередко подчеркивают, что SEO-специалисты неправильно работают с ними. Не нужно подавать голые парсинги из Вордстат, подсказок и всего прочего, нужно изначально делать оценку, убирать лишнее, предоставлять на вход более-менее правильные данные, и тогда вы получите реальный, крутой результат.

Так и есть, мы используем данные кластеризации, но только в таком фоне, а не в фоне «спарсили и отдали на вход». Поэтому данные, которые мы подавали на вход — это наши ядра, которые мы продали, которые прошли оценку качества, у которых все круто, – согласился с позицией сервисов спикер.

Иными словами, данные, которые подаются на вход, являются максимально объективными по требованию самих же кластеризаторов. Это не только очищенные от мусора запросы, а готовая группировка, на основе которых строится структура и продвижение реальных сайтов. Данные, которые вы получите, применив эту методику на «голом» парсинге, никак не могут соотноситься с текущим исследованием!

Кластеризация проводилась в каждом из сервисов в одно и то же время.

Но прежде чем представить слушателям рейтинг сервисов, Александр продемонстрировал проблемные моменты, с которыми столкнулся во время проведения анализа.

На слайде представлены 3 кластера

Прежде всего, это дублирование кластеров:

Рис 13.png

Важно понимать, что:

  1. салют
  2. фейерверки
  3. салют и фейерверки

Это три разных кластера.

В то же время рядовой специалист работает по следующей схеме: выгружает ядро из 60 тыс. запросов и отдает это на вход. Кластеризаторы выдают самый большой кластер, по которому и формируется ТОП. При таком подходе получить качественный результат невозможно.

Вот как должна проводиться работа по кластеризации в идеале:

Рис 14.png

Рис 15.png

Еще одна существенная проблема - это отсутствие кластеризации в регионах. Стоит лишь копнуть чуть глубже и можно получить абсолютно разные кластеры. На слайде видна статистика по 2400 запросам.

Рис 16.png

Рис 17.png

Поскольку отдельные запросы нередко «прыгают» по кластерам, важно сформировать структуру запросов, статьи, сайта и распределить некластеризованные запросы:

Рис 18.png

Важно понимать, что есть множество запросов, которые в принципе не кластеризуются.

Рис 19.png

Дополнительно спикер пояснил, что сбор семантики — это отдельный бизнес-процесс, и в каждой уважающей себя SEO-компании есть целый отдел, который им занимается.

Я не призываю вас не использовать кластеризацию, я призываю думать своей головой. Кластеризация это круто, — пояснил Александр.

Семь параметров оценки

В ходе анализа кластеризаторов использовали 7 параметров оценки:

1 параметр — это сильное совпадение. К примеру, есть исходный кластер и есть кластер кластеризатор, он на 60% повторяет наш кластер, от 60 до 100% — это хороший показатель.

2 параметр — слабое совпадение, когда процент совпадений из кластера сервиса составляет от 59 до 21% с исходным кластером. Это тоже неплохо.

3 параметр — когда идет сильное несовпадение (от 20 до 0%). Это не круто.

4 параметр — процент некластеризованного. То есть процент запросов из кластеризации сервиса, которые оказались непригодными для кластеризации по сравнению с исходным кластером.

5 параметр — совпадение по важным запросам. То есть совпадения по частотным запросам в тематике.

6 параметр — совпадение по второстепенным запросам. Этот параметр характерен только для очень крупных бизнесов.

7 параметр — совпадение по ТОПу. Сравнение проводится по методологии оценки исходной группировки, но с учетом дублей по кластерам.

Вот такие данные удалось получить по каждому ядру.

Рис 20.png

Key Collector крут!

Рис 21.png

Что касается сильного совпадения, здесь данные оказались следующими:

Рис 22.png

Далее сравниваем слабое совпадение:

Рис 23.png

Сильное несовпадение:

Рис 24.png

Некластиризовано:

Рис 25.png

Совпадение по важным:

Рис 26.png

Совпадение по второстепенным:

Рис 27.png

Вхождение в ТОП:

Рис 28.png

Далее были выбраны лучшие кластеризации, которые будут представлены ниже:

Рис 29.png

Итоговая оценка получилась такой:

Рис 30.png

Что касается вхождения по ТОПу, то у 40% кластеризаторов проблем с этим параметром нет. Однако в целом кластеризаторы уступают специалистам и всем сервисам есть, куда расти.

Сделать однозначный вывод о том, какой из кластеризаторов лучший, невозможно. Ведь следует учитывать все предыдущие параметры, на основе которых проводился эксперимент: где-то Rush Soft реально проигрывает Just-Magic, а где-то Топвизор выигрывает у Rush Soft, но это исключение из правил.

В таблицах представлены общие данные по 116 тысячам запросов. Я считаю, это объективно, – подвел итог исследования спикер. 

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Алиэкспресс Профи
    5
    комментариев
    0
    читателей
    Алиэкспресс Профи
    больше года назад
    Я правильно понял, что для точности данных в Key Assort нужно работать с SOFT 5 ?
    -
    0
    +
    Ответить
  • Сергей Иванов
    57
    комментариев
    0
    читателей
    Сергей Иванов
    больше года назад
    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."

    Как я понял - запросы от 170 по 180 занимают позиции с 5 по 10. Т.е. нам интересна группа запросов с 1 по 170, так как они в ТОП5
    -
    0
    +
    Ответить
    • Саша Ожгибесов
      2
      комментария
      0
      читателей
      Саша Ожгибесов
      Сергей Иванов
      больше года назад
      Ребят, посмотрите презентацию, она есть у меня на странице www.facebook.com/aozhgibesov/posts/1444042752340262

      Мысль в том, что не всегда сайт, которых находится в ТОПе по наибольшому количеству запросов, должен быть самым идеальным. Цитирую, как это было написано в презентации:

      "Ищем сайт из ТОП 10 с наибольшим совпадением по списку запросов, при этом сайт с 9 совпадению из 10 с позицией с 5 по 10 считается менее репрезентативным, нежели сайт с 8 совпадениями с...
      Ребят, посмотрите презентацию, она есть у меня на странице www.facebook.com/aozhgibesov/posts/1444042752340262

      Мысль в том, что не всегда сайт, которых находится в ТОПе по наибольшому количеству запросов, должен быть самым идеальным. Цитирую, как это было написано в презентации:

      "Ищем сайт из ТОП 10 с наибольшим совпадением по списку запросов, при этом сайт с 9 совпадению из 10 с позицией с 5 по 10 считается менее репрезентативным, нежели сайт с 8 совпадениями с позициями с 1 по 4. "
      -
      0
      +
      Ответить
  • lusie
    2
    комментария
    0
    читателей
    lusie
    больше года назад
    Местами создается впечатление, что либо писавший статью не вполне понимает, о чем пишет, либо не вполне четко выражает свою мысль.

    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."
    О каком варианте речь? Сайт "смог попасть в топ10"  и по 170 запросам, что хотел сказать автор?....
    Местами создается впечатление, что либо писавший статью не вполне понимает, о чем пишет, либо не вполне четко выражает свою мысль.

    "Допустим, есть 180 запросов, и по 170 запросам сайт занимает с 1 по 5 позицию. При этом запрос №180 занимает позиции с 5 по 10. Именно первый вариант будет наиболее интересен, поскольку по нему сайт смог попасть в ТОП."
    О каком варианте речь? Сайт "смог попасть в топ10"  и по 170 запросам, что хотел сказать автор?...

    "У нас был пул запросов, все данные поисковой выдачи были получены через прокси, и по каждому URL сформировали ТОП-10 сайтов."
    Может, по каждому запросу?
    -
    1
    +
    Ответить
    • Саша Ожгибесов
      2
      комментария
      0
      читателей
      Саша Ожгибесов
      lusie
      больше года назад
      Посмотрите ответ к первому комментарию, а лучше изучить всю презентацию целиком
      -
      -3
      +
      Ответить
  • Emin Reklama
    9
    комментариев
    0
    читателей
    Emin Reklama
    больше года назад
    Очень интересный материал, каждый день что-то новое. amalgoo.blogspot.com/
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
«Юзабилити-лаборатория»: оставляйте заявку на участие!
Анна Макарова
381
комментарий
0
читателей
Полный профиль
Анна Макарова - Антон, добрый день! Ваш сайт не попал в основную выборку для юзабилити-анализа, но эксперты постараются сделать по вашему сайту видеоразбор (ю-ревью). Будем держать вас в курсе )
Тест по SEO – проверь свой уровень знаний
Артем Дорофеев
8
комментариев
0
читателей
Полный профиль
Артем Дорофеев - Полный текст вопроса со скриншотом панели прикладываю. Итого, что имеем: - на скриншоте отмечено, что это фильтр МПК - сайт коммерческий - рекламы на сайте нет С вероятностью 95% это ошибка (которая уже дважды случалась в Яндексе), когда они случайно "закосили" неповинные сайты. Тогда по запросу Платону фильтр быстренько снимали. Но вопрос даже не на знание этого нюанса. В любой непонятной ситуации, прежде чем что-либо предпринимать (особенно переписывать весь контент на сайте или менять дизайн, как указано в других вариантах) - фильтр следует подтвердить. Правильный ответ: "Написать письмо в техподдержку Яндекса".
Кейс: как за 30 дней вывести новый сайт в ТОП выдачи Google
Сергей
2
комментария
0
читателей
Полный профиль
Сергей - Прошёл у Паши курс год назад, пытался продвигать свой сайт portativ.org.ua, но особых продвижений нет. Наверное сео уже умерло??
Выбираем CMS для сайта с точки зрения SEO: базовые требования
SEO.RU
6
комментариев
0
читателей
Полный профиль
SEO.RU - Спасибо за замечание, действительно была допущена неточность - возможно информация была не так давно обновилась. Данные в статье поправим на актуальные.
Digital-marketing: как выжить в кризис. Опыт реальной компании
Maks
1
комментарий
0
читателей
Полный профиль
Maks - Спасибо за опыт Вашей компании, Иван Папусь. Интересно получилось! Желаю Вашему бизнесу стабильности и успешно пережить все кризисы))
100+ ресурсов по SEO для изучения поисковой оптимизации с нуля
Марина Ибушева
0
комментариев
0
читателей
Полный профиль
Марина Ибушева - Спасибо за добавление. Мы уже работаем над отдельным материалом про курсы, потому что одной статьи мало, чтобы охватить все крутое по обучению)
SEO must go on! Почему в кризис нельзя останавливать продвижение сайта
everystraus
43
комментария
0
читателей
Полный профиль
everystraus - Мы даже варианты не рассматривали. Если проект неустойчив, сразу предлагали сбавить обороты до минимума, но и так, чтоб не свалиться в штопор. Именно по СЕО чаще всего.
Как стандартизировать данные семантики с помощью логарифмов
Юлий
1
комментарий
0
читателей
Полный профиль
Юлий - Чем снималась коммерцелизация?
Платные и бесплатные курсы по SEO и интернет-маркетингу для новичков и опытных специалистов
Алексей Терещенко
1
комментарий
0
читателей
Полный профиль
Алексей Терещенко - Запустил бесплатный марафон для SEO специалистов с нуля в Фейсбуке. Рекомендую начинать совой путь с него и дальше уже определятся, нравится направление или нет. Так же на базе обучающего марафона есть сообщестово в котором все в удобном формате общаются и постигают профессию. Моя миссия - создать сообщество крутых и образованых seo специалистов и поднять качество услуг на высокий уровень. Кому интересно, присоеденяйтесь www.facebook.com/groups/startseofree/
Гайд по работе с освобождающимися доменами: перехват, восстановление, создание сетки и заработок
Daniel Dan
1
комментарий
0
читателей
Полный профиль
Daniel Dan - Интересно и полезно читать, Спасибо!
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
381
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
113
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
89
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
60
Комментариев
59
Комментариев
57

Отправьте отзыв!
Отправьте отзыв!