×
Россия +7 (495) 139-20-33

Кластеризация наоборот: как автоматизировать рутинную работу

Россия +7 (495) 139-20-33
Шрифт:
0 4151

Любой SEO-специалист мечтает о том, чтобы автоматизировать рутинную работу с поисковыми запросами. Вместо того чтобы собирать ключи по разным источникам, прогонять через кластеризатор, потом чистить руками… просто получить готовый кластер, который станет основой для успешного продвижения страницы в выдаче. Такой способ на самом деле есть, и эта статья описывает его алгоритмическую составляющую, а также дает возможность каждому желающему протестировать данный способ на практике.

Проблематика

Допустим, мы имеем маленький сайт с 10 страницами. Нам бы хотелось, чтобы у нас было 10 кластеров запросов под каждую страницу. Как подобрать эти запросы?
Решение в лоб – это сбор маркерных запросов из Wordstat, потом парсинг поисковых подсказок, частотности запросов и дальнейшая кластеризация всего «облака» по маркерам. Согласитесь – и долго, и дорого. Вот бы был сервис, в который можно отправить 10 маркерных запросов, а он бы вернул 10 кластеров, да еще и с частотностью.

Классическая кластеризация

В общем виде кластеризация – это группировка объектов по какому-то общему признаку. Двигаясь от известного к новому, давайте рассмотрим алгоритм кластеризации по признаку схожести поисковых топов:

Классическая кластеризация

  • на шаге 1 мы имеем список поисковых запросов;
  • на шаге 2 проверяется топ-10 по каждому запросу;
  • на шаге 3 проверяется наличие общих url;
  • на шаге 4 в один кластер объединяются запросы, у которых есть общие url.

Пример умышленно упрощен, чтобы было легче понять, что такое «кластеризация наоборот».

Кластеризация наоборот

Алгоритм под названием «кластеризация наоборот» нельзя в полной мере назвать кластеризацией, он работает по-другому:

Кластеризация наоборот

  • на шаге 1 подается на вход поисковый запрос;
  • на шаге 2 проверяется топ-10 по этому запросу;
  • на шаге 3 получаем список запросов, по которым url встречается в топ 10 (подробнее про этот шаг будет ниже);
  • на шаге 4 объединяем все запросы в один список. Он, конечно, содержит дубликаты. Мы можем посчитать, сколько раз повторяется тот или иной ключ, а затем отсортировать все ключи по этой цифре.

Для примера мы проверили выдачу по запросу «купить бейсболку», затем для каждого url получили список ключей, соединили списки и посчитали встречаемость ключей. На скриншоте видно, что ключ «купить бейсболку» встречается 3 раза, ключ «кепки» – 2 раза, остальные – по одному разу.

Есть еще пятый шаг, согласно которому нам нужно взять только верхушку получившегося на шаге 4 списка. Дело в том, что запросы, которые встречаются 1 раз, нас не интересуют – среди них есть и брендовые запросы, и те, что в кластере будут смотреться неуместно. Верхушкой считаются первые 10 запросов списка, они встречаются чаще всего. 10 запросов вполне достаточно для первичной оптимизации одной страницы.

Ключи на url

Но откуда взять запросы, по которым конкретный url присутствует в топе? Такой информации поисковая система не раскрывает, придется воспользоваться платными сервисами:

  • Ahrefs.com;
  • Serpstat.com;
  • Keys.so.

На базе последнего (Keys.so) и работает программа, которая реализует этот алгоритм.

KeysSoCollector

KeysSoCollector

Скачать ее можно тут, разархивируйте папку на рабочий стол. Для того чтобы все заработало, вам нужно зайти в настройки программы и заполнить текстовые поля:

Ключи на URL

  1. X-Keyso-Token – возьмите его из личного кабинета keys.so.

  2. Город KeysSo – это город базы ключевых слов. Выбрать нужный можно из раскрывающегося списка.

  3. xmlproxy – это ваш адрес для совершения запросов к XMLProxy. Необходимо скопировать полностью всю строку:

Город KeysSo

  1. Город выдачи – это город выдачи Яндекса. В разных городах, как известно, выдача отличается, поэтому нужно написать с большой буквы ваш город самостоятельно.

Задайте списком маркерные запросы в текстовое поле в левой части программы и нажмите Запуск. Через некоторое время вы получите готовые кластеры запросов с их частотностью.

Примеры получившихся кластеров

Примеры получившихся кластеров

Примеры получившихся кластеров

Преимущества и недостатки

К преимуществам такого подхода можно отнести:

  • скорость сбора ключей;
  • получение сразу ключей с их частотностью;
  • простота подхода – всего пара шагов до готового результата;
  • разнообразие ключей на выходе (не просто перестановки слов одного ключа);
  • получившийся кластер дает представление о том, какой интент запроса с точки зрения ПС;
  • сбор запросов на любом языке. Если сделать реализацию этого алгоритма с использованием Serpstat и Google, то можно собирать запросы на любом языке.

Про последний пункт стоит сказать подробнее. Дело в том, что объект поиска Яндексу приходится угадывать, так как большинство запросов мультиинтентные. Возьмем для примера запрос «поло». Что хотел пользователь? Водное поло? Или рубашки поло? Или ошибся в слове «пол». Или это машина Volkswagen Polo? Проверим.

Сбор запросов на любом языке

Как видите, кластер целиком про Volkswagen Polo. Так получилось потому, что в выдаче Яндекса по этому запросу 10 url про машину. Рассмотрим менее очевидный пример:

Сбор запросов на любом языке

Очень часто по таким запросам многие ожидают увидеть коммерческую выдачу, но на деле она является информационной. Таким образом можно быстро и точно анализировать интенты, не прибегая к сервисам проверки типа запросов.

К недостаткам относятся:

  • Ограничение на количество ключей в кластере. Оно существует, так как первые 10 ключей списка, как правило, хорошо дополняют основной маркер. Но дальше начинаются случайные запросы, которые сделают кластер «грязным», и его придется чистить. Экспериментально выявлено, что 10 запросов – это оптимальное количество.
  • Иногда можно получить меньше 10 запросов в кластере:

Недостатки: меньше 10 запросов в кластере

Это происходит потому, что не набралось 10 ключей для анализа. Такое возможно в тех случаях, когда семантика не предусматривает разнообразия и когда url в выдаче присутствуют по одному-двум ключам.

  • Иногда кластер получается очень грязным и нерелевантным основному маркеру. В первую очередь это связано с тем, что сама выдача нерелевантна запросу. На примере ниже мы видим кластер, который состоит из разношерстных запросов про кардиганы, но нам-то нужны были запросы про мужской черный кардиган.

Иногда кластер получается очень грязным и не релевантным основному маркеру

Ниже приведена органическая выдача по запросу «кардиган мужской черный купить». Там мы видим, что только Wildberries сделали отдельную страницу под этот запрос. Остальные ответы нерелевантны – скорее всего, у Яндекса просто нет релевантных ответов на этот запрос.

Органическая выдача по запросу “кардиган мужской черный купить”

Как можно доработать алгоритм

Выбирать перестановки по частотности

Например, запросы «купить кроссовки в москве» и «кроссовки в москве купить» – это, по сути, перестановка одних и тех же слов. В таком случае можно было бы говорить о том, что это один и тот же запрос, который встречается 2 раза. И в итоговом списке отдавать самую частотную перестановку.

Недописанные запросы

В любой базе ключевых слов встречаются запросы, с которыми SEO-специалист не работает. Например, запрос «блеск для губ от». Их легко выделить, потому что они заканчиваются предлогом или союзом.

Выбор языка

Когда мы говорим про парсинг выдачи Google, то мы, конечно, помним, что это мультиязычный поиск, он работает во всех странах.

Если так, тогда мы можем использовать этот алгоритм для того, чтобы собрать кластер запросов на чужом языке, например французском.

(Голосов: 17, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
15
комментариев
0
читателей
Полный профиль
Михаил Мухин - Здравствуйте! 1-2. Считает стенд. Ссылка на него дана, но могу повторить: online.p-c-l.ru/competition/task/card/id/106. Нажмите на кнопку "Начать" и заранее приготовьте прогноз бюджета Яндекс. Суть расчета: перебор комбинаций всех ставок на всех фразах, построение бюджетных когорт - бюджетов с одинаковым СРС, отбор в каждой когорте бюджета с максимальным количеством кликов и ..., да упорядочивание этих бюджетов по мере возрастания СРС, причем берем не все, а с фиксированным шагом. 3. Гугл считается через поправочные коэффициенты. Мы перевариваем океан данных и представляем их. На удивление, получается не менее, хотя и не более точно, как и прогноз Яндекс. Конечно, нужно понимать, что это очень примерные прикидки, фактически перевод неточного прогноза Яндекс в удобочитаемую форму, не больше. Самое интересное начинается, когда применяешь метод бюджетных когорт к измерению показателей фраз на реальной рекламной кампании в режиме 48х7. Первые результаты очень хорошие. Если хотите присоединиться к бесплатному тестированию, напишите Эльвире r-support@r-broker.ru. В теме укажите "хочу присоединиться к тестам Умного управления рекламой"
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
8
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Дмитрий Сульман
4
комментария
0
читателей
Полный профиль
Дмитрий Сульман - Все верно, об этом я и говорю. У крупных компаний есть много данных и они имеют доступ к дорогим технологиям и решениям для персонализации контента. Топовые западные сервисы для персонализации, такие как RichRelevance или Dynamic Yield, стоят от нескольких тысяч до десятков тысяч долларов в месяц. Понятно, что малый бизнес не может себе этого позволить. Да даже если бы чисто теоретически и мог, то это вряд ли бы имело хоть какой-то смысл. Во-первых, у малого бизнеса недостаточно данных, чтобы подобные алгоритмы персонализации начали эффективно работать, а во-вторых, тот профит, который МСБ получит от персонализации, никогда не покроет таких расходов. Мы же предлагаем решение, доступное как раз для малого и среднего бизнеса. При этом наше решение комплексное: МультиЧат - это одновременно и инструмент для персонализации, и для коммуникации.
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
Digital-разговор: Михаил Шакин про SEO, Google и заработок в интернете
Анна Макарова
368
комментариев
0
читателей
Полный профиль
Анна Макарова - Подготовим ) Пока предлагаю почитать интервью с Денисом Нарижным из той же серии. Там стенограмма =) www.seonews.ru/interviews/digital-razgovor-denis-narizhnyy-pro-ukhod-iz-seo-i-zarabotok-na-partnerkakh/
Как удвоить выручку за счет продвижения в поиске. Кейс coffee-butik.ru
Максим Боровой
3
комментария
0
читателей
Полный профиль
Максим Боровой - Последний вопрос (извиняюсь за количество) - почему на "В корзину" стоит Nofollow. Осознанно для распределение весов?
Кейс Hansa: как увеличить органический трафик в 1,5 раза
Алексей Порфирьев
3
комментария
0
читателей
Полный профиль
Алексей Порфирьев - Спасибо за замечание, о данной проблеме известно, но она не стоит в порядке приоритетных. Вопрос, на самом деле, дискуссионный. В тематике конкуренция не настолько велика, а в топе выдачи часто встречаются сайты с более серьёзными техническими проблемами. По этому, именно в статьях, более важно работать над релевантностью контента, отношением времени пользователя на странице к уровню доскрола, и различным пользовательским функционалом (рейтинг материала, просмотры и т. п.).
Автоматические SEO-аудиты: как напугать некорректными выводами
SEOquick
38
комментариев
0
читателей
Полный профиль
SEOquick - Парсинг сайтов – это самый лучший способ автоматизировать процесс сбора и сохранения информации. Конкурентов всегда нужно мониторить, а не сравнивать свой сайт через автоматический аудит анализатора.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
368
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
139
Комментариев
121
Комментариев
108
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
85
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!