×
Россия +7 (495) 139-20-33

Как стандартизировать данные семантики с помощью логарифмов

Россия +7 (495) 139-20-33
Шрифт:
6 12323

Сбор, кластеризация и анализ полученных данных по семантическому ядру – один из наиболее важных этапов продвижения сайтов в поисковых системах. 

Так как процесс сбора ядра имеет примерно одинаковый алгоритм во многих компаниях, в данной статье мы поговорим не о самом процессе формирования кластеров, а о способе быстрой оценки данных при выборе наиболее значимых кластеров для работы. Это позволит сделать быстрый старт именно с тех позиций, которые имеют наиболее весомые показатели как по коммерческой оценке, так и по частотности. 

Проблема 

При работе с большим объемом запросов в коммерческой тематике и при необходимости быстрого запуска наиболее весомых кластеров часто возникает ситуация, когда выборка по частотности показывает запросы некоммерческого характера. После сортировки ключей по коммерческим оценкам мы можем увидеть вверху низкочастотные запросы, которые не интересны для нас на этапе старта работ. 

Ключевики

На скриншоте видно, что, фильтруя по частотности, мы получаем вверху запросы с низкими коммерческими показателями 

Если представить ситуацию, при которой мы работаем с готовой чистой информационной семантикой, то тогда мы можем отбирать

  • либо самый частотный запрос, а затем забирать остальные запросы кластера по номеру группы (grp); 
  • либо сортировать информацию по сумме кластера через функцию «СУММ ЕСЛИ». 

Подбор и кластеризация ключевиков

Данный способ не подходит, когда при сортировке по частотности мы получаем запросы, не отсортированные по коммерческой оценке. 

Стандартизация данных 

Суммировать сумму запросов кластера и смотреть на ее отношение к сумме по процентам коммерческой оценки некорректно. Во-первых, это две разные сущности. Во-вторых, большой кластер с низкими коммерческими оценками запросов за счет их суммы может оказаться выше кластера из меньшего количества запросов, которые обладают 100% коммерческим интентом. 

В результате в числе приоритетных ключей мы увидим ключевые фразы, не соответствующие нашим требованиям. 

Чтобы решить этот вопрос мы должны: 

1. Стандартизировать данные, для чего мы вводим функцию натурального логарифмирования. Прежде, чем объединять данные, нам нужно их нормировать и сжать. Функция логарифма для Excel «=LN(в скобках указываем нужное число)». 

Логарифмы и стандартизация данных семантики

На скриншоте показано, как выглядит формула 

2. Прибавить условное число для каждого показателя частотности и коммерческости, чтобы избежать ошибок, если данные равны 0 или 1. 

Как с помощью логарифмов стандартизировать семантику

3. Логарифм обезличивает наши данные и дает возможность сопоставить их для сравнения. 

Далее мы складываем полученные числа, чтобы получить показатель, по которому можно сделать сортировку запросов и увидеть наиболее приоритетные в семантическом ядре по соотношению коммерческой оценки запроса и его частотности. 

Стандартизация данных семантики и логарифмы

Также мы можем сдвинуть веса, изменив приоритет суммируемых данных. Это можно сделать через коэффициент, который добавляем к тем данным, которые для нас важнее. 

Стандартизация данных семантики и логарифмы

После того как сделана сортировка и выбраны запросы для работы, остальные ключи кластера можно подтянуть по номеру группы. 

Заключение 

Предлагая данный метод, мы бы хотели, в первую очередь, услышать обратную связь. Возможно, есть способ повысить точность итоговых данных или ускорить процесс. 

Данный подход встречается в прогнозной аналитике Дмитрия Иванова, но при этом метод не распространен среди SEO-специалистов. Часто на различных курсах по SEO вопрос выбора кластеров сводится только к частотности или коммерческой оценке. Однако проблема отсутствия возможности увидеть сбалансированные данные по этим двум характеристикам остается. На наш взгляд это некорректно, поэтому мы попробовали систематизировать работу в этом направлении. 

Представленный метод позволяет:

  • быстро выделить запросы и кластеры, наиболее важные для работы в плане частотности и интента, 
  • исключает потерю в большом ядре ключей, которые лучше всего отвечают нашим требованиям, но не имеют ярко выраженного показателя, по которому можно сделать обычную сортировку.

(Голосов: 20, Рейтинг: 4.6)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Марине Ибушевой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Юлий
    1
    комментарий
    0
    читателей
    Юлий
    больше года назад
    Чем снималась коммерцелизация?
    -
    0
    +
    Ответить
  • Andrey Stepanov
    1
    комментарий
    0
    читателей
    Andrey Stepanov
    больше года назад
    А если нормализовать частоты таким образом, чтобы не нужно было вообще трогать показатель коммерческости? То есть подобрать основание логарифма и плюсуемое число таким образом, чтобы для макс частоты логарифм был равен 1, а для мин частоты был равен 0? Тогда полученные значения можно использовать вместе с показателем коммерческости и как сумму и как среднее - без разницы.
    Если x=max частота, а у=min частота, то b=1+x-y - это основание логарифма, a=b-x - плюсуемый показатель
    cl...
    А если нормализовать частоты таким образом, чтобы не нужно было вообще трогать показатель коммерческости? То есть подобрать основание логарифма и плюсуемое число таким образом, чтобы для макс частоты логарифм был равен 1, а для мин частоты был равен 0? Тогда полученные значения можно использовать вместе с показателем коммерческости и как сумму и как среднее - без разницы.
    Если x=max частота, а у=min частота, то b=1+x-y - это основание логарифма, a=b-x - плюсуемый показатель
    clip2net.com/s/48V0Xgd
    -
    0
    +
    Ответить
  • Павел
    1
    комментарий
    0
    читателей
    Павел
    больше года назад
    Спасибо за метод, пригодится в наборе.
    -
    0
    +
    Ответить
  • Сергей Одинцов
    1
    комментарий
    0
    читателей
    Сергей Одинцов
    больше года назад
    Не так уж и быстро иногда подобрать веса, но повозиться можно, если много запросов.
    -
    0
    +
    Ответить
  • Dmitry_Zolin
    2
    комментария
    0
    читателей
    Dmitry_Zolin
    больше года назад
    Да, довольно точный результат получается. У меня тоже кластеризация из JM, судя по скринам как и тут. Я везде ln от показателя comm на 100 умножал. А ещё можно попробовать сумму по номеру группы кластера потом складывать.
    -
    0
    +
    Ответить
  • varlamovseo
    3
    комментария
    0
    читателей
    varlamovseo
    больше года назад
    Сегодня пробовал на нескольких проектах. Да, работает, единственное, что веса подбирать надо было ко всем трём, но это быстро, спасибо за хак.
    -
    1
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Алгоритм продвижения сайта через Pinterest
Виктор Гаврюков
29
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - В самом вверху есть ссылка на мою группу в ВК, там где автор материала. Через группу и свяжитесь со мной_)
Как забрать 5 мест в выдаче из 10. Кейс-эксперимент
Виктор Гаврюков
29
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - такое можно делать и с ВЧ_)
Ссылочный апдейт Google: что изменится для SEO-специалистов в рунете
Тимур
6
комментариев
0
читателей
Полный профиль
Тимур - Понял, спасибо за информацию.
3 основные ошибки, которые допускают владельцы сайтов при продвижении
Виктор Гаврюков
29
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - Не обращай внимания_) Если у тебя хороший ресурс, то ты будешь первоисточником, и все кто своровал, автоматически начнут на тебя ссылаться, точнее, так гугл будет считать_)
Как продвинуть сайт по коммерческим запросам в ТОП-10 с помощью ресурса Reddit
Denis Zar
2
комментария
0
читателей
Полный профиль
Denis Zar - пользовались услугами по продвижению на реддит от reddit-marketing.pro?
Как мы увеличили трафик из Яндекса более чем в 3 раза за неделю на сайте клиники. Кейс
Андрей
1
комментарий
0
читателей
Полный профиль
Андрей - У большинства сайтов произошел рост в Гугле в декабре и в марте Яндекса. Ваши шаманства тут не причём :)
Рост ботных переходов на сайт: как интерпретировать и что делать
Mike
5
комментариев
0
читателей
Полный профиль
Mike - как это проверить? что товары выводится именно на основе спроса, а не по заданным алгоритмам?
Сравнительная статистика уровня жизни SEO-специалистов в семи странах, включая Россию
Рустам
1
комментарий
0
читателей
Полный профиль
Рустам - Средняя температура по больнице, подсчет даже близко не отображает действительность, особенно учитывая разность цен и уровня зп в разных частях больших стран (США, Канада, Россия)
Зарабатываем с помощью текстов: как создать уникальный контент и монетизировать сайт
dotaidi
94
комментария
0
читателей
Полный профиль
dotaidi - Какой-то нейро-физиологический подход к теме создания контента: 1. " ..чтобы контент отвечал интересам аудитории, закрывал ее боли и потербности". Закрыть боль аудитории? Это как понимать, текст что должен выполнять функцию анестезии? Зачем падать в медицинские категории, это ведь профессиональный текст о SEO, а не триллер и не художественная литература, где метафоры уместны. 2. "Главное — чтобы процесс сбора информации вас увлекал и нравился, ведь эта работа требует усилий". Построение тезиса предполагает, что если работа не нравится, то и усилий она не требует. И вообще, упор в работе на главное значение "нравится" — очень спорное и тоже из области НЛП-игрушек. Стилистика статьи тоже желает более продуманного подхода к использованию словосочетаний специфической терминологии: "вы можеет создавать материалы в коллаборации с известными брендами, релевантными тематике вашего сайта". Бренд не может быть релевантным из-за того, что это целый комплекс явлений, собранный под некоторой узнаваемой семантической или графической символикой. Релевантность — качество, свидетельствующее о совпадении запроса(желания) и выдачи (полученной информации). Это нужно хотеть бренд, чтобы он стал релевантным. Аналогия и релевантность не синонимы. "прикладывайте усилия в сбор и обработку информации" и многие подобные обороты делают статью не просто нерелевантной, но просто безграмотной.
Как доработка структуры вывела сайт в ТОП-10 Google и увеличила трафик в 2 раза. Кейс Связной Трэвел
Дмитрий
3
комментария
0
читателей
Полный профиль
Дмитрий - Вероятнее всего было обновление Google и позиции были снижены в связи с низкой скоростью загрузки страниц (так как доработке ведутся не только по SEO, но и в целом по функционалу сайта, появляются новые скрипты). В этот период в Google Search Console увеличилось количество страниц с низкой скоростью загрузки. Мы выявили несколько проблем, которые снижают скорость загрузки страниц и выдали рекомендации по их устранению. Пока данные рекомендации находятся в работе. Также был проведен анализ EAT факторов и проверка сайта на соответствие требованиям Google к YMYL сайта, выданы рекомендации по доработке данных факторов (ждем внедрения наших рекомендаций, поделимся потом результатами).
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
385
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
114
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
94
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
62
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!