Спам в Analytics стал одной из самых «горячих» тем аналитики в 2015 году. Пик обсуждений этой проблемы пришёлся на лето 2015 года, затем в ноябре она снова набрала популярность и не потеряла актуальности и по сей день.
Динамика популярности
Google создал справку «Фильтрация переходов из определенных доменов», что говорит об осведомлённости компании о данной проблеме и попытках найти её решение. Адам Сингер (Adam Singer), сотрудник Google Analytics, подтвердил, что Google работает над устранением проблемы рефспама, но дата релиза пока не названа.
Команда The Daily Egg проанализировала 292 аккаунта Google Analytics, не установивших спам-фильтрацию, у которых не менее 25 реферальных сеансов в день. Общий реферальный спам-трафик составил 11%, а 57% всех веб-сайтов получают трафик с хотя бы с одного из 500 спам-доменов.
Как сохранить новый трафик чистым с помощью автоматизированных инструментов
Большинство решений, с помощью которых можно очистить от спама статистику Analytics, предполагают ручную установку фильтра для спам-доменов или общую фильтрацию в рамках GA.
На данный момент существует около 550 доменов, которые вызывают проблему со спамом (актуальную базу данных спам-доменов можно найти на открытом ресурсе GitHub).
Из-за увеличения числа подобных доменов установка фильтров вручную стала отнимать слишком много времени, а учитывая тот факт, что новые спам-домены возникают каждый месяц, их появление достаточно сложно отслеживать.
Чтобы справиться с постоянно растущим объёмом спама, были созданы специальные инструменты, большинство из которых бесплатны.
Это не бесплатный инструмент, но это небольшая цена за избавление от лишней головной боли. Этот спам-блокер является одним из инструментов аналитики, предоставляемых Analytics Toolkit.
Referrer Spam Blocker – бесплатный инструмент от Stijlbreuk, обладающий одним из самых привлекательных и удобных для пользователей интерфейсов в этом списке.
Типы фильтра: по занесённым в чёрный список доменов
Цена: бесплатно
Достоинства:
Можно выбрать несколько ресурсов и представлений
Квота увеличилась до 5000 обращений в день
Недостатки:
Неполная база спам-доменов (203+ доменов, 17 фильтров)
Как работают инструменты и фильтры
Большинство инструментов содержат один или несколько следующих фильтров. Давайте рассмотрим, как они работают.
Exclude Empty Hostname
Исключить трафик пустого имени хоста
Большинство спам-ботов не присылает информацию с именем хоста, отправляя фейковые данные в GA.
Этот фильтр исключает все обращения с пустой колонкой «Имя хоста».
Exclude Empty Screen Resolution
Исключить трафик пустого разрешения экрана
Большинство спам-ботов не присылает информацию о разрешении экрана, отправляя фейковые данные в GA.
Этот фильтр исключает обращения с пустой колонкой «Разрешение экрана».
Include Only Own Hostnames
Включить трафик только собственных имен хоста
Иногда спам-боты всё же устанавливают имя хоста, используя в большинстве случаев имя хоста спам-домена, а не настоящего домена веб-сайта.
Фильтр удаляет все обращения с именами хоста, отличающимися от предоставленного списка имён.
Предупреждение: Этот фильтр включает только обращения с предоставленными именами хоста, исключая все остальные обращения. У этого есть отрицательная сторона: если вы измените домен в будущем или используете один и тот же GA аккаунт для нескольких доменов (например, для каждого языкового домена верхнего уровня или нескольких субдоменов), вы можете отфильтровать качественный трафик. Поэтому с этим фильтром стоит быть осторожнее, иначе можно лишиться большого объёма чистого трафика.
Хотя этот фильтр и хорош, он всё же неидеален. Некоторые спам-боты всё же посещают ваш сайт, используя верное имя домена, и в этом случае спам-трафик не отфильтровывается.
Exclude Blacklisted Domains (Campaign Source Filter)
Исключить трафик занесённых в чёрный список доменов (Фильтр по источникам кампании)
Когда не работает ни один другой фильтр, вам придётся исключить каждый занесённый в чёрный список домен вручную (на данный момент в базу дынных занесены около 550 доменов).
Большинство инструментов используют списки доменов, которые обновляются автоматически.
Как удалить спам из уже загрязнённого трафика
Вам не удастся очистить заспамленные данные в GA, используя вышеописанные методы. Google analytics поддерживает сегменты, которые позволят вам отфильтровать старый трафик.
Используя сегменты, вы можете скрыть все спам-домены в старых данных. Этот метод очень полезен в том случае, если у вас было много спам-трафика и вы его не фильтровали.
Просто импортируйте Analytics Spam Blocker (550 доменов) и вы сможете выбрать этот сегмент в любом представлении.
Нерекомендуемые решения
Существует ряд других решений, которые могут частично сработать, но не исключено, что они принесут больше вреда, чем пользы.
Создание специальных параметров для каждого сеанса (не лучше описанных фильтров)
Создание специальных параметров для каждого сеанса позволит вам отличить спам от качественного трафика. Для этого вам необходим доступ к коду отслеживания на веб-сайте.
Установка дополнительных параметров для триггера типа «Просмотр страницы» (не рекомендуется)
Чтобы установить дополнительные параметры, вам нужен доступ к коду отслеживания на веб-сайте.
Создание нового идентификатора отслеживания (не рекомендуется)
Создание нового идентификатора отслеживания GA не является удачным решением, так как вы потеряете все старые данные. Более того, спам-боты найдут ваш новый аккаунт и поступление спам-трафика возобновится.
Фильтрация IP адресов (не рекомендуется)
Фильтрация IP адресов не является эффективной, так как боты используют разные IP.
Вывод:
Google работает над решением проблемы спама в Analytics, и, будем надеяться, устранит её раз и навсегда в ближайшем будущем.
Однако до тех пор, пока решение не найдено, вы можете воспользоваться большим выбором автоматизированных инструментов, которые просты и удобны в использовании.
Друзья, теперь вы можете поддержать SEOnews https://pay.cloudtips.ru/p/8828f772
Ваши донаты помогут нам развивать издание и дальше радовать вас полезным контентом.
Рассказать друзьям:
Нас удобно читать в социальных сетях. Подписывайся!
Добрый день! На днях заметил в GA странный трафик с lifehacker и reddit. Вероятно спамный. По вашему совету воспользовался первым сервисом в этой статье Analytics Referrer/Ghost Spam Blocker.
А как вы решаете эту проблему? И вообще нужно ли ее решать?
Какой смысл спамить в AdWords? Где там можно увидеть левые ссылки? Надо просто в GA убрать возможность кликать по спамным ссылкам - рефералам. Не будет у них трафика, и спама не будет.
Павел -
Спасибо за комментарий. Гипотеза была в том, что с указанными счетчиками конкурентов показы будут не просто похожей аудитории их сайтов (как при рекламе по доменам), а именно на аудиторию которую Яндекс для себя разметил как целевая дл сайтов конкурентов.
Важно, это гипотеза. А про белые нитки, как говорится, доверяй, но проверяй))
Кирилл Половников -
Оба этих статуса (редирект и малополезная) преобладали в качестве проблем с индексацией.
Помогла работа с .htaccess (в нем были ошибки и его чистили), работа над корректировкой редиректов, каноникалами и прочими техническими ошибками. Нельзя сказать, что только редиректы были ключевым препятствием.
Мама Стифлера -
Вызывает сожаление, что вы не осознаете, что Яндекс.Советник может быть рассмотрен как форма рэкета, которая заставляет компании, размещающиеся в Яндекс.Маркете, выплачивать дополнительные финансовые средства, повышая в конечном итоге прибыль Яндекс.Маркета, но не принесет пользы для посетителей сайта.
Станислав -
С 2019 года количество доменов в зоне .ru остается на одном и том же уровне - около 5 млн. Все изменения на уровне 1% от этого объема в плюс или минус
Фанит -
Спасибо автору за статью, полезно! По поводу сниппета сайта, для увеличения CTR можно дополнительно внедрить основные схемы микроразметки и улучшить его, чтобы выделялся на фоне конкурентов, особенно заметно в Google.
Гость -
Haaaa! Articol despre "перелинковка" cu scopul de a acapara BackLink-uri. Înțeleg cu exemplele din zona ru, da chiar sa folosiți și md, panda, serios?
Александр -
Хм.... ооочень сомнительный результат. За 10 000 в месяц получить 1 запрос в топ10, да ещё и в google, который на ссылки всегда лучше Яндекса реагировал - такое себе.... При этом достаточно странно были отобраны запросы с местами за ТОП50. Ведь давно известно же, что ссылки так быстро не сработают, к тому же за такое короткое время максимально, на что можно рассчитывать - это небольшое повышение средней. Поэтому тут логично было бы подобрать запросы, либо те, которые находятся близко к ТОП10, например на 11-15 местах, и посмотреть на их динамику. Либо на запросы, которые уже в топ10 находятся (5-10 места). Ведь после отключения контекста CTR в google кратно вырос и, например, разница 1 и 2-х местах отличается почти в два раза! Поэтому, если бы ссылки сработали на рост позиций с 5-10 мест, на 1-4 - это был бы кратный толк как в росте трафика, так и с точки зрения отдачи от вложений. Тем более как раз подвижки в 2-3 позиции уже дали бы ощутимый результат (если это, конечно не НЧ и микроНЧ запросы).... Так что считаю, эксперимент изначально был провальным уже на этапе отбора запросов.