Экспериментальное SEO: «Дырявые носочки панды»
Как известно, Панда – поисковый алгоритм Google, направленный на борьбу с низкокачественным контентом. Алгоритм живет уже 4 года и потерпел множество обновлений. Логично было предположить, что в случае с идентифицированием сайтов на автоперевод Панда использует базу переводчика translate.google.com. Я решил выяснить, как Панда справится с автопереводом сайта на 37 языков через API translate.yandex.ru. За базу взят портал в тематике компьютерных игр и объемом контента на 20 миллионов знаков.
Цели эксперимента
- Узнать, сможет ли панда идентифицировать автоперевод по чужим базам переводчиков,
- Определить регионы, наиболее «податливые» на хорошее ранжирование плохого контента
- Оценить качество межрегионального ссылочного
- Выделить регионы, наиболее привлекательные для МFA сайтов (Made For AdSense)
Условия
- 37 поддоменов xx.name.info, по одному на каждый целевой регион,
- Сайты полностью переведены: навигация, мета данные, тексты,
- Произведена перегенерация ЧПУ, sitemap.xml,
- Одновременный запуск в индекс Google в феврале 2015,
- Полная синхронизация с русскоязычной версией. Как только мы публиковали новость на русском языке, она автоматически переводилась на 37 языков и публиковалась на всех региональных сайтах
- Региональные сайты залинкованы на русскоязычную версию следующим образом: каждая страница ссылается свою русскоязычную версию в доменной зоне .ru с русским анкором = «Название страницы»
- У сайтов одинаковые: IP, дизайн, контактные данные
Данные собирались 12 месяцев, за этот период поддерживалась хорошая активность публикаций уникального контента.
Результаты
Для начала посмотрим в процентах, сколько страниц по региональным доменам вошло в индекс.
Выделим 3 группы:
- Плохо проиндексированы, до 40%. Вероятно, панда зафиксировала неладное.
- Нормально, от 40% до 70%. Панда нашла ряд страниц сомнительного качества, но, в целом, сайт неплохо ранжируется.
- Хорошо, свыше 70% в индексе. Автоперевод принят весьма дружелюбно.
Важный момент, значение «Всего проиндексированных страниц» = «Общему индексу для всех доменов», то есть Google не выделял для автоперевода Дополнительный индекс, а просто удалял/не включал в индекс то, что идентифицировал, как негодный контент. Но есть исключение, Финскую языковую версию Google проиндексировал на 76% - 39100 страниц, из них 32090 определил в дополнительный индекс.
Посмотрим, сколько поискового трафика из Google мы получили с 1 марта 2015 по 29 февраля 2016.
Некорректно будет сравнивать объем регионального трафика с Россией т.к. нет выравнивающего коэффициента, учитывающего популярность всей группы запросов в каждом регионе. Чтобы его высчитать, нужны толковые переводчики и сбор данных по каждой стране, на это пока ресурсов не нашлось. Поэтому принимайте информацию, для общего ознакомления или самостоятельного анализа.
Отдельно выделю 5 стран, где Google не являлся трафикообразующей поисковой системой:
- Чехия, 50% из Seznam, относительно общего поискового трафика
- Турция, 30% из Яндекс
- Китай, 75% из Baidu
- Малайзия, 50% из местных поисков
- Сербия, 70% из Яндекса
В панели вебмастера Google отображается информация, что на русский домен учитывается всего 222700 ссылок из региональных сайтов, которые ссылаются на 3821 страницу. Отмечу, что все ссылки были с разными анкорами и распределялись на свои русскоязычные аналоги. Довольно внушительные цифры, которые никак не повлияли на трафик и позиции RU сайта. Из этого следует, что засчитался вес только с одной ссылки каждого домена, либо ссылки со сайтов на других языках учитываются весьма незначительно. RU домен не был подвержен санкциям пингвина за резкий прирост внешних ссылок.
Области вывода и размеры AdSense блоков одинаковы для всех сайтов, из чего следует, что ставки за клик формировались в равных условиях.
Общий итог
- Панда кушает не только вкусный и питательный бамбук, ее аппетит и избирательность очень зависит от региона
- Внешние ссылки из автогена работают сомнительно, не питайте надежды на сателлитную структуру
- Не тяните с открытием регионального сайта, даже если это будет автоперевод
Теперь я планирую испытать Пингвина, расширяя условия эксперимента, в рамках которого сеть языковых версий будет подвержена агрессивному посеву внешних ссылок.
Задавайте ваши вопросы и пишите пожелания к последующим форматам экспериментов на ящик info@zhaf.ru или в комментарии.
Есть о чем рассказать? Тогда присылайте свои материалы Марине Ибушевой
-
Спасибо за отличный материал! Скажитн, а почему вы уверенны, что это именно Панда не пускает страницы в индекс?
-
Спасибо за отзыв)
Сеть сайтов дерзила именно качеством контента, перевод яндекса местами недостаточно качественен, а на некоторые языки он напрочь не переводил каждое 5-6 слово. Панда анализирует контент и решает, пускать ли его в индекс и если Да, то размещать страницу в основной или вспомогательный индекс Google. Признаки других фильтров отсутствовали, как и уведомления о нарушениях в GWT.-
А от куда уверенность, что именно Панда решает кого на входе пускать в индекс?
-
Уточним формулировку: "Панда принимает решение о включении в общий и дополнительный индекс, в случае идентификации проблем с контентом."
В условиях эксперимента, осознанно сгенерирован плохой контент, остальные факторы seo оптимизации в порядке. Поэтому я считаю, что в данном случае решает Панда. Но я буду рад услышать другие мнения)-
1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.
2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
3. По дополнительному индексу:
«Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, есл...1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.
2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
3. По дополнительному индексу:
«Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, если я ошибаюсь» — спросили Андрея Липатцева на справочном форуме для веб-мастеров."
Действительно, ошибаетесь, — ответил он. — Никакой полезной информации добавление & к запросу Вам не даёт.
Итого: возможно Панда и может выкинуть страницы из индекса, но то, что этот алгоритм проверяет страницы перед их индексацией очень сомнительно.
Не Пандой единой живет Google.-
Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
Я заинтересован в выявлении бОльших взаимосвязей, сегментиров...Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
Я заинтересован в выявлении бОльших взаимосвязей, сегментировании степени воздействия различных алгоритмов Google на индексацию и ранжирование сайтов. Но не все сразу) Важно активное участие проф сообщества в данном вопросе.
-
-
-
-
-
-
В разделе "Объем трафика" Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка. Исходя из этого, трафика очень мало получается. То же самое и по ОАЭ и арабскому языку. Или Вы учитывали трафик исключительно из названных стран?
Блокировок в Адсенс не было?