×
Россия +7 (495) 139-20-33

Экспериментальное SEO: «Дырявые носочки панды»

Россия +7 (495) 139-20-33
Шрифт:
19 12521

Как известно, Панда – поисковый алгоритм Google, направленный на борьбу с низкокачественным контентом. Алгоритм живет уже 4 года и потерпел множество обновлений. Логично было предположить, что в случае с идентифицированием сайтов на автоперевод Панда использует базу переводчика translate.google.com. Я решил выяснить, как Панда справится с автопереводом сайта на 37 языков через API translate.yandex.ru. За базу взят портал в тематике компьютерных игр и объемом контента на 20 миллионов знаков.

Цели эксперимента

- Узнать, сможет ли панда идентифицировать автоперевод по чужим базам переводчиков,

- Определить регионы, наиболее «податливые» на хорошее ранжирование плохого контента

- Оценить качество межрегионального ссылочного

- Выделить регионы, наиболее привлекательные для МFA сайтов (Made For AdSense)

Условия

- 37 поддоменов xx.name.info, по одному на каждый целевой регион,

- Сайты полностью переведены: навигация, мета данные, тексты,

- Произведена перегенерация ЧПУ, sitemap.xml,

- Одновременный запуск в индекс Google в феврале 2015,

- Полная синхронизация с русскоязычной версией. Как только мы публиковали новость на русском языке, она автоматически переводилась на 37 языков и публиковалась на всех региональных сайтах

- Региональные сайты залинкованы на русскоязычную версию следующим образом: каждая страница ссылается свою русскоязычную версию в доменной зоне .ru с русским анкором = «Название страницы»

- У сайтов одинаковые: IP, дизайн, контактные данные

Данные собирались 12 месяцев, за этот период поддерживалась хорошая активность публикаций уникального контента.

Результаты

Для начала посмотрим в процентах, сколько страниц по региональным доменам вошло в индекс.

Выделим 3 группы:

- Плохо проиндексированы, до 40%. Вероятно, панда зафиксировала неладное.

- Нормально, от 40% до 70%. Панда нашла ряд страниц сомнительного качества, но, в целом, сайт неплохо ранжируется.

- Хорошо, свыше 70% в индексе. Автоперевод принят весьма дружелюбно.

Важный момент, значение «Всего проиндексированных страниц» = «Общему индексу для всех доменов», то есть Google не выделял для автоперевода Дополнительный индекс, а просто удалял/не включал в индекс то, что идентифицировал, как негодный контент. Но есть исключение, Финскую языковую версию Google проиндексировал на 76% - 39100 страниц, из них 32090 определил в дополнительный индекс.

Посмотрим, сколько поискового трафика из Google мы получили с 1 марта 2015 по 29 февраля 2016.

Некорректно будет сравнивать объем регионального трафика с Россией т.к. нет выравнивающего коэффициента, учитывающего популярность всей группы запросов в каждом регионе. Чтобы его высчитать, нужны толковые переводчики и сбор данных по каждой стране, на это пока ресурсов не нашлось. Поэтому принимайте информацию, для общего ознакомления или самостоятельного анализа.

Отдельно выделю 5 стран, где Google не являлся трафикообразующей поисковой системой:

- Чехия, 50% из Seznam, относительно общего поискового трафика

- Турция, 30% из Яндекс

- Китай, 75% из Baidu

- Малайзия, 50% из местных поисков

- Сербия, 70% из Яндекса

В панели вебмастера Google отображается информация, что на русский домен учитывается всего 222700 ссылок из региональных сайтов, которые ссылаются на 3821 страницу. Отмечу, что все ссылки были с разными анкорами и распределялись на свои русскоязычные аналоги. Довольно внушительные цифры, которые никак не повлияли на трафик и позиции RU сайта. Из этого следует, что засчитался вес только с одной ссылки каждого домена, либо ссылки со сайтов на других языках учитываются весьма незначительно. RU домен не был подвержен санкциям пингвина за резкий прирост внешних ссылок.

Изображение 4.jpg

Области вывода и размеры AdSense блоков одинаковы для всех сайтов, из чего следует, что ставки за клик формировались в равных условиях.

Общий итог

- Панда кушает не только вкусный и питательный бамбук, ее аппетит и избирательность очень зависит от региона

- Внешние ссылки из автогена работают сомнительно, не питайте надежды на сателлитную структуру

- Не тяните с открытием регионального сайта, даже если это будет автоперевод

Теперь я планирую испытать Пингвина, расширяя условия эксперимента, в рамках которого сеть языковых версий будет подвержена агрессивному посеву внешних ссылок.

Задавайте ваши вопросы и пишите пожелания к последующим форматам экспериментов на ящик info@zhaf.ru или в комментарии.

(Голосов: 6, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Марине Ибушевой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Роман
    больше года назад
    На карте цен для одной из стран указаны проценты.
    -
    0
    +
    Ответить
  • Alexander Mikhailov
    1
    комментарий
    0
    читателей
    Alexander Mikhailov
    больше года назад
    Добрый день!

    Какова цена за клик AdSense для Вьетнама?
    -
    0
    +
    Ответить
  • Гость
    больше года назад
    Спасибо за отличный материал! Скажитн, а почему вы уверенны, что это именно  Панда не пускает страницы в индекс?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Гость
      больше года назад
      Спасибо за отзыв)
      Сеть сайтов дерзила именно качеством контента, перевод яндекса местами недостаточно качественен, а на некоторые языки он напрочь не переводил каждое 5-6 слово. Панда анализирует контент и решает, пускать ли его в индекс и если Да, то размещать страницу в основной или вспомогательный индекс Google. Признаки других фильтров отсутствовали, как и уведомления о нарушениях в GWT.
      -
      0
      +
      Ответить
      • Евгений Аралов
        2
        комментария
        0
        читателей
        А от куда уверенность, что именно Панда решает кого на входе пускать в индекс?
        -
        2
        +
        Ответить
        • Андрей Желудевич
          0
          комментариев
          0
          читателей
          Уточним формулировку: "Панда принимает решение о включении в общий и дополнительный индекс, в случае идентификации проблем с контентом."
          В условиях эксперимента, осознанно сгенерирован плохой контент, остальные факторы seo оптимизации в порядке. Поэтому я считаю, что в данном случае решает Панда. Но я буду рад услышать другие мнения)
          -
          1
          +
          Ответить
          • Евгений Аралов
            2
            комментария
            0
            читателей
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, есл...
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, если я ошибаюсь» — спросили Андрея Липатцева на справочном форуме для веб-мастеров."

            Действительно, ошибаетесь, — ответил он. — Никакой полезной информации добавление & к запросу Вам не даёт.

            Итого: возможно Панда и может выкинуть страницы из индекса, но то, что этот алгоритм проверяет страницы перед их индексацией очень сомнительно.

            Не Пандой единой живет Google.
            -
            2
            +
            Ответить
            • Андрей Желудевич
              0
              комментариев
              0
              читателей
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментиров...
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментировании степени воздействия различных алгоритмов Google на индексацию и ранжирование сайтов. Но не все сразу) Важно активное участие проф сообщества в данном вопросе.
              -
              0
              +
              Ответить
  • Игорь Бакалов
    5
    комментариев
    0
    читателей
    Игорь Бакалов
    больше года назад
    Поддоменам через GWT устанавливались регионы?
    На сколько изначально был прокачен основной домен? Хотя бы тИЦ/возраст

    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Здравствуйте!
      Да, регион устанавливался через GWT.
      Домен чистый, без истории и внешних ссылок, зарегистрирован в августе 2014 (за пол года до запуска всей сети в индекс)
      -
      0
      +
      Ответить
  • Fuck You Buddy :D
    39
    комментариев
    0
    читателей
    Fuck You Buddy :D
    больше года назад
    Самый годный контент за последний год на сеоньюс. Спасибо
    -
    9
    +
    Ответить
  • Dmitriy Kulinar
    2
    комментария
    0
    читателей
    Dmitriy Kulinar
    больше года назад
    Индию не взяли по какой-то определенной причине или случайно?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Dmitriy Kulinar
      больше года назад
      Определенных причин не было. Если не ошибаюсь, на момент запуска генерации, Яндекс.Переводчик не поддерживал хинди.
      -
      0
      +
      Ответить
  • Adrian
    больше года назад
    В разделе "Объем трафика" Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка. Исходя из этого, трафика очень мало получается. То же самое и по ОАЭ и арабскому языку. Или Вы учитывали трафик исключительно из названных стран?

    Блокировок в Адсенс не было?
    -
    0
    +
    Ответить
    • Зюкин Павел
      1
      комментарий
      0
      читателей
      Зюкин Павел
      Adrian
      больше года назад
      "Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка."
      что-то с географией у вас батенька всё крайне плохо, даже недавно прошедший чемпионат ЕВРОПЫ по футболу не помог отнести к Европе, Испанию и Португалию.
      -
      1
      +
      Ответить
      • Adrian
        Зюкин Павел
        больше года назад
        Испания и Португалия находятся в Европе и участвовали в чемпионате Европы. Одна из этих стран даже стала победителем.
        А Южная и Центральная Америка здесь при том, что там разговаривают на испанском и португальском языках.
        Сына, учите географию.
        -
        0
        +
        Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Adrian
      больше года назад
      Здравствуйте!

      Емкость рынка не учитывалась, данные по трафику даны сводно и их дробление произведено довольно примитивно.
      Блокировок не было, все работает)

      -
      0
      +
      Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Алгоритм продвижения сайта через Pinterest
Виктор Гаврюков
29
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - В самом вверху есть ссылка на мою группу в ВК, там где автор материала. Через группу и свяжитесь со мной_)
Как забрать 5 мест в выдаче из 10. Кейс-эксперимент
Виктор Гаврюков
29
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - такое можно делать и с ВЧ_)
Ссылочный апдейт Google: что изменится для SEO-специалистов в рунете
Тимур
6
комментариев
0
читателей
Полный профиль
Тимур - Понял, спасибо за информацию.
3 основные ошибки, которые допускают владельцы сайтов при продвижении
Виктор Гаврюков
29
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - Не обращай внимания_) Если у тебя хороший ресурс, то ты будешь первоисточником, и все кто своровал, автоматически начнут на тебя ссылаться, точнее, так гугл будет считать_)
Как продвинуть сайт по коммерческим запросам в ТОП-10 с помощью ресурса Reddit
Denis Zar
2
комментария
0
читателей
Полный профиль
Denis Zar - пользовались услугами по продвижению на реддит от reddit-marketing.pro?
Как мы увеличили трафик из Яндекса более чем в 3 раза за неделю на сайте клиники. Кейс
Андрей
1
комментарий
0
читателей
Полный профиль
Андрей - У большинства сайтов произошел рост в Гугле в декабре и в марте Яндекса. Ваши шаманства тут не причём :)
Сравнительная статистика уровня жизни SEO-специалистов в семи странах, включая Россию
Рустам
1
комментарий
0
читателей
Полный профиль
Рустам - Средняя температура по больнице, подсчет даже близко не отображает действительность, особенно учитывая разность цен и уровня зп в разных частях больших стран (США, Канада, Россия)
Как доработка структуры вывела сайт в ТОП-10 Google и увеличила трафик в 2 раза. Кейс Связной Трэвел
Дмитрий
3
комментария
0
читателей
Полный профиль
Дмитрий - Вероятнее всего было обновление Google и позиции были снижены в связи с низкой скоростью загрузки страниц (так как доработке ведутся не только по SEO, но и в целом по функционалу сайта, появляются новые скрипты). В этот период в Google Search Console увеличилось количество страниц с низкой скоростью загрузки. Мы выявили несколько проблем, которые снижают скорость загрузки страниц и выдали рекомендации по их устранению. Пока данные рекомендации находятся в работе. Также был проведен анализ EAT факторов и проверка сайта на соответствие требованиям Google к YMYL сайта, выданы рекомендации по доработке данных факторов (ждем внедрения наших рекомендаций, поделимся потом результатами).
Рост ботных переходов на сайт: как интерпретировать и что делать
Mike
5
комментариев
0
читателей
Полный профиль
Mike - как это проверить? что товары выводится именно на основе спроса, а не по заданным алгоритмам?
Как поступить в ситуации, когда конкурент рекламируется по вашим брендовым запросам. Кейс
Гость
49
комментариев
0
читателей
Полный профиль
Гость - поржал с Тинькофф банк и точка)))
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
385
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
114
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
92
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
62
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!