Экспериментальное SEO: «Дырявые носочки панды»

Россия+7 (495) 960-65-87
Шрифт:
19 9461

Как известно, Панда – поисковый алгоритм Google, направленный на борьбу с низкокачественным контентом. Алгоритм живет уже 4 года и потерпел множество обновлений. Логично было предположить, что в случае с идентифицированием сайтов на автоперевод Панда использует базу переводчика translate.google.com. Я решил выяснить, как Панда справится с автопереводом сайта на 37 языков через API translate.yandex.ru. За базу взят портал в тематике компьютерных игр и объемом контента на 20 миллионов знаков.

Цели эксперимента

- Узнать, сможет ли панда идентифицировать автоперевод по чужим базам переводчиков,

- Определить регионы, наиболее «податливые» на хорошее ранжирование плохого контента

- Оценить качество межрегионального ссылочного

- Выделить регионы, наиболее привлекательные для МFA сайтов (Made For AdSense)

Условия

- 37 поддоменов xx.name.info, по одному на каждый целевой регион,

- Сайты полностью переведены: навигация, мета данные, тексты,

- Произведена перегенерация ЧПУ, sitemap.xml,

- Одновременный запуск в индекс Google в феврале 2015,

- Полная синхронизация с русскоязычной версией. Как только мы публиковали новость на русском языке, она автоматически переводилась на 37 языков и публиковалась на всех региональных сайтах

- Региональные сайты залинкованы на русскоязычную версию следующим образом: каждая страница ссылается свою русскоязычную версию в доменной зоне .ru с русским анкором = «Название страницы»

- У сайтов одинаковые: IP, дизайн, контактные данные

Данные собирались 12 месяцев, за этот период поддерживалась хорошая активность публикаций уникального контента.

Результаты

Для начала посмотрим в процентах, сколько страниц по региональным доменам вошло в индекс.

Выделим 3 группы:

- Плохо проиндексированы, до 40%. Вероятно, панда зафиксировала неладное.

- Нормально, от 40% до 70%. Панда нашла ряд страниц сомнительного качества, но, в целом, сайт неплохо ранжируется.

- Хорошо, свыше 70% в индексе. Автоперевод принят весьма дружелюбно.

Важный момент, значение «Всего проиндексированных страниц» = «Общему индексу для всех доменов», то есть Google не выделял для автоперевода Дополнительный индекс, а просто удалял/не включал в индекс то, что идентифицировал, как негодный контент. Но есть исключение, Финскую языковую версию Google проиндексировал на 76% - 39100 страниц, из них 32090 определил в дополнительный индекс.

Посмотрим, сколько поискового трафика из Google мы получили с 1 марта 2015 по 29 февраля 2016.

Некорректно будет сравнивать объем регионального трафика с Россией т.к. нет выравнивающего коэффициента, учитывающего популярность всей группы запросов в каждом регионе. Чтобы его высчитать, нужны толковые переводчики и сбор данных по каждой стране, на это пока ресурсов не нашлось. Поэтому принимайте информацию, для общего ознакомления или самостоятельного анализа.

Отдельно выделю 5 стран, где Google не являлся трафикообразующей поисковой системой:

- Чехия, 50% из Seznam, относительно общего поискового трафика

- Турция, 30% из Яндекс

- Китай, 75% из Baidu

- Малайзия, 50% из местных поисков

- Сербия, 70% из Яндекса

В панели вебмастера Google отображается информация, что на русский домен учитывается всего 222700 ссылок из региональных сайтов, которые ссылаются на 3821 страницу. Отмечу, что все ссылки были с разными анкорами и распределялись на свои русскоязычные аналоги. Довольно внушительные цифры, которые никак не повлияли на трафик и позиции RU сайта. Из этого следует, что засчитался вес только с одной ссылки каждого домена, либо ссылки со сайтов на других языках учитываются весьма незначительно. RU домен не был подвержен санкциям пингвина за резкий прирост внешних ссылок.

Изображение 4.jpg

Области вывода и размеры AdSense блоков одинаковы для всех сайтов, из чего следует, что ставки за клик формировались в равных условиях.

Общий итог

- Панда кушает не только вкусный и питательный бамбук, ее аппетит и избирательность очень зависит от региона

- Внешние ссылки из автогена работают сомнительно, не питайте надежды на сателлитную структуру

- Не тяните с открытием регионального сайта, даже если это будет автоперевод

Теперь я планирую испытать Пингвина, расширяя условия эксперимента, в рамках которого сеть языковых версий будет подвержена агрессивному посеву внешних ссылок.

Задавайте ваши вопросы и пишите пожелания к последующим форматам экспериментов на ящик info@zhaf.ru или в комментарии.

(Нет голосов)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Роман
    больше года назад
    На карте цен для одной из стран указаны проценты.
    -
    0
    +
    Ответить
  • Alexander Mikhailov
    1
    комментарий
    0
    читателей
    Alexander Mikhailov
    больше года назад
    Добрый день!

    Какова цена за клик AdSense для Вьетнама?
    -
    0
    +
    Ответить
  • Гость
    больше года назад
    Спасибо за отличный материал! Скажитн, а почему вы уверенны, что это именно  Панда не пускает страницы в индекс?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Гость
      больше года назад
      Спасибо за отзыв)
      Сеть сайтов дерзила именно качеством контента, перевод яндекса местами недостаточно качественен, а на некоторые языки он напрочь не переводил каждое 5-6 слово. Панда анализирует контент и решает, пускать ли его в индекс и если Да, то размещать страницу в основной или вспомогательный индекс Google. Признаки других фильтров отсутствовали, как и уведомления о нарушениях в GWT.
      -
      0
      +
      Ответить
      • Евгений Аралов
        2
        комментария
        0
        читателей
        А от куда уверенность, что именно Панда решает кого на входе пускать в индекс?
        -
        2
        +
        Ответить
        • Андрей Желудевич
          0
          комментариев
          0
          читателей
          Уточним формулировку: "Панда принимает решение о включении в общий и дополнительный индекс, в случае идентификации проблем с контентом."
          В условиях эксперимента, осознанно сгенерирован плохой контент, остальные факторы seo оптимизации в порядке. Поэтому я считаю, что в данном случае решает Панда. Но я буду рад услышать другие мнения)
          -
          1
          +
          Ответить
          • Евгений Аралов
            2
            комментария
            0
            читателей
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, есл...
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, если я ошибаюсь» — спросили Андрея Липатцева на справочном форуме для веб-мастеров."

            Действительно, ошибаетесь, — ответил он. — Никакой полезной информации добавление & к запросу Вам не даёт.

            Итого: возможно Панда и может выкинуть страницы из индекса, но то, что этот алгоритм проверяет страницы перед их индексацией очень сомнительно.

            Не Пандой единой живет Google.
            -
            2
            +
            Ответить
            • Андрей Желудевич
              0
              комментариев
              0
              читателей
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментиров...
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментировании степени воздействия различных алгоритмов Google на индексацию и ранжирование сайтов. Но не все сразу) Важно активное участие проф сообщества в данном вопросе.
              -
              0
              +
              Ответить
  • Игорь Бакалов
    4
    комментария
    0
    читателей
    Игорь Бакалов
    больше года назад
    Поддоменам через GWT устанавливались регионы?
    На сколько изначально был прокачен основной домен? Хотя бы тИЦ/возраст

    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Здравствуйте!
      Да, регион устанавливался через GWT.
      Домен чистый, без истории и внешних ссылок, зарегистрирован в августе 2014 (за пол года до запуска всей сети в индекс)
      -
      0
      +
      Ответить
  • Fuck You Buddy :D
    39
    комментариев
    0
    читателей
    Fuck You Buddy :D
    больше года назад
    Самый годный контент за последний год на сеоньюс. Спасибо
    -
    9
    +
    Ответить
  • Dmitriy Kulinar
    2
    комментария
    0
    читателей
    Dmitriy Kulinar
    больше года назад
    Индию не взяли по какой-то определенной причине или случайно?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Dmitriy Kulinar
      больше года назад
      Определенных причин не было. Если не ошибаюсь, на момент запуска генерации, Яндекс.Переводчик не поддерживал хинди.
      -
      0
      +
      Ответить
  • Adrian
    больше года назад
    В разделе "Объем трафика" Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка. Исходя из этого, трафика очень мало получается. То же самое и по ОАЭ и арабскому языку. Или Вы учитывали трафик исключительно из названных стран?

    Блокировок в Адсенс не было?
    -
    0
    +
    Ответить
    • Зюкин Павел
      1
      комментарий
      0
      читателей
      Зюкин Павел
      Adrian
      больше года назад
      "Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка."
      что-то с географией у вас батенька всё крайне плохо, даже недавно прошедший чемпионат ЕВРОПЫ по футболу не помог отнести к Европе, Испанию и Португалию.
      -
      1
      +
      Ответить
      • Adrian
        Зюкин Павел
        больше года назад
        Испания и Португалия находятся в Европе и участвовали в чемпионате Европы. Одна из этих стран даже стала победителем.
        А Южная и Центральная Америка здесь при том, что там разговаривают на испанском и португальском языках.
        Сына, учите географию.
        -
        0
        +
        Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Adrian
      больше года назад
      Здравствуйте!

      Емкость рынка не учитывалась, данные по трафику даны сводно и их дробление произведено довольно примитивно.
      Блокировок не было, все работает)

      -
      0
      +
      Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Рейтинг Известности 2018: старт народного голосования
Михаил Р
1
комментарий
0
читателей
Полный профиль
Михаил Р - 1. Demis 2. кокс 3. Ашманов 4. Скобеев 5. Digital Strategy
Тест: Кто как пробежал, или Итоги клиентского рейтинга SEOnews 2018
Анна Макарова
338
комментариев
0
читателей
Полный профиль
Анна Макарова - Друзья, спасибо всем за участие! Мы определили победителей. Кто ими стал - вы найдете по ссылке: www.seonews.ru/events/darim-knigi-ot-mif-pobediteli-opredeleny/ Если вы стали одним из победителей, обязательно свяжитесь с нами по указанной в новости (по ссылке выше) почте. Всем хороших выходных! =)
SEO глазами клиентов 2018
Артур Якушев
1
комментарий
0
читателей
Полный профиль
Артур Якушев - >сейчас же сложно найти агентства, которые специализируются только на SEO Не так и сложно найти нас www.msk.lapkinlab.ru
Рейтинг Известности 2018: второй этап народного голосования
Константин Сокол
3
комментария
0
читателей
Полный профиль
Константин Сокол - Кто был ответственный за дизайн таблицы голосования? Копирайтер?
Комплексный аудит интернет-магазина от «Ашманов и партнеры». Часть 1
Александр Сова
1
комментарий
0
читателей
Полный профиль
Александр Сова - А вот и сеошники подъехали, покидать на вентилятор :D
Кейс: вывод лендинга по изготовлению флагов на заказ в ТОП 1 по Санкт-Петербургу
utka21
4
комментария
0
читателей
Полный профиль
utka21 - Кейс как кейс. Для некоторых станет вполне возможно полезным. ( Для конкурентов точно) . А вот с комментариями , что то пошло не так )
Не очень удачный кейс продвижения сайта по услуге «Трезвый водитель» в Москве
Кирилл Щербаков
3
комментария
0
читателей
Полный профиль
Кирилл Щербаков - "даже пришлось подключить отслеживание звонков с сайта" "Даже" - как будто это что-то нереальное
Как использовать Python для LSI-копирайтинга
Evgeny Montana
6
комментариев
0
читателей
Полный профиль
Evgeny Montana - спасибо)
Стартовал сбор заявок на участие в рейтинге «Известность бренда SEO-компаний 2018»
Артем Первухин
1
комментарий
0
читателей
Полный профиль
Артем Первухин - Make KINETICA Great Again!
Эксперимент: как уникальность контента влияет на продвижение сайта
Ilia Nazmutdinov
2
комментария
0
читателей
Полный профиль
Ilia Nazmutdinov - Кстати, ПФ не работают на нулевом трафике. Пока на сайт не льются тысячи показов по одним и тем же запросам влияние оказывает ток ссылочное\внешнее и внутреннее\ и внутренняя оптимизация.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
338
Комментариев
262
Комментариев
241
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
98
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
67
Комментариев
61
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55
Комментариев
54

Отправьте отзыв!
Отправьте отзыв!