Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:

Экспериментальное SEO: «Дырявые носочки панды»

Россия +7 (495) 960-65-87
Шрифт:
19 7667

Как известно, Панда – поисковый алгоритм Google, направленный на борьбу с низкокачественным контентом. Алгоритм живет уже 4 года и потерпел множество обновлений. Логично было предположить, что в случае с идентифицированием сайтов на автоперевод Панда использует базу переводчика translate.google.com. Я решил выяснить, как Панда справится с автопереводом сайта на 37 языков через API translate.yandex.ru. За базу взят портал в тематике компьютерных игр и объемом контента на 20 миллионов знаков.

Цели эксперимента

- Узнать, сможет ли панда идентифицировать автоперевод по чужим базам переводчиков,

- Определить регионы, наиболее «податливые» на хорошее ранжирование плохого контента

- Оценить качество межрегионального ссылочного

- Выделить регионы, наиболее привлекательные для МFA сайтов (Made For AdSense)

Условия

- 37 поддоменов xx.name.info, по одному на каждый целевой регион,

- Сайты полностью переведены: навигация, мета данные, тексты,

- Произведена перегенерация ЧПУ, sitemap.xml,

- Одновременный запуск в индекс Google в феврале 2015,

- Полная синхронизация с русскоязычной версией. Как только мы публиковали новость на русском языке, она автоматически переводилась на 37 языков и публиковалась на всех региональных сайтах

- Региональные сайты залинкованы на русскоязычную версию следующим образом: каждая страница ссылается свою русскоязычную версию в доменной зоне .ru с русским анкором = «Название страницы»

- У сайтов одинаковые: IP, дизайн, контактные данные

Данные собирались 12 месяцев, за этот период поддерживалась хорошая активность публикаций уникального контента.

Результаты

Для начала посмотрим в процентах, сколько страниц по региональным доменам вошло в индекс.

Изображение 1.jpg

Выделим 3 группы:

- Плохо проиндексированы, до 40%. Вероятно, панда зафиксировала неладное.

- Нормально, от 40% до 70%. Панда нашла ряд страниц сомнительного качества, но, в целом, сайт неплохо ранжируется.

- Хорошо, свыше 70% в индексе. Автоперевод принят весьма дружелюбно.

Важный момент, значение «Всего проиндексированных страниц» = «Общему индексу для всех доменов», то есть Google не выделял для автоперевода Дополнительный индекс, а просто удалял/не включал в индекс то, что идентифицировал, как негодный контент. Но есть исключение, Финскую языковую версию Google проиндексировал на 76% - 39100 страниц, из них 32090 определил в дополнительный индекс.

Посмотрим, сколько поискового трафика из Google мы получили с 1 марта 2015 по 29 февраля 2016.

Изображение 2.jpg

Некорректно будет сравнивать объем регионального трафика с Россией т.к. нет выравнивающего коэффициента, учитывающего популярность всей группы запросов в каждом регионе. Чтобы его высчитать, нужны толковые переводчики и сбор данных по каждой стране, на это пока ресурсов не нашлось. Поэтому принимайте информацию, для общего ознакомления или самостоятельного анализа.

Отдельно выделю 5 стран, где Google не являлся трафикообразующей поисковой системой:

- Чехия, 50% из Seznam, относительно общего поискового трафика

- Турция, 30% из Яндекс

- Китай, 75% из Baidu

- Малайзия, 50% из местных поисков

- Сербия, 70% из Яндекса

Изображение 3.jpg

В панели вебмастера Google отображается информация, что на русский домен учитывается всего 222700 ссылок из региональных сайтов, которые ссылаются на 3821 страницу. Отмечу, что все ссылки были с разными анкорами и распределялись на свои русскоязычные аналоги. Довольно внушительные цифры, которые никак не повлияли на трафик и позиции RU сайта. Из этого следует, что засчитался вес только с одной ссылки каждого домена, либо ссылки со сайтов на других языках учитываются весьма незначительно. RU домен не был подвержен санкциям пингвина за резкий прирост внешних ссылок.

Изображение 4.jpg

Области вывода и размеры AdSense блоков одинаковы для всех сайтов, из чего следует, что ставки за клик формировались в равных условиях.

Общий итог

- Панда кушает не только вкусный и питательный бамбук, ее аппетит и избирательность очень зависит от региона

- Внешние ссылки из автогена работают сомнительно, не питайте надежды на сателлитную структуру

- Не тяните с открытием регионального сайта, даже если это будет автоперевод

Теперь я планирую испытать Пингвина, расширяя условия эксперимента, в рамках которого сеть языковых версий будет подвержена агрессивному посеву внешних ссылок.

Задавайте ваши вопросы и пишите пожелания к последующим форматам экспериментов на ящик info@zhaf.ru или в комментарии.

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
Отправить отзыв
  • Роман
    6 месяцев назад
    На карте цен для одной из стран указаны проценты.
    -
    0
    +
    Ответить
    Поделиться
  • Alexander Mikhailov
    1
    комментарий
    0
    читателей
    Alexander Mikhailov
    6 месяцев назад
    Добрый день!

    Какова цена за клик AdSense для Вьетнама?
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    6 месяцев назад
    Спасибо за отличный материал! Скажитн, а почему вы уверенны, что это именно  Панда не пускает страницы в индекс?
    -
    0
    +
    Ответить
    Поделиться
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Гость
      6 месяцев назад
      Спасибо за отзыв)
      Сеть сайтов дерзила именно качеством контента, перевод яндекса местами недостаточно качественен, а на некоторые языки он напрочь не переводил каждое 5-6 слово. Панда анализирует контент и решает, пускать ли его в индекс и если Да, то размещать страницу в основной или вспомогательный индекс Google. Признаки других фильтров отсутствовали, как и уведомления о нарушениях в GWT.
      -
      0
      +
      Ответить
      Поделиться
      • Евгений Аралов
        2
        комментария
        0
        читателей
        А от куда уверенность, что именно Панда решает кого на входе пускать в индекс?
        -
        2
        +
        Ответить
        Поделиться
        • Андрей Желудевич
          0
          комментариев
          0
          читателей
          Уточним формулировку: "Панда принимает решение о включении в общий и дополнительный индекс, в случае идентификации проблем с контентом."
          В условиях эксперимента, осознанно сгенерирован плохой контент, остальные факторы seo оптимизации в порядке. Поэтому я считаю, что в данном случае решает Панда. Но я буду рад услышать другие мнения)
          -
          1
          +
          Ответить
          Поделиться
          • Евгений Аралов
            2
            комментария
            0
            читателей
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, есл...
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, если я ошибаюсь» — спросили Андрея Липатцева на справочном форуме для веб-мастеров."

            Действительно, ошибаетесь, — ответил он. — Никакой полезной информации добавление & к запросу Вам не даёт.

            Итого: возможно Панда и может выкинуть страницы из индекса, но то, что этот алгоритм проверяет страницы перед их индексацией очень сомнительно.

            Не Пандой единой живет Google.
            -
            2
            +
            Ответить
            Поделиться
            • Андрей Желудевич
              0
              комментариев
              0
              читателей
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментиров...
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментировании степени воздействия различных алгоритмов Google на индексацию и ранжирование сайтов. Но не все сразу) Важно активное участие проф сообщества в данном вопросе.
              -
              0
              +
              Ответить
              Поделиться
  • Игорь Бакалов
    4
    комментария
    0
    читателей
    Игорь Бакалов
    6 месяцев назад
    Поддоменам через GWT устанавливались регионы?
    На сколько изначально был прокачен основной домен? Хотя бы тИЦ/возраст

    -
    0
    +
    Ответить
    Поделиться
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Здравствуйте!
      Да, регион устанавливался через GWT.
      Домен чистый, без истории и внешних ссылок, зарегистрирован в августе 2014 (за пол года до запуска всей сети в индекс)
      -
      0
      +
      Ответить
      Поделиться
  • Fuck You Buddy :D
    39
    комментариев
    0
    читателей
    Fuck You Buddy :D
    6 месяцев назад
    Самый годный контент за последний год на сеоньюс. Спасибо
    -
    9
    +
    Ответить
    Поделиться
  • Dmitriy Kulinar
    2
    комментария
    0
    читателей
    Dmitriy Kulinar
    6 месяцев назад
    Индию не взяли по какой-то определенной причине или случайно?
    -
    0
    +
    Ответить
    Поделиться
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Dmitriy Kulinar
      6 месяцев назад
      Определенных причин не было. Если не ошибаюсь, на момент запуска генерации, Яндекс.Переводчик не поддерживал хинди.
      -
      0
      +
      Ответить
      Поделиться
  • Adrian
    6 месяцев назад
    В разделе "Объем трафика" Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка. Исходя из этого, трафика очень мало получается. То же самое и по ОАЭ и арабскому языку. Или Вы учитывали трафик исключительно из названных стран?

    Блокировок в Адсенс не было?
    -
    0
    +
    Ответить
    Поделиться
    • Зюкин Павел
      1
      комментарий
      0
      читателей
      Зюкин Павел
      Adrian
      6 месяцев назад
      "Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка."
      что-то с географией у вас батенька всё крайне плохо, даже недавно прошедший чемпионат ЕВРОПЫ по футболу не помог отнести к Европе, Испанию и Португалию.
      -
      1
      +
      Ответить
      Поделиться
      • Adrian
        Зюкин Павел
        6 месяцев назад
        Испания и Португалия находятся в Европе и участвовали в чемпионате Европы. Одна из этих стран даже стала победителем.
        А Южная и Центральная Америка здесь при том, что там разговаривают на испанском и португальском языках.
        Сына, учите географию.
        -
        0
        +
        Ответить
        Поделиться
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Adrian
      6 месяцев назад
      Здравствуйте!

      Емкость рынка не учитывалась, данные по трафику даны сводно и их дробление произведено довольно примитивно.
      Блокировок не было, все работает)

      -
      0
      +
      Ответить
      Поделиться
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
SEOnews и Serpstat запускают конкурс для интернет-маркетологов
Анна Ольяная
4
комментария
0
читателей
Полный профиль
Анна Ольяная - благодарю :)
Как построить качественную ссылочную массу сайта
Айрат Рахимзянов
39
комментариев
0
читателей
Полный профиль
Айрат Рахимзянов - Спасибо Кирилл. Сейчас восстановилась работа сервиса: take.ms/ttXrw
«Я оптимизировал сайт, а он не в ТОП! Что делать?»
Павел Горбунов
7
комментариев
0
читателей
Полный профиль
Павел Горбунов - Как можно в инструменте tools.pixelplus.ru/tools/text-natural сравнить текст со страницы конкурента и со своей страницы? Я вижу возможность только для проверки одного урла.
Мир глазами поисковых систем
Александр Рунов
4
комментария
0
читателей
Полный профиль
Александр Рунов - Какой регион, если не секрет? В Мск, в ряде ВК тематик (в тех же "окнах" или "колесах"), без работы с внешними факторами по ВЧ запросам в ТОП не выплывешь. Хотя в большинстве направлений вполне реально.
Влияние HTTPS на ранжирование региональных поддоменов в Яндексе
Екатерина Иванова
1
комментарий
0
читателей
Полный профиль
Екатерина Иванова - Посмотрите на сколько упал трафик и на сколько потом вырос:упал на 10-20% на 1 месяц, а вырос в итоге в 5 раз. Одним мартовским трафиком всё падение перекрыли. Или можно ждать Яндекс неопределённое количество времени со стартовым уровнем трафика. Упущенные возможности и всё-такое.
Google.ru внесли в реестр запрещенных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
Монетизация сайта. Как, когда, сколько?
Ruslan Baybekov
2
комментария
0
читателей
Полный профиль
Ruslan Baybekov - Максим, добавили возможность вывода дохода на Яндекс Деньги и WMR.
Интеграция call tracking и CRM: углубленный анализ данных о звонках и продажах
Денис
2
комментария
0
читателей
Полный профиль
Денис - Какой смысл вообще в облачных CRM, обрезанный фугкционал, свое дописать невозможно, слив клиентов другим компаниям. Серверные бесплатные CRM куда надежней и кастамизируй как хочешь.
SEMrush: факторы ранжирования в Google в 2017 году
Анна Макарова
292
комментария
0
читателей
Полный профиль
Анна Макарова - Уважаемый S1, я тоже понимаю, что есть такие люди, которые заметив допущенную неточность несутся на всех парусах продемонстрировать "силу" своего ума. Спасибо вам за пристальное внимание. Это поможет нам быть лучше.
Дашборд Метрика 2.0 – мониторинг проблем на сайте в режиме реального времени
Константин Сокол
24
комментария
0
читателей
Полный профиль
Константин Сокол - Есть динамика трафика по разделам. Этот виджет показывает некоторые фильтры, в результате которых с поиска выпадают целые разделы.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
292
Комментариев
262
Комментариев
219
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
52
Комментариев
48
Комментариев
45

Отправьте отзыв!
Отправьте отзыв!