Россия+7 (495) 960-65-87

Экспериментальное SEO: «Дырявые носочки панды»

Россия+7 (495) 960-65-87
Шрифт:
19 10227

Как известно, Панда – поисковый алгоритм Google, направленный на борьбу с низкокачественным контентом. Алгоритм живет уже 4 года и потерпел множество обновлений. Логично было предположить, что в случае с идентифицированием сайтов на автоперевод Панда использует базу переводчика translate.google.com. Я решил выяснить, как Панда справится с автопереводом сайта на 37 языков через API translate.yandex.ru. За базу взят портал в тематике компьютерных игр и объемом контента на 20 миллионов знаков.

Цели эксперимента

- Узнать, сможет ли панда идентифицировать автоперевод по чужим базам переводчиков,

- Определить регионы, наиболее «податливые» на хорошее ранжирование плохого контента

- Оценить качество межрегионального ссылочного

- Выделить регионы, наиболее привлекательные для МFA сайтов (Made For AdSense)

Условия

- 37 поддоменов xx.name.info, по одному на каждый целевой регион,

- Сайты полностью переведены: навигация, мета данные, тексты,

- Произведена перегенерация ЧПУ, sitemap.xml,

- Одновременный запуск в индекс Google в феврале 2015,

- Полная синхронизация с русскоязычной версией. Как только мы публиковали новость на русском языке, она автоматически переводилась на 37 языков и публиковалась на всех региональных сайтах

- Региональные сайты залинкованы на русскоязычную версию следующим образом: каждая страница ссылается свою русскоязычную версию в доменной зоне .ru с русским анкором = «Название страницы»

- У сайтов одинаковые: IP, дизайн, контактные данные

Данные собирались 12 месяцев, за этот период поддерживалась хорошая активность публикаций уникального контента.

Результаты

Для начала посмотрим в процентах, сколько страниц по региональным доменам вошло в индекс.

Изображение 1.jpg

Выделим 3 группы:

- Плохо проиндексированы, до 40%. Вероятно, панда зафиксировала неладное.

- Нормально, от 40% до 70%. Панда нашла ряд страниц сомнительного качества, но, в целом, сайт неплохо ранжируется.

- Хорошо, свыше 70% в индексе. Автоперевод принят весьма дружелюбно.

Важный момент, значение «Всего проиндексированных страниц» = «Общему индексу для всех доменов», то есть Google не выделял для автоперевода Дополнительный индекс, а просто удалял/не включал в индекс то, что идентифицировал, как негодный контент. Но есть исключение, Финскую языковую версию Google проиндексировал на 76% - 39100 страниц, из них 32090 определил в дополнительный индекс.

Посмотрим, сколько поискового трафика из Google мы получили с 1 марта 2015 по 29 февраля 2016.

Изображение 2.jpg

Некорректно будет сравнивать объем регионального трафика с Россией т.к. нет выравнивающего коэффициента, учитывающего популярность всей группы запросов в каждом регионе. Чтобы его высчитать, нужны толковые переводчики и сбор данных по каждой стране, на это пока ресурсов не нашлось. Поэтому принимайте информацию, для общего ознакомления или самостоятельного анализа.

Отдельно выделю 5 стран, где Google не являлся трафикообразующей поисковой системой:

- Чехия, 50% из Seznam, относительно общего поискового трафика

- Турция, 30% из Яндекс

- Китай, 75% из Baidu

- Малайзия, 50% из местных поисков

- Сербия, 70% из Яндекса

Изображение 3.jpg

В панели вебмастера Google отображается информация, что на русский домен учитывается всего 222700 ссылок из региональных сайтов, которые ссылаются на 3821 страницу. Отмечу, что все ссылки были с разными анкорами и распределялись на свои русскоязычные аналоги. Довольно внушительные цифры, которые никак не повлияли на трафик и позиции RU сайта. Из этого следует, что засчитался вес только с одной ссылки каждого домена, либо ссылки со сайтов на других языках учитываются весьма незначительно. RU домен не был подвержен санкциям пингвина за резкий прирост внешних ссылок.

Изображение 4.jpg

Области вывода и размеры AdSense блоков одинаковы для всех сайтов, из чего следует, что ставки за клик формировались в равных условиях.

Общий итог

- Панда кушает не только вкусный и питательный бамбук, ее аппетит и избирательность очень зависит от региона

- Внешние ссылки из автогена работают сомнительно, не питайте надежды на сателлитную структуру

- Не тяните с открытием регионального сайта, даже если это будет автоперевод

Теперь я планирую испытать Пингвина, расширяя условия эксперимента, в рамках которого сеть языковых версий будет подвержена агрессивному посеву внешних ссылок.

Задавайте ваши вопросы и пишите пожелания к последующим форматам экспериментов на ящик info@zhaf.ru или в комментарии.

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Роман
    больше года назад
    На карте цен для одной из стран указаны проценты.
    -
    0
    +
    Ответить
  • Alexander Mikhailov
    1
    комментарий
    0
    читателей
    Alexander Mikhailov
    больше года назад
    Добрый день!

    Какова цена за клик AdSense для Вьетнама?
    -
    0
    +
    Ответить
  • Гость
    больше года назад
    Спасибо за отличный материал! Скажитн, а почему вы уверенны, что это именно  Панда не пускает страницы в индекс?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Гость
      больше года назад
      Спасибо за отзыв)
      Сеть сайтов дерзила именно качеством контента, перевод яндекса местами недостаточно качественен, а на некоторые языки он напрочь не переводил каждое 5-6 слово. Панда анализирует контент и решает, пускать ли его в индекс и если Да, то размещать страницу в основной или вспомогательный индекс Google. Признаки других фильтров отсутствовали, как и уведомления о нарушениях в GWT.
      -
      0
      +
      Ответить
      • Евгений Аралов
        2
        комментария
        0
        читателей
        А от куда уверенность, что именно Панда решает кого на входе пускать в индекс?
        -
        2
        +
        Ответить
        • Андрей Желудевич
          0
          комментариев
          0
          читателей
          Уточним формулировку: "Панда принимает решение о включении в общий и дополнительный индекс, в случае идентификации проблем с контентом."
          В условиях эксперимента, осознанно сгенерирован плохой контент, остальные факторы seo оптимизации в порядке. Поэтому я считаю, что в данном случае решает Панда. Но я буду рад услышать другие мнения)
          -
          1
          +
          Ответить
          • Евгений Аралов
            2
            комментария
            0
            читателей
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, есл...
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, если я ошибаюсь» — спросили Андрея Липатцева на справочном форуме для веб-мастеров."

            Действительно, ошибаетесь, — ответил он. — Никакой полезной информации добавление & к запросу Вам не даёт.

            Итого: возможно Панда и может выкинуть страницы из индекса, но то, что этот алгоритм проверяет страницы перед их индексацией очень сомнительно.

            Не Пандой единой живет Google.
            -
            2
            +
            Ответить
            • Андрей Желудевич
              0
              комментариев
              0
              читателей
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментиров...
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментировании степени воздействия различных алгоритмов Google на индексацию и ранжирование сайтов. Но не все сразу) Важно активное участие проф сообщества в данном вопросе.
              -
              0
              +
              Ответить
  • Игорь Бакалов
    4
    комментария
    0
    читателей
    Игорь Бакалов
    больше года назад
    Поддоменам через GWT устанавливались регионы?
    На сколько изначально был прокачен основной домен? Хотя бы тИЦ/возраст

    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Здравствуйте!
      Да, регион устанавливался через GWT.
      Домен чистый, без истории и внешних ссылок, зарегистрирован в августе 2014 (за пол года до запуска всей сети в индекс)
      -
      0
      +
      Ответить
  • Fuck You Buddy :D
    39
    комментариев
    0
    читателей
    Fuck You Buddy :D
    больше года назад
    Самый годный контент за последний год на сеоньюс. Спасибо
    -
    9
    +
    Ответить
  • Dmitriy Kulinar
    2
    комментария
    0
    читателей
    Dmitriy Kulinar
    больше года назад
    Индию не взяли по какой-то определенной причине или случайно?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Dmitriy Kulinar
      больше года назад
      Определенных причин не было. Если не ошибаюсь, на момент запуска генерации, Яндекс.Переводчик не поддерживал хинди.
      -
      0
      +
      Ответить
  • Adrian
    больше года назад
    В разделе "Объем трафика" Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка. Исходя из этого, трафика очень мало получается. То же самое и по ОАЭ и арабскому языку. Или Вы учитывали трафик исключительно из названных стран?

    Блокировок в Адсенс не было?
    -
    0
    +
    Ответить
    • Зюкин Павел
      1
      комментарий
      0
      читателей
      Зюкин Павел
      Adrian
      больше года назад
      "Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка."
      что-то с географией у вас батенька всё крайне плохо, даже недавно прошедший чемпионат ЕВРОПЫ по футболу не помог отнести к Европе, Испанию и Португалию.
      -
      1
      +
      Ответить
      • Adrian
        Зюкин Павел
        больше года назад
        Испания и Португалия находятся в Европе и участвовали в чемпионате Европы. Одна из этих стран даже стала победителем.
        А Южная и Центральная Америка здесь при том, что там разговаривают на испанском и португальском языках.
        Сына, учите географию.
        -
        0
        +
        Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Adrian
      больше года назад
      Здравствуйте!

      Емкость рынка не учитывалась, данные по трафику даны сводно и их дробление произведено довольно примитивно.
      Блокировок не было, все работает)

      -
      0
      +
      Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Google Data Studio: делаем красивые отчеты по контекстной рекламе для клиентов
Askar Seitov
1
комментарий
0
читателей
Полный профиль
Askar Seitov - помогите! не могу понять почему по инструкции в вашей статье добавляю вычистяемые поля просто копирую ваш код, но датастудио выдает ошибку на этот код: Синтаксическая ошибка: Недопустимый входной символ. Убедитесь, что в формуле нет кавычек-лапок.. как это исправить? я все варианты кавычек уже попробовал
Сайт на WordPress: за и против
Мира Смурков
1
комментарий
0
читателей
Полный профиль
Мира Смурков - Людмила, я согласен с большинством комментаторов. Вы хоть один полноценный магазин сделали на этих движках? Woocommerce это система с супер возможностями. И к ней есть дополнительные модули, с функционалом, который вряд ли появиться на Битрикс. А самому это программировать - сотни тысяч рублей на разработку. А приведя в пример сложности с robots.txt и Sitemap вы ставите под вопрос вашу компетенцию в понимании Интернет-бизнеса и веб-разработки в целом. Во-первых это такие мелочи, а во-вторых это все делается на вордпресса за 2 минуты, и опять же с возможностями многократно превышающими Битрикс.
#SEOnews14: мы празднуем – вы получаете подарки!
Rizat Sundetov
1
комментарий
0
читателей
Полный профиль
Rizat Sundetov - 14
Google обошел Яндекс по популярности в России в 2018 году: исследование SEO Auditor
Рамблер
1
комментарий
0
читателей
Полный профиль
Рамблер - Вот вроде отечественный - это сказано верно.. «Я́ндекс» — российская транснациональная компания, зарегистрированная в Нидерландах. Так говорится в Википедии. И с хрена ли ОТЕЧЕСТВЕННЫЙ поисковик зарегистрирован в Европе? И где платится основная часть налогов? Ну-ууу, точно не в России. И если запахнет жаренным, то был Яндекс и нет Яндекса!
8 методик в SEO, от которых давно пора отказаться
Евгений Сметанин
12
комментариев
0
читателей
Полный профиль
Евгений Сметанин - Факторов вообще очень много, согласитесь, вы будете использовать максимальное их количество, особенно, если в ТОПе засели агрегаторы с сумасшедшими ПФ. В таких случаях, вхождение ключа в домен для маленького профильного сайта, сыграет свою положительную роль. Конечно же, если контент на страницах хорошего качества. У меня есть несколько успешных кейсов на эту тему. На сайте продают несколько видов товаров, а выстреливает в ТОП тот, название которого присутствует в доменном имени. Как корабль назовешь, так он и поплывет, верно?))
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Дмитрий
1
комментарий
0
читателей
Полный профиль
Дмитрий - Здравствуйте, на сайте возможно несколькими путями дойти до почти одинаковой страницы, те отличаться будет только незначительная часть H1, а контент будет одинаковым, дело в применимости автозапчастей к разным автомобилям. Что из этого будет каноничной ссылкой и какие есть пути для решения подобных ситуаций? 1 - bpauto.ru/catalog/audi/audi-a6/a6-iv-c7-sedan-2011-2014/kuzov-naruzhnaya-chast/dveri-i-komplektuyushchie/dver-perednyaya-levaya/ 2 - bpauto.ru/catalog/audi/audi-a6/a6-iv-c7-rest-sedan-2014-n-v-/kuzov-naruzhnaya-chast/dveri-i-komplektuyushchie/dver-perednyaya-levaya/
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Марина Ибушева
46
комментариев
0
читателей
Полный профиль
Марина Ибушева - Здравствуйте! Все рекламные материалы на SEOnews помечаются. В данном случае мы решили перевести и опубликовать эту статью совершенно бесплатно, так как она показалась нам интересной и вызвала бурное обсуждение среди западных SEO-специалистов. Ссылки мы ставим в конце ко всем материалам, если у них есть первоисточник.
Как выбрать подрядчика для продвижения сайта: 7 уровней воронки поиска
aashutosh
1
комментарий
0
читателей
Полный профиль
aashutosh - data science training institute in noida- Webtrackker Technology (8802820025) providing Data Science Training in Noida. Get ✓ 40 Hours Learning training✓ 70 Hrs Projects ✓ 24 X 7 Support ✓ Job Assistance. WEBTRACKKER TECHNOLOGY (P) LTD. C - 67, sector- 63, Noida, India. E-47 Sector 3, Noida, India. +91 - 8802820025 0120-433-0760 +91 - 8810252423 012 - 04204716 EMAIL:info@webtrackker.com webtrackker.com/Best-Data-Science-Training-Institute-in-Noida.php
Как построить качественный ссылочный профиль на основе конкурентов
Ирина
5
комментариев
0
читателей
Полный профиль
Ирина - Давно сотрудничаю с megaindex.com и считаю данный сервис одним из лучших в сео сегменте рунета да и не только рунета. Пользуюсь их инструментами для аналитики своих работ и выявлению своих и чужих ошибок. Да и ссылочный профиль, как и говорится в данной статье сделать гораздо проще и правильней при помощи как раз мегаиндекса. Добавлю еще что инструмент для поиска конкурентов у мегаиндекса очень удобный и простой в применении.
Google назвал три главных SEO-фактора
Павел Андрейчук
44
комментария
0
читателей
Полный профиль
Павел Андрейчук - Я бы не стал утверждать что это так. У меня есть ресурс где ссылок.. ну я не знаю, полтинник может быть, вручную проставленные года за 2 и позиции хорошие по могим запросам именно в гугле, в то время как в Яндексе позиции ниже. Хотя конечно с ссылками позиции были бы лучше, наверное, но владелец увы не выделяет бюджет на ссылки.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
352
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
105
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
69
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!