×
Россия +7 (495) 960-65-87

Экспериментальное SEO: «Дырявые носочки панды»

Россия +7 (495) 960-65-87
SEOnews
Экспериментальное SEO: «Дырявые носочки панды»
Шрифт:
19 10420

Как известно, Панда – поисковый алгоритм Google, направленный на борьбу с низкокачественным контентом. Алгоритм живет уже 4 года и потерпел множество обновлений. Логично было предположить, что в случае с идентифицированием сайтов на автоперевод Панда использует базу переводчика translate.google.com. Я решил выяснить, как Панда справится с автопереводом сайта на 37 языков через API translate.yandex.ru. За базу взят портал в тематике компьютерных игр и объемом контента на 20 миллионов знаков.

Цели эксперимента

- Узнать, сможет ли панда идентифицировать автоперевод по чужим базам переводчиков,

- Определить регионы, наиболее «податливые» на хорошее ранжирование плохого контента

- Оценить качество межрегионального ссылочного

- Выделить регионы, наиболее привлекательные для МFA сайтов (Made For AdSense)

Условия

- 37 поддоменов xx.name.info, по одному на каждый целевой регион,

- Сайты полностью переведены: навигация, мета данные, тексты,

- Произведена перегенерация ЧПУ, sitemap.xml,

- Одновременный запуск в индекс Google в феврале 2015,

- Полная синхронизация с русскоязычной версией. Как только мы публиковали новость на русском языке, она автоматически переводилась на 37 языков и публиковалась на всех региональных сайтах

- Региональные сайты залинкованы на русскоязычную версию следующим образом: каждая страница ссылается свою русскоязычную версию в доменной зоне .ru с русским анкором = «Название страницы»

- У сайтов одинаковые: IP, дизайн, контактные данные

Данные собирались 12 месяцев, за этот период поддерживалась хорошая активность публикаций уникального контента.

Результаты

Для начала посмотрим в процентах, сколько страниц по региональным доменам вошло в индекс.

Изображение 1.jpg

Выделим 3 группы:

- Плохо проиндексированы, до 40%. Вероятно, панда зафиксировала неладное.

- Нормально, от 40% до 70%. Панда нашла ряд страниц сомнительного качества, но, в целом, сайт неплохо ранжируется.

- Хорошо, свыше 70% в индексе. Автоперевод принят весьма дружелюбно.

Важный момент, значение «Всего проиндексированных страниц» = «Общему индексу для всех доменов», то есть Google не выделял для автоперевода Дополнительный индекс, а просто удалял/не включал в индекс то, что идентифицировал, как негодный контент. Но есть исключение, Финскую языковую версию Google проиндексировал на 76% - 39100 страниц, из них 32090 определил в дополнительный индекс.

Посмотрим, сколько поискового трафика из Google мы получили с 1 марта 2015 по 29 февраля 2016.

Изображение 2.jpg

Некорректно будет сравнивать объем регионального трафика с Россией т.к. нет выравнивающего коэффициента, учитывающего популярность всей группы запросов в каждом регионе. Чтобы его высчитать, нужны толковые переводчики и сбор данных по каждой стране, на это пока ресурсов не нашлось. Поэтому принимайте информацию, для общего ознакомления или самостоятельного анализа.

Отдельно выделю 5 стран, где Google не являлся трафикообразующей поисковой системой:

- Чехия, 50% из Seznam, относительно общего поискового трафика

- Турция, 30% из Яндекс

- Китай, 75% из Baidu

- Малайзия, 50% из местных поисков

- Сербия, 70% из Яндекса

Изображение 3.jpg

В панели вебмастера Google отображается информация, что на русский домен учитывается всего 222700 ссылок из региональных сайтов, которые ссылаются на 3821 страницу. Отмечу, что все ссылки были с разными анкорами и распределялись на свои русскоязычные аналоги. Довольно внушительные цифры, которые никак не повлияли на трафик и позиции RU сайта. Из этого следует, что засчитался вес только с одной ссылки каждого домена, либо ссылки со сайтов на других языках учитываются весьма незначительно. RU домен не был подвержен санкциям пингвина за резкий прирост внешних ссылок.

Изображение 4.jpg

Области вывода и размеры AdSense блоков одинаковы для всех сайтов, из чего следует, что ставки за клик формировались в равных условиях.

Общий итог

- Панда кушает не только вкусный и питательный бамбук, ее аппетит и избирательность очень зависит от региона

- Внешние ссылки из автогена работают сомнительно, не питайте надежды на сателлитную структуру

- Не тяните с открытием регионального сайта, даже если это будет автоперевод

Теперь я планирую испытать Пингвина, расширяя условия эксперимента, в рамках которого сеть языковых версий будет подвержена агрессивному посеву внешних ссылок.

Задавайте ваши вопросы и пишите пожелания к последующим форматам экспериментов на ящик info@zhaf.ru или в комментарии.

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Роман
    больше года назад
    На карте цен для одной из стран указаны проценты.
    -
    0
    +
    Ответить
  • Alexander Mikhailov
    1
    комментарий
    0
    читателей
    Alexander Mikhailov
    больше года назад
    Добрый день!

    Какова цена за клик AdSense для Вьетнама?
    -
    0
    +
    Ответить
  • Гость
    больше года назад
    Спасибо за отличный материал! Скажитн, а почему вы уверенны, что это именно  Панда не пускает страницы в индекс?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Гость
      больше года назад
      Спасибо за отзыв)
      Сеть сайтов дерзила именно качеством контента, перевод яндекса местами недостаточно качественен, а на некоторые языки он напрочь не переводил каждое 5-6 слово. Панда анализирует контент и решает, пускать ли его в индекс и если Да, то размещать страницу в основной или вспомогательный индекс Google. Признаки других фильтров отсутствовали, как и уведомления о нарушениях в GWT.
      -
      0
      +
      Ответить
      • Евгений Аралов
        2
        комментария
        0
        читателей
        А от куда уверенность, что именно Панда решает кого на входе пускать в индекс?
        -
        2
        +
        Ответить
        • Андрей Желудевич
          0
          комментариев
          0
          читателей
          Уточним формулировку: "Панда принимает решение о включении в общий и дополнительный индекс, в случае идентификации проблем с контентом."
          В условиях эксперимента, осознанно сгенерирован плохой контент, остальные факторы seo оптимизации в порядке. Поэтому я считаю, что в данном случае решает Панда. Но я буду рад услышать другие мнения)
          -
          1
          +
          Ответить
          • Евгений Аралов
            2
            комментария
            0
            читателей
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, есл...
            1. На сколько мне известно Панда, хоть и включена в основной алгоритм, все еще запускается вручную joxi.ru/n2YekxXhjP9YX2 www.searchengines.ru/filtr_panda_sta.html.

            2. Обычно этот алгоритм понижает сайт по запросам, но не выкидывает страницы из индекса.
            3. По дополнительному индексу:

            «Если ввести в адресную строку site:pdapps.ru/ — то весь индекс страниц, а если ввести site:pdapps.ru/& — это основной индекс, который по идее должен быть в поиске. Поправьте, если я ошибаюсь» — спросили Андрея Липатцева на справочном форуме для веб-мастеров."

            Действительно, ошибаетесь, — ответил он. — Никакой полезной информации добавление & к запросу Вам не даёт.

            Итого: возможно Панда и может выкинуть страницы из индекса, но то, что этот алгоритм проверяет страницы перед их индексацией очень сомнительно.

            Не Пандой единой живет Google.
            -
            2
            +
            Ответить
            • Андрей Желудевич
              0
              комментариев
              0
              читателей
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментиров...
              Не спорю с приведенными аргументами. Данные по индексу на инфографике приведены на март 2016 (запуск состоялся в марте 2015). Вероятно, за год Панду не раз запускали в каждом из регионов, где она работает. Не исключаю, что выпадение из индекса могло быть связано не только с Пандой. Но, поскольку условия эксперимента были направлены на провокацию именно Панды, я отдал ей предпочтение в описании результатов.
              Я заинтересован в выявлении бОльших взаимосвязей,  сегментировании степени воздействия различных алгоритмов Google на индексацию и ранжирование сайтов. Но не все сразу) Важно активное участие проф сообщества в данном вопросе.
              -
              0
              +
              Ответить
  • Игорь Бакалов
    5
    комментариев
    0
    читателей
    Игорь Бакалов
    больше года назад
    Поддоменам через GWT устанавливались регионы?
    На сколько изначально был прокачен основной домен? Хотя бы тИЦ/возраст

    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Здравствуйте!
      Да, регион устанавливался через GWT.
      Домен чистый, без истории и внешних ссылок, зарегистрирован в августе 2014 (за пол года до запуска всей сети в индекс)
      -
      0
      +
      Ответить
  • Fuck You Buddy :D
    39
    комментариев
    0
    читателей
    Fuck You Buddy :D
    больше года назад
    Самый годный контент за последний год на сеоньюс. Спасибо
    -
    9
    +
    Ответить
  • Dmitriy Kulinar
    2
    комментария
    0
    читателей
    Dmitriy Kulinar
    больше года назад
    Индию не взяли по какой-то определенной причине или случайно?
    -
    0
    +
    Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Dmitriy Kulinar
      больше года назад
      Определенных причин не было. Если не ошибаюсь, на момент запуска генерации, Яндекс.Переводчик не поддерживал хинди.
      -
      0
      +
      Ответить
  • Adrian
    больше года назад
    В разделе "Объем трафика" Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка. Исходя из этого, трафика очень мало получается. То же самое и по ОАЭ и арабскому языку. Или Вы учитывали трафик исключительно из названных стран?

    Блокировок в Адсенс не было?
    -
    0
    +
    Ответить
    • Зюкин Павел
      1
      комментарий
      0
      читателей
      Зюкин Павел
      Adrian
      больше года назад
      "Испания и Португалия вероятно должны быть красными, потому-что, фактически это вся Южная и Центральная Америка."
      что-то с географией у вас батенька всё крайне плохо, даже недавно прошедший чемпионат ЕВРОПЫ по футболу не помог отнести к Европе, Испанию и Португалию.
      -
      1
      +
      Ответить
      • Adrian
        Зюкин Павел
        больше года назад
        Испания и Португалия находятся в Европе и участвовали в чемпионате Европы. Одна из этих стран даже стала победителем.
        А Южная и Центральная Америка здесь при том, что там разговаривают на испанском и португальском языках.
        Сына, учите географию.
        -
        0
        +
        Ответить
    • Андрей Желудевич
      0
      комментариев
      0
      читателей
      Андрей Желудевич
      Adrian
      больше года назад
      Здравствуйте!

      Емкость рынка не учитывалась, данные по трафику даны сводно и их дробление произведено довольно примитивно.
      Блокировок не было, все работает)

      -
      0
      +
      Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
#SEOnews14: мы празднуем – вы получаете подарки!
Анна Макарова
358
комментариев
0
читателей
Полный профиль
Анна Макарова - Гость, добрый день! С победителями мы связывались сразу после розыгрыша. Если мы вам не написали, значит, ваш номер не выпал. Но не расстраивайтесь, у нас обязательно будут новые розыгрыши!
Google Data Studio: делаем красивые отчеты по контекстной рекламе для клиентов
Светлана Зубрицкая
1
комментарий
0
читателей
Полный профиль
Светлана Зубрицкая - Нужно убрать пробелы между строк и заменить кавычки на вот такие "
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Георгий
1
комментарий
0
читателей
Полный профиль
Георгий - Все что рекомендуется в этой статье есть у w.tools. Ни разу не пожалел что подключился. Своя CDN сеть, кеш статики и динамики, минификация js\css и кешируемого html, оптимизация всех типов картинок и еще куча всего полезного. Сайт летает и я не знаю проблем. Могу рекомендовать от души.
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Ann Yaroshenko
5
комментариев
0
читателей
Полный профиль
Ann Yaroshenko - Дмитрий, добрый день! Если вы проставили на странице с автозапчастями rel=canonical ( а я вижу в коде, что не проставили) или в HTTP хедере, то бот, как правило: выберит ту страницу главной, которую вы указали в rel=canonical ссылке. Eсли же вы этого не сделали, то бот сам выберит оригинал (алгоритмы, по которым бот это делает, скрыты Googl-ом)
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Feth
1
комментарий
0
читателей
Полный профиль
Feth - Тот момент, когда от статьи в интернете получаешь больше полезных знаний и навыков, чем от своего начальства. По статьям нетпиковцев можно учебник про SEO уже сшивать, ребята молодцы. Спасибо, что делитесь информацией.
Как я пытался купить CRM-систему, но мне ее поленились продать
Kristina
1
комментарий
0
читателей
Полный профиль
Kristina - Очень рекомендую CRM-систему польской фирмы Firmao. Все функции настраиваются в соответствии с индивидуальным потребностям компании! Советую попробовать бесплатную демо-версию, чтобы попробовать все необходимые функции, без лишних кнопок и траты дополнительных финансов! :) Сайт: firmao.ru/info
Как улучшить репутацию сайта недвижимости с помощью крауд-маркетинга
Евгений
2
комментария
0
читателей
Полный профиль
Евгений - а у вас какое впечатление от статьи?
10 элементов сайта, которые гарантированно отпугнут посетителей
Андрей
2
комментария
0
читателей
Полный профиль
Андрей - Ну типа потому что клиентское seo больше для коммерции предназначено. Типа контентники и сами знают что делать. В коммерции можно тысячу причин найти чтобы поработать с сайтом, а с контентными такие фокусы уже не прокатят, поэтому и не пишут. Всё продвижение для контентников сеошники описывают в трех словах: скорость, качество, систематичность. А, ну ещё конечно же СЯ, как же я про него забыл (фундамент жеть!).
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
358
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
106
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
73
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!