×
Россия +7 (495) 139-20-33

Baltic Digital Days 2017: Как поисковые системы оценивают и учитывают возраст документа

Россия +7 (495) 139-20-33
Шрифт:
1 7120

Продолжаем обзор программной части конференции Baltic Digital Days, которая уже в пятый раз проходит в Калининграде. Одним из самых ярких и заметных докладов мероприятия стало выступление независимого эксперта Алексея Трудова, в котором он затронул тему «Как поисковые системы оценивают и учитывают возраст документа».

Алексей Трудов.jpg

Среди специалистов в области поисковой оптимизации распространено мнение, что возраст страницы — очень важный фактор ранжирования. Чем страница старше — тем лучше. Ее возраст можно определить при помощи различных операторов, параметров Яндекс.Xml и пр.

На данный момент никаких достоверных исследований по поводу влияния возраста страницы на ранжирование не существует. Все ограничивается результатами опросов экспертов, но это всего-навсего субъективное отражение личного опыта, а не реальные цифры.

Очевидно, что в ТОП-ах всегда много старых документов. Их владельцы имели возможность нарастить ссылочную массу, уделить внимание созданию качественного контента и пр.

Однако наличие в ТОП-ах множества старых документов ни о чем не говорит. Кроме возраста существует еще масса различных факторов ранжирования страниц. Очевиден своего рода парадокс — никто на самом деле не уверен в объективной важности возраста страницы, но все активно используют данный фактор.

Отражает ли modtime реальный возраст страницы

Modtime — один из технических параметров Яндекс.Xml — время последнего изменения страницы. Modtime может обнуляться. Например, документ создан в 2010 году, а его modtime датирован 2017-м. Это может происходить при выпадении страницы из индекса. Особенно важно, что, согласно распространенному мнению, modtime отражает реальные возрастные факторы, которые учитываются в ранжировании. Это легко проверить.

Если после обнуления страницы трафик упал, то modtime важен. В противном случае — нет. После анализа 5846 сайтов с 113 523 URL с детальными данными о динамике трафика за полтора года выяснилось, что обнуление modtime произошло для 4880 URL. Из этого следует, что возраст первой индексации документа определить по modtime с уверенностью нельзя.

Изменения трафика после обнуления modtime незначительны и практически равны «0».

Изменения трафика после обнуления modtime

Как посмотреть возраст страницы в Google

Существует мнение, что для определения возраста страницы необходимо задать ограничения по времени, и Google в сниппете покажет дату. Этот способ тоже не работает.

В сниппете даже может демонстрироваться дата из будущего. Как видно из примера, дата посещения страницы меньше даты, выведенной в сниппет. Дата в этом случае взята непосредственно из контента страницы. Владелец сайта может указать любую дату, так что в сниппете может оказаться что угодно.

Владелец сайта может указать любую дату, так что в сниппете может оказаться что угодно

На другом примере можно увидеть, что дата посещения страницы на полгода опережает дату регистрации домена.

Дата посещения страницы на полгода опережает дату регистрации домена

Несложно прийти к выводу, что даты, которые демонстрируют поисковые системы, не всегда показывают достоверный возраст страницы. Во всяком случае, на 100% доверять им нельзя. Они созданы для клиентов поисковых систем, а не для оптимизаторов.

Попытка определения реального возраста страницы по массе показателей

Сразу стоит отметить, что особых результатов выборка измерений большого количества показателей не принесла. Удалось определить только количество URL в Google и Яндекс и, главное, сроки, в которые их трафик вышел на плато.

Попытка определения реального возраста страницы по массе показателей

Что дало результат?

Вместо большой статистической выборки для эксперимента были рассмотрены 6 старых сайтов — заглушек, которые когда-то были созданы, но не получили дальнейшего развития. Сайты не имели ссылочного или другого трафика.

На старых URL был размещен сгенерированный текст под низкочастотные запросы. Для каждой страницы был создан практически идентичный дубль со схожей релевантностью. Главное условие — пары страниц не должны были склеиваться как дубли. Все текстовые факторы этих URL, кроме возраста, были предельно близки. В выборку не попали страницы с внешними ссылками.

Затем были созданы еще пары сайтов. В итоге получилась схема: страница на старом домене и старом URL, страница на старом домене и новом URL, пара страниц на новом домене и новом URL. Сайты на новых доменах понадобились для проверки идентичности текстовой релевантности.

В сумме получилось 954 поисковых запроса — по 6 на каждую исходную страницу.

В сумме получилось 954 поисковых запроса

Данные по индексации показали, что из всех сгенерированных страниц ни одна не была удалена Яндексом как дубль. На новых доменах некоторые страницы вылетели как некачественные. На старых доменах были проиндексированы почти все страницы.

20885020_1645961998755804_1067218868_n.png

 

Вывод: в Яндексе возраст каждого конкретного URL имеет значение.

20840317_1645962002089137_401160842_n.png

В Google ситуация выглядит иначе. Преимущество здесь получили старые страницы на старом домене. С ними почти сравнялись новые страницы на старом домене. Как и в ситуации с Яндексом, доля новых страниц на новых доменах значительно меньше. В Google на первом месте доменные факторы URL.

Выводы

Важно: все показатели — modtime, дата в сниппете Google и пр. — не демонстрируют возраст страницы в любом понимании. Надежного универсального способа оценить дату первичной индексации страницы чужого сайта не существует.

Обнуление modtime — то, чего все боятся — не показало на большой выборке значимого изменения трафика.

Тем не менее длительное нахождение URL в индексе для Яндекса действительно имеет значение. В Google такая зависимость не прослеживается. Это не значит, что его нет: зависимость может быть нелинейной.

В Google параллельно возрасту работают другие факторы ранжирования, так как в среднем трафик выходит на плато позже, чем в Яндексе.

«Вылет» страницы в Вебмастере, как недостаточно качественной, не всегда связан с характеристиками документа. BAD_QUALITY в Вебмастере связан в том числе с показателями всего сайта.

В понимании Яндекса недостаточно качественная страница — это необязательно страница с «копипастом» и прочими «смертными грехами». Яндекс определяет как некачественные те страницы, у которых мало шансов оказаться в выдаче по каким-то запросам.

На заметку специалистам

По изменению modtime нет смысла оценивать эффективность «склейки». Modtime можно использовать для получения дополнительной информации при оценке конкурентов, но эти данные будут сильно «зашумлены» и не факт, что они будут способствовать пониманию ситуации.

На старте любого проекта стоит сделать «заглушку» для накопления возрастных факторов. При продвижении под Яндекс не будет лишним также сразу создать URL для особо важных документов.

Для новых проектов небезопасно применять вылетевшие домены. Необходимо учитывать риски и использовать дропнутые домены в случаях, когда ссылочная масса может перевесить их все.

В качестве условных ориентиров для продвижения на Google можно принять 16 месяцев, под Яндекс — один год. Эти временные рамки полезны для оценки сроков возврата инвестиций.

Проблемы с BAD_QUALITY в Вебмастере можно попытаться решить при помощи продвижения успешных разделов. Это даст трафик уже в ближайшем будущем, а заодно улучшит доменные факторы. Они повлияют на увеличение процента страниц в индексе.

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Ri Ri
    1
    комментарий
    0
    читателей
    Ri Ri
    больше года назад
    Интересно, полезно! Раскладочка:  Этоn способ тоже не работает.
    -
    3
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
#SEOnews14: мы празднуем – вы получаете подарки!
Анна Макарова
0
комментариев
0
читателей
Полный профиль
Анна Макарова - Гость, добрый день! С победителями мы связывались сразу после розыгрыша. Если мы вам не написали, значит, ваш номер не выпал. Но не расстраивайтесь, у нас обязательно будут новые розыгрыши!
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
9
комментариев
0
читателей
Полный профиль
Михаил Мухин - Дожидаться 100 попыток не будем - не дождемся :) Подведем итоги и опубликуем решение 13 Декабря
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Георгий
1
комментарий
0
читателей
Полный профиль
Георгий - Все что рекомендуется в этой статье есть у w.tools. Ни разу не пожалел что подключился. Своя CDN сеть, кеш статики и динамики, минификация js\css и кешируемого html, оптимизация всех типов картинок и еще куча всего полезного. Сайт летает и я не знаю проблем. Могу рекомендовать от души.
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Ann Yaroshenko
5
комментариев
0
читателей
Полный профиль
Ann Yaroshenko - Дмитрий, добрый день! Если вы проставили на странице с автозапчастями rel=canonical ( а я вижу в коде, что не проставили) или в HTTP хедере, то бот, как правило: выберит ту страницу главной, которую вы указали в rel=canonical ссылке. Eсли же вы этого не сделали, то бот сам выберит оригинал (алгоритмы, по которым бот это делает, скрыты Googl-ом)
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Kosta Bankovski
4
комментария
0
читателей
Полный профиль
Kosta Bankovski - Спасибо за приятные слова! Буду и дальше делиться наработками ;)
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
Как вывести сайт в ТОП 10 Google в 2019 году
Ирина
8
комментариев
0
читателей
Полный профиль
Ирина - Работают. Как естественные, так и закупные. >Мои сайты в первую очередь заточены на яндекс Соболезную. >Насколько поисковые алгоритмы с гугловскими у него. Разница в 10 лет. Вон в Яше все долбят на ключи, на вхождения и прочий трэш из древностей. А у Гугла, вон почитайте про eat, ymyl Не все понятно но спасибо за ответы. Я так понимаю что с ссылками деть никто точно не знает) Ну это и хорошо вообщем. Самому разбираться как то интересней. Но не всегда. Есть к примеру 2captcha.com/ru и на него 100к ссылок есть. Ну а смысл какой?
Как я пытался купить CRM-систему, но мне ее поленились продать
Kristina
1
комментарий
0
читателей
Полный профиль
Kristina - Очень рекомендую CRM-систему польской фирмы Firmao. Все функции настраиваются в соответствии с индивидуальным потребностям компании! Советую попробовать бесплатную демо-версию, чтобы попробовать все необходимые функции, без лишних кнопок и траты дополнительных финансов! :) Сайт: firmao.ru/info
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
360
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
79
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!