×
Россия +7 (495) 139-20-33

Baltic Digital Days 2017: Как поисковые системы оценивают и учитывают возраст документа

Россия +7 (495) 139-20-33
Шрифт:
1 7320

Продолжаем обзор программной части конференции Baltic Digital Days, которая уже в пятый раз проходит в Калининграде. Одним из самых ярких и заметных докладов мероприятия стало выступление независимого эксперта Алексея Трудова, в котором он затронул тему «Как поисковые системы оценивают и учитывают возраст документа».

Алексей Трудов.jpg

Среди специалистов в области поисковой оптимизации распространено мнение, что возраст страницы — очень важный фактор ранжирования. Чем страница старше — тем лучше. Ее возраст можно определить при помощи различных операторов, параметров Яндекс.Xml и пр.

На данный момент никаких достоверных исследований по поводу влияния возраста страницы на ранжирование не существует. Все ограничивается результатами опросов экспертов, но это всего-навсего субъективное отражение личного опыта, а не реальные цифры.

Очевидно, что в ТОП-ах всегда много старых документов. Их владельцы имели возможность нарастить ссылочную массу, уделить внимание созданию качественного контента и пр.

Однако наличие в ТОП-ах множества старых документов ни о чем не говорит. Кроме возраста существует еще масса различных факторов ранжирования страниц. Очевиден своего рода парадокс — никто на самом деле не уверен в объективной важности возраста страницы, но все активно используют данный фактор.

Отражает ли modtime реальный возраст страницы

Modtime — один из технических параметров Яндекс.Xml — время последнего изменения страницы. Modtime может обнуляться. Например, документ создан в 2010 году, а его modtime датирован 2017-м. Это может происходить при выпадении страницы из индекса. Особенно важно, что, согласно распространенному мнению, modtime отражает реальные возрастные факторы, которые учитываются в ранжировании. Это легко проверить.

Если после обнуления страницы трафик упал, то modtime важен. В противном случае — нет. После анализа 5846 сайтов с 113 523 URL с детальными данными о динамике трафика за полтора года выяснилось, что обнуление modtime произошло для 4880 URL. Из этого следует, что возраст первой индексации документа определить по modtime с уверенностью нельзя.

Изменения трафика после обнуления modtime незначительны и практически равны «0».

Изменения трафика после обнуления modtime

Как посмотреть возраст страницы в Google

Существует мнение, что для определения возраста страницы необходимо задать ограничения по времени, и Google в сниппете покажет дату. Этот способ тоже не работает.

В сниппете даже может демонстрироваться дата из будущего. Как видно из примера, дата посещения страницы меньше даты, выведенной в сниппет. Дата в этом случае взята непосредственно из контента страницы. Владелец сайта может указать любую дату, так что в сниппете может оказаться что угодно.

Владелец сайта может указать любую дату, так что в сниппете может оказаться что угодно

На другом примере можно увидеть, что дата посещения страницы на полгода опережает дату регистрации домена.

Дата посещения страницы на полгода опережает дату регистрации домена

Несложно прийти к выводу, что даты, которые демонстрируют поисковые системы, не всегда показывают достоверный возраст страницы. Во всяком случае, на 100% доверять им нельзя. Они созданы для клиентов поисковых систем, а не для оптимизаторов.

Попытка определения реального возраста страницы по массе показателей

Сразу стоит отметить, что особых результатов выборка измерений большого количества показателей не принесла. Удалось определить только количество URL в Google и Яндекс и, главное, сроки, в которые их трафик вышел на плато.

Попытка определения реального возраста страницы по массе показателей

Что дало результат?

Вместо большой статистической выборки для эксперимента были рассмотрены 6 старых сайтов — заглушек, которые когда-то были созданы, но не получили дальнейшего развития. Сайты не имели ссылочного или другого трафика.

На старых URL был размещен сгенерированный текст под низкочастотные запросы. Для каждой страницы был создан практически идентичный дубль со схожей релевантностью. Главное условие — пары страниц не должны были склеиваться как дубли. Все текстовые факторы этих URL, кроме возраста, были предельно близки. В выборку не попали страницы с внешними ссылками.

Затем были созданы еще пары сайтов. В итоге получилась схема: страница на старом домене и старом URL, страница на старом домене и новом URL, пара страниц на новом домене и новом URL. Сайты на новых доменах понадобились для проверки идентичности текстовой релевантности.

В сумме получилось 954 поисковых запроса — по 6 на каждую исходную страницу.

В сумме получилось 954 поисковых запроса

Данные по индексации показали, что из всех сгенерированных страниц ни одна не была удалена Яндексом как дубль. На новых доменах некоторые страницы вылетели как некачественные. На старых доменах были проиндексированы почти все страницы.

20885020_1645961998755804_1067218868_n.png

 

Вывод: в Яндексе возраст каждого конкретного URL имеет значение.

20840317_1645962002089137_401160842_n.png

В Google ситуация выглядит иначе. Преимущество здесь получили старые страницы на старом домене. С ними почти сравнялись новые страницы на старом домене. Как и в ситуации с Яндексом, доля новых страниц на новых доменах значительно меньше. В Google на первом месте доменные факторы URL.

Выводы

Важно: все показатели — modtime, дата в сниппете Google и пр. — не демонстрируют возраст страницы в любом понимании. Надежного универсального способа оценить дату первичной индексации страницы чужого сайта не существует.

Обнуление modtime — то, чего все боятся — не показало на большой выборке значимого изменения трафика.

Тем не менее длительное нахождение URL в индексе для Яндекса действительно имеет значение. В Google такая зависимость не прослеживается. Это не значит, что его нет: зависимость может быть нелинейной.

В Google параллельно возрасту работают другие факторы ранжирования, так как в среднем трафик выходит на плато позже, чем в Яндексе.

«Вылет» страницы в Вебмастере, как недостаточно качественной, не всегда связан с характеристиками документа. BAD_QUALITY в Вебмастере связан в том числе с показателями всего сайта.

В понимании Яндекса недостаточно качественная страница — это необязательно страница с «копипастом» и прочими «смертными грехами». Яндекс определяет как некачественные те страницы, у которых мало шансов оказаться в выдаче по каким-то запросам.

На заметку специалистам

По изменению modtime нет смысла оценивать эффективность «склейки». Modtime можно использовать для получения дополнительной информации при оценке конкурентов, но эти данные будут сильно «зашумлены» и не факт, что они будут способствовать пониманию ситуации.

На старте любого проекта стоит сделать «заглушку» для накопления возрастных факторов. При продвижении под Яндекс не будет лишним также сразу создать URL для особо важных документов.

Для новых проектов небезопасно применять вылетевшие домены. Необходимо учитывать риски и использовать дропнутые домены в случаях, когда ссылочная масса может перевесить их все.

В качестве условных ориентиров для продвижения на Google можно принять 16 месяцев, под Яндекс — один год. Эти временные рамки полезны для оценки сроков возврата инвестиций.

Проблемы с BAD_QUALITY в Вебмастере можно попытаться решить при помощи продвижения успешных разделов. Это даст трафик уже в ближайшем будущем, а заодно улучшит доменные факторы. Они повлияют на увеличение процента страниц в индексе.

(Голосов: 6, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Ri Ri
    1
    комментарий
    0
    читателей
    Ri Ri
    больше года назад
    Интересно, полезно! Раскладочка:  Этоn способ тоже не работает.
    -
    3
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
14
комментариев
0
читателей
Полный профиль
Михаил Мухин - Здравствуйте! 1-2. Считает стенд. Ссылка на него дана, но могу повторить: online.p-c-l.ru/competition/task/card/id/106. Нажмите на кнопку "Начать" и заранее приготовьте прогноз бюджета Яндекс. Суть расчета: перебор комбинаций всех ставок на всех фразах, построение бюджетных когорт - бюджетов с одинаковым СРС, отбор в каждой когорте бюджета с максимальным количеством кликов и ..., да упорядочивание этих бюджетов по мере возрастания СРС, причем берем не все, а с фиксированным шагом. 3. Гугл считается через поправочные коэффициенты. Мы перевариваем океан данных и представляем их. На удивление, получается не менее, хотя и не более точно, как и прогноз Яндекс. Конечно, нужно понимать, что это очень примерные прикидки, фактически перевод неточного прогноза Яндекс в удобочитаемую форму, не больше. Самое интересное начинается, когда применяешь метод бюджетных когорт к измерению показателей фраз на реальной рекламной кампании в режиме 48х7. Первые результаты очень хорошие. Если хотите присоединиться к бесплатному тестированию, напишите Эльвире r-support@r-broker.ru. В теме укажите "хочу присоединиться к тестам Умного управления рекламой"
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
5
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Дмитрий Сульман
4
комментария
0
читателей
Полный профиль
Дмитрий Сульман - Все верно, об этом я и говорю. У крупных компаний есть много данных и они имеют доступ к дорогим технологиям и решениям для персонализации контента. Топовые западные сервисы для персонализации, такие как RichRelevance или Dynamic Yield, стоят от нескольких тысяч до десятков тысяч долларов в месяц. Понятно, что малый бизнес не может себе этого позволить. Да даже если бы чисто теоретически и мог, то это вряд ли бы имело хоть какой-то смысл. Во-первых, у малого бизнеса недостаточно данных, чтобы подобные алгоритмы персонализации начали эффективно работать, а во-вторых, тот профит, который МСБ получит от персонализации, никогда не покроет таких расходов. Мы же предлагаем решение, доступное как раз для малого и среднего бизнеса. При этом наше решение комплексное: МультиЧат - это одновременно и инструмент для персонализации, и для коммуникации.
Как вывести сайт в ТОП 10 Google в 2019 году
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Интересная статья. Подскажите на каких ресурсах расположить ссылки бесплатно по автобезопасности? Наш сайт bastion-center.ru/
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Kosta Bankovski
4
комментария
0
читателей
Полный профиль
Kosta Bankovski - Спасибо за приятные слова! Буду и дальше делиться наработками ;)
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
10 элементов сайта, которые гарантированно отпугнут посетителей
Андрей
2
комментария
0
читателей
Полный профиль
Андрей - Ну типа потому что клиентское seo больше для коммерции предназначено. Типа контентники и сами знают что делать. В коммерции можно тысячу причин найти чтобы поработать с сайтом, а с контентными такие фокусы уже не прокатят, поэтому и не пишут. Всё продвижение для контентников сеошники описывают в трех словах: скорость, качество, систематичность. А, ну ещё конечно же СЯ, как же я про него забыл (фундамент жеть!).
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
363
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
83
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!