×
Россия +7 (495) 139-20-33

Оценка спамности доноров

Россия +7 (495) 139-20-33
Шрифт:
25 10556

Компания Реаспект разработала новую оценку спамности доноров. Она в большей мере отражает степень спамности доноров, т.к. использует при анализе оценку оптимизированности анкоров. Собственно, во многом именно на основе анализа анкоров поисковые системы делают вывод о спамности ссылок (тот же «Мадридский доклад» и метрику «SEO-text»).

Метрика исходящих хостов на страницу (ссылок на страницу)

Пообщавшись с большим количеством SEO-специалистов, мы поняли, что сегодня часто используется простая метрика «ссылок на страницу» или «хостов на страницу». Её смысл: «Чем больше донор имеет ссылок на уникальные хосты, и чем меньше у него страниц, тем он спамнее».

Так же часто для расчёта качества донора некоторые специалисты используют количество входящих ссылок на донор, их посещаемость и т.п. То есть вся оценка о КАЧЕСТВЕ сводится к оперированию данных о КОЛИЧЕСТВЕ (доноров, получателей, посетителей и кучей других количественных метрик).

Мы задумались. Посмотрим со стороны поисковых систем. Поисковые системы не борются со ссылками. Они борются с псевдо-ссылками. Они не борются с сайтами, на которых много исходящих ссылок. Они борются с сайтами, на которых много псевдо-ссылок для манипулирования их алгоритмами.

Поэтому оперировать ТОЛЬКО количественной информацией при оценке спамности донора — всё-таки не совсем правильный подход. При проведении прошлого исследования по выявлению различных признаков коммерческих и некоммерческих анкоров, мы проанализировали множество анкор-листов сайтов, не продающих ссылки. Сайт, не продающий ссылки, по данной метрике может оказаться очень спамным. Хотя, с точки зрения поисковой системы, это должен быть вполне «чистый» источник данных (с которых часто ссылаются на википедию, популярные форумы, хостинги изображений и т.п.).

Метрика оптимизированности анкор-листа

Мы решили оценить степень спамности доноров оценивая оптимизированность их исходящих анкор-листов. Применили простую эвристику, основная суть которой заключается в учёте количества:

  • безанкорных ссылок (ссылок-картинок и урловых ссылок — http://; в спамных анкор-листах их доля обычно слишком низкая),
  • анкорных коммерческих ссылок (те слова и фразы, которые наиболее часто содержатся в коммерческих ссылках — выявлены так же по результатам прошлого исследования),
  • хостов-получателей — в качестве понижающего коэффициента (если их 500 и более — коэффициент равен 1; если хостов-получателей 1, то коэффициент стремится к нулю).

Данные факторы учавствуют в формуле в виде различных степенных логарифмических функций. Сами функции подбирались эмпирически.

Полученная формула показывает достаточно хорошую эффективность оценки спамности анкор-листов. Ручная оценка специалистом и оценка сервиса, использующего эту эвристику, совпадает минимум в 90% случаев. В то время, как оценки, использующие в основе метрику «исходящих хостов на страницу» совпадают с оценкой специалиста существенно реже (50-60%).

Этот же сервис мы смогли применить не только для оценки спамности исходящих анкор-листов. Но и оценки заспамленности акцепторов (входящих анкор-листов) — сайтов, которые находятся в активном продвижении.

Пример данных из нашего сервиса:

При желании, в формулу можно добавить и некоторые другие показатели (например, посещаемость, цитируемость, упоминаемость донора в качестве дисконтирующих коэффициентов).

В целом, идея достаточно простая и построена по логике поисковых систем. Пользуйтесь:)

Если хотите сравнить свои оценки доноров с оценкой нашего сервиса, то можете присылать 50 хостов на rustem@reaspekt.ru с пометкой «Хосты на оценку».


(Голосов: 6, Рейтинг: 4.33)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Игорь
    больше года назад
    Марина, спасибо! Анализ был проведен.
    -
    0
    +
    Ответить
  • Марал Гаипова
    137
    комментариев
    0
    читателей
    Марал Гаипова
    больше года назад
    Добрый день, Игорь. Уточните, пожалуйста, кому вы отправляли домены на проверку? На какой адрес? Если на rustem@reaspekt.ru, постараемся связаться с автором статьи.
    -
    0
    +
    Ответить
  • Игорь
    больше года назад
    Гость, Я Вам отослал на проверку домены еще 5 дней назад. Ответа нет.
    -
    0
    +
    Ответить
  • Гость
    больше года назад
    Виталий
    1. Возможно. Изначально и планировалось сделать несколько коммерческих тематических словарей. Но остановился на этом, т.к. и без этого всё достаточно очевидно. Я обязательно этот момент рассмотрю, посмотрю насколько это будет лучше.

    2. Как один из факторов, да. Можно ещё множество факторов приплести, конечно. В то же время, даже одна эта оценка мне кажется на сегодняшний день достаточно объёктивной, "сильной" и уникальной.
    -
    0
    +
    Ответить
  • zero50x
    больше года назад
    nogval, теперь это я ))
    -
    0
    +
    Ответить
  • Виталий
    4
    комментария
    0
    читателей
    Виталий
    больше года назад
    Рустем, «Реаспект»,
    Еще несколько моментов по поводу данной оценки:
    1. В данной формуле явно не хватает оценки спектра тематик анкор-листа, так как чем шире спектр тематик анкоров, тем Выше шанс, что это спам.
    2. В заголовке статьи сказано, что это "Оценка спамности доноров", а по факту это методика оценки спамности анкор-листа, если говорить о спамности донора, то в формуле нужно как минимум учитывать общее количество документов донора и количество анкоров на 1 до...
    Рустем, «Реаспект»,
    Еще несколько моментов по поводу данной оценки:
    1. В данной формуле явно не хватает оценки спектра тематик анкор-листа, так как чем шире спектр тематик анкоров, тем Выше шанс, что это спам.
    2. В заголовке статьи сказано, что это "Оценка спамности доноров", а по факту это методика оценки спамности анкор-листа, если говорить о спамности донора, то в формуле нужно как минимум учитывать общее количество документов донора и количество анкоров на 1 документ и т.д.
    -
    0
    +
    Ответить
  • nogval
    больше года назад
    >И еще вопрос: получается исходя из формулы брендовые ссылки типо "supershop" и ссылки типа "www.somesite.com" (без http) будут отнесены к CAnch, верно я понял? Но это не до конца соответствует действительности..

    так и выходит. спасибо! учтем.

    >откуда выгружаете анкоры - ahrefs, opensiteexp, majestic или чтото другое?
    >Информацию по исходящим ссылкам с донора откуда берете? Соломоно?

    да, соломоно. по апи.
    -
    0
    +
    Ответить
  • Хость
    больше года назад
    0,09 - чистый, 0,1 - уже подозрительный!?) Как вам это удалось?
    -
    0
    +
    Ответить
  • Виталий
    4
    комментария
    0
    читателей
    Виталий
    больше года назад
    Как одну из проверок можно использовать с одним "но"!
    Точечные проверки не всегда адекватны, нужно смотреть динамику изменения показателя AnchSpam .
    Сайты с бирж сегодня могут быть с допустимым показателем AnchSpam , а завтра он будет уже зашкаливать!
    -
    0
    +
    Ответить
  • Рустем, «Реаспект»
    больше года назад
    TIIIMOXAN, доказательства чего? Есть множество доказательств того, что поисковые системы для определения коммерческих ссылок в большей степени ориентируются на из анкоры. В 9 из 10 патентов на эту тему речь так или иначе идет о коммерческих анкорах.

    Иван, ссылки на сервис нет. А кто то ещё хочет протестировать? :)

    zero50x, а так никто делает. Ни оптимизаторы пока не парятся, ни тем более вебмастера-манимейкеры. Зачем? И так покупают и продают.

    Илья...
    TIIIMOXAN, доказательства чего? Есть множество доказательств того, что поисковые системы для определения коммерческих ссылок в большей степени ориентируются на из анкоры. В 9 из 10 патентов на эту тему речь так или иначе идет о коммерческих анкорах.

    Иван, ссылки на сервис нет. А кто то ещё хочет протестировать? :)

    zero50x, а так никто делает. Ни оптимизаторы пока не парятся, ни тем более вебмастера-манимейкеры. Зачем? И так покупают и продают.

    Илья,
    Про брендовые анкоры. Они не дают ни плюса ни минуса. Плюс дают картинки и хттп. А минус коммерческие.
    Нет, они не относятся к CAnch, т.к. не коммерческие.


    Анкор листы берутся из соломоно. Не 500 первых доноров-акцепторов, а полные анкор-листы хостов.
    -
    0
    +
    Ответить
  • Рустем, «Реаспект»
    больше года назад
    nogval, нет, это типе и выходит. Такие бредовые анкоры не подпадают под CAnch, т.к. они, как правило, не содержат коммерческие слова.

    Хость, тут мы поставили простые границы. 0 - 0.1, 0.1 - 0.2, 0.2 - 0.5, 0.5 - 1. И обозвали их для удобства. Границы взяты на основе наблюдений за сотнями анкор-листов разных доноров.

    Виталий, да. Доноры имеют привычку заспамляться. Описанным выше методом как раз это и можно анализировать.
    -
    0
    +
    Ответить
  • zero50x
    больше года назад
    ну ставим 100 безанкорных ссылок вида хттп//ru.wikipedia  хттп//ria.ru и мы в шоколаде ))
    -
    0
    +
    Ответить
  • Игорь Бакалов
    39
    комментариев
    0
    читателей
    Игорь Бакалов
    больше года назад
    Информацию по исходящим ссылкам с донора откуда берете? Соломоно?
    -
    0
    +
    Ответить
  • NosovI
    больше года назад
    >Мы решили оценить степень спамности доноров оценивая оптимизированность их исходящих анкор-листов.

    Методика интересная, для автоматизации каких-то процессов однозначно подойдет.

    Вообще Яндекс никогда не был против коммерческих ссылок, он был против ссылок, поставленных не в интересах пользователя и используемых для влияния на выдачу поисковой системы. А это не одно и тоже. Для Гугла вполне возможно, что это весьма рабочая тема, а для Яндекса - не факт, у него все...
    >Мы решили оценить степень спамности доноров оценивая оптимизированность их исходящих анкор-листов.

    Методика интересная, для автоматизации каких-то процессов однозначно подойдет.

    Вообще Яндекс никогда не был против коммерческих ссылок, он был против ссылок, поставленных не в интересах пользователя и используемых для влияния на выдачу поисковой системы. А это не одно и тоже. Для Гугла вполне возможно, что это весьма рабочая тема, а для Яндекса - не факт, у него все сложнее. Но чтобы говорить наверняка надо проводить настоящие исследования.
    -
    0
    +
    Ответить
  • Илья
    больше года назад
    Спасибо, очень интересная идея. Еще бы сервис поюзать)
    К сожалению, ссылка на ваше предыдущее исследование не работает.
    -
    0
    +
    Ответить
  • TIIIMOXAN
    больше года назад
    О чем пост? Где доказательства?
    -
    0
    +
    Ответить
  • Марал Гаипова
    137
    комментариев
    0
    читателей
    Марал Гаипова
    больше года назад
    Илья, сейчас не работает блог компании Реаспект, в котором было опубликовано исследование. Думаю, скоро починят и можно будет посмотреть.
    -
    0
    +
    Ответить
  • Антон Шабан
    18
    комментариев
    0
    читателей
    Антон Шабан
    больше года назад
    Очень жду когда починят блог, тоже хотелось бы почитать предыдущее исследование.
    -
    0
    +
    Ответить
  • иван
    больше года назад
    а где ссылка на сервис то?
    -
    0
    +
    Ответить
  • Марал Гаипова
    137
    комментариев
    0
    читателей
    Марал Гаипова
    больше года назад
    Антон Шабан, написали ребятам в Реаспект, ждем)
    -
    0
    +
    Ответить
  • Андрей Пунегов
    1
    комментарий
    0
    читателей
    Андрей Пунегов
    больше года назад
    Илья, спасибо за интерес. Блог подняли) В открытый доступ пока ничего выкладывать не планируем. Рустем сейчас в отпуске уже, а в статье хотел поделиться в первую очередь мыслями и принципами оценки. Пишите Рустему, вернется к началу октября - ответит.
    -
    0
    +
    Ответить
  • nogval
    больше года назад
    TIIIMOXAN, Пост о том как еще можно оценивать доноров. Сервис оценивает доноров по 2 основным метрикам, причем один из них развернуто описан в мадридском докладе (классификатор SEOtext). Прочитайте мадридский доклад Яндекса (2009 год), там много интересных вещей написано. :) Доказательства частично описаны в предыдущем исследовании (ссылка в посте, не могу оставить ссылку).

    Это просто один из методов отбора ссылочных доноров. Можно также изменить форм...
    TIIIMOXAN, Пост о том как еще можно оценивать доноров. Сервис оценивает доноров по 2 основным метрикам, причем один из них развернуто описан в мадридском докладе (классификатор SEOtext). Прочитайте мадридский доклад Яндекса (2009 год), там много интересных вещей написано. :) Доказательства частично описаны в предыдущем исследовании (ссылка в посте, не могу оставить ссылку).

    Это просто один из методов отбора ссылочных доноров. Можно также изменить формулу в свою сторону, оценивая также страничные факторы и расставив при этом к каждой метрике свои коэффициенты.
    -
    0
    +
    Ответить
  • zero50x
    больше года назад
    Легко накрутить алгоритм просто увеличив количество внешних ссылок на википедию и СМИ :))
    -
    0
    +
    Ответить
  • nogval
    больше года назад
    zero50x, а теперь найдите доноров в популярных ссылочных биржах, которые накручивают этот алгоритм. :)
    -
    0
    +
    Ответить
  • Илья
    больше года назад
    Спасибо, всем кто отреагировал на мой коммент о нерабочей ссылке, оказывается я это исследование уже видел)) Но все равно спс!

    zero50x, при чем тут вики и СМИ? В формуле ведь учитываются анкоры ссылок, а не их акцепторы...

    И еще вопрос: получается исходя из формулы брендовые ссылки типо "supershop" и ссылки типа "www.somesite.com" (без http) будут отнесены к  CAnch, верно я понял? Но это не до конца соответствует действит...
    Спасибо, всем кто отреагировал на мой коммент о нерабочей ссылке, оказывается я это исследование уже видел)) Но все равно спс!

    zero50x, при чем тут вики и СМИ? В формуле ведь учитываются анкоры ссылок, а не их акцепторы...

    И еще вопрос: получается исходя из формулы брендовые ссылки типо "supershop" и ссылки типа "www.somesite.com" (без http) будут отнесены к  CAnch, верно я понял? Но это не до конца соответствует действительности..
    И вопрос на тему "спалить тему": откуда выгружаете анкоры - ahrefs, opensiteexp, majestic или чтото другое?

    Ну а мысль очень толковая, как я уже говорил, спасибо!
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
14
комментариев
0
читателей
Полный профиль
Михаил Мухин - Здравствуйте! 1-2. Считает стенд. Ссылка на него дана, но могу повторить: online.p-c-l.ru/competition/task/card/id/106. Нажмите на кнопку "Начать" и заранее приготовьте прогноз бюджета Яндекс. Суть расчета: перебор комбинаций всех ставок на всех фразах, построение бюджетных когорт - бюджетов с одинаковым СРС, отбор в каждой когорте бюджета с максимальным количеством кликов и ..., да упорядочивание этих бюджетов по мере возрастания СРС, причем берем не все, а с фиксированным шагом. 3. Гугл считается через поправочные коэффициенты. Мы перевариваем океан данных и представляем их. На удивление, получается не менее, хотя и не более точно, как и прогноз Яндекс. Конечно, нужно понимать, что это очень примерные прикидки, фактически перевод неточного прогноза Яндекс в удобочитаемую форму, не больше. Самое интересное начинается, когда применяешь метод бюджетных когорт к измерению показателей фраз на реальной рекламной кампании в режиме 48х7. Первые результаты очень хорошие. Если хотите присоединиться к бесплатному тестированию, напишите Эльвире r-support@r-broker.ru. В теме укажите "хочу присоединиться к тестам Умного управления рекламой"
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
5
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Дмитрий Сульман
4
комментария
0
читателей
Полный профиль
Дмитрий Сульман - Все верно, об этом я и говорю. У крупных компаний есть много данных и они имеют доступ к дорогим технологиям и решениям для персонализации контента. Топовые западные сервисы для персонализации, такие как RichRelevance или Dynamic Yield, стоят от нескольких тысяч до десятков тысяч долларов в месяц. Понятно, что малый бизнес не может себе этого позволить. Да даже если бы чисто теоретически и мог, то это вряд ли бы имело хоть какой-то смысл. Во-первых, у малого бизнеса недостаточно данных, чтобы подобные алгоритмы персонализации начали эффективно работать, а во-вторых, тот профит, который МСБ получит от персонализации, никогда не покроет таких расходов. Мы же предлагаем решение, доступное как раз для малого и среднего бизнеса. При этом наше решение комплексное: МультиЧат - это одновременно и инструмент для персонализации, и для коммуникации.
Как вывести сайт в ТОП 10 Google в 2019 году
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Интересная статья. Подскажите на каких ресурсах расположить ссылки бесплатно по автобезопасности? Наш сайт bastion-center.ru/
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
10 элементов сайта, которые гарантированно отпугнут посетителей
Андрей
2
комментария
0
читателей
Полный профиль
Андрей - Ну типа потому что клиентское seo больше для коммерции предназначено. Типа контентники и сами знают что делать. В коммерции можно тысячу причин найти чтобы поработать с сайтом, а с контентными такие фокусы уже не прокатят, поэтому и не пишут. Всё продвижение для контентников сеошники описывают в трех словах: скорость, качество, систематичность. А, ну ещё конечно же СЯ, как же я про него забыл (фундамент жеть!).
Как удвоить выручку за счет продвижения в поиске. Кейс coffee-butik.ru
Максим Боровой
2
комментария
0
читателей
Полный профиль
Максим Боровой - Последний вопрос (извиняюсь за количество) - почему на "В корзину" стоит Nofollow. Осознанно для распределение весов?
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
363
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
83
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!