Рекламные кампании для вашего бизнеса
Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:

Как поисковые системы отличают запросы пользователей и ботов?

Россия +7 (495) 960-65-87
Шрифт:
0 4238

Не всегда поисковыми системами пользуются люди, которые ищут информацию. Иногда к поисковым системам интернета обращаются роботы, которые хотят собрать данные о позициях определенных страниц, исследовать ключевые слова или сделать максимальное количество кликов по результатам выдачи или контекстной рекламе, чтобы насолить конкурентам.

Такие роботы расходуют ресурсы поисковых систем и могут получить данные о пользователях, которые используются поисковиками для работы над алгоритмом ранжирования и формированием поисковых подсказок.

Google ещё давно попросил вебмастеров не использовать автоматические программы, которые добавляют страницы или проверяют позиции. «Такие программы нарушают правила использования поисковой системы и перегружают сервера».

Поэтому многие поисковые системы разработали принципы, по которым они отличают запрос человека от запроса робота. Недавно Microsoft опубликовал заявление на патент метода, который будет классифицировать трафик на пользовательский и полученный от автоматических программ в зависимости от некоторых характеристик запроса. Это заявление позволяет сказать, какие параметры используют поисковые системы, чтобы разграничивать два типа запросов.

Когда поисковая системы отслеживает запросы, она собирает большое количество информации о пользователях. Например, такая информация может включать, как сами ключевые слова, так и метаданные, связанные с ними:

  • Цепочки поисковых запросов.
  • Страницы результатов.
  • Место, где вводился запросы.
  • IP-адрес.
  • Уникальный идентификатор пользователя или программы.
  • Время введения запроса.

Определить, был ли задан запрос пользователем или роботом, поисковая система может, основываясь на двух группах факторов: физических параметрах запроса и его поведенческих характеристиках.

Физические параметры запросов пользователей

Один из способов узнать, кем был задан запрос, это отследить некоторые физические характеристики запроса.

Объем. Пользователи могут сделать только лимитированное количество запросов за определенный отрезок времени. Скорее всего вводящий 100 запросов за 10 секунд не человек. И тем более, если этот пользователь искал запрос «голые девочки» 12 тысяч раз в течение дня.

Месторасположение. Довольно-таки тяжело одному человеку находиться сразу в нескольких местах. А поисковая система может зафиксировать, когда пользователь с одним и тем же ID печатает запросы из разных, сильно удаленных друг от друга городов. Использовать несколько компьютеров для поиска в Интернете — дело обычное, только если эти компьютеры не разделены океаном или несколькими тысячами километров. В таком случае, поисковая система определяет ботнет или пользователя, использующего инструмент для анонимного поиска и не отключившего cookie.

Поведенческие характеристики

По физическим параметрам можно определить автоматические запросы. Но эти автоматические запросы также могут быть настроены так, чтобы они напоминали запросы, сделанные обычным пользователем.

Поэтому существует поведенческие характеристики, по которым возможно понять, что запросы автоматически сгенерированы. Ниже перечислены модели, по которым Microsoft в своем заявлении на патент собирается распознавать, кем был задан запрос.

CTR

Люди после введения поискового запроса обычно кликают на один или несколько результатов. Обычно это один клик на каждые десять результатов. В то время как автоматические программы не нажимают на результаты поиска, поэтому это может быть сигналом для поисковой машины. Некоторые боты к тому же собирают дополнительную информацию о некоторых урлах, поэтому существует несколько моделей, по которым может определяться активность ботов:

  • Бот, который не кликает на ссылки.
  • Бот, который кликает на каждую ссылку.
  • Бот, который кликает только на целевые ссылки.

Боты ищут в алфавитном порядке (иногда)

Вряд ли обычные пользователи, набирая серию запросов, распределяют их в алфавитном порядке. Поэтому такая модель выдаёт использование автоматических программ.

Боты ищут, используя спамовые слова

Некоторые запросы характеризуются высокой заспамленностью и употреблением спам-слов,. Поэтому если с одного ID задаётся большое количество вопросов со спамом, вероятнее всего это запросы бота. То же самое касается запросов, которые содержат обращение к adult-тематике.

Слишком большое количество слов

Запросы, которые содержат чрезмерное количество слов, не характерны в большом количестве для обычных пользователей. Другое, что может настораживать по поводу запросов большой длины, что они следуют друг за другом цепочкой, которая содержит примерно одинаково большое количество слов в разных запросах.

Периодичность запросов

Время, которое проходит между запросами одного пользователя, может измеряться. Это потом позволяет определить среднее время между запросами или время, которое проходит от введения запроса до клика по определенному результату. С помощью модели, построенной таким образом, возможно распознать запросы от пользователей и от ботов

Использование операторов запросов

Большое количество поисковых запросов, в которых используются операторы поиска (например, «allintitle:» и «allinurl;») исходят от автоматических программ.

Лимитированность категорий

Существует вероятность, что запросы были сделаны ботом, если вся цепочка запросов принадлежит к одной или нескольким узким категориям.

***

Здесь перечислены не все методы, которые описаны в заявке на патент. В документе описано, что сервис может классифицировать запросы в зависимости от того, из какого источника поступают запросы. Но не объясняется, каким образом эта классификация используется.

Когда поисковой системе серия запросов кажется подозрительной, она просит пользователя ответить на вопрос или расшифровать CAPTCHA, которая именно для этих целей и создана.

Оригинал статьи


internet-dlya-biznesa
Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
23 действительно эффективных совета по продвижению интернет-магазина
Гость - Троль Гуру паНгинации - Что такое паНгинация?))))
Конкурс: угадайте пятерку лидеров рейтинга «SEO глазами клиентов 2016»
Марина
1
комментарий
0
читателей
Полный профиль
Марина - Ingate i-Media SEO.RU Netpeak 1PS.RU
Анализ ссылок: сравнение многофункциональных платформ по размеру их баз
Михаил - Хватит пениться на каждый аргументированный отзыв. Это не придает вашей компании чести.
Как создать интернет-магазин: сколько стоит открытие?
Гость - да у битрикса что ни обновление - то сплошные баги. недавно знакомый обновился на лицензии интернет-магазина, про***лись заказы за последнюю неделю, слетели все связи по складам. одним словом, жопа. при этом обновился на сразу, а спустя месяц после выкатывания, надеялся, успеют все поправить
Как упростить продвижение вечными ссылками?
Coursh - Зарегестрировался. Накинули 1100 рубликов за пополнение на 10к. Очень неплохо!
Вопрос недели: почему сайт хорошо ранжируется в Google и не интересует Яндекс?
Nina S.Dzh. - У вас достаточно конкурентная тематика для рунета и по главной странице домена расположена англоязычная версия. Полагаю, в этих двух фактах вся проблема. Поскольку Яндекс в данном случае считает английскую версию сайта приоритетной, а среди ваших конкурентов в выдаче достаточно много хороших русскоязычных сайтов, то он и не ранжирует ваш сайт высоко. Грубо говоря, ему есть что предложить пользователю и без вашего сайта. На мой взгляд, в данном случае версии нужно разводить по разным доменам, русскую вешать на RU и продвигать там.
Кому и зачем нужен маркетплейс от Яндекса
Дарья Калинская
0
комментариев
0
читателей
Полный профиль
Дарья Калинская - Максим, спасибо, рада, что статья оказалась полезной )
Конкурс: угадай победителя рейтинга «Известность бренда SEO-компаний»
Андрей
1
комментарий
0
читателей
Полный профиль
Андрей - Оптимизм Дэмис Кокос Ашманов и Партнеры Раш эдженси
ТОП-10 автоматизированных сервисов контекстной рекламы
Жанна Рожкова
155
комментариев
0
читателей
Полный профиль
Жанна Рожкова - Научитесь отличать рекламу от PR-активности. Если следовать вашей логике, на этом сайте (и на всех остальных информационных ресурсах в принципе) кроме рекламы ничего и нет. Так что насчет статьи от понимающего эксперта? Будем рады, если подготовите
Экспериментальное SEO: «Дырявые носочки панды»
Adrian - Испания и Португалия находятся в Европе и участвовали в чемпионате Европы. Одна из этих стран даже стала победителем. А Южная и Центральная Америка здесь при том, что там разговаривают на испанском и португальском языках. Сына, учите географию.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
285
Комментариев
262
Комментариев
200
Комментариев
171
Комментариев
155
Комментариев
137
Комментариев
123
Комментариев
97
Комментариев
97
Комментариев
93
Комментариев
80
Комментариев
70
Комментариев
67
Комментариев
60
Комментариев
55
Комментариев
52
Комментариев
49
Комментариев
45
Комментариев
44

Отправьте отзыв!
Отправьте отзыв!