Как определить семантичен ли поисковик?

Россия+7 (495) 960-65-87
Шрифт:
2 2440

В последнее время понятие «семантический поисковик» стало настолько часто употребляться, что неизбежно границы этого понятия размылись. В этой статье приведен перевод выдержек из доклада исполнительного вице-президента Отдела поиска и ответов Ask.com Томаша Имелински. В докладе, который будет полностью прозвучит только осенью 2009 года, он предлагает несколько условий, по которым можно определить, насколько поисковик понимает запросы пользователей и может считаться семантическим.

Представим четырехлетнего ребенка в качестве поисковика...

Предположим, что поисковые системы обладают интеллектом четырехлетнего ребенка. В таком случае представим такой диалог

Пользователь: Как погодка в Москве?

Поисковик: Я не знаю.

Пользователь: Какая сейчас погода с Москве?

Поисковик: Я не знаю!

Пользователь: OK. Погода Москва.

Поисковик: И сколько раз нужно задавать один и тот же вопрос? Я же сказал, понятия не имею.

Несмотря на то, что этот поисковик совершенно не знает, какая погода сейчас в Москве, он все равно семантический, потому что он знает, что не знает о погоде. И к тому же он понимает, что пользователь продолжает задавать один и тот же вопрос, просто в разных формулировках.

Люди очень быстро понимают, что два вопроса могут быть разными формулировками одного и того же. А вот поисковые системы обычно это не понимают. И до тех пор, пока они этого не понимают, они не могут называться семантическими. Поэтому запросы «Топ-10 песен» и «десять лучших песен» выводят различные, но практически равнозначно релевантные результаты. Хотя поисковики не должны этого делать.

Это не технологии, которые вы используете, а результат, которого вы достигаете...

Отражением семантичности поисковика можно считать уровень изменения результатов при перефразировании одного и того же запроса. Чем сильнее они отличаются, тем меньше возможности назвать этот поисковик семантическим.

Не имеет значения, каким образом достигается неизменность результатов при переформулировке запроса, т.е. не важно, какая используется технология (обработка натурального языка, статистический анализ серии запросов). Важен результат. Если результаты изменяются сильно, это означает, что пользователям приходится больше думать, чтобы правильно сформулировать свой запрос. А это означает, что поисковые системы плохо выполняют свою работу. Они не стараются сделать процесс поиска для пользователя проще.

Мы предполагаем, что с помощью нескольких показателей, измеряющих изменения результатов, выдаваемых поисковой системой на переформулированный запрос, можно определить уровень семантичности поисковика. Например, к таким показателям можно отнести изменение положения на странице выдачи результатов единственно правильного ответа или изменение порядка всех результатов при переформулировании запроса.

Выводы

  1. В большинстве поисковиков результаты сильно изменяются от вида запроса. Современные поисковики все еще сильно зависят от формулировок запроса. В большинстве своем они основаны на ключевых словах, и далеки от понимания человеческого языка запросов.
  2. Поисковые запросы с единственно возможным вариантом ответа (В каком году родился Гагарин?) хорошо воспринимаются поисковыми системами. Ответы на них на удивление мало отличаются при изменении порядка слов или переформулировке поискового запроса. Но скорее всего это заслуга не поисковиков, а Интернета, а, точнее, большого количества информации во всемирной сети, ее переписывании в различных вариантах от сайта к сайту, особенно информации на популярные темы. Это помогает поисковым системам найти правильный ответ опять же по ключевым словам.

По-настоящему семантический поисковик заботится о неизменяемости результатов при переформулировании запросов. Он собирает в одном кластере все возможные варианты одного и того же по смыслу запросу, чтобы предоставить одинаковые результаты, касающиеся как запросов на популярные, так и на нераспространенные темы.

Данные, которые мы собрали, подтверждают, что среди основных поисковиков даже простые перефразирования сильно изменяют результаты выдачи. Например, изменение числового написания «10» на текстовое «десять» меняет результаты в зависимости от варианта написания, которое присутствует на веб-странице. Также результаты меняются от добавления лишнего слова в запрос.

Ключевые слова, используемые в запросе, их порядок, сильно влияют на ранжирование результатов на странице выдачи. Это неприемлемо при семантическом поиске, задачей которого является снятие с пользователя тяжести «правильной формулировки запроса» для получения правильного ответа.


Оригинал статьи


Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • terehoff
    2
    комментария
    0
    читателей
    terehoff
    больше года назад
    Ачто в ваitv понимании пертинентность?
    -
    0
    +
    Ответить
  • Юлия Вронская
    0
    комментариев
    0
    читателей
    Юлия Вронская
    больше года назад
    релевантность) а почему возник вопрос?
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Рейтинг «Известность бренда SEO-компаний 2017»: народное голосование
Иван
1
комментарий
0
читателей
Полный профиль
Иван - 1) IT-Agency 2) Пиксели 3) 1ps 4) Ингейт 5) Нетпики
«Баден-Баден»: как выйти из-под фильтра
Сергей Дембицкий «Sima-Land.ru»
17
комментариев
0
читателей
Полный профиль
Сергей Дембицкий «Sima-Land.ru» - Скрины Метрики показывать не буду, но мы (sima-land.ru - 1,5 млн. стр. в поиске Яндекс) в сентябре загремели под ББ, в разгар сезона и вышли из-под фильтра, спустя 50 дней, удалив все тексты с сайта: категории + карточки товаров (описание). Трафик с Google только вырос. Тексты возвращать собираемся, но процесс будет длительный, тексты будем теперь писать исключительно полезные, т.к. было больно :-))
Второе дыхание ссылочного продвижения
Автопилот
14
комментариев
0
читателей
Полный профиль
Автопилот - Еще лучше, когда продвижение осуществляется комплексно :)
«Прямая линия» с Александром Алаевым («АлаичЪ и Ко»): отвечаем на вопросы
Александр Алаев
13
комментариев
0
читателей
Полный профиль
Александр Алаев - Роман. Тут ответ очень простой. Каждый запрос можно четко разделить на коммерческий или некоммерческий. "Купить слона" и его длинные хвосты - коммерческий. "Как выбрать слона" и подобные - информационные. Вот под коммерческие ключи должны быть страницы услуг или каталога товаров. А под информационку - блог. Очень важно не путать их, тем более несоответствующая коммерческим факторам страниц просто не продвинется, то есть по запросу с "купить" блог никогда не будет показываться в выдаче, так же как и страница услуги/товаров не покажется по "как выбрать". Понятно примерно?
Кейс: продвигаем бизнес по продаже пластиковых окон в Москве
Иван Стороженко
5
комментариев
0
читателей
Полный профиль
Иван Стороженко - 1. По началу вообще не использовали, сейчас уже много каналов используется. 2. Все может быть, в принципе сайты должны быть удобны для пользователя, для этого и нужна схожесть между собой. Честно говоря старались брать все самое интересное у конкурентов + подкреплять своими идеями.
Западные специалисты выяснили, как повысить позиции ресурса в выдаче Google
Максим Мирошник
2
комментария
0
читателей
Полный профиль
Максим Мирошник -
Инфографика: самые распространенные SEO-ошибки Рунета
Dmitro Grunt
2
комментария
0
читателей
Полный профиль
Dmitro Grunt - Кстати, у проектов которые продвигает Нетпик все тайтлы не более 65 символов? Или вы надеетесь что кто то послушает советов и отдаст вам часть трафика? :-)
Как бесплатно публиковать гостевые посты без миралинкс и бирж ссылок
Liliya
1
комментарий
0
читателей
Полный профиль
Liliya - Лично для меня черный гостевой постинг со всеми этими биржами ссылок (таких как www.miralinks.ru и sponsoredreviews.com... ) давно уже в прошлом. Белый постинг имеет на много больше преимуществ, перечислять их конечно же не буду... А вообще, хотела поблагодарить за Ваш онлайн-калькулятор, действительно ускорил мне работу, а еще он удобный и быстрый в использовании.
День рождения SEOnews: 12 лет в эфире!
Анна Макарова
314
комментария
0
читателей
Полный профиль
Анна Макарова - Ура )
Сердитый маркетолог: как вы сами хороните свой сайт, или 16 принципов, которые нужно усвоить заказчикам SEO
Анна Макарова
314
комментария
0
читателей
Полный профиль
Анна Макарова - Artem Sergeev, ваш комментарий удален за агрессивный настрой и безосновательные обвинения. Держите себя в руках!
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
314
Комментариев
262
Комментариев
229
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
78
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
54
Комментариев
52
Комментариев
49

Отправьте отзыв!
Отправьте отзыв!