×
Россия +7 (495) 139-20-33

Как определить семантичен ли поисковик?

Россия +7 (495) 139-20-33
Шрифт:
2 3841

В последнее время понятие «семантический поисковик» стало настолько часто употребляться, что неизбежно границы этого понятия размылись. В этой статье приведен перевод выдержек из доклада исполнительного вице-президента Отдела поиска и ответов Ask.com Томаша Имелински. В докладе, который будет полностью прозвучит только осенью 2009 года, он предлагает несколько условий, по которым можно определить, насколько поисковик понимает запросы пользователей и может считаться семантическим.

Представим четырехлетнего ребенка в качестве поисковика...

Предположим, что поисковые системы обладают интеллектом четырехлетнего ребенка. В таком случае представим такой диалог

Пользователь: Как погодка в Москве?

Поисковик: Я не знаю.

Пользователь: Какая сейчас погода с Москве?

Поисковик: Я не знаю!

Пользователь: OK. Погода Москва.

Поисковик: И сколько раз нужно задавать один и тот же вопрос? Я же сказал, понятия не имею.

Несмотря на то, что этот поисковик совершенно не знает, какая погода сейчас в Москве, он все равно семантический, потому что он знает, что не знает о погоде. И к тому же он понимает, что пользователь продолжает задавать один и тот же вопрос, просто в разных формулировках.

Люди очень быстро понимают, что два вопроса могут быть разными формулировками одного и того же. А вот поисковые системы обычно это не понимают. И до тех пор, пока они этого не понимают, они не могут называться семантическими. Поэтому запросы «Топ-10 песен» и «десять лучших песен» выводят различные, но практически равнозначно релевантные результаты. Хотя поисковики не должны этого делать.

Это не технологии, которые вы используете, а результат, которого вы достигаете...

Отражением семантичности поисковика можно считать уровень изменения результатов при перефразировании одного и того же запроса. Чем сильнее они отличаются, тем меньше возможности назвать этот поисковик семантическим.

Не имеет значения, каким образом достигается неизменность результатов при переформулировке запроса, т.е. не важно, какая используется технология (обработка натурального языка, статистический анализ серии запросов). Важен результат. Если результаты изменяются сильно, это означает, что пользователям приходится больше думать, чтобы правильно сформулировать свой запрос. А это означает, что поисковые системы плохо выполняют свою работу. Они не стараются сделать процесс поиска для пользователя проще.

Мы предполагаем, что с помощью нескольких показателей, измеряющих изменения результатов, выдаваемых поисковой системой на переформулированный запрос, можно определить уровень семантичности поисковика. Например, к таким показателям можно отнести изменение положения на странице выдачи результатов единственно правильного ответа или изменение порядка всех результатов при переформулировании запроса.

Выводы

  1. В большинстве поисковиков результаты сильно изменяются от вида запроса. Современные поисковики все еще сильно зависят от формулировок запроса. В большинстве своем они основаны на ключевых словах, и далеки от понимания человеческого языка запросов.
  2. Поисковые запросы с единственно возможным вариантом ответа (В каком году родился Гагарин?) хорошо воспринимаются поисковыми системами. Ответы на них на удивление мало отличаются при изменении порядка слов или переформулировке поискового запроса. Но скорее всего это заслуга не поисковиков, а Интернета, а, точнее, большого количества информации во всемирной сети, ее переписывании в различных вариантах от сайта к сайту, особенно информации на популярные темы. Это помогает поисковым системам найти правильный ответ опять же по ключевым словам.

По-настоящему семантический поисковик заботится о неизменяемости результатов при переформулировании запросов. Он собирает в одном кластере все возможные варианты одного и того же по смыслу запросу, чтобы предоставить одинаковые результаты, касающиеся как запросов на популярные, так и на нераспространенные темы.

Данные, которые мы собрали, подтверждают, что среди основных поисковиков даже простые перефразирования сильно изменяют результаты выдачи. Например, изменение числового написания «10» на текстовое «десять» меняет результаты в зависимости от варианта написания, которое присутствует на веб-странице. Также результаты меняются от добавления лишнего слова в запрос.

Ключевые слова, используемые в запросе, их порядок, сильно влияют на ранжирование результатов на странице выдачи. Это неприемлемо при семантическом поиске, задачей которого является снятие с пользователя тяжести «правильной формулировки запроса» для получения правильного ответа.


Оригинал статьи


(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • terehoff
    2
    комментария
    0
    читателей
    terehoff
    больше года назад
    Ачто в ваitv понимании пертинентность?
    -
    0
    +
    Ответить
  • Юлия Вронская
    0
    комментариев
    0
    читателей
    Юлия Вронская
    больше года назад
    релевантность) а почему возник вопрос?
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Кейс: как за 30 дней вывести новый сайт в ТОП выдачи Google
Сергей
2
комментария
0
читателей
Полный профиль
Сергей - Прошёл у Паши курс год назад, пытался продвигать свой сайт portativ.org.ua, но особых продвижений нет. Наверное сео уже умерло??
Облако тегов в интернет-магазине: прикладная инструкция по увеличению трафика
Юлия Дмитриева
2
комментария
0
читателей
Полный профиль
Юлия Дмитриева - Согласна с вами, что в любом деле важен индивидуальный подход:)
Специалисты в Рунете заметили глобальную накрутку поведенческих факторов
Дмитрий Кулаевский
1
комментарий
0
читателей
Полный профиль
Дмитрий Кулаевский - кто-нибудь знает как с этим бороться? очень много такого трафа идёт с июля, сайт сильно просел
Как стандартизировать данные семантики с помощью логарифмов
Юлий
1
комментарий
0
читателей
Полный профиль
Юлий - Чем снималась коммерцелизация?
Яндекс возобновил «показательные порки» за накрутку поведенческих факторов
Антон
1
комментарий
0
читателей
Полный профиль
Антон - Никакой не выпал. Кроме клиентского сайта, который проседал из-за скрутки, о чем Я.Поиску сообщали и клиенту тоже. Ноль реакции от поисковика (продолжайте развивать сайт, никаких проблем нет ...). Клиенту надоело и он заказал накрутку у подрядчиков. Мы искренне ждали бана, сообщали об этом клиенту, т.к. мы все таки делаем все остальное для развития. Как итог: с лета полет нормальный. Сайт растет, никаких проблем. Случайно даже стажер палил тех поддержке факт использования накрутки. И ничего. Сайт растет дальше. Если они не могут ничего принять даже после признания факта накрутки, что они могут сделать с жалобами на накрутку конкурентов?! Никогда не одобряли данные методы, но ... похоже ... все работает :)
От количества к качеству: что происходит с рекламой в Рунете
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Истину глаголите!
Михаил Ляшенко (PostMarket): о рынке инфлюенс-маркетинга и рекламе у блогеров
Григорий Романченко
1
комментарий
0
читателей
Полный профиль
Григорий Романченко - Неудивительно, что все хвалят PostMarket, это действительно достойный сервис, недавно стали через них продвигать свой продукт, результаты есть, продажи выросли на 40% и это только начало.
«Нет в наличии»: что делать с карточками отсутствующего товара
freyr energy
1
комментарий
0
читателей
Полный профиль
freyr energy - Thank you so much @ admin for share your valuable thoughts and ideas We always enjoy your articles its inspired a lot by reading your articles day by day. So please accept my thanks and congrats for success of your latest series. We hope, you should published more better articles like ever before solar rooftop
15 языков программирования, за знание которых платят выше среднего
Любомир
2
комментария
0
читателей
Полный профиль
Любомир - Ну и ЗП: ни слова о том что она варируеться от 0 до 100 000$ в год!!! Что до высокой зп надо несколько лет етим заниматся! Что 100 000$ в год на западе заробатывают, а где нибудь в азиатских страннах 100$ в год. В СНГ первые годы в разработчика ЗП как в грузчика на складе - это где то 4-5 тыс. долларов в год, и уже имея несколько лет опыта возможно дойти до 10-20 тыс. долларов в год! Почему нет конкретики? Меня лично нервирует то что людям внушают великие ЗП в АйТи, а люди тупые и ведутся!!!!
Яндекс тестирует оценки сайта в сниппете
Сергей Демин
8
комментариев
0
читателей
Полный профиль
Сергей Демин - вопрос такой: где получить оценку о сайте? а не об организации
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
384
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
113
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
92
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
60
Комментариев
59
Комментариев
57

Отправьте отзыв!
Отправьте отзыв!