×
Россия +7 (495) 139-20-33

Как поисковые машины могут расшифровывать аббревиатуры в запросах

Россия +7 (495) 139-20-33
Шрифт:
0 3683

Когда пользователи поисковых машин используют аббревиатуры или их расшифровки, то они могут пропустить некоторые довольно важные страницы.

Например, поищите в Yahoo [NASA Moon bombing] (бомбардировка луны NASA) и сравните результаты с выдачей по запросу [National Aeronautics and Space Administration moon bombing] и вы увидите огромную разницу.

А должны ли быть эти результаты одинаковыми? NASA и National Aeronautics and Space Administration это одна и та же организация. С другой стороны, NASA также является аббревиатурой для:

  • North American Saxophone Alliance.
  • National Auto Sport Association.
  • National Association of Students of Architecture.

Кроме того, существует гора Nasa в Швеции, и там же расположена серебряная шахта Nasa. Есть шведская музыкальная группа с таким названием, исполнитель хип-хопа с таким именем, DJ и народность Nasa в Колумбии.

Как поисковая машина должна обращаться с аббревиатурами в запросах? Должна ли она расшифровывать аббревиатуры для улучшения поисковых результатов? Если страница имеет высокий рейтинг по запросу «National Aeronautics and Space Administration», но низкий по «NASA», то должна ли такая страница отображаться в поисковых результатах по термину содержащему NASA?

Именно подобные вопросы поднимаются в патенте Yahoo, опубликованном на прошлой неделе.

Обработка аббревиатур в веб-поиске
Изобретатели: Xing Wei, Fuchun Peng и Benoit Dumoulin
Принадлежит Yahoo
US Patent Application 20090259629
Опубликовано 15 октября 2009
Подано на рассмотрение 15 апреля 2008

Аннотация

Метод обработки аббревиатур в веб-запросах включает:

  • создание словаря множества возможных расшифровок потенциальных аббревиатур, связанных с ключевыми словами запроса полученного или ожидаемого поисковой машиной;
  • принятие запроса содержащего аббревиатуру;
  • расширение аббревиатуры в один из множества вариантов расшифровки аббревиатуры при вероятности корректности такого расширения выше установленной границы, где вероятность определяется с учетом контекста аббревиатуры в запросе, где в контекст включен хотя бы якорный текст;
  • отсылка запроса с расшифрованной аббревиатурой поисковой машине для генерации страницы поисковых результатов соответствующей запросу.

Одним из первых шагов, как мы видим, является ассоциация аббревиатур с их расшифровками. Это возможно реализовать при помощи анализа якорного текста, указывающего на страницы, и содержащего как аббревиатуры, так и их расшифровки. Например, если на одни и те же страницы стоят ссылки со словами «NASA» и «National Aeronautics and Space Administration», то в словарь может быть добавлена следующая строка:

  • NASA = National Aeronautics and Space Administration.

Но что тогда делать представителям Североамериканского Саксофонного Объединения (North American Saxophone Alliance), которые будут в ответ на запрос «NASA jazz competition» (состязание по джазу NASA) получать ссылки на проекты по освоению Луны? Возможно, словарь аббревиатур может содержать и информацию, полученную из других источников.

При расшифровке аббревиатур поисковой машине следует соблюдать осторожность. В патенте приводятся следующие примеры различного использования аббревиатуры/слова «aim»:

  • aim download — судя по всему, здесь «aim» является аббревиатурой «AOL instant messenger».
  • aim stock — в данном случае это явно сокращение «alternative investment market».
  • aim at improvement — а здесь «aim» используется просто как слово, а не аббревиатура.

Существует минимум три способа для поисковой машины узнать о наличии аббревиатуры:

  • Сессии запросов — Если человек искал «aim download» и не увидел релевантного результата, то он скорее всего перепишет запрос как «aol instant messenger download». Рассмотрение подобной информации в логах запросов поисковой машины может помочь в составлении словаря аббревиатур и получении информации об использовании аббревиатур в различных контекстах.
  • Якорный текст — Если на одни и те же страницы стоят ссылки с текстом в виде аббревиатуры и ее расшифровки, то между этими текстами можно отследить связь.
  • Логи кликов — Переходы людей на одну и ту же страницу со страниц поисковых результатов по различным запросам может означать, что запросы каким-то образом связаны между собой. Чем чаще подобное происходит, тем выше вероятность связи.

Все три метода основываются на участии людей. Проставление ссылок, выбор страниц в поисковых результатах или уточнение запросов во время поиска — все это делают люди. Вся информация доступна для поисковых машин и может быть использована для построения статистической модели, которая подскажет поисковой машине, когда стоит использовать расшифровку аббревиатуры.

Кроме всего вышеописанного, в патенте рассматриваются случаи возможной обработки различных сокращений вроде акронимов, инициальных аббревиатур, составных слов и т.п.

Когда поисковая машина обнаруживает подобное слово в запросе, она может поступить следующим образом:

  • Расширить запрос, чтобы включить страницы с аббревиатурой, страницы с расшифровкой аббревиатуры и страницы, содержащие оба написания.
  • Предложить пользователю провести поиск по расшифрованной аббревиатуре.
  • Проигнорировать расширенную версию и просто выдать результат поиска со страницами, содержащими аббревиатуру.

Выводы

Если вы что-то ищите и используете в поисковом запросе аббревиатуру, то неплохой идеей является повторение поиска с расшифрованной версией аббревиатуры. Особенно, если вам нужна как можно более полная информация по теме.

Если вы публикуете что-то в глобальной сети и используете в тексте аббревиатуры, то неплохо бы на той же странице использовать и расшифровку аббревиатуры. Плюс проверьте, что выдает поисковая машина на запрос с этой аббревиатурой.

Рассмотренный патент принадлежит Yahoo, но вполне возможно, что подобные идеи обсуждались или тестировались разработчиками и других поисковых машин.


Переводной материал, источник


(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Как выбрать CMS для интернет-магазина
demimurych
18
комментариев
0
читателей
Полный профиль
demimurych - Очередное волшебство, а не материал. все что ниже, сказано человеком который больше 20 лет своей жизни посвятил ковырянию исходных кодов систем. Битрикс по качеству кода и функциональности ровно такое же говно как и вордпресс. Заявить что он разрабатывается группой крутых программистов может только человек, который не знает что такое программирование. Единтсвенное отличие битрикса от вордпресса, это сертифицированнось на определенном локальном рынке. поставить Друпал в один ряд с вордпрессом, это видимо в продолжении предыдущей бугогашечки про крутых программистов в битриксе. тут важно отметить, что если битрикс и вордпресс являлись говном одного сорта весь цикл своего существования, то друпал имеет минимум 4 принципаильно разных кодовых базы. При этом даже самая примитивная из них - друпал 5 ветки, которому больше 12 лет, на голову выше текущих вп с битриксом вместе взятых. с точки зрения разработки - конечно. А не востребовтных на текущий момент плагинов. теория про разработку кода группой крутых программистов, не выдерживает никакой критики. достаточно просто оглянуться назад и увидеть, что в мире опенсорса есть как примеры эталонного говна - вордпресс, так и полная противоположность им типа РОР ставшего фактически во многом и на долго эталоном веб разработки. И это я еще ненапомнил автору о том, что есть такие вещи как питон, миникс и т.д. примеров качественного по в мире разработки открытым сообществом на порядки больше, чем наоборот. и тому есть ряд очень простых обьяснений. первое из которых, никто вам не даст просто так закомитить в ядро любой свой говнокод. даже в вордпресе. словом, информация в статье, как и ее выводы - это из области работы со своим воображением, чем с текущей ситуацией на рынке.
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
18
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
Тест по SEO – проверь свой уровень знаний
Артем Дорофеев
8
комментариев
0
читателей
Полный профиль
Артем Дорофеев - Полный текст вопроса со скриншотом панели прикладываю. Итого, что имеем: - на скриншоте отмечено, что это фильтр МПК - сайт коммерческий - рекламы на сайте нет С вероятностью 95% это ошибка (которая уже дважды случалась в Яндексе), когда они случайно "закосили" неповинные сайты. Тогда по запросу Платону фильтр быстренько снимали. Но вопрос даже не на знание этого нюанса. В любой непонятной ситуации, прежде чем что-либо предпринимать (особенно переписывать весь контент на сайте или менять дизайн, как указано в других вариантах) - фильтр следует подтвердить. Правильный ответ: "Написать письмо в техподдержку Яндекса".
Автоматические SEO-аудиты: как напугать некорректными выводами
Trydogolik
25
комментариев
0
читателей
Полный профиль
Trydogolik - спасибо
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Trydogolik
25
комментариев
0
читателей
Полный профиль
Trydogolik - К мифу 1 добавлю Google optimize optimize.google.com Удобен для сотрудников со спец. знаниями и без них. Подмена контента настраивается за счет многих вариантов страниц и условий настроек распределения трафика. Варианты страниц можно легко создать копипастом. На мой взгляд удобно и бесплатно. Тот же Calibri и программисты в любом случае, пусть не за это, но где-то берут свою комиссию. (чисто мое мнение). В качестве цены отдаешь такой ресурс как личное время и копейки за внесение двух первоначальных изменений в html шаблон страниц. Но если ваша digital-кампания имеет совесть то оплата максимум час, а то и бесплатно. Интернет-маркетолог сам должен уметь это делать. Все просто + подробную инструкцию прилагают на языке пользователя. + за поддомены платить не надо, они вообще не нужны. + взаимодействие с: - Google Ads; - Google Tag; - Google Analytics просто прекрасно отслеживается по всем вариантам параллельно. Это помогает до деталей нарисовать профиль ЦА по любому "кредиту - отдельно на машину и отдельно на бизнес". Что с аналитикой у Calibri на этот счет? Сам с Calibri не разу не работал, всегда работаю с первоисточником. + к мифу 3 в том что это и есть детище поисковой системы и рекламного инструмента. Яша тоже спокоен будет так как сам везде навязывает Турбо-страницы (считаю их не удобными).- Как "-" (минус) вижу то, что может повлиять на скорость загрузки сайта. Но если у вас не конструктор, а темболее Landing Page, то о скорости можно не волноваться. Но это чисто мое мнение. В остальном согласен с автором.
7 способов увеличить авторитетность сайта «в глазах» поисковых систем
Grigo5
4
комментария
0
читателей
Полный профиль
Grigo5 - Понятно.
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
100+ ресурсов по SEO для изучения поисковой оптимизации с нуля
Марина Ибушева
59
комментариев
0
читателей
Полный профиль
Марина Ибушева - Спасибо за добавление. Мы уже работаем над отдельным материалом про курсы, потому что одной статьи мало, чтобы охватить все крутое по обучению)
Digital-разговор: Михаил Шакин про SEO, Google и заработок в интернете
Анна Макарова
372
комментария
0
читателей
Полный профиль
Анна Макарова - Подготовим ) Пока предлагаю почитать интервью с Денисом Нарижным из той же серии. Там стенограмма =) www.seonews.ru/interviews/digital-razgovor-denis-narizhnyy-pro-ukhod-iz-seo-i-zarabotok-na-partnerkakh/
Digital-разговор: Денис Нарижный про уход из SEO и заработок на партнерках
Юлия Штерн
2
комментария
0
читателей
Полный профиль
Юлия Штерн - "Среднее агентство зарабатывает примерно 100-150 тыс. рублей в месяц" - а сколько сотрудников в среднем агентстве всего на полной ставке?
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
372
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
139
Комментариев
121
Комментариев
111
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
86
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
59
Комментариев
57

Отправьте отзыв!
Отправьте отзыв!