После «Магадана» Яндекс лучше усваивает морфологию русского языка

Россия+7 (495) 960-65-87
Шрифт:
2 2208

логотип ЯндексаЯндекс продолжает раскрывать механизмы работы уже вошедшей в историю поисковой программы Магадан.
Еще в своем первом отчете по новому алгоритму яндексоиды рассказали о том, что поиск Яндекса стал понимать аббревиатуры и транслитерацию.

Теперь же команда поисковика рассказывает подробно и поэтапно о том, как именно происходит ранжирование результатов поиска по таким запросам.

До Магадана Яндекс учитывал морфологию русского языка лишь по двум типам отношений:
а) словоизменительному – т.е. изменение форм слова, например, по падежам, числу: «маме», «мамой», «маму», «мамы» – формы слова «мама»;
б) видовому – совершенный и несовершенный виды глагола, например “сделать” – “делать”.

Теперь же новая поисковая программа позволяет учитывать еще 3 вида отношений:
1) некоторые типы переходов из одной части речи в другую («гамбург» -> «гамбургский»);
2) транслитерация («mazda» -> «мазда»);
3) аббревиатуры (МГУ -> Московский государственный университет).

То есть если пользователь введет запрос «МПГУ», то Яндекс найдет страницы, содержащие «Московский Педагогический Государственный Университет», причем даже если самого слова «МПГУ» на них нет. Аналогичным образом, по запросу «мазда» показываются сайты как с этим словом, так и со словом «mazda».

Что касается упомянутого типа отношений «гамбург» -> «гамбургский», SEOnews дал дополнительный комментарий руководитель отдела веб-поиска "Яндекса" Александр Садовский:
"При принятии решения, требуется ли учитывать переход из одной части речи в другую, поисковая программа анализирует необходимость этого перехода (например, по логам поисковых сессий, где встречались запросы с такими словами) и далеко не всегда принимает положительное решение.
Поэтому по запросам [гамбургские сосиски] или [гамбургский счет] не должны находиться счета и сосиски в Гамбурге, так как они действительно не нужны пользователям".


Команда Яндекса дает статистические характеристики внесенных изменений по расширению слов запроса:

•Переход из одной части речи в другую - 17182 пар слов, 6% запросов
•Транслитерация - 25455 пар слов, 8% запросов
•Аббревиатуры - 19360 пар слов, 1,5% запросов

Однако что касается аббревиатур, на их примере команда Яндекса рассказывает о том, каким образом собирались по текстам интернета зоны .ru связки пар слов (МГУ – Московский Государственный Университет).

1. На первом этапе из архива веба выделяются цепочки вида
•Парламентская ассамблея Совета Европы (ПАСЕ)
•Мобильные ТелеСистемы (МТС)

2. Затем оставляют те пары, в которых из первых букв последовательности получается слово в скобках.

3. Далее удаляется часть аббревиатур, если средняя частота расшифровки аббревиатуры близка к частоте стоп-слов, а сама расшифровка встречалась меньше, чем на N хостах, удаляем аббревиатуру, например, были удалены:

•правая рука (пр) -- 46 хостов
•что я за это получу (чязэп) -- 16 хостов
•центр информационных систем и технологий в управлении (цисту) -- 2 хоста

4. Если две расшифровки одной и той же аббревиатуры отличаются по Левенштейну не больше, чем минимальная длина расшифровок, умноженная на k, при этом различия распределены равномерно, тогда считаем это одной и той же расшифровкой, например:

•фильтр низких частот фильтр нижних частот
•железная дорога молдавии железная дорога молдовы
5. Удивило то, что если устанавливается омонимия аббревиатур, удаляется вся пара, а не менее частотный омоним:

•управление буровых работ (убр) - 154
•учреждение банка россии (убр) - 26

•московский государственный строительный университет (мгсу) - 2181
•московский государственный социальный университет (мгсу) - 718

6. Также удаляются аббревиатуры, совпадающие с частотными словарными словами:

•технические условия (ту)
•институт гармонического развития и адаптации (игра)

Читайте нас в Telegram - digital_bar

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Анастасия Гутникова
    373
    комментария
    0
    читателей
    Анастасия Гутникова
    больше года назад

    С тех пор, как Магадан выложили, да. И даже чуть раньше об этом говорили. Но сейчас интересно то, что яндексоиды раскрывают механику работы
    -
    0
    +
    Ответить
  • Гость
    больше года назад
    дык по-моему давно так уже, если не ошибаюсь
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Тест: Кто как пробежал, или Итоги клиентского рейтинга SEOnews 2018
Анна Макарова
334
комментария
0
читателей
Полный профиль
Анна Макарова - Друзья, спасибо всем за участие! Мы определили победителей. Кто ими стал - вы найдете по ссылке: www.seonews.ru/events/darim-knigi-ot-mif-pobediteli-opredeleny/ Если вы стали одним из победителей, обязательно свяжитесь с нами по указанной в новости (по ссылке выше) почте. Всем хороших выходных! =)
32 инструмента в помощь SEO-специалисту
luthorscorploanfirm
2
комментария
0
читателей
Полный профиль
luthorscorploanfirm - Я - г-н Марк Джо из корпорации corp, мы являемся законной, зарегистрированной и гарантированной кредитной компанией, мы предоставляем 3% -ые кредиты частным лицам, компаниям, государственным учреждениям и деловым организациям и людям всех родов. Свободные кредиты - это решение всех ваших финансовых проблем. свяжитесь с нами по электронной почте: mjoe0123@gmail.com
Комплексный аудит интернет-магазина от «Ашманов и партнеры». Часть 1
Александр Сова
1
комментарий
0
читателей
Полный профиль
Александр Сова - А вот и сеошники подъехали, покидать на вентилятор :D
SEO глазами клиентов 2018
Анна Макарова
334
комментария
0
читателей
Полный профиль
Анна Макарова - Дмитрий, во-первых, это старая песня уже всем порядком надоела. Мы не устаем объяснять, что для всех участников рейтинга условия равные. Мы общаемся клиентами агентств, именно они оценивают своего подрядчика. Во-вторых, надеюсь, вы помните, что за клевету вас могут привлечь к ответственности.
Не очень удачный кейс продвижения сайта по услуге «Трезвый водитель» в Москве
Кирилл Щербаков
3
комментария
0
читателей
Полный профиль
Кирилл Щербаков - "даже пришлось подключить отслеживание звонков с сайта" "Даже" - как будто это что-то нереальное
Два идеальных способа разориться на старте интернет-магазина
Стас
4
комментария
0
читателей
Полный профиль
Стас - Seonews в последнее время такую чушь несет! Где вы таких афторов находите? Статья ничего не стоит и несет чушь! Кто хоть немного понимает в этом так вам и скажет, и такие де комментаторы горе-сеошники, просто смешно читать, вы хоть модерируете ваши статьи или просто для воды на сайте?! Бред сивой кобылы эта статья до самой последней точки!!!
Эксперимент: как уникальность контента влияет на продвижение сайта
Ilia Nazmutdinov
2
комментария
0
читателей
Полный профиль
Ilia Nazmutdinov - Кстати, ПФ не работают на нулевом трафике. Пока на сайт не льются тысячи показов по одним и тем же запросам влияние оказывает ток ссылочное\внешнее и внутреннее\ и внутренняя оптимизация.
Яндекс перестал индексировать сайты, созданные на Wix
Константин Даткунас
3
комментария
0
читателей
Полный профиль
Константин Даткунас - Было бы интересно посмотреть саму выборку из 10 000 и методику анализа.
Как мы разработали и вывели в ТОП сайт курсов рисования
Иван Стороженко
25
комментариев
0
читателей
Полный профиль
Иван Стороженко - Добрый день. 1)Чаще всего основная проблема заключается, в согласовании с клиентом добавляемого контента и то как он будет отображаться. На данном сайте фото и услуги конечно предоставлял клиент, все остальное уже делали мы. 2)Да в принципе, когда есть команда и понимание, что нужно делать, все идет быстро (опять же основная заминка идет на согласовании с клиентом) 3)Смысла делать новый в данном случает нет. В принципе доделывался полноценный сайт. 4)Когда клиент уже не предоставляет информацию, приходится искать у конкурентов (например с других стран или регионов). Но чаще всего клиент, хоть что-то "подкидывает".
Расчет трафика из поисковых систем по брендовым и небрендовым запросам
Дарья Калинская
238
комментариев
0
читателей
Полный профиль
Дарья Калинская - А вот и статья :) www.seonews.ru/analytics/raschet-trafika-po-nebrendovym-zaprosam-pri-pomoshchi-r/
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
334
Комментариев
262
Комментариев
238
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
87
Комментариев
80
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
56
Комментариев
55
Комментариев
54

Отправьте отзыв!
Отправьте отзыв!