×
Россия +7 (495) 139-20-33

YaC 2020: Яндекс рассказал про новую технологию анализа текста Yati

Россия +7 (495) 139-20-33
Шрифт:
1 7342

На конференции YaC 2020 Яндекс анонсировал в «Поиске» новую технологию Yati, которая расшифровывается как Yet another transformer with Improvements. Это новая технология анализа текста, в рамках которой алгоритмы учатся распознавать связь между запросом и содержанием документов.

Тигран Худавердян, генеральный директор Яндекса в России, отметил, Поиск Ядекса перешел на анализ текста, основываясь на огромных нейросетях, на архитектуре трансформеров.

Что такое трансформер Yati 

Более подробно про трансформеры и сам Yati рассказала Екатерина Серажим, она отвечает за качество ранжирования в поиске Яндекса.

Есть два этапа обучения трансформера. Классическая техника – показываем им неструктурированные тексты. Берем текст маскируем в нем какой-то процент слов и заставляем наш трансформер угадывать эти слова.

Для Yati мы усложнили задачу: мы оказывали ему не просто текст какого-то документа, а реальные поисковые запросы и тексты документов, которые видели наши пользователи. И просили Yati угадывать, какой документ понравится пользователю, а какой нет. Для этого у нас есть эталон – это экспертная разметка наших асессоров, которые оценивают по сложной шкале каждый документ, насколько он релевантен запросу.

Далее Яндекс берет этот массив данных и дообучает трансформер угадывать эту экспертную оценку – так он учится ранжировать.

Екатерина Серажим, Яндекс

Для чего используется трансформер

Тигран Худавердян привел пример: если вы не помните, как называется фильм, но примерно помните, что там было, можно именно так Яндексу сказать. Поисковая машина поймет по смыслу, какой фильм имелся ввиду и найдет его.

Почему трансформеры – это важно

По словам Екатерины Серажим, трансформеры дали Яндексу рекордный уровень в качестве поиска. Они существенно улучшили то, как работает поисковый алгоритм.

«Это самое большое изменение в поиске Яндекса за последние 10 лет, и оно заложило фундамент на следующие годы», – отмечает Тигран Худавердян.

Также на конференции YaC 2020: 

(Голосов: 11, Рейтинг: 4.55)
Читайте нас в Telegram - digital_bar

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Виктор Петров
    3
    комментария
    0
    читателей
    Виктор Петров
    больше года назад
    Серьезно? Вот тот трэш, что творится на выдаче Яндекса последние полгода - это улучшение?
    -
    0
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Известность бренда SEO-компаний 2021
Валерий Прошин
1
комментарий
0
читателей
Полный профиль
Валерий Прошин - Мне больше всего нравится компания занимающаяся продвижением сайтов в поисковых системах exiterra.com/seo/.
Медицинская тематика в SEO: исследование спроса
Гость
1
комментарий
0
читателей
Полный профиль
Гость - В файле по ссылке запрос "как понизить голос" относят к 100-тысячным. Каким боком? Вордстат показывает в разы меньшую цифру.
Товары, которые не стоит продавать на Wildberries: типичные ошибки новичков
Николай
1
комментарий
0
читателей
Полный профиль
Николай - Похоже wildberries-edu.ru/
SEO-продвижение монобрендового интернет-магазина. Кейс Casio
Mike
11
комментариев
0
читателей
Полный профиль
Mike - Яндекс сам не знает, что рекомендует. Каноникал они игнорируют все равно. А вот в гугле четко сказано, что если у страниц разный контент, то каноникал ставить не правильно.
Внедрение и тестирование поиска по товарам в интернет-магазине инструментов
Геннадий IQAD.RU
1
комментарий
0
читателей
Полный профиль
Геннадий IQAD.RU - На текущий момент достаточно часто (через 2-3 фида находятся проблемы). Причина в том, что инструмент пока находится в бета-версии и фиды проходят ручную модерацию через асессоров Яндекса. Тем не менее, как правило, правки минимальны.
Медицинская тематика в SEO: исследование выдачи
УточняюВопросы
1
комментарий
0
читателей
Полный профиль
УточняюВопросы - не очень понятен ваш запрос, можете чуть детальнее расписать? у нас же РУ-семантика, соответственно и язык сайтов в выдаче РУ конечно могуть быть какие то случайные выбросы, но вряд ли значимые
7 трендов интернет-маркетинга на 2022 год
Иван
1
комментарий
0
читателей
Полный профиль
Иван - За трендами реально будущее!
«Ашманов и партнёры» создали нейросеть, которая генерирует нешаблонные описания для страниц сайтов
Алексей
1
комментарий
0
читателей
Полный профиль
Алексей - Функционал есть, но он не отдельный. Он идёт в дополнение к LSI-анализу, интегрирован в него. Можете увидеть сгенерированные мета-теги на вкладке "Текст" в результатах LSI-анализа. Они будут указаны с пометкой (авто). Также сгенерированные мета-теги указаны в ТЗ для копирайтера, которое формируется по итогам анализа конкурентов.
Реклама в Google Ads и AdSense в России работает нестабильно
Гость
2
комментария
0
читателей
Полный профиль
Гость - У тебя трафик с поиска уменьшился?
Как сохранить клиентов и управлять онлайн-репутацией бизнеса в кризис
RocketData
1
комментарий
0
читателей
Полный профиль
RocketData - Добрый день! Да, эта информация актуальна на март 2022 года. При написании статьи мы опирались на информацию, полученную от служб поддержки геосервисов.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
385
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
115
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
62
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!