×
Россия +7 (495) 139-20-33

Яндекс запустил новый алгоритм ранжирования «Королёв»

Россия +7 (495) 139-20-33
Шрифт:
8 20133

22 августа в Москве состоялась презентация нового алгоритма ранжирования Яндекса. Его представил руководитель службы релевантности и лингвистики Александр Сафронов. Алгоритм получил название «Королёв».

Новый алгоритм является еще одним шагом на пути к лучшему пониманию пользователей. В его основе лежат нейронные сети.


Работу в направлении обучения нейронных сетей Яндекс начал с модели DSSM. Также на помощь пришли пользователи, задающие огромное число запросов ежедневно. На основании этого массива данных составляются обучающие примеры для нейронной сети.

В новом алгоритме было увеличено влияние нейронный сетей на ранжирование. Одной из интересных черт нововведения стало применение нейронных сетей к тексту документов.

Яндекс внедрил модель, которая, при оценке смысловой близости смотрит не только на заголовок, но и на тело страницы.

Еще одно нововведение связано с тем, что нейронные модели научили учитывать тексты запросов, по которым ранее на эту страницу приходили пользователи. Изменения коснулись и количества страниц, к которым применяются нейронные сети.

Ранее Яндекс использовал нейронные сети для ограниченного числа страниц (приблизительно для 150) по запросу из-за большой вычислительной сложности. Теперь число страниц увеличили до 200 000.

Команда Яндекса верит, что машинное обучение, а особенно нейросети, рано или поздно позволит научить поиск оперировать смыслами на уровне человека. Однако здесь невозможно обойтись без помощи людей. Поэтому необходимо показывать машине огромное число примеров, чем и занимаются пользователи поиска.

Однако в помощи нуждается также и Матрикснет, который строит формулу ранжирования. Чтобы поиск продолжал развиваться, люди должны постоянно давать оценку его работе. Раньше выставлением оценок занимались только сотрудники Яндекса – асессоры. Однако позже специалисты компании решили привлечь к этому и пользователей, запустив Яндекс.Толоку.

Сейчас в Толоке зарегистрировано более миллиона пользователей. Они анализируют качество поиска и принимают участие в улучшении других сервисов компании. Задания на Толоке оплачиваются. За два года существования сервиса толокеры выставили около двух миллиардов оценок.

Команда Яндекса подчеркнула, что новый поиск – это результат совместной работы рядовых пользователей и специалистов компании.

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Дмитрий Горошко
    4
    комментария
    0
    читателей
    Дмитрий Горошко
    больше года назад
    Что-то пошло не так. Пшик космического масштаба от Яндекса.
    -
    1
    +
    Ответить
  • Виктор Кудрявцев
    4
    комментария
    0
    читателей
    Виктор Кудрявцев
    больше года назад
    Присоединюсь к комментаторам ниже, кто делает задания в Толоке? Явно не гении мира сего и даже не просто умны люди, ведь они ценят свое время.
    -
    2
    +
    Ответить
  • Гость
    0
    комментариев
    0
    читателей
    Гость
    больше года назад
    Мда, я давно догадывался, что человечество, начиная с Адама, не эволюционирует, а деградирует... Вот то же самое и с поиском - что у гугла, что у яндекса. Если раньше я мог управлять поиском путем изменения формулировки запроса, то сейчас этого так просто не сделать - надо извращаться с кавычками и пр. Если раньше я сам был интеллектом, когда формулировал запрос, то сейчас поисковик заменил мой интеллект, мои профессиональные навыки и знания, своим искусственным интеллектом, обученным... кем?...
    Мда, я давно догадывался, что человечество, начиная с Адама, не эволюционирует, а деградирует... Вот то же самое и с поиском - что у гугла, что у яндекса. Если раньше я мог управлять поиском путем изменения формулировки запроса, то сейчас этого так просто не сделать - надо извращаться с кавычками и пр. Если раньше я сам был интеллектом, когда формулировал запрос, то сейчас поисковик заменил мой интеллект, мои профессиональные навыки и знания, своим искусственным интеллектом, обученным... кем??? - домохозяйками, разумеется. В итоге, на конкретный профессиональный вопрос я стал получать размытые нечеткие ответы общего зарактера. Если например меня интересует, какими именно шурупами лучше всего крепить пластиковый плинтус к стене, то поисковики сейчас мне выдадут обширное описание типов плинтусов, историческую справку, где купить и т.д и тп, но мне это не нужно, мне нужен краткий ответ типа: саморез с прессшайбой 4.2х35 и нейлоновый дюбель 6х30. Без воды. Также обнаружил проблему с поиском по фразам из логов. Раньше и гугл и яндекс на первые места ставили страницы с обсуждением ошибок, точно соответствующим логам. А с запуском семантического поиска и в гугле и в яндексе началась хрень - приходится использовать кавычки и язык запроса...

    Да я и сам экспериментировал с семантическим поиском на корпусе в миллион документов, но в итоге отказался от него изза непрактичности. Да, результаты я получал интересные. Удивительно видеть в выдаче страницы, соответствующие в целом по смыслу, но в которых нет ни одного слрва из запроса... Однако я поймал себя на мысли, что что то мне в этих результатах не нравится и потом понял, что именно - результаты были тематически размыты, обобщенные, неконкретные, хоть и были в тему в большинстве своем. Т.е. практическая польза оказалась меньше, чем от классического поиска по словам...

    А они еще нейронеую сеть прикрутили... А нейронеые сети отличаются тем недостатком, как непрозрачность их работы, то есть они по сути являются черным ящиком...
    -
    6
    +
    Ответить
    • Mih
      2
      комментария
      0
      читателей
      Mih
      Гость
      больше года назад
      Скажу от себя что к гуглу у меня более положительное отношение - он настолько нагло и беспринципно не пытается монополизировать выдачу а в частности ком. запросы, видимо цели глобальнее. О яше могу только промолчать в моих глазах он давно обделался.
      -
      1
      +
      Ответить
    • Roman Popov
      46
      комментариев
      0
      читателей
      Roman Popov
      Гость
      больше года назад
      Так в этом весь смысл алгоритма - единственный нормальный ответ на коммерческий запрос будет в Директе. А в выдаче в ответ на запрос "купить" мне расскажут, что нужно помнить, чтобы купить, на какие типы денег можно "купить", зачем мне вообще это "купить" надо, но купить так и не предложат. =)
      -
      3
      +
      Ответить
  • Roman Popov
    46
    комментариев
    0
    читателей
    Roman Popov
    больше года назад
    Геноцид качественной выдачи продолжается... =))) Прошлых достижений им показалось мало...
    -
    7
    +
    Ответить
  • Сергей Дембицкий «Sima-Land.ru»
    22
    комментария
    0
    читателей
    Сергей Дембицкий «Sima-Land.ru»
    больше года назад
    Да здравствует, Королёв!!!
    -
    0
    +
    Ответить
  • Johnnie Walker
    1
    комментарий
    0
    читателей
    Johnnie Walker
    больше года назад
    никогда такого не было и вот опять...
    -
    13
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
15
комментариев
0
читателей
Полный профиль
Михаил Мухин - Здравствуйте! 1-2. Считает стенд. Ссылка на него дана, но могу повторить: online.p-c-l.ru/competition/task/card/id/106. Нажмите на кнопку "Начать" и заранее приготовьте прогноз бюджета Яндекс. Суть расчета: перебор комбинаций всех ставок на всех фразах, построение бюджетных когорт - бюджетов с одинаковым СРС, отбор в каждой когорте бюджета с максимальным количеством кликов и ..., да упорядочивание этих бюджетов по мере возрастания СРС, причем берем не все, а с фиксированным шагом. 3. Гугл считается через поправочные коэффициенты. Мы перевариваем океан данных и представляем их. На удивление, получается не менее, хотя и не более точно, как и прогноз Яндекс. Конечно, нужно понимать, что это очень примерные прикидки, фактически перевод неточного прогноза Яндекс в удобочитаемую форму, не больше. Самое интересное начинается, когда применяешь метод бюджетных когорт к измерению показателей фраз на реальной рекламной кампании в режиме 48х7. Первые результаты очень хорошие. Если хотите присоединиться к бесплатному тестированию, напишите Эльвире r-support@r-broker.ru. В теме укажите "хочу присоединиться к тестам Умного управления рекламой"
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
8
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Дмитрий Сульман
4
комментария
0
читателей
Полный профиль
Дмитрий Сульман - Все верно, об этом я и говорю. У крупных компаний есть много данных и они имеют доступ к дорогим технологиям и решениям для персонализации контента. Топовые западные сервисы для персонализации, такие как RichRelevance или Dynamic Yield, стоят от нескольких тысяч до десятков тысяч долларов в месяц. Понятно, что малый бизнес не может себе этого позволить. Да даже если бы чисто теоретически и мог, то это вряд ли бы имело хоть какой-то смысл. Во-первых, у малого бизнеса недостаточно данных, чтобы подобные алгоритмы персонализации начали эффективно работать, а во-вторых, тот профит, который МСБ получит от персонализации, никогда не покроет таких расходов. Мы же предлагаем решение, доступное как раз для малого и среднего бизнеса. При этом наше решение комплексное: МультиЧат - это одновременно и инструмент для персонализации, и для коммуникации.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
Digital-разговор: Михаил Шакин про SEO, Google и заработок в интернете
Анна Макарова
368
комментариев
0
читателей
Полный профиль
Анна Макарова - Подготовим ) Пока предлагаю почитать интервью с Денисом Нарижным из той же серии. Там стенограмма =) www.seonews.ru/interviews/digital-razgovor-denis-narizhnyy-pro-ukhod-iz-seo-i-zarabotok-na-partnerkakh/
Как удвоить выручку за счет продвижения в поиске. Кейс coffee-butik.ru
Максим Боровой
3
комментария
0
читателей
Полный профиль
Максим Боровой - Последний вопрос (извиняюсь за количество) - почему на "В корзину" стоит Nofollow. Осознанно для распределение весов?
Почему вы торгуетесь за показы, даже если платите за клики
Константин Требунских
3
комментария
0
читателей
Полный профиль
Константин Требунских - Дмитрий, спасибо за комментарий, хорошие замечания!) 1. "Какая-то подмена понятий. CPM у “Original Works” взлетает не от того, что у них РАВНАЯ цена клика, а оттого, что вы "с потолка" поставили ему CPC в 2 раза выше, чем был. Логично, что и CPM в 2 раза увеличился (см. формулу выше). Если бы вместо 5 вы всем решили поставить 2 или 1.5, то он бы наоборот уменьшился." Вы правы, что CPM уменьшился бы. В первой и второй табличке берем одинаковое количество показов (именно за них мы платим сначала) и считаем данные, в том числе CPC. Мы поставили рекламодателей в одинаковые условия и посмотрели их эффективность в разрезе цены клика при одинаковом количестве показов. А затем изменился аукцион, и, взяв получившиеся данные по кликам и CTR, мы поставили рекламодателей тоже в одинаковое положение, но уже по цене клика, ведь мы теперь за него платим. Посчитали эффективность в разрезе уже CPM. Тут если и есть подмена понятий, то она точно не моя, а рекламных систем, потому и обозначена, как "ход конем" :) 2. "Ок, смотрим таблички "как оно было" и "как оно стало". Было: система суммарно за 2 000 денег показала рекламу 4 000 раз. Стало: система суммарно за 2 000 денег показала рекламу 13 500 раз. Сомнительный профит для системы." Вы правы, именно поэтому для рекламодателей с низким CTR ставка будет выше, чем для рекламодателей с высоким CTR. Просто чтобы система окупилась. Потому что, системе выгодно продавать показы тем, у кого кликов будет больше (ведь они платят за клик). По факту реальные цены за клик в аукционе будут как в таблице 2. Но ранжирование системы проводят по таблице 5.
Где SEO-специалист может углубить свои навыки в области поискового продвижения
Ирина Полинина
1
комментарий
0
читателей
Полный профиль
Ирина Полинина - Полезно! Спасибо
Кейс Hansa: как увеличить органический трафик в 1,5 раза
Алексей Порфирьев
3
комментария
0
читателей
Полный профиль
Алексей Порфирьев - Спасибо за замечание, о данной проблеме известно, но она не стоит в порядке приоритетных. Вопрос, на самом деле, дискуссионный. В тематике конкуренция не настолько велика, а в топе выдачи часто встречаются сайты с более серьёзными техническими проблемами. По этому, именно в статьях, более важно работать над релевантностью контента, отношением времени пользователя на странице к уровню доскрола, и различным пользовательским функционалом (рейтинг материала, просмотры и т. п.).
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
368
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
139
Комментариев
121
Комментариев
108
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
85
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!