×
Россия +7 (495) 139-20-33

Яндекс запустил новый алгоритм ранжирования «Королёв»

Россия +7 (495) 139-20-33
Шрифт:
8 19633

22 августа в Москве состоялась презентация нового алгоритма ранжирования Яндекса. Его представил руководитель службы релевантности и лингвистики Александр Сафронов. Алгоритм получил название «Королёв».

Новый алгоритм является еще одним шагом на пути к лучшему пониманию пользователей. В его основе лежат нейронные сети.


Работу в направлении обучения нейронных сетей Яндекс начал с модели DSSM. Также на помощь пришли пользователи, задающие огромное число запросов ежедневно. На основании этого массива данных составляются обучающие примеры для нейронной сети.

В новом алгоритме было увеличено влияние нейронный сетей на ранжирование. Одной из интересных черт нововведения стало применение нейронных сетей к тексту документов.

Яндекс внедрил модель, которая, при оценке смысловой близости смотрит не только на заголовок, но и на тело страницы.

Еще одно нововведение связано с тем, что нейронные модели научили учитывать тексты запросов, по которым ранее на эту страницу приходили пользователи. Изменения коснулись и количества страниц, к которым применяются нейронные сети.

Ранее Яндекс использовал нейронные сети для ограниченного числа страниц (приблизительно для 150) по запросу из-за большой вычислительной сложности. Теперь число страниц увеличили до 200 000.

Команда Яндекса верит, что машинное обучение, а особенно нейросети, рано или поздно позволит научить поиск оперировать смыслами на уровне человека. Однако здесь невозможно обойтись без помощи людей. Поэтому необходимо показывать машине огромное число примеров, чем и занимаются пользователи поиска.

Однако в помощи нуждается также и Матрикснет, который строит формулу ранжирования. Чтобы поиск продолжал развиваться, люди должны постоянно давать оценку его работе. Раньше выставлением оценок занимались только сотрудники Яндекса – асессоры. Однако позже специалисты компании решили привлечь к этому и пользователей, запустив Яндекс.Толоку.

Сейчас в Толоке зарегистрировано более миллиона пользователей. Они анализируют качество поиска и принимают участие в улучшении других сервисов компании. Задания на Толоке оплачиваются. За два года существования сервиса толокеры выставили около двух миллиардов оценок.

Команда Яндекса подчеркнула, что новый поиск – это результат совместной работы рядовых пользователей и специалистов компании.

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
  • Дмитрий Горошко
    4
    комментария
    0
    читателей
    Дмитрий Горошко
    больше года назад
    Что-то пошло не так. Пшик космического масштаба от Яндекса.
    -
    1
    +
    Ответить
  • Виктор Кудрявцев
    4
    комментария
    0
    читателей
    Виктор Кудрявцев
    больше года назад
    Присоединюсь к комментаторам ниже, кто делает задания в Толоке? Явно не гении мира сего и даже не просто умны люди, ведь они ценят свое время.
    -
    2
    +
    Ответить
  • Гость
    0
    комментариев
    0
    читателей
    Гость
    больше года назад
    Мда, я давно догадывался, что человечество, начиная с Адама, не эволюционирует, а деградирует... Вот то же самое и с поиском - что у гугла, что у яндекса. Если раньше я мог управлять поиском путем изменения формулировки запроса, то сейчас этого так просто не сделать - надо извращаться с кавычками и пр. Если раньше я сам был интеллектом, когда формулировал запрос, то сейчас поисковик заменил мой интеллект, мои профессиональные навыки и знания, своим искусственным интеллектом, обученным... кем?...
    Мда, я давно догадывался, что человечество, начиная с Адама, не эволюционирует, а деградирует... Вот то же самое и с поиском - что у гугла, что у яндекса. Если раньше я мог управлять поиском путем изменения формулировки запроса, то сейчас этого так просто не сделать - надо извращаться с кавычками и пр. Если раньше я сам был интеллектом, когда формулировал запрос, то сейчас поисковик заменил мой интеллект, мои профессиональные навыки и знания, своим искусственным интеллектом, обученным... кем??? - домохозяйками, разумеется. В итоге, на конкретный профессиональный вопрос я стал получать размытые нечеткие ответы общего зарактера. Если например меня интересует, какими именно шурупами лучше всего крепить пластиковый плинтус к стене, то поисковики сейчас мне выдадут обширное описание типов плинтусов, историческую справку, где купить и т.д и тп, но мне это не нужно, мне нужен краткий ответ типа: саморез с прессшайбой 4.2х35 и нейлоновый дюбель 6х30. Без воды. Также обнаружил проблему с поиском по фразам из логов. Раньше и гугл и яндекс на первые места ставили страницы с обсуждением ошибок, точно соответствующим логам. А с запуском семантического поиска и в гугле и в яндексе началась хрень - приходится использовать кавычки и язык запроса...

    Да я и сам экспериментировал с семантическим поиском на корпусе в миллион документов, но в итоге отказался от него изза непрактичности. Да, результаты я получал интересные. Удивительно видеть в выдаче страницы, соответствующие в целом по смыслу, но в которых нет ни одного слрва из запроса... Однако я поймал себя на мысли, что что то мне в этих результатах не нравится и потом понял, что именно - результаты были тематически размыты, обобщенные, неконкретные, хоть и были в тему в большинстве своем. Т.е. практическая польза оказалась меньше, чем от классического поиска по словам...

    А они еще нейронеую сеть прикрутили... А нейронеые сети отличаются тем недостатком, как непрозрачность их работы, то есть они по сути являются черным ящиком...
    -
    6
    +
    Ответить
    • Mih
      2
      комментария
      0
      читателей
      Mih
      Гость
      больше года назад
      Скажу от себя что к гуглу у меня более положительное отношение - он настолько нагло и беспринципно не пытается монополизировать выдачу а в частности ком. запросы, видимо цели глобальнее. О яше могу только промолчать в моих глазах он давно обделался.
      -
      1
      +
      Ответить
    • Roman Popov
      46
      комментариев
      0
      читателей
      Roman Popov
      Гость
      больше года назад
      Так в этом весь смысл алгоритма - единственный нормальный ответ на коммерческий запрос будет в Директе. А в выдаче в ответ на запрос "купить" мне расскажут, что нужно помнить, чтобы купить, на какие типы денег можно "купить", зачем мне вообще это "купить" надо, но купить так и не предложат. =)
      -
      3
      +
      Ответить
  • Roman Popov
    46
    комментариев
    0
    читателей
    Roman Popov
    больше года назад
    Геноцид качественной выдачи продолжается... =))) Прошлых достижений им показалось мало...
    -
    7
    +
    Ответить
  • Сергей Дембицкий «Sima-Land.ru»
    22
    комментария
    0
    читателей
    Сергей Дембицкий «Sima-Land.ru»
    больше года назад
    Да здравствует, Королёв!!!
    -
    0
    +
    Ответить
  • Johnnie Walker
    1
    комментарий
    0
    читателей
    Johnnie Walker
    больше года назад
    никогда такого не было и вот опять...
    -
    13
    +
    Ответить
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Google Data Studio: делаем красивые отчеты по контекстной рекламе для клиентов
Светлана Зубрицкая
1
комментарий
0
читателей
Полный профиль
Светлана Зубрицкая - Нужно убрать пробелы между строк и заменить кавычки на вот такие "
#SEOnews14: мы празднуем – вы получаете подарки!
Анна Макарова
359
комментариев
0
читателей
Полный профиль
Анна Макарова - Гость, добрый день! С победителями мы связывались сразу после розыгрыша. Если мы вам не написали, значит, ваш номер не выпал. Но не расстраивайтесь, у нас обязательно будут новые розыгрыши!
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Георгий
1
комментарий
0
читателей
Полный профиль
Георгий - Все что рекомендуется в этой статье есть у w.tools. Ни разу не пожалел что подключился. Своя CDN сеть, кеш статики и динамики, минификация js\css и кешируемого html, оптимизация всех типов картинок и еще куча всего полезного. Сайт летает и я не знаю проблем. Могу рекомендовать от души.
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Ann Yaroshenko
5
комментариев
0
читателей
Полный профиль
Ann Yaroshenko - Дмитрий, добрый день! Если вы проставили на странице с автозапчастями rel=canonical ( а я вижу в коде, что не проставили) или в HTTP хедере, то бот, как правило: выберит ту страницу главной, которую вы указали в rel=canonical ссылке. Eсли же вы этого не сделали, то бот сам выберит оригинал (алгоритмы, по которым бот это делает, скрыты Googl-ом)
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Feth
1
комментарий
0
читателей
Полный профиль
Feth - Тот момент, когда от статьи в интернете получаешь больше полезных знаний и навыков, чем от своего начальства. По статьям нетпиковцев можно учебник про SEO уже сшивать, ребята молодцы. Спасибо, что делитесь информацией.
Как вывести сайт в ТОП 10 Google в 2019 году
Ирина
8
комментариев
0
читателей
Полный профиль
Ирина - Работают. Как естественные, так и закупные. >Мои сайты в первую очередь заточены на яндекс Соболезную. >Насколько поисковые алгоритмы с гугловскими у него. Разница в 10 лет. Вон в Яше все долбят на ключи, на вхождения и прочий трэш из древностей. А у Гугла, вон почитайте про eat, ymyl Не все понятно но спасибо за ответы. Я так понимаю что с ссылками деть никто точно не знает) Ну это и хорошо вообщем. Самому разбираться как то интересней. Но не всегда. Есть к примеру 2captcha.com/ru и на него 100к ссылок есть. Ну а смысл какой?
10 элементов сайта, которые гарантированно отпугнут посетителей
Андрей
2
комментария
0
читателей
Полный профиль
Андрей - Ну типа потому что клиентское seo больше для коммерции предназначено. Типа контентники и сами знают что делать. В коммерции можно тысячу причин найти чтобы поработать с сайтом, а с контентными такие фокусы уже не прокатят, поэтому и не пишут. Всё продвижение для контентников сеошники описывают в трех словах: скорость, качество, систематичность. А, ну ещё конечно же СЯ, как же я про него забыл (фундамент жеть!).
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
359
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
79
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!