Секрет ранжирования подсказок Яндекса

Поисковые подсказки всегда должны отвечать текущим интересам пользователей. Как Яндекс угадывает, что будет интересовать пользователей в определенное время года, он рассказал в своем блоге. Как оказалось, каждый день Яндекс обрабатывает сотни миллионов запросов и на основе сложных математических моделей просчитывает востребованность подсказок на следующий день. Чтобы составить такой прогноз для всего количества подсказок, которое превышает десятки миллионов, используются вычислительные мощности не одной сотни машин.

Сам прогноз строится на основе регрессионного анализа, который позволяет вычислить будущее значение величины на основе данных за прошлый период. Для каждого запроса выстраивается кривая, где отмечается его частота за прошлый период, затем подбирается наиболее соответствующая этой кривой функция, и по полученной формуле вычисляется частота данного запроса на ближайшие дни.

(Голосов: 5, Рейтинг: 5)