«Городские» алгоритмы: веб-мастер предполагает, а Яндекс располагает

Далекой зимой 2008-ого у Яндекса случилось игривое настроение, и он предложил своим пользователям партию-другую «В города». Предложил, это, конечно, образно выражаясь. Точнее — поставил перед фактом всех граждан веб-мастеров, и с тех памятных дней долго ли, коротко ли, освоили мы уже четыре населенных пункта. Каждый новый алгоритм, как водится, порождал взлеты или падения кровью и потом добытых позиций в SERP, 70-листовые обсуждения на SEO-форумах и все более релевантные результаты выдачи.


Городские хроники

Вспомним, как это было. Каждый раз, за исключением Арзамаса, третьего «городского» алгоритма, новая версия поиска появлялась сначала в бета-версии. Разведка боем осуществлялась на сайте buki\.yandex\.ru. После жарких полемик, учета предложений и исправления недоработок, алгоритм матерел, креп и отправлялся в свободное плавание.

Рассмотрим специфику каждого городского алгоритма Яндекса с помощью наглядной таблицы.

Магадан

Находка

Арзамас

Снежинск

Дата выхода бета- версии

14 апреля 2008 года

14 апреля 2008 года

— 

14 апреля 2008 года

Дата релиза

14 апреля 2008 года

11 сентября 2008

14 апреля 2008 года

14 апреля 2008 года

Выходившие версии

14 апреля 2008 года

— 

14 апреля 2008 года,

14 апреля 2008 года,

14 апреля 2008 года,

14 апреля 2008 года,

14 апреля 2008 года

14 апреля 2008 года, Снежинск 1\.1

Новые разработки алгоритма

1. Увеличено вдвое число факторов ранжирования, улучшены некоторые внедренные ранее;

2. Добавлены классификаторы, позволяющие системе лучше понять тип страницы и тип ссылок;

3. Улучшено ранжирование по запросам, слова которых в релевантных документах идут далеко друг от друга, например, «хармс цирк вертунов»;

4. Улучшена скорость поиска путем использования технологии 14 апреля 2008 года;

5. Стали учитываться следующие отношения:

а) Переходы из одной части речи в другую («гамбург» -> «гамбургский») — 17182 пар слов, 6% запросов;
б) транслитерация («mazda» -> «мазда») — 25455 пар слов, 8% запросов;
в) аббревиатуры (МГУ -> Московский государственный университет) — 19360 пар слов, 1,5% запросов.

6. Стали определяться слова с символами («C++» и «Европа+» теперь находятся как единое целое);

7. В поиске стали участвовать переводы и транслитерация частей URL («mail» — это «почта», а «bmw» — это «бмв»);

8. Повышена точность распознавания фамилий и географических названий.

1. Выросло качество ранжирования по запросам со стоп-словами.

2. Совершен новый подход к машинному обучению и, как следствие, изменился способ учета факторов ранжирования:

а) Коммерческие сайты стали реже появляться на 1-й странице выдачи;

б) В результатах поиска стало больше внутренних страниц;

в) Улучшено понимание текста страницы (оригинальность контент, наличие точных соответствий запросам в тексте сайта, количество ключевых слов и др.)

3. Расширен тезаурус: стали распознаваться запросы, которые в раздельном написании означают то же самое, что и в «склеенном» виде (авто ваз ->"автоваз«).

1. Реализован алгоритм, распознающий слова омонимы.

2. Настроен геотаргетинг, также появился инструмент сравнения результатов поиска в разных регионах.

3. По «картиночным» запросам над результатами веб-поиска стали показываться картинки.

1. Переработана архитектура ранжирования, факторов ранжирования стало значительно больше.

2. Введены дополнительные региональные факторы для всех 19 городов.

3. Впервые применен алгоритм машинного обучения Матрикснет.

Что сделано в версиях

Добавлены новые факторы, учитывающие уникальность контента, классификатор порнографии, геоклассификатор запроса, классификатор коммерциализированности и многие другие.


Арзамас 1.1:

Стали определяться поисковые результаты для пользователей из России, за исключением Москвы, Санкт-Петербурга и Екатеринбурга.

Арзамас 1.2

Запросы поделены на гео-зависимые и гео-независимые.

Арзамас +16

Ранжирование по гео-зависимым запросам теперь осуществляется еще для 16 городов.

Арзамас 1.5

Улучшена формула ранжирования для гео-независимых запросов и запросов из городов без локализованного ранжирования.

Арзамас 1.5 SP1

Улучшена формула ранжирования по гео-зависимым запросам.

Снежинск (Конаково)

Локальное ранжирование стало работать для 1250 городов, подсказки и колдунщики теперь также гео-ориентированы.

Снежинск 1.1

Улучшена формула ранжирования по гео-независимым запросам.

Что в имени тебе моем?

Завершая линейки разработок в рамках двух первых алгоритмов (Магадан и Находка), Яндекс всегда анонсировал название следующей «остановки». Но после того как команда поисковика попала в молоко с прогнозами на Анадырь (алгоритм в итоге назвали Арзамасом), предсказаний на будущее больше не делалось. Что ж, сюрприз должен быть сюрпризом — непредсказуемым, неожиданным и ... приятным?

Кемерово, Краснодар, Конаково...

Новые алгоритмы Яндекса выходили в среднем с периодичностью в полгода. Нынешний алгоритм Снежинск явил себя в ноябре, а последнее его обновление выпало на март. По-видимому, вскоре нам предстоит принять участие в очередном раунде игры Яндекса. Каким же будет название следующего круга сеошного инферно? Находка и Магадан являются портами на северо-восточных рубежах Отечества, в Арзамасе и Снежинске располагались секретные ядерные центры. Куда теперь заведет нас Яндекс?

Примечательно, что вторая версия Снежинска имела рабочее название 11 сентября 2008, в честь города, в котором родился один из разработчиков алгоритма — Алексей Барыкин. Однако полноценным новым алгоритмом Конаково так и не стал.

Долгое время вся SEOшная братия с замиранием сердца следила за состоянием «настроения» Дена Расковалова на блогхостинге Я\.ру. Здесь руководитель отдела качества поиска Яндекса, предупреждая выход официальных релизов алгоритмов, сообщал о надвигающихся коллапсах в мире русского SEO. Но сейчас заветная страница удалена пользователем, и вестей ждать неоткуда.

Каким же он будет, следующий город? Курск, Красноярск, а может, Комсомольск-на-Амуре?

Эксперты о грядущем

И все же эксперты не советуют поднимать панику раньше времени. «Летом обычно наблюдается снижение активности, как пользователей, так и рекламодателей. Так что сейчас нет особого смысла выдачу трясти. Думаю выхода нового алгоритма можно ждать к концу лета», — рассуждает блогер Дмитрий Голополосов. А Елена Камская, руководитель технического отдела компании SeoLib, отметила, что такая сложнейшая программа как алгоритм машинного обучения Матрикснет скорее всего разрабатывалась на долгосрочную перспективу, поэтому «алгоритмы уже не будут меняться так часто, как в течение двух прошлых лет, а сами изменения будут касаться не всего алгоритма в целом, а каких-то отдельных факторов».

Дабы дать нашим читателям информативные и полезные прогнозы по поводу грядущей смены алгоритма, редакция SEOnews обратилась за комментариями к ряду экспертов. Известные специалисты в сфере SEO поделились своими рассуждениями о траекториях развития поисковой системы, первоочередных задачах, стоящих перед Яндексом на сегодняшний день, и своих ожиданиях относительно следующего алгоритма.

Сергей Петраковский, коммерческий директор агентства интернет-рекламы i-Media:

Я не думаю, что в следующем алгоритме будут какие-то прорывы. Думаю, что будут улучшать параметры MatrixNet, отслеживая, как меняются оценки качества поиска. Возможно, большее значение приобретет анализ поведения пользователей на сайте после перехода с поисковой системы — это будет особенно актуально, если Яндекс существенно увеличит охват сайтов Рунета Яндекс.Метрикой.

Мелькин Никита, разработчик популярного программного продукта Semonitor:

Первоочередная задача — персонализация выдачи на основе предыдущей истории запросов (cookies). Кажется, это дело уже тестируют. Во всяком случае, я наблюдал у себя на компьютере разную выдачу в двух разных браузерах — после очистки cookies все стало совпадать.

Андрей Иванов («Ашманов и партнеры»):

Улучшения региональной выдачи. В частности, сейчас региональные результаты совершенно странным образом размазаны по топу (Казань — Москва — Казань — Санкт-Петербург — Киев — Казань и т.п.). Мне кажется, в скором времени Яндекс начнет отображать региональные ссылки более компактными блоками. Если говорить о принципиальных задачах, мне кажется, что в ближайшие годы поисковикам придется плотно заняться проблемой определения и ранжирования информации, публикация которой нарушает закон об авторском праве.

Елена Камская (SeoLib):

Основное замечание с точки зрения пользователя — явный недостаток в выдаче „свежих“ сайтов даже по некоммерческим запросам. Думаю, что определенная квота в Топе для хороших молодых ресурсов не была бы лишней. Также очень хотелось бы поскорее увидеть региональную выдачу на Yandex.ua. Как у оптимизатора, у меня есть замечания только по поводу медлительности Яндекса при реагировании на директиву HOST и присвоении региона сайта.

Но самая жизнеутверждающая позиция оказалась у Дмитрия Голополосова:

Я для себя решил просто не ждать чего-то, а работать над проектами — это эффективнее выходит. Всегда в поисковиках что-то меняется, иногда очень кардинально, но у больших качественных сайтов с этим не часто возникают проблемы: где-то отвалится трафик, но обязательно где-то еще образуется свежий.

А свежий трафик будет всегда, так как доля Яндекса в общей массе поисковых систем Рунета только растет, да и российская аудитория пользователей не мельчает. И еще важно не забывать главную SEOшную мудрость: на Яндекс надейся, а сам не плошай!

(Голосов: 5, Рейтинг: 5)