×

Мы думаем прежде всего о поиске

Россия +7 (495) 960-65-87
Дорогая Редакция
0 2413
Шрифт:

Технический директор компании «Яндекс» Илья Сегалович – особо секретная персона. Его никогда не отпускают одного к девушкам, особенно если девушка – журналист. В этот раз он тоже пришел не один. Поэтому Демфира Шакурова, воспользовавшись моментом, задала несколько вопросов ещё и руководителю пресс-службы «Яндекса» Михаилу Ушакову.

По образованию Вы геофизик, как с таким образованием Вы работаете в интернет-компании?

Илья Сегалович: По-моему, образование – это не панацея. Чем меньше у человека «красивых корочек», тем больше у него чувство неудовлетворенности и стремления к совершенству. У меня нет комплекса. Я, будучи студентом, занял второе место на «всесоюзке» (всесоюзной олимпиаде) по математике и всех мехматовцев, которые со мной выступали вместе, победил.

Так же как Яндекс победил конкурентов. 4 года назад в базе Яндекса было 15 миллионов страниц, сколько сейчас? Как много индексируется страниц в день?

Илья Сегалович: Поиск Яндекса индексирует порядка миллиарда страниц, но там очень много спама. Хотя этого добра в любой базе много. Мы измеряем число страниц в базе специальными способами. Для конференции WWW2006 мы писали на эту тему статью, мы, правда, не довели ее до ума, но там правильные вещи написаны…Можно понять, что мы измеряем и как. Мы следим за свежестью и чистотой поиска. Свежесть – это процент страниц, которые отвечают данному поисковому запросу и содержат искомое слово. Если доля таких страниц в выдаче равна 100%, значит, все страницы живые и содержат искомое слово.

А у вас какой процент сейчас?

Илья Сегалович: Сейчас хороший процент. Мы занимаемся расчетом базы сайтов и по отношению к нам, и по отношению к Google, Rambler, Апорту. Соответственно, видим, кто работает лучше, а кто – хуже, у кого какой прогресс. Yаhoo, например, прошлой осенью объявили, что у них самая большая база в мире. А им никто не поверил. Мы по нашим приборам не видели, что база Yаhoo больше. Мы просто заметили рост, а с зимы, она действительно стала больше. Интересно, что эти наши измерения подтвердил на конференции WWW2006 русский юноша из Израиля. Он, кстати, получил первое место среди юношеских докладов. Его методика очень похожа на нашу, но более аккуратна математически. Он сделал расчет и доказал всему поисковому сообществу, что базаYahoo все таки больше базы Google. Это просто информация – никакого личного наезда на товарища Долгова (генеральный директор Google Россия) и Google Россия. (смеется)

А какие у Вас личные отношения с Владимиром Долговым?

Илья Сегалович: Лично у меня никаких отношений нет. Сережа Бурков (руководитель центра разработок и исследований Google Россия), Лена (Колмановская) его знает, был в жюри Кубка Яндекса в Калифорнии. Владимир Долгов работал в Ozon.ru, и был аспирантом Андрея Себранта (директор компании «Яндекс» по специальным проектам). Я не знаю лично ни того, ни другого.

Рост вашей базы влияет на работу поискового движка?

Илья Сегалович: Влияет, тяжелее работать. Все очень пропорционально, чем больше база, тем труднее работать.

Успеваете апдейты делать?

Илья Сегалович: Успеваем, успеваем, успеваем. (задумчиво)

Михаил Ушаков: Кроме апдейтов, у нас еще идет технологическое обновление, то есть мы каждый день «кушаем» по 3 сервера: на завтрак обед и ужин.

Заменяете?

Михал Ушаков: Нет. Новые ставим. Сегодня в технопарке Яндекса около тысячи серверов.

Хороший аппетит у серверного парка. Но волнует нас и читателей не количество серверов, а технические проблемы, связанные с регулярным, массовым выпадением сайтов по разным запросам (с большой или маленькой буквы, с окончанием или без окончания)?

Илья Сегалович: Нестабильность есть, мы с ней боремся, но наша цель – удовлетворить не веб-мастера, а конечного пользователя. А что касается разницы выдачи по запросу с большой и маленькой буквой, то, это учет словоформы. Это нормально.

А выпадения из выдачи? Они не связаны с ростом базы, с тем, что не успеваете обновлять парк?

Илья Сегалович: Выпадение всех страниц сайта невозможно, потому что все проиндексированные страницы одного сайта не лежат на одном сервере. Если выпадет весь сайт, то это связано с пессимизацией. Да, действительно, нагрузки есть, с ростом базы возникают ситуации не очень стабильной работы, мы эту проблему понимаем, и действуем. Была, например, проблема – страницы одного сайта по-разному кешировались. Её пофиксили еще в начале весны.

Но, по отзывам оптимизаторов и клиентов, эта проблема, массовая и повторяется периодически?

Илья Сегалович: Да поймите, эта проблема есть, но она практически незаметна пользователю, в этом смысле она минорная. Мы сейчас сосредоточены на других проблемах . К сожалению, я должен извиниться перед веб-мастерами. Повторюсь, эта проблема у нас минорная и я понимаю их недобрые чувства, связанные с нестабильной работой Яндекса. Я просто подчеркиваю, что мы думаем, прежде всего, о поиске.Мы предпринимаем какие-то шаги, чтобы этого не было, но полностью от этого «не излечишься». Да, причина в очень большой базе, однако, с точки зрения пользователя, это минимальный брак – для пользователя важно то, что на его запрос находится релевантный ответ, и не так важно, на каком именно сайте.

Вопросы наших читателей для Ильи Сегаловича:

Вадим М.:
Как вы можете прокомментировать, тот факт, что в выдаче поисковой системы «Яндекс» практически по любому низкоконкурентному запросу появляются сайты дорвеи, принудительно перенаправляющие пользователя на сайт www.rupoisk.ru? Когда кончится это безобразие и есть ли эффективные методы борьбы с этим злом?

Илья Сегалович: Да, действительно, редиректы на такие сайты, как www.rupoisk.ru и www.bloknotik.ru, появляются в выдаче Яндекса. Мы с этим боремся. Есть эффективные методы борьбы с этим злом. Думаю, ждать осталось не долго.

Мария И.:
Ожидаются ли кардинальные изменения в поисковом алгоритме?

Илья Сегалович: Да.

Например, изменения в ссылочном ранжировании сайтов?

Илья Сегалович: Да.

Учете ссылок с главных страниц?

Илья Сегалович: Это детали, которые я не могу разглашать.

Павел К.:
Насколько стабильно работают и будут работать алгоритмы ранжирования?

Илья Сегалович: Алгоритмы ранжирования работают стабильно, но у баз большая нагрузка. Мы стараемся, чтобы эта стабильность повышалась. Что касается стабильности временной, то алгоритмы будут меняться.

Дмитрий Р.:
Почему сейчас приоритет отдается быстроте индексации страниц и количеству сайтов в базе поисковой системы, а не качеству выдаваемых пользователю страниц по запросу, их релевантности?

Илья Сегалович: Приоритет отдается качеству, и только на втором месте быстрота. Поэтому я не согласен с этим утверждением.

Почему «Яндекс» придумывает и развивает новые сервисы (поиск по картинкам, в блогах, погода разная, телепрограмма), а алгоритм, определяющий релевантность сайта, работает все хуже и релевантность выдаваемых сайтов все ниже?

Илья Сегалович: Работы над новыми проектами и над качеством поиска идут параллельно, ими занимаются разные люди и одно другому не мешает. Мы понимаем, что алгоритм, определяющий релевантность сайтов – наша главная задача, и продолжим над ним работать и дальше.

Беседовала Демфира Шакурова

(Голосов: 6, Рейтинг: 5)
Читайте нас в Telegram - digital_bar
Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
14
комментариев
0
читателей
Полный профиль
Михаил Мухин - Здравствуйте! 1-2. Считает стенд. Ссылка на него дана, но могу повторить: online.p-c-l.ru/competition/task/card/id/106. Нажмите на кнопку "Начать" и заранее приготовьте прогноз бюджета Яндекс. Суть расчета: перебор комбинаций всех ставок на всех фразах, построение бюджетных когорт - бюджетов с одинаковым СРС, отбор в каждой когорте бюджета с максимальным количеством кликов и ..., да упорядочивание этих бюджетов по мере возрастания СРС, причем берем не все, а с фиксированным шагом. 3. Гугл считается через поправочные коэффициенты. Мы перевариваем океан данных и представляем их. На удивление, получается не менее, хотя и не более точно, как и прогноз Яндекс. Конечно, нужно понимать, что это очень примерные прикидки, фактически перевод неточного прогноза Яндекс в удобочитаемую форму, не больше. Самое интересное начинается, когда применяешь метод бюджетных когорт к измерению показателей фраз на реальной рекламной кампании в режиме 48х7. Первые результаты очень хорошие. Если хотите присоединиться к бесплатному тестированию, напишите Эльвире r-support@r-broker.ru. В теме укажите "хочу присоединиться к тестам Умного управления рекламой"
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
5
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Дмитрий Сульман
4
комментария
0
читателей
Полный профиль
Дмитрий Сульман - Все верно, об этом я и говорю. У крупных компаний есть много данных и они имеют доступ к дорогим технологиям и решениям для персонализации контента. Топовые западные сервисы для персонализации, такие как RichRelevance или Dynamic Yield, стоят от нескольких тысяч до десятков тысяч долларов в месяц. Понятно, что малый бизнес не может себе этого позволить. Да даже если бы чисто теоретически и мог, то это вряд ли бы имело хоть какой-то смысл. Во-первых, у малого бизнеса недостаточно данных, чтобы подобные алгоритмы персонализации начали эффективно работать, а во-вторых, тот профит, который МСБ получит от персонализации, никогда не покроет таких расходов. Мы же предлагаем решение, доступное как раз для малого и среднего бизнеса. При этом наше решение комплексное: МультиЧат - это одновременно и инструмент для персонализации, и для коммуникации.
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
Как вывести сайт в ТОП 10 Google в 2019 году
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Интересная статья. Подскажите на каких ресурсах расположить ссылки бесплатно по автобезопасности? Наш сайт bastion-center.ru/
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Kosta Bankovski
4
комментария
0
читателей
Полный профиль
Kosta Bankovski - Спасибо за приятные слова! Буду и дальше делиться наработками ;)
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
Как улучшить репутацию сайта недвижимости с помощью крауд-маркетинга
Евгений
3
комментария
0
читателей
Полный профиль
Евгений - а у вас какое впечатление от статьи?
10 элементов сайта, которые гарантированно отпугнут посетителей
Андрей
2
комментария
0
читателей
Полный профиль
Андрей - Ну типа потому что клиентское seo больше для коммерции предназначено. Типа контентники и сами знают что делать. В коммерции можно тысячу причин найти чтобы поработать с сайтом, а с контентными такие фокусы уже не прокатят, поэтому и не пишут. Всё продвижение для контентников сеошники описывают в трех словах: скорость, качество, систематичность. А, ну ещё конечно же СЯ, как же я про него забыл (фундамент жеть!).
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
362
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
83
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!