Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:

Yahoo! о своем отношении к платным ссылкам и спаму

Дорогая Редакция Дорогая Редакция 17 Июля 2008, в 04:56
0 1477
Шрифт:

Перевод выполнен при поддержке
Биржи переводов онлайн - PerevodBy.ru.
Приёмышева Н.


Приянк Гарг является руководителем отдела разработки поиска Yahoo!, в его ведении находятся функциональные возможности поисковой системы, такие как кроулинг, индексирование, ранжирование, грамматика запросов, а также программы для вебмастеров, например, Site Explorer. В течение трех лет работы в Yahoo! Приянк возглавлял многие известные проекты по запуску новых продуктов для Yahoo! Search. С его помощью сервисы Yahoo! Site Explorer и Yahoo! Sitemaps обрели широкую популярность среди вебмастеров.

Расскажите о роли ссылок в алгоритмах ранжирования Yahoo?

Существует много мифов о том, как ссылки влияют на ранжирование. С помощью ссылок мы отслеживаем, как пользователи относятся к контенту, на который они ведут. Кроме того, по анкорному тексту определяется тематика страницы, на которую ведет ссылка. Эти сведения используются нами на протяжении многих лет для поиска наиболее релевантных источников под запрос пользователя.

Таким образом, ссылки важны, но не менее важен и анкорный текст. Мы ищем естественные ссылки, которые могут быть полезными пользователям Сети. Когда пользователь увидит их и заинтересуется такими ссылками, их можно считать рабочими. Именно эти ссылки мы распознаем, идентифицируем и приписываем целевому контенту.

Вы говорите о том, что большое значение имеет релевантность. Можно ли утверждать, что ссылка внизу страницы, например, на WordPress будет абсолютно нерелевантной?

Нерелевантные ссылки, расположенные внизу страницы, не представляют особой ценности для пользователей, поэтому мы не учитываем такие ссылки при ранжировании. Эти ссылки не влияют на рейтинг, хотя наши роботы их индексируют. Могу сказать, что за последние несколько лет, пока мы строили нашу поисковую систему и объединяли большие объемы информации, сократилось соотношение влияния ссылок и анкор-текста на алгоритмы ранжирования и их значение в целом на ранжирование.

Мы совершенствуем наш алгоритм ранжирования благодаря новым источникам информации, новым возможностям Yahoo!. Поэтому с течением временем снижается влияние ссылок на ранжирование. Думаю, это отчасти связано с тем, что вебмастера все чаще компрометируют качество ссылок. Из-за этого понижаются сетевые качественные характеристики ссылок. Тем не менее, мы не перестаем работать над тем, чтобы на запрос пользователя в результатах поиска были показаны качественные ссылки.

Значит, вы утверждаете, что ссылки играют все меньшую роль в новых процессах ранжирования?

Мы не делаем этого специально. Это процесс развития, а в ходе него может произойти все, что угодно. В чем-то это зависит от того, в каком направлении идет развитие самого интернета. Отмечу, совершенствуя алгоритмы, мы добавляем новые факторы, влияющие на ранжирование. Поэтому в процентном соотношении значение ссылок в процессе ранжирования стало значительно меньше.

Существует интересное предположение. Если бы цены на ссылки росли так же, как и цены на бензин, их бы просто перестали покупать, и качество выдачи стало намного лучше.

Возможно, но пока этого не произошло, наши алгоритмы постоянно совершенствуются; мы вводим изменения много раз в неделю. Некоторые изменения незначительные, но мы работаем над этим, чтобы идти в ногу с развитием Всемирной Паутины. В игру вступают все новые инструменты, новые возможности взаимодействия с пользователями. Эволюция не прекращается, и мы приспосабливаем наши алгоритмы под то, что происходит в сети.

Какие еще факторы, помимо ссылок, влияют на ранжирование в Yahoo?

У нас достаточно много источников данных, которые все время дополняются новыми. Мы учитываем структуру сайта; качество контента; наличие спама на сайта; наличие спама на каждой отдельной странице; выделенные на странице слова; содержание анкор-текста страницы. И таких факторов может быть несколько сотен.

Это что касается постраничных факторов, а какие из внешних? Например, ссылки с социальных медиа сайтов, например, сайт del.icio.us.

Любой ресурс, который может предоставить пользователю ценную информацию, является важным. Если это хороший сайт с различными обзорами, созданный самими пользователями, которые не имеют другого стимула, кроме как помогать другим пользователям, тогда эти ссылки будут ценными. Если сайт популярен у пользователей и на нем уникальный контент, ссылки с него будут рассматриваться как качественные.

Какие методы борьбы с поисковым спамом используются в Yahoo?

Мы используем специальные алгоритмы и команду редакторов для выявления и удаления спама. В обнаружении более эффективны алгоритмы, а наши редакторы очень хорошо умеют выявлять новые спам-технологии и на ранних стадиях давать сигнал тревоги. Этот подход, состоящий из двух составляющих, помогает нам быть одними из лучших в данной индустрии. Из всех поисковых систем меньше всего спама в Yahoo. Наша технология обнаружения спама исследует каждую страницу в индексе Yahoo. Данный алгоритм имеет определенное влияние на алгоритм ранжирования, где обнаружение спама очень важно.

Расскажите подробней о редакторах по выявлению спама?

Это специалисты Yahoo!, которые занимаются редактированием. Они настоящие эксперты в этой области, и порой они превосходят наши алгоритмы по части обнаружения подобных вещей. Иногда алгоритмы замечают что-то подозрительное, эти данные отправляются в специальную базу «подозрительных ресурсов», и только человек может распознать такие вещи на ранней стадии.

Мы используем эту схему, чтобы выйти на следующий уровень качества в обнаружении спама. Оба механизма алгоритмического обнаружения, за которыми следует редакционное обнаружение с последующей алгоритмической обработкой, все время находятся в действии. И наконец, усовершенствованием процесса работы является создание алгоритмических путей решения, чтобы можно было обнаружить спам на каждой странице, при каждом ее просмотре. Поэтому все, что делают наши редакторы, постоянно отражается в работе нашей спам-команды настолько быстро, насколько это возможно в алгоритмах.

Бывают ли у вас крайние ситуации, когда редакторы могут производить действия вручную?

Наши редакторы имеют право действовать в различных ситуациях, например, DMCA (акт об авторском праве в цифровую эпоху) или легальное удаление, какое имеет место на рынке Франции, где введены ограничения на определенные виды содержания сайтов, например, «памятные вещи нацистов» (Nazi memorabilia). На рынках других стран подобных ограничений нет. Следовательно, у них есть свои способы борьбы с нарушениями. Они не преследуют цель - найти за месяц миллион страниц спама и удалить их.

Мы можем использовать редактирование, чтобы обучать алгоритмы, чтобы направлять их. Также редакторы могут предупреждать вебмастеров о несоответствии их действий принципам поисковой системы.

Если будет обнаружена страница с хорошим содержанием, но с присутствием на ней некоторого количества спама, как это повлияет на ее ранжирование?

Да. Но в ходе нашей работы мы стараемся оптимизировать алгоритмы под запросы пользователей. Информационное содержание сайтов, доступное пользователям, и ранжирование по запросам – это то, на что мы обращаем свое внимание. Если страница содержит уникальную информацию, и неважно, это может означать, что она не будет соответствовать большинству запросов.

А что вы можете сказать относительно платных ссылок? Какова ваша политика?

У нас нет «белой» и «черной» политики относительно платных ссылок. Принципом остается ценность для пользователя. Если платная ссылка не имеет какой-либо ценности для пользователя, то и для нас она не представляет интереса. Наши алгоритмы направлены на определение ценности для пользователей. Мы постоянно убеждаемся, что естественные ссылки пользуются большей популярностью у пользователей, нежели платные ссылки.

Yahoo! продолжает фокусироваться на элементах, распознающих ссылки, ценные для пользователя, выстраивая механизмы в алгоритмах, которые ослабляют сигнал и собирают информацию о ценности ссылки в контексте. Они созданы не с тем, чтобы определять, платные это ссылки или нет. Как я уже говорил, мы выяснили, что платные ссылки представляют меньшую ценность для пользователей. Этим мы и руководствуемся.

Несколько технических вопросов. Расскажите о том, как Yahoo! обращается с NoIndex?

Присутствие NoIndex на странице подразумевает, что ее содержание не будет искаться и она не будет проиндексирована в нашей поисковой системе. Если на странице есть мета-тег NoIndex, то она не будет уже восстановлена.

А если большое количество пользователей пытаются перейти на страницу, которая содержит NoIndex, по действующим ссылкам, а эта страница перенаправляет их на другие страницы с качественной информацией; передает ли эта страница вес ссылки другим страницам на которые ведет?

Мы индексируем страницу и показываем адрес URL в результатах поиска, если она действительно популярна в сети, даже если она содержит тег NoIndex. По существу это применимо в тех ситуациях, когда страница сама по себе имеют высокую ценность, и имеется много релевантных внешних ссылок, отвечающих определенным запросам.

В настоящее время мы показываем страницы, содержащие тег NoIndex, если это рекомендовано анкор-текстом. Также мы обнаруживаем ссылки на странице с тегом NoIndex и передаем их значение соответствующим документам.

В robots.txt прописывается право на индексирование страницы. При каких условиях страница все еще может попасть в индекс?

Если файлы robots.txt говорят не просматривать, мы не будем просматривать, мы даже не будем пытаться восстанавливать страницу для просмотра. Но если анкор-текст определяет сильную потребность в том, чтобы показать ее для определенных запросов, тогда она может появиться.

Приведу такой пример. Сайт библиотеки конгресса запрещен для индексации файлом robots.txt, но эта страница была доступна для просмотра в нашей поисковой системе, потому что это было нужно пользователям. Так что она будет доступна в том случае, если будет известно, что эта страница соответствует определенному запросу.

Актуальной остается проблема дублированного контента. Как поступает Yahoo, когда обнаруживает одну и ту же информацию на двух разных сайтах?

Наша цель – иметь хороший имидж, уникальное содержание страниц для пользователей и обеспечивать максимальное количество релевантной информации на каждый запрос, который делает пользователь. Поэтому мы прикладываем усилия к тому, чтобы постоянно находить источники с одинаковым содержанием, распознавать первоначальный источник, насколько это возможно, и приписывать ему авторское право на данную информацию. Затем мы применяем это для каждого запроса. Скажем, содержание сайта А дублирует содержание сайта Б, а мы узнаем, что сайт А – первоначальный. Тогда в качестве результата поиска, связанного с этим содержанием, появится скорее сайт А. Но если в запросе говорится, что необходима эта информация с сайта Б, то мы постараемся ее предоставить.

Но ведь не всегда легко определить авторство.

Это правда. Не так-то просто определить лучшую страницу, но это является частью наших алгоритмических усилий, и мы продолжаем это делать. И существует множество факторов, которые зачастую работают.

Если поступают жалобы на нарушение авторских прав, они рассматриваются командой техподдержки и редакторов, а впоследствии могут быть пресечены. Так что если вы или любой другой владелец сайта уверены, что ваш материал взят без вашего согласия, сообщите нам об этом - мы обязательно рассмотрим вашу жалобу и сохраним материал, который был украден.

Подводя итоги, я хотел бы спросить, что бы вы хотели посоветовать издателям и оптимизаторам поисковых систем, исходя из опыта работы Yahoo.

Базовые принципы остаются прежними; больше думайте о пользователях. Следуйте правилам поисковых систем, чтобы мы быстрее смогли распознать содержание вашего сайта. Не пренебрегайте инструментами, которые наша команда разрабатывает для вас, например, Yahoo Site Explorer является огромным пространством для изучения того, что мы делаем.

Интервью взял Эрик Эндж (Eric Enge), президент Stone Temple Consulting (консалтинговой компании по вопросам SEO)

Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
SEOnews и Serpstat запускают конкурс для интернет-маркетологов
Анна Ольяная
4
комментария
0
читателей
Полный профиль
Анна Ольяная - благодарю :)
Как построить качественную ссылочную массу сайта
Айрат Рахимзянов
39
комментариев
0
читателей
Полный профиль
Айрат Рахимзянов - Спасибо Кирилл. Сейчас восстановилась работа сервиса: take.ms/ttXrw
«Я оптимизировал сайт, а он не в ТОП! Что делать?»
Павел Горбунов
7
комментариев
0
читателей
Полный профиль
Павел Горбунов - Как можно в инструменте tools.pixelplus.ru/tools/text-natural сравнить текст со страницы конкурента и со своей страницы? Я вижу возможность только для проверки одного урла.
Мир глазами поисковых систем
Александр Рунов
4
комментария
0
читателей
Полный профиль
Александр Рунов - Какой регион, если не секрет? В Мск, в ряде ВК тематик (в тех же "окнах" или "колесах"), без работы с внешними факторами по ВЧ запросам в ТОП не выплывешь. Хотя в большинстве направлений вполне реально.
Влияние HTTPS на ранжирование региональных поддоменов в Яндексе
Екатерина Иванова
1
комментарий
0
читателей
Полный профиль
Екатерина Иванова - Посмотрите на сколько упал трафик и на сколько потом вырос:упал на 10-20% на 1 месяц, а вырос в итоге в 5 раз. Одним мартовским трафиком всё падение перекрыли. Или можно ждать Яндекс неопределённое количество времени со стартовым уровнем трафика. Упущенные возможности и всё-такое.
Google.ru внесли в реестр запрещенных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
Монетизация сайта. Как, когда, сколько?
Ruslan Baybekov
2
комментария
0
читателей
Полный профиль
Ruslan Baybekov - Максим, добавили возможность вывода дохода на Яндекс Деньги и WMR.
Интеграция call tracking и CRM: углубленный анализ данных о звонках и продажах
Денис
2
комментария
0
читателей
Полный профиль
Денис - Какой смысл вообще в облачных CRM, обрезанный фугкционал, свое дописать невозможно, слив клиентов другим компаниям. Серверные бесплатные CRM куда надежней и кастамизируй как хочешь.
SEMrush: факторы ранжирования в Google в 2017 году
Анна Макарова
292
комментария
0
читателей
Полный профиль
Анна Макарова - Уважаемый S1, я тоже понимаю, что есть такие люди, которые заметив допущенную неточность несутся на всех парусах продемонстрировать "силу" своего ума. Спасибо вам за пристальное внимание. Это поможет нам быть лучше.
Дашборд Метрика 2.0 – мониторинг проблем на сайте в режиме реального времени
Константин Сокол
24
комментария
0
читателей
Полный профиль
Константин Сокол - Есть динамика трафика по разделам. Этот виджет показывает некоторые фильтры, в результате которых с поиска выпадают целые разделы.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
292
Комментариев
262
Комментариев
219
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
52
Комментариев
48
Комментариев
45

Отправьте отзыв!
Отправьте отзыв!