Россия+7 (495) 960-65-87

Мэтт Каттс: коротко о поиске Google

Россия+7 (495) 960-65-87
Шрифт:
0 2631

Один из пользователей попросил Мэтта Каттса, руководителя группы Google Webspam, рассказать, как работает поиск Google. «Это почти то же самое, что расскажите мне все о Google», - пошутил Мэтт, но попытался в общих словах обрисовать процесс.

Если вы хотите стать лучшей поисковой системой в мире, нужно уметь делать хорошо три вещи: сканировать всесторонне и глубоко интернет, индексировать страницы, ранжировать и возвращать наиболее релевантные результаты, говорит Мэтт.

Краулинг гораздо более сложный процесс, чем его себе представляют пользователи. Чем выше у страницы page rank, чем чаще на нее ссылаются авторитетные источники, тем больше вероятности, что поисковик быстрее просканирует сайт. Фактически, краулинг можно представить в строго определенном порядке с учетом page rank. На все про все уходит где-то порядка 30 дней. Еще две недели уходят на индексацию и обработку данных. Причем для постоянного обновления результатов поисковый робот заходит на сайты с высоким PR снова и снова, чтобы посмотреть, не появилось ли что-то новое или важное.

Затем начинается индексация документов. Предположим, вам нужно найти Katy Perry. Google оценивает, в каких документах встречается Katy, в каких появляется слово Perry. Допустим Katy есть в документах 1, 2, 89, 555, 789, Perry - в документах 2, 8, 73, 555, 1000. После обнаружения этих документов Google смотрит на порядок слов и как эти слова встречаются в документе. Если на странице есть Katy, но нет Perry, она отбрасывается поисковиком. Документ номер 2 имеет Katy и Perry, поэтому Google его оставляет.

Отобрав необходимые документы поисковик решает, как их ранжировать дальше. Для этого существует page rank и более 200 факторов ранжирования. Например, есть сайт, где слово Perry встречается только однажды, и где-то на странице еще есть слово Katy. И есть документ, где слова Katy и Perry идут друг за другом. Google пытается найти баланс: обнаружить качественный документ с высокой репутацией и одновременно выдать сайт, который отвечает на запрос пользователя. И так сотни миллионов раз в день, когда пользователь заходит на сайт Google, он вбивает запрос и получает самые релевантные по нашему мнению результаты меньше, чем за полсекунды.

Для тех, кто хочет узнать больше о работе Google, page rank, Мэтт Каттс посоветовал познакомиться с различными статьями и научными работами.


(Нет голосов)
Читайте нас в Telegram - digital_bar

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
    ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
    Рейтинг Известности 2018: старт народного голосования
    Михаил Р
    1
    комментарий
    0
    читателей
    Полный профиль
    Михаил Р - 1. Demis 2. кокс 3. Ашманов 4. Скобеев 5. Digital Strategy
    Рейтинг Известности 2018: второй этап народного голосования
    Константин Сокол
    3
    комментария
    0
    читателей
    Полный профиль
    Константин Сокол - Кто был ответственный за дизайн таблицы голосования? Копирайтер?
    Кейс: вывод лендинга по изготовлению флагов на заказ в ТОП 1 по Санкт-Петербургу
    utka21
    5
    комментариев
    0
    читателей
    Полный профиль
    utka21 - Кейс как кейс. Для некоторых станет вполне возможно полезным. ( Для конкурентов точно) . А вот с комментариями , что то пошло не так )
    Сколько ссылок помогут продвинуть молодой сайт
    Антон
    1
    комментарий
    0
    читателей
    Полный профиль
    Антон - Да, Игорек Рудник из Reffer знает толк в ссылках. Вот только знает ли толк владелец сайта, а вернее услуги что предоставляют пользователям? Если с коммерческими факторами всё туго то на ссылках далеко не уедешь - это будет временный эффект и долго такая страница не сможет провисеть в поиске когда с другими факторами не всё Гуд. Сейчас Украина сидит на Google и там без ссылок как без воды никуда, поэтому там вплотную заняты ссылочным продвижением, а как насчет других вариантов продвижения?
    Обзор популярных CMS: плюсы и минусы
    Олег
    3
    комментария
    0
    читателей
    Полный профиль
    Олег - Опять же - разве есть более-менее распространенный движок, который не заразят, если его не обновлять? А если обновлять - modx (ну, как минимум Evolution, хотя не думаю, что у Revo есть какие-нибудь отдельные проблемы) в этом плане ничем не хуже других движков. И, видимо, не случайно, имена php-файлов с вирусами, которые встречаются на зараженных сайтах с разными движками, часто имеют имена в духе wp-db.php. По моему личному опыту, самый подвергаемый атакам движок (не утверждаю, что самый уязвимый, возможно, именно в силу своей распространенности) – WordPress. Не понимаю, почему, – обновляется он еще проще, обновления выходят часто. Но вот такой вот мой личный опыт.
    Как использовать Python для LSI-копирайтинга
    Evgeny Montana
    6
    комментариев
    0
    читателей
    Полный профиль
    Evgeny Montana - спасибо)
    Стартовал сбор заявок на участие в рейтинге «Известность бренда SEO-компаний 2018»
    Артем Первухин
    1
    комментарий
    0
    читателей
    Полный профиль
    Артем Первухин - Make KINETICA Great Again!
    Инструкция: настраиваем цели Яндекс.Метрики через Google Tag Manager
    Roman Gorkunenko
    1
    комментарий
    0
    читателей
    Полный профиль
    Roman Gorkunenko - Здравствуйте. Подскажите, пожалуйста, можно с айпи метрики вытащить среднюю стоимость клика по утм меткам? В метрике есть такой шаблон tags_u_t_m, но он не совместим с меткой директа, у них разные префиксы.
    Аудит структуры интернет-магазина мебели от «Ашманов и партнеры»
    Дмитрий
    7
    комментариев
    0
    читателей
    Полный профиль
    Дмитрий - Сергей, а вы допускаете, что вся ваша жизнь - seo-миф?
    BDD 2018: Как загнать сайт под фильтр без ПФ и ссылочного. Конкуренция в сложных нишах и методы защиты
    Гость
    1
    комментарий
    0
    читателей
    Полный профиль
    Гость - Какой там год) судя по этому "кейсу", чувак либо вообще не в теме, либо это делал кто то вместо него, но делал очень коряво
    ТОП КОММЕНТАТОРОВ
    Комментариев
    910
    Комментариев
    834
    Комментариев
    554
    Комментариев
    540
    Комментариев
    483
    Комментариев
    373
    Комментариев
    341
    Комментариев
    262
    Комментариев
    243
    Комментариев
    171
    Комментариев
    156
    Комментариев
    137
    Комментариев
    121
    Комментариев
    99
    Комментариев
    97
    Комментариев
    97
    Комментариев
    96
    Комментариев
    80
    Комментариев
    67
    Комментариев
    65
    Комментариев
    60
    Комментариев
    59
    Комментариев
    57
    Комментариев
    55
    Комментариев
    54

    Отправьте отзыв!
    Отправьте отзыв!