Мэтт Каттс: коротко о поиске Google

Россия+7 (495) 960-65-87
Шрифт:
0 2143

Один из пользователей попросил Мэтта Каттса, руководителя группы Google Webspam, рассказать, как работает поиск Google. «Это почти то же самое, что расскажите мне все о Google», - пошутил Мэтт, но попытался в общих словах обрисовать процесс.

Если вы хотите стать лучшей поисковой системой в мире, нужно уметь делать хорошо три вещи: сканировать всесторонне и глубоко интернет, индексировать страницы, ранжировать и возвращать наиболее релевантные результаты, говорит Мэтт.

Краулинг гораздо более сложный процесс, чем его себе представляют пользователи. Чем выше у страницы page rank, чем чаще на нее ссылаются авторитетные источники, тем больше вероятности, что поисковик быстрее просканирует сайт. Фактически, краулинг можно представить в строго определенном порядке с учетом page rank. На все про все уходит где-то порядка 30 дней. Еще две недели уходят на индексацию и обработку данных. Причем для постоянного обновления результатов поисковый робот заходит на сайты с высоким PR снова и снова, чтобы посмотреть, не появилось ли что-то новое или важное.

Затем начинается индексация документов. Предположим, вам нужно найти Katy Perry. Google оценивает, в каких документах встречается Katy, в каких появляется слово Perry. Допустим Katy есть в документах 1, 2, 89, 555, 789, Perry - в документах 2, 8, 73, 555, 1000. После обнаружения этих документов Google смотрит на порядок слов и как эти слова встречаются в документе. Если на странице есть Katy, но нет Perry, она отбрасывается поисковиком. Документ номер 2 имеет Katy и Perry, поэтому Google его оставляет.

Отобрав необходимые документы поисковик решает, как их ранжировать дальше. Для этого существует page rank и более 200 факторов ранжирования. Например, есть сайт, где слово Perry встречается только однажды, и где-то на странице еще есть слово Katy. И есть документ, где слова Katy и Perry идут друг за другом. Google пытается найти баланс: обнаружить качественный документ с высокой репутацией и одновременно выдать сайт, который отвечает на запрос пользователя. И так сотни миллионов раз в день, когда пользователь заходит на сайт Google, он вбивает запрос и получает самые релевантные по нашему мнению результаты меньше, чем за полсекунды.

Для тех, кто хочет узнать больше о работе Google, page rank, Мэтт Каттс посоветовал познакомиться с различными статьями и научными работами.


Читайте нас в Telegram - digital_bar

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
    ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
    Рейтинг «Известность бренда SEO-компаний 2017»: народное голосование
    Иван
    1
    комментарий
    0
    читателей
    Полный профиль
    Иван - 1) IT-Agency 2) Пиксели 3) 1ps 4) Ингейт 5) Нетпики
    «Баден-Баден»: как выйти из-под фильтра
    Сергей Дембицкий «Sima-Land.ru»
    17
    комментариев
    0
    читателей
    Полный профиль
    Сергей Дембицкий «Sima-Land.ru» - Скрины Метрики показывать не буду, но мы (sima-land.ru - 1,5 млн. стр. в поиске Яндекс) в сентябре загремели под ББ, в разгар сезона и вышли из-под фильтра, спустя 50 дней, удалив все тексты с сайта: категории + карточки товаров (описание). Трафик с Google только вырос. Тексты возвращать собираемся, но процесс будет длительный, тексты будем теперь писать исключительно полезные, т.к. было больно :-))
    Второе дыхание ссылочного продвижения
    Автопилот
    14
    комментариев
    0
    читателей
    Полный профиль
    Автопилот - Еще лучше, когда продвижение осуществляется комплексно :)
    Кейс: продвигаем бизнес по продаже пластиковых окон в Москве
    Иван Стороженко
    5
    комментариев
    0
    читателей
    Полный профиль
    Иван Стороженко - 1. По началу вообще не использовали, сейчас уже много каналов используется. 2. Все может быть, в принципе сайты должны быть удобны для пользователя, для этого и нужна схожесть между собой. Честно говоря старались брать все самое интересное у конкурентов + подкреплять своими идеями.
    Западные специалисты выяснили, как повысить позиции ресурса в выдаче Google
    Максим Мирошник
    2
    комментария
    0
    читателей
    Полный профиль
    Максим Мирошник -
    «Прямая линия» с Александром Алаевым («АлаичЪ и Ко»): отвечаем на вопросы
    Александр Алаев
    13
    комментариев
    0
    читателей
    Полный профиль
    Александр Алаев - Роман. Тут ответ очень простой. Каждый запрос можно четко разделить на коммерческий или некоммерческий. "Купить слона" и его длинные хвосты - коммерческий. "Как выбрать слона" и подобные - информационные. Вот под коммерческие ключи должны быть страницы услуг или каталога товаров. А под информационку - блог. Очень важно не путать их, тем более несоответствующая коммерческим факторам страниц просто не продвинется, то есть по запросу с "купить" блог никогда не будет показываться в выдаче, так же как и страница услуги/товаров не покажется по "как выбрать". Понятно примерно?
    Инфографика: самые распространенные SEO-ошибки Рунета
    Dmitro Grunt
    2
    комментария
    0
    читателей
    Полный профиль
    Dmitro Grunt - Кстати, у проектов которые продвигает Нетпик все тайтлы не более 65 символов? Или вы надеетесь что кто то послушает советов и отдаст вам часть трафика? :-)
    7 причин не работать на биржах копирайтинга
    Dasha Shkaruba
    6
    комментариев
    0
    читателей
    Полный профиль
    Dasha Shkaruba - Спасибо за мнение! Кстати, на бирже главреда прием анкет закрыт
    «Прямая линия» с Артуром Латыповым: отвечаем на вопросы
    God Koss
    1
    комментарий
    0
    читателей
    Полный профиль
    God Koss - Добрый день! Есть сайты одной компании продвигающиеся в разных странах. .ru .com .net. На российском сайте два языка ru и en, на остальных до 10 языков. Недавно сайт ru по основному брендовому запросу выпал из выдачи Яндекс но после апа вернулся на вторую позицию. На вопрос аффилирования в тех поддержку, получит ответ, что всё в порядке и сайт com не учавствует в выдаче. Но он есть и занимает 1 место. Как быть в данной ситуации? Так же, после возврата в топ 10 по этому запросу зашла еще одна внутренняя страница. Могло ли это случиться из-за каннибализации запроса? Немного изменил description на внутренней, исключил вхождения брендового запроса. Жду апа. Хотел бы услышать ваше мнение. Заранее благодарю!
    Google.ru внесли в реестр запрещенных сайтов
    Гость
    1
    комментарий
    0
    читателей
    Полный профиль
    Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
    ТОП КОММЕНТАТОРОВ
    Комментариев
    910
    Комментариев
    834
    Комментариев
    554
    Комментариев
    540
    Комментариев
    483
    Комментариев
    373
    Комментариев
    314
    Комментариев
    262
    Комментариев
    229
    Комментариев
    171
    Комментариев
    156
    Комментариев
    137
    Комментариев
    121
    Комментариев
    97
    Комментариев
    97
    Комментариев
    95
    Комментариев
    80
    Комментариев
    78
    Комментариев
    67
    Комментариев
    60
    Комментариев
    59
    Комментариев
    55
    Комментариев
    54
    Комментариев
    52
    Комментариев
    49

    Отправьте отзыв!
    Отправьте отзыв!