×
Россия +7 (495) 139-20-33

Энциклопедия интернет-маркетинга. Поисковая система: предназначение, поведение, состав

Россия +7 (495) 139-20-33
Шрифт:
0 7329

Лого.jpg

SEOnews запустил проект для специалистов и клиентов «Энциклопедия интернет-маркетинга», в рамках которого редакция публикует обучающие материалы от ведущих агентств на рынке. В итоге мы планируем выпустить полное, практически полезное и актуальное электронное руководство. 

***

Энциклопедия интернет-маркетинга. Поисковая система: предназначение, поведение, состав 

Поисковая система (search engine) помогает найти нужную информацию. Алгоритм такой: пользователь вбивает в нужной строке интересующий запрос, система выдает ссылки на ресурсы, где он может получить ответ.

Поисковиков немало, между ними — жесткая конкуренция. В Рунете лидируют Яндекс и Google, сильно отстает, но все же используется поисковый сервис Mail.ru, незначительная доля пользователей приходится на Bing и Rambler.

image02.jpg

Данные LiveInternet.ru за последние 3 месяца (октябрь, ноябрь и декабрь 2015)

Чем выше качество поиска, тем большую популярность имеет поисковик.

Как работает поисковая система?

Поисковая система — сложный комплекс. Основные ее составляющие — оболочка (сайт) и программно-аппаратный набор. Каждый поисковик имеют свою уникальную структуру, однако принцип работы схожий.

● Поисковые роботы занимаются поиском и сохранением новых документов.

● Индексаторы анализируют и обрабатывают загруженные документы.

● Обработанная информация хранится в базе данных.

● Система запросов и выдачи принимает фразу, заданную пользователем, и выводит релевантные ей сайты.

image03.jpg

Этапы поиска

1. Поисковый робот («паук», краулер) анализирует содержимое страницы сайта и сохраняет его на сервере. Затем переходит по найденным ссылкам для поиска новой информации. На этом этапе образуется большое количество необработанных и непригодных для выдачи данных. Их предстоит проиндексировать.

2. Индексатор разбивает скачанные страницы на составные части, затем анализирует их, применяя собственные морфологические и лексические алгоритмы. Сортировка позволяет систематизировать информацию, собранную роботами. Проанализированные элементы страницы записываются в индексную базу данных.

3. База данных хранит в себе преобразованные специальным образом параметры всех скачанных и проиндексированных страниц. Актуальная база называется индексом. В ней хранятся страницы, подготовленные к выдаче.

4. Система обработки запросов и выдачи результатов — важнейший элемент поисковой системы. Именно от алгоритмов, которые в ней заложены, зависит качество выдачи и скорость поиска.

5. Запрос, который получила от пользователя система, в обязательном порядке анализируется. Результат передается модулю ранжирования, после чего все документы обрабатываются с целью выявления страниц, наиболее релевантных запросу. Далее для каждого найденного документа генерируются сниппеты и перед пользователем предстают страницы выдачи (SERP).

image04.png

Что такое сниппет?

Сниппет состоит из заголовка, краткой аннотации и ссылки на документ. Ключевые слова выделяются жирным шрифтом. Например, Google обычно формирует аннотацию из описания страницы (description). Если описания нет или оно содержит нерелевантую информацию, в качестве аннотации используется более подходящий фрагмент текста.

image05.jpg

Яндекс формирует аннотацию из фрагментов документа, содержащих слова из запроса пользователя.

image06.jpg

Чтобы удержать пользователя, система должна предоставлять максимально релевантные документы. Поэтому поисковики постоянно развиваются и улучшают свои алгоритмы.

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
#SEOnews14: мы празднуем – вы получаете подарки!
Анна Макарова
0
комментариев
0
читателей
Полный профиль
Анна Макарова - Гость, добрый день! С победителями мы связывались сразу после розыгрыша. Если мы вам не написали, значит, ваш номер не выпал. Но не расстраивайтесь, у нас обязательно будут новые розыгрыши!
Google Data Studio: делаем красивые отчеты по контекстной рекламе для клиентов
Светлана Зубрицкая
1
комментарий
0
читателей
Полный профиль
Светлана Зубрицкая - Нужно убрать пробелы между строк и заменить кавычки на вот такие "
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Георгий
1
комментарий
0
читателей
Полный профиль
Георгий - Все что рекомендуется в этой статье есть у w.tools. Ни разу не пожалел что подключился. Своя CDN сеть, кеш статики и динамики, минификация js\css и кешируемого html, оптимизация всех типов картинок и еще куча всего полезного. Сайт летает и я не знаю проблем. Могу рекомендовать от души.
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Ann Yaroshenko
5
комментариев
0
читателей
Полный профиль
Ann Yaroshenko - Дмитрий, добрый день! Если вы проставили на странице с автозапчастями rel=canonical ( а я вижу в коде, что не проставили) или в HTTP хедере, то бот, как правило: выберит ту страницу главной, которую вы указали в rel=canonical ссылке. Eсли же вы этого не сделали, то бот сам выберит оригинал (алгоритмы, по которым бот это делает, скрыты Googl-ом)
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Kosta Bankovski
4
комментария
0
читателей
Полный профиль
Kosta Bankovski - Спасибо за приятные слова! Буду и дальше делиться наработками ;)
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
Как вывести сайт в ТОП 10 Google в 2019 году
Ирина
8
комментариев
0
читателей
Полный профиль
Ирина - Работают. Как естественные, так и закупные. >Мои сайты в первую очередь заточены на яндекс Соболезную. >Насколько поисковые алгоритмы с гугловскими у него. Разница в 10 лет. Вон в Яше все долбят на ключи, на вхождения и прочий трэш из древностей. А у Гугла, вон почитайте про eat, ymyl Не все понятно но спасибо за ответы. Я так понимаю что с ссылками деть никто точно не знает) Ну это и хорошо вообщем. Самому разбираться как то интересней. Но не всегда. Есть к примеру 2captcha.com/ru и на него 100к ссылок есть. Ну а смысл какой?
Как я пытался купить CRM-систему, но мне ее поленились продать
Kristina
1
комментарий
0
читателей
Полный профиль
Kristina - Очень рекомендую CRM-систему польской фирмы Firmao. Все функции настраиваются в соответствии с индивидуальным потребностям компании! Советую попробовать бесплатную демо-версию, чтобы попробовать все необходимые функции, без лишних кнопок и траты дополнительных финансов! :) Сайт: firmao.ru/info
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
360
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
79
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!