×
Россия +7 (495) 139-20-33

Страницы результатов поисковых систем

Россия +7 (495) 139-20-33
Шрифт:
0 3573

В данной статье детальному рассмотрению будут подвергнуты следующие процессы работы поисковой системы: индексирование документов, обработка запросов, ранжирование результатов.

Невероятно, но факт, современные поисковые системы, которыми многие из нас пользуются, имеют в своей основе науку, насчитывающую уже не один десяток лет, известную как информационный поиск. На заре своего развития данная наука нашла основное применение в крупных организациях, таких как библиотеки, научно-исследовательские центры, правительственные лаборатории. В то время учеными были определены два основополагающих компонента успешного поиска. По аналогии можно выделить подобные компоненты и в современном поиске.

Первым является релевантность, определяющая степень соотношения контента, как результатов поиска, оригинальному запросу пользователя. Документ считается релевантным запросу в том случае, если слова запроса часто встречаются в тексте самого документа, особенно в наиболее важных его частях, таких как заголовок и подзаголовки. В современном поиске данный процесс известен как анализ документа. Современные поисковые системы проверяют наиболее значимые области веб-страниц: заголовок, мета-данные, тэги заголовков, основную часть текстового сообщения, чтобы определить, насколько близок контент страницы запросу.

Вторым компонентом является популярность. Все, кто писал курсовые работы, сталкивался с этим. Вспомните преподавателя, настойчиво требующего Вас обратить особое внимание на ссылки и библиографию источников, в частности, на те ссылки, которые встречаются несколько раз. Такие работы считаются популярными, следовательно, важными для исследуемой темы. В Интернете подобный процесс представлен в виде ссылочного анализа, с помощью которого поисковая система определяет общее количество входящих ссылок, кто ссылается на данную страницу или сайт, и что говорят о данной странице или сайте ссылающиеся источники.

В дополнение к релевантности и популярности, поисковым системам необходимо учитывать то, насколько источникам можно доверять. Продолжая проводить аналогию с университетской средой, можно предположить, что коммерческие интересы не повлияют на результаты поиска документа. Однако, в интерактивной среде все как раз наоборот. Одной из причин, почему ссылки со страниц с расширением .edu и .gov представляются более важными, является именно их некоммерческий характер. Техника анализа документов и ссылок предполагает изучение сотни процессов, проходящих в алгоритмах поисковой системы, и определение порядка выдачи результатов поиска пользователю.

Кому можно доверять

Желая получить больше информации о человеке, обычно предпринимают следующее: знакомятся с ним лично, либо наводят справки о нем. При оценке веб-сайта поисковая система выполняет то же самое: проверяет, как сам сайт оценивает себя, и как его оценивают другие сайты. Однако, преследуя финансовую выгоду, многие сайты могут завышать собственную оценку, прибегая к чрезмерному использованию мета-тэгов и ключевых слов, что до 1998 г. оставалось совершенно безнаказанным. Сейчас поисковые системы не так уж просто провести, политика наказаний порой излишне сурова.

Если забыть на время о самооценке сайтов, стоит вспомнить об определении популярности. Если сотни тысяч сайтов ссылаются на определенный сайт, то согласно теории, он должен быть популярным, а, следовательно, значимым. Если ссылки сделаны с сайтов, обладающих большим количеством входящих ссылок, это увеличивает вес всех исходящих, с подобных сайтов, ссылок. Только не стоит забывать о качестве ссылок. Так, например, ссылки с сайтов, обладающих высокой степенью доверия (например, сайты Гарвардского Университета, Агентства Рейтер, Министерства Юстиции США и т.д.), непременно окажут положительное влияние на позиции сайта. Соответственно, ссылки с сайтов низкого качества (например, входящие в состав ссылочных ферм) не принесут выгоды, а, возможно, и негативно скажутся в SERP.

Актуальным остается вопрос: как поисковые системы определяют значимость входящих ссылок на сайт. Анализу подвергается весь контент страницы, с которой делается ссылка. Вот, например, как работает PageRank Google: для определения важности ссылки во внимание принимается не только сама ссылка со страницы А на страницу B, но и текст страницы А.

Как поисковая система оценивает ссылки

На оценку качества ссылки влияет большое количество факторов. В рамках данной статьи представляется возможным рассмотреть лишь несколько из них, имеющих большее значение.

Одним из таких факторов является «ссылочный текст» - видимые символы или слова, кликая которые, осуществляется переход по гиперссылке. Например, на странице, рассказывающей об азартных играх, Вы находите следующую фразу «I’ve looked all over, but so far I’ve only found one place that keeps the Xbox360 consistently in stock». Если последние четыре слова являются гиперссылкой, то поисковый робот, столкнувшись с подобной фразой, сделает вывод, что страницы, на которые сделана ссылка (одной из которых может быть и eBay), были определены согласно фразе «Xbox360 consistently in stock». Многие считают, если определенные страницы релевантны определенному набору слов и ссылкам, содержащим данный набор слов, то сайт может быть высоко оценен даже при условии, если этот набор слов больше нигде на сайте не встречается.

Популярность сайта, определенная количеством входящих ссылок, влияет и на оценку сайта. Например, ссылка с SEO Chat на Ваш сайт имеет большой вес, однако ссылка с NYTimes.com будет весить намного больше. Определение подобных данных является одной из функций PageRank, хотя зачастую эти данные теряют свою актуальность (т.к. Google обновляет PageRank лишь каждые 3-6 месяцев).

Всем сайтам обрести популярность сложно. Возможно, именно поэтому поисковые системы стали замечать появление «тематических сообществ», раньше они представляли собой «webring-и». «Тематические сообщества» - сайты, объединенные общей тематикой и ссылками друг с другом. Отметим, что ссылка с сайта, состоящего в «тематическом сообществе», может приобрести больший вес, если он ссылается на страницу с подобной тематикой. В противном случае, вес ссылки будет намного меньше.

Текст, окружающий ссылку (не ссылочный текст), зачастую подвергается более тщательному анализу и оценке, чем остальной текст на странице. Таким образом, внутренние ссылки являются более значимыми. Предметом изучения ссылающейся страницы также является определение важности «голоса», который страница передает той, на которую ссылается.

Изучение языка

Уже рассмотрев такие функции поисковых систем, как индексирование и ранжирование, следует упомянуть о том, для чего выполняются все эти задачи, – об обработке запроса. И первое, с чем следует ознакомиться, это семантика, языкознание. Поисковые системы используют все свои знания в данных областях для того, чтобы представить релевантные запросу результаты. Вот почему, например, при запросе «старинный автомобиль», поисковик может представить наряду со страницами, содержащими данную фразу, страницы, имеющие отношение к запросу, но представленные синонимичной фразой «антикварный автомобиль».

Поисковые системы тщательно просматривают огромное количество информации, определяют родство слов на основе частоты их использования и контекстуального значения. Это значит следующее: чем больше данных соберет поисковая система, тем более точными будут результаты поиска. Для заметных перемен требуется немало времени. Однако следует отметить, что происходящие улучшения увеличивают скорость прямо пропорционально увеличению объема собранных поисковым роботом данных.

Можно смело утверждать, что поисковые системы не остановятся на достигнутом. Попытки улучшить понимание запросов пользователей будут предприниматься до тех пор, пока «не придут» к совершенству. Добившись идеала в понимании запросов, поисковые системы будут представлять совершенные результаты поиска.

По информации www.seochat.com

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
#SEOnews14: мы празднуем – вы получаете подарки!
Анна Макарова
0
комментариев
0
читателей
Полный профиль
Анна Макарова - Гость, добрый день! С победителями мы связывались сразу после розыгрыша. Если мы вам не написали, значит, ваш номер не выпал. Но не расстраивайтесь, у нас обязательно будут новые розыгрыши!
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
9
комментариев
0
читателей
Полный профиль
Михаил Мухин - Дожидаться 100 попыток не будем - не дождемся :) Подведем итоги и опубликуем решение 13 Декабря
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Георгий
1
комментарий
0
читателей
Полный профиль
Георгий - Все что рекомендуется в этой статье есть у w.tools. Ни разу не пожалел что подключился. Своя CDN сеть, кеш статики и динамики, минификация js\css и кешируемого html, оптимизация всех типов картинок и еще куча всего полезного. Сайт летает и я не знаю проблем. Могу рекомендовать от души.
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Ann Yaroshenko
5
комментариев
0
читателей
Полный профиль
Ann Yaroshenko - Дмитрий, добрый день! Если вы проставили на странице с автозапчастями rel=canonical ( а я вижу в коде, что не проставили) или в HTTP хедере, то бот, как правило: выберит ту страницу главной, которую вы указали в rel=canonical ссылке. Eсли же вы этого не сделали, то бот сам выберит оригинал (алгоритмы, по которым бот это делает, скрыты Googl-ом)
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Kosta Bankovski
4
комментария
0
читателей
Полный профиль
Kosta Bankovski - Спасибо за приятные слова! Буду и дальше делиться наработками ;)
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
Как вывести сайт в ТОП 10 Google в 2019 году
Ирина
8
комментариев
0
читателей
Полный профиль
Ирина - Работают. Как естественные, так и закупные. >Мои сайты в первую очередь заточены на яндекс Соболезную. >Насколько поисковые алгоритмы с гугловскими у него. Разница в 10 лет. Вон в Яше все долбят на ключи, на вхождения и прочий трэш из древностей. А у Гугла, вон почитайте про eat, ymyl Не все понятно но спасибо за ответы. Я так понимаю что с ссылками деть никто точно не знает) Ну это и хорошо вообщем. Самому разбираться как то интересней. Но не всегда. Есть к примеру 2captcha.com/ru и на него 100к ссылок есть. Ну а смысл какой?
Как я пытался купить CRM-систему, но мне ее поленились продать
Kristina
1
комментарий
0
читателей
Полный профиль
Kristina - Очень рекомендую CRM-систему польской фирмы Firmao. Все функции настраиваются в соответствии с индивидуальным потребностям компании! Советую попробовать бесплатную демо-версию, чтобы попробовать все необходимые функции, без лишних кнопок и траты дополнительных финансов! :) Сайт: firmao.ru/info
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
360
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
79
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!