Рекламные кампании для вашего бизнеса
Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 0-9
П

Парсинг

Парсинг — это автоматический сбор информации с какого-либо источника с целью его дальнейшей обработки и преобразования. Чаще всего парсинг осуществляется с использованием PHP, Perl или другого скриптового, сервисного языка программирования. Программа, которая используется для анализа и обработки данных, называется парсером. Готовые данные, как правило, выкладываются в базу данных, представляются в виде файла или в формате XML.

Примером парсинга может быть, к примеру, обработка сайта интернет-магазина, результатом которой является список товаров, представленных в каждой категории. Для сферы SEO можно привести собственный пример — так, поисковые роботы занимаются парсингом, анализируя страницы и сохраняя полученные данные о них в собственной базе. Эти данные затем используются поисковой системой для ранжирования проанализированных сайтов и формирования выдачи. Также парсинг лежит в основе любых сервисов для SEO-специалистов и маркетологов, позволяющих анализировать сайты из поисковой выдачи.

Однако бывает и так, что целью парсинга является не получение каких-то данных из обработанного контента, а сам контент, представленный в удобоваримой форме.

Фазы парсинга

Программы-парсеры работают по единому принципу, действуя в три этапа.

Сбор информации с одного или нескольких источников. В соответствии с заданными настройками программа обходит заданные источники информации в Сети. Поскольку чаще всего этими источниками являются веб-страницы, парсер обрабатывает их исходный HTML-код.

Получение и преобразование информации. Данные, которые были собраны на первом этапе, обрабатываются средствами парсера — чаще всего с использованием регулярных выражений. При необходимости на данной стадии информация может преобразовываться в нужный формат.

Генерация результатов. Итоговый этап, после которого программа выдает результат в заданном виде. Данные выводятся или записываются в удобной для пользователя форме.

Существует схожее, но не аналогичное понятие — граббинг. Этот процесс также предполагает сбор информации с различных веб-источников (HTML-страницы, RSS-лент, XML-документов) в одну базу данных. Разница заключается в том, что в результате граббинга пользователь получает данные в том же виде, что и в исходнике, в то время как парсинг дает возможность вычленить только нужную информацию и преподносить ее в другом формате.

Синонимы: нет
Все термины на букву «П»
Все термины в глоссарии

Ссылки по теме

... ключевых фраз», он подсказывает оптимизаторам поисковые запросы, которые присутствуют у конкурента, но которые отсутствуют на нашем проекте. 2. Парсинг поисковых подсказок Отчет «Анализ семантики / Поисковые подсказки» поможет найти для искомой ключевой фразы поисковые подсказки,...

Валерия Полякова
22.11.16 в 14:27
10 2558

... вот таким образом:  3. После этого загружаем весь список страниц с оператором: url в Key Collector: 4. Не забываем про настройку XML для более быстрого парсинга результатов: 5. Запускаем парсинг позиций:  Если документ проиндексирован, то позиция по запросу будет 1. 6. Ждем, когда закончится ...

Айрат Рахимзянов
22.05.16 в 10:33
17 12328

... что за многолетнюю практику я опробовал довольно большое количество парсеров, и всегда обращал внимание только на то, какие возможности парсинга сервис предоставляет и сколько стоит его использование. Последним парсером, на котором я обоснованно и надолго остановил свой выбор,...

Сергей Ахметов
18.05.16 в 13:18
15 18439

... конкурентов, т.к. содержат идентичные товары в каталоге, чтобы не вводить все вручную. Можно, конечно, заморочиться, пробить IP, с которого идет парсинг раз в неделю, и заблокировать его. Но они могут использовать прокси. Всех желающих поделиться своими вариантами решения проблемы ...

6 7540

... базового списка за счет фраз из правой колонки. Расширение Yandex Wordstat Assistant используется для удобства работы с wordstat.yandex.ru. Расширение за счет парсинга хвостов входных запросов KeyCollector – расширение списка запросов за счет парсинга через левую колонку wordstat.yandex.ru. При желании собираем ...

Александр Александров
03.03.16 в 15:30
23 32520
Отправьте отзыв!