Cбор статистики из log-файлов

Россия+7 (495) 960-65-87
Шрифт:
0 3084

1. Введение
2. Инструменты сбора статистики
3. Скрипт для сбора статистики из log-файлов
4. Заключение

1. Введение

Статистика – это наука, требующая внимания, времени и терпения. Но то, что в Интернете (а в частности, в Рунете) называют «статистикой веб-сайтов», к науке пока отношение имеет только косвенное. Администраторы сайтов время от времени посматривают на хиты и хосты, радуются, когда подобные показатели возрастают, и удивляются, – когда снижаются.

Однако сегодня Интернет-статистика – очень мощный инструмент, который при правильном использовании сможет помогать Вашему бизнесу. Недаром многие иностранные фирмы, предоставляющие подобные сервисы, гордо называют их «EBusiness Intelligence Products».

В Рунете с Интернет-статистикой сложилось довольно-таки странная картина (прежде всего, это относится к коммерческим проектам, корпоративным сайтам). Одни при слове «статистика» недоуменно пожимают плечами. Другие утверждают, что, кроме счетчика HotLog, им ничего и не надо. Третьи заказывают дорогие статистические online-системы только для внутреннего использования, просматривают графики и отчеты, не делая при этом никаких существенных выводов. Некоторые же используют статистические отчеты для того, чтобы понять, что еще можно улучшить в предоставляемых сервисах, переносят опыт в offline, анализируют эффективность маркетинговых акций.

2. Инструменты сбора статистики

Счетчики. Пожалуй, самый известный и популярный в настоящее время способ получить сведения о посетителях Интернет-ресурса. Количество подобных счетчиков (порою объединенных с рейтингами) исчисляется десятками. Среди них можно выделить несколько лидеров: HotLog, SpyLOG, Liveinternet, Rating@Mail.ru, Rambler’s Top100 и некоторые другие.

Нестандартные счетчики. Существует ряд систем, которые пытаются интерпретировать статистические данные не совсем обычным способом. Среди таких систем – Netvertising и IntelliMetr. Специфика первой в том, что она объединяет данные, полученные от счетчиков, с данными анкет, регистраций и т.п. Специфика второй – в бизнес-подходе: сервис предоставляет информацию о продажах, регистрациях, эффективности работы партнеров – обо всем, что интересует маркетологов.

Анализаторы log-файлов. Принцип работы этих систем – в анализе стандартной информации, накапливаемой в файлах журнала любого веб-сервера. Наиболее популярным бесплатным анализатором является Analog.

Собственная система статистики. Для большинства коммерческих проектов подобная система является оптимальным вариантом. Это – не самое дешевое решение, но позволяющее реализовать практически все ваши мысли и пожелания. Однако для создания подобной системы потребуется немалый опыт, а также довольно длительный период для устранения ошибок и недочетов созданной системы.

Более подробную информацию об Интернет-статистике можно найти на сайте Oborot.rU.

3. Скрипт для сбора статистики из log-файлов

Итак, мы рассмотрели основные инструменты для сбора статистики в Интернете. Со счетчиками все просто: зашли на интересуемый сайт, предоставляющий подобный сервис, зарегистрировались и можно «пользоваться».

С программами-анализаторами немного сложнее: если на приобретение программного обеспечения требуется сравнительно малое время и небольшие затраты, то для освоения потребуется достаточно длительное время (а порою и дополнительные затраты).

Создание же собственной системы статистики для многих – совершенно неприемлемый вариант: существенные временные и материальные затраты на реализацию подобного проекта могут совершенно не окупиться, поэтому позволить подобное могут лишь большие корпоративные сайты.

Что же делать маленьким и беззащитным, но гордым и принципиальным? Можно попробовать создать собственную небольшую систему статистики – своеобразный гибрид программы-анализатора и счетчика. Подобную систему всегда будет просто подстроить под себя, постоянно совершенствуя и дополняя ее новыми возможностями.

Для решения поставленной задачи напишем скрипт, позволяющий собирать статистику из log-файлов произвольного веб-ресурса.

Сразу стоит сказать, что форматы log-файлов на различных сайтах зачастую отличаются друг от друга. Поэтому для использования приведенного ниже скрипта в собственных целях необходима его достаточно простая корректировка (регулярного выражения, интересуемых User-Agent и т.д.).


html>
head>
  title>Сбор статистики из log-файловtitle>
  < meta http-equiv="content-type" content="text/html; charset=windows-1251">
В  < meta http-equiv="content-language" content="ru">



* {
В  font-family: Arial, Helvetica, sans-serif;
В  font-size: 12px;
}



function ip_st(state)
{
В  if (document.all)
В  {
В В В  document.all.ip.disabled = state;
В В В  document.all.req_ip.disabled = state;
В  }
В  else
    if (document.getElementById) // Для Netscape/Mozilla
В В В  {
В В В В В  document.getElementById('ip').disabled = state;
В В В В В  document.getElementById('req_ip').disabled = state;
В В В  }
}

function cd_st(state)
{
В  if (document.all)
В  {
В В В  document.all.code.disabled = state;
В В В  document.all.req_code.disabled = state;
В  }
В  else
    if (document.getElementById) // Для Netscape/Mozilla
В В В  {
В В В В В  document.getElementById('code').disabled = state;
В В В В В  document.getElementById('req_code').disabled = state;
В В В  }
}

function ua_st(state)
{
В  if (document.all)
В  {
В В В  document.all.user_agent.disabled = state;
В В В  document.all.req_user_agent.disabled = state;
В  }
В  else
    if (document.getElementById) // Для Netscape/Mozilla
В В В  {
В В В В В  document.getElementById('user_agent').disabled = state;
В В В В В  document.getElementById('req_user_agent').disabled = state;
В В В  }
}



В 
    Введите URI интересующего log-файла:

В В В  ">
В В В 

В В В 


    Выберите отображаемые поля:
В В В 

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
    ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
    32 инструмента в помощь SEO-специалисту
    Игорь
    1
    комментарий
    0
    читателей
    Полный профиль
    Игорь - отличная подборка, сам многим из этих сервисов пользуюсь (ETXT, TEXT.RU, Адаптивность, Pingdom Website Speed Test, Google PageSpeed Tools, 2IP, Whois, Букварикс) Правда не мог найти достойного кластеризатора, но потом наткнулся на вот этот seoquick.com.ua/keyword-grouping/ не сочтите за рекламу:) Было бы интересно услышать ваше мнение о нем. Мне очень даже зашел, из-за скорости работы. Как говорит автор - 100 000 запросов за несколько минут. Я с такими цифрами правда не работал, обычно это до 30 000 точно, но работает очень быстро и в правду. Ну и бесплатно, думаю, это был еще один решающий фактор для меня
    Исследование: влияние smart-ссылок на продвижение по СЧ-запросам
    Анатолий Шевчик
    1
    комментарий
    0
    читателей
    Полный профиль
    Анатолий Шевчик - +1097988
    SEO глазами клиентов 2018
    Анна Макарова
    332
    комментария
    0
    читателей
    Полный профиль
    Анна Макарова - Нет, мы не собирали такую информацию.
    Не очень удачный кейс продвижения сайта по услуге «Трезвый водитель» в Москве
    Александр Селенков
    1
    комментарий
    0
    читателей
    Полный профиль
    Александр Селенков - Работа проделана огромная. Интересный кейс, все детально и понятно изложено.
    Два идеальных способа разориться на старте интернет-магазина
    Стас
    4
    комментария
    0
    читателей
    Полный профиль
    Стас - Seonews в последнее время такую чушь несет! Где вы таких афторов находите? Статья ничего не стоит и несет чушь! Кто хоть немного понимает в этом так вам и скажет, и такие де комментаторы горе-сеошники, просто смешно читать, вы хоть модерируете ваши статьи или просто для воды на сайте?! Бред сивой кобылы эта статья до самой последней точки!!!
    Яндекс перестал индексировать сайты, созданные на Wix
    Константин Даткунас
    3
    комментария
    0
    читателей
    Полный профиль
    Константин Даткунас - Было бы интересно посмотреть саму выборку из 10 000 и методику анализа.
    4 способа быстро собрать теги для сайта
    Рустем Низамутинов
    5
    комментариев
    0
    читателей
    Полный профиль
    Рустем Низамутинов - Расписал и закинул в Google Docs, а то здесь в комментариях ссылки на активны. docs.google.com/document/d/1r0TZLNrQyYLdIzDQsD5YKlMG41HUGQgEep3bxE_ij-M/edit?usp=sharing
    Эксперимент: как уникальность контента влияет на продвижение сайта
    Гоша
    4
    комментария
    0
    читателей
    Полный профиль
    Гоша - Ну да! Тырить легче, чем самому писать... Или хотя бы заказать. Ещё и хвастаемся. Поисковики - не дураки - найдется фильтр и на тех, что воруют чужой контент. Еще немного... еще чуть-чуть. Получается, если ты украл в магазине - ты вор, а если в интернете - ты предприниматель. Успеха!
    Яндекс: как мы модерируем объявления
    Гость
    5
    комментариев
    0
    читателей
    Полный профиль
    Гость - Это ж Яндекс, чего вы ожидали-то? Коммерческая структура с раздутым штатом, задачей которой является заработать больше денег. Любыми методами. Задача всех пользователей посадить на Директ, даже если придется разрушить суть рунета, реализуется по полной программе. Все возражающие караются и выпиливаются. И каждый из сотрудников делает все возможное и невозможное, чтобы реализовать любую дурацкую идею - за это еще и премию выхватить можно. Даже если потом придется выполнять "откат", премиальные уже заплачены. Так было с одним из фильтров Яндекса, так было с купленным им сайтом Кинопоиска, который из русскоязычной энциклопедии кино был превращен за безумные деньги в банальный платный онлайн-кинотеатр.
    Как мы разработали и вывели в ТОП сайт курсов рисования
    Иван Стороженко
    25
    комментариев
    0
    читателей
    Полный профиль
    Иван Стороженко - Добрый день. 1)Чаще всего основная проблема заключается, в согласовании с клиентом добавляемого контента и то как он будет отображаться. На данном сайте фото и услуги конечно предоставлял клиент, все остальное уже делали мы. 2)Да в принципе, когда есть команда и понимание, что нужно делать, все идет быстро (опять же основная заминка идет на согласовании с клиентом) 3)Смысла делать новый в данном случает нет. В принципе доделывался полноценный сайт. 4)Когда клиент уже не предоставляет информацию, приходится искать у конкурентов (например с других стран или регионов). Но чаще всего клиент, хоть что-то "подкидывает".
    ТОП КОММЕНТАТОРОВ
    Комментариев
    910
    Комментариев
    834
    Комментариев
    554
    Комментариев
    540
    Комментариев
    483
    Комментариев
    373
    Комментариев
    332
    Комментариев
    262
    Комментариев
    235
    Комментариев
    171
    Комментариев
    156
    Комментариев
    137
    Комментариев
    121
    Комментариев
    97
    Комментариев
    97
    Комментариев
    95
    Комментариев
    87
    Комментариев
    80
    Комментариев
    67
    Комментариев
    60
    Комментариев
    59
    Комментариев
    57
    Комментариев
    55
    Комментариев
    54
    Комментариев
    53

    Отправьте отзыв!
    Отправьте отзыв!