×
Россия +7 (495) 139-20-33

4 вызова, с которыми сталкиваются аналитики данных

Россия +7 (495) 139-20-33
Шрифт:
0 4889

Партнерский материал

За последние несколько лет аналитика данных превратилась из модного тренда в обязательный элемент развивающихся компаний. Анализ данных раскрывает новые возможности и точки роста: получив полезные инсайты, можно повысить эффективность как отдельных процессов, так и работу организации в целом. Если в компании нет такой должности, это значит только то, что данные в ней изучают другие люди – маркетологи, менеджеры и т.д.

Работа с большими объемами сырых данных связана с постоянным поиском новых инструментов, требующих специальных знаний. Но так как аналитикой данных занимается далеко не всегда аналитик (а иногда маркетолог или даже PR-менеджер), и таких специалистов редко много в штате, человек оказывается один на один со своими вопросами и проблемами.

В этой статье мы разберем, какие именно трудности возникают в работе аналитиков, и предложим решения.

Статья будет полезна тем, кто:

  • хочет стать аналитиком. Если вы давно хотите попробовать себя в анализе данных, но никак не решаетесь, в статье вы узнаете, чем аналитик занимается на ежедневной основе и какими инструментами он должен владеть.
  • уже работает аналитиком. Если вы уже работаете аналитиком, но чувствуете, что могли бы выполнять свою работу лучше, в статье вы узнаете, как это сделать.
  • сталкивается с анализом данных в работе. Если вы не аналитик, но вам приходится работать с данными, в статье вы найдете информацию, которая поможет упорядочить знания и справиться с возникающими проблемами.

Нехватка знаний в математике и статистике

Несмотря на пул инструментов, доступных для анализа, знание математики и статистики, а также наличие аналитического мышления повышают шансы стать высокоуровневым специалистом.

Если речь идет об анализе эффективности сайта, знание статистики поможет правильно классифицировать пользователей, избежать критических погрешностей в A/B-тестированиях и отделить ненужные данные низкого качества, оставляя только необходимые. А фундамент для успешного освоения статистики формирует математика.

Нехватка базовых знаний может негативно сказаться на скорости выполнения задач и результате в целом. Полностью исключить ошибки невозможно, однако можно минимизировать их количество.

Пример

Для проведения A/B-тестирования веб-аналитику необходимо не только «задать два разных цвета для кнопки», но и сформировать правильную гипотезу, верно сегментировать пользователей и исключить все погрешности и возможные ошибки в анализе результатов тестирования. Для этого и нужна статистика.

Решение

Изучение статистики в целом поможет проводить более качественные A/B-тесты. Углубленные знания математики и статистики с примерами применения в реальных задачах можно получить в рамках специализированного курса «Аналитик данных» от SkillFactory.

Проблемы со сбором разнородных данных

Для качественного анализа данных важно, чтобы на каждом этапе присутствовало минимальное количество ошибок. Перед сбором данных аналитику стоит тщательно продумать, откуда и как будет собираться информация. Далее ему стоит решить, как получить данные – вручную или с помощью алгоритма. Проблема заключается в том, что данные часто поступают из разных источников и в разных форматах, на ручной сбор уходит слишком много времени и сил, а многие аналитики не умеют использовать алгоритмы для автоматизированного сбора данных.

Пример

Например, аналитику нужно следить за эффективностью интернет-магазина, его упоминаниями в сети и сайтами-конкурентами. В таком случае на сбор данных вручную уйдет слишком много времени и сил.

Решение

Решением станет автоматический парсинг данных с помощью Python. Аналитик сможет создать алгоритм, который сам найдет и добавит в базу уже конвертированные данные, с которыми будет удобно работать.

Сложности в работе с базами данных

Аналитикам приходится работать с большим количеством данных, в которых запросто можно «утонуть». Практически всегда на начальном этапе аналитик имеет дело с сырой информацией. Сначала данные нужно «очистить» – проверить на дублирование, удалить лишние, устаревшие, противоречивые и некачественные – и привести в единообразный вид.

В качестве примера можно взять email-рассылки, которые есть у многих компаний. Часть пользователей, подписавшихся на рассылку, неверно написали email-адрес, другие – подписались дважды, сменив электронный адрес, а третьи оформили подписку давно и уже не пользуются тем почтовым ящиком. Если данные не очистить, эти, казалось бы, небольшие недочеты могут привести к тому, что специалист получит искаженную картину происходящего, например, посчитает неэффективной рассылку, которая на самом деле хорошо «зашла» клиентам. Неправильные выводы в этом случае могут привести к стратегически неверным решениям и, как следствие, к падению эффективности работы компании.

Пример

Приведем еще один пример. Аналитику мобильного приложения для тренировок поступило задание: исследовать поведение пользователей на этапе обучения и понять, влияет ли прохождение этого шага на частоту и величину выплат пользователей.

Решение

Для нахождения разницы между процентом пользователей, просмотревших обучение и совершившихся оплату, и тех, кто не прошел его до конца, нужно использовать данные из БД PostgreSQL и провести их анализ с помощью Python. После получения данных аналитику стоит провести их обзор и преобразование, выделить группы/когорты, рассчитать значения для каждой группы и сделать датафреймы, определить разницу в значениях.

Оперативный анализ и визуализация данных

Следующий шаг – анализ данных. Основная проблема заключается в том, что анализировать данные нужно как можно быстрее – чем раньше получены результаты, тем быстрее можно внедрить решение. К тому же некоторые данные быстро устаревают.

Помимо этого, данные не всегда удается визуализировать таким образом, чтобы донести до руководства все инсайты, полученные в ходе анализа. Сами по себе цифры лишены смысла, осмысленными их делает интерпретация.

От того, насколько убедительно будут представлены таблицы, графики и дашборды, зависит то, удастся ли аналитику донести до начальства текущее состояние и проблемы, над которыми нужно работать. Важно подобрать подходящую форму визуализации, в которой будут учтены все тенденции, нюансы и детали. К сожалению, визуализация данных – трудоемкий процесс, если делать все вручную.

Пример

Аналитик, работающий в онлайн-кинотеатре, может оказаться в следующей ситуации. Например, дела в компании идут хорошо: сервис набирает популярность, количество аудитории и платных подписчиков растет. И тут ему приходит задача: подготовить отчет для инвесторов о том, влияют ли просмотры трейлеров и рекомендаций на решение клиента о покупке.

Решение

Чтобы проанализировать показатели, нужно посчитать с помощью Python и сравнить по когортам конверсию в покупку двух типов пользователей: тех, кто видел и не видел трейлеры. Результаты можно визуализировать с помощью библиотек Matplotlib и Seaborn либо в Google Таблицах (Excel).

Вывод

Самое важное в любой области – систематизированные знания и сильная база, без которой работа может превратиться в мучение. Для аналитиков такой базой являются математика и статистика, умение работать с Excel/Google Таблицами, SQL и Python, способность выбрать подходящий для конкретной ситуации инструмент, а также понимание того, как визуализировать полученную информацию. Обычно теории недостаточно, требуется практика. Конечно, ее можно приобрести уже на рабочем месте, однако тогда ошибок в работе не избежать.

Систематизировать свои знания и попрактиковаться в аналитике без страха совершить ошибку можно в рамках фундаментального курса по аналитике данных. SkillFactory как раз запускает такой курс, в котором начинающие или уже работающие аналитики смогут получить все знания, необходимые для работы. До 15 октября записаться на курс можно со скидкой в 30%, достаточно при регистрации указать промокод SEOnews.

(Голосов: 11, Рейтинг: 3.73)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
#SEOnews14: мы празднуем – вы получаете подарки!
Анна Макарова
0
комментариев
0
читателей
Полный профиль
Анна Макарова - Гость, добрый день! С победителями мы связывались сразу после розыгрыша. Если мы вам не написали, значит, ваш номер не выпал. Но не расстраивайтесь, у нас обязательно будут новые розыгрыши!
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
9
комментариев
0
читателей
Полный профиль
Михаил Мухин - Дожидаться 100 попыток не будем - не дождемся :) Подведем итоги и опубликуем решение 13 Декабря
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Георгий
1
комментарий
0
читателей
Полный профиль
Георгий - Все что рекомендуется в этой статье есть у w.tools. Ни разу не пожалел что подключился. Своя CDN сеть, кеш статики и динамики, минификация js\css и кешируемого html, оптимизация всех типов картинок и еще куча всего полезного. Сайт летает и я не знаю проблем. Могу рекомендовать от души.
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Ann Yaroshenko
5
комментариев
0
читателей
Полный профиль
Ann Yaroshenko - Дмитрий, добрый день! Если вы проставили на странице с автозапчастями rel=canonical ( а я вижу в коде, что не проставили) или в HTTP хедере, то бот, как правило: выберит ту страницу главной, которую вы указали в rel=canonical ссылке. Eсли же вы этого не сделали, то бот сам выберит оригинал (алгоритмы, по которым бот это делает, скрыты Googl-ом)
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Евгений
1
комментарий
0
читателей
Полный профиль
Евгений - Воообще, на самом деле здесь двоякое впечатление от таких аудитов. Конечно, для полного глубокого анализа и подготовки рекомендаций по сайту - нужны доступы к системам аналитики и инструментам вебмастера. Но если оценивать подобные аудиты с точки зрения чистого SEO (которое все больше и больше становится лишь малой частью digital-маркетинга, лишь одним из каналов) - они имеют место быть. Но с оговоркой, что они сделаны с учетом анализа конкурентов/отрасли. Современные инструменты и алгоритмы позволяют делать это маркетологам в автоматическом режиме, и даже давать рекомендации - возможностями машинного обучения уже никого не удивишь. Да, полное перечисление "мифического" списка ошибок, построенного по предикативным правилам, да еще и с учетом устаревших особенностей ПС - это явный признак некачественного аудита. В первую очередь потому, что эти "ошибки" следует рассматривать в качестве рекомендаций от ПС (как и говорится в справочнике вебмастера у Яндекса/Google). Однако если эти данные даются с отсылкой на данные о конкурентах, об отрасли, используются методы ML и Natural language processing для обработки исходных данных, кластеризации запросов, классификации страниц/запросов/сайтов, определения структуры документа - такие отчеты имеют право на существование. Но ключевым моментом является то, что подобные инструменты достаточно сложны в разработке, а значит требуют квалифицированных специалистов для их разработки. Которых просто нет у студий рассылающих подобные "сео отчеты". Подобные отчеты по "ошибках" тоже неплохой источник информации, но лишь на 0 этапе анализа сайта. И в принципе, теоретически, возможно почти полное составление "хороших аудитов" без участия маркетолога, на основе лишь открытых данных сайта/внешних источников, но только при соответствующем применении всех современных возможностей анализа данных и рекомендательных систем. И в любом случае подобный "хороший отчет" требует конечного заключения от эксперта.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Kosta Bankovski
4
комментария
0
читателей
Полный профиль
Kosta Bankovski - Спасибо за приятные слова! Буду и дальше делиться наработками ;)
Как провести анализ содержания страниц товаров и категорий
Никита Седнин
3
комментария
0
читателей
Полный профиль
Никита Седнин - Спасибо!
Как вывести сайт в ТОП 10 Google в 2019 году
Ирина
8
комментариев
0
читателей
Полный профиль
Ирина - Работают. Как естественные, так и закупные. >Мои сайты в первую очередь заточены на яндекс Соболезную. >Насколько поисковые алгоритмы с гугловскими у него. Разница в 10 лет. Вон в Яше все долбят на ключи, на вхождения и прочий трэш из древностей. А у Гугла, вон почитайте про eat, ymyl Не все понятно но спасибо за ответы. Я так понимаю что с ссылками деть никто точно не знает) Ну это и хорошо вообщем. Самому разбираться как то интересней. Но не всегда. Есть к примеру 2captcha.com/ru и на него 100к ссылок есть. Ну а смысл какой?
Как я пытался купить CRM-систему, но мне ее поленились продать
Kristina
1
комментарий
0
читателей
Полный профиль
Kristina - Очень рекомендую CRM-систему польской фирмы Firmao. Все функции настраиваются в соответствии с индивидуальным потребностям компании! Советую попробовать бесплатную демо-версию, чтобы попробовать все необходимые функции, без лишних кнопок и траты дополнительных финансов! :) Сайт: firmao.ru/info
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
360
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
107
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
79
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!