×
Россия +7 (495) 139-20-33

4 вызова, с которыми сталкиваются аналитики данных

Россия +7 (495) 139-20-33
Шрифт:
0 7865

Партнерский материал

За последние несколько лет аналитика данных превратилась из модного тренда в обязательный элемент развивающихся компаний. Анализ данных раскрывает новые возможности и точки роста: получив полезные инсайты, можно повысить эффективность как отдельных процессов, так и работу организации в целом. Если в компании нет такой должности, это значит только то, что данные в ней изучают другие люди – маркетологи, менеджеры и т.д.

Работа с большими объемами сырых данных связана с постоянным поиском новых инструментов, требующих специальных знаний. Но так как аналитикой данных занимается далеко не всегда аналитик (а иногда маркетолог или даже PR-менеджер), и таких специалистов редко много в штате, человек оказывается один на один со своими вопросами и проблемами.

В этой статье мы разберем, какие именно трудности возникают в работе аналитиков, и предложим решения.

Статья будет полезна тем, кто:

  • хочет стать аналитиком. Если вы давно хотите попробовать себя в анализе данных, но никак не решаетесь, в статье вы узнаете, чем аналитик занимается на ежедневной основе и какими инструментами он должен владеть.
  • уже работает аналитиком. Если вы уже работаете аналитиком, но чувствуете, что могли бы выполнять свою работу лучше, в статье вы узнаете, как это сделать.
  • сталкивается с анализом данных в работе. Если вы не аналитик, но вам приходится работать с данными, в статье вы найдете информацию, которая поможет упорядочить знания и справиться с возникающими проблемами.

Нехватка знаний в математике и статистике

Несмотря на пул инструментов, доступных для анализа, знание математики и статистики, а также наличие аналитического мышления повышают шансы стать высокоуровневым специалистом.

Если речь идет об анализе эффективности сайта, знание статистики поможет правильно классифицировать пользователей, избежать критических погрешностей в A/B-тестированиях и отделить ненужные данные низкого качества, оставляя только необходимые. А фундамент для успешного освоения статистики формирует математика.

Нехватка базовых знаний может негативно сказаться на скорости выполнения задач и результате в целом. Полностью исключить ошибки невозможно, однако можно минимизировать их количество.

Пример

Для проведения A/B-тестирования веб-аналитику необходимо не только «задать два разных цвета для кнопки», но и сформировать правильную гипотезу, верно сегментировать пользователей и исключить все погрешности и возможные ошибки в анализе результатов тестирования. Для этого и нужна статистика.

Решение

Изучение статистики в целом поможет проводить более качественные A/B-тесты. Углубленные знания математики и статистики с примерами применения в реальных задачах можно получить в рамках специализированного курса «Аналитик данных» от SkillFactory.

Проблемы со сбором разнородных данных

Для качественного анализа данных важно, чтобы на каждом этапе присутствовало минимальное количество ошибок. Перед сбором данных аналитику стоит тщательно продумать, откуда и как будет собираться информация. Далее ему стоит решить, как получить данные – вручную или с помощью алгоритма. Проблема заключается в том, что данные часто поступают из разных источников и в разных форматах, на ручной сбор уходит слишком много времени и сил, а многие аналитики не умеют использовать алгоритмы для автоматизированного сбора данных.

Пример

Например, аналитику нужно следить за эффективностью интернет-магазина, его упоминаниями в сети и сайтами-конкурентами. В таком случае на сбор данных вручную уйдет слишком много времени и сил.

Решение

Решением станет автоматический парсинг данных с помощью Python. Аналитик сможет создать алгоритм, который сам найдет и добавит в базу уже конвертированные данные, с которыми будет удобно работать.

Сложности в работе с базами данных

Аналитикам приходится работать с большим количеством данных, в которых запросто можно «утонуть». Практически всегда на начальном этапе аналитик имеет дело с сырой информацией. Сначала данные нужно «очистить» – проверить на дублирование, удалить лишние, устаревшие, противоречивые и некачественные – и привести в единообразный вид.

В качестве примера можно взять email-рассылки, которые есть у многих компаний. Часть пользователей, подписавшихся на рассылку, неверно написали email-адрес, другие – подписались дважды, сменив электронный адрес, а третьи оформили подписку давно и уже не пользуются тем почтовым ящиком. Если данные не очистить, эти, казалось бы, небольшие недочеты могут привести к тому, что специалист получит искаженную картину происходящего, например, посчитает неэффективной рассылку, которая на самом деле хорошо «зашла» клиентам. Неправильные выводы в этом случае могут привести к стратегически неверным решениям и, как следствие, к падению эффективности работы компании.

Пример

Приведем еще один пример. Аналитику мобильного приложения для тренировок поступило задание: исследовать поведение пользователей на этапе обучения и понять, влияет ли прохождение этого шага на частоту и величину выплат пользователей.

Решение

Для нахождения разницы между процентом пользователей, просмотревших обучение и совершившихся оплату, и тех, кто не прошел его до конца, нужно использовать данные из БД PostgreSQL и провести их анализ с помощью Python. После получения данных аналитику стоит провести их обзор и преобразование, выделить группы/когорты, рассчитать значения для каждой группы и сделать датафреймы, определить разницу в значениях.

Оперативный анализ и визуализация данных

Следующий шаг – анализ данных. Основная проблема заключается в том, что анализировать данные нужно как можно быстрее – чем раньше получены результаты, тем быстрее можно внедрить решение. К тому же некоторые данные быстро устаревают.

Помимо этого, данные не всегда удается визуализировать таким образом, чтобы донести до руководства все инсайты, полученные в ходе анализа. Сами по себе цифры лишены смысла, осмысленными их делает интерпретация.

От того, насколько убедительно будут представлены таблицы, графики и дашборды, зависит то, удастся ли аналитику донести до начальства текущее состояние и проблемы, над которыми нужно работать. Важно подобрать подходящую форму визуализации, в которой будут учтены все тенденции, нюансы и детали. К сожалению, визуализация данных – трудоемкий процесс, если делать все вручную.

Пример

Аналитик, работающий в онлайн-кинотеатре, может оказаться в следующей ситуации. Например, дела в компании идут хорошо: сервис набирает популярность, количество аудитории и платных подписчиков растет. И тут ему приходит задача: подготовить отчет для инвесторов о том, влияют ли просмотры трейлеров и рекомендаций на решение клиента о покупке.

Решение

Чтобы проанализировать показатели, нужно посчитать с помощью Python и сравнить по когортам конверсию в покупку двух типов пользователей: тех, кто видел и не видел трейлеры. Результаты можно визуализировать с помощью библиотек Matplotlib и Seaborn либо в Google Таблицах (Excel).

Вывод

Самое важное в любой области – систематизированные знания и сильная база, без которой работа может превратиться в мучение. Для аналитиков такой базой являются математика и статистика, умение работать с Excel/Google Таблицами, SQL и Python, способность выбрать подходящий для конкретной ситуации инструмент, а также понимание того, как визуализировать полученную информацию. Обычно теории недостаточно, требуется практика. Конечно, ее можно приобрести уже на рабочем месте, однако тогда ошибок в работе не избежать.

Систематизировать свои знания и попрактиковаться в аналитике без страха совершить ошибку можно в рамках фундаментального курса по аналитике данных. SkillFactory как раз запускает такой курс, в котором начинающие или уже работающие аналитики смогут получить все знания, необходимые для работы. До 15 октября записаться на курс можно со скидкой в 30%, достаточно при регистрации указать промокод SEOnews.

(Голосов: 12, Рейтинг: 3.83)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Марине Ибушевой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Алгоритм продвижения сайта через Pinterest
Виктор Гаврюков
28
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - В самом вверху есть ссылка на мою группу в ВК, там где автор материала. Через группу и свяжитесь со мной_)
Ссылочный апдейт Google: что изменится для SEO-специалистов в рунете
Тимур
6
комментариев
0
читателей
Полный профиль
Тимур - Понял, спасибо за информацию.
Как забрать 5 мест в выдаче из 10. Кейс-эксперимент
Виктор Гаврюков
28
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - такое можно делать и с ВЧ_)
Как продвинуть сайт по коммерческим запросам в ТОП-10 с помощью ресурса Reddit
Denis Zar
2
комментария
0
читателей
Полный профиль
Denis Zar - пользовались услугами по продвижению на реддит от reddit-marketing.pro?
3 основные ошибки, которые допускают владельцы сайтов при продвижении
Виктор Гаврюков
28
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - Не обращай внимания_) Если у тебя хороший ресурс, то ты будешь первоисточником, и все кто своровал, автоматически начнут на тебя ссылаться, точнее, так гугл будет считать_)
Как мы увеличили трафик из Яндекса более чем в 3 раза за неделю на сайте клиники. Кейс
Андрей
1
комментарий
0
читателей
Полный профиль
Андрей - У большинства сайтов произошел рост в Гугле в декабре и в марте Яндекса. Ваши шаманства тут не причём :)
Как доработка структуры вывела сайт в ТОП-10 Google и увеличила трафик в 2 раза. Кейс Связной Трэвел
Дмитрий
3
комментария
0
читателей
Полный профиль
Дмитрий - Вероятнее всего было обновление Google и позиции были снижены в связи с низкой скоростью загрузки страниц (так как доработке ведутся не только по SEO, но и в целом по функционалу сайта, появляются новые скрипты). В этот период в Google Search Console увеличилось количество страниц с низкой скоростью загрузки. Мы выявили несколько проблем, которые снижают скорость загрузки страниц и выдали рекомендации по их устранению. Пока данные рекомендации находятся в работе. Также был проведен анализ EAT факторов и проверка сайта на соответствие требованиям Google к YMYL сайта, выданы рекомендации по доработке данных факторов (ждем внедрения наших рекомендаций, поделимся потом результатами).
Сравнительная статистика уровня жизни SEO-специалистов в семи странах, включая Россию
Рустам
1
комментарий
0
читателей
Полный профиль
Рустам - Средняя температура по больнице, подсчет даже близко не отображает действительность, особенно учитывая разность цен и уровня зп в разных частях больших стран (США, Канада, Россия)
Как влияют отзывы на показатель отказов/выходов с сайта. Эксперимент
Виктор Гаврюков
28
комментариев
1
читатель
Полный профиль
Виктор Гаврюков - Жаль что гугл стал меньше ценить пользовательский контент. Но отзывы все еще важны, в любом слае_)
Рост ботных переходов на сайт: как интерпретировать и что делать
Денис Логанов
2
комментария
0
читателей
Полный профиль
Денис Логанов - Все крупные интернет-магазины. Пример: Ситилинк, Ozon, SberMegaMarket, WB.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
385
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
114
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
92
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
62
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!