×
Россия +7 (495) 139-20-33

4 вызова, с которыми сталкиваются аналитики данных

Россия +7 (495) 139-20-33
Шрифт:
0 5404

Партнерский материал

За последние несколько лет аналитика данных превратилась из модного тренда в обязательный элемент развивающихся компаний. Анализ данных раскрывает новые возможности и точки роста: получив полезные инсайты, можно повысить эффективность как отдельных процессов, так и работу организации в целом. Если в компании нет такой должности, это значит только то, что данные в ней изучают другие люди – маркетологи, менеджеры и т.д.

Работа с большими объемами сырых данных связана с постоянным поиском новых инструментов, требующих специальных знаний. Но так как аналитикой данных занимается далеко не всегда аналитик (а иногда маркетолог или даже PR-менеджер), и таких специалистов редко много в штате, человек оказывается один на один со своими вопросами и проблемами.

В этой статье мы разберем, какие именно трудности возникают в работе аналитиков, и предложим решения.

Статья будет полезна тем, кто:

  • хочет стать аналитиком. Если вы давно хотите попробовать себя в анализе данных, но никак не решаетесь, в статье вы узнаете, чем аналитик занимается на ежедневной основе и какими инструментами он должен владеть.
  • уже работает аналитиком. Если вы уже работаете аналитиком, но чувствуете, что могли бы выполнять свою работу лучше, в статье вы узнаете, как это сделать.
  • сталкивается с анализом данных в работе. Если вы не аналитик, но вам приходится работать с данными, в статье вы найдете информацию, которая поможет упорядочить знания и справиться с возникающими проблемами.

Нехватка знаний в математике и статистике

Несмотря на пул инструментов, доступных для анализа, знание математики и статистики, а также наличие аналитического мышления повышают шансы стать высокоуровневым специалистом.

Если речь идет об анализе эффективности сайта, знание статистики поможет правильно классифицировать пользователей, избежать критических погрешностей в A/B-тестированиях и отделить ненужные данные низкого качества, оставляя только необходимые. А фундамент для успешного освоения статистики формирует математика.

Нехватка базовых знаний может негативно сказаться на скорости выполнения задач и результате в целом. Полностью исключить ошибки невозможно, однако можно минимизировать их количество.

Пример

Для проведения A/B-тестирования веб-аналитику необходимо не только «задать два разных цвета для кнопки», но и сформировать правильную гипотезу, верно сегментировать пользователей и исключить все погрешности и возможные ошибки в анализе результатов тестирования. Для этого и нужна статистика.

Решение

Изучение статистики в целом поможет проводить более качественные A/B-тесты. Углубленные знания математики и статистики с примерами применения в реальных задачах можно получить в рамках специализированного курса «Аналитик данных» от SkillFactory.

Проблемы со сбором разнородных данных

Для качественного анализа данных важно, чтобы на каждом этапе присутствовало минимальное количество ошибок. Перед сбором данных аналитику стоит тщательно продумать, откуда и как будет собираться информация. Далее ему стоит решить, как получить данные – вручную или с помощью алгоритма. Проблема заключается в том, что данные часто поступают из разных источников и в разных форматах, на ручной сбор уходит слишком много времени и сил, а многие аналитики не умеют использовать алгоритмы для автоматизированного сбора данных.

Пример

Например, аналитику нужно следить за эффективностью интернет-магазина, его упоминаниями в сети и сайтами-конкурентами. В таком случае на сбор данных вручную уйдет слишком много времени и сил.

Решение

Решением станет автоматический парсинг данных с помощью Python. Аналитик сможет создать алгоритм, который сам найдет и добавит в базу уже конвертированные данные, с которыми будет удобно работать.

Сложности в работе с базами данных

Аналитикам приходится работать с большим количеством данных, в которых запросто можно «утонуть». Практически всегда на начальном этапе аналитик имеет дело с сырой информацией. Сначала данные нужно «очистить» – проверить на дублирование, удалить лишние, устаревшие, противоречивые и некачественные – и привести в единообразный вид.

В качестве примера можно взять email-рассылки, которые есть у многих компаний. Часть пользователей, подписавшихся на рассылку, неверно написали email-адрес, другие – подписались дважды, сменив электронный адрес, а третьи оформили подписку давно и уже не пользуются тем почтовым ящиком. Если данные не очистить, эти, казалось бы, небольшие недочеты могут привести к тому, что специалист получит искаженную картину происходящего, например, посчитает неэффективной рассылку, которая на самом деле хорошо «зашла» клиентам. Неправильные выводы в этом случае могут привести к стратегически неверным решениям и, как следствие, к падению эффективности работы компании.

Пример

Приведем еще один пример. Аналитику мобильного приложения для тренировок поступило задание: исследовать поведение пользователей на этапе обучения и понять, влияет ли прохождение этого шага на частоту и величину выплат пользователей.

Решение

Для нахождения разницы между процентом пользователей, просмотревших обучение и совершившихся оплату, и тех, кто не прошел его до конца, нужно использовать данные из БД PostgreSQL и провести их анализ с помощью Python. После получения данных аналитику стоит провести их обзор и преобразование, выделить группы/когорты, рассчитать значения для каждой группы и сделать датафреймы, определить разницу в значениях.

Оперативный анализ и визуализация данных

Следующий шаг – анализ данных. Основная проблема заключается в том, что анализировать данные нужно как можно быстрее – чем раньше получены результаты, тем быстрее можно внедрить решение. К тому же некоторые данные быстро устаревают.

Помимо этого, данные не всегда удается визуализировать таким образом, чтобы донести до руководства все инсайты, полученные в ходе анализа. Сами по себе цифры лишены смысла, осмысленными их делает интерпретация.

От того, насколько убедительно будут представлены таблицы, графики и дашборды, зависит то, удастся ли аналитику донести до начальства текущее состояние и проблемы, над которыми нужно работать. Важно подобрать подходящую форму визуализации, в которой будут учтены все тенденции, нюансы и детали. К сожалению, визуализация данных – трудоемкий процесс, если делать все вручную.

Пример

Аналитик, работающий в онлайн-кинотеатре, может оказаться в следующей ситуации. Например, дела в компании идут хорошо: сервис набирает популярность, количество аудитории и платных подписчиков растет. И тут ему приходит задача: подготовить отчет для инвесторов о том, влияют ли просмотры трейлеров и рекомендаций на решение клиента о покупке.

Решение

Чтобы проанализировать показатели, нужно посчитать с помощью Python и сравнить по когортам конверсию в покупку двух типов пользователей: тех, кто видел и не видел трейлеры. Результаты можно визуализировать с помощью библиотек Matplotlib и Seaborn либо в Google Таблицах (Excel).

Вывод

Самое важное в любой области – систематизированные знания и сильная база, без которой работа может превратиться в мучение. Для аналитиков такой базой являются математика и статистика, умение работать с Excel/Google Таблицами, SQL и Python, способность выбрать подходящий для конкретной ситуации инструмент, а также понимание того, как визуализировать полученную информацию. Обычно теории недостаточно, требуется практика. Конечно, ее можно приобрести уже на рабочем месте, однако тогда ошибок в работе не избежать.

Систематизировать свои знания и попрактиковаться в аналитике без страха совершить ошибку можно в рамках фундаментального курса по аналитике данных. SkillFactory как раз запускает такой курс, в котором начинающие или уже работающие аналитики смогут получить все знания, необходимые для работы. До 15 октября записаться на курс можно со скидкой в 30%, достаточно при регистрации указать промокод SEOnews.

(Голосов: 11, Рейтинг: 3.73)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
15
комментариев
0
читателей
Полный профиль
Михаил Мухин - Здравствуйте! 1-2. Считает стенд. Ссылка на него дана, но могу повторить: online.p-c-l.ru/competition/task/card/id/106. Нажмите на кнопку "Начать" и заранее приготовьте прогноз бюджета Яндекс. Суть расчета: перебор комбинаций всех ставок на всех фразах, построение бюджетных когорт - бюджетов с одинаковым СРС, отбор в каждой когорте бюджета с максимальным количеством кликов и ..., да упорядочивание этих бюджетов по мере возрастания СРС, причем берем не все, а с фиксированным шагом. 3. Гугл считается через поправочные коэффициенты. Мы перевариваем океан данных и представляем их. На удивление, получается не менее, хотя и не более точно, как и прогноз Яндекс. Конечно, нужно понимать, что это очень примерные прикидки, фактически перевод неточного прогноза Яндекс в удобочитаемую форму, не больше. Самое интересное начинается, когда применяешь метод бюджетных когорт к измерению показателей фраз на реальной рекламной кампании в режиме 48х7. Первые результаты очень хорошие. Если хотите присоединиться к бесплатному тестированию, напишите Эльвире r-support@r-broker.ru. В теме укажите "хочу присоединиться к тестам Умного управления рекламой"
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
8
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Дмитрий Сульман
4
комментария
0
читателей
Полный профиль
Дмитрий Сульман - Все верно, об этом я и говорю. У крупных компаний есть много данных и они имеют доступ к дорогим технологиям и решениям для персонализации контента. Топовые западные сервисы для персонализации, такие как RichRelevance или Dynamic Yield, стоят от нескольких тысяч до десятков тысяч долларов в месяц. Понятно, что малый бизнес не может себе этого позволить. Да даже если бы чисто теоретически и мог, то это вряд ли бы имело хоть какой-то смысл. Во-первых, у малого бизнеса недостаточно данных, чтобы подобные алгоритмы персонализации начали эффективно работать, а во-вторых, тот профит, который МСБ получит от персонализации, никогда не покроет таких расходов. Мы же предлагаем решение, доступное как раз для малого и среднего бизнеса. При этом наше решение комплексное: МультиЧат - это одновременно и инструмент для персонализации, и для коммуникации.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
Digital-разговор: Михаил Шакин про SEO, Google и заработок в интернете
Анна Макарова
368
комментариев
0
читателей
Полный профиль
Анна Макарова - Подготовим ) Пока предлагаю почитать интервью с Денисом Нарижным из той же серии. Там стенограмма =) www.seonews.ru/interviews/digital-razgovor-denis-narizhnyy-pro-ukhod-iz-seo-i-zarabotok-na-partnerkakh/
Как удвоить выручку за счет продвижения в поиске. Кейс coffee-butik.ru
Максим Боровой
3
комментария
0
читателей
Полный профиль
Максим Боровой - Последний вопрос (извиняюсь за количество) - почему на "В корзину" стоит Nofollow. Осознанно для распределение весов?
Автоматические SEO-аудиты: как напугать некорректными выводами
SEOquick
38
комментариев
0
читателей
Полный профиль
SEOquick - Парсинг сайтов – это самый лучший способ автоматизировать процесс сбора и сохранения информации. Конкурентов всегда нужно мониторить, а не сравнивать свой сайт через автоматический аудит анализатора.
Почему вы торгуетесь за показы, даже если платите за клики
Константин Требунских
3
комментария
0
читателей
Полный профиль
Константин Требунских - Дмитрий, спасибо за комментарий, хорошие замечания!) 1. "Какая-то подмена понятий. CPM у “Original Works” взлетает не от того, что у них РАВНАЯ цена клика, а оттого, что вы "с потолка" поставили ему CPC в 2 раза выше, чем был. Логично, что и CPM в 2 раза увеличился (см. формулу выше). Если бы вместо 5 вы всем решили поставить 2 или 1.5, то он бы наоборот уменьшился." Вы правы, что CPM уменьшился бы. В первой и второй табличке берем одинаковое количество показов (именно за них мы платим сначала) и считаем данные, в том числе CPC. Мы поставили рекламодателей в одинаковые условия и посмотрели их эффективность в разрезе цены клика при одинаковом количестве показов. А затем изменился аукцион, и, взяв получившиеся данные по кликам и CTR, мы поставили рекламодателей тоже в одинаковое положение, но уже по цене клика, ведь мы теперь за него платим. Посчитали эффективность в разрезе уже CPM. Тут если и есть подмена понятий, то она точно не моя, а рекламных систем, потому и обозначена, как "ход конем" :) 2. "Ок, смотрим таблички "как оно было" и "как оно стало". Было: система суммарно за 2 000 денег показала рекламу 4 000 раз. Стало: система суммарно за 2 000 денег показала рекламу 13 500 раз. Сомнительный профит для системы." Вы правы, именно поэтому для рекламодателей с низким CTR ставка будет выше, чем для рекламодателей с высоким CTR. Просто чтобы система окупилась. Потому что, системе выгодно продавать показы тем, у кого кликов будет больше (ведь они платят за клик). По факту реальные цены за клик в аукционе будут как в таблице 2. Но ранжирование системы проводят по таблице 5.
Где SEO-специалист может углубить свои навыки в области поискового продвижения
Ирина Полинина
1
комментарий
0
читателей
Полный профиль
Ирина Полинина - Полезно! Спасибо
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
368
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
139
Комментариев
121
Комментариев
108
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
85
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!