×
Россия +7 (495) 139-20-33

Язык регулярных выражений для интернет-маркетолога

Россия +7 (495) 139-20-33
Шрифт:
0 8313

В работе интернет-маркетолога часто приходится сталкиваться с регулярными выражениями: кластеризация семантики, анализ конкурентов, работа с данными веб-аналитики, настройка редиректов и сервисов интернет-маркетинга.

Большинство руководств по RegExp сложны и ориентированы на технарей, при этом абстрактно описывают область применения этого инструмента.

В статье хочу поделиться частыми кейсами применения регулярных выражений в интернет-маркетинге, дать советы по инструментарию, который позволит ежедневно использовать регулярные выражения в работе.

Как могли выглядеть регулярные выражения в древности

Регулярные выражения Древней Греции

Intro

Материал рассчитан на интернет-маркетологов и SEO-специалистов без опыта в программировании, содержит упрощения и терминологические неточности. Это осознанный шаг для снижения порога входа в тему.

Регулярные выражения – это последовательности символов (масок), которые определяют поисковые паттерны при использовании операции «найти/заменить». Синтаксис RegExp поддерживается множеством приложений и сервисов.

Но не будем начинать с описания синтаксиса, а лучше давайте сразу посмотрим, как и где регулярные выражения применяются, какую пользу можно извлечь, а когда будет понятна ценность – вы сможете расширить и закрепить полученные знания.

1. Настройка целей в Google Analytics

Допустим, на нашем сайте есть коллтрекинг и форма обратной связи, а при отправке формы или звонке по подменному номеру коллтрекинга в Google Analytics отправляются события, которые считаются в разных целях.

Условия события для формы callback   Условия события "Звонки коллтрекинг"

Для оптимизации кампаний по CPL будет удобнее параллельно считать эти события в общей цели. Регулярные выражения позволяют решить эту задачу и поддерживаются Google Analytics. Посмотрим, как будет выглядеть настройка общей цели:

Пример настройки общей цели в Google Analytics

Настройки для общей цели в Google Analytics

Разберем значения полей, чтобы понять условия срабатывания:

  • «|» – вертикальный разделитель, логическое «ИЛИ». Сначала проверяется условие слева от разделителя, затем условие справа. В нашем случае это вхождение form или phone в категорию, sent или call в действие и так далее.
  • «^» – крышечка, начало строки и «$» – доллар, конец строки. Используем, чтобы исключить ложное срабатывание, если какой-то сервис будет отправлять не одноименное, но схожее имя события (категории, действия, ярлыка).

Источников событий может быть много – email-трекинг, онлайн-чат, виджет обратного звонка. С помощью регулярок легко объединить все эти события в одной цели.

2. Настройка показа через Google Tag Manager

Частая задача при подключении виджетов через GTM – выбор страниц показа. Например, мы решили использовать виджет с Pop-up формой «Подпишитесь на рассылку» для сбора email-адресов в разделе «Статьи».

Google Tag Manager также поддерживает синтаксис регулярных выражений, настроим триггер для виджета, который хотим показывать на страницах статей:

Настройка триггера через Google Tag Manager

У нас появились новые символы: «.» – точка, любой символ (буква, цифра, спецсимвол), в сочетании со звездочкой «*», обозначает любое количество любых символов, то есть любую страницу, вложенную в articles, включая ее саму.

3. Настройка редиректов в .htaccess

С настройкой 301 редиректов чаще сталкиваются разработчики и SEO-специалисты, но и для интернет-маркетолога навык не будет лишним. Лично меня знание этого функционала часто выручало в «переездах» между сайтами и фиксинге проблем.

Допустим у нас был сайт, где все услуги лежали по адресу http://example.org/uslugi/*, а все статьи по адресу http://example.org/stati/* – на новом сайте все материалы переехали в другие разделы, при этом адреса всех вложенных страниц сохранились.

Если страниц немного, можно пойти простым путем и прописать редиректы для каждой, но что если страниц сотни или даже тысячи? Тут не обойтись без регулярных выражений. Итак, подключаемся по FTP/SSH, открываем .htaccess и вносим правки:

Как настроить редиректы в htaccess

Не будем вникать в синтаксис .htaccess, а сосредоточимся на используемых регулярных выражениях. Тут мы видим знакомые нам символы начала строки «^» и конца строки «$», а также любого количества любых символов «.*».

Символы «.*» заключены в скобки, а в конце правила перенаправления появился «$1». Скобки можно назвать запоминающими – они сохраняют заключенную в них последовательность для каждой строки и передают ее в переменную $1.

Таким образом любое перенаправления с любой страницы будет корректно переадресовано в новую директорию и не потребуется прописывать кучу редиректов.

4. Экспорт в электронную таблицу

Другая частая задача – когда надо собрать информацию из какого-то сервиса и представить ее в табличном виде, а экспорта данных в CSV нет.

Например, мы решили выбрать название для своего лампового блога по интернет-маркетингу и нагенерили 1000 вариаций доменных имен.

Варианты доменных имен после генерации

Список доменов после генерации

Потом мы их пакетно проверили на возможность регистрации и теперь хотим сделать табличку и выбрать лучший вариант с учетом стоимости и возможности регистрации.

Результаты пакетной проверки доменных имен

Результаты пакетной проверки доменов

Если мы попробуем скопировать эту информацию в электронную таблицу, то получим много строк никак не разделенного текста. А мы хотим, чтобы домен, стоимость, доменная зона и ее тематика были в разных столбцах для фильтрации данных.

Под решение этой задачи потребуется среда для работы с регулярными выражениями. Самое удобное решение – это приложение Notepad++, возможен также и вариант использования надстройки для Excel или других программ, например, Calc Open Office (аналог MS Excel) поддерживает регулярки «из коробки».

Скопировав результаты проверки в файл получим: домены с новой строки, цены – тоже с новой строки, все данные разделены пробелами, без табуляции.

Разбивка данных с помощью регулярных выражений

Напомню, мы хотим получить таблицу, где первый столбец с доменным именем, второй с ценой, третий с доменной зоной, четвертый – тематика доменной зоны.

Для этого нам надо будет выполнить несколько последовательных действий. В нашем примере мы работаем с тысячами доменов и сделать это руками – не вариант.

Последовательность операций «найти/заменить», которые приведут нас к результату:

1. Убрать пробел, отделяющий разряды в цене.

Условие поиска: ([0-9]) ([0-9][0-9][0-9]) – находим числа, разделенные пробелами, и запоминаем их в первые и вторые запоминающие скобки.

Условие замены: $1$2 – результат первых запоминающих скобок ($1) добавляем ко второму ($2), без пробела.

Удаление пробела с помощью регулярных выражений

Удаление пробела

2. Убрать копейки и «руб» из цены.

Условие поиска: \.00 руб – чтобы «.» была не любым символом, а точкой, перед ней надо добавить обратный слеш (экранировать)

Условие замены: пустая строка.

Удаление копеек с помощью регулярных выражений

Удаление копеек

3. Убрать переносы строк.

Первая строка в нашем файле заканчивается на английскую букву (доменной зоны), а следующая за ней строка начинается с цифры (цены) – надо убрать переносы строк.

Условие поиска: ([a-z])\r\n([0-9]) – находим латинскую букву в конце строки \r и цифру, с которой начинается новая строка \n, используем две пары запоминающих скобок.

Условие замены: $1 $2 – результаты первых запоминающих скобок добавляем ко вторым запоминающих скобкам через символ пробела.

Удаление переносов строк с помощью регулярных выражений

Удаление переносов строк

4. Заменить пробелы на символы табуляции.

Осталось заменить оставшиеся пробелы на символы табуляции \t.

Замена пробелов на табуляцию с помощью регулярных выражений

Замена пробелов на табуляцию

Теперь копируем и вставляем полученные результаты в электронную таблицу. Данные представляются корректно, с ними удобно работать.

Представление данных в табличном виде

Данные в табличном виде

Outro

Не буду приводить длинного академического описания всех символов – есть Wiki и много материалов, более глубоких и терминологически правильных, чем этот. Я хотел лишь упростить сложное, заинтересовать, чтобы вы начали работать с регулярками.

Если вам стало интересно – рекомендую установить себе надстройку для Excel, скачать Notepad++, чтобы среда для работы с RegExp всегда была под рукой. А если что-то не получится – есть сервисы для отладки, которые подробно описывают работу вашего регулярного выражения посимвольно, что крайне удобно. Удачи!

Регулярные выражения

(Голосов: 13, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Что скрывает «Прогноз бюджета Яндекс.Директ»?
Михаил Мухин
15
комментариев
0
читателей
Полный профиль
Михаил Мухин - Здравствуйте! 1-2. Считает стенд. Ссылка на него дана, но могу повторить: online.p-c-l.ru/competition/task/card/id/106. Нажмите на кнопку "Начать" и заранее приготовьте прогноз бюджета Яндекс. Суть расчета: перебор комбинаций всех ставок на всех фразах, построение бюджетных когорт - бюджетов с одинаковым СРС, отбор в каждой когорте бюджета с максимальным количеством кликов и ..., да упорядочивание этих бюджетов по мере возрастания СРС, причем берем не все, а с фиксированным шагом. 3. Гугл считается через поправочные коэффициенты. Мы перевариваем океан данных и представляем их. На удивление, получается не менее, хотя и не более точно, как и прогноз Яндекс. Конечно, нужно понимать, что это очень примерные прикидки, фактически перевод неточного прогноза Яндекс в удобочитаемую форму, не больше. Самое интересное начинается, когда применяешь метод бюджетных когорт к измерению показателей фраз на реальной рекламной кампании в режиме 48х7. Первые результаты очень хорошие. Если хотите присоединиться к бесплатному тестированию, напишите Эльвире r-support@r-broker.ru. В теме укажите "хочу присоединиться к тестам Умного управления рекламой"
Ссылочное продвижение локальных сайтов: ТОП худших SEO-методов
demimurych
8
комментариев
0
читателей
Полный профиль
demimurych - о господи. это для регионального сайта? в яндексе? где у сайта по региону конкурентов меньше чем выдачи на двух страницах из которых перваш это реклама москвы? потешно ей богу. ктото чего то не понеимает.
Зачем подменять контент на сайте: разбираем инструмент и развенчиваем мифы
Дмитрий Сульман
4
комментария
0
читателей
Полный профиль
Дмитрий Сульман - Все верно, об этом я и говорю. У крупных компаний есть много данных и они имеют доступ к дорогим технологиям и решениям для персонализации контента. Топовые западные сервисы для персонализации, такие как RichRelevance или Dynamic Yield, стоят от нескольких тысяч до десятков тысяч долларов в месяц. Понятно, что малый бизнес не может себе этого позволить. Да даже если бы чисто теоретически и мог, то это вряд ли бы имело хоть какой-то смысл. Во-первых, у малого бизнеса недостаточно данных, чтобы подобные алгоритмы персонализации начали эффективно работать, а во-вторых, тот профит, который МСБ получит от персонализации, никогда не покроет таких расходов. Мы же предлагаем решение, доступное как раз для малого и среднего бизнеса. При этом наше решение комплексное: МультиЧат - это одновременно и инструмент для персонализации, и для коммуникации.
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Виктор Брухис
5
комментариев
0
читателей
Полный профиль
Виктор Брухис - Статья выглядит так, как пожелали редакторы и интервьюер) Вопросы к интервью подбирал не я)) Хотя, в целом я согласен с вашим видением. А за пожелание удачи большое спасибо!
Монетизируйте свой сайт вместе с VIZTROM
VIZTROM
3
комментария
0
читателей
Полный профиль
VIZTROM - Добрый день! Так как мы сейчас работаем в приватном режиме, Вы врятли можете объективно оценить нашу рекламную площадку. У нас будет официальный запуск 3 марта для вебмастеров. Приглашаем Вас присоединиться к нам и лично посмотреть наш функционал.
Digital-разговор: Михаил Шакин про SEO, Google и заработок в интернете
Анна Макарова
368
комментариев
0
читателей
Полный профиль
Анна Макарова - Подготовим ) Пока предлагаю почитать интервью с Денисом Нарижным из той же серии. Там стенограмма =) www.seonews.ru/interviews/digital-razgovor-denis-narizhnyy-pro-ukhod-iz-seo-i-zarabotok-na-partnerkakh/
Как удвоить выручку за счет продвижения в поиске. Кейс coffee-butik.ru
Максим Боровой
3
комментария
0
читателей
Полный профиль
Максим Боровой - Последний вопрос (извиняюсь за количество) - почему на "В корзину" стоит Nofollow. Осознанно для распределение весов?
Автоматические SEO-аудиты: как напугать некорректными выводами
SEOquick
38
комментариев
0
читателей
Полный профиль
SEOquick - Парсинг сайтов – это самый лучший способ автоматизировать процесс сбора и сохранения информации. Конкурентов всегда нужно мониторить, а не сравнивать свой сайт через автоматический аудит анализатора.
Почему вы торгуетесь за показы, даже если платите за клики
Константин Требунских
3
комментария
0
читателей
Полный профиль
Константин Требунских - Дмитрий, спасибо за комментарий, хорошие замечания!) 1. "Какая-то подмена понятий. CPM у “Original Works” взлетает не от того, что у них РАВНАЯ цена клика, а оттого, что вы "с потолка" поставили ему CPC в 2 раза выше, чем был. Логично, что и CPM в 2 раза увеличился (см. формулу выше). Если бы вместо 5 вы всем решили поставить 2 или 1.5, то он бы наоборот уменьшился." Вы правы, что CPM уменьшился бы. В первой и второй табличке берем одинаковое количество показов (именно за них мы платим сначала) и считаем данные, в том числе CPC. Мы поставили рекламодателей в одинаковые условия и посмотрели их эффективность в разрезе цены клика при одинаковом количестве показов. А затем изменился аукцион, и, взяв получившиеся данные по кликам и CTR, мы поставили рекламодателей тоже в одинаковое положение, но уже по цене клика, ведь мы теперь за него платим. Посчитали эффективность в разрезе уже CPM. Тут если и есть подмена понятий, то она точно не моя, а рекламных систем, потому и обозначена, как "ход конем" :) 2. "Ок, смотрим таблички "как оно было" и "как оно стало". Было: система суммарно за 2 000 денег показала рекламу 4 000 раз. Стало: система суммарно за 2 000 денег показала рекламу 13 500 раз. Сомнительный профит для системы." Вы правы, именно поэтому для рекламодателей с низким CTR ставка будет выше, чем для рекламодателей с высоким CTR. Просто чтобы система окупилась. Потому что, системе выгодно продавать показы тем, у кого кликов будет больше (ведь они платят за клик). По факту реальные цены за клик в аукционе будут как в таблице 2. Но ранжирование системы проводят по таблице 5.
Где SEO-специалист может углубить свои навыки в области поискового продвижения
Ирина Полинина
1
комментарий
0
читателей
Полный профиль
Ирина Полинина - Полезно! Спасибо
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
368
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
139
Комментариев
121
Комментариев
108
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
85
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!