Как с помощью автоматизации выделить группы пользователей сайта, приносящие максимальный доход

8 Августа 2019
Время чтения: 8 минут
5 5 8
Дмитрий Кондратьев

Закон Парето гласит, что 20 % усилий дают 80 % результата. Для современного digital-маркетинга баланс смещен еще дальше: обычно от 1 до 5 % трафика генерирует основной поток выручки. Как из огромного потока посетителей выделить наиболее перспективных, чтобы сфокусировать на них усилия? Расскажу, как мы делаем это в Wrike.

Wrike — это SaaS-платформа для управления проектами. Как и во многих других SaaS-бизнес-моделях, близкое знакомство с новым пользователем начинается с бесплатной триал-версии одного из наших тарифных планов.

Каждый месяц пользователи начинают десятки тысяч новых триалов. При этом, во-первых, возможности отдела продаж ограничены количеством сотрудников, и, во-вторых, менеджеры по продажам отличаются своей квалификацией. Перед отделом маркетинга стоит задача не только создать трафик и конвертировать его в триалы, но и сделать этот трафик наиболее качественным и помочь отделу продаж распределить свои усилия так, чтобы получить максимально возможную выручку.

За время существования Wrike у нас появилось понимание того, кто является нашим идеальным клиентом и принесет наибольшую ожидаемую выручку. Портрет клиента состоит из информации о том, как он нас нашел, на какой должности и в какой отрасли он работает, и других параметров. Проблема заключалась в том, что такое понимание существовало на интуитивном уровне: с его помощью нельзя было измерить текущую эффективность, и тем более обрабатывать большие потоки входящих данных. В определенный момент появилась необходимость отмечать каждого посетителя одним числом, которое бы показывало, насколько клиент ценен для нас.

Для выполнения таких задач в Wrike работает обширный отдел аналитиков и data-инженеров. Инженеры поддерживают и развивают инфраструктуру, а аналитики занимаются прикладными задачами, помогающими решать проблемы бизнеса с помощью данных.

Wrike

Как правило, в аналитике данных 80 % усилий тратится на сбор и очистку данных и только 20 % — на прикладной анализ. В масштабах отдела маркетинга существует три основных источника данных:

  1. наш веб-сайт, куда команда лидогенерации приводит трафик и где создаются новые триалы;
  2. приложения Wrike, в которых пользователи работают после начала триала;
  3. внешние базы данных, к которым мы обращаемся, чтобы обогатить собранные в первых двух источниках данные.

Данные с веб-сайта собираются в два потока:

  1. Рекламные данные и некоторые простые действия пользователей собираются с помощью Google Analytics. Загружать данные в GA достаточно просто, этим полностью занимается команда маркетинговой аналитики без помощи инженеров и зачастую даже без помощи команды веб-сайта, для этого используется Google Tag Manager. Самый полезный в этой части трюк, которым сегодня многие пользуются, — это загрузка идентификатора пользователя (client id) в качестве пользовательского параметра (custom dimension). Это простое действие позволяет при последующей загрузке информации в собственную базу данных разбивать ее на уровне отдельного пользователя.
  2. События с большой информационной насыщенностью и события, которые происходят в большом количестве, отправляются на сервис, упаковывающий информацию в HDFS (Hadoop Distributed File System, файловое хранилище в основе Apache Hadoop). Предварительной обработкой и обеспечением полноты данных здесь занимаются инженеры, что позволяет аналитикам уделять больше времени фактическому анализу. Аналитики имеют доступ к хранилищу через PySpark — когда данные нужны для анализа, они загружаются в базу данных, иногда с предварительной агрегацией, и используются для создания прикладных моделей.

Из-за большого количества событий на клиентской части Wrike и из соображения безопасности данных наших клиентов события в приложениях собираются только с помощью внутреннего логирования.

На основе информации в базе данных строятся отчеты для внутренних пользователей. Здесь же работают различные предсказательные модели, которые наши аналитики разрабатывают на Python.

Данные о клиентах, а также выводы моделей передаются в Salesforce, который используется в повседневной работе нашими менеджерами по продажам. Здесь аналитики отдела продаж и BI-инженеры создают алгоритмы, по которым происходит назначение лидов на менеджеров. Основные задачи аналитиков отдела продаж:

  1. назначение наиболее перспективных лидов лучшим менеджерам;
  2. назначение менеджера со знанием языка клиента и примерно в том же часовом поясе, что и клиент;
  3. проведение назначения максимально быстро, пока лид «горячий».

Но я немного забежал вперед. Прежде чем лид уйдет в Salesforce, отдел маркетинга должен присвоить ему некоторый количественный показатель качества.

Пожалуй, последним препятствием к усилению бизнес-модели алгоритмами машинного обучения сегодня является нежелание вкладывать ресурсы в эту сферу в связи с неопределенностью ее выгод. На самом деле, для создания базовых моделей, которые смогут быстро помочь оптимизировать маркетинговые усилия, необязательно сразу создавать большой отдел аналитики или иметь продвинутое хранилище для больших данных. Достаточно подключенной Google Analytics и базового знания Python.

Во многих случаях, особенно в B2C-бизнесе, для создания простого алгоритма классификации достаточно данных, получаемых из Google Analytics по каждому пользователю, в частности:

  1. количества сессий и просмотренных страниц;
  2. структуры и количества источников, по которым пользователь пришел на ваш сайт;
  3. факта посещения определенных страниц или входа в воронку оформления заказа;
  4. географического расположения пользователя, если ваш бизнес покрывает несколько регионов.

Для самого анализа можно использовать один из множества методов, уже реализованных в библиотеках для языков R и Python. Если у вас есть данные по конверсиям и параметрам ваших посетителей, модель можно построить в несколько строчек кода.

Начать рекомендую с логистической регрессии. Сегодня в прикладных задачах часто используются тщательно подогнанные ансамбли моделей, бустинг и другие продвинутые методы, но для начала именно логистическая регрессия может помочь вам быстро набрать предсказательную мощность. Получить ее можно, например, из пакета Sklearn для Python — в Сети на эту тему доступно множество инструкций.

Стоит помнить, что если конверсия вашего сайта составляет 5 %, то модель, которая будет всегда предсказывать отсутствие конверсии, будет права в 95 % случаев. Высокая точность, но на практике такая модель абсолютно бесполезна. Поэтому не забывайте взвешивать наблюдения так, чтобы у сконвертировавшихся пользователей вес был выше: практически все «пакетные» модели позволяют передать такой параметр. В digital-маркетинге предсказать наличие выручки для несконвертировавшегося пользователя не так страшно, как упустить реальную конверсию.

Все факторы, которые я перечислил выше, можно собирать на сайте в реальном времени. А следовательно, и классифицировать посетителя можно в реальном времени, перенеся веса, оцененные с помощью логистической регрессии, в JavaScript сайта.

Таким образом можно получить абстрактную оценку ценности одним числом для каждого посетителя сайта. Как правило, если разделить пользователей на группы согласно предсказанному логистической регрессией «счету» и построить график средней выручки по таким группам, в определенный момент можно увидеть резкий подъем, это будет выглядеть примерно так:

График

Здесь мы видим, что посетители, для которых предсказана оценка выше 0,75, приносят подавляющую долю выручки. И мы можем узнать, к какой из групп принадлежит пользователь, еще до совершения конверсии.

Области применения такой модели ограничиваются только вашим воображением. Вот несколько идей:

  1. динамическая оптимизация контента сайта, выведение upsell-предложений самым ценным лидам;
  2. приоритизация обработки заявок с сайта;
  3. оптимизация расходов на рекламу: например, можно загрузить score в качестве значения конверсии в Google Ads. После этого можно настроить объявления так, чтобы Google подбирал для показа аудиторию, похожую на ту группу посетителей сайта, которая имеет наивысшие оценки.


(2)
5/5
Оцените статью
Поделитесь с друзьями
Вы эксперт в
интернет-маркетинге?

Опубликуйте материал в нашем блоге

Содержание:
Будем на связи!