Как выбрать нужную модель атрибуции? Слово экспертам

Время чтения: 13 минут
logo

Модель атрибуции — это правило, по которому ценность конверсии распределяется по разным каналам взаимодействия покупателя с брендом. Это позволяет проанализировать эффективность разных источников и принять решение относительно подключения/отключения того или иного рекламного канала. Тем не менее, несмотря на тщательный анализ, часто это не приводит к нужным результатам. Почему? Выбрана не та модель атрибуции? Тогда как выбрать правильную? Об этом мы поговорили с экспертами.


Стандартные модели атрибуции

По умолчанию Google Analytics предлагает нам использовать несколько моделей: First Click, Last Click, Last Non Direct Click. Со временем появились и дополнительные модели:

  • «Линейная» — каждой точке на пути конверсии присваиваются равные доли ценности конверсии (по 25 %).
  • «С учетом давности взаимодействий» — самую большую долю ценности получают точки взаимодействия, наиболее близкие по времени к продаже или конверсии.
  • «На основе позиции» — по 40 % ценности присваивается первому и последнему взаимодействиям, а оставшиеся 20 % поровну распределяются между остальными.

Однако у всех этих моделей есть свои недостатки. Например, First Click и Last Click учитывают первый и последний канал, в то время как все остальные каналы остаются недооцененными. Атрибуция по уменьшению времени (The Time Decay Model) работает следующим образом: чем ближе канал к итоговой конверсии, тем выше его ценность. Однако и это может быть не совсем правильно, ведь каналы более длинных, но эффективных цепочек будут выглядеть хуже, чем такие же каналы в коротких цепочках. Более того, важность первого или последнего касания зачастую сильно зависит от сферы конкретного бизнеса, и недооценивать их тоже может быть не совсем корректно.

Какие еще могут быть модели атрибуции? Константин Юревич рассказал нам о модели атрибуции, разработанной на основе машинного обучения.


Модели атрибуции на основе Machine Learning

Константин Юревич
Константин Юревич: Predictive analytics and ML-attribution using BigQuery ML

В рамках платформы SegmentSteam мы построили все возможные атрибуции, которые присутствуют на рынке. Однако у всех этих моделей был ряд проблем:

  • Одни не учитывали мультиканальность и множественные касания перед покупкой.
  • Другие были неустойчивы к фроду.
  • Большинство смотрели только в прошлое и не могли предсказать, как действовать в будущем с новыми кампаниями и маркетинговыми активностями.

Проанализировав достоинства и недостатки каждой модели, мы разработали собственную модель поведенческой атрибуции, основанной на машинном обучении, которая:

  1. устойчива к фроду;
  2. использует накопленные знания для улучшения новых кампаний;
  3. справедливо распределяет ценность конверсии между всеми источниками в цепочке;
  4. учитывает не только переходы и UTM-метки, но и реальное поведение пользователя на сайте.

В основе модели лежит предсказание, с какой вероятностью будет совершено определенное действие (конверсия) каждым отдельным пользователем в зависимости от его поведения на сайте.

При каждом входе на сайт из нового канала предсказывается вероятность совершения клиентом покупки в начале сессии и в конце сессии. Разница в этих предсказаниях (дельта) определяет пропорцию ценности, которая присваивается каждому источнику, инициировавшему переход на сайт.

Рассмотрим пример, изображенный на картинке выше (цифры вымышленные):

  1. Пользователь впервые попал на сайт. Мы определяем, что вероятность совершения им покупки на этой стадии 10 %.
  2. Пользователь провел на сайте какое-то время, совершил какие-то действия и в итоге ушел. Вероятность совершения им покупки в момент ухода с сайта составила 25 %.
  3. Это означает, что компания Facebook получит 15 %, т. к. во время инициированной ею сессии вероятность конвертироваться изменилась с 10 до 25 % для конкретного пользователя.
  4. Затем, через 2 дня, пользователь увидел ретаргетинг от Criteo и вернулся на сайт. Проведя на сайте какое-то время, пользователь ушел, а вероятность совершения им покупки увеличилась лишь на 2 %. Поэтому Criteo получит лишь 2 % ценности в цепочке.

Таким образом, мы видим, как каждая рекламная кампания повлияла на вероятность совершения покупки каждым человеком, и можем ювелирно распределить ценность для каждого источника в цепочке.


Анализ многоуровневых пользовательских цепей

Кирилл Баскаков
Кирилл Баскаков, CBDO в Smart Analytics Russia

Вопрос выбора правильной модели атрибуции — это то, что всегда вызывало споры и разногласия разных маркетологов, аналитиков и разработчиков этих моделей. Чаще всего применяются простые модели атрибуции типа первого клика, последнего клика, последнего непрямого взаимодействия, линейной модели или какого-нибудь U-shape, где первый и последний источники получают больший вес.

Есть и продвинутые модели атрибуции, использующие более сложные математические модели, например, на основе векторов Шепли или цепей Маркова. Проблемы этих подходов в том, что они не учитывают критически значимого фактора последовательности источников/каналов в поведении пользователей.

В последнее время также набирают популярность различные ML-модели атрибуции. Предполагается, что модель обучается на данных, которые получены на входе.

Основные недостатки подхода:

  • требуется много данных, не работает на небольших и средних объемах;
  • требуется регулярно дообучать/переобучать модель, т. к. с изменением структуры трафика (а значит, и пользовательских цепей) меняется и вклад различных источников/каналов;
  • применение оптимизационных решений на базе ML-атрибуции приводит к пересчету весов.

Стоит обратить внимание на последний пункт. ML-атрибуция — это такая «ветреная дама», которая рекомендует вам произвести определенную оптимизацию (на основе атрибуцированных данных), а когда эта оптимизация произведена, она может «передумать» насчет значимости источников/каналов. Почему так происходит? Потому что цепи ломаются, и легко может быть, что ломаются высокоэффективные цепи и набирают обороты малоэффективные.

Но главная проблема всех моделей атрибуции в том, что они всегда скрывают структуру омниканального маркетинга и не дают оснований для принятия однозначных и окончательных управленческих решений. Создавая «плоскую» таблицу из данных, которые не могут быть представлены в виде простой таблицы из-за слишком большого количества взаимосвязей между ними, мы лишаем себя настоящего видения ситуации и действуем почти вслепую. Выглядит этот процесс примерно так:

Срезы

В результате:

  • Не видим последовательностей рекламных активностей.
  • Не понимаем количества касаний в рамках тех или иных цепочек.
  • Не можем посмотреть, в какие разные цепочки входит один и тот же канал, рекламная кампания, ключевое слово или что-то еще.
  • Нет возможности отделить эффективные пути от неэффективных.
  • Выстроить маркетинговую стратегию на основании этих данных невозможно.

Важно понять, что ваш маркетинг — это не цепь случайных событий, а последовательный путь, который подвержен логике. Прошлые действия пользователя, даже первый заход без достигнутых целей, вносят определенный вклад и ложатся в начало некой цепи дальнейших взаимодействий, которая была бы невозможна без этого, казалось бы, бесполезного касания.

Как же правильно и однозначно определить вес? Верный ответ — никак. И это не нужно. Smart Analytics показывает реальную структуру вашего омниканального маркетинга в виде сегментируемых агрегированных многоуровневых пользовательских цепей, а не плоской таблицы и избегает оценочных суждений.

Smart Analitics

По цепям доступны все важные показатели:

  • Совокупный расход, клики, показы.
  • Количество сеансов и пользователей.
  • Количество и стоимость конверсий (в т. ч. их кастомных групп).
  • Количество и стоимость достижения любого этапа воронки продаж из CRM.
  • Количество и объем продаж, CPO, ROAS, LTV и прочие.

Одни и те же источники/каналы будут входить в цепочки разного типа, и их показатели также будут различными:

Поняв, как устроены пути пользователей, вы сможете понять, как выстроить оптимальную маркетинговую стратегию. Есть цепи, которыми невозможно управлять, например «yandex/organic → google/organic → direct/none». Повлиять на их результаты вы не сможете. При этом будет огромное количество цепей с участием платного трафика, на которые можно оказывать прямое влияние. Приведу пару простых и самых очевидных примеров использования:

  • Если вы видите, что ретаргетинг невероятно эффективен в сочетании с сетевыми рекламными кампаниями в РСЯ — можете выгрузить сегмент и импортировать его в Яндекс, чтобы задать необходимые условия показа.
  • Если видно, что цепь с двумя заходами через Facebook неэффективна, а с одним работает хорошо, то можете настроить ограничение на число показов одному пользователю.
  • Можно строить простые сегменты внутри рекламных систем. Например, если видим, что пользователи, пришедшие через Яндекс.Поиск, не конвертируются в сетях (или ROI нас не устраивает), то можно создать сегмент «пришедшие с Яндекс.Поиска» и занизить для него ставки в сетевых РК (возможно, не во всех, а в определенных).
  • Если мы видим, что цепь (или множество цепей, которые содержат это условие) «Яндекс.Поиск» → «ремаркетинг в Google» имеет низкий ROI (например, по причине низкой конверсии), мы выгружаем cid'ы Яндекс.Поиска и заливаем их в ремаркетинговые кампании Google как сегмент, на который устанавливаем низкую ставку.
  • Если мы видим, что цепи с неким элементом (источником/каналом или рекламной кампанией, например) неэффективны вне зависимости от структуры, то можем этот источник/канал или нечто другое просто отключить без опасений, что это негативно повлияет на рентабельность каких-то других цепей.

Пользовательские цепи открывают огромное количество новых подходов к аналитике и, самое главное, к управлению омниканальным маркетингом. Использование этого инструмента позволит пересмотреть процесс построения маркетинговых стратегий и снизить количество решений, которые приводят к неожиданным негативным последствиям из-за недостатка данных, на основе которых они принимаются.


Модели атрибуции CoMagic

Для большинства видов бизнеса подойдут стандартные модели — все они есть в CoMagic. Если вам нужно, чтобы все было просто и понятно для принятия верных и быстрых решений, в личном кабинете вы найдете такой отчет: «Модели атрибуции». Он позволяет выбрать подходящую для вашего бизнеса модель и менять ее в режиме реального времени. Так можно сразу видеть, как меняется общая картина по эффективности каналов.

Выбирая наиболее подходящую вам модель, можно отталкиваться от стандартной модели Last Click. Если выбранная модель считает конверсий меньше, чем «Последнее взаимодействие», значит, канал при стандартной модели переоценен. Если исследуемая нами модель показывает конверсий больше, скорее всего, данный канал был недооценен.

Святослав Васильев
Святослав Васильев, директор по продукту

Как ни странно, все еще в большом количестве компаний рекламу анализируют только по модели last click. Это плохо не только потому, что во многих бизнесах по такой модели на передний план выходит органика и прямые заходы, но и потому, что замываются источники, приводящие предыдущие касания посетителей, совершивших конверсию.

Для тех, кто понимает важность отслеживания всех источников, лежащих на пути к продаже, мы выпустили «Модели атрибуции» и «Ассоциированные конверсии». Вкупе с нашей сквозной аналитикой они позволяют увидеть, с каких источников происходит первое знакомство будущего покупателя с вашим сайтом. Либо убрать из аналитики все прямые заходы, чтобы они не оттесняли те источники, на которые вы можете влиять. Также у нас в отчете вы можете анализировать ключи из всех рекламных систем одновременно, чтобы оценить общий вклад ключа безотносительно рекламной системы. Если же вы не понимаете, какая модель атрибуции лучше описывает ценность вклада рекламных источников, то можете использовать отчет «Ассоциированные конверсии», чтобы случайно не отключить рекламный источник, не влияющий на привлечение конверсий.

Хороший вопрос, какое окно ретроспективы нужно выбрать при использовании моделей атрибуции. Для этого нужно знать ваш цикл конверсии от первого касания. В CoMagic окно ретроспективы можно установить в 180 дней, это означает, что мы будем искать переходы с источников для посетителя за полгода до его конверсии. Если вам нужно меньшее значение, вы можете его поменять в настройках отчета.

Важно понимать главную вещь: какой бы подход к оценке значимости источников на пути к конверсии вы ни выбрали, в любом случае это будет лучше, чем оценивать рекламу только по модели last click и не задаваться вопросом о длине пути к конверсии и значимости рекламных источников на других местах пути, кроме последнего. А чтобы понять, что лучше работает именно для вашей специфики бизнеса, инструмент один — эксперименты.



(3)
5/5
Оцените статью
Поделитесь с друзьями
Содержание: