Categorías
Uncategorized

Cómo medir el valor de cada interacción

Modelo de Atribución

María Mestres

14/03/2023

Uno de los problemas más estudiados en el campo de la analítica web es la atribución de una compra a los distintos canales. Con el marketing digital se puede medir el camino que realizan las personas desde su primera visita hasta la compra, en el cual pueden pasar días, semanas o incluso meses hasta que las personas se decidan y, finalmente, realicen una compra.

Aquí entra en juego el modelo de atribución por canal. La atribución multicanal analiza todo el recorrido que realiza una persona hasta la compra y atribuye valor a todos los «touchpoints» o «interacciones» a lo largo de ese recorrido.

Existen diferentes tipos de modelo de atribución, ya que hay que tener en cuenta que se puede asignar más peso a un fragmento del path o a otro. Más valor a los primeros touchpoints equivaldría a darle más importancia a la captación del usuario; sin embargo, más peso en las últimas interacciones puede reflejar aquellos canales con los que el usuario decidió la compra. Los modelos más clásicos para la atribución de canales son:

  • Last Click: un modelo que atribuye el 100% del valor de conversión al último canal con el que realiza la compra.
  • First Click: un modelo que atribuye el 100% de la conversión al primer canal con el que interactuó su cliente.
  • Linear: el modelo que otorga la misma atribución a cada interacción que tu cliente tiene con tu empresa en el camino hacia la conversión.
  • Time Decay: un modelo que otorga valor adicional a los puntos de contacto más cercanos al punto de conversión en términos de tiempo.

Inicialmente, el modelo de atribución Data Driven de Google utilizaba cadenas de Markov para calcular la importancia de los canales en una compra. En pocas palabras, los modelos de Markov utilizan el efecto de eliminación, es decir, para el caso particular del modelo de atribución, se calcula la pérdida de compras/revenue si elimináramos cada canal. Por tanto, esto nos ayuda a saber en qué porcentaje cada canal ha aportado a las compras.

Datarmony ha querido ir un paso más allá y darle un nuevo enfoque a la atribución por canal. Para ello, en lugar de hacer uso del enfoque anterior basado únicamente en touchpoints de canales y con la base algorítmica de Markov, se ha desarrollado un sistema nuevo con mayor énfasis en el comportamiento del comprador. El resultado se basará en el cambio de probabilidad de compra antes de interactuar con ese canal y posteriormente.

Haciendo uso de la información obtenida mediante Google Analytics se estudia la influencia de cada una de las sesiones de los usuarios y cómo estas afectan a la probabilidad de obtener una compra en el período a atribuir. Con esta información, se reparte la aportación al éxito de compra entre cada uno de los canales que han participado en las sesiones estudiadas.

Entrenamos un modelo de clasificación mediante un árbol de decisión que nos permite predecir la probabilidad de compra tras cada sesión, combinado con teoría de juegos, obtenemos la atribución por canal.

Las principales diferencias entre el modelo actual y el de Markov se presentan a continuación:

Para entender a nivel particular la nueva atribución simularemos algunos usuarios y veremos el resultado de aplicar el modelo Data Driven.

Se definen seis usuarios que tienen ocho sesiones cada uno, en todos se ha producido una única compra de 134€, pero tienen diferentes comportamientos a nivel de sesión por las diferentes variables indicadas anteriormente. A parte, se ha analizado la influencia de cambiar tanto la cantidad de sesiones con cierto canal y su posición, poniendo el foco en dos canales de los que generan más curiosidad sobre el modelo: Email y Social – Brand – Paid.

El resumen a nivel de comportamiento de estos canales consiste en:

Por ejemplo, el id 333 tiene muchas sesiones de Social, pero no son finalizadoras; por contra el 88888888 sí que convierte mediante Social o el 999999999 convierte en Social, pero solo tiene una sesión en ese canal. El mismo enfoque que en Social se le ha dado para el canal Email con los usuarios 4444, 55555 y 7777777.

Tras aplicar el modelo de atribución obtenemos la siguiente tabla donde w indica el peso de que se le ha atribuido a cada canal para cada id, según su comportamiento (cada fila suma 1 que es el total a atribuir a nivel proporcional):

Los usuarios 4444 y 55555 tienen un peso parecido en Email, que varía básicamente porqué el último es finalizador, en cambio en el último se reduce drásticamente debido que Email es solo finalizador.  Fijémonos igualmente que aunque el usuario 4444 tiene la mitad de las sesiones de Email, no le atribuye el 50% del peso.

Algo parecido ocurre cuando cambiamos a los usuarios con mayor presencia de Social, sus números se parecen a los proporciones del caso de email, aunque son ligeramente superiores por casuísticas del modelo.

Si agrupamos la información de cada uno de los id’s, podríamos obtener de la atribución del revenue para cada canal. Un ejemplo de los resultados de este análisis podría ser el siguiente:

En este caso, podemos comprobar que el canal que más revenue aporta es Email seguido de SEO, Paid Search y Direct. Además, se observan ciertas diferencias entre Last Click y Data Driven. Por ejemplo, a SEO se le aporta menos revenue con el modelo Data Driven que con el modelo Last Click, esto se puede deber a que suele ser un canal finalizador pero, en general, no aporta tanto a la conversión.

Para el ejemplo que acabamos de mostrar se ha de tener en cuenta que se han usado registros simulados con el mismo comportamiento a nivel de sesión (tiempo de duración, hits…). Esto se ha hecho para poder comparar su correcto funcionamiento respecto a Markov; si además, añadimos las variables de la sesión entonces podemos ver cómo estás influyen cambiando la aportación de cada canal.

La gracia del modelo data driven que ofrece Datarmony se encuentra en esto, ya no solo se basa en la posición, si no que también se basa en la sesión. Este último punto es realmente importante teniendo en cuenta las restricciones a nivel de cookies que dificultan el seguimiento completo de los usuarios.