La atribución a través del fútbol

En el mundo digital una de las principales preocupaciones de los equipos de marketing es la distribución correcta del presupuesto. Decidir qué recursos destinan a cada canal de captación de tráfico es fundamental y para ello necesitan, evidentemente, datos. 

Y ahí es donde entramos nosotros, los analistas. Muchas veces somos los encargados de mostrarles a los profesionales del marketing qué canales y campañas están funcionando mejor. En definitiva, cuáles tienen un mejor retorno para así distribuir los esfuerzos para conseguir la mayor rentabilidad posible

El complejo mundo de la atribución

Todo suele comenzar con una petición de este estilo: 

  • Encargado de Marketing: “Buenos días, me podrías pasar un informe con las ventas e ingresos obtenidos por cada uno de los canales de marketing en el último trimestre?”

Perfecto, no hay problema. Entramos en Google Analytics y sacamos un informe donde se vean todas nuestras ventas e ingresos desglosados por cada una de las fuentes. Se compara con la inversión que se ha hecho en los distintos canales y ¡listo! Ya sabemos la rentabilidad que ha tenido el tráfico procedente de SEO, de Google Ads o de RRSS. 

Sencillo, ¿verdad? Pues siento decirte que esto no es lo que suele pasar. El mundo de la atribución no es tán fácil como puede parecer. La situación real suele acercarse más a esto: 

Tras la petición preparas un informe con la ayuda de tu herramienta de analítica habitual, te curras una presentación chula con muchos números, gráficas, tablas y conclusiones. Intentas contar una historia a través de los datos como tantas veces nos han dicho que debemos hacer. Finalmente se la haces llegar a los distintos responsables de marketing… En ese momento comienza la fiesta: 

  • El responsable de SEO: “Disculpa analista, pero tu informe es una mierda. Todas mis herramientas me indican que las visitas desde los buscadores están consiguiendo muchísimas más ventas de lo que pones aquí”
  • El responsable de RRSS: “¡No puede ser! ¿De dónde sacas estos datos? Me estás diciendo que después de todo el  trabajo que hemos hecho en redes estos últimos meses, solamente hemos conseguido esta p*** m**rd* de ventas? Mira lo que pone en Facebook Ads, anda…”
  • El responsable de Google Ads: “Esto tiene que estar mal. Estoy ahora mismo revisando en la plataforma de Google Ads y hemos conseguido muchas más ventas de las que reflejas en tu informe. Así que ya sabes, puedes tirar eso a la basura”

De repente te has convertido en el enemigo público nº 1 de todo el departamento de marketing. Ninguno está conforme con los datos que se muestran en tu informe. Ellos han estado trabajando guiándose por los datos que les ofrecía una plataforma y ahora llega el listo de turno para decirles que los datos son otros. Y lo más curioso de todo es que ¡todos tienen razón!

Pero, ¿cómo es posible que el de SEO, el de RRSS y el de GADS tengan datos distintos a los que maneja el analista y que todos los datos sean correctos? Es más, ¿cómo es posible que si sumas las ventas conseguidas por SEO, por RRSS y por GADS sumen más ventas que las realmente obtenidas por el propio ecommerce? Pues la respuesta a todo esto está, queridos amigos, en los famosos “Modelos de atribución”

Los modelos de atribución

Los modelos de atribución son una serie de reglas que determina de qué manera se reparte el mérito de una venta (o cualquier otro objetivo) entre los distintos canales de adquisición. 

Si una persona antes de hacer una compra ha conocido una nueva web a través de Facebook, luego ha sido impactada con un producto que le flipa a través de un anuncio de Google Ads y finalmente accedió al ecommerce a través de un buscador y acabó comprando, ¿cómo se reparte el mérito de esta compra? Pues depende. Por lo pronto, lo más seguro es que Google Ads te diga que la venta le pertenece, que Facebook se la atribuya a sí mismo y que la herramienta del buscador barra también para casa. Así es como, por arte de magia, una sola venta se ha convertido en 3… Muy loco todo esto.

¿Y cómo reparten ese mérito las herramientas de analítica? Ahí se recogen los datos de los distintos canales, así que su sistema de atribuir las ventas  será más justo ¿no? Pues nuevamente, depende. 

La atribución a través del fútbol

Se ha escrito mucho sobre modelos de atribución y hay muchísima documentación en la red que podéis consultar. Pero en este artículo quiero explicarlo de una forma diferente, a través de algo que conocemos bien muchos de nosotros: el fútbol.

Para ello echemos a volar nuestra imaginación. En el fútbol el principal objetivo es el gol, igual que en una tienda online el principal objetivo es la venta. Para conseguir meter ese gol es necesaria la interacción de múltiples jugadores. Defensas, medios y delanteros combinan esfuerzos entre sí para lograr meter el balón en la portería rival. En un ecommerce los distintos canales de adquisición se unen entre sí para lograr que un usuario realice la ansiada compra. 

En el fútbol todos tenemos claro que un gol es mérito de muchos jugadores y no solo del que empuja el balón entre los tres palos. Sin embargo, en un ecommerce muchas veces nos olvidamos de aquellas fuentes que no han sido la última puerta de entrada pero que claramente han contribuido a alcanzar el objetivo final. La forma de cambiar esto es conociendo bien los distintos modelos de atribución. De esta manera podremos interpretar correctamente los datos y usarlos para realizar las mejores estrategias a la hora de captar tráfico. 

Así que vamos a conocer los modelos de atribución de la mano de uno de los goles más importantes para todo coruñés y deportivista como yo. El gol que metió Alfredo Santaelena ante el Valencia en la final de la Copa del Rey de 1995, que otorgó al Deportivo el primer título de su historia. Repasemos la jugada: 

Tras un despeje de la defensa valenciana, Voro gana de cabeza el balón y se lo hace llegar a los pies de Ribera. Éste abre a la banda para Nando que a su vez hace un pase en largo a Manjarín. Tras un recorte, se interna hacia el centro del campo y centra el balón de forma teledirigida a Alfredo que tras un gran control de pecho bate a Zubizarreta de cabeza. 

La jugada de uno de los goles más importantes de la historia del Depor

Si lo prefieres puedes verlo tú mismo en Youtube.

A continuación veremos cómo los más utilizados modelos de atribución repartarían el valor que aportó cada uno de estos jugadores en la consecución de este gol.

Tipos de Modelos de atribución

Modelo última interacción:

Para este modelo todo el mérito del gol es de Alfredo. 

No tiene en cuenta ni a los defensas, que ganaron el balón y lo hicieron llegar al medio del campo. Ni la gran acción de Manjarín, deshaciéndose de un defensa rival y realizando un centro milimétrico a su compañero. 

¿Creéis que es un modelo justo? Pues es uno de los más utilizados por las herramientas de analítica y marketing. Muchas de las decisiones que se han tomado durante años se han basado en este modelo de atribución.

Modelo primera interacción:

En este caso todo el mérito del gol lo tendría el jugador que comenzó la jugada. Es el caso de nuestra jugada, Voro sería el jugador al que se le atribuiría el gol que hizo ganar la Copa del Rey al Depor.

Si nos basáramos solo en este modelo para crear nuestro equipo de fútbol, no le auguro un futuro muy prometedor.

Modelo lineal

En este modelo se reparte el gol a partes iguales entre todos los que han participado en la jugada. El resultado sería que cada uno de los jugadores se podrían atribuir un 20% de ese gol. Este modelo aunque a priori parezca el más justo no tiene por qué ser el más acertado. ¿Crees que realmente todos los jugadores han aportado el mismo valor a ese gol? Seguramente tu respuesta sea que no. 

Modelo deterioro en el tiempo:

Se parte de la premisa de que las interacciones más próximas al gol, son las que aportan mayor valor. Por tanto las interacciones más alejadas irán perdiendo porcentaje del mérito del gol. Según este modelo, el gol se podía repartir de la siguiente forma: 

  • Voro: 10% del gol
  • Ribera: 15% del gol
  • Nando: 20% del gol
  • Manjarín: 25% del gol
  • Alfredo: 30% del gol. 

Modelo basado en el valor de Shapley

Es el primero de los dos modelos avanzados que vamos a ver en este artículo. Se basa en un planteamiento del premio nobel Lloyd Shapley dentro de la rama de la teoría de juegos. 

Para averiguar qué valor le atribuimos a cada jugador en nuestra jugada necesitaríamos contar con mucha más información de la que tenemos en el ejemplo. Para calcularlo nos harían falta los datos de las distintas jugadas que han realizado esos cinco jugadores en conjunto o por separado. 

Una vez tenemos toda esa información obtenemos la probabilidad que hay de conseguir un gol con cada combinación posible entre esos 5 jugadores y cómo afecta que un jugador participe o no en la jugada. Y a partir de esto valora la aportación real de cada jugador en cada coalición posible. 

En el siguiente ejemplo vemos cómo la participación de Nando en la segunda coalición aumenta un 50% la probabilidad de conseguir un gol sobre la primera coalición. 

Como punto débil, este modelo tiene en cuenta las distintas combinaciones de participantes pero no el orden en el que participan, algo que en marketing normalmente tiene mucha importancia. 

El modelo de atribución “Basado en datos” de Google Analytics se basa en el valor de Shapley. 
Si quieres profundizar en cómo se repartiría exactamente el valor en cada uno de los jugadores, te recomiendo este extenso artículo sobre el tema.

Modelo basado en la cadena de Márkov

Al contrario que el valor de Shapley, este modelo sí que tiene en cuenta el orden en el que interactúan los jugadores. Para ello cuenta con las transiciones entre las distintas interacciones. En nuestra jugada habría los siguientes estados:  inicio-voro, voro-ribera, ribera-nando, nando-manjarín, manjarín-alfredo, alfredo-gol.

Para saber cómo este modelo atribuiría el valor del gol entre los jugadores lo vamos a ver con un nuevo ejemplo con tres jugadas diferentes: 

A partir de esta información podríamos trazar un gráfico como este: 

Flujo de modelo de atribución Cadena de Markov

Sabemos que la probabilidad de meter un gol si tenemos en cuenta estas tres jugadas es de un 33,3%. Es fácil de calcular porque sabemos que son tres jugadas y se consiguió un único gol. Pero el cálculo a partir del gráfico anterior sería: 

  • Para el flujo: inicio – Nando – Manjarín – Alfredo – Gol: 0,667 x 0,5 x 1 x 0,5 = 16,67%
  • Para el flujo: inicio – Manjarín – Alfredo – Gol: 0,33 x 1 x 0,5 =  16,67%
  • Sumamos el resultado de ambos flujos y nos da ese 33,33% 

Ahora tocaría saber el mérito de cada uno de los jugadores. Para ello tenemos que calcular cómo repercutirá la supresión de cada uno de ellos en la probabilidad de conseguir el gol. Qué pasaría si eliminásemos a:

  • Nando:  0,33 x 1 x 0,5 =  16,67% → Bajaría un 50% la probabilidad de gol. 
  • Manjarín → Bajaría un 100% la probabilidad de gol.
  • Alfredo → Bajaría un 100% la probabilidad de gol.

Y para el cálculo final lo que haremos será relacionar la caída de eliminar cada uno de los jugadores de forma independiente con la suma de la caída de quitar a todos ellos. Es decir: 

  • Nando: 0,5 / (0,5+1+1) = 0,2 → Se le atribuiría el 20% del gol
  • Manjarín: 1 / (0,5+1+1) = 0,4 → Se le atribuiría el 40% del gol
  • Alfredo: 1 / (0,5+1+1) = 0,4 → Se le atribuiría el 40% del gol

¿Cuál es el mejor modelo de atribución?

Ahora que ya conocemos un poco mejor los distintos modelos de atribución podemos concluir que no hay modelos buenos o malos,  mejores o peores, ni más ni menos justos. Lo importante es saber interpretar lo que nos está diciendo cada uno. La mejor opción es combinar toda la información valiosa que nos puede dar cada uno de ellos y así tomaremos siempre las mejores decisiones.

Pablo Visos
Pablo Visos

Estoy (casi) todo el día buceando en un océano de datos. Busco la manera de conseguir la información más valiosa para cada negocio y trabajo con ésta para alcanzar las metas de cada cliente. Mi especialidad son los proyectos digitales aunque últimamente me estoy abriendo también al mundo offline.

Deja un comentario