Cómo combinar fuentes de datos en Google Data Studio

La combinación de fuentes de datos o data blending es la funcionalidad de Google Data Studio que permite construir tu propia fuente de datos a partir de otras. El cómo combinar fuentes de datos en Google Data Studio quizás sea una de las funcionalidades más complejas de la herramienta. No por la complejidad de la configuración, si no porque el resultado de salida de la combinación puede no ser el deseado.

Antes de empezar a combinar datos de distintas fuentes debes tener claro el concepto de «join» de datos, un concepto heredado del lenguaje SQL de base de datos. En el siguiente artículo describiremos con ejemplos cada tipo de join (unión) que nos permite Google Data Studio, con la intención de que todos podáis explotar al máximo esta funcionalidad.

¿Cuándo usar la opción de combinar fuentes de datos?

Cuando llegas a un uso profesional de la herramienta pronto te encuentras con una limitación en la funciones básicas: Incluir en un gráfico datos de 2 fuentes de datos diferentes.

Un caso de uso clásico es el siguiente. Imagínate que haces anuncios en 2 plataformas publicitarias: Google Ads y Bing Ads. Te encuentras creando el informe de rendimiento de tus campañas publicitarias y deseas ver en una misma tabla los datos por las distintas campañas que tienes activas en todos tus soportes publicitarios. Esta información sólo es posible mostrarla en una misma tabla creando una fuente de datos combinada con las 2 fuentes individuales: Fuente creada con el conector de Googe Ads y fuente creada con el conector de Bing Ads.

Con la combinación también se permite agregar métricas y crear nuevas columnas operando con datos de 2 fuentes distintas. Otra gran ventaja de combinar fuentes de datos.

Tipos de unión de Fuentes de datos/Tablas

Una unión de fuentes de datos consiste en una combinación de los registros de 2 o más tablas mediante un operador y una condición de unión. A través del operador se define cómo combinar las filas coincidentes y no coincidentes de cada una de las tablas y a través de la condición de unión definimos el conjunto de campos por los cuáles están relacionadas las tablas entre sí.

Combinar Datos --> Configuración de Unión Google Data Studio
Cómo combinar fuentes de datos en Google Data Studio

Tipos de Operadores de unión

Inner Join

Sólo se devuelve las filas coincidentes en ambas tablas, la tabla de la izquierda (Tabla 1) y derecha (Tabla 2). Ejemplo: El registro 3 y el registro C no existe en la tabla de la derecha por lo tanto no se devuelve en el resultado de la unión.

Inner join - Operación de unión entre tablas Data Studio
Inner join – Operación de unión entre tablas

Left Outer Join

Devuelve todas las filas de la tabla Izquierda (Tabla 1) y las coincidentes de la derecha (Tabla 2). Ejemplo: El registro 3 sólo existe en la izquierda pero se devuelve en el resultado de la unión igual.

Left join - Operación de unión por la izquierda Data Studio
Left join – Operación de unión por la izquierda

Right Outer Join

Devuelve sólo las filas coincidentes de la tabla de la izquierda y todos los registros de la tabla de la derecha. Ejemplo: El registro C sólo existe en la tabla de la derecha pero se devuelve en el resultado de la unión.

Right Join - Operación de unión por la derecha Data Studio
Right Join – Operación de unión por la derecha

Full Join

Devuelve todas las filas, tanto coincidentes cómo no.

Full Join - Operación de devuelve todo
Full Join – Operación de devuelve todo

Cross Join

Devuelve el resultado de cruzar todo los registro de la izquierda con todos los de la derecha.

Cross Join - Operación de cruzar todo con todo.
Cross Join – Operación de cruzar todo con todo.

Caso de uso: Cómo combinar fuentes de datos en Google Data Studio

Para que veas claramente el uso de estos operadores dentro de la herramienta, os planteamos un caso práctico de cómo combinar dos fuentes de datos de ejemplo.

Para ello os compartimos 2 fuentes de datos en formato Google Sheet:

Ambos sheets los hemos añadido cómo fuentes de datos a través del conector de Hoja de cálculo de Google.

Descripción del caso de uso

En la fuente de Inversión Paid disponemos de varias filas con datos de impresiones, inversión CPC y número de clientes potenciales conseguidos, cada fila representa las métricas de varios días del mes de abril. En un caso real estos datos podrían traerse de una fuente de datos configurada con un conector de Google Analytics o Google Ads.

En la fuente Ventas CRM tenemos varias filas con dimensión de Fecha (varios días de abril y mayo), canal publicitario y país, y métricas transacciones e ingresos.

Antes de seguir leyendo te recomiendo que le eches un vistazo a los datos de ambas fuentes. Algo muy importante antes de ponerse a operar con cualquier fuente de datos es conocer en profundidad la información que contiene la fuente, estudiar tipo de datos y volumen de filas.

El reto

Os retamos a adivinar el resultado de estas operaciones antes de ver las respuestas (Link a DataStudio más abajo):

  1. ¿Cuál sería el resultado si realizamos una combinada de tipo Inner join dónde la tabla 1 es la Inversión Paid y tabla 2 Ventas CRM? La única clave de unión es la fecha.
  2. ¿ Qué pasa con el resultados global de ganancias en la combinada de tipo Left join?
  3. ¿Porqué ganamos menos o más si las fuentes de datos son las mismas?
  4. ¿ Qué tipo de configuración deberíamos de hacer en nuestra fuente de datos combinada para que el cálculo de ganancia y CPC medio sea real durante el mes de abril?

Y aquí el link al DataStudio con todas las soluciones: https://datastudio.google.com/reporting/aecb6a61-0f31-414b-bb10-1e2b4fcaf66d

Observar con detenimiento los distintos que pueden ser los resultados de las métricas totales si configuramos incorrectamente nuestra fuente combinada.

Podéis dejar todas vuestras dudas o consultas en los comentarios.

Links de interés

Para finalizar os aporto varios enlaces que yo creo que os pueden ayudar a comprender el Data Blending si después de esta lectura no ha quedado lo suficientemente claro:

¿Has aprobado el reto? ¡Estás preparado para el blending! 🙂

Fátima Andrade
Fátima Andrade

LLevo más de 8 años trabajando en negocios digitales, analizando y estableciendo estrategias para aumentar el retorno de la inversión en Marketing. Actualmente mi día a día se basa en segmentar clientes y orquestar los canales de comunicación dentro de una visión 360 omnicanal del cliente.

Necesitas compartirlo y lo sabes!

Deja un comentario