La combinación de fuentes de datos o data blending es la funcionalidad de Google Data Studio que permite construir tu propia fuente de datos a partir de otras. El cómo combinar fuentes de datos en Google Data Studio quizás sea una de las funcionalidades más complejas de la herramienta. No por la complejidad de la configuración, si no porque el resultado de salida de la combinación puede no ser el deseado.
Antes de empezar a combinar datos de distintas fuentes debes tener claro el concepto de «join» de datos, un concepto heredado del lenguaje SQL de base de datos. En el siguiente artículo describiremos con ejemplos cada tipo de join (unión) que nos permite Google Data Studio, con la intención de que todos podáis explotar al máximo esta funcionalidad.
¿Cuándo usar la opción de combinar fuentes de datos?
Cuando llegas a un uso profesional de la herramienta pronto te encuentras con una limitación en la funciones básicas: Incluir en un gráfico datos de 2 fuentes de datos diferentes.
Un caso de uso clásico es el siguiente. Imagínate que haces anuncios en 2 plataformas publicitarias: Google Ads y Bing Ads. Te encuentras creando el informe de rendimiento de tus campañas publicitarias y deseas ver en una misma tabla los datos por las distintas campañas que tienes activas en todos tus soportes publicitarios. Esta información sólo es posible mostrarla en una misma tabla creando una fuente de datos combinada con las 2 fuentes individuales: Fuente creada con el conector de Googe Ads y fuente creada con el conector de Bing Ads.
Con la combinación también se permite agregar métricas y crear nuevas columnas operando con datos de 2 fuentes distintas. Otra gran ventaja de combinar fuentes de datos.
Tipos de unión de Fuentes de datos/Tablas
Una unión de fuentes de datos consiste en una combinación de los registros de 2 o más tablas mediante un operador y una condición de unión. A través del operador se define cómo combinar las filas coincidentes y no coincidentes de cada una de las tablas y a través de la condición de unión definimos el conjunto de campos por los cuáles están relacionadas las tablas entre sí.
Tipos de Operadores de unión
Inner Join
Sólo se devuelve las filas coincidentes en ambas tablas, la tabla de la izquierda (Tabla 1) y derecha (Tabla 2). Ejemplo: El registro 3 y el registro C no existe en la tabla de la derecha por lo tanto no se devuelve en el resultado de la unión.
Left Outer Join
Devuelve todas las filas de la tabla Izquierda (Tabla 1) y las coincidentes de la derecha (Tabla 2). Ejemplo: El registro 3 sólo existe en la izquierda pero se devuelve en el resultado de la unión igual.
Right Outer Join
Devuelve sólo las filas coincidentes de la tabla de la izquierda y todos los registros de la tabla de la derecha. Ejemplo: El registro C sólo existe en la tabla de la derecha pero se devuelve en el resultado de la unión.
Full Join
Devuelve todas las filas, tanto coincidentes cómo no.
Cross Join
Devuelve el resultado de cruzar todo los registro de la izquierda con todos los de la derecha.
Caso de uso: Cómo combinar fuentes de datos en Google Data Studio
Para que veas claramente el uso de estos operadores dentro de la herramienta, os planteamos un caso práctico de cómo combinar dos fuentes de datos de ejemplo.
Para ello os compartimos 2 fuentes de datos en formato Google Sheet:
- Inversión Paid, representa la inversión en publicidad realizada en las distintas plataformas publicitarias por días https://docs.google.com/spreadsheets/d/1_-gVSqC9oRepc93K4uQrjK9Fh4gpTlp4rbZ2aPWfWtI/edit?usp=sharing
- Ventas CRM, incluye la información de las ventas online por día canal y país https://docs.google.com/spreadsheets/d/10mBniIrGWngdxhShCqEeBfjROA0w5tsHbmDFBU0D0SM/edit?usp=sharing
Ambos sheets los hemos añadido cómo fuentes de datos a través del conector de Hoja de cálculo de Google.
Descripción del caso de uso
En la fuente de Inversión Paid disponemos de varias filas con datos de impresiones, inversión CPC y número de clientes potenciales conseguidos, cada fila representa las métricas de varios días del mes de abril. En un caso real estos datos podrían traerse de una fuente de datos configurada con un conector de Google Analytics o Google Ads.
En la fuente Ventas CRM tenemos varias filas con dimensión de Fecha (varios días de abril y mayo), canal publicitario y país, y métricas transacciones e ingresos.
Antes de seguir leyendo te recomiendo que le eches un vistazo a los datos de ambas fuentes. Algo muy importante antes de ponerse a operar con cualquier fuente de datos es conocer en profundidad la información que contiene la fuente, estudiar tipo de datos y volumen de filas.
El reto
Os retamos a adivinar el resultado de estas operaciones antes de ver las respuestas (Link a DataStudio más abajo):
- ¿Cuál sería el resultado si realizamos una combinada de tipo Inner join dónde la tabla 1 es la Inversión Paid y tabla 2 Ventas CRM? La única clave de unión es la fecha.
- ¿ Qué pasa con el resultados global de ganancias en la combinada de tipo Left join?
- ¿Porqué ganamos menos o más si las fuentes de datos son las mismas?
- ¿ Qué tipo de configuración deberíamos de hacer en nuestra fuente de datos combinada para que el cálculo de ganancia y CPC medio sea real durante el mes de abril?
Y aquí el link al DataStudio con todas las soluciones: https://datastudio.google.com/reporting/aecb6a61-0f31-414b-bb10-1e2b4fcaf66d
Observar con detenimiento los distintos que pueden ser los resultados de las métricas totales si configuramos incorrectamente nuestra fuente combinada.
Podéis dejar todas vuestras dudas o consultas en los comentarios.
Links de interés
Para finalizar os aporto varios enlaces que yo creo que os pueden ayudar a comprender el Data Blending si después de esta lectura no ha quedado lo suficientemente claro:
- Documentación oficinal de Google DataStudio
- Video tutorial Google Data Studio Data Blending Tutorial With Examples
- SQL: Introducción al Join
¿Has aprobado el reto? ¡Estás preparado para el blending! 🙂