Sincronizar GA4 con BigQuery para manejar grandes volúmenes de datos

GA4 es la próxima generación de Google Analytics que pronto dejará atrás a Universal Analytics. Como sabéis, la fecha definitiva para el sunset de UA es el 1 de julio 2023. ¡Mírate este post («La exportación de datos de UA», 2020, Ubaldo Hervás ) y no esperes hasta el último momento para exportar los datos. Existen grandes diferencias de GA4 respecto a UA, la principal es la total captura de datos basada en eventos.

Absolutamente todo, desde una sesión hasta una transacción, se captura como un evento y con parámetros asociados. Esto brinda la capacidad de capturar tantos detalles como sea posible en una página web o App que, a la práctica, se traduce en la ingesta de un gran volumen de datos. Para un análisis en profundidad de GA4 recomiendo leer este artículo («Hola Google Analytics 4«, 2021, Pablo Visos )

¡Adelante Vídeo! Sincronizar GA4 con BigQuery

Hoy explicamos cómo dar el primer paso para que Marketers y Analistas Digitales nos sintamos cómodos con el manejo de grandes volúmenes de datos. Y la mejor manera de hacerlo es sincronizar GA4 con BigQuery. Este post es el primero que hacemos sobre esta temática y vendrá acompañado de varias entregas para que aprendas a sacar el máximo provecho a BQ con un enfoque a GA4. 

Si ya tienes claro qué quieres utilizar la herramienta, ¡mírate el vídeo de cómo hacer la conexión

 ¿Hacia dónde va la Analítica Digital?

Las herramientas para el profesional del Marketing y la Analítica Digital cada vez son más intuitivas y permiten tener más independencia respecto a los equipos de IT / Desarrollo. Esto hace que el mantra Medir, Analizar, Decidir se invoque todos los días en las agencias y empresas. Los negocios digitales cada vez generan más datos. Están en todas partes y en todos los departamentos. ¿Qué te voy a contar, verdad? 

El diseño User-Friendly de las herramientas digitales y la creación de datos por doquier viene acompañado, en mi opinión, de una tendencia al alza hacia la Tecnificación del Marketing. Si te interesa la temática, no te pierdas estos podcasts («Technical Marketing Handbook», 2021, Simo Ahava).

Un ejemplo de ello es la gradual desaparición de las 3rd party cookies. Un verdadero quebradero de cabeza para Marketers y Publicistas que verán afectadas sus campañas (si es que no les está afectando ya) y que se encuentran de lleno con el nuevo mundo de la GDPR compliance con el manejo de CMPs, 1st party cookies, implementaciones Server-Side e incluso ya vemos herramientas de analítica cookieless como Seal Metrics. Puedes ver una presentación en el canal de Youtube de Mide y Vencerás. ¡Un nuevo y verdadero reto!

Y no solo esto, sino que con la llegada de GA4 y la posibilidad de conectarse con BigQuery (antes solo era posible con GA360) se está abriendo un camino sin retorno hacia el uso de los datos. Tanto Marketers como Analístas Digitales tenemos hoy la oportunidad de adquirir nuevas competencias y habilidades que nos van a venir muy bien para seguir creciendo profesionalmente y adaptarnos a la era del dato. Estoy hablando del lenguaje SQL, y concretamente la oportunidad que nos está ofreciendo Google al poder sincronizar GA4 con BigQuery.  

Tracking my cookies? They will never get muy recipe!

SQL cumple 40 años

Sí, has oído bien. El lenguaje SQL fue desarrollado por IBM en la década de 1970. En la actualidad, es el lenguaje más utilizado para consultar bases de datos y su dominio lo convierte en una hard-skill clave para todas las empresas que cuenten con bases de datos. ¿Hay alguna hoy en día que no utilice ninguna? El acrónimo SQL en Inglés significa Structured Query Language y es un lenguaje que permite descargar y manipular datos de una base de datos relacional.

​​El lenguaje SQL se caracteriza por el uso del álgebra y el cálculo relacional para realizar las consultas. Permite sumar, restar, dividir, multiplicar, realizar medias, filtrar, etc los valores de una tabla. 

  • Integridad de los datos →  Preserva la integridad de los datos, asegurándose de que sean válidos, correctos y completos. También protege la base de datos de corrupciones provocadas por fallos del sistema o actualizaciones inconsistentes

  • Flexibilidad → Es un lenguaje muy versátil a la hora de implantar soluciones y permite definir diferentes formas de ver los datos para satisfacer las demandas específicas de los usuarios

  • Sencillez y claridad → Es un lenguaje unificado, claro y de fácil comprensión. Los comandos para crear la estructura de base de datos o manipular la información comparten la misma forma. Por ejemplo, el lenguaje SQL de Oracle no es idéntico al de Microsoft SQL Server, pero las diferencias son mínimas

Ya no es un lenguaje exclusivo para Data Engineers, Data Scientists o Data Analysts, que, además, utilizan lenguajes de programación como JavaScript, Python o R. Si no que vemos cómo empresas y agencias digitales valoran muy positivamente a los Marketers y Analistas Digitales que pueden defenderse con SQL. Y, sobre todo, ahora que GA4 se conecta directamente con BigQuery.

Analistas deben conocer SQL

SQL es el segundo lenguaje más común utilizado por el 50,73% de todos los Desarrolladores, solo superado por JavaScript que cuenta con un robusto 68,62%. En tercer lugar encontramos a Phyton con un 41,53% (ver encuesta «Developer Survey», 2021, StackOverflow)

Acerca de BigQuery

Google BigQuery es una solución de almacén de datos de empresa, en Inglés Data Warehouse, que no requiere servidor (serverless). Es altamente escalable, no requiere gestión de infraestructura y soporta los análisis para volúmenes muy grandes de datos, a la escala del Petabyte. Al pertenecer al ecosistema Google permite una integración totalmente nativa con el resto de sus productos y herramientas.  Por ejemplo: 

  1. Conexión con GA4 → Puedes sincronizar GA4 con BigQuery en cualquier momento y se volcarán los datos sin sampling.

  2. Importar Spreadsheets → Seguro que utilizas Spreadsheets de forma diaria. Esta es una de las formas más rápidas y eficaces para empezar a analizar una base de datos por sencilla que sea.

  3. Visualización en Data studio → El resultado de las consultas realizadas en BQ se presentan en forma de tablas que podrás exportar a Data Studio para transformarlas en gráficos (si trabajas con Tableau también puedes conectarlo).

  4. Plan gratuito → Capacidad de 10GB de almacenaje y 1 TB/mes de procesamiento de análisis. A partir de este volumen los precios suelen ser de 0.020€ por GB de almacenaje y 0.05€ por operación. El sandbox gratuito tiene una limitación de 60 días. Pasado este tiempo se borran los datos de los proyectos que tengamos. Por eso, recomiendo añadir una cuenta de facturación desde el primer día y tener controlado, mediante avisos, el gasto mensual. Ver Documentación Google

  5. Integración de distintas BBDD → Esta es mi funcionalidad preferida. Puedes juntar tablas de distintas fuentes siempre que tengan un denominador común. Por ejemplo, las tablas de GA4 tienen un user_id (en caso de login) o una transaction_id (en caso de un Ecommerce). Estas tablas pueden unirse con los datos que tengamos en el CRM o el CMS o en cualquier otra base de datos que compartan este mismo ID.
Uso de BigQuery

Vale, me gusta la idea. ¿Y ahora qué?

Ahora que ya sabes cómo sincronizar GA4 con BigQuery (ver vídeo de Youtube) lo primero que debes hacer es aprender las funciones básicas para el lenguaje SQL. Yo mismo empecé hace unos años con los cursos de Data Camp. Pero también puedes echar un vistazo a portales gratuitos como sqlzoo o Datademia. Al menos para que te empiecen a sonar las funciones. En un próximo artículo hablaré sobre los comandos principales y sobre cómo desanidar la tabla de GA4 con la función UNNEST

Para entonces, estate preparad@

Marshall Sansano Roma
Marshall Sansano Roma

Mi día ideal empieza con un buen café. Durante las primeras horas del día me encontrarás redactando guías técnicas, implementando contenedores o ejecutando queries. A partir del mediodía ya soy más comunicativo y empiezo a hablar sobre la consecución de objetivos, optimización web, hipótesis de mejora y todo aquello relacionado con la Analítica Digital.

Deja un comentario