Transformación de 5 millones de registros transaccionales en inteligencia competitiva mediante SQL, Power BI y Machine Learning.
Pipeline: Extracción de 5M+ de filas en SQL, visualización en Power BI y modelado predictivo en Python.
En este proyecto, mi formación en ADE fue fundamental para identificar que el ticket medio y la recurrencia por sección eran los motores reales de rentabilidad para "Sano y Fresco". Por otro lado, la mentalidad de 42 Madrid me permitió procesar una base de datos de 5 millones de entradas sin comprometer el rendimiento, utilizando SQL para los datos y Python para desarrollar un algoritmo de cross-seling.
El reto consistía en fragmentar un volumen masivo de datos para extraer accionables claros. Implementé un ecosistema de BI completo: desde la limpieza de datos y creación de KPIs financieros (Margen, Ticket Medio, LTV) hasta el desarrollo de un motor de recomendación Market Basket Analysis. Esto permitió pasar de una gestión basada en la intuición a una estrategia dirigida por datos (Data-Driven).
Utilicé SQL para acceder a la base de datos. Estructuré queries complejas para extraer KPIs como la tendencia de ingresos mensuales y el rendimiento por departamento. Segmenté los productos más valiosos y analicé el ticket medio para entender los hábitos de consumo real bajo una estructura de JOINs y subconsultas optimizadas.
Siguiendo un Documento de Requerimientos Funcionales (BRD), diseñé un modelo de datos en estrella. El panel permite filtrar por mes y sección, visualizando mediante Treemaps y gráficos de evolución el rendimiento de cada producto. Implementé medidas DAX para calcular dinámicamente la cantidad media por artículo y el valor promedio por pedido.
Para la fase final, desarrollé un script en Python (utilizando pandas y sqlite3) para realizar un Market Basket Analysis. El algoritmo identifica qué productos tienen mayor probabilidad de ser comprados juntos. Este insight es crítico para la personalización de productos relacionados en el carrito de compra online, aumentando directamente el Average Order Value.