Retail & Big Data

Análisis de Sano y Fresco

Transformación de 5 millones de registros transaccionales en inteligencia competitiva mediante SQL, Power BI y Machine Learning.

Flujo de datos del proyecto

Pipeline: Extracción de 5M+ de filas en SQL, visualización en Power BI y modelado predictivo en Python.

El valor añadido de mi perfil

En este proyecto, mi formación en ADE fue fundamental para identificar que el ticket medio y la recurrencia por sección eran los motores reales de rentabilidad para "Sano y Fresco". Por otro lado, la mentalidad de 42 Madrid me permitió procesar una base de datos de 5 millones de entradas sin comprometer el rendimiento, utilizando SQL para los datos y Python para desarrollar un algoritmo de cross-seling.

Resumen Ejecutivo

El reto consistía en fragmentar un volumen masivo de datos para extraer accionables claros. Implementé un ecosistema de BI completo: desde la limpieza de datos y creación de KPIs financieros (Margen, Ticket Medio, LTV) hasta el desarrollo de un motor de recomendación Market Basket Analysis. Esto permitió pasar de una gestión basada en la intuición a una estrategia dirigida por datos (Data-Driven).

Conclusiones Generales

  • Optimización de consultas SQL para el manejo eficiente de +5M de registros.
  • Creación de un Dashboard interactivo que reduce el tiempo de análisis gerencial en un 80%.
  • Descubrimiento de patrones de compra cruzada mediante Python para optimizar el layout de tienda y carrito web.
Deep Dive

1. Arquitectura SQL e Insights de Negocio

Utilicé SQL para acceder a la base de datos. Estructuré queries complejas para extraer KPIs como la tendencia de ingresos mensuales y el rendimiento por departamento. Segmenté los productos más valiosos y analicé el ticket medio para entender los hábitos de consumo real bajo una estructura de JOINs y subconsultas optimizadas.

Análisis de consultas SQL

2. Dashboard Estratégico en Power BI

Siguiendo un Documento de Requerimientos Funcionales (BRD), diseñé un modelo de datos en estrella. El panel permite filtrar por mes y sección, visualizando mediante Treemaps y gráficos de evolución el rendimiento de cada producto. Implementé medidas DAX para calcular dinámicamente la cantidad media por artículo y el valor promedio por pedido.

Cuadro de Mando Power BI
Cuadro de Mando Power BI

3. Algoritmo de Asociación con Python

Para la fase final, desarrollé un script en Python (utilizando pandas y sqlite3) para realizar un Market Basket Analysis. El algoritmo identifica qué productos tienen mayor probabilidad de ser comprados juntos. Este insight es crítico para la personalización de productos relacionados en el carrito de compra online, aumentando directamente el Average Order Value.

Market Basket Analysis Python
Market Basket Analysis Python