02 — Customer Analytics

Retail Customer Fidelity Analysis (RFM)

Analisi del comportamento clienti nel settore retail tramite modello RFM, con segmentazione avanzata, dashboard Power BI e raccomandazioni strategiche per marketing, retention e crescita del fatturato.

Python Pandas NumPy Power BI RFM Analysis Customer Segmentation DAX Feature Engineering

Obiettivo del progetto

Analizzare il comportamento dei clienti nel settore retail utilizzando un approccio RFM (Recency, Frequency, Monetary), con l'obiettivo di identificare segmenti ad alto valore e supportare decisioni di marketing, retention e crescita.

Il dataset è stato costruito replicando la struttura di dati retail reali, mantenendo logiche di business coerenti e sostituendo le informazioni sensibili.


Data Preparation & EDA

Validazione iniziale

Verificata la completezza delle colonne chiave. Nessun valore nullo rilevato nelle variabili critiche.

  • ID_Card
  • Prezzo
  • Prodotto
  • Data

Coerenza dati — Business Logic

Controlli effettuati per garantire coerenza con le logiche del dominio retail.

Sesso ↔ Reparto
Cliente M → Reparto Uomo · Cliente F → Reparto Donna
Prodotto ↔ Mondo
T-shirt / Jeans → Casual · Scarpe / Felpe → Sport · Giacche → Luxury
Prezzo ↔ Categoria
T-shirt fascia bassa · Jeans / Felpe fascia media · Giacche fascia alta

Gestione duplicati & Outlier

  • Verifica duplicati su chiavi transazionali: (ID_Card, Data, Codice_Articolo, Prezzo)
  • Rimozione dei duplicati per evitare distorsioni nelle metriche cliente
  • Analisi della distribuzione dei prezzi e verifica coerenza per categoria

Data Transformation

  • Creazione della colonna Data a partire da Anno, Mese, Giorno
  • Aggiunta di Giorno_Settimana e flag Weekend (booleano)
  • Uniformati valori categorici e conversione corretta dei tipi dati

EDA — Pattern identificati

  • Vendite per giorno della settimana e confronto weekend vs weekday
  • Identificazione picchi di vendita e performance per prodotto/categoria
  • Frequenza acquisti per cliente, distribuzione spesa, clienti ricorrenti vs occasionali
  • Distribuzione prezzi per categoria e verifica clustering naturale delle fasce

Customer Analysis & RFM Modeling

Costruzione delle tre metriche fondamentali per la fidelity cliente.

R
Recency
Giorni dall'ultimo acquisto
F
Frequency
Numero di acquisti per cliente
M
Monetary
Spesa totale per cliente

Segmentazione clienti

Top Client — alta spesa e alta frequenza
Medium Client — valore intermedio
Low Client — bassa spesa

Stato cliente (Recency)

Attivo — ≤ 30 giorni
A rischio — 31–90 giorni
Perso — > 90 giorni

Dashboard Power BI

La dashboard è strutturata in tre sezioni principali per coprire l'intero ciclo analitico: dai KPI di vendita alla fidelity cliente.

Overview Vendite
Overview Vendite — KPI totali, trend temporale, performance per negozio e prodotto
Analisi Clienti
Analisi Clienti — Segmentazione, distribuzione spesa, top clienti
Fidelity & Retention
Fidelity & Retention — Recency, clienti attivi vs a rischio vs persi

Key Insights

8 pattern chiave emersi dall'analisi, con relative raccomandazioni strategiche.

01

Concentrazione del fatturato

Il fatturato è concentrato su una minoranza di clienti ad alto valore, mentre la maggior parte genera una spesa contenuta.

Fidelizzazione Top Client · Strategie di retention
02

Distribuzione clienti

La maggioranza appartiene al segmento Medium, indicando opportunità di crescita verso il segmento superiore.

Upselling verso Top Client
03

Distribuzione della spesa

Distribuzione a coda lunga: pochi high spender generano gran parte del valore totale.

Personalizzazione offerte · Segmentazione marketing
04

Frequenza e retention

I clienti attivi mostrano una frequenza d'acquisto significativamente maggiore rispetto ai clienti persi.

Aumentare frequenza → migliorare retention
05

Recency e churn

Una quota significativa di clienti risulta inattiva nel periodo analizzato.

Campagne di re-engagement · Offerte mirate
06

Perdita di valore latente

Una parte del fatturato deriva da clienti oggi inattivi, recuperabili con azioni mirate.

Strategie di recupero clienti
07

Differenze tra negozi

I negozi principali generano la maggior parte del fatturato con logiche di business replicabili.

Replicare strategie top store · Ottimizzare outlier
08

Mix prodotto

I prodotti ad alto volume non coincidono sempre con quelli a maggiore valore unitario.

Ottimizzazione assortimento · Cross-selling

Takeaway

Il progetto dimostra come l'integrazione di analisi dati e logiche di business permetta di identificare segmenti ad alto valore, migliorare la retention clienti e supportare decisioni strategiche data-driven — trasformando dati transazionali grezzi in insight azionabili per il business.


Privacy & Dati

I dati utilizzati sono simulati per motivi di privacy, mantenendo struttura e complessità di scenari reali. La logica di business e i controlli implementati rispecchiano fedelmente il caso d'uso originale.