Pacchetti di base

Il pacchetto Pandas offre la funzione .corr() che restituisce la matrice di correlazione Pearson. Per corréleazionii non lineari si può usare scipy.stats con il test di Spearman.

  • Numpy: calcolo efficiente di matrici e operazioni numeriche.
  • Statsmodels: modelli statistici avanzati e metodi diagnostici.

Visualizzazione interattiva

Con Seaborn è possibile creare heatmap colorate che mostrano la matrice di correlazione. Per visualizzazioni dinamiche, Bokeh e Plotly permettono di costruire dashboard interattive dove l’utente può filtrare variabili e osservare cambiamenti in tempo reale.

Pipeline completa

Esempio rapido: importare un dataset con Pandas, calcolare la matrice di correlazione, selezionare le coppie più significative con Statsmodels, e infine visualizzarle con Seaborn. Questo flusso è facilmente replicabile in notebook Jupyter o in script Python.