Dashboard Statistiche Descrittive

Carica un file CSV e ottieni istantaneamente un profilo statistico completo di ogni colonna numerica del tuo dataset. Il dashboard calcola quattordici indicatori chiave per colonna, visualizza un mini-istogramma per ciascuna e — con due o più colonne numeriche — genera una heatmap di correlazione di Pearson per individuare relazioni a colpo d’occhio. Tutta l’elaborazione avviene nel tuo browser; i tuoi dati non lasciano mai il tuo dispositivo.

Cos’è la statistica descrittiva?

La statistica descrittiva riassume e descrive le caratteristiche principali di un dataset senza fare inferenze su una popolazione più ampia. Risponde alle domande fondamentali:

Dov’è il centro? Media, mediana e moda catturano il valore “tipico” in modi diversi.
Quanto sono dispersi i dati? Deviazione standard, varianza, IQR e intervallo quantificano la variabilità.
Qual è la forma della distribuzione? Asimmetria e curtosi descrivono la forma oltre una semplice media.
Quali sono i valori estremi? Minimo, massimo e quartili mostrano i confini e la struttura.

Spiegazione degli indicatori

Media: somma di tutti i valori divisa per il conteggio. Sensibile agli outlier.

Mediana: valore centrale dopo aver ordinato i dati. Robusta agli outlier.

Moda: il valore più frequente. Per dati continui potrebbe non esserci una moda significativa.

Deviazione standard: distanza media di ogni punto dalla media. Il dashboard usa la deviazione standard campionaria (divisione per n − 1).

Varianza: quadrato della deviazione standard. Fondamentale in molte formule statistiche.

IQR (range interquartile): Q3 − Q1, ampiezza del 50 % centrale. Robusto agli outlier.

Asimmetria (skewness): misura l’asimmetria della distribuzione. Vicina a 0 → approssimativamente simmetrica. Positiva → coda destra lunga. Negativa → coda sinistra lunga.

Curtosi in eccesso: confronta il peso delle code con una distribuzione normale (curtosi in eccesso = 0). Positiva (leptocurtica) → code più pesanti; negativa (platicurtica) → code più leggere.

Matrice di correlazione

Con due o più colonne numeriche, il dashboard calcola il coefficiente di correlazione di Pearson r per ogni coppia. La heatmap mostra correlazioni positive forti in rosso e negative in blu. Nota: Pearson r misura solo relazioni lineari, e la correlazione non implica causalità.

Come usare il dashboard

Carica o incolla un file CSV — i separatori vengono rilevati automaticamente.
Consulta la panoramica del dataset: righe, colonne, colonne numeriche, valori mancanti.
Scorri le schede delle colonne: ognuna mostra un mini-istogramma e una tabella statistica completa.
Esamina la matrice di correlazione in fondo alla pagina.
Con più di 50 colonne numeriche, vengono mostrate inizialmente solo le prime 12.

Privacy

Tutti i calcoli avvengono localmente nel tuo browser. Nessun dato viene trasmesso a server. Dimensione massima file: circa 5 MB.

Riferimenti

Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.