Dashboard Statistiche Descrittive
Dashboard gratuita di statistiche descrittive. Carica un file CSV e vedi immediatamente conteggio, media, mediana, moda, deviazione standard, varianza, quartili, IQR, intervallo, asimmetria e curtosi per ogni colonna numerica.
Dashboard Statistiche Descrittive
Carica un file CSV e ottieni istantaneamente un profilo statistico completo di ogni colonna numerica del tuo dataset. Il dashboard calcola quattordici indicatori chiave per colonna, visualizza un mini-istogramma per ciascuna e — con due o più colonne numeriche — genera una heatmap di correlazione di Pearson per individuare relazioni a colpo d’occhio. Tutta l’elaborazione avviene nel tuo browser; i tuoi dati non lasciano mai il tuo dispositivo.
Cos’è la statistica descrittiva?
La statistica descrittiva riassume e descrive le caratteristiche principali di un dataset senza fare inferenze su una popolazione più ampia. Risponde alle domande fondamentali:
- Dov’è il centro? Media, mediana e moda catturano il valore “tipico” in modi diversi.
- Quanto sono dispersi i dati? Deviazione standard, varianza, IQR e intervallo quantificano la variabilità.
- Qual è la forma della distribuzione? Asimmetria e curtosi descrivono la forma oltre una semplice media.
- Quali sono i valori estremi? Minimo, massimo e quartili mostrano i confini e la struttura.
Spiegazione degli indicatori
Media: somma di tutti i valori divisa per il conteggio. Sensibile agli outlier.
Mediana: valore centrale dopo aver ordinato i dati. Robusta agli outlier.
Moda: il valore più frequente. Per dati continui potrebbe non esserci una moda significativa.
Deviazione standard: distanza media di ogni punto dalla media. Il dashboard usa la deviazione standard campionaria (divisione per n − 1).
Varianza: quadrato della deviazione standard. Fondamentale in molte formule statistiche.
IQR (range interquartile): Q3 − Q1, ampiezza del 50 % centrale. Robusto agli outlier.
Asimmetria (skewness): misura l’asimmetria della distribuzione. Vicina a 0 → approssimativamente simmetrica. Positiva → coda destra lunga. Negativa → coda sinistra lunga.
Curtosi in eccesso: confronta il peso delle code con una distribuzione normale (curtosi in eccesso = 0). Positiva (leptocurtica) → code più pesanti; negativa (platicurtica) → code più leggere.
Matrice di correlazione
Con due o più colonne numeriche, il dashboard calcola il coefficiente di correlazione di Pearson r per ogni coppia. La heatmap mostra correlazioni positive forti in rosso e negative in blu. Nota: Pearson r misura solo relazioni lineari, e la correlazione non implica causalità.
Come usare il dashboard
- Carica o incolla un file CSV — i separatori vengono rilevati automaticamente.
- Consulta la panoramica del dataset: righe, colonne, colonne numeriche, valori mancanti.
- Scorri le schede delle colonne: ognuna mostra un mini-istogramma e una tabella statistica completa.
- Esamina la matrice di correlazione in fondo alla pagina.
- Con più di 50 colonne numeriche, vengono mostrate inizialmente solo le prime 12.
Privacy
Tutti i calcoli avvengono localmente nel tuo browser. Nessun dato viene trasmesso a server. Dimensione massima file: circa 5 MB.
Riferimenti
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
- Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.