Deskriptive Statistik Dashboard
Kostenloses Dashboard für deskriptive Statistiken. CSV-Datei hochladen und sofort Anzahl, Mittelwert, Median, Modus, Standardabweichung, Varianz, Quartile, IQR, Bereich, Schiefe und Kurtosis für jede numerische Spalte sehen — plus Mini-Histogramme und Pearson-Korrelations-Heatmap.
Deskriptive Statistik Dashboard
Laden Sie eine CSV-Datei hoch und erhalten Sie sofort ein umfassendes statistisches Profil jeder numerischen Spalte in Ihrem Datensatz. Das Dashboard berechnet vierzehn Kennzahlen pro Spalte, rendert ein Mini-Histogramm für jede Spalte und — bei zwei oder mehr numerischen Spalten — zeigt eine Pearson-Korrelations-Heatmap, mit der Sie Beziehungen auf einen Blick erkennen. Die gesamte Verarbeitung erfolgt in Ihrem Browser; Ihre Daten verlassen Ihr Gerät nie.
Was ist deskriptive Statistik?
Deskriptive Statistik fasst die Hauptmerkmale eines Datensatzes zusammen, ohne auf eine größere Grundgesamtheit zu schließen. Sie beantwortet grundlegende Fragen:
- Wo liegt das Zentrum? Mittelwert, Median und Modus erfassen den „typischen” Wert auf unterschiedliche Weise.
- Wie stark streut die Daten? Standardabweichung, Varianz, IQR und Bereich quantifizieren die Variabilität.
- Welche Form hat die Verteilung? Schiefe (Asymmetrie) und Kurtosis (Schwanzgewicht) beschreiben die Form jenseits eines einfachen Durchschnitts.
- Was sind die Extremwerte? Minimum, Maximum und Quartile zeigen die Grenzen und Struktur.
Kennzahlen erklärt
Mittelwert ist die Summe aller Werte dividiert durch die Anzahl. Er reagiert empfindlich auf Ausreißer.
Median ist der mittlere Wert bei sortierten Daten. Er ist robust gegenüber Ausreißern.
Modus ist der am häufigsten vorkommende Wert. Bei kontinuierlichen Daten gibt es oft keinen bedeutsamen Modus.
Standardabweichung misst den durchschnittlichen Abstand jedes Datenpunkts vom Mittelwert. Das Dashboard verwendet die Stichproben-Standardabweichung (Division durch n − 1).
Varianz ist das Quadrat der Standardabweichung und bildet die Grundlage vieler statistischer Formeln.
Interquartilsabstand (IQR) ist Q3 − Q1, die Breite der mittleren 50 % der Daten. Er ist robust gegenüber Ausreißern.
Schiefe misst die Asymmetrie der Verteilung. Ein Wert nahe 0 bedeutet annähernde Symmetrie. Positive Werte weisen auf eine Rechtsschiefe (langer rechter Schwanz) hin; negative auf eine Linksschiefe.
Exzess-Kurtosis vergleicht die Schwanzgewichte mit der Normalverteilung (die einen Exzess-Kurtosis-Wert von 0 hat). Positive Werte (leptokurtisch) deuten auf schwerere Schwänze hin; negative (platykurtisch) auf leichtere.
Korrelationsmatrix
Bei zwei oder mehr numerischen Spalten berechnet das Dashboard den Pearson-Korrelationskoeffizienten r für jedes Paar. Die Heatmap zeigt starke positive Korrelationen in Rot und starke negative in Blau. Wichtig: Pearson r misst nur lineare Zusammenhänge, und Korrelation ist keine Kausalität.
Verwendung des Dashboards
- CSV-Datei hochladen oder einfügen — Trennzeichen werden automatisch erkannt.
- Datensatz-Übersicht prüfen: Zeilen, Spalten, numerische Spalten, fehlende Werte.
- Spaltenkarten durchscrollen: jede Karte zeigt Mini-Histogramm und Statistiktabelle.
- Korrelationsmatrix am Seitenende überprüfen.
- Bei > 50 numerischen Spalten zeigt das Dashboard zunächst nur die ersten 12.
Datenschutz
Alle Berechnungen laufen lokal in Ihrem Browser. Es werden keine Daten an Server übertragen. Maximale Dateigröße: ca. 5 MB.
Referenzen
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
- Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.