コンテンツへスキップ

記述統計ダッシュボード

無料の記述統計ダッシュボード。CSV ファイルをアップロードして、各数値列のカウント、平均、中央値、最頻値、標準偏差、分散、四分位数、IQR、範囲、歪度、尖度を即座に確認できます。

記述統計ダッシュボード

CSV ファイルをアップロードして、データセットの各数値列の包括的な統計プロファイルを即座に取得できます。ダッシュボードは列ごとに 14 の主要指標を計算し、各列のミニヒストグラムを表示し、数値列が 2 つ以上あれば、変数間の関係を一目で把握できるピアソン相関ヒートマップを生成します。すべての処理はブラウザ内で行われ、データがデバイスの外に出ることはありません。

記述統計とは何か

記述統計は、より大きな母集団について推論することなく、データセットの主な特徴を要約・説明します。以下の基本的な問いに答えます:

  • 中心はどこか? 平均、中央値、最頻値はそれぞれ異なる方法で「典型的な」値を捉えます。
  • データはどれくらい広がっているか? 標準偏差、分散、IQR、範囲が変動性を定量化します。
  • 分布の形は何か? 歪度(非対称性)と尖度(尾の重さ)が形を説明します。
  • 極端な値は何か? 最小値、最大値、四分位数が境界と構造を示します。

指標の説明

平均:全値の合計をデータ数で割ったもの。外れ値に敏感。

中央値:データを並べ替えたときの中間値。外れ値に対して頑健。

最頻値:最も頻繁に出現する値。連続データでは有意義な最頻値がない場合もあります。

標準偏差:各データ点と平均との平均距離。ダッシュボードは標本標準偏差(n − 1 で除算)を使用。

分散:標準偏差の二乗。多くの統計公式の核心。

IQR(四分位範囲):Q3 − Q1、データの中央 50% の幅。外れ値に頑健。

歪度:分布の非対称性を測定。0 に近い → ほぼ対称。正 → 右の尾が長い。負 → 左の尾が長い。

超過尖度:正規分布(超過尖度 = 0)との尾の重さを比較。正(尖鋒型) → より重い尾;負(平鋒型) → より軽い尾。

相関行列

数値列が 2 つ以上ある場合、ダッシュボードはすべてのペアについてピアソン相関係数 r を計算します。ヒートマップは強い正の相関を赤、強い負の相関を青で表示します。注意:ピアソン r は線形関係のみを測定し、相関は因果関係を意味しません。

ダッシュボードの使い方

  1. CSV ファイルをアップロードまたは貼り付け — 区切り文字は自動検出。
  2. データセット概要を確認:行数、列数、数値列、欠損値。
  3. 列カードをスクロール:各カードにミニヒストグラムと完全な統計表を表示。
  4. ページ下部の相関行列を確認。
  5. 数値列が 50 超の場合、最初は 12 列のみ表示。

プライバシー

すべての計算はブラウザ内でローカルに実行されます。サーバーにデータは送信されません。最大ファイルサイズ:約 5 MB。

参考文献

  • Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
  • Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
  • Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.