描述性统计仪表板
免费描述性统计仪表板。上传 CSV 文件,立即查看每个数值列的计数、均值、中位数、众数、标准差、方差、四分位数、IQR、极差、偏度和峰度。
描述性统计仪表板
上传 CSV 文件,立即获取数据集中每个数值列的完整统计概况。仪表板为每列计算 14 项关键指标,渲染迷你直方图,并在有两列或更多数值列时生成皮尔逊相关热图,一眼即可发现变量间的关系。所有处理均在您的浏览器中完成,数据永不离开您的设备。
什么是描述性统计?
描述性统计汇总并描述数据集的主要特征,而不对更大的总体做出推断。它回答以下基本问题:
- 中心在哪里? 均值、中位数和众数以不同方式捕捉”典型”值。
- 数据有多分散? 标准差、方差、IQR 和极差量化了变异性。
- 分布形状如何? 偏度(不对称性)和峰度(尾部权重)描述了超越简单平均的形状。
- 极端值是什么? 最小值、最大值和四分位数展示了边界和结构。
指标说明
均值:所有值之和除以数量。对异常值敏感。
中位数:排序后的中间值。对异常值具有鲁棒性。
众数:出现最频繁的值。对于连续数据可能没有有意义的众数。
标准差:每个数据点与均值的平均距离。仪表板使用样本标准差(除以 n − 1)。
方差:标准差的平方。在许多统计公式中处于核心位置。
IQR(四分位距):Q3 − Q1,数据中间 50% 的宽度。对异常值具有鲁棒性。
偏度:衡量分布的不对称性。接近 0 → 大致对称。正值 → 右尾长(均值 > 中位数)。负值 → 左尾长。
超额峰度:将尾部权重与正态分布(超额峰度 = 0)比较。正值(尖峰态) → 尾部更重;负值(低峰态) → 尾部更轻。
相关矩阵
有两列或更多数值列时,仪表板计算每对之间的皮尔逊相关系数 r。热图以红色显示强正相关,以蓝色显示强负相关。注意:皮尔逊 r 只测量线性关系,相关性不等于因果关系。
使用方法
- 上传或粘贴 CSV 文件,分隔符自动检测。
- 查看数据集概览:行数、列数、数值列、缺失值。
- 浏览列卡片:每张显示迷你直方图和完整统计表。
- 在页面底部查看相关矩阵。
- 数值列超过 50 时,默认仅显示前 12 列。
隐私
所有计算在您的浏览器中本地执行,不向任何服务器传输数据。最大文件大小约 5 MB。
参考文献
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
- Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.