跳转至内容

散点图与相关性分析

免费散点图工具。上传 CSV 文件或粘贴数据,选择两个数值列,即时查看变量间的关系。计算皮尔逊相关系数 (r)、R²,并可叠加显示线性回归线及其斜率和截距。

散点图与相关性分析

上传 CSV 文件或粘贴表格数据,选择两个数值列,立即查看变量间的关系。本工具在浏览器中绘制散点图,计算皮尔逊相关系数,并可选择性地叠加线性回归线——所有计算均在本地完成,数据不会发送到任何服务器。

什么是散点图?

散点图(XY 图)将成对观测值显示为二维平面上的点。每个点的 X 坐标来自一个变量,Y 坐标来自另一个变量。点的分布形态揭示了两个变量之间关系的形状、强度和方向。

散点图可以快速回答的问题:

  • 是否存在正相关(X 增大时,Y 也趋于增大)?
  • 是否存在负相关(X 增大时,Y 趋于减小)?
  • 关系是线性还是非线性
  • 是否存在离群点——远离主要点群的数据点?

皮尔逊相关系数(r)

皮尔逊 r 是描述线性关系的最常用单一统计量,取值范围为 -1 到 +1:

  • r = +1:完全正线性关系——所有点恰好落在一条向上倾斜的直线上。
  • r = 0:无线性关系。
  • r = -1:完全负线性关系——所有点恰好落在一条向下倾斜的直线上。

传统强度标准(Cohen, 1988):|r| < 0.1 可忽略;0.1–0.3 弱;0.3–0.5 中等;0.5–0.7 强;> 0.7 很强。

重要注意事项: r 只测量线性关联。相关性不等于因果关系。离群点会显著影响 r 值。务必可视化数据——安斯库姆四重奏(1973 年)表明,相同的 r 值可能对应完全不同的散点图。

R²——决定系数

等于 r 的平方,代表 Y 的方差中能被 X 的线性关系解释的比例。例如,R² = 0.64 意味着 Y 中 64% 的变异由 X 解释。

线性回归

勾选显示回归线可计算普通最小二乘(OLS)回归线:ŷ = 斜率 · x + 截距,使各点到直线的垂直距离平方和最小。

常见使用场景

  • 生物学/医学:身高 vs 体重、剂量 vs 反应、年龄 vs 血压。
  • 金融:价格 vs 交易量、收益率 vs 市场指数(Beta 估算)。
  • 教育:学习时长 vs 考试成绩、班级规模 vs 学业表现。
  • 工程:输入电压 vs 输出电流、温度 vs 电阻。

隐私保护

所有计算均在您的浏览器本地进行。不会向任何服务器传输数据。推荐最大文件大小:5 MB。