본문으로 건너뛰기

산점도 및 상관관계 분석

무료 산점도 도구. CSV 파일을 업로드하거나 데이터를 붙여넣고 두 숫자 열을 선택해 즉시 관계를 시각화. 피어슨 상관계수(r), R²를 계산하고 기울기와 절편이 있는 선형 회귀선을 선택적으로 표시합니다.

산점도 및 상관관계 분석

CSV 파일을 업로드하거나 표 형식의 데이터를 붙여넣고, 두 개의 숫자 열을 선택하면 즉시 관계를 시각화합니다. 이 도구는 브라우저에서 산점도를 그리고, 피어슨 상관계수를 계산하며, 선택적으로 선형 회귀선을 표시합니다. 데이터는 서버로 전송되지 않습니다.

산점도란?

산점도(XY 그래프)는 쌍을 이루는 관측값을 2차원 평면의 점으로 표시합니다. 각 점의 X 좌표는 하나의 변수에서, Y 좌표는 다른 변수에서 가져옵니다. 점들의 분포 패턴은 두 변수 간 관계의 형태, 강도, 방향을 드러냅니다.

산점도로 빠르게 답할 수 있는 질문들:

  • 양의 관계가 있는가(X가 증가할수록 Y도 증가하는 경향)?
  • 음의 관계가 있는가(X가 증가할수록 Y가 감소하는 경향)?
  • 관계가 선형인가, 비선형인가?
  • 주요 점군에서 멀리 떨어진 이상값이 있는가?

피어슨 상관계수(r)

피어슨 r은 선형 관계를 나타내는 가장 일반적인 단일 통계량으로, -1에서 +1 사이의 값을 취합니다:

  • r = +1:완전한 양의 선형 관계.
  • r = 0:선형 관계 없음.
  • r = -1:완전한 음의 선형 관계.

일반적인 강도 기준(Cohen, 1988):|r| < 0.1 무시 가능;0.1–0.3 약;0.3–0.5 중;0.5–0.7 강;> 0.7 매우 강.

중요한 주의사항: r은 선형 연관성만 측정합니다. 상관관계는 인과관계를 의미하지 않습니다. 이상값은 r 값을 크게 변화시킬 수 있습니다. 데이터는 항상 시각화하세요——앤스컴의 사중주(1973)는 동일한 r 값에서도 완전히 다른 산점도가 나타날 수 있음을 보여줍니다.

R²——결정계수

는 r의 제곱으로, Y의 분산 중 X의 선형 관계로 설명되는 비율을 나타냅니다. 예를 들어 R² = 0.64는 Y 변동의 64%가 X에 의해 설명됨을 의미합니다.

선형 회귀

회귀선 표시를 체크하면 최소자승법(OLS)으로 회귀선을 계산합니다:ŷ = 기울기 · x + 절편. 각 점과 직선 사이의 수직 거리의 제곱합을 최소화합니다.

주요 활용 사례

  • 생물학/의학:키 vs 몸무게, 용량 vs 반응, 나이 vs 혈압.
  • 금융:가격 vs 거래량, 수익률 vs 시장 지수(베타 추정).
  • 교육:학습 시간 vs 시험 점수, 학급 크기 vs 성적.
  • 공학:입력 전압 vs 출력 전류, 온도 vs 저항.

개인 정보 보호

모든 계산은 브라우저에서 로컬로 실행됩니다. 데이터는 서버로 전송되지 않습니다. 권장 최대 파일 크기:5 MB.