기술 통계 대시보드
무료 기술 통계 대시보드. CSV 파일을 업로드하면 모든 수치 열에 대한 개수, 평균, 중앙값, 최빈값, 표준편차, 분산, 사분위수, IQR, 범위, 왜도, 첨도를 즉시 확인할 수 있습니다.
기술 통계 대시보드
CSV 파일을 업로드하여 데이터셋의 모든 수치 열에 대한 포괄적인 통계 프로파일을 즉시 확인하세요. 대시보드는 열당 14개의 핵심 지표를 계산하고, 각 열에 대한 미니 히스토그램을 렌더링하며, 수치 열이 2개 이상인 경우 변수 간 관계를 한눈에 파악할 수 있는 피어슨 상관 히트맵을 생성합니다. 모든 처리는 브라우저 내에서 이루어지며 데이터는 절대 기기를 벗어나지 않습니다.
기술 통계란 무엇인가?
기술 통계는 더 큰 모집단에 대한 추론 없이 데이터셋의 주요 특성을 요약하고 설명합니다. 다음과 같은 기본적인 질문에 답합니다:
- 중심은 어디에 있는가? 평균, 중앙값, 최빈값은 각각 다른 방식으로 ‘전형적인’ 값을 포착합니다.
- 데이터는 얼마나 퍼져 있는가? 표준편차, 분산, IQR, 범위가 변동성을 정량화합니다.
- 분포의 형태는 어떤가? 왜도(비대칭성)와 첨도(꼬리 무게)가 형태를 설명합니다.
- 극단값은 무엇인가? 최솟값, 최댓값, 사분위수가 경계와 구조를 보여줍니다.
지표 설명
평균: 모든 값의 합을 개수로 나눈 것. 이상값에 민감합니다.
중앙값: 데이터를 정렬했을 때의 중간값. 이상값에 강건합니다.
최빈값: 가장 자주 나타나는 값. 연속 데이터에서는 유의미한 최빈값이 없을 수 있습니다.
표준편차: 각 데이터 점과 평균 사이의 평균 거리. 대시보드는 표본 표준편차(n − 1로 나눔)를 사용합니다.
분산: 표준편차의 제곱. 많은 통계 공식의 핵심.
IQR(사분위 범위): Q3 − Q1, 데이터의 중간 50%의 너비. 이상값에 강건합니다.
왜도: 분포의 비대칭성 측정. 0에 가까움 → 대략 대칭. 양수 → 오른쪽 꼬리가 길다. 음수 → 왼쪽 꼬리가 길다.
초과 첨도: 정규 분포(초과 첨도 = 0)와 꼬리 무게 비교. 양수(급첨 분포) → 더 무거운 꼬리; 음수(완첨 분포) → 더 가벼운 꼬리.
상관 행렬
수치 열이 2개 이상인 경우, 대시보드는 모든 쌍에 대해 피어슨 상관계수 r을 계산합니다. 히트맵은 강한 양의 상관을 빨간색, 강한 음의 상관을 파란색으로 표시합니다. 참고: 피어슨 r은 선형 관계만 측정하며, 상관관계는 인과관계를 의미하지 않습니다.
대시보드 사용 방법
- CSV 파일 업로드 또는 붙여넣기 — 구분자는 자동 감지됩니다.
- 데이터셋 개요 확인: 행 수, 열 수, 수치 열, 결측값.
- 열 카드 스크롤: 각 카드에 미니 히스토그램과 전체 통계 표 표시.
- 페이지 하단의 상관 행렬 확인.
- 수치 열이 50개 초과 시 처음에는 12개만 표시.
개인 정보 보호
모든 계산은 브라우저 내에서 로컬로 실행됩니다. 서버로 데이터가 전송되지 않습니다. 최대 파일 크기: 약 5 MB.
참고 문헌
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
- Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.