Диаграмма Рассеяния и Корреляция
Бесплатный инструмент для построения диаграммы рассеяния. Загрузите CSV или вставьте данные, выберите два числовых столбца и мгновенно увидьте связь. Вычисляет коэффициент корреляции Пирсона (r), R² и строит линию линейной регрессии с наклоном и сдвигом.
Диаграмма Рассеяния и Корреляция
Загрузите CSV-файл или вставьте табличные данные, выберите два числовых столбца и мгновенно визуализируйте зависимость. Этот инструмент строит диаграмму рассеяния в браузере, вычисляет коэффициент корреляции Пирсона и может наложить линию регрессии — без передачи данных на сервер.
Что такое диаграмма рассеяния?
Диаграмма рассеяния (точечная диаграмма или XY-график) отображает парные наблюдения в виде точек на двумерной плоскости. Каждая точка имеет координату X из одной переменной и координату Y из другой. Облако точек раскрывает форму, силу и направление зависимости между переменными.
Вопросы, на которые быстро отвечает диаграмма рассеяния:
- Есть ли положительная зависимость (при росте X значение Y тоже растёт)?
- Есть ли отрицательная зависимость (при росте X значение Y убывает)?
- Зависимость линейная или криволинейная?
- Есть ли выбросы — точки далеко от основного облака?
Коэффициент корреляции Пирсона (r)
Коэффициент Пирсона r — наиболее распространённое числовое описание линейной зависимости. Он принимает значения от -1 до +1:
- r = +1: идеальная положительная линейная связь.
- r = 0: линейной связи нет.
- r = -1: идеальная отрицательная линейная связь.
Традиционные пороговые значения (Коэн, 1988): |r| < 0,1 — незначительно; 0,1–0,3 — слабо; 0,3–0,5 — умеренно; 0,5–0,7 — сильно; > 0,7 — очень сильно.
Важные оговорки: r измеряет только линейную связь. Корреляция не означает причинно-следственную связь. Выбросы могут существенно изменить r. Всегда визуализируйте данные — квартет Ансбомба (1973) показывает, что одинаковые значения r могут соответствовать совершенно разным диаграммам рассеяния.
R² — коэффициент детерминации
R² равен r² и показывает долю дисперсии Y, объяснённую линейной зависимостью от X. Например, R² = 0,64 означает, что 64% вариации Y объясняется X.
Линейная регрессия
Включите Показать линию регрессии, чтобы вычислить прямую наименьших квадратов (МНК): ŷ = наклон · x + сдвиг, минимизирующую сумму квадратов вертикальных отклонений.
Типичные сценарии применения
- Биология/медицина: рост и вес, доза и реакция, возраст и давление.
- Финансы: цена и объём, доходность и рыночный индекс.
- Образование: часы обучения и оценки, размер класса и успеваемость.
- Инженерия: входное напряжение и ток, температура и сопротивление.
Конфиденциальность
Все вычисления выполняются локально в вашем браузере. Данные не передаются ни на какой сервер. Рекомендуемый максимальный размер файла: 5 МБ.