Перейти к содержимому

Диаграмма Рассеяния и Корреляция

Бесплатный инструмент для построения диаграммы рассеяния. Загрузите CSV или вставьте данные, выберите два числовых столбца и мгновенно увидьте связь. Вычисляет коэффициент корреляции Пирсона (r), R² и строит линию линейной регрессии с наклоном и сдвигом.

Диаграмма Рассеяния и Корреляция

Загрузите CSV-файл или вставьте табличные данные, выберите два числовых столбца и мгновенно визуализируйте зависимость. Этот инструмент строит диаграмму рассеяния в браузере, вычисляет коэффициент корреляции Пирсона и может наложить линию регрессии — без передачи данных на сервер.

Что такое диаграмма рассеяния?

Диаграмма рассеяния (точечная диаграмма или XY-график) отображает парные наблюдения в виде точек на двумерной плоскости. Каждая точка имеет координату X из одной переменной и координату Y из другой. Облако точек раскрывает форму, силу и направление зависимости между переменными.

Вопросы, на которые быстро отвечает диаграмма рассеяния:

  • Есть ли положительная зависимость (при росте X значение Y тоже растёт)?
  • Есть ли отрицательная зависимость (при росте X значение Y убывает)?
  • Зависимость линейная или криволинейная?
  • Есть ли выбросы — точки далеко от основного облака?

Коэффициент корреляции Пирсона (r)

Коэффициент Пирсона r — наиболее распространённое числовое описание линейной зависимости. Он принимает значения от -1 до +1:

  • r = +1: идеальная положительная линейная связь.
  • r = 0: линейной связи нет.
  • r = -1: идеальная отрицательная линейная связь.

Традиционные пороговые значения (Коэн, 1988): |r| < 0,1 — незначительно; 0,1–0,3 — слабо; 0,3–0,5 — умеренно; 0,5–0,7 — сильно; > 0,7 — очень сильно.

Важные оговорки: r измеряет только линейную связь. Корреляция не означает причинно-следственную связь. Выбросы могут существенно изменить r. Всегда визуализируйте данные — квартет Ансбомба (1973) показывает, что одинаковые значения r могут соответствовать совершенно разным диаграммам рассеяния.

R² — коэффициент детерминации

равен r² и показывает долю дисперсии Y, объяснённую линейной зависимостью от X. Например, R² = 0,64 означает, что 64% вариации Y объясняется X.

Линейная регрессия

Включите Показать линию регрессии, чтобы вычислить прямую наименьших квадратов (МНК): ŷ = наклон · x + сдвиг, минимизирующую сумму квадратов вертикальных отклонений.

Типичные сценарии применения

  • Биология/медицина: рост и вес, доза и реакция, возраст и давление.
  • Финансы: цена и объём, доходность и рыночный индекс.
  • Образование: часы обучения и оценки, размер класса и успеваемость.
  • Инженерия: входное напряжение и ток, температура и сопротивление.

Конфиденциальность

Все вычисления выполняются локально в вашем браузере. Данные не передаются ни на какой сервер. Рекомендуемый максимальный размер файла: 5 МБ.