Перейти к содержимому

Дашборд Описательной Статистики

Бесплатный дашборд описательной статистики. Загрузите CSV-файл и мгновенно увидьте количество, среднее, медиану, моду, стандартное отклонение, дисперсию, квартили, IQR, размах, асимметрию и эксцесс для каждой числовой колонки.

Дашборд Описательной Статистики

Загрузите CSV-файл и мгновенно получите исчерпывающий статистический профиль каждой числовой колонки вашего датасета. Дашборд вычисляет четырнадцать ключевых показателей на колонку, отображает мини-гистограмму для каждой и — при наличии двух и более числовых колонок — строит тепловую карту корреляций Пирсона для выявления взаимосвязей с первого взгляда. Все вычисления выполняются в вашем браузере; данные никогда не покидают ваше устройство.

Что такое описательная статистика?

Описательная статистика резюмирует и описывает основные характеристики набора данных без выводов о генеральной совокупности. Она отвечает на фундаментальные вопросы:

  • Где находится центр? Среднее, медиана и мода по-разному фиксируют «типичное» значение.
  • Насколько разбросаны данные? Стандартное отклонение, дисперсия, IQR и размах количественно выражают изменчивость.
  • Какова форма распределения? Асимметрия и эксцесс описывают форму помимо простого среднего.
  • Каковы крайние значения? Минимум, максимум и квартили показывают границы и структуру.

Пояснения к показателям

Среднее: сумма всех значений делённая на количество. Чувствительно к выбросам.

Медиана: среднее значение после сортировки данных. Устойчива к выбросам.

Мода: наиболее часто встречающееся значение. Для непрерывных данных может не быть значимой моды.

Стандартное отклонение: средняя удалённость каждой точки от среднего. Дашборд использует выборочное стандартное отклонение (деление на n − 1).

Дисперсия: квадрат стандартного отклонения. Фундаментальна во многих статистических формулах.

IQR (межквартильный размах): Q3 − Q1, ширина центральных 50 % данных. Устойчив к выбросам.

Асимметрия: измеряет несимметричность распределения. Близко к 0 → приближённо симметрично. Положительная → длинный правый хвост. Отрицательная → длинный левый хвост.

Эксцесс: сравнивает «хвостатость» распределения с нормальным (эксцесс = 0). Положительный (лептокуртический) → более тяжёлые хвосты; отрицательный (платикуртический) → более лёгкие.

Матрица корреляций

При наличии двух и более числовых колонок дашборд вычисляет коэффициент корреляции Пирсона r для каждой пары. Тепловая карта показывает сильные положительные корреляции красным, а отрицательные — синим. Важно: r Пирсона измеряет только линейные зависимости, и корреляция не означает причинно-следственную связь.

Как пользоваться дашбордом

  1. Загрузите или вставьте CSV-файл — разделители определяются автоматически.
  2. Изучите обзор датасета: строки, колонки, числовые колонки, пропущенные значения.
  3. Прокрутите карточки колонок: каждая показывает мини-гистограмму и полную таблицу статистик.
  4. Проверьте матрицу корреляций внизу страницы.
  5. При более чем 50 числовых колонках изначально отображаются первые 12.

Конфиденциальность

Все вычисления выполняются локально в вашем браузере. Никакие данные не передаются на серверы. Максимальный размер файла: около 5 МБ.

Литература

  • Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
  • Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
  • Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.