Дашборд Описательной Статистики
Бесплатный дашборд описательной статистики. Загрузите CSV-файл и мгновенно увидьте количество, среднее, медиану, моду, стандартное отклонение, дисперсию, квартили, IQR, размах, асимметрию и эксцесс для каждой числовой колонки.
Дашборд Описательной Статистики
Загрузите CSV-файл и мгновенно получите исчерпывающий статистический профиль каждой числовой колонки вашего датасета. Дашборд вычисляет четырнадцать ключевых показателей на колонку, отображает мини-гистограмму для каждой и — при наличии двух и более числовых колонок — строит тепловую карту корреляций Пирсона для выявления взаимосвязей с первого взгляда. Все вычисления выполняются в вашем браузере; данные никогда не покидают ваше устройство.
Что такое описательная статистика?
Описательная статистика резюмирует и описывает основные характеристики набора данных без выводов о генеральной совокупности. Она отвечает на фундаментальные вопросы:
- Где находится центр? Среднее, медиана и мода по-разному фиксируют «типичное» значение.
- Насколько разбросаны данные? Стандартное отклонение, дисперсия, IQR и размах количественно выражают изменчивость.
- Какова форма распределения? Асимметрия и эксцесс описывают форму помимо простого среднего.
- Каковы крайние значения? Минимум, максимум и квартили показывают границы и структуру.
Пояснения к показателям
Среднее: сумма всех значений делённая на количество. Чувствительно к выбросам.
Медиана: среднее значение после сортировки данных. Устойчива к выбросам.
Мода: наиболее часто встречающееся значение. Для непрерывных данных может не быть значимой моды.
Стандартное отклонение: средняя удалённость каждой точки от среднего. Дашборд использует выборочное стандартное отклонение (деление на n − 1).
Дисперсия: квадрат стандартного отклонения. Фундаментальна во многих статистических формулах.
IQR (межквартильный размах): Q3 − Q1, ширина центральных 50 % данных. Устойчив к выбросам.
Асимметрия: измеряет несимметричность распределения. Близко к 0 → приближённо симметрично. Положительная → длинный правый хвост. Отрицательная → длинный левый хвост.
Эксцесс: сравнивает «хвостатость» распределения с нормальным (эксцесс = 0). Положительный (лептокуртический) → более тяжёлые хвосты; отрицательный (платикуртический) → более лёгкие.
Матрица корреляций
При наличии двух и более числовых колонок дашборд вычисляет коэффициент корреляции Пирсона r для каждой пары. Тепловая карта показывает сильные положительные корреляции красным, а отрицательные — синим. Важно: r Пирсона измеряет только линейные зависимости, и корреляция не означает причинно-следственную связь.
Как пользоваться дашбордом
- Загрузите или вставьте CSV-файл — разделители определяются автоматически.
- Изучите обзор датасета: строки, колонки, числовые колонки, пропущенные значения.
- Прокрутите карточки колонок: каждая показывает мини-гистограмму и полную таблицу статистик.
- Проверьте матрицу корреляций внизу страницы.
- При более чем 50 числовых колонках изначально отображаются первые 12.
Конфиденциальность
Все вычисления выполняются локально в вашем браузере. Никакие данные не передаются на серверы. Максимальный размер файла: около 5 МБ.
Литература
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
- Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.