सामग्री पर जाएं

वर्णनात्मक सांख्यिकी डैशबोर्ड

निःशुल्क वर्णनात्मक सांख्यिकी डैशबोर्ड। CSV फ़ाइल अपलोड करें और प्रत्येक संख्यात्मक कॉलम के लिए गणना, माध्य, मध्यांक, बहुलक, मानक विचलन, प्रसरण, चतुर्थक, IQR, परास, तिरछापन और कुर्तोसिस तुरंत देखें।

वर्णनात्मक सांख्यिकी डैशबोर्ड

एक CSV फ़ाइल अपलोड करें और अपने डेटासेट की प्रत्येक संख्यात्मक कॉलम का व्यापक सांख्यिकीय प्रोफ़ाइल तुरंत प्राप्त करें। डैशबोर्ड प्रत्येक कॉलम के लिए चौदह प्रमुख संकेतकों की गणना करता है, प्रत्येक के लिए एक मिनी-हिस्टोग्राम प्रस्तुत करता है और — दो या अधिक संख्यात्मक कॉलम होने पर — एक नज़र में संबंधों को पहचानने के लिए पियर्सन सहसंबंध हीटमैप बनाता है। सभी प्रसंस्करण आपके ब्राउज़र में होता है; आपका डेटा कभी भी आपके डिवाइस से बाहर नहीं जाता।

वर्णनात्मक सांख्यिकी क्या है?

वर्णनात्मक सांख्यिकी किसी बड़ी जनसंख्या के बारे में निष्कर्ष निकाले बिना डेटासेट की मुख्य विशेषताओं का सारांश और वर्णन करती है। यह मूलभूत प्रश्नों का उत्तर देती है:

  • केंद्र कहाँ है? माध्य, मध्यांक और बहुलक अलग-अलग तरीकों से “सामान्य” मान को दर्शाते हैं।
  • डेटा कितना फैला हुआ है? मानक विचलन, प्रसरण, IQR और परास परिवर्तनशीलता को मापते हैं।
  • वितरण का आकार क्या है? तिरछापन (असममिति) और कुर्तोसिस (पूंछ का भार) सरल माध्य से परे आकार का वर्णन करते हैं।
  • चरम मान क्या हैं? न्यूनतम, अधिकतम और चतुर्थक सीमाओं और संरचना को दिखाते हैं।

संकेतकों की व्याख्या

माध्य: सभी मानों का योग गणना से विभाजित। आउटलायर्स के प्रति संवेदनशील।

मध्यांक: डेटा को क्रमबद्ध करने के बाद का मध्य मान। आउटलायर्स के प्रति मज़बूत।

बहुलक: सबसे अधिक बार आने वाला मान। सतत डेटा के लिए कोई सार्थक बहुलक नहीं हो सकता।

मानक विचलन: प्रत्येक डेटा बिंदु और माध्य के बीच की औसत दूरी। डैशबोर्ड नमूना मानक विचलन (n − 1 से विभाजन) का उपयोग करता है।

प्रसरण: मानक विचलन का वर्ग। कई सांख्यिकीय सूत्रों का केंद्र।

IQR (अंतर-चतुर्थक परास): Q3 − Q1, डेटा के मध्य 50% की चौड़ाई। आउटलायर्स के प्रति मज़बूत।

तिरछापन: वितरण की असममिति को मापता है। 0 के पास → लगभग सममित। धनात्मक → लंबी दाहिनी पूंछ। ऋणात्मक → लंबी बाईं पूंछ।

अधिशेष कुर्तोसिस: पूंछ के भार की सामान्य वितरण (अधिशेष कुर्तोसिस = 0) से तुलना। धनात्मक (तीव्र-कूट) → भारी पूंछें; ऋणात्मक (चपटा-कूट) → हल्की पूंछें।

सहसंबंध मैट्रिक्स

दो या अधिक संख्यात्मक कॉलम होने पर, डैशबोर्ड प्रत्येक जोड़े के लिए पियर्सन सहसंबंध गुणांक r की गणना करता है। हीटमैप मजबूत सकारात्मक सहसंबंध को लाल और नकारात्मक को नीले रंग में दिखाता है। महत्वपूर्ण: पियर्सन r केवल रैखिक संबंधों को मापता है, और सहसंबंध कारणता नहीं है।

डैशबोर्ड का उपयोग कैसे करें

  1. CSV फ़ाइल अपलोड या पेस्ट करें — सीमांक स्वचालित रूप से पहचाने जाते हैं।
  2. डेटासेट अवलोकन देखें: पंक्तियाँ, कॉलम, संख्यात्मक कॉलम, अनुपस्थित मान।
  3. कॉलम कार्ड स्क्रॉल करें: प्रत्येक कार्ड मिनी-हिस्टोग्राम और पूर्ण सांख्यिकी तालिका दिखाता है।
  4. पृष्ठ के नीचे सहसंबंध मैट्रिक्स जाँचें।
  5. 50 से अधिक संख्यात्मक कॉलम होने पर शुरुआत में केवल 12 दिखाई देते हैं।

गोपनीयता

सभी गणनाएँ आपके ब्राउज़र में स्थानीय रूप से होती हैं। कोई डेटा सर्वर पर नहीं भेजा जाता। अधिकतम फ़ाइल आकार: लगभग 5 MB।

संदर्भ

  • Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
  • Pearson, K. (1895). Notes on regression and inheritance. Proceedings of the Royal Society of London, 58, 240–242.
  • Freedman, D., Diaconis, P. (1981). On the histogram as a density estimator. Zeitschrift für Wahrscheinlichkeitstheorie, 57, 453–476.