मध्य प्रवृत्ती आणि फैलाव दरम्यान फरक

Anonim

मध्य प्रवृत्ती विरोधाभास वर्णनात्मक आणि अनुमानित आकडेवारीमध्ये, केंद्रस्थानी असलेल्या डेटा सेटचे वर्णन करण्यासाठी बर्याच निर्देशांकांचा वापर केला जातो. प्रवृत्ती, फैलाव आणि तिरकस: तीन सर्वात महत्वाच्या गुणधर्म जे डेटा सेटचे वितरण सापेक्ष आकार निर्धारित करतात.

केंद्रीय प्रवृत्ती म्हणजे काय?

केंद्रीय प्रवृत्ती म्हणजे मूल्य वाटपाचा केंद्रबिंदू. डेटा सेटची मध्य प्रवृत्ती दर्शविण्यामध्ये मध्य, मोड आणि मध्य अधिक सामान्यतः वापरले जाणारे निर्देशांक आहेत. एखादा डेटा सेट सममित असल्यास, मध्यस्थ आणि डेटासेटचा अर्थ दोन्ही एकमेकांशी एकाचवेळी असणे आवश्यक आहे.

डेटा संच दिल्यास, सर्व डेटा मूल्यांची बेरीज करून आणि नंतर डेटाच्या संख्येद्वारे ते भागून काढले जाणारे गणना केली जाते. उदाहरणार्थ, 10 व्यक्तींचे वजनाचे (किलोग्रॅममध्ये) 70, 62, 65, 72, 80, 70, 63, 72, 77 आणि 79 असे मोजले जाते. मग दहा लोकांचा (किलोग्रॅममध्ये) सरासरी वजन होऊ शकतो. खालील प्रमाणे गणना वजन 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710 आहे. सरासरी = (रक्कम) / (डेटा संख्या) = 710/10 = 71 (किलोग्रॅम मध्ये). असे समजले जाते की आउटलायर्स (डेटा पॉइंट जे सामान्य ट्रेन्डमधून विचलित करतात) ह्या अर्थास प्रभावित करतात. त्यामुळे आउटलाइअरच्या उपस्थितीत डेटा सेटच्या केंद्रांविषयी योग्य चित्र मिळणार नाही.

मध्यक हे डेटा सेटच्या अगदी मध्यभागी आढळणारे डेटा बिंदू आहे. मध्यकांची गणना करण्याचा एक मार्ग म्हणजे चढत्या क्रमाने डेटा बिंदू लावणे, आणि नंतर मध्यभागी डेटा बिंदू शोधा. उदाहरणार्थ, एकदा मागील डेटा सेट 62, 63, 65, 70, 70, 72, 72, 77, 79, 80 असे दिसण्याचा आदेश दिला तर. (70 + 72) / 2 = 71 मध्यभागी आहे. यावरून असे दिसेल की मध्यक डेटा सेटमध्ये असण्याची गरज नाही. आउटलाइनच्या उपस्थितीमुळे मध्यक प्रभावित होत नाही. म्हणूनच, आउद्रेयरच्या उपस्थितीत मध्यवर्ती कणखर प्रवृत्ती म्हणून काम करतील.

मोड डेटाच्या सेटमध्ये सर्वात जास्त आढळणारे मूल्य आहे. मागील उदाहरणात, मूल्य 70 आणि 72 दोन्हीदा दोनदा आणि अशा प्रकारे, दोन्ही मोड आहेत हे दर्शविते की, काही वितरणात, एकापेक्षा अधिक मॉडेल मूल्य असते. जर फक्त एकच मोड असेल तर, डेटा सेट अनिमॉडल असल्याचे म्हटले आहे, या प्रकरणात, डेटा सेट द्विमॉडल आहे. पांगापांग म्हणजे काय?

वितरण हे वितरण केंद्राबद्दलच्या माहितीचे विस्तृत प्रसार आहे. श्रेणी आणि मानक विचलन हे पांगापांगांच्या सामान्यतः वापरले जाणारे उपाय आहेत.

श्रेणी ही सर्वोच्च मूल्य वजावट सर्वात कमी मूल्य आहे. मागील उदाहरणामध्ये, सर्वोच्च मूल्य 80 आहे आणि सर्वात कमी मूल्य 62 आहे, म्हणून श्रेणी 80-62 = 18 आहे. परंतु श्रेणी प्रसारणाविषयी पुरेशी चित्र पुरवत नाही.

मानक विचलनाची गणना करण्यासाठी, प्रथम सरासरी मधे डेटा मूल्यांचे विचलन मोजले जाते. विचलनांचा मूळ चौरस अर्थ याला मानक विचलन म्हणतात. याआधीच्या उदाहरणामध्ये, या क्षुद्रतेतील संबंधित विचलन (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 आणि (79 - 71) = 8. योग विचलन च्या वर्ग (-1)

2

+ (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. मानक विचलन √ (366/10) = 6 05 (किलोग्रॅम मध्ये) आहे. डेटा सेट मोठ्या मानाने दिसेपर्यंत, यामधून असे म्हणता येईल की बहुतांश डेटा अंतराल 71 ± 6 मध्ये आहे. 05, आणि या विशिष्ट उदाहरण खरंच म्हणून आहे. केंद्रीय प्रवृत्ती आणि पांगापांग यांच्यात काय फरक आहे? • केंद्रीय प्रवृत्ती म्हणजे मूल्य वाटपाचे केंद्र संदर्भित करते आणि शोधते.

• एका डेटा सेटच्या केंद्रांविषयी डेटा प्रसारित होण्याची शक्यता आहे.