मानक विचलन आणि मानक त्रुटीमधील फरक

Anonim

परिचय

मानक D उत्परिवर्तन (एसडी) आणि S मानक ई < आररर < (एसई) < ही अशीच परिभाषा आहे; तथापि, ते संकल्पनात्मकरित्या इतके भिन्न आहेत की ते सांख्यिकी साहित्यामध्ये जवळजवळ एकमेकांशी वापरण्यात येतात. दोन्ही संज्ञा सामान्यत: प्लस-कमीतकमी चिन्ह (+/-) ने दर्शविली जातात ज्यामुळे ते प्रमाणबद्ध मूल्य परिभाषित करतात किंवा मूल्यांची श्रेणी दर्शवतात. नित्यनेच, दोन्ही शब्द मोजले मूल्यांच्या एका संच (सरासरी) सह दिसतात. मनोरंजकदृष्ट्या, एखाद्या एसईने मानके, चुकांसह किंवा वैज्ञानिक डेटाच्या संप्रेषणासह काहीही करण्याचेच नसते. एसडी आणि एसईचे स्पष्टीकरण आणि उत्पन्नाचे सविस्तर स्वरूप उघड होईल, व्यावसायिक दर्जाशास्त्रज्ञ आणि जे त्याचा वापर कर्ताद्वारे करतात ते दोघेही चुकीचे वाटतील. मानक विचलन (एसडी)

एक एसडी एक

वर्णनात्मक < एका वितरणाचा प्रसार सांगणारे सांख्यिकी आहे. मेट्रिक म्हणून, जेव्हा डेटा सामान्यतः वितरीत केला जातो तेव्हा हे उपयुक्त असते. तथापि, डेटा अत्यंत स्क्यूड किंवा बिमोडाल असल्याने तो कमी उपयुक्त आहे कारण हे वितरणाचा आकार फार चांगले वर्णन करीत नाही. थोडक्यात, आम्ही नमुन्याच्या वैशिष्ट्यांचे अहवाल देताना एसडी वापरतो, कारण आम्हाला हे

वर्णन करतात की

हा अर्थभरात किती डेटा बदलतो. डेटा प्रसारित करण्यासाठी इतर उपयुक्त आकडेवारी आंतर-चतुर्थक श्रेणी आहेत, 25 व्या आणि 75 व्या टक्केवारी आणि डेटाची व्याप्ती.

आकृती 1. डेटाचा प्रसार करण्याचा हा एक उपाय आहे. सामान्यत: वितरीत वितरणातून डेटा नमुना असतो तेव्हा डेटाच्या दोन तृतीयांश हे मध्यवर्ती मानक विचलनाच्या आत राहण्याची अपेक्षा करते. फरक हा एक वर्णनात्मक < सांख्यिकी देखील आहे, आणि तो मानक विचलनाचा वर्ग म्हणून परिभाषित केला जातो. परिणामांचे वर्णन करताना हे सहसा कळवले जात नाही, परंतु ते अधिक गणितीयरित्या संरक्षित केले जाणारे सूत्र आहे (एक म्हणजे चौरसातील विचलनांचा योग) आणि आकडेवारीच्या गणनेत भूमिका बजावते.

उदाहरणादाखल, जर आपल्याकडे दोन आकडेवारी

P

& Q ज्ञात फरकांसहित

var

(पी) < var (प्रश्न) , नंतर बेरजेचे बेरीज समान आहे: var (पी) + > var (प्रश्न) हे आता स्पष्ट आहे की सांख्यिकीशास्त्र निराळ्या गोष्टींबद्दल बोलू इच्छितो. पण मानक विचलनांचा प्रसार करण्यासाठी एक महत्वाचा अर्थ असतो, विशेषत: जेव्हा डेटा सामान्यतः वितरीत केला जातो: अंतराल म्हणजे < +/- 1 एसडी < नमुन्याचा 2/3 कॅप्चर करणे अपेक्षित आहे आणि मध्यांतर याचा अर्थ < + - 2 एसडी < नमुना पैकी 95% कॅप्चर करणे अपेक्षित आहे. 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99संशोधकांना प्रतिसाद कसे पसरतो हे एसडी सांगते - ते क्षुल्लक वर लक्ष केंद्रित केले आहेत, किंवा दूर दूर दूर आहेत? आपल्या सर्व प्रतिसादकांनी आपले उत्पादन आपल्या स्केलच्या मध्यभागी रेट केले आहे, किंवा काही लोकांनी यास मंजुरी दिली आहे आणि काही जण त्यास नकार देतात? < एका प्रयोगावर विचार करा जिथे उत्तरप्रेषितांना 5-बिंदूच्या पटलावरील गुणांच्या मालिकेवर उत्पादनास रेट करण्यास सांगितले जाते. "पैसे चांगले मूल्य" साठी दहा उत्तरप्रेषक (खाली 'जम्मू' द्वारे लेबल केलेल्या 'अ' नावाचा लेबल) म्हणजे 3.2 मध्ये एसडी 0 सह. 4 आणि "उत्पादन विश्वसनीयता" म्हणजे 3. 4 2 च्या एसडी सह. 1. पहिल्या दृष्टीक्षेपात (केवळ अर्थ पाहून) असे दिसते की विश्वासार्हता मूल्यापेक्षा अधिक होती. परंतु विश्वासार्हतेच्या उच्च एसडीला (खाली दिलेल्या वितरणात दाखवल्याप्रमाणे) दर्शविण्यासारखे होते की प्रतिसाद खूप ध्रुवीकरण होते, जिथे सर्वाधिक उत्तरप्रेषकांकडे कोणतेही विश्वासार्हता नसलेल्या समस्या ("5" गुणधर्म दर्शवितात), परंतु उत्तरदात्यांच्या एका लहान परंतु महत्त्वाच्या विभागात एक विश्वसनीयता समस्या आणि विशेषता "1" रेट केले एकट्या बघण्याचा हा कथाचा केवळ एक भाग सांगतो, परंतु, सहसा जास्त वेळा नाही, हे संशोधक लक्ष केंद्रित करतात. प्रतिसादांचे वितरण विचारात घेणे महत्वाचे आहे आणि एसडी याबद्दल एक मूल्यवान वर्णनात्मक उपाय प्रदान करते. उत्तरदायी पैशासाठी चांगले मूल्य उत्पादन विश्वसनीयता 3 1 बी 3 1

सी 3 < 1 D 3 1

4

5

एफ < 4 5 जी < 3
5 एच 3
5 मी 3
5 जे 3
5 माध्य 3 2
3 4 रु. देव 0 4
2 1 पहिले सर्वेक्षण: 5 गुणांच्या स्तरावरील उत्पादनास उत्तर देणारे उत्तरदायी 5-बिंदू रेटिंग स्केलच्या प्रतिक्रियांचे दोन वेगवेगळ्या वितरण समान अर्थ मिळवू शकतात. दोन भिन्न मूल्यांकनांसाठी प्रतिसाद मूल्ये दर्शवणारे खालील उदाहरण विचारात घ्या.
पहिल्या उदाहरणामध्ये (रेटिंग "ए"), एसडी शून्य आहे कारण सर्व प्रतिसाद अगदी बरोबर मूल्य आहेत. वैयक्तिक प्रतिसादामुळे क्षुल्लक बदल झाला नाही. रेटिंग "बी" मध्ये, जरी गट म्हणजे समान (3. 0) पहिला वितरण म्हणून, मानक विचलन अधिक आहे 1 च्या मानक विचलन. 15 हे दर्शविते की सरासरी प्रतिसादात * सरासरीपासून 1 गुणापेक्षा कमी अंतर होते. उत्तरदायित्व
रेटिंग "ए" रेटिंग "बी" ए < 3
1 बी 3
2 सी < 3 2
डी 3 3
3 3

फॅ < 3

3

जी

3 > 3

एच 3 4
मी 3 4
जे 3 5
माध्य 3 0 3 0
रु. देव 0 00 1 15
दुसरे सर्वेक्षण: उत्तरदायी 5 गुणांच्या स्तरावरील उत्पादनास रेट करीत आहेत एसडी वर पाहण्याचा दुसरा मार्ग म्हणजे प्रतिसादांचे हिस्टोग्राम म्हणून वितरण काल्पनिक आहे. कमी एसडी असलेले वितरण एक उंच अरुंद आकार म्हणून प्रदर्शित होईल, तर मोठ्या एसडी मोठ्या आकाराने दर्शविला जाईल. एसडी सामान्यतः "योग्य किंवा अयोग्य" किंवा "चांगले किंवा वाईट" असे सूचित करत नाही - कमी एसडी हे अधिक फायद्याचे नाही. हे केवळ वर्णनात्मक आकडेवारी म्हणून वापरले जाते. हे क्षुल्लक संबंधात वितरण वर्णन करते.
टी एसडी संबंधित ईक्निकल डिस्क्लेमर> "सरासरी विचलन" म्हणून एसडीचा विचार करणे म्हणजे त्याचा अर्थ समजणे हा एक उत्कृष्ट मार्ग आहे. तथापि, प्रत्यक्षात सरासरी म्हणून गणना केली जात नाही (असल्यास, आम्ही "सरासरी विचलन" असे म्हणतो). त्याऐवजी, तो "प्रमाणित" आहे, वर्गांच्या बेरजेचा वापर करून मूल्याची गणना करण्यासाठी काहीसे जटिल पद्धत. व्यावहारिक हेतूंसाठी, गणना महत्वाचे नाही. सर्वाधिक टॅब्लेट प्रोग्राम, स्प्रेडशीट किंवा इतर डेटा व्यवस्थापन साधने आपल्यासाठी SD ची गणना करतील आकडेवारी महत्वाचे आहे हे समजून घेणे अधिक महत्वाचे आहे.
सामान्य त्रुटी एक मानक त्रुटी एक < लाभात्मक < सांख्यिकी आहे जी संपूर्ण लोकसंख्येदरम्यान नमुन्याचा अर्थ (सरासरी) वापरते. हा नमुना अर्थाचा < अचूकपणा आहे नमुना अर्थ एक अंतर्निहित वितरण असलेली डेटामधून प्राप्त केलेली आकडेवारी आहे. आपण डेटा वापरल्याप्रमाणेच कल्पना करू शकत नाही, कारण आपण एकच प्रयोग केले आहे आणि फक्त एकच मूल्य आहे. स्टॅटिस्टिकल थिअरी सांगते की नमुना अर्थ (मोठ्या "पुरेशा" नमुन्यासाठी आणि काही नियमित परिस्थितीनुसार) साधारणपणे साधारणपणे वितरित केले जाते. या सामान्य वितरणाच्या प्रमाणित विचलना म्हणजे काय आम्ही मानक त्रुटी म्हणतो.
आकृती 2. तळाशी दिनांकावरील वितरण < डेटाच्या वितरणास संपुष्टात आणते, तर सर्वात वर वितरण म्हणजे नमूना अर्थाचे सैद्धांतिक वितरण. 20 च्या SD डेटाचा प्रसार एक उपाय आहे, तर 5 एसई नमूद अर्थ सुमारे अनिश्चितता एक उपाय आहे. < जेव्हा आपण उपचार ए विरुद्ध उपचार बी चे दोन नमुने प्रयोगातून परिणामांच्या साधनांची तुलना करू इच्छितो तेव्हा आम्हाला अंदाज लावण्याची आवश्यकता आहे की आम्ही तशाच प्रकारे मोजले आहे. वास्तविक, आम्ही दोन गोष्टींमधील फरक मोजला आहे याबद्दल आम्हाला स्वारस्य आहे. आम्ही या फरकाचा मानक त्रुटी मोजतो म्हणतो. आपण हे जाणून घेण्यास आश्चर्यचकित होऊ नये की नमुना अर्थाने मध्ये फरक मानक त्रुटी म्हणजे साधन मानक चुका एक फंक्शन आहे:
आता आपण समजला की अर्थ (एसई) आणि मानक प्रमाण त्रुटी वितरणाच्या प्रमाणित विचलन (एसडी) दोन वेगळ्या पश्या आहेत, आपण प्रथम ठिकाणी गोंधळ झाला कसे आश्चर्य वाटू शकते. ते दोघेही संकल्पनात्मक नसतात, त्यांच्याकडे गणितीय दृष्टिकोनातून एक साधा संबंध असतो: <, जेथे n डेटा बिंदूची संख्या आहे लक्षात घ्या की मानक त्रुटी दोन घटकांवर अवलंबून आहे: नमुना मानक विचलन, आणि नमुन्याचे आकार n
. हे सहजज्ञतार्थित करते: नमुना प्रमाणित केलेले मोठे विचलन, वास्तविक अर्थाविषयीच्या आमच्या अंदाजाबद्दल आपण नेमके स्पष्ट करू शकता. त्याचप्रमाणे, नमुन्याचे मोठे आकार, लोकसंख्येबद्दल जितके अधिक माहिती आहे आणि आपण तंतोतंत अर्थ सांगू शकतो. एसई म्हणजे मध्यवर्ती विश्वासार्हतेचे संकेत आहेत. एक छोटासा एसई म्हणजे असा संकेत आहे की नमुना म्हणजे प्रत्यक्ष लोकसंख्येचा अधिक अचूक प्रतिबिंब आहे.एक मोठा नमुना आकार साधारणपणे एक लहान एसई होईल (एसडी थेट नमुना आकार प्रभावित होत नाही असताना).
बहुतेक सर्वेक्षण संशोधनात लोकसंख्या एक नमुना काढणे यांचा समावेश आहे. मग आम्ही त्या नमुन्यावरून घेतलेल्या परिणामांमधून लोकसंख्येबद्दलचे अनुमान काढतो. जर दुसरा नमुना काढला असेल तर कदाचित परिणाम पहिल्या नमुन्याशी जुळणार नाही. एखाद्या रेटिंगसाठी सरासरी मूल्य 3 असल्यास. 2 एक नमुना साठी, ते 3 असू शकते. 4 त्याच आकाराचे दुसर्या नमुन्यासाठी. जर आपण आपल्या लोकसंख्येतील असंख्य सॅम्पल (समान आकाराच्या) काढू शकलो तर, आपण वितरित म्हणून साजरा केलेला अर्थ प्रदर्शित करू शकू. मग आम्ही आमच्या सर्व नमुना माध्यमांची सरासरी काढू शकतो. याचा अर्थ खऱ्या लोकसंख्येचा अर्थ समान असेल. आम्ही नमूद अर्थ वितरण वितरण एसडी गणना करू शकता. नमुना म्हणजे या वितरणाच्या एसडी म्हणजे प्रत्येकाचे नमुना म्हणजे एसई. अशा प्रकारे आम्ही आमचे सर्वात लक्षणीय निरीक्षण केले: एसई म्हणजे लोकसंख्येचा एसडी म्हणजे सरासरी.
नमुना माध्य पहिले < 3 2

2 3 4

तिसरे < 3 3

4 था

3 2 5 था

3 1

….

….

…. . …. . ….

…. …. ….

माध्य

3 3 < रु. देव

0 13

एसडी आणि एसई

यांच्यातील संबंधांचे उदाहरण देणारी सारणी आता स्पष्ट आहे की जर या वितरणाचा एसडी आपल्याला समजून घेण्यात मदत करते की खऱ्या लोकसंख्येचा नमुन्याचा अर्थ कितपत असतो, तर आपण हे कसे समजू शकतो ते समजून घेऊ शकतो. कोणत्याही वैयक्तिक नमुना अर्थ अचूक म्हणजे काय? हे एसईचे सार आहे. प्रत्यक्षात, आम्ही आमच्या लोकसंख्येतून फक्त एकच नमुना काढला आहे, परंतु आपण या निष्कर्षांचा वापर आमच्या साप्ताहिक नमुना अर्थाच्या विश्वासार्हतेचा अंदाज देण्यासाठी करू शकतो.

खरं तर, एसई आम्हाला सांगते की आपण 9 5.5% आत्मविश्वासाने विश्वास बाळगू शकतो की आमचे साप्ताहिक नमुना म्हणजे अधिक किंवा कमी अंदाजे 2 (प्रत्यक्षात 1. 9 6) लोकसंख्या दरामधील मानक त्रुटी.

खालील तक्ता आमच्या पहिल्या (आणि केवळ) नमुन्यातून प्रतिसादांचा वितरण आमच्या संशोधनासाठी वापरला आहे. 0. 13 च्या एसई, तुलनेने लहान असल्यामुळे, आम्हाला असे सूचित करते की आमची एकूण लोकसंख्येची वास्तविकता अगदी जवळ आहे. आमच्या क्षुद्रतेसाठी (9 5% आत्मविश्वासावर) मार्जिन (साधारणतः) दुप्पट मूल्य (+/- 0. 26), आपल्याला सांगत आहे की वास्तविक अर्थ 2 9 4 आणि 3 दरम्यान सर्वात जास्त आहे. 46.

उत्तरदायित्व रेटिंग

ए < 3 बी
3 सी
3 डी < 3
4
एफ 4
जी 3
एच < 3 मी
3 जे < 3
माध्य 3 2 रु. चूक
0. 13
सारांश अनेक संशोधक मानक विचलन आणि मानक त्रुटी दरम्यान फरक समजण्यास अपयशी ठरत असत, जरी ते सामान्यतः डेटा विश्लेषणात समाविष्ट केले गेले आहेत. मानक विचलन आणि स्टँडर्ड एरर साठीच्या वास्तविक गणिते अगदी सारखे दिसतात, तरी ते दोन अतिशय भिन्न परंतु पूरक, उपायांचे प्रतिनिधित्व करतात. एसडी आम्हाला आमच्या वितरणाचा आकार सांगते, प्रत्येक डेटाचे मूल्य सरासरी मूल्यामधील किती मूल्य आहे. एसई आम्हाला सांगत आहे की एकूण लोकसंख्येच्या खर्या अर्थाबद्दल आमच्या नमुनाचा अर्थ कितपत जवळ आहे?एकट्याने, ते आम्हाला फक्त सांगू शकते त्यापेक्षा अधिक संपूर्ण चित्र प्रदान करण्यात मदत करतात <