मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?

संकल्पना:

Show

माना कि ‘n’ अवलोकन {\({\rm{\;}}{{\rm{x}}_{\rm{1}}},{{\rm{x}}_{{\rm{2\;}}}},{{\rm{x}}_{{\rm{3\;}}}}, \ldots ,{{\rm{x}}_{{\rm{n\;}}}}\)} हैं। 

माध्य \(\left( {{\rm{\bar x}}} \right) = \frac{{{\rm{\;}}({{\rm{x}}_1} + {{\rm{x}}_{2{\rm{\;}}}} + {{\rm{x}}_{3{\rm{\;}}}} + \ldots + {{\rm{x}}_{{\rm{n\;}}}})}}{{\rm{n}}}\) \( = {\rm{\;}}\frac{{\mathop \sum \nolimits_{{\rm{i = 1}}}^{\rm{n}} {{\rm{x}}_{\rm{i}}}}}{{\rm{n}}}\)

भिन्नता (\({{\bf{\sigma }}^2}\)) = \(\frac{{\mathop \sum \nolimits_{{\rm{i = 1}}}^{\rm{n}} {{\left( {{{\rm{x}}_{\rm{i}}} - {\rm{\bar x}}} \right)}^2}}}{{\rm{n}}}\)

मानक विचलन (σ) = \(= \sqrt {{\rm{variance}}} = \sqrt {{{\rm{\sigma }}^2}}\)

गणना:

दिए गए आकड़े: 7, 9, 11, 13, 15

निम्न ज्ञात करने के लिए: मानक विचलन (σ) 

यहाँ, अवलोकनों की संख्या (n) = 5 

माध्य (x̅) \(= {\rm{\;}}\frac{{\mathop \sum \nolimits_{{\rm{i = 1}}}^{{\rm{5}}} {{\rm{x}}_{\rm{i}}}}}{{{\rm{5}}}} = \frac{{ {\rm{\;}}7+9 + 11+ 13+15{\rm{\;}}}}{{{\rm{5}}}}\)

\(= \frac{{55}}{{5}} = 11\)

भिन्नता (\({{\bf{\sigma }}^2}\)) \(=\frac{{\mathop \sum \nolimits_{{\rm{i = 1}}}^{\rm{n}} {{\left( {{{\rm{x}}_{\rm{i}}} - {\rm{\bar x}}} \right)}^2}}}{{\rm{n}}}\)

\(\Rightarrow \frac{{\mathop \sum \nolimits_{{\rm{i = 1}}}^{\rm{5}} {{\left( {{{\rm{x}}_{\rm{i}}} - {\rm{\bar x}}} \right)}^2}}}{{\rm{5}}} = \frac{{{{\left( {7 - 11} \right)}^2} + {{\left( {9 - 11} \right)}^2} + {{\left( {11 - 11} \right)}^2} + {{\left( {13 - 11} \right)}^2} + {{\left( {15 - 11} \right)}^2} }}{{5}}\)

चेतावनी: इस टेक्स्ट में गलतियाँ हो सकती हैं। सॉफ्टवेर के द्वारा ऑडियो को टेक्स्ट में बदला गया है। ऑडियो सुन्ना चाहिये।

प्रायिकता सिद्धांत दर्शन की कि मैं किसी धमकी की जनसंख्या डाटा डाटा ऑपरेटर वितरण के प्रकरण के वर्गमूल को मानक विचलन स्टैंडर्ड डेविएशन कहते हैं अंडर रूट 1 बाय एंड माइनस वन कमिशन ऑफ इक्वल टू वन टू ए माइनस बी का होल स्क्वायर यहां पर आर्मीन है और एक्स आई एक्स की वैल्यू है अजय सिंचाई की वैल्यू बढ़ाएंगे तो एक्टिवेट और एंड टोटल नंबर ऑफ टाइम

prayikta siddhant darshan ki ki main kisi dhamki ki jansankhya data data operator vitaran ke prakaran ke vargmul ko maanak vichalan standard deviation kehte hain under root 1 bye and minus van commission of equal to van to a minus be ka hole square yahan par armin hai aur x I x ki value hai ajay sinchai ki value badhaenge toh activate aur and total number of time

सरल शब्दों में, मानक विचलन (एसडी) एक सांख्यिकीय उपाय है जो किसी उपकरण में अस्थिरता या जोखिम का प्रतिनिधित्व करता है। यह आपको बताता है कि स्कीम के ऐतिहासिक औसत रिटर्न से फंड का रिटर्न कितना विचलित हो सकता है। एसडी जितना अधिक होगा, रिटर्न में उतार-चढ़ाव उतना ही अधिक होगा।

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?

यदि किसी फंड की औसत दर 12 प्रतिशत और मानक विचलन 4 प्रतिशत है, तो उसका प्रतिफल होगाश्रेणी 8-16 प्रतिशत से।

मानक विचलन की गणना कैसे करें?

किसी म्युचुअल फंड पर मानक विचलन का पता लगाने के लिए, उस अवधि के लिए रिटर्न की दरों को जोड़ें जिसे आप मापना चाहते हैं और औसत रिटर्न खोजने के लिए दर डेटा बिंदुओं की कुल संख्या से विभाजित करें। इसके अलावा, प्रत्येक व्यक्तिगत डेटा बिंदु लें और वास्तविकता और औसत के बीच अंतर खोजने के लिए अपना औसत घटाएं। इनमें से प्रत्येक संख्या का वर्ग करें और फिर उन्हें जोड़ दें।

परिणामी योग को डेटा बिंदुओं की कुल संख्या से कम से कम विभाजित करें -- यदि आपके पास 12 डेटा बिंदु हैं, तो आप 11 से विभाजित करते हैं। मानक विचलन उस संख्या का वर्गमूल है।

आइए दृष्टांत से बेहतर समझते हैं-

1. दोनों शेयरों के मानक विचलन का पता लगाएं

आइए दो भिन्नों का SD ज्ञात करेंम्यूचुअल फंड्स. सबसे पहले, हम पिछले पांच वर्षों के उनके औसत रिटर्न की गणना करेंगे।

म्यूचुअल फंड ए: (11.53% + 0.75% + 12.75% + 32.67% + 15.77%)/5 = 14.69%

म्युचुअल फंड बी: (4.13% + 3.86% + {-0.32%} + 11.27% + 21.63%)/5 = 9.71%

2. प्रत्येक स्टॉक के विचरण की गणना करें

चूंकि मानक विचलन विचरण का वर्गमूल है, इसलिए हमें पहले प्रत्येक निवेश का प्रसरण ज्ञात करना चाहिए।

फिर, आप पहले चरण के वर्गों के योग को 1 वर्ष की संख्या से विभाजित करते हैं(∑/n-1).

म्यूचुअल फंड ए: (11.53%-14.69%)² + (0.75%-14.69%)² + (12.75%-14.69%)² + (32.67%-14.69%)² + (15.77%-14.69%)²= 0.052/4= .013

म्युचुअल फंड बी: (4.13%-9.71%)² + (3.85%-9.71%)² + (-0.32%-9.71%)² + (11.27%-9.71%)² + (21.63%-9.71%)²= 0.032/4 =.008

प्रायिकता सिद्धांत और सांख्यिकी में, किसी सांख्यिकीय जनसंख्या, डाटा सेट या प्रायिकता वितरण के प्रसरण के वर्गमूल को मानक विचलन (स्टैण्डर्ड देविएशन) कहते हैं। मानक विचलन, व्यापक रूप से प्रयोग होने वाला एक मापदंड है प्रकीर्णन की माप करता है कि आंकड़े कितने 'फैले हुए' हैं। मानक विचलन बीजगणित की दृष्टि से अधिक सुविधाजनक है यद्यपि व्यावहारिक रूप से प्रत्याशित विचलन या औसत निरपेक्ष विचलन की तुलना में यह कम सुदृढ़ होता है।

इससे पता चलता है कि यहां "औसत" (मध्यमान) से कितनी भिन्नता है। इसे वितरण के मध्यमान से अंकों के औसत अंतर के रूप में माना जा सकता है कि वे मध्यमान से कितनी दूर हैं। एक निम्न मानक विचलन इंगित करता है कि डाटा के अंक मध्यमान के बहुत समीप होते हैं जबकि उच्च मानक विचलन इंगित करता है कि डाटा, मानों की एक बहुत बड़ी श्रेणी पर फैला हुआ है।

उदाहरण के लिए, संयुक्त राज्य अमेरिका में वयस्क पुरुषों की औसत ऊंचाई 70 इंच (178 से॰मी॰) है और इसके साथ ही साथ इनका मानक विचलन लगभग 3 इंच (8 से॰मी॰) है। इसका मतलब है कि अधिकांश पुरुषों (एक सामान्य वितरण की कल्पना के आधार पर लगभग 68 प्रतिशत) की ऊंचाई मध्यमान (67–73 इंच (170–185 से॰मी॰)) के 3 इंच (8 से॰मी॰) के भीतर – एक मानक विचलन है जबकि लगभग सभी पुरुषों (लगभग 95%) की ऊंचाई मध्यमान (64–76 इंच (163–193 से॰मी॰)) के 6 इंच (15 से॰मी॰) के भीतर – 2 मानक विचलन है। यदि मानक विचलन शून्य होता, तो सभी पुरुष वास्तव में 70 इंच (178 से॰मी॰) ऊंचे होते. यदि मानक विचलन 20 इंच (51 से॰मी॰) होता, तो पुरुषों की ऊंचाइयों में बहुत ज्यादा अंतर, विशेष रूप से लगभग 50 से 90 इंच (127 से 229 से॰मी॰) होता. तीन मानक विचलन के तहत वितरण को सामान्य (घंटाकार) मानकर जनसंख्या के नमूने के 99% जनसंख्या के विवरणों का अध्ययन किया गया।

जनसंख्या की परिवर्तनीयता को व्यक्त करने के अलावा, मानक विचलन को आम तौर पर सांख्यिकीय निष्कर्ष के विश्वास को मापने के लिए प्रयोग में लाया जाता है। उदाहरण के लिए, यदि एक ही चुनाव को कई बार आयोजित किया गया हो तो मतदान डाटा की त्रुटि सीमा को परिणाम के प्रत्याशित मानक विचलन की गणना द्वारा निर्धारित किया जाता है। सूचित त्रुटि सीमा विशिष रूप से मानक विचल का लगभग दोगुना – 95% आत्मविश्वास अंतराल की त्रिज्या के बराबर होती है। विज्ञान में, शोधकर्ता आमतौर पर प्रयोगात्मक डाटा के मानक विचलन की सूचना देते हैं और मानक विचलन की सीमा से बिलकुल परे एकमात्र प्रभाव को सांख्यिकी की दृष्टि से महत्वपूर्ण माना जाता है—सामान्य यादृच्छिक त्रुटि या मापन भिन्नता को इस तरह से कारणात्मक भिन्नता से अलग कर दिया जाता है। मानक विचलन, वित्त में भी महत्वपूर्ण है, जहां किसी निवेश के प्रतिफल दर का मानक विचलन, निवेश की अस्थिरता का एक माप है।

मानक विचलन संज्ञा का सबसे पहला प्रयोग[1] 1894 में कार्ल पीयरसन[2] के लेखन में किया गया और उसके बाद उनके व्याख्यानों में इसका प्रयोग किया गया। इसे एक ही विचार को व्यक्त करने वाले आरंभिक वैकल्पिक नामों के बदले प्रयोग किया गया: उदाहरण के तौर पर गॉस ने "मध्यमान त्रुटि" का प्रयोग किया।[3] मानक विचलन की एक उपयोगी विशेषता यह है कि प्रसरण के विपरीत, इसे डाटा के रूप में एक ही इकाइयों में व्यक्त किया जाता है। ध्यान दें, तथापि, कि इकाई के रूप में प्रतिशत युक्त मापन के लिए, मानक विचलन में इकाई के रूप में प्रतिशत अंक होगा.

जब जनसंख्या से आंकड़ों का केवल एक नमूना उपलब्ध हो, तो जनसंख्या के मानक विचलन का आकलन, नमूना मानक विचलन कहलाने वाले एक संशोधित मात्रा द्वारा किया जा सकता है जिसकी व्याख्या नीचे दी गई है.

मान लें कि जनसंख्या में निम्नलिखित मान हैं:

2,4,4,4,5,5,7,9.{\displaystyle 2,\;4,\;4,\;4,\;5,\;5,\;7,\;9.}

इसमें कुल आठ डाटा अंक हैं जिसका मध्यमान (या औसत) मान 5 है:

2+4+4+4+5+5+7+98=5.{\displaystyle {\frac {2+4+4+4+5+5+7+9}{8}}=5.}

जनसंख्या के मानक विचलन की गणना करने के लिए, सबसे पहले मध्यमान से प्रत्येक डाटा अंक के अंतर का परिकलन करें और प्रतिफल का वर्ग निकालें:

(2−5)2=(−3)2=9amp;(5−5)2=02=0(4−5)2=(−1)2=1amp;(5−5)2=02=0(4−5)2=(−1)2=1amp;(7−5)2=22=4(4−5)2=(−1)2=1amp;(9−5)2=42=16{\displaystyle {\begin{array}{ll}(2-5)^{2}=(-3)^{2}=9&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&(7-5)^{2}=2^{2}=4\\(4-5)^{2}=(-1)^{2}=1&(9-5)^{2}=4^{2}=16\end{array}}}

उसके बाद इन मानों के योगफल को आंकड़ों की संख्या से विभाजित करें और मानक विचलन ज्ञात करने के लिए इनका वर्गमूल निकालें:

9+1+1+1+0+0+4+168=2.{\displaystyle {\sqrt {\frac {9+1+1+1+0+0+4+16}{8}}}=2.}

इस प्रकार, उपरोक्त उदाहरण से पता चलता है कि जनसंख्या का मानक विचलन 2 है।

उपरोक्त उदाहरण एक सम्पूर्ण जनसंख्या की कल्पना है। यदि कुछ मूल जनसंख्या से यादृच्छिक नमूना द्वारा 8 मानों को प्राप्त किया जाता है, तो नमूना मानक विचलन के परिकलन में 8 के बजाय 7 से भाग दिया जायेगा। व्याख्या के लिए जनसंख्या के मानक विचलन का आकलन अनुभाग देखें.

प्रायिकता वितरण या यादृच्छिक परिवर्तनीय[संपादित करें]

मान लें, X एक यादृच्छिक परिवर्तनीय है जिसका मध्यमान मान μ है:

E⁡[X]=μ{\displaystyle \operatorname {E} [X]=\mu \,\!}

यहां, ऑपरेटर E, X के औसत या प्रत्याशित मान को दर्शाता है। तो, X की मानक विचलन मात्रा है

σ=E⁡[(X−μ)2].{\displaystyle \sigma ={\sqrt {\operatorname {E} \left[(X-\mu )^{2}\right]}}.}

अर्थात्, मानक विचलन σ (सिग्मा), (X − μ)2 के औसत मान का वर्गमूल है।

इस मामले में जहां X, एक परिमित डाटा सेट x1,x2,…,xN{\displaystyle x_{1},x_{2},\ldots ,x_{N}}

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
से यादृच्छिक मान प्राप्त करता है जिसके प्रत्येक मान में एक ही प्रायिकता है, तो मानक विचलन है

σ=(x1−μ)2+(x2−μ)2+⋯+(xN−μ)2N,{\displaystyle \sigma ={\sqrt {\frac {(x_{1}-\mu )^{2}+(x_{2}-\mu )^{2}+\cdots +(x_{N}-\mu )^{2}}{N}}},}

या, जोड़ संकेतन का प्रयोग करने पर,

σ=1N∑i=1N(xi−μ)2,{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}},}


(एकविचारण) प्रायिकता वितरण का मानक विचलन, उसी प्रकार के वितरण वाले यादृच्छिक परिवर्तनीय के मानक विचलन के समान ही होता है। चूंकि इन प्रत्याशित मानों का होना आवश्यक नहीं है, इसलिए सभी यादृच्छिक परिवर्तनीय में मानक विचलन नहीं होता है। उदाहरण के लिए, एक यादृच्छिक परिवर्तनीय का मानक विचलन, जो एक कॉची वितरण का अनुसरण करता है, परिभाषित रहता है क्योंकि इसका प्रत्याशित मान, अपरिभाषित होता है।

सतत यादृच्छिक परिवर्तनीय[संपादित करें]

सतत वितरण आम तौर पर वितरण के मापदंडों के एक फलन के रूप में मानक विचलन की गणना करने के लिए एक सूत्र प्रदान करता है। साधारणतः, प्रायिकता घनत्व फलन p (x) युक्त एक सतत वास्तविक मूल्य वाले यादृच्छिक परिवर्तनीय X का मानक विचलन

σ=∫(x−μ)2p(x)dx{\displaystyle \sigma ={\sqrt {\int (x-\mu )^{2}\,p(x)\,dx}}\,}

है जहां

μ=∫xp(x)dx{\displaystyle \mu =\int x\,p(x)\,dx\,}

और जहां अभिन्न, निश्चित अभिन्न है जो X की श्रेणी पर x श्रेणी का कल्पित मान है।

असतत यादृच्छिक परिवर्तनीय या डाटा सेट[संपादित करें]

एक असतत यादृच्छिक परिवर्तनीय का मानक विचलन, मध्यमान से इसके मानों का मूल-मध्यमान-वर्ग (RMS) विचलन होता है।

यदि यादृच्छिक परिवर्तनीय X, समान प्रायिकता वाले N मानों x1,…,xN{\displaystyle \textstyle x_{1},\dots ,x_{N}}

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
(जो वास्तविक संख्या हैं) को ग्रहण करता है, तो इसके मानक विचलन σ की गणना निम्न प्रकार से की जा सकती है:

  1. मानों का मध्यमान, x¯{\displaystyle \scriptstyle {\overline {x}}}
    मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
    ज्ञात करें.
  2. प्रत्येक मान xi{\displaystyle x_{i}}
    मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
    के लिए मध्यमान से इसके विचलन (xi−x¯{\displaystyle \scriptstyle x_{i}-{\overline {x}}}
    मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
    ) की गणना करें.
  3. इन विचलनों के वर्ग की गणना करें.
  4. वर्ग किए गए विचलनों का मध्यमान ज्ञात करें. यह मात्रा, प्रसरण σ 2 है।
  5. प्रसरण का वर्गमूल निकालें.

इस गणना को निम्नलिखित सूत्र द्वारा वर्णित किया जाता है:

σ=1N∑i=1N(xi−x¯)2{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}\,}

जहां x¯{\displaystyle \scriptstyle {\overline {x}}}, मान xi का अंकगणितीय मध्यमान है, जो निम्न रूप में परिभाषित है:

x¯=x1+x2+⋯+xNN=1N∑i=1Nxi.{\displaystyle {\overline {x}}={\frac {x_{1}+x_{2}+\cdots +x_{N}}{N}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}\,.}

यदि सभी मानों की प्रायिकता समान न हो, लेकिन मान xi की प्रायिकता pi के समान हो, तो मानक विचलन का परिकलन निम्न प्रकार से की जा सकती है:

σ=∑i=1Npi(xi−x¯)2∑i=1Npi{\displaystyle \sigma ={\sqrt {\frac {\sum _{i=1}^{N}p_{i}(x_{i}-{\overline {x}})^{2}}{\sum _{i=1}^{N}p_{i}}}}\,} औरs=N′∑i=1Npi(xi−x¯)2(N′−1)∑i=1Npi{\displaystyle s={\sqrt {\frac {N'\sum _{i=1}^{N}p_{i}(x_{i}-{\overline {x}})^{2}}{(N'-1)\sum _{i=1}^{N}p_{i}}}}\,}

जहां

x¯=∑i=1Npixi∑i=1Npi{\displaystyle {\overline {x}}={\frac {\sum _{i=1}^{N}p_{i}x_{i}}{\sum _{i=1}^{N}p_{i}}}\,}

और N', गैर-शून्य भार तत्वों की संख्या है।

एक डाटा सेट का मानक विचलन, असतत यादृच्छिक परिवर्तनीय के मानक विचलन के समान ही होता है जो डाटा सेट से विधिपूर्वक मानों की कल्पना कर सकता है जहां प्रत्येक मान का बिंदु आधिक्य, डाटा सेट में इसकी बहुलता के समानुपातिक होता है।

उदाहरण[संपादित करें]

मान लें, हम 3, 7, 7 और 19 मान वाले डाटा सेट का मानक विचलन ज्ञात करना चाहते थे।

चरण 1: 3, 7, 7 और 19 का अंकगणितीय मध्यमान (औसत) ज्ञात करें,

3+7+7+194=9.{\displaystyle {\frac {3+7+7+19}{4}}=9.}

चरण 2: मध्यमान से प्रत्येक संख्या का विचलन ज्ञात करें,

3−9amp;=−67−9amp;=−27−9amp;=−219−9amp;=10.{\displaystyle {\begin{aligned}3-9&=-6\\7-9&=-2\\7-9&=-2\\19-9&=10.\end{aligned}}}

चरण 3: प्रत्येक विचलन का वर्ग निकालें, जो बड़े विचलनों को परिवर्धित करती हैं और ऋणात्मक मानों को धनात्मक में बदल देती है,

(−6)2amp;=36(−2)2amp;=4(−2)2amp;=4102amp;=100.{\displaystyle {\begin{aligned}(-6)^{2}&=36\\(-2)^{2}&=4\\(-2)^{2}&=4\\10^{2}&=100.\end{aligned}}}

चरण 4: उन वर्गित विचलनों का मध्यमान ज्ञात करें,

36+4+4+1004=36.{\displaystyle {\frac {36+4+4+100}{4}}=36.}

चरण 5: भागफल (वर्गित इकाइयों को पुनः नियमित इकाइयों में परिवर्तित करके) के गैर-ऋणात्मक वर्गमूल लें,

36=6.{\displaystyle {\sqrt {36}}=6.\,}

तो, समुच्चय का मानक विचलन 6 है। इस उदाहरण से यह भी पता चलता है कि, सामान्य रूप से, मानक विचलन मध्यमान निरपेक्ष विचलन (इस उदाहरण में जिसका मान 5 है) से भिन्न होता है।

ध्यान दें कि यदि उपरोक्त डाटा सेट केवल वृहत्तर जनसंख्या के एक नमूने को दर्शाए, तो जनसंख्या के मानक विचलन का आकलन करने के लिए एक संशोधित मानक विचलन की गणना (नीचे व्याख्या दी गई है) करनी होगी जो इस उदाहरण के लिए 6.93 प्रदान करेगा.

सूत्र का सरलीकरण[संपादित करें]

वर्गित विचलनों के योगफल की गणना का सरलीकरण निम्न प्रकार से किया जा सकता है।

∑i=1N(xi−x¯)2amp;=∑i=1N(xi2−2xix¯+x¯2)amp;=(∑i=1Nxi2)−(2x¯∑i=1Nxi)+Nx¯2amp;=(∑i=1Nxi2)−2x¯(Nx¯)+Nx¯2amp;=(∑i=1Nxi2)−2Nx¯2+Nx¯2amp;=(∑i=1Nxi2)−Nx¯2.{\displaystyle {\begin{aligned}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}&={}\sum _{i=1}^{N}(x_{i}^{2}-2x_{i}{\overline {x}}+{\overline {x}}^{2})\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-\left(2{\overline {x}}\sum _{i=1}^{N}x_{i}\right)+N{\overline {x}}^{2}\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-2{\overline {x}}(N{\overline {x}})+N{\overline {x}}^{2}\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-2N{\overline {x}}^{2}+N{\overline {x}}^{2}\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-N{\overline {x}}^{2}.\end{aligned}}}

मानक विचलन के मूल सूत्र में इसे लागू करने पर प्राप्त होता है:

σ=1N((∑i=1Nxi2)−Nx¯2)=1N(∑i=1Nxi2)−x¯2.{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\left(\left(\sum _{i=1}^{N}x_{i}^{2}\right)-N{\overline {x}}^{2}\right)}}={\sqrt {{\frac {1}{N}}\left(\sum _{i=1}^{N}x_{i}^{2}\right)-{\overline {x}}^{2}}}.}

(औसत के वर्ग से कम वर्गों के औसत) का वर्गमूल निकालकर इसे स्मृति में रखा जा सकता है।

जनसंख्या के मानक विचलन का आकलन[संपादित करें]

कुछ परिस्थितियों (जैसे मानकीकृत परीक्षण) में व्यक्त सम्पूर्ण जनसंख्या के मानक विचलन को ज्ञात कर सकते हैं जहां जनसंख्या के प्रत्येक सदस्य का नमूना उपलब्ध हो. ऐसे मामलों में जहां ऐसा नहीं किया जा सकता है, वहां मानक विचलन σ का आकलन जनसंख्या से लिए गए एक यादृच्छिक नमूने का परीक्षण करके किया जाता है। कुछ आकलनकर्ता नीचे दिए गए हैं:

नमूने के मानक विचलन के साथ[संपादित करें]

कभी-कभी प्रयोग किए जाने वाले σ का एक आकलनकर्ता, नमूने का मानक विचलन है जिसे s n द्वारा चिह्नित किया जाता है और जिसे निम्न रूप में परिभाषित किया गया है:

sn=1N∑i=1N(xi−x¯)2.{\displaystyle s_{n}={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}.}

इस आकलनकर्ता में "नमूना मानक विचलन" (नीचे देखें) की अपेक्षा एक-समान छोटा मध्यमान वर्गित त्रुटि होती है और जब जनसंख्या को आम तौर पर वितरित किया जाता है तब यह अधिकतम संभावित आकलन होता है। लेकिन यह आकलनकर्ता, जब इसे एक छोटे या मामूली आकार वाले नमूने में कार्यान्वित किया जाता है, तब बहुत कम हो जाता है: यह एक पक्षपाती आकलनकर्ता है।

नमूना मानक विचलन के साथ[संपादित करें]

σ प्रयोग का सर्वाधिक सामान्य आकलनकर्ता एक समायोजित संस्करण, नमूना मानक विचलन है जिसे "s" द्वारा चिह्नित किया जाता है और निम्न रूप में परिभाषित है:

s=1N−1∑i=1N(xi−x¯)2,{\displaystyle s={\sqrt {{\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}},}

जहां {x1,x2,…,xN}{\displaystyle \scriptstyle \{x_{1},\,x_{2},\,\ldots ,\,x_{N}\}}

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
, नमूना है और x¯{\displaystyle \scriptstyle {\overline {x}}}, नमूने का मध्यमान है। इस संशुद्धि (N के बजाय N − 1 का प्रयोग) को बेसेल की संशुद्धि के रूप में जाना जाता है। इस संशुद्धि का कारण यह है कि s 2, अंतर्निहित जनसंख्या के प्रसरण σ2 का एक निष्पक्ष आकलनकर्ता है, यदि वह प्रसरण मौजूद हो और नमूने के मान को प्रतिस्थापन के साथ स्वतंत्रतापूर्वक तैयार किया गया हो. हालांकि, s, मानक विचलन σ का एक निष्पक्ष आकलनकर्ता नहीं है, बल्कि यह जनसंख्या के मानक विचलन के न्यून-आकलन में सहायक है।

ध्यान दें कि शब्द "नमूने का मानक विचलन" असंशुद्ध आकलनकर्ता (N का प्रयोग करके) के लिए प्रयोग में लाया जाता है जबकि शब्द "नमूना मानक विचलन" संशुद्ध आकलनकर्ता (N − 1 का प्रयोग करके) के लिए प्रयोग में लाया जाता है। हर N − 1, अवशिष्ट के अदिश में स्वतंत्रता की डिग्री की संख्या है, (x1−x¯,…,xN−x¯){\displaystyle \scriptstyle (x_{1}-{\overline {x}},\,\dots ,\,x_{N}-{\overline {x}})}

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
.

अन्तःचतुर्थक श्रेणी के साथ[संपादित करें]

सांख्यिकी

IQR1.35{\displaystyle {\frac {\text{IQR}}{1.35}}}

(1.35 एक सन्निकटन है) जहां IQR, नमूने का अन्तःचतुर्थक श्रेणी है, σ का संगत आकलन है यदि जनसंख्या को सामान्य रूप से वितरित किया गया हो. अन्तःचतुर्थक श्रेणी IQR, डाटा के तीसरे चतुर्थक और प्रथम चतुर्थक का अंतर है। नमूना मानक विचलन से एक के संबंध में इस आकलनकर्ता की अनन्तस्पर्शी सापेक्ष दक्षता (ARE), 0.37 है। इसलिए सामान्य डाटा के लिए नमूना मानक विचलन से एक का प्रयोग करना बेहतर होता है; जब डाटा में अधिक जानकारी होती है तब यह आकलनकर्ता और अधिक कुशल हो सकता है।[4][not in citation given][संदिग्ध – वार्ता]

अन्य आकलनकर्ता[संपादित करें]

हालांकि σ के लिए एक निष्पक्ष आकलनकर्ता को ज्ञात किया जाता है जब यादृच्छिक परिवर्तनीय को सामान्य रूप से वितरित किया जाता है, सूत्र जटिल होता है और एक मामूली संशुद्धि की फलगणना करता है: अधिक जानकारी के लिए मानक विचलन का निष्पक्ष आकलन देखें. इसके अलावा, निष्पक्षता (शब्द के इस अर्थ में) हमेशा वांछनीय नहीं होता है: एक आकलनकर्ता का पक्षपात देखें.

स्थिरांक c और यादृच्छिक परिवर्तनीय X और Y के लिए:

stdev⁡(X+c)=stdev⁡(X){\displaystyle \operatorname {stdev} (X+c)=\operatorname {stdev} (X)\,}stdev⁡(cX)=|c|stdev⁡(X){\displaystyle \operatorname {stdev} (cX)=|c|\,\operatorname {stdev} (X)\,}stdev⁡(X+Y)=var⁡(X)+var⁡(Y)+2cov⁡(X,Y){\displaystyle \operatorname {stdev} (X+Y)={\sqrt {\operatorname {var} (X)+\operatorname {var} (Y)+2\operatorname {cov} (X,Y)}}\,}

जहां var{\displaystyle \operatorname {var} }

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
और cov{\displaystyle \operatorname {cov} }
मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
क्रमशः प्रसरण और सहप्रसरण के प्रतीक हैं।

एक बड़ा मानक विचलन इंगित करता है कि डाटा अंक मध्यमान से दूर होते हैं और एक लघु मानक विचलन इंगित करता है कि वे मध्यमान के चारों-तरफ़ काफी नज़दीकी से समूहीकृत होते हैं।

उदाहरण के लिए, तीन जनसंख्या {0, 0, 14, 14}, {0, 6, 8, 14} and {6, 6, 8, 8} में से प्रत्येक का मध्यमान 7 है। उनके मानक विचलन क्रमशः 7, 5 और 1 हैं। तीसरी जनसंख्या का मानक विचलन अन्य दो विचलनों की अपेक्षा कम होता है क्योंकि इनके सभी मान 7 के करीब हैं। एक अस्पष्ट अर्थ में, मानक विचलन हमें यह बताता है कि डाटा के अंक माध्यम से कितिनी दूर होने चाहिए. इसमें उतनी ही इकाइयां होगी जितनी स्वयं डाटा अंकों में होते हैं। उदाहरण के लिए, यदि डाटा सेट {0, 6, 8, 14} चार भाई-बहनों की की एक संख्या की आयु को वर्ष में प्रदर्शित करता है तो मानक विचलन 5 वर्ष होता है।

एक दूसरे उदाहरण के तौर पर, जनसंख्या {1000, 1006, 1008, 1014} चार एथलीटों द्वारा तय की गई दूरियों को मीटर में व्यक्त करता है। इसका मध्यमान 1007 मीटर है और मानक विचलन 5 मीटर है।

मानक विचलन, अनिश्चितता की एक माप के रूप में कार्य कर सकते हैं। उदाहरण के लिए, भौतिक विज्ञान में दोहराए गए मापन के एक समूह के प्रतिवेदित मानक विचलन को उन मापनों की सुस्पष्टता प्रदान करनी चाहिए. जब यह निश्चय किया जाता है कि क्या मापन, सैद्धांतिक भविष्यवाणी से सहमत है तब उन मापनों का मानक विचलन महत्त्व निर्णायक होता है: यदि मापन का मध्यमान भविष्यवाणी से बहुत दूर हो, तो परीक्षणमूलक सिद्धांत को संभवतः परिशोधित करने की आवश्यकता है। इससे यह अर्थ निकलता है कि वे मानों की श्रेणी से बाहर चले जाते हैं जिसके होने की उचित उम्मीद की जा सके यदि भविष्यवाणी सही होती और मानक विचलन मात्र को उचित ढंग से निर्धारित किया जाता. भविष्यवाणी अंतराल देखें.

मानों के एक समूह के मानक विचलन को समझने का व्यवहारिक मान निर्धारण के अधीन है कि "औसत" (मध्यमान) से कितनी भिन्नता है।

मौसम[संपादित करें]

एक साधारण उदाहरण के रूप में, शहरों के औसत तापमान पर विचार करें. जबकि दो शहरों का औसत तापमान 15 °C हो सकता है, यह समझने में सहायक है कि समुद्र तट के पास के शहर की सीमा अंतर्देशीय शहरों की तुलना में छोटी है जो यह स्पष्ट करता है कि जबकि औसत समान है लेकिन समुद्र तट के समीप की अपेक्षा अंतर्देशीय भिन्नता के होने की अधिक सम्भावना है।

तो, एक शहर का औसत तापमान 15 होता है जिसका अधिकतम तापमान 25 °C और निम्न तापमान 5 °C हो और ऐसा दूसरे शहर के साथ भी होता है जिसका अधिकतम तापमान 18 और निम्न तापमान 12 हो. मानक विचलन हमें पहचानने की अनुमति प्रदान करता है कि व्यापक भिन्नता वाले शहर का औसत और इस प्रकार एक उच्च मानक विचलन तापमान का उतना विश्वसनीय भविष्यवाणी प्रदान नहीं करेगा जितना कम भिन्नता वाला और निम्न मानक विचलन वाला शहर का औसत प्रदान करेगा.

खेल[संपादित करें]

इसे समझने का एक दूसरा तरीका है कि हम खेल की टीमों पर विचार करें. किसी भी श्रेणी समूह में, ऐसे टीम होंगे जो कभी उच्च दर प्राप्त करेंगे तो कभी खराब। इसकी संभावना है कि जो टीम स्टैंडिंग में नेतृत्व करते हैं, वे ऐसी विपरीतता का प्रदर्शन नहीं करेंगे लेकिन अधिकांश श्रेणियों में वे अच्छा प्रदर्शन करेंगे. प्रत्येक श्रेणी में उनकी रेटिंग का मानक विचलन जितना कम होगा, वे उतना ही अधिक संतुलित और सुसंगत होंगे. जबकि उच्च मानक विचलन वाले टीम अधिक अपूर्वानुमेय होंगे. उदाहरण के लिए, एक टीम जो अधिकांश श्रेणियों में लगातार खराब है, उसमें निम्न मानक विचलन होगा. एक टीम जो ज्यादातर श्रेणियों में लगातार अच्छा है, उसमें भी निम्न मानक विचलन होगा. हालांकि, एक उच्च मानक विचलन वाला टीम उस प्रकार टीम हो सकता है जो बहुत स्कोर (सशक्त आक्रमण) बनाता है लेकिन बहुत छूट (कमज़ोर सुरक्षा) भी देते हैं, या एक दूसरे के विपरीत, जिसका आक्रमण ख़राब हो सकता है लेकिन स्कोर करने में मुश्किलें पैदा कर इसकी क्षतिपूर्ति करता है।

यह भविष्यवाणी करने की कोशिश करना कि किसी भी निर्धारित दिन को कौन सी टीम जीतेगी, इसके लिए टीम के विभिन्न "आंकड़ों" की रेटिंग के मानक विचलन पर ध्यान देना होगा जिसके अंतर्गत असंगति यह समझने की कोशिश में शक्ति बनाम कमजोरी का मिलान कर सकता है कि कौन से कारक अंतिम स्कोरिंग परिणाम के सशक्त संकेतकों के रूप में अभिभावी हो सकते हैं।

रेसिंग में, एक चालक को लगातार चक्कर लगाने के लिए समय प्रदान किया जाता है। चक्कर की संख्या के निम्न मानक विचलन वाला चालक, उच्च मानक विचलन वाले चालक की अपेक्षा अधिक अनुकूल होता है। इस जानकारी को यह समझने में मदद करने के लिए प्रयोग में लाया जा सकता है कि चक्करों की संख्या को घटाने के लिए अवसर कहां प्राप्त हो सकते हैं।

वित्त[संपादित करें]

वित्त में, मानक विचलन किसी प्रदत्त प्रतिभूति (शेयरों, बांडों, संपत्ति, आदि) से जुड़े जोख़िम या प्रतिभूतियों (सक्रिय रूप से प्रबंधित म्युचुअल फंड, इंडेक्स म्युचुअल फंड, या ETFs) के एक पोर्टफोलियो के जोख़िम का एक प्रदर्शन है। जोख़िम यह निर्धारित करने का एक महत्वपूर्ण कारक है कि किस तरह निवेश के पोर्टफोलियो का कुशलतापूर्वक प्रबंधन करना चाहिए क्योंकि यह आस्ति और/या पोर्टफोलियो के प्रतिफल की भिन्नता का निर्धारण करता है और निवेशकों को निवेश के फैसलों के लिए एक गणितीय आधार प्रदान करता है (जिसे मध्यमान-प्रसरण इष्टतमीकरण के रूप में जाना जाता है). जोख़िम की समग्र अवधारणा यह है कि जब इसमें वृद्धि होती है तो अर्जित जोख़िम प्रीमियम के परिणामस्वरूप आस्ति के प्रत्याशित लाभ में वृद्धि होगी – दूसरे शब्दों में, निवेशकों को निवेश पर अधिक प्रतिफल की उम्मीद करनी चाहिए जब कथित निवेश में उच्च स्तरीय जोख़िम हो या उस प्रतिफल की अनिश्चितता हो. निवेशों के मूल्यांकन के समय निवेशकों को प्रत्याशित प्रतिफल और भविष्यत् प्रतिफलों की अनिश्चितता दोनों का आकलन करना चाहिए. मानक विचलन, भविष्यत् प्रतिफलों की अनिश्चितता का एक परिमानित आकलन प्रदान करता है।

उदाहरण के लिए, मान लें कि किसी निवेशक को दोनों स्टॉक में से किसी एक का चयन करना था। स्टॉक A का पिछले 20 वर्षों से औसत प्रतिफल 10% था जिसका मानक विचलन 20 प्रतिशत अंक (pp) था और स्टॉक B का उसी समयावधि में औसत प्रतिफल का मान 12% था लेकिन उसके उच्च मानक विचलन का मान 30 pp था। जोख़िम और प्रतिफल के आधार पर, एक निवेशक निर्णय कर सकता है कि स्टॉक A अधिक सुरक्षित विकल्प है क्योंकि स्टॉक B के प्रतिफल के अतिरिक्त 2% अंक का अतिरिक्त 10 pp मानक विचलन (अधिक जोख़िम या प्रत्याशित प्रतिफल की अनिश्चितता) के सामने कोई मूल्य नहीं है। एक ही परिस्थितियों में स्टॉक A की अपेक्षा स्टॉक B के आरंभिक निवेश में कई बार कमी होने की संभावना होती है (लेकिन आरंभिक निवेश में वृद्धि होने की भी संभावना होती है) और औसतन केवल 2% अधिक प्रतिफल प्राप्त होने का आकलन किया जाता है। इस उदाहरण में, स्टॉक A में लगभग 10%, 20 pp अधिक या कम (30% से -10% की सीमा), भविष्यत् वर्ष के प्रतिफल का लगभग दो-तिहाई कमाने की उम्मीद है। भविष्य में अधिक से अधिक संभावित प्रतिफल या परिणाम पर विचार करने के समय, एक निवेशक को 10% अधिक या कम 60 pp, या 70% से (-)50% तक की सीमा तक के परिणाम की उम्मीद करनी चाहिए जिसमें औसत प्रतिफल (संभावित प्रतिफल का लगभग 99.7%) के तीन मानक विचलनों का परिणाम शामिल होता है।

एक प्रदत्त समयावधि के दौरान एक प्रतिभूति के औसत प्रतिफल (या अंकगणितीय मध्यमान) की गणना करने पर आस्ति का एक प्रत्याशित प्रतिफल उत्पन्न होगा. प्रत्येक अवधि के लिए, वास्तविक प्रतिफल से प्रत्याशित प्रतिफल को घटाने के फलस्वरूप प्रसरण की प्राप्ति होती है। आस्ति के समग्र जोख़िम के परिणाम के प्रभाव को ज्ञात करने के लिए प्रत्येक अवधि के प्रसरण का वर्ग निकालें. अवधि का प्रसरण जितना अधिक होता है, प्रतिभूति उतना ही अधिक जोख़िम वहन करता है। वर्गित प्रसरणों का औसत निकालने के परिणामस्वरूप आस्ति से जुड़े समग्र इकाइयों का माप प्राप्त होता है। इस प्रसरण का वर्गमूल ज्ञात करने के परिणामस्वरूप प्रश्नाधीन निवेश उपकरण का मानक विचलन प्राप्त होगा.

जनसंख्या मानक विचलन को बोलिंगर पट्टियों, व्यापक तौर पर अपनाए गए एक तकनीकी विश्लेषण उपकरण की चौड़ाई को निर्धारित करने के लिए प्रयोग किया जाता है। उदाहरण के लिए, ऊपरी बोलिंगर पट्टी को निम्न रूप में दिया जाता है:

x¯+n∗σx{\displaystyle {\bar {x}}+n*\sigma {x}}

कुछ ज्यामितीय अंतर्दृष्टि प्राप्त करने के लिए, हमलोग तीन मानों, x 1, x 2, x 3 की एक जनसंख्या के साथ शुरू करेंगे. यह एक अंक P = R 3 में (x 1, x 2, x 3) को परिभाषित करता है। मान लें रेखा L = {({0}r, r, r) : R में r }. यही "मुख्य विकर्ण" है जो उत्पत्ति स्थल से होकर गुजरता है। यदि हमारे सभी तीनों प्रदत्त मान बराबर थे, तो मानक विचलन शून्य होगा और P, L पर अवस्थित होगा. यह मानना अनुचित नहीं है कि मानक विचलन, P से L की दूरी से संबंधित है। और वास्तव में यही विषय है। P से रेखा L तक लम्बवत रूप से जाने पर, एक बिंदु से टकराता है:

R=(x¯,x¯,x¯){\displaystyle R=({\overline {x}},{\overline {x}},{\overline {x}})}

जिसका निर्देशांक उन मानों का मध्यमान है जिसे लेकर हमने शुरुआत की थी। बीजगणित से थोड़ा बहुत पता चलता है कि P और R के बीच की दूरी (जो P और रेखा L के बीच की दूरी के समान है) σ√3 द्वारा प्रदत्त है। एक अनुरूप सूत्र (3 को N द्वारा प्रतिस्थापित करके) N मानों की एक जनसंख्या के लिए भी वैध है; उसके बाद हमें R N में काम करना है। मानक विचलन

एक अवलोकन शायद ही मध्यमान से दूर कुछ मानक विचलनों से अधिक होता है। चेबीशेव की असमानता, सभी वितरणों के लिए निम्नलिखित सीमा पर ज़ोर देता है जिसके लिए मानक विचलन को परिभाषित किया गया है।

कम से कम मानों का 50%, मध्यमान से √2 मानक विचलनों के भीतर होते हैं।कम से कम मानों का 75%, मध्यमान से 2 मानक विचलनों के भीतर होते हैं।कम से कम मानों का 89%, मध्यमान से 3 मानक विचलनों के भीतर होते हैं।कम से कम मानों का 94%, मध्यमान से 4 मानक विचलनों के भीतर होते हैं।कम से कम मानों का 96%, मध्यमान से 5 मानक विचलनों के भीतर होते हैं।कम से कम मानों का 97%, मध्यमान से 6 मानक विचलनों के भीतर होते हैं।

और सामान्य तौर पर:

कम से कम मानों का (1 − 1/k 2) × 100%, मध्यमान से k मानक विचलनों के भीतर होते हैं।[5]

सामान्य रूप से वितरित डाटा के नियम[संपादित करें]

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?

गहरे नीले रंग की पट्टी का मध्यमान एक मानक विचलन से कम है। सामान्य वितरण के लिए, इसमें सेट के 68.27 % का विवरण है; जबकि मध्यमान के दो मानक विचलनों (माध्यम और गहरा नीला) में 95.45% विवरण हैं; तीन मानक विचलनों (हल्का, माध्यम और गहरा नीला) में 99.73% विवरण है; और चार मानक विचलनों में 99.994% विवरण है। वक्र के दो अंक भी मोड़ अंक हैं जिनके मध्यमान का मान एक मानक विचलन है।

केंद्रीय सीमा प्रमेय का कहना है कि कई स्वतंत्र, समानतापूर्वक वितरित यादृच्छिक परिवर्तनीय के योगफल का वितरण, सामान्य वितरण की ओर जाता है। यदि कोई डाटा वितरण लगभग सामान्य है तो मानों का लगभग 68% मान, मध्यमान (गणित की दृष्टि से, μ ± σ, जहां μ अंकगणितीय मध्यमान है) के 1 मानक विचलन के भीतर, मानों का लगभग 95% मान, दो मानक विचलनों (μ ± 2σ) के भीतर और लगभग 99.7%, 3 मानक विचलनों (μ ± 3σ) के भीतर होते हैं। इसे 68-95-99.7 नियम या अनुभवजन्य नियम के रूप में जाना जाता है।

Z के विभिन्न मानों के लिए, मानों के प्रतिशत जिनके सममित अंतराल (−z σ, z σ) में और उसके बाहर होने की उम्मीद है, इस प्रकार है:

z σCI के भीतर प्रतिशतCI के बाहर प्रतिशतCI के बाहर अनुपात1σ68.268949199%31.731050799%1 / 3.15148711.645σ90%10%1 / 101.960σ95%5%1 / 202σ95.4499736%4.550026399%1 / 21.9778942.576σ99%1%1 / 1003σ99.730020399%0.2699796%1 / 370.3983.2906σ99.9%0.1%1 / 10004σ99.993666%0.006334%1 / 15,7885σ99.999942669%0.000057330000%1 / 17,44,2786σ99.999999802%0.000000197%1 / 506,800,0007σ99.999 999 999 7440%0.000000000%1 / 3,90,60,00,00,000

सीमा के भीतर के प्रतिशत को सूत्र द्वारा परिभाषित किया गया है: %perc = erf(nσ / √2) × 50% + 50%

मानक विचलन और मध्यमान के बीच संबंध[संपादित करें]

डाटा के एक सेट के मध्यमान और मानक विचलन को आम तौर पर एक साथ प्रतिवेदित किया जाता है। एक खास मायने में, यदि डाटा के केंद्र को मध्यमान के सन्दर्भ में मापा जाता है तो मानक विचलन, सांख्यिकीय प्रकीर्णन का एक "स्वाभाविक" माप होता है। इसका कारण यह है कि मध्यमान का मानक विचलन, अन्य किसी बिंदु से कम होता है। सटीक विवरण निम्नलिखित है: मान लें x 1, ..., x n वास्तविक संख्याएं हैं और फलन को परिभाषित करें:

σ(r)=1N−1∑i=1N(xi−r)2.{\displaystyle \sigma (r)={\sqrt {{\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-r)^{2}}}.}

कलन का प्रयोग करने या वर्ग को पूरा करने पर, संभवतः यह पता चलता है कि σ(r) का मध्यमान अद्वितीय रूप से न्यूनतम है:

r=x¯.{\displaystyle r={\overline {x}}.\,}

एक नमूने की भिन्नता का गुणांक, मानक विचलन और मध्यमान का अनुपात होता है। यह एक आयामरहित संख्या है जिसे एक दूसरे के समीप मध्यमानों वाले जनसंख्याओं की बीच के प्रसरण की राशि की तुलना करने के लिए प्रयोग में लाया जा सकता है। कारण यह है कि यदि आप एक ही मानक विचलन वाले लेकिन अलग-अलग मध्यमान वाले जनसंख्याओं की तुलना करते हैं तो भिन्नता का गुणांक, कम मध्यमान वाले जनसंख्या के लिए अधिक होगा. इस प्रकार डाटा की परिवर्तनीयता की तुलना करने में, भिन्नता के गुणांक को बड़ी सावधानी से प्रयोग किया जाना चाहिए और बेहतर होगा यदि इसे किसी दूसरी विधि की सहायता से प्रतिस्थापित किया जाए.

यदि हम वितरण के नमूने के द्वारा मध्यमान प्राप्त करना चाहते हैं तो मध्यमान का मानक विचलन निम्न द्वारा वितरण के मानक विचलन से संबंधित होता है

σmean=σN{\displaystyle \sigma _{\text{mean}}={\frac {\sigma }{\sqrt {N}}}}

जहां N, मध्यमान का आकलन करने के लिए प्रयुक्त नमूने के अवलोकन की संख्या है।

तेज़ी से गणना करने के तरीके[संपादित करें]

इन्हें भी देखें: Algorithms for calculating variance

निम्नलिखित दो सूत्र, एक चालू (सतत) मानक विचलन को प्रदर्शित कर सकते हैं। तीन घातों s 0,1,2 के योगफल के एक सेट को x k के रूप में चिह्नित, x के N मानों के एक सेट पर प्रत्येक का परिकलन किया जाता है।

 sj=∑k=1Nxkj.{\displaystyle \ s_{j}=\sum _{k=1}^{N}{x_{k}^{j}}.}

ध्यान दें कि s 0, x को शून्य घात में विकसित कर देता है और चूंकि x 0 का मान हमेशा 1 होता है, इसलिए s 0, N का मूल्यांकन करता है।

इन तीन चालू योगफलों के परिणाम को देखते हुए, चालू मानक विचलन के मौजूदा मान का परिकलन करने के लिए मानों s 0,1,2 को कभी भी प्रयोग में लाया जा सकता है। s j की परिभाषा, दो अलग-अलग चरणों (योगफल परिकलन s j और σ{\displaystyle \sigma }

मानक विचलन का सही सूत्र क्या है? - maanak vichalan ka sahee sootr kya hai?
गणना) को प्रदर्शित कर सकते हैं।

σ=1s0s0s2−s12{\displaystyle \sigma ={\frac {1}{s_{0}}}{\sqrt {s_{0}s_{2}-s_{1}^{2}}}}

इसी प्रकार नमूना मानक विचलन के लिए,

s=s0s2−s12s0(s0−1).{\displaystyle s={\sqrt {\frac {s_{0}s_{2}-s_{1}^{2}}{s_{0}(s_{0}-1)}}}.}

एक कंप्यूटर कार्यान्वयन में, चूंकि तीन s j योगफल अधिक हो जाते हैं, इसलिए हमें राउंड-ऑफ त्रुटि, अंकगणित अतिप्रवाह और अंकगणित अनुप्रवाह पर विचार करने की आवश्यकता है। निम्न विधि कम राउंडिंग त्रुटियों वाले चालू योगफल विधि की गणना करता है:

A0=0{\displaystyle A_{0}=0\,}Ai=Ai−1+xi−Ai−1i{\displaystyle A_{i}=A_{i-1}+{\frac {x_{i}-A_{i-1}}{i}}}

जहां A, मध्यमान मान है।

Q0=0{\displaystyle Q_{0}=0\,}Qi=Qi−1+i−1i(xi−Ai−1)2{\displaystyle Q_{i}=Q_{i-1}+{\frac {i-1}{i}}(x_{i}-A_{i-1})^{2}\,}

या

Qi=Qi−1+(xi−Ai−1)(xi−Ai){\displaystyle Q_{i}=Q_{i-1}+(x_{i}-A_{i-1})(x_{i}-A_{i})\,}

नमूना प्रसरण:

sn2=Qnn−1{\displaystyle s_{n}^{2}={\frac {Q_{n}}{n-1}}}

मानक विचलन

σn2=Qnn.{\displaystyle \sigma _{n}^{2}={\frac {Q_{n}}{n}}.}

जब मान x i, को असमान भार wi के साथ भारित किया जाता है, तो घात योग s 0,1,2 में से प्रत्येक निम्न प्रकार से परिकलन किया जाता है:

 sj=∑k=1Nwixkj.{\displaystyle \ s_{j}=\sum _{k=1}^{N}{w_{i}x_{k}^{j}}.\,}

और मानक विचलन समीकरण अपरिवर्तित रहते हैं। ध्यान दें कि s 0 अब भारों का योग है न कि N नमूनों की संख्या.

कम राउंडिंग त्रुटियों वाले वृद्धिशील विधि को भी कुछ अतिरिक्त जटिलता के साथ लागू किया जा सकता है।

भारों के एक चालू योग का अवश्य परिकलन किया जाना चाहिए:

W0=0{\displaystyle W_{0}=0\,}Wi=Wi−1+wi{\displaystyle W_{i}=W_{i-1}+w_{i}\,}

और जिन जगहों में ऊपर 1/i का प्रयोग हुआ है, उन्हें अवश्य ही wi /Wi द्वारा प्रतिष्ठापित किया जाना चाहिए:

A0=0{\displaystyle A_{0}=0\,}Ai=Ai−1+wiWi(xi−Ai−1){\displaystyle A_{i}=A_{i-1}+{\frac {w_{i}}{W_{i}}}(x_{i}-A_{i-1})\,}Q0=0{\displaystyle Q_{0}=0\,}Qi=Qi−1+wiWi−1Wi(xi−Ai−1)2=Qi−1+wi(xi−Ai−1)(xi−Ai){\displaystyle Q_{i}=Q_{i-1}+{\frac {w_{i}W_{i-1}}{W_{i}}}(x_{i}-A_{i-1})^{2}=Q_{i-1}+w_{i}(x_{i}-A_{i-1})(x_{i}-A_{i})\,}

अंतिम विभाजन में,

σn2=QnWn{\displaystyle \sigma _{n}^{2}={\frac {Q_{n}}{W_{n}}}\,}

और

sn2=n′n′−1σn2{\displaystyle s_{n}^{2}={\frac {n'}{n'-1}}\sigma _{n}^{2}\,}

जहां n, तत्वों की कुल संख्या है और 'n, गैर-शून्य भार वाले तत्वों की संख्या है। यदि भारों को 1 के समान मान लिया जाए तो उपरोक्त सूत्र, उपरोक्त प्रदत्त सरल सूत्रों के समान हो जाता है।

जनसंख्या आधारित सांख्यिकी[संपादित करें]

गैर-अतिव्यापी उप-जनसंख्याओं के मानक विचलनों को निम्न प्रकार से जोड़ सकते हैं यदि प्रत्येक का आकार (वास्तविक या एक-दूसरे के सापेक्ष) और मध्यमान ज्ञात हो:

μX∪Y=NXμX+NYμYNX+NY{\displaystyle \mu _{X\cup Y}={\frac {N_{X}\mu _{X}+N_{Y}\mu _{Y}}{N_{X}+N_{Y}}}\,\!}

और

σX∪Y=NX(σX2+μX2)+NY(σY2+μY2)NX+NY−μX∪Y2{\displaystyle \sigma _{X\cup Y}={\sqrt {{\frac {N_{X}(\sigma _{X}^{2}+\mu _{X}^{2})+N_{Y}(\sigma _{Y}^{2}+\mu _{Y}^{2})}{N_{X}+N_{Y}}}-\mu _{X\cup Y}^{2}}}\,\!}

जहां

X∩Y≡∅{\displaystyle X\cap Y\equiv \emptyset \,\!}

उदाहरण के लिए, मान लें कि ज्ञात है कि औसत अमेरिकी पुरुष की मध्यमान ऊंचाई 70 इंच और मानक विचलन 3 इंच है और यह भी ज्ञात है कि औसत अमेरिकी महिला की मध्यमान ऊंचाई 65 इंच और मानक विचलन 2 इंच है। अमेरिकी वयस्कों के मध्यमान और मानक विचलन की निम्न प्रकार से गणना की जा सकती है:

μAmericanHeight≈50%×70inches+50%×65inches100%=70+652inches=67.5inches{\displaystyle \mu _{AmericanHeight}\approx {\frac {50\%\times 70\,inches+50\%\times 65\,inches}{100\%}}={\frac {70+65}{2}}\,inches=67.5\,inches\,\!}σAmericanHeight≈(32+702)+(22+652)2−67.52inches=12.75inches≈3.5707inches{\displaystyle \sigma _{AmericanHeight}\approx {\sqrt {{\frac {(3^{2}+70^{2})+(2^{2}+65^{2})}{2}}-67.5^{2}}}\,inches={\sqrt {12.75}}\,inches\approx 3.5707\,inches\,\!}

XM के माध्यम से अधिक सामान्य M गैर-अतिव्यापी डाटा सेट्स X1 के लिए:

μ{X1∪⋯∪XM}=∑i=1MNXiμXi∑i=1MNXi{\displaystyle \mu _{\{X1\cup \dots \cup XM\}}={\frac {\sum _{i=1}^{M}{N_{Xi}\mu _{Xi}}}{\sum _{i=1}^{M}{N_{Xi}}}}\,\!}

और

σ{X1∪⋯∪XM}=∑i=1MNXi(σXi2+μXi2)∑i=1MNXi−μ{X1∪⋯∪XM}2{\displaystyle \sigma _{\{X1\cup \dots \cup XM\}}={\sqrt {{\frac {\sum _{i=1}^{M}{N_{Xi}(\sigma _{Xi}^{2}+\mu _{Xi}^{2})}}{\sum _{i=1}^{M}{N_{Xi}}}}-\mu _{\{X1\cup \dots \cup XM\}}^{2}}}\,\!}

जहां

Xi∩Xj≡∅{\displaystyle Xi\cap Xj\equiv \emptyset \,\!}∀i≠j{\displaystyle \forall \,\,i\neq j\,\!}

यदि दो अतिव्यापी जनसंख्याओं के आकार (वास्तविक या एक दूसरे के सापेक्ष), मध्यमान और मानक विचलन, जनसंख्याओं के साथ-साथ उनके प्रतिच्छेदन के लिए ज्ञात हों, तो सम्पूर्ण जनसंख्या के मानक विचलन की अभी भी निम्न प्रकार से गणना की जा सकती है:

μX∪Y=NXμX+NYμY−NX∩YμX∩YNX+NY−NX∩Y{\displaystyle \mu _{X\cup Y}={\frac {N_{X}\mu _{X}+N_{Y}\mu _{Y}-N_{X\cap Y}\mu _{X\cap Y}}{N_{X}+N_{Y}-N_{X\cap Y}}}\,\!}

और

σX∪Y=NX(σX2+μX2)+NY(σY2+μY2)−NX∩Y(σX∩Y2+μX∩Y2)NX+NY−NX∩Y−μX∪Y2{\displaystyle \sigma _{X\cup Y}={\sqrt {{\frac {N_{X}(\sigma _{X}^{2}+\mu _{X}^{2})+N_{Y}(\sigma _{Y}^{2}+\mu _{Y}^{2})-N_{X\cap Y}(\sigma _{X\cap Y}^{2}+\mu _{X\cap Y}^{2})}{N_{X}+N_{Y}-N_{X\cap Y}}}-\mu _{X\cup Y}^{2}}}\,\!}

गैर-अतिव्यापी उप-नमूनों के मानक विचलनों को निम्न प्रकार से जोड़ सकते हैं यदि प्रत्येक का वास्तविक आकार और मध्यमान ज्ञात हो:

μX∪Y=NXμX+NYμYNX+NY{\displaystyle \mu _{X\cup Y}={\frac {N_{X}\mu _{X}+N_{Y}\mu _{Y}}{N_{X}+N_{Y}}}\,\!}

और

σX∪Y=(NX−1)σX2+NXμX2+(NY−1)σY2+NYμY2−(NX+NY)μX∪Y2NX+NY−1{\displaystyle \sigma _{X\cup Y}={\sqrt {\frac {(N_{X}-1)\sigma _{X}^{2}+N_{X}\mu _{X}^{2}+(N_{Y}-1)\sigma _{Y}^{2}+N_{Y}\mu _{Y}^{2}-(N_{X}+N_{Y})\mu _{X\cup Y}^{2}}{N_{X}+N_{Y}-1}}}\,\!}

जहां

X∩Y≡∅{\displaystyle X\cap Y\equiv \emptyset \,\!}

XM के माध्यम से अधिक सामान्य M गैर-अतिव्यापी डाटा सेट्स X1 के लिए:

μ{X1∪⋯∪XM}=∑i=1MNXiμXi∑i=1MNXi{\displaystyle \mu _{\{X1\cup \dots \cup XM\}}={\frac {\sum _{i=1}^{M}{N_{Xi}\mu _{Xi}}}{\sum _{i=1}^{M}{N_{Xi}}}}\,\!}

और

σ{X1∪⋯∪XM}=∑i=1M((NXi−1)σXi2+NXiμXi2)−(∑i=1MNXi)μ{X1∪⋯∪XM}2∑i=1MNXi−1{\displaystyle \sigma _{\{X1\cup \dots \cup XM\}}={\sqrt {\frac {\sum _{i=1}^{M}{((N_{Xi}-1)\sigma _{Xi}^{2}+N_{Xi}\mu _{Xi}^{2})-(\sum _{i=1}^{M}{N_{Xi}})\mu _{\{X1\cup \dots \cup XM\}}^{2}}}{\sum _{i=1}^{M}{N_{Xi}-1}}}}\,\!}

जहां

Xi∩Xj≡∅{\displaystyle Xi\cap Xj\equiv \emptyset \,\!}∀i≠j{\displaystyle \forall \,\,i\neq j\,\!}

यदि दो अतिव्यापी नमूनों के आकार, मध्यमान और मानक विचलन, नमूनों के साथ-साथ उनके प्रतिच्छेदन के लिए ज्ञात हों, तो नमूनों के मानक विचलन की अभी भी गणना की जा सकती है। सामान्य तौर पर,

मानक विचलन गुणांक का सूत्र क्या होता है?

अर्थात्, मानक विचलन σ (सिग्मा), (X − μ)2 के औसत मान का वर्गमूल है।

मानक विचलन क्या है समझाइए?

मानक विचलन σ (सिग्मा), (X − μ)2 के औसत मान का वर्गमूल है। मानक विचलन, एक श्रृंखला के प्रसार या मानक से दूरी का एक माप है। 1893 में, कार्ल पियर्सन ने मानक विचलन की धारणा को गढ़ा, जो निस्संदेह शोध अध्ययन में सबसे अधिक उपयोग किया जाने वाला उपाय है। यह अपने मतलब से विचलन के वर्गों के औसत का वर्गमूल है।

7 9 11 13 व 15 का मानक विचलन क्या है?

Detailed Solution माना कि 'n' अवलोकन { x 1 , x 2 , x 3 , … , x n } हैं। अतः विकल्प (4) सही है।

माध्य विचलन की गणना कैसे की जाती है?

माध्य विचलन निकालने के लिए, सबसे पहले डेटा सेट का माध्य निकालें, फिर हर एक संख्या और माध्य का अंतर निकालें, और फिर हर एक अंतर को जोड़कर उसका माध्य निकालें।