एक टी-टेस्ट यह तय करने का एक तरीका है कि क्या छात्र के टी-वितरण का उपयोग करके डेटासेट के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर हैं। एक्सेल में टी-टेस्ट दो नमूनों के साधनों की तुलना करने वाला दो-नमूना टी-परीक्षण है। यह आलेख बताता है कि सांख्यिकीय महत्व का क्या अर्थ है और एक्सेल में टी-टेस्ट कैसे करना है।
इस लेख में दिए गए निर्देश एक्सेल 2019, 2016, 2013, 2010, 2007 पर लागू होते हैं; माइक्रोसॉफ्ट 365 के लिए एक्सेल और एक्सेल ऑनलाइन।
सांख्यिकीय महत्व क्या है?
कल्पना कीजिए कि आप जानना चाहते हैं कि दो में से कौन सा पासा बेहतर अंक देगा। आप पहले पासे को रोल करते हैं और 2 प्राप्त करते हैं; आप दूसरा पासा रोल करते हैं और 6 प्राप्त करते हैं।क्या यह आपको बताता है कि दूसरा पासा आमतौर पर उच्च अंक देता है? यदि आपने उत्तर दिया, "बिल्कुल नहीं," तो आप पहले से ही सांख्यिकीय महत्व की कुछ समझ रखते हैं। आप समझते हैं कि अंतर स्कोर में यादृच्छिक परिवर्तन के कारण था, हर बार एक पासा लुढ़काया जाता है। क्योंकि नमूना बहुत छोटा था (केवल एक रोल) यह कुछ भी महत्वपूर्ण नहीं दिखा।
अब कल्पना कीजिए कि आप प्रत्येक पासे को 6 बार रोल करते हैं:
- पहला पासा 3, 6, 6, 4, 3, 3; माध्य=4.17
- दूसरा पासा 5, 6, 2, 5, 2, 4; माध्य=4.00
क्या अब यह साबित होता है कि पहला पासा दूसरे की तुलना में अधिक अंक देता है? शायद ऩही। साधनों के बीच अपेक्षाकृत छोटे अंतर के साथ एक छोटा सा नमूना यह संभावना बनाता है कि अंतर अभी भी यादृच्छिक भिन्नताओं के कारण है। जैसे-जैसे हम पासा रोल की संख्या बढ़ाते हैं, प्रश्न का सामान्य ज्ञान देना मुश्किल हो जाता है - क्या अंकों के बीच का अंतर यादृच्छिक भिन्नता का परिणाम है या क्या वास्तव में दूसरे की तुलना में अधिक अंक देने की संभावना है?
महत्व इस बात की प्रायिकता है कि नमूनों के बीच देखा गया अंतर यादृच्छिक भिन्नताओं के कारण है। महत्व को अक्सर अल्फा स्तर या केवल 'α' कहा जाता है। आत्मविश्वास का स्तर, या बस 'सी', यह संभावना है कि नमूनों के बीच का अंतर यादृच्छिक भिन्नता के कारण नहीं है; दूसरे शब्दों में, अंतर्निहित आबादी के बीच अंतर है। इसलिए: सी=1 - α
हम किसी भी स्तर पर 'α' सेट कर सकते हैं, यह विश्वास करने के लिए कि हमने महत्व साबित कर दिया है। बहुत बार α=5% का उपयोग किया जाता है (95% आत्मविश्वास), लेकिन अगर हम वास्तव में यह सुनिश्चित करना चाहते हैं कि कोई अंतर यादृच्छिक भिन्नता के कारण नहीं है, तो हम α=1% या यहां तक कि α=0.1 का उपयोग करके एक उच्च आत्मविश्वास स्तर लागू कर सकते हैं। %.
विभिन्न स्थितियों में महत्व की गणना के लिए विभिन्न सांख्यिकीय परीक्षणों का उपयोग किया जाता है। टी-परीक्षणों का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो आबादी के साधन भिन्न हैं और एफ-परीक्षणों का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या भिन्नताएं भिन्न हैं।
सांख्यिकीय महत्व के लिए परीक्षण क्यों?
विभिन्न चीजों की तुलना करते समय, हमें यह निर्धारित करने के लिए महत्व परीक्षण का उपयोग करने की आवश्यकता है कि क्या एक दूसरे से बेहतर है। यह कई क्षेत्रों पर लागू होता है, उदाहरण के लिए:
- व्यवसाय में, लोगों को विभिन्न उत्पादों और मार्केटिंग विधियों की तुलना करने की आवश्यकता होती है।
- खेल में, लोगों को विभिन्न उपकरणों, तकनीकों और प्रतिस्पर्धियों की तुलना करने की आवश्यकता होती है।
- इंजीनियरिंग में, लोगों को विभिन्न डिज़ाइन और पैरामीटर सेटिंग्स की तुलना करने की आवश्यकता होती है।
यदि आप यह जांचना चाहते हैं कि कोई चीज़ किसी अन्य क्षेत्र में बेहतर प्रदर्शन करती है या नहीं, तो आपको सांख्यिकीय महत्व के लिए परीक्षण करने की आवश्यकता है।
छात्र का टी-वितरण क्या है?
एक छात्र का टी-वितरण सामान्य (या गाऊसी) वितरण के समान है। ये दोनों घंटी के आकार के वितरण हैं जिनमें अधिकांश परिणाम माध्य के करीब हैं, लेकिन कुछ दुर्लभ घटनाएं दोनों दिशाओं में माध्य से काफी दूर हैं, जिन्हें वितरण की पूंछ कहा जाता है।
छात्र के टी-वितरण का सटीक आकार नमूना आकार पर निर्भर करता है। 30 से अधिक के नमूनों के लिए यह सामान्य वितरण के समान है। जैसे-जैसे नमूना का आकार कम होता जाता है, टेल्स बड़ी होती जाती हैं, जो एक छोटे नमूने के आधार पर अनुमान लगाने से आने वाली बढ़ी हुई अनिश्चितता का प्रतिनिधित्व करती है।
एक्सेल में टी-टेस्ट कैसे करें
इससे पहले कि आप यह निर्धारित करने के लिए टी-टेस्ट लागू कर सकें कि क्या दो नमूनों के साधनों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है, आपको पहले एक एफ-टेस्ट करना होगा। ऐसा इसलिए है क्योंकि टी-टेस्ट के लिए अलग-अलग गणनाएं की जाती हैं, जो इस बात पर निर्भर करती है कि वेरिएंस के बीच महत्वपूर्ण अंतर है या नहीं।
आपको इस विश्लेषण को करने के लिए विश्लेषण टूलपैक ऐड-इन सक्षम करने की आवश्यकता होगी।
विश्लेषण टूलपैक ऐड-इन की जांच करना और लोड करना
विश्लेषण टूलपैक को जांचने और सक्रिय करने के लिए इन चरणों का पालन करें:
- फ़ाइल टैब चुनें > विकल्प चुनें।
- विकल्प संवाद बॉक्स में, बाईं ओर स्थित टैब से ऐड-इन चुनें।
-
विंडो के निचले भाग में, मैनेज ड्रॉप-डाउन मेनू का चयन करें, फिर एक्सेल ऐड-इन्स चुनें। चुनें जाओ।
-
सुनिश्चित करें कि विश्लेषण टूलपैक के बगल में स्थित चेक-बॉक्स चेक किया गया है, फिर ठीक चुनें।
- विश्लेषण टूलपैक अब सक्रिय है और आप एफ-टेस्ट और टी-टेस्ट लागू करने के लिए तैयार हैं।
एक्सेल में एफ-टेस्ट और टी-टेस्ट करना
-
स्प्रेडशीट में दो डेटासेट दर्ज करें। इस मामले में, हम एक सप्ताह के दौरान दो उत्पादों की बिक्री पर विचार कर रहे हैं। प्रत्येक उत्पाद के लिए औसत दैनिक बिक्री मूल्य की गणना उसके मानक विचलन के साथ की जाती है।
-
डेटा टैब चुनें > डेटा विश्लेषण
-
सूची से F-टेस्ट टू-सैंपल फॉर वेरिएंस चुनें, फिर OK चुनें।
एफ-टेस्ट गैर-सामान्यता के प्रति अत्यधिक संवेदनशील है। इसलिए वेल्च परीक्षण का उपयोग करना सुरक्षित हो सकता है, लेकिन एक्सेल में यह अधिक कठिन है।
-
चर 1 रेंज और वेरिएबल 2 रेंज का चयन करें; अल्फा सेट करें (0.05 95% आत्मविश्वास देता है); आउटपुट के ऊपरी बाएँ कोने के लिए एक सेल का चयन करें, यह देखते हुए कि यह 3 कॉलम और 10 पंक्तियों को भर देगा। ठीक चुनें।
चर 1 रेंज के लिए, सबसे बड़े मानक विचलन (या विचरण) वाले नमूने का चयन किया जाना चाहिए।
-
प्रसरणों के बीच महत्वपूर्ण अंतर है या नहीं यह निर्धारित करने के लिए एफ-टेस्ट परिणाम देखें। परिणाम तीन महत्वपूर्ण मान देते हैं:
- F: भिन्नताओं के बीच का अनुपात।
- P(F<=f) one-tail: प्रायिकता कि वेरिएबल 1 का वास्तव में वेरिएबल 2 से बड़ा विचरण नहीं है। यदि यह अल्फा से बड़ा है, जो आम तौर पर 0.05 है, तो भिन्नताओं के बीच कोई महत्वपूर्ण अंतर नहीं है।
- F क्रिटिकल वन-टेल: F का मान जो P(F<=f)=α देने के लिए आवश्यक होगा। यदि यह मान F से अधिक है, तो यह भी इंगित करता है कि भिन्नताओं के बीच कोई महत्वपूर्ण अंतर नहीं है।
P(F<=f) को F के साथ FDIST फ़ंक्शन का उपयोग करके और इसके इनपुट के रूप में प्रत्येक नमूने के लिए स्वतंत्रता की डिग्री का उपयोग करके भी गणना की जा सकती है। स्वतंत्रता की डिग्री केवल एक नमूना शून्य से एक में टिप्पणियों की संख्या है।
-
अब जब आप जानते हैं कि भिन्नताओं के बीच कोई अंतर है या नहीं, तो आप उपयुक्त टी-टेस्ट का चयन कर सकते हैं। डेटा टैब > डेटा विश्लेषण चुनें, फिर या तो चुनें टी-टेस्ट: दो-नमूना समान भिन्नताओं को मानते हुए या टी-टेस्ट: दो-नमूना असमान विचरण मानते हुए
-
चाहे आपने पिछले चरण में जो भी विकल्प चुना हो, विश्लेषण का विवरण दर्ज करने के लिए आपको उसी संवाद बॉक्स के साथ प्रस्तुत किया जाएगा। शुरू करने के लिए, वैरिएबल 1 रेंज और वेरिएबल 2 रेंज के लिए नमूनों वाली श्रेणियों का चयन करें।
- यह मानते हुए कि आप साधनों के बीच कोई अंतर नहीं होने के लिए परीक्षण करना चाहते हैं, परिकल्पित माध्य अंतर को शून्य पर सेट करें।
- महत्व स्तर अल्फा सेट करें (0.05 95% आत्मविश्वास देता है), और आउटपुट के ऊपरी बाएं कोने के लिए एक सेल का चयन करें, यह देखते हुए कि यह 3 कॉलम और 14 पंक्तियों को भरेगा। ठीक चुनें।
-
साधनों में कोई महत्वपूर्ण अंतर है या नहीं यह तय करने के लिए परिणामों की समीक्षा करें।
F-टेस्ट की तरह ही, यदि p-मान, इस स्थिति में P(T<=t), अल्फा से अधिक है, तो कोई महत्वपूर्ण अंतर नहीं है। हालांकि, इस मामले में दो पी-मान दिए गए हैं, एक एक-पूंछ परीक्षण के लिए और दूसरा दो-पूंछ परीक्षण के लिए। इस मामले में, दो-पूंछ वाले मान का उपयोग करें क्योंकि या तो अधिक माध्य वाले चर का एक महत्वपूर्ण अंतर होगा।