आर में नमूना () फ़ंक्शन

Ara Mem Namuna Fanksana



R में, हम नमूना () फ़ंक्शन का उपयोग करके वेक्टर या सूची से बेतरतीब ढंग से नमूना मान प्राप्त करते हैं। यह हमें यादृच्छिक रूप से डेटा का एक सबसेट चुनने में सक्षम बनाता है जो कई सांख्यिकीय अनुप्रयोगों में उपयोगी होता है। यदि इनपुट नमूना () फ़ंक्शन में एक सूची है, तो आउटपुट भी तत्वों की समान संख्या के साथ एक सूची होगी, लेकिन चयनित तत्वों के साथ। यह आलेख आर के नमूना () फ़ंक्शन को कार्यान्वयन के साथ प्रदर्शित करता है जो विभिन्न तर्कों को सेट करता है।

उदाहरण 1: डेटा तर्क के साथ नमूना () फ़ंक्शन का उपयोग करना

R का नमूना () फ़ंक्शन नमूना डेटा के साथ बेतरतीब ढंग से एक संख्या उत्पन्न करने के लिए प्रदान किया जाना चाहिए। नमूना डेटा नमूना () फ़ंक्शन का आवश्यक तर्क है जिसका कोड निम्नलिखित में दिया गया है:

dataX < - सी ( 10 , बीस , 30 , 40 , पचास , 60 , 70 , 80 , 90 , 100 )

नमूना ( dataX , 3 )

नमूना ( dataX , 3 )

यहां, हम पहले 'डेटाएक्स' चर के भीतर पूर्णांक तत्वों के वैक्टर उत्पन्न करते हैं। अगला, हम कोड में दो बार नमूना () फ़ंक्शन को कॉल करते हैं और 'डेटाएक्स' वेक्टर पास करते हैं जिसे हमने पहले तर्क के रूप में उत्पन्न किया था। नमूने का पहला उपयोग (डेटाएक्स, 3) 'डेटाएक्स' वेक्टर से तीन तत्वों का एक यादृच्छिक नमूना लेता है। परिणाम 'डेटाएक्स' से तीन तत्वों का एक यादृच्छिक क्रमचय है। उसके बाद, हम नमूना (ए, 5) का फिर से उपयोग करते हैं जो 'डेटाएक्स' वेक्टर से तीन तत्वों का एक और स्वतंत्र यादृच्छिक नमूना लेता है। इस बार का नतीजा पिछली बार से बिल्कुल अलग है.







नमूना () फ़ंक्शन को दो बार कॉल करने पर आउटपुट विभिन्न तत्वों को दिखाता है। ध्यान दें कि हर बार जब हम नमूना बेतरतीब ढंग से बनाते हैं, तो वैक्टर से विभिन्न तत्व प्राप्त होते हैं:





उदाहरण 2: प्रतिस्थापित तर्क के साथ नमूना () फ़ंक्शन का उपयोग करना

इसके अलावा, हमारे पास नमूना () फ़ंक्शन का 'प्रतिस्थापन' तर्क है जो तार्किक मान लेता है। एक समान तत्व को एक से अधिक बार चुना जा सकता है यदि तत्व को प्रतिस्थापन विकल्प TRUE के साथ नमूना किया गया हो। हालाँकि, यदि मान FALSE पर सेट है, तो प्रत्येक तत्व का केवल एक ही चयन हो सकता है, जिसके कारण तत्वों को बिना प्रतिस्थापन के नमूना लिया जा सकता है।





random_numbers = सी ( ग्यारह , 25 , 12 , 89 , चार पांच , 16 , 67 , 38 , 96 , 55 , 73 )

नमूना ( random_numbers , 4 , बदलना = सत्य )

नमूना ( random_numbers , 5 , बदलना = सत्य )

यहां, हम पहले 'random_numbers' वेरिएबल में कुछ संख्यात्मक मानों के साथ वेक्टर को परिभाषित करते हैं। उसके बाद, हम नमूना () फ़ंक्शन का आह्वान करते हैं जहां 'यादृच्छिक_नंबर' तर्क के रूप में पारित किया जाता है। '4' का मान नमूना () फ़ंक्शन के लिए निर्दिष्ट है जो इंगित करता है कि यह केवल 'यादृच्छिक_संख्या' में वैक्टर से चार यादृच्छिक मानों का चयन करता है।

इसके बाद, नमूना () फ़ंक्शन में प्रतिस्थापित = TRUE निर्दिष्ट करता है कि प्रत्येक मान को एक से अधिक बार चुना जा सकता है। फिर, हम नमूना () फ़ंक्शन को फिर से तैनात करते हैं, जो इस बार वैक्टर से '5' यादृच्छिक मान का चयन करता है। इसी तरह, हम प्रत्येक मूल्य के लिए कई चयन विकल्पों के लिए पहले की तरह 'TRUE' के साथ बदलें तर्क सेट करते हैं।



जैसा कि हम देख सकते हैं, पहला आउटपुट 'random_numbers' वेक्टर से 4 बेतरतीब ढंग से चुने गए तत्वों के वेक्टर को प्रदर्शित करता है। हालाँकि, अगला आउटपुट '5' का एक वेक्टर यादृच्छिक रूप से चयनित तत्वों को प्रदर्शित करता है:

उदाहरण 3: आकार तर्क के साथ नमूना () फ़ंक्शन का उपयोग करना

अगला तर्क जो नमूना () फ़ंक्शन पास करता है वह 'आकार' है। 'आकार' एक वैकल्पिक पैरामीटर है जो तैयार किए जाने वाले नमूनों के मूल्य को इंगित करता है। नमूना () फ़ंक्शन का कोड 'आकार' पैरामीटर के साथ निम्नलिखित में दिया गया है:

वैक्टर < - 1 : 10

नमूना ( वैक्टर , आकार = 5 )

यहां, एक संख्यात्मक वेक्टर को 'वैक्टर' चर में 1 से 10 तक पूर्णांकों के अनुक्रम के रूप में परिभाषित किया गया है। नमूना () फ़ंक्शन तब वेक्टर से यादृच्छिक तत्वों के चयन के लिए नियोजित किया जाता है। जैसा कि हम देख सकते हैं, नमूना () फ़ंक्शन दो तर्क लेता है। पहला तर्क वे वैक्टर हैं जिनसे हमें नमूना मिलता है। अगला तर्क आकार है जो '5' के मान के साथ निर्दिष्ट है जो इंगित करता है कि वेक्टर से चुनने के लिए केवल पांच तत्व हैं।

इसलिए, चयनित तत्वों को निम्न आउटपुट में एक नए वेक्टर के रूप में एक यादृच्छिक क्रम में लौटाया जाता है:

उदाहरण 4: R सूची के लिए नमूना () फ़ंक्शन का उपयोग करना

इसके अलावा, आर में सूची के लिए नमूना () फ़ंक्शन का उपयोग किया जा सकता है। उदाहरण के इस खंड को सूची से यादृच्छिक मान मिलते हैं।

सूची < - सूची ( 1 : 4 ,

913 ,

सी ( 'एक्स' , 'YYY' , 'अच्छा' ) ,

'ZZZ' ,

5 )

परिणाम < - आर_सूची [ नमूना ( 1 :लंबाई ( सूची ) , आकार = 4 ) ]

परिणाम

यहां, 'R_list' की सूची को विभिन्न प्रकार के तत्वों के साथ परिभाषित किया गया है जिसमें न्यूमेरिक्स का एक वेक्टर, एक नंबर, एक कैरेक्टर वेक्टर, एक स्ट्रिंग और एक अन्य नंबर शामिल है। उसके बाद, हम एक 'परिणाम' चर बनाते हैं जहां नमूना () फ़ंक्शन लागू होता है।

नमूना () फ़ंक्शन के अंदर, हम '1: लंबाई (R_list)' अभिव्यक्ति सेट करते हैं जो सूचकांक के वैक्टर को नमूना के माध्यम से इंगित करता है। अगला, हमारे पास नमूने के लिए तत्वों की संख्या निर्दिष्ट करने के लिए एक 'आकार' तर्क है जो '4' है। इसलिए, 'R_list' 'R_list' की सूची से तीन यादृच्छिक रूप से चयनित तत्व उत्पन्न करती है। चूंकि 'R_list' की सूची में तत्व विभिन्न प्रकार के होते हैं, परिणामी तत्व 'परिणाम' में भी विभिन्न प्रकार के हो सकते हैं।

आउटपुट नई सूची का प्रतिनिधित्व करता है जिसमें मूल सूची का एक यादृच्छिक सबसेट होता है:

उदाहरण 5: समस्या तर्क के साथ नमूना () फ़ंक्शन का उपयोग करना

इसके अतिरिक्त, हमारे पास नमूना () फ़ंक्शन का 'प्रोब' पैरामीटर है। 'समस्या' तर्क सदिश में चयनित तत्व की संभावना देता है। ध्यान दें कि 'समस्या' तर्क का उपयोग नहीं किए जाने पर सभी तत्वों को समान संभावना माना जाता है।

मेरी जानकारी = सी ( 31 , 99 , 5 , 24 , 72 )

नमूना ( मेरी जानकारी , आकार = 10 , बदलना = सत्य ,

समस्या = सी ( 0.5 , निरसित ( 0.1 , 4 ) ) )

यहाँ, संख्यात्मक वैक्टर के तत्वों को 'my_data' कहा जाता है। अगले चरण में, हम नमूना () फ़ंक्शन को कॉल करते हैं जहां 'my_data' यादृच्छिक रूप से चयनित 10 तत्वों को पास किया जाता है। फिर, 'आकार' तर्क परिभाषित किया गया है जो निर्दिष्ट करता है कि यादृच्छिक रूप से चयन करने वाला मान '10' आकार का होना चाहिए। उसके बाद, हम 'TRUE' को 'प्रतिस्थापन' तर्क के लिए असाइन करते हैं जिसका अर्थ है कि प्रत्येक चयनित तत्व को अगले एक को चुनने से पहले वेक्टर में बदल दिया जाता है। नमूना () फ़ंक्शन में परिभाषित तीसरा तर्क 'prob' है जो चयनित होने के लिए 'my_data' वेक्टर में प्रत्येक तत्व की संभावना को परिभाषित करता है। पहले तत्व की संभावना '0.5' पर सेट है। शेष चार वेक्टर तत्वों के लिए प्रायिकता '0.1' है।

अपेक्षित रूप से वैक्टर में पहले तत्व की उच्चतम संभावना के साथ निम्न आउटपुट प्राप्त किया गया है:

उदाहरण 6: बारप्लॉट को रेंडर करने के लिए सैंपल () फ़ंक्शन का उपयोग करना

अंत में, नमूना () फ़ंक्शन का उपयोग आर में बारप्लॉट बनाने के लिए किया जाता है ताकि किसी संभाव्यता वितरण के साथ श्रेणीबद्ध चर के वितरण की कल्पना की जा सके।

नमूना डेटा = सी ( 1 , 2 , 3 )

barplot ( मेज ( नमूना ( नमूना डेटा , आकार = 500 , बदलना = सत्य , समस्या = सी ( .30 , .60 , .10 ) ) ) )

यहां, एक पूर्णांक मान के वेक्टर के साथ 'sample_data' को परिभाषित करने के बाद, हम नमूना () फ़ंक्शन को तैनात करके बारप्लॉट उत्पन्न करते हैं। सबसे पहले, हम बारप्लॉट को कॉल करते हैं जो परिणामी नमूने की आवृत्ति तालिका बनाने के लिए तालिका () फ़ंक्शन को आमंत्रित करता है। फिर, हम तालिका () फ़ंक्शन के भीतर नमूना () फ़ंक्शन निर्दिष्ट करते हैं, जहां आकार 1000 का एक यादृच्छिक नमूना पूर्णांक 1 से 3 के वेक्टर से खींचा जाता है। फिर, 'प्रोब' तर्क का उपयोग प्रत्येक पूर्णांक का चयन करने की संभावना को निर्दिष्ट करने के लिए किया जाता है। .

जैसा कि हम अब देख सकते हैं, बारप्लॉट तीन बार के साथ निम्नलिखित में प्रस्तुत किया गया है, प्रत्येक पूर्णांक के लिए एक, और बार की ऊंचाई नमूने में होने वाले पूर्णांक के लिए प्रासंगिक है:

निष्कर्ष

हमने देखा है कि नमूना () फ़ंक्शन विभिन्न उदाहरणों के साथ कैसे काम करता है। नमूना () फ़ंक्शन का उपयोग विभिन्न तर्कों के साथ किया जाता है जहां नमूना डेटा की आवश्यकता होती है और अन्य सभी तर्क वैकल्पिक होते हैं और विशिष्ट मामलों पर बुलाए जाते हैं। हालाँकि, नमूना () फ़ंक्शन सांख्यिकीय विश्लेषण में या बड़े डेटासेट के साथ काम करते समय उपयोगी होता है।