आर में, स्तंभों की संख्या प्राप्त करना एक बुनियादी ऑपरेशन है जो डेटाफ़्रेम के साथ काम करते समय कई स्थितियों में आवश्यक होता है। डेटा को सबसेटिंग, विश्लेषण, हेरफेर, प्रकाशन और विज़ुअलाइज़ करते समय, कॉलम की गिनती जानने के लिए जानकारी का एक महत्वपूर्ण हिस्सा है। इसलिए, R निर्दिष्ट DataFrame के कुल स्तंभों को प्राप्त करने के लिए अलग-अलग दृष्टिकोण प्रदान करता है। इस लेख में, हम कुछ ऐसे दृष्टिकोणों पर चर्चा करेंगे जो हमें DataFrame के कॉलम की गिनती प्राप्त करने में मदद करते हैं।
उदाहरण 1: Ncol() फ़ंक्शन का उपयोग करना
डेटाफ्रेम के कुल कॉलम प्राप्त करने के लिए ncol() सबसे लगातार कार्य है।
df <- data.frame ('y1' = c (10, 12, 14, 19),
'वाई2' = सी (15, 22, 24, 29),
'वाई3' = सी (25, 32, 34, 39))
एन <- एनकोल (डीएफ)
बिल्ली ('----- डेटा फ़्रेम में स्तंभों की संख्या:', n)
इस उदाहरण में, हम पहले तीन स्तंभों के साथ एक 'df' डेटाफ़्रेम बनाते हैं, जिन्हें 'y1', 'y2', और 'y3' के रूप में लेबल किया जाता है, जो कि डेटा.फ्रेम () फ़ंक्शन का उपयोग करते हुए R में होता है। प्रत्येक कॉलम में तत्वों का उपयोग करके निर्दिष्ट किया जाता है c() फ़ंक्शन जो तत्वों का वेक्टर बनाता है। फिर, 'n' चर का उपयोग करते हुए, ncol () फ़ंक्शन का उपयोग 'df' डेटाफ़्रेम में कुल स्तंभों को निर्धारित करने के लिए किया जाता है। अंत में, वर्णनात्मक संदेश और 'एन' चर के साथ, प्रदान की गई बिल्ली () फ़ंक्शन परिणाम को कंसोल पर प्रिंट करती है।
अपेक्षित रूप से, पुनर्प्राप्त आउटपुट इंगित करता है कि निर्दिष्ट डेटाफ़्रेम में तीन कॉलम हैं:
उदाहरण 2: खाली डेटाफ़्रेम के कुल कॉलम की गणना करें
अगला, हम ncol() फ़ंक्शन को खाली DataFrame पर लागू करते हैं जो कुल कॉलम के मान भी प्राप्त करता है लेकिन वह मान शून्य है।
empty_df <- data.frame ()एन <- एनकोल (खाली_डीएफ)
बिल्ली ('--- डेटा फ़्रेम में कॉलम:', एन)
इस उदाहरण में, हम बिना किसी कॉलम या पंक्तियों को निर्दिष्ट किए data.frame () को कॉल करके खाली डेटाफ़्रेम, 'खाली_डीएफ' उत्पन्न करते हैं। अगला, हम ncol() फ़ंक्शन का उपयोग करते हैं जिसका उपयोग DataFrame में कॉलम की संख्या खोजने के लिए किया जाता है। कुल कॉलम प्राप्त करने के लिए ncol () फ़ंक्शन को 'खाली_df' डेटाफ़्रेम के साथ सेट किया गया है। चूंकि 'खाली_डीएफ' डेटाफ्रेम खाली है, इसमें कोई कॉलम नहीं है। तो, ncol(empty_df) का आउटपुट 0 है। परिणाम यहां तैनात किए गए cat() फ़ंक्शन द्वारा प्रदर्शित किए जाते हैं।
आउटपुट '0' मान दिखाता है जैसा कि अपेक्षित था क्योंकि डेटाफ़्रेम खाली है।
उदाहरण 3: लंबाई() फ़ंक्शन के साथ Select_If() फ़ंक्शन का उपयोग करना
यदि हम किसी विशिष्ट प्रकार के कॉलम की संख्या को पुनः प्राप्त करना चाहते हैं, तो हमें R के लंबाई () फ़ंक्शन के संयोजन के साथ select_if () फ़ंक्शन का उपयोग करना चाहिए। इन फ़ंक्शंस का उपयोग किया जाता है जो प्रत्येक प्रकार के कॉलम की कुल संख्या प्राप्त करने के लिए संयुक्त होते हैं। . इन कार्यों का उपयोग करने के लिए कोड निम्नलिखित में लागू किया गया है:
पुस्तकालय (डीपीएलआईआर)x1<-अक्षर[1:10]
x2<-rpois(10,2)
x3<-rpois(10,5)
x4 <-नमूना (सी ('ग्रीष्मकालीन', 'सर्दी'), 10, प्रतिस्थापित करें = TRUE)
df1<-data.frame(x1,x2,x3,x4)
df1
लंबाई (select_if (df1, is.numeric))
इस उदाहरण में, हम पहले dplyr पैकेज को लोड करते हैं ताकि हम select_if() फ़ंक्शन और लंबाई() फ़ंक्शन तक पहुंच सकें। फिर, हम क्रमशः चार चर - 'X1', 'x2', 'x3' और 'x4' बनाते हैं। यहाँ, 'X1' में अंग्रेजी वर्णमाला के पहले 10 अपरकेस अक्षर हैं। क्रमशः पैरामीटर 2 और 5 के साथ 10 यादृच्छिक संख्याओं के दो अलग-अलग वैक्टर बनाने के लिए 'x2' और 'x3' चर rpois () फ़ंक्शन का उपयोग करके उत्पन्न होते हैं। 'X4' चर 10 तत्वों वाला एक कारक वेक्टर है जिसे वेक्टर c ('समर', 'विंटर') से यादृच्छिक रूप से नमूना लिया जाता है।
फिर, हम 'df1' DataFrame बनाने का प्रयास करते हैं जहाँ सभी चर data.frame () फ़ंक्शन में पारित किए जाते हैं। अंत में, हम dplyr पैकेज से select_if () फ़ंक्शन का उपयोग करके बनाए गए 'df1' डेटाफ़्रेम की लंबाई निर्धारित करने के लिए लंबाई () फ़ंक्शन का आह्वान करते हैं। Select_if () फ़ंक्शन 'df1' डेटाफ़्रेम से एक तर्क के रूप में कॉलम का चयन करता है और is.numeric () फ़ंक्शन केवल उन कॉलम का चयन करता है जिनमें संख्यात्मक मान होते हैं। फिर, लंबाई () फ़ंक्शन को कुल कॉलम मिलते हैं जो कि सेलेक्ट_इफ () द्वारा चुने गए हैं जो पूरे कोड का आउटपुट है।
स्तंभ की लंबाई निम्न आउटपुट में दिखाई गई है जो डेटाफ़्रेम के कुल स्तंभों को इंगित करता है:
उदाहरण 4: सैप्ली () फ़ंक्शन का उपयोग करना
इसके विपरीत, यदि हम केवल स्तंभों के लापता मानों को गिनना चाहते हैं, तो हमारे पास sapply() फ़ंक्शन है। sapply() फ़ंक्शन विशेष रूप से संचालित करने के लिए DataFrame के प्रत्येक कॉलम पर पुनरावृति करता है। sapply() फ़ंक्शन को पहले DataFrame के साथ तर्क के रूप में पास किया जाता है। फिर, उस DataFrame पर किए जाने वाले ऑपरेशन को लेता है। DataFrame कॉलम में NA मानों की गिनती प्राप्त करने के लिए sapply () फ़ंक्शन का कार्यान्वयन निम्नानुसार प्रदान किया गया है:
new_df <- data.frame (c1 = c (10, 11, NA, 13, NA),सी 2 = सी ('एन', एनए, 'ए', 'एम', 'ई'),
सी3 = सी (एनए, 92, एनए, एनए, 95))
सैप्ली (new_df, फ़ंक्शन (x) योग (is.na (x)))
इस उदाहरण में, हम तीन कॉलम - 'c1', 'c2', और 'c3' के साथ 'new_df' डेटाफ़्रेम उत्पन्न करते हैं। पहले कॉलम, 'c1' और 'c3' में संख्यात्मक मान होते हैं जिनमें कुछ लापता मान शामिल होते हैं जिन्हें NA द्वारा दर्शाया जाता है। दूसरे कॉलम, 'c2' में कुछ लापता मानों सहित वर्ण शामिल हैं, जिन्हें NA द्वारा भी दर्शाया गया है। फिर, हम sapply () फ़ंक्शन को 'new_df' DataFrame पर लागू करते हैं और sapply () फ़ंक्शन के भीतर योग () अभिव्यक्ति का उपयोग करके प्रत्येक कॉलम में लापता मानों की संख्या की गणना करते हैं।
is.na() फ़ंक्शन वह अभिव्यक्ति है जो योग () फ़ंक्शन के लिए निर्दिष्ट है जो एक तार्किक वेक्टर देता है जो दर्शाता है कि कॉलम में प्रत्येक तत्व गायब है या नहीं। योग () फ़ंक्शन प्रत्येक कॉलम में लापता मानों की संख्या की गणना करने के लिए TRUE मान जोड़ता है।
इसलिए, आउटपुट प्रत्येक कॉलम में कुल NA मान प्रदर्शित करता है:
उदाहरण 5: मंद () फ़ंक्शन का उपयोग करना
इसके अतिरिक्त, हम DataFrame की पंक्तियों के साथ कुल कॉलम प्राप्त करना चाहते हैं। फिर, मंद () फ़ंक्शन डेटाफ़्रेम के आयाम प्रदान करता है। मंद () फ़ंक्शन ऑब्जेक्ट को एक तर्क के रूप में लेता है जिसका आयाम हम पुनर्प्राप्त करना चाहते हैं। यहाँ मंद () फ़ंक्शन का उपयोग करने के लिए कोड है:
d1 <- data.frame (टीम = c ('t1', 't2', 't3', 't4'),अंक = सी (8, 10, 7, 4))
मंद (डी 1)
इस उदाहरण में, हम पहले 'd1' DataFrame को परिभाषित करते हैं जो data.frame () फ़ंक्शन का उपयोग करके उत्पन्न होता है जहां दो कॉलम 'टीम' और 'पॉइंट' सेट होते हैं। उसके बाद, हम 'd1' डेटाफ़्रेम पर डिम () फ़ंक्शन को लागू करते हैं। मंद () फ़ंक्शन डेटाफ़्रेम की पंक्तियों और स्तंभों की संख्या लौटाता है। इसलिए, जब हम मंद (d1) चलाते हैं, तो यह दो तत्वों के साथ एक वेक्टर लौटाता है - जिनमें से पहला 'd1' डेटाफ़्रेम में पंक्तियों की संख्या को दर्शाता है और दूसरा कॉलम की संख्या को दर्शाता है।
आउटपुट डेटाफ़्रेम के आयामों का प्रतिनिधित्व करता है जहाँ मान '4' कुल स्तंभों को इंगित करता है और मान '2' पंक्तियों का प्रतिनिधित्व करता है:
निष्कर्ष
अब हमने सीखा है कि R में कॉलम की संख्या गिनना एक सरल और महत्वपूर्ण ऑपरेशन है जिसे DataFrame पर किया जा सकता है। सभी कार्यों में, एनकोल () फ़ंक्शन सबसे सुविधाजनक तरीका है। अब, हम दिए गए DataFrame से कॉलम की संख्या प्राप्त करने के विभिन्न तरीकों से परिचित हैं।