R DataFrame में कई कॉलम प्राप्त करें

R Dataframe Mem Ka I Kolama Prapta Karem



आर में, स्तंभों की संख्या प्राप्त करना एक बुनियादी ऑपरेशन है जो डेटाफ़्रेम के साथ काम करते समय कई स्थितियों में आवश्यक होता है। डेटा को सबसेटिंग, विश्लेषण, हेरफेर, प्रकाशन और विज़ुअलाइज़ करते समय, कॉलम की गिनती जानने के लिए जानकारी का एक महत्वपूर्ण हिस्सा है। इसलिए, R निर्दिष्ट DataFrame के कुल स्तंभों को प्राप्त करने के लिए अलग-अलग दृष्टिकोण प्रदान करता है। इस लेख में, हम कुछ ऐसे दृष्टिकोणों पर चर्चा करेंगे जो हमें DataFrame के कॉलम की गिनती प्राप्त करने में मदद करते हैं।

उदाहरण 1: Ncol() फ़ंक्शन का उपयोग करना

डेटाफ्रेम के कुल कॉलम प्राप्त करने के लिए ncol() सबसे लगातार कार्य है।







df <- data.frame ('y1' = c (10, 12, 14, 19),

'वाई2' = सी (15, 22, 24, 29),
'वाई3' = सी (25, 32, 34, 39))


एन <- एनकोल (डीएफ)

बिल्ली ('----- डेटा फ़्रेम में स्तंभों की संख्या:', n)

इस उदाहरण में, हम पहले तीन स्तंभों के साथ एक 'df' डेटाफ़्रेम बनाते हैं, जिन्हें 'y1', 'y2', और 'y3' के रूप में लेबल किया जाता है, जो कि डेटा.फ्रेम () फ़ंक्शन का उपयोग करते हुए R में होता है। प्रत्येक कॉलम में तत्वों का उपयोग करके निर्दिष्ट किया जाता है c() फ़ंक्शन जो तत्वों का वेक्टर बनाता है। फिर, 'n' चर का उपयोग करते हुए, ncol () फ़ंक्शन का उपयोग 'df' डेटाफ़्रेम में कुल स्तंभों को निर्धारित करने के लिए किया जाता है। अंत में, वर्णनात्मक संदेश और 'एन' चर के साथ, प्रदान की गई बिल्ली () फ़ंक्शन परिणाम को कंसोल पर प्रिंट करती है।



अपेक्षित रूप से, पुनर्प्राप्त आउटपुट इंगित करता है कि निर्दिष्ट डेटाफ़्रेम में तीन कॉलम हैं:







उदाहरण 2: खाली डेटाफ़्रेम के कुल कॉलम की गणना करें

अगला, हम ncol() फ़ंक्शन को खाली DataFrame पर लागू करते हैं जो कुल कॉलम के मान भी प्राप्त करता है लेकिन वह मान शून्य है।

empty_df <- data.frame ()

एन <- एनकोल (खाली_डीएफ)

बिल्ली ('--- डेटा फ़्रेम में कॉलम:', एन)

इस उदाहरण में, हम बिना किसी कॉलम या पंक्तियों को निर्दिष्ट किए data.frame () को कॉल करके खाली डेटाफ़्रेम, 'खाली_डीएफ' उत्पन्न करते हैं। अगला, हम ncol() फ़ंक्शन का उपयोग करते हैं जिसका उपयोग DataFrame में कॉलम की संख्या खोजने के लिए किया जाता है। कुल कॉलम प्राप्त करने के लिए ncol () फ़ंक्शन को 'खाली_df' डेटाफ़्रेम के साथ सेट किया गया है। चूंकि 'खाली_डीएफ' डेटाफ्रेम खाली है, इसमें कोई कॉलम नहीं है। तो, ncol(empty_df) का आउटपुट 0 है। परिणाम यहां तैनात किए गए cat() फ़ंक्शन द्वारा प्रदर्शित किए जाते हैं।



आउटपुट '0' मान दिखाता है जैसा कि अपेक्षित था क्योंकि डेटाफ़्रेम खाली है।

उदाहरण 3: लंबाई() फ़ंक्शन के साथ Select_If() फ़ंक्शन का उपयोग करना

यदि हम किसी विशिष्ट प्रकार के कॉलम की संख्या को पुनः प्राप्त करना चाहते हैं, तो हमें R के लंबाई () फ़ंक्शन के संयोजन के साथ select_if () फ़ंक्शन का उपयोग करना चाहिए। इन फ़ंक्शंस का उपयोग किया जाता है जो प्रत्येक प्रकार के कॉलम की कुल संख्या प्राप्त करने के लिए संयुक्त होते हैं। . इन कार्यों का उपयोग करने के लिए कोड निम्नलिखित में लागू किया गया है:

पुस्तकालय (डीपीएलआईआर)

x1<-अक्षर[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4 <-नमूना (सी ('ग्रीष्मकालीन', 'सर्दी'), 10, प्रतिस्थापित करें = TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

लंबाई (select_if (df1, is.numeric))

इस उदाहरण में, हम पहले dplyr पैकेज को लोड करते हैं ताकि हम select_if() फ़ंक्शन और लंबाई() फ़ंक्शन तक पहुंच सकें। फिर, हम क्रमशः चार चर - 'X1', 'x2', 'x3' और 'x4' बनाते हैं। यहाँ, 'X1' में अंग्रेजी वर्णमाला के पहले 10 अपरकेस अक्षर हैं। क्रमशः पैरामीटर 2 और 5 के साथ 10 यादृच्छिक संख्याओं के दो अलग-अलग वैक्टर बनाने के लिए 'x2' और 'x3' चर rpois () फ़ंक्शन का उपयोग करके उत्पन्न होते हैं। 'X4' चर 10 तत्वों वाला एक कारक वेक्टर है जिसे वेक्टर c ('समर', 'विंटर') से यादृच्छिक रूप से नमूना लिया जाता है।

फिर, हम 'df1' DataFrame बनाने का प्रयास करते हैं जहाँ सभी चर data.frame () फ़ंक्शन में पारित किए जाते हैं। अंत में, हम dplyr पैकेज से select_if () फ़ंक्शन का उपयोग करके बनाए गए 'df1' डेटाफ़्रेम की लंबाई निर्धारित करने के लिए लंबाई () फ़ंक्शन का आह्वान करते हैं। Select_if () फ़ंक्शन 'df1' डेटाफ़्रेम से एक तर्क के रूप में कॉलम का चयन करता है और is.numeric () फ़ंक्शन केवल उन कॉलम का चयन करता है जिनमें संख्यात्मक मान होते हैं। फिर, लंबाई () फ़ंक्शन को कुल कॉलम मिलते हैं जो कि सेलेक्ट_इफ () द्वारा चुने गए हैं जो पूरे कोड का आउटपुट है।

स्तंभ की लंबाई निम्न आउटपुट में दिखाई गई है जो डेटाफ़्रेम के कुल स्तंभों को इंगित करता है:

उदाहरण 4: सैप्ली () फ़ंक्शन का उपयोग करना

इसके विपरीत, यदि हम केवल स्तंभों के लापता मानों को गिनना चाहते हैं, तो हमारे पास sapply() फ़ंक्शन है। sapply() फ़ंक्शन विशेष रूप से संचालित करने के लिए DataFrame के प्रत्येक कॉलम पर पुनरावृति करता है। sapply() फ़ंक्शन को पहले DataFrame के साथ तर्क के रूप में पास किया जाता है। फिर, उस DataFrame पर किए जाने वाले ऑपरेशन को लेता है। DataFrame कॉलम में NA मानों की गिनती प्राप्त करने के लिए sapply () फ़ंक्शन का कार्यान्वयन निम्नानुसार प्रदान किया गया है:

new_df <- data.frame (c1 = c (10, 11, NA, 13, NA),

सी 2 = सी ('एन', एनए, 'ए', 'एम', 'ई'),
सी3 = सी (एनए, 92, एनए, एनए, 95))

सैप्ली (new_df, फ़ंक्शन (x) योग (is.na (x)))

इस उदाहरण में, हम तीन कॉलम - 'c1', 'c2', और 'c3' के साथ 'new_df' डेटाफ़्रेम उत्पन्न करते हैं। पहले कॉलम, 'c1' और 'c3' में संख्यात्मक मान होते हैं जिनमें कुछ लापता मान शामिल होते हैं जिन्हें NA द्वारा दर्शाया जाता है। दूसरे कॉलम, 'c2' में कुछ लापता मानों सहित वर्ण शामिल हैं, जिन्हें NA द्वारा भी दर्शाया गया है। फिर, हम sapply () फ़ंक्शन को 'new_df' DataFrame पर लागू करते हैं और sapply () फ़ंक्शन के भीतर योग () अभिव्यक्ति का उपयोग करके प्रत्येक कॉलम में लापता मानों की संख्या की गणना करते हैं।

is.na() फ़ंक्शन वह अभिव्यक्ति है जो योग () फ़ंक्शन के लिए निर्दिष्ट है जो एक तार्किक वेक्टर देता है जो दर्शाता है कि कॉलम में प्रत्येक तत्व गायब है या नहीं। योग () फ़ंक्शन प्रत्येक कॉलम में लापता मानों की संख्या की गणना करने के लिए TRUE मान जोड़ता है।

इसलिए, आउटपुट प्रत्येक कॉलम में कुल NA मान प्रदर्शित करता है:

उदाहरण 5: मंद () फ़ंक्शन का उपयोग करना

इसके अतिरिक्त, हम DataFrame की पंक्तियों के साथ कुल कॉलम प्राप्त करना चाहते हैं। फिर, मंद () फ़ंक्शन डेटाफ़्रेम के आयाम प्रदान करता है। मंद () फ़ंक्शन ऑब्जेक्ट को एक तर्क के रूप में लेता है जिसका आयाम हम पुनर्प्राप्त करना चाहते हैं। यहाँ मंद () फ़ंक्शन का उपयोग करने के लिए कोड है:

d1 <- data.frame (टीम = c ('t1', 't2', 't3', 't4'),

अंक = सी (8, 10, 7, 4))

मंद (डी 1)

इस उदाहरण में, हम पहले 'd1' DataFrame को परिभाषित करते हैं जो data.frame () फ़ंक्शन का उपयोग करके उत्पन्न होता है जहां दो कॉलम 'टीम' और 'पॉइंट' सेट होते हैं। उसके बाद, हम 'd1' डेटाफ़्रेम पर डिम () फ़ंक्शन को लागू करते हैं। मंद () फ़ंक्शन डेटाफ़्रेम की पंक्तियों और स्तंभों की संख्या लौटाता है। इसलिए, जब हम मंद (d1) चलाते हैं, तो यह दो तत्वों के साथ एक वेक्टर लौटाता है - जिनमें से पहला 'd1' डेटाफ़्रेम में पंक्तियों की संख्या को दर्शाता है और दूसरा कॉलम की संख्या को दर्शाता है।

आउटपुट डेटाफ़्रेम के आयामों का प्रतिनिधित्व करता है जहाँ मान '4' कुल स्तंभों को इंगित करता है और मान '2' पंक्तियों का प्रतिनिधित्व करता है:

निष्कर्ष

अब हमने सीखा है कि R में कॉलम की संख्या गिनना एक सरल और महत्वपूर्ण ऑपरेशन है जिसे DataFrame पर किया जा सकता है। सभी कार्यों में, एनकोल () फ़ंक्शन सबसे सुविधाजनक तरीका है। अब, हम दिए गए DataFrame से कॉलम की संख्या प्राप्त करने के विभिन्न तरीकों से परिचित हैं।