डेटाफ़्रेम को R में सॉर्ट करें

Detafrema Ko R Mem Sorta Karem



R में DataFrames को सॉर्ट करना डेटा विश्लेषण और हेरफेर में एक महत्वपूर्ण ऑपरेशन है। गौरतलब है कि आर कई कॉलम के आधार पर डेटा को सॉर्ट करने और आरोही या अवरोही क्रम में सॉर्ट करने में काफी लचीलापन प्रदान करता है। R में, DataFrames को सॉर्ट करने के लिए विभिन्न तरीकों और कार्यों का उपयोग किया जा सकता है। इस लेख में, हम विभिन्न कार्यों से गुजरेंगे जो किसी भी निर्दिष्ट क्रम में डेटाफ़्रेम को सॉर्ट करने में हमारी सहायता करते हैं।

उदाहरण 1: R में ऑर्डर () विधि का उपयोग करके डेटाफ़्रेम को सॉर्ट करना

R में ऑर्डर () फ़ंक्शन का उपयोग DataFrames को एक या एक से अधिक कॉलम द्वारा सॉर्ट करने के लिए किया जाता है। ऑर्डर फ़ंक्शन डेटाफ़्रेम की पंक्तियों को पुनर्व्यवस्थित करने के लिए क्रमबद्ध पंक्तियों के सूचकांक प्राप्त करता है।

ईएमपी = आंकड़े। चौखटा ( नाम = सी ( 'एंडी' , 'निशान' , 'बोनी' , 'कैरोलीन' , 'जॉन' ) ,

आयु = सी ( इक्कीस , 23 , 29 , 25 , 32 ) ,

वेतन = सी ( 2000 , 1000 , 1500 , 3000 , 2500 ) )

बिल्ली ( ' \एन \एन आरोही क्रम में नाम द्वारा क्रमबद्ध डेटाफ्रेम \एन ' )

Sorted_asc = ईएमपी [ साथ ( ईएमपी , आदेश ( नाम ) ) , ]

छपाई ( Sorted_asc )

यहां, हम 'एम्प' डेटाफ़्रेम को अलग-अलग मानों वाले तीन कॉलम के साथ परिभाषित करते हैं। कैट () फ़ंक्शन को स्टेटमेंट को प्रिंट करने के लिए तैनात किया गया है ताकि यह इंगित किया जा सके कि 'नाम' कॉलम द्वारा 'एम्प' डेटाफ़्रेम आरोही क्रम में सॉर्ट किया जा रहा है। इसके लिए, हम आर में ऑर्डर () फ़ंक्शन का उपयोग करते हैं जो एक सदिश में मूल्यों की अनुक्रमणिका स्थिति देता है जो आरोही क्रम में क्रमबद्ध होता है। इस मामले में, () फ़ंक्शन निर्दिष्ट करता है कि 'नाम' कॉलम को सॉर्ट किया जाना चाहिए। सॉर्ट किए गए डेटाफ़्रेम को 'सॉर्टेड_एएससी' वेरिएबल में संग्रहित किया जाता है जिसे सॉर्ट किए गए परिणामों को प्रिंट करने के लिए प्रिंट () फ़ंक्शन में एक तर्क के रूप में पारित किया जाता है।







इसलिए, आरोही क्रम में 'नाम' कॉलम द्वारा डेटाफ़्रेम के क्रमबद्ध परिणाम निम्नलिखित में प्रदर्शित होते हैं। अवरोही क्रम में सॉर्ट ऑपरेशन प्राप्त करने के लिए, हम पिछले ऑर्डर () फ़ंक्शन में केवल कॉलम नाम के साथ नकारात्मक चिह्न निर्दिष्ट कर सकते हैं:





उदाहरण 2: आर में ऑर्डर () विधि पैरामीटर का उपयोग करके डेटाफ़्रेम को सॉर्ट करना

इसके अलावा, ऑर्डर () फ़ंक्शन डेटाफ़्रेम को सॉर्ट करने के लिए घटते तर्कों को लेता है। निम्नलिखित उदाहरण में, हम ऑर्डर () फ़ंक्शन को बढ़ते या घटते क्रम में सॉर्ट करने के तर्क के साथ निर्दिष्ट करते हैं:





df = आंकड़े। चौखटा (

पहचान = सी ( 1 , 3 , 4 , 5 , 2 ) ,

अवधि = सी ( 'अजगर' , 'जावा' , 'सी ++' , 'मोंगोडीबी' , 'आर' ) )

छपाई ( 'आईडी द्वारा घटते क्रम में क्रमबद्ध' )

छपाई ( df [ आदेश ( डीएफ $ आईडी , घटते = सत्य ) , ] )

यहां, हम पहले 'df' वेरिएबल की घोषणा करते हैं जहां data.frame() फ़ंक्शन को तीन अलग-अलग कॉलम के साथ परिभाषित किया गया है। अगला, हम प्रिंट () फ़ंक्शन का उपयोग करते हैं जहां हम यह इंगित करने के लिए एक संदेश प्रिंट करते हैं कि डेटाफ़्रेम को 'आईडी' कॉलम के आधार पर घटते क्रम में क्रमबद्ध किया जा रहा है। उसके बाद, हम सॉर्टिंग ऑपरेशन करने और उन परिणामों को प्रिंट करने के लिए प्रिंट () फ़ंक्शन को फिर से तैनात करते हैं। प्रिंट () फ़ंक्शन के अंदर, हम 'कोर्स' कॉलम के आधार पर 'df' डेटाफ़्रेम को सॉर्ट करने के लिए 'ऑर्डर' फ़ंक्शन कहते हैं। घटते क्रम में सॉर्ट करने के लिए 'घटता' तर्क TRUE पर सेट है।

निम्नलिखित दृष्टांत में, DataFrame के 'आईडी' कॉलम को अवरोही क्रम में व्यवस्थित किया गया है:



हालाँकि, आरोही क्रम में छँटाई के परिणाम प्राप्त करने के लिए, हमें ऑर्डर () फ़ंक्शन के घटते तर्क को FALSE के साथ सेट करना होगा जैसा कि निम्नलिखित में दिखाया गया है:

छपाई ( 'आईडी द्वारा बढ़ते क्रम में क्रमबद्ध' )

छपाई ( df [ आदेश ( डीएफ $ आईडी , घटते = असत्य ) , ] )

वहां, हमें बढ़ते क्रम में 'आईडी' कॉलम द्वारा डेटाफ्रेम के सॉर्ट ऑपरेशन का आउटपुट मिलता है।

उदाहरण 3: आर में अरेंज () विधि का उपयोग करके डेटाफ़्रेम को सॉर्ट करना

इसके अतिरिक्त, हम कॉलम द्वारा डेटाफ़्रेम को सॉर्ट करने के लिए व्यवस्था () विधि का भी उपयोग कर सकते हैं। हम बढ़ते या घटते क्रम में भी सॉर्ट कर सकते हैं। निम्नलिखित दिया गया R कोड अरेंज () फ़ंक्शन का उपयोग करता है:

पुस्तकालय ( 'डीपीएलआईआर' )

विद्यार्थी = आंकड़े। चौखटा (

पहचान = सी ( 3 , 5 , 2 , 4 , 1 ) ,

निशान = सी ( 70 , 90 , 75 , 88 , 92 ) )

छपाई ( 'आईडी के आधार पर बढ़ते हुए क्रम' )

छपाई ( व्यवस्थित करना ( विद्यार्थी , पहचान ) )

यहाँ, हम छँटाई के लिए व्यवस्था () विधि तक पहुँचने के लिए R के 'dplyr' पैकेज को लोड करते हैं। फिर, हमारे पास data.frame() फ़ंक्शन है जिसमें दो कॉलम हैं और DataFrame को 'छात्र' चर में सेट करें। अगला, हम दिए गए DataFrame को सॉर्ट करने के लिए प्रिंट () फ़ंक्शन में 'dplyr' पैकेज से व्यवस्था () फ़ंक्शन को तैनात करते हैं। व्यवस्था () फ़ंक्शन 'छात्र' डेटाफ़्रेम को इसके पहले तर्क के रूप में लेता है, इसके बाद कॉलम के 'आईडी' को क्रमबद्ध करने के लिए। प्रिंट () फ़ंक्शन अंत में सॉर्ट किए गए डेटाफ़्रेम को कंसोल पर प्रिंट करता है।

हम देख सकते हैं कि 'आईडी' कॉलम को निम्नलिखित आउटपुट में एक क्रम में कहाँ क्रमबद्ध किया गया है:

उदाहरण 4: डेटाफ़्रेम को R में दिनांक के अनुसार क्रमित करना

R में DataFrame को दिनांक मानों द्वारा भी क्रमबद्ध किया जा सकता है। इसके लिए, सॉर्ट किए गए फ़ंक्शन को दिनांक स्वरूपित करने के लिए as.date() फ़ंक्शन के साथ निर्दिष्ट किया जाना चाहिए।

कार्यक्रम की तिथि = आंकड़े। चौखटा ( आयोजन = सी ( '3/4/2023' , '2/2/2023' ,

'10/1/2023' , '3/29/2023' ) ,

प्रभार = सी ( 3100 , 2200 , 1000 , 2900 ) )

कार्यक्रम की तिथि [ आदेश ( जैसा . तारीख ( घटना_दिनांक$ईवेंट , प्रारूप = '%d/%m/%Y' ) ) , ]

यहां, हमारे पास एक 'event_date' DataFrame है, जिसमें 'महीना/दिन/वर्ष' प्रारूप में दिनांक स्ट्रिंग्स के साथ 'ईवेंट' कॉलम है। हमें इन दिनांक स्ट्रिंग्स को आरोही क्रम में क्रमबद्ध करने की आवश्यकता है। हम ऑर्डर () फ़ंक्शन का उपयोग करते हैं जो आरोही क्रम में 'इवेंट' कॉलम द्वारा डेटाफ़्रेम को सॉर्ट करता है। हम इसे 'ईवेंट' कॉलम में दिनांक स्ट्रिंग्स को 'as.Date' फ़ंक्शन का उपयोग करके वास्तविक तिथियों में परिवर्तित करके और 'प्रारूप' पैरामीटर का उपयोग करके दिनांक स्ट्रिंग्स के प्रारूप को निर्दिष्ट करके पूरा करते हैं।

इस प्रकार, हम आरोही क्रम में 'ईवेंट' दिनांक कॉलम द्वारा सॉर्ट किए गए डेटा का प्रतिनिधित्व करते हैं।

उदाहरण 5: आर में सेटऑर्डर () विधि का उपयोग करके डेटाफ़्रेम को सॉर्ट करना

इसी तरह, डेटाफ़्रेम को सॉर्ट करने के लिए सेटऑर्डर () भी एक और तरीका है। यह व्यवस्था () विधि की तरह ही तर्क लेकर डेटाफ़्रेम को सॉर्ट करता है। सेटऑर्डर () विधि के लिए आर कोड निम्नानुसार दिया गया है:

पुस्तकालय ( 'डेटा तालिका' )

d1 = आंकड़े। चौखटा ( आदेश कामतत्व = सी ( 1 , 4 , 2 , 5 , 3 ) ,

चीजों की फरमाइश करें = सी ( 'सेब' , 'नारंगी' , 'कीवी' , 'आम' , 'केला' ) )

छपाई ( आदेश निर्धारित करें ( d1 , चीजों की फरमाइश करें ) )

यहां, हम data.table लाइब्रेरी को पहले सेट करते हैं क्योंकि सेटऑर्डर () इस पैकेज का कार्य है। फिर, हम Data.frame() फ़ंक्शन को DataFrame बनाने के लिए नियोजित करते हैं। DataFrame को केवल दो कॉलम के साथ निर्दिष्ट किया जाता है जिसका उपयोग हम सॉर्ट करने के लिए करते हैं। इसके बाद, हम प्रिंट () फ़ंक्शन के भीतर सेटऑर्डर () फ़ंक्शन सेट करते हैं। सेटऑर्डर () फ़ंक्शन 'd1' डेटाफ़्रेम को पहले पैरामीटर के रूप में और 'ऑर्डरआईड' कॉलम को दूसरे पैरामीटर के रूप में लेता है जिसके द्वारा डेटाफ़्रेम को सॉर्ट किया जाता है। 'सेटऑर्डर' फ़ंक्शन 'ऑर्डरआईड' कॉलम में मानों के आधार पर आरोही क्रम में डेटा तालिका की पंक्तियों को पुनर्व्यवस्थित करता है।

सॉर्ट किया गया DataFrame R के निम्नलिखित कंसोल में आउटपुट है:

उदाहरण 6: R में Row.Names () विधि का उपयोग करके डेटाफ़्रेम को सॉर्ट करना

Row.names() विधि भी R में DataFrame को सॉर्ट करने का एक तरीका है। Row.names() निर्दिष्ट पंक्ति द्वारा DataFrames को सॉर्ट करें।

df < - आंकड़े। चौखटा ( टीम = सी ( 'एक्स' , 'एक्स' , 'और' , 'और' , 'साथ' ) ,

अंक = सी ( 91 , 80 , 86 , 83 , 95 ) )

पंक्ति। नाम ( df ) < - सी ( 'ए' , 'डी' , 'सी' , 'और' , 'बी' )

df [ आदेश ( पंक्ति। नाम ( df ) ) , ]

यहां, data.frame() फ़ंक्शन 'df' चर के भीतर स्थापित किया गया है जहां कॉलम मानों के साथ निर्दिष्ट किए गए हैं। फिर, DataFrame की पंक्ति के नाम row.names() फ़ंक्शन का उपयोग करके निर्दिष्ट किए जाते हैं। उसके बाद, हम DataFrame को पंक्ति नामों से सॉर्ट करने के लिए ऑर्डर () फ़ंक्शन को कॉल करते हैं। ऑर्डर () फ़ंक्शन क्रमबद्ध पंक्तियों के सूचकांक लौटाता है जिनका उपयोग डेटाफ़्रेम की पंक्तियों को पुनर्गठित करने के लिए किया जाता है।

आउटपुट सॉर्ट किए गए DataFrame को पंक्तियों द्वारा वर्णानुक्रम में दिखाता है:

निष्कर्ष

हमने R में DataFrames को सॉर्ट करने के लिए विभिन्न कार्यों को देखा है। प्रत्येक विधि का एक फायदा है और सॉर्ट ऑपरेशन की आवश्यकता है। R भाषा में DataFrame को सॉर्ट करने के और भी तरीके या तरीके हो सकते हैं लेकिन सॉर्टिंग के लिए ऑर्डर (), अरेंज (), और सेटऑर्डर () तरीके सबसे महत्वपूर्ण और उपयोग में आसान हैं।