पांडा डेटाफ्रेम अद्वितीय

Panda Detaphrema Advitiya



डेटा विज्ञान में उपयोग की जाने वाली सबसे लोकप्रिय पायथन लाइब्रेरी को पंडों कहा जाता है। यह पायथन प्रोग्रामर को उच्च-प्रदर्शन, उपयोगकर्ता के अनुकूल और डेटा विश्लेषण उपकरण प्रदान करता है। एक बार जब आप मूलभूत कार्यों को समझ लेते हैं और उनका उपयोग कैसे करते हैं, तो पंडों डेटा को बदलने के लिए एक शक्तिशाली उपकरण है। 'पांडा' में डेटा को सारणीबद्ध रूप में संग्रहीत करने के मानक तरीके डेटाफ़्रेम हैं। हम 'पांडा' डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करने के लिए कुछ 'पांडा' विधियों का उपयोग कर सकते हैं। जब हमें डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करने की आवश्यकता होती है और 'पांडा' डेटाफ़्रेम के कॉलम में मूल्यों का दोहराव नहीं चाहते हैं, तो हम ऐसा करने के लिए 'पांडा' द्वारा प्रदान की जाने वाली विधियों का उपयोग कर सकते हैं। आइए इस गाइड में ऐसे तरीकों को देखें, कुछ उदाहरणों और आउटपुट के साथ डेटाफ़्रेम के 'पांडा' के कॉलम में अद्वितीय मान प्राप्त करने के लिए।

'पांडा' डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करने के तरीके

हम 'पांडा' डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करने के लिए दो विधियों का उपयोग कर सकते हैं। हम डुप्लिकेट मानों को छोड़ देते हैं और केवल डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करते हैं। इस कार्य को करने के लिए 'पंडों' द्वारा प्रदान की जाने वाली विधियाँ हैं:







  • अद्वितीय () विधि का उपयोग करके।
  • drop_dupliactes() विधि का उपयोग करके।

अब, हम 'पांडा' कोड में दोनों विधियों का उपयोग 'पांडा' डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करने के लिए करेंगे।



उदाहरण # 01

'स्पाइडर' ऐप का उपयोग यहां 'पांडा' कोड बनाने के लिए उन तरीकों का उपयोग करने के लिए किया जाता है जो हमें 'पांडा' डेटाफ्रेम के कॉलम में अद्वितीय मान प्राप्त करने में मदद करते हैं। डेटाफ़्रेम बनाने से पहले हमें 'पांडा' मॉड्यूल आयात करना चाहिए, जो 'पांडा' कोड के लिए आवश्यक हैं। 'आयात' शब्द का उपयोग करके और 'पंडों को पीडी' के रूप में रखकर, हम इन मॉड्यूलों को आयात करते हैं।



अब, 'पीडी' की सहायता से, हम 'पांडा' कार्यों या विधियों को जल्दी से प्राप्त कर सकते हैं। फिर हम 'विषय_डेटा' डालते हैं जिसमें हम 'नाम' जोड़ते हैं और 'नाम' में हम नाम का डेटा जोड़ रहे हैं जो 'रोमन, विलियम, पीटर, स्मिथ, जॉन, मिल्ली, थॉमस और जेम्स' हैं। फिर, हम 'सब्ज' में विषय डेटा जोड़ते हैं जो 'गणित, अर्थशास्त्र, विज्ञान, गणित, सांख्यिकी, सांख्यिकी, सांख्यिकी और कंप्यूटर' हैं। फिर, हम इस “Subject_data” को “pd.DataFrame ()” विधि का उपयोग करके “Subject_df” DataFrame में बदल देते हैं। हम 'Subject_df' को 'प्रिंट ()' विधि में रखते हैं ताकि यह टर्मिनल पर दिखाई दे।





अब, हम 'pandas' DataFrame के कॉलम 'Subj' में अद्वितीय मान प्राप्त करना चाहते हैं। इस उद्देश्य के लिए, हम यहां 'अद्वितीय ()' विधि का उपयोग कर रहे हैं और हम कॉलम का नाम और डेटाफ़्रेम का नाम भी जोड़ते हैं जैसा कि नीचे दिखाया गया है। हम इस विधि को 'प्रिंट ()' में जोड़ते हैं, इसलिए परिणाम टर्मिनल पर भी दिखाई देगा।



अब, हम इस कोड का परिणाम प्राप्त करने के लिए 'Shift + Enter' दबा रहे हैं और यह टर्मिनल पर प्रस्तुत होता है और यहां भी दिखाया जाता है, जिसमें सभी मानों के साथ डेटाफ़्रेम होता है। यह मूल डेटाफ़्रेम है जिसे हमने कोड में जोड़ा है और इसके नीचे 'सबज' कॉलम के अद्वितीय मान प्रदर्शित होते हैं। यह डुप्लिकेट मानों को छोड़ देता है और DataFrame के 'Subj' कॉलम के अद्वितीय मान प्रदर्शित करता है।

उदाहरण # 02

हम 'नमूना_सूची' बनाते हैं जिसमें कुछ जानकारी होती है। हम 'लैला, 21, 28, 31, 14, और 39' सम्मिलित करते हैं, जो इस सूची को डेटाफ़्रेम में बदलने पर पहले कॉलम के रूप में दिखाई देगा। फिर, हम डेटाफ़्रेम की दूसरी पंक्ति के रूप में 'लुसी, 31, 25, 34, 26 और 21' जोड़ते हैं। इसके बाद, हमारे पास 'पीटर, 38, 20, 20, 35, और 24' और 'लैला 38, 23, 39 24, 23' हैं जो डेटाफ़्रेम की तीसरी और चौथी पंक्तियाँ होंगी। हम तीन और डेटा भी सम्मिलित करते हैं जो 'स्टेला, 21, 24, 24, 28, 31', 'लैला, 33, 32, 26, 30, 25' और 'पीटर, 21, 21, 31, 21, 29' भी हैं। .

अब, हम 'Sample_list' को 'DF_Sample' में परिवर्तित कर रहे हैं जो कि 'pd.DataFrame ()' फ़ंक्शन डालकर यहां डेटाफ़्रेम का नाम है। साथ ही, हम इस डेटाफ़्रेम के कॉलम का नाम सेट करते हैं और ये नाम 'नाम, Ass_1, Ass_2, Ass_3, Ass_4, और Ass_5' हैं। फिर, हम 'प्रिंट ()' का उपयोग करते हैं जो डेटाफ़्रेम 'DF_Sample' को प्रदर्शित करने में मदद करता है। अब, हम इस उदाहरण में डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करने के लिए एक अन्य विधि का उपयोग कर रहे हैं। यह विधि 'पंडों' की 'ड्रॉप_डुप्लिकेट ()' विधि है।

'Drop_duplicates ()' विधि में, हम उस कॉलम का नाम सेट करते हैं जहाँ हम DataFrame के कॉलम में अद्वितीय मान प्राप्त करना चाहते हैं। हम 'ड्रॉप_डुप्लिकेट्स ()' विधि की सहायता से इस कॉलम में डुप्लिकेट मानों को छोड़कर 'नाम' कॉलम के अद्वितीय मान प्राप्त कर रहे हैं और यहां 'प्रिंट ()' फ़ंक्शन का उपयोग करके इन अद्वितीय मानों को प्रस्तुत करते हैं।

डुप्लिकेट किए गए नाम हटा दिए जाते हैं और 'ड्रॉप_डुप्लिकेट ()' पद्धति को लागू करने के बाद अद्वितीय मान प्रदान किए जाते हैं। आप देख सकते हैं कि 'लैला' नाम 'नाम' कॉलम के तीन कक्षों में दिखाई देता है। लेकिन जब इस कॉलम पर 'ड्रॉप_डुप्लिकेट ()' विधि लागू की जाती है, तो सभी डुप्लिकेट मान हटा दिए जाते हैं और स्क्रीन पर एक 'लैला' नाम दिखाई देता है। डुप्लिकेट मानों को छोड़ने के बाद, नया डेटाफ़्रेम दिखाई दिया जिसमें इस 'नाम' कॉलम में अद्वितीय मान शामिल हैं। इस तरह, हम 'ड्रॉप_डुप्लिकेट ()' विधि की मदद से डुप्लिकेट मानों को छोड़ सकते हैं और डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त कर सकते हैं।

उदाहरण # 03

उसी डेटाफ़्रेम का फिर से उपयोग किया जाता है और अब हम यहां 'अद्वितीय ()' विधि लागू कर रहे हैं। 'अद्वितीय ()' विधि के साथ हम कॉलम के नाम के साथ-साथ डेटाफ्रेम के नाम को भी रखते हैं, जिस पर हम अद्वितीय मान प्राप्त करने के लिए इस 'अद्वितीय ()' विधि को लागू करना चाहते हैं। यह केवल उस कॉलम के अद्वितीय मान प्रस्तुत करेगा और इन मानों को डेटाफ़्रेम के रूप में नहीं दिखाएगा।

यहां, डेटाफ़्रेम में 'नाम' कॉलम में सात मान होते हैं, लेकिन जब हम इस कॉलम में 'अद्वितीय ()' विधि लागू करते हैं, तो केवल चार मान दिखाई देते हैं और ये उस कॉलम के अद्वितीय मान होते हैं। यह डुप्लिकेट मान प्रस्तुत नहीं करता है।

उदाहरण # 04

इस उदाहरण में हम जो DataFrame बनाते हैं, वह 'F_G_df' है। हम इस डेटाफ़्रेम में 'My_fruits' और 'my_Vegs' सम्मिलित करते हैं। 'माई_फ्रूट्स' कॉलम में 'सेब, संतरा, सेब, नाशपाती, लीची, सेब, सेब, नाशपाती और सेब' शामिल हैं। इसके बाद, हमारे पास 'My_Vegs' है जिसमें सब्जियों के नाम शामिल हैं जो 'मिर्च, ब्रिंगल, गाजर, आलू, आलू, गाजर, प्याज, लहसुन और अदरक' हैं। इस DataFrame में केवल दो कॉलम हैं।

अब, हम 'अद्वितीय ()' पद्धति की सहायता से दोनों स्तंभों में अद्वितीय मान प्राप्त कर रहे हैं। हम DataFrame के नाम का उल्लेख करते हैं। फिर, कॉलम को पहले कॉलम का नाम दें। इसके बाद, हम एपेंड () विधि का उपयोग करते हैं। इस परिशिष्ट में, हम फिर से DataFrame का नाम और दूसरे कॉलम का नाम रखते हैं और 'अद्वितीय ()' विधि रखते हैं। यह दोनों स्तंभों के अद्वितीय मान प्राप्त करेगा और फिर दोनों स्तंभों के अद्वितीय मानों को जोड़ देगा और उन्हें स्क्रीन पर प्रदर्शित करेगा।

DataFrame को पहले सभी मानों के साथ प्रस्तुत किया जाता है। इसके बाद, 'अद्वितीय ()' विधि लागू की जाती है और दोनों स्तंभों के अद्वितीय मान नीचे प्रस्तुत किए जाते हैं। इस कोड में, हम 'अद्वितीय ()' विधि का उपयोग करके डेटाफ़्रेम के कई स्तंभों में अद्वितीय मान प्राप्त करते हैं।

निष्कर्ष

डेटाफ़्रेम के कॉलम में अद्वितीय मान प्राप्त करने की पूरी व्याख्या इस गाइड में पाई जाती है। हमने 'अद्वितीय ()' और 'ड्रॉप_डुप्लिकेट ()' विधियों पर चर्चा की है जो हमें डेटाफ्रेम के कॉलम के अद्वितीय मूल्यों को प्राप्त करने में मदद करती है। हमने अपने कोड में इन विधियों का उपयोग करके 'पांडा' कोड में इन विधियों का उपयोग करने का तरीका खोजा है। हमने इस गाइड में विभिन्न उदाहरणों का उदाहरण दिया है और आपको दिखाया है कि 'अद्वितीय ()' विधि के साथ-साथ 'ड्रॉप_डुप्लिकेट ()' विधि का उपयोग करके एक कॉलम के अद्वितीय मान कैसे प्राप्त करें। हमने यह भी पता लगाया है कि इस गाइड में 'अद्वितीय ()' विधि का उपयोग करके कई स्तंभों में अद्वितीय मान कैसे प्राप्त करें।