पांडस ग्रुपबी औसत

Pandasa Grupabi Ausata



जब हम दो या दो से अधिक मानों को एक साथ जोड़ते हैं और उनके योग को एक साथ जोड़े गए मानों की कुल संख्या से विभाजित किया जाता है, तो परिणाम एक औसत होता है। पांडा माध्य किसी दिए गए अक्ष के साथ डेटा या मान का औसत लौटाता है। यदि माध्य () विधि को डेटाफ़्रेम पर लागू किया जाता है, तो एक अक्ष पर औसत के साथ एक श्रृंखला पांडा द्वारा वापस कर दी जाएगी। यदि श्रृंखला पर 'माध्य ()' का उपयोग किया जाता है, तो पांडा एक संख्यात्मक मान (एकल संख्या) लौटाते हैं। श्रेणियों के समूह बनाने के बाद कार्यों को श्रेणियों पर लागू किया जा सकता है। यह एक सरल विचार है लेकिन एक अत्यधिक प्रभावी तकनीक है जिसे अक्सर डेटा विज्ञान में लागू किया जाता है। यह हमें प्रत्येक समूह के लिए डेटा का सारांश बनाने, समूह-विशिष्ट संशोधनों को लागू करने और डेटा फ़िल्टर करने की अनुमति देता है। Groupby () फ़ंक्शन के साथ, ऑब्जेक्ट को विभाजित किया जा सकता है, एक फ़ंक्शन लागू किया जा सकता है, और फिर उत्पादों को जोड़ा जा सकता है। इसके साथ बड़े डेटासेट को समूहीकृत किया जा सकता है, और समूहों पर संचालन किया जा सकता है।

पंडों में groupby.mean () विधि का उपयोग कैसे करें?

डेटाफ़्रेम के औसत या डेटाफ़्रेम के विशिष्ट स्तंभों के औसत की गणना करने के लिए, हम groupby.mean() फ़ंक्शन का उपयोग कर सकते हैं। हम निम्नलिखित उदाहरणों में इसका उपयोग कैसे करेंगे, इसका प्रदर्शन करेंगे।







उदाहरण # 01: एकल कॉलम के डेटा को समूहीकृत करके एकल पूर्णांक कॉलम का औसत निर्धारित करें

pd.DataFrame() फ़ंक्शन का उपयोग करके, हम पहले एक डेटाफ़्रेम बनाएंगे ताकि हम डेटाफ़्रेम के कॉलम या कॉलम के डेटा को समूहों में विभाजित कर सकें और फिर उनका माध्य मान ज्ञात कर सकें। डेटा फ्रेम बनाने से पहले, हमें पंडों के मॉड्यूल को खस्ता पुस्तकालय के साथ आयात करना चाहिए।





जैसा कि देखा जा सकता है, हमने पांडा डिक्शनरी का उपयोग करके अपना डेटाफ्रेम बनाया है। हमारे df डेटाफ़्रेम में 3 कॉलम हैं, यानी, 'आइटम', 'निर्माता', और 'मात्रा'। कॉलम 'आइटम' में, हमने मानों ('शर्ट', 'टाई', 'पैंट', 'शर्ट', 'टाई', 'पैंट', 'शर्ट', 'पैंट', 'पैंट', ' टाई'), जबकि  कॉलम 'निर्माता' और 'मात्रा' जिसमें मान ('इटली', 'फ़्रांस', 'चीन', 'फ़्रांस',  'चीन', 'इटली', 'चीन', 'इटली', 'फ्रांस', 'चीन') और (13, 16, 21, 32, 26, 41, 24, 42, 12, 15) क्रमशः। आइए निर्माता कॉलम में मानों को समूहित करें और प्रत्येक विशिष्ट निर्माता के लिए औसत मात्रा मान निर्धारित करें।





निर्माता मूल्य 'चीन' का औसत मात्रा मूल्य 21.5 है, 'फ़्रांस' के लिए औसत मात्रा मान 20.0 है, और 'इटली' के लिए औसत मात्रा मान 32.0 है। हम groupby.mean () फ़ंक्शन के साथ रीसेट_इंडेक्स फ़ंक्शन का उपयोग करके आउटपुट के लिए एक इंडेक्स भी निर्दिष्ट कर सकते हैं।



उदाहरण # 02: सिंगल कॉलम के डेटा को ग्रुप करके सिंगल फ्लोट कॉलम का माध्य ज्ञात करें

हमने देखा है कि आँकड़ों को समूहीकृत करने के बाद हम किस प्रकार पूर्णांक स्तंभ का माध्य ज्ञात कर सकते हैं। अब फ्लोट जैसे एक और डेटाटाइप कॉलम की कोशिश करते हैं। pd.DataFrame() फ़ंक्शन का उपयोग करके फ्लोट मानों के साथ कम से कम एक कॉलम वाला डेटाफ़्रेम बनाया जाएगा।

pd.DataFrame() के अंदर एक डिक्शनरी डालकर, हमने तीन कॉलम के साथ एक डेटाफ्रेम बनाया है। कॉलम 'नाम' कुछ यादृच्छिक खिलाड़ियों ('सैम', 'जे', 'लियो', 'माइक', 'विल', 'बिली', 'जॉनी', 'लारा', 'हन्ना', के नाम संग्रहीत कर रहा है। 'टोनी'), कॉलम 'टीम' उस टीम का प्रतिनिधित्व करता है जिससे प्रत्येक खिलाड़ी ('ए', 'ए', 'बी', 'ए', 'बी', 'ए', 'सी', 'बी') से संबंधित है। ', 'सी', 'सी'), और 'ऊंचाई' कॉलम प्रत्येक खिलाड़ी की ऊंचाई को फ्लोट वैल्यू (5.6, 5.4, 6.3, 5.2, 5.5, 6.4, 5.6, 5.8, 6.0, 5.2) के रूप में संग्रहीत कर रहा है। आइए डेटा को 'टीम' कॉलम में समूहित करें और प्रत्येक विशिष्ट 'टीम' मान के लिए औसत ऊंचाई मान निर्धारित करें।

आप देख सकते हैं कि टीम A के खिलाड़ियों की औसत ऊंचाई का मान 5.65 है, जबकि टीम B और C में खिलाड़ियों की औसत ऊंचाई क्रमशः 5.866 और 5.6 है।

उदाहरण # 03: groupby.mean() फ़ंक्शन का उपयोग करके एकाधिक कॉलम का माध्य निर्धारित करें

पिछले उदाहरणों में, हमने एकल कॉलम का औसत निर्धारित किया था। हालाँकि, प्रत्येक समूह के लिए कई स्तंभों का माध्य भी निर्धारित किया जा सकता है। पांडा और सुन्न मॉड्यूल आयात करने के बाद, एक से अधिक संख्यात्मक कॉलम वाले डेटाफ़्रेम बनाएं।

नए बनाए गए डेटाफ़्रेम में, 'नाम', 'स्कोर' और 'मैच' लेबल वाले तीन कॉलम होते हैं। एक स्ट्रिंग के रूप में डेटा मान रखने वाले कॉलम नाम ('रॉन', 'जिम', 'डैनी', 'जिम', 'जिम', 'डैनी', 'रॉन', 'रॉन', 'डेनी', 'जिम' ), जबकि 'स्कोर' और 'मैचों' में संख्यात्मक डेटा होते हैं जैसे (3, 4, 2, 4, 1, 5, 2, 3, 1, 2) और (2, 3, 1, 2, 1, 3 , 4, 1, 2, 1)। आइए अब कॉलम 'नाम' के डेटा को समूहीकृत करने के बाद कॉलम 'स्कोर' और 'मैचों' का माध्य ज्ञात करें। इसके लिए groupby.mean() फंक्शन का इस्तेमाल किया जाएगा।

यह देखा जा सकता है कि समूह 'डैनी' का 2.00 मैचों में औसत स्कोर 2.66 है। जिम समूह का औसत स्कोर 2.75 है और खेले गए मैचों का औसत मूल्य 1.75 है। जबकि समूह 'रॉन' का औसत स्कोर 2.66 है और खेले गए मैचों का औसत मूल्य 2.33 है।

ऑब्जेक्ट द्वारा श्रेणियों के समूह के औसत की गणना agg () विधि का उपयोग करके भी की जा सकती है। हम agg() फ़ंक्शन के तर्क के रूप में माध्य की आपूर्ति करेंगे। दिए गए अक्ष पर एकल या एकाधिक संचालन का उपयोग करके एकत्रित करने के लिए, हम agg() फ़ंक्शन का उपयोग कर सकते हैं।

आउटपुट पहले जैसा ही है।

उदाहरण # 04: एकाधिक स्तंभों को समूहीकृत करके विशिष्ट स्तंभों का माध्य निर्धारित करें

उदाहरण 1, 2, और 3 में, हमने एक कॉलम के मानों या डेटा को समूहीकृत किया है। अब हम ग्रुपबाय () फ़ंक्शन के अंदर कॉलम लेबल की सूची का उपयोग करके कई कॉलमों को समूहित करेंगे, और फिर हम प्रत्येक समूह के लिए औसत मान पाएंगे। डेटाफ़्रेम बनाने के लिए इनपुट के रूप में pd.Dataframe() फ़ंक्शन के अंदर एक शब्दकोष 'd' पास किया जाएगा।

हमने आवश्यक डेटाफ्रेम बनाया है। कॉलम 'स्पोर्ट्स' कुछ खेलों ('बैडमिंटन', 'फुटबॉल', 'टेनिस', 'बास्केटबॉल', 'फुटबॉल', 'टेनिस', 'बास्केटबॉल', 'फुटबॉल', 'बैडमिंटन', ' बास्केटबॉल', 'बास्केटबॉल', 'टेनिस'), देशों के नाम ('चीन', 'रूस', 'इटली', 'स्पेन', 'रूस', 'इटली', 'चीन', 'इटली', ' स्पेन', 'चीन', 'रूस', 'इटली') 'देश' कॉलम में संग्रहीत हैं। जबकि कॉलम 'जीत' में हमने प्रत्येक देश द्वारा प्रत्येक खेल में जीते गए मैचों की संख्या (13, 10, 6, 7, 10, 12, 7, 11, 8, 13, 11, 6) संग्रहीत की है। आइए 'खेल' और 'देश' कॉलम को समूहीकृत करके 'जीत' कॉलम मानों का मतलब खोजने के लिए groupby.mean() फ़ंक्शन का उपयोग करें।

समारोह ने देश में प्रत्येक खेल के लिए 'जीत' कॉलम मानों का औसत सफलतापूर्वक निर्धारित किया है। समूहबद्ध डेटाफ़्रेम को रीसेट_इंडेक्स () फ़ंक्शन का उपयोग करके रीसेट किया जा सकता है, जो एक नया इंडेक्स भी बनाता है, जिससे यह एक उपयुक्त डेटाफ़्रेम संरचना देता है।

प्रत्येक डेटाफ़्रेम की पंक्ति के लिए एक अनुक्रमणिका जोड़ी जाती है। परिणामों को एक आकर्षक तालिका में व्यवस्थित करने के लिए, हम पिवट () ​​फ़ंक्शन का भी उपयोग कर सकते हैं।

निष्कर्ष

इस ट्यूटोरियल में, हमने चर्चा की है कि संख्याओं का माध्य या औसत क्या है और डेटाफ़्रेम के कॉलम या कॉलम को समूहीकृत करने के बाद किसी विशिष्ट कॉलम (एक या अधिक) का माध्य कैसे ज्ञात करें। हमने इस लेख में कुछ उदाहरण लागू किए हैं जो आपको सिखाते हैं कि किसी एकल स्तंभ के डेटा को समूहीकृत करके एकल पूर्णांक या फ़्लोट स्तंभ का औसत कैसे निर्धारित किया जाए; groupby.mean() फ़ंक्शन का उपयोग करके एकाधिक कॉलम का माध्य कैसे निर्धारित करें; और यह भी कि एकाधिक स्तंभों को समूहीकृत करके विशिष्ट स्तंभों का माध्य कैसे निर्धारित किया जाए।