पायथन में एक्सएलएसएक्स से सीएसवी

Payathana Mem Eksa Ela Esa Eksa Se Si Esavi



हाल के वर्षों में, पायथन प्रमुख प्रोग्रामिंग भाषाओं में से एक के रूप में उभरा है। Python की लोकप्रियता और उपयोगिता के परिणामस्वरूप Python समुदाय का काफी विस्तार हुआ है। हम इस लेख में एक्सएलएसएक्स को सीएसवी में बदलने के लिए पायथन का उपयोग करने के तरीके के बारे में विस्तार से जानेंगे। हम जानते हैं कि एक्सेल फाइलों का उपयोग अक्सर वित्तीय विश्लेषण करने, डेटा को व्यवस्थित करने, डेटा प्रविष्टि, लेखा, डेटा प्रबंधन, चार्ट और ग्राफ़ बनाने आदि के लिए किया जाता है। हालाँकि, हम ज्यादातर डेटा आयात और निर्यात के लिए CSV फ़ाइलों का उपयोग करना पसंद करते हैं। इसका एक तरीका यह है कि सादे टेक्स्ट फ़ाइल का इस्तेमाल करके स्ट्रक्चर्ड डेटा को ट्रांसफ़र किया जाए।

Xslx फ़ाइल क्या है?

Excel के नवीनतम संस्करणों में स्प्रेडशीट बनाते समय, Microsoft XLSX फ़ाइल को डिफ़ॉल्ट फ़ाइल प्रकार के रूप में उपयोग करता है। Word के DOCX फ़ाइल प्रकार के समान, हम विभिन्न प्रकार के एप्लिकेशन/प्रोग्राम का उपयोग करके XLSX फ़ाइलें खोल सकते हैं।

CSV फ़ाइल क्या है?

CSV फ़ाइल स्वरूप वह है जिसका उपयोग हम स्प्रेडशीट और डेटाबेस में सारणीबद्ध डेटा मानों को संग्रहीत करने के लिए कर सकते हैं। सारणीबद्ध डेटा, पाठ या पाठ, CSV फ़ाइल में सादे पाठ के रूप में संग्रहीत किया जाता है। CSV फ़ाइल में एक रिकॉर्ड फ़ाइल की प्रत्येक पंक्ति पर संग्रहीत डेटा मान है। प्रत्येक रिकॉर्ड में एक से अधिक फ़ील्ड हो सकते हैं जिन्हें कॉमा द्वारा अलग किया जाता है।







XLSX और CSV फ़ाइलों के बीच मुख्य अंतर

उपयोगकर्ता अक्सर CSV और XLSX का एक दूसरे के स्थान पर उपयोग करते हैं, और वे आम तौर पर उनके बीच के अंतरों से अनभिज्ञ होते हैं, उनकी मूलभूत विशेषताएं क्या हैं, और वे कैसे काम करते हैं। यह केवल उपयोगकर्ता के लिए सूचना के स्रोत के रूप में कार्य करता है। लगभग हर व्यवसाय और कॉर्पोरेट दोनों का उपयोग उपयोगकर्ता के डेटा को प्रबंधित करने, अपडेट करने और संग्रहीत करने में उपयोगकर्ताओं की सहायता के लिए करते हैं। XLSX और CSV फ़ाइलों के बीच कुछ प्रमुख अंतर निम्नलिखित हैं जिन्हें आपको जानना चाहिए:



  • CSV प्रारूप .csv एक्सटेंशन के साथ सारणीबद्ध डेटा को सीमांकक पाठ फ़ाइल में सहेजता है। जबकि, एक्सेल या एक्सएलएसएक्स फ़ाइल एक स्प्रेडशीट है जो फाइलों को अपने मालिकाना प्रारूप में संग्रहीत करती है, अर्थात। एक्सएलएस या एक्सएलएसएक्स।
  • एक्सेल फाइलें बाइनरी फाइलें होती हैं जिनमें वर्कबुक में प्रत्येक वर्कशीट पर डेटा होता है। जबकि, CSV कॉमा द्वारा अलग किए गए डेटा मानों के अनुक्रम के साथ एक सादा और सरल पाठ प्रारूप है।
  • सीएसवी फाइलों पर डेटा संचालन नहीं किया जा सकता है। हालाँकि, उन्हें एक्सेल फाइलों पर किया जा सकता है।
  • CSV फ़ाइलें तेज़ हैं और XLSX फ़ाइलों की तुलना में कम मेमोरी का उपयोग करती हैं। हालाँकि, डेटा आयात करते समय Excel अधिक मेमोरी का उपयोग करता है।
  • यदि हम एक्सेल के साथ सीएसवी की तुलना करते हैं, तो हम सीएसवी फाइलों को किसी भी विंडोज टेक्स्ट एडिटर में खोल सकते हैं जबकि एक्सेल फाइल नहीं कर सकते।

पायथन का उपयोग करके एक्सएलएसएक्स फ़ाइल को सीएसवी में कैसे परिवर्तित किया जा सकता है?

एक XLSX फ़ाइल को विभिन्न तरीकों का उपयोग करके Python में CSV फ़ाइल में बदला जा सकता है। पायथन में विभिन्न प्रकार के मॉड्यूल और फ़ंक्शन शामिल हैं जो इस कार्य को पूरा करने में हमारी सहायता कर सकते हैं। यहां, हम कुछ तरीकों से गुजरेंगे जिनका उपयोग एक्सएलएसएक्स फाइलों को पायथन में सीएसवी फाइलों में बदलने के लिए किया जा सकता है।



एक्सेल को सीएसवी रूपांतरण करने के लिए पूर्वापेक्षाएँ

आवश्यकताओं को स्थापित करना पहला कदम है। हम इस ट्यूटोरियल में कंबाइन पांडा, सीएसवी और ओपनपीएक्सएल आदि जैसे मॉड्यूल का उपयोग करते हैं। पायथन का पांडा पैकेज डेटा के हेरफेर और विश्लेषण की अनुमति देता है। पंडास पायथन प्रोग्रामर्स के बीच एक प्रसिद्ध पुस्तकालय है। एक्सेल फाइलों को ओपनपीएक्सएल नामक पायथन पैकेज का उपयोग करके पढ़ा और लिखा जा सकता है। हम सीधे इस पुस्तकालय से नहीं निपटेंगे। इसके बजाय पांडा आंतरिक रूप से Openpyxl का उपयोग करते हैं।





PyPI रिपॉजिटरी का उपयोग करके, हम दोनों पैकेजों को संस्थापित कर सकते हैं:

विधि 1: पांडा मॉड्यूल का उपयोग करके XLSX को CSV में बदलना

उदाहरण 1: एक XLSX फ़ाइल को CSV में बदलना



पांडा एक ओपन-सोर्स मॉड्यूल है जो डेटा में हेरफेर और विश्लेषण करने के लिए पायथन प्रोग्रामिंग भाषा के लिए बनाया गया है। समय श्रृंखला और संख्यात्मक तालिकाओं के साथ काम करने के लिए, पांडा विभिन्न प्रकार की कार्यक्षमता और सुविधाएँ प्रदान करता है। पांडा का उपयोग करके, छोटे और बड़े दोनों प्रकार के डेटासेट को पढ़ा, फ़िल्टर और पुनर्व्यवस्थित किया जा सकता है। और परिणाम एक्सेल, जेएसओएन और सीएसवी जैसे विभिन्न स्वरूपों में उत्पादित किए जा सकते हैं। हम एक एक्सेल फ़ाइल को पढ़ने के लिए पांडा की read_excel () विधि का उपयोग करते हैं, और डेटाफ़्रेम को CSV फ़ाइल में बदलने के लिए to_csv () विधि का उपयोग करते हैं।

हम अपनी .csv फ़ाइल को डेटाफ़्रेम के रूप में प्रिंट करते हैं जैसा कि आउटपुट में देखा जा सकता है। पिछली स्क्रिप्ट हमारी XLSX फ़ाइल को CSV में परिवर्तित करती है और वर्तमान निर्देशिका में 'salary.csv' फ़ाइल बनाती है।

उदाहरण 2: XLSX फ़ाइल (एकाधिक शीट के साथ) को CSV में बदलना

आगे दिए गए उदाहरण में, हम पहले एक्सेल फाइल के शीट नाम पढ़ते हैं। इसके बाद अलग-अलग शीट के नामों को लूप किया जाता है और अलग-अलग CSV फ़ाइलों के रूप में सहेजा जाता है। स्क्रिप्ट CSV को उसी स्थान पर सहेजती है।

हम दो या दो से अधिक वर्कशीट या स्प्रेडशीट वाली एक नमूना XLSX फ़ाइल का उपयोग करते हैं।

जैसा कि देखा जा सकता है, हमारी XLSX फाइल में दो शीट (शीट1 और शीट2) हैं। अब, हम इस XLSX फाइल को CSV में बदलने के लिए एक कोड लिखते हैं।

आउटपुट:

स्क्रिप्ट ने XLSX फाइल को दो शीट के साथ सिंगल शीट के साथ सिंगल CSV फाइल में सफलतापूर्वक बदल दिया।

उदाहरण 3: एकाधिक XLSX फ़ाइलों को अलग-अलग CSV फ़ाइलों में बदलना

एक ऐसे परिदृश्य पर विचार करें जिसमें आपको अपनी कार्यशील निर्देशिका में कई एक्सेल फ़ाइलों को CSV में बदलने की आवश्यकता होती है। आप इस तरीके को अपना सकते हैं। हम यह मानकर शुरू करते हैं कि प्रत्येक फ़ाइल में केवल एक शीट होती है। फिर, हम कई फाइलों और कई शीटों को संभालने के लिए अपनी पद्धति का विस्तार करते हैं। निम्नलिखित पायथन कोड ग्लोब मानक मॉड्यूल का उपयोग करता है। हम ग्लोब के साथ पैटर्न का उपयोग करके फ़ाइल पथों का मिलान करते हैं। यह वर्किंग डायरेक्टरी में .xlsx एक्सटेंशन वाली सभी फाइलों से मेल खाता है। उसके बाद, हम एक फ़ंक्शन विकसित करते हैं जो एक्सेल फ़ाइलों को पढ़ता है और उन्हें CSV फ़ाइलों के रूप में सहेजता है। हम इस फ़ंक्शन को पाए जाने वाले प्रत्येक फ़ाइल पथ पर कॉल करते हैं।

यह पिछली स्क्रिप्ट सभी xlsx फ़ाइलों को वर्तमान निर्देशिका में CSV फ़ाइलों में परिवर्तित करती है।

अब, हम XLSX फ़ाइलों को कई स्प्रेडशीट के साथ CSV में कनवर्ट करते हैं। यह सबसे अधिक कठिन हिस्सा है। तीन एक्सेल फाइलें हमारी वर्किंग डायरेक्टरी में हैं। साथ ही, उनमें से कुछ में एक से अधिक शीट होती हैं। हमारा लक्ष्य है:

  1. प्रत्येक स्प्रेडशीट फ़ाइल के लिए एक निर्देशिका बनाएँ,
  2. एक्सेल फ़ाइल शीट को सीएसवी में कनवर्ट करें और उन्हें नव निर्मित निर्देशिका में रखा जाना चाहिए।

स्क्रिप्ट XLSX को सिंगल और मल्टीपल शीट के साथ अलग-अलग CSV फ़ाइलों में परिवर्तित करती है और उन्हें उसी नाम से नई निर्देशिकाओं में संग्रहीत करती है।

वर्तमान निर्देशिका में स्थित प्रत्येक एक्सेल फ़ाइल को पुनः प्राप्त करने के लिए ग्लोब फ़ंक्शन का उपयोग किया जाता है। उसके बाद, os.mkdir फ़ंक्शन का उपयोग करके प्रत्येक XLSX फ़ाइल के लिए फ़ोल्डर बनाए जाते हैं। एक CSV फ़ाइल तब शीट के नाम पर लूप करके नई निर्देशिका के अंदर प्रत्येक शीट के लिए बनाई जाती है।

विधि 2: Openpyxl और CSV मॉड्यूल का उपयोग करके XLSX को CSV में बदलना

इस पद्धति में, हम XLSX फ़ाइलों को CSV में बदलने के लिए openpyxl और CSV मॉड्यूल का उपयोग करेंगे। 2010 xlsx, xlsm, xltx, और xltm फ़ाइलों को पढ़ने और लिखने के लिए, Python मॉड्यूल openpyxl का उपयोग किया जा सकता है। सीएसवी मॉड्यूल में ऐसी कक्षाएं शामिल हैं जो सीएसवी-प्रारूपित सारणीबद्ध डेटा को पढ़ने और लिखने में सक्षम बनाती हैं।

हमारी xlsx फ़ाइल को पढ़ने या लोड करने के लिए, हम openpyxl मॉड्यूल के load_workbook() फ़ंक्शन का उपयोग करते हैं। यदि आपको Python में मौजूदा XLSX/Excel फ़ाइल लिखने या पढ़ने की आवश्यकता है, तो आप इस फ़ंक्शन का उपयोग कर सकते हैं। एक्सेल की सक्रियता के बाद, हम अपनी CSV फ़ाइल बनाने के लिए csv.writer () फ़ंक्शन का उपयोग करते हैं। फिर, CSV फ़ाइल के डेटा सेल में डेटा को स्टोर करने के लिए फॉर-लूप का उपयोग किया जाता है। हम अपनी example.xlsx फ़ाइल को myfile.csv में कनवर्ट करते हैं जैसा कि निम्न छवि में देखा गया है:

निष्कर्ष

इस ट्यूटोरियल में, हमने आपको XLSX फाइलों और CSV फाइलों का संक्षिप्त परिचय दिया है। हमने दोनों फ़ाइल स्वरूपों के बीच प्रमुख अंतरों की व्याख्या की है। हमने यह सिखाने के लिए कई उदाहरणों के साथ दो तरीकों पर चर्चा की कि कैसे सिंगल या मल्टीपल शीट वाली XLSX फाइलों को CSV फाइलों में बदला जा सकता है। हमने एक साथ कई XLSX फ़ाइलों को CSV फ़ाइलों में बदलने के लिए एक उदाहरण लागू किया। डेटा को एक्सेल से सीएसवी में बदलना सरल या कठिन हो सकता है। यदि आपके पास केवल एक फ़ाइल है जिसमें बहुत कम संख्या में पत्रक हैं, तो यह सरल है। लेकिन नहीं तो मुश्किल हो सकती है।