ट्रांसफॉर्मर का उपयोग करके टेक्स्ट वर्गीकरण कैसे करें

इस युग में, ट्रांसफॉर्मर सबसे शक्तिशाली मॉडल हैं जिन्होंने कई एनएलपी (प्राकृतिक भाषा प्रसंस्करण) संचालन में सर्वोत्तम परिणाम प्रदान किए हैं। प्रारंभ में, इसका उपयोग पाठ निर्माण के साथ-साथ वर्गीकरण, मशीनी अनुवाद और कई अन्य भाषा मॉडलिंग कार्यों के लिए किया गया था। लेकिन अब, इसका उपयोग वस्तु पहचान, छवि वर्गीकरण और कई अन्य कंप्यूटर विज़न कार्यों के लिए भी किया जाता है।

इस ट्यूटोरियल में, हम ट्रांसफॉर्मर का उपयोग करके टेक्स्ट वर्गीकरण करने की प्रक्रिया प्रदान करेंगे।

ट्रांसफॉर्मर का उपयोग करके टेक्स्ट वर्गीकरण कैसे करें?

ट्रांसफॉर्मर का उपयोग करके पाठ वर्गीकरण करने के लिए, सबसे पहले, 'स्थापित करें' ट्रान्सफ़ॉर्मर दिए गए आदेश को निष्पादित करके लाइब्रेरी:

! रंज स्थापित करना ट्रान्सफ़ॉर्मर

जैसा कि आप देख सकते हैं, निर्दिष्ट लाइब्रेरी सफलतापूर्वक स्थापित की गई है:

फिर, आयात करें ' पाइपलाइन ' से ' ट्रान्सफ़ॉर्मर ' पुस्तकालय:

ट्रांसफार्मर से पाइपलाइन आयात करते हैं

यहां ही ' पाइपलाइन इसमें एनएलपी कार्य शामिल होगा जिसे हमें निष्पादित करने की आवश्यकता है और टोकननाइज़र के साथ इस ऑपरेशन के लिए वांछित ट्रांसफार्मर मॉडल शामिल होगा।

टिप्पणी: टोकननाइज़र का उपयोग टेक्स्ट पर प्रसंस्करण करने के लिए किया जाता है ताकि टेक्स्ट को टोकन में अलग करके मॉडल का इनपुट प्रदान किया जा सके।

उसके बाद, ' का उपयोग करें पाइपलाइन() 'फ़ंक्शन करें और इसे पास करें' शून्य-शॉट-वर्गीकरण एक तर्क के रूप में. इसके बाद, एक और पैरामीटर पास करें जो हमारा मॉडल है। हम फेसबुक का उपयोग कर रहे हैं ' बार्ट ” ट्रांसफार्मर मॉडल। यहां, हम टोकननाइज़र का उपयोग नहीं करते हैं क्योंकि इसे निर्दिष्ट मॉडल द्वारा स्वचालित रूप से अनुमान लगाया जा सकता है:

text_classifier = पाइपलाइन ( 'शून्य-शॉट-वर्गीकरण' , नमूना = 'फ़ेसबुक/बार्ट-लार्ज-एमएनएलआई' )

अब, घोषित करें ' स्व-परीक्षा प्रश्न 'वेरिएबल जो हमारे इनपुट टेक्स्ट को रखता है जिसे वर्गीकृत करने की आवश्यकता है। फिर, हम वे श्रेणियाँ प्रदान करते हैं जिनमें हम पाठ को वर्गीकृत करना चाहते हैं और 'में सहेजना चाहते हैं' प्रयोगशाला जिसे लेबल के रूप में जाना जाता है:

स्व-परीक्षा प्रश्न = 'स्पष्टता, सुसंगतता और त्रुटि मुक्त सामग्री सुनिश्चित करने के लिए प्रूफरीडिंग और संपादन आवश्यक घटक हैं'
प्रयोगशाला = [ 'अद्यतन' , 'गलती' , 'महत्वपूर्ण' , 'सत्यापन' ]

अंत में, इनपुट के साथ पाइपलाइन चलाएँ:

text_classifier ( स्व-परीक्षा प्रश्न , प्रयोगशाला )

पाइपलाइन को क्रियान्वित करने के बाद, जैसा कि आप देख सकते हैं कि मॉडल ने हमारे प्रदत्त अनुक्रम को वर्गीकृत करने की भविष्यवाणी की है:

अतिरिक्त जानकारी: यदि आप मॉडल के प्रदर्शन को तेज़ करना चाहते हैं, तो आपको GPU का उपयोग करना होगा। यदि हां, तो, उस उद्देश्य के लिए, आप पाइपलाइन के लिए एक डिवाइस तर्क निर्दिष्ट कर सकते हैं और इसे 'पर सेट कर सकते हैं' 0 'जीपीयू का उपयोग करने के लिए।

यदि आप टेक्स्ट को एक से अधिक अनुक्रम/इनपुट टेक्स्ट स्टेटमेंट पर वर्गीकृत करना चाहते हैं, तो आप उन्हें एक सूची में जोड़ सकते हैं और इसे पाइपलाइनों में इनपुट के रूप में पास कर सकते हैं। उस उद्देश्य के लिए, कोड स्निपेट देखें:

स्व-परीक्षा प्रश्न = [ 'स्पष्टता, सुसंगतता और त्रुटि मुक्त सामग्री सुनिश्चित करने के लिए प्रूफरीडिंग और संपादन आवश्यक घटक हैं' ,
'इस आधुनिक युग में, लेखों को अच्छी रैंक देने और व्यापक दर्शकों तक पहुंचने के लिए एसईओ अनुकूलन आवश्यक है' ]

text_classifier ( स्व-परीक्षा प्रश्न , प्रयोगशाला )

उत्पादन

इतना ही! हमने ट्रांसफॉर्मर का उपयोग करके पाठ वर्गीकरण करने का सबसे आसान तरीका संकलित किया है।

निष्कर्ष

ट्रांसफार्मर का उपयोग भाषा मॉडलिंग कार्यों, जैसे पाठ निर्माण, पाठ वर्गीकरण और मशीन अनुवाद, साथ ही वस्तु पहचान और छवि वर्गीकरण सहित कंप्यूटर विज़न कार्यों को करने के लिए किया जाता है। इस ट्यूटोरियल में, हमने ट्रांसफॉर्मर का उपयोग करके टेक्स्ट वर्गीकरण करने की प्रक्रिया का वर्णन किया है।

ट्रांसफॉर्मर का उपयोग करके टेक्स्ट वर्गीकरण कैसे करें

ट्रांसफॉर्मर का उपयोग करके टेक्स्ट वर्गीकरण कैसे करें?

निष्कर्ष

श्रेणी

लोकप्रिय पोस्ट

लिनक्स पर हमाची को कैसे स्थापित और कॉन्फ़िगर करें

लिनक्स में hwinfo कमांड का उपयोग कैसे करें

सी # बिटवाइज़ लेफ्ट शिफ्ट (<<) ऑपरेटर

MATLAB में एक्सिस कैसे बदलें

सीएसएस पृष्ठभूमि बनाम पृष्ठभूमि-रंग

रास्पबेरी पाई पर गनोम सिस्टम मॉनिटर कैसे स्थापित करें

OpenAI का ज्यूकबॉक्स क्या है?

Arduino में टाइमर कैसे सेट करें?

Minecraft में गेम मोड कैसे बदलें

एंड्रॉइड पर मेरे पसंदीदा कहां हैं?

MATLAB में FFT क्या करता है?

Linux पर Hamachi नेटवर्क के लिए Haguichi GUI को कैसे इंस्टॉल और कॉन्फ़िगर करें

ESP32 DevKitC डुअल एंटीना क्या है - DEV-19900

विंडोज 7 में टास्कबार आइकॉन के लिए विंडो मेनू (रिस्टोर, मिनीमाइज, क्लोज) दिखाएं - Winhelponline

Git में GitHub पब्लिक रिपॉजिटरी को कैसे क्लोन करें?

सी प्रोग्रामिंग में बबल सॉर्ट कैसे लागू करें?

GUI का उपयोग करके Ubuntu 22.04 में छिपी हुई फ़ाइलों को कैसे प्रदर्शित करें

Java में Scanner.nextLine() क्या है

डॉकर में पोर्ट मैपिंग क्या है?

कुबेरनेट्स में लिनक्स sysctls का उपयोग कैसे करें