लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी कैसे जोड़ें?

चैटबॉट और बड़े भाषा मॉडल का उपयोग दुनिया भर में लाखों लोगों द्वारा किया जा रहा है और ये मॉडल कमांड पर टेक्स्ट उत्पन्न कर सकते हैं। लैंगचेन सबसे प्रभावी और कुशल ढाँचों में से एक है जो डेवलपर्स को ऐसे मॉडल और बॉट बनाने में सक्षम बनाता है। उपयोगकर्ता इनपुट के रूप में संकेत या प्रश्न देता है और मॉडल उस टेक्स्ट को उत्पन्न करने से पहले कमांड को समझता है जो कमांड से सबसे अधिक संबंधित या पसंद लगता है।

यह मार्गदर्शिका लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी जोड़ने की प्रक्रिया का वर्णन करेगी।

लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी कैसे जोड़ें?

नवीनतम संदेशों या डेटा को संग्रहीत करने के लिए मेमोरी को एलएलएम या चैटबॉट में जोड़ा जा सकता है ताकि मॉडल कमांड के संदर्भ को समझ सके। लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी जोड़ने की प्रक्रिया सीखने के लिए, बस निम्नलिखित चरणों से गुजरें:

चरण 1: मॉड्यूल स्थापित करें

सबसे पहले, लैंगचेन फ्रेमवर्क स्थापित करें क्योंकि इसमें भाषा मॉडल बनाने के लिए विभिन्न प्रकार की निर्भरताएँ हैं:

पाइप लैंगचैन स्थापित करें

क्रोमा वेक्टर स्टोर में मेमोरी द्वारा उपयोग किए गए डेटा को संग्रहीत करने के लिए क्रोमैडब स्थापित करें:

पाइप क्रोमैडबी स्थापित करें

टिकटोकन एक टोकननाइज़र है जिसका उपयोग बड़े दस्तावेज़ों के छोटे हिस्से बनाने के लिए किया जाता है ताकि उन्हें आसानी से प्रबंधित किया जा सके:

पिप टिकटोकन इंस्टॉल करें

OpenAI वह मॉड्यूल है जिसका उपयोग OpenAI() विधि का उपयोग करके चेन और एलएलएम बनाने के लिए किया जा सकता है:

पिप इंस्टाल ओपनाई

चरण 2: पर्यावरण सेटअप करें और डेटा अपलोड करें

इस प्रक्रिया के लिए सभी आवश्यक मॉड्यूल स्थापित करने के बाद अगला चरण है पर्यावरण की स्थापना OpenAI खाते से API कुंजी का उपयोग करना:

आयात आप
आयात पास ले लो

आप . लगभग [ 'OPENAI_API_KEY' ] = पास ले लो . पास ले लो ( 'ओपनएआई एपीआई कुंजी:' )

लैंगचेन फ्रेमवर्क में चेन बनाने के लिए फाइल लाइब्रेरी का उपयोग करके दस्तावेज़ अपलोड करें:

से गूगल। और अन्य आयात फ़ाइलें

अपलोड किए गए = फ़ाइलें. डालना ( )

चरण 3: पुस्तकालय आयात करें

एक बार दस्तावेज़ सफलतापूर्वक अपलोड हो जाने पर, बस लैंगचैन मॉड्यूल से आवश्यक लाइब्रेरी आयात करें:

से लैंगचैन. एम्बेडिंग . openai आयात ओपनएआईएम्बेडिंग्स

से लैंगचैन. एम्बेडिंग . अनुकूल होना आयात सहयहाँ एंबेडिंग

से लैंगचैन. टेक्स्ट_स्प्लिटर आयात कैरेक्टरटेक्स्टस्प्लिटर

से लैंगचैन. वेक्टरस्टोर्स . इलास्टिक_वेक्टर_खोज आयात इलास्टिकवेक्टर खोज

से लैंगचैन. वेक्टरस्टोर्स आयात क्रोमा

से लैंगचैन. डॉक्टर की दुकान . दस्तावेज़ आयात दस्तावेज़

चरण 4: क्रोमा डेटाबेस का उपयोग करके मेमोरी बनाना

अब, पहले अपलोड किए गए दस्तावेज़ के एम्बेडिंग और टोकन को संग्रहीत करने के लिए वेक्टर स्पेस बनाना शुरू करें:

साथ खुला ( 'state_of_the_union.txt' ) जैसा एफ:
संघ का राज्य = एफ। पढ़ना ( )
टेक्स्ट_स्प्लिटर = कैरेक्टरटेक्स्टस्प्लिटर ( खंड आकार = 1000 , खंड_ओवरलैप = 0 )
ग्रंथों = टेक्स्ट_स्प्लिटर. स्प्लिट_टेक्स्ट ( संघ का राज्य )

एम्बेडिंग = ओपनएआईएम्बेडिंग्स ( )

दस्तावेज़ से टेक्स्ट और एम्बेडिंग संग्रहीत करने के लिए क्रोमा डेटाबेस कॉन्फ़िगर करें:

दस्तावेज़खोज = क्रोमा. from_texts (

ग्रंथों , एम्बेडिंग , मेटाडेटा = [ { 'स्रोत' : मैं } के लिए मैं में श्रेणी ( केवल ( ग्रंथों ) ) ]

)

क्वेरी वेरिएबल में कमांड पूछकर मेमोरी का परीक्षण करें और फिर समानता_खोज() विधि निष्पादित करें:

सवाल = 'नाटो का गठन कब हुआ'

डॉक्स = दस्तावेज़खोज. समानता_खोज ( सवाल )

चरण 5: प्रॉम्प्ट टेम्पलेट कॉन्फ़िगर करना

यह चरण निम्नलिखित पुस्तकालयों को आयात करके संकेतों के लिए टेम्पलेट को कॉन्फ़िगर करने की प्रक्रिया की व्याख्या करता है:

से लैंगचैन. चेन . प्रश्न_उत्तर आयात लोड_क्यूए_चेन

से लैंगचैन. एलएमएस आयात ओपनएआई

से लैंगचैन. संकेतों आयात संकेत टेम्पलेट

से लैंगचैन. याद आयात कन्वर्सेशनबफरमेमोरी

उसके बाद, बस क्वेरी के लिए टेम्पलेट या संरचना को कॉन्फ़िगर करें और मॉडल में मेमोरी जुड़ने के बाद श्रृंखला चलाएं:

खाका = '''आप एक मॉडल हैं जो एक इंसान के साथ बातचीत कर रही हैं
एक लंबे दस्तावेज़ और एक प्रश्न से निकाले गए अंशों को देखते हुए, एक अंतिम उत्तर बनाएं

{प्रसंग}

{इतिहास}
मानव: {इनपुट}
चैटबॉट:'''

तत्पर = संकेत टेम्पलेट (
इनपुट_चर = [ 'इतिहास' , 'इनपुट' , 'प्रसंग' ] , खाका = खाका
)
याद = कन्वर्सेशनबफरमेमोरी ( मेमोरी_कुंजी = 'इतिहास' , इनपुट_कुंजी = 'इनपुट' )
जंजीर = लोड_क्यूए_चेन (
ओपनएआई ( तापमान = 0 ) , श्रृंखला_प्रकार = 'सामग्री' , याद = याद , तत्पर = तत्पर
)

चरण 6: मेमोरी का परीक्षण

यहां क्वेरी वेरिएबल का उपयोग करके प्रश्न पूछकर और फिर उसके मापदंडों के साथ चेन() विधि निष्पादित करके मॉडल का परीक्षण करने का समय है:

सवाल = 'नाटो का गठन कब हुआ'

जंजीर ( { 'input_documents' : दस्तावेज़ , 'इनपुट' : सवाल } , वापसी_केवल_आउटपुट = सत्य )

बफर मेमोरी में संग्रहीत डेटा को प्रिंट करें क्योंकि मॉडल द्वारा दिया गया उत्तर हाल ही में मेमोरी में संग्रहीत है:

छपाई ( जंजीर। याद . बफर )

यह सब लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी जोड़ने के बारे में है।

निष्कर्ष

लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी जोड़ने के लिए, बस टेक्स्ट और एम्बेडिंग को स्टोर करने के लिए मॉड्यूल और वेक्टर स्टोर स्थापित करें। उसके बाद, स्थानीय सिस्टम से डेटा/दस्तावेज़ अपलोड करें और फिर एलएलएम के लिए मेमोरी बनाने के लिए डेटा संग्रहीत करने के लिए आवश्यक लाइब्रेरी आयात करें। नवीनतम संदेशों को बफ़र मेमोरी में संग्रहीत करने के लिए प्रॉम्प्ट टेम्पलेट कॉन्फ़िगर करें और फिर श्रृंखला को टेक्स्ट करें। इस गाइड में लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी जोड़ने की प्रक्रिया के बारे में विस्तार से बताया गया है।

लैंगचेन में एकाधिक इनपुट वाली श्रृंखला में मेमोरी कैसे जोड़ें?