Microsoft का VisualGPT एक नई तकनीक जारी करता है' विजुअलजीपीटी “यह एआई की उन्नति है और दृश्यों और भाषा के बीच के अंतर को पाटकर अधिक आकर्षक और इंटरैक्टिव एआई अनुभवों की संभावनाओं को खोलता है।
विज़ुअलजीपीटी क्या है?
विजुअलजीपीटी, चैटजीपीटी का एक विस्तारित संस्करण है जो एनएलपी (प्राकृतिक भाषा प्रसंस्करण) मॉडल पर आधारित है, लेकिन विजुअलजीपीटी में, वीएफएमएस का उपयोग किया जाता है जो टेक्स्ट क्वेरी को छवि रूप में परिवर्तित कर सकता है। यह ऐसा है कि यह टेक्स्ट और छवि प्रश्नों का संयोजन/एकीकरण है।
विजुअलजीपीटी का उद्देश्य
बाजार में चैटजीपीटी के जारी होने के बाद, जो केवल पाठ्य प्रारूप पर काम कर रहा था, उन्नति के अगले स्तर को प्राप्त करने के लिए एक आदर्श उपकरण है जो इन सभी कारणों का पालन करते हुए और एआई की दौड़ में पाठ्य से ग्राफिकल प्रारूप पर काम करेगा। उन्नति माइक्रोसॉफ्ट ने विजुअलजीपीटी जारी किया विजुअलजीपीटी का मुख्य उद्देश्य उपयोगकर्ता की मांग पर एआई छवियां बनाना या छवि का विश्लेषण करना है
विजुअलजीपीटी की वास्तुकला
विजुअलजीपीटी में उपयोगकर्ता क्वेरी, प्रॉम्प्ट मैनेजर, विजुअल फाउंडेशन मॉडल (वीएफएम), सिस्टम सिद्धांत, संवाद का इतिहास, तर्क का इतिहास और मध्यवर्ती उत्तर शामिल हैं।
अगर हम विशेष रूप से इसके मॉडल के बारे में बात करें तो, “ वीएफएम (विजुअल फाउंडेशन मॉडल) ”, लगभग 22 वीएफएम का उपयोग किया जाता है, जैसे बीएलआईपी (बूटस्ट्रैपिंग लैंग्वेज-इमेज प्री-ट्रेनिंग), और स्टेबल डिफ्यूजन।
विज़ुअल चैटजीपीटी कैसे चलाएं?
विज़ुअल चैटजीपीटी चलाने के लिए, निम्नलिखित चरणों पर विचार करें:
चरण 1: एक वातावरण बनाएँ
सबसे पहले, आपको Python संस्करण 3.8 का एक वातावरण बनाना होगा:
आयात sys
sys.path.append ( '/usr/local/lib/python3.8/site-packages' )
चरण 2: विज़ुअल चैटजीपीटी फ़ाइल को क्लोन करें
अब, निम्नलिखित कमांड का उपयोग करके GitHub से विज़ुअल ChatGPT फ़ाइल को क्लोन करें:
! गिट क्लोन https: // github.com / deepanshu88 / विजुअल-चैटgpt.git
चरण 3: एक नई निर्देशिका सेटअप करें
उसके बाद, नीचे दिए गए आदेश के माध्यम से एक नई निर्देशिका सेट करें:
% सीडी दृश्य-चैटजीपीटीचरण 4: आवश्यक पैकेज स्थापित करें
अब, 'का उपयोग करके आवश्यक पैकेज स्थापित करें रंज ” सीएमडीलेट:
! कर्ल https: // बूटस्ट्रैप.pypa.io / get-pip.py -ओ get-pip.py! Python3.8 get-pip.py
! पायथन3.8 -एम रंज स्थापित करना -आर आवश्यकताएँ.txt
चरण 5: OpenAI API तक पहुंचें
प्रारंभिक पैकेज स्थापित करने के बाद, 'platform.openai.com' से एपीआई कुंजी प्राप्त करके और प्रमाणित एपीआई कॉल करके ओपनएआई एपीआई तक पहुंचें:
% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxचरण 6: मॉडल चुनें
अंत में, ओपनई तक पहुंचने के बाद मॉडल चुनें, 20 से अधिक मॉडल हैं जो विजुअलजीपीटी में उपयोग किए जाते हैं जिन्हें आप अपनी आवश्यकता के अनुसार चुन सकते हैं:
! पायथन3.8 . / Visual_chatgpt.py --भार Text2Image_cuda: 0उपरोक्त आदेश में, “ टेक्स्ट2इमेज ' उपयोग किए जाने वाले मॉडल से मेल खाता है। अधिक जानकारी के लिए इस Google Colab को देखें स्मरण पुस्तक .
निष्कर्ष
चैटजीपीटी को किसी भी प्रश्न के बारे में विशिष्ट उत्तर प्राप्त करने के लिए पेश किया गया था और अब माइक्रोसॉफ्ट ने विजुअलजीपीटी लॉन्च किया है जो पाठ्य के साथ-साथ चित्रात्मक डेटा से निपटने में सक्षम है। यह ऐसा है कि उपयोगकर्ता अपनी आवश्यकताओं को केवल पाठ्य रूप में जोड़ सकता है और इसका ग्राफिकल आउटपुट प्राप्त कर सकता है।