विंडोज़ पर टेस्सेक्ट कैसे स्थापित करें

Vindoza Para Tes Sekta Kaise Sthapita Karem



Tesseract एक स्वतंत्र रूप से उपलब्ध ओपन-सोर्स टेक्स्ट रिकग्निशन टूल है जिसे OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) के रूप में भी जाना जाता है। यह मुख्य रूप से छवियों से टेक्स्ट को पहचानने और निकालने के लिए उपयोग किया जाता है। यह छवि डेटा से पाठ पढ़ेगा और एक नई .txt फ़ाइल में आउटपुट लिखेगा। Tesseract भी Python के तहत काम कर रहा है, क्योंकि इसका उपयोग मुख्य रूप से छवियों से लिखावट को पहचानने के लिए किया जाता है। यह LSTR (लॉन्ग शॉर्ट-टर्म मेमोरी) मॉडल का उपयोग कर रहा है। Tesseract Apache 2.0 लाइसेंस के तहत काम कर रहा है।

हम इस ब्लॉग में विंडोज पर Tesseract को स्थापित करने की विधि के बारे में विस्तार से बताएंगे।







तो चलो शुरू करते है!



विंडोज़ पर टेस्सेक्ट कैसे स्थापित करें?

Tesseract एक कमांड लाइन टूल है जिसका उपयोग इमेज से टेक्स्ट एक्सट्रैक्शन के लिए किया जाता है। विंडोज़ पर टेस्सेक्ट को स्थापित करने के लिए, आपको नीचे दिए गए निर्देशों का पालन करना होगा।



चरण 1: टेस्सेक्ट इंस्टालर डाउनलोड करें





सबसे पहले, नीचे दिए गए लिंक पर नेविगेट करें और अपने सिस्टम विनिर्देश के अनुसार Tesseract इंस्टॉलर डाउनलोड करें:

https: // github.com / यूबी-मैनहेम / टेसेरैक्ट / सप्ताह



चरण 2: टेस्सेक्ट इंस्टालर चलाएँ

दौरा करना ' डाउनलोड निर्देशिका जहां Tesseract इंस्टॉलर डाउनलोड किया गया है। विंडोज़ पर Tesseract स्थापित करने के लिए, Tesseract इंस्टॉलर पर डबल क्लिक करके निष्पादित करें:

चरण 3: भाषा चुनें

कई भाषाएं Tesseract इंस्टॉलर द्वारा समर्थित हैं। इंस्टालर यूआई के साथ बातचीत करने के लिए, 'चुनें' अंग्रेज़ी 'अपनी भाषा के रूप में और' पर क्लिक करें ठीक है ':

चरण 4: टेस्सेक्ट स्थापित करें

ऐसा करने पर, स्क्रीन पर Tesseract OCR सेटअप विजार्ड दिखाई देगा। Tesseract की स्थापना शुरू करने के लिए, हिट करें ' अगला ' बटन:

स्वीकार करने के लिए ' लाइसेंस समझौता ', क्लिक करें ' मैं सहमत हूं ' बटन:

को चुनिए ' इस कंप्यूटर का उपयोग करने वाले सभी लोगों के लिए स्थापित 'विकल्प और' दबाएं अगला ' बटन:

यदि आप स्क्रिप्ट डेटा जोड़ना चाहते हैं या कोई अन्य भाषा शामिल करना चाहते हैं, तो उनके संबंधित चेकबॉक्स को चिह्नित करें और ' अगला ' बटन। चूंकि हम कोई अतिरिक्त डेटा स्क्रिप्ट या भाषा नहीं चाहते हैं, इसलिए हम डिफ़ॉल्ट चयनित विकल्पों के साथ जारी रखेंगे:

स्थापना स्थान चुनें और 'पर क्लिक करें' अगला ' बटन:

यदि आप प्रारंभ मेनू में शॉर्टकट नहीं बनाना चाहते हैं, तो 'चिह्नित करें' शॉर्टकट नहीं बनाएं 'चेकबॉक्स और दबाएं' स्थापित करना ' बटन:

उसके बाद, Tesseract की स्थापना शुरू हो जाएगी। स्थापना पूर्ण होने तक प्रतीक्षा करें और हिट करें ' अगला ' बटन:

अंत में, 'पर क्लिक करें खत्म करना ' बटन:

चरण 5: पर्यावरण चर सेट करें

स्थापना के बाद, आपको Tesseract के पर्यावरण चर को सेट करने की आवश्यकता है। ऐसा करने के लिए, सबसे पहले उस निर्देशिका पर जाएँ जहाँ आपने Tesseract स्थापित किया है और 'से पथ की प्रतिलिपि बनाएँ' पता ' छड़:

के लिए खोज करें ' पर्यावरण चर ' में ' चालू होना 'मेनू और खोलें' सिस्टम पर्यावरण चर संपादित करें ':

सेटिंग्स के अंदर, नेविगेट करें ' विकसित 'सेटिंग मेनू और' पर क्लिक करें पर्यावरण चर ' बटन:

चुनना ' रास्ता 'से चर' सिस्टम चर 'पैनल, और हिट' संपादन करना ' बटन:

इसके बाद ' पर्यावरण चर संपादित करें 'विंडो स्क्रीन पर दिखाई देगी। दबाएं ' नया ” बटन पर क्लिक करें और कॉपी किए गए Tesseract इंस्टॉलेशन डायरेक्टरी पाथ को यहां पेस्ट करें। अंत में, 'पर क्लिक करें ठीक है ' बटन:

चरण 6: टेसेरैक्ट इंस्टॉलेशन सत्यापित करें

Tesseract स्थापना को सत्यापित करने के लिए, 'खोज कर विंडोज कमांड प्रॉम्प्ट खोलें' सही कमाण्ड ' में ' चालू होना ' मेन्यू:

प्रदान की गई कमांड का उपयोग करके टेस्सेक्ट संस्करण देखें:

> टेसेरैक्ट --संस्करण

नीचे दिया गया आउटपुट इंगित करता है कि हमने सफलतापूर्वक Tesseract संस्करण स्थापित किया है ' v5.2.0 विंडोज़ पर:

विंडोज पर Tesseract का उपयोग कैसे करें, यह जानने के लिए आइए आगे बढ़ते हैं।

विंडोज़ पर टेस्सेक्ट का उपयोग कैसे करें?

Tesseract का उपयोग हस्तलेखन पढ़ने या चित्रों से पाठ निकालने के लिए किया जाता है। आइए देखें कि यह कैसे काम करता है:

चरण 1: छवि का चयन करें

उस छवि का चयन करें जिससे आप टेक्स्ट निकालना चाहते हैं। जैसा कि हमने चुना है ' 1.png ':

चरण 2: छवि से पाठ निकालें

एक बार सीएमडी खुल जाता है। का उपयोग करें ' सीडी ' उस निर्देशिका को बदलने का आदेश जहां छवि संग्रहीत है। फिर चलाएं ' टेसेरैक्ट 'जैसा कि हमने निर्दिष्ट किया है, छवि फ़ाइल नाम को कमांड और परिभाषित करें' 1.png ' ' मूलपाठ 'पैरामीटर शो आउटपुट फ़ाइल के नाम को दर्शाता है:

> सीडी C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> टेसेरैक्ट 1 पीएनजी 'मूलपाठ'

चरण 3: टेक्स्ट एक्सट्रैक्शन सत्यापित करें

टेक्स्ट निष्कर्षण को सत्यापित करने के लिए, उस निर्देशिका को नेविगेट करें जहां छवि फ़ाइल मौजूद है। आप देख सकते हैं कि आउटपुट फ़ाइल ' मूलपाठ 'यहाँ भी सहेजा गया है। टेस्सेक्ट ने छवि से टेक्स्ट निकाला है या नहीं, यह जांचने के लिए आउटपुट फ़ाइल पर डबल क्लिक करें:

आप देख सकते हैं कि हमने Tesseract कमांड लाइन टूल का उपयोग करके टेक्स्ट को सफलतापूर्वक निकाला है:

हमने विंडोज़ पर Tesseract को स्थापित करने और उपयोग करने की तकनीक का प्रदर्शन किया है।

निष्कर्ष

विंडोज़ पर Tesseract को स्थापित करने के लिए, Tesseract इंस्टॉलर को डाउनलोड करना आवश्यक है। इस उद्देश्य के लिए, इस लेख के पहले सत्र का पालन करें। इसके बाद विंडोज कमांड प्रॉम्प्ट से Tesseract का उपयोग करने और उस तक पहुंचने के लिए पथ पर्यावरण चर सेट करें। फिर, छवि फ़ाइल का चयन करें और “का उपयोग करें” टेसेरैक्ट 'छवि से पाठ को पहचानने और निकालने का आदेश। यहां, आपने 'इंस्टॉल करना और साथ ही' का उपयोग करना सीखा है टेसेरैक्ट 'खिड़कियों पर।