सेलेनियम के साथ वर्तमान URL कैसे प्राप्त करें

How Get Current Url With Selenium



सेलेनियम ब्राउज़र परीक्षण, वेब स्वचालन और वेब स्क्रैपिंग के लिए एक उपकरण है। अपने सेलेनियम प्रोजेक्ट्स पर काम करते समय, आपको उस पेज का URL जानने की आवश्यकता हो सकती है जिसे आपका सेलेनियम नियंत्रित वेब ब्राउज़र प्रदर्शित कर रहा है। यह जानकारी उस URL का ट्रैक रखने के लिए उपयोगी हो सकती है जहां से आपने कुछ डेटा निकाला है ताकि आप कुछ स्क्रिप्ट का उपयोग करके डेटा को स्वचालित रूप से अपडेट करने में सक्षम हो सकें।

इस लेख में, मैं आपको दिखाने जा रहा हूं कि सेलेनियम के साथ ब्राउज़र का वर्तमान URL कैसे प्राप्त करें। तो चलो शुरू हो जाओ।







पूर्वापेक्षाएँ:

इस आलेख के आदेशों और उदाहरणों को आज़माने के लिए, आपके पास होना चाहिए,



1) आपके कंप्यूटर पर एक लिनक्स वितरण (अधिमानतः उबंटू) स्थापित है।
2) आपके कंप्यूटर पर Python 3 स्थापित है।
3) आपके कंप्यूटर पर PIP 3 स्थापित है।
4)पायथन वर्चुअलएन्व पैकेज आपके कंप्यूटर पर स्थापित है।
5) मोज़िला फ़ायरफ़ॉक्स या Google क्रोम वेब ब्राउज़र आपके कंप्यूटर पर स्थापित हैं।
6) पता होना चाहिए कि फ़ायरफ़ॉक्स गेको ड्राइवर या क्रोम वेब ड्राइवर कैसे स्थापित करें।



४, ५, और ६ की आवश्यकताओं को पूरा करने के लिए, कृपया मेरा लेख पढ़ें पायथन 3 के साथ सेलेनियम का परिचय Linuxhint.com पर।





आप अन्य विषयों पर कई लेख पा सकते हैं LinuxHint.com . यदि आपको किसी सहायता की आवश्यकता हो तो उनकी जाँच अवश्य करें।

एक परियोजना निर्देशिका की स्थापना:

सब कुछ व्यवस्थित रखने के लिए, एक नई परियोजना निर्देशिका बनाएं सेलेनियम-यूआरएल/ निम्नलिखित नुसार:



$एमकेडीआईआर -पीवीसेलेनियम-यूआरएल/ड्राइवरों

पर नेविगेट करें सेलेनियम-यूआरएल/ परियोजना निर्देशिका इस प्रकार है:

$सीडीसेलेनियम-यूआरएल/

प्रोजेक्ट डायरेक्टरी में एक पायथन वर्चुअल वातावरण इस प्रकार बनाएँ:

$वर्चुअलएन्व .venv

वर्चुअल वातावरण को निम्नानुसार सक्रिय करें:

$स्रोत.venv/पूर्वाह्न/सक्रिय

PIP3 का उपयोग करके अपने आभासी वातावरण में सेलेनियम पायथन लाइब्रेरी को निम्नानुसार स्थापित करें:

$ pip3 सेलेनियम स्थापित करें

में सभी आवश्यक वेब ड्राइवर डाउनलोड और इंस्टॉल करें ड्राइवर/ परियोजना की निर्देशिका। मैंने अपने लेख में वेब ड्राइवरों को डाउनलोड करने और स्थापित करने की प्रक्रिया के बारे में बताया है पायथन 3 के साथ सेलेनियम का परिचय . अगर आपको किसी सहायता की आवश्यकता है, तो खोजें LinuxHint.com उस लेख के लिए।

मैं इस लेख में प्रदर्शन के लिए Google Chrome वेब ब्राउज़र का उपयोग करूंगा। तो, मैं का उपयोग करूंगा क्रोमड्राइवर सेलेनियम के साथ बाइनरी। आपको का उपयोग करना चाहिए छिपकली चालक बाइनरी यदि आप फ़ायरफ़ॉक्स वेब ब्राउज़र का उपयोग करना चाहते हैं।

एक पायथन लिपि बनाएँ ex01.py अपनी परियोजना निर्देशिका में और उसमें कोड की निम्न पंक्तियों में टाइप करें।

सेसेलेनियमआयातवेबड्राइवर
सेसेलेनियमवेबड्राइवर.सामान्य.चांबियाँ आयातचांबियाँ
विकल्प=वेबड्राइवर।क्रोम विकल्प()
विकल्प।नेतृत्वहीन = सत्य
ब्राउज़र=वेबड्राइवर।क्रोम(निष्पादन योग्य_पथ='./ड्राइवर/क्रोमड्राइवर',विकल्प=विकल्प)
ब्राउज़र।पाना('https://duckduckgo.com/')
प्रिंट(ब्राउज़र।current_url)
ब्राउज़र।बंद करे()

एक बार जब आप कर लें, तो सहेजें ex01.py पायथन लिपि।

यहां, लाइन 1 और लाइन 2 पायथन सेलेनियम लाइब्रेरी से सभी आवश्यक घटकों को आयात करते हैं।

पंक्ति 4 एक क्रोम विकल्प ऑब्जेक्ट बनाती है, और पंक्ति 5 क्रोम वेब ब्राउज़र के लिए हेडलेस मोड को सक्षम करती है।

लाइन 7 एक क्रोम बनाता है ब्राउज़र वस्तु का उपयोग कर क्रोमड्राइवर से द्विआधारी ड्राइवर/ परियोजना की निर्देशिका।

लाइन 9 ब्राउज़र को duckduckgo.com वेबसाइट को लोड करने के लिए कहती है।

पंक्ति 10 ब्राउज़र के वर्तमान URL को प्रिंट करती है। यहां, ब्राउज़र.current_url संपत्ति का उपयोग ब्राउज़र के वर्तमान URL तक पहुँचने के लिए किया जाता है।

लाइन 12 ब्राउज़र को बंद कर देती है।

पायथन लिपि चलाएँ ex01.py निम्नलिखित नुसार:

$ python3 ex01.पीयू

जैसा कि आप देख सकते हैं, वर्तमान URL ( https://duckduckgo.com ) कंसोल पर प्रिंट होता है।

पहले के उदाहरण में, मैंने डकडकगो.कॉम वेबसाइट देखी है और कंसोल पर वर्तमान यूआरएल मुद्रित किया है। यह उस पृष्ठ का URL देता है जिसे हम देख रहे हैं। बहुत फैंसी नहीं है क्योंकि हम पहले से ही पेज यूआरएल जानते हैं। अब, DuckDuckGo पर कुछ खोजते हैं और कंसोल पर खोज परिणाम पृष्ठ के URL को प्रिंट करने का प्रयास करते हैं।

एक पायथन लिपि बनाएँ ex02.py अपनी परियोजना निर्देशिका में और उसमें कोड की निम्न पंक्तियों में टाइप करें।

सेसेलेनियमआयातवेबड्राइवर
सेसेलेनियमवेबड्राइवर.सामान्य.चांबियाँ आयातचांबियाँ
विकल्प=वेबड्राइवर।क्रोम विकल्प()
विकल्प।नेतृत्वहीन = सत्य
ब्राउज़र=वेबड्राइवर।क्रोम(निष्पादन योग्य_पथ='./ड्राइवर/क्रोमड्राइवर',विकल्प=विकल्प)
ब्राउज़र।पाना('https://duckduckgo.com/')
प्रिंट(ब्राउज़र।current_url)
खोज इनपुट=ब्राउज़र।find_element_by_id('खोज_फॉर्म_इनपुट_होमपेज')
खोज इनपुटभेजें_कुंजी('सेलेनियम मुख्यालय'+ कुंजियाँ।प्रवेश करना)
प्रिंट(ब्राउज़र।current_url)
ब्राउज़र।बंद करे()

एक बार जब आप कर लें, तो सहेजें ex02.py पायथन लिपि।

यहाँ, पंक्तियाँ 1-10 वही हैं जो in ex01.py . इसलिए, मैं उन्हें दोबारा नहीं समझा रहा हूं।

पंक्ति 12 खोज टेक्स्टबॉक्स ढूंढती है और उसे इसमें संग्रहीत करती है खोज इनपुट चर।

पंक्ति १३ खोज क्वेरी भेजती है सेलेनियम मुख्यालय में खोज इनपुट टेक्स्ट बॉक्स और दबाता है कुंजी का उपयोग कुंजियाँ.ENTER .

एक बार खोज पृष्ठ लोड हो जाने पर, ब्राउज़र.current_url अद्यतन वर्तमान URL तक पहुँचने के लिए उपयोग किया जाता है।

लाइन 15 कंसोल पर अद्यतन वर्तमान URL को प्रिंट करता है।

लाइन 17 ब्राउज़र को बंद कर देती है।

चलाएं ex02.py पायथन लिपि इस प्रकार है:

$ python3 ex02.पीयू

जैसा कि आप देख सकते हैं, पायथन लिपि ex02.py 2 यूआरएल प्रिंट करता है।

पहला डकडकगो सर्च इंजन का होमपेज यूआरएल है।

दूसरा अद्यतन वर्तमान URL है जो क्वेरी का उपयोग करके डकडकगो खोज इंजन पर खोज करने के बाद है सेलेनियम मुख्यालय .

निष्कर्ष:

इस लेख में, मैंने आपको सेलेनियम पायथन लाइब्रेरी का उपयोग करके वेब ब्राउज़र का वर्तमान URL प्राप्त करने का तरीका दिखाया है। अब, आप अपनी सेलेनियम परियोजनाओं को और अधिक रोचक बनाने में सक्षम होना चाहिए।