सिस्टम व्यवस्थापकों के लिए 30 Grep उदाहरण

30 Grep Examples System Admins



आप यूनिक्स और यूनिक्स जैसे ऑपरेटिंग सिस्टम के जानवरों के मस्तिष्क के अंदर मौजूद grep पा सकते हैं। यह पैटर्न मिलान के लिए उपयोग किया जाने वाला एक बुनियादी कार्यक्रम है और इसे 70 के दशक में बाकी UNIX टूल के साथ लिखा गया था जिसे हम जानते हैं और प्यार (या नफरत) करते हैं।

जबकि औपचारिक भाषाओं और नियमित अभिव्यक्तियों के बारे में सीखना एक रोमांचक विषय है। रेगेक्स की तुलना में ग्रेप सीखना इसके लिए बहुत अधिक है। इसके साथ शुरुआत करने के लिए और grep की सुंदरता और लालित्य को देखने के लिए आपको पहले कुछ वास्तविक दुनिया के उदाहरण देखने होंगे।







उदाहरण जो आसान हैं और आपके जीवन को थोड़ा आसान बनाते हैं। यहां 30 ऐसे grep सामान्य उपयोग के मामले और विकल्प दिए गए हैं।



1. पीएस ऑक्स | ग्रेप

पीएस ऑक्स सभी प्रक्रियाओं और उनके संबंधित पिड्स को सूचीबद्ध करता है। लेकिन अक्सर यह सूची मनुष्य के निरीक्षण के लिए बहुत लंबी होती है। आउटपुट को एक grep कमांड में पाइप करके आप एक बहुत ही विशिष्ट एप्लिकेशन को ध्यान में रखते हुए चल रही प्रक्रियाओं को सूचीबद्ध कर सकते हैं। उदाहरण के लिए sshd या nginx या httpd हो सकता है।



# पीएस से | ग्रेप sshd
जड़400 0.0 0.2 ६९९४४ 5624? एस एस17:47 0: 00/usr/sbin/एसएसएचडी-डी
जड़१०७६ 0.2 0.3 ९५२०४ ६८१६? एस एस१८:29 0:00 sshd: रूट@अंक/0
जड़१०९३ 0.0 0.0 १२७८४ 932अंक/0एस+१८:29 0: 00पकड़एसएसएचडी

2. अपने आईपी पते को टटोलना

अधिकांश ऑपरेटिंग सिस्टम में आप अपने सभी नेटवर्क इंटरफेस और आईपी को सूचीबद्ध कर सकते हैं जो उस इंटरफेस को सौंपा गया है या तो कमांड ifconfig या ip addr का उपयोग करके। ये दोनों कमांड बहुत सारी अतिरिक्त जानकारी आउटपुट करेंगे। लेकिन अगर आप केवल आईपी एड्रेस (शेल स्क्रिप्ट के लिए कहें) प्रिंट करना चाहते हैं तो आप नीचे दिए गए कमांड का उपयोग कर सकते हैं:





$आईपी ​​​​अतिरिक्त | पकड़मंत्रिमंडल| awk '{प्रिंट $2; }'
$आईपी ​​​​अतिरिक्त | पकड़ -मेंमंत्रिमंडल| awk '{प्रिंट $2; }' #इनसेट नहीं inet6 (IPv6) वाली पंक्तियों के लिए

ip addr कमांड को सभी विवरण (आईपी पते सहित) मिलते हैं, फिर इसे दूसरे कमांड grep inet पर पाइप किया जाता है जो केवल उन पंक्तियों को आउटपुट करता है जिनमें inet होता है। इसके बाद इसे awk प्रिंट में उस स्टेटमेंट को प्रिंट किया जाता है जो प्रत्येक पंक्ति में दूसरे शब्द को प्रिंट करता है (इसे सीधे शब्दों में कहें तो)।

पुनश्च: यदि आप awk अच्छी तरह से जानते हैं तो आप इसे बिना grep के भी कर सकते हैं।



3. असफल SSH प्रयासों को देखते हुए

यदि आपके पास एक सार्वजनिक आईपी के साथ एक इंटरनेट का सामना करने वाला सर्वर है, तो यह लगातार एसएसएच प्रयासों के साथ बमबारी करेगा और यदि आप उपयोगकर्ताओं को पासवर्ड आधारित एसएसएच एक्सेस (एक नीति जिसकी मैं अनुशंसा नहीं करता) की अनुमति देता हूं, तो आप ऐसे सभी असफल प्रयासों का उपयोग करके देख सकते हैं निम्नलिखित grep कमांड:

# बिल्ली /var/log/auth.log | ग्रेप विफल
नमूना बाहर रखा
दिसम्बर5 16:बीस:03 डेबियन sshd[509]:असफल पासवर्डके लिये१९२.१६८.०.१०० पोर्ट से रूट52374ssh2
दिसम्बर5 16:बीस:07 डेबियन sshd[509]:असफल पासवर्डके लिये१९२.१६८.०.१०० पोर्ट से रूट52374ssh2
दिसम्बर5 16:बीस:ग्यारहडेबियन sshd[509]:असफल पासवर्डके लिये१९२.१६८.०.१०० पोर्ट से रूट52374ssh2

4. पाइपिंग Grep को Uniq

कभी-कभी, grep बहुत सारी जानकारी आउटपुट करेगा। उपरोक्त उदाहरण में, हो सकता है कि कोई एकल IP आपके सिस्टम में प्रवेश करने का प्रयास कर रहा हो। ज्यादातर मामलों में, केवल कुछ ही ऐसे अपमानजनक आईपी होते हैं जिन्हें आपको विशिष्ट रूप से पहचानने और ब्लैकलिस्ट करने की आवश्यकता होती है।

#बिल्ली /कहां/लॉग/auth.log| पकड़ 'विफल' | यूनीक्यू -एफ 3

uniq कमांड को केवल यूनिक लाइन्स को प्रिंट करना चाहिए। uniq -f 3 पहले तीन क्षेत्रों को छोड़ देता है (टाइमस्टैम्प को अनदेखा करने के लिए जो कभी दोहराया नहीं जाता है) और फिर अद्वितीय लाइनों की तलाश शुरू कर देता है।

5. त्रुटि संदेशों के लिए ग्रीपिंग

पहुँच और त्रुटि लॉग के लिए Grep का उपयोग केवल SSH तक ही सीमित नहीं है। वेब सर्वर (जैसे Nginx) लॉग एरर और एक्सेस लॉग काफी सावधानी से करते हैं। यदि आप मॉनिटरिंग स्क्रिप्ट सेट करते हैं जो आपको अलर्ट भेजती है जब grep 404 एक नया मान लौटाता है। यह काफी उपयोगी हो सकता है।

# grep -w '404' /var/www/nginx/access.log

१९२.१६८.०.१०० - -[06/दिसम्बर/2018: 02:बीस:29+0530] 'प्राप्त करें /favicon.ico HTTP/1.1' ४०४ 200
'http://192.168.0.102/' 'मोज़िला/5.0 (Windows NT 10.0; Win64; x64)
AppleWebKit/537.36 (KHTML, छिपकली की तरह) Chrome/70.0.3538.110 Safari/537.36'


१९२.१६८.०.१०१ - -[06/दिसम्बर/2018: 02:चार पांच:16+0530] 'प्राप्त करें /favicon.ico HTTP/1.1' ४०४ 143
'http://192.168.0.102/' 'मोज़िला/5.0 (iPad; CPU OS 12_1 जैसे Mac OS X)
AppleWebKit/605.1.15 (KHTML, छिपकली की तरह) संस्करण/12.0 मोबाइल/15E148 सफारी/604.1'

रेगेक्स 404 नहीं हो सकता है लेकिन केवल मोबाइल क्लाइंट या वेबपृष्ठ देखने वाले ऐप्पल डिवाइस के लिए कुछ अन्य रेगेक्स फ़िल्टरिंग हो सकता है। इससे आप इस बारे में गहन जानकारी प्राप्त कर सकते हैं कि आपका ऐप कैसा प्रदर्शन कर रहा है।

6. पैकेज लिस्टिंग

डेबियन आधारित सिस्टम के लिए, dpkg -l आपके सिस्टम पर संस्थापित सभी संकुलों को सूचीबद्ध करता है। किसी विशिष्ट एप्लिकेशन से संबंधित पैकेजों को देखने के लिए आप उसे एक grep कमांड में पाइप कर सकते हैं। उदाहरण के लिए:

#डीपीकेजी -NS | पकड़ 'मैं आया'

7. grep -v फ़ाइलनाम

उन सभी पंक्तियों को सूचीबद्ध करने के लिए जो मत करो दिए गए पैटर्न को शामिल करें, ध्वज -v का उपयोग करें। यह मूल रूप से एक नियमित grep कमांड के विपरीत है।

8. ग्रेप -एल

यह उन सभी फाइलों को सूचीबद्ध करता है जिनमें आपूर्ति किए गए पैटर्न की कम से कम एक घटना होती है। यह तब उपयोगी होता है जब आप एक निर्देशिका के अंदर एक से अधिक फाइलों के साथ एक पैटर्न की खोज कर रहे होते हैं। यह केवल फ़ाइल नाम प्रिंट करता है, न कि पैटर्न के साथ विशिष्ट लाइन।

9. एकल शब्द विकल्प -w

$पकड़ -में <प्रतिरूप>फ़ाइल नाम

-w ध्वज दिए गए पैटर्न को संपूर्ण शब्द के रूप में देखने के लिए grep को बताता है, न कि केवल एक पंक्ति के विकल्प के रूप में। उदाहरण के लिए, पहले हमने आईपी एड्रेस और पैटर्न के लिए ग्रीप किया था मंत्रिमंडल दोनों के साथ लाइनों को मुद्रित किया मंत्रिमंडल तथा inet6 IPv4 और IPv6 दोनों पतों को सूचीबद्ध करना। लेकिन अगर हम इस्तेमाल करते हैं -w केवल लाइनों के साथ ध्वजांकित करें मंत्रिमंडल एक शब्द के रूप में पहले और उसके बाद सफेद रिक्त स्थान एक मान्य मिलान है।

10. विस्तारित नियमित अभिव्यक्ति

आप अक्सर पाएंगे कि ग्रीप के मूल निवासी रेगुलर एक्सप्रेशन थोड़े सीमित हैं। अधिकांश लिपियों और निर्देशों में आपको -E ध्वज का उपयोग मिलेगा और यह आपको विस्तारित मोड में पैटर्न दर्ज करने की अनुमति देगा।

सुपरमैन और स्पाइडरमैन शब्दों को देखने के लिए यहां grep और grep -E कमांड हैं।

$पकड़ '(सुपर|स्पाइडर)मैन'मूलपाठ
$पकड़ -तथा '(सुपर|स्पाइडर)मैन'मूलपाठ

जैसा कि आप देख सकते हैं कि विस्तारित संस्करण को पढ़ना बहुत आसान है।

11. अपने कंटेनरों के लिए ग्रेप

यदि आपके पास अपने होस्ट पर चलने वाले कंटेनरों का एक बड़ा समूह है, तो आप उन्हें छवि नाम, स्थिति, पोर्ट जो वे उजागर कर रहे हैं और कई अन्य विशेषताओं से पकड़ सकते हैं। उदाहरण के लिए,

$डाक में काम करनेवाला मज़दूरपी.एस. | पकड़ [छवि का नाम]

12. अपने पॉड्स के लिए ग्रेप

जबकि हम कंटेनरों के विषय पर हैं। कुबेरनेट्स अक्सर किसी दिए गए परिनियोजन के तहत कई पॉड लॉन्च करते हैं। जबकि प्रत्येक पॉड का एक विशिष्ट नाम होता है, किसी दिए गए नाम स्थान में, वे आमतौर पर परिनियोजन नाम से शुरू होते हैं। हम इसका grep कर सकते हैं और किसी दिए गए परिनियोजन से जुड़े सभी पॉड्स को सूचीबद्ध कर सकते हैं।

$कुबेक्टल फली प्राप्त करें| पकड़ <परिनियोजननाम>

13. बिग डेटा के लिए पकड़

अक्सर तथाकथित बिग डेटा विश्लेषण में किसी दिए गए डेटासेट में पैटर्न की सरल खोज, छँटाई और गिनती शामिल होती है। निम्न स्तर की UNIX उपयोगिताएँ जैसे grep, uniq, wc इसमें विशेष रूप से अच्छी हैं। यह ब्लॉग पोस्ट केवल कुछ सेकंड में grep और अन्य यूनिक्स उपयोगिताओं का उपयोग करके पूरा किए गए कार्य का एक अच्छा उदाहरण दिखाता है जबकि Hadoop को लगभग आधा घंटा लगा।

उदाहरण के लिए, यह डेटा सेट आकार में 1.7GB से अधिक है। इसमें कई शतरंज मैचों के बारे में जानकारी शामिल है, जिसमें किए गए कदम, कौन जीता, आदि शामिल हैं। हम केवल परिणामों में रुचि रखते हैं इसलिए हम निम्न आदेश चलाते हैं:

$पकड़ 'नतीजा'मिलियनबेस-2.22.pgn| तरह | यूनीक्यू -सी
२२१ [नतीजा'*']
653728 [नतीजा'0-1']
८५२३०५ [नतीजा'1-0']
६९०९३४ [नतीजा'1 / 2-1 / 2']

4 साल पुराने 2-कोर/4-थ्रेड प्रोसेसर पर इसमें लगभग 15 सेकंड का समय लगा। तो अगली बार जब आप किसी बड़ी डेटा समस्या का समाधान कर रहे हों। सोचें कि क्या आप इसके बजाय grep का उपयोग कर सकते हैं।

14. grep -color=auto

यह विकल्प grep को उस रेखा के अंदर पैटर्न को हाइलाइट करने देता है जहां यह पाया गया था।

15. ग्रेप -i

Grep पैटर्न मिलान स्वाभाविक रूप से केस-संवेदी है। लेकिन अगर आपको इसकी परवाह नहीं है तो -i ध्वज का उपयोग करने से grep केस असंवेदनशील हो जाएगा।

16. ग्रेप -एन

-n फ्लैग लाइन नंबर दिखाएगा ताकि आपको बाद में उसी लाइन को खोजने की चिंता न करनी पड़े।

17. गिट ग्रेप

संस्करण नियंत्रण प्रणाली Git में स्वयं एक अंतर्निहित grep कमांड है जो आपके नियमित grep की तरह बहुत अधिक काम करता है। लेकिन इसका उपयोग थकाऊ पाइपों के बजाय देशी गिट सीएलआई का उपयोग करके किसी भी प्रतिबद्ध पेड़ पर पैटर्न खोजने के लिए किया जा सकता है। उदाहरण के लिए, यदि आप अपने रेपो की मास्टर शाखा में हैं तो आप रेपो का उपयोग करके grep कर सकते हैं:

(गुरुजी)$गिट ग्रेप <प्रतिरूप>

18. ग्रेप -ओ

जब आप रेगेक्स डीबग करने का प्रयास कर रहे हों तो -o ध्वज वास्तव में सहायक होता है। यह पूरी लाइन के बजाय केवल लाइन के मेल खाने वाले हिस्से को ही प्रिंट करेगा। इसलिए, यदि आपको आपूर्ति किए गए पैटर्न के लिए बहुत अधिक अवांछित लाइन मिल रही है, और आप समझ नहीं पा रहे हैं कि ऐसा क्यों हो रहा है। आप आपत्तिजनक सबस्ट्रिंग को प्रिंट करने के लिए -o ध्वज का उपयोग कर सकते हैं और वहां से अपने रेगेक्स के पीछे की ओर तर्क कर सकते हैं।

19. ग्रेप -x

-x ध्वज एक पंक्ति मुद्रित करेगा, यदि और केवल तभी, पूरी पंक्ति आपके आपूर्ति किए गए रेगेक्स से मेल खाती है। यह कुछ हद तक -w ध्वज के समान है जो एक पंक्ति मुद्रित करता है यदि केवल और केवल एक संपूर्ण शब्द आपूर्ति किए गए रेगेक्स से मेल खाता है।

20. ग्रेप-टी

शेल स्क्रिप्ट से लॉग और आउटपुट के साथ काम करते समय, आउटपुट के विभिन्न कॉलमों के बीच अंतर करने के लिए आपको हार्ड टैब मिलने की संभावना अधिक होती है। -T फ्लैग इन टैब्स को बड़े करीने से संरेखित करेगा ताकि कॉलम बड़े करीने से व्यवस्थित हों, जिससे आउटपुट मानव पठनीय हो।

21. ग्रेप -क्यू

यह आउटपुट को दबा देता है और चुपचाप grep कमांड चलाता है। टेक्स्ट की जगह, या डेमॉन स्क्रिप्ट में grep चलाते समय बहुत उपयोगी है।

22. ग्रेप -पी

जिन लोगों को नियमित अभिव्यक्ति वाक्यविन्यास पर्ल करने के लिए उपयोग किया जाता है, वे ठीक उसी का उपयोग करने के लिए -P ध्वज का उपयोग कर सकते हैं। आपको मूल नियमित अभिव्यक्ति सीखने की ज़रूरत नहीं है, जो कि डिफ़ॉल्ट रूप से grep उपयोग करता है।

२३. ग्रेप-डी [कार्रवाई]

यूनिक्स में, लगभग हर चीज को एक फाइल के रूप में माना जा सकता है। नतीजतन, किसी भी डिवाइस, सॉकेट, या डेटा की FIFO स्ट्रीम को grep को फीड किया जा सकता है। आप -D ध्वज का अनुसरण एक ACTION द्वारा कर सकते हैं (डिफ़ॉल्ट क्रिया READ है)। कुछ अन्य विकल्प हैं SKIP विशिष्ट उपकरणों को चुपचाप छोड़ने के लिए और RECURSE निर्देशिकाओं और सिम्लिंक के माध्यम से पुनरावर्ती रूप से जाने के लिए।

24. दोहराव

यदि दिए गए पैटर्न की तलाश में हैं जो एक ज्ञात सरल पैटर्न की पुनरावृत्ति है, तो दोहराव की संख्या को इंगित करने के लिए घुंघराले ब्रेसिज़ का उपयोग करें

$पकड़ -तथा [0-9]{10}

यह उन पंक्तियों को प्रिंट करता है जिनमें 10 या अधिक अंक लंबे होते हैं।

25. दोहराव आशुलिपि

कुछ विशेष वर्ण विशिष्ट प्रकार के पैटर्न दोहराव के लिए आरक्षित हैं। आप घुंघराले ब्रेसिज़ के बजाय इनका उपयोग कर सकते हैं, यदि वे आपकी आवश्यकता के अनुरूप हों।

? : प्रश्नवाचक चिह्न से पहले का पैटर्न शून्य या एक बार से मेल खाना चाहिए।

* : तारे से पहले का पैटर्न शून्य या अधिक बार मेल खाना चाहिए।

+ : प्लस से पहले का पैटर्न एक या अधिक बार मेल खाना चाहिए।

25. बाइट ऑफ़सेट

यदि आप जानना चाहते हैं कि उन पंक्तियों के बाइट ऑफ़सेट देखें जहां मिलान अभिव्यक्ति मिलती है, तो आप ऑफ़सेट को प्रिंट करने के लिए -बी ध्वज का भी उपयोग कर सकते हैं। किसी पंक्ति के केवल मिलान वाले भाग के ऑफ़सेट को प्रिंट करने के लिए, आप -b ध्वज के साथ -o ध्वज का उपयोग कर सकते हैं।

$पकड़ -बी -या <प्रतिरूप> [फ़ाइल का नाम]

ऑफसेट का सीधा सा मतलब है, फ़ाइल की शुरुआत से कितने बाइट के बाद मैचिंग स्ट्रिंग शुरू होती है।

26. egrep, fgrep और rgerp

विस्तारित नियमित अभिव्यक्ति सिंटैक्स का उपयोग करने के लिए आप अक्सर egrep का आह्वान देखेंगे, जिसकी हमने पहले चर्चा की थी। हालांकि, यह एक बहिष्कृत वाक्यविन्यास है और यह अनुशंसा की जाती है कि आप इसका उपयोग करने से बचें। इसके बजाय grep -E का प्रयोग करें। इसी तरह, fgrep के बजाय grep -F और rgrep के बजाय grep -r का उपयोग करें।

27. ग्रीप -z

कभी-कभी grep का इनपुट एक न्यूलाइन वर्ण के साथ समाप्त होने वाली रेखाएं नहीं होती हैं। उदाहरण के लिए, यदि आप फ़ाइल नामों की सूची संसाधित कर रहे हैं, तो वे विभिन्न स्रोतों से आ सकते हैं। -z ध्वज grep को NULL वर्ण को समाप्त होने वाली रेखा के रूप में मानने के लिए कहता है। यह आपको आने वाली स्ट्रीम को किसी भी नियमित टेक्स्ट फ़ाइल के रूप में मानने की अनुमति देता है।

28. grep -a [फ़ाइल नाम]

-a ध्वज grep को आपूर्ति की गई फ़ाइल का इलाज करने के लिए कहता है जैसे कि यह नियमित पाठ था। फ़ाइल एक बाइनरी हो सकती है, लेकिन grep अंदर की सामग्री का इलाज करेगी, जैसे कि वे पाठ हैं।

29. ग्रेप-यू [फाइलनाम]

-U ध्वज grep को आपूर्ति की गई फ़ाइलों का इलाज करने के लिए कहता है जैसे कि वे बाइनरी फाइलें हैं न कि टेक्स्ट। डिफ़ॉल्ट रूप से grep पहले कुछ बाइट्स को देखकर फ़ाइल प्रकार का अनुमान लगाता है। इस ध्वज का उपयोग करने से अनुमान लगाया जा सकता है कि यह काम करता है।

ग्रेप -एम NUM

बड़ी फ़ाइलों के साथ, अभिव्यक्ति के लिए टटोलना हमेशा के लिए लग सकता है। हालाँकि, यदि आप केवल पहले NUM मैचों की संख्या की जाँच करना चाहते हैं तो आप इसे पूरा करने के लिए -m ध्वज का उपयोग कर सकते हैं। यह तेज़ है और आउटपुट अक्सर प्रबंधनीय भी होता है।

निष्कर्ष

एक sysadmin के रोज़मर्रा के बहुत सारे काम में पाठ के बड़े स्वाथों के माध्यम से स्थानांतरण शामिल है। ये सुरक्षा लॉग, आपके वेब या मेल सर्वर से लॉग, उपयोगकर्ता गतिविधि या मैन पेजों का बड़ा टेक्स्ट भी हो सकता है। इन उपयोग के मामलों से निपटने के दौरान Grep आपको अतिरिक्त लचीलापन देता है।

उम्मीद है, उपरोक्त कुछ उदाहरणों और उपयोग के मामलों ने आपको एक सॉफ्टवेयर के इस जीवित जीवाश्म को बेहतर ढंग से समझने में मदद की है।