ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) क्या है?

विषयसूची:

ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) क्या है?
ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) क्या है?
Anonim

ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) उस सॉफ़्टवेयर को संदर्भित करता है जो एक मुद्रित, टाइप किए गए या हस्तलिखित दस्तावेज़ का डिजिटल संस्करण बनाता है जिसे कंप्यूटर मैन्युअल रूप से टाइप करने या टेक्स्ट दर्ज करने की आवश्यकता के बिना पढ़ सकता है। ओसीआर आमतौर पर पीडीएफ प्रारूप में स्कैन किए गए दस्तावेज़ों पर उपयोग किया जाता है, लेकिन यह एक छवि फ़ाइल के भीतर पाठ का कंप्यूटर-पठनीय संस्करण भी बना सकता है।

ओसीआर क्या है

OCR, जिसे टेक्स्ट रिकग्निशन के रूप में भी जाना जाता है, सॉफ्टवेयर तकनीक है जो मुद्रित या लिखित दस्तावेज़ों से संख्याओं, अक्षरों और विराम चिह्न (जिन्हें ग्लिफ़ भी कहा जाता है) जैसे वर्णों को इलेक्ट्रॉनिक रूप में आसानी से पहचाना और कंप्यूटर द्वारा पढ़ा जाता है। अन्य सॉफ्टवेयर प्रोग्राम।कुछ ओसीआर प्रोग्राम ऐसा करते हैं क्योंकि एक दस्तावेज़ को स्कैन किया जाता है या डिजिटल कैमरे से फोटो खींचा जाता है और अन्य इस प्रक्रिया को उन दस्तावेज़ों पर लागू कर सकते हैं जिन्हें पहले स्कैन किया गया था या ओसीआर के बिना फोटो खिंचवाया गया था। OCR उपयोगकर्ताओं को PDF दस्तावेज़ों में खोज करने, टेक्स्ट संपादित करने और दस्तावेज़ों को फिर से प्रारूपित करने की अनुमति देता है।

Image
Image
ओसीआर सॉफ्टवेयर के साथ ऐतिहासिक अखबार की स्कैनिंग।

गेटी इमेजेज

ओसीआर का उपयोग किस लिए किया जाता है?

त्वरित, दैनिक स्कैनिंग आवश्यकताओं के लिए, ओसीआर कोई बड़ी बात नहीं हो सकती है। यदि आप बड़ी मात्रा में स्कैनिंग करते हैं, तो पीडीएफ के भीतर खोजने में सक्षम होने के कारण आपको सटीक समय मिल सकता है और आपके स्कैनर प्रोग्राम में ओसीआर कार्यक्षमता को और अधिक महत्वपूर्ण बना सकता है। यहाँ कुछ अन्य चीजें हैं जिनसे OCR मदद करता है:

  • स्वचालित डेटा प्रोसेसिंग और डेटा प्रविष्टि (उदाहरण: नौकरी आवेदक फिर से शुरू करने के लिए ट्रैकिंग सिस्टम)।
  • स्कैन की गई पुस्तकों को खोजने योग्य बनाना।
  • हस्तलिखित स्कैन को कंप्यूटर-पठनीय पाठ में परिवर्तित करना।
  • दृष्टिबाधित उपयोगकर्ताओं की सहायता करने वाले पाठक कार्यक्रमों द्वारा दस्तावेज़ों को अधिक उपयोगी बनाना।
  • ऐतिहासिक दस्तावेजों और समाचार पत्रों को संरक्षित करते हुए उन्हें खोजने योग्य भी बनाना।
  • डेटा निष्कर्षण और लेखांकन कार्यक्रमों में स्थानांतरण (उदाहरण: रसीदें और चालान)।
  • खोज इंजन द्वारा उपयोग के लिए दस्तावेजों का अनुक्रमण।
  • स्पीड कैमरा और रेड-लाइट कैमरा सॉफ्टवेयर द्वारा ड्राइवर लाइसेंस प्लेट की पहचान।
  • उन लोगों के लिए भाषण सिंथेसाइज़र जो बोल नहीं सकते - सैद्धांतिक भौतिक विज्ञानी, स्टीफन हॉकिंग, शायद भाषण सिंथेसाइज़र प्रोग्राम के सबसे प्रसिद्ध उपयोगकर्ता हैं।

नीचे की रेखा

क्यों न सिर्फ एक तस्वीर लें, है ना? क्योंकि आप कुछ भी संपादित नहीं कर पाएंगे या टेक्स्ट को खोज नहीं पाएंगे क्योंकि यह सिर्फ एक छवि होगी। दस्तावेज़ को स्कैन करना और OCR सॉफ़्टवेयर चलाना उस फ़ाइल को किसी ऐसी चीज़ में बदल सकता है जिसे आप संपादित कर सकते हैं और खोजने में सक्षम हो सकते हैं।

ओसीआर का इतिहास

जबकि पाठ पहचान का सबसे प्रारंभिक उपयोग 1914 में हुआ, ओसीआर-संबंधित प्रौद्योगिकियों का व्यापक विकास और उपयोग 1950 के दशक में गंभीरता से शुरू हुआ, विशेष रूप से बहुत ही सरलीकृत फोंट के निर्माण के साथ जो डिजिटल रूप से परिवर्तित करना आसान था- पठनीय पाठ। इनमें से पहला सरलीकृत फ़ॉन्ट डेविड शेपर्ड द्वारा बनाया गया था और आमतौर पर ओसीआर -7 बी के रूप में जाना जाता था। OCR-7B आज भी वित्तीय उद्योग में क्रेडिट कार्ड और डेबिट कार्ड पर उपयोग किए जाने वाले मानक फ़ॉन्ट के लिए उपयोग में है। 1960 के दशक में, कई देशों में डाक सेवाओं ने संयुक्त राज्य अमेरिका, ग्रेट ब्रिटेन, कनाडा और जर्मनी सहित मेल सॉर्टिंग में तेजी लाने के लिए OCR तकनीक का उपयोग करना शुरू किया। ओसीआर अभी भी दुनिया भर में डाक सेवाओं के लिए मेल सॉर्ट करने के लिए उपयोग की जाने वाली मुख्य तकनीक है। 2000 में, ओसीआर प्रौद्योगिकी की सीमाओं और क्षमताओं के प्रमुख ज्ञान का उपयोग बॉट्स और स्पैमर को रोकने के लिए उपयोग किए जाने वाले कैप्चा कार्यक्रमों को विकसित करने के लिए किया गया था।

दशकों में, कृत्रिम बुद्धि, मशीन सीखने और कंप्यूटर दृष्टि जैसे संबंधित प्रौद्योगिकी क्षेत्रों में प्रगति के कारण ओसीआर अधिक सटीक और अधिक परिष्कृत हो गया है।आज, ओसीआर सॉफ्टवेयर पहले से कहीं अधिक तेजी से और अधिक सटीक रूप से दस्तावेजों को बदलने के लिए पैटर्न पहचान, फीचर डिटेक्शन और टेक्स्ट माइनिंग का उपयोग करता है।

अक्सर पूछे जाने वाले प्रश्न

    मैं अपने फ़ोन या टैबलेट से दस्तावेज़ कैसे स्कैन करूं?

    आईओएस पर नोट्स ऐप खोलें और एक नया नोट बनाएं। कैमरा खोलें, और फिर दस्तावेज़ स्कैन करें टैप करें। Android पर, Google ड्राइव खोलें और Plus (+) चुनें, फिर स्कैन करने के लिए स्कैन पर टैप करें अपने फोन के साथ दस्तावेज़।

    मैं Adobe Acrobat में OCR का उपयोग कैसे करूँ?

    एक स्कैन की गई छवि वाली पीडीएफ फाइल खोलें, फिर टूल्स > पीडीएफ संपादित करें चुनें। एक्रोबैट स्वचालित रूप से ओसीआर लागू करेगा ताकि आप टेक्स्ट को संपादित कर सकें। बस चुनें कि आप कहाँ संपादन करना चाहते हैं और टाइप करना शुरू करें।

    ओसीआर और ओएमआर में क्या अंतर है?

    ऑप्टिकल मार्क रिकॉग्निशन (ओएमआर) एक ऐसा सॉफ्टवेयर है जो कागज पर निशान का पता लगाता है, आमतौर पर एक बबल शीट।ओएमआर का उपयोग परीक्षा, सर्वेक्षण, प्रश्नावली और यहां तक कि चुनावों के परिणामों को संसाधित करने के लिए किया जाता है। ओसीआर के विपरीत, ओएमआर पृष्ठ पर अंकों को नहीं समझ सकता है, लेकिन केवल यह सत्यापित करता है कि अंक हैं।

सिफारिश की: