Таңбаларды оптикалық тану (OCR) дегеніміз не?

Мазмұны:

Таңбаларды оптикалық тану (OCR) дегеніміз не?
Таңбаларды оптикалық тану (OCR) дегеніміз не?
Anonim

Таңбаларды оптикалық тану (OCR) мәтінді қолмен теру немесе енгізу қажеттілігінсіз компьютерлер оқи алатын басып шығарылған, терілген немесе қолмен жазылған құжаттың сандық нұсқасын жасайтын бағдарламалық құралды білдіреді. OCR әдетте PDF пішіміндегі сканерленген құжаттарда қолданылады, бірақ кескін файлында мәтіннің компьютер оқитын нұсқасын да жасай алады.

OCR дегеніміз не

OCR, сондай-ақ мәтінді тану деп те аталады, басып шығарылған немесе жазбаша құжаттардағы сандар, әріптер және тыныс белгілері (сонымен қатар глифтер деп те аталады) сияқты таңбаларды компьютерлер оңай танитын және оқитын электрондық пішінге түрлендіретін бағдарламалық құрал технологиясы. басқа бағдарламалық құралдар. Кейбір OCR бағдарламалары мұны құжат сканерленген немесе сандық камерамен суретке түсірілген кезде жасайды, ал басқалары бұл процесті OCRсіз бұрын сканерленген немесе суретке түсірілген құжаттарға қолдана алады. OCR пайдаланушыларға PDF құжаттарынан іздеуге, мәтінді өңдеуге және құжаттарды қайта пішімдеуге мүмкіндік береді.

Image
Image
Тарихи газетті OCR бағдарламалық құралымен сканерлеу.

Getty Images

OCR не үшін пайдаланылады?

Жылдам, күнделікті сканерлеу қажеттіліктері үшін OCR маңызды мәселе болмауы мүмкін. Егер сканерлеудің үлкен көлемін жасасаңыз, PDF файлдарының ішінен дәл қажеттісін табу үшін іздеу мүмкіндігі біраз уақытты үнемдейді және сканер бағдарламасындағы OCR функциясын маңыздырақ етеді. Мұнда OCR көмектесетін кейбір басқа нәрселер бар:

  • Деректерді автоматтандырылған өңдеу және деректерді енгізу (Мысалы: резюмелер үшін жұмысқа өтініш берушіні қадағалау жүйелері).
  • Сканерленген кітаптарды іздеуге болады.
  • Қолжазба сканерлерін компьютер оқитын мәтінге түрлендіру.
  • Көру қабілеті нашар пайдаланушыларға көмектесетін оқу бағдарламалары арқылы құжаттарды қолдануға ыңғайлы ету.
  • Тарихи құжаттар мен газеттерді сақтау, сонымен қатар оларды іздеуге мүмкіндік береді.
  • Деректерді алу және бухгалтерлік бағдарламаларға жіберу (Мысалы: Түбіртектер мен шот-фактуралар).
  • Іздеу жүйелері пайдалану үшін құжаттарды индекстеу.
  • Жылдамдық камерасы және қызыл жарық камерасы бағдарламалық құралы арқылы жүргізуші куәлігінің нөмірлерін тану.
  • Сөйлей алмайтын адамдарға арналған сөйлеу синтезаторлары – теориялық физик Стивен Хокинг сөйлеу синтезаторы бағдарламасының ең танымал пайдаланушысы болуы мүмкін.

Төменгі жол

Неге жай суретке түсірмеске, солай ма? Өйткені сіз ештеңені өңдей алмайсыз немесе мәтінді іздей алмайсыз, себебі ол жай ғана сурет болар еді. Құжатты сканерлеу және OCR бағдарламалық құралын іске қосу бұл файлды өңдеуге және іздеуге болатын нәрсеге айналдыруы мүмкін.

OCR тарихы

Мәтінді танудың ең алғашқы қолданысы 1914 жылға дейін болғанымен, OCR-қа қатысты технологияларды кеңінен дамыту және пайдалану 1950 жылдары, әсіресе цифрлық түрлендіруге оңай болатын өте жеңілдетілген қаріптерді жасау арқылы қарқынды түрде басталды. оқылатын мәтін. Осы жеңілдетілген қаріптердің біріншісін Дэвид Шепард жасаған және әдетте OCR-7B ретінде белгілі. OCR-7B әлі күнге дейін қаржы индустриясында несиелік карталар мен дебеттік карталарда қолданылатын стандартты қаріп үшін қолданылады. 1960 жылдары бірнеше елдердегі пошта қызметтері АҚШ, Ұлыбритания, Канада және Германияны қоса алғанда, поштаны сұрыптауды айтарлықтай жылдамдату үшін OCR технологиясын қолдана бастады. OCR әлі де бүкіл әлем бойынша пошта қызметтері үшін поштаны сұрыптау үшін қолданылатын негізгі технология болып табылады. 2000 жылы OCR технологиясының шектеулері мен мүмкіндіктері туралы негізгі білім боттар мен спамерлерді тоқтату үшін пайдаланылатын CAPTCHA бағдарламаларын әзірлеу үшін пайдаланылды.

Онжылдықтар ішінде OCR жасанды интеллект, машиналық оқыту және компьютерлік көру сияқты сәйкес технология салаларындағы жетістіктердің арқасында дәлірек және күрделірек болды. Бүгінгі күні OCR бағдарламалық құралы құжаттарды бұрынғыдан да жылдам және дәлірек түрлендіру үшін үлгіні тану, мүмкіндіктерді анықтау және мәтінді өңдеуді пайдаланады.

ЖҚС

    Телефон немесе планшет арқылы құжаттарды қалай сканерлеймін?

    iOS жүйесінде Notes қолданбасын ашып, жаңа жазба жасаңыз. Камераны ашып, Құжаттарды сканерлеу түймесін түртіңіз. Android жүйесінде Google Drive-ты ашып, Plus таңдаңыз (+), содан кейін сканерлеу үшін Сканерлеу түймесін басыңыз. телефонмен құжат.

    Adobe Acrobat бағдарламасында OCR қалай пайдаланамын?

    Сканерленген кескіні бар PDF файлын ашыңыз, содан кейін Құралдар > PDF өңдеу таңдаңыз. Acrobat мәтінді өңдей алуыңыз үшін OCR функциясын автоматты түрде қолданады. Тек өзгертулер енгізгіңіз келетін жерді таңдап, теруді бастаңыз.

    OCR мен OMR арасындағы айырмашылық неде?

    Таңбаны оптикалық тану (OMR) – қағаздағы белгілерді, әдетте көпіршік парағын анықтайтын бағдарламалық құрал. OMR емтихандардың, сауалнамалардың, сауалнамалар мен тіпті сайлаулардың нәтижелерін өңдеу үшін қолданылады. OCR-ден айырмашылығы, OMR беттегі белгілерді шеше алмайды, тек белгілердің бар екенін тексереді.

Ұсынылған: