Праграмы для распазнання тэксту

Як правіла, калі гаворка заходзіць аб праграмах для распазнання сканаваць тэксту (OCR, аптычнае распазнаванне сімвалаў), большасць карыстальнікаў ўспамінаюць адзіны прадукт - ABBYY FineReader, які, бясспрэчна, з'яўляецца лідэрам сярод такога праграмнага забеспячэння ў Расіі і адным з лідэраў у свеце.

Тым не менш, FineReader - не адзінае такога роду рашэнне: ёсць бясплатныя праграмы для распазнання тэксту, анлайн-сэрвісы для гэтых жа мэтаў і, больш за тое, такія функцыі прысутнічаюць і ў некаторых знаёмых вам праграмах, якія, магчыма, ужо ўстаноўлены на вашым кампутары . Аб усім гэтым я і паспрабую напісаць у гэтым артыкуле. Усе разгледжаныя праграмы працуюць у Windows 7, 8 і XP.

Лідэр распазнання тэкстаў - праграма ABBYY Finereader

Пра FineReader (вымаўляецца як Файн Рыдэр) чулі, напэўна, большасць з вас. Гэтая праграма лепшая ці адна з лепшых для якаснага распазнання тэкстаў на рускай мове. Праграма з'яўляецца платнай і кошт ліцэнзіі для хатняга выкарыстання складае крыху менш за 2000 рублёў. Таксама маецца магчымасць спампаваць пробную версію FineReader ці ж скарыстацца онлайн распазнаннем тэкстаў у ABBYY Fine Reader Online (бясплатна можна распазнаць некалькі старонак, далей - платна). Усё гэта даступна на афіцыйным сайце распрацоўніка //www.abbyy.ru.

Ўстаноўка пробнай версіі FineReader ня выклікала ніякіх праблем. ПА можа інтэгравацца з Microsoft Office і Правадыром Windows, для таго каб было зручней запусціць распазнаванне. З абмежаванняў бясплатнай пробнай версіі - 15 сутак выкарыстання і магчымасць распазнаць не больш за 50 старонак.

Здымак для тэставання праграм распазнання

Бо сканэра у мяне няма, то для праверкі я скарыстаўся здымкам з няякаснай камеры тэлефона, у якім крыху адрэдагаваў кантраснасць. Якасць нікуды не прыдатнае, паглядзім, хто справіцца.

Меню праграмы FineReader

FineReader можа атрымліваць графічнае малюнак тэксту наўпрост са сканара, з графічных файлаў або камеры. У маім выпадку, дастаткова было адкрыць файл малюнка. Вынік парадаваў - усяго пара памылак. Адразу скажу, што гэта лепшы вынік з усіх правераных праграм пры працы з дадзеным узорам - падобнае якасць распазнавання было толькі на бясплатным онлайн сэрвісе Free Online OCR (але ў гэтым аглядзе мы гаворым толькі пра праграмных сродках, не анлайн распазнанні).

Вынік распазнання тэксту ў FineReader

Шчыра кажучы, для кірылічных тэкстаў у FineReader, напэўна, няма канкурэнтаў. Плюсамі праграмы з'яўляецца не толькі якасць распазнавання тэкстаў, але і шырокая функцыянальнасць, падтрымка фарматавання, граматны экспарт у мноства фарматаў, уключаючы Word docx, pdf і іншыя магчымасці. Такім чынам, калі задачы OCR - гэта тое, з чым вы сутыкаецеся пастаянна, то не пашкадуйце параўнальна невялікай колькасці грошай і гэта цалкам акупіцца: вы зэканоміце велізарная колькасць часу, хутка атрымліваючы якасны вынік у FineReader. Я, дарэчы, не рэкламую нічога - сапраўды лічу, што тым, каму трэба распазнаць больш за дзесятак старонак, варта задумацца аб куплі такога ПА.

CuneiForm - бясплатная праграма для распазнання тэксту

Па маёй ацэнцы, другая па папулярнасці праграма OCR ў Расіі - бясплатная CuneiForm, спампаваць якую можна з афіцыйнага сайта //cognitiveforms.ru/products/cuneiform/.

Ўстаноўка праграмы таксама вельмі простая, ніякага іншага софту (як многае бясплатнае ПА) яна ўсталяваць не спрабуе. Інтэрфейс лаканічны і зразумелы. У некаторых выпадках прасцей за ўсё скарыстацца майстрам, для чаго прызначана першая з абразкоў у меню.

З узорам, якім я карыстаўся ў FineReader, праграма не справілася, ці, дакладней, выдала нешта дрэнна чытанае і шмаццё слоў. Другая спроба была прадпрынятая са скрыншот тэксту з сайта самой гэтай праграмы, які, праўда, прыйшлося павялічыць (ёй патрэбныя сканы з дазволам 200dpi і вышэй, скрыншоты з таўшчынёй ліній шрыфтоў 1-2 пікселя яна не чытае). Тут яна справілася добра (частка тэксту не пазнаў, бо быў абраны толькі руская мова).

Распазнаванне тэксту ў CuneiForm

Такім чынам, можна меркаваць, што CuneiForm - гэта тое, што варта паспрабаваць, асабліва калі ў вас якасна адсканаваныя старонкі і вы хочаце распазнаць іх бясплатна.

Microsoft OneNote - праграма, якая ў вас, магчыма, ужо ёсць

У склад Microsoft Office, пачынаючы з версіі 2007 года і заканчваючы бягучай, 2013, прысутнічае праграма для вядзення нататак - OneNote. У ёй таксама прысутнічаюць функцыі распазнання тэксту. Для таго, каб скарыстацца ёю, проста ўстаўце адсканаваную або любое іншае малюнак тэксту ў заметку, клікніце правай клавішай мышы па ёй і скарыстайцеся кантэкстным меню. Адзначу, што па змаўчанні для распазнання усталяваны англійская мова.

Распазнаванне ў Microsoft OneNote

Не магу сказаць, што тэкст распазнаецца ідэальна, але, наколькі я магу судзіць, некалькі лепш нават чым у CuneiForm. Плюс праграмы, як ужо было сказана, у тым, што з немалой верагоднасцю яна ўжо ўстаноўлена на вашым кампутары. Хоць, вядома, яе выкарыстанне ў выпадку неабходнасці працы з вялікай колькасцю адсканаваных дакументаў наўрад ці будзе зручным, хутчэй яна падыдзе для хуткага распазнання візітак.

OmniPage Ultimate, OmniPage 18 - павінна быць, што-то вельмі стромкае

Я не ведаю, наколькі добрая праграма для распазнання тэкстаў OmniPage: пробных версій няма, дзе-то спампоўваць не хачу. Але, калі яе кошт апраўданая, а яна абыйдзецца прыкладна ў 5000 рублёў у версіі для індывідуальнага выкарыстання і не Ultimate, то гэта павінна быць нешта ўражлівае. Старонка праграмы: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

Цана на ПА OmniPage

Калі азнаёміцца ​​з характарыстыкамі і водгукамі, у тым ліку і ў рускамоўных выданнях, у іх адзначаецца, што OmniPage сапраўды забяспечвае якаснае і дакладнае распазнаванне, у тым ліку і на рускай мове, параўнальна лёгка разбірае не самыя якасныя сканы і падае набор дадатковых інструментаў. З недахопаў вылучаюць не самы зручны, асабліва для пачаткоўца карыстальніка, інтэрфейс. Так ці інакш, на заходнім рынку OmniPage - прамы канкурэнт FineReader і англамоўных рэйтынгах яны змагаюцца менавіта паміж сабой, а таму, думаю, праграма павінна быць годнай.

Гэта далёка не ўсе праграмы дадзенага тыпу, існуюць таксама розныя варыянты невялікіх бясплатных праграм, але, пакуль эксперыментаваў з імі знайшоў два галоўных недахопу ім уласцівых: адсутнасць падтрымкі кірыліцы, альбо рознае, не занадта карыснае ПА у камплекце ўстаноўкі, а таму вырашыў не згадваць іх тут.

Глядзіце відэа: YouTube В 2019 ЗАКРОЮТ? КАК СОХРАНИТЬ СВОИ ВИДЕО? SaveYourInternet (Красавік 2024).