Вітаю ўсіх чытачоў блога!
Я думаю, што тым хто часта працуе за кампутарам (не гуляе, а менавіта працуе), даводзілася сутыкацца з распазнаннем тэксту. Ну напрыклад, адсканаваць вы ўрывак з кнігі і зараз вам неабходна гэтую частку ўставіць у свой дакумент. Але сканаваць дакумент уяўляе сабой карцінку, а нам патрэбен тэкст - для гэтага то і патрэбныя адмысловыя праграмы і онлайн сэрвісы для распазнання тэксту з малюнкаў.
Пра праграмы для распазнання я ўжо пісаў у папярэдніх пастах:
- сканаванне тэксту і распазнання ў FineReader (платная праграма);
- праца ў аналагу FineReader - CuneiForm (бясплатная праграма).
У гэтым жа артыкуле хацелася б спыніцца на онлайн сэрвісах для распазнання тэксту. Бо, калі трэба па хуткім атрымаць тэкст з 1-2 малюнкаў - няма сэнсу затлумляцца з устаноўкай розных праграм ...
Важна! Якасць распазнавання (колькасць памылак, чытальнасць і інш.) Залежыць вельмі моцна ад зыходнага якасці карцінкі. Таму, пры сканаванні (фатаграфаванні і інш.) Выбірайце якасць як мага вышэй. У большасці выпадкаў якасці 300-400 dpi будзе дастаткова (dpi - параметр характарызуе якасць карцінкі. У наладах амаль усіх сканараў, звычайна, паказаны дадзены параметр).
онлайн сэрвісы
Для таго, каб паказаць працу сэрвісаў, я зрабіў скрыншот адным са сваіх артыкулаў. Гэты скрыншот і будзе загружацца на ўсе сэрвісы, апісанне якіх прадстаўлена ніжэй.
1) //www.ocrconvert.com/
Мне гэты сэрвіс вельмі падабацца сваёй прастатой. Сайт хоць і англійская, але добра працуе і з рускай мовай. Рэгістравацца ня трэба. Для пачатку распазнання трэба зрабіць 3 дзеянні:
- загрузіць свой малюнак;
- выбраць мову тэксту, які на малюнку;
- націснуць кнопку пачатку распазнавання.
Падтрымка фарматаў: PDF, GIF, BMP, JPEG.
Вынік прадстаўлены ніжэй на малюнку. Трэба сказаць, тэкст дастаткова добра распазнаецца. Да таго ж вельмі хутка - я чакаў літаральна 5-10 сек.
2) //www.i2ocr.com/
Гэты сэрвіс працуе аналагічна вышэйпрыведзенага. Тут гэтак жа трэба загрузіць файл, выбраць мову распазнання і націснуць кнопку выняць тэкст. Працуе сэрвіс вельмі хутка: 5-6 сек. на адну старонку.
Падтрымлівае фарматы: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Вынік гэты онлайн сэрвіс уяўляе нашмат зручней: вы адразу бачыце два вокны - у першым вынік распазнання, у другім - зыходны малюнак. Таму досыць лёгка ўнесці праўкі па ходзе рэдагавання. Рэгістравацца на сэрвісе, дарэчы, таксама не трэба.
3) //www.newocr.com/
Гэты сэрвіс унікальны адразу па некалькіх параметрах. Па-першае, ён падтрымлівае "навамодны" фармат DJVU (дарэчы, поўны спіс фарматаў: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Па-другое, падтрымлівае вылучэнне абласцей тэксту на малюначку. Гэта вельмі карысна, калі ў вас на малюнку ёсць не толькі тэкставыя вобласці, але і графічныя, якія распазнаваць ня трэба.
Якасць распазнаванне вышэй за сярэдні, рэгістравацца ня трэба.
4) //www.free-ocr.com/
Вельмі просты сэрвіс для распазнання: загружаеце малюнак, паказваеце мова, ўводзіце капчу (дарэчы, адзіны сэрвіс у гэтым артыкуле, дзе гэта трэба рабіць), і ціснеце кнопку перавесці карцінку ў тэкст. Уласна ўсё!
Падтрымліваюцца фарматы: PDF, JPG, GIF, TIFF, BMP.
Вынік распазнання - сярэдні. Ёсць памылкі, але іх не шмат. Зрэшты, калі якасць зыходнага скрыншота было б вышэй - памылак было б на парадак менш.
PS
На гэтым сёння ўсё. Калі ведаеце яшчэ цікавыя сэрвісы для распазнання тэксту - падзяліцеся ў каментарах, буду ўдзячны. Адна ўмова: пажадана каб ня трэба было рэгістравацца і сэрвіс быў бясплатны.
Усяго добрага!