ЯК ПЕРАВЕСЦІ КАРЦІНКУ Ў ТЭКСТ ПРЫ ДАПАМОЗЕ ABBYY FINEREADER?

Гэты артыкул будзе дадаткам да папярэдняй (і больш дэталёва раскрые сутнасць непасрэднага распазнавання тэксту.

Пачнем з самой сутнасці, якую многія карыстальнікі не да канца разумеюць.

Пасля сканавання кнігі, газеты, часопіса і інш. Вы атрымліваеце набор малюнкаў (г.зн. графічныя файлы, а не тэкставыя), якія трэба распазнаць у спецыяльнай праграме (адна з лепшых для гэтага - ABBYY FineReader). Распазнанне - гэта і ёсць, працэс атрымання тэксту з графікі і менавіта гэты працэс мы і распішам больш дэталёва.

У сваім прыкладзе зраблю скрыншот гэтага сайта і паспрабую атрымаць з яго тэкст.

1) Адкрыццё файла

Адкрываем фота (і), якія плануем распазнаць.

Дарэчы, тут трэба адзначыць, што адкрыць можна не толькі фарматы малюнкаў, але і, напрыклад, файлы DJVU і PDF. Гэта дазволіць хутка распазнаць цэлую кнігу, якія па сетцы, звычайна, распаўсюджваюцца менавіта ў гэтых фарматах.

2) Рэдагаванне

Адразу згаджацца з аўта-распазнаннем вялікага сэнсу няма. Калі, вядома, у вас кніга ў якой толькі тэкст, няма малюнкаў і таблічак, плюс адсканаваныя ў выдатнай якасці, то можаце. У астатніх выпадках, лепш ўсе вобласці задаць ўручную.

Звычайна спачатку трэба выдаліць са старонкі непатрэбныя вобласці. Для гэтага націсніце на панеле кнопку рэдагаваць.

Затым трэба пакінуць толькі тую вобласць, з якой вы хочаце даўжэй працаваць. Для гэтага ёсць інструмент абрэзкі непатрэбных межаў. Справа ў калонцы абярыце рэжым абрэзаць.

Далей вылучыце вобласць, якую жадаеце пакінуць. На малюнку знізу яна вылучаная чырвоным.

Дарэчы, калі ў вас адкрыта некалькі малюнкаў, то абразанне можна прымяніць да ўсіх малюнках адразу! Зручна, каб не рэзаць кожную паасобку. Звярніце ўвагу, унізе гэтай панэлькі ёсць яшчэ адзін выдатны інструмент -гумка. Пры дапамозе яго з малюнка можна сцерці непатрэбныя разводы, нумары старонак, крапінкі, непатрэбныя спец-сімвалы і асобныя ўчасткі.

Пасля таго, як вы націснеце абрэзаць краю, зыходная ваша карцінка павінна змяніцца: застанецца толькі працоўная вобласць.

Далей можаце выходзіць з рэдактара малюнкаў.

3) Вылучэнне абласцей

На панэльцы, над адкрытай малюначкам, ёсць невялікія прастакутнікі, якія задаюць вобласці сканавання. Іх некалькі, разгледзім коратка самыя распаўсюджаныя.

Карцінка - гэтую вобласць праграма не будзе распазнаваць, яна проста скапіюе зададзены прастакутнік і уставіць яго ў распазнаны дакумент.

Тэкст - галоўная вобласць, на якой засяродзіцца праграма і паспрабуе з карцінкі атрымаць тэкст. Гэтую вобласць мы і вылучым у нашым прыкладзе.

Пасля вылучэння, вобласць зафарбоўваецца ў светла-зялёны колер. Далей можна пераходзіць да наступнага кроку.

4) Распазнанне тэксту

Пасля таго, як усе вобласці зададзены, пстрыкайце ў меню каманду распазнаць. На шчасце, у гэтым кроку больш нічога рабіць не трэба.

Час распазнавання залежыць ад колькасці старонак у вашым дакуменце і магутнасці кампутара.

У сярэднім на адну поўную старонку, адсканаваную ў добрым якасці сыходзіць 10-20 сек. на сярэднім па магутнасці ПК (па сённяшніх мерках).

5) Праверка памылак

Якім бы не было зыходнае якасць малюнкаў, звычайна заўсёды пасля распазнання застаюцца памылкі. Усё ткі пакуль ні адна праграма не здольная цалкам выключыць работу чалавека.

Націскайце на опцыю праверкі і ABBYY FineReader пачне выводзіць вам па чарзе тыя месцы ў дакуменце, дзе ў яго паўсталі запінкі. Ваша задача, параўнаўшы арыгінал карцінкі (дарэчы, гэта месца ён вам пакажа ў ўзбуйненне варыянце) з варыянтам распазнання - адказаць станоўча, альбо выправіць і зацвердзіць. Далей праграма пяройдзе да наступнага складанага месцы і гэтак далей, пакуль не будзе правераны ўвесь дакумент.

Наогул, працэс гэты можа быць доўгім і сумным ...

6) Захаванне

ABBYY FineReader прапануе некалькі варыянтаў захавання вашай работы. Самы часта-выкарыстоўваны - гэта "дакладная копія". Г.зн. ўвесь дакумент, тэкст у ім, будзе гэтак жа адфарматаваны, як і ў исходнике.Удобный варыянт для таго, каб перадаць яго ў Word. Так мы і паступілі ў гэтым прыкладзе.