Рецоммендед, 2024

Избор Уредника

Екстракт текста из слика с овим најбољим ОЦР софтвера

Ових дана, готово све (нпр. Фотографије, музика, видео записи) постало је дигитално (и то има смисла, јер се дигиталним садржајем може једноставно управљати, уређивати и дијелити). Како могу остати текстуални документи. Захваљујући напретку у технологијама оптичког препознавања знакова (ОЦР), сада је лакше него икада дигитализовати текстуалну материју у штампаним / руком писаним документима, чинећи је уређивом програмима за обраду текста.

Да бисте то урадили, потребне су вам стварно добре ОЦР софтверске апликације, и то је управо оно о чему се ради у овом чланку. Овај софтвер може или да прибави изворне штампане документе као слике са уређаја за скенирање, или можете да унесете сопствене слике документа да бисте их конвертовали у текст за уређивање. Интригуед? Па, хајде да не ударамо по грму и да дођемо до 5 најбољих ОЦР софтвера .

1. АББИИ ФинеРеадер

Када је ријеч о оптичком препознавању знакова, готово да и ништа не долази близу АББИИ ФинеРеадер-а. Напуњен до врха лудом количином моћних функција, АББИИ ФинеРеадер чини да извлачење текста из свих врста слика буде лако.

Упркос свеобухватној и широкој листи функција, АББИИ ФинеРеадер је супер једноставан за коришћење. Може издвојити текст из готово свих врста популарних формата слика, као што су ПНГ, ЈПГ, БМП и ТИФФ. И то није све. АББИИ ФинеРеадер такође може издвојити текст из ПДФ и ДЈВУ датотека. Када се изворна датотека или слика (која би по могућности требала имати резолуцију од најмање 300 дпи, за оптимално скенирање) учитава, програм је анализира и аутоматски одређује различите дијелове датотеке с текстом који се може извадити. Можете да извучете сав текст или да изаберете само одређене секције. Након тога, све што треба да урадите је да употребите опцију Сними да изаберете излазни формат, а АББИИ ФИнеРеадер ће се побринути за остало. Подржани су бројни излазни формати, као што су ТКСТ, ПДФ, РТФ, па чак и ЕПУБ.

Излазни текст се савршено може уређивати, а текст из чак и докумената са најсложенијим садржајем (нпр. Оних који имају више колона и сложених распореда) беспрекорно се издваја. Остале карактеристике укључују опсежну језичку подршку, бројне стилове / величине фонтова и алате за корекцију слике за датотеке које потичу од скенера и камера.

Укратко, ако желите да апсолутно најбољи ОЦР софтвер, заједно са опсежним улазно / излазним форматом и подршком за обраду, иде за АББИИ ФинеРеадер.

Доступност платформе: Виндовс 10, 8, 7, Виста и КСП; Мац ОС Кс 10.6 и новије верзије

Цијена: Плаћене верзије почињу од $ 169.99, 30 дана бесплатне пробне верзије

Преузимање

2. Реадирис

У потрази за екстремно моћним ОЦР софтвером који је веома тежак за функције, али не треба много труда да би се почело? Погледајте Реадирис, јер то може бити оно што вам је потребно.

Апликација за професионалну оцјену, Реадирис има опсежан скуп значајки који је у великој мјери идентичан са претходно расправљеним АББИИ ФинеРеадер-ом. Од БМП-а до ПНГ-а, и од ПЦКС-а до ТИФФ-а, Реадирис подржава доста формата слика. Осим тога, ПДФ и ДЈВУ датотеке могу бити обрађене исто тако добро. Слике могу да се добијају из уређаја за скенирање, а апликација вам такође омогућава да подесите прилагођене параметре обраде на изворне датотеке / слике, као што су смоотхенинг и ДПИ подешавање, пре него што их анализирате. Иако Реадирис може обрадити слике ниже резолуције, оптимална резолуција би требала бити најмање 300 дпи. Када се анализа заврши, Реадирис одређује текстуалне делове (или зоне), а текст се може издвојити из специфичних зона или из целог фајла. Издвојени текст се може уређивати и може се сачувати у бројним форматима, као што су ПДФ, ДОЦКС, ТКСТ, ЦСВ и ХТМ.

Штовише, значајка Реадирис Про за спремање облака омогућује вам да изравно спремите извучени текст у различите сервисе за похрану у облаку, као што су Дропбок, ОнеДриве, ГооглеДриве, а затим и још неке. Такође постоји и здрав број функција за уређивање и обраду текста, па чак и баркодови се могу скенирати.

Све у свему, требало би да користите Реадирис ако желите робустне функције за екстракцију текста / едитовање у једноставном пакету, заједно са обимном подршком за улазно / излазни формат. Међутим, Реадирис се мало погоршава када се ради о обради докумената са сложеним изгледима као што су вишеструки колоне, табеле итд.

Доступност платформе: Виндовс 10, 8, 7, Виста и КСП; Мац ОС Кс 10.7 и новије верзије

Цена: Плаћене верзије почињу од $ 99, 10 дана бесплатне пробне верзије

Преузимање

3. ФрееОЦР

Ако тражите једноставан и безбрижан ОЦР софтвер са пристојним могућностима препознавања текста, не тражите даље од ФрееОЦР-а . Иако можда није преоптерећена свим врстама фенси карактеристика, и даље ради изузетно добро за оно што јесте.

Заснован на изузетно популарном, Тессерацт ОЦР мотору који подржава Гоогле, ФрееОЦР је изузетно једноставан за употребу. Може да добије штампане документе скениране помоћу скенера, као и да отпремите слике са текстуалним садржајем. И не само то, он такође може да издвоји текст из форматираних докумената са више страница. Апликацију можете извући или из текста ПДФ / слике, или дефинисати одређени део текста. Брзине конверзије су прилично добре, а конвертовани текст може да се сачува у форматима као што су ТКСТ и РТФ, или да се извози директно у Мицрософт Ворд. ФрееОЦР подржава све главне формате слика, као што су ПНГ, ЈПГ и ТИФФ.

С обзиром на то, ФрееОЦР има неке недостатке. То је сувише основно и нема функције за обраду пост-обраде текста. Штавише, распоред издвојеног текста често се забрља, са преклапајућим линијама и колонама. Користите га само ако вам је потребна повремена ОЦР функционалност.

Доступност платформе: Виндовс 10, 8, 7, Виста и КСП

Цена: Бесплатно

Преузимање

4. Мицрософт ОнеНоте

ОнеНоте представља импресивну апликацију за снимање нота која је лако покренути. Међутим, нотетакинг није једино у чему је добро. Ако користите ОнеНоте као део вашег радног тока, можете га користити да направите основну екстракцију текста, захваљујући уграђеној ОЦР доброти.

Коришћење програма ОнеНоте за издвајање текста из слика је смешно једноставно. Ако користите десктоп апликацију, све што треба да урадите је да употребите опцију Инсерт да убаците слику у било коју од нотебоок или секција. Када то урадите, једноставно кликните десним тастером миша на слику и изаберите опцију Копирај текст из слике . Читав текстуални садржај са слике би се копирао у клипборд, и могао би се налепити (а тиме и уредити) било где, према захтеву. Било да се ради о ПНГ, ЈПГ, БМП или ТИФФ, ОнеНоте подржава готово све главне формате слика.

Међутим, могућности издвајања текста ОнеНоте-а су прилично ограничене и не могу да се баве сликама са сложеним текстуалним садржајима као што су табеле и подсекције. То је нешто што треба имати на уму.

Доступност платформе: Виндовс 10, 8, 7 и Виста; Мац ОС Кс 10.10 и касније

Цена: Бесплатно

Преузимање

5. ГОЦР

Напомена: Пре него што почнете, важно је да знате да иако ГОЦР подржава регуларне формате слика као што су ПНГ и ЈПГ, није успео да их препозна током тестирања (изведеног на Виндовс 10 ПЦ-у). Веома је могуће да може да ради са тим форматима на Линук машинама, али ако користите Виндовс, мораћете да конвертујете изворне слике у ПНМ формат. То се може урадити путем бројних алата за конверзију датотека на мрежи, као што је овај.

Оно што издваја ГОЦР од парцеле је то што заправо нема графички кориснички интерфејс (ГУИ) фронт-енд. То је алат заснован на командној линији и као такав, није баш најлакше користити. Али када се задовољите основама, ГОЦР се може показати као веома користан у извлачењу текста из слика. Такође је вредно напоменути да ГОЦР треба да ради како треба, изворне слике би требало да имају јасно видљив текстуални садржај, а пожељно белу позадину, јер програм не ради са комплексним изворним датотекама. ГОЦР издваја текст из слика и чува их у ТКСТ формату. Иако подржава доста аргумената и функција, потребно је познавати само неке. На пример, да бисте екстрактовали текст из узорка ПНМ слике, у командну линију унесите следеће.

Кс: мапа датотеке гоцр049 -и филе.пнм -о филе.ткт

Овде Кс: пример мапа је локација на којој се налази ГОЦР алат за командну линију, а филе.пнм и филе.ткт су улазне и излазне датотеке, односно (на истој локацији као и ГОЦР; ако је локација различита;, треба одредити комплетну путању). Такође, ако желите да промените ниво сиве скале за слику, можете да наведете нумеричку вредност као аргумент, заједно са -л. Кликните овде да бисте детаљно прочитали о употреби.

Да сумирамо, ГОЦР је прилично добар ОЦР алат, а када је у питању екстракција текста из једноставних слика, он ради изузетно добро. Међутим, карактеристике су веома ограничене и захтевају доста напора да би се посао обавио.

Доступност платформе: Виндовс 10, 8, 7, Виста и КСП; Линук; ОС / 2

Цена: Бесплатно

Преузимање

Све је подешено за конвертовање слика у текст?

Дигитализација штампаног (и рукописног) текстуалног садржаја је изузетно корисна, јер чини складиштење, уређивање и дељење текста изузетно лако. А горе описани ОЦР софтвер брзо ради на томе, без обзира на то колико су основне или напредне потребе вађења текста. Требате професионалне могућности за екстракцију текста са најбољим алатима за пост обраду? Идите за АББИИ ФинеРеадер или Реадирис. Желите ли једноставнији ОЦР софтвер који само оспособљава основе? Користите ОнеНоте или ФрееОЦР. Пробајте их и погледајте како раде за вас. Знате ли за било који други ОЦР софтвер који је могао бити укључен у горе наведену листу? Изговори у коментарима испод.

Top