ABBYY FineReader 11

12. 10. 2011 | Filip Marvan | Recenze, Software

ABBY FineReader je jedním nejznámějších OCR programů s dnes již poměrně dlouhou historií. V letošním roce vyšla jedenáctá verze, která nově přinesla podporu stále populárnějších e-book formátů, vylepšila (hlavně zrychlila) OCR algoritmus, představila upravené uživatelské rozhraní či přidala rozpoznávání nových jazyků. K tomu ještě několik dalších novinek, které jsme prověřili v krátkém testu. Pojďte se s námi podívat, jak se s touto aplikací pracuje a jaké jsou možnosti moderního OCR.

Kapitoly článků

1. Specifikace, rozhraní aplikace

2. Test OCR převodů

3. Hodnocení, závěr

K čemu vlastně OCR slouží a jak funguje? OCR neboli optické rozpoznávání znaků je v podstatě postup, který umožňuje z needitovatelného textu (například textu na fotce z fotoaparátu nebo naskenovaného dokumentu) vytvořit text editovatelný (například dokument Microsoft Word, OpenOffice Writer či obyčejný txt). Toho dosahuje tak, že inteligentní algoritmus se snaží rozpoznat jednotlivá písmena na základě jejich tvaru a následně je ukládá v některém z textových formátů. Kvalita převodu velice závisí na kvalitě předlohy (skenu, fotografie a fontu v předloze). Některé OCR aplikace se pokouší rozeznávat i ručně psaný text, ale takový převod je velice náročný a zatím s nevalnými úspěchy.

Ale pojďme se podívat na samotný FineReader. Instalační soubor má velikost 382 MB a po instalaci vám na disku zabere zhruba 710 MB, což je skoro dvakrát tolik než například kancelářský balík OpenOffice. Není to tedy žádný střízlík, na druhou stranu již první spuštění aplikace dává tušit, že s optimalizací to tak špatné nebude. Studený start aplikace trval 3,2 vteřiny, což je na testovacím počítači zhruba stejně jako start poštovního klienta Mozilla Thunderbird a o poznání rychleji než například Writer z kancelářské sady OpenOffice.

Minimální požadovaná konfigurace
Procesor	1 GHz
Operační paměť	1024 MB volné paměti, plus dalších 512 MB ke každému dalšímu jádru procesoru
Diskový prostor	700 MB pro typickou instalaci programu a dalších 700 MB potřebných pro běh aplikace
Operační systém	Microsoft Windows 7/Vista/XP/Server 2008/Server 2008 R2/Server 2003
Podporované formáty
Vstupní formáty souborů	BMP, PCX, DCX, JEPG, JPEG 2000, JBIG2, PNG, TIFF, PDF, XPS, DjVu, GIF, WDP
Formáty pro ukládání dokumentů	DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, EPUB, FB2, VCF
Aplikace, do kterých se FineReader integruje	Microsoft Word 2002/2003/2007/2010 Microsoft Excel 2002/2003/2007/2010 Microsoft PowerPoint 2003/2007/2010 Corel WordPerfect 10/11/12/14 Lotus Word Pro 97/Millennium OpenOffice 3 Adobe Acrobat/Reader

Po spuštění programu vás uvítá průvodce, který vám pomůže zvolit zdroj, ze kterého potřebujete text získat, a zároveň vyberete formát, do kterého ho budete chtít uložit. Pokud to předem nevíte, můžete zvolit i obecnou volbu „jiné“, ale i v případě že zvolíte některou z připravených konverzí, můžete parametry i formáty později měnit.

Úvodní průvodce

Grafické rozhraní je rozděleno do dvou základních oken. V levém okně uvidíte dokument určený k převodu, tedy například sken, PDF soubor nebo obrázek z fotoaparátu. V pravém okně se vám pak postupně objeví již upravitelný výsledek převodu před samotným uložením.

Jakmile otevřete zdrojový obrázek nebo se vám načte materiál přímo ze skeneru, FineReader začne s jeho analýzou. To znamená, že projde stránku po stránce a pokouší se rozeznat oblasti, které obsahují text, tabulky, případně obrázky nebo čárový kód. Výsledky této analýzy vám následně v levém okně zobrazí a v případě potřeby můžete upravit typ jednotlivých oblastí. Během testu se nám ale nestalo, že by se automatika v tomto ohledu spletla.

Po proběhlé analýze začne samotný OCR převod a načítání výsledného dokumentu, který se vám objeví v listu v pravém okně FineReaderu. Pokud s výsledkem nebudete spokojeni, máte možnost ještě před uložením provést úpravy, například opravit překlepy. S tím vám pomůže automatická kontrola textu, která vám postupně nabídne detekované chyby.

V levé části program analyzuje PNG screenshot webové stránky, v právé části je již editovatelný výsledek

Načtený dokument v pravém okně si můžete zobrazit (a poté uložit) v několika různých módech. Standardně je stránka převáděna v módu přesná kopie, kdy se snaží zachovat formát co nejpodobnější originálu (byť to ještě neznamená, že se ho podaří tak i uložit). Nestará se o to, zda bude potřeba dokument v budoucnu ještě upravovat. To je vhodné například pro výstup ve formátu PDF. Dalším módem je upravitelná kopie, kdy se opět snaží o co nejpřesnější výsledek stejně jako v prvním případě, ale výsledný dokument formátuje tak, aby se s ním dalo dále pracovat. To znamená nepoužívat různé bloky a rámce, které sice vypadají stejně jako originál, ale jejich další úprava je obtížná. Tento režim je ideální pro ukládání do formátů Microsoft Word či OpenOffice. Třetí možností je naformátovaný text bez jakýchkoliv dalších prvků (obrázků, tabulek), což je pro uložení do některého z podporovaných formátů značné ulehčení. Předposlední možností je pak čistý nenaformátovaný text a jako poslední možnost je volba optimalizovaná pro uložení do HTML.

Další úpravy, pomocí kterých můžete do převodu zasáhnout, jsou odstranění záhlaví/zápatí, což se hodí, pokud chcete jedním kliknutím odebrat hlavičku nebo čísla stránek z naskenovaného dokumentu. Jedním tlačítkem lze také přepínat mezi volbou dokumentu s obrázky nebo bez obrázků.

Možnosti nastavení FineReaderu

Až budete spokojeni s výsledkem tak, jak vám ho FineReader načte, můžete s ním opět naložit několika způsoby. Jednak ho lze odeslat do některé z podporovaných aplikací, například do Microsoft Word, Excel, OpenOffice Writer nebo Acrobat Reader. V takovém případě se příslušná aplikace otevře a vy v ní uvidíte vytvořený (ale zatím neuložený) materiál z FineReaderu, kde ho případně můžete dále upravovat. Dále můžete výsledek rovnou uložit do některého z podporovaných formátů – docx, odt, xlsx, pdf, djvu, epub a podobně. Dokonce můžete výsledek převodu odeslat přímo do čtečky Amazon Kindle přes váš Kindle účet nebo v těle bežného e-mailu. Příjemné je, že v momentě kdy vybíráte cíl uložení, FineReader mění vzhled stránky tak, jak bude pravděpodobně v daném formátu či v dané aplikaci vypadat.

Tagy:

OCR, ABBYY, FineReader

nahlásit chybu

následující kapitola

Test OCR převodů »

Kapitoly článků

1. Specifikace, rozhraní aplikace

2. Test OCR převodů

3. Hodnocení, závěr

Filip Marvan

Administrátor serverů a diskových polí pracující pro společnost Aira Group.

více článků, blogů a informací o autorovi

Diskuse ke článku ABBYY FineReader 11

Pondělí, 17 Říjen 2011 - 10:57 | Tibor Toth | Neviem či to v redakcii vyskúšali - ale predsa...

Pondělí, 17 Říjen 2011 - 06:38 | umiyaki | FR11 si bere to nejlepší z obou předchozích verzí...

Pátek, 14 Říjen 2011 - 10:23 | maruširi | Však jsem ti poradil, jak to zjistit, tak co se...

Pátek, 14 Říjen 2011 - 06:38 | RoboV | Asi by nebolo od veci spomenúť, že verzia 10 na...

Čtvrtek, 13 Říjen 2011 - 18:36 | Tibor Toth | Prepáč, že som sa opovážil položiť otázku ohľadne...

Čtvrtek, 13 Říjen 2011 - 18:06 | maruširi | Mně ten tvůj přijde trapný docela dost. Kdyžs...

Čtvrtek, 13 Říjen 2011 - 16:41 | Tibor Toth | Mám ešte lepší nápad. Zrušme všetky diskusie a...

Čtvrtek, 13 Říjen 2011 - 15:31 | Filip Marvan | S ničím lepším zkušenosti nemám. Při exportu...

Čtvrtek, 13 Říjen 2011 - 00:23 | Vuk | http://www.onlineocr.net/

Středa, 12 Říjen 2011 - 18:45 | JonyATS | Hmm, když tak "hnidopišsky" kritizujete...

Zobrazit diskusi

Diit.cz - Novinky a informace o hardware, software a internetu

ABBYY FineReader 11

Kapitoly článků

Filip Marvan

Diskuse ke článku ABBYY FineReader 11

Komerční sdělení

CDR Hry

Epic rozdává zdarma hru, která potěší hráče akčních plošinovek

Tajemné „temné hvězdy“: Webbův teleskop našel nový druh hvězd

Únik dat na Discordu: Až 70 000 uživatelů mohlo přijít o své doklady totožnosti

Stát nemá co číst soukromé zprávy: Německo hájí základní práva před návrhem EU

Obří asteroid zasáhl Austrálii před 11 miliony lety. Kráter se však ztratil

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT