Test OCR převodů
Kapitoly článků
Schopnosti FineReaderu jsme se rozhodli vám prezentovat na několika namátkou vybraných dokumentech. Jako první jsme zvolili propagační materiál k řadiči od LSI, který byl v uzamčeném PDF. Na následujících obrázcích si můžete prohlédnout, jak si poradil s relativně složitým formátem dokumentu.
Výsledek dopadl tak na půl. Text sám osobě byl převeden dobře s minimem chyb, s formátováním to již bylo horší. Ještě před uložením do souboru docx v samotném okně programu byl editovatelný dokument prakticky shodný s originálem, ale po odeslání do aplikace Microsoft Word se už se to bez problémů s formátem neobešlo.
Ve druhém případě jsme vyzkoušeli běžný textový dokument prakticky v ideálních podmínkách. Zde výsledek dopadl výborně, posuďte sami. Oprav je potřeba jen minimum a můžete porovnat výsledné uložení v docx a v odt. Jakmile se jedná o text jen s jednoduchým formátováním, nemá FineReader žádné problémy.
Ve třetím testu jsme jako zdroj vyzkoušeli fotografii vytištěné stránky běžným mobilním telefonem, který má fotoaparát s autofokusem a rozlišením 5 MPix (Nokia E72). Vytištěná stránka měla opravdu drobné písmo a před odesláním do FineReaderu jsme jen mírně upravili kontrast. Výsledek byl opět velmi dobrý, celý text byl převeden do Word dokumentu jen s drobnými chybami v některých jednotlivých písmenech, a to i přesto, že nás FineReader varoval, že rozlišení zdrojového obrázku by mohlo být lepší.
Čistě pro zajímavost jsme vyzkoušeli i rozpoznání ručně psaného textu. Zdrojem bylo běžné tiskací písmo a pár napsaných znaků. Tentokrát už to bylo podle očekávání příliš velké sousto. V dokumentu bylo více chyb než správně rozpoznaných znaků, byť sem tam se FineReader trefil. Buď se budeme muset naučit lépe psát nebo bude potřeba v tomto směru přeci jen ještě nějaký vývoj.