Po delší době zdánlivé nečinnosti se vracím k Sony Readeru: narazil jsem totiž na velice zajímavý nový projekt jménem eBook Applications. Co to je? Nic víc a nic míň než alternativní firmware pro Sony Reader PRS-505 a PRS-300. A narozdíl od PRS-Plus v něm nejde „jen“ o úpravy originálního firmware, ale o vytvoření firmware úplně nového – například s podporou řady nových e-bookových formátů. Tedy v podstatě o to, o co se snaží projekt InkPot, který ovšem na čtečky Sony zřejmě už definitivně rezignoval.
(Celý příspěvek…)
Vracím se ke svému projektu, ve kterém zkouším schopnosti OCR programů. Po FineReaderu 10, který jsem zkoušel minule, přišla řada na OmniPage 17 firmy Nuance.
(Celý příspěvek…)
Už delší dobu používám pro zpracování svých knížek do elektronické podoby FineReader 9.0. Jsem s ním v zásadě spokojený – už jsme si na sebe vzájemně zvykli, naučil jsem se jeho výstup upravovat do podoby, která mi vyhovuje, vím, na co si u něj dávat pozor. Proč tedy měnit, co funguje? Protože vývoj jde v tomto oboru dost rychle kupředu a to, co bylo loni skvělé, už letos může být jen průměrné. A protože převod knih do elektronické podoby stále ještě stojí hodně práce, každé zlepšení se počítá. Rozhodl jsem se proto vyzkoušet, jak si stojí aktuální verze OCR programů – jestli by třeba nestálo za úvahu aktualizovat. Jako první jsem vyzkoušel FineReader 10 – jako nástupce dosud používaného programu byl jasným kandidátem…
(Celý příspěvek…)
Několik čtenářů mě požádalo, jestli bych nesepsal nějaké povídání o převodu čistě textových e-booků do HTML podoby (viz Šablona pro HTML knihu). Na rovinu říkám, že s tím mnoho zkušeností nemám, protože v drtivé většině případů, kdy jsem se o to pokoušel, se ukázalo, že to nestojí za tu námahu – knihy v plaintextu se často vyznačují skutečně příšerným OCR, a i když je OCR v pořádku, pořád tu je problém, že prostý text prostě nenese všechny potřebné informace (např. o kurzívě, která se v knihách vyskytuje až nečekaně často). Ale čas od času se stane, že opravdu není jiná cesta než vyjít z prostého textu a ten nějak zpracovat. Moje postupy pro tento případ jsou uvedeny ve článku – a stejné postupy lze použít i pro nejběžnější variantu formátu PDB, který je vlastně jen komprimovaným prostým textem.
(Celý příspěvek…)
Princip dosazení vlastních fontů do čtečky zůstal po celá léta, co se tato úprava dělá, stejná – je třeba vzít originální firmware, rozbalit ho na disk, nahradit v něm některé soubory, zase firmware zabalit a flashnout ho do čtečky. Zatím jsem se věnoval tomu poslednímu kroku, flashnutí upraveného firmware (na PRS-505, PRS-600 a PRS-300), ale neřešil jsem otázku, kde se ten upravený firmware vezme. Nyní bude toto tajemství odhaleno. Není však pro lidi se slabými nervy – podstatnou část úprav je třeba dělat z příkazového řádku. Na druhou stranu, když už postup jednou zvládnete, dá se použít i pro tvorbu vlastních hacků, takže jestli máte ambice udělat něco jako PRS Plus, je to možné…
(Celý příspěvek…)
Pokračuji v sérii článků, jak dostat podporu češtiny do e-inkových čteček firmy Sony. Po PRS-505 a PRS-600 se mi nyní ozval odvážný majitel dalšího modelu, se kterým jsme hack vyzkoušeli a shledali funkčním. Slavnostně tedy oznamuji podporu češtiny pro Sony Reader PRS-300. Za otestování patří díky Mirkovi Tichákovi (a před ním Jirkovi Trousilovi, s ním jsme ale nepřišli na jeden klíčový krok).
(Celý příspěvek…)
Po mnoha slibech se dnes konečně dostávám k tomu, jak v HTML knihách pracovat s uvozovkami. Důvod, proč mi to trvalo tak dlouho, je poměrně prozaický: Na rozdíl od minulých témat, kde jsem měl optimální řešení (optimální z mého pohledu, pochopitelně), u uvozovek optimální řešení neznám; existuje několik přístupů, které lze použít, ale všechny mají více či méně vážné nedostatky. Jistě, jeden z přístupů jsem si zvolil a používám ho, ale spokojen s ním nejsem. Pokud by někoho napadlo nějaké řešení, které by nemělo popisované nedostatky, velice ho uvítám.
(Celý příspěvek…)
O problematice převodu papírové knihy do e-booku ve formátu HTML už jsem na větší nebo menší úrovni abstraktnosti psal několikrát, v článku HTML jako e-bookový formát, v sérii článků Z papíru do čtečky (zejména v jeho páté části, Technická korektura) a naposledy v Šablona pro e-knihu v HTML. Nyní se v reakci na několik žádostí k tomuto tématu opět vracím, tentokrát se zcela konkrétním příkladem postupu: vyjdu z naskenovaných obrázků stránek, které proženu OCR programem FineReader do HTML souboru a na tomto souboru předvedu techniky, které používám k získání pěkného čistého HTML. Stav dokumentu po každém kroku, včetně samotyných naskenovaných obrázků, nabízím ke stažení, takže si to zájemci mohou sami vyzkoušet. Předem ale upozorňuji, že nejde o činnost pro lidi se slabými nervy.
(Celý příspěvek…)
V souvislosti se svým úsilím o zprovoznění EPUB hacku i na dalších modelech Sony Readeru jsem se dostal i k tomu, že by bylo dobré umět některé hackovací operace, které zatím dělám ručně, i automaticky – aby si je každý mohl použít na svůj firmware a nebyl odkázán jen na mě. Prvním prográmkem ke splnění tohoto cíle je SonyFont, který slouží k úpravě systémových fontů čteček – dělá vlastně to, co se ve článcích PRS-505: Čeština a PRS-505: Čeština podruhé muselo pracně a nespolehlivě dělat v nějakém editoru fontů. Se SonyFontem totéž zvládnete na šest kliknutí a prakticky bez sebemenších znalostí. Podporovány jsou všechny Readery kromě PRS-700, který by měl také fungovat, ale neměl jsem možnost to ověřit.
(Celý příspěvek…)
Když jsem psal článek o zprovoznění češtiny v každém EPUBu na PRS-505, zmiňoval jsem se, že stejný postup by měl fungovat i na ostatních modelech Sony Readeru. Také jsem si hned připravil aktualizace pro modely PRS-300, PRS-500, PRS-600 a PRS-700, a pak jsem jen čekal na někoho, kdo bude ochoten a schopen ze sebe udělat pokusného králíka (klidně bych to udělal na své čtečce, ale mám jen spoustu PRS-505, žádné jiné modely). Králík se konečně našel, takže mohu s radostí hlásit, že mám k dispozici funkční hacknutý firmware pro PRS-600. Velké díky patří Karlicovi, který se nebál položit svoji čtečku na oltář vědy, a Vladimiru Borodovi (AKA Porkupanovi) za napsání flashovacího softwaru.
(Celý příspěvek…)