Vývoj Calibre úspěšně pokračuje a v dohledné době nás čeká verze 0.6, která mimo jiné přinese sjednocení konverzních nástrojů – místo hromady utilit typu html2lrf a any2epub bude už jen jeden nástroj, ebook-convert, který bude řešit konverze všemi směry. Současně byly sjednoceny i parametry, takže konverze už by měly probíhat skoro stejně mezi všemi formáty. Současně to ovšem znamená, že stará verze H2LRF už není s novým Calibre kompatibilní, protože Calibre 0.6 mění strukturu své příkazové řádky.
(Celý příspěvek…)
Pomalu každé noviny mají aspoň jeden komiksový strip pro pobavení čtenářů (nebo pro nalákání čtenářů, kterým dělají problém delší texty). Dnes už je doplňují i čistě webové stripy (Wulffmorgenthaler.com), ale původní novinové kousky žijí dál. Mnohé z těchto kratičkých minikomiksů si vě světě získalo nesmírnou popularitu, některé z nich se časem dostaly i k nám. Mimo jiné i Dilbert, který je mým nejoblíbenějším stripem – prostě mám blízko k té představě odborníka utlačovaného zlým managementem
Slibuju, že v článku bude i něco e-bookového – zmíním se o převádění komiksů pro čtení v PRS-505.
(Celý příspěvek…)
Americký obchod Borders má nyní akci (do 14. června), ve které můžete získat Sony Reader PRS-505 za 200 dolarů (necelých 3800 Kč podle dnešního kurzu). Pokud žijete v americe, stačí vložit Reader do košíku a pak použít slevový kupón SONY505READ. Dokonce ani nebudete platit poštovné, protože tento produkt splňuje podmínky pro poštovné zdarma. Pokud žijete v ČR, máte to pochopitelně o něco složitější.
(Celý příspěvek…)
Kolega Jirka Vlček z e-bookového blogu na Palmknihy se zamýšlí nad DRM (Digital Rights Management, podle kritiků Digital Restrictions Management – fakticky technické prostředky, které mají zabránit v použití digitálního obsahu na neautorizovaných zařízeních) v elektronických knihách a ptá se, co na to my ostatní. Jednoduchá odpověď pochopitelně je, že DRM nikdy a za žádných okolností, ale skoro každá jednoduchá odpověď je chybná. Jaká je tedy složitější, snad méně chybná odpověď?
(Celý příspěvek…)
Před časem jsem tu psal o tom, jak dostat do čtečky knihy v češtině. Věnoval jsem se primárně formátům TXT, RTF a LRF (protože LRF mi z čtečkou podporovaných formátů vyhovuje nejvíc a zprovozněním češtiny u něj ji zprovozním i u druhých dvou), u EPUBu jsem to spíš jen naznačil a dál nepitval. Protože se ale množí dotazy na to, jak rozchodit češtinu v EPUBových knihách, je zjevně na čase sepsat k tomu podrobnější návod. Tady ho tedy máte.
(Celý příspěvek…)
Nemám rád ochrany proti kopírování. Pokud mám jenom trochu na výběr, je pro mě jejich existence důvodem pro hledání alternativy. Ale teď jsem zrovna na výběr neměl a tak jsem na Books On Board se skřípěním zubů koupil chráněnou knížku ve formátu Adobe Digital Editions. Je to moje první setkání s tímto formátem, který se v ČR zrovna moc nevyskytuje, a tak si o něm možná taky se zájmem přečtete.
(Celý příspěvek…)
Dostáváme se k poslední, nejpracnější, nejdůležitější a nejzanedbávanější části převodu papírové knihy do elektronické podoby: k obsahové korektuře. Proces OCR, jakkoliv už je nesmírně kvalitní, stále nevede k bezchybným výsledkům. Hodně chyb už jsme opravili v předchozím kroku, ale pořád zbývá to nejnáročnější – ručně projít celou knihu a opravit všechny chyby, které tam ještě zbyly. A počítejte s tím, že tam budou a že jich nebude zrovna málo.
(Celý příspěvek…)
Pokračujeme v převodu papírové knihy do elektronické podoby. Po minulém kroku už máme k dispozici HTML soubor s knihou. To ale není všechno. Ten soubor je zatím jen hodně surová verze, která se sice dá v nouzi použít už sama o sobě, ale pokud má e-kniha k něčemu vypadat, je třeba do toho ještě zasáhnout – je třeba sjednotit strukturu dokumentu, upravit obrázky, správně rozmístit poznámky pod čarou, vyřadit nadbytečná záhlaví a patičky apod. Problém je v tom, že tady už končí univerzálně platné pravdy a nastává okamžik, kdy je třeba se s každou knihou vypořádat specificky. Podotýkám, že celý tento návod předpokládá aspoň základní znalost HTML.
(Celý příspěvek…)
Po posledním kroku máme hromadu obrázků, kde každý odpovídá jedné stránce knihy. Co teď s nimi? Potřebujeme z nich udělat text. Proces i software, který to dokáže, se nazývá optical character recognition (OCR), a k dispozici je řešení od řady výrobců. Špatná zpráva do začátku je, že nemá vůbec smysl uvažovat o řešeních, která jsou zdarma – sice existují, ale kvalita jejich výstupu je velmi špatná. Nedejte se zmást tvrzeními o 99% přesnosti – jednak si každý výrobce tu přesnost měří jinak (někdo ji počítá jako procento správně rozpoznaných znaků, někdo jako slovníkových slov a někdo jako skutečných slov) a hlavně – 99% přesnost (tj. 1% chyb) u spíš kratší knihy znamená řádově 500 chybně rozpoznaných slov nebo 3000 chybných znaků, což mi přijde jako poměrně hodně a opravovat bych to fakt nechtěl. Komerční nástroje jsou v tomto nesrovnatelně účinnější, pokud máte dobrou kvalitu skenu, dosáhnete u stejné knihy na nějakých 50-60 chyb všech typů celkem.
(Celý příspěvek…)
Plustek OpticBook 3600 je skener speciálně určený pro skenování knížek. Tomu je podřízeno ovládání i software, ale hlavně design – a v tomto konkrétním případě tím nemyslím jenom vzhled, ale kompletní návrh. A je to poznat – převod knížek do elektronické podoby je s tímto skenerem velice pohodlný i přesto, že je manuální.
(Celý příspěvek…)