Vyčištění HTML knihy

O problematice převodu papírové knihy do e-booku ve formátu HTML už jsem na větší nebo menší úrovni abstraktnosti psal několikrát, v článku HTML jako e-bookový formát, v sérii článků Z papíru do čtečky (zejména v jeho páté části, Technická korektura) a naposledy v Šablona pro e-knihu v HTML. Nyní se v reakci na několik žádostí k tomuto tématu opět vracím, tentokrát se zcela konkrétním příkladem postupu: vyjdu z naskenovaných obrázků stránek, které proženu OCR programem FineReader do HTML souboru a na tomto souboru předvedu techniky, které používám k získání pěkného čistého HTML. Stav dokumentu po každém kroku, včetně samotyných naskenovaných obrázků, nabízím ke stažení, takže si to zájemci mohou sami vyzkoušet. Předem ale upozorňuji, že nejde o činnost pro lidi se slabými nervy.

(more…)

Identifikace browseru i bez cookies

Hlídáte si na internetu soukromí? Používáte TOR, anonymní VPN nebo anonymní proxy? Promazáváte nebo vůbec nepoužíváte cookies a vyřadili jste Flash s jeho „supercookie“? Vypínáte javascript? V tom případě by vás mohla zajímat série článků na webu Electronic Frontier Foundation, zejména poslední Browser Versions Carry 10.5 Bits of Identifying Information on Average, která se zabývá možností identifikovat browser na základě informací, o kterých obvykle jako identifikujících nepřemýšlíme – například o používaném prohlížeči. Je příznačné, že z českých webů o tom, pokud vím, neinformoval ani jeden (titulek „Patří soukromí online mezi vaše priority?“ na Rootu vypadal nadějně, ale je o něčem jiném).

(more…)

The Unspeakable People (sbírka)

Za normálních okolností povídkové sbírky téměř nekupuji a nečtu, protože z nich vesměs mám stejný pocit jako ze soundtracků k Final Fantasy – několik málo perel zahrabaných v obrovských hromadách sena. Výjimkou jsou sbírky povídek mých oblíbených autorů, případně sbírky, ve kterých je od mých oblíbených autorů třeba jen jedna povídka, která se ale nedá sehnat nikde jinde. To je zrovna případ The Unspeakable People, kterou jsem po dlouhá léta sháněl z jednoho prostého důvodu – obsahovala jednu ze tří tehdy dosud chybějících povídek Johna Wyndhama (Den trifidů, Kukly), The Cathedral Crypt. K mému velkému překvapení ale za přečtení stojí skoro všechny povídky ve sbírce – což je něco, s čím jsem se dosud nesetkal.

Drobná upoutávka pro ty, které moje „čtenářské deníky“ nezajímají: asi třetině povídek už propadla copyrightová ochrana a uvnitř článku je naleznete ke stažení. V blízké budoucnosti na nich také demonstruji technickou korekturu OCR, jak jsem sliboval ve článku Šablona pro e-knihu v HTML.

The Unspeakable People

(more…)

And Eternity (Piers Anthony) – ukázka

Rozhodl jsem se, že v rámci svých recenzí méně známých knížek budu uvádět i ukázky, aby případný zájemce mohl sám posoudit jazyk a obsah knihy, jestli se mu budou líbit. Z hlediska autorského zákona by to mělo být v pořádku (podle paragrafu 31, odstavec 1), pokud však majitel práv s mým názorem nesouhlasí, uvítal bych, kdyby napřed kontaktoval kvůli odstranění ukázky mě a teprve v případě neúspěchu soud.

Následuje první kapitola knihy And Eternity, sedmého dílu série Incarnations of Immortality od Pierse Anthonyho. Knihu snadno pořídíte na Amazonu. Recenzi naleznete zde.

Literatura:

  1. ANTHONY, Piers: And Eternity. New York: Avon Books, 1990. 386 str. ISBN 0-380-75286-7.

(more…)

SonyFont – čeština jednoduše

V souvislosti se svým úsilím o zprovoznění EPUB hacku i na dalších modelech Sony Readeru jsem se dostal i k tomu, že by bylo dobré umět některé hackovací operace, které zatím dělám ručně, i automaticky – aby si je každý mohl použít na svůj firmware a nebyl odkázán jen na mě. Prvním prográmkem ke splnění tohoto cíle je SonyFont, který slouží k úpravě systémových fontů čteček – dělá vlastně to, co se ve článcích PRS-505: Čeština a PRS-505: Čeština podruhé muselo pracně a nespolehlivě dělat v nějakém editoru fontů. Se SonyFontem totéž zvládnete na šest kliknutí a prakticky bez sebemenších znalostí. Podporovány jsou všechny Readery kromě PRS-700, který by měl také fungovat, ale neměl jsem možnost to ověřit.

(more…)

PRS-600: Čeština

Když jsem psal článek o zprovoznění češtiny v každém EPUBu na PRS-505, zmiňoval jsem se, že stejný postup by měl fungovat i na ostatních modelech Sony Readeru. Také jsem si hned připravil aktualizace pro modely PRS-300, PRS-500, PRS-600 a PRS-700, a pak jsem jen čekal na někoho, kdo bude ochoten a schopen ze sebe udělat pokusného králíka (klidně bych to udělal na své čtečce, ale mám jen spoustu PRS-505, žádné jiné modely). Králík se konečně našel, takže mohu s radostí hlásit, že mám k dispozici funkční hacknutý firmware pro PRS-600. Velké díky patří Karlicovi, který se nebál položit svoji čtečku na oltář vědy, a Vladimiru Borodovi (AKA Porkupanovi) za napsání flashovacího softwaru.

(more…)

For Love of Evil (Piers Anthony) – ukázka

Rozhodl jsem se, že v rámci svých recenzí méně známých knížek budu uvádět i ukázky, aby případný zájemce mohl sám posoudit jazyk a obsah knihy, jestli se mu budou líbit. Z hlediska autorského zákona by to mělo být v pořádku (podle paragrafu 31, odstavec 1), pokud však majitel práv s mým názorem nesouhlasí, uvítal bych, kdyby napřed kontaktoval kvůli odstranění ukázky mě a teprve v případě neúspěchu soud.

Následuje první kapitola knihy For Love of Evil, šestého dílu série Incarnations of Immortality od Pierse Anthonyho. Knihu snadno pořídíte na Amazonu. Recenzi naleznete zde.

Literatura:

  1. ANTHONY, Piers: For Love of Evil. New York: Avon Books, 1988. 336 str. ISBN 0-380-75285-9.

(more…)

Ramdisky pro Windows

Ve svém počítači už řadu let s úspěchem používám nejrůznější ramdisky – programy, které dovolí k části operační paměti přistupovat, jako kdyby to byl klasický pevný disk, tzn. vytvářet v ní soubory, kopírovat je, spouštět v ní programy a podobně. Základní výhodou přitom je rychlost práce s ramdiskem – přístupové doby se pohybují řádově v desítkách nanosekund (asi tak 100 000krát rychlejší než u klasických disků), přenosové rychlosti přinejmenším v jednotkách GB za sekundu (řádově desetkrát více než u nejrychlejších rozumně dostupných dnešních médií včetně SSD). V dalším textu uvedu několik způsobů, jak výhody ramdisku co nejlépe využít, a doporučím několik programů, které mám důkladně vyzkoušené.

(more…)

Šablona pro e-knihu v HTML

Ruda Kořínek mě na diskusním fóru požádal, jestli bych nemohl dát dohromady nějaký článek o tom, v jaké podobě vlastně schraňuji elektronické knihy – prostě nějaký template, do kterého by se dal relativně jednoduše „napustit“ text a po nějaké základní konverzi by z toho vznikla použitelná elektronická kniha. Přišlo mi to jako docela zajímavý námět, přestože můj přístup k tvorbě e-knih je právě opačný (začnu s víceméně prostým textem a ten pak obalím vhodným kódem), takže tady máte můj přístup. Netvrdím, že je nejlepší možný ani že bude vyhovovat každému, ale pokud momentálně tápete, třeba vám poskytne inspiraci. Článek vychází ze starších příspěvků HTML jako e-bookový formát a Z papíru do čtečky 5: Technická korektura, takže pokud jste je nečetli, doporučuji začít s nimi. Na druhou stranu jsem se snažil psát tak, aby tu byly čistě praktické záležitosti, které můžete použít i tehdy, pokud vůbec HTML neumíte.

(more…)

Catching Fire (Suzanne Collins) – ukázka

Rozhodl jsem se, že v rámci svých recenzí méně známých knížek budu uvádět i ukázky, aby případný zájemce mohl sám posoudit jazyk a obsah knihy, jestli se mu budou líbit. Z hlediska autorského zákona by to mělo být v pořádku (podle paragrafu 31, odstavec 1), pokud však majitel práv s mým názorem nesouhlasí, uvítal bych, kdyby napřed kontaktoval kvůli odstranění ukázky mě a teprve v případě neúspěchu soud.

Následuje první kapitola knihy Catching Fire, druhého dílu trilogie Hunger Games, jejíž autorkou je Suzanne Collins. Knihu lze (v hardcoveru) pořídit na Amazonu. Recenzi naleznete zde.

Literatura:

  1. COLLINS, Suzanne: Catching Fire. New York: Scholastic Press, 2009. 400 str. ISBN 0-439-02349-1.

(more…)

Themocracy iconWordPress Themes

css.php