Open-source a backdoory

Kdykoliv se někde objeví článek o komerčním šifrovacím nástroji, docela jistě se u něj objeví aspoň jeden komentář, že u programu s uzavřeným kódem nikdo neví, jaká skrytá dvířka do něj programátor umístil. A hned se objeví reference na TrueCrypt, který je zdarma, umí to samé, a „díky tomu, že je to open-source, si každý může ověřit, že je čistý“. Problém je v tom, že toto tvrzení je nepravdivé. Dokonce hned na dvou úrovních: Není pravda, že v open source programu nelze úspěšně skrýt backdoor, a také není pravda, že u open-source programu má uživatel větší jistotu. Speciálně u TrueCryptu to platí dvojnásob.

(more…)

James Horner: Something Wicked This Way Comes

Something Wicked This Way Comes

(more…)

Z papíru do čtečky 6: Obsahová korektura

Dostáváme se k poslední, nejpracnější, nejdůležitější a nejzanedbávanější části převodu papírové knihy do elektronické podoby: k obsahové korektuře. Proces OCR, jakkoliv už je nesmírně kvalitní, stále nevede k bezchybným výsledkům. Hodně chyb už jsme opravili v předchozím kroku, ale pořád zbývá to nejnáročnější – ručně projít celou knihu a opravit všechny chyby, které tam ještě zbyly. A počítejte s tím, že tam budou a že jich nebude zrovna málo.

(more…)

Z papíru do čtečky 5: Technická korektura

Pokračujeme v převodu papírové knihy do elektronické podoby. Po minulém kroku už máme k dispozici HTML soubor s knihou. To ale není všechno. Ten soubor je zatím jen hodně surová verze, která se sice dá v nouzi použít už sama o sobě, ale pokud má e-kniha k něčemu vypadat, je třeba do toho ještě zasáhnout – je třeba sjednotit strukturu dokumentu, upravit obrázky, správně rozmístit poznámky pod čarou, vyřadit nadbytečná záhlaví a patičky apod. Problém je v tom, že tady už končí univerzálně platné pravdy a nastává okamžik, kdy je třeba se s každou knihou vypořádat specificky. Podotýkám, že celý tento návod předpokládá aspoň základní znalost HTML.

(more…)

Z papíru do čtečky 4: OCR – FineReader 9.0

Po posledním kroku máme hromadu obrázků, kde každý odpovídá jedné stránce knihy. Co teď s nimi? Potřebujeme z nich udělat text. Proces i software, který to dokáže, se nazývá optical character recognition (OCR), a k dispozici je řešení od řady výrobců. Špatná zpráva do začátku je, že nemá vůbec smysl uvažovat o řešeních, která jsou zdarma – sice existují, ale kvalita jejich výstupu je velmi špatná. Nedejte se zmást tvrzeními o 99% přesnosti – jednak si každý výrobce tu přesnost měří jinak (někdo ji počítá jako procento správně rozpoznaných znaků, někdo jako slovníkových slov a někdo jako skutečných slov) a hlavně – 99% přesnost (tj. 1% chyb) u spíš kratší knihy znamená řádově 500 chybně rozpoznaných slov nebo 3000 chybných znaků, což mi přijde jako poměrně hodně a opravovat bych to fakt nechtěl. Komerční nástroje jsou v tomto nesrovnatelně účinnější, pokud máte dobrou kvalitu skenu, dosáhnete u stejné knihy na nějakých 50-60 chyb všech typů celkem.

(more…)

Z papíru do čtečky 3: Plustek OpticBook 3600

Plustek Opticbook 3600

Plustek OpticBook 3600 je skener speciálně určený pro skenování knížek. Tomu je podřízeno ovládání i software, ale hlavně design – a v tomto konkrétním případě tím nemyslím jenom vzhled, ale kompletní návrh. A je to poznat – převod knížek do elektronické podoby je s tímto skenerem velice pohodlný i přesto, že je manuální.

(more…)

Z papíru do čtečky 2: Zařízení

Prvním krokem při převodu papírové knihy do elektronické podoby je získání papírové předlohy. To nemusí být zrovna jednoduchý úkol, ale dejme tomu, že to se vám už podařilo. Pustíme se tedy rovnou do druhého kroku, to jest do převedení papírových stránek do formy elektronického obrázku v počítači. Tento krok je asi tím hlavním, co potenciální zájemce o digitalizaci knih odradí, protože vypadá strašně pracně. Nebudu vám lhát – ono to pracné je. Ale – určitě jste tušili, že tu bude ale – není to zdaleka tak pracné, jak se zdá, a není to tak pracné, jako některé z navazujících kroků. Tak s chutí do toho.

(more…)

The Hunger Games (Suzanne Collins)

obálka knihy The Hunger Games

Krátká zprávička na Studně, informující o chystaném filmu The Hungry Games podle stejnojmenné knížky od Suzanne Collins, mě přiměla hned otevřít Amazon – „horrorové soutěže“ mám velice rád i ve filmové podobě a jejich knižní verze jsou vesměs ještě lepší – Running Man od Stephena Kinga mě sice až tak nebere, ale Battle Royale (Koushun Takami) je fantastický po všech stránkách a Sulphuric Acid (Amelie Nothomb) patří k těm nejpůsobivějším knihám, které jsem za poslední léta četl (a kdyby nebyl tak strašně depresivní a neměl tak zprasený závěr, klidně by to mohla být jedna z mých nejoblíbenějších knížek).

(more…)

Z papíru do čtečky 1: Proč to dělat?

Ještě před rokem a půl mi nebylo dost dobře jasné, kde se vlastně na internetu berou všechny ty elektronické knihy. Tedy přesněji řečeno, bylo mi jasné, že někdo vezme papírovou knihu, naskenuje ji, převede do textu a publikuje, ale nedovedl jsem si představit, proč – zkušenost ze skenování obalů celé mé sbírky CDček mě poučila, že rozsáhlejší skenování je velice náročná a dlouhodobá práce, kterou by sotva někdo chtěl dělat jen z dobré vůle. Od okamžiku, kdy jsem si pořídil elektronickou čtečku, se ovšem situace poněkud změnila, „prohlédl jsem“, a teď už skenuji taky. V několika dalších článcích se podělím o svoje zkušenosti s tím, jak to dělat co možná bezbolestně.

(more…)

Formáty: *.PDB

Takzvaný „formát PDB“ se od ostatních e-bookových formátů liší mnoha věcmi, mimo jiné tím, že to není formát (v podstatě je to kopie bloku paměti Palmu, bez ohledu na to, co vlastně obsahuje), a i kdyby to formát byl, tak to není formát e-bookový – obsahem PDB může být úplně cokoliv, co lze na Palmu spustit nebo v jeho aplikacích editovat. Dokonce i textových formátů pro použití v e-boocích je pod hlavičkou PDB několik.

(more…)

Themocracy iconWordPress Themes

css.php