Když mě před časem postihl záchvat paranoie, přestalo mi stačit šifrování jen kritických dat a začal jsem pátrat po možnostech, jak zašifrovat celý disk. Ono to ostatně má svou logiku i bez paranoie – každý operační systém, a Windows zvlášť, prozrazuje v rámci své činnosti spoustu informací, které by možná radši měly zůstat utajené, například prostřednictvím dočasných souborů nebo stránkovacího souboru. Šifrování celého disku tento problém řeší docela uspokojivě – prostě jsou zašifrované i tyhle „potenciálně zrádné“ soubory. Postupně jsem si prošel několik nástrojů, které to umí. Jako první mi do rány padl DriveCrypt Plus Pack (neplést s DriveCrypt bez Plus Packu, ten šifruje jen kontejnery, ne celé disky) od německé firmy SecurStar.
(more…)
Nemám rád ochrany proti kopírování. Pokud mám jenom trochu na výběr, je pro mě jejich existence důvodem pro hledání alternativy. Ale teď jsem zrovna na výběr neměl a tak jsem na Books On Board se skřípěním zubů koupil chráněnou knížku ve formátu Adobe Digital Editions. Je to moje první setkání s tímto formátem, který se v ČR zrovna moc nevyskytuje, a tak si o něm možná taky se zájmem přečtete.
(more…)
Po posledním kroku máme hromadu obrázků, kde každý odpovídá jedné stránce knihy. Co teď s nimi? Potřebujeme z nich udělat text. Proces i software, který to dokáže, se nazývá optical character recognition (OCR), a k dispozici je řešení od řady výrobců. Špatná zpráva do začátku je, že nemá vůbec smysl uvažovat o řešeních, která jsou zdarma – sice existují, ale kvalita jejich výstupu je velmi špatná. Nedejte se zmást tvrzeními o 99% přesnosti – jednak si každý výrobce tu přesnost měří jinak (někdo ji počítá jako procento správně rozpoznaných znaků, někdo jako slovníkových slov a někdo jako skutečných slov) a hlavně – 99% přesnost (tj. 1% chyb) u spíš kratší knihy znamená řádově 500 chybně rozpoznaných slov nebo 3000 chybných znaků, což mi přijde jako poměrně hodně a opravovat bych to fakt nechtěl. Komerční nástroje jsou v tomto nesrovnatelně účinnější, pokud máte dobrou kvalitu skenu, dosáhnete u stejné knihy na nějakých 50-60 chyb všech typů celkem.
(more…)