Formáty na PRS-505: *.TXT

Prostý text je podporován asi každou čtečkou – v tomto smyslu jde o nejuniverzálnější formát. Univerzálnost je ovšem jeho jedinou výhodou – všechno ostatní je horší než u jiných formátů, v nejlepším případě stejné. Přesto může být univerzálnost natolik zásadní kvalitou, aby u některých uživatelů převážila nad nedostatečnými možnostmi formátování, nulovou podporou pro metadata (název knihy, autor, obsah…), nemožností kombinovat text a obrázky a dokonce i velikostí (ostatní formáty sice obsahují spoustu „nadbytečných“ údajů, ale vesměs jsou komprimované). Jak tedy PRS-505 podporuje texty?

PRS-505 zobrazuje TXT soubory pomocí integrovaného patkového fontu. Velikost písmen je myslím ideální. Čtečka se vypořádá s různými standardy konců řádek (zvládne „DOSové“ CRLF i „unixové“ LF), pro rozumné zobrazení však vyžaduje, aby byl dodržen standard „jeden řádek v souboru odpovídá jednomu odstavci v textu“ – pokud to nedodržíte a pokusíte se předhodit jí text, kde jsou řádky zalámány na nějakou pevnou délku a odstavce jsou vyznačeny prázdným řádkem, nedá se výsledek skoro číst (příklad je na jednom z obrázků níže).

Pokud jde o kódování znaků, bez problémů je podporováno čisté ASCII (pochopitelně), ISO-8859-1, Unicode (16bitů na znak, little-endian; Unicode v big-endiánu jsem nezkoušel) a UTF-8. Ostatní kódování podporována nejsou a jejich čitelnost závisí na tom, jak moc se blíží jednomu z podporovaných kódování a jak moc vám při čtení vadí „ksichtíky“ – pokud jste vyrostli na kódu Kamenických na CGA kartě, dá se na PRS-505 docela dobře číst i běžný Windowsovský text. Pokud však preferujete normální znaky, zapomeňte rovnou na jednobajtová kódování češtiny, ať už více (ISO-8859-2) nebo méně (Windows-1250) standardní – blbě budou vypadat všechna. V Unicode nebo UTF-8 je to ovšem o něčem jiném, tam je čeština bez chybičky – tedy za předpokladu, že jste do čtečky integrovali české fonty – pokud tento zásadní přípravný krok vynecháte, dočkáte se ksichtíků i v Unicode :-).

Pár obrázků, jak můžou vypadat české texty na PRS-505:

V Unicode je čeština perfektní.

Totéž platí o UTF-8.

Jednobajtová kódování (v tomto případě ISO-8859-2) nedopadnou dobře.

Windows-1250 také není žádná sláva. U něj jsem ještě přidal další hrubou chybu, totiž řádky zalomené zhruba na osmdesát znaků. Popravdě řečeno, ksichtíky bych ještě přežil (já tu CGA-Kameničtí průpravu mám), ale ty zalámané řádky jsou katastrofa.

Podobné příspěvky:

Posted in Sony Reader by pepak, 2. 4. 2009 18:47

2 Responses to “Formáty na PRS-505: *.TXT”

pepak napsal:

18. 4. 2009 (09:18)

I do much the same thing, only not in Open Office but in a generic programmer’s editor with regular expressions.
roger64 napsal:

18. 4. 2009 (08:18)

A typical need for working with text are the Gutenberg books.

I use a basic two steps macro with OpenOffice to deal with the hard returns.
– search and replace „$“ with one space
– search and replace „.*$“ with „&\n“ (to recreate line breaks after paragaphs)
You can also add
-search and replace two spaces with one space.

I then insert in a 9x12cm custom model, justify text, chose font and size. Then I check the output (compulsory), improve the main title and chapters, add a cover, clear the legalese rubbish, and so on…Some minutes but quite easy to do.