Prvních pět dílů seriálu o regulárních výrazech se zabývalo tím, jak tyto výrazy zformulovat – jejich stavebními bloky a tím, jak je skládat dohromady. Neřešili jsme ale otázku, co s regulárním výrazem, když už je napsaný. Na to odpoví až dnešní díl, ve kterém si povíme něco o vyhledávání, nahrazování a dalších operacích s regulárními výrazy, včetně několika nových zápisů, které se pro tyto účely dají vhodně využít.
(more…)
I u nás oblíbená série knih ze světa Midkemie, kterou už třicet let produkuje Raymond E. Feist, postupně dosahuje až nestvůrné rozsáhlosti. Začátek dubna přinesl další přídavek pro nás čtenáře – vyšlo A Kingdom Besieged („Království v obležení“), první díl prý poslední trilogie, Chaoswar („Válka s chaosem“ – neplést s válkami chaosu, které se v Midkemii odehrály v dávné minulosti). Upřímně řečeno, do čtení jsem se po zkušenostech s předchozími třemi ságami nijak zvlášť nehrnul, ale přeci jen zvědavost nedala a když jsem dokončil důležitější knížky (dost hrozný čtvrtý díl Billa galaktického hrdiny, který jsem se sebezapřením překousal jenom proto, že pátý díl je prostě super a já nechci přeskakovat), pustil jsem se i do Království. A nelituji – knize se dá vytknout řada věcí (a také to na dalších řádcích udělám), ale je to po dlouhé době první Feistova kniha, která mě opravdu navnadila na další díly a u které se nebudu muset přemáhat, až ji budu číst podruhé (ale už je otázka, jestli i potřetí).
(more…)
V pátém dílu seriálu o regulárních výrazech se podíváme na možnosti práce s kódováním Unicode, které se velmi hodí uživatelům exotických abeced (například české). Za běžných okolností je totiž knihovna PCRE nastavena pro práci s běžným osmibitovým kódováním znaků (co znak, to bajt), a ještě speciálně pro práci s anglickou abecedou. Abecedy ostatní standardním PCRE podporovány nejsou a buď nejsou použitelné vůbec (japonština a další abecedy, které potřebují více než jeden bajt na reprezentaci jednoho znaku) nebo jen s omezeními (např. čeština – v zásadě funguje, ale neexistuje žádná podpora pro skutečnost, že „č“ je „písmeno“ a ne „speciální symbol“). S podporou Unicode lze ale docela dobře pracovat i s neanglickými abecedami.
(more…)
Autorská práva mi bohužel brání dát jako ukázku povídku A Long Spoon, která je sice daleko nejlepší z celé sbírky, ale bohužel tak krátká, že bych ji sem musel dát celou – a to bych už s volnými užitími narazil. Rozhodl jsem se tedy „jít na jistotu“ a nabídnout vám úvodní část titulní Consider Her Ways, končící zhruba v okamžiku, kdy už je zjevné, že je něco hodně špatně, ale ještě před odhalením, jak moc špatně to je.
Literatura:
- WYNDHAM, John: Consider Her Ways and Others. Harmondsworth: Penguin Books, 1970. 190 str. ISBN 0-14-002231-7.
(more…)
Zatímco u povídkové sbírky The Best of John Wyndham jsem se rozplýval nad tím, jak dobře sestavená ta sbírka je, sbírka Consider Her Ways and Others patří mezi mé nejméně oblíbené. Důvodů je víc, hlavní je ale ten, že většina povídek patří spíš k tomu slabšímu, co John Wyndham napsal – a vesměs se k nim v jeho tvorbě najdou povídky s obdobnou tematikou, ale lepším provedením. Pro kompletisty je ovšem Consider Her Ways and Others nevyhnutelná – jedna z povídek (Oh, Where, Now, Is Peggy MacRafferty?) se nesežene nikde jinde a jedna (A Long Spoon) jen obtížně v tematických (nikoliv autorských) sbírkách. A co čert nechtěl, zrovna A Long Spoon je opravdu výborná.
(more…)
Vodácká sezóna 2011 začala pro mě 2. dubna na řece Jizeře, opět s CK Klíč. Sjížděný úsek měl jen asi 8 kilometrů, ale vzhledem ke slušnému průtoku (20 m3/s) a hodně náročnému terénu (WW III-IV) to skutečně stálo za to!
Fotky bohužel tentokrát nemám, nějak mi nezbýval prostor ani síly na to, abych se snažil vyhrabat foťák. Podívejte se na „oficiální“.
(more…)
Zatímco předchozí díly seriálu se zabývaly něcím, co bych označil za základní syntaxi regulárních výrazů, víceméně stejnou ve všech implementacích, ve čtvrtém díle se podíváme na konstrukce, které jsou specifické pro PCRE a nedají se použít skoro nikde jinde. To je sice jejich velká nevýhoda, na druhou stranu jde o konstrukce natolik užitečné, že stojí za to je znát. Konečně totiž dojde i na častou otázku, „jak vyhledat řetězec, který neobsahuje zadaný podřetězec?“
(more…)
Třetí díl seriálu o regulárních výrazech bude věnován obyčejným kulatým závorkám (
a )
. Ony vlastně ani nejsou zvlášť složité, celá jejich funkce by se snadno dala shrnout do tvou slov „vymezení skupin“ – jenže jde o to, že tímhle jedním mechanismem jde provádět celou řadu zajímavých operací, drtivé většině uživatelů neznámých. Na ty ale dojde až v příštím pokračování, dnes se seznámíme jen se základním použitím závorek, na které v dalším díle navážeme (a konečně v něm dojde na slibovanou často žádanou funkčnost „jak napsat výraz, který nenajde zadané slovo“).
(more…)
V prvním díle série o regulárních výrazech jsem lehce naťukl, co to vlastně ty regulární výrazy jsou a na jaké problémy se musíte připravit, pokud chcete regulární výrazy používat. Také jsem ale říkal, že přes to všechno jsou regexpy nesmírně užitečným nástrojem, který stojí za to umět používat. V dnešním díle už dojde na lámání chleba: pustíme se do základních regulárních výrazů.
(more…)
Pokud trochu sledujete zdrojové kódy mých programů, jistě jste už zjistili, že v nich se železnou pravidelností používám regulární výrazy (regexpy – z „regular expression“). Proč to dělám? Protože regulární výrazy jsou nesmírně užitečným nástrojem pro zpracování textu, který se navíc dá v takřka stejné podobě použít všude možně – nemusíte být zrovna programátor, abyste ocenili sílu regexpů, protože je můžete i bez znalosti programování použít třeba v mnoha textových editorech. A protože mě známé české popisy podle mě vykazují řadu nedostatků, rozhodl jsem se napsat sérii článků uvádějících do úžasného, i když trochu mystického, světa regulárních výrazů. Ke čtení bych je doporučil zejména těm, kdo a) chtějí upravovat moje programy, nebo b) chtějí vytvářet e-booky podle mých návodů.
(more…)