Projekt č.1: Digitalizace knih z fondu Národní knihovny
Tenhle projekt jsem už jednou navrhoval, ale v trochu jiné podobě. Jako technické zázemí pro digitalizaci můžeme využít WikiZdroje, takže nebude potřeba vyvíjet vlastní systém, na kterém se zasekl předchozí pokus. Co všechno tenhle projekt obnáší:
- Vyhledat knížku v systému Kramerius, stáhnout data pomocí mého skriptu a nahrát výsledný DjVu dokument na WikiMedia Commons. (Nebo mi pošlete odkaz na knížku a já vám ji tam nahraju.)
- Ručně opravit chyby v OCR textu. Zpracovat jednu stránku včetně formátování trvá asi 15-20 minut. Příklad
- Zkontrolovat už opravené texty, že v nich nezůstaly žádné chyby. Digitalizační modul na WikiZdrojích vyžaduje kontrolu od 2 dalších lidí.
- Hotový text vydat jako e-knihu v několika formátech (PDF, EPUB, atd.) pod hlavičkou Pirátské strany. Konverze z WikiZdrojů se dá z velké části automatizovat skriptem, takže nejvíc času by pak zase zabrala oční kontrola výsledných souborů. Prostě projekt pro knihomoly.
Na Internetu už existuje spousta volných a svobodných e-knih, třeba na webu Městské knihovny v Praze. Podobných webů je ale víc, takže by to chtělo vytvořit velkou databázi odkazů, aby čtenáři nemuseli prohledávat každý web zvlášť (a Google se hodí jen na některé druhy hledání). Co všechno tenhle projekt obnáší:
- Vývoj systému.
- Navázání spolupráce s provozovateli zdrojových webů, aby nám poskytli odkazy a metadata pro import.
- Propagace.
Cílem je vytvořit databázi legislativních návrhů a parlamentních hlasování, kde by občané mohli sledovat novinky, diskutovat nad obsahem návrhů a značkovat si, jak by sami hlasovali. Před volbami by si pak mohli prohlédnout, kteří poslanci jim byli skutečně názorově nejblíž (ne jen planými řečmi před kamerou). Postupem času by pak systém mohl pomáhat i s tvorbou a předkládáním pozměňovacích návrhů samotnými voliči. Co všechno tenhle projekt obnáší:
- Vývoj systému.
- Ruční úprava popisu hlasování z parlamentního stenozáznamu a přidávání odkazů na související dokumenty.
- Propagace.
Oživit vlákno o konzultacích Evropské komise a případně ho rozšířit i na připomínkování krajských a celostátních věcí. Co všechno tenhle projekt obnáší:
- Psát doporučení pro ostatní k tématům, kterým dobře rozumíte.
- Vyplňovat konzultace.
- Propagace.
Chtělo by to licenci jako CC BY-NC, ale upravenou tak, aby umožňovala komerční užití za paušální poplatek (určený autorem). Creative Commons licence odbourávají veškerou licenční byrokracii, pokud buď autor vůbec nestojí o peníze, nebo je dílo využíváno nekomerčně. Pirátská licence by měla za cíl odbourat veškerou byrokracii pro komerční využití i v případě, že autor peníze chce. Co je na to potřeba:
- Právník, který licenci napíše.
- Vytvořit databázi děl pod Pirátskou licencí, kde by komerční uživatelé snadno dohledali kontaktní a fakturační údaje autora (ten se musí zaregistrovat sám).
- Propagace.