Pozrite si video z prezentácie Petra Hanečáka, programátora a open data experta, ktorý hovorí o tom ako zverejniť open data rýchlo a lacno.
Prednáška bola súčasťou podujatia Mestá a Open Data v Trenčíne, ktoré organizovalo naše občianske združenie v spolupráci s mestom Trenčín v termíne 9.-10. septembra 2020.
“Technológia zverejňovania dát je vlastne veľmi jednoduchá, veľmi priamočiara a veľmi lacná. Ale to čo sme vytesnili, je žiaľbohu, veľmi dôležité. Sú to tzv. politické a organizačné veci, ktoré sú častokrát zložité, ťažkopádne, drahé, komplikované, niekedy dokonca nereálne. Ale za predpokladu, že sa nájde starosta alebo primátor, ktorý to chce a vie riešiť, a keď má k dispozícií IT-čkára, ktorý vie a chce riešiť, tak následne je to riešiteľné omnoho ľahšie. Z politickej línie sa dajú vydať pokyny aby sa riešili agendy, procesy, ľudia a zdroje. Následne aj tí úradníci a IT-čkári vedia zabezpečiť aby to technické riešenie bolo efektívne a jednoduché.”
Pointa otvorených dát spočíva v tom, aby boli datasety zverejnené na jednom mieste. Datasety sa preto zverejňujú v katalógoch otvorených dát, ktoré by okrem datasetov na stiahnutie mali obsahovať aj stručné metaúdaje (informácie o zverejnených dátach), licencie (podmienky použitia dát) a kontaktné informácie na gestora dát. Pri zverejňovaní datasetov treba dodržiavať Vyhlášku č. 78/2020 Z. z. MIRRI o štandardoch pre informačné technológie verejnej správy, ktorá presne definuje technické atribúty otvorených dát.
Vytvorenie katalógu otvorených dát je preto prvým krokom, ktoré by po technickej stránke malo mesto zabezpečiť, ak sa rozhodne začať so zverejňovaním dát. Vytvorenie kvalitného katalógu si nevyžaduje stovky človekohodín ani implementáciu zložitých technických riešení. Katalóg je možné vytvoriť niekoľkými prístupmi:
- Vytvoriť katalóg na webstránke mesta – Ide o jednoduché riešenie v podobe prehľadnej stránky, podstránky, tabuľky, kde sú k dispozícii na stiahnutie datasety v rôznych formátoch vrátane bližšieho popisu údajov (metadáta). Pri tvorbe katalógu možno využiť interné kapacity mesta na vývoj vlastného open data katalógu, tak ako to spravil Magistrát Bratislavy alebo osloviť dodávateľa informačných systémov. Takýto prístup zvolil aj Prešov, ktorý pre výkon agendy používa rôzne systémy spoločnosti Corageo. Dáta z týchto systémov sú následne zverejňované automatizovane vo formáte otvorených dát v katalógu open data.
- Data.gov.sk a jeho technickú infraštruktúru – Výhodou je, že ak sú datasety katalogizované, príp. umiestnené na data.gov.sk sú automaticky preberané aj na európsky dátový portál, čím sa stávajú dáta viditeľnejšie.
Mestá sú si často vedomé toho, že majú v systémoch nepresné, neúplné, neaktuálne dáta. Lepším prístupom ako do nekonečna vyčkávať na moment, kedy budú dáta v 100% kvalite, je zverejniť to čo je v systémoch a postupne, aj na základe spätnej väzby od používateľov, zlepšovať kvalitu údajov. Ako hovorí Peter Hanečák, “chyby sa dejú. Nechceme čakať kým tie dáta budú dokonalé, lebo to nebude nikdy. Treba zverejňovať to čo máme – ako máme. Nato je dôležité potom s ľuďmi komunikovať a na to je dôležité uvádzať kontaktný údaj. “
Peter Hanečák hovorí v prezentácii niekoľko praktických rád na ktoré netreba zabúdať pri zverejňovaní dát:
- V metaúdajoch vysvetliť skratky, ktoré nemusia byť jasné pre verejnosť a vysvetliť, čo sa nachádza v jednotlivých stĺpcoch.
- Drvivá väčšina open data aplikácií využíva desiatky až stojky datasetov, preto nevymýšľajte vlastné licencie. Používajte tie, ktoré sú odporúčané na Európskej úrovni (Creative Commons). Umožňujú ľahšie kombinovať datasety – klesá riziko, že licencie nebudú vzájomne kompatibilné.
- Zverejňujte otvorené formáty (csv, json, xml), inak vyrábate extra náklady pre tých, ktorí chcú pracovať s Vašimi dátami ale musia si kúpiť licencie na Vami používané softvéry.
- Ak Vám to kapacity dovoľujú, zverejňujte datasety vo viacerých formátoch, nech si používateľ môže vybrať. Programátorom sa dobre robí s formátmi json, ale bežný človek s ním nevie pracovať a ocení skôr csv.
- Dáta vo Vašich systémoch sú Vaše, ak dodávateľ tvrdí niečo iné, vymeňte ho.
Vypočujte si celú prednášku od Petra Hanečáka a dozviete sa plno ďalších užitočných rád ako zverejňovať otvorené dáta rýchlo a lacno v súlade s technickými požiadavkami na dáta.