Pozrite si prednášku Miroslava Babiča, autora portálov Uvostat a Otvorená Bratislava, kde hovorí o tom ako portál Otvorená Bratislava funguje a nad akými dátami je postavený.
Prednáška bola súčasťou workshopov “Otvorené dáta v mestách a krajoch – Nitra”, ktoré realizovalo občianske združenie Alvaria online v mesiacoch február – marec 2021.
Miroslav Babič je programátor a dátový špecialista. Pracuje v medzinárodnej korporácii, vo voľnom čase sa venuje verejnoprospešným dátovým projektom. Je autor portálu Uvostat.sk a najnovšie aj portálu Otvorená Bratislava.
Cieľom portálu Otvorená Bratislava je vizualizovať finančné dáta magistrátu, zjednodušiť vyhľadávanie vo faktúrach, objednávkach, zmluvách a poskytnúť užívateľom analytické pohľady na hospodárenie magistrátu. Prostredníctvom portálu získa používateľ komplexný prehľad o nakupovaní magistrátu. Portál obsahuje medziročné štatistiky nakupovania vzhľadom na objem financií a sektorov, informácie o dodávateľoch magistrátu, či prehľadné vyhľadávanie vo faktúrach a objednávkach.
Portál je postavený nad niekoľkými dátovými zdrojmi:
- opendata.bratislava.sk – portál otvorených dát Bratislavy, ktorý v súčasnosti obsahuje stovky datasetov. Na tomto mieste Bratislava zverejňuje zmluvy, objednávky, faktúry vo formáte otvorených dát,
- finstat.sk – prostredníctvom integrácie údajov z FinStatu je možné analyzovať údaje o firmách aj podľa SK NACE
- uvostat.sk – portál obsahuje údaje o obstarávaniach
Pri vývoji portálu narazil Miroslav Babič na niekoľko výziev z hľadiska spracovávania dát. Jednou z nich je nejednotná štruktúra – štruktúra súborov sa mení v čase, mení sa typ súborov, v niektorých prípadoch sú aj PDF súbory. Tieto dáta je potom zložité spájať. Ďalšou výzvou je nekonzistentnosť v názvosloví – tie isté položky sú zapísané rozdielne. Problémom API, ktoré poskytuje mesto je že neobsahuje údaje ktoré sú v datasetoch ale len zoznam datasetov a metadáta. Ak by ich obsahovalo zrejme by boli už vyčistené. Autor dostal od mesta prísľub riešenia, bez konkrétneho dátumu. Častý problém je manuálne vkladanie dát a z toho prameniace chyby.
Vyvarovať sa týmto chybám je možné aj vďaka týmto krokom, ktoré Miroslav Babič odporúča:
- nastaviť štruktúru datasetov na začiatku,
- čistiť dáta už pred vkladaním do systému – problémom je práca so súbormi a neexistencia databáz,
- automatizovať procesy – odstránenie rizika ľudskej chyby,
- nebáť sa prebrať dobré nápady od iných – výborným príkladom API je práve Register partnerov verejného sektora, ktorý funguje veľmi dobre.
Autor projektu už dnes rozmýšľa nad ďalším vývojom portálu. Jeho plánom je dáta analyzovať a výsledky spracovávať do blogov. Ďalším cieľom je pridať porovnanie dát s rozpočtom, ktorý Bratislava taktiež zverejňuje vo formáte otvorených dát.
Pozrite si celú prednášku Miroslava Babiča a dozviete sa ďalšie užitočné informácie.