O serveru

Hlídáme je, protože si to zaslouží!

V historii ČR po 1989 považuji za zásadní existenci tří zákonů. Ústavy ČR, Zákon o svobodném přístupu k informacím (106/1999 Sb.) a Zákon o registru smluv (340/2015 Sb).

Všechny tyto zákony garantují lidem svobodu a právo kontrolovat stát, samosprávné orgány a politiky. Jsou základními kameny nutné digitalizace státu.

Od roku 1990 do dneška došlo a stále dochází k obrovským ztrátam a úniků peněz ze státního a místních rozpočtů, a to v důsledků klientelismu, úplatků a katastrofální neefektivity státu. Mohl bych vyjmenovat stovky zakázek a aktivit státu, které v prostředí soukromých firem vznikají zcela běžně za 1/10 ceny, 1/10 provozních nákladů a ve výrazně vyšší kvalitě.

Začátek

Na začátku všeho byl server Hlídač smluv, následovaný Hlídačem EET. Tyto a další aktivity jsem se rozhodl zastřešit Hlídačem státu.

Proč Hlídač Státu?

Hlídač státu má za cíl

  • zpřístupnit registr smluv
  • informace v něm obohatit o informace ze souvisejících databází
  • identifikovat plýtvání a zneužití moci v úřadech
  • analyzovat a umožnit veřejnosti data z rejstříku analyzovat
  • zvýšit kontrolu veřejných prostředků ze strany občanů
  • propojit více datových zdrojů logicky dohromady. Aktuálně jsou propojeni Hlídač smluv, Hlídač politiků a Hlídač politických financí.

Jak zpracováváme data z registru smluv

Základem je pravidelné stahování metadat registru smluv z měsíčních XML dumpů.
Poté pro všechny nové smlouvy (či změněné) stáhneme přílohy – to jsou obvykle texty smluv a příloh v PDF a Office formátech.

PDF s texty smluv a Office dokumenty jsou relativně snadné na zpracování, z nich vytáhneme texty smluv a uložíme je do systému, takže se dají prohledávat i texty smluv. Horší je to s oscanovanými smlouvami, které tvoří téměř 30 % dokumentů. V takovém případě provedeme OCR analýzu dokumentu a pokud byla úspěšnost převodu scanu na text vyšší než 80 %, pak tento text uložíme do databáze.

Tím je hotové hrubé zpracování záznamů a poté nad každou smlouvou provádíme analýzu z několika hledisek:

  1. Ověření platnosti formálních údajů
  2. Kontrola uvedených cen s DPH a bez DPH, zda jsou spočítány správně (tisíce smluv nejsou)
  3. Kontrola úplnosti údajů o smlouvě, včetně validace a ověření v obchodních a dalších rejstřících
  4. Analýza protiprávních kroků – typicky podepsání smlouvy dříve, než vznikla dodavatelská firma
  5. Analýza vztahu politiků k dodavateli ve smlouvě a nalezení konfliktu zájmů
  6. Statistické výpočty (např. dodavatelé s největším podílem na zakázkách)
  7. Hledání podezřelých okolností (dělení zakázek, smlouvy s novými firmami, apod.)

Poděkování

Server vznikl v polovině srpna 2016 a nevznikl by bez pomoci těchto lidí a institucí:

  • Michal Bláha, autor
  • Švejda & Goldmann – top UX a UI design. Jsou autory designu HlidacEET a log HlidacEET, HlidacSmluv a všech ostatních „hlídačů“.
  • Mediatoring.com – monitoring médií v reálném čase včetně TV, rozhlasu a webu
  • Ondřej Kokeš za pionýrskou analýzu rejstříku, neutuchající odhalování chyb, cennou spolupráci a cenná data.
  • Petr Boroš za pomoc se zpracováním dat z různých zdrojů.
  • Petr Siegel za pomoc s doplňováním dalších politiků.
  • Firmo.cz a GovData.cz a Merk.cz za skvělý přístup k různým zdrojům dat

Další partneři a poskytovatelé dat:

Chcete využít data ze serveru pro vlastní potřebu či prezentaci? Licence k použití je jednoduchá.

Chtěli byste pomoci? Pomocí či penězi? Bez obav mě kontaktujte. Díky