Skip to main content

Atvirų duomenų portalo plėtros viešasis pirkimas

Pagaliau paskelbtas atvirų duomenų portalo plėtros viešasis pirkimas!

Kviečiu dalyvauti šio viešojo pirkimo konkurse ir prisidėti prie atvirų duomenų proveržio!

Nors yra parengta pirkimo techninė specifikacija, tačiau papildomai noriu padaryti trumpą apžvalgą apie tai ką turime ir ko mums reikia.

Atvirų duomenų portalas susideda iš šių dalių:

  • data.gov.lt - atvirų duomenų katalogas, viena vieta, kurioje galima rasti visus šalies atvirus duomenis.

  • get.data.gov.lt - atvirų duomenų saugykla, tai yra atvirų duomenų talpinimo ir publikavimo paslauga, kur duomenys publikuojami įvairiais formatais, per vieningą API.

  • Spinta - komandinės eilutės priemonių rinkinys skirtas duomenų inventorizacijai, kokybės užtikrinimui ir perdavimui publikuoti.

  • Duomenų struktūros aprašas - susitarimas, kaip aprašomi atveriami duomenys, šio susitarimo dėka atsiranda galimybė automatizuoti daugelį veiklų susijusių su duomenų atvėrimu. Tai yra DCAT išplėtimas, leidžiantis aprašyti į duomenų rinkinį įeinančių distribucijų turinį, tokiu formatu, kuris yra patogiausias valstybinių įstaigų duomenų rinkinių tvarkytojams.

  • Atvirų duomenų vadovas - nuolat tobulinama dokumentacija, parašyta naudojant Sphinx ir reStructuredText.

Vykdanti Atvirų duomenų portalo plėtros darbus, bus vystomos visos dalys.

Trumpai apie tai, kaip numatyta vykdyti šio viešojo pirkimo darbus.

  • Darbai bus vykdomi vadovaujantis SCRUM projektų valdymo metodologija.

  • Product owneris yra programuotojas, gerai susipažinęs su projekto specifika ir žinantis ką reikia daryti.

  • Atsiskaitymas valandinis, už konkrečiai atliktus darbus, pagal iš anksto parengtas užduotis GitHub platformoje.

  • Kiekviena įgyvendinta funkcija turi turėti gerą padengimą testais.

  • Įgyvendintoms funkcijoms bus atliekamas code review.

  • Projektai prie kurių bus dirbama yra atviro kodo (Katalogo dalis dar nėra atverta, bet planuojama atverti). Todėl iš esmės prie projekto vystymo gali prisijungti bet kas.

  • Projekto užduočių sąrašas taip pat atviras ir viešai prieinamas.

data.gov.lt

projektas:

https://data.gov.lt/

technologija:

Linux, Java

kodas:

https://github.com/atviriduomenys/katalogas (kol kas dar neatvertas, bet planuojama atverti)

užduotys:

https://github.com/atviriduomenys/katalogas/issues (negalutinis ir nuolat pildomas)

Atvirų duomenų katalogas, parašytas su Java. Yra atskira administravimo dalis ir viešoji dalis.

Katalogas neturi automatinių testų, todėl prieš pradedant darbus, reikės pasidengti esamą funkcionalumą testais, kad nesugriauti to, kas jau veikia.

Nemaža dalis administravimo funkcijų bus perkeliamos į viešąją dalį, siekiant didinti patogumą naudoti, mažinti funkcijų kiekį, kurias reikia palaikyti.

Didžiausias dėmesys bus skiriamas viešajai daliai ir integracijai su duomenų struktūros aprašo specifikacija ir Saugykla.

Esamos funkcijos, kurios turėtu išlikti arba bus minimaliai tobulinamos:

  • Titulinis puslapis

  • Organizacijų sąrašas

  • Rinkinių sąrašas

  • Partnerių API - turi būti išlaikomas atgalinis suderinamumas

  • Viešasis API - turi būti išlaikomas atgalinis suderinamumas

  • Prisijungimas per el. valdžios vartus

Esamos funkcijos, kurios bus perdaromos arba stipriai keičiamos:

  • Bus perkeliamas visas duomenų teikėjų koordinatorių ir tvarkytojų funkcionalumas, integruojanti į viešąją dalį, papildant pilnu duomenų struktūros aprašo administravimu. Mano vertinimu, įgyvendinti tai administravimo dalyje bus per daug sudėtinga, be to, tai būtų dvigubas darbas.

  • Integracija su išoriniais duomenų katalogais

  • Integracija su Europos duomenų portalu

  • Duomenų šaltinių sąrašas

  • Duomenų peržiūra (integracija su Saugykla)

  • Poreikiai ir pasiūlymai

  • Panaudojimo atvejai

  • Ataskaitos

  • Atvėrimo planavimas

Esamos funkcijos, kurios bus perkeliamos ant esamų atviro kodo sprendimų:

  • Visas administravimas, skirtas vyriausiajam administratoriui, tokių naudotojų yra vos keli.

  • Visas turinio valdymo administravimas.

  • Naujienos.

Naujas funkcionalumas:

  • Integracija su Saugykla, DCAT 3.0, duomenų struktūros aprašo specifikacijos palaikymas, palaikymas, apraše pateikiamų metaduomenų administravimas ir atvaizdavimas.

  • Užduočių valdymas, užduotys gali ateiti iš įvairių vietų, automatiniai patikrinimai, naudotojų pranešimai ir pan.

get.data.gov.lt ir spinta

projektas:

https://get.data.gov.lt/

technologija:

Linux, Python

kodas:

https://github.com/atviriduomenys/spinta

užduotys:

https://github.com/atviriduomenys/spinta/issues (negalutinis ir nuolat pildomas)

get.data.gov.lt ir spinta yra vienas projektas, viena kodo bazė, kuris veikia kaip komandinės eilutės priemonių rinkinys ir kaip duomenų publikavimo serveris.

Spinta projektas parašytas naudojant Python programavimo kalbą. Šis komponentas atsakingas už automatinį duomenų publikavimą (get.data.gov.lt) ir automatinį duomenų atvėrimą (komandinės eilutės įrankis).

Kodo padengimas testais geras, yra virš 1000 unit testų, testais padengta apie 90% kodo.

Visas duomenų valdymo funkcionalumas yra dinaminis, interpretuojant tai, kas yra parašyta duomenų struktūros apraše. Nors yra padarytas tam tikras karkasas, tačiau gali tekti susidurti su interpretatoriaus lygio kodo rašymu.

Esamos funkcijos, kurios bus tobulinamos:

  • Duomenų struktūros aprašo ir duomenų kokybės tikrinimas, pateikiant aptiktas klaidas pačiame duomenų struktūros apraše, komentarų pavidalu.

  • Struktūros aprašo schemos keitimų valdymas (migracijos).

  • Duomenų filtravimo funkcionalumo tobulinimas.

  • Optimizavimas, greitaveikos ir stabilumo didinimas.

Naujas funkcionalumas:

  • Naujų duomenų šaltinių palaikymas: CSV, JSON, XLSX, XMLHTML.

  • Naujų publikavimo formatų palaikymas: RDF, TTLSQL.

  • Duomenų vizualizacija (pagal duomenų tipą).

  • Naujų transformacijos funkcijų palaikymas.

  • Struktūros aprašų valdymas per API.

  • API klientų valdymas per API.

  • Trūkstamų duomenų struktūros aprašo specifikacijos punktų įgyvendinimas.

  • Ribojamo panaudojimo tikslo duomenų publikavimas.

  • SPARQL paieška.

Istorija

Tiems, kam patinka platesnis vaizdas, truputis istorijos, kaip iki čia atėjome. Tai nėra pilna istorija, tik ta dalis, kuri mano manymu turėjo tiesioginę įtaką po to sekusiems įvykiams.

Aš pats į veiklą susijusią su atvirais duomenimis įsitraukiau nuo 2012 metų.

  • 2006-10-10 - Pradėtas pildyti informacijos rinkmenų sąrašas.

  • 2012-07-31 - Ūkio viceministras Rimantas Žylius pradėjo kalbėti apie atvirus duomenis.

  • 2012-10-08 - sukurta Lietuvos atvirų duomenų naudotojų el. pašto grupė.

  • 2013-01-05 - atvirų duomenų galimybių studija (Kurk Lietuvai).

  • 2014-10-09 - atvirų duomenų galimybių studija (IVPK).

  • 2014-10-27 - pradėjau savo atvirų duomenų platformos vizijos įgyvendinimo darbus, tuo metu projektą vadinau kodiniu pavadinimu databot, vėliau šio projekto pagalba esu atvėręs 15-os oranizacijų duomenis.

  • 2015-05-26 - pradėjau atvirų duomenų bendruomenės vystomą projektą atviriduomenys.lt, kaip alternatyvą tuo metu veikiančiam opendata.gov.lt.

  • 2016-08-29 - atvirų duomenų platformos investicijų projektas.

  • 2017-07-31 - perkėliau opendata.gov.lt į ckan.opendata.gov.lt.

  • 2017-12-29 - atvirų duomenų platformos projekto pradžia.

  • 2018-02-01 - atvirų duomenų platformos metodikos projektas.

  • 2018-09-05 - mano pasiūlyta atvirų duomenų platformos vizija.

  • 2019-02-01 - remiantis databot projekto idėjomis ir patirtimi, pradėjau naują projektą, kodiniu pavadinimu spinta, šio projekto paskirtis - duomenų atvėrimo proceso standartizavimas ir automatizavimas.

  • 2019–02–12 - paskelbtas atvirų duomenų portalo kūrimo viešasis pirkimas, šio projekto metu buvo atverti penkių įstaigų duomenys.

  • 2020-07-01 - startuoja data.gov.lt - Lietuvos atvirų duomenų portalas.

  • 2020-10-19 - kadangi labai senai bendraujam ir iš esmės konkuruojam su IVPK atvirų duomenų srityje, galiausiai nusprendžiau įsidarbinti IVPK, kad galėtume apjungti jėgas siekiant vieno bendro tikslo - atvirų duomenų proveržio.

  • 2020-12-01 - parengta duomenų struktūros aprašo techninė specifikacija, kurios pagrindu sudaroma galimybė automatizuoti duomenų atvėrimą. Specifikacija paremta mano šešių metų patirtimi ieškant būdų, kaip optimizuoti ir paspartinti duomenų atvėrimą viešajame sektoriuje.

  • 2020-12-14 - paskelbtas II duomenų atvėrimo etapo viešasis pirkimas, tačiau netrukus šis pirkimas buvo nutrauktas ir Vyriausybės sprendimu perduotas Statistikos departamentui. Tačiau pradėti darbai standartizuojant ir automatizuojant duomenų atvėrimą išliko aktualūs, kadangi VDV IS nėra skirta duomenų atvėrimui ar publikavimui. Todėl buvo pradėta rašyti nauja techninė specifikacija, tiek pačio atvirų duomenų katalogo, tiek atvėrimo automatizavimo ir publikavimo priemonių plėtrai. Deja, toks staigus pasikeitimas, kainavo praktiškai metus laiko.

  • 2021-03-01 - paleista atvirų duomenų publikavimo paslauga get.data.gov.lt vadinama Saugykla, kuri veikia atviro kodo spinta projekto pagrindu, prie kurio dirbau paskutinius tris metus.

  • 2021-03-31 - Saugykloje publikuoti pirmieji duomenys, kuriuos publikavo Statistikos departamento.

  • 2021-09-06 - Saugykloje publikuoti pirmieji duomenys pilnai automatizuotu būdu, kuriuos publikavo Standartizacijos departamentas.

  • 2022-02-25 - Paskelbtas atvirų duomenų portalo plėtros viešasis pirkimas, kuris realiai turėjo prasidėti daugiau nei prieš metus.