Didžiųjų duomenų ir dirbtinio intelekto technologijų panaudojimas viešajame valdyme atveria ne tik galimybes, bet ir kelia tam tikras grėsmes, susijusias su etinėmis šių technologijų taikymo problemomis, duomenų apsaugos ir asmens privatumo iššūkiais, taipogi jų panaudojimui kyla kliūčių dėl reikalingų resursų ir kompetencijų trūkumo, bendradarbiavimo stokos valstybės tarnyboje, politikos formavimo proceso ypatumų, kokybiško duomenų trūkumo ir fragmentacijos.
Asociatyvi „Pixabay“ nuotr.
Visgi dabartinės tendencijos atskleidžia, kad viešąją politiką formuojančios ir įgyvendinančios institucijos palaipsniui prisitaiko prie technologinių pokyčių teikiamų galimybių panaudodamos šias technologijas tam, kad priimtų geresnius duomenimis pagrįstus sprendimus, mažintų biudžeto išlaidas, spręstų socialines – ekonomines problemas, teiktų kokybiškesnes viešąsias paslaugas, užtikrintų atskaitomybę ir kurtų didesnę vertę piliečiams.
Didžiųjų duomenų ir dirbtinio intelekto technologijos gali padėti viešosios politikos sprendimų priėmėjams laiku ir tinkamai reaguoti į kylančius 21-o amžiaus iššūkius: ekonomines, politines, saugumo, sveikatos ir klimato krizes, kartu su biurokratijos mažinimu kylantį efektyvaus valstybinio reguliavimo poreikį, socialinę nelygybę ir atskirtį, smurtą artimoje aplinkoje, lygių galimybių ir teisingumo užtikrinimą, sveikatos ir socialinių paslaugų prieinamumą, terorizmo grėsmę, benamystę ir kt.
Didžiųjų duomenų (angl. big data) terminas sietinas apytikriai su 1990 metais, tačiau daugiau apie juos pradėta diskutuoti tik apie 2000 metus. Dažniausiai jie apibrėžiami kaip milžiniškas struktūruotų ir nestruktūruotų duomenų kiekis, kurie yra generuojami, užfiksuojami ir išsaugojami ypatingu greičiu, siekiant iš jų išgauti vertę organizaciniam prognozavimui ir sprendimų priėmimui. Šie duomenys renkami iš labai plataus spektro šaltinių: mobiliųjų telefonų, video įrašymo įrenginių, sensorių, įvairių išmaniųjų prietaisų, miestuose esančių vaizdo kamerų ir kitų šaltinių.
Jie suteikia galimybę institucijoms prognozuoti piliečių elgseną, analizuoti ekonomikos ir statistinius reiškinius. Remiantis Jungtinių Tautų siūloma klasifikacija, galima išskirti šiuos didžiųjų duomenų šaltinius: a) socialinių tinklų, t. y. žmonių sugeneruotus, duomenis tokius kaip „Twitter“, „YouTube“ ir kt. socialinių medijų, paieškų sistemų, blogų įrašų, mobilių telefonų žinučių, elektroninio pašto ir kt. informacija; b) valdymo sistemų duomenis (procesų tokių kaip verslo operacijos, elektroninė prekyba, kreditinės kortelės ir kt. sugeneruotus duomenis); c) daiktų interneto (angl. Internet of Things), t. y. mašinų sugeneruotus, duomenis tokius kaip pastatų, vandens gavybos, taršos, apsaugos kamerų sensorių, automobilių, palydovų, kompiuterinių sistemų informacija ir kt.
Pretty išskiria tris didžiųjų duomenų šaltinius: a) istorinius laiko eilučių duomenis; b) esamojo laiko (angl. real-time) duomenis kelių valandų ar minučių laikotarpiu, atspindinčius esamą, ar artimą esamai, situaciją; c) prognostinius duomenis, kurie atskleidžia, kas gali įvykti ateityje, o institucijos priima sprendimus pasiremdamos ateities projekcijomis.
Didieji duomenys panaudojami kaip įvesties (angl. input) ir išvesties (angl. output) duomenys apmokant ir tikrinant dirbtinio intelekto modelius. Europos Komisija apibrėžia dirbtinį intelektą kaip „sistemas, kurios demonstruoja protingą elgesį, analizuodamos savo aplinką ir atlikdamos iš dalies autonomiškus veiksmus tam, kad pasiektų konkrečius tikslus“. Dirbtinio intelekto tyrimų laukas apima apima tokias technologijas kaip mašininis mokymasis (angl. machine learning) (išskiriamos trys mašininio mokymosi sritys: mokymasis be mokytojo (angl. unsupervised learning), mokymasis su mokytoju (angl. supervised learning) ir sustiprintas mokymasis (angl. reinforcement learning), dirbtinių neuroninių tinklų (angl. artificial neural networks) algoritmais pagrįstas gilusis mokymasis (angl. deep learning), mašininis samprotavimas (angl. machine reasoning) ir robotika.
Didžiųjų duomenų ir dirbtinio intelekto technologijų panaudojimas verslo ir viešajame valdyme galimas keturiais būdais. Aprašomoji analitika (angl. descriptive analytics) yra orientuota į siekį identifikuoti, koks reiškinys vyksta, kur jis vyksta, kas yra jo paveiktieji ir kokios yra jų demografinės charakteristikos. Ji yra naudojama siekiant nustatyti karštuosius taškus (angl. hotspots), kurie parodo, kokiu intensyvumu pasireiškia įvairūs fenomenai, sudaryti tokių karštųjų taškų žemėlapius. Tai suteikia galimybę suprasti, kaip tam tikri elgesio modeliai yra susiję su bendruomenių turima infrastruktūra, gyventojų sveikata, išsilavinimu, socialiniu-ekonominiu statusu. Aprašomosios analitikos pavyzdys yra COVID-19 pandemijos metu „Google“ kompanijos parengtos įvairių šalių gyventojų mobilumo ataskaitos, kurios buvo naudojamos siekiant suprasti SARS-CoV-2 viruso plitimui įtaką darančius veiksnius.
Diagnostinė analitika (angl. diagnostic analytics) gali padėti nustatyti probleminius fenomenus, kurie savo savybėmis išsiskiria iš normalių fenomenų (t. y. diagnozuoti problemas), ir paaiškinti, kodėl probleminiai reiškiniai įvyksta, išryškinant esminius su jais susijusius kintamuosius. Platus tyrinėjimų laukas yra COVID-19 ligos atvejų diagnozavimas panaudojant mašininio mokymosi (angl. machine learning) ir neuroniniais tinklais pagrįstus giliojo mokymosi (angl. deep learning) metodus ir algoritmus (pvz., konvoliucinius neuroninius tinklus (angl. convolutional neural networks (CNN)), šioje srityje paskelbta daug mokslinių publikacijų.
Prognostinė analitika (angl. predictive analytics) identifikuoja įvykių tendencijas remdamasi praeities laiko eilučių duomenimis ir tų tendencijų pagrindu modeliuoja įvykių raidą ateityje. Nuo pandemijos pradžios publikuota daug mokslinių straipsnių, kuriuose pristatomi užsikrėtimų SARS-CoV-2 virusu prognozavimo remiantis įvairiais prognostiniais modeliais rezultatai.
SARS-CoV-2 viruso plitimo prognozavimui naudojami klasikiniai epidemiologiniai modeliai (SIR, SEIR bei šių modelių modifikacijos, logistinis modelis, ARIMA modelis, kelių kintamųjų tiesinė regresija, taipogi neuroniniais tinklais pagrįsti modeliai, Prophet, DeepAR, N-Beats modeliai, ilgalaikės trumposios atminties tinklai (angl. Long Short-Term Memory (LSTM)), rekurentiniai neuroniniai tinklai (angl. recurrent neural networks (RNN)), daugiasluoksnis perceptronas (angl. Multilayer Perceptron), giliosios ekstremalaus mokymosi mašinos (angl. Deep Extreme Learning Mashines (DELM), grafiniai neuroniniai tinklai (angl. Graph Neural Networks (GNN)). Tačiau galima pastebėti, kad daugumoje šių tyrimų COVID-19 pandemijos rodiklių prognozavimas buvo vykdomas remiantis vieno kintamojo laiko eilučių analize (t. y. buvo sudaryti modeliai, kuriais, pvz., užsikrėtimų virusu atvejų skaičius prognozuojamas remiantis duomenimis apie užsikrėtimų atvejų skaičiaus reikšmių pokyčius ankstesniu laikotarpiu).
Daug mažiau paskelbta tyrimų, kuriuose prognozavimas rėmėsi kelių kintamųjų laiko eilučių analize ir į prognostinius modelius buvo įtraukiami duomenys apie kitų veiksnių (pvz., karantino priemonių) poveikį užsikrėtimų atvejų skaičiaus ar kitų COVID-19 pandemijos rodiklių pokyčiams. Dažniausiai prognostiniuose modeliuose prognozėms naudojami COVID-19 pandemijos rodiklių duomenys šalių mastu, tačiau taip pat buvo atlikta COVID-19 pandemijos prognozavimo tyrimų, kuriuose buvo tiriama pandemijos dinamika įvairių šalių regionuose (pvz., JAV valstijose, Kinijos provincijose). Kita vertus, dar menkiau buvo tyrinėta pandemijos dinamika skirtingose gyventojų grupėse.
Preskriptyvioji analitika (angl. prescriptive analytics) apima sprendimų paramos ir optimizavimo sistemas. Sprendimai ir veiksmai rekomenduojami panaudojant matematinius algoritmus ir apdorojant prognostinės analitikos išvesčių duomenis. Tokia analitika suteikia galimybę pasirinkti tinkamiausius sprendimus iš daugelio alternatyvų. Sėkmingo duomenų pavertimo vertę kuriančiais sprendimais pavyzdžiai verslo organizacijose yra klientų sandorių duomenų panaudojimas optimizuojant klientų segmentavimą ir tikslinių grupių nustatymą arba sprendimų palaikymo įrankių kūrimas, siekiant optimizuoti priežiūros užduotis.
Tačiau ne tik tik verslo organizacijos, bet ir viešojo sektoriaus įstaigos savo veikloje vis plačiau panaudoja didžiųjų duomenų ir dirbtinio intelekto technologijų teikiamas galimybes. Sveikatos priežiūros įstaigos, analizuodamos pacientų sveikatos duomenis realiuoju laiku, gali pacientams pasiūlyti personalizuotas paslaugas, pateikia analitinių sistemų panaudojimo miestuose pavyzdžius – pastatų ir sveikatos inspektorių veiklos optimizavimą, remiantis numatoma pažeidimų tikimybe. Prognostinės policijos sistemos panaudojamos policijos veiklai optimizuoti, iš anksto paskirstant išteklius numatomų nusikaltimų vietoms.
Atliekų tvarkymo sistemos padeda miestams efektyviau atlikti atliekų surinkimą ir šalinimą. Tokios analitinės sistemos naudoja didžiuosius duomenis ir daiktų internetą, kad pagerintų veiklos efektyvumą. Analitika taip pat panaudojama ir kaip priemonė strateginių sprendimų priėmimui viešajame sektoriuje. Pavyzdžiui, Brandtas, Bendleris ir Neumannas parodo, kaip savivaldybės panaudoja socialinių medijų analizę kurdamos miesto turizmo plėtros strategijas. Ilgalaikiai strateginiai sprendimai viešajame sektoriuje, ypač vietos savivaldoje, dažnai yra susiję su investicijomis į infrastruktūrą (pvz., keliais ar viešuoju transportu) ir miesto plėtra.
Paminėtini keli optimalių sprendimų paieškos ir rekomendavimo pavyzdžiai ir COVID-19 pandemijos valdymo srityje. Kilus COVID-19 pandemijai, šalių vyriausybėms kilo uždaviniai nustatyti optimalų skirtingų priemonių taikymo lygį, kad būtų pasiekta didžiausia nauda (kaip galima labiau sumažintas užsikrėtimų SARS-CoV-2 virusu atvejų ir mirčių nuo COVID-19 ligos atvejų skaičius) su kuo mažesnėmis sąnaudomis ir neigiamomis pasekmėmis gyventojams ir verslui. Matrajt ir kt. parengė matematinį modelį ir pritaikė optimizavimo algoritmus, pagal kuriuos galima apskaičiuoti, kokios gyventojų vakcinavimo strategijos skirtingose amžiaus grupėse yra optimaliausios, siekiant minimizuoti tokius rodiklius kaip užsikrėtimų atvejų skaičius, hospitalizuotų asmenų skaičius, asmenų intensyvios terapijos skyriuose skaičius, mirčių nuo COVID-19 atvejų skaičius. Awasthi ir kt. (2021) straipsnyje pristatytas veiksmingų COVID-19 vakcinų strategijų paieškos modelis VacSIM, pagrįstas „giliuoju Q mokymusi“ (angl. Deep Q Learning) ir tokiais algoritmais kaip „kontekstiniai banditai“ (angl. contextual bandits) ir „veikėjo kritika panaudojant Kroneckerio faktorizuotą pasitikėjimo regioną“ (angl. Actor-Critic using Kronecker-Factored Trust Region (ACKTR)).
Uddin ir kt. (2020) parengė modelius, pagrįstus sustiprinto mokymosi (angl. reinforcement learning) ir giliojo mokymosi algoritmais, kuriuos galima pritaikyti optimalių sprendimų dėl gyventojų testavimo, dezinfekavimo ir karantinavimo paieškai. Palyginus modelius, buvo nustatyta, kad giliojo mokymosi algoritmai tokie kaip „gilusis Q tinklas“ (angl. Deep Q Network (DQN)) ir „gilusis deterministinis politikos gradientas“ (angl. Deep Deterministic Policy Gradient (DDPG)) veikia geriau nei įprasti sustiprinto mokymosi algoritmai tokie kaip „Q mokymasis“ arba „būsena-veiksmas-atlygis-būsena-veiksmas“ (angl. State-Action-Reward-State_Action (SARSA)).
Didžiųjų duomenų analizė padeda geriau suprasti kompleksiškas socialines problemas, į kurias būtų sudėtinga reaguoti remiantis vienu duomenų šaltiniu. Tokia analizė gali būti pritaikoma, siekiant numatyti tam tikrų grupių charakteristikas, pvz., iš mokyklų iškrisiančių mokinių skaičių, įvairių reiškinių ir fenomenų plėtros galimybes, kaip, pvz., ligų protrūkius, ar gyventojų lokacijas žemės drebėjimų areale, socialinės paramos nepaėmimo mastą ir metodologiją jo įveikimui. Didieji duomenys taip pat suteikia galimybę stebėti įvairių reiškinių vystymosi kryptis, pvz., skurdo rodiklių pokyčius tam tikruose teritoriniuose vienetuose. Svarbiausia, kad veiksmingas didžiųjų duomenų panaudojimas gali pagerinti paslaugų efektyvumą, pasiekiant didesnį rezultatą su mažesnėmis sąnaudomis.
Didžiųjų duomenų analitika viešojo sektoriaus institucijoms suteikia ir gali suteikti ir kitų privalumų. Pažymėtinas perėjimas nuo popierine dokumentacija paremtų prie skaitmeninių paslaugų, užtikrinant didesnę duomenų integraciją, judėjimą ir dalijimąsi iš skirtingų institucijų. Pabrėžtinos ir viešųjų paslaugų tobulinimo galimybės, pasitelkiant didžiuosius duomenis, kai yra analizuojama piliečių nuomonė apie viešųjų paslaugų kokybę. Taip, pvz., paieškos raktažodžiai gali suteikti naudingą grįžtamąjį ryšį ir padėti tobulinant viešąsias paslaugas, kad jos geriau atitiktų piliečių poreikius. Toks grįžtamasis ryšys paslaugų teikėjams sukuria strateginę reagavimo galimybę. Kaip aiškina mokslininkai Gillingham ir Graham, didžiųjų duomenų rinkimas apie piliečių elgseną ir jų aktyvumą naudojantis paslaugomis, institucijoms ir politinių sprendimų priėmėjams sukuria naujas prielaidas paslaugų planavimo, teikimo ir jų fokusavimo tobulinimui.
Didieji duomenys gali prisidėti ir prie reikšmingesnio piliečių įsitraukimo į viešosios politikos programų vystymą, įgyvendinimą ir vertinimą. Didieji duomenys gali atskleisti realias visuomenės preferencijas įvairiais viešosios politikos klausimais, ir todėl viešosios politikos formavimo procesas gali tapti mažiau priklausomas nuo viešojo valdymo ekspertų, kurių nuomonė ne visada atitinka realius visuomenės poreikius, ir interesų grupių poveikio. Didieji duomenys gali būti naudojami piliečių nuostatų ir nuotaikų analizei, siekiant išsiaiškinti, kaip visuomenė vertina konkrečią viešąją politiką. Šiuo atveju, didieji duomenys yra panaudojami kaip tam tikras grįžtamojo ryšio apie politikos sprendimus ir jų įgyvendinimą mechanizmas.
Vis dėlto kai kurie mokslininkai, pvz., Coulton ir kt., pastebi, kad, nepaisant technologinio progreso, atskiros viešojo gyvenimo sritys, pvz., socialinių paslaugų sektorius vis dar lėtai integruoja duomenų analitiką į politikos formavimo ir įgyvendinimo procesus. Tokią situaciją galima paaiškinti sudėtingai išmatuojama ilgalaike verte, kurios kūrimas, pasitelkiant didžiuosius duomenis, reikalauja reikšmingų investicijų. Prognostinė analizė viešojo sektoriaus institucijų veikloje irgi turi būti vertinama atsargiai. Nepaisant didelio patikimumo, neapibrėžtumai ir klaidos tikimybė visada egzistuoja.
Doc. Adomas Vincas Rakšnys, prof. Dangis Gudelis, prof. Arvydas Guogis, Mykolo Romerio universiteto Viešojo administravimo institutas