Nors internetu naudojamės kasdien, ganėtinai retai susimąstome, kaip veikia šis pasaulį pakeitęs fenomenas. Pavyzdžiui, ar žinojote, kad pastaruoju metu vis svarbesnę rolę internete užima didieji duomenys, kurių sprendimais yra paremtas net „Google“ paieškos veikimo principas? Kaip veikia kartais interneto stuburu vadinami didžiųjų duomenų įrankiai, kaip jie mums pasitarnauja kasdien ir kokiose situacijose su jais susiduriame, pranešime žiniasklaidai pasakoja viešųjų duomenų rinkimo ir tarpinių serverių sprendimus teikiančios kompanijos produkto vadovas „Oxylabs“ atstovas Aleksandras Šulženko.
Asociatyvi „Pixabay“ nuotr.
Internetą paprastai ir aiškiai galima apibūdinti kaip pasaulinį kompiuterių tinklą, kuriam būdinga didelio lygio decentralizacija. Tai reiškia, kad iš šio tinklo pašalinus bet kurį jame esantį įrenginį, likusieji vis dar galės siųsti ir priimti duomenis iš kitų įrenginių.
A. Šulženko teigimu, pirmykštis internetas arba šiuolaikinio varianto pirmtakas sukurtas dar 7–ajame dešimtmetyje ir buvo naudotas karinėms reikmėms. Kiek vėliau atsirado elektroninis paštas, o 1989 m. šviesą išvydo tai, ką daugelis laiko šiuolaikinio interneto pradžia – „World Wide Web“ (WWW) platforma. Jo išradėju yra laikomas žymus anglų mokslininkas Timas Berners-Lee, tuo metu dirbęs Europos branduolinių mokslinių tyrimų organizacijoje (CERN).
„Dėl WWW internete galime kurti svetaines ir jose keliauti iš vieno puslapio į kitą, naudojant nuorodas – šiuo principu veikia didžioji dalis vartotojams skirto turinio. Svarbu ir tai, kad prieš gerą dešimtmetį įžengėme į „Web 2.0“ paradigmą. Jei „Web. 1.0“ vyravo statinis turinys, kuriamas internetines svetaines prižiūrinčių žmonių, „Web 2.0“ žymi puslapių lankytojų įgalinimą kurti kitiems pasiekiamą turinį, tampantį neatsiejama jos dalimi. Tokie gerai žinomi vardai kaip „Youtube“, „Facebook“ ar „Wikipedia“ gali būti laikomos klasikiniais „Web 2.0“ pavyzdžiais“, – sako ekspertas.
Anot jo, šiandien liudijame naujos bangos – „Web. 3.0“ – iškilimą: „Jos principas – padaryti internetinį turinį lengvai suprantamu ne tik žmonėms, bet ir kompiuteriams. Tai apima ir kiekviename puslapyje esančio turinio klasifikavimą bei struktūrizavimą.“
Kuria komfortišką interneto aplinką
A. Šulženko produkto vadovas pratęsia, kad itin svarų indėlį į patogų šiandieninio interneto funkcionavimą įneša didieji duomenys.
„Tai yra labai dideli informacijos rinkiniai, kuriuose esantys duomenys yra naudojami siekiant nustatyti juos jungiančius ryšius. Tam tikrame duomenų rinkinyje nustačius jungiančias sąsajas galima jomis vadovautis analizuojant naujus, nepilnus duomenų rinkinius ir nuspėti trūkstamų duomenų reikšmes arba ateityje įvyksiančius įvykius.
Dažnu atveju tai yra pagrindas, ant kurio laikosi kai kurios iš esminių paslaugų – internetinių parduotuvių kainų palyginimai, skrydžių ir viešbučių paieškos, pavyzdžiui, tokie puslapiai kaip „Skyscanner“, „Trivago“ ar „kaina24.lt“. Tiesa, didžiųjų duomenų įtaka internete juntama ir naudojantis kitomis paslaugomis. Tarp jų – net „Google“ paieška, kuri be šio fenomeno būtų neįsivaizduojama“, – sako A. Šulženko.
Pasak jo, didieji duomenys pasitarnauja net kuriant vartotojams pritaikytas prekes ar paslaugas – tai yra informacijos rinkiniai, generuojami rinkos tyrimo tikslais: „Pavyzdžiui, turint daug duomenų apie prekių ir paslaugų asortimentą, kainas bei pasiekiamumą, galima rasti priežastingumo ryšį tarp tam tikro prekės savybių rinkinio ir jos paklausos. Nustačius tokias sąsajas, kurti prekes, kurias pamėgs žmonės – gerokai paprasčiau.“
Užtikrina sklandų duomenų rinkimą
Ir nors didžiaisiais duomenimis paremtus sprendimus galima vadinti vienu iš šiuolaikinio interneto variklių, o juos naudoja daugelis vartotojų pamėgtų platformų, kai kurie puslapiai savo viešai prieinamais duomenimis dalintis nenori.
Nepaisant to, kad informacija yra viešai prieinama, tam tikros svetainės stengiasi įvairiais būdais neleisti iš jų rinkti informacijos arba tiekia skirtingą turinį, priklausomai nuo vartotojo vietos. Anot A. Šulženko, tai gerokai apsunkina duomenų internete automatizuotu būdu išgavimą.
„Vis dėlto tokios paslaugos kaip tarpiniai arba proxy serveriai bei viešųjų duomenų rinkimo įrankiai padeda tai įgyvendinti. Pirmieji leidžia duomenų rinkėjams naudoti didelį kiekį skirtingų IP adresų, leidžiančių turinį pasiekti iš skirtingų pasaulio vietų. Antrieji suteikia galimybę vartotojams gauti praktiškai neribotą kiekį internetinių duomenų, užtikrina jų kokybinius rodiklius, nesirūpinant pačiu duomenų surinkimu.
Apskritai, žmonės kasdien naudojasi didžiaisiais duomenimis paremtomis paslaugomis, o šie duomenys dažniausiai būna surinkti būtent iš interneto. Todėl galima sakyti, kad mūsų kuriami sprendimai yra tvirtas šiuolaikinio interneto pagrindas“, – sako A. Šulženko.