Berklyje esančio Kalifornijos universiteto mokslininkai pristatė naują paieškos variklį „Infovell“, pasak jų, sugebantį atrasti tai, ką praleidžia tokie paieškos gigantai kaip „Google“ ar „Yahoo“.
Nors „Infovell“ galimybės turėtų pralenkti beveik etalonu tapusį „Google“ paieškos variklį, visgi naujoji sistema neskirta plačiajai rinkai ir konkurencijai su komercinėmis paieškos sistemomis. Tuo labiau, jog ir naujos paieškos sistemos sukūrimo priežastis buvo iš esmės svarbi daugiau mokslininkams – tikslios, rimtos ir specifinės informacijos paieška.
Kūrėjų nuomone, tokio tipo informaciją tradicinės paieškos sistemos praktiškai nesugeba net suindeksuoti – jų nuomone, dabartiniu momentu rimtos elektroninės medžiagos, prieinamos internetu, indeksavimas siekia tik 0,2 %, kai likusi informacija – 99,8 % (taip vadinama deep web) yra likusi šešėlyje ir paieškos robotai jos tiesiog nepasiekia (dėl pačių įvairiausių priežasčių, iš kurių pagrindinės yra registracijos būtinybė ar kitos papildomos sistemos apsaugos).
Šis neindeksuotas informacijos lobynas ypatingai svarbus mokslininkams, nes jame dažniausiai slepiasi specializuota informacija, neturinti gražios sąsajos su vartotoju, padėta mažai lankomame puslapyje, tačiau vertinga ir naudinga. „Infovell“ kūrėjai akcentuoja susidariusi ratą, kuomet nedideli ir neoptimizuoti puslapiai yra nemėgstami paieškos sistemų, tad jie niekaip nepakyla į viršutinius užklausos rezultatus. Todėl sulaukia nedaug lankytojų ir gauna nedidelį paieškos sistemų įvertinimo balą. O tai vėl juos stumia į paieškos rezultatų dugną.
Tad norėdami surasti naudingą straipsnį, mokslininkai paprastai yra užverčiami nereikalingos ir net nesusijusios informacijos kiekiu, tačiau padidinus raktinių žodžių skaičių, rezultatų apskritai paieškos sistema neberanda.
Štai tokia situacija paskatino Kalifornijos universiteto mokslininkus, dirbančius prie žmogaus genomo projekto iššifravimo (Human Genome Project) sukurti naują paieškos variklį. Štai čia reiktų pažymėti įdomų faktą – genomo tyrinėtojams neatsitiktinai šovė į galva mintis, jog jie pajėgus sukurti tokią sistemą. Juk tyrinėjant genomą, tenka apdoroti milžiniškus duomenų kiekius ir juose surasti atskiras genomo grandines, kurios nėra pažymėtos jokiais raktažodžiais. Tad per ilgą laiką mokslininkai susikūrė savus originalius paieškos algoritmus, kuriuos dabar nusprendė pritaikyti bendros informacijos paieškai internete.
Štai taip gimė sistema „Infovell“, sugebanti aptikti reikiamą informaciją bet kokia kalba ir net užkoduota bet kokia kita simbolių sistema. Pasak kūrėjų, vienintelis reikalavimas ieškomam dokumentui – jis turi būti skaitmeninės formos.
Nuo tipinių paieškos sistemų „Infovell“ skiriasi dar ir tuo, jog ji ieško ne tik pagal raktinius žodžius, bet ir pagal „ištisas raktines frazes“, – pažymi sistemos kūrėjai. Sistema gali ieškoti atitikmenų pagal atskirus dominančio teksto paragrafus ar ištisus dokumentus arba net dokumentų rinkinius. Vienintelis užklausos apribojimas yra jos dydis – ji neturi viršyti 25 tūkstančių žodžių. Ir kaip jau minėjome, paieškos sistemai jokios įtakos nedaro užklausos kalba – ji suras visus atitinkamus dokumentus anglų, kinų ar prancūzų kalba, jei tik jie egzistuoja.
Kadangi sistemos algoritmui nesvarbi kalba, todėl į paieškos lauką galima įvesti tiesiog chemines formules ar matematines lygtis.
Be viso to, sistema yra valdoma labai lengvai – kaip ir kitos populiarios tradicinės sistemos.
Taigi, išvardintų pliusų labai daug, belieka laukti tolesnių sistemos bandymo rezultatų – kol kas ji buvo pademonstruota „DEMOfall08“ parodoje.
Parengta pagal: