Vilniaus universiteto Gyvybės mokslų centro (VU GMC) bioinformatikai dr. Justas Dapkūnas ir dr. Klimentas Olechnovičius tiria baltymų struktūras, kurios gali suteikti daug svarbios informacijos ir naujų žinių gyvybės mokslo pasaulyje. Prie šių tyrinėjimų šiandien prisideda ir dirbtinis intelektas, o tyrimų rezultatai praverčia ir kovoje su koronavirusu. VU mokslininkai pasakoja apie baltymų struktūrų tyrimus, jų svarbą ir naujas „žaidimo taisykles“, kurias šioje srityje diktuoja dirbtinio intelekto naudojimas, rašo „VU naujienos“.
Asociatyvi „Pixabay“ nuotr.
– Kaip bioinformatikos specialistų VU GMC darbo sritis susijusi su gyvybės mokslais?
– K. Olechnovič. Jei trumpai, bioinformatikai tiria gyvybę kompiuteriais. Tam reikia informacijos – pvz., baltymų sekų ir struktūrų. Tokia informacija dažniausiai kaupiama atvirose duomenų bazėse, kiekvienas gali ją pasiekti. Pagrindinis iššūkis yra tą informaciją panaudoti problemoms spręsti.
Problemos bioinformatikoje labai įvairios, viena grupė visko neaprėps, todėl GMC veikia kelios bioinformatikų komandos. Konkrečiai mes daugiausia kuriame ir naudojame kompiuterinius metodus baltymų erdvinėms struktūroms analizuoti ir modeliuoti. Pastaruoju metu daugiausia užsiimame baltymų kompleksų struktūromis.
J. Dapkūnas. Iš principo bioinformatika yra tokia pat plati, kaip ir visi gyvybės mokslai. Dėl to bioinformatikai paprastai specializuojasi tam tikrose srityse: mes analizuojame baltymų struktūras, o kiti mokslininkai, pavyzdžiui, tiria genus ir genomus.
– Kuo žmonijai svarbūs baltymai ir kodėl turime juos analizuoti?
– J. Dapkūnas. Mes kartais mėgstame sakyti, kad baltymai yra svarbiausios molekulės Žemėje. Su tuo turbūt nesutiktų genetikai, kuriems svarbiausia molekulė yra DNR, tačiau būtent baltymai vykdo tą programą, kuri užkoduota DNR.
K. Olechnovič. Gyvosiose ląstelėse baltymai yra tiek darbininkai bei statybininkai, tiek statybinės medžiagos. Baltymo pagrindinė charakteristika yra jo erdvinė struktūra – tai, kaip baltymo atomai išsidėsto erdvėje. Nuo struktūros priklauso, kokią funkciją baltymas atlieka ir kaip. Dažnai baltymo struktūra yra svarbiausia informacija siekiant tiksliai sužinoti, kaip baltymas veikia ir kaip paveikti jo veikimą. Struktūrų būna labai įvairių, dauguma jų iki šiol mokslui nežinomos.
Geriausias būdas sužinoti struktūrą yra atlikti specialius eksperimentus. Tuo užsiima daugybė mokslininkų eksperimentatorių, kurie deda išspręstas struktūras į „Protein Data Bank“ (PDB) duomenų bazę. Bet eksperimentai yra brangūs ir ne visada pavyksta, visų struktūrų taip nesužinosi. Čia ir turi pagelbėti bioinformatika.
J. Dapkūnas. Be fundamentalaus žinojimo apie baltymų struktūras, egzistuoja ir bent keli praktiniai aspektai. Visų pirma, baltymai, veikiantys gyvuose organizmuose, dažnai yra vaistų taikiniai, o žinant jų struktūras, galima bandyti sukurti naujas vaistines molekules, kurios pakeistų baltymų veikimą ir gydytų įvairias ligas. Kitas svarbus aspektas yra tai, kad baltymai vis dėlto yra cheminės molekulės ir gali būti naudojami, pavyzdžiui, kaip katalizatoriai chemijos pramonėje. Fermentai yra labai geri katalizatoriai, tačiau dažnai neužtenka tokio baltymo, kuris yra randamas gamtoje, ir reikia jį pakeisti, kad jis geriau darytų tai, ko iš jo nori žmonės. Šie pakeitimai daug paprasčiau padaromi žinant baltymo struktūrą, o ne bandant aklai badyti bet kur.
– Ar užtenka žinoti pavienių baltymų struktūras?
– K. Olechnovič. Ne, nes baltymai dažniausiai veikia ne vieni. Jie sąveikauja tarpusavyje ir sudaro nuolatinius ir laikinus kompleksus. Todėl komplekso struktūros modelis yra daug vertingesnis už pavienės baltymo grandinės modelį, jis daugiau pasako apie realybę. Kompleksų yra kur kas daugiau negu pavienių baltymų grandinių, ir toli gražu ne visa jų įvairovė yra atspindėta PDB.
J. Dapkūnas. Neseniai teko skaityti apie tyrimą, kurio metu buvo pabandyta kompiuteriniais metodais rasti sąveikas tarp baltymų bakterijose Escherichia coli ir Mycobacterium tuberculosis. Pasirodo, maždaug pusė iš rastų sąveikų dar nebuvo tyrinėtos eksperimentiškai. Sakoma, kad sąveikų tarp žmogaus baltymų eksperimentiškai identifikuota tik mažiau nei 1/10.
Šie tyrimai parodo, kaip dažnai baltymai sąveikauja su kitais baltymais ir kiek mes dar nedaug apie tai žinome. Ir kartu darosi aišku, kad, norint suprasti, kaip ir ką veikia baltymai, ir po to šią veiklą pakeisti, būtina analizuoti sąveikaujančių baltymų struktūras.
– GMC bioinformatikų komanda daug metų dalyvauja prestižiniame baltymų struktūrų modeliavimo konkurse (CASP). Kuo šis konkursas ypatingas?
– K. Olechnovič. Oficialiai CASP yra ne konkursas, o eksperimentas, kurio tikslas – įvertinti mūsų srities, baltymų struktūrų bioinformatikos, lygį. Tai tarsi neoficialus šios srities pasaulio čempionatas, kuriame dešimtys mokslininkų grupių iš JAV, Europos, Japonijos ir kitų šalių stengiasi parodyti kuo geresnius rezultatus.
J. Dapkūnas. Šis baltymų struktūrų modeliavimo eksperimentas atsirado beveik prieš 30 metų, siekiant įvertinti, kiek tiksliai yra įmanoma prognozuoti baltymų struktūras. Tai vertinama aklo testavimo būdu. Visiems dalyviams yra pateikiamos tų pačių baltymų sekos. Šių baltymų struktūros paprastai būna jau žinomos, tačiau nepaviešintos. Eksperimento dalyviai – dalyvauti gali visi, reikia tik užsiregistruoti – atsiunčia savo modelius, kuriuos paskui nepriklausomi vertintojai palygina su tikrosiomis, eksperimentiškai nustatytomis baltymų struktūromis. Taip sužinoma, ar apskritai kas nors sugeba modeliuoti baltymų struktūras ir kas tai gali padaryti tiksliausiai. Taigi šis eksperimentas stumia visą baltymų struktūrų mokslo sritį į priekį, kadangi jame sąžiningai įvertinamas progresas struktūrų prognozavimo ir įvairiose susijusiose srityse.
– Kuo išskirtinis pastarasis, 2020 m. pabaigoje vykęs CASP konkursas?
– K. Olechnovič. Įvairiose šio konkurso kategorijose VU GMC komanda dalyvauja jau ne vienerius metus. Šį kartą GMC komanda, kurioje, be manęs ir Justo, dalyvavo ir komandos vadovas prof. Česlovas Venclovas, baltymų kompleksų struktūrų modeliavimo kategorijoje užėmė antrąją vietą. 2018 m. šioje kategorijoje buvome pirmi.
Kalbant apie konkurso išskirtinumą reikia prisiminti tai, kad pandemija pakoregavo šio renginio formatą ir pirmą kartą jis vyko visiškai nuotoliniu būdu, tačiau tai nesutrukdė mums pasiekti aukštų rezultatų. Vis dėlto daug didesniu netikėtumu nei virtualus formatas tapo pagrindinė pastarojo CASP naujiena – komandos „DeepMind“, naudojusios „AlphaFold2“ struktūrų prognozavimo metodą, paremtą dirbtiniu intelektu, pergalė pavienių baltymų struktūrų modeliavimo kategorijoje.
Prieš dvejus metus ši komanda irgi gerai pasirodė, bet šių metų rezultatai pranoko didžiausius lūkesčius. Įdomu tai, kad 2008 m., kai apie tokias dirbtinio intelekto panaudojimo galimybes niekas nė nesvajojo, šioje kategorijoje pirmąją vietą užėmė lietuvių mokslininkų dr. Č. Venclovo ir dr. M. Margelevičiaus komanda.
J. Dapkūnas. Mes CASP eksperimente dalyvaujame daugiausia baltymų kompleksų modeliavimo kategorijoje, kur reikia nusakyti, kaip baltymai sąveikauja tarpusavyje. Kadangi 2020 m. naudojome tik truputį pakeistą metodiką, kuri padėjo mums būti pirmiems 2018 m., juokavome, kad arba mes vėl pasirodysime gerai, arba pasaulyje įvyks mokslo proveržis. Baltymų kompleksų modeliavimo srityje mes buvome vieni iš geriausių, tai galime drąsiai sakyti, kad ten joks proveržis neįvyko. Tačiau pagrindinėje CASP kategorijoje „DeepMind“ atstovų komandos „AlphaFold2“ rezultatai buvo įspūdingi: panašu, kad pavienių baltymų struktūrų problema yra išspręsta, dabar liko tik technologiniai patobulinimai.
Po šio konkurso pavienių baltymų struktūrų prognozavimas pasidarė nebe mokslo, o inžinerijos klausimas. Tai reiškia, kad mūsų kategorija, baltymų kompleksų modeliavimas, matyt, dabar bus pagrindinė sritis baltymų bioinformatikoje. Bent jau šioje kategorijoje kol kas nesivaržome su dirbtiniu intelektu.
– Ar galima sakyti, kad dirbtinio intelekto pajėgumai laimėjo prieš žmogaus proto galias?
– K. Olechnovič. Geriau vadinti tai žmonių iš „DeepMind“ kompanijos pergale. Nebuvo taip, kad kažkoks universalus dirbtinis intelektas išmoko modeliuoti baltymus. Didelė geriausių pasaulyje dirbtinio intelekto specialistų komanda intensyviai ir kryptingai dirbo mažiausiai ketverius metus.
J. Dapkūnas. Kompanijos „DeepMind“ vadovas Demis Hassabis CASP konferencijoje sakė, kad ne dirbtinis intelektas išsprendė baltymų struktūrų prognozavimo problemą, o žmonės, kurie naudojo dirbtinį intelektą kaip įrankį. Iš tiesų „DeepMind“ kompanija surinko didelę, beveik 30 žmonių, komandą, kurioje buvo įvairių sričių specialistų: tiek dirbtinio intelekto mokslininkų, tiek molekulinių biologų. Beje, itin svarbu tai, kad jų atliktas modeliavimas tapo įmanomas tik todėl, kad buvo galima pasinaudoti viešai pateikiamomis baltymų sekomis ir struktūromis, kurias per dešimtmečius nustatė tūkstančiai eksperimentatorių visame pasaulyje.
– Kokią reikšmę molekulinės biologijos sričiai turės dirbtinio intelekto taikymo galimybės?
– K. Olechnovič. Baltymų ir jų kompleksų struktūros svarbios visų pirma fundamentiniam mokslui. O praktiniai pritaikymai padaromi naudojant fundamentinio mokslo rezultatus. Manau, dirbtinio intelekto metodai labai spartina fundamentinio mokslo pažangą.
J. Dapkūnas. Aš manau, kad „AlphaFold2“ yra didžiulis pasiekimas. „DeepMind“ mokslininkai parodė, kad baltymų struktūras galima pakankamai tiksliai sumodeliuoti kompiuteriu, ir tai turės didžiulę reikšmę tiek fundamentalaus mokslo tyrimams, tiek įvairiems praktiniams taikymams. Tačiau jokiu būdu negalima teigti, kad jie atsakė į visus klausimus. Visų pirma, ir toliau neaišku, kaip susidaro baltymų struktūros, nes mes vis dar žinome nedaug detalių apie tai, kokie fizikos ir chemijos principai nulemia šių didelių ir sudėtingų struktūrų susilankstymą ir kaip jis taip efektyviai ir tiksliai įvyksta ląstelėse.
Be to, yra daugybė kitų su baltymų mokslu susijusių klausimų: pradedant jau mūsų ne kartą minėtomis baltymų sąveikomis, baigiant įvairiomis baltymų savybėmis. Baltymų struktūros yra dažnai įsivaizduojamos kaip pavienių baltymų nuotraukos, bet gyvenime taip nėra: jie kontaktuoja vieni su kitais ir visą laiką juda. Be to, labai įdomu, kaip įvairios mutacijos pakeičia baltymus ir jų veiklą, taigi darbo baltymų struktūrų mokslininkams dar liko pakankamai.
– Siaučiant pandemijai, daugelio sričių mokslininkai meta visas jėgas ieškodami būdų ją įveikti. Kaip jūsų tyrinėjimai gali padėti šioje kovoje ir kokios dirbtinio intelekto pritaikymo šioje srityje galimybės?
– J. Dapkūnas. CASP bendruomenė iš karto įsitraukė į kovą su koronavirusu, pasiūlydama viso pasaulio mokslininkams sumodeliuoti SARS-CoV-2 baltymus, kurių struktūra buvo dar nežinoma, paviešindama šiuos modelius, kad visi galėtų pasinaudoti. Mes patys rudenį dalyvavome analogiškame baltymų sąveikų modeliavimo eksperimente CAPRI, kuriame buvo bandoma sumodeliuoti, kaip koronaviruso baltymai sąveikauja tarpusavyje ir su žmogaus baltymais.
K. Olechnovič. „AlphaFold2“ sumodeliavo kelių koronaviruso baltymų struktūras. Tie modeliai tikriausiai yra neblogi. Ką su jais daryti? Pavyzdžiui, galima ieškoti, kokios kitos molekulės gali veikti kaip vaistai ir blokuoti koronaviruso baltymus prie jų prisijungiant. Tai jau atskira tema. Taigi, turint baltymo struktūros modelį, net ir labai gerą, viskas tik prasideda. Mokslininkai be darbo neliks, o dirbtinio intelekto metodai jiems tarnaus kaip įrankiai. Galvoti vis tiek reikės mums patiems.
Tekstą parengė Gediminas Dubonikas