Vďaka umelej inteligencii s názvom AlphaFold dokázali výskumníci predpovedať 3D štruktúry proteínu iba na základe jeho 1D aminokyselinovej sekvencie. Ide o dôležitý krok vpred, ktorý vedcom otvorí nové dvere pri liečení chorôb, ako je rakovina a rovnako tak aj pri objavovaní nových liekov, upozornil portál DailyMail.

O tento obrovský úspech sa nepostaral nik iný, ako spoločnosť DeepMind, patriaca pod krídla Google. Tá sa preslávila vývojom systémom umelej inteligencie už pred pár rokmi, keď vyvinula programy, ako AlphaGo a AlphaGo Zero, počítačové algrotimy, ktoré svojimi výkonmi doslova terorizovali najlepších ľudských majstrov v stolovej hre Go. Okrem toho DeepMind priniesla aj ich vylepšenú verziu s názvom AlphaZero, ktorá sa len za 4 hodiny naučila celú históriu a princípy šachu.

Všetky predchádzajúce úspechy však boli len akýmsi odrazovým mostíkom k väčšiemu cieľu, ktorým je vytvorenie umelej inteligencie, ktorá nám pomôže lepšie porozumieť životu a svetu okolo nás.

Dosiahnuť tento kriticky dôležitý úspech sa spoločnosti podarilo vďaka novému systému s názvom AlphaFold, ktorý bol špeciálne navrhnutý na účely rýchleho predpovedania 3D štruktúr proteínu a bol vytrénovaný na 170 000 proteínoch s rôznymi štruktúrami.

AlphaFold dosiahol neuveriteľnú presnosť

Vedci pochopiteľne neostali len pri teórii, no nový nástroj aj naplno otestovali. Poslúžil im na to experiment CASP (Critical Assessment of Protein Structure Prediction), ktorý bol založený už v roku 1994 a od tej doby sa koná každé dva roky s cieľom poskytnúť výskumným skupinám príležitosť objektívne testovať ich metódy predikcie bielkovinových štruktúr.

Okrem toho CASP ponúka aj možnosť nezávislého hodnotenia jednotlivých programov, vďaka čomu je mnohými považovaný za „majstrovstvá sveta“ v oblasti identifikácie trojrozmerných proteínových štruktúr.

Zobraziť celú galériu (4)
Screenshot / YouTube / DeepMind

Účastníci experimentu vždy na začiatku dostanú aminokyselinové sekvencie pre asi 100 proteínov, ktorých štruktúry nie sú známe (pozn. redakcie: podľa všetkého ide buď o takmer vyriešené štruktúry, alebo nedávno vyriešené štruktúry, ktoré sa však ešte nenachádzajú v Protein Data Bank aby žiadny zo „súťažiacich“ nemal informácie o danej štruktúre).

Na záver potom organizátori porovnajú predpovede zúčastnených skupín s laboratórnymi výsledkami a dajú jednotlivým predikciám numerické skóre GDT, ktoré popisuje percento aminokyselinových zvyškov v prahovej vzdialenosti od správnej polohy a pohybuje sa v rozmedzí od 0 do 100. Všetky výsledky nad 90 sú považované za porovnateľné s bežne používanými experimentálnymi metódami.

AlphaFold v tomto teste dosahoval stredné skóre 92,4. V oblasti predikcie štruktúry tých najnáročnejších proteínov však dosiahol stredné skóre 87, teda až o 25 bodov viac, ako tie najlepšie predikcie ostatných skupín, informoval web ScienceMag.

Najlepšie výsledky dosiahnuté v experimente CASP v priebehu posledných štrnástich rokov. DeepMind

Za bežne používané metódy zisťovania 3D štruktúry proteínu je považovaná nukleárna magnetická rezonancia, röntgenová kryštalografia alebo kryo-elektrónová mikroskopia. Tieto metódy si však na presné určenie proteínovej štruktúry vyžadujú roky úsilia a množstvo špecializovaného vybavenia za niekoľko miliónov dolárov.

Doposiaľ bolo preto vyriešených iba asi 170 000 z viac ako 200 miliónov proteínových štruktúr. V roku 1969 dokonca molekulárny biológ Cyrus Levinthal poznamenal, že spočítanie všetkých možných konfigurácií typického proteínu „klasickými“ výpočtami bude trvať dlhšie než vek nášho vesmíru.

Podľa Levinthala totiž existuje celkovo až 10300 možných usporiadaní atómov pre typický proteín, informovala spoločnosť DeepMind na svojom webe.

Ako sa proteíny skladajú do 3D štruktúry sa snažíme zistiť už takmer 50 rokov

Rozlúsknuť záhadu skladania proteínov sa snažíme už od roku 1972, kedy Christian Anfinsen vo svojom príhovore za Nobelovu cenu špekuloval o tom, že aminokyselinová sekvencia proteínu by mohla úplne určovať jeho štruktúru. Táto hypotéza vo vedeckej obci vyvoláva už takmer 50 rokov snahu o to, aby bolo možné výpočtovo predpovedať 3D štruktúru proteínu iba na základe jeho 1D aminokyselinovej sekvencie.

Zistenie proteínovej štruktúry je dôležité najmä z toho dôvodu, že tvar proteínu je úzko spätý s jeho funkciou a schopnosť predvídať jeho štruktúru nám umožní lepšie pochopenie jeho funkcií. Z tohto dôvodu je aj vývoj nových liečebných metód proti rôznym chorobám alebo hľadanie enzýmov, ktoré umožňujú rozklad priemyselného odpadu, vo veľkej miere spájaný s bielkovinami a ich funkciou.

Zaujímavosťou tiež je, že spoločnosť DeepMind sa experimentu CASP zúčastnila po prvýkrát v roku 2018, kde sa AlphaFold taktiež umiestnil na prvom mieste, avšak s podstatne menším stredným skóre – iba cca 60 bodov, čo je považované za príliš hrubú predikciu na to, aby mohla byť užitočná.

Nové a podstatne lepšie výsledky sa vedcom podarilo dosiahnuť vďaka 128 jadrám TPUv3 (Tensor Processing Unit), čo je v porovnaní s väčšinou najmodernejších modelov používaných v strojovom učení stále len podpriemerné množstvo.

Architektúra modelu neurónovej siete. DeepMind

DeepMind tiež uviedol, že predikcia proteínovej štruktúry by mohla byť užitočná aj v boji proti prebiehajúcej pandémii COVID-19, pretože začiatkom roka sa im podarilo predpovedať niekoľko proteínových štruktúr vírusu SARS-COV-2, vrátane ORF3a, ktorá doposiaľ nebola známa.

Podľa spoločnosti je z toho dôvodu AlphaFold jedným z najvýznamnejších vedeckých pokrokov v tejto sfére. DeepMind však upozorňuje, že nie každá štruktúra, ktorú AlphaFold predpovedá bude dokonalá a celý systém musí byť naďalej trénovaný, aby dokázal riešiť štruktúry komplexných bielkových, ktoré sa podieľajú na kľúčových telesných funkciách.

Pošli nám TIP na článok



Vesmír a veda