Na pomedzí umelej inteligencie a genetiky dochádza k prelomu, o ktorom ešte nedávno nik ani nesníval. Vedci skúšajú, či AI dokáže pochopiť logiku riadiacu vznik nových génov, a teda aj proteínov. Nie je to jednoduché pole. Väčšina dnešných AI modelov sa sústreďuje na samotnú štruktúru proteínov, ktorá určuje ich funkciu. Z toho vznikli nástroje, ktoré dokážu predpovedať tvar proteínov a navrhovať nové. Lenže skutočné zmeny v biológii nevznikajú na úrovni proteínov, ale v DNA. A vzťah medzi týmito dvoma svetmi nepatrí medzi priamočiare, píše Ars Technica.

Medicínu premení od základov

Tím zo Stanfordu v tom uvidel príležitosť. Zameral sa na baktérie, pretože tie často organizujú gény do funkčných blokov. Ak baktéria potrebuje spracovať cukor alebo vytvoriť aminokyselinu, väčšinou má všetky potrebné gény za sebou. Celý úsek sa prepíše do jedného dlhého RNA reťazca a bunka tým získa jednoduchý spôsob riadenia celého procesu.

Na tomto princípe vznikol model Evo. Trénoval sa podobne ako veľké jazykové modely, len namiesto slov dostával nukleotidy. Úlohou bolo predpovedať ďalší znak v reťazci a učiť sa vzory, ktoré riadia bakteriálne genómy. Model následne dokáže generovať nové úseky DNA na základe krátkeho vstupu. V podstate číta genóm ako text a reaguje naň vlastnou vetou.

Vedci najprv skúšali, či Evo vie dopĺňať známe gény. Keď dostal len tretinu sekvencie, dokázal správne doplniť zvyšok. Poradil si aj s chýbajúcim génom v ucelenom funkčnom bloku. Pri úpravách zachovával oblasti, ktoré sú citlivé na zmeny, a menil hlavne tie, kde si evolúcia môže dovoliť väčšiu variabilitu.

Posunúť môže aj CRISPR

Skutočný test prišiel v momente, keď dostal za úlohu vytvoriť niečo nové. Vedci mu vložili genetickú informáciu o bakteriálnom toxíne a hľadali, či dokáže vyprodukovať gén pre antitoxín. Z výsledkov vybrali len sekvencie, ktoré sa nepodobajú na známe riešenia. V laboratóriu preverili desať z nich a polovica tlmila toxicitu. Dve úplne obnovili rast buniek. Vyzerali pritom ako úplne nové proteíny, zložené z fragmentov desiatok rôznych zdrojov.

Model sa osvedčil aj pri toxínoch s RNA inhibítormi a dokonca pri proteínoch, ktoré brzdia CRISPR systémy. Niektoré vytvorené sekvencie zmiatli nástroje, ktoré predpovedajú trojrozmernú štruktúru proteínov, pretože nepripomínali nič známe.

gén a kód
Freepik

Nakoniec tím nechal Evo generovať obsah z 1,7 milióna bakteriálnych a vírusových génov. Výsledkom je 120 miliárd párov báz DNA, ktoré obsahujú známe aj úplne nové sekvencie. Praktické využitie zatiaľ nie je jasné. Vedci však veria, že biológovia časom nájdu spôsob, ako tento obrovský priestor preskúmať.

Takýto prístup zrejme nebude fungovať pri zložitejších organizmoch. Genómy stavovcov majú komplikovanú štruktúru a funkčné gény netvoria jednoduché bloky. Napriek tomu sa tu ukázalo niečo prekvapivé. AI dokáže pracovať s genetickým kódom na úrovni, v ktorej prebieha prirodzená evolúcia. A to posúva tvorbu funkčných proteínov do úplne inej roviny, než akú zatiaľ poznáme

Genetická modifikácia na obzore

Ľudstvo už dlhšie geneticky modifikuje napríklad rastliny, či už laboratórne alebo tisícročia šľachtením. Čoraz väčšie pokroky sa však darí vykonávať aj v genetickej modifikácii ľudí samotných, čo vyvoláva zásadné otázky o etike takýchto metód. To ale nebráni niektorým vedcom, aby porušovali pravidlá a experimentovali.

Čítajte viac z kategórie: Novinky

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP