Umelá inteligencia vytvorila nemožné. Urobí video z myšlienok, nahrá tvoje sny
V uplynulých mesiacoch zažila umelá inteligencia väčší rozvoj, ako akákoľvek iná technológia. AI prekročila pomyselný prah a prestúpila zo sveta odborníkov do sveta širokej populácie. Hoci mnoho laikov začalo využívať výhody platforiem ako sú ChatGPT, Bing Chat či Bard, umelá inteligencia dosiahla výrazný pokrok aj v ďalších oblastiach.
Umelá inteligencia a technológie v medicíne
Pokrok je zreteľný najmä v oblasti medicíny a neurovied, ku ktorému výrazne pomohli aj ďalšie moderné technológie ako je napríklad funkčná magnetická rezonancia (fMRI). Čo sa týka samotnej fMRI, ide o stále o pomerne novú technológiu slúžiacu k funkčnému zobrazovaniu mozgu, respektíve k mapovaniu mozgovej odozvy na vonkajšie alebo vnútorné podnety.

S rapídnym vývojom počítačovej techniky a štatistických metód sa rozvinula aj fMRI a to do takého štádia, že funguje aj ako veľmi užitočný nástroj pre vizualizáciu anatomických štruktúr mozgu, ktoré sú zapojené do procesov vnímania, riadenia pohybu a myslenia. Vďaka tejto metóde je možné získavať detailné a dynamické informácie o tom, ako sa mozog správa a funguje v reálnom čase.
Hoci moderné technológie prispeli k výraznému pokroku v oblasti neurovied, plne porozumieť informáciám skrytým v našich mozgových aktivitách je stále veľkou hádankou. Úloha obnovy ľudského videnia z mozgových záznamov, najmä pomocou neinvazívnych nástrojov ako je spomínaná fMRI, je tiež nesmierne komplikovaná úloha.
Neinvazívne metódy majú veľké množstvo výhod, ale zachytávajú len určité obmedzené množstvo informácií, ktoré sú navyše náchylné na rôzne rušenia. Výzvou je aj samotná povaha fMRI, ktorá meria signály závislé od hladiny kyslíka v krvi (BOLD signály) a zachytáva snímky mozgovej aktivity každých niekoľko sekúnd. Základné obmedzenie fMRI technológie teda spočíva vo veľmi malej zmene intenzity signálu spojenej s hemodynamickou odpoveďou – zmeny v krvnom toku a hladine kyslíka v mozgu, ktoré sú spúšťané aktivitou mozgových buniek.
V ľudskej reči povedané, v prípade, že sa vedci snažia zo záznamov o aktivite mozgu obnoviť myšlienky, narážajú na problém. Naše prežívanie sveta okolo nás je totiž jeden veľký plynulý a kontinuálny obraz plný rôznych pohyb a scenérií, zatiaľ čo fMRI meria signály závislé od hladiny kyslíka v krvi a zachytáva mozgovú aktivitu len každých pár sekúnd.
Vytvoriť tak plynulý obraz, ktorý by svojim spôsobom pripomínal video, je pomerne veľký problém.
Neuveriteľný kvalitný výstup
Zatiaľ čo každý údaj fMRI je považovaný v podstate za „priemer“ mozgovej aktivity, frekvencia štandardného videa je 30 snímok za sekundu. Ak jeden snímok „fMRI trvá 2 sekundy, za túto dobu je na štandardnom videu možné vzhliadnuť 60 a viac snímok, ktoré môžu obsahovať rôzne objekty a pohyby,“ približujú problematiku rekonštrukcie mozgovej aktivity čínsky vedci v štúdii publikovanej v žurnále arXiv.
Tým sa totiž v uvedenej štúdii podarilo pomocou fMRI a umelej inteligencie vytvoriť dynamické video vo vysokom rozlíšení z aktivity mozgu. Zatiaľ čo predchádzajúce úsilie iných vedeckých skupín viedlo k rekonštrukcii, respektíve vytvoreniu statických obrazov z mozgovej aktivity, v novej štúdii vedci vytvorili tzv. „MinD-Video“, ktoré generuje video obraz z mozgovej aktivity.
Svoj model „MinD-Video“ považujú za „dvojmodulový systém, ktorý slúži na spojenie obrazových a video dekódovacích techník v mozgu“. Model sa navyše neustále učí zo získaných mozgových signálov a trénuje prostredníctvom obrazových databáz.

Ako to funguje?
V prípade modelu MinD-Video je prvým modulom enkóder fMRI, ktorý je trénovaný v rámci prostredia CLIP pomocou kontrastného učenia, čo umožňuje získanie sémanticky súvisiacich vlastností zo signálov v mozgu.
CLIP je skratka pre Contrastive Language-Image Pre-Training, teda metódu strojového učenia, ktorá kombinuje jazykové a vizuálne signály s cieľom naučiť sa reprezentácie, ktoré sú schopné porozumieť vzťahu medzi textom a obrazom, uvádza sa v štúdii.
Druhý modul potom predstavuje upravená verzia Stable Diffusion, čo je model, ktorý sa používa na generovanie videí z fMRI dát. Pri generovaní videa z fMRI údajov sa využíva Stable Diffusion model na predikciu nasledujúceho snímku na základe predchádzajúcich snímok a fMRI signálov.
Portál Science túto technológiu prirovnáva k iným generatívnym umelým inteligenciám prevodu textu na obrázok, ako sú DALL-E či MidJourney, ktoré vytvárajú nové obrázky na základe textových výziev. Za zmienku rozhodne stojí aj fakt, že technológia uzrela svetlo sveta iba minulý rok.
V rámci novej štúdie jej však vedci pridali niekoľko nových poznatkov, respektíve jej umožnili ďalší tréning a pridali množstvo vylepšení ako zaostrovanie na blízke snímky a pod.

Výsledky hovoria jasne
Výsledkom potom boli vysokokvalitné videá, doplnené o dynamiku pohybu a scény s presnosťou až 85 %, uvádza sa v správe publikovanej na webe TechExplorist. Vedci dosiahli priemernú presnosť v sémantických klasifikačných úlohách a hodnotu 0.19 v indexe štrukturálnej podobnosti (SSIM), čím predčili predchádzajúce najmodernejšie modely o závratných 45 %.
SSIM je metrika, ktorá sa používa na kvantitatívne porovnanie podobnosti medzi dvoma obrazmi. Kritickým poznatkom v tomto prípade je to, že index meria ako podobnosť vo výskyte pixelov, tak aj štrukturálnu podobnosť – textúra, kontrast, osvetlenie a pod. SSIM býva hodnotené na škále od -1 do 1, pričom hodnota 1 indikuje maximálnu podobnosť medzi dvoma obrazmi.
Výsledky tiež naznačujú, že nová metóda je účinná pri rekonštrukcii videí z fMRI údajov a poskytuje vysokú sémantickú presnosť a vizuálnu podobnosť s originálnymi videami. Čo sa týka originálnych videí, tie boli z dôvodu efektívneho trénovania a testovania zmenšené z 30 FPS na 3 FPS, čo zodpovedá 6 snímkam na jeden fMRI snímok.

Vedci pritom rekonštruovali video o dĺžke 2 sekúnd (6 snímok) z jedného fMRI snímku. Ubezpečujú však, že ich model je schopný rekonštruovať aj dlhšie videá z viacerých fMRI, avšak je potrebné mať oveľa viac grafického výkonu, ako mali k dispozícii.
Autori tiež tvrdia, že ich práca je prísľubom pre budúce veľké modelové aplikácie „od neurovedy po rozhrania mozog-počítač“. Použitie AI spolu s technológiami ako sú fMRI, MRI a EGM (elektromyogram) predstavuje tiež prísľub pre lepšie pochopenie fungovania ľudskej mysle.
Dokážeme zaznamenávať sny?
Niektorí ďalší vedci, ktorí neboli zapojení do výskumu, sa tiež nazdávajú, že tieto technológie nám v budúcnosti umožnia zachytávať naše myšlienky a sny. Umelá inteligencia sa spolu s uvedenými technológiami totiž už nejaký ten čas využíva na zaznamenávania snov, respektíve na sledovanie mozgovej aktivity a nervových impulzov vo svaloch, aby bolo možné definovať obrazy, reč a pohyb v snoch.
Za zmienku tiež stojí aj fakt, že človek má v priemere 6 snov za noc, avšak až 90 % z nich zabudne do niekoľko minút po prebudení. Aj preto je pre mnohých predstava zaznamenávania snov nesmierne vzrušujúca.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Najhoršie obavy sa potvrdili. ChatGPT začne zneužívať veci, ktoré o tebe vie

Šokujúci prieskum je varovaním pred novou revolúciou. Teenageri začali používať AI inak, ako sa čakalo

Sony chystá prevrat v hernom priemysle. Nová technológia vyrieši najväčší problém hier

Vzbura proti robotom: komunity sa sťažujú na gigantické dátové centrá, ničia im životy

Ľudia získajú superschopnosť: Musk sa chystá vypustiť do sveta sci-fi technológiu
NAJČÍTANEJŠIE ZO STARTITUP

Osťo veril, že je to len stres a intolerancia. Týchto 5 príznakov rakoviny pankreasu môžeš ľahko prehliadnuť
PREMIUM„Ty to len preháňaš“ – Tiché taktiky cielia na emócie: Psychologička opisuje najhoršie formy manipulácie (ROZHOVOR)

Výživový expert tvrdí, že táto živina ovládne rok 2026. Jeho 5 tipov ti naštartuje chudnutie aj energiu

Putinov exporadca varuje, že Rusko použije proti Európe jadrové zbrane, ak sa niekedy priblíži k porážke

„Superovocie“ zo slovenských záhrad znižuje obvod pásu a zlepšuje činnosť čriev. Stačí ho jesť pravidelne
- 24 hod
- 48 hod
- 7 dní
-
- Televízory Slovákov úmyselne zhoršujú kvalitu obrazu. Je to špinavý marketing, takto ho opravíš
- Väčšina Slovákov o nej ani netuší. Ak porušíš túto povinnosť, hrozí ti pokuta 1200 €
- Celý život triedila plasty. Žena neverila vlastným očiam, keď pomocou AirTagu zistila, kde končia
- Riaditeľ dostavby jadrovej elektrárne Mochovce: Slovensko potrebuje „atómky“ ako soľ (ROZHOVOR)
- Zánik sveta, ako si ho ešte nevidel. Veľkolepá sci-fi novinka láka na poriadne temný príbeh
-
- Celý život triedila plasty. Žena neverila vlastným očiam, keď pomocou AirTagu zistila, kde končia
- Televízory Slovákov úmyselne zhoršujú kvalitu obrazu. Je to špinavý marketing, takto ho opravíš
- Votrelec je dostupný na novej službe. Hrôzu na vesmírnej lodi si pozrieš aj s dabingom
- Väčšina Slovákov o nej ani netuší. Ak porušíš túto povinnosť, hrozí ti pokuta 1200 €
- Najväčšie americké lode narazia na najlacnejšiu prekážku, námorníctvo je z týchto zbraní v panike
-
- Celý život triedila plasty. Žena neverila vlastným očiam, keď pomocou AirTagu zistila, kde končia
- Vybabrali s Američanmi, teraz to schytajú Rusi. Česi pošlú Ukrajine špičkovú vesmírnu „zbraň“
- Kam sa hrabe tunel Višňové. Číňania ukázali inžiniersky zázrak, ktorý prekvapil aj expertov
- Má dokonalý obraz, je lepšia než OLED a cena pôjde nadol. Televízory čaká v roku 2026 revolúcia
- Veľký prieskum zničil ilúzie. Najporuchovejší pohon áut je o 80 % horší ako klasické spaľováky
Elon Musk žiada od OpenAI astronomické odškodné v miliardách. Tvrdí, že ho „obrali o jeho firmu“
Jadrová dohoda s USA je na stole. Saková a Fico odlietajú do Washingtonu
Susedná krajina chystá prelom v mimozemskom živote. Na ISS začali kľúčový experiment
Slovensko sa zaradilo medzi špičku Európy. V tomto sektore jednoznačne dominujeme
Kybernetická apokalypsa 2026 začala: Firmy čelia hrozbe, aká tu ešte nebola
Nemecko pridalo takmer tisíc turbín za rok, stále to nestačí. Rastu bráni kľúčový nedostatok
Ľudia o prácu neprídu. Slávna nemecká automobilka naleje do výroby miliardu eur
NAJČÍTANEJŠIE ZO STARTITUP

Osťo veril, že je to len stres a intolerancia. Týchto 5 príznakov rakoviny pankreasu môžeš ľahko prehliadnuť
PREMIUM„Ty to len preháňaš“ – Tiché taktiky cielia na emócie: Psychologička opisuje najhoršie formy manipulácie (ROZHOVOR)

Výživový expert tvrdí, že táto živina ovládne rok 2026. Jeho 5 tipov ti naštartuje chudnutie aj energiu

Putinov exporadca varuje, že Rusko použije proti Európe jadrové zbrane, ak sa niekedy priblíži k porážke

