Svet umelej inteligencie sa mení závratnou rýchlosťou a technologickí giganti ako Google túto revolúciu nielen sledujú, ale priamo ju aj poháňajú vpred. Najnovším dôkazom je predstavenie ich doteraz najefektívnejšej jednotky na spracovanie umelej inteligencie – Tensor Processing Unit siedmej generácie s názvom Ironwood. Tento výkonný čip má potenciál zmeniť pravidlá hry nielen v oblasti AI, ale aj v globálnom výkone výpočtovej techniky ako takej, píše Interesting Engineering.

Šesťnásobne viac ako predchádzajúca generácia

Na podujatí Google Cloud Next ’25 spoločnosť odhalila, že Ironwood dokáže pri nasadení vo veľkom rozsahu dosiahnuť až 42,5 exaflopov výpočtového výkonu čo je v preklade 24-násobne viac než momentálne najrýchlejší superpočítač sveta – El Capitan s 1,7 exaflopmi. A to nie je všetko. Ironwood má zabudovaných až 192 GB vysokorýchlostnej pamäte HBM, čo je šesťnásobne viac ako predchádzajúca generácia TPU známa ako Trillium. Každý čip pritom zvládne priepustnosť až 7,2 terabitu za sekundu, čo predstavuje 4,5-násobné zlepšenie oproti Trillium

graf porovnania google ai
Google

„Ironwood je navrhnutý tak, aby podporoval túto ďalšiu fázu generatívnej AI a jej obrovské nároky na výpočtový výkon a komunikáciu,“ povedal Amin Vahdat, viceprezident Googlu pre ML, systémy a Cloud AI počas virtuálnej tlačovej konferencie pred podujatím. Zároveň dodal „Toto nazývame érou inferencie, keď AI agenti budú proaktívne získavať a generovať dáta, aby spoločne prinášali odpovede a poznatky, nie len samotné informácie,“ dodal.

Na rozdiel od predchádzajúcich TPU jednotiek, ktoré boli zamerané na trénovanie modelov, Ironwood je navrhnutý špeciálne pre tzv. inferenciu – teda proces, pri ktorom AI model využíva nadobudnuté vedomosti na odpovedanie na otázky či riešenie problémov. To je mimoriadne dôležité najmä v súčasnosti, keď sa AI stále viac presúva z tréningových laboratórií do reálneho sveta.

Ukázali aj nové nástroje

Ironwood je zároveň mozgom všetkých pokročilých AI modelov Googlu vrátane najnovšieho Gemini 2.5. Ten bol na konferencii predstavený vo dvoch verziách – Pro a Flash. Kým Pro je určený na náročné výpočtové úlohy ako vývoj liekov či modelovanie finančných trhov, verzia Flash je optimalizovaná na bežné každodenné použitie s dôrazom na rýchlosť. V praxi to znamená, že model sám rozhodne, ako „hlboko“ sa má zamyslieť nad konkrétnou úlohou v závislosti od jej zložitosti.

Google tiež ukázal celý rad multimodálnych generatívnych modelov, ktoré dokážu vytvárať obsah zo zadania v prirodzenom jazyku – od textu cez obrázky až po video a hudbu. Novinkou je nástroj Lyria, ktorý generuje hudbu na základe textových inštrukcií. V živom demu tím Googlu predviedol ako pomocou týchto modelov vytvoriť kompletné promo video na koncert – len na základe niekoľkých viet zadaných ako vstup.

Čítajte viac z kategórie: Novinky

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP