OpenAI má bizarný problém. Najnovšie výkonné modely robia jednu zlú vec častejšie, než tie staré
Nedávno predstavené modely umelej inteligencie od OpenAI – o3 a o4-mini – prinášajú špičkový výkon v oblastiach ako kódovanie či matematika, no zároveň čelia starej známej výzve, ktorá sužuje aj najlepšie AI systémy súčasnosti: halucináciám. Navyše, nové modely si podľa interných testov vymýšľajú ešte viac než ich predchodcovia, čo je znepokojujúci trend, ktorý vývojári zatiaľ nevedia úplne vysvetliť.
Halucinácie, teda situácie, keď si AI systém vymyslí nepravdivé alebo neoverené informácie, zostávajú jednou z najväčších a najťažších prekážok v oblasti umelej inteligencie. Doteraz sa s každou novou verziou modelu očakávalo, že bude v tejto oblasti lepšia – teda bude si vymýšľať menej. Pri modeloch o3 a o4-mini sa však tento trend otočil. O téme informoval portál TechCrunch.
Starý problém v novom prevedení
Podľa technickej správy od OpenAI oba nové modely halucinujú častejšie ako staršie reasoning modely ako o1, o1-mini či o3-mini, ale aj ako tradičné „ne-reasoning“ modely ako GPT-4o. Model o3 napríklad halucinoval až pri 33 % otázok na PersonQA – internej OpenAI databáze na testovanie faktickej presnosti o ľuďoch. Pre porovnanie, o1 halucinoval len v 16 % a o3-mini v 14,8 % prípadov. Ešte horšie dopadol o4-mini, ktorý vykazoval halucinácie v 48 % otázok.
OpenAI priznáva, že dôvody zhoršenia nie sú zatiaľ jasné a „je potrebný ďalší výskum“, aby sa zistilo, prečo škálovanie reasoning modelov vedie k vyššiemu výskytu halucinácií. Jedným z vysvetlení môže byť samotná povaha týchto modelov – vďaka ich schopnosti robiť viac záverov a tvrdení, častejšie vytvárajú presné, ale aj nepresné odpovede.
Nejasné dôvody a hypotézy výskumníkov
Organizácia Transluce, neziskové výskumné laboratórium pre AI, našla ďalší dôkaz o halucináciách modelu o3. V jednom prípade tvrdil, že spustil kód na MacBooku Pro mimo prostredia ChatGPT a následne skopíroval výsledky – čo technicky nie je možné. Podľa výskumníka Neila Chowdhuryho z Transluce môže byť za problémom typ reinforcement learningu použitý pri o-serii modeloch, ktorý môže zhoršiť niektoré nedostatky, ktoré bývajú zvyčajne zmiernené tradičným post-tréningovým spracovaním.
Napriek problémom s halucináciami niektorí odborníci nové modely už testujú v praxi. Kian Katanforoosh, profesor zo Stanfordu a CEO startupu Workera, uviedol, že model o3 používajú v kódovacích pracovných tokoch a považujú ho za výkonný nástroj. Avšak upozornil, že model má tendenciu vymýšľať nefunkčné odkazy na webové stránky, čo znižuje jeho spoľahlivosť.
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Vážilo 32 kg a dosiahlo rýchlosť 30 km/h. Mazda vymyslela kufríkové auto za 5 000 dolárov
Totálne zmenili svet. Toto je 10 vecí, ktoré pred 20 rokmi neexistovali a dnes si bez nich nevieme predstaviť život
Je 10 000-krát rýchlejšia než tie najlepšie. Číňania vynašli pamäť, ktorá zapíše 25 miliárd bitov za sekundu
Čo naozaj robia slovenskí IT-čkári: Takto vyzerá deň v živote skúseného programátora so slušným platom
S naftou zmizli aj karcinogénne látky. Američania nasadili elektrické vlaky, z ich vedľajších účinkov ostali šokovaní
NAJČÍTANEJŠIE ZO STARTITUP
Mladá vodička zrazila muža na priechode pre chodcov, na mieste ho oživujú záchranné zložky
„Len sa uč a budeš sa mať dobre“ už neplatí: Generácia Z mení pohľad na peniaze a nebojí sa riskovať, hovorí odborník (ROZHOVOR)
Klasika slovenskej kuchyne je „zdravým pokladom“. Chráni črevá a podporuje trávenie
Obľúbená potravina Slovákov prekvapila škodlivým účinkom: Francúzsko ju zakazuje v sociálnych zariadeniach
Tragédia na trati: Vlak v Bratislave zrazil 2 osoby. Jedna z miesta utiekla s vážnymi zraneniami
- 24 hod
- 48 hod
- 7 dní
-
- Zem je zachránená. Odborníci našli konečné riešenie na klimatickú krízu, máme ho „pod nosom“
- Britská armáda zničila 100 dronov v zlomku sekundy. Použili 40-miliónovú zbraň s neviditeľnou muníciou
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
- Zostrelili UFO a kruto za to zaplatili. 23 sovietskych vojakov podľa CIA postihol desivý osud
- Tieto veci v recenziách nenájdeš. 11 mesiacov som testoval najlepší robotický vysávač na Slovensku
-
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
- Definitívny obrat? Známy ropný gigant na svojich čerpačkách prestáva predávať benzín a naftu
- Zem je zachránená. Odborníci našli konečné riešenie na klimatickú krízu, máme ho „pod nosom“
- 4K pastva pre oči len za 300 eur? Našli sme TOP 9 televízorov s vynikajúcim obrazom a nízkou cenou
- Zostrelili UFO a kruto za to zaplatili. 23 sovietskych vojakov podľa CIA postihol desivý osud
-
- Tento typ pohonu je definitívne obrovský emisný podvod. Potvrdila to ďalšia štúdia
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
- EÚ chystá veľkú zmenu. Tisíce Slovákov prídu o vodičák
- Definitívny obrat? Známy ropný gigant na svojich čerpačkách prestáva predávať benzín a naftu
- Čech si poriadne zavaril. Elektromobil nabíjal zo zásuvky v spoločnej garáži, účet za elektrinu susedov šokoval
Ceny stúpli, no obsah zabodoval. Netflix prekonal očakávania analytikov
Sci-fi technológiu zo Star Treku premenili na realitu. Vyvinuli hologramy, ktoré cítiš v rukách
Zabudni na rebríček TOP 10. Netflix ti prečíta myšlienky a ukáže, čo máš rád
Ministerstvo školstva pripravuje veľkú zmenu. Slovenskí študenti absolvujú elektronickú skúšku dospelosti
Rusko posiela Nemecku jasný odkaz. Rakety Taurus môžu všetko zmeniť
NAJČÍTANEJŠIE ZO STARTITUP
Mladá vodička zrazila muža na priechode pre chodcov, na mieste ho oživujú záchranné zložky
„Len sa uč a budeš sa mať dobre“ už neplatí: Generácia Z mení pohľad na peniaze a nebojí sa riskovať, hovorí odborník (ROZHOVOR)
Klasika slovenskej kuchyne je „zdravým pokladom“. Chráni črevá a podporuje trávenie
Obľúbená potravina Slovákov prekvapila škodlivým účinkom: Francúzsko ju zakazuje v sociálnych zariadeniach
Tragédia na trati: Vlak v Bratislave zrazil 2 osoby. Jedna z miesta utiekla s vážnymi zraneniami
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené