AI modely obsahujú závažnú chybu, zistili experti. Klamú miliónom ľudí v dôležitej otázke
Chatboti s umelou inteligenciou sa stali bežnou súčasťou našich životov. Čoraz viac sa na nich spoliehame, hoci nie sú dokonalí a majú sklony k halucináciám. Nová štúdia však upozorňuje, že by sme im nemali úplne dôverovať – populárne jazykové modely totiž často výrazne skresľujú vedecké závery. Na tému upozornil portál Phys.org.
Nepresné výsledky chatbotov
Hoci sa mnohí tvorcovia AI modelov chvália, aké sú nové modely presné aj vo vede, ukazuje sa, že realita je iná. Vedci v štúdii analyzovali 4 900 automaticky vygenerovaných súhrnov, ktoré boli odvodené z abstraktov aj celých článkov publikovaných v prestížnych vedeckých a medicínskych časopisoch, ako sú Nature, Science a The Lancet. Zistili, že až v 73 % prípadov skresľovali vedecké závery. Poskytovali menej presné odpovede alebo dospeli k príliš zovšeobecneným záverom oproti pôvodným vedeckým textom.
Vedci testovali desať popredných jazykových modelov vrátane ChatGPT, DeepSeek, Claude či LLaMA. Výsledky ukázali, že šesť z nich systematicky poskytuje nepresné výsledky výskumov. Hoci je forma skreslenia nenápadná, v štúdiách to môže mať veľký dopad. Chatboti zmenili napríklad formuláciu „liečba bola v tejto štúdii účinná“ a zovšeobecnili tvrdenie na „liečba je účinná“, čo môže viesť k mylnému dojmu, že výsledky štúdie sú univerzálne platné.
Keď zadávame chatbotom požiadavku, napríklad aby sa vyhli nepresnostiam, očakávame, že ju aj splnia. Vedci zistili, že po zadaní mali dvakrát vyššiu pravdepodobnosť, že vygenerujú všeobecné závery než keď im bol zadaný len jednoduchý prompt.
„Tento efekt je znepokojujúci. Študenti, výskumníci či tvorcovia politík môžu predpokladať, že ak ChatGPT požiadajú o presnosť, dostanú spoľahlivejší súhrn. Naše zistenia dokazujú opak,“ povedal Uwe Peters, spoluautor štúdie.
Riešenie je jednoduché
Výskumníci sa pozreli aj na to, ako sú na tom ľudia v porovnaní s AI. Ukázalo sa, že zhrnutia tých istých článkov vytvorené ľuďmi boli päťkrát menej náchylné k zovšeobecňovaniu. Čo je však zaujímavé, novšie modely ako ChatGPT-4o a DeepSeek, ktoré by mali byť kvalitnejšie a menej chybné, si viedli horšie než staršie modely.
Vedci ponúkajú aj riešenie. Ukázalo sa, že medzi najspoľahlivejšie modely patrí podľa vedcov Claude, ktorý mal najnižší sklon k zovšeobecňovaniu. Dôležité je tiež písanie kvalitných promptov s požiadavkou, aby boli výsledky formulované v minulom čase a nepriamou rečou. Pokročilí používatelia môžu v API modelu znížiť hodnotu parametra „teplota“, aby sa znížila jeho kreativita a zvýšila presnosť odpovedí.
Rôzne výskumy upozorňujú na riziká používania AI. Modely umelej inteligencie majú sklon k halucinovaniu, dokonca sú schopné klamať, aby zvíťazili v hre.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Vedci odhalili trik s vodou, po ktorom z nej zmizne až 90 % mikroplastov. Vyskúšať ho môže každý
Čína odpálila raketu, akú svet ešte nevidel. Už o pár rokov ňou pristanú ľudia na Mesiaci
Má dojazd 2 245 km a neskutočnú spotrebu. Automobilka pôsobiaca aj na Slovensku predstavila zázračný hybrid
Sú nezničiteľné: 90 % všetkých vyrobených Ferrari stále jazdí, toto sú dôvody
Rozbije všetko, čo mu stojí v ceste. Rusi vypustili ľadového giganta, ktorý má ovládnuť Arktídu
NAJČÍTANEJŠIE ZO STARTITUP
90% Slovákov znervóznie už pri prvej otázke: Tento kvíz z biológie ťa pošle späť do školskej lavice
Mikróby v črevách, toxíny v mozgu: Nová štúdia spochybňuje doterajšie teórie o príčine sklerózy multiplex
Iba hodinu od Slovenska vyrástol architektonický zázrak: Futuristické „plávajúce šošovky“ menia pohľad na vinice
FOTO: Post Malone odpálil v Bratislave ohňovú šou. Druhý deň festivalu Lovestream 2025 bol veľkolepý
TOP 5 slovenských miest, ktoré zažívajú boom: Jedno z nich takmer zdvojnásobilo počet obyvateľov (REBRÍČEK)
- 24 hod
- 48 hod
- 7 dní
-
- 30 rokov ho nič neprekonalo. Jeden z najlepších akčných filmov histórie hlási návrat, máme detaily
- Dodáva teplo a elektrinu v Arktíde. Plávajúca jadrová elektráreň Rusov dosiahla nový rekord
- Bill Gates mal pravdu. Umelá inteligencia narazila na veľký problém, môže znamenať jej koniec
- Strach z Votrelca vôbec nehrali, herečka omdlela priamo pred kamerou. Takto vznikla najdesivejšia sci-fi bytosť histórie
- Západ ju nemá ako zastaviť. Desivá ruská zbraň dokáže vyradiť základne NATO v sekundách
-
- Bill Gates mal pravdu. Umelá inteligencia narazila na veľký problém, môže znamenať jej koniec
- 30 rokov ho nič neprekonalo. Jeden z najlepších akčných filmov histórie hlási návrat, máme detaily
- Západ ju nemá ako zastaviť. Desivá ruská zbraň dokáže vyradiť základne NATO v sekundách
- Dodáva teplo a elektrinu v Arktíde. Plávajúca jadrová elektráreň Rusov dosiahla nový rekord
- Švajčiari ukázali Slovensku energetické riešenie. Vyvinuli vŕtačku, ktorá dodá energiu domácnosti
-
- NASA sleduje emisie CO2 z vesmíru. Najväčší znečisťovateľ v Európe je blízko Slovenska
- Najväčší nepriateľ nebol Rus, ale mikro zabijak. Vedci po 200 rokoch odhalili, čo zabilo armádu Napoleona
- Európa sa vráti 20 000 rokov späť v čase, katastrofu už nemožno zastaviť
- Spojenec Slovenska stavia svoju najdrahšiu zbraň. Ponesie 144 jadrových hlavíc a vyzerá ako zo sci-fi
- Bill Gates mal pravdu. Umelá inteligencia narazila na veľký problém, môže znamenať jej koniec
Postavia jadrové elektrárne, vysokorýchlostnú železnicu a predbehnú Slovensko. Ázia má nového tigra
Volkswagen znovu zaťal do živého. Vládu vyzval na štátnu podporu elektromobilov
Putin berie Rusom aj posledný kúsok slobody. Ľuďom bizarne ruší hovory cez obľúbené aplikácie
Rada Európy vyslala jasný odkaz: Prestaňte predávať zbrane do tejto krajiny
Niečo sa chystá a „nikto nevie čo“. USA začali vojenské cvičenia s nečakanou krajinou
NAJČÍTANEJŠIE ZO STARTITUP