AI modely obsahujú závažnú chybu, zistili experti. Klamú miliónom ľudí v dôležitej otázke
Chatboti s umelou inteligenciou sa stali bežnou súčasťou našich životov. Čoraz viac sa na nich spoliehame, hoci nie sú dokonalí a majú sklony k halucináciám. Nová štúdia však upozorňuje, že by sme im nemali úplne dôverovať – populárne jazykové modely totiž často výrazne skresľujú vedecké závery. Na tému upozornil portál Phys.org.
Nepresné výsledky chatbotov
Hoci sa mnohí tvorcovia AI modelov chvália, aké sú nové modely presné aj vo vede, ukazuje sa, že realita je iná. Vedci v štúdii analyzovali 4 900 automaticky vygenerovaných súhrnov, ktoré boli odvodené z abstraktov aj celých článkov publikovaných v prestížnych vedeckých a medicínskych časopisoch, ako sú Nature, Science a The Lancet. Zistili, že až v 73 % prípadov skresľovali vedecké závery. Poskytovali menej presné odpovede alebo dospeli k príliš zovšeobecneným záverom oproti pôvodným vedeckým textom.

Vedci testovali desať popredných jazykových modelov vrátane ChatGPT, DeepSeek, Claude či LLaMA. Výsledky ukázali, že šesť z nich systematicky poskytuje nepresné výsledky výskumov. Hoci je forma skreslenia nenápadná, v štúdiách to môže mať veľký dopad. Chatboti zmenili napríklad formuláciu „liečba bola v tejto štúdii účinná“ a zovšeobecnili tvrdenie na „liečba je účinná“, čo môže viesť k mylnému dojmu, že výsledky štúdie sú univerzálne platné.
Keď zadávame chatbotom požiadavku, napríklad aby sa vyhli nepresnostiam, očakávame, že ju aj splnia. Vedci zistili, že po zadaní mali dvakrát vyššiu pravdepodobnosť, že vygenerujú všeobecné závery než keď im bol zadaný len jednoduchý prompt.
„Tento efekt je znepokojujúci. Študenti, výskumníci či tvorcovia politík môžu predpokladať, že ak ChatGPT požiadajú o presnosť, dostanú spoľahlivejší súhrn. Naše zistenia dokazujú opak,“ povedal Uwe Peters, spoluautor štúdie.
Riešenie je jednoduché
Výskumníci sa pozreli aj na to, ako sú na tom ľudia v porovnaní s AI. Ukázalo sa, že zhrnutia tých istých článkov vytvorené ľuďmi boli päťkrát menej náchylné k zovšeobecňovaniu. Čo je však zaujímavé, novšie modely ako ChatGPT-4o a DeepSeek, ktoré by mali byť kvalitnejšie a menej chybné, si viedli horšie než staršie modely.
Vedci ponúkajú aj riešenie. Ukázalo sa, že medzi najspoľahlivejšie modely patrí podľa vedcov Claude, ktorý mal najnižší sklon k zovšeobecňovaniu. Dôležité je tiež písanie kvalitných promptov s požiadavkou, aby boli výsledky formulované v minulom čase a nepriamou rečou. Pokročilí používatelia môžu v API modelu znížiť hodnotu parametra „teplota“, aby sa znížila jeho kreativita a zvýšila presnosť odpovedí.
Rôzne výskumy upozorňujú na riziká používania AI. Modely umelej inteligencie majú sklon k halucinovaniu, dokonca sú schopné klamať, aby zvíťazili v hre.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

ROZHODNUTÉ: Európska únia povolí. Zákaz spaľovákov sa odkladá, ide o pyrrhovo víťazstvo

Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu

Prvé dojmy Najväčšia filmová udalosť roka dorazila. Avatar ukázal vizuálny extrém, no Cameron sa odmieta poučiť

Máš doma starý a pomalý notebook? 5 jednoduchých a lacných úprav do 100€ mu dá druhý život

Jeden z najlepších filmov 2025 prichádza online aj s dabingom. Ukázal smutný paradox
NAJČÍTANEJŠIE ZO STARTITUP
PREMIUMMichal Strnad s majetkom 13,6 miliardy eur: „Chcem vybudovať najväčšiu firmu obranného priemyslu v Európe“
PREMIUMV 17. rokoch začala podnikať, vybudovala firmu s obratom 296 miliónov eur: Ak chceš robiť biznis, musíš sa naučiť žiť s rizikom. Inak to nejde

Vykoľajený vlak na čas ochromil frekventovanú trať. Železnice SR reagujú

Tvrdý zásah pre živnostníkov v roku 2026. Tisíce SZČO stoja pred životným rozhodnutím

Bratislavská pizzeria sa zaradila medzi TOP európske podniky. Vybrali ju elitní inšpektori
- 24 hod
- 48 hod
- 7 dní
-
- Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu
- Výrobcovia sa smejú Slovákom. Do mobilov zabudovali vec, ktorá im zarába miliardy na tvoj úkor
- Energetický prevrat je na dosah: Európsky štát našiel masívne ložisko, je v ňom 43 miliónov ton vzácnej suroviny
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
- Ľudia sa nevedia dočkať. Na divákov čaká bitka, akú sme tu nemali celé roky
-
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
- Diesel je mŕtvy. Scania vyvinula prvý 60-tonový kolos 8×4 s ultimátnym pohonom
- Hovorí o ňom celý internet. Nový sci-fi seriál rozpútal šialenstvo, ukazuje desivú realitu
- Ľudia sa nevedia dočkať. Na divákov čaká bitka, akú sme tu nemali celé roky
- Na Slovensko mieri nová TV cez anténu. Pokryje 97 % územia a nebude treba žiadny internet
-
- Diesel je mŕtvy. Scania vyvinula prvý 60-tonový kolos 8×4 s ultimátnym pohonom
- Spojenec Slovenska dostal ultimátnu zbraň. „Dračiemu ohňu“ neunikne ani jedna raketa, zasiahne aj mincu
- Zdrvujúca slovenská novinka zbúrala Netflix. Porazila aj hollywoodsky hit za 200 miliónov
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
- Musk po vyše 20 rokov zmenil názor, SpaceX prichádza na akciový trh so šialenou hodnotou
Známa automobilka pochovala elektrické nákladiaky. Smeruje k hybridom a menším elektromobilom
Zlom v EÚ: Spaľovacie motory po roku 2035 nezmiznú. Nový balík umožní ich prežitie
Elon Musk prepisuje dejiny. Výška jeho majetku vyráža dych, vďačí za to jednej veci
Zostrihaný prejav spustil peklo. Trump od BBC žiada likvidačné odškodné
Poliakom došla trpezlivosť. Vyvíjajú štátnu aplikáciu na nahlasovanie podozrivých situácií
Obrovská fraška Muskovej AI. O teroristickom útoku v Sydney používateľom surovo klamala
Tvrdý bankrot a milióny ľudí v neistote. Slávny výrobca vysávačov skrachoval
NAJČÍTANEJŠIE ZO STARTITUP
PREMIUMMichal Strnad s majetkom 13,6 miliardy eur: „Chcem vybudovať najväčšiu firmu obranného priemyslu v Európe“
PREMIUMV 17. rokoch začala podnikať, vybudovala firmu s obratom 296 miliónov eur: Ak chceš robiť biznis, musíš sa naučiť žiť s rizikom. Inak to nejde

Vykoľajený vlak na čas ochromil frekventovanú trať. Železnice SR reagujú

Tvrdý zásah pre živnostníkov v roku 2026. Tisíce SZČO stoja pred životným rozhodnutím

