Mal byť najlepší z najlepších. AI pri testoch brutálne pohorela, jej odpovede mali mizernú úspešnosť
OpenAI, popredná spoločnosť vo vývoji umelej inteligencie, zverejnila nové zistenia o spoľahlivosti svojich najnovších modelov, ktoré prinášajú prekvapujúce výsledky. V rámci vlastného testovania, najnovší model o1-preview, vydaný minulý mesiac, dosiahol len 42,7 % úspešnosť v správnych odpovediach.
Tieto čísla sú znepokojujúce, najmä preto, že umelá inteligencia sa čoraz viac integruje do našich každodenných životov a služieb. O tejto téme informoval portál Futurism.
OpenAI testovalo svoj najnovší model v rámci benchmarku SimpleQA a dosiahlo alarmujúco nízky počet správnych odpovedí. Konkurenti OpenAI, ako napríklad modely od spoločnosti Anthropic, na tom nie sú lepšie. Ich nový model Claude-3.5-sonnet dosiahol v tomto teste len 28,9 %, pričom častejšie odmietal odpovedať na otázky, keď si nebol istý správnou odpoveďou.
Tento opatrný prístup je možno rozumnejší, pretože podľa zistení výskumníkov OpenAI sú modely často príliš sebavedomé v odpovediach, aj keď sú nesprávne. To vedie k riziku šírenia nesprávnych informácií s presvedčivým tónom.
Halucinácie AI – vážny problém
Jedným z najvážnejších problémov, s ktorým sa vývojári stretávajú, je tzv. halucinovanie modelov. Tento termín v oblasti AI znamená sklon modelov generovať odpovede, ktoré nemajú oporu v realite. Hoci riziko nepresných alebo dokonca úplne vymyslených odpovedí je v prípade týchto modelov vysoké. Technológie založené na veľkých jazykových modeloch (LLM) sú dnes populárne v mnohých oblastiach. Od študentov píšucich domáce úlohy až po programátorov v popredných technologických firmách.
Nedávno bol napríklad model OpenAI použitý na prepis rozhovorov s pacientmi v nemocnici, kde sa ukázalo, že časté halucinácie v odpovediach vedú k riziku nepresného zápisu zdravotných údajov. Podobne je možné, že zavedenie AI do činnosti polície v USA môže zvyšovať.
Narážka na kvalitu dát
Výskum od spoločnosti OpenAI upozorňuje na dôležitý fakt. Odpovede jazykových modelov umelej inteligencie si stále vyžadujú veľkú opatrnosť a pozorné hodnotenie. Aj keď sa tieto technológie rýchlo rozvíjajú, otázky ohľadom spoľahlivosti odpovedí zostávajú aktuálne. Čoraz väčší počet ľudí sa totiž pri hľadaní informácií spolieha na AI modely, a tak je dôležité zvážiť ich presnosť a dôveryhodnosť.
Podľa nových zistení od OpenAI sa ukazuje, že problém presnosti a spoľahlivosti AI môže byť spojený s kvalitou dát, ktoré modely spracovávajú počas tréningu. Aj keď rozšírenie množstva týchto dát môže zlepšiť výkon a rozmanitosť odpovedí, zatiaľ nie je jasné, či tento krok úplne vyrieši riziko nepresností.
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Ukrajinská nočná mora sa môže skončiť. Tisíce nových zbraní zatočia s ruskými dronmi
Temná hmota nemusí existovať. Najväčšia záhada vesmíru je ešte podivnejšia, ako sme si mysleli
Zlyhanie ich neodradilo. Google chystá revolučné AI zariadenie, príde aj náhrada za Apple Vision Pro
Marvel udrie v plnej sile a DC chystá veľkolepý návrat. V roku 2025 nebudeš vedieť, čo pozerať skôr (PREHĽAD)
Triumf aj tragédia Rusov. Legendárna raketa má za sebou už 2000 letov, no zaspala dobu
NAJČÍTANEJŠIE ZO STARTITUP
MAPA: Na Slovensko sa rúti ľadová kalamita. Radšej ostaň doma, varujú meteorológovia
Rusi ním „ovládnu“ Arktídu: Najnovší gigantický jadrový ľadoborec prelomí ľad s hrúbkou až 2,8 metra
Zomrela najstaršia osoba na svete. Dožila sa 116 rokov
V 17 rokoch prepísal históriu športu. Majster sveta Luke Littler vstáva popoludní a bez pizze netrénuje (PRÍBEH)
Revolučné kvantové hodiny vyrážajú dych: Tajné laboratórium vyvíja projekt s presnosťou na miliardy rokov
- 24 hod
- 48 hod
- 7 dní
-
- Fanúšikovia im nedokázali odolať. Toto sú nelegálne najsťahovanejšie filmy roka 2024 (ZOZNAM)
- Bol nočnou morou gestapa. Slováci objavili klenot na Netflixe, je najsledovanejším filmom
- V januári nevstaneš od televízora. Toto je TOP 8 noviniek, ktoré si nesmieš nechať ujsť
- Slovákov špehujú, ani o tom netušia. Takto overíš, či niekto nesleduje tvoj mobil
- Koniec batérií sa blíži. Vedci vyvíjajú technológie, ktoré efektívne uložia vyrobenú energiu
-
- Fanúšikovia im nedokázali odolať. Toto sú nelegálne najsťahovanejšie filmy roka 2024 (ZOZNAM)
- Bol nočnou morou gestapa. Slováci objavili klenot na Netflixe, je najsledovanejším filmom
- V januári nevstaneš od televízora. Toto je TOP 8 noviniek, ktoré si nesmieš nechať ujsť
- Slovákov špehujú, ani o tom netušia. Takto overíš, či niekto nesleduje tvoj mobil
- Koniec batérií sa blíži. Vedci vyvíjajú technológie, ktoré efektívne uložia vyrobenú energiu
-
- Pošlú ich rovno do šrotu. Kontroverzná regulácia Európskej komisie o autách je na spadnutie
- Bol nočnou morou gestapa. Slováci objavili klenot na Netflixe, je najsledovanejším filmom
- Fanúšikovia im nedokázali odolať. Toto sú nelegálne najsťahovanejšie filmy roka 2024 (ZOZNAM)
- Svet len krúti hlavami. Rusko zakázalo kľúčovú funkciu populárnych aplikácií, bez nej strácajú význam
- Jeho éra hrdinu sa skončila. Obľúbený herec prechádza na temnú stranu DC, zahrá si vysnívanú úlohu
Vedci šokovali svet: V ľudskom tele našli látky, ktoré nepochádzajú z našej galaxie
Čína zrýchľuje vesmírny program. Za jeden deň otestovali až 5 raketových motorov
SpaceX sa pripravuje na testovací let svojej rakety Starship. Otestujú novú technológiu
Pomaly ich zabíja hustý smog. Toto je najnezničenejšie mesto na svete, možno ťa prekvapí
Stellantis bojuje o budúcnosť v prekvapivej krajine. V minulom roku vyrobili rekordne málo áut
NAJČÍTANEJŠIE ZO STARTITUP
MAPA: Na Slovensko sa rúti ľadová kalamita. Radšej ostaň doma, varujú meteorológovia
Rusi ním „ovládnu“ Arktídu: Najnovší gigantický jadrový ľadoborec prelomí ľad s hrúbkou až 2,8 metra
Zomrela najstaršia osoba na svete. Dožila sa 116 rokov
V 17 rokoch prepísal históriu športu. Majster sveta Luke Littler vstáva popoludní a bez pizze netrénuje (PRÍBEH)
Revolučné kvantové hodiny vyrážajú dych: Tajné laboratórium vyvíja projekt s presnosťou na miliardy rokov
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené