Mal byť najlepší z najlepších. AI pri testoch brutálne pohorela, jej odpovede mali mizernú úspešnosť
OpenAI, popredná spoločnosť vo vývoji umelej inteligencie, zverejnila nové zistenia o spoľahlivosti svojich najnovších modelov, ktoré prinášajú prekvapujúce výsledky. V rámci vlastného testovania, najnovší model o1-preview, vydaný minulý mesiac, dosiahol len 42,7 % úspešnosť v správnych odpovediach.
Tieto čísla sú znepokojujúce, najmä preto, že umelá inteligencia sa čoraz viac integruje do našich každodenných životov a služieb. O tejto téme informoval portál Futurism.
OpenAI testovalo svoj najnovší model v rámci benchmarku SimpleQA a dosiahlo alarmujúco nízky počet správnych odpovedí. Konkurenti OpenAI, ako napríklad modely od spoločnosti Anthropic, na tom nie sú lepšie. Ich nový model Claude-3.5-sonnet dosiahol v tomto teste len 28,9 %, pričom častejšie odmietal odpovedať na otázky, keď si nebol istý správnou odpoveďou.
Tento opatrný prístup je možno rozumnejší, pretože podľa zistení výskumníkov OpenAI sú modely často príliš sebavedomé v odpovediach, aj keď sú nesprávne. To vedie k riziku šírenia nesprávnych informácií s presvedčivým tónom.
Halucinácie AI – vážny problém
Jedným z najvážnejších problémov, s ktorým sa vývojári stretávajú, je tzv. halucinovanie modelov. Tento termín v oblasti AI znamená sklon modelov generovať odpovede, ktoré nemajú oporu v realite. Hoci riziko nepresných alebo dokonca úplne vymyslených odpovedí je v prípade týchto modelov vysoké. Technológie založené na veľkých jazykových modeloch (LLM) sú dnes populárne v mnohých oblastiach. Od študentov píšucich domáce úlohy až po programátorov v popredných technologických firmách.
Nedávno bol napríklad model OpenAI použitý na prepis rozhovorov s pacientmi v nemocnici, kde sa ukázalo, že časté halucinácie v odpovediach vedú k riziku nepresného zápisu zdravotných údajov. Podobne je možné, že zavedenie AI do činnosti polície v USA môže zvyšovať.

Narážka na kvalitu dát
Výskum od spoločnosti OpenAI upozorňuje na dôležitý fakt. Odpovede jazykových modelov umelej inteligencie si stále vyžadujú veľkú opatrnosť a pozorné hodnotenie. Aj keď sa tieto technológie rýchlo rozvíjajú, otázky ohľadom spoľahlivosti odpovedí zostávajú aktuálne. Čoraz väčší počet ľudí sa totiž pri hľadaní informácií spolieha na AI modely, a tak je dôležité zvážiť ich presnosť a dôveryhodnosť.
Podľa nových zistení od OpenAI sa ukazuje, že problém presnosti a spoľahlivosti AI môže byť spojený s kvalitou dát, ktoré modely spracovávajú počas tréningu. Aj keď rozšírenie množstva týchto dát môže zlepšiť výkon a rozmanitosť odpovedí, zatiaľ nie je jasné, či tento krok úplne vyrieši riziko nepresností.
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Japonci ukázali budúcnosť áut. Na kritickú vec ale totálne zabudli

Trump bije na poplach. USA spúšťajú testy jadrových zbraní, majú ich podľa neho „viac než Rusko“

Z 200 eurového zariadenia bude plnohodnotná konzola. Únik odhaľuje zásadnú zmenu

Najväčšia bitka roka je tu. Netflix ukazuje finále svojho sci-fi hitu, v slovenských premiérach je zmätok

YouTube dostáva revolučné vylepšenie. Nová AI funkcia automaticky vylepší staré videá
NAJČÍTANEJŠIE ZO STARTITUP

Nový výskum odhaľuje prekvapivý zdroj infekcií močových ciest. Každý piaty prípad má rovnakú príčinu

Centrum Bratislavy čaká najväčšia premena za desaťročie. Hlavné mesto ruší parkoviská a stavia na zelenšiu budúcnosť

Putin mení tón po 3 rokoch vojny na Ukrajine. Z triumfálnej invázie je mierová misia

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

Dom s pozemkom a príslušenstvom za 28 000 eur. Štát predáva nepotrebný majetok
- 24 hod
- 48 hod
- 7 dní
- 
					- Experti ostali bez slov. Najväčšiu pliagu ľudstva našli na mieste, kde nemá vôbec čo robiť
- Najväčšia bitka roka je tu. Netflix ukazuje finále svojho sci-fi hitu, v slovenských premiérach je zmätok
- Vedci neverili vlastným očiam. Na Slnku prší a konečne vieme ako je to možné
- VIDEO: Zbláznila sa Čína? Neuveríš, čím pokryli celé pohorie
- Netflix priznáva zlyhanie. Zaklínač končí v predstihu, tvorcovia priznali smutnú pravdu
 
- 
					- Netflix priznáva zlyhanie. Zaklínač končí v predstihu, tvorcovia priznali smutnú pravdu
- Experti ostali bez slov. Najväčšiu pliagu ľudstva našli na mieste, kde nemá vôbec čo robiť
- VIDEO: Zbláznila sa Čína? Neuveríš, čím pokryli celé pohorie
- Pochopili, že ubližujú sami sebe. Bohatá krajina chce okamžite zrušiť clá na elektromobily z Číny
- Akčný veľkofilm 2025 prichádza online. Sľub splniť nedokázal
 
- 
				- Bez Západu by rýchlo prehrali. Ukrajina zistila, čo v skutočnosti poháňa „ruské“ drony
- Pochopili, že ubližujú sami sebe. Bohatá krajina chce okamžite zrušiť clá na elektromobily z Číny
- Vodiči sú proti nim bezradní. Nové radary rozdávajú pokuty za niečo, čo by ti nikdy nenapadlo
- Akčný film 2025 neprestáva udivovať. Ohúril aj Slovákov a naďalej láme rekordy
- VIDEO: Zbláznila sa Čína? Neuveríš, čím pokryli celé pohorie
 
Európsky Detroit má problém. Slovenský automobilový priemysel sa dostal do slepej uličky
Svetová elita ničí Zem. Oxfam odhalil katastrofálne rozdiely v emisiách
To, čo Nvidia dokázala, nemá v histórii obdoby. Svet financií stojí v nemom úžase
Takú astronomickú hodnotu dosiahli len tri firmy. Technologický gigant prekonal historický míľnik
Obľúbený operátor spúšťa štedrý vianočný kalendár, pre Slovákov si pripravil veľa prekvapení (PREHĽAD)
NAJČÍTANEJŠIE ZO STARTITUP

Nový výskum odhaľuje prekvapivý zdroj infekcií močových ciest. Každý piaty prípad má rovnakú príčinu

Centrum Bratislavy čaká najväčšia premena za desaťročie. Hlavné mesto ruší parkoviská a stavia na zelenšiu budúcnosť

Putin mení tón po 3 rokoch vojny na Ukrajine. Z triumfálnej invázie je mierová misia

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

 
			 
				 
				 
                 
				 
				 
				

 
		