Pexels (Úprava redakcie)

OpenAI, popredná spoločnosť vo vývoji umelej inteligencie, zverejnila nové zistenia o spoľahlivosti svojich najnovších modelov, ktoré prinášajú prekvapujúce výsledky. V rámci vlastného testovania, najnovší model o1-preview, vydaný minulý mesiac, dosiahol len 42,7 % úspešnosť v správnych odpovediach.

Tieto čísla sú znepokojujúce, najmä preto, že umelá inteligencia sa čoraz viac integruje do našich každodenných životov a služieb. O tejto téme informoval portál Futurism.

PRIDAJ sa do exkluzívnej technologickej skupiny na Facebooku

OpenAI testovalo svoj najnovší model v rámci benchmarku SimpleQA a dosiahlo alarmujúco nízky počet správnych odpovedí. Konkurenti OpenAI, ako napríklad modely od spoločnosti Anthropic, na tom nie sú lepšie. Ich nový model Claude-3.5-sonnet dosiahol v tomto teste len 28,9 %, pričom častejšie odmietal odpovedať na otázky, keď si nebol istý správnou odpoveďou.

Tento opatrný prístup je možno rozumnejší, pretože podľa zistení výskumníkov OpenAI sú modely často príliš sebavedomé v odpovediach, aj keď sú nesprávne. To vedie k riziku šírenia nesprávnych informácií s presvedčivým tónom.

Halucinácie AI – vážny problém

Jedným z najvážnejších problémov, s ktorým sa vývojári stretávajú, je tzv. halucinovanie modelov. Tento termín v oblasti AI znamená sklon modelov generovať odpovede, ktoré nemajú oporu v realite. Hoci riziko nepresných alebo dokonca úplne vymyslených odpovedí je v prípade týchto modelov vysoké. Technológie založené na veľkých jazykových modeloch (LLM) sú dnes populárne v mnohých oblastiach. Od študentov píšucich domáce úlohy až po programátorov v popredných technologických firmách.

Nedávno bol napríklad model OpenAI použitý na prepis rozhovorov s pacientmi v nemocnici, kde sa ukázalo, že časté halucinácie v odpovediach vedú k riziku nepresného zápisu zdravotných údajov. Podobne je možné, že zavedenie AI do činnosti polície v USA môže zvyšovať.

Pexels

Narážka na kvalitu dát

Výskum od spoločnosti OpenAI upozorňuje na dôležitý fakt. Odpovede jazykových modelov umelej inteligencie si stále vyžadujú veľkú opatrnosť a pozorné hodnotenie. Aj keď sa tieto technológie rýchlo rozvíjajú, otázky ohľadom spoľahlivosti odpovedí zostávajú aktuálne. Čoraz väčší počet ľudí sa totiž pri hľadaní informácií spolieha na AI modely, a tak je dôležité zvážiť ich presnosť a dôveryhodnosť.

Podľa nových zistení od OpenAI sa ukazuje, že problém presnosti a spoľahlivosti AI môže byť spojený s kvalitou dát, ktoré modely spracovávajú počas tréningu. Aj keď rozšírenie množstva týchto dát môže zlepšiť výkon a rozmanitosť odpovedí, zatiaľ nie je jasné, či tento krok úplne vyrieši riziko nepresností.

Teraz čítajú

Japonci ukázali budúcnosť áut. Na kritickú vec ale totálne zabudli

Trump bije na poplach. USA spúšťajú testy jadrových zbraní, majú ich podľa neho „viac než Rusko“

Z 200 eurového zariadenia bude plnohodnotná konzola. Únik odhaľuje zásadnú zmenu

Najväčšia bitka roka je tu. Netflix ukazuje finále svojho sci-fi hitu, v slovenských premiérach je zmätok

YouTube dostáva revolučné vylepšenie. Nová AI funkcia automaticky vylepší staré videá

NAJČÍTANEJŠIE ZO STARTITUP

Nový výskum odhaľuje prekvapivý zdroj infekcií močových ciest. Každý piaty prípad má rovnakú príčinu

Centrum Bratislavy čaká najväčšia premena za desaťročie. Hlavné mesto ruší parkoviská a stavia na zelenšiu budúcnosť

Putin mení tón po 3 rokoch vojny na Ukrajine. Z triumfálnej invázie je mierová misia

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

Dom s pozemkom a príslušenstvom za 28 000 eur. Štát predáva nepotrebný majetok

Mal byť najlepší z najlepších. AI pri testoch brutálne pohorela, jej odpovede mali mizernú úspešnosť

Halucinácie AI – vážny problém

Narážka na kvalitu dát

Japonci ukázali budúcnosť áut. Na kritickú vec ale totálne zabudli

Trump bije na poplach. USA spúšťajú testy jadrových zbraní, majú ich podľa neho „viac než Rusko“

Z 200 eurového zariadenia bude plnohodnotná konzola. Únik odhaľuje zásadnú zmenu

Najväčšia bitka roka je tu. Netflix ukazuje finále svojho sci-fi hitu, v slovenských premiérach je zmätok

YouTube dostáva revolučné vylepšenie. Nová AI funkcia automaticky vylepší staré videá

Nový výskum odhaľuje prekvapivý zdroj infekcií močových ciest. Každý piaty prípad má rovnakú príčinu

Centrum Bratislavy čaká najväčšia premena za desaťročie. Hlavné mesto ruší parkoviská a stavia na zelenšiu budúcnosť

Putin mení tón po 3 rokoch vojny na Ukrajine. Z triumfálnej invázie je mierová misia

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

Dom s pozemkom a príslušenstvom za 28 000 eur. Štát predáva nepotrebný majetok

Európsky Detroit má problém. Slovenský automobilový priemysel sa dostal do slepej uličky

Svetová elita ničí Zem. Oxfam odhalil katastrofálne rozdiely v emisiách

To, čo Nvidia dokázala, nemá v histórii obdoby. Svet financií stojí v nemom úžase

Takú astronomickú hodnotu dosiahli len tri firmy. Technologický gigant prekonal historický míľnik

Obľúbený operátor spúšťa štedrý vianočný kalendár, pre Slovákov si pripravil veľa prekvapení (PREHĽAD)

Nový výskum odhaľuje prekvapivý zdroj infekcií močových ciest. Každý piaty prípad má rovnakú príčinu

Centrum Bratislavy čaká najväčšia premena za desaťročie. Hlavné mesto ruší parkoviská a stavia na zelenšiu budúcnosť

Putin mení tón po 3 rokoch vojny na Ukrajine. Z triumfálnej invázie je mierová misia

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

Dom s pozemkom a príslušenstvom za 28 000 eur. Štát predáva nepotrebný majetok

Odomknúť článok

kamošovi

Odomknúť článok

kamošovi

Mal byť najlepší z najlepších. AI pri testoch brutálne pohorela, jej odpovede mali mizernú úspešnosť

Halucinácie AI – vážny problém

Narážka na kvalitu dát

Japonci ukázali budúcnosť áut. Na kritickú vec ale totálne zabudli

Trump bije na poplach. USA spúšťajú testy jadrových zbraní, majú ich podľa neho „viac než Rusko“

Z 200 eurového zariadenia bude plnohodnotná konzola. Únik odhaľuje zásadnú zmenu

Najväčšia bitka roka je tu. Netflix ukazuje finále svojho sci-fi hitu, v slovenských premiérach je zmätok

YouTube dostáva revolučné vylepšenie. Nová AI funkcia automaticky vylepší staré videá

Nový výskum odhaľuje prekvapivý zdroj infekcií močových ciest. Každý piaty prípad má rovnakú príčinu

Centrum Bratislavy čaká najväčšia premena za desaťročie. Hlavné mesto ruší parkoviská a stavia na zelenšiu budúcnosť

Putin mení tón po 3 rokoch vojny na Ukrajine. Z triumfálnej invázie je mierová misia

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

Dom s pozemkom a príslušenstvom za 28 000 eur. Štát predáva nepotrebný majetok

Európsky Detroit má problém. Slovenský automobilový priemysel sa dostal do slepej uličky

Svetová elita ničí Zem. Oxfam odhalil katastrofálne rozdiely v emisiách

To, čo Nvidia dokázala, nemá v histórii obdoby. Svet financií stojí v nemom úžase

Takú astronomickú hodnotu dosiahli len tri firmy. Technologický gigant prekonal historický míľnik

Obľúbený operátor spúšťa štedrý vianočný kalendár, pre Slovákov si pripravil veľa prekvapení (PREHĽAD)

Nový výskum odhaľuje prekvapivý zdroj infekcií močových ciest. Každý piaty prípad má rovnakú príčinu

Centrum Bratislavy čaká najväčšia premena za desaťročie. Hlavné mesto ruší parkoviská a stavia na zelenšiu budúcnosť

Putin mení tón po 3 rokoch vojny na Ukrajine. Z triumfálnej invázie je mierová misia

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

Dom s pozemkom a príslušenstvom za 28 000 eur. Štát predáva nepotrebný majetok

Odomknúť článok

kamošovi

Odomknúť článok

kamošovi

Blahoželáme, máš prémiových kamošov!

Zakúpené články

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac

Nehnuteľnosť vs. fond: AI a expert prezradili, do čoho sa Slovákom oplatí investovať viac