Mal byť najlepší z najlepších. AI pri testoch brutálne pohorela, jej odpovede mali mizernú úspešnosť
OpenAI, popredná spoločnosť vo vývoji umelej inteligencie, zverejnila nové zistenia o spoľahlivosti svojich najnovších modelov, ktoré prinášajú prekvapujúce výsledky. V rámci vlastného testovania, najnovší model o1-preview, vydaný minulý mesiac, dosiahol len 42,7 % úspešnosť v správnych odpovediach.
Tieto čísla sú znepokojujúce, najmä preto, že umelá inteligencia sa čoraz viac integruje do našich každodenných životov a služieb. O tejto téme informoval portál Futurism.
OpenAI testovalo svoj najnovší model v rámci benchmarku SimpleQA a dosiahlo alarmujúco nízky počet správnych odpovedí. Konkurenti OpenAI, ako napríklad modely od spoločnosti Anthropic, na tom nie sú lepšie. Ich nový model Claude-3.5-sonnet dosiahol v tomto teste len 28,9 %, pričom častejšie odmietal odpovedať na otázky, keď si nebol istý správnou odpoveďou.
Tento opatrný prístup je možno rozumnejší, pretože podľa zistení výskumníkov OpenAI sú modely často príliš sebavedomé v odpovediach, aj keď sú nesprávne. To vedie k riziku šírenia nesprávnych informácií s presvedčivým tónom.
Halucinácie AI – vážny problém
Jedným z najvážnejších problémov, s ktorým sa vývojári stretávajú, je tzv. halucinovanie modelov. Tento termín v oblasti AI znamená sklon modelov generovať odpovede, ktoré nemajú oporu v realite. Hoci riziko nepresných alebo dokonca úplne vymyslených odpovedí je v prípade týchto modelov vysoké. Technológie založené na veľkých jazykových modeloch (LLM) sú dnes populárne v mnohých oblastiach. Od študentov píšucich domáce úlohy až po programátorov v popredných technologických firmách.
Nedávno bol napríklad model OpenAI použitý na prepis rozhovorov s pacientmi v nemocnici, kde sa ukázalo, že časté halucinácie v odpovediach vedú k riziku nepresného zápisu zdravotných údajov. Podobne je možné, že zavedenie AI do činnosti polície v USA môže zvyšovať.
Narážka na kvalitu dát
Výskum od spoločnosti OpenAI upozorňuje na dôležitý fakt. Odpovede jazykových modelov umelej inteligencie si stále vyžadujú veľkú opatrnosť a pozorné hodnotenie. Aj keď sa tieto technológie rýchlo rozvíjajú, otázky ohľadom spoľahlivosti odpovedí zostávajú aktuálne. Čoraz väčší počet ľudí sa totiž pri hľadaní informácií spolieha na AI modely, a tak je dôležité zvážiť ich presnosť a dôveryhodnosť.
Podľa nových zistení od OpenAI sa ukazuje, že problém presnosti a spoľahlivosti AI môže byť spojený s kvalitou dát, ktoré modely spracovávajú počas tréningu. Aj keď rozšírenie množstva týchto dát môže zlepšiť výkon a rozmanitosť odpovedí, zatiaľ nie je jasné, či tento krok úplne vyrieši riziko nepresností.
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Nemíňaj zbytočne stovky eur. Tieto aplikácie ťa dostanú do formy a ušetríš pritom čas aj peniaze (TOP 5)
Objednávka ti môže prísť až v roku 2026. Slováci naleteli sieti podvodných e-shopov s bizarnými podmienkami
Experti sa boja najhoršieho. Zlúčenie japonských automobiliek nedáva zmysel, prsty v tom má politika
Znie to ako paradox. Vďaka elektromobilu môžeš ušetriť stovky eur na elektrine, nová štúdia ukázala obrovskú výhodu
Žijeme v simulácii? Vedec prišiel s fascinujúcim riešením, ako sa z nej dostať von
NAJČÍTANEJŠIE ZO STARTITUP
Podnestersko čelí masívnej energetickej kríze po odstavení ruského plynu. Obyvatelia zostali v zime bez tepla
Migréna ako varovný signál rakoviny: Tieto príznaky by si nemal ignorovať
Novoročné príhovory vrcholových politikov: Ficove slová si všimli svetové médiá
Prelomový výskum: Lekári odhalili tichého nepriateľa zdravého mozgu. Problém sa dá liečiť
Čo sa jedlo a kto nesmel prekročiť prah domu: Zisti, ako poznáš tradície Nového roka (KVÍZ)
- 24 hod
- 48 hod
- 7 dní
-
- Pošlú ich rovno do šrotu. Kontroverzná regulácia Európskej komisie o autách je na spadnutie
- Jeho éra hrdinu sa skončila. Obľúbený herec prechádza na temnú stranu DC, zahrá si vysnívanú úlohu
- Predali závratný počet áut. Elektromobily majú jasného lídra, týmto číslam môže Tesla len závidieť
- Svet len krúti hlavami. Rusko zakázalo kľúčovú funkciu populárnych aplikácií, bez nej strácajú význam
- Pozrieš si desiatky filmov a seriálov. Obľúbená služba Slovákov bude úplne zadarmo
-
- Pošlú ich rovno do šrotu. Kontroverzná regulácia Európskej komisie o autách je na spadnutie
- Nemci ukázali svetu tvrdú realitu. Toto sú hlavné dôvody, ktoré ľudí odrádzajú od kúpy elektromobilu
- Pozrieš si desiatky filmov a seriálov. Obľúbená služba Slovákov bude úplne zadarmo
- Pilier našej ekonomiky je v ohrození. Slovensko zavádza najvyššiu daň z transakcií v regióne
- Jeho éra hrdinu sa skončila. Obľúbený herec prechádza na temnú stranu DC, zahrá si vysnívanú úlohu
-
- Pošlú ich rovno do šrotu. Kontroverzná regulácia Európskej komisie o autách je na spadnutie
- Experiment zlyhal. Neúspešný Pán prsteňov prichádza online v rekordne krátkom čase
- USA odhalili tajný projekt za miliardy. Tu je všetko, čo vieme o ich stíhačke budúcnosti
- Väčšina Slovákov sa ohromne mýli. Elektromobily majú v zime oproti spaľovákom veľkú výhodu
- Čaká nás „hviezdny“ záver roka. Slováci uvidia na oblohe výnimočný úkaz
Revolúcia sa odkladá. OpenAI nedodržalo termín spustenia kľúčového nástroja
Nový iPhone dostane zásadné vylepšenia kamery. Údajne im pomáha Samsung
Robotické sondy prekračujú všetky limity. Sú budúce vesmírne misie v rukách strojov či ľudí?
Vedci odhaľujú tajomstvá evolúcie. Konečne vieme, ako DNA menila život na Zemi
Ukrajina čelí novej výzve. Špeciálne ruské drony odolávajú všetkým protiopatreniam
NAJČÍTANEJŠIE ZO STARTITUP
Podnestersko čelí masívnej energetickej kríze po odstavení ruského plynu. Obyvatelia zostali v zime bez tepla
Migréna ako varovný signál rakoviny: Tieto príznaky by si nemal ignorovať
Novoročné príhovory vrcholových politikov: Ficove slová si všimli svetové médiá
Prelomový výskum: Lekári odhalili tichého nepriateľa zdravého mozgu. Problém sa dá liečiť
Čo sa jedlo a kto nesmel prekročiť prah domu: Zisti, ako poznáš tradície Nového roka (KVÍZ)
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené