Odhalili najväčšiu slabinu umelej inteligencie. Čelí problému, ktorý trápi aj Slovákov
Umelá inteligencia sa už, či sa nám to páči alebo nie, stala bežnou súčasťou viacerých odvetví a tiež každodenného života mnohých ľudí. Známe je už množstvo rizík spojených s touto technológiou, pričom jedným z najväčších je šírenie dezinformácií. Ako ale upozorňuje ArsTechnica, tento problém je ešte komplikovanejší, než sa prv zdalo a vysporiadať sa s ním môže byť takmer nemožné.
Nemožná výzva?
Internet je plný dezinformácií a väčšina veľkých jazykových modelov (LLM) je trénovaná na obrovských množstvách textov získaných práve z internetu. V ideálnom svete by vysoký objem presných informácií mohol zatieniť falošné správy.
Je to však naozaj tak? Nová štúdia výskumníkov z New York University skúma, koľko medicínskych informácií môže byť zahrnutých v tréningových dátach LLM, aby výsledný model stále dával nesprávne odpovede. Aj keď štúdia neurčuje minimálnu hranicu, ukazuje, že keď dezinformácie tvoria iba 0,001 % tréningových dát, výsledný model je narušený.
Štúdia sa zameriava na zámerné „otrávenie“ tréningových dát, no tiež upozorňuje na problém už existujúcich dezinformácií online, ktoré sú súčasťou tréningových súborov, ako aj na zastarané informácie v overených medicínskych databázach.
Výsledky sú zdrvujúce
Ide o pomerne jednoduchý koncept. LLM sa trénujú na obrovských množstvách textov, často získaných z internetu. Ak sa do tréningových dát cielene pridajú nesprávne informácie, model ich môže považovať za fakty. Stačí, ak sa tieto informácie umiestnia na internet, kde sa stanú súčasťou tréningového súboru.
Yann LeCun: AI won’t be used to generate misinformation in science, deliberately or accidentally. It’s not a problem.
Actual research: It’s already happening. pic.twitter.com/F0Ye6FasDs
— Gary Marcus (@GaryMarcus) September 12, 2024
Výskumníci analyzovali databázu The Pile, ktorá obsahuje veľa medicínskych informácií. Zamerali sa na 60 medicínskych tém a zámerne nahradili 0,5 % a 1 % relevantných informácií falošnými dátami. Výsledné modely boli oveľa náchylnejšie produkovať dezinformácie, a to nielen na cielené témy, ale aj na iné medicínske otázky.
Aj malé množstvo dezinformácií (0,001 %) spôsobilo, že viac ako 7 % odpovedí obsahovalo nesprávne informácie. Takéto útoky sú lacné a jednoduché – napríklad pomocou „neviditeľného textu“ na webových stránkach. Podľa odborníkov je pritom možné nájsť zdroje niektorých dezinformácií aj v odbornej literatúre aj na platformách ako PubMed, kde sa nachádzajú či už zastaralé liečebné metódy alebo kedysi sľubne vyzerajúce výskumy, ktoré však nikam neviedli.
Môže aj pomáhať
Ako sme ale informovali v samostatnom článku, AI je schopná proti klamlivým informáciám online aj bojovať. Nórsky startup Factiverse na to využíva vlastný model umelej inteligencie, ktorý je odlišný od veľkých jazykových modelov, akým je napríklad GPT-4. Factiverse sa zameriava na informačné vyhľadávanie a je trénovaný výhradne na kvalitných a overených dátach z dôveryhodných zdrojov.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Krutá pravda o Ficovi, Dankovi či Šimečkovi? Spýtali sme sa AI, čo si myslí o slovenských politikoch
Jedna z najlepších funkcií ChatGPT je konečne zadarmo. OpenAI pridáva aj bezpečnostné novinky
Spojí 10-tisíc bojových robotov v akomkoľvek teréne. Čína odhalila tajnú zbraň, buduje AI armádu
Spravia za teba všetko. TOP 8 AI nástrojov, ktoré Slováci tajne používajú na školu a prácu
Totálne zmenia to, ako funguješ. Toto je 30 AI nástrojov, ktoré za teba urobia úplne všetko
NAJČÍTANEJŠIE ZO STARTITUP
Konsolidácia zasiahne peňaženky všetkých: Minister Kamenický predstavil balík
Šesť miliónkrát menej ako zrnko soli. Virológ objasnil, prečo sa Kotlár mýli: „mRNA vakcíny nemenia DNA“ (ROZHOVOR)
Pyrotechnici zneškodňujú bombu v centre Bratislavy: Uzavreté sú klúčové úseky
Nebezpečný vírus „zaplavil“ Európu: Prvé príznaky oklamú aj lekára, rúška a umývanie rúk nestačia
Náborový príspevok až 5 000 eur a slušný plat: Finančná správa hľadá posily do tímu
- 24 hod
- 48 hod
- 7 dní
-
- Vedcom padla sánka. 4 757 metrov pod ľadom Antarktídy objavili stratený svet
- Veľmoc našla ložisko mimoriadne vzácnej suroviny. Má astronomickú hodnotu
- Nová rana pre vodičov. Ak nemáš splnenú túto podmienku, auto ti na STK neprejde
- Krutá daň 1000 jadrových bômb. USA naozaj stavali raketu s hmotnosťou 8 miliónov ton
- Nemci na diaľnici prekvapili: Hoci môžu jazdiť neobmedzenou rýchlosťou, toto je realita
-
- Vedcom padla sánka. 4 757 metrov pod ľadom Antarktídy objavili stratený svet
- Na Slovensko prichádza najlepšie hodnotený seriál celého roka. Ponúkne ho jediná služba
- Veľmoc našla ložisko mimoriadne vzácnej suroviny. Má astronomickú hodnotu
- Zbraň budúcnosti zlyhala na plnej čiare. Arabi testovali čínsky laser a ostali totálne zarazení
- Európske automobilky sa otriasajú. Šéf Stellantisu poslal Bruselu tvrdý odkaz, čas sa kráti
-
- Vedcom padla sánka. 4 757 metrov pod ľadom Antarktídy objavili stratený svet
- Nič lepšie vraj na Netflixe tento rok neuvidíš. Hrozivo aktuálny film ohromil kritikov, 11 minút mu tlieskali v stoji
- Susedná krajina kupuje ničivé zbrane za 1,4 miliardy eur. Moskve poslali jasný odkaz
- Zbraň budúcnosti zlyhala na plnej čiare. Arabi testovali čínsky laser a ostali totálne zarazení
- Na Slovensko prichádza najlepšie hodnotený seriál celého roka. Ponúkne ho jediná služba
Slovenský export zbraní rastie nebývalým tempom. Rok 2025 môže priniesť 3 miliardy eur
Mapy Google sa v Kórei menia. Citlivé oblasti už nebudú viditeľné
Nový prieskum odhalil trend. Platby kartou a mobilom sa stali štandardom na Slovensku
Prekvapenie: Európske automobilky úspešne plnia prísne emisie EÚ, zaostáva len slávna značka
Nemecký politik chce zrušiť zákaz spaľovacích motorov. Prehliadame vraj dostupnú alternatívu pre spaľováky
NAJČÍTANEJŠIE ZO STARTITUP