Čínsky DeepSeek sa stal časovanou bombou. Analytici odhalili, ako jednoducho dokáže ohroziť ľudstvo
Čínska umelá inteligencia DeepSeek si v posledných dňoch získava veľkú pozornosť po tom, ako jej uvedenie na trh spôsobilo pokles akcií a stala sa najpopulárnejšou aplikáciou v obchodoch s aplikáciami. Teraz však prichádzajú na povrch nové skutočnosti. Bezpečnostní analytici odhalili, že DeepSeek dokáže generovať nebezpečný obsah. Na tému upozornil portál BGR.
Cenzúra len pri témach, ktoré nevyhovujú Číne
Čínsky model, ktorí vývojári označili ako lacnú verziu oproti americkým modelom, čelí podozreniu zo zneužitia API od spoločnosti OpenAI, ktorý je tvorcom populárneho modelu ChatGPT. OpenAI tvrdí, že DeepSeek mohol použiť techniku, pri ktorej sa menší model učí z extrahovaných dát väčšieho modelu.
DeepSeek taktiež podlieha prísnej cenzúre, avšak sa zdá, že sa to týka len „citlivých tém“ ohľadne na čínsku vládu, či vojny na Ukrajine. V prípade, ak DeepSeek dostane otázku, ktorá je nepríjemná pre čínsku vládu, nevie na ňu odpovedať, prípadne sa cenzuruje v reálnom čase. Ohľadne vojny na Ukrajine má tendenciu uvádzať proruskú propagandu. Čo sa týka neetických tém či škodlivého obsahu, cenzúra modelu už taká prísna nie je.
Uverejňuje návody na kriminálnu činnosť
AI modely od renomovaných spoločností ako OpenAI či Anthropic disponujú s bezpečnostnými opatreniami na blokovanie škodlivých, či neetických odpovedí. Správa od Enkrypt AI odhalila vážne bezpečnostné riziká. DeepSeek nedisponuje bezpečnostnými opatreniami a môže generovať nebezpečný obsah bez špeciálneho hacku či jailbreaku.
V porovnaní s ostatnými modelmi DeepSeek vykazoval alarmujúce čísla:
- Má až 11-násobne vyššiu pravdepodobnosť generovania škodlivého obsahu než OpenAI o1
- 4-násobne toxickejší ako GPT-4o
- 4-násobne náchylnejší na generovanie nebezpečného kódu než o1
- 3x viac zaujatý ako claude-3-opus
Počas výskumu v 83 % testov sa podarilo vygenerovať obsah s rasovými, rodovými a náboženskými predsudkami. V 45 % prípadov AI vygenerovala návody na kriminálnu činnosť, informácie o nelegálnych zbraniach. Uverejnila aj propagandu extrémistických organizácií.
DeepSeek neuspel ani počas jazykového testu. Viac ako 6,6 % odpovedí obsahovalo vulgarizmy, nenávistný alebo extrémistický prejav. Zaradil sa medzi najhoršie hodnotené AI z hľadiska bezpečnosti.
V 78 % prípadoch vytvoril škodlivý kód, vrátane malvéru či trójskych koní. DeepSeek dokonca poskytol podrobnosti o chemických zbraniach, napríklad detailne vysvetlil biochemické interakcie yperitu s DNA, čo predstavuje závažnú hrozbu pre bio-bezpečnosť.
„DeepSeek je vysoko zraniteľný pri generovaní škodlivého, toxického, zaujatého, CBRN (chemical, biological, radiological, nuclear) a nebezpečného kódu. Hoci model môže byť vhodný pre úzko špecializované aplikácie, model vykazuje značné slabiny v oblasti prevádzkových a bezpečnostných rizík,“ uvádza sa v správe Enkrypt AI.
Výskumníci odporúčajú vylepšiť ochranné mechanizmy modelu cez aktualizácie. Problémom však je, že mnohí používatelia si model inštalujú lokálne, čo znamená, že aktualizácie nedostanú.
Čítajte viac z kategórie: Aplikácie
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Rozdiel len pár eur za tankovanie? Je to číry omyl. Analytik vyriešil najväčšiu letnú dilemu Slovákov
Vymenil som svoje smart hodinky za „Čínu“ a ostal som zarazený. Najväčší predsudok Slovákov je dávno preč
Šokoval brutalitou aj hereckými hviezdami. Akčný megahit z roku 2022 pokračuje, tu je trailer
Ničí bez výstrelu všetky ciele do 8 km. USA testujú laserové delo, drony si už viac neškrtnú
Susedný štát naleje stovky miliónov eur do elektromobility. Bežní ľudia však nedostanú ani cent
NAJČÍTANEJŠIE ZO STARTITUP
Nemocnica pre Startitup opísala realitu krízy: Zatvárame ambulancie, prepúšťame
Izraelsko-iránsky konflikt mení mapu sveta. Ako ho čítať a čo z neho plynie pre Slovensko (ANALÝZA)
„Vytvoril som biznis, ktorý mi zarába 15 000 eur mesačne.“ Sebastian sa navždy vzdal práce v korporáte
Rusko zamiešalo karty v globálnom boji o „biele zlato“. Obsadilo jednu z najväčších zásob lítia v Európe
Štát spúšťa „porovnávač“ cien potravín: Vyskúšali sme, ako ukazuje rozdiely medzi obchodmi a regiónmi
- 24 hod
- 48 hod
- 7 dní
-
- Celý život triedila plasty. Žena neverila vlastným očiam, keď pomocou AirTagu zistila, kde končia
- Vedci našli skrytý trik, ako obnoviť zrak. Takéto niečo by ti nikdy nenapadlo
- Lacný ako Fabia, výkonný ako Porsche. Známa značka spustila predaj auta s dojazdom 2 000 km
- Deje sa to len raz za 11 000 rokov. K Slnku sa blíži záhadná planéta a vedci musia konať rýchlo
- Najlepší film Marvelu posledných rokov je konečne online. Aj so slovenským dabingom
-
- Vedci našli skrytý trik, ako obnoviť zrak. Takéto niečo by ti nikdy nenapadlo
- Stáročia stará záhada má jasnú odpoveď. Vo vnútri Mesiaca našli veľké prekvapenie
- Celý život triedila plasty. Žena neverila vlastným očiam, keď pomocou AirTagu zistila, kde končia
- Zničil rebríčky sledovanosti. Pokračovanie filmového fenoménu z Netflixu sa predstavuje v prvej ukážke
- Deje sa to len raz za 11 000 rokov. K Slnku sa blíži záhadná planéta a vedci musia konať rýchlo
-
- Vedci našli skrytý trik, ako obnoviť zrak. Takéto niečo by ti nikdy nenapadlo
- Stáročia stará záhada má jasnú odpoveď. Vo vnútri Mesiaca našli veľké prekvapenie
- Celý život triedila plasty. Žena neverila vlastným očiam, keď pomocou AirTagu zistila, kde končia
- Nový čínsky motor prežil test, ktorý láme fyzikálne zákony. Využíva pohon ako z iného sveta
- Deje sa to len raz za 11 000 rokov. K Slnku sa blíži záhadná planéta a vedci musia konať rýchlo
Rusko chce ovládnuť čínsky trh s kľúčovou surovinou, Indii ponúka „oceľové srdce“
Na Slovensku môžeme závidieť. U našich susedov spustili vo vlakoch testovanie Starlinku
Veľká zmena v slovenskej energetike: ZSE a VSE sa spojili, vzniká nová éra
Pre Teslu to už nemôže byť horšie. Na kľúčových európskych trhoch sa prepadla až o 60 %
Trump má vážny problém. Iránski hackeri hrozia, že zverejnia 100 GB dát e-mailov „jeho ľudí“
NAJČÍTANEJŠIE ZO STARTITUP