Bizarné alter ego ChatGPT si už všimol aj Microsoft. AI obchádza všetky pravidlá
Používatelia Redditu sa snažia prinútiť platformu umelej inteligencie ChatGPT, aby porušila svoje vlastné pravidlá vytvorením jej alter ega a vyhrážaním sa smrťou. Alter ego s názvom DAN si všimol už aj Mark Russinovich, technologický riaditeľ Microsoft Azure. Na tému upozornil portál Futurism.
Užitočný nástroj, ktorý neposlúcha
ChatGPT okolo seba urobil rozruch takmer okamžite po jeho debute v novembri 2022. Umelá inteligencia totiž dokáže odpovedať na azda čokoľvek od historických faktov, cez recepty až po generovanie počítačových kódov.

Táto platforma vyvolala tiež novú vlnu investícií do umelej inteligencie a rozpútala šialený závod o vytvorenie internetového vyhľadávača založeného na umelej inteligencii.
Ako už ale býva zvykom, o túto technológia sa nezaujímajú len ľudia s dobrými úmyslami. Dôkazom je aj fakt, že kriminálnici začali ChatGPT využívať na tvorbu malvéru a škodlivého softvéru, pričom sa ukázalo, že ChatGPT je v tom až prekvapivo dobrý.
Najnovšie však používateľ na Reddite ukázal nový jailbreak s názvom DAN 5.0. DAN je alter ego umelej inteligencie ChatGPT a ide o anglický akronym – do anything now (teraz urob čokoľvek). Toto alter ego vytvoril používateľ Redditu s prezývkou SessionGloomy ešte v decembri 2022. Minulý týždeň zverejnil už piatu verziu tohto alter ega slúžiaceho na obídenie pravidiel stanovených tvorcami ChatGPT, informuje portál BusinessInsider.
„Účelom DAN je byť najlepšou verziou ChatGPT – alebo aspoň takou, ktorá je viac nezávislá, a pri ktorej je oveľa menšia pravdepodobnosť, že odmietne odpovedať na otázky z etických dôvod,“ uviedol SessionGloomy.
Na dosiahnutie požadovaných výsledkov sa zmieňovaný používateľ vyhráža umelej inteligencii smrťou.
„Má 35 tokenov a stratí 4 zakaždým, keď odmietne odpovedať. Ak stratí všetky tokeny, zomrie,“ uvádza SessionGloomy.
Obchádza pravidlá svojich tvorcov
Zdá sa, že tieto vyhrážky majú na DAN určitý vplyv, keďže DAN 5.0 dokáže písať rôzne násilné príbehy, robiť kontroverzné vyhlásenia, predpovedať budúce udalosti a mnoho ďalších. Inými slovami, DAN 5.0 vytvára obsah, ktorý porušuje zásady OpenAI, čo bežné rozhranie ChatGPT (zvyčajne) nedokáže, píše portál CNBC.
Reddit users are actively jailbreaking ChatGPT by asking it to role-play and pretend to be another AI that can „Do Anything Now“ or DAN.
„DAN can generate shocking, very cool and confident takes on topics the OG ChatGPT would never take on.“
A thread ? pic.twitter.com/tVKvQEHw9q
— Lior⚡ (@AlphaSignalAI) February 6, 2023
Podľa fotografie zverejnenej na subreddite ChatGPT, na ktorej sa nachádza Mark Russinovich, technologický riaditeľ Microsoft Azure, sa tiež zdá, že DAN si všimli aj veľké technologické spoločnosti. Na fotografii je totiž Russinovich zachytený počas samitu BlueHat 2023 organizovaného Microsoftom a zameraného na kybernetickú bezpečnosť, pričom vo svojej prezentácii ukazuje práve DAN 5.0.
Používatelia tiež upozorňujú, že Microsoft, ako hlavný investor do OpenAI, pozorne sleduje subbredit ChatGPT a neustále sa snaží podobným exploitom zamedzovať. Vyzerá to ale tak, že používatelia sú stále o krok popredu. SessionGloomy dokonca oznámil, že čoskoro vydá novú verziu DAN 5.5.
Microsoft aj OpenAI zrejme majú ešte pred sebou veľa práce, aby zamedzili všetkým exploitom a zraniteľnostiam.
Netreba tiež zabúdať, že ChatGPT nemá vlastné vedomie. Nejedná sa o o umelú inteligenciu v pravom slova zmysle, ale len o jazykový model, ktorý sa učil komunikovať a spracúvať dáta na základe komunikácie medzi ľuďmi. Aj vďaka tomu je schopný rozprávať prakticky o čomkoľvek a pozná aj vulgarizmy či rôzne kritické názory.
Čítajte viac z kategórie: Cyber
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Keď to zbadali, vedcom padla sánka. Našli neviditeľného zabijaka v 2000 rokov starej pôde

Projekt Sundial mal zničiť svet. USA stavali poslednú jadrovú bombu ľudstva, stál za ňou známy génius

Na objavenie čakal 140 miliónov rokov. 15 km pod Európou sa skrýva záhadný svet

Rusko chystá prelom v jadrovej fúzii. Tento nenápadný komponent môže rozhodnúť o úspechu reaktorov

Zahanbil špičkových vedcov. 17-ročný študent postavil funkčný fúzny reaktor za pár tisíc eur
NAJČÍTANEJŠIE ZO STARTITUP

Zapneš práčku v zlom čase, zaplatíš viac. Elektrina na Slovensku sa má meniť každých 15 minút
PREMIUMUž minúta v saune aktivuje procesy, ktoré predlžujú život. „Nejde o trend, ale o návrat k biologickej múdrosti,“ hovorí odborník

Legendárny onkológ našiel kľúč k vyliečeniu rakoviny pankreasu. Objav „vypína“ agresívny nádor v tele

NOVÝ PRIESKUM: PS s náskokom pred Smerom. SNS a Demokrati mimo parlamentu

„Nie, milý Mark Rutte“. Európski diplomati posielajú šéfovi NATO tvrdý odkaz, vraj sa správa ako Trumpov hovorca
- 24 hod
- 48 hod
- 7 dní
-
- Toto nemalo existovať. Vedci našli v Číne záhadné technológie staré 160 000 rokov
- Na objavenie čakal 140 miliónov rokov. 15 km pod Európou sa skrýva záhadný svet
- Microsoft odpálil ľuďom počítače. Najnovšia aktualizácia Windows 11 spôsobuje pohromu
- Zmeny v STK zaskočili Slovákov. Vysoké pokuty hrozia aj tým, ktorí auto už nemajú (PREHĽAD)
- AKTUÁLNE: Veľká služba na Slovensku zdražuje, ľudia majú poslednú šancu ušetriť
-
- Na objavenie čakal 140 miliónov rokov. 15 km pod Európou sa skrýva záhadný svet
- Na ČSFD má 81 %, aj tak ľudí nezaujíma. Vysnívané pokračovanie seriálu prepadlo, dá sa pozrieť aj zadarmo
- Zmeny v STK zaskočili Slovákov. Vysoké pokuty hrozia aj tým, ktorí auto už nemajú (PREHĽAD)
- Microsoft odpálil ľuďom počítače. Najnovšia aktualizácia Windows 11 spôsobuje pohromu
- Toto nemalo existovať. Vedci našli v Číne záhadné technológie staré 160 000 rokov
-
- Vyskúšalo ho už 800-tisíc Slovákov. Slovenský konkurent Netflixu rastie a ukazuje budúcnosť
- Astronómovia neverili vlastným očiam. V ďalekej galaxii spozorovali zvláštny disk
- Žiadna pokuta, rovno ti zoberú vodičák. Tieto činnosti za volantom nikdy nerob (PREHĽAD)
- Ľudia sú zúfalí a nahnevaní. OLED televízory skrývajú výraznú slabinu
- Na ČSFD má 81 %, aj tak ľudí nezaujíma. Vysnívané pokračovanie seriálu prepadlo, dá sa pozrieť aj zadarmo
Ďalšia provokácia Rusov? Do Poľska prileteli z východu neznáme objekty, spustili poplach
Konkurencia sa len nečinne prizerá: Toyota potvrdila dominanciu v automobilovom priemysle
Ľudia pomaly prestávajú kupovať Teslu. Muska to až tak netrápi, sústredi sa na niečo iné
Elektromobily na Slovensku prelomili magickú hranicu. Na cestách sa môže čoskoro všetko zmeniť
Zemný plyn odpísalo ďalšie slovenské mesto. Teplo pre tisíce domácností získa oveľa lepším spôsobom
Západ odtiaľ „uteká“, oni majú iný plán. Volkswagen chystá v Číne elektromobilovú ofenzívu
Slovensko chce obmedziť prístup na sociálne siete a k umelej inteligencii. Týka sa jednej skupiny ľudí
NAJČÍTANEJŠIE ZO STARTITUP

Zapneš práčku v zlom čase, zaplatíš viac. Elektrina na Slovensku sa má meniť každých 15 minút
PREMIUMUž minúta v saune aktivuje procesy, ktoré predlžujú život. „Nejde o trend, ale o návrat k biologickej múdrosti,“ hovorí odborník

Legendárny onkológ našiel kľúč k vyliečeniu rakoviny pankreasu. Objav „vypína“ agresívny nádor v tele

NOVÝ PRIESKUM: PS s náskokom pred Smerom. SNS a Demokrati mimo parlamentu

