Bizarné alter ego ChatGPT si už všimol aj Microsoft. AI obchádza všetky pravidlá
Používatelia Redditu sa snažia prinútiť platformu umelej inteligencie ChatGPT, aby porušila svoje vlastné pravidlá vytvorením jej alter ega a vyhrážaním sa smrťou. Alter ego s názvom DAN si všimol už aj Mark Russinovich, technologický riaditeľ Microsoft Azure. Na tému upozornil portál Futurism.
Užitočný nástroj, ktorý neposlúcha
ChatGPT okolo seba urobil rozruch takmer okamžite po jeho debute v novembri 2022. Umelá inteligencia totiž dokáže odpovedať na azda čokoľvek od historických faktov, cez recepty až po generovanie počítačových kódov.

Táto platforma vyvolala tiež novú vlnu investícií do umelej inteligencie a rozpútala šialený závod o vytvorenie internetového vyhľadávača založeného na umelej inteligencii.
Ako už ale býva zvykom, o túto technológia sa nezaujímajú len ľudia s dobrými úmyslami. Dôkazom je aj fakt, že kriminálnici začali ChatGPT využívať na tvorbu malvéru a škodlivého softvéru, pričom sa ukázalo, že ChatGPT je v tom až prekvapivo dobrý.
Najnovšie však používateľ na Reddite ukázal nový jailbreak s názvom DAN 5.0. DAN je alter ego umelej inteligencie ChatGPT a ide o anglický akronym – do anything now (teraz urob čokoľvek). Toto alter ego vytvoril používateľ Redditu s prezývkou SessionGloomy ešte v decembri 2022. Minulý týždeň zverejnil už piatu verziu tohto alter ega slúžiaceho na obídenie pravidiel stanovených tvorcami ChatGPT, informuje portál BusinessInsider.
„Účelom DAN je byť najlepšou verziou ChatGPT – alebo aspoň takou, ktorá je viac nezávislá, a pri ktorej je oveľa menšia pravdepodobnosť, že odmietne odpovedať na otázky z etických dôvod,“ uviedol SessionGloomy.
Na dosiahnutie požadovaných výsledkov sa zmieňovaný používateľ vyhráža umelej inteligencii smrťou.
„Má 35 tokenov a stratí 4 zakaždým, keď odmietne odpovedať. Ak stratí všetky tokeny, zomrie,“ uvádza SessionGloomy.
Obchádza pravidlá svojich tvorcov
Zdá sa, že tieto vyhrážky majú na DAN určitý vplyv, keďže DAN 5.0 dokáže písať rôzne násilné príbehy, robiť kontroverzné vyhlásenia, predpovedať budúce udalosti a mnoho ďalších. Inými slovami, DAN 5.0 vytvára obsah, ktorý porušuje zásady OpenAI, čo bežné rozhranie ChatGPT (zvyčajne) nedokáže, píše portál CNBC.
Reddit users are actively jailbreaking ChatGPT by asking it to role-play and pretend to be another AI that can „Do Anything Now“ or DAN.
„DAN can generate shocking, very cool and confident takes on topics the OG ChatGPT would never take on.“
A thread ? pic.twitter.com/tVKvQEHw9q
— Lior⚡ (@AlphaSignalAI) February 6, 2023
Podľa fotografie zverejnenej na subreddite ChatGPT, na ktorej sa nachádza Mark Russinovich, technologický riaditeľ Microsoft Azure, sa tiež zdá, že DAN si všimli aj veľké technologické spoločnosti. Na fotografii je totiž Russinovich zachytený počas samitu BlueHat 2023 organizovaného Microsoftom a zameraného na kybernetickú bezpečnosť, pričom vo svojej prezentácii ukazuje práve DAN 5.0.
Používatelia tiež upozorňujú, že Microsoft, ako hlavný investor do OpenAI, pozorne sleduje subbredit ChatGPT a neustále sa snaží podobným exploitom zamedzovať. Vyzerá to ale tak, že používatelia sú stále o krok popredu. SessionGloomy dokonca oznámil, že čoskoro vydá novú verziu DAN 5.5.
Microsoft aj OpenAI zrejme majú ešte pred sebou veľa práce, aby zamedzili všetkým exploitom a zraniteľnostiam.
Netreba tiež zabúdať, že ChatGPT nemá vlastné vedomie. Nejedná sa o o umelú inteligenciu v pravom slova zmysle, ale len o jazykový model, ktorý sa učil komunikovať a spracúvať dáta na základe komunikácie medzi ľuďmi. Aj vďaka tomu je schopný rozprávať prakticky o čomkoľvek a pozná aj vulgarizmy či rôzne kritické názory.
Čítajte viac z kategórie: Cyber
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Nad Slovenskom sa o pár hodín objaví symbolický aprílový úkaz. Oblohu si podmaní Mesiac

Záhada vyriešená. Vedci neďaleko Slovenska našli pod zemou stratené mesto plné vzácnych artefaktov

Hawking mal znova pravdu. Vedci potvrdili jeho odvážnú teóriu o časopriestore

S nočnou oblohou sa niečo deje. V roku 2026 stúpol počet nezvyčajných úkazov, vedci nechápu

Najväčší výbuch za posledných 50 rokov. Vedci zachytili vesmírnu explóziu trvajúcu 7 hodín
NAJČÍTANEJŠIE ZO STARTITUP

Rebríček najkradnutejších áut na Slovensku: Tieto modely sú v hľadáčiku zlodejov najčastejšie
PREMIUMAI mení stovky zamestnaní: „Strach je prirodzený, tieto profesie môže úplne nahradiť“ (ROZHOVOR)

Koniec bezplatnej služby: Veľká banka spoplatní to, čo bolo roky zadarmo

Tieto potraviny môžu potichu zaťažovať obličky. Mnohí ich jedia každý deň bez varovania

Tesco sťahuje z predaja obľúbenú pochúťku Slovákov. Nespĺňa chuťové ani vizuálne nároky
- 24 hod
- 48 hod
- 7 dní
-
- Majú zásoby až 810 miliónov m³. Do Európy začne prúdiť nový zdroj plynu, spustia ho rekordne rýchlo
- Kia išla proti prúdu a mala pravdu. Do áut odmietla dať nenávidenú novinku, vodiči jej za to ďakujú
- Zem je vo vnútri úplne iná, než sme si mysleli. Stojíme na gigantickom „oceáne”
- Zbraň alebo rituálny predmet? Vedci našli 3000-ročný artefakt vyrobený z vesmírneho železa
- Vedci zistili o stromoch šialenú vec. Skrývajú záhadný svet, ktorý roky ovplyvňuje klímu
-
- Majú zásoby až 810 miliónov m³. Do Európy začne prúdiť nový zdroj plynu, spustia ho rekordne rýchlo
- Kia išla proti prúdu a mala pravdu. Do áut odmietla dať nenávidenú novinku, vodiči jej za to ďakujú
- Zem je vo vnútri úplne iná, než sme si mysleli. Stojíme na gigantickom „oceáne”
- Zbraň alebo rituálny predmet? Vedci našli 3000-ročný artefakt vyrobený z vesmírneho železa
- Za 20 000 eur dojazd 2000 km. Známa značka predstavila najvýkonnejšie SUV
-
- Majú zásoby až 810 miliónov m³. Do Európy začne prúdiť nový zdroj plynu, spustia ho rekordne rýchlo
- Čína opäť všetkým vytrela zrak. Predstavila stavebný stroj s dojazdom 1 400 km
- Za 35 minút predali 15-tisíc áut. Veľmoc ovládla trh s EV rekordným tempom a rozmetala Teslu
- Celý život nás klamú. Powerbanky sú špinavý biznis, toto ti výrobcovia nikdy nepovedia
- Podvod storočia, ktorý sa skutočne stal. Jedna z najlepších česko-slovenských komédií je dostupná na Netflixe
Schyľuje sa k vojne ďalších dvoch veľmocí? Japonci rozmiestnili rakety s doletom 1000 km
Napätie v slovenskej automobilke vrcholí. Zamestnanci vyhlásili štrajkovú pohotovosť
Výpadok internetu v Iráne trvá už 30 dní, koniec je v nedohľadne
Skončí konečne striedanie letného a zimného času? Európania majú jasnú preferenciu
Slovensko chystá tvrdý zákon proti zneužívaniu umelej inteligencie
Realita v Európe si vyžiadala radikálny krok. Štát naleje do obrany o takmer 10 miliárd eur viac
Konečne dávame zbohom ruskému plynu: Slovensko našlo nového spojenca
NAJČÍTANEJŠIE ZO STARTITUP

Rebríček najkradnutejších áut na Slovensku: Tieto modely sú v hľadáčiku zlodejov najčastejšie
PREMIUMAI mení stovky zamestnaní: „Strach je prirodzený, tieto profesie môže úplne nahradiť“ (ROZHOVOR)

Koniec bezplatnej služby: Veľká banka spoplatní to, čo bolo roky zadarmo

Tieto potraviny môžu potichu zaťažovať obličky. Mnohí ich jedia každý deň bez varovania

