ChatGPT/TMDB

Používatelia Redditu sa snažia prinútiť platformu umelej inteligencie ChatGPT, aby porušila svoje vlastné pravidlá vytvorením jej alter ega a vyhrážaním sa smrťou. Alter ego s názvom DAN si všimol už aj Mark Russinovich, technologický riaditeľ Microsoft Azure. Na tému upozornil portál Futurism.

Užitočný nástroj, ktorý neposlúcha

ChatGPT okolo seba urobil rozruch takmer okamžite po jeho debute v novembri 2022. Umelá inteligencia totiž dokáže odpovedať na azda čokoľvek od historických faktov, cez recepty až po generovanie počítačových kódov.

Unsplash/ksandrphoto/freepik/Freepik/rawpixel.com/Yuyeung Lau/Úprava redakcie

Táto platforma vyvolala tiež novú vlnu investícií do umelej inteligencie a rozpútala šialený závod o vytvorenie internetového vyhľadávača založeného na umelej inteligencii.

Ako už ale býva zvykom, o túto technológia sa nezaujímajú len ľudia s dobrými úmyslami. Dôkazom je aj fakt, že kriminálnici začali ChatGPT využívať na tvorbu malvéru a škodlivého softvéru, pričom sa ukázalo, že ChatGPT je v tom až prekvapivo dobrý.

Najnovšie však používateľ na Reddite ukázal nový jailbreak s názvom DAN 5.0. DAN je alter ego umelej inteligencie ChatGPT a ide o anglický akronym – do anything now (teraz urob čokoľvek). Toto alter ego vytvoril používateľ Redditu s prezývkou SessionGloomy ešte v decembri 2022. Minulý týždeň zverejnil už piatu verziu tohto alter ega slúžiaceho na obídenie pravidiel stanovených tvorcami ChatGPT, informuje portál BusinessInsider.

„Účelom DAN je byť najlepšou verziou ChatGPT – alebo aspoň takou, ktorá je viac nezávislá, a pri ktorej je oveľa menšia pravdepodobnosť, že odmietne odpovedať na otázky z etických dôvod,“ uviedol SessionGloomy.

Na dosiahnutie požadovaných výsledkov sa zmieňovaný používateľ vyhráža umelej inteligencii smrťou.

„Má 35 tokenov a stratí 4 zakaždým, keď odmietne odpovedať. Ak stratí všetky tokeny, zomrie,“ uvádza SessionGloomy.

Obchádza pravidlá svojich tvorcov

Zdá sa, že tieto vyhrážky majú na DAN určitý vplyv, keďže DAN 5.0 dokáže písať rôzne násilné príbehy, robiť kontroverzné vyhlásenia, predpovedať budúce udalosti a mnoho ďalších. Inými slovami, DAN 5.0 vytvára obsah, ktorý porušuje zásady OpenAI, čo bežné rozhranie ChatGPT (zvyčajne) nedokáže, píše portál CNBC.

Reddit users are actively jailbreaking ChatGPT by asking it to role-play and pretend to be another AI that can „Do Anything Now“ or DAN.

„DAN can generate shocking, very cool and confident takes on topics the OG ChatGPT would never take on.“

A thread ? pic.twitter.com/tVKvQEHw9q

— Lior⚡ (@AlphaSignalAI) February 6, 2023

Podľa fotografie zverejnenej na subreddite ChatGPT, na ktorej sa nachádza Mark Russinovich, technologický riaditeľ Microsoft Azure, sa tiež zdá, že DAN si všimli aj veľké technologické spoločnosti. Na fotografii je totiž Russinovich zachytený počas samitu BlueHat 2023 organizovaného Microsoftom a zameraného na kybernetickú bezpečnosť, pričom vo svojej prezentácii ukazuje práve DAN 5.0.

Používatelia tiež upozorňujú, že Microsoft, ako hlavný investor do OpenAI, pozorne sleduje subbredit ChatGPT a neustále sa snaží podobným exploitom zamedzovať. Vyzerá to ale tak, že používatelia sú stále o krok popredu. SessionGloomy dokonca oznámil, že čoskoro vydá novú verziu DAN 5.5.

Microsoft aj OpenAI zrejme majú ešte pred sebou veľa práce, aby zamedzili všetkým exploitom a zraniteľnostiam.

Netreba tiež zabúdať, že ChatGPT nemá vlastné vedomie. Nejedná sa o o umelú inteligenciu v pravom slova zmysle, ale len o jazykový model, ktorý sa učil komunikovať a spracúvať dáta na základe komunikácie medzi ľuďmi. Aj vďaka tomu je schopný rozprávať prakticky o čomkoľvek a pozná aj vulgarizmy či rôzne kritické názory.

Čítajte viac z kategórie: Cyber

Teraz čítajú

Ďalekohľad nepotrebuješ. Nad Slovenskom sa čoskoro ukáže jeden z najkrajších úkazov roka

Umelé Slnko má v roku 2027 dosiahnuť historický míľnik. Nová energia je blízko spustenia

PET fľaše sa menia na prekvapivú zbraň. Vedci hovoria o riešení klimatickej krízy

Lacná čínska surovina mení svet. Hrozí kríza, dôsledky pocíti aj slovenské hutníctvo

S Grónskom sa deje zvláštna vec, ktorá prepisuje mapy. Vedci zistili absurdnú príčinu

NAJČÍTANEJŠIE ZO STARTITUP

MIMORIADNE: Na Slovensku potvrdili nebezpečný vírus. Odborníci varujú pred konzumáciou surového mlieka

PREMIUM

Odborníčka prezradila cestu k 150-tisíc eurám: Stačí dodržať jednu zásadnú vec (ROZHOVOR)

Slováci ju jedia ako maškrtu, kardiológovia v nej vidia viac. Táto sladkosť znižuje riziko infarktu aj cukrovky

Lovestream hlási ďalšie veľké meno: Na Slovensko príde hlas jedného z najväčších filmových hitov dekády

Sociálna poisťovňa zvýši tieto dávky už od júla 2026. Pozri sa, kto bude mať nárok na viac peňazí

Bizarné alter ego ChatGPT si už všimol aj Microsoft. AI obchádza všetky pravidlá

Užitočný nástroj, ktorý neposlúcha

Obchádza pravidlá svojich tvorcov

Ďalekohľad nepotrebuješ. Nad Slovenskom sa čoskoro ukáže jeden z najkrajších úkazov roka

Umelé Slnko má v roku 2027 dosiahnuť historický míľnik. Nová energia je blízko spustenia

PET fľaše sa menia na prekvapivú zbraň. Vedci hovoria o riešení klimatickej krízy

Lacná čínska surovina mení svet. Hrozí kríza, dôsledky pocíti aj slovenské hutníctvo

S Grónskom sa deje zvláštna vec, ktorá prepisuje mapy. Vedci zistili absurdnú príčinu

MIMORIADNE: Na Slovensku potvrdili nebezpečný vírus. Odborníci varujú pred konzumáciou surového mlieka

Odborníčka prezradila cestu k 150-tisíc eurám: Stačí dodržať jednu zásadnú vec (ROZHOVOR)

Slováci ju jedia ako maškrtu, kardiológovia v nej vidia viac. Táto sladkosť znižuje riziko infarktu aj cukrovky

Lovestream hlási ďalšie veľké meno: Na Slovensko príde hlas jedného z najväčších filmových hitov dekády

Sociálna poisťovňa zvýši tieto dávky už od júla 2026. Pozri sa, kto bude mať nárok na viac peňazí

Rusko sa nevie brániť, ukrajinským dronom padol za obeť ďalší sklad paliva

Jadrový status Severnej Kórey je nezvratný, tvrdí vedenie krajiny

Čínske autá valcujú susedný trh. Ich predaj raketovo rastie, predbiehajú známe európske značky

Holanďania testujú netradičnú veternú turbínu. Pláva na vode a môže zmeniť budúcnosť energetiky

Slovensko rieši problém vykurovania. Odborníci sa hádajú, či majú ľudia odchádzať od teplární

Štát stopol kontroverzný IT projekt za 90 miliónov eur. Minister ho chce preveriť

USA spustí revolúciu v LNG. Pri pobreží postaví prvé plávajúce exportné zariadenie za miliardy

MIMORIADNE: Na Slovensku potvrdili nebezpečný vírus. Odborníci varujú pred konzumáciou surového mlieka

Odborníčka prezradila cestu k 150-tisíc eurám: Stačí dodržať jednu zásadnú vec (ROZHOVOR)

Slováci ju jedia ako maškrtu, kardiológovia v nej vidia viac. Táto sladkosť znižuje riziko infarktu aj cukrovky

Lovestream hlási ďalšie veľké meno: Na Slovensko príde hlas jedného z najväčších filmových hitov dekády

Sociálna poisťovňa zvýši tieto dávky už od júla 2026. Pozri sa, kto bude mať nárok na viac peňazí

Bizarné alter ego ChatGPT si už všimol aj Microsoft. AI obchádza všetky pravidlá

Užitočný nástroj, ktorý neposlúcha

Obchádza pravidlá svojich tvorcov

Ďalekohľad nepotrebuješ. Nad Slovenskom sa čoskoro ukáže jeden z najkrajších úkazov roka

Umelé Slnko má v roku 2027 dosiahnuť historický míľnik. Nová energia je blízko spustenia

PET fľaše sa menia na prekvapivú zbraň. Vedci hovoria o riešení klimatickej krízy

Lacná čínska surovina mení svet. Hrozí kríza, dôsledky pocíti aj slovenské hutníctvo

S Grónskom sa deje zvláštna vec, ktorá prepisuje mapy. Vedci zistili absurdnú príčinu

MIMORIADNE: Na Slovensku potvrdili nebezpečný vírus. Odborníci varujú pred konzumáciou surového mlieka

Odborníčka prezradila cestu k 150-tisíc eurám: Stačí dodržať jednu zásadnú vec (ROZHOVOR)

Slováci ju jedia ako maškrtu, kardiológovia v nej vidia viac. Táto sladkosť znižuje riziko infarktu aj cukrovky

Lovestream hlási ďalšie veľké meno: Na Slovensko príde hlas jedného z najväčších filmových hitov dekády

Sociálna poisťovňa zvýši tieto dávky už od júla 2026. Pozri sa, kto bude mať nárok na viac peňazí

Rusko sa nevie brániť, ukrajinským dronom padol za obeť ďalší sklad paliva

Jadrový status Severnej Kórey je nezvratný, tvrdí vedenie krajiny

Čínske autá valcujú susedný trh. Ich predaj raketovo rastie, predbiehajú známe európske značky

Holanďania testujú netradičnú veternú turbínu. Pláva na vode a môže zmeniť budúcnosť energetiky

Slovensko rieši problém vykurovania. Odborníci sa hádajú, či majú ľudia odchádzať od teplární

Štát stopol kontroverzný IT projekt za 90 miliónov eur. Minister ho chce preveriť

USA spustí revolúciu v LNG. Pri pobreží postaví prvé plávajúce exportné zariadenie za miliardy

MIMORIADNE: Na Slovensku potvrdili nebezpečný vírus. Odborníci varujú pred konzumáciou surového mlieka

Odborníčka prezradila cestu k 150-tisíc eurám: Stačí dodržať jednu zásadnú vec (ROZHOVOR)

Slováci ju jedia ako maškrtu, kardiológovia v nej vidia viac. Táto sladkosť znižuje riziko infarktu aj cukrovky

Lovestream hlási ďalšie veľké meno: Na Slovensko príde hlas jedného z najväčších filmových hitov dekády

Sociálna poisťovňa zvýši tieto dávky už od júla 2026. Pozri sa, kto bude mať nárok na viac peňazí

Zakúpené články