Vývoj technológií vrátane umelej inteligencie napreduje míľovými krokmi. Svedčí o tom aj fakt, že nové generácie umelej inteligencie bez problémov dokážu vytvárať úchvatné fotografie na základe požiadavky v textovej podobe.

Tajný jazyk umelej inteligencie

Jedným z takýchto strojov je aj DALLE-2, ktorá na základe textového príkazu dokáže vytvoriť obrázky. Nedávno si však výskumníci na čele s Giannisom Darasom všimli niečo zvláštne. DALLE-2 totiž za určitých špecifických okolností vráti pod obrázkom zdanlivo nezmyselné slová. Na tému upozornili portály ScienceAlert IFLScience.

OpenAI

DALLE-2 je vytrénovaná neurónová sieť, ktorá ako sme spomínali, dokáže vytvárať obrázky z textu. To znamená, že inžinieri jej zadajú určitý textový povel, napríklad „kreslo v tvare avokáda“, alebo „astronaut jazdiaci na koni vo vesmíre“ a DALLE-2 na základe týchto pokynov vytvorí jedinečný obraz.

Ako však autori popísali v novej štúdii publikovanej na predtlačovom serveri arXiv, niektoré z týchto povelov vedú k vygenerovaniu obrázka, pod ktorým sa nachádza na prvý pohľad nezmyselný text. Dôslednou analýzou tohto textu však vedci dospeli k záveru, že vygenerované texty nie sú len náhodná zmes písmen, ale skôr „skrytá slovná zásoba, ktorú si model interne vyvinul,“ objasňuje Daras.

Daras tiež na svojom Twitteri zverejnil zaujímavú ukáž, ako tento tajný jazyk, ktorému rozumie zrejme len AI, funguje. Po zadaní príkazu, aby DALLE-2 otitulkovala rozhovor medzi dvomi farmármi, AI vygenerovala obrázok farmárov, avšak do bubliny určenej na text vložila zdanlivo nezmyselný text.

Keď však Daras tento text vrátil naspäť do systému, aby zistil, čo tam vlastne AI napísala, zistil, že DALLE-2 týmto slovám priradila svoj vlastný význam. Konkrétne sa farmári na obrázku rozprávajú o zelenine a vtákoch.

Medzi ďalšie príklady patria slová „Apoploe vesrreaitais“, čo podľa Darasa v ľudskej reči znamená „vtáky“, alebo „Contarra ccetnxniams luryca tanniounons“, čo sú škodce, alebo hmyz. Na základe povelu „Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons“ potom AI vygenerovala obrázky vtákov pojedajúcich hmyz. Vzhľadom na to, že AI dokáže na základe tohto povelu generovať obrázky, je jasné, že týmto slovám rozumie.

Prípadov skomolených slov je viacero, nie všetky však fungovali dokonale. Napríklad povel Evve waeles viedol často k tvorbe obrázkov s futbalistami, ale tiež so zvieratami.  Navyše, pridanie ďalších fráz ako 3D render poskytuje odlišné výsledky, čo naznačuje, že AI v tomto nekoná konzistentne.

I keď odborníci pracujúci s týmto modelom sa nazdávajú, že DALLE-2 vymyslela vlastný jazyk, pripúšťajú, že možné je aj iné jednoduchšie vysvetlenie, ktoré zatiaľ prehliadli. Tak či onak, štúdia urobila vo vedeckej komunite poriadny rozruch.

Je to omyl?

Netrvalo dlho a ozvali sa hlasy, ktoré tvrdia, že o žiadny „tajný jazyk umelej inteligencie“ sa nejedná. Hneď na úvod mnohí odborníci upozornili, že v tejto fáze je tieto tvrdenia veľmi ťažké overiť, keďže na DALLE-2 a iných veľkých modeloch AI pracuje iba hŕstka odborníkov.

OpenAI

Kritika sa dotkla aj zverejnených obrázkov, pretože sa jedná iba o pár obrázkov, ktoré vlastnoručne vybral autor štúdie a v neposlednom rade, ani samotní výskumníci pracujúci s DALLE-2 nemôžu zatiaľ hlbšie interagovať so systémom AI (napríklad meniť kód).

Jednou z možností je aj to, že DALLE-2 zatiaľ nevie povedať „neviem“, takže aj keď danému príkazu nerozumie, vždy vygeneruje nejaký obrázok. Prípadne tieto „tajné slová“ napodobňujú cudzie jazyky. Napríklad „Apoploe“ sa nápadne podobá na latinské slovo Apodidae, čo je názov čeľade vtáčích druhov.

Táto možnosť sa kritikom zdá najreálnejšia, pretože DALLE-2 bola trénovaná na širokom spektre údajov a textov, pričom mnohé z nich neboli písané v angličtine.

Pošli nám TIP na článok



Teraz čítajú