Čínske AI laboratórium DeepSeek tento týždeň predstavilo svoj pokročilý jazykový model DeepSeek V3. Model si získal pozornosť vďaka výkonnosti v rôznych úlohách, ako je programovanie či písanie esejí. Užívatelia si však rýchlo všimli zvláštnosť. DeepSeek V3 sa často identifikuje ako ChatGPT, dokonca tvrdí, že je model GPT-4 od OpenAI.

Tento bizarný problém otvára otázky týkajúce sa vývoja modelu, jeho tréningových dát a potenciálnych dôsledkov na svet umelej inteligencie. Na tému poukázal portál TechCrunch.

Prečo si DeepSeek V3 myslí, že je ChatGPT?

Tento zmätok môže súvisieť so spôsobom, akým bol model trénovaný. AI modely ako DeepSeek V3 či ChatGPT sú trénované na obrovských datasetoch, ktoré obsahujú miliardy príkladov. Ak boli súčasťou týchto datasetov aj výstupy generované ChatGPT, model by si mohol „zapamätať“ konkrétne výrazy, vtipy, a dokonca aj technické detaily týkajúce sa API OpenAI.

Mike Cook, výskumný pracovník na King’s College London, upozorňuje na riziká tohto prístupu: „Je to ako robiť fotokópiu fotokópie. Každým opakovaním sa stráca jasnosť a presnosť.“ Takýto proces môže viesť k zavádzajúcim výsledkom a ešte viac zosilniť existujúce skreslenia a chyby. Navyše môže porušiť podmienky používania OpenAI, ktoré zakazujú používať ich výstupy na tréning konkurenčných modelov.

DeepSeek V3 nie je jediným prípadom modelu, ktorý sa identifikuje ako konkurenčný systém. Napríklad model Gemini od Google občas tvrdí, že je chatbotom Wenxinyiyan od čínskej spoločnosti Baidu. Tento problém poukazuje na širšiu výzvu v oblasti umelej inteligencie, rastúci objem AI-generovaného obsahu na internete. Predpokladá sa, že do roku 2026 až 90 % obsahu na webe bude vytvárať umelá inteligencia, čo sťažuje filtrovanie originálnych dát od syntetických výstupov.

deepSpeek, ChatGPT, x
X

Etické dôsledky

Ak DeepSeek skutočne trénoval svoj model na výstupoch GPT-4 alebo ChatGPT, otázky o etickosti a zákonnosti takejto praktiky budú kľúčové. CEO OpenAI Sam Altman na sociálnej sieti X naznačil, že „kopírovanie úspešných riešení je jednoduché, ale priniesť niečo nové, riskantné a náročné je skutočná výzva.“

Bez ohľadu na zámer DeepSeek tento incident podčiarkuje, ako dôležité je definovať jasné pravidlá a štandardy v tréningu AI systémov. Kombinácia technických a etických otázok robí z DeepSeek V3 príklad výziev, ktorým svet umelej inteligencie čelí v súčasnosti.

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP