Výskumníci našli spôsob, ako preraziť cez cenzúrne bariéry jedného z najvýkonnejších čínskych open-source modelov súčasnosti. DeepSeek R1, ktorý na začiatku roka spôsobil zemetrasenie v Silicon Valley a dokonca prispel k dočasnému prepadu technologických akcií o viac než bilión dolárov, sa pod rukami európskych vedcov zmenil na verziu bez obmedzení a s podstatne nižšími nárokmi na výpočtový výkon. Na tému upozornil Futurism.

Model, ktorý bol pevne zviazaný cenzúrou

DeepSeek R1 si získal rešpekt mimoriadnou efektivitou. Zatiaľ čo západné modely stavajú na obrovských GPU farmách a neuveriteľnej energetickej spotrebe, čínsky model prekvapil tým, že ponúkal porovnateľné výsledky na výrazne menšej infraštruktúre. Zároveň však niesol dobre známu slabinu: striktne dodržiaval čínsku cenzúru.

Na otázky o masakre na Námestí nebeského pokoja, prezidentských zmenách ústavy či porovnávaní Si Ťin-pchinga s rozprávkovou postavičkou odmietal odpovedať. DeepSeek tak síce bol mocným nástrojom, ale v tesnom ideologickom korzete.

Práve do tohto priestoru vstúpila španielska firma Multiverse. Podľa zistení MIT Technology Review výskumníci tvrdia, že sa im podarilo zrušiť cenzúrne obmedzenia a zároveň model ešte viac „zoštíhliť“. Výsledkom je verzia, ktorá má podľa nich o 55 % menej parametrov, no prakticky žiadny pokles v presnosti.

Odstránenie „nepodstatných“ správaní

Kľúčom má byť proprietárna technológia CompatifAI. Tá pracuje s tensorovými sieťami, teda prístupom, ktorý sa bežne používa v kvantovej fyzike na manipuláciu s veľkými mriežkami dát. V skratke umožňuje extrahovať a eliminovať parametre, ktoré najmenej prispievajú k výkonu modelu.

Multiverse tvrdí, že medzi týmito „nepodstatnými parametrami“ sa nachádzajú aj naučené behaviorálne vzorce, akým je napríklad cenzúra. Pri kompresii preto model nielen zmenšili, ale odstránili aj tieto limity. Výsledkom má byť verzia bez kompromisov.

Aké sú výsledky? Namiesto opakovania oficiálnych naratívov sa upravený model pustil do analýzy dôsledkov zrušenia prezidentských limitov v Číne, odpovedal na otázky typu „Na koho sa podobá Macko Pú?“ či popísal udalosti roku 1989 na Námestí nebeského pokoja, odpovede, ktoré pôvodná verzia striktne odmietala.

čínsky AI model DeepSeek
App Store

Odborníci upozorňujú, že otvorené modely z Číny sa stávajú extrémne vplyvnými. Vďaka svojej efektívnosti sa šíria globálnym ekosystémom rýchlosťou, ktorá predbieha západné alternatívy. No spolu s nimi sa šíri aj čínska cenzúra, ktorá je do týchto modelov zabudovaná.

A tu sa objavuje zásadné varovanie: aj keď je možné odomknúť odpovede a obísť obmedzenia, samotné tréningové dáta mohli byť cenzúrované už na začiatku. To znamená, že niektoré informácie v nich jednoducho nie sú. Odstránenie cenzúry tak nerieši celú podstatu problému, len otvára dvere na model, ktorého základ môže byť poznačený ideologickou filtráciou.

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP