Predbehol angličtinu a rozumejú mu aj Slováci. Sused Slovenska má najpresnejší jazyk pre komunikáciu s AI
V tomto texte boli použité materiály TASR.
Nový výskum americkej Marylandskej univerzity v Baltimore v spolupráci so spoločnosťou Microsoft priniesol prekvapivé zistenie – najpresnejším jazykom na komunikáciu s umelou inteligenciou je poľština. V rámci rozsiahleho porovnania 26 jazykov si tento západoslovanský jazyk odniesol prvé miesto, čím predbehol francúzštinu, taliančinu aj angličtinu, ktorá skončila až šiesta.
Výskum mení predstavy
Štúdia s názvom „One ruler to measure them all: Benchmarking multilingual long-context language models“ bola predstavená ako súčasť nového benchmarku OneRuler, ktorý testuje, ako dobre veľké jazykové modely (LLM) dokážu spracovávať dlhé textové vstupy. Výsledky ukazujú, že poľština dosiahla priemernú úspešnosť 88 %, zatiaľ čo angličtina len necelých 84 %.
Na prvý pohľad ide o paradox, pretože väčšina AI modelov je trénovaná práve na anglických dátach, ktoré tvoria najväčší objem dostupného textového materiálu. Napriek tomu si poľština viedla lepšie aj než čínština – jazyk s obrovským množstvom tréningových dát, ktorá však v rebríčku skončila až štvrtá od konca s výsledkom 62 %.
Poľština ako ideálny jazyk pre komplexné otázky
Výskum analyzoval sedem typov úloh rozdelených do dvoch kategórií – vyhľadávanie a agregáciu informácií – pričom testy prebiehali pri rôznych dĺžkach kontextu, od 8 000 až po 128 000 tokenov. Z výsledkov vyplynulo, že čím dlhší je textový vstup, tým viac sa prehlbuje rozdiel medzi vysokozdrojovými jazykmi (ako angličtina či francúzština) a nízkozdrojovými jazykmi (napr. swahilčina alebo sothčina).
Kým pri krátkych textoch bol rozdiel vo výkonnosti modelov okolo 11 %, pri najdlhších sa prehĺbil až na 34 %. Poľština sa však vymyká tejto logike. Napriek menšiemu objemu tréningových dát sa ukázala ako jazyk, v ktorom modely robia menej chýb, dávajú presnejšie odpovede a lepšie zvládajú analýzu rozsiahlych textov.
Autori výskumu vysvetľujú tento fenomén jazykovou štruktúrou poľštiny, ktorá obsahuje množstvo ohybov a gramatických väzieb, nútiacich modely k presnejšiemu pochopeniu kontextu. „Poľština sa ukázala ako najvhodnejší jazyk na tzv. promptovanie – zadávanie dlhých a komplexných otázok umelej inteligencii,“ uvádzajú vedci v štúdii.
AI výskum dostáva nový smer
Objav z Marylandskej univerzity a Microsoftu tak spochybňuje doterajšie predstavy o jazykovej dominancii v AI svete. Ak sa potvrdí, že niektoré jazyky prirodzene „ladia“ s mechanizmami jazykových modelov lepšie než iné, mohlo by to zásadne ovplyvniť spôsob, akým sa AI bude učiť spracovávať viacjazyčné dáta.
Pre vývojárov to môže znamenať nový impulz na optimalizáciu modelov nielen pre dominantné jazyky, ale aj pre tie, ktoré dokážu umelú inteligenciu viesť k presnejším a logickejším odpovediam.
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

100 rokov ležal v zásuvke. Zabudnutý meteorit odhalil tajomstvo života na Marse

Má 2 000 rokov a je celý pod vodou. V Taliansku našli vzácny chrám

Zasiahnu cieľ na opačnej strane Zeme. Najhrozivejšie zbrane sveta stvorilo USA, Rusi ťahajú za kratší koniec

Microsoft šokuje hráčov. Ikonická značka Xboxu prichádza na PlayStation

Nike sa chystá urobiť technologický prevrat: Vyvinulo elektroobuv, ktorá umožní ľuďom chodiť rýchlejšie
NAJČÍTANEJŠIE ZO STARTITUP

Sieť predajní dm sťahuje z predaja nebezpečný produkt. Môže obsahovať kvasinky a plesne

Obchody masívne sťahujú „nebezpečnú potravinu“ z Poľska. Hrozí ťažká otrava

Zabudni na kódovanie AI: Podľa Marka Cubana budú firmy platiť zlatom ľuďom s touto jednou schopnosťou

Poznáme najlepšiu destináciu Európy za rok 2025: Je vzdialená len 3 hodiny od Slovenska

Kruháč, ktorý vedie „nikam“ za 1,27 milióna eur: Stal sa symbolom byrokratického fiaska, na železnicu čaká 4 roky
- 24 hod
- 48 hod
- 7 dní
-
- Sovieti mali v rukách väčší klenot ako Concorde, no bol úplnou nočnou morou
- Najväčšia udalosť od Game of Thrones. Nové sci-fi ukazuje znepokojivú víziu budúcnosti
- Súbor Predátorov aj prepojenie na Votrelca. Pokračovanie ikonickej sci-fi série dostalo finálnu ukážku (VIDEO)
- Obrovská nehoda vo vesmíre vydesila vedcov. Zachytili extrémnu zvukovú bombu, toto ju spôsobilo
- Čína prepisuje pravidlá IT sveta. Pod morom spustila veterné dátové centrum
-
- 11 minút mu tlieskali v stoji. Netflix práve predstavil jeden zo svojich najlepších filmov
- Západ nič také nemá. „Spojenec“ Ruska nasadí laser na stíhačky budúcnosti, rakety po ňom „slepnú“
- Celý život nás klamú. Powerbanky sú špinavý biznis, toto ti výrobcovia nikdy nepovedia
- Záhadný kameň v Egypte nechal vedcov v nemom úžase. Odhalil tajomstvo ukryté 5000 rokov
- Plán na večer je jasný. Najlepšie hodnotený horor 2025 dorazil na známu službu aj s dabingom
-
- Ak nepriateľ zaútočí, bude čeliť vlastnému koncu. Európsky štát otestoval 8100-tonový jadrový kolos
- Automobilky oklamali svet a budú platiť. Obľúbený pohon zlyhal na celej čiare, produkuje veľké emisie
- Máš doma staré mobily? Nevyhadzuj ich, obľúbený operátor ti za každý jeden dá až 100 GB dát
- Celý život nás klamú. Powerbanky sú špinavý biznis, toto ti výrobcovia nikdy nepovedia
- 11 minút mu tlieskali v stoji. Netflix práve predstavil jeden zo svojich najlepších filmov
Elektromobilita rozdelila Európu na dve časti. Osud spaľovákov má v rukách jeden štát
Prevádzkovatelia spochybňujú plán vlády. Žiadajú predĺžiť využívanie jadrovej energie
Predbehol angličtinu a rozumejú mu aj Slováci. Sused Slovenska má najpresnejší jazyk pre komunikáciu s AI
Trump vyslal jasný odkaz. Severnú Kóreu označil za „akýsi jadrový štát“
Kritici sa chytajú za hlavu: 60 krajín OSN podpísalo kontroverznú kyber dohodu, navrhli ju Rusi
NAJČÍTANEJŠIE ZO STARTITUP

Sieť predajní dm sťahuje z predaja nebezpečný produkt. Môže obsahovať kvasinky a plesne

Obchody masívne sťahujú „nebezpečnú potravinu“ z Poľska. Hrozí ťažká otrava

Zabudni na kódovanie AI: Podľa Marka Cubana budú firmy platiť zlatom ľuďom s touto jednou schopnosťou

Poznáme najlepšiu destináciu Európy za rok 2025: Je vzdialená len 3 hodiny od Slovenska

