Spoločnosť Meta prišla s jedinečnou umelou inteligenciou v podobe jazykového modelu, ktorá je nesmierne kompaktná a napriek tomu dokáže prekonať jazykový model GPT-3 spoločnosti OpenAI, ktorý je hlavným stavebným prvkom populárneho ChatGPT, informuje ArsTechnica. Má fungovať aj na jednom jedinom GPU (grafická procesná jednotka, resp. grafická karta) a od ostatných sa poriadne líši.

Stačili verejne dostupné dáta

Nový jazykový model LLaMA je, ako vysvetľuje Meta v samostatnej štúdii, cvičený na verejne dostupných dátových setoch zo stránok, ako je Wikipedia, Github, arXiv a predovšetkým Common Crawl. Common Crawl je nezisková organizácia, ktorá poskytuje zdarma dátové sety z webu verejnosti, pričom v tomto prípade jej dáta tvoria až 67 % použitých setov.

Kým GPT-3 spoločnosti OpenAI tvorí až 175 miliárd parametrov, v prípade LLaMA je to len od 7 do 65 miliárd parametrov. Aj keď sa jedná o oveľa menší systém, v testoch prekonal nielen GPT-3, ale tiež jazykový model OPT v takmer všetkých skúškach a je navyše schopný konkurovať aj systémom ako je Chinchilla 70B spoločnosti DeepMind alebo PaLM 540B spoločnosti Palm AI.

Od všetkých týchto modelov sa ale poriadne líši práve používaním verejne dostupných dát, vďaka čomu je možné použiť túto technológiu aj ako open-source softvér. Meta tieto systémy nazýva „fundamentálnymi modelmi“, keďže sa jedná len o prvotnú verziu čohosi oveľa väčšieho a konkurencieschopného.

AI Microsoftu dostala lobotómiu

Jazykové modely už narazili aj na niekoľko problémov, pričom Microsoft musel tvrdo zakročiť a novou verziou väčšinu nežiadúcich javov z modelu Sydney odstránil. Práve tieto nedokonalosti si však mnohí fanúšikovia obľúbili a zmenu nazývajú lobotómiou, aj keď bola nevyhnutná.

Ďalší gigant na bojisku

Zdá sa tak, že aj Meta sa chystá vstúpiť do boja o najlepšiu umelú inteligenciu s reálnym využitím a to proti firmám ako Google či Microsoft. Práve menšie verzie jazykových modelov môžu byť pre Zuckerbergovu spoločnosť obrovskou výhodou, keďže je možné ich použiť priamo na zákazníckych zariadeniach, čo otvára úplne nové možnosti podnikania, ktoré konkurentom zatiaľ chýbajú.

Flickr

Simon Willison, výskumník umelej inteligencie, je dokonca presvedčený o tom, že už o jeden až dva roky bude možné mať schopnosti porovnateľné s ChatGPT priamo v laptope či dokonca v smartfóne. Na to je ale ešte potrebný dodatočný vývoj.

Jazykové modely sú len prvým krokom v boji technologických gigantov o aplikáciu umelej inteligencie do každodenného života a to, pochopiteľne, s vidinou zisku. Aj keď je umelá inteligencia nesmierne nápomocným nástrojom, v posledných mesiacoch dokázala, že dokáže byť aj neuveriteľne škodlivá a je preto potrebná opatrnosť – skôr či neskôr budú musieť zakročiť aj úrady s ostrými reguláciami.

Pošli nám TIP na článok



Teraz čítajú