Spoločnosť OpenAI, ktorá stojí za populárnou aplikáciou ChatGPT, oznámila uvedenie svojho nového jazykového modelu GPT-4o. Písmeno „o“ v GPT-4o znamená „omni“, čo znamená, že model dokáže pracovať s textom, rečou a videom, vysvetľuje TechCrunch.

Tento nový model je zásadným vylepšením oproti svojmu predchodcovi GPT-4 Turbo, ktorý ponúka rozšírené možnosti, rýchlejšie spracovanie a úsporu nákladov pre používateľov. V niektorých metrikách dokonca zaznamenáva až 5-násobné zlepšenie.

GPT-4o má poháňať chatbot a API ChatGPT od OpenAI, čo umožní vývojárom využívať schopnosti modelu. Nový model je k dispozícii pre platiacich aj neplatiacich používateľov, pričom niektoré funkcie sa zavádzajú okamžite a iné v nasledujúcich týždňoch, dodáva CNN.

Dokáže veci, z ktorých behá mráz po chrbte

Nový model prináša výrazné zlepšenie rýchlosti spracovania, zníženie nákladov o 50 %, päťkrát vyššie limity rýchlosti a podporu viac ako 50 jazykov. Spoločnosť OpenAI plánuje postupne zavádzať nový model pre používateľov ChatGPT Plus a Team, pričom dostupnosť pre podniky „sa blíži“. Spoločnosť začala v pondelok zavádzať nový model aj pre používateľov ChatGPT Free, aj keď s obmedzeniami používania.

V nasledujúcich týždňoch spoločnosť OpenAI predstaví vylepšené hlasové a video funkcie pre ChatGPT. Hlasové funkcie ChatGPT môžu zintenzívniť konkurenciu s inými hlasovými asistentmi, ako sú Siri od spoločnosti Apple, Google od spoločnosti Alphabet a Alexa od Amazonu. Používatelia teraz môžu ChatGPT počas požiadaviek prerušiť a simulovať tak prirodzenejšiu konverzáciu.

GPT-4o výrazne zlepšuje skúsenosti v chatbote ChatGPT poháňanom umelou inteligenciou od spoločnosti OpenAI. Platforma už dlho ponúka hlasový režim, ktorý prepisuje odpovede chatbota pomocou modelu prevodu textu na reč, ale GPT-4o ho vylepšuje a umožňuje používateľom komunikovať s ChatGPT viac ako s asistentom.

OpenAI

Model poskytuje reakcie v „reálnom čase“ a dokáže dokonca zachytiť nuansy v hlase používateľa, pričom v reakcii generuje hlasy v „rôznych emocionálnych štýloch“ (vrátane spevu).

Nielen počuť, dokáže aj vidieť

GPT-4o tiež vylepšuje schopnosti ChatGPT v oblasti videnia. Pri zadaní fotografie – alebo obrazovky pracovnej plochy – teraz ChatGPT dokáže rýchlo odpovedať na súvisiace otázky, a to na témy od „Čo sa deje v tomto softvérovom kóde?“ až po „Akú značku košele má táto osoba na sebe?“. Tieto funkcie sa budú v budúcnosti ďalej rozvíjať, pričom model ChatGPT by mohol umožniť napríklad „sledovať“ športový zápas naživo a vysvetľovať pravidlá.

GPT-4o je tiež viacjazyčnejší, s vylepšeným výkonom v približne 50 jazykoch. A v rozhraniach API OpenAI a Azure OpenAI Service spoločnosti Microsoft je GPT-4o dvakrát rýchlejší, o polovicu lacnejší a má vyššie limity rýchlosti ako GPT-4 Turbo.

Wikimedia/OpenAI

Počas demonštrácie GPT-4o ukázal, že dokáže porozumieť emóciám používateľov počúvaním ich dychu. Keď si všimol, že používateľ je vystresovaný, ponúkol mu radu, ktorá mu pomohla uvoľniť sa. Model tiež ukázal, že dokáže konverzovať vo viacerých jazykoch, prekladať a automaticky odpovedať na otázky.

Čítajte viac z kategórie: Cyber

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP