Spoločnosť Google oznámila ďalší krok vo vývoji svojej AI platformy Gemini – tentoraz ide o nástroj na natívnu úpravu obrázkov. Funkcia sa od stredy postupne sprístupňuje používateľom po celom svete a v priebehu najbližších týždňov bude podporovať viac ako 45 jazykov. Používatelia budú môcť upravovať nielen obrázky vygenerované umelou inteligenciou, ale aj vlastné fotografie nahraté zo svojho zariadenia.

Funkcia prichádza po testovacej fáze, ktorú Google spustil v rámci svojho AI Studio ešte v marci. Vtedy vyvolala rozruch, pretože dokázala odstraňovať vodoznaky z akýchkoľvek obrázkov. Nový editor v rámci Gemini však sľubuje oveľa širšie a bezpečnejšie využitie. Používateľ teraz môže napríklad zmeniť pozadie, pridať či nahradiť objekty, alebo dokonca upraviť fyzické vlastnosti osoby na fotke, ako je farba vlasov. Stačí poskytnúť prompt a Gemini sa postará o zvyšok. O téme informoval portál TechCrunch.

„Môžete nahrať osobnú fotografiu a požiadať Gemini, aby vytvoril obrázok s inou farbou vlasov,“ uvádza Google vo svojom blogu. „Alebo ho môžete požiadať, aby pripravil prvý návrh rozprávky o drakoch a pridal k nej ilustrácie.“

Google sľubuje ochranu

S takouto silnou AI funkciou však prichádzajú aj obavy – najmä pokiaľ ide o zneužitie deepfake technológií. Google tieto obavy nezamieta, naopak, aktívne sa im venuje. Všetky obrázky vytvorené alebo upravené pomocou Gemini budú obsahovať neviditeľný vodoznak, ktorý má overiť ich pôvod. Firma zároveň experimentuje s viditeľnými vodoznakmi, ktoré by mohli ešte viac pomôcť v boji proti manipulovaným vizuálom.

Na rozdiel od klasických AI generátorov obrázkov, Gemini pracuje v multi-krokovom editačnom režime, čo znamená, že používateľ dostane „bohatšie a kontextuálnejšie“ výsledky. Textové aj vizuálne prvky sa kombinujú do jedného toku, čo zvyšuje flexibilitu práce s obsahom. V praxi to znamená, že môžete postupne vylepšovať výstup bez nutnosti začínať vždy od začiatku.

Google

Súboj AI editorov sa rozbieha

Nový editor v Gemini tak vstupuje do priamej konkurencie s podobnými nástrojmi od OpenAI (ChatGPT) či Adobe (Firefly). Google si však dáva záležať na tom, aby jeho nástroj bol priamo integrovaný do používateľskej skúsenosti Gemini – a teda prístupný cez mobil aj desktop bez potreby ďalších aplikácií.

Zároveň je zrejmé, že úprava obrázkov pomocou AI nie je len o zábave, ale môže mať aj vážne etické dôsledky. Google preto zjavne počíta s potrebou transparentnosti a dôvery. Výsledky tejto rovnováhy medzi kreativitou a ochranou súkromia uvidíme už v najbližších týždňoch.

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP