Gemini dostáva novú funkciu na generáciu videí

Vytvoriť zo statického obrázka video už nebude problém ani pre laikov.

Google rozširuje možnosti generatívnej AI: Model Veo 3 teraz vytvára videá zo statických obrázkov. Spoločnosť predstavila významné rozšírenie svojho modelu generatívnej umelej inteligencie Veo 3, ktoré zásadne zjednodušuje proces tvorby video obsahu. Nová funkcia umožňuje aj používateľom bez technických znalostí konvertovať statické obrázky na dynamické videosekvencie, čím sa otvárajú nové možnosti pre kreatívnu prácu a digitálny marketing.

Generatívna umelá inteligencia je schopná vytvárať širokú škálu obsahu vrátane textu, obrázkov, zvuku a najnovšie aj videa. Veo 3, pokročilý model strojového učenia integrovaný do ekosystému Gemini, dokáže na základe textových pokynov generovať krátke videá. Najnovšia aktualizácia prináša možnosť vytvoriť osemsekundové video so zvukovým sprievodom priamo z nahraného obrázka.

Proces je navrhnutý pre maximálnu jednoduchosť. Používateľ nahrá východiskový vizuál; pridá textový popis, ktorý definuje požadovanú scénu a animáciu; voliteľne môže doplniť pokyny pre zvukovú stopu videa. Výsledné video je možné okamžite stiahnuť a zdieľať. Google zároveň implementoval systém spätnej väzby, ktorý používateľom umožňuje hodnotiť kvalitu výstupu a prispievať tak k ďalšiemu zdokonaľovaniu služby.

Funkcia generovania videa z obrázka je postupne sprístupňovaná predplatiteľom programov Google AI Pro a Ultra vo vybraných krajinách. Zároveň sa stáva súčasťou služby Flow, komplexnejšieho nástroja od Googlu pre tvorbu videí s podporou AI. Popularita týchto nástrojov rýchlo rastie. Podľa oficiálnych údajov bolo za posledných sedem týždňov prostredníctvom modelov Veo 3 v aplikáciách Gemini a Flow vygenerovaných viac ako 40 miliónov videí.

Očakáva sa, že nová funkcia tento počet ešte výrazne navýši. S cieľom zabrániť zneužitiu generovaného obsahu sú všetky videá opatrené viditeľným vodoznakom. Okrem toho obsahujú aj neviditeľný digitálny vodoznak SynthID, ktorý je odolný voči bežným úpravám a slúži ako prostriedok na identifikáciu obsahu vytvoreného umelou inteligenciou.

Napriek pokroku je dôležité si uvedomiť, že nástroje ako Veo 3 v súčasnosti nenahrádzajú profesionálne platformy na strih a postprodukciu videa, akými sú produkty od Adobe alebo Final Cut Pro. Slúžia skôr ako doplnkové nástroje, ktoré môžu zefektívniť špecifické úlohy. Príkladom je zjednodušené odstraňovanie pozadia zo záberov bez potreby zeleného plátna alebo pokusy o oddelenie vokálnej stopy od hudby.

Potenciál AI však presahuje len generovanie obsahu. Technológie ako Voice Isolation už dnes dokážu efektívne potlačiť rušivé zvuky v pozadí počas telefonických hovorov, čím výrazne zvyšujú kvalitu komunikácie. Nástroje ako Veo 3 majú obrovský potenciál pre zábavu, kreatívu a zjednodušenie práce. Na druhej strane však prinášajú aj značné riziká.

Technológia môže byť zneužitá na vytváranie neoznačených deepfake videí, šírenie dezinformácií a páchanie kriminálnej činnosti. Príkladom sú cielené podvody, kde útočníci môžu pomocou hlasu vygenerovaného umelou inteligenciou z verejne dostupných nahrávok (napríklad zo sociálnych sietí) manipulovať obeťami a pripraviť ich o finančné prostriedky. Rovnováha medzi inováciami a zavedením robustných ochranných mechanizmov bude kľúčová pre zodpovedné využitie tejto technológie.

Zdroj