Tvůrce multimediálního obsahu Ondřej Řepík: „Výstup z AI nástrojů používám jen jako polotovar“

Jednou z oblastí, kde si umělá inteligence velmi rychle získává popularitu, je tvorba multimediálního obsahu. Právě o ní jsme si povídali s Ondřejem Řepíkem, tvůrcem, který už přes 10 let vytváří videa na YouTube. Zároveň stojí také za kanálem Onden&OndwaK, kde mimo jiné publikuje originální návody, tipy a triky pro využívání umělé inteligence při tvorbě grafiky či videa. Nahradí umělá inteligence umělce a jaké jsou její největší hrozby? Přečtěte si rozhovor a dozvíte se více.

Jaké konkrétní výhody vidíte ve využití umělé inteligence při tvorbě a úpravách grafiky?

V první řadě určitě skvělá inspirace, možnost „načrtnout“ si více návrhů v úvodních fázích tvorby a rychle se rozhodnout, jakou cestou se pak vydat ve finální realizaci. Tedy nechat AI nakreslit nějaké koncepty a pak už rozvíjet ten nejzajímavější.

To krásně navazuje na druhou výhodu. Čím víc otrocké práce za nás AI může udělat, tím víc se jako umělci můžeme soustředit na to nejdůležitější. Když už není nutné trávit hodiny a hodiny vystřihováním subjektů a retuší, mnohem víc se projeví dobré nápady, emoce, kreativita.

Jaké jsou podle vás největší výzvy spojené s integrací umělé inteligence do tvorby multimediálního obsahu?

Existuje hromada úžasných nástrojů, které umí velmi dobře jednu konkrétní věc. Vytvořit například nádherný obrázek, nebo napodobeninu hlasu. Velká výzva ale může být efektivně je spojit dohromady, aby i celkový výsledek byl alespoň podobně kvalitní.

Záplava uměle generovaného obsahu taky učí diváky, jak takový obsah rozpoznat. A diváci nejsou hloupí – někdy je velmi těžké ukázat na konkrétní slabé stránky robotů, ale vnitřní pocit z videa, který napsala i namluvila AI, je zatím pořád o dost slabší. Často je znát, že mu chybí lidskost. To se samozřejmě do budoucna může změnit a pak bude výzva se jako člověk v záplavě velmi kvalitního AI obsahu probojovat na přední příčky.

Jaký je vztah mezi tvořivostí a umělou inteligencí? Může umělá inteligence skutečně nahradit lidskou kreativitu?

AI se učí a inspiruje velmi podobně jako člověk. Stejně jako my má „v hlavě“ hromadu informací o obsahu, který „nakoukala“. Na jeho základě pak tvoří vlastní originální kreace. Může ale kreativního člověka nahradit? Dnes si to asi těžko dokážeme představit, protože žádná umělá inteligence zatím není kreativnější než ti nejkreativnější lidé. Nejúspěšnější tvůrci mají pořád navrch a jejich lidskost a charakter jsou dnes už jejich největší výhodou. Navíc umělá inteligence se v jejich rukou stane jen nástrojem k odemknutí hlubší kreativity – umožní jim soustředit se víc na vlastní tvořivost, protože automatizuje monotónní a nekreativní stránky jejich práce. Co se ale stane, až přijde superinteligence, která bude mít vyšší intelektuální kapacitu než všichni lidé dohromady? Těžko říct, proto se tomu říká singularita.

Jaká jsou rizika spojená s tím, že stále více tvůrců začíná spoléhat na umělou inteligenci? Může to nějak ovlivnit originalitu obsahu?

Pro jednotlivce to může být užitečné i nebezpečné jako každý jiný nástroj. Trh obsahu se ale reguluje sám. Pokud nás zavalí vlna opakujícího se nudného AI generovaného obsahu, otevře se prostor pro originální a „ručně“ vyrobený obsah, který bude lidem chybět. Vždy budou mít výhodu ti tvůrci, kteří budou tvořit nejlepší obsah. V tom se zatím na AI nelze úplně spolehnout.

Pokud vedle sebe postavíme dva tvůrce, kteří používají AI nástroje, jeden z nich je líný a vyrábí automatická videa, druhý pomocí AI jen zrychluje a zdokonaluje svou precizní práci, je asi jasné, kdo z nich bude úspěšnější.

Jaký je váš postup při výběru vhodných úkolů a projektů pro umělou inteligenci na vašem kanálu Onden&OndwaK?

Pokud mi to zrychlí práci, nebo pomůže vytvořit zajímavý prvek, který by třeba jiným způsobem ani vytvořit nešel, pak je to vhodný úkol. Už roky pomocí AI vystřihuju subjekty z pozadí, retušuju fotografie, nebo dopočítávám snímky u zpomalených videí.

V poslední době jsem začal hodně využívat jako ilustrační záběry rozpohybované fotografie z Midjourney, občas si jako první krok brainstormingu nechám vyplivnout pár nápadů od ChatGPT. Vždy ale používám výstup z AI nástrojů jen jako polotovar, který dále ladím ručně do dokonalosti. Ať už jde o název videa, nebo automaticky generované titulky.

Jaké jsou vaše oblíbené nástroje a programy v oblasti umělé inteligence pro tvorbu multimediálního obsahu?

V první řadě musím samozřejmě zmínit DaVinci Resolve Studio a jeho Neural Engine, který v sobě má hromadu funkcí od vyčištění ruchů z audio stopy až po kompletní přesvícení scény. Rád říkám, že vývojáři z BlackMagic Design tady opravdu dostáli svému jménu, protože místy to působí trochu jako černá magie.

Co se týče generátorů obsahu, tak jsem experimentoval na vlastním počítači se Stable Diffusion, ale jeho údržba a ovládání mi nepřišlo úměrné výsledkům, kterých jsem dosahoval, takže jsem přešel na placené Midjourney. ChatGPT používám nejen v rámci kreativní tvorby, teď už i jako appku na svém Android telefonu, kde se dá dokonce vstupní prompt diktovat i hlasem, takže to už je opravdu konverzace s vševědoucím robotem. Čím dál víc přemýšlím o předplacení vyššího modelu, na druhou stranu možná spíš počkám, jaká se objeví konkurence. Už je tady mimo jiné třeba Google Bard a Elon Musk taky něco tajně vaří…

Třešnička na dortu a skvělý objev je pro mě Whisper, který funguje skrze příkazovou řádku. Napsal jsem si k jeho snažšímu ovládání script v Pythonu. Ačkoliv programovacím jazykům absolutně nerozumím, zvládl jsem to právě s pomocí ChatGPT! Do Whisperu vložím svoje hotové YouTube video a on mi k němu za pár minut vygeneruje titulky v jakémkoliv jazyce včetně češtiny. Přesnost odhaduji někde kolem 95 %, takže je potřeba něco málo opravit, ale upřímně nechápu, jak může fungovat tak dobře, i když ve videích často mluvím česko-anglicky, používám hromadu cizích výrazů, krkolomných zkratek a tak podobně.

České titulky si pak už YouTube přechroustá do jakéhokoliv jazyka, takže moje videa jsou díky AI dostupná komukoliv na světě.

Jaký je váš postoj k vývoji umělé inteligence schopné replikovat konkrétní lidský hlas a vzhled? Myslíte si, že by to mohlo mít nějaké negativní důsledky?

Velmi kontroverzní téma, zejména z hlediska celovečerních filmů velkých studií. Jako největší problém vidím morální otázku „oživování“ zemřelých herců, jelikož se jich zkrátka nelze zeptat, zda-li by s něčím takovým souhlasili. Pak lze argumentovat, že bychom nikoho bez výslovného souhlasu oživovat (a ještě k tomu za komerčním účelem) neměli. Pod to bych se podepsal.

Co se týče živých lidí, pokud s tím replikovaná osoba souhlasí, není to podle mě problém. Pokud ne, tak to problém být může. Samozřejmě je rozdíl využít něčí hlas a vzhled v parodii versus zfalšovat důkazy o trestném činu. Variant zneužití je celá řada.

Označil bych to jako první nežádoucí vedlejší efekty postupného přechodu života z reality do virtuální reality. Poprvé se jako lidstvo musíme vypořádat s tím, že nelze jednoznačně určit, co je reálné a co není. A v tomto ohledu to bude už jen těžší a těžší.

Kde vidíte váš YouTube kanál a vaši práci za pár let? Nemyslíte si, že se z tvůrců multimediálního obsahu stanou prompt inženýři?

Být dobrý v komunikaci s umělou inteligencí bych označil za jednu z nejdůležitějších dovedností současnosti. I proto se snažím v tomto ohledu nezůstat pozadu. Na druhou stranu s vývojem AI nástrojů se zlepšuje i jejich uživatelský zážitek, takže si myslím, že brzy přijde doba, kdy bude ovládání mnohem jednodušší a promyšlené prompty nebudou dost možná nutné. Stejně jako dnes není nutné ovládat příkazovou řádku, aby mohl člověk používat svůj smartphone.

Každý tvůrce bude postaven na rozcestí. Pomocí AI nástrojů bude moct vložit méně manuální práce a dosáhnout stejného výsledku, nebo při stejném úsilí dosahovat mnohem lepších výsledků než v minulosti. Asi každý, komu na tvorbě záleží a chce uspět a vyniknout, se spíš přikloní k té druhé možnosti. Já nejsem zas takový kariérista a nejvíc mi vyhovuje pracovat kolem 20 hodin týdně. Věřím tedy, že za pár let budu moct tento čas využít mnohem lépe a produkovat zábavný i užitečný obsah, který bude moct bez bariér konzumovat kdokoliv na světě. Třeba pomocí automatického AI dabingu do všech světových jazyků. Že pak bude někde na cizím serveru ležet můj hlas, to mě zas tolik netrápí.

Co byste chtěl říct lidem, kteří mají obavy z růstu vlivu umělé inteligence na tvorbu obsahu a kreativitu jako celek?

Nedávno jsem přesně na toto téma publikoval na svém kanálu video. Kdybych to měl ještě jednou celé shrnout, umělá inteligence je nástroj. Ten, kdo ho bude umět používat, bude mít navrch. To ale neznamená, že se nebude muset snažit! Naopak, bude mít možnost snažit se v těch nejzajímavějších a nejdůležitějších aspektech kreativní tvorby a tu nudnější a zbytečně náročnou práci nechat na umělé inteligenci. Úspěšné kreativní studio nebude propouštět své zaměstnance, aby je nahradilo AI roboty, ale bude moct se stejným počtem zaměstnanců produkovat víc obsahu ve vyšší kvalitě.