Rozhovor s MAMA AI: „Pro nás to vždy byla věc cti, abychom byli v češtině perfektní“

Zleva Jan Kleindienst, Kuba Krchák, Jan Cuřín, Jan Macek, Josef Vopička, Martin Čmejrek

MAMA AI je český technologický startup založený předními odborníky z IBM Watson laboratoře s rozsáhlými mezinárodními zkušenostmi. V našem rozhovoru jsme se podívali blíže na výzvy konverzační umělé inteligence, konkrétní projekty a produkty, MAMA AI Academy, umělou inteligenci v zákaznických centrech či humanoidního robota jménem Pepek.

Na webu tvrdíte, že s MAMA není AI žádné drama. To nás hned přivádí k první otázce, s jakými obavami na straně klientů se setkáváte nejčastěji?

Nejčastěji je to obvyklý strach z neznámého a ze změn. To je pochopitelné, ale netýká se to pouze projektů v oblasti umělé inteligence. Ale podívejme se na to takto: pokud má klient realistická očekávání a ví, co chce dokázat, potom není k obavám důvod. Rádi pomáháme i s úvodním nastavením projektu, kde si parametry projektu společně zformulujeme. Pokud si chce klient některé technologie napřed osahat vlastníma rukama, aby se ujistil, že je na správné cestě, nabízíme menší PoC. A pokud úvodní PoC dopadne dobře, pak se prostor k obavám výrazně zmenší. I z toho klientského přístupu pramení toto naše přátelské firemní heslo.

Jako startup se specializujete na řešení v oblasti konverzační umělé inteligence, rozpoznávání a syntézy řeči, dialogových systémů, strojového překladu, obecného hlubokého učení či strojového učení. Proč jste se rozhodli soustředit zrovna na tuto oblast?

Je to oblast, které se všichni věnujeme dlouhodobě, dá se říct, že desítky let. A je v ní stále co zdokonalovat a vymýšlet. Například s nástupem velkých jazykových modelů se otevřely nové možnosti toho, co vše na ně napojit. Rozvíjíme mDataChat, což je technologie agentů, kteří dohromady tvoří ucelené konverzační řešení čerpající z různých datových zdrojů. Ať už se klient v konverzaci zeptá na něco z oblasti vyžadující vyhledávání v relačních databázích a následné výpočty, nebo na dotaz směřující do znalostních databází, které navíc mohou být v různých jazycích, to všechno zvládne konverzační umělá inteligence využívající specializované agenty ve spolupráci s velkými jazykovými modely. Je to oblast, které se v uplynulém roce dostalo značné pozornosti a velice rychle se rozvíjí a stále je v ní možné vymýšlet něco nového pro naše zákazníky. To je to, co nás láká.

Zajímavostí je také to, že zakládající členové MAMA AI 25 let pracovali v oblasti umělé inteligence pro IBM. Jak velká je nyní vaše „rodina“ a jsou zmíněné zkušenosti tím, co váš tým odlišuje od jiných firem zaměřujících se na AI?

Myslíme, že rozhodně ano. Naše rodina měla více než 20 členů už v době, kdy jsme se s IBM loučili a dnes je nás přes padesát. My zakladatelé se známe navzájem nějakých 15 – 20 let. Pracovali jsme spolu nejen v české pobočce IBM Watson Research, ale strávili jsme spolu i nějakou dobu v USA. Takže přesto, že MAMA AI je na trhu 2,5 roku, jsou za námi vidět osobní zkušenosti z projektů, které jsme psali během uplynulých dekád pro IBM a její mezinárodní klienty. Není to jen konverzační inteligence Watson Asistent, ale pokud si pamatujete na rok 2011, když počítač IBM porazil nejlepší lidské soupeře ve hře Jeopardy! (obdoba českého „Riskuj!“), tak hlas Watsona vznikal u nás ve výzkumném a vývojovém středisku v Praze. Nejsme si jisti, zda v jiné české AI firmě existuje tým, který by byl takto dlouhodobě sehraný. A to, že jste použili v otázce slovo „rodina“, je vlastně velice přiléhavé, protože za ta léta se opravdu znají velice dobře i naše rodiny. Řada našich kolegů a jejich dětí mají umělecké vlohy a najdou se i projekty, na kterých spolupracují naši potomci.

A ještě bychom rádi uvedli, že naší odlišností může být i multigeneračnost. Najdete u nás kolegy s čerstvými diplomy, ale i kolegy, kterým je přes šedesát. Pokrýváme třígenerační rozpětí.

Pro jaké firmy a odvětví nejčastěji pracujete? Velmi nás překvapila například realizace pro Armádu ČR, pro kterou jste vytvořili virtuální náborářku Adélu.

Máme opravdu velmi široký záběr a to jen dokazuje, jak široké spektrum uplatnění má umělá inteligence. Některé technologie jsou použitelné napříč všemi typy organizací. Jsme schopni třeba nabídnout řadu zajímavých nástrojů personalistům a vlastně i virtuální náborářka Adéla patří do této oblasti. Velmi vzrušující oblastí je oblast biochemie a farmakologie. Jde o super inovativní příklady, jak používat prostředky AI pro drug discovery, hledání v mnoha miliardovém prostoru molekul a určování jejich chemických vlastností, aby se snadněji, rychleji a levněji našla požadovaná látka s optimálními vlastnostmi pro léčbu. A možná i pro tento široký záběr jsme byli nedávno úspěšní v AI Awards, kde jsme se v bohaté konkurenci v kategorii Byznys probojovali mezi 3 nejlepší finalisty.

Mezi nabízenými produkty nechybí velké jazykové modely (LLM), kterým se tento rok dostává velké pozornosti. Velkým otazníkem je však on-premise nasazení a jeho případné výhody či nevýhody. Mohl byste je prosím přiblížit? Je možné při takovém nasazení dosáhnout stejně kvalitních výsledků jako například u modelu GPT-4?

Některá naše řešení umožňují napojení na velké jazykové modely. Ale vždy je třeba si ujasnit, jaká je v daném řešení funkce jazykového modelu. Málokteré řešení využije kompletně GPT-4. Pokud si tedy klient přeje, aby jeho řešení bylo výhradně on-premise, musíme společně s klientem požadovanou funkčnost definovat. A třeba zjistíme, že jazykový model nebude muset umět stovku jazyků, ale bude mu stačit třeba jen pět. Vlastně i kdyby měl pokrýt všechny oficiální jazyky EU, tak jich nebude stovka, ale jen 24. A bude nutné, aby v sumarizaci dokumentů použil své znalosti v programování v Pythonu? Pravděpodobně ne. To všechno jsou možnosti, jak některé jazykové modely zmenšit, aby byly provozovatelné přímo u klienta, ale přitom poskytly naprosto dostačující funkčnost pro dané řešení.

Pojďme se podívat také na produkt Telma. Jedná se o omnichannel platformu s umělou inteligencí, která nabízí flexibilní digitální asistenty pro automatizaci komunikace se zákazníky. Mezi příklady využití jsou také odchozí hovory. Máte k dispozici nějaká data, která by dokázala srovnat úspěšnost lidských operátorů a digitálních asistentů?

Myslíme, že obrovskou výhodou Telmy je rychlost. Je značný rozdíl, když bude operátor člověk obvolávat se stejnou otázkou či informací stovky klientů a na konci pracovního dne bude unuděný a umluvený k smrti zároveň, nebo když to Telma zvládne za pár minut, protože zvládá stovky paralelních hovorů a navíc ji to nenudí. Samozřejmě záleží i na tom, kolik lidí hovor zvedne, ale zde asi nebude velký rozdíl mezi tím, když volá člověk nebo Telma. A obvolávat celý den klienty se stejnou informací, to asi nebude pro člověka dream job. Takže pokud necháme lidské operátory, aby se soustředili na zajímavější a rozmanitější úkoly, určitě to bude mít vliv i na jejich spokojenost, motivaci a dlouhodobě i na retenci. A teprve Telma umožnila vůbec některá využití v byznys procesu klienta. Například obvolávání klientů kvůli online objednaným a dosud nevyzvednutým produktům na pobočkách. Tady máme k dispozici data ukazující, že takové začlenění Telmy do procesu navýšilo obrat klidně o 10 % a více. Rovněž se ukazuje, že pokud klientovi, který zapomněl uhradit fakturu, zavolá voicebot místo živého člověka, pak je to pro klienta méně trapné.

Na straně příchozích hovorů pomáhá Telma například v zákaznických centrech. Nacházíme se již v době, kdy zvládne „robot“ vyřešit se zákazníkem opravdu vše?

Nevíme, jestli opravdu vše, ale těch schopností přibývá. Záleží na tom, co klient definuje jako oblast, kterou svěří umělé inteligenci. Řada použití v zákaznických centrech znamená mít dobře definované byznys procesy tak, aby přínos umělé inteligence byl co největší. Aby například uměla najít řešení problému klienta v dřívějších záznamech a aby měla možnosti některé kroky z postupu celého řešení rovnou provést a teprve v případech, kde je to nezbytné, přivolala svého lidského kolegu.

Mezi produkty máte také další služby, například převod Powerpointových prezentací do videa. O kolik složitější je vytvářet podobné služby s podporou českého jazyka? Mnoho lidí má z minulosti zafixováno, že čeština bývá u podobných služeb vždy problém. Změnila se doba a na jazyku už vlastně ani tolik nezáleží?

Na jazyku záleží. A na dokonalé výslovnosti a intonaci rovněž. Pro nás to vždy byla věc cti, abychom byli v češtině perfektní, i když jsme dříve pracovali hodně s anglickým a případně dalšími jazyky, a někdy i velmi exotickými. Ale čeština je opravdu jazyk nádherně košatý a morfologicky velmi bohatý se všemi svými pády, rody, časy, vidy a dalšími prvky. Proto výroba nového českého hlasu není jednoduchá věc a vyžaduje čas. Ale těší nás výsledky. Například již v červnu uvedlo rádio Expres FM digitální dvojče moderátorky Báry Hacsi. Těžko si představit, že by se to mohlo uskutečnit bez perfektní češtiny. Na Seznamu si můžete poslechnout i některé články v audioverzi, kterou čte naše robotka Jana. A nedávné vítězství MAMA AI ve výběrovém řízení České televize jen potvrzuje, že v této oblasti jsme nejlepší na českém trhu. Takže i pro převod prezentací do videa včetně automatického přednesu poznámek mluvčího platí, že pokud byla původní prezentace určena českému publiku a pronášena česky, pak musí být česky i video, které je pro auditorium určeno.

Jedním z nových projektů je MAMA AI Academy. Pro koho je akademie určena? Musím mít účastník již hlubší znalosti programování?

Ne, nemusí mít žádné. Naše MAMA AI Academy míří na ty profesionály ve svých oborech, kteří pochopili, že o umělé inteligenci je třeba něco vědět. Někteří budou třeba o jejím nasazení rozhodovat nebo přímo povedou takový projekt a je třeba mít správně nastavená očekávání. Po absolvování MAMA AI Academy budou mít dobrý přehled zejména o základech hlasových a textových technologií. Je pravda, že během tohoto workshopu procházíme řadou praktických cvičení. Asi nejvíce zábavy si klienti užívají při tvorbě vlastního hlasového asistenta. Ano, i to je možné stihnout ve cvičení, které trvá asi 25 minut a bez znalosti programování. A nevěřili byste, co všechno jsou někteří hlasoví asistenti s volaným člověkem schopni probrat! Mimochodem, v interní soutěži zákaznických týmů zpravidla vítězí ti, kteří si jako téma vyberou oblast HR. Co všechno se dá v roli HR zavolat třeba zaměstnanci, který je právě na dovolené, bývá velice pozoruhodné.

Když vysvětlujeme zpracování textu, demonstrujeme některé principy na krátkých programech v Pythonu v online prostředí, ale všichni uživatelé si s tím vždy poradili. Jejich role se omezuje na úpravu vstupních dat, což je velice jednoduché. Mohou si vyzkoušet úlohy jako jsou analogie, detekci toxicity a další.

Otázka závěrem. Jak moc je podle vás budoucnost umělé inteligence spojena s robotikou? Přece jen víme, že máte „kamaráda“ jménem Pepek, který kombinuje několik inovativních technologií MAMA AI.

Ano, Pepek, tedy humanoidní robot Pepper vybavený našim konverzačním rozhraním, je velmi příjemný společník, jak už mohli vidět účastníci některých akcí, kam šel Pepek s námi. Mohou za to právě technologie umělé inteligence. Umožňují mu mluvil lidským hlasem, i když v tomto případě volíme trochu výše položený hlas. Naprosto přirozený lidský hlas by neladil s jeho vzhledem. Může zabezpečit vítání hostů na různých konferencích, odpovídat na otázky týkající se organizace konference, ale i další. Dovedeme si ho představit i jako společníka třeba pro pacienty upoutané na lůžko, protože se s ním dá pohovořit vlastně o čemkoliv. Také může poskytovat informace o vašich produktech na veletržním stánku nebo na prodejně. A těší nás nadšené reakce publika na jeho chování, zejména ženy mají tendenci si ho hned pohladit, což je skvělé, protože pohlazením po hlavě se Pepek aktivuje. 😊