Pavel Chocholouš z datové platformy Keboola: „Automatizace s GenAI je cesta k ultimátní produktivitě“
Data jsou nepostradatelnou součástí řešení využívajících umělou inteligenci. A nejen o důležitosti dat jsme si povídali s Pavlem Chocholoušem, produktovým managerem datové platformy Keboola. Jak na efektivní správu dat, jak využívá AI online supermarket Rohlik.cz a proč je nejlepší postup žádný postup? Odpovědi na vás čekají v rozhovoru níže.
Jako Keboola upozorňujete na propast mezi aktuálním stavem AI technologií a byznysem. Čím si tento „gap“ vysvětlujete a vede cesta k jeho překonání přes efektivní správu dat?
Závratné tempo technologických inovací se jen pomalu promítá do firem. Zvenčí se může zdát transformace firmy jako jednoduchý úkol, radit, jak dělat věci lépe, dokáže ledaskdo. Ve větších organizacích je klíčová role vedení, odvaha přiznat si pravdu a prosadit změny. Nezřídka zárodek „modernizace“ vzejde zevnitř, zespoda, od týmů, které v datech vidí příležitost. Ale abych odpověděl na otázku, dokud firma netrpí, datovou nedospělost často neřeší a až bolest – problémy s růstem, konkurencí, procesy donutí vedení začít problém řešit. Pro úplnost, nic není černobílé, existuje mnoho firem, které na datech a AI stojí, nekončící vývoj a inovace mají v DNA.
Jaké jsou klíčové faktory přispívající k významnému nárůstu návratnosti investic z iniciativ AI ve firmách?
V klasickém machine learningu je nárůst menší, velká část je způsobená klesající cenou výpočetního výkonu. Lidské práce ani nezdarů, které na návratnost mají zásadní vliv, nijak významně neubylo.
Generative AI je úplně jiný příběh. Například poznat e-mail, kde by bylo vhodné doplnit informace a zeptat se na ně zákazníka dřív, než e-mail vidí lidské oči, je najednou snadné. Ale nejsou to jen jednoduché „úkoly pro ChatGPT“, i mnohem složitější problémy jde řešit pomocí Generative AI, je složitější je uvést do produkce, ale často stále řádově jednodušší než trénování vlastních modelů.
Jaké jsou nejlepší postupy pro zajištění kvality dat používaných v projektech AI?
Keboola přináší například chybové zprávy s návrhy řešení, automatizovanou správou dat a analýzou dopadů změn v kódu. To jsou první vlaštovky, vlastně výstupy z interního hackathonu. Nejlepší postup je žádný postup, tedy plná automatizace. Dosud jsme si většinou pod automatizací představovali spíš pravidelně spouštěný proces, nebo procesy, které na sebe navazují v místech, kde je nelze paralelizovat. To se úplně mění. Automatizace s GenAI je cesta k ultimátní produktivitě a nadpozemsky dobrému UX. Zní to ambiciózně, nebo možná až hloupě, raději dám příklad. Při práci s daty je mnoho míst, kde uživatel definuje vazby mezi daty. Je to tupá repetitivní práce. Zároveň prostor pro chybu. Nepotkal jsem nikoho, koho by naplňovala, ale generace uživatelů se s tím prostě smířily. Stejně jako neexistencí historie v clipboardu, to je dobrá analogie. Všechny tyto úkoly předáváme AI, mapování, spojování tabulek, kontroly datových typů, navržení dalších kontrol podle obsahu dat. Našeho uživatele vidíme jako někoho, kdo úkoluje a hlídá AI. A sledujeme vývoj na poli foundation modelů, jako např. TimeGPT, které slibují přinést další možnosti kontroly dat.
Jak důležitá je podle vás spolupráce mezi odborníky z daného oboru a technickými odborníky ve vývoji produktů AI?
Zajímavá otázka. Ta hranice se smývá. Vytvořit AI produkt předpokládá dostupná data pro daný use case a představu o tom, jak do něj AI začlenit, zbytek by měl být jednoduchý podobně jako je jednoduché si analyzovat data v ChatGPT. Role odborníků na AI přichází ve chvíli, kdy AI produkt nedává uspokojivé výsledky, nebo je příliš pomalý, drahý a tak podobně.
Jak Keboola zjednodušuje proces převádění AI konceptů AI do funkčních služeb a produktů?
V jednoduchosti je síla Kebooly. Nahrát data z více zdrojů na jedno místo, se vší pohodlností nejmodernějších cloud data warehouse služeb, integrovat data, klidně i bez použití kódu, to všechno je v Keboole super jednoduché. A že na pozadí je všechno monitorované, verzované, zabezpečené a celá platforma je otevřená, je třešnička, o které někteří uživatelé ani neví.
Keboola nechá lidi, kteří rozumí business problému, ten problém zkoumat a řešit, aniž by se bylo potřeba starat o cokoliv dalšího. Kdo někdy stavěl datovou platformu ve firmě, určitě ví, kolik energie zabere ji jen vybudovat a provozovat (aniž by se v ní cokoliv dělo), kolik kostiček je v architektonickém diagramu atd. S Keboolou jde jen o business problém a data, případně AI, pokud už data jsou ok.
Doporučujete ve vývoji AI produktů uplatňovat „rychle jednat, rychle selhat, rychle se učit“?
Doporučuju to u všech produktů. Moc se mi líbí pravidlo Dušana Šenkypla – short term impatience, long term patience. Při vývoji hledat zkratky, mít co nejdřív něco k vyzkoušení, ověřit, že projekt jde správným směrem a tak pořád dokola. A ta long term patience zajistí, že prioritizujeme, nezačneme dělat na všech věcech najednou. Lepší jeden produkt hotový nebo shozený ze skály, než pět rozpracovaných.
Je budoucnost ve znamení low-code a no-code přístupu?
Keboola již nyní uživatelům bez znalosti kódování umožňuje vytvářet datové produkty. A AI je, v jistém smyslu, dalším evolučním krokem.
Jak pomohla Keboola Rohlíku ve vývoji jeho AI produktů a jaké byly výsledky?
Rohlík v Keboole odjakživa připravuje všechna svá data. Nejen pro data science a AI účely. S příchodem GenAI byl Rohlík jedním z prvních partnerů a beta testerů Keboola AI apps. Chat nad daty v databázi, chat nad interní knowledge base přímo ve Slacku a další experimenty. Spolupráce s Rohlíkem je jedním ze základů, které pomohly utvořit naší AI roadmapu.
Jaké nejnovější funkce, které zefektivňují DataOps, nabízí Keboola v rámci podpory vývoje AI produktů?
Streamlit Data Apps, jednoduchý způsob, jak postavit aplikaci nad daty v Keboole. S využitím šablon je to vlastně instantní end-to-end datový a AI produkt. Od posbírání dát, přes jejich čištění, predikce, segmentace až po konzumaci a úpravy dát, to všechno se dá zabalit jako šablona a použít znova.
Jaké další AI funkce jako Keboola máte v roadmapě?
Rozdělil bych to na dvě oblasti. AI pro uživatele a AI od uživatelů. Pro uživatele už jsem hodně funkcí zmínil. Cíl je zřejmý, ušetřit lidi práce bez přidané hodnoty, dát každému jeho pomocníka. Například pomocník na získávání dat z externích zdrojů, pomocník na čištění, kontrolu a integraci dat, ale i pomocník na vytvoření celé data/AI pipeline, pomocník na analýzu dat a tak podobně. Uživatelům umožňujeme v Keboole provozovat jejich vlastní modely, využívat Generative AI, NLP, langchain apod. To plánujeme vylepšovat a zjednodušovat, aby mohl AI produkty stavět opravdu každý.
Závěrem se zeptáme, v jakých oblastech byznysu či segmentech má dle vás AI největší potenciál?
Otočím to, pokud jste neviděli poslední South Park, pak jedině dobře. Obory, kde AI nemá potenciál, jsou vzácné. Příklad, instalatérovi se může hodit appka, která z fotky pozná výrobce a typ dílu. Ale vážně. Nepřekvapivě marketing, obecně jakákoliv konzumace a tvorba obsahu, komunikace se zákazníkem, dodavatelem, kolegou, software engineering (hlavně UX) – aplikace konečně začnou být chytré. Velký potenciál vidím určitě ve zpracování nestrukturovaných dat. A důležitá je i automatizace, rozhodování a řízení procesů a firem.