AI bez kontextu je slepá. Dawiso pomáhá firmám dělat AI zodpovědně

AI bez kontextu je slepá. A právě kvůli tomu často selhávají firemní strategie, když se snaží držet krok s konkurencí. Nestačí nasadit chatbot nebo analyzovat reporty pomocí jazykového modelu. Aby umělá inteligence opravdu přinášela hodnotu, potřebuje znát širší souvislosti, kvalitní vstupy a jednotný jazyk, kterému rozumí nejen lidi, ale i stroje. Se Samuelem Nagy, VP of Strategic Growth v Dawiso, jsme si povídali o tom, proč AI potřebuje kontext, jakou roli v tom hraje datový katalog, a co všechno se musí stát, aby firmy mohly AI využívat bezpečně, efektivně a s důvěrou.
Dawiso je platforma, která spojuje datovou i AI governance. Co to přesně znamená a proč je dnes důležité mít přehled nejen o datech, ale i o tom, jak firmy využívají umělou inteligenci?
Dawiso je platforma, která začala jako data governance řešení pro velké enterprise firmy. Jak se ale trh i umělá inteligence postupně vyvíjely, začali jsme si stále víc uvědomovat, že data governance má velký přesah právě do řízení AI nástrojů. Konkrétně jejich zpřístupňování a vytváření v rámci organizací. Tímto směrem proto do platformy přidáváme stále víc funkcí.
Je to důležité hlavně proto, že aby AI fungovala kvalitně, potřebuje mít dobré vstupy a širší kontext. U klasické „datařiny“ jsme zvyklí, že když něco zadáme člověku, tak si spoustu věcí domyslí. Ví, jak to má spočítat, odkud si vzít data, protože zná datový sklad. Nebo třeba tuší, že ten report je pro sales tým, takže použije data ze salesového martu. Ale AI tohle neumí. Potřebuje dodat veškeré informace včetně kontextu, aby výstupy dávaly smysl. A právě v tom vidíme dneska roli datového katalogu.
Vaše řešení stojí na myšlence „data pro každého“ – tedy že s nimi mohou pracovat i netechnické týmy. Jak taková platforma funguje v praxi?
Já se zase vrátím k tomu, že jsme data governance platforma. Ty původní platformy řešily hlavně regulatorní požadavky, typicky ve finančním sektoru, kde přišel centrální tlak na zavedení nějaké formy governance.
My jsme k tomu ale přistoupili trochu jinak a díváme se na to, kde může governance a datový katalog reálně přinášet hodnotu. Jednu z největších příležitostí vidíme v tom, že byznysoví uživatelé často nerozumí datové infrastruktuře, což ani nemusí, není to jejich role. Ale potřebují s daty pracovat, najít si je, přidat vstupy nebo definice. A právě to v mnoha organizacích nefunguje.
Naše platforma je postavená tak, aby ji zvládli používat i lidé ze salesu, marketingu a dalších netechnických týmů. V praxi to znamená, že celé uživatelské rozhraní vyvíjíme s důrazem na jednoduchost. Cílem je, aby uživatel nepotřeboval žádné školení. Aby si sám dokázal najít data, která potřebuje, bez pomoci kolegů. Tím umožňujeme dostat znalosti těchto uživatelů na jedno místo a pracovat s nimi. To je velký rozdíl oproti jiným datovým katalogům, které s byznysovými uživateli tolik nepočítají.
Co je tedy potřeba k úspěšné adopci?
Aby měl datový katalog skutečně přidanou hodnotu, tedy nejen to že si odškrtneme regulatorní požadavky, je klíčové vytvořit aktivní komunitu kolem celé platformy. A to nejen z technických týmů, ale hlavně z těch netechnických. Potřebujeme, aby lidé měli chuť a důvod se o definice starat, protože v tom sami vidí hodnotu. Pak může celá organizace fungovat mnohem lépe.
My na to máme nastavený i pricing. Platforma je koncipovaná tak, aby v ní mohla fungovat široká komunita. Platí se jen za aktivní uživatele, není tam žádné další nacenění za deployment, scannery nebo jiné části. Všechno je již v ceně za aktivního uživatele. To vnímáme jako hlavní metriku úspěchu. Čím víc aktivních uživatelů, tím větší hodnotu platforma přináší. A právě na to teď dokonce připravujeme i několik AI funkcí, o kterých budeme brzy mluvit.
Jedním z hlavních pilířů Dawiso je AI governance – tedy zodpovědné řízení umělé inteligence. V čem firmám konkrétně pomáháte, a jak se to liší od běžné datové správy?
Já bych na začátek řekl, že AI governance je jen jedním z aspektů, jak se k AI v Dawiso stavíme. Umíme ji podpořit, ale nemyslíme si, že je to to nejdůležitější, pokud jde o rozvoj AI v organizacích.
Každopádně téma AI governance dnes hodně souvisí s AI Actem, tedy s nařízením Evropské unie, které definuje, jak by firmy měly přistupovat k AI řešením. Jedním z hlavních požadavků je dodržení compliance. Například zmapovat, jaká data AI využívá, jestli mezi nimi nejsou citlivá nebo GDPR data, a jaký dopad mohou mít výstupy na uživatele.
A proč dává smysl řešit AI governance v datové platformě, ne v samostatném řešení? Protože když už máte zmapované datové prostředí, respektive víte, odkud data pochází, jak se používají a kam proudí, tak je mnohem snazší tyto požadavky naplnit. Dawiso k tomu umí dodat správné vstupy a kontext a pomoci firmám zvládnout AI governance co nejefektivněji a s co nejmenší náročností.
Obecně ale vnímáme, že mimo státní správu nebo opravdu velké instituce není AI governance zatím hlavním tématem. Většina firem teď řeší spíš samotnou implementaci AI, kde jsou technické překážky a kde to naopak může přinést přidanou hodnotu.

Vaše AI-powered funkce umožňují např. automatické sumarizace nebo generování popisů. Jaké jsou podle vás reálné přínosy generativní AI v oblasti správy dat?
My s AI pracujeme už od doby, kdy začal být populární ChatGPT. Nejdřív jsme integrovali nástroje, které pomáhaly s psaním definic a zjednodušovaly práci s texty. Postupem času, jak se modely zlepšovaly a jejich kontextové okno se rozšířilo, jsme začali objevovat nové možnosti využití generativní AI v datovém katalogu.
Hlavní přínos vidíme v tom, že klasická implementace katalogu bývá časově náročná. Firmy musí investovat spoustu času a úsilí, aby někdo popsal jednotlivé datové assety, typicky tabulky ve warehousu nebo reporty, alespoň základním popisem: co to je, proč to existuje, jak se to používá. Díky větším možnostem dnešních modelů a jejich většímu kontextovému oknu ale dokážeme část těchto popisů generovat automaticky. Právě teď v létě přicházíme s novými funkcemi, které umožňují už při prvotní implementaci vytvořit základní verzi katalogu. Ta doručí hodnotu rychle, a hlavně umožní datovým vlastníkům, aby nemuseli vše psát od nuly. Místo toho jen upravují a doplňují návrhy od AI.
Kde je tedy naopak třeba opatrnosti v tomto směru?
Naším cílem není nahrazovat lidi, ale urychlit práci. Pořád držíme model „human in the loop“. Vše, co vygeneruje AI, je jasně označené a očekává se, že to vlastníci zkontrolují. Víme, že AI nikdy nebude rozumět firmě tak jako její vlastní zaměstnanci, minimálně ne v dohledné době. Díky tomu je generování popisů bezpečné, ale zároveň výrazně urychluje onboarding. Nechceme, aby se používaly definice, které nedávají smysl nebo nejsou relevantní. Firmy tak rychleji získají funkční katalog, který pak mohou využít i pro další rozvoj, třeba AI chatboty nebo agentní systémy.
Funkce jako data lineage nebo business glossary pomáhají chápat kontext dat. Jak právě kontext a porozumění zvyšují důvěru v AI systémy, které na těchto datech staví?
Popsal bych to ze dvou úhlů. První je kontext kolem samotných AI systémů, tedy schopnost popsat, jaká data do nich vstupují a odkud pocházejí. Když uživatelé vidí, že AI pracuje se správnými daty ze správných zdrojů, mají k ní větší důvěru.
Druhý úhel se týká fungování AI. Kontext je tady naprosto klíčový, protože datové prostředí ve firmách je složité. Neexistuje jedna správná odpověď – záleží, kdo se ptá, na jaká data má přístup, v jakém systému se informace nacházejí, a co vlastně má daný dotaz znamenat. Aby AI mohla správně reagovat, musí tenhle kontext chápat. A právě datový katalog je nástroj, který takový kontext poskytuje. Bez něj se AI ve firmě těžko zorientuje.
V metadatech se často skrývá chaos – různé definice, nejasné termíny, zdvojené záznamy. Jak Dawiso pomáhá firmám udělat v jejich „datové krajině“ pořádek?
Já bych ani neřekl, že se ten chaos skrývá v metadatech. Spíš je to problém celé datové sféry. Třeba v tom, že existuje víc verzí stejného reportu nebo že různé týmy používají různé definice pro stejnou věc. Metadata by naopak měla být tím nástrojem, který v tom udělá pořádek, vše standardizuje a pomůže vše sjednotit.
Dawiso k tomu nabízí několik funkcí. Tou primární je skenování. Jsme schopni načíst metadata ze všech systémů, které firma používá, a vytvořit z nich mapu prostředí. Vidíme, jak spolu souvisí tabulky, sloupce, reporty a metriky. Z toho vznikne datová lineage, která ukáže, jak data proudí a proč.
Součástí katalogu je ale i přiřazení vlastníků. Každý datový asset, ať už jde o tabulku nebo byznysovou definici, má mít někoho, kdo za něj zodpovídá. To je jedním z hlavních cílů skenování. Pomáhá to předejít tomu, že si každý tým definuje věci po svém.
Typickým příkladem je definice zákazníka. Ve velké firmě se často stává, že retail, korporátní část nebo legal mají každý jinou představu, koho do této kategorie počítat. Dawiso nabízí byznysový slovník, kde jsou všechny definice na jednom místě a s jasnou odpovědností. Díky tomu se tyto definice dají snadno použít i při tvorbě nových tabulek nebo reportů a čísla tak budou vždycky sedět.
Zmiňujete, že AI je jen tak dobrá, jak kvalitní jsou její vstupy. Jak se snažíte firmám pomáhat, aby předešly problému „garbage in, garbage out“?
Primárně tím, že pomáháme zmapovat datové zdroje. Umíme se integrovat i s nástroji na datovou kvalitu, ale základem je vždy vědět, s jakými daty AI vlastně pracuje.
V poslední době spolupracujeme i s firmami, které řeší governance nestrukturovaných dat, typicky dokumentů a interních směrnic. To je častý první use case pro AI, třeba ve formě interního chatbotu. Problém ale bývá v tom, že dokumenty nejsou popsané, nikdo neví, co přesně se do AI dostává. Dawiso umožňuje vytvořit mapu dokumentů přes metadata a nastavit, aby AI používala jen ty relevantní a schválené.
U strukturovaných dat pak platí to samé. Když vím, jaká data používám, můžu posoudit jejich kvalitu, sjednotit je pomocí master data managementu a určit, kdo za ně zodpovídá. Právě tohle porozumění datům je první krok k tomu, aby AI pracovala se správnými vstupy a nevznikalo „garbage out“.
Máte nějaký příklad kdy z toho vzniklo „garbage out“?
Typicky u dokumentů, když si firma napojí AI na SharePoint, kde má deset verzí jednoho souboru. Někdo aktualizoval dokument, ale staré verze zůstaly a AI si pak náhodně vybírá, z čeho bude čerpat. Výsledkem jsou zmatené a často nekvalitní odpovědi.
Ve chvíli, kdy jsme u těchto klientů zavedli governance nestrukturovaných dat, se situace výrazně zlepšila. Vždy je určen jeden master dokument, se kterým AI pracuje a díky tomu jsou výstupy mnohem přesnější.

Dawiso nabízí i přirozené rozhraní pro práci s daty – vyhledávání ve stylu „Google“, propojení se Slackem… Proč je podle vás intuitivnost klíčem k demokratizaci dat a AI nástrojů?
My nepracujeme přímo s daty, ale s metadaty. A to, pročje to důležité souvisí s tím, o čem jsme mluvili. Metadata jsou klíčová pro to, aby AI, třeba jako interní chatbot nebo agent, mohla správně fungovat. AI totiž potřebuje ten byznysový kontext. Dneska totiž spousta znalostí o tom, jak fungují firemní procesy, jak se počítají metriky nebo jak se nad daty přemýšlí, existuje jen v hlavách zaměstnanců. Pokud takové know-how není nikde uložené, nemůže se k němu AI dostat. Pokud ale nabídneme dostatečně intuitivní rozhraní, dokážeme tyto znalosti z lidí dostat ven a uložit je na jedno místo, odkud se dají zpracovat a použít jako vstup pro AI.
Naopak pokud postavíme platformu, která bude sice robustní, ale nebude uživatelsky přívětivá, bude ji používat jen úzká skupina specialistů, kteří často neznají ten byznysový kontext. Tím bychom přišli o možnost AI dál rozvíjet. Intuitivnost je proto naprosto klíčová nejen pro šíření datové kultury, ale i pro rozvoj AI nástrojů.
Jak to vypadá v praxi? Je to tedy jako když jdeš na Google?
Přesně tak. Máme v platformě výkonný vyhledávač, který umožňuje i laikům snadno najít, co potřebují. Ve chvíli kdy to sami používají a najdou co potřebují, tak mají motivaci do toho i sami přispívat.
Letos jsme navíc spustili vlastního chatbota, který může běžet buď samostatně, nebo být integrovaný třeba do Slacku nebo do Teamsů. Uživatelé se ho můžou přirozeně doptávat na metadata uložená v Dawiso, aniž by museli do platformy vůbec jít. Typicky když probíhá nějaká diskuze o reportech nebo metrikách, dá se to ve Slacku rovnou vypsat a člověk má odpověď hned po ruce.
Vaše hodnoty jako curious, inclusive a empowering naznačují, že věříte v otevřenost a přístupnost. Jak se tyto principy promítají do vašeho vývoje produktu i spolupráce s klienty?
Naším cílem je vždycky podporovat uživatele v tom, aby byli samostatnější a víc datově informovaní. Aby se mohli rozhodovat na základě dat. Tím, že jim dáme nástroj, který jim umožní si ta data najít sami.
Co se týče vývoje produktu, tak pokud chce člověk dělat startup a vyvíjet nový produkt, musí mít otevřenou mysl. Musí se nebát zpětné vazby, toho, co přijde z trhu, a být ochotný naslouchat. A já jsem přesvědčený, že to dlouhodobě děláme. Nasloucháme našim zákazníkům a platformu upravujeme tak, aby co nejvíc odpovídala jejich aktuálním potřebám.
Jak podle vás bude vypadat budoucnost datové a AI governance? Míříme k větší automatizaci, nebo naopak poroste potřeba lidského dohledu a vysvětlitelnosti? A kde v tom vidíte místo Dawiso?
Myslíme si, že pokud jde o samotné platformy a tvorbu obsahu, bude role člověka v přímém psaní a manuální práci čím dál menší. Lidé se budou mnohem víc soustředit na validaci, rozhodování a garanci. Ale už nebudou muset všechno tvořit od nuly. Právě v tom se dnes pálí nejvíc času.
Co se týče širší budoucnosti datových katalogů, vidíme je jako nástroj pro budování kontextového modelu celé organizace. Nejen z pohledu metadat, ale jako zdroj kontextu pro AI, aby chápala, co se ve firmě děje, kde a proč. S tím, jak ve firmách přibývá AI use casů, poroste i potřeba mít jednoduché, rychle nasaditelné katalogy, které tenhle kontext umí doručit. A to bez toho, aby implementace trvala měsíce nebo roky. A přesně tohle je oblast, kde vidíme roli Dawiso.