Nell’era della digital transformation i dati sono ormai linfa vitale per le aziende: alimentano l’innovazione, guidano il processo decisionale e supportano la definizione delle strategie di crescita.
Con l’avvento dell’AI generativa le aziende sono pronte a sbloccare nuove opportunità senza precedenti in termini di creatività, personalizzazione ed efficienza. Tuttavia, dietro a ciò si nasconde una sfida cruciale: garantire solide logiche di governance dei dati per sfruttare la potenza dell’AI generativa in modo responsabile ed efficace.
Uno studio condotto da Amazon Web Services e dal MIT Chief Data Officer/Information Quality Symposium evidenzia, infatti, una lacuna critica: l’indagine condotta su 334 CDO e Data Leader mostra che l’80% riconosce il potenziale trasformativo della AI generativa, ma solo il 6% delle aziende ha portato in produzione con successo le applicazioni. Inoltre, la maggior parte delle organizzazioni non ha ancora ottenuto un ritorno sostanziale dall’uso dell’AI generativa1.
La sfida più grande? La data preparation.
È quanto riporta un recente articolo dell’Harvard Business Review.
Preparare i dati di un’azienda per l’AI generativa, in particolare utilizzando documenti non concepiti per l’addestramento dei modelli, richiede di strutturare procedure di data governance per garantirne la qualità, la pertinenza e l’uso etico, sfruttando framework metodologici consolidati.
Cosa è la data governance?
La data governance è un sistema che garantisce una gestione dei dati sicura e di alta qualità in tutta l’organizzazione.
Dal punto di vista aziendale, la data governance si concentra sulla massimizzazione del valore strategico dei dati, su come sfruttarli per migliorare il processo decisionale e su come garantirne la conformità alle normative e standard di settore.
Da una prospettiva IT, la data governance comporta la definizione di policy, procedure e standard per l’archiviazione e l’accesso ai dati, nonché l’implementazione di tecnologie a supporto della qualità dei dati, della privacy e della gestione del ciclo di vita. Questo approccio integrato facilita il miglioramento dei risultati aziendali e l’efficienza delle operazioni IT.
Più in dettaglio, la data governance comprende tre principali strumenti business-oriented.
Il business glossary è una raccolta di termini aziendali che ha lo scopo di allineare tutta l’organizzazione (compresi i nuovi dipendenti) sulla terminologia utilizzata all’interno dell’organizzazione stessa per qualificare le entità di business (es: cosa si intende per prodotto, con che livello di dettaglio è identificato).
Il data catalog, invece, è un archivio centralizzato che raccoglie metadati e informazioni sugli asset dei dati di un’organizzazione. Ad esempio, raccoglie informazioni sul tipo di dati ownership e responsabilità, i criteri di qualità e di sicurezza che si applicano. Può essere utilizzato per costruire “Knowledge Graphs” che descrivono la struttura delle informazioni nell’organizzazione, fornendo così un guardrail ai motori della GenAI.
Infine, il data lineage assicura che le modifiche ai sistemi o alle fonti di dati siano documentate e tenute in considerazione negli aggiornamenti del modello. Fornisce il tracciamento e la visualizzazione del flusso di dati dalla loro origine, attraverso le varie fasi di elaborazione, fino alla destinazione finale. Fornisce una visione completa del percorso dei dati, compreso il modo in cui sono stati trasformati, da dove provengono, dove sono spostati e come sono stati utilizzati. Il data lineage è essenziale per comprendere, gestire e mantenere la qualità e l’integrità dei dati all’interno di un’organizzazione e nel tempo.
Perché serve la data governance per la Generative AI?
In un contesto retail, i contenuti generati dall’AI possono essere adattati alle preferenze dei singoli clienti, migliorandone coinvolgimento e soddisfazione.
Ad esempio, l’AI può creare campagne e-mail personalizzate con un linguaggio specifico che si allinea con il target o le raccomandazioni mirate sui prodotti, aumentando i tassi di conversione. Tuttavia, è importante che l’AI generativa attinga alle ultime versioni dei documenti aziendali (es: cataloghi), possa mappare quali condizioni di acquisto si applichino a cluster di clienti diversi per condizioni, evitando di diffondere informazioni non aggiornate e/o fuorvianti.
Lo stesso vale per la produzione. L’intelligenza artificiale può aiutare i tecnici a consultare la documentazione tecnica di apparecchiature e dispositivi. Per essere efficace e scalabile, la base di conoscenza deve essere strutturata in modo che il motore AI possa riconoscere l’ultima documentazione aggiornata da prendere in considerazione.
Questi sono due esempi di come l’adozione di framework di data governance possa portare benefici anche per la diffusione dell’AI generativa. La data governance, infatti, consente di perseguire:
- Garanzia della qualità dei dati: i dati di alta qualità sono la chiave di volta delle applicazioni AI di successo. La data governance supporta le aziende stabilendo standard per la raccolta, la preelaborazione e la convalida dei dati. Ciò garantisce che i dati in input per i modelli siano accurati, pertinenti e rappresentativi per l’azienda.
- Conformità etica e normativa: con la continua evoluzione delle tecnologie di AI sono emerse conseguenti preoccupazioni relative a privacy e bias. I framework di data governance forniscono meccanismi per garantire la conformità etica e normativa nello sviluppo e nell’implementazione dell’AI, integrando principi come la trasparenza, la responsabilità e l’equità.
- Gestione del rischio e sicurezza: la proliferazione delle tecnologie basate sui dati introduce nuovi rischi e vulnerabilità per le organizzazioni, che vanno dalle minacce informatiche alle violazioni dei dati. I framework di data governance forniscono strumenti per identificare, valutare e mitigare i rischi implementando solidi controlli di sicurezza, meccanismi di gestione degli accessi e tecniche di crittografia dei dati.
- Collaborazione e condivisione delle conoscenze: una data governance efficace promuove la collaborazione e la condivisione delle conoscenze tra i diversi team e le divisioni di un’organizzazione, stabilendo ruoli, responsabilità e processi chiari per la gestione dei dati.
Conclusione
L’integrazione dell’AI generativa nelle operations ha un immenso potenziale, ma deve essere sostenuta da una solida data governance.
Garantire un’elevata qualità e conformità dei dati, migliorandone la trasparenza, impatta non solo sull’efficacia dei modelli AI, ma crea anche fiducia e senso di responsabilità/responsabilizzazione. Man mano che le aziende sfruttano la potenza dell’AI generativa, l’adozione di framework di data governance sarà essenziale per sfruttarne appieno i benefici, promuovere l’innovazione e mantenere un vantaggio competitivo.
Intellico Group integra la visione tecnologica sull’AI di Intellico, con la conoscenza dei framework di data governance di doDigital, aiutando le aziende a implementare soluzioni end-to-end ed explainable.
Se volete saperne di più contattateci…
Contributors:
Sara Uboldi, Head of solutions Intellico
Giulio Nicelli, Partner Data Governance doDigital
Referenze:
- Harvard Business Review (2024), Is Your Company’s Data Ready for Generative AI?