Shadow AI — Dimbo White Paper 03

Abstract L'IA generativa di consumo è stata adottata dalla forza lavoro più rapidamente di qualsiasi tecnologia aziendale a memoria d'uomo — e in larga parte senza autorizzazione. Circa il 75% dei knowledge worker oggi usa l'IA sul lavoro, e circa il 78% porta con sé i propri strumenti per farlo.[1] Quasi la metà dei dipendenti ammette di inserire informazioni aziendali non pubbliche negli strumenti di GenAI pubblici.[2] Ogni interazione di questo tipo è un trasferimento incontrollato di dati aziendali verso un fornitore di modelli di terze parti — spesso al di fuori dell'UE — senza alcun log, senza valutazione della base giuridica e senza pista di controllo. Questa è la shadow AI: l'erede dello shadow IT, ma con una differenza decisiva — lo shadow IT teneva i dati dentro l'organizzazione, mentre la shadow AI li invia fuori. Raccogliamo le evidenze sulla sua portata, spieghiamo perché il rimedio riflesso — il divieto — fallisce sistematicamente, mappiamo la collisione normativa (GDPR, Schrems II, il CLOUD Act statunitense, l'AI Act europeo, NIS2) e ne quantifichiamo il rovescio. Sosteniamo poi che l'unico rimedio duraturo è la sostituzione, non il divieto: un assistente governato, sovrano e con ambito ristretto per ruolo, che gira all'interno del perimetro, risponde a partire dalla conoscenza aziendale viva, anonimizza i dati personali prima ancora che qualsiasi modello esterno venga toccato, e registra ogni interrogazione in una pista di controllo. La tesi in una riga: i dati hanno già lasciato l'azienda; il compito è portare l'IA all'interno.

1. La portata della shadow AI

La curva di adozione dell'IA generativa di consumo non ha precedenti aziendali. Il Work Trend Index 2024 di Microsoft e LinkedIn — un'indagine su 31.000 lavoratori in 31 Paesi — ha rilevato che il 75% dei knowledge worker usa già l'IA sul lavoro e, cosa cruciale, che il 78% di essi porta i propri strumenti di IA ("BYOAI") anziché attendere uno strumento autorizzato.[1] L'adozione non ha seguito la governance; l'ha superata con ampio margine.

La conseguenza è una fuoriuscita di dati su vasta scala. Il Data Privacy Benchmark Study 2024 di Cisco — 2.600 professionisti di privacy e sicurezza in 12 aree geografiche — riporta che il 48% dei dipendenti ammette di inserire informazioni aziendali non pubbliche negli strumenti di GenAI.[2] La telemetria indipendente affina il quadro: Cyberhaven, analizzando l'utilizzo di circa 1,6 milioni di lavoratori, ha rilevato che l'11% dei dati che i dipendenti incollano in ChatGPT è confidenziale, con materiale a uso interno, codice sorgente e dati dei clienti tra le categorie più comuni, e l'azienda media che fa trapelare materiale confidenziale centinaia di volte a settimana.[3]

Usa l'IA sul lavoro75%

Porta la propria IA78%

La alimenta con dati non pubblici48%

Incolla confidenziale11%

FIG 1 — La portata della shadow AI. L'adozione (blu) ha superato la governance; la fuga di dati (grigio) è seguita. Fonti: Microsoft & LinkedIn, Work Trend Index 2024 (uso / BYOAI); Cisco 2024 (dati non pubblici); Cyberhaven (quota confidenziale degli incolla).[1][2][3]

L'etichetta conta. Questo non è "shadow IT" — il problema decennale dei dipendenti che adottano SaaS non autorizzati. Lo shadow IT, con tutti i suoi rischi, per lo più teneva i dati aziendali dentro strumenti che l'azienda poteva alla fine scoprire, inventariare e governare. La shadow AI ribalta tutto questo: i dati vengono copiati fuori dal perimetro, dentro l'infrastruttura di un fornitore di modelli, nell'istante in cui un dipendente preme invio. Non c'è alcun inventario ombra da riconciliare in seguito, perché il trasferimento è già completo e, nel caso generale, irreversibile.

48%

dei dipendenti ammette di inserire informazioni aziendali non pubbliche negli strumenti di GenAI pubblici — mentre oltre un quarto delle organizzazioni ha già vietato del tutto questi strumenti.

Fonte: Cisco, 2024 Data Privacy Benchmark Study.

Il lettore deve tenere insieme due fatti: gli strumenti offrono una produttività reale e percepita (ecco perché il 78% li adotta senza chiedere), e ogni uso di uno strumento non governato è un piccolo evento di esfiltrazione di dati. Quella combinazione — valore genuino più fuga genuina — è precisamente ciò che rende il problema difficile, e ciò che esclude la soluzione ovvia.

2. Perché il divieto fallisce

La risposta istintiva è vietare. Più di un'organizzazione su quattro ha già fatto esattamente questo — Cisco ha rilevato che oltre il 27% delle organizzazioni aveva vietato l'uso dell'IA generativa per preoccupazioni di privacy e sicurezza.[2] I divieti non funzionano, per due ragioni strutturali.

2.1 Lo strumento è utile, e il BYOAI aggira il divieto

Quando il 78% dei lavoratori porta già la propria IA,[1] un divieto di policy non rimuove lo strumento; rimuove la versione autorizzata e osservabile di esso e spinge l'uso su telefoni personali, account personali e dispositivi personali — precisamente i canali che il team di sicurezza non può vedere. Un divieto converte un rischio visibile in uno invisibile. Il lavoratore mantiene il vantaggio di produttività; l'organizzazione perde l'ultimo brandello di telemetria che aveva.

2.2 Il divieto è conflittuale, e il divario di produttività è reale

Chiedere a una forza lavoro di rinunciare a uno strumento che accelera in modo misurabile il suo lavoro, senza offrire nulla in cambio, crea un incentivo permanente ad aggirare la regola — e seleziona gli utenti più motivati, spesso più senior, perché spingano più in profondità nella clandestinità. È la stessa lezione che il settore ha già imparato con lo shadow IT un decennio fa: la risposta alla condivisione di file non autorizzata non è mai stata vietare la condivisione di file — è stata fornire un equivalente autorizzato abbastanza buono da rendere superfluo quello non autorizzato. La mossa vincente è stata la sostituzione, non il divieto.

Dimensione	Divieto	Sostituzione — un'alternativa governata
Effetto sull'uso	lo spinge in clandestinità	✓ lo attira su uno strumento autorizzato
Fuoriuscita di dati	✗ continua, ora invisibile	✓ resta dentro il perimetro
Pista di controllo	✗ nessuna — evento non osservabile	✓ ogni interrogazione registrata
Rapporto con il personale	conflittuale	✓ allineato — l'interno è la via facile
Produttività	persa o catturata fuori piattaforma	✓ mantenuta, sulla piattaforma

FIG 2 — Non puoi governare ciò che non puoi vedere, e un divieto garantisce che non lo vedrai. L'unica via duratura è rendere l'opzione interna quella migliore.

La conclusione non è "governare meglio la shadow AI". Non puoi governare ciò che non puoi vedere, e un divieto garantisce che non lo vedrai. L'unica via duratura è rendere l'opzione interna quella a cui i dipendenti ricorrono per prima.

3. La collisione normativa

Per un'azienda europea, un dipendente che incolla dati aziendali in un modello ospitato negli Stati Uniti non è semplicemente una falla di sicurezza — è una collisione con diversi regimi giuridici sovrapposti in un colpo solo, e a risponderne è l'azienda, non il dipendente.

GDPR (Regolamento (UE) 2016/679). Se il testo incollato contiene qualsiasi dato personale — il nome di un cliente, un'e-mail, il contatto di un fornitore, il record di un dipendente — l'atto è un trattamento, e inviarlo a un fornitore di modelli di terze parti è una comunicazione, nella maggior parte delle configurazioni un trasferimento verso un Paese terzo. Avviene senza alcuna valutazione della base giuridica, senza registro dei trattamenti e senza valutazione d'impatto sulla protezione dei dati. Il titolare — il datore di lavoro — porta l'obbligo indipendentemente dal fatto che sapesse o meno che il trasferimento è avvenuto.[5]

Schrems II (CGUE, Causa C-311/18). La Corte di giustizia ha invalidato il Privacy Shield UE–USA nel 2020, stabilendo che i trasferimenti di dati personali verso gli Stati Uniti richiedono garanzie supplementari perché la normativa statunitense sulla sorveglianza non offre una protezione equivalente a quella dell'UE.[7] Un successivo quadro di adeguatezza esiste, ma resta politicamente contestato e giuridicamente fragile. L'incolla di un dipendente in un LLM statunitense è esattamente il trasferimento transatlantico che Schrems II disciplina — eseguito senza nessuna delle garanzie che la sentenza richiede.

Il CLOUD Act statunitense (2018). I fornitori con sede negli Stati Uniti possono essere obbligati a produrre i dati in loro custodia indipendentemente da dove nel mondo siano fisicamente conservati.[8] "I dati sono su server UE" non è quindi, di per sé, una garanzia di sovranità quando il fornitore è soggetto alla giurisdizione statunitense — il nodo del problema di residenza per l'industria europea regolamentata.

L'AI Act europeo (Regolamento (UE) 2024/1689). Il regolamento dell'Unione sull'IA, che entra in vigore per fasi scaglionate, impone obblighi di trasparenza sull'IA per finalità generali e obblighi di supervisione umana e gestione del rischio sugli usi ad alto rischio.[6] L'IA di consumo non governata, incorporata — invisibilmente — in un processo regolamentato (un batch record farmaceutico, una decisione di sicurezza, una valutazione del credito) è per definizione rischio di IA non gestito, ed è l'organizzazione che la impiega a dover dimostrare una supervisione che non può documentare.

NIS2 (Direttiva (UE) 2022/2555). Per le aziende rientranti nell'ambito, la NIS2 amplia i doveri di gestione del rischio in materia di cybersecurity e catena di fornitura e innalza la responsabilità al livello dirigenziale.[9] La fuoriuscita incontrollata di dati verso servizi di IA di terze parti è una lacuna di governance che ricade direttamente negli obblighi di gestione del rischio che la NIS2 rende non delegabili.

Regime	Obbligo fondamentale	Cosa fa un incolla di shadow AI
GDPR (2016/679)	Base giuridica + trasferimento controllato	✗ trasferimento verso Paese terzo non valutato
Schrems II (C-311/18)	Garanzie per i trasferimenti verso gli USA	✗ trasferimento senza garanzie
CLOUD Act USA	(esposizione) portata della giurisdizione USA	✗ dati esigibili, ovunque conservati
AI Act UE (2024/1689)	Supervisione umana dell'IA ad alto rischio	✗ IA non governata in un processo regolamentato
NIS2 (2022/2555)	Gestione del rischio + responsabilità	✗ fuoriuscita incontrollata e non registrata

FIG 3 — Cinque regimi, un presupposto comune: l'organizzazione sa quali dati si muovono e dove, e può provare di controllarli. La shadow AI sconfigge quel presupposto alla radice — perché la caratteristica distintiva dell'evento è che nessuno l'ha registrato.

Il filo comune a tutti e cinque: ogni regime presume che l'organizzazione sappia quali dati si muovono e dove, e possa dimostrare di averne il controllo. La shadow AI sconfigge quel presupposto alla radice, perché la caratteristica distintiva dell'evento è che nessuno l'ha registrato.

4. Il costo quando va male

Il rovescio finanziario è ben quantificato all'estremo superiore. Il Cost of a Data Breach Report 2024 di IBM colloca il costo medio globale di una violazione a 4,88 milioni di USD — il più alto mai registrato.[4] Nessuna azienda del mid-market dovrebbe aspettarsi quella cifra — è una media globale su tutte le dimensioni — ma calibra la coda del rischio.

$4.88M

il costo medio globale di una violazione di dati nel 2024 — il più alto mai registrato. Un'azienda del mid-market non vedrà questo numero; calibra la coda di rischio a cui l'evento invisibile la espone.

Fonte: IBM, Cost of a Data Breach Report 2024.

Il costo operativo più grande spesso non è una violazione notificabile, ma la perdita irreversibile di segreti industriali. In un incidente ampiamente riportato nel 2023, Samsung ha limitato l'uso di ChatGPT da parte dei dipendenti dopo che alcuni ingegneri avevano incollato codice sorgente interno e appunti di riunioni nello strumento per eseguirne il debug e riassumerli.[10] Il materiale in questione — una formulazione, un modello di prezzo, codice sorgente, un processo proprietario — non torna indietro una volta entrato nei sistemi di un terzo e, potenzialmente, nei suoi dati idonei all'addestramento. Per un produttore il cui intero vantaggio competitivo è una ricetta di processo, è l'asset stesso che esce dalla porta.

E il problema che si aggrava sotto entrambi è l'invisibilità. Non puoi quantificare, rimediare o notificare un incidente che non hai mai osservato. Ogni regime del §3 richiede all'organizzazione di dimostrare il controllo; un evento di shadow AI non produce alcun log con cui dimostrare alcunché. L'assenza di prove non è una semplice scomodità di rendicontazione — ai sensi di GDPR e NIS2 l'incapacità di mostrare cosa è accaduto è essa stessa un fallimento di conformità.

Nota di onestà

Una visione prudente del costo atteso — la probabilità annua di un incidente rilevante collegato alla shadow AI rispetto a un impatto scalato sul mid-market — si attesta comunque su decine di migliaia di euro all'anno per un'azienda rappresentativa da €40M, prima di qualsiasi coda legata ai segreti industriali. Quella costruzione è un'analisi Dimbo, esposta per intero nel Value Model di accompagnamento; il punto qui è direzionale, non preciso. Il rischio non conteggiato di fuga competitiva — prezzi, formulazioni, codice sorgente — è ancora più grande e il meno quantificabile.

5. L'alternativa governata

Se il divieto fallisce e lo strumento è genuinamente utile, il rimedio è rendere l'opzione governata, dentro il perimetro quella a cui i dipendenti ricorrono per prima. Quattro proprietà rendono credibile quel sostituto — e ciascuna è una proprietà reale e presente del sistema, non una certificazione che non possediamo.

Sovrano per impostazione predefinita. Dimbo gira interamente sull'infrastruttura del cliente su un modello locale sottoposto a benchmark — un LLM locale di classe gemma alla pari del riferimento su una singola GPU di classe workstation, con visione locale e trascrizione vocale locale. Il funzionamento air-gapped è l'impostazione predefinita, non un livello premium. Quando un modello esterno viene mai usato, i dati personali vengono anonimizzati a un gateway Presidio prima che qualsiasi testo lasci il perimetro — il vincolo architetturale rigido che inverte la modalità di fallimento della shadow AI. Dove l'IA di consumo copia i dati fuori, Dimbo li tiene dentro.

Interrogazione dipendenteSulla conoscenza aziendale

→

GatewayDati personali anonimizzati

→

on-premise (locale) ospitato in UE cloud (mascherato) pista di controllo ✓

FIG 4 — Sostituzione per costruzione. Il ramo predefinito gira interamente on-premise; solo quando si sceglie un livello esterno il testo passa prima il varco dei dati personali — e ogni interazione finisce nella pista di controllo. L'assistente si ferma a proponi; l'autonomia si guadagna per processo, revocabile all'istante.

Ambito ristretto per ruolo, dalla conoscenza aziendale viva. L'assistente risponde alla domanda "come faccio X" a partire dall'archivio di conoscenza proprio dell'azienda, filtrato al momento del recupero in base al ruolo (RBAC in fase di recupero): un operatore vede la conoscenza dell'operatore, mai la cap table; un capo turno vede la linea, non i verbali del consiglio. Il dipendente ottiene la produttività che cercava dal chatbot di consumo — nella propria lingua — senza che i dati escano mai, e ogni interrogazione e la sua evidenza finiscono in una pista di controllo, che è precisamente il log che la shadow AI non produce mai.

Human-in-the-loop per costruzione. Ogni capacità inizia come una proposta che un umano approva; l'autonomia si guadagna per processo, solo con un track record misurato, e la promozione è sempre una decisione del cliente, con un kill-switch principale e un declassamento immediato verso il basso nel momento in cui un umano è in disaccordo. Questa è la scala di autonomia — e significa che gli obblighi di supervisione umana dell'AI Act europeo sono soddisfatti dal meccanismo centrale del prodotto anziché da un'appendice di conformità.

Onesto sui propri limiti. Le proprietà sopra sono reali: GDPR-by-design, sovranità dei dati, deployment on-premise, anonimizzazione dei dati personali, una pista di controllo completa, supervisione umana. Dimbo non rivendica la certificazione SOC 2 o ISO 27001. La rete opzionale di intelligence tra aziende è rigorosamente a opt-in ed è fornita con un confine dei dati dichiarato esplicitamente — nessun dato lo attraversa per impostazione predefinita. Vendere sovranità richiede di dichiarare esattamente dov'è il perimetro; è ciò che fanno queste barriere di sicurezza.

I dati hanno già lasciato l'azienda. Il compito non è presidiare l'uscita — è portare l'IA all'interno, dove il lavoro, la conoscenza e la pista di controllo già vivono. — La tesi della sostituzione

Uno scenario rappresentativo. Adriatica Pharma Services, una fittizia contract development and manufacturing organisation (CDMO), impiega un chimico di processo che — per redigere rapidamente un deviation report — incolla il batch record proprietario di un cliente in un chatbot pubblico. È al tempo stesso un evento GMP e un trasferimento GDPR, e nessuno lo registra. Con l'assistente sovrano e con ambito ristretto per ruolo di Dimbo, lo stesso chimico produce la stessa bozza dentro il perimetro: il modello gira localmente, i dati del cliente non escono mai, e l'interrogazione più l'evidenza su cui si è basata vengono scritte nella pista di controllo — disponibili mesi dopo quando l'auditor chiede come è stato prodotto il documento. La produttività è identica; l'esfiltrazione è sparita; il controllo che il regolatore esige ora esiste.

6. Conclusione — porta l'IA all'interno

La shadow AI non è un rischio futuro da gestire con una circolare di policy; è un evento di esfiltrazione di dati presente e quotidiano, già in atto su scala industriale — il 75% dei knowledge worker usa l'IA, il 78% porta la propria, il 48% la alimenta con dati non pubblici.[1][2] Il divieto non può chiuderlo, perché rimuove lo strumento autorizzato senza rimuovere la domanda sottostante, e così spinge la fuga di dati in canali che nessuno può vedere. Nel frattempo GDPR, Schrems II, il CLOUD Act, l'AI Act europeo e NIS2 convergono tutti su un unico requisito che l'evento di shadow AI sconfigge strutturalmente: sapere quali dati si muovono e dove, ed essere in grado di provare di controllarli.

La soluzione è la sostituzione. Dai alla forza lavoro un assistente almeno tanto utile quanto lo strumento di consumo, che gira sull'infrastruttura propria dell'azienda, che attinge alla conoscenza propria dell'azienda, filtrato per ciascun ruolo, che anonimizza tutto ciò che deve mai uscire e che registra ogni interazione. Questa è un'IA sovrana, governata e verificabile che l'azienda possiede — l'opposto di un incolla nel modello di qualcun altro. I dati hanno già lasciato l'azienda. L'unica risposta duratura è costruire la versione che non dovrà mai farlo.

Riferimenti

Microsoft & LinkedIn — 2024 Work Trend Index: AI at Work Is Here. Now Comes the Hard Part (75% dei knowledge worker usa l'IA sul lavoro; 78% porta la propria IA / "BYOAI"; 31.000 rispondenti in 31 Paesi). microsoft.com/worklab
Cisco — 2024 Data Privacy Benchmark Study (48% dei dipendenti ammette di inserire informazioni aziendali non pubbliche negli strumenti di GenAI; oltre il 27% delle organizzazioni ha vietato l'uso della GenAI; 2.600 professionisti di privacy/sicurezza in 12 aree geografiche). cisco.com
Cyberhaven — L'11% dei dati che i dipendenti incollano in ChatGPT è confidenziale (analisi su ~1,6M di lavoratori; codice sorgente, dati dei clienti e materiale a uso interno tra le principali categorie trapelate). cyberhaven.com
IBM — Cost of a Data Breach Report 2024 (costo medio globale di una violazione 4,88M USD — il più alto mai registrato). ibm.com
Regolamento (UE) 2016/679 — Regolamento generale sulla protezione dei dati (GDPR) (base giuridica, registro dei trattamenti, trasferimenti internazionali, responsabilizzazione del titolare). eur-lex.europa.eu
Regolamento (UE) 2024/1689 — Regolamento sull'intelligenza artificiale (AI Act) (obblighi di supervisione umana e gestione del rischio per l'IA ad alto rischio; trasparenza GPAI; entrata in vigore per fasi). eur-lex.europa.eu
Corte di giustizia dell'UE — Causa C-311/18 (Schrems II), sentenza del 16 luglio 2020 (ha invalidato il Privacy Shield UE–USA; i trasferimenti verso gli USA richiedono garanzie supplementari). curia.europa.eu
Stati Uniti — Clarifying Lawful Overseas Use of Data (CLOUD) Act, 2018 (i fornitori USA sono obbligabili a produrre dati indipendentemente dal luogo di conservazione). congress.gov
Direttiva (UE) 2022/2555 — Direttiva NIS2 (obblighi ampliati di gestione del rischio in materia di cybersecurity e catena di fornitura; responsabilità a livello dirigenziale). eur-lex.europa.eu
Bloomberg — Samsung Bans Staff's AI Use After Spotting ChatGPT Data Leak (maggio 2023; secondo quanto riferito, alcuni ingegneri avevano incollato codice sorgente interno e appunti di riunioni in ChatGPT). bloomberg.com

I dati contrassegnati con vanno confermati rispetto all'ultima versione prima della pubblicazione. Lo scenario Adriatica Pharma Services è un'illustrazione fittizia rappresentativa segnalata come analisi Dimbo. Nessuna certificazione non posseduta (SOC 2 / ISO 27001) è rivendicata in alcun punto di questo paper; la rete di intelligence tra aziende è descritta con il suo confine dei dati esplicito, dichiarato e a opt-in.

Shadow AI: i tuoi dati hanno già lasciato l'azienda