In un’epoca contrassegnata dalle produzioni digitali è difficile comprendere se un contenuto è stato generato da un essere umano o da una macchina. A tal proposito, portando una questione simile in tribunale, Getty Images, ha citato in giudizio Stability AI, la società dietro a Stable Diffusion, per presunta violazione del copyright. È stata dunque intentata una causa contro la società Stability AI Inc., accusandola di “violazione sfacciata” nell’utilizzo di oltre 12 milioni di fotografie dalla collezione della società di immagini stock per addestrare il suo generatore di immagini di intelligenza artificiale Stable Diffusion. Recentemente la causa è stata intentata in un tribunale federale del Delaware il 3 febbraio: la causa sostiene inoltre che Stability ha “rimosso o alterato le informazioni sulla gestione del copyright di Getty Images, fornito false informazioni sulla gestione del copyright e violato i famosi marchi attraverso vari trattamenti sulla filigrana dell’azienda” nelle foto presenti e nelle immagini generate.

Le accuse di Getty nei confronti di Stability includono violazione del copyright, fornitura di false informazioni sulla gestione del copyright, rimozione o alterazione delle informazioni sulla gestione del copyright, violazione del marchio, concorrenza sleale e pratiche commerciali ingannevoli ed i legali di Getty hanno richiesto un processo e preteso il risarcimento dei danni per una cifra che corrisponde circa a $ 150.000 per ogni opera violata.

Trattando del tema relativo alla violazione del copyright, in Italia la legge di riferimento è la Legge 22.04.1941 n. 633 (Legge sulla protezione del diritto d’autore), ma si reputano di pari importanza le normative di riferimento attinenti alla Convenzione di Berna e la Direttiva 2001/29/CE, Diritto d’autore e società dell’informazione. Nello specifico, bisogna comprendere cosa si intende per “eccezione per finalità di estrazione di testo e di dati”, facendo espresso riferimento agli articoli 3 e 4 della Direttiva Ue Copyright inerenti alla disciplina del rapporto tra diritti esclusivi e uso automatizzato.

Alla fine del 2021, precisamente il 5 novembre, è stato approvato il decreto di recepimento della Direttiva Copyright 2019/790/UE. Il d.lgs. 177/2021, che modifica la legge sul diritto d’autore, introducendo nella legislazione nazionale i nuovi articoli 70-ter e 70-quater, l. 633/1941 che recepiscono l’eccezione di Text and Data Mining (TDM) presenti agli articoli 3 e 4 della Direttiva. Le tecnologie di Text and Data Mining, intese come “qualsiasi tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni inclusi, a titolo non esaustivo, modelli, tendenze e correlazioni” non sono altro che sistemi automatizzati in grado di elaborare un elevato numero di informazioni in tempi minimi e fornire l’output richiesto. In genere, le tecnologie relative ai sistemi di intelligenza artificiale generativa si “auto-addestrano” grazie all’uso di algoritmi di apprendimento automatico che esaminano enormi quantità di dati, avvalendosi di tali informazioni per produrre nuovi contenuti simili a quelli già esistenti. La suddetta analisi potrebbe altresì essere interpretata come una effettiva riproduzione dei dati e delle fonti utilizzate, tra cui potrebbero annoverarsi anche opere protette, da cui potrebbero susseguirsi problemi di coordinamento con la disciplina a tutela del diritto d’autore e dei diritti ad esso connessi, specialmente col “diritto esclusivo di riproduzione ex art. 13 legge sul diritto d’autore n. 633/1941”.

Relativamente alla disciplina del diritto d’autore, gli interpreti si sono interrogati sull’eventuale possibilità di realizzare un’elaborazione creativa dell’informazione e/o dell’opera protetta. Il legislatore europeo si è espresso affermando che “nel processo di elaborazione dei dati, l’assenza di un’autorizzazione da parte dell’autore dell’opera da cui sono estratti può integrare una violazione del diritto d’autore”, pertanto è stata necessaria una riforma della materia attraverso l’introduzione di alcune eccezioni e limitazioni al diritto d’autore obbligatorie per ogni Stato Membro. Dunque, circa l’estrazione dei dati, si fa menzione della Direttiva Copyright 2019/790/UE, la quale introdotto le eccezioni di c.d. di text and data mining (TDM), disciplinate agli artt. 3 (Estrazione di testo e di dati per scopi di ricerca scientifica) e 4 (Eccezioni o limitazioni ai fini dell’estrazione di testo e di dati) che potrebbero essere rilevanti per l’addestramento dei sistemi di intelligenza artificiale. Il TDM viene definito all’art. 2 della Direttiva Copyright come “qualsiasi tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni inclusi, a titolo non esaustivo, modelli, tendenze e correlazioni”.

In Italia, i suddetti articoli sono presenti grazie all’introduzione – nella legge sul diritto d’autore – degli artt. 70-ter, relativo unicamente l’estrazione per fini scientifici da parte di organismi di ricerca e istituti di tutela del patrimonio culturale e 70-quater, circa l’estrazione di testo e dati a livello generico, includendo il mero fine di lucro.