Qual’è il nesso tra intelligenza artificiale e dati sintetici? Partiamo del presupposto che ci stiamo riferendo a dati che sono creati in maniera del tutto artificiale tramite un processo imitativo il mondo reale. In passato questa specifica tipologia di dati non era percepita in maniera non positiva, infatti si tendeva a dare preferenza ai dati considerati reali e provenienti dal mondo. Qual’è il limite che potremmo identificare per i dati definiti reali? Vediamolo insieme:
- I dati reali possono essere del tutto disordinati.
- Potrebbero essere distorti.
- Le nuove regolamentazioni in corso, rendono la loro gestione complessa a difficoltosa.
Parlando invece di quelli che vengono definiti dati sintetici, sono strutturati in maniera del tutto differente, sono in grado di produrre in tal senso dei volti che hanno un livello elevato di elaborazione, fornendo differenti parametri quali l’età, l’etnia. Questo consente di costruire un sistema definito di riconoscimento basato sul volto che possa funzionare da questo punto di vista in molti angoli del mondo.
Limiti dei dati sintetici
Quali sono i limiti che potrebbero avere i dati sintetici? La risposta è complessa, partendo dal presupposto che se non sono uno specchio fedele della realtà, potrebbero influire in maniera negativa sull’intelligenza artificiale.
Datagen
Parlando delle possibili applicazioni dei dati definiti sintetici, una sicuramente delle più originali fa capo ad un’azienda che si chiama Datagen. La particolarità di questa organizzazione privata è che in grado di creare delle identità umane completamente simili al mondo reale, tuttavia è bene fare una specifica in tal senso:
- Non stiamo parlando di avatar.
- Si tratta di dati sintetici in tutto e per tutto.
Qual’è il loro utilizzo e il loro scopo? La risposta corretta è che servono a implementare gli algoritmi legati all’intelligenza artificiale. Se pensiamo alla raccolta di dati legati al mondo reale, il procedimento per arrivare a questo è laborioso e implica dei costi notevoli. Al contrario quest’azienda fornisce dati sintetici che sono tuttavia prodotti avvalendosi della scansione di esseri umani reali.
Questo tramite body scanner molto grandi e sofisticati che sono in grado di rilevare ogni dettaglio di un essere umano, si parla in tal senso di:
- Iride.
- Struttura della pelle.
Una volta scansionati tutti questi dati reali tuttavia in forma grezza cosa accade successivamente? Successivamente l’azienda, avvalendosi di algoritmi è in grado di creare delle rappresentazioni 3d relative ai dettagli anatomici delle persone realmente scansionate quali:
- Crea rappresentazioni 3d del corpo della persona.
- Crea rappresentazioni relative agli occhi.
- Del viso.
- Delle mani.
Approccio qualitativo o quantitativo?
Nel campo dell’intelligenza artificiale è meglio avere a disposizione una grande quantità di dati che tuttavia potrebbe essere inesatta, oppure al contrario è bene elaborare una quantità di dati minori attendibili? La risposta corretta, gli esperti di intelligenza artificiale se la sono già data, chiaramente la propensione è quella per avere una minor quantità di dati che tuttavia risultino essere esatti.
Infatti questi quando interagiscono con un sistema di intelligenza artificiale, sono in grado di migliorarne le prestazioni in maniera molto più esponenziale. Piuttosto che al contrario avere a disposizione una quantità di dati piuttosto corposa e imperfetta, pur utilizzando in tal senso degli algoritmi molto sofisticati.
Parliamo di privacy
I dati sintetici entrano nel campo della privacy? La risposta corretta è che pur trattandosi di dati definiti sintetici, pur in tal senso non corrispondendo ad un profilo di una persona con dati reali, questo non vuol dire che non abbiano al loro interno delle informazioni definite sensibili che siano inerenti a persone che nella vita esistono in maniera reale. La tematica è complessa, infatti riguarda le tecniche che generano questi dati, questo infatti non esclude che si possa fare delle ricerche e risalire a quella che potrebbe essere l’identità reale delle persone.
In tal senso la problematica dipende dalla tipologia di azienda che sfrutta questa tecnologica, se si tratta infatti di realtà che lavorano magari nell’ambito di settori come la finanza, potrebbe esserci un conflitto, infatti si tratta di realtà nelle quali tra i compiti che hanno, c’è anche quello di custodire in maniera riservata le informazioni di natura finanziaria o magari l’identità di specifici utenti.
Cosa dicono i ricercatori? Dal punto di vista di alcuni, il fatto che ci sia una combinazione di due tipologie di tecniche legate ai dati sintetici, produce una protezione molto elevata dei dati. Quali sono le tecniche in oggetto? Vediamole insieme:
- Si parla di una tecnica definita privacy differenziale.
- Si parla di una tecnica definita rete generativa avversaria.
Tuttavia il dibattito in tal senso risulta del tutto aperto, infatti oltre a questi ricercatori, ci manifestano altre posizioni più improntate allo scetticismo nelle quali c’è il dubbio che le aziende che gestiscono e forniscono dei dati sintetici, non saranno sempre così disponibili e attenti nel valutare le tecniche che al momento utilizzeranno per generare questi dati definiti sintetici.
I dati sintetici quale interazione hanno con l’intelligenza artificiale in termini di distorsione dei dati stessi? Potrebbero ridurre il rischio che l’intelligenza artificiale tenda a distorcerli. La tematica è complessa, infatti non è necessariamente detto che dataset che contengono un bilanciamento ottimale, non producono automaticamente un’intelligenza artificiale che da questo punto di vista sia in grado di trattare questi dati sintetici in maniera più equa.
Dataset
Quando parliamo di dataset a cosa ci stiamo riferendo? La risposta corretta è che parliamo di un insieme di dati, in forma più comune un dataset è costituito da un insieme di dati che sono strutturati in maniera relazionale.
Nell’informatica possiamo parlare di modello relazionale quando parliamo di un modello di natura logica per la rappresentazione e la strutturazione dei dati dati presenti e implementati in un database.
La tematica quindi aperta al momento è quella legata al fatto che non è matematico si possa ottenere un’ottimale combinazione puntando su un’intelligenza artificiale che utilizza dati sintetici, questo non la rende necessariamente equa.
Considerazioni finali
La combinazione di intelligenza artificiale e dati sintetici come abbiamo visto è un campo molto interessante, tuttavia non garantisce che si possa creare un sistema corretto ed equo, nel quale si possa avere una massima attenzione alla privacy dell’utente, partendo da sistemi quali la privacy differenziale e le reti generative avversarie.
fonte: https://www.agendadigitale.eu/