Parliamo di...

La chiave dell'apprendimento federato per proteggere l'IA

#25Gennaio  #AI  #DataInfrastructure  #Security  #AIMLandDeepLearning 

Contenuto originale di VentureBeat
Dai un'occhiata a tutte le sessioni on-demand dell'Intelligent Security Summit qui.
La grotta di Altxerri ad Aia, in Spagna, contiene pitture rupestri che si stima risalgano a circa 39.000 anni fa. Alcuni dei più antichi conosciuti esistenti, questi disegni raffigurano bisonti, renne, uri, antilopi e altri animali e figure.
È ciò che Xabi Uribe-Etxebarria chiama una delle prime forme di "archiviazione dei dati".
Ma ovviamente abbiamo fatto molta strada dai disegni rupestri. La raccolta dei dati è accelerata nel corso dei millenni; solo nell'ultimo decennio, la sua raccolta e conservazione è cresciuta a un ritmo mai visto prima, così come gli attacchi contro di essa.
Pertanto, "la nostra privacy è a rischio", ha affermato Uribe-Etxebarria. "Quindi, dobbiamo agire."
Event Intelligent Security Summit On-Demand Scopri il ruolo fondamentale di AI e ML nella sicurezza informatica e case study specifici del settore. Guarda le sessioni on-demand oggi. Guarda qui
La società di Uribe-Etxebarria, Sherpa, lo sta facendo tramite l'apprendimento federato, una tecnica di apprendimento automatico (ML) che addestra algoritmi su più server decentralizzati contenenti dati locali, ma senza condividere o condividere involontariamente tali dati.
La società ha annunciato oggi il lancio della sua piattaforma di addestramento del modello di intelligenza artificiale (AI) "a tutela della privacy".
Uribe-Etxebarria, fondatore e CEO, ha affermato che l'azienda considera la privacy dei dati "un valore etico fondamentale" e che la sua piattaforma "può essere una pietra miliare nel modo in cui i dati vengono utilizzati in modo privato e sicuro per l'IA".
La privacy frena il progresso
Le tecniche ML standard richiedono la centralizzazione dei dati di addestramento su una macchina o in un data center. Al contrario, l'apprendimento federato, coniato e introdotto da Google nel 2016, consente agli utenti di condividere i dati in remoto per addestrare un modello di deep learning.
Ogni utente può scaricare il modello da un data center nel cloud, addestrarlo sui propri dati privati, riepilogare e crittografare la sua nuova configurazione. Viene quindi rispedito al cloud, decrittografato, mediato e integrato nel modello centralizzato.
"Iterazione dopo iterazione, la formazione collaborativa continua fino a quando il modello non è completamente addestrato", hanno spiegato i ricercatori IBM.
Tuttavia, la sfida è che previsioni utili e accurate richiedono una grande quantità di dati di addestramento e molte organizzazioni, in particolare quelle nei settori regolamentati, sono riluttanti a condividere dati sensibili che potrebbero far evolvere i modelli di AI e ML.
Condivisione dei dati senza esporli
Questo è il problema che Sherpa cerca di affrontare. Secondo Uribe-Etxebarria, la sua piattaforma consente l'addestramento del modello AI senza la condivisione di dati privati. Questo, ha affermato, può aiutare a migliorare l'accuratezza dei modelli e delle previsioni degli algoritmi, garantire la conformità normativa e può anche aiutare a ridurre l'impronta di carbonio.
Uribe-Etxebarria ha sottolineato che uno dei maggiori problemi con l'IA è la notevole quantità di energia che utilizza a causa delle elevate quantità di calcolo necessarie per costruire e addestrare modelli accurati. La ricerca ha indicato che l'apprendimento federato può ridurre il consumo energetico nell'addestramento del modello fino al 70%.
Sherpa afferma che la sua piattaforma riduce la comunicazione tra i nodi fino al 99%. Le sue tecnologie di base includono la crittografia omomorfica, il calcolo multipartitico sicuro, la privacy differenziale, l'apprendimento cieco e le prove a conoscenza zero.
La società - il cui team comprende Carsten Bönnemann del National Institutes of Health del Dipartimento della salute e dei servizi umani degli Stati Uniti e Tom Gruber, ex CTO e fondatore di Siri - ha firmato accordi con NIH, KPMG e Telefónica. Uribe-Etxebarria ha affermato che NIH sta già utilizzando la piattaforma per aiutare a migliorare gli algoritmi per la diagnosi e il trattamento delle malattie.
Casi d'uso in abbondanza per l'apprendimento federato
I ricercatori IBM hanno affermato che l'aggregazione dei record finanziari dei clienti potrebbe consentire alle banche di generare punteggi di credito dei clienti più accurati o rilevare le frodi. La messa in comune delle richieste di risarcimento per l'assicurazione auto potrebbe contribuire a migliorare la sicurezza stradale e dei conducenti; mettere insieme le immagini satellitari potrebbe portare a previsioni migliori sul clima e sull'innalzamento del livello del mare.
E "i dati locali di miliardi di dispositivi connessi a Internet potrebbero dirci cose che non abbiamo ancora pensato di chiedere", hanno scritto i ricercatori.
Uribe-Etxebarria ha sottolineato l'importanza dell'apprendimento federato nella ricerca scientifica: l'intelligenza artificiale può essere sfruttata per aiutare a rilevare modelli o biomarcatori che l'occhio umano non può vedere. Gli algoritmi possono sfruttare in modo sicuro i dati riservati, come radiografie, cartelle cliniche, esami del sangue e della glicemia, elettrocardiogrammi e monitoraggio della pressione sanguigna, per apprendere ed eventualmente prevedere.
"Sono entusiasta del potenziale della scienza dei dati e dell'apprendimento automatico per prendere decisioni migliori, salvare vite umane e creare nuove opportunità economiche", ha affermato Thomas Kalil, ex direttore della politica scientifica e tecnologica alla Casa Bianca e ora consulente senior di Sherpa per innovazione.
Ha osservato, tuttavia, che "non saremo in grado di realizzare il potenziale del ML a meno che non possiamo anche proteggere la privacy delle persone e prevenire il tipo di violazioni dei dati che consentono ai criminali di accedere a miliardi di record di dati".
Uribe-Etxebarria ha concordato, dicendo: "questo è solo l'inizio di un lungo viaggio, e abbiamo ancora molto lavoro davanti a noi".


RSS - Mastodon