Vedi traduzione automatica
Questa è una traduzione automatica. Per vedere il testo originale in inglese cliccare qui
#News
{{{sourceTextContent.title}}}
Una nuova tecnologia per l'analisi cooperativa di Big Data
{{{sourceTextContent.subTitle}}}
Le comunità traggono vantaggio dalla condivisione della conoscenza e dell'esperienza tra i loro membri. Seguendo un principio simile - chiamato "swarm learning" - un team di ricerca internazionale ha addestrato algoritmi di intelligenza artificiale per rilevare il cancro del sangue, malattie polmonari e COVID-19 nei dati memorizzati in modo decentralizzato. Questo approccio ha un vantaggio rispetto ai metodi convenzionali in quanto fornisce intrinsecamente tecnologie di conservazione della privacy, che facilita l'analisi cross-site dei dati scientifici.
{{{sourceTextContent.description}}}
L'apprendimento dello sciame potrebbe quindi promuovere e accelerare significativamente la collaborazione e lo scambio di informazioni nella ricerca, soprattutto nel campo della medicina. Esperti del DZNE, dell'Università di Bonn, dell'azienda informatica Hewlett Packard Enterprise (HPE) e di altri istituti di ricerca ne parlano nella rivista scientifica "Nature".
La scienza e la medicina stanno diventando sempre più digitali. L'analisi dei volumi di informazioni risultanti - noti come "big data" - è considerata una chiave per migliori opzioni di trattamento. "I dati della ricerca medica sono un tesoro. Possono giocare un ruolo decisivo nello sviluppo di terapie personalizzate che sono fatte su misura per ogni individuo in modo più preciso rispetto ai trattamenti convenzionali", ha detto Joachim Schultze, direttore di Systems Medicine al DZNE e professore al Life & Medical Sciences Institute (LIMES) dell'Università di Bonn. "È fondamentale per la scienza essere in grado di utilizzare tali dati nel modo più completo e da quante più fonti possibili"
Tuttavia, lo scambio di dati di ricerca medica tra luoghi diversi o addirittura tra paesi diversi è soggetto alle norme sulla protezione dei dati e sulla sovranità dei dati. In pratica, questi requisiti possono essere implementati solo con uno sforzo significativo. Inoltre, ci sono barriere tecniche: Per esempio, quando enormi quantità di dati devono essere trasferite digitalmente, le linee dati possono raggiungere rapidamente i loro limiti di prestazione. In considerazione di queste condizioni, molti studi medici sono confinati a livello locale e non possono utilizzare dati che sono disponibili altrove.
Alla luce di questo, una collaborazione di ricerca guidata da Joachim Schultze ha testato un nuovo approccio per valutare i dati di ricerca memorizzati in modo decentralizzato. La base è stata l'ancora giovane tecnologia "Swarm Learning" sviluppata da HPE. Oltre all'azienda IT, numerosi istituti di ricerca di Grecia, Paesi Bassi e Germania - compresi i membri della "German COVID-19 OMICS Initiative" (DeCOI) - hanno partecipato a questo studio.
L'apprendimento dello sciame combina un tipo speciale di scambio di informazioni attraverso diversi nodi di una rete con metodi dalla cassetta degli attrezzi del "machine learning", un ramo dell'intelligenza artificiale (AI). Il perno dell'apprendimento automatico sono gli algoritmi che vengono addestrati sui dati per rilevare i modelli in essi - e che di conseguenza acquisiscono la capacità di riconoscere i modelli appresi anche in altri dati. "L'apprendimento dello sciame apre nuove opportunità di collaborazione nella ricerca medica, così come nel business. La chiave è che tutti i partecipanti possono imparare l'uno dall'altro senza dover condividere dati riservati", ha detto il dottor Eng Lim Goh, Senior Vice President e Chief Technology Officer per l'intelligenza artificiale di HPE.
Infatti, con Swarm Learning, tutti i dati della ricerca rimangono in loco. Solo gli algoritmi e i parametri sono condivisi - in un certo senso, le lezioni apprese. "Swarm Learning soddisfa i requisiti di protezione dei dati in modo naturale", ha sottolineato Joachim Schultze.
A differenza del "federated learning", in cui i dati rimangono anche localmente, non c'è un centro di comando centralizzato, ha spiegato lo scienziato di Bonn. "L'apprendimento dello sciame avviene in modo cooperativo sulla base di regole che tutti i partner hanno concordato in anticipo. Questo insieme di regole è catturato in una blockchain" Questa è una sorta di protocollo digitale che regola lo scambio di informazioni tra i partner in modo vincolante, documenta tutti gli eventi e tutte le parti vi hanno accesso. "La blockchain è la spina dorsale di Swarm Learning", ha detto Schultze. "Tutti i membri dello sciame hanno uguali diritti. Non c'è un potere centrale su ciò che accade e sui risultati. Quindi non c'è, in un certo senso, nessun ragno che controlla la rete di dati"
Così, gli algoritmi AI imparano localmente, cioè sulla base dei dati disponibili in ogni nodo della rete. I risultati dell'apprendimento di ogni nodo sono raccolti come parametri attraverso la blockchain ed elaborati in modo intelligente dal sistema. Il risultato, cioè i parametri ottimizzati, vengono trasmessi a tutte le parti. Questo processo viene ripetuto più volte, migliorando gradualmente la capacità degli algoritmi di riconoscere i modelli in ogni nodo della rete.
I ricercatori stanno ora fornendo la prova pratica di questo approccio attraverso l'analisi di immagini a raggi X dei polmoni e dei trascrittomi: Questi ultimi sono dati sull'attività genica delle cellule. Nello studio attuale, l'attenzione era specificamente sulle cellule immunitarie che circolano nel sangue - in altre parole, i globuli bianchi. "I dati sull'attività genica delle cellule del sangue sono come un'impronta digitale molecolare. Contengono importanti informazioni su come l'organismo reagisce a una malattia", ha detto Schultze. "I trascrittomi sono disponibili in gran numero proprio come le immagini a raggi X, e sono altamente complessi. Questo è esattamente il tipo di informazioni necessarie per l'analisi dell'intelligenza artificiale. Tali dati sono perfetti per testare lo Swarm Learning"
Il team di ricerca ha affrontato un totale di quattro malattie infettive e non infettive: due varianti di cancro del sangue (leucemia mieloide acuta e leucemia linfoblastica acuta), così come la tubercolosi e COVID-19. I dati includevano un totale di più di 16.000 trascrittomi. La rete di apprendimento dello sciame sulla quale i dati sono stati distribuiti consisteva tipicamente di almeno tre e fino a 32 nodi. Indipendentemente dai trascrittomi, i ricercatori hanno analizzato circa 100.000 immagini radiografiche del torace. Queste provenivano da pazienti con accumulo di fluido nel polmone o altri risultati patologici, così come da individui senza anomalie. Questi dati sono stati distribuiti in tre diversi nodi.
L'analisi dei trascrittomi e delle immagini radiografiche ha seguito lo stesso principio: In primo luogo, i ricercatori hanno alimentato i loro algoritmi con sottoinsiemi dei rispettivi set di dati. Questo includeva informazioni su quali dei campioni provenivano da pazienti e quali da individui senza risultati. Il riconoscimento del modello appreso per "malato" o "sano" è stato poi utilizzato per classificare ulteriori dati, in altre parole è stato utilizzato per ordinare i dati in campioni con o senza malattia. L'accuratezza, cioè la capacità degli algoritmi di distinguere tra individui sani e malati, era intorno al 90% in media per i trascrittomi (ciascuna delle quattro malattie è stata valutata separatamente); nel caso dei dati radiologici, variava dal 76 all'86%.
"La metodologia ha funzionato meglio nella leucemia. In questa malattia, la firma dell'attività genica è particolarmente evidente e quindi più facile da rilevare per l'intelligenza artificiale. Le malattie infettive sono più variabili. Tuttavia, la precisione è stata molto alta anche per la tubercolosi e COVID-19. Per i dati a raggi X, il tasso era un po' più basso, il che è dovuto alla minore qualità dei dati o delle immagini", ha commentato Schultze sui risultati. "Il nostro studio dimostra quindi che lo Swarm Learning può essere applicato con successo a dati molto diversi. In linea di principio, questo si applica a qualsiasi tipo di informazione per la quale è utile il riconoscimento dei modelli tramite l'intelligenza artificiale. Che si tratti di dati del genoma, immagini a raggi X, dati di imaging del cervello o altri dati complessi"
Lo studio ha anche scoperto che lo Swarm Learning ha dato risultati significativamente migliori rispetto a quando i nodi della rete hanno imparato separatamente. "Ogni nodo beneficia dell'esperienza degli altri nodi, anche se solo i dati locali sono sempre disponibili. Il concetto di apprendimento a sciame ha quindi superato la prova pratica", ha detto Schultze.
"Sono convinto che lo swarm learning possa dare una spinta enorme alla ricerca medica e ad altre discipline guidate dai dati". Lo studio attuale era solo una prova. In futuro, abbiamo intenzione di applicare questa tecnologia all'Alzheimer e ad altre malattie neurodegenerative", ha detto Schultze. "Lo Swarm Learning ha il potenziale per essere un vero e proprio game changer e potrebbe contribuire a rendere la ricchezza di esperienza in medicina più accessibile in tutto il mondo. Non solo gli istituti di ricerca, ma anche gli ospedali, per esempio, potrebbero unirsi per formare tali sciami e quindi condividere le informazioni a vantaggio reciproco."