Uno dei problemi che i sistemi di machine learning e soprattutto deep learning basati su reti neurali devono affrontare è che il loro modello concettuale è il comportamento del cervello umano, ma la loro base hardware è molto diversa da quest’ultimo.
Il componente ultimo del cervello – il neurone – unisce infatti sia la parte di storage delle informazioni che la parte elaborativa, mentre il modello tradizionale dell’informatica divide nettamente queste due funzioni.
Ci sono approcci alternativi, ma nella gran parte dei casi questa distinzione resta.
Alcuni ricercatori del MIT e dell’università canadese di Sherbrooke, con la collaborazione di Elenion Technologies, hanno portato avanti uno studio di fattibilità legato a un approccio alternativo. Si tratta di una architettura per la realizzazione di reti neurali completamente ottiche, basate quindi su processori nano-fotonici e non su componenti elettronici.
Questo dovrebbe portare a prestazioni molto superiori sia per la velocità di elaborazione sia per il consumo energetico.
Il progetto si basa sulla constatazione che alcuni componenti ottici effettuano di fatto delle “operazioni” matematiche sui segnali luminosi che li attraversano, trasformandoli. Il vantaggio principale è che queste operazioni sono molto più veloci che in un computer, operando a frequenze che arrivano sino a 100 GHz.
Per l’addestramento di reti neurali servono però componenti ottiche programmabili, non statiche. A questo scopo i ricercatori hanno adottato un processore nano-fotonico dotato di un array di 56 interferometri di Mach-Zehnder programmabili.
Una volta raggiunta la configurazione finale della rete neurale, gli interferometri non vengono più modificati e il processore mantiene il suo stato indefinitamente con un consumo molto basso di energia.
Nel complesso si stima che questa architettura fotonica porti all’utilizzo di reti neurali con un dispendio di energia centomila volte più basso di quello dei sistemi tradizionali. Insieme alla velocità computazionale, è un vantaggio di notevole rilievo.
L’altro lato della medaglia
Ci sono però alcuni svantaggi, legati anche al fatto che ci troviamo di fronte a un prototipo. Il primo è che l’accuratezza delle reti neurali nano-fotoniche è stata relativamente bassa. Il sistema è stato testato nel riconoscimento vocale e ha raggiunto una precisione del 75 percento contro il 90 di un sistema classico.
L’altro aspetto critico sta nelle dimensioni del sistema. Una rete neurale completa richiede molti più nodi di quelli contenuti nel processore usato, uno scoglio aggirato facendo transitare i segnali ottici più volte attraverso il chip.
Un sistema reale deve però evitare questa scorciatoia per non vanificare i vantaggi in latenza trasmissiva e velocità di elaborazione, quindi deve avere un numero di nodi distinti sufficiente. Il che porterebbe a chip grandi diversi centimetri quadrati.