IL SOGNO NEURALE:
EQUIVOCO O PARADOSSO?

di Carlo Morabito
I misteri della mente umana hanno da sempre affascinato scienziati, filosofi e maghi. Lo stesso Cartesio ha identificato nell'abilità del pensiero il fondamento della filosofia ontologica. Altri hanno addirittura additato la mente umana come evidenza dell'esistenza di poteri sovrannaturali, o anche di Dio. Non deve sorprendere, dunque, il fervore di ricerche e sperimentazioni in un settore che ha promesso di offrire, attraverso l'applicazione di concetti e funzioni proprie dell'intelletto umano all'elaborazione elettronica, suggerimenti e sviluppi anche alla ricerca di base in campo medico. Le reti neurali artificiali rappresentano la metafora del cervello computazionale, dell'implementazione su calcolatore di procedure e metodi dell'intelletto.
La rigorosa investigazione scientifica ha preso le mosse circa mezzo secolo fa, anche se esperimenti sull'elettricità animale erano già un fatto acquisito qualche tempo prima. Le risposte in atto avute non sono tante e riguardano aspetti specifici quali, ad esempio, le dinamiche di elaborazione delle informazioni visive da parte del cervello, o la localizzazione di processi in determinate aree e il comportamento selettivo di aree del cervello umano. Le risposte più attese e profonde sono soltanto ipotesi e non invadono la natura della coscienza e il concetto di anima. Come potrebbe ciò specchiarsi in una macchina di calcolo? Perchè, quindi, reti neurali artificiali, perchè metafora biologica del calcolatore?
Ci muoviamo in un ambito pericoloso e controverso, tuttavia, preme evidenziare i principali paradigmi del calcolo neurale e i risultati già ottenuti in tale ambito. Si rinvia intanto il lettore interessato all'affascinante volume The Self and Its Brain, di K.Popper e J.C.Eccles, editore Springer, Heidelberg, 1977, per una più approfondita descrizione degli aspetti meramente filosofici e fisiologici del problema.
Le prime rappresentazioni di reti di neuroni artificiali formali risalgono agli anni `50 e sono da attribuire a McCullogh e Pitts. Una prima rigorosa impostazione matematica del problema dinamico richiama alla memoria il compianto scienziato italiano Eduardo Renato Caianiello, recentemente scomparso. L'informazione elaborata dal neurone formale è di tipo binario e si presta all'interpretazione di un problema di riconoscimento in termini di presenza o assenza di una caratteristica in un insieme di dati (pattern). Il neurone formale è rappresentato cioè da un legame ingresso-uscita fortemente non lineare del tipo: data una configurazione di bit in ingresso, decidere se l'uscita dev'essere si oppure no.
La ricerca nel settore è stata praticamente un'ideologia di pochi, sparsi nei Laboratori del mondo, sino al 1986, quando è esploso un interesse a livello internazionale pilotato più dall'imminente fallimento dell'intelligenza artificiale basata sull'approccio logico che dalla promessa di fornire interpretazioni realistiche ai modelli del cervello. Tuttavia, l'attuale interesse verso la materia è fertilizzato dallo sviluppo di modelli computazionali in ambiti affini: la logica fuzzy, l'evoluzionismo computazionale, gli algoritmi genetici, il ragionamento approssimato e il calcolo dolce (soft computing). Non stupisce che il grosso della ricerca applicata nel settore è diretto appannaggio degli Stati Uniti d'America e del Giappone, mentre gli aspetti più tipicamente formali costituiscono ancora un patrimonio anche europeo. La ricerca, ai nostri giorni, spesso cede il passo alle mode e a quant'altro possa giustificare un intervento, in termini di finanziamenti, del privato. In questo senso, manca oggi un equivalente del settore Difesa, che ha stimolato la ricerca in questo secolo più che mai e conosce oggi una crisi spaventosa. L'interesse crescente per l'ambiente e l'ecologia non giustifica ancora investimenti corposi e duraturi, specialmente in paesi strutturalmente instabili politicamente. Per tali ragioni, solo accennate, l'idea di una rivoluzione informatica che potesse sostituire lo sgonfiato dirigibile dell'intelligenza artificiale e dei sistemi esperti ha comunque generato notevoli speranze. Probabilmente, la ricerca affannosa di fondi e fama ha portato a una esagerazione delle virtù degli attuali modelli neurali.
Che cos'è una rete neurale artificiale, perchè e come simula un modello biologico, quali pregi e difetti possiede e come si può sostituire (o integrare) al calcolatore tradizionale? Le risposte a questi legittimi quesiti non sono oggi disponibili se non in parte. Innanzitutto, il neurone artificiale è un oggetto che, a somiglianza della cellula neuronale, riceve in ingresso un segnale che è una media pesata di più ingressi che provengono da giunzioni dendritiche eventualmente dislocate lontano dal corpo cellulare di base del neurone. La rappresentazione circuitale della struttura neuronale, associata a quanto evidenziato dal microscopio elettronico circa la cellula neurale, è costituita da un nucleo elaborativo che trasforma in modo non lineare l'ingresso (attività) e lo invia a un insieme di neuroni ad esso collegati (connessionismo). Le più comuni reti neurali riproducono l'idea di base che i collegamenti tra neuroni sono in effetti collegamenti tra gruppi di neuroni, o strati. Accanto a un livello d'ingresso e un livello d'uscita, esiste sempre un livello intermedio inaccessibile dall'esterno, detto per questo nascosto (hidden) che si occupa di rappresentare in una forma più oculata, possibilmente ridotta, e comunque funzionale alla determinazione dell'uscita, il pattern d'ingresso. La rappresentazione interna è una caratteristica del problema implementato nella macchina piuttosto che semplicemente una specifica di un particolare ingresso. La rete neurale può essere vista innanzitutto come un sistema statico che è definito da un ingresso e un'uscita vettoriale, nonchè da uno stato, un insieme cioè di variabili che sintetizzano la storia del sistema, o meglio, la sua memoria.
Come il sistema acquisisca una memoria riguarda il concetto di apprendimento. Si suppone che ai collegamenti tra ingressi e nodi nascosti, così come i collegamenti tra questi ultimi e le uscite, siano associati dei coefficienti, o pesi, che una volta inizialmente impostati, sono l'oggetto dell'apprendimento. I pesi, cioè, evolvono sulla base di una procedura di calcolo nota come training. Se possediamo un insieme di esempi di come il nostro sistema si comporta, o si dovrebbe comportare, il training consiste nell'impostare i valori dei pesi della rete con l'obiettivo di uniformarsi al comportamento desiderato. L'algoritmo di base per effettuare la determinazione dei pesi ottimi è noto come retropropagazione dell'errore (backpropagation). Si invia un ingresso alla rete, si calcola l'uscita, la si confronta con l'esempio ottenendo così una misura d'errore, si correggono i pesi in modo da ridurre l'errore corrispondente. Questa procedura viene semplicemente effettuata sullo strato più vicino all'uscita e quindi sullo strato d'ingresso, secondo una tecnica che tiene conto del contributo all'errore dei singoli nodi nascosti e della non linearità utilizzata come funzione d'attivazione del neurone di base. Aldilà della difficoltà di tale procedimento, la costruzione di un modello di sistema che rispecchi il problema allo studio dipende drasticamente dagli esempi utilizzati, dalla natura stessa del problema, dall'eventuale introduzione nel modello di conoscenza a priori e dalla bontà dell'algoritmo utilizzato. Un problema apparentemente tautologico si rivela nell'osservazione che la determinazione del numero di nodi nascosti, la cardinalità cioè della rappresentazione interna, è fatta sulla base di procedimenti euristici oppure sulla formulazione di un'ipotesi di soluzione. La rappresentazione non verrebbe quindi determinata autonomamente come conseguenza dell'apprendimento, ma riprodurrebbe una vincolante configurazione predefinita. Il baricentro della ricerca neurale è qui: la plasticità sinaptica, cioè la modifica del peso associato a una connessione va guidata seguendo modelli di learning biologici, oppure utilizzando la vasta messe di risultati resi disponibili dall'analisi numerica? Quando si conclude l'apprendimento di un modello? L'introduzione di nuovi esempi come può modificare il modello precedentemente appreso e secondo quali meccanismi il processo si stabilizza?
Certamente, questi modelli non possono rappresentare l'incredibile complessità del cervello umano. Nonostante ciò, alcuni modelli dinamici di reti neurali possiedono accattivanti proprietà di origine vagamente ispirata all'uomo. Un esempio classico è l'auto-organizzazione, il procedimento secondo cui dato un catalogo di possibili ingressi di un sistema, un opportuno algoritmo di apprendimento consenta di estrarre delle regolarità dagli ingressi riportandole in mappe topograficamente organizzate apprese autonomamente dalla struttura. Il richiamo alla rappresentazione in aree del cervello umano è evidente. Da un punto di vista pratico, questo apprendimento non supervisto (senza insegnante) consente di ridurre fortemente la mole di dati necessaria per descrivere un fenomeno e quindi il tempo di trasmissione di tali informazioni lungo un canale. Pensate alle trasmissioni via satellite, dove l'invio continuo di immagini telerilevate può costituire un grosso problema di memorizzazione e gestione.
Un altro tipo di problema alquanto comune risolto facilmente dal cervello umano è l'associazione. Vi faccio un esempio: non vedo un caro amico da diversi anni, di colpo me lo trovo davanti per strada. Poichè di tempo ne è passato, l'amico ha un aspetto un po' diverso da quel che ricordavo, ha perso qualche capello, magari ha messo qualche chilo di troppo. Ebbene, l'ho immediatamente riconosciuto e salutato con affetto: non ho avuto, neanche per un attimo, il dubbio che non fosse lui. Questo tipo di problema, essenzialmente di riconoscimento, è svolto con disarmante facilità dall'uomo, ma risulta gravosissimo per un calcolatore numerico. Quest'ultimo è straordinariamente veloce nel risolvere una complessa equazione differenziale, ma è in affanno davanti a una cosa apparentemente così semplice. Che cosa ci fa riconoscere quel volto? Come facciamo a associare, istintivamente, un volto a una persona, indipendentemente dalle sfumature, dai particolari, dalla prospettiva di vista? Come riprodurre questo comportamento in una macchina da calcolo? Il problema di riconoscimento viene tipicamente scomposto in uno di estrazione di caratteristiche e mescolamento appropriato delle stesse. Cosa distingue la nonna di Cappuccetto Rosso dal Lupo Cattivo? La voce della nonna è dolce, quella del lupo grossa e afona. I denti della nonna sono un po' cadenti mentre il lupo ha lunghe zanne affilate. La nonna ha i capelli bianchi, il lupo ha il pelo grigio. E così via. Il lupo sarà quindi inequivocabilmente individuato dal possedere alcune caratteristiche distintive. L'evoluzione della specie, che ha le sue leggi, ha inoltre costretto l'uomo a imparare a riconoscere il lupo in modo veloce, pena l'essere divorato. Per un insieme di ragioni, l'associazione è un compito che la macchina non svolge altrettanto bene, anche perchè deve essere programmata e il programmatore spesso non sa dire e tradurre in termini di linguaggio di calcolatore quale caratteristica gli consente di distinguere un oggetto da uno simile, salvo alcune semplici considerazioni di massima. Inoltre, ogni segnale elettronico è inquinato da un insieme di disturbi (rumore, interferenza, ...) che comunque sembrano non avere lo stesso effetto sull'uomo. se siamo immersi nel brusio di una folla, riusciamo agevolmente a distnguere la voce di una persona nota; ascoltando un brano musicale intonato da un'orchestra riusciamo a riconoscere il violino e apprezzarne la differenza rispetto a un oboe. Per un calcolatore non neurale questo è impossibile. La rete neurale, viceversa, durante la fase di apprendimento, crea una distribuzione spaziale con un insieme di configurazioni di minimo (valli della funzione) in corrispondenza delle quali è memorizzato un pattern (un volto, un suono, l'iride di un occhio). Se il pattern in ingresso viene poi distorto è inquinato da rumore, la rete è in grado di ricostruire, in maniera iterativa, il pattern corretto, cioè di individuare il minimo corrispondente. In conclusione, i modelli neurali e del ragionamento approssimato si propongono come mezzi per colmare alcune lacune del calcolo convenzionale e per superare le intrinseche limitazioni dell'intelligenza artificiale tradizionale. Tuttavia, il sogno neurale si configura anche come un goffo tentativo di emulare alcune funzioni del cervello umano. Il problema centrale di questo sogno prometeico pare quello di pretendere dall'oggetto neurale la precisione del calcolo numerico. Invece, il comportamento umano non mostra una risposta accurata e riproducibile in molte circostanze di riconoscimento, essendo influenzato dalla coscienza e dai fattori emotivi. Qui sta il paradosso neurale: l'accuratezza non è umana, l'arte si estrinseca nel timbro dell'uomo, si manifesta con la sua fantasia. L'errore è umano, dal calcolatore esigiamo indiscutibile precisione. Oltre che nel miglioramento e l'evoluzione delle tecniche neurali, sarebbe necessario un ripensamento sul significato del dilemma uomo-macchina.

Carlo Morabito è Ricercatore Confermato di Elettrotecnica e Tecnologie Elettriche e Professore Supplente di Teoria dei Sistemi presso la Facoltà d'Ingegneria dell'Università di Reggio Calabria. Ha svolto attività di ricerca presso industrie di rilevanza nazionale (Selenia, oggi Alenia), e presso importanti Laboratori Europei (Max-Planck Institut fuer PlasmaPhysik, Germania). E' autore di numerose pubblicazioni su riviste di rilevanza internazionale, è proprietario di due brevetti internazionali nell'ambito elaborazione d'immagini telerilevate, è revisore di lavori sottomessi a riviste e conferenze. E' stato Invited Plenary Speaker alla Conferenza Internazionale di Reti Neurali e Sistemi Fuzzy organizzata dall'AMSE a Brno (Repubblica Ceca) nel 1995. E' presente nel Who's Who in the World 1995 e 1996.



HELIOS Magazine ANNO I - n.2 HELIOSmagazine@diel.it