
Un gruppo di scienziati francesi ha sviluppato la prima tecnologia di memoria ibrida che supporta l’addestramento locale adattivo e l’inferenza di reti neurali artificiali direttamente su chip, superando il compromesso tradizionale tra memoria per training e memoria per inferenza.
Un team del centro di ricerca francese CEA-Leti, in collaborazione con diversi laboratori universitari, ha reso realtà la prima memoria ibrida (Hybrid Memory, HM) capace di supportare sia l’addestramento locale sia l’inferenza su dispositivi edge. Il lavoro è stato pubblicato su Nature Electronics con il titolo “A Ferroelectric-Memristor Memory for Both Training and Inference”.
Questo progresso affronta una delle principali barriere tecnologiche nell’AI su dispositivi distribuiti: come implementare modelli che possono non solo eseguire inferenza, ma anche apprendere dai dati locali, mantenendo efficienza energetica, compatibilità con processi CMOS e footprint ridotto.
L’architettura ibrida: FeCAP + Memristor in un unico stack
La chiave del successo risiede nella combinazione di due tecnologie storicamente incompatibili: memristor (memorie resistive non volatili) e condensatori ferroelettrici (FeCAP), integrate in uno stack unico. Il team ha realizzato una struttura basata su ossido di afnio drogato con silicio (Si-doped HfO₂) che consente di trasformare le celle da FeCAP in memristor mediante una operazione elettrica di “forming”. Così, parte dell’array agisce come memoria volatile per operazioni di aggiornamento (training), mentre l’altra parte serve per inferenza analogica tramite la conduttanza del memristor.
L’implementazione è stata realizzata in tecnologia CMOS a 130 nm, con 16.384 celle FeCAP e 2.048 memristor interconnessi, oltre ai circuiti periferici. Questo approccio evita l’uso di maschere aggiuntive, semplificando il processo produttivo.
Superare la “memory wall”
Fino a oggi, i sistemi AI on-chip affrontavano un conflitto: i memristor erano ideali per inferenza (memoria analogica e calcolo in memoria), ma non eccellevano nel training; i FeCAP, invece, supportavano bene aggiornamenti, ma la lettura distruttiva li rendeva inadatti all’inferenza.
Con la nuova architettura ibrida, i progettisti possono usare i FeCAP per le operazioni di aggiornamento dei pesi ad alta precisione e trasferire periodicamente i valori più significativi ai memristor per uso in inferenza continua. Questo approccio misto consente di mantenere efficienza, flessibilità e accuratezza.
Nel contesto dell’edge AI — dove dispositivi come sensori intelligenti, veicoli autonomi o dispositivi medicali devono apprendere localmente — l’innovazione può permettere una personalizzazione in tempo reale senza dipendere costantemente dal cloud.
Sfide e criticità
Pur promettente, la soluzione ibrida presenta alcune difficoltà:
- Scalabilità e resa (yield): mantenere affidabilità su array di grandi dimensioni è complesso.
- Compatibilità di processo: integrare memristor e FeCAP nel flusso CMOS senza maschere extra è un vantaggio, ma resta la sfida dei materiali e dell’affidabilità.
- Precisione e stabilità: il passaggio tra modalità FeCAP e memristor deve essere stabile e mantenere l’accuratezza del modello.
- Consumo e usura: aggiornamenti frequenti e operazioni analogiche generano stress, che va gestito con strategie di endurance.
Collaborazioni e contesto europeo
CEA-Leti è uno dei principali centri di ricerca microelettronica europei, parte del gruppo CEA in Francia. Il loro coinvolgimento in soluzioni avanzate per computing è strategico per rafforzare l’autonomia europea nel settore high-tech.
STMicroelectronics, che in progetti di memoria avanzata collabora con Leti (es. ottimizzazione del bonding in 3D), ha mostrato interesse nel superare la “memory wall” nei dispositivi edge, tema di discussione recente tra Leti e ST.
Impatti e prospettive
Se la tecnologia ibrida si svilupperà in applicazioni reali, potrebbe cambiare il paradigma dell’AI distribuita. I dispositivi potrebbero non solo effettuare l’inferenza, ma adattarsi e apprendere in loco, con maggiore privacy, latenza ridotta e minore dipendenza da infrastrutture cloud.
A livello industriale, aziende di sensori, automotive, wearable e IoT potrebbero adottare questa memoria per modellare dispositivi più intelligenti e resilienti.
In ogni caso servirà del tempo per migrare da prototipi accademici a soluzioni integrate in prodotti commerciali. Ma il passo compiuto da Leti e dai suoi partner indica che la “memoria ibrida per AI on-chip” non è più un’idea astratta, ma un possibile volano tecnologico per l’edge computing del futuro.



