mercoledì, Aprile 24, 2024
HomeAZIENDERenesas sviluppa un nuovo acceleratore AI light e tecnologia di processo embedded...

Renesas sviluppa un nuovo acceleratore AI light e tecnologia di processo embedded per elaborazione in tempo reale

Nuovo acceleratore AI light di Renesas

I risultati della verifica operativa con un prototipo AI-MPU embedded sono stati annunciati durante l’evento ISSCC 2024.

Renesas Electronics ha annunciato oggi lo sviluppo di un processore embedded che consente velocità più elevate e un consumo energetico inferiore nelle unità a microprocessore (MPU) che realizzano un’intelligenza artificiale visiva avanzata. Le tecnologie recentemente sviluppate sono le seguenti:

  • Un acceleratore AI basato su processore riconfigurabile dinamicamente (DRP) che elabora in modo efficiente modelli AI “leggeri”.
  • Tecnologia di architettura eterogenea che consente l’elaborazione in tempo reale tramite IP del processore che operano in modo cooperativo, come processore.

Renesas ha prodotto un prototipo di AI-MPU embedded con queste tecnologie e ne ha confermato il funzionamento ad alta velocità e a basso consumo energetico. Ha raggiunto un’elaborazione fino a 16 volte più veloce (130 TOPS) rispetto a prima dell’introduzione di queste nuove tecnologie e un’efficienza energetica di livello assoluto (fino a 23,9 TOPS/W con alimentazione a 0,8 V).

Nel contesto della recente diffusione dei robot nelle fabbriche, nella logistica, nei servizi medici e nei negozi, c’è una crescente necessità di sistemi che possano funzionare autonomamente in tempo reale rilevando l’ambiente circostante utilizzando l’intelligenza artificiale visiva avanzata. Poiché esistono severe restrizioni sulla generazione di calore, in particolare per i dispositivi embedded, nei chip AI sono richiesti sia prestazioni più elevate che un consumo energetico inferiore. Renesas ha sviluppato nuove tecnologie per soddisfare questi requisiti e ha presentato questi risultati il ​​21 febbraio alla Conferenza internazionale ISSCC 2024, tenutasi dal 18 al 22 febbraio 2024 a San Francisco.

Le tecnologie sviluppate da Renesas sono le seguenti:

1 – Un acceleratore che elabora in modo efficiente modelli di intelligenza artificiale “leggeri”

Come tecnologia tipica per migliorare l’efficienza dell’elaborazione dell’intelligenza artificiale, è disponibile la potatura (pruning) per omettere calcoli che non influiscono in modo significativo sulla precisione del riconoscimento. Tuttavia, è comune che nei modelli di intelligenza artificiale esistano calcoli che non influiscono sull’accuratezza del riconoscimento. Ciò causa una differenza tra il parallelismo dell’elaborazione hardware e la casualità dell’eliminazione, che rende l’elaborazione inefficiente.

Per risolvere questo problema, Renesas ha ottimizzato il suo esclusivo acceleratore AI basato su DRP (DRP-AI) per il pruning. Analizzando il modo in cui le caratteristiche del modello di pruning e un metodo di pruning sono correlati all’accuratezza del riconoscimento nei tipici modelli AI di riconoscimento delle immagini (modelli CNN), Renesas ha identificato la struttura hardware di un acceleratore AI in grado di raggiungere sia un’elevata precisione di riconoscimento che un tasso di pruning efficiente e applicato al design DRP-AI. Inoltre, è stato sviluppato un software per ridurre il “peso” dei modelli AI ottimizzati per questo DRP-AI.

Questo software converte la configurazione del modello di pruning casuale in un calcolo parallelo altamente efficiente, con conseguente elaborazione a velocità più elevata. In particolare, la tecnologia di supporto altamente flessibile al pruning di Renesas (tecnologia di potatura N:M flessibile), che può modificare dinamicamente il numero di cicli in risposta ai cambiamenti del tasso di pruning locale nei modelli AI, consente un controllo preciso del tasso di pruning in base a il consumo energetico, alla velocità operativa e alla precisione del riconoscimento richiesti dagli utenti.

Questa tecnologia riduce il numero di cicli di elaborazione dei modelli AI a un sedicesimo rispetto all’eliminazione di modelli incompatibili e consuma meno di un ottavo dell’energia.



2 – Tecnologia di architettura eterogenea che consente l’elaborazione in tempo reale per il controllo di robot

Le applicazioni robotiche richiedono un’elaborazione AI visiva avanzata per il riconoscimento dell’ambiente circostante. Allo stesso tempo, la valutazione e il controllo del movimento del robot richiedono una programmazione dettagliata delle condizioni in risposta ai cambiamenti nell’ambiente circostante, quindi l’elaborazione software basata sulla CPU è più adatta dell’elaborazione basata sull’intelligenza artificiale. La sfida è stata che le CPU con gli attuali processori embedded non sono pienamente in grado di controllare i robot in tempo reale.

Ecco perché Renesas ha introdotto un processore riconfigurabile dinamicamente (DRP), che gestisce elaborazioni complesse, oltre alla CPU e all’acceleratore AI (DRP-AI). Ciò ha portato allo sviluppo di una tecnologia di architettura eterogenea che consente velocità più elevate e un consumo energetico inferiore nelle MPU AI distribuendo e parallelizzando i processi in modo appropriato.

Un DRP esegue un’applicazione modificando dinamicamente la configurazione della connessione del circuito tra le unità aritmetiche all’interno del chip per ciascun ciclo di clock in base ai dettagli di elaborazione. Poiché anche per elaborazioni complesse funzionano solo i circuiti aritmetici necessari, sono possibili un consumo energetico inferiore e velocità più elevate.

Ad esempio, SLAM (Simultaneously Localization and Mapping), una delle tipiche applicazioni robotiche, è una configurazione complessa che richiede più processi di programmazione per il riconoscimento della posizione del robot, in parallelo con il riconoscimento dell’ambiente mediante l’elaborazione dell’intelligenza artificiale visiva. Renesas ha dimostrato il funzionamento di questo SLAM attraverso la commutazione istantanea del programma con il DRP e il funzionamento parallelo dell’acceleratore AI e della CPU, ottenendo velocità operative circa 17 volte più elevate e un’efficienza energetica operativa circa 12 volte superiore rispetto alla sola CPU integrata.

Verifica dell’operazione

Renesas ha creato un prototipo di chip di prova con queste tecnologie e ha confermato di aver raggiunto un’efficienza energetica elevatissima, di 23,9 TOPS per watt con una tensione di alimentazione di 0,8 V per l’acceleratore AI e un’efficienza energetica operativa di 10 TOPS per watt per i principali modelli di intelligenza artificiale. Ha inoltre dimostrato che l’elaborazione AI è possibile senza ventola o dissipatore di calore.

L’utilizzo di questi risultati aiuta a risolvere la generazione di calore dovuta all’aumento del consumo energetico, che è stata una delle sfide associate all’implementazione dei chip AI in una varietà di dispositivi integrati come robot di servizio e veicoli a guida automatizzata. La riduzione significativa della generazione di calore contribuirà alla diffusione dell’automazione in vari settori, come i mercati della robotica e delle tecnologie intelligenti. Queste tecnologie verranno applicate alla serie RZ/V di Renesas: MPU per applicazioni di intelligenza artificiale visiva.