Arm presenta la CPU AGI: un processore specializzato progettato per orchestrare l’era degli agenti IA

3

Il progettista di chip Arm è entrato ufficialmente nel mercato dell’hardware specializzato per l’intelligenza artificiale con l’introduzione del suo primo processore interno specificamente progettato per alimentare gli agenti IA.

Mentre l’attuale popolarità dell’intelligenza artificiale è guidata dai chatbot che rispondono ai suggerimenti, il settore si sta spostando verso l’“intelligenza artificiale”, ovvero sistemi in grado di adottare misure proattive e autonome per completare obiettivi complessi con una supervisione umana minima. La nuova architettura di Arm mira a fornire la struttura computazionale necessaria per questa transizione.

L’orchestratore: perché le CPU sono importanti per gli agenti IA

Nell’attuale panorama dell’intelligenza artificiale, le unità di elaborazione grafica (GPU) sono i pesi massimi; la loro potenza di elaborazione parallela è essenziale per la formazione e l’esecuzione di Large Language Models (LLM). Tuttavia, l’esecuzione di un agente autonomo richiede qualcosa di più del semplice throughput matematico. Richiede processo decisionale, gestione delle attività e capacità di gestire logiche complesse e ramificate.

È qui che l’Unità centrale di elaborazione (CPU) diventa fondamentale. Se una GPU è il motore di un sistema AI, la CPU funge da direttore d’orchestra. Gestisce il flusso di dati, orchestra i vari acceleratori e garantisce che tutti i componenti funzionino in armonia per eseguire le attività dell’agente.

Specifiche tecniche e architettura

La nuova CPU AGI di Arm è progettata per allontanarsi dai limiti dell’elaborazione “generale” per concentrarsi sull’inferenza, il processo di un modello di intelligenza artificiale che esegue effettivamente un’attività in tempo reale.

I principali punti salienti tecnici includono:
Produzione avanzata: basato su un processo all’avanguardia a 3 nanometri.
Elevata densità di core: include fino a 136 core Neoverse V3 per chip, raggiungendo velocità di clock di 3,7 GHz.
Efficienza della memoria: offre una larghezza di banda della memoria di 6 GB/s per core.
Design scalabile: l’architettura consente di inserire due chip in un singolo server blade (272 core), che può quindi essere impilato in rack da 30. Un singolo rack può vantare un enorme 8.160 core che lavorano in parallelo.

Sfidare l’eredità x86

Per decenni, l’architettura x86 (introdotta da Intel) ha dominato il mondo informatico. Tuttavia, i chip x86 sono progettati per il “supporto legacy”, nel senso che devono rimanere compatibili con una vasta gamma di software meno recenti e applicazioni diverse. Questa versatilità va a scapito dell’efficienza.

Al contrario, la CPU AGI di Arm utilizza l’architettura Armv9.2-A, che elimina gran parte di questo sovraccarico legacy per concentrarsi esclusivamente sui carichi di lavoro AI. Questa specializzazione consente notevoli miglioramenti prestazionali:
Densità superiore: Arm afferma che la sua CPU AGI offre più del doppio delle prestazioni per rack server rispetto alle tradizionali CPU x86.
Efficienza energetica: sfruttando la forza storica di Arm nella gestione dell’energia, la stessa tecnologia che alimenta la maggior parte degli smartphone del mondo, questo chip mira a mitigare le massicce richieste di energia previste con la scalabilità dell’implementazione dell’intelligenza artificiale.

Il passaggio dalla formazione all’azione

L’industria dei semiconduttori sta assistendo a un cambiamento fondamentale nel focus. Mentre la precedente ondata di sviluppo dell’IA si concentrava sull’addestramento di modelli massicci, l’ondata successiva riguarda l’implementazione e l’agenzia.

Man mano che l’intelligenza artificiale passa dall’essere uno strumento con cui parliamo a un agente che lavora per noi, la domanda di hardware per data center in grado di gestire un’orchestrazione rapida e intelligente salirà alle stelle. L’ingresso di Arm in questo spazio suggerisce che il futuro dell’intelligenza artificiale potrebbe dipendere tanto dal “cervello” che gestisce i compiti quanto dal “muscolo” che elabora i dati.

Conclusione: dando priorità all’orchestrazione specializzata rispetto all’informatica generica, Arm si posiziona per guidare il cambiamento infrastrutturale necessario affinché l’IA autonoma e ad agenti possa funzionare su scala globale.