Arm revela CPU AGI: um processador especializado projetado para orquestrar a era dos agentes de IA

12

O designer de chips Arm entrou oficialmente no mercado especializado de hardware de IA com o lançamento de seu primeiro processador interno projetado especificamente para alimentar agentes de IA.

Embora a popularidade atual da IA ​​seja impulsionada por chatbots que respondem a solicitações, a indústria está migrando para a “IA agêntica” – sistemas capazes de tomar medidas proativas e autônomas para completar objetivos complexos com o mínimo de supervisão humana. A nova arquitetura da Arm visa fornecer a espinha dorsal computacional necessária para esta transição.

O orquestrador: por que as CPUs são importantes para os agentes de IA

No cenário atual de IA, Unidades de Processamento Gráfico (GPUs) são os pesos pesados; seu poder de processamento paralelo é essencial para treinar e executar Large Language Models (LLMs). No entanto, executar um agente autônomo requer mais do que apenas rendimento matemático bruto. Requer tomada de decisão, gerenciamento de tarefas e capacidade de lidar com lógica complexa e ramificada.

É aqui que a Unidade Central de Processamento (CPU) se torna crítica. Se uma GPU é o motor de um sistema de IA, a CPU atua como o maestro da orquestra. Ele gerencia o fluxo de dados, orquestra os diversos aceleradores e garante que todos os componentes funcionem em harmonia para executar as tarefas do agente.

Especificações Técnicas e Arquitetura

A nova CPU AGI da Arm foi construída para se afastar das limitações da computação de “uso geral” para se concentrar na inferência – o processo de um modelo de IA que realmente executa uma tarefa em tempo real.

Os principais destaques técnicos incluem:
Fabricação Avançada: Construída em um processo de última geração de 3 nanômetros.
Alta densidade de núcleo: Apresenta até 136 núcleos Neoverse V3 por chip, atingindo velocidades de clock de 3,7 GHz.
Eficiência de memória: oferece uma largura de banda de memória de 6 GB/s por núcleo.
Design escalável: A arquitetura permite que dois chips sejam agrupados em um único blade de servidor (272 núcleos), que pode então ser empilhado em racks de 30. Um único rack pode ostentar enormes 8.160 núcleos trabalhando em paralelo.

Desafiando o legado x86

Durante décadas, a arquitetura x86 (criada pela Intel) dominou o mundo da computação. No entanto, os chips x86 são projetados para “suporte legado”, o que significa que devem permanecer compatíveis com uma vasta gama de softwares mais antigos e diversos aplicativos. Essa versatilidade tem um custo de eficiência.

Por outro lado, a CPU AGI da Arm utiliza a arquitetura Armv9.2-A, que elimina grande parte dessa sobrecarga legada para se concentrar estritamente nas cargas de trabalho de IA. Esta especialização permite ganhos significativos de desempenho:
Maior densidade: Arm afirma que sua CPU AGI oferece mais que o dobro do desempenho por rack de servidor em comparação com CPUs x86 tradicionais.
Eficiência energética: Aproveitando a força histórica da Arm no gerenciamento de energia — a mesma tecnologia que alimenta a maioria dos smartphones do mundo — este chip visa mitigar as enormes demandas de energia esperadas à medida que a implantação de IA aumenta.

A mudança do treinamento para a ação

A indústria de semicondutores está testemunhando uma mudança fundamental de foco. Enquanto a onda anterior de desenvolvimento de IA se concentrava no treinamento de modelos massivos, a próxima onda é sobre implantação e agência.

À medida que a IA deixa de ser uma ferramenta com a qual conversamos para se tornar um agente que trabalha para nós, a demanda por hardware de data center que possa lidar com orquestração rápida e inteligente disparará. A entrada de Arm neste espaço sugere que o futuro da IA ​​pode depender tanto dos “cérebros” que gerem as tarefas como do “músculo” que processa os dados.

Conclusão: Ao priorizar a orquestração especializada em vez da computação de uso geral, a Arm está se posicionando para liderar a mudança de infraestrutura necessária para que a IA autônoma e agente funcione em escala global.