A Nvidia anunciou durante a GTC 2026 a integração do novo chip Groq 3 LPU à sua plataforma de data centers Vera Rubin. A novidade, fruto da propriedade intelectual adquirida da Groq no ano passado, promete transformar a velocidade das “fábricas de IA” ao focar na geração massiva de tokens com baixíssima latência.
A plataforma Rubin já contava com um ecossistema robusto de seis componentes principais, liderados pela GPU Rubin e a CPU Vera. Agora, a Groq 3 LPU (Language Processing Unit, ou Unidade de Processamento de Linguagem) entra como um coprocessador de inferência estratégico para aliviar gargalos de desempenho, prometendo oferecer até 1,2 PFLOPs de poder computacional em formato de dados FP8.
Seu principal diferencial é o foco em instruções lineares e sincronizadas, em vez do paralelismo das GPUs, junto de uma organização mais precisa dos cálculos que serão feitos. Outro aspecto arquitetônico único é o uso de 500 MB de SRAM embutida no chip, o que não apenas mantém uma quantidade muito maior de informações junto à LPU, como também entrega impressionantes 150 TB/s de largura de banda.
