7 de janeiro de 2026
Da nuvem ao asfalto: o plano da Nvidia para a
Compartilhe:

O CEO da Nvidia, Jensen Huang, abriu a CES 2026, em Las Vegas (EUA), com um recado ao mercado: a empresa quer redefinir como a inteligência artificial (IA) é construída, treinada e usada no mundo real. No palco, Huang apresentou a plataforma Vera Rubin, o primeiro sistema de IA com “design extremo” da companhia; e o Alpamayo, modelo de “raciocínio” voltado a veículos autônomos.

A nova arquitetura, sucessora da Blackwell e já em produção, promete reduzir em até 90% o custo de geração de tokens, base do funcionamento dos sistemas de IA. O movimento acelera a modernização de um mercado global de computação estimado em US$ 10 trilhões (R$ 54 trilhões).

Além disso, marca o avanço da Nvidia para a chamada IA física – quando modelos, simulações e sensores permitem que máquinas compreendam, raciocinem e ajam no mundo real.

Vera Rubin da Nvidia tem arquitetura com seis chips integrados

A plataforma Vera Rubin, nomeada em homenagem à astrônoma americana pioneira no estudo da matéria escura, nasce com a seguinte proposta: tratar a IA como um sistema completo, não como um chip isolado. Em vez de otimizar apenas um componente, a Nvidia projetou tudo junto. 

Com seis chips integrados, plataforma Vera Rubin, da Nvidia, elimina gargalos que hoje encarecem e limitam a escala da IA (Imagem: Divulgação/Nvidia)

O resultado é uma plataforma formada por seis chips integrados, pensados desde o data center até o software. Isso elimina gargalos que hoje encarecem e limitam a escala da IA.

No centro desse conjunto estão as GPUs Rubin, capazes de entregar 50 petaflops de inferência, acompanhadas das CPUs Vera, voltadas ao processamento agêntico (quando modelos não só respondem, mas decidem e executam ações). Tudo isso é conectado pelo NVLink 6, nova geração de interconexão que permite que milhares de chips funcionem como um único sistema.

Esse “design extremo” se traduz em desempenho bruto. Segundo a Nvidia, a Rubin entrega cinco vezes mais poder de computação do que a geração anterior na execução de chatbots e aplicativos de IA. Na prática, isso significa respostas mais rápidas, latência menor e a possibilidade de atender milhões de usuários simultaneamente sem multiplicar custos.

O salto aparece também no treinamento de modelos gigantes. A plataforma permite treinar sistemas com até dez trilhões de parâmetros em cerca de um mês, usando apenas um quarto do número de chips exigido pela Blackwell. É uma mudança relevante num cenário no qual o tamanho dos modelos cresce mais rápido do que a capacidade dos data centers de absorver novos equipamentos.

A eficiência energética entra como peça-chave dessa equação. A Nvidia afirma que o custo de inferência cai para um décimo do atual, ao mesmo tempo em que novas tecnologias ajudam a conter o consumo elétrico (hoje um dos maiores entraves à expansão dos data centers). 

Um dos destaques é a nova plataforma de memória de contexto, tipo de armazenamento otimizado para conversas longas, que aumenta em cinco vezes a velocidade de tokens por segundo e a eficiência energética.

Com a produção já em andamento, a Rubin não é promessa distante. As remessas para clientes como Microsoft, Amazon e Oracle estão previstas para a segunda metade de 2026. Isso sinaliza que a próxima fase da corrida da IA começa ainda este ano, com foco menos em volume bruto e mais em custo, escala e eficiência.

Alpamayo leva ‘raciocínio’ para veículos e impulsiona a era da IA física

Se a Rubin resolve o “como” da IA em escala, o Alpamayo responde ao “para quê”. Apresentado como o “momento ChatGPT da IA física”, o modelo leva o conceito de raciocínio para sistemas que precisam agir no mundo real, como carros autônomos, robôs e máquinas industriais.

CEO da Nvidia, Jensen Huang, mostrando na CES 2026 como a empresa planeja levar raciocínio para a inteligência artificial (IA) física
Nvidia planeja levar raciocínio para sistemas que precisam agir no mundo real, como carros autônomos, robôs e máquinas industriais (Imagem: Divulgação/Nvidia)

A diferença central está na forma de decidir. Em vez de apenas reagir a padrões vistos antes, o Alpamayo usa cadeias de pensamento para lidar com situações raras e complexas, como uma obra inesperada na pista ou o comportamento imprevisível de outros motoristas. O sistema combina visão, linguagem e ação para avaliar cenários antes de executar uma manobra.

Outro ponto-chave é a transparência. O modelo é capaz de explicar suas decisões de direção, deixando um rastro que engenheiros podem analisar depois. Treinado diretamente com demonstradores humanos, ele busca um comportamento mais natural e previsível, algo essencial para ganhar confiança em ambientes urbanos reais.

A Nvidia posiciona o Alpamayo como base para autonomia de nível 4 (quando o veículo consegue operar sozinho na maior parte das situações). Para isso, a empresa oferece blueprints de simulação e conjuntos de dados abertos. Assim, montadoras podem testar e validar seus sistemas em ambientes digitais antes de colocá-los nas ruas.

O primeiro exemplo concreto dessa estratégia vem da parceria com a Mercedes-Benz. O novo CLA, equipado com tecnologia de direção definida por IA, deve chegar aos EUA e à Europa ainda em 2026, o que deve marcar a transição da autonomia avançada do laboratório para o produto comercial.

Esse avanço se encaixa num ecossistema mais amplo de modelos abertos, que vai além dos carros. A Nvidia ampliou seu portfólio para áreas como saúde (Clara), clima (Earth-2) e robótica (Cosmos) para que empresas, governos e pesquisadores construam soluções sobre a mesma base de inteligência.

Leia mais:

  • CES 2026 começa com IA no centro do palco
  • Entrevista: o que esperar da CES 2026?
  • Nvidia: o que é e o que a empresa vende?
  • Entenda a valorização da Nvidia e como ela se tornou a empresa mais valiosa do mundo

A lógica da IA física também chega à indústria. A parceria ampliada com a Siemens integra simulação, design e produção, o que deve transformar fábricas em grandes sistemas robóticos conectados. 

No outro extremo da escala, a empresa mostrou agentes rodando localmente no DGX Spark, um supercomputador de mesa. Isso aponta para um futuro no qual robôs e agentes de IA atuam como colaboradores físicos, responsivos e autônomos. Do data center à linha de produção.

O post Da nuvem ao asfalto: o plano da Nvidia para a próxima fase da corrida da IA apareceu primeiro em Olhar Digital.

Fonte: https://olhardigital.com.br/2026/01/06/inteligencia-artificial/o-plano-da-nvidia-para-a-proxima-fase-da-corrida-da-ia/