3 de dezembro de 2025
Como a Amazon quer baratear o treinamento de IAs
Compartilhe:

A Amazon Web Services (AWS) ampliou sua ofensiva para reduzir o custo do treinamento de inteligência artificial (IA) com o lançamento do chip Trainium3 e do serviço Nova Forge, anunciados durante a conferência re:Invent, em Las Vegas (EUA).

As iniciativas reforçam a estratégia da empresa de oferecer alternativas mais baratas e escaláveis para companhias que buscam treinar modelos cada vez mais complexos sem recorrer a investimentos de centenas de milhões — ou até bilhões — de dólares.

Trainium3 UltraServers reúnem até 144 chips em um único sistema (Imagem: Divulgação/Amazon)

Amazon e seu plano por IAs mais escaláveis e baratas

  • O pilar central dessa ofensiva é o Trainium3, nova geração de chips de IA desenvolvidos pela Amazon. Disponível nos Trainium3 UltraServers, o processador é fabricado em tecnologia de três nanômetros e promete desempenho até 4,4 vezes maior que o do Trainium2, além de quase quatro vezes mais largura de banda de memória;
  • Segundo a AWS, os ganhos reduzem tanto o tempo de treinamento quanto os custos operacionais. Em testes internos com o modelo de código aberto GPT-OSS, o chip registrou três vezes mais throughput por chip e respostas até quatro vezes mais rápidas;
  • A eficiência energética também entra na conta da economia: o Trainium3 oferece cerca de 40% mais eficiência que sua geração anterior. Essa melhoria, afirma a AWS, reduz não apenas despesas diretas com energia, mas também o impacto ambiental dos data centers;
  • Os UltraServers reúnem até 144 chips em um único sistema, somando 362 PFLOPs em FP8, enquanto a nova arquitetura de rede — com o NeuronSwitch-v1 e a evolução da Neuron Fabric — diminui a latência para menos de 10 microsegundos.

Com os novos EC2 UltraClusters 3.0, empresas podem conectar milhares desses sistemas, alcançando até um milhão de chips Trainium, dez vezes mais que na geração anterior.

Para alguns clientes, os ganhos já aparecem: a AWS afirma que empresas, como Anthropic, Metagenomi e Ricoh, registraram reduções de até 50% nos custos de treinamento e inferência ao migrar para a família Trainium. A startup Decart relatou desempenho quatro vezes superior e custo pela metade em comparação a GPUs tradicionais.

Logomarca do Amazon Nova
Nova Forge permite às empresas personalizarem modelos de IA da Amazon desde o estágio inicial de treinamento (Imagem: Divulgação/AWS)

Briga por chips distintos da Nvidia

O lançamento ocorre no momento em que o mercado busca alternativas aos chips da Nvidia — ainda padrão da indústria. Analistas citados pela Bloomberg afirmam que a AWS mira clientes que procuram menor custo total de operação.

A empresa, porém, diz não querer substituir a Nvidia, mas ampliar as opções disponíveis. Ainda assim, o movimento se alinha à tendência observada pelo The Wall Street Journal: companhias de IA vêm diversificando fornecedores para evitar dependência de um único fabricante.

Paralelamente à nova geração de chips, a AWS apresentou o Nova Forge, serviço que permite às empresas treinarem modelos da Amazon desde estágios iniciais, pagando US$ 100 mil (R$ 530,7 mil, na conversão direta) anuais.

A proposta é oferecer “treinamento aberto”, no qual clientes acessam checkpoints exclusivos no pré-treinamento, treinamento e pós-treinamento. Em vez de apenas realizar fine-tuning, as empresas podem incorporar seus próprios dados em múltiplas fases do desenvolvimento — o que, segundo a Amazon, reduz significativamente os custos em comparação a construir um grande modelo de linguagem (LLM, na sigla em inglês) do zero.

O CTO do Reddit, Chris Slowe, afirmou que um modelo Nova adaptado com dados da plataforma “já está entregando resultados impressionantes”, segundo comunicado divulgado pela Amazon.

Entre as organizações que utilizam o Forge estão Booking.com, Cosine AI, Nimbus Therapeutics, Nomura Research Institute, OpenBabylon, Reddit e Sony. O sistema também é usado internamente pelas equipes das lojas da Amazon e da assistente Alexa.

Fachada de um galpão da Amazon
Amazon diz não querer substituir a Nvidia, mas ampliar as opções disponíveis (Imagem: Marcos del Mazo/Shutterstock)

Leia mais:

  • 5 dicas para economizar nas compras na Amazon
  • O que é a AWS, plataforma da Amazon que apresentou falhas nesta segunda-feira?
  • Fim dos apagões? Amazon lança ferramenta de IA que detecta causa das interrupções

Os modelos personalizados gerados pelo serviço — chamados “Novellas” — podem ser implantados no Amazon Bedrock, que já opera cargas de produção em Trainium3. A AWS também apresentou a família Nova 2, destacando o modelo Nova 2 Pro, descrito como o mais inteligente da empresa, e o Nova 2 Omni, primeiro modelo multimodal de raciocínio capaz de processar texto, imagens, fala e vídeos, além de gerar imagens e texto.

“Um ano atrás, havia dúvidas se tínhamos perdido a onda, mas agora, a maioria das pessoas está construindo seus sistemas de produção na AWS por causa do que construímos nos últimos anos”, disse o CEO da AWS, Matt Garman, ao Axios.

A companhia já trabalha na próxima geração: o Trainium4, que trará ao menos seis vezes mais desempenho em FP4, três vezes mais em FP8 e largura de banda de memória quatro vezes maior. Em parceria com a Nvidia, o futuro chip integrará o NVLink Fusion, permitindo racks híbridos com Trainium, Graviton e EFA.

Os Amazon EC2 Trn3 UltraServers já estão disponíveis para clientes da AWS.

O post Como a Amazon quer baratear o treinamento de IAs apareceu primeiro em Olhar Digital.

Fonte: https://olhardigital.com.br/2025/12/03/pro/como-a-amazon-quer-baratear-o-treinamento-de-ias/