
A OpenAI anunciou nesta segunda-feira (14) a chegada da nova família de modelos GPT-4.1 à sua API, incluindo as versões GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. A empresa afirma que os novos modelos superam os anteriores GPT-4o e GPT-4o mini em diversos quesitos, com destaque para tarefas de programação e compreensão de instruções. Além disso, eles agora suportam janelas de contexto de até 1 milhão de tokens.
Segundo a OpenAI, os modelos foram desenvolvidos com foco em aplicações do mundo real, a partir de colaborações com a comunidade de desenvolvedores. A atualização também inclui um novo limite de conhecimento até junho de 2024.
Desempenho do GPT-4.1 em tarefas de codificação
- Segundo a OpenAI, o GPT-4.1 apresentou melhorias significativas em benchmarks de engenharia de software, como o SWE-bench Verified, no qual obteve 54,6% de sucesso.
- Este índice representa um aumento de mais de 20 pontos percentuais em relação ao GPT-4o e coloca o novo modelo como destaque entre os modelos de linguagem voltados à programação.
- A OpenAI também informa que o GPT‑4.1 é mais eficiente na geração de código em formatos de diffs e realiza menos edições desnecessárias.
- Em avaliações internas, a frequência de alterações extrínsecas caiu de 9% para 2%, e houve melhorias expressivas em tarefas como desenvolvimento frontend.
- Em testes comparativos, avaliadores humanos preferiram os sites gerados com o GPT‑4.1 em 80% dos casos.
- Outro destaque é a versão GPT‑4.1 nano, que se posiciona como o modelo mais rápido e econômico da nova linha.
- Ele alcança 80,1% no benchmark MMLU e se mostra adequado para tarefas como classificação e autocompletar, mantendo a capacidade de processar 1 milhão de tokens.
Aprimoramentos em instruções e conversas longas
Com foco na confiabilidade, o GPT-4.1 também avançou no cumprimento de instruções complexas, como seguir formatos específicos (ex: XML, Markdown), evitar comportamentos indesejados e manter coerência em múltiplas interações. O modelo teve desempenho 10,5% superior ao GPT-4o no benchmark MultiChallenge, que simula conversas com múltiplas instruções encadeadas.
Além disso, no IFEval — que avalia o cumprimento de instruções verificáveis — o GPT‑4.1 obteve 87,4%, contra 81% do GPT‑4o. Empresas que participaram da fase de testes, como Blue J e Hex, relataram reduções no retrabalho e maior precisão em tarefas de análise fiscal e consultas em bancos de dados.
Contexto ampliado: até 1 milhão de tokens
A nova linha também se diferencia pela ampliação significativa da janela de contexto. Enquanto versões anteriores como o GPT‑4o limitavam-se a 128 mil tokens, os novos modelos conseguem lidar com entradas de até 1 milhão de tokens, o que, segundo a OpenAI, equivale a mais de oito cópias completas do código-fonte do React.
Para validar essa capacidade, a empresa desenvolveu testes como o “Needle in a Haystack”, onde os modelos devem localizar uma informação escondida em grandes volumes de texto. O GPT‑4.1 se mostrou eficaz mesmo com dados dispersos em janelas extensas. Para cenários mais complexos, a OpenAI criou o benchmark OpenAI-MRCR, que exige interpretação de múltiplas informações interligadas ao longo de conversas simuladas.
Transição e disponibilidade
O GPT-4.1 está disponível exclusivamente via API. A OpenAI também comunicou que a versão GPT‑4.5 Preview será desativada em 14 de julho de 2025, já que o novo modelo oferece desempenho semelhante ou superior com menor custo e latência. Os recursos do GPT‑4.5, como qualidade de texto e nuance, continuarão sendo incorporados aos próximos modelos.
Já no ChatGPT, as melhorias do GPT‑4.1 estão sendo gradualmente integradas à versão GPT‑4o. A empresa afirma que continuará ampliando essas atualizações nas futuras versões da plataforma.
GPT‑4.1 mini e nano foram desenvolvidos pensando em performance com menor custo. A versão mini, por exemplo, reduz a latência pela metade e o custo em 83%, mantendo resultados comparáveis aos modelos maiores. Já a nano foca em velocidade e custo-benefício, sendo indicada para aplicações que exigem respostas rápidas com contexto extenso.
Esses avanços devem ampliar as possibilidades de criação de agentes autônomos mais úteis e confiáveis para áreas como suporte ao cliente, engenharia de software e análise documental.
O post OpenAI lança GPT-4.1: melhor em código e em seguir instruções apareceu primeiro em Olhar Digital.
Fonte: https://olhardigital.com.br/2025/04/14/pro/openai-lanca-gpt-4-1-melhora-em-codigo-e-em-seguir-instrucoes/