
A OpenAI anunciou nesta terça-feira (25) a integração do Sora ao ChatGPT, permitindo que os usuários gerem imagens diretamente na plataforma. Antes, o acesso ao Sora era limitado a um site separado, mas agora essa funcionalidade passa a estar disponível dentro do ChatGPT sob o nome de “Imagens no ChatGPT”.
O Sora foi inicialmente apresentado como um gerador de vídeos por inteligência artificial, mas, nesta primeira fase de integração, estará focado apenas na criação de imagens. A funcionalidade será acessível para usuários dos planos ChatGPT Plus, Pro, Team e Free.
No caso dos assinantes do plano gratuito, o limite de uso será o mesmo do DALL-E, embora a OpenAI não tenha divulgado um número exato. A porta-voz da empresa, Taya Christianson, afirmou ao The Verge que esse limite pode mudar ao longo do tempo conforme a demanda.
Avanços técnicos na geração de imagens no ChatGPT
- De acordo com Gabriel Goh, líder de pesquisa da OpenAI, o novo sistema utiliza o modelo GPT-4o como base.
- Ele destaca avanços significativos na precisão dos detalhes das imagens, especialmente na capacidade de manter relações corretas entre atributos e objetos.
- Esse conceito, chamado de “binding”, permite ao modelo gerar imagens com mais precisão quando solicitados múltiplos elementos, como cores e formas diferentes, sem erros.
- Outro aprimoramento é a renderização de textos dentro das imagens. Ferramentas de IA frequentemente apresentam erros ao tentar inserir palavras legíveis nas criações visuais, mas a OpenAI aprimorou essa capacidade para tornar os textos gerados mais coerentes e utilizáveis.
- Segundo Goh, essa melhoria exigiu meses de refinamento, mas a qualidade agora é consistente, com falhas ocorrendo apenas em textos muito pequenos.
- A abordagem adotada pela OpenAI para a geração de imagens também difere dos modelos tradicionais.
- Enquanto o DALL-E e outras ferramentas usam um método baseado em difusão, o Sora emprega um processo autoregressivo, criando a imagem sequencialmente, da esquerda para a direita e de cima para baixo.
- Esse método pode ser responsável pelos avanços na precisão dos elementos visuais e textuais.
Aplicações e demonstrações
Antes do lançamento da nova funcionalidade, a OpenAI realizou demonstrações para mostrar o potencial do Sora. Entre os exemplos apresentados, estavam diagramas científicos como o experimento do prisma de Newton, histórias em quadrinhos com personagens e balões de diálogo consistentes, além de pôsteres informativos com textos precisos. A ferramenta também se mostrou útil na criação de imagens com fundo transparente para adesivos, cardápios de restaurantes e logotipos.
Para Jackie Shannon, líder de produto multimodal da OpenAI, a IA por trás do ChatGPT traz consigo um diferencial: o conhecimento de mundo. Isso significa que um usuário não precisa fornecer detalhes extensivos sobre um conceito científico, por exemplo, para obter uma imagem precisa.
Apesar dos avanços, a nova tecnologia leva mais tempo para gerar imagens em comparação com versões anteriores. No entanto, a OpenAI considera essa troca vantajosa. Segundo Shannon, a qualidade e a capacidade de geração de imagens com alto nível de detalhe compensam os segundos adicionais de espera.

Leia mais:
- O que é a Sora, a inteligência artificial da OpenAI que cria vídeos?
- 5 IAs parecidas com o Sora, que criam vídeo a partir de texto
- Solução para alucinações de IA pode ser… a própria IA!
Salvaguardas e segurança
Diante de preocupações com o uso indevido de imagens geradas por IA, como deepfakes e remoção de marcas d’água, a OpenAI reforçou seus mecanismos de segurança com a chegada do Sora ao ChatGPT. Shannon afirmou que o sistema bloqueia a geração de deepfakes sexuais e a remoção de marcas d’água e impede a criação de conteúdo ilegal.
Embora as imagens geradas pelo Sora não possuam marcas visíveis indicando sua origem, todas incluirão metadados C2PA, um padrão adotado para identificar imagens criadas por IA. A OpenAI também desenvolverá ferramentas internas para rastrear a proveniência das imagens.
A empresa enfatiza que os usuários têm a propriedade das imagens geradas e podem utilizá-las conforme as políticas da OpenAI permitem. “Nenhum sistema é perfeito, mas estamos constantemente aprimorando nossas salvaguardas”, concluiu Shannon.
O post OpenAI integra Sora ao ChatGPT e melhora geração de imagens apareceu primeiro em Olhar Digital.
Fonte: https://olhardigital.com.br/2025/03/25/reviews/openai-integra-sora-ao-chatgpt-e-melhora-geracao-de-imagens/