
A Google DeepMind lançou o Genie 3 nesta terça-feira (05). É a nova versão de seu modelo de inteligência artificial (IA) capaz de criar “mundos” em 3D interativos em tempo real para usuários e agentes de IA.
Entre as melhorias prometidas para o modelo, estão mais tempo para interações e a capacidade de lembrar a posição de objetos mesmo quando o usuário desvia o olhar.
No entanto, provavelmente este não será um modelo que você poderá testar por conta própria. Ele chega como uma “prévia limitada para pesquisa”, acessível apenas a “um pequeno grupo de acadêmicos e criadores”.
Por que? Segundo o Google, para que os desenvolvedores possam entender melhor os riscos e como mitigá-los de forma apropriada.
Genie 3: o que é e como funciona o novo modelo de IA do Google DeepMind
Modelos como o Genie são sistemas de IA projetados para simular ambientes com diversos propósitos – por exemplo: educação, entretenimento e treinamento de robôs.
Eles funcionam a partir de comandos fornecidos pelos usuários, gerando espaços navegáveis semelhantes a videogames. A diferença é que esses são totalmente criados por IA.
Em comparação ao Genie 2, lançado em dezembro de 2024, o Genie 3 representa um avanço importante. Isso porque combina capacidades do antecessor com as do Veo 3, modelo de IA do Google gera vídeos e entende melhor as leis da física.
Na prática, isso permite experiências mais realistas e duradouras nos “mundos” criados por meio do Genie 3, segundo postagem no blog do Google.
“O Genie 3 é o primeiro modelo de mundo interativo, em tempo real e de uso geral”, disse Shlomi Fruchter, diretor de pesquisa da DeepMind, durante uma coletiva de imprensa (via TechCrunch).
“Ele vai além dos modelos de mundo restritos que existiam até agora. Não é específico de nenhum ambiente em particular”, disse Fruchter. “Pode gerar tanto mundos fotorrealistas quanto imaginários — e tudo entre esses dois extremos.”
Agora, os usuários agora poderão interagir com os mundos por alguns minutos, o que supera a limitação de 20 segundos do modelo anterior.
Outro aprimoramento importante está na memória visual. O Genie 3 mantém a posição de objetos por até um minuto. Assim, ambientes ficam mais consistentes.
Além disso, os “mundos” serão renderizados em resolução 720p e com taxa de 24 frames por segundo (fps).
A DeepMind também informou que vai incorporando eventos ativáveis por comando. Isso permite ao usuário, por exemplo, mudar o clima de um “mundo” ou adicionar personagens por meio de prompts.
No entanto, existem várias restrições – por exemplo: as maneiras limitadas pelas quais os usuários podem interagir com os mundos gerados. E o fato de que textos legíveis só são gerados quando fornecidos na descrição do mundo inserida pelo usuário.
Leia mais:
- IA médica do Google inventou parte do corpo que não existe
- O que é superinteligência artificial? Veja como ela pode mudar o futuro da humanidade
- Como usar de graça o Veo 3 e o Flow, do Google, para fazer vídeos com inteligência artificial
Passo para a AGI?
O Genie 3, segundo Fruchter, tem aplicações promissoras em áreas como educação, jogos e prototipagem criativa. Mas seu verdadeiro valor está no treinamento de agentes de IA para tarefas de uso geral, algo crucial para o avanço rumo à inteligência artificial geral (AGI).

“Acreditamos que os modelos de mundo são fundamentais no caminho rumo à AGI, especialmente para agentes incorporados, nos quais simular cenários do mundo real é particularmente desafiador”, disse Jack Parker-Holder, pesquisador da DeepMind, durante a coletiva.
Diferente de motores de física tradicionais, o Genie 3 aprende sozinho como o mundo funciona. Inspirado no Veo, ele observa como objetos se movimentam e interagem, “raciocinando” com base no que já foi gerado. Isso permite ao sistema criar simulações mais realistas e adaptativas.
“O modelo é autoregressivo, o que significa que gera um quadro por vez”, disse Fruchter em entrevista ao TechCrunch. “Ele precisa olhar para o que foi gerado anteriormente para decidir o que acontecerá a seguir. Essa é uma parte fundamental da arquitetura.”
Essa memória e consistência visual permitem que o Genie 3 desenvolva uma noção de física semelhante à dos humanos. A DeepMind destaca que isso cria oportunidades para que agentes de IA aprendam por meio da experiência prática, da mesma forma que os humanos aprendem no mundo real.
O post Genie 3: Google DeepMind melhora IA que cria ‘mundos’ em 3D apareceu primeiro em Olhar Digital.
Fonte: https://olhardigital.com.br/2025/08/05/pro/genie-3-google-deepmind-melhora-ia-que-cria-mundos-em-3d/