A OpenAI está investigando a startup chinesa DeepSeek, suspeita de ter treinado seu chatbot utilizando os modelos de IA da empresa americana, prática conhecida como destilação. As informações são do Wall Street Journal.
A OpenAI detectou várias tentativas de entidades chinesas de extrair grandes volumes de dados de seus modelos de IA, com o objetivo de treinar seus próprios sistemas, o que pode ser uma tentativa de imitar o desempenho de modelos mais avançados.
A empresa tomou medidas, como banir contas suspeitas e colaborar com a Microsoft, parceira que hospeda seus modelos, para identificar os responsáveis pelas tentativas de destilação.
Leia mais sobre a DeepSeek:
- DeepSeek é bom mesmo? Confira as primeiras impressões sobre a IA chinesa
- DeepSeek lança IA que supera o DALL-E 3 em geração de imagens
- Sam Altman diz que modelo de IA da DeepSeek é “impressionante”
Prática da “destilação” é permitida, mas há limites
- A DeepSeek ganhou atenção recentemente com o lançamento de seu modelo R1, que, apesar de ser treinado em chips menos potentes, demonstrou um desempenho impressionante.
- No entanto, as suspeitas sobre o uso indevido de dados da OpenAI levantam dúvidas sobre a verdadeira origem de seu sucesso.
- A destilação é uma técnica que permite treinar modelos menores e mais eficientes a partir de um modelo maior e mais caro, imitando seu raciocínio.
- Embora a OpenAI permita que seus usuários empresariais destilem seus modelos internamente, ela proíbe o uso de saídas de seus modelos para treinar sistemas concorrentes.
A DeepSeek, por sua vez, reconheceu o uso da destilação, mas defendeu que a técnica foi aplicada apenas em seus próprios modelos.
A situação levanta preocupações sobre o risco de empresas gastarem grandes somas para treinar modelos avançados, apenas para ver sua tecnologia ser copiada por rivais, o que poderia afetar a competitividade no mercado de IA.
Além disso, figuras como David Sacks, ex-czar da IA do governo Trump, acusaram publicamente a DeepSeek de usar modelos da OpenAI para aprimorar os seus, afirmando que há evidências substanciais dessa prática.
O post OpenAI suspeita de uso dos seus modelos em treino de IA da DeepSeek apareceu primeiro em Olhar Digital.
Fonte: https://olhardigital.com.br/2025/01/29/pro/openai-suspeita-de-uso-dos-seus-modelos-em-treino-de-ia-da-deepseek/