22 de setembro de 2024
Compartilhe:

O Google adicionou 110 idiomas ao Google Tradutor – a maior expansão já feita para o serviço, conforme divulgado pela empresa nesta quinta-feira (27). Até então, o Tradutor entendia 133 idiomas. Ou seja, o número quase dobrou nesta atualização.

O modelo de linguagem AI PaLM 2 da big tech, antecessor do Gemini, ajudou o Google Tradutor a aprender esses novos idiomas. O modelo foi eficaz principalmente em aprender idiomas relacionados entre si, como idiomas “próximos ao hindi, como Awadhi e Marwadi, e crioulos franceses como crioulo seichelense e crioulo mauriciano”, explicou Isaac Caswell, engenheiro de software, num post no blog do Google.

Leia mais:

  • Drone secreto dos EUA aparece no Google Maps
  • Como usar modo satélite no Google Maps [PC e celular]
  • Veja as vantagens de usar o Gemini em vez do Google Assistente no seu celular

Entre os novos idiomas suportados pelo serviço do Google, está o Cantonês, que “há muito tempo tem sido um dos idiomas mais solicitados para o Google Tradutor”, diz Caswell. “Como o Cantonês muitas vezes se sobrepõe ao Mandarim na escrita, é complicado encontrar dados e treinar modelos [de linguagem].”

Expansão do Google Tradutor abrange idiomas falados por 614 milhões de pessoas

Idiomas que chegam ao Google Tradutor são falados por 8% da população mundial (Imagem: Poetra.RH/Shutterstock)

Caswell também mencionou no post que “cerca de um quarto dos novos idiomas são originários da África”. No total, a expansão abrange idiomas com mais de 614 milhões de falantes, “abrindo traduções para cerca de 8% da população mundial”, afirmou o engenheiro de software.

“Alguns são idiomas mundiais importantes, com mais de 100 milhões de falantes. Outros são falados por pequenas comunidades de povos indígenas, e alguns têm praticamente nenhum falante nativo, mas esforços ativos de revitalização.” – Isaac Caswell, engenheiro de software, num post no blog do Google

Celular com o aplicativo Google Tradutor
Entre os novos idiomas entendidos pelo Google Tradutor, estão Cantonês, Punjabi (Shahmukhi) e Tok Pisin (Imagem: Ars/Shutterstock)

Confira abaixo detalhes sobre idiomas que chegam ao Google Tradutor, além do Cantonês:

  • Afar: língua tonal falada no Djibouti, Eritreia e Etiópia. Entre os idiomas incluídos na expansão, o Afar teve a maior contribuição voluntária da comunidade;
  • Manx: idioma celta da Ilha de Man. Quase foi extinto com a morte de seu último falante nativo, em 1974. Mas graças a um movimento de revitalização em toda a ilha, agora há milhares de falantes;
  • N’Ko: forma padronizada das línguas mandingas da África Ocidental, unificando muitos dialetos num idioma comum. Seu alfabeto único foi inventado em 1949 e possui uma comunidade ativa de pesquisa que desenvolve recursos e tecnologia para ele atualmente;
  • Punjabi (Shahmukhi): variação do Punjabi escrito no script Perso-Árabe (Shahmukhi). É o idioma mais falado no Paquistão;
  • Tamazight (Amazigh): idioma berbere falado em toda a África do Norte. Embora haja muitos dialetos, a forma escrita é geralmente mutuamente compreensível. É escrito no alfabeto latino e no alfabeto Tifinagh, ambos suportados pelo Google Tradutor;
  • Tok Pisin: crioulo baseado no inglês e a língua franca da Papua Nova Guiné.

O post Número de idiomas entendidos pelo Google Tradutor (quase) dobra apareceu primeiro em Olhar Digital.

Fonte: https://olhardigital.com.br/2024/06/27/internet-e-redes-sociais/numero-de-idiomas-entendidos-pelo-google-tradutor-quase-dobra/