O Google adicionou 110 idiomas ao Google Tradutor – a maior expansão já feita para o serviço, conforme divulgado pela empresa nesta quinta-feira (27). Até então, o Tradutor entendia 133 idiomas. Ou seja, o número quase dobrou nesta atualização.
O modelo de linguagem AI PaLM 2 da big tech, antecessor do Gemini, ajudou o Google Tradutor a aprender esses novos idiomas. O modelo foi eficaz principalmente em aprender idiomas relacionados entre si, como idiomas “próximos ao hindi, como Awadhi e Marwadi, e crioulos franceses como crioulo seichelense e crioulo mauriciano”, explicou Isaac Caswell, engenheiro de software, num post no blog do Google.
Leia mais:
- Drone secreto dos EUA aparece no Google Maps
- Como usar modo satélite no Google Maps [PC e celular]
- Veja as vantagens de usar o Gemini em vez do Google Assistente no seu celular
Entre os novos idiomas suportados pelo serviço do Google, está o Cantonês, que “há muito tempo tem sido um dos idiomas mais solicitados para o Google Tradutor”, diz Caswell. “Como o Cantonês muitas vezes se sobrepõe ao Mandarim na escrita, é complicado encontrar dados e treinar modelos [de linguagem].”
Expansão do Google Tradutor abrange idiomas falados por 614 milhões de pessoas
Caswell também mencionou no post que “cerca de um quarto dos novos idiomas são originários da África”. No total, a expansão abrange idiomas com mais de 614 milhões de falantes, “abrindo traduções para cerca de 8% da população mundial”, afirmou o engenheiro de software.
“Alguns são idiomas mundiais importantes, com mais de 100 milhões de falantes. Outros são falados por pequenas comunidades de povos indígenas, e alguns têm praticamente nenhum falante nativo, mas esforços ativos de revitalização.” – Isaac Caswell, engenheiro de software, num post no blog do Google
Confira abaixo detalhes sobre idiomas que chegam ao Google Tradutor, além do Cantonês:
- Afar: língua tonal falada no Djibouti, Eritreia e Etiópia. Entre os idiomas incluídos na expansão, o Afar teve a maior contribuição voluntária da comunidade;
- Manx: idioma celta da Ilha de Man. Quase foi extinto com a morte de seu último falante nativo, em 1974. Mas graças a um movimento de revitalização em toda a ilha, agora há milhares de falantes;
- N’Ko: forma padronizada das línguas mandingas da África Ocidental, unificando muitos dialetos num idioma comum. Seu alfabeto único foi inventado em 1949 e possui uma comunidade ativa de pesquisa que desenvolve recursos e tecnologia para ele atualmente;
- Punjabi (Shahmukhi): variação do Punjabi escrito no script Perso-Árabe (Shahmukhi). É o idioma mais falado no Paquistão;
- Tamazight (Amazigh): idioma berbere falado em toda a África do Norte. Embora haja muitos dialetos, a forma escrita é geralmente mutuamente compreensível. É escrito no alfabeto latino e no alfabeto Tifinagh, ambos suportados pelo Google Tradutor;
- Tok Pisin: crioulo baseado no inglês e a língua franca da Papua Nova Guiné.
O post Número de idiomas entendidos pelo Google Tradutor (quase) dobra apareceu primeiro em Olhar Digital.
Fonte: https://olhardigital.com.br/2024/06/27/internet-e-redes-sociais/numero-de-idiomas-entendidos-pelo-google-tradutor-quase-dobra/