“O Meta fez um ótimo trabalho ao oferecer suporte a muitas coisas diferentes, como fala para fala, fala para texto e até mesmo reconhecimento automático de fala”, diz Chetan Jaiswal, professor de ciência da computação na Universidade Quinnipiac. não participar do estudo. “Só o número de idiomas que eles suportam já é uma grande conquista.”

Os tradutores humanos ainda são uma parte importante do processo de tradução, dizem os investigadores, porque podem lidar com diversos contextos culturais e garantir que o mesmo significado é transmitido de uma língua para outra. A mudança é importante, diz Lynne Bowker, da Escola de Tradução e Interpretação da Universidade de Ottawa, que não trabalhou no Seamless. “As línguas refletem as culturas, e as culturas têm suas próprias maneiras de conhecer as coisas”, diz ele.

Quando se trata de aplicações como medicina ou direito, um ser humano precisa verificar minuciosamente as traduções automáticas, diz ele. Caso contrário, poderão ocorrer mal-entendidos. Por exemplo, se houvesse uma tradução do Google usado Em janeiro de 2021, o Departamento de Saúde da Virgínia traduziu as informações de saúde pública sobre a vacina COVID-19 do inglês para “não obrigatório” em espanhol, mudando todo o significado da mensagem.

Os modelos de IA têm muito mais exemplos para treinar em alguns idiomas do que em outros. Isto significa que os atuais modelos de conversão de fala podem traduzir uma língua como o grego para o inglês, onde pode haver muitos exemplos, mas não podem traduzir o suaíli para o grego. A equipe por trás do Seamless decidiu resolver esse problema treinando o modelo em milhões de horas de áudio falado em diferentes idiomas. Este pré-treinamento permitiu-lhe reconhecer padrões gerais de linguagem, facilitando o processamento de línguas menos comuns porque já tinha um certo ponto de partida de como deveria soar a língua falada.

O sistema é de código aberto, o que os pesquisadores esperam que incentive outros a desenvolverem suas capacidades atuais. Mas alguns estão cépticos sobre a sua utilidade em comparação com as alternativas existentes. “O modelo de tradução do Google não é tão open source quanto o Seamless, mas é muito mais responsivo e rápido, e não custa nada academicamente”, diz Jaiswal.

O mais interessante sobre o metasistema é que ele aponta para a possibilidade, em um futuro não muito distante, de tradução instantânea entre idiomas – como o peixe Babel no romance cult de Douglas Adams. Guia do Mochileiro das Galáxias. SeamlessM4T é mais rápido que os modelos existentes, mas ainda não imediatamente. Ainda assim, a Meta afirma ter uma versão mais recente do Seamless que é tão rápida quanto os tradutores humanos.

“Embora este tipo de tradução de sinais seja bom e útil, acho que a tradução simultânea é ainda mais útil”, diz Kenny Zhu, diretor do Laboratório de Linguística Computacional da Universidade do Texas em Arlington, que não está envolvido na nova versão. investigação.

Source link