O novo modelo de IA da Meta é um especialista em tradução em tempo real

The new AI model from Meta is an expert in real-time translation.

O mais recente avanço da Meta em IA é uma grande conquista para a tradução em tempo real de texto e fala.

Na terça-feira, a empresa lançou o SeamlessM4T: um modelo multimodal que traduz texto para fala e vice-versa. A Meta afirma que o SeamlessM4T é “o primeiro modelo de IA de tradução e transcrição multilíngue e multimodal tudo-em-um”, o que significa que ele é capaz de traduzir e transcrever idiomas ao mesmo tempo. O SeamlessM4T pode traduzir entrada de fala para texto, fala para fala, texto para fala e texto para texto em até 100 idiomas. As traduções para saídas de fala para fala e texto para fala suportam 35 idiomas.

O tweet pode ter sido excluído

Assim como outros modelos de IA lançados recentemente pela Meta, incluindo Llama 2 e AudioCraft, o SeamlessM4T está disponível publicamente para pesquisadores e desenvolvedores com uma licença de pesquisa. Além do modelo, a Meta também está lançando seu conjunto de dados de treinamento chamado SeamlessAlign, que contém 270.000 horas de alinhamentos de fala e texto. Ao contrário da OpenAI e do Google, a Meta faz questão de disponibilizar seus modelos como código aberto e publicamente acessíveis. A abordagem da Meta de lançar modelos de código aberto tem o efeito duplo de permitir que os desenvolvedores construam e melhorem os produtos, ao mesmo tempo em que ganham pontos entre os éticos de IA que pedem transparência nos sistemas de IA generativos.

A abordagem de código aberto da Meta pode parecer altruísta, mas é um movimento estratégico em um mercado brutalmente competitivo contra outras grandes empresas de tecnologia que desenvolvem IA. Há também a questão da coleta de dados com a qual todos os modelos de IA devem lidar. De acordo com a postagem no blog, o conjunto de dados do SeamlessM4T (SeamlessAlign) é composto por dados disponíveis publicamente, havendo questões éticas e legais em relação ao uso de obras protegidas por direitos autorais e dados pessoais sem consentimento.

O anúncio da Meta não detalhou planos específicos para o SeamlessM4T, apenas sugerindo que deseja “explorar como esse modelo fundamental pode permitir novas capacidades de comunicação”. Em outras palavras, algum dia poderemos ver uma versão voltada para o consumidor do SeamlessM4T no WhatsApp ou Instagram.