Cingapura lidera iniciativa para desenvolver modelo de linguagem multimodal para o Sudeste Asiático.

Singapura investe $52 milhões no desenvolvimento de um modelo de linguagem único, diferente das nações ocidentais.

Projeto de pesquisa constrói modelo de IA em grande escala para o Sudeste Asiático

🌐 Globo do Sudeste Asiático 🌐

Uma nova iniciativa de pesquisa está em andamento para construir um grande modelo de idioma (LLM) que atenda melhor às características demográficas das nações do Sudeste Asiático.

Apresentando o Programa Nacional LLM Multimodal

Denominado Programa Nacional LLM Multimodal, essa iniciativa emocionante é liderada por Cingapura e tem como objetivo desenvolver um modelo de idioma artificial de inteligência (AI) em grande escala que apoie a mistura diversificada de cultura e idioma da região. 🇸🇬

Três agências governamentais – Infocomm Media Development Authority (IMDA), AI Singapore (AISG) e a Agency for Science, Technology and Research (A*STAR) – colaboraram para lançar o programa de pesquisa, contando com um financiamento de SG$70 milhões ($52,48 milhões) da National Research Foundation.

Por que o Sudeste Asiático precisa de modelos de idioma localizados

“À medida que a tecnologia evolui rapidamente, há uma necessidade estratégica de desenvolver capacidades soberanas em LLMs”, disseram as agências em um comunicado conjunto. “Cingapura e as culturas locais e regionais da região têm valores e normas diferentes daqueles dos países ocidentais, de onde a maioria dos grandes modelos de idioma tem sua origem”.

Para entender verdadeiramente o contexto e os valores relacionados às diversas culturas e idiomas da região, é crucial desenvolver LLMs multimodais e localizados para o Sudeste Asiático. Isso inclui enfrentar os desafios de alternância de contexto entre idiomas na população multilíngue de Cingapura.

Desenvolvendo Capacidades de Pesquisa e Engenharia

A iniciativa de pesquisa utilizará os recursos de computação de alto desempenho do Centro Nacional de Supercomputação de Cingapura e se concentrará no desenvolvimento das capacidades de pesquisa e engenharia em LLMs multimodais. O comprometimento de Cingapura em se tornar um hub global de IA é claro, com Ong Chen Hui, vice-presidente executivo de tecnologia de negócios da IMDA, afirmando: “A linguagem é um facilitador essencial para a colaboração. Ao investir em talento e modelos de IA em grande escala para idiomas regionais, queremos promover a colaboração da indústria além das fronteiras e impulsionar a próxima onda de inovação em IA no Sudeste Asiático”.

SEA-LION: Um Passo Rumo à Maior Localização

A iniciativa se baseará nos esforços atuais do Southeast Asian Languages in One Network (SEA-LION) da AISG, um LLM de código aberto projetado para ser menor, flexível e mais rápido em comparação com os LLMs existentes no mercado atualmente. O SEA-LION opera com dois modelos base: um modelo de três bilhões de parâmetros e um modelo de sete bilhões de parâmetros.

Ao criar LLMs que representam melhor as populações “não-WEIRD” (não ocidentais, educadas, industrializadas, ricas e democráticas), o SEA-LION tem como objetivo combater os vieses encontrados em modelos existentes. Com seus dados de treinamento consistindo em 981 bilhões de tokens de linguagem, o SEA-LION tem o potencial de preencher a lacuna e fornecer uma representação mais precisa dos idiomas e culturas do Sudeste Asiático.

A Ambiciosa Estratégia de IA de Cingapura

Os esforços para construir LLMs localizados estão alinhados com a estratégia de IA de Cingapura, que visa estabelecer o país como um hub global de desenvolvimento de soluções de IA até 2030. Essa estratégia abrangente inclui planos para triplicar o número de profissionais de IA no país para 15.000 nos próximos três a cinco anos, junto com iniciativas que enfocam governança, testes, padronização e diretrizes de ética e segurança em IA.

O vice-primeiro-ministro de Cingapura, Lawrence Wong, enfatizou a importância do desenvolvimento e adoção responsável da IA em seu discurso no lançamento da estratégia nacional de IA. À medida que a IA avança, ele destacou a possibilidade de máquinas com habilidades cognitivas semelhantes às humanas, autoconsciência e tomada de decisões independentes. Portanto, é crucial orientar o desenvolvimento e a adoção da IA de forma deliberada.

P&R: O que mais os leitores querem saber?

P: O que é um modelo de idioma em grande escala (LLM)? R: Um modelo de idioma em grande escala é um sistema de IA capaz de gerar texto semelhante ao humano, responder perguntas e entender o contexto da linguagem. Ele utiliza uma quantidade massiva de dados para aprender e replicar padrões de linguagem semelhantes aos humanos.

P: Como os modelos de idioma existentes exibem viés? R: Os modelos de idioma existentes frequentemente exibem viés devido aos dados de treinamento que eles utilizam, os quais são frequentemente obtidos da internet. Esses dados tendem a ter uma origem ocidental, educada, industrializada, rica e democrática (WEIRD), criando vieses em valores culturais, crenças políticas e atitudes sociais. Pessoas de origem não-WEIRD têm menos representação nesses modelos.

P: Quais são os benefícios de construir modelos de linguagem localizados? R: Construir modelos de linguagem localizados permite uma melhor compreensão das nuances, contexto cultural e valores específicos de uma determinada região. Ao abordar os preconceitos e limitações dos modelos existentes, os modelos localizados fornecem representações mais precisas e permitem avanços nas aplicações de IA para línguas regionais.

P: Como a SEA-LION contribui para a localização de idiomas? R: A SEA-LION é uma LLM de código aberto especificamente projetada para representar populações não-WEIRD. Ao aproveitar seus dados de treinamento, que incluem tokens de linguagem do sudeste asiático e regiões de língua chinesa, a SEA-LION busca fornecer um modelo de linguagem mais inclusivo e abrangente para as culturas do sudeste asiático.

P: Quais são as implicações de longo prazo da estratégia de IA de Cingapura? R: A estratégia de IA de Cingapura tem como objetivo posicionar o país como líder global no desenvolvimento de IA. Ao promover a colaboração da indústria, aumentar o número de profissionais de IA e focar em governança e ética, Cingapura busca impulsionar a inovação, o crescimento econômico e o progresso social no campo da IA.

Em conclusão

O Programa Nacional Multimodal LLM liderado por Cingapura demonstra um compromisso de desenvolver modelos de linguagem de IA que representem melhor as culturas e línguas do sudeste asiático. Ao abordar preconceitos, contextos específicos da linguagem e valores locais, esses modelos localizados abrirão caminho para avanços nas aplicações de IA e fomentarão a inovação na região. A ambiciosa estratégia de IA de Cingapura posiciona o país como líder global no desenvolvimento de IA, enfatizando a importância da adoção responsável da IA e a necessidade de abraçar o poder transformador da IA.


Referências:
1. TomTom e Microsoft Lançam Assistente de Direção com IA 2. A Ética da IA Generativa: Como Podemos Aproveitar Essa Tecnologia Poderosa 3. DALL·E 3: Como o ChatGPT Pode Ler e Modificar Imagens, Venha Conferir 4. Uma Questão Difícil: Quem Possui o Código, Imagens e Narrativas Geradas por IA? 5. Proprietário da CBS Paramount, National Amusements, Afirma que Foi Hackeado 6. OpenAI Lança Correção de Vazamento de Dados do ChatGPT: Problema Completamente Resolvido 7. 7 Dicas Avançadas de Redação de Prompt do ChatGPT que Você Precisa Saber


Você achou este artigo fascinante? Compartilhe suas opiniões nos comentários abaixo e não se esqueça de divulgar o artigo em suas redes sociais favoritas! 🚀😄