Urgente 14:44 O Irão ameaça os EUA enquanto Teerão acusa Washington e Israel de atacarem Natanz 14:00 A União Africana nomeia Macky Sall para suceder a António Guterres como Secretário-Geral da ONU 13:15 Omar Zniber: Estratégias Reais Reforçam a Democratização da Governação e a Justiça Territorial 12:30 Trump critica Starmer pela recusa do Reino Unido em apoiar ataques ao Irão 11:53 Ações das companhias aéreas caem a pique em todo o mundo com conflito no Médio Oriente a provocar turbulência nas viagens 10:51 Os preços do gás na Europa disparam quase 50% com a suspensão da produção de GNL no Qatar 09:34 Trump sinaliza que operação no Irão pode estender-se para além do prazo inicial de 4 a 5 semanas 22:30 Cooperação entre Marrocos e Bélgica entra em nova fase estratégica 21:44 Conselho de Direitos Humanos: 40 Estados Reiteram Apoio à Soberania de Marrocos sobre o Saara 21:00 Marrocos garante o levantamento das sanções dos EUA contra altos responsáveis ​​militares do Mali 20:15 Marrocos sobe para a 15ª posição no ranking global de atratividade mineira, segundo o Instituto Fraser 19:30 AIMA recebe o Prêmio de Transformação Digital de 2025 16:39 Marrocos e Bélgica reforçam parceria estratégica com base na cooperação económica e no diálogo político 15:53 Bitcoin cai após ataques coordenados entre os EUA e Israel contra o Irão abalarem os mercados globais 15:34 Trump diz que ataques contra o Irão vão demorar "quatro semanas ou menos"

GemMaroc: A Revolução Marroquina Integrando o Darija na Inteligência Artificial

Segunda-feira 13 Outubro 2025 - 15:00
GemMaroc: A Revolução Marroquina Integrando o Darija na Inteligência Artificial

Marrocos acaba de dar um grande passo em frente no mundo da tecnologia da linguagem com o lançamento do GemMaroc, um estudo pioneiro intitulado "Libertar a Proficiência em Darija em LLMs com Dados Mínimos", que explora a capacidade dos modelos de linguagem para compreender e gerar o Darija, o dialeto marroquino.

Esta iniciativa, liderada por um grupo de investigadores marroquinos especializados em inteligência artificial e linguística, marca uma verdadeira revolução na integração das línguas locais nos sistemas digitais. Muito mais do que um projeto científico, o GemMaroc destaca-se como um ato de emancipação tecnológica face à dominação linguística global no campo da IA.

Os resultados deste estudo são impressionantes: em apenas dois dias de formação, os investigadores conseguiram desenvolver um modelo capaz de compreender e produzir Darija com uma precisão notável, utilizando recursos de dados limitados.

Utilizando um pequeno corpus de frases cuidadosamente traduzidas e selecionadas, a equipa observou um aumento da taxa de acertos de 33% para mais de 47%, sem comprometer o desempenho do modelo em inglês. O modelo mais avançado, GemMaroc-27B, superou mesmo vários modelos internacionais em testes de compreensão de Darija.

O estudo enfatiza um ponto crucial: o sucesso do modelo não depende do volume de dados, mas sim da sua qualidade e diversidade. Os investigadores privilegiaram cenários da vida real e diálogos quotidianos que refletissem a vida marroquina — instruções orais, expressões populares e questões culturais — para permitir que o modelo integrasse as subtilezas do contexto local.

Outra grande inovação foi a criação de uma língua "Darija estruturada", com o objectivo de reduzir o "ruído linguístico" provocado pela variedade de dialectos regionais. Esta abordagem permitiu que a inteligência artificial respondesse de forma mais consistente e precisa, abrindo caminho para o desenvolvimento de ferramentas educativas, administrativas e digitais em Darija.

O estudo destaca ainda um desafio fundamental: a falta de um padrão de escrita para o Darija, devido à sua natureza essencialmente oral. Para lidar com isto, a equipa adotou um método híbrido que combina a escrita nos alfabetos árabe e latino para refletir a realidade linguística marroquina na internet e nas redes sociais.

Por fim, para manter o equilíbrio de competências do modelo, 20% dos textos de formação permaneceram em inglês, garantindo a preservação das competências gerais do sistema em matemática, raciocínio e compreensão contextual.

Com o GemMaroc, Marrocos consolida-se como pioneiro na inclusão linguística da inteligência artificial, comprovando que a tecnologia de ponta pode adaptar-se a uma língua local e transformá-la numa ferramenta de inovação cultural e social. Este projecto inaugura uma nova era em que o Darija entra finalmente na linguagem das máquinas, em pé de igualdade com as principais línguas do mundo.


  • Fajr
  • Amanhecer
  • Dhuhr
  • Asr
  • Maghrib
  • Isha

Leia mais

Este site, walaw.press, utiliza cookies para lhe proporcionar uma boa experiência de navegação e melhorar continuamente os nossos serviços. Ao continuar a navegar neste site, você concorda com o uso desses cookies.