Urgente 17:15 Gaza: União Europeia vai participar na primeira reunião do Conselho de Paz em Washington 16:30 Marrocos e Brasil reforçam parceria estratégica na aviação militar 15:45 Rei da Dinamarca visita a Gronelândia para reafirmar a soberania no meio das tensões com Washington 15:00 Painel da ONU afirma que ficheiros de Epstein podem indicar crimes contra a humanidade 14:15 A CHEGA quer proibir bandeiras LGBT em edifícios públicos em Portugal 13:00 EUA afirmam que a China realizou teste nuclear secreto com novos detalhes 12:44 Índice de Perceção da Corrupção de 2025: Países Árabes Mantêm-se Abaixo da Média Global 12:16 Mistério resolvido: porque é que ocorrem coágulos sanguíneos raros após algumas vacinas adenovirais contra a COVID-19? 12:00 Omar Zniber: Desarmamento Nuclear, uma Prioridade Absoluta Face aos Desafios Estratégicos Globais 11:28 Marrocos-UE: Desempenho sólido em 2025 e novas prioridades de investimento para 2026 11:15 Porto Atlântico de Dakhla: O Nascimento de um Novo Gigante Marítimo ao Serviço das Ambições Africanas de Marrocos 10:50 Negociações de paz entre a Ucrânia e a Rússia são retomadas em Genebra sob mediação dos EUA 10:30 Ramadão: O forte apelo de António Guterres a um mundo mais justo e unido 09:45 Ataque mortal no centro da Nigéria: Conselho de Segurança condena ato terrorista hediondo 09:16 Peru destitui presidente Jeri no meio de escândalo envolvendo encontros com empresário chinês 09:00 O BEI reafirma o seu total compromisso com Marrocos com 740 milhões de euros de financiamento em 2025 08:43 O Les Impériales Ftour regressa em grande estilo com a aguardada 14ª edição 08:15 Marrocos: Um Modelo de Turismo de Luxo Autêntico e Tranquilizante

Meta lança modelo de inteligência artificial Spirit LM para imitar vozes humanas

Terça-feira 22 Outubro 2024 - 08:45
Meta lança modelo de inteligência artificial Spirit LM para imitar vozes humanas

A Meta lançou o seu novo modelo de código aberto, “Spirit LM”, que aborda os desafios relacionados com os modelos multimodais em inteligência artificial na geração de som.

O novo modelo pretende proporcionar uma experiência áudio mais natural e expressiva, o que é um passo avançado no desenvolvimento de robôs inteligentes capazes de comunicação vocal de formas mais complexas e realistas.

O modelo “Spirit LM” baseia-se num modelo de linguagem pré-treinado contendo 7 mil milhões de parâmetros, e distingue-se pela sua capacidade de processar som de forma diferente dos modelos tradicionais que dependem de tecnologias de reconhecimento automático de fala (ASR ).

Meta sublinha que a abordagem tradicional resulta na perda de muitas expressões naturais da voz. Assim sendo, o Spirit LM conta com a utilização de fonemas, tons e alturas para ultrapassar estas limitações, permitindo-lhe produzir sons naturais e aprender novas tarefas, incluindo o reconhecimento de fala, a conversão de som de texto em texto e a classificação de voz.

A Meta revelou este modelo num artigo de investigação e mencionou também os detalhes da investigação que levou ao desenvolvimento do “Spirit LM”, bem como amostras do desempenho áudio do modelo, dando uma ideia clara das suas capacidades futuras.

O modelo está agora disponível como um projeto de código aberto para programadores e investigadores utilizarem e expandirem, e espera-se que seja utilizado no futuro em meta-aplicações como o WhatsApp, Instagram e Facebook, permitindo aos utilizadores interagir com a inteligência artificial através da voz natural. . conversas repletas de expressões semelhantes ao modo de voz avançado recentemente introduzido pela OpenAI.


  • Fajr
  • Amanhecer
  • Dhuhr
  • Asr
  • Maghrib
  • Isha

Leia mais

Este site, walaw.press, utiliza cookies para lhe proporcionar uma boa experiência de navegação e melhorar continuamente os nossos serviços. Ao continuar a navegar neste site, você concorda com o uso desses cookies.