- 17:00A Europa precisa de estar armada para "sobreviver", diz o Primeiro-Ministro polaco à União Europeia
- 16:23Marrocos, uma referência para a União Europeia no domínio da gestão das migrações e da luta contra o terrorismo
- 16:04Laranjas marroquinas conquistam mercados dos EUA com novo recorde de 20.000 toneladas
- 15:18Marrocos investe 96 mil milhões de dirhams para modernizar a sua infraestrutura ferroviária até 2030
- 14:41Hospital Amadora-Sintra. Assédio laboral leva à demissão de 10 cirurgiões
- 13:55Trump lança iniciativa de 500 mil milhões de dólares para desenvolvimento de inteligência artificial
- 12:18Trump está aberto a Elon Musk ou cofundador da Oracle comprarem o TikTok
- 11:24Projectos de energia limpa em África... Marrocos na vanguarda da transição verde.
- 11:00Os preços do ouro sobem à medida que aumentam as preocupações do mercado sobre as políticas comerciais de Trump
Siga-nos no Facebook
Meta lança modelo de inteligência artificial Spirit LM para imitar vozes humanas
A Meta lançou o seu novo modelo de código aberto, “Spirit LM”, que aborda os desafios relacionados com os modelos multimodais em inteligência artificial na geração de som.
O novo modelo pretende proporcionar uma experiência áudio mais natural e expressiva, o que é um passo avançado no desenvolvimento de robôs inteligentes capazes de comunicação vocal de formas mais complexas e realistas.
O modelo “Spirit LM” baseia-se num modelo de linguagem pré-treinado contendo 7 mil milhões de parâmetros, e distingue-se pela sua capacidade de processar som de forma diferente dos modelos tradicionais que dependem de tecnologias de reconhecimento automático de fala (ASR ).
Meta sublinha que a abordagem tradicional resulta na perda de muitas expressões naturais da voz. Assim sendo, o Spirit LM conta com a utilização de fonemas, tons e alturas para ultrapassar estas limitações, permitindo-lhe produzir sons naturais e aprender novas tarefas, incluindo o reconhecimento de fala, a conversão de som de texto em texto e a classificação de voz.
A Meta revelou este modelo num artigo de investigação e mencionou também os detalhes da investigação que levou ao desenvolvimento do “Spirit LM”, bem como amostras do desempenho áudio do modelo, dando uma ideia clara das suas capacidades futuras.
O modelo está agora disponível como um projeto de código aberto para programadores e investigadores utilizarem e expandirem, e espera-se que seja utilizado no futuro em meta-aplicações como o WhatsApp, Instagram e Facebook, permitindo aos utilizadores interagir com a inteligência artificial através da voz natural. . conversas repletas de expressões semelhantes ao modo de voz avançado recentemente introduzido pela OpenAI.
Comentários (0)