
Image by Freepik
IA de Pensamento-para-Fala Traduz Ondas Cerebrais em Fala
Cientistas fizeram uma grande descoberta na restauração da fala natural para pessoas com paralisia, usando implantes cerebrais alimentados por IA para transformar ondas cerebrais em palavras faladas em tempo real.
Está com pressa? Aqui estão os fatos rápidos:
- O sistema decifra as ondas cerebrais e as converte em uma fala quase instantânea e com som natural.
- O sistema usa a voz do paciente antes da lesão para criar uma síntese de fala personalizada, o que permite uma comunicação autêntica.
- O modelo de IA decodifica sinais de fala em 80 milissegundos, reduzindo significativamente os atrasos anteriores.
Cientistas da Universidade Radboud, juntamente com o UMC Utrecht, desenvolveram uma tecnologia de implante cerebral com IA que traduz sinais neurais em palavras faladas com taxas de precisão entre 92-100%, conforme relatado pela Neuroscience News. A pesquisa, publicada nesta semana na Nature Neuroscience, busca desenvolver ferramentas de comunicação para pessoas paralisadas.
A pesquisa utilizou pacientes com epilepsia com implantes cerebrais de curto prazo para criar associações entre sinais neurais e expressões verbais. O desenvolvimento reduz o atraso anterior que dificultava a comunicação para pessoas com dificuldades de fala.
“Nossa abordagem de streaming traz a mesma capacidade rápida de decodificação de fala de dispositivos como Alexa e Siri para neuropróteses”, explicou Gopala Anumanchipalli, um dos principais investigadores do estudo, conforme relatado pelo New Atlas. “Usando um tipo similar de algoritmo, descobrimos que poderíamos decodificar dados neurais e, pela primeira vez, possibilitar o streaming de voz quase síncrono”, acrescentou.
O sistema funciona capturando a atividade cerebral por meio de eletrodos de alta densidade colocados na superfície do cérebro. A IA então decifra esses sinais, reconstruindo palavras e frases com uma precisão notável.
Além disso, um modelo de texto para fala treinado na voz do paciente antes da lesão garante que a fala gerada soe natural e se assemelhe de perto à sua voz original.
Uma das autoras do estudo, Cheol Jun Cho, explicou como o sistema processa os pensamentos em fala: “O que estamos decodificando é após um pensamento ter acontecido, depois de decidirmos o que dizer, depois de decidirmos quais palavras usar e como mover nossos músculos do trato vocal”, conforme relatado no New Atlas.
O avanço melhora significativamente as tecnologias passadas. Além disso, este sistema movido a IA agora fornece iniciação de fala de um segundo, que permite conversas fluidas e ininterruptas. Esta tecnologia poderia mudar a vida de pessoas com paralisia grave, síndrome do encarceramento, ou condições como a ALS, ao capacitar a sua habilidade de se comunicar naturalmente com os outros.
No entanto, apesar destes avanços, a tecnologia ainda enfrenta desafios. Conforme explicado no Neuroscience News, esta IA requer um treinamento extenso nos dados neurais de uma pessoa, e pode não funcionar efetivamente para aqueles que não possuem gravações de fala prévias.
Embora o sistema possa decodificar palavras, alcançar um ritmo e expressão completamente naturais ainda é difícil. Além disso, os modelos atuais lutam para prever frases e parágrafos completos, concentrando-se principalmente em palavras individuais.
Além disso, versões não invasivas usando capacetes EEG têm menor precisão, cerca de 60%, em comparação com eletrodos implantados, conforme observado em New Scientist.
Avançando, os pesquisadores visam melhorar a velocidade de fala e a expressividade do sistema, tornando as conversas ainda mais parecidas com a vida real.
Deixe um comentário
Cancelar