Warning: "continue" targeting switch is equivalent to "break". Did you mean to use "continue 2"? in C:\xampp\htdocs\templates\gk_evonews\lib\menu\GKBase.class.php on line 96
MIT cria Inteligência Artificial que reconstrói rostos a partir da voz
Sexta, Novembro 01, 2024
Follow Us
MIT cria Inteligência Artificial que reconstrói rostos a partir da voz

Você já imaginou que a tecnologia cresceria a ponto de um computador ser capaz de reconstruir o rosto de uma pessoa a partir do simples ato de ouvir sua voz, mesmo que ela não conheça seu rosto? Bem, mesmo que sua imaginação não tenha ido tão longe, uma Inteligência Artificial desenvolvida pelo MIT acabou de realizar esse processo.

Os pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) estão trabalhando desde 2019 no desenvolvimento de uma Inteligência Artificial (IA) que tem a capacidade de converter fragmentos de áudio gravados de vozes de pessoas nos rostos daqueles que falam.

Parece algo inconcebível, mas o CSAIL acaba de apresentar os últimos avanços dessa IA, chamada de Speech2Face. Como você pode ver nas imagens, os resultados são mais do que impressionantes, embora a plataforma não consiga reconstruir um retrato 100% preciso:


5QWXTNWYKJBQBODXIVK4MX675QSpeech2Face. Imagem: MIT


O MIT disse que o modelo desenvolvido é treinado para capturar recursos visuais relacionados a idade, sexo, etc., que são comuns a muitas pessoas, e somente nos casos em que há evidências suficientes para conectar esses elementos com atributos de voz. Com isso, o modelo produzirá apenas rostos de aparência média, com características visuais que se correlacionam com a fala de entrada, mas não produzirá imagens de indivíduos específicos.

A forma como a IA realiza essa magia é baseada em bases estatísticas e científicas documentadas, onde certas características de tonalidade, timbre, modulação e ritmo são reflexo de alguma característica física específica na constituição facial dos sujeitos.

De acordo com os últimos avanços do projeto, quanto mais longo for o fragmento de áudio analisado pela IA, mais completo será o retrato desenvolvido pela plataforma.

No entanto, a própria equipe do MIT CSAIL admite que a tecnologia nunca poderia ser completamente precisa, o que traz alívio para aqueles que estão preocupados com o cuidado de sua privacidade.

-
Por Olhar Digital.

Log in or Sign up