fbpx
DestacadosTecnología

Presentan interfaz que transcribe palabras que se dicen en voz baja

El dispositivo es parte de un completo sistema de computación silenciosa que permite al usuario plantear y recibir de forma indetectable respuestas a problemas de computación difíciles.

Investigadores del Instituto Tecnológico de Massachusetts (MIT) desarrollaron una interfaz de computadora que puede transcribir palabras que el usuario verbaliza de manera interna, es decir, en voz baja que no es perceptible al oído humano.

El sistema consiste en un dispositivo portátil y un sistema informático asociado, en el que los electrodos captan señales neuromusculares en la mandíbula y en la cara que se desencadenan mediante verbalizaciones internas.

Según un comunicado del MIT, las señales alimentan un sistema de aprendizaje automático que ha sido programado para correlacionar las señales con palabras de cada persona.

Transmiten las vibraciones a través de los huesos

El aparato también incluye un par de auriculares de conducción ósea, que transmiten las vibraciones a través de los huesos de la cara hacia el oído interno.

Debido a que no obstruyen el canal auditivo, los auriculares permiten que el sistema transmita información al usuario, sin interrumpir la conversación ni interferir con la experiencia auditiva del usuario.

En una de las pruebas que realizaron los investigadores, los sujetos usaron el sistema para detallar silenciosamente los movimientos de los oponentes en un juego de ajedrez y, de forma silenciosa, recibieron respuestas recomendadas por la computadora.

Dispositivo de inteligencia reforzada

El estudiante graduado en el MIT Media Lab, Arnav Kapur, explicó que la motivación para esto fue construir un dispositivo IA, un dispositivo de inteligencia reforzada.

Para el desarrollo de esta investigación, se preguntaron si era posible tener una plataforma informática “más interna”, que fusione humanos y máquinas de alguna manera y que se sienta como una extensión interna de nuestra propia cognición.

Con el uso de la interfaz prototipo portátil, los investigadores realizaron un estudio de usabilidad en el que 10 sujetos pasaron unos 15 minutos, cada uno, personalizando la aplicación aritmética a su propia neurofisiología, luego pasaron otros 90 minutos usándolo para ejecutar cálculos.

El sistema tenía una precisión de transcripción promedio de aproximadamente 92%

En el trabajo en curso, los investigadores están recopilando una gran cantidad de datos en conversaciones más elaboradas, con la esperanza de crear aplicaciones con vocabularios mucho más expansivos.

“Estamos en el medio de recopilar datos, y los resultados se ven bien. Creo que lograremos una conversación completa algún día”, resaltó Kapur.

NTX/VDR/MSG

A %d blogueros les gusta esto: