DeWave: Avance innovador en traducción de pensamientos a texto mediante IA no invasiva
Investigadores australianos han desarrollado un sistema de inteligencia artificial (IA) pionero en el mundo llamado DeWave, capaz de transformar pensamientos silenciosos en texto mediante el uso de un gorro ajustado que registra las ondas cerebrales a través de un electroencefalograma (EEG). Este avance representa un significativo progreso en la traducción de ondas cerebrales crudas directamente a lenguaje, potencialmente revolucionando la comunicación para personas con parálisis o que han sufrido un accidente cerebrovascular.
El equipo de la Universidad de Tecnología de Sídney (UTS), liderado por el científico informático Chin-Teng Lin, realizó pruebas utilizando datos de más de dos docenas de participantes que leían en silencio mientras llevaban puesto el gorro. Aunque la precisión alcanzada por DeWave fue poco más del 40% según uno de los dos conjuntos de métricas en los experimentos, esto ya representa una mejora del 3% sobre el estándar anterior para la traducción del pensamiento a partir de grabaciones EEG.
Los investigadores aspiran a mejorar la precisión hasta el 90%, comparable con los métodos convencionales de traducción de lenguaje o software de reconocimiento de voz. Lo notable de DeWave es que, a diferencia de otros métodos que requieren cirugías invasivas para implantar electrodos o el uso de máquinas de resonancia magnética voluminosas y costosas, este sistema no invasivo promete ser mucho más práctico para el uso diario.
El proceso de DeWave implica convertir las ondas EEG en un código que luego se puede emparejar con palabras específicas en su ‘libro de códigos’. Este método innovador no solo introduce técnicas de codificación discretas en el proceso de traducción de cerebro a texto, sino que también integra modelos de lenguaje amplios, abriendo nuevas fronteras en la neurociencia y la IA.
El equipo utilizó modelos de lenguaje entrenados y lo probó en conjuntos de datos existentes de personas que tenían seguimiento ocular y actividad cerebral registrada mientras leían texto. Esto ayudó al sistema a aprender a coincidir patrones de ondas cerebrales con palabras. En términos de traducción, DeWave mostró un rendimiento mejor con los verbos, mientras que los sustantivos a menudo se traducían en pares de palabras con significados similares.
A pesar de los desafíos, como la variabilidad en las distribuciones de ondas EEG entre individuos y el ruido en la señal recibida a través del gorro en lugar de electrodos implantados en el cerebro, los resultados significativos y la estructura de las oraciones formadas por el modelo indican un progreso prometedor.
Los investigadores subrayan que la traducción directa de pensamientos desde el cerebro es un empeño valioso pero desafiante que merece esfuerzos continuos. Con el rápido avance de los Modelos de Lenguaje Grandes, métodos de codificación similares que conectan la actividad cerebral con el lenguaje natural merecen una atención creciente. Este estudio se presentó en la conferencia NeurIPS 2023 y un preprint está disponible en ArXiv.