La depresión es una de las enfermedades mentales más comunes. Alrededor de 280 millones de personas en todo el mundo se ven afectadas por esta enfermedad, razón por la cual investigadores de la Universidad Tecnológica de Konas (KTU) han desarrollado un modelo de inteligencia artificial (IA) que puede identificar la depresión basándose tanto en el habla como en la actividad neuronal del cerebro. Este enfoque multimodal, que combina dos fuentes de datos diferentes, permite un análisis más preciso y objetivo del estado emocional de una persona, abriendo la puerta a una nueva fase en el diagnóstico de la depresión.
“La depresión es uno de los trastornos mentales más comunes, con consecuencias devastadoras tanto para el individuo como para la sociedad, por lo que estamos desarrollando un método de diagnóstico nuevo y más objetivo que será accesible para todos en el futuro”, afirma el profesor Rytis Maskeliūnas. KTU y uno de los autores de la invención.
Si bien la mayoría de las investigaciones diagnósticas sobre la depresión se han basado tradicionalmente en un solo tipo de datos, el nuevo enfoque multimodal puede proporcionar mejor información sobre el estado emocional de una persona, afirman los científicos.
Precisión impulsiva utilizando datos de voz y actividad cerebral
Esta combinación de datos del habla y de la actividad cerebral logró una precisión del 97,53% en el diagnóstico de la depresión, superando significativamente a los métodos alternativos. “Esto se debe a que el sonido añade datos al estudio que aún no podemos extraer del cerebro”, explica Maskilionas.
Según el estudiante de doctorado de KTU, Musyab Yousefi, que participó en la invención, se tuvo en cuenta la selección de datos: “Aunque se cree que las expresiones faciales pueden revelar más sobre el estado psicológico de una persona, es muy fácil de diagnosticar erróneamente. puede reflejar con precisión un estado emocional, afecta la velocidad del habla, el tono y la energía general”.
Además, a diferencia de la actividad eléctrica cerebral (EEG) o los datos de voz, el rostro puede, hasta cierto punto, identificar directamente el estado de excitación de una persona. “Pero no podemos violar la privacidad de los pacientes, y la recopilación e integración de datos de múltiples fuentes es más prometedora para su uso posterior”, afirma el profesor de la Facultad de Informática (IF) de KTU.
Maskeliūnas enfatiza que el conjunto de datos de EEG utilizado se obtuvo del Conjunto de datos abierto multimodal para el análisis de trastornos mentales (MODMA), ya que el grupo de investigación KTU representa el campo de la informática y no la ciencia médica.
Los datos de MODMA EEG se recopilaron y registraron durante cinco minutos mientras los participantes estaban despiertos, descansando y con los ojos cerrados. En la parte de audio del experimento, los pacientes participaron en una sesión de preguntas y respuestas y en varias actividades centradas en leer y describir imágenes para aprovechar su lenguaje natural y su estado cognitivo.
La IA necesitará aprender a justificar las evaluaciones.
Las señales de audio y EEG recopiladas se convirtieron en espectrogramas, lo que permitió la visualización de los datos. Se aplicaron filtros de ruido especiales y métodos de preprocesamiento para eliminar el ruido y comparar los datos, y se utilizó un modelo de aprendizaje profundo DenseNet-121 modificado para identificar los síntomas de depresión en las imágenes. Cada imagen muestra cambios de señal a lo largo del tiempo. El EEG mostró ondas de actividad cerebral y el sonido mostró distribuciones de frecuencia e intensidad.
El modelo incluía una capa de clasificación personalizada que fue entrenada para dividir los datos en clases de personas sanas o deprimidas. Se evalúan las calificaciones exitosas y luego se evalúa la validez de la solicitud.
En el futuro, este modelo de IA podría acelerar el diagnóstico de depresión, o hacerlo remoto, y reducir el riesgo de diagnóstico subjetivo. Esto requiere más ensayos clínicos y mejoras en los programas. Sin embargo, Maskeliūnas añadió que este último aspecto de la investigación puede plantear algunos desafíos.
“El principal problema de estos estudios es la falta de datos porque las personas tienden a ser privadas acerca de sus problemas de salud mental”, dice.
Otro aspecto importante mencionado por el profesor del Departamento de Ingeniería Multimedia de KTU es que el algoritmo debe optimizarse de tal manera que no solo sea preciso sino que también proporcione información al profesional médico ¿Qué causa este resultado de diagnóstico? “Los algoritmos todavía tienen que aprender a interpretar el diagnóstico de forma comprensible”, afirma Maskeliūnas.
Según un profesor de KTU, necesidades similares son cada vez más comunes debido a la creciente demanda de soluciones de inteligencia artificial que afectan directamente a las personas en sectores como la salud, las finanzas y el sistema legal.
Es por eso que la inteligencia artificial explicable (XAI), cuyo objetivo es explicar al usuario por qué un modelo toma ciertas decisiones y aumentar su confianza en la IA, está ganando impulso.