De izquierda a derecha, L. Alfonso Ureña, Pilar López, Manuel C. Díaz y Mª Teresa Martín.

Un sistema computacional basado en redes neuronales profundas que permite el análisis de textos oncológicos desarrollado por los investigadores del Grupo ‘Sistemas Inteligentes de Acceso a la Información’ (SINAI) del Departamento de Informática de la Universidad de Jaén Pilar López Úbeda, Manuel Carlos Díaz Galiano, L. Alfonso Ureña López y Mª Teresa Martín Valdivia fue premiado en el marco del XXXVI Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN 2020).

En concreto, los investigadores de la UJA participaron en el taller internacional CANTEMIST (CANcer TExt Mining Shared Task – tumor named entity recognition), un foro en el que distintos equipos de investigación presentan sus sistemas computacionales basados en la aplicación de tecnologías del lenguaje para procesar textos clínicos con el fin de avanzar en el reconocimiento de entidades relacionadas con síntomas, tratamientos y enfermedades oncológicas.

Este taller tiene como objetivo principal avanzar en el uso y aplicación de técnicas de Procesamiento del Lenguaje Natural (PLN) para contribuir a la investigación tanto oncológica como clínica, así como recolectar importantes variables clínicas para los tratamientos del cáncer escondidas en los textos médicos, que son claves para impulsar mejoras en la calidad de la salud y la medicina personalizada de una manera más sistematizada para avanzar en el cuidado y diagnóstico del cáncer. El trabajo de los investigadores de la UJA fue premiado en una de las tareas propuestas en la competición, concretamente en la de Reconocimiento de Entidades Nombradas, tema principal de la tesis doctoral de Pilar López. En total, en el taller participaron 24 equipos de investigación de 16 países diferentes.

Los investigadores de la UJA, que se han mostrado muy satisfechos con el papel desarrollado en dicho taller, señalan que existe una necesidad urgente de aplicar tecnologías de PLN y minería de textos para procesar textos clínicos, con el objetivo de analizar información crítica que permita una mejor toma de decisiones clínicas. En este sentido, consideran que el PLN puede facilitar el uso de información textual y los registros médicos electrónicos en el análisis de datos biomédicos. “Comprender las enfermedades requiere la extracción de ciertas entidades clave como enfermedades, tratamientos o síntomas y sus atributos a partir de datos textuales”, apuntan.

Author
Gabinete de Comunicación UJA (F.R.R.). Fuente: Grupo de Investigación SINAI de la UJA