A Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN) concedeu a Miguel Anxo Pérez Vila o Premio á Mellor Tese Doutoral no ano 2024, un dos galardóns máis prestixiosos no ámbito do Procesamento de Linguaxe Natural (NLP) en España, en recoñecemento á súa excelencia científica e a súa relevancia social.
A investigación deste membro do Centro de Investigación en TIC (CITIC) da Universidade da Coruña, centro integrado na Rede CIGUS da Xunta de Galicia, é pioneira no uso de técnicas de Intelixencia Artificial, aprendizaxe automática e lingüística computacional para a detección da depresión a través da linguaxe en redes sociais.
A tese, dirixida polos investigadores Javier Parapar e Álvaro Barreiro, parte da evidencia de que as persoas que sofren problemas de saúde mental adoitan mostrar cambios na súa maneira de expresarse. A partir desta premisa e do enorme repositorio de linguaxe escrita que supoñen as redes sociais, o traballo de Anxo Pérez explora como aproveitar estas publicacións mediante modelos de IA adestrados con datos clínicos e sociais para identificar sinais de risco nos usuarios.
Facilitar a comprensión dos profesionais da saúde
Un dos aspectos máis innovadores da investigación é a procura de maior transparencia nos sistemas de detección. Fronte a aproximacións previas máis opacas, a tese propón modelos explicables baseados en síntomas validados clinicamente, o que facilita que os resultados sexan comprensibles e útiles para profesionais da saúde.
O proxecto combina o deseño de novos algoritmos de estimación da gravidade da depresión coa creación de coleccións de datos específicas e coa exploración de grandes modelos de linguaxe (LLMs). Ademais, as súas achegas foron integradas nunha plataforma demostrativa que permite o seu uso por parte de profesionais clínicos, abrindo a porta a aplicacións prácticas no ámbito sanitario.
A depresión a través da linguaxe
Ao longo do desenvolvemento da tese, Anxo Pérez publicou os resultados en conferencias internacionais de referencia como ECIR, SIGIR ou EMNLP, así como en revistas como Artificial Intelligence in Medicine (AIM). Entre as principais conclusións alcanzadas destacan varias achegas crave: os síntomas de depresión maniféstanse de forma distinta na linguaxe, o que esixe modelos sensibles á súa natureza; as mensaxes en redes sociais conteñen sinais sutís, que poden revelarse mediante técnicas de recuperación semántica; e a falta de datos adecuados motivou a creación de dous novos conxuntos de referencia (BDI-Sen e DepreSym).
Así mesmo, a investigación subliña que, aínda que os modelos de linguaxe de gran escala poden apoiar a tarefa de anotación, a supervisión humana segue sendo esencial. Finalmente, a colaboración con profesionais clínicos resultou fundamental para guiar a clasificación, a interpretación dos resultados e garantir a validez médica das conclusións.
Con este premio, a SEPLN pon en valor unha investigación que non só destaca pola súa orixinalidade e rigor metodolóxico, senón tamén polo seu impacto potencial na mellora da saúde mental e o benestar social.















