Alejandro Ramos, na sede do CiTIUS da USC. Foto: CiTIUS.

Alejandro Ramos, na sede do CiTIUS da USC. Foto: CiTIUS.

“Optar pola investigación exponte a unha incerteza enorme”

Alejandro Ramos, creador de Galiweather, acaba de recibir un recoñecemento estatal da Sociedade Informática de España e a Fundación BBVA

 Unha entrevista de Eva Rodríguez/Agencia SINC

Alejandro Ramos Soto é un xoven enxeñeiro informático da Universidade de Santiago de Compostela que en 2011 iniciou a súa carreira desenvolvendo unha ferramenta de CAD para o diagnóstico de nódulos de cancro de pulmón en colaboración con Centro de Supercomputación de Galicia e a empresa Bahía Software. En 2012 decidiu dedicarse á investigación aplicada nos campos de teoría de conxuntos borrosos e xeración de linguaxe natural, plasmouno nunha tese e deulle unha utilidade real: GALiWeather. Esta aplicación xera automaticamente prognósticos meteorolóxicos a curto prazo en linguaxe natural, a partir dos datos de predición de Meteogalicia. Esta innovación levoulle a gañar o premio estatal que convocan a Sociedade Científica Informática de España e a Fundación BBVA.

– O galardón recoñece a excelencia de novos doutores menores de 30 anos que realizan investigación de alta calidade no noso país. Que lle supuxo recibilo?

– É un aliciente enorme para continuar a miña carreira investigadora. Optar por este camiño exponche a unha incerteza enorme e dependes da concesión de bolsas, da realización de estancias no estranxeiro ou de proxectos de investigación para poder aspirar a unha praza estable dentro do sistema universitario español.

– Como se lle ocorreu combinar estes dous campos, o da intelixencia artificial e a linguaxe natural, para crear GALiWeather?

– A xeración de linguaxe natural é unha das moitas ramas da intelixencia artificial, do mesmo xeito que a lóxica borrosa. O que integramos é o uso de conxuntos borrosos nun sistema de xeración de textos. Foi un paso natural. Ao tratar de aplicar técnicas de conxuntos borrosos á creación de resumos lingüísticos de datos, que codifican información lingüística como protolinguaxe, démonos conta de que necesitabamos unha capa máis de procesado para adaptalos aos usuarios finais.

– En que consisten os conxuntos borrosos e o soft computing que se utilizou para esta aplicación?

Por unha banda, utilizamos conxuntos borrosos para modelar matematicamente conceptos imprecisos en meteoroloxía como ‘metade do período’ ou ‘predominante’. Supoñamos que temos datos de predición para sete días. Se queremos facer unha descrición da cobertura nubosa para o inicio da semana, teremos en conta o luns e o martes, pero tamén poderiamos considerar a achega da información para o mércores. Sobre este tipo de definicións, aplicamos técnicas de cuantificación borrosa para xerar sentenzas cuantificadas como ‘a maior parte dos datos de cobertura nubrada corresponden a cuberto’, que despois verbalizamos como ‘os ceos atoparanse predominantemente cubertos’.

Galiweather é un sistema pioneiro a escala mundial

– Existen outros exemplos deste uso combinado ou é algo que non se fixo ata esta aplicación?

– O único que existía ata o momento era algunha idea vaga sobre a posible utilidade de combinar ambos os campos. Tamén existían exemplos de resumos lingüísticos de datos que non incluían ningunha técnica de procesado para a xeración de textos. GALiWeather é o primeiro sistema de xeración de textos operativo a escala mundial que utiliza técnicas baseadas no uso de conxuntos borrosos para modelar a imprecisión dalgúns dos termos lingüísticos que se inclúen nos textos xerados.

– Que achega este detalle de información meteorolóxica?

– O único acceso oficial aos textos xerados por GALiWeather é a través da páxina de Meteogalicia, que proporciona os textos para cada concello de Galicia. No Grupo de Sistemas Intelixentes da Universidade de Santiago de Compostela desenvolvemos adicionalmente unha aplicación móbil onde o sistema de xeración adaptouse para contemplar, non só os concellos, senón tamén calquera punto dentro da xeografía galega.

– Estudan aplicar esta tecnoloxía para outro tipo de datos que non sexan meteorolóxicos?

– Os conxuntos borrosos tamén os aplicamos noutro sistema de xeración de informes sobre unha plataforma de Business Service Intelligence, en colaboración coa empresa Ozona Consulting S.L. Nese caso utilizámolos para dotar de flexibilidade a un algoritmo de detección de patróns temporais. Tamén se empregaron noutro proxecto enfocado á xeración de descricións de carteiras de proxectos en base a certos indicadores.

– E no futuro?

– Esperamos poder seguir experimentando e investigando a aplicación deste tipo de técnicas en sistemas de xeración de linguaxe natural, aínda que a posibilidade do devandito uso virá dada polos requisitos específicos de cada dominio de aplicación que abordemos. Entre os devanditos dominios contemplamos o campo da saúde e a medicina, business intelligence, o ámbito financeiro, etc.

“Contemplamos o uso futuro destas técnicas no campo da medicina e o ámbito financeiro”

– En que está a traballar nestes momentos?

Estou a realizar unha estadía de posdoutoramento na Universidade de Aberdeen (Reino Unido), no grupo de lingüística computacional. Colaboro con Ehud Reiter, unha das figuras máis relevantes no campo de xeración de linguaxe natural, para investigar o uso de conxuntos borrosos para modelar conceptos xeográficos e xerar expresións de referencia xeográficas. O meu obxectivo é, do mesmo xeito que con GALiWeather, tratar de usar esta investigación para crear un sistema de xeración de linguaxe natural que permita describir a situación sinóptica da meteoroloxía a nivel comunitario utilizando datos de observación en tempo real.

Máis aló desta liña, estou a colaborar con outros investigadores noutros traballos tanxenciais á miña liña principal, como a aplicación de técnicas de xeración de linguaxe natural para proporcionar unha maior interpretabilidade a certas técnicas de aprendizaxe automática.

Deixar unha resposta

XHTML: Podes empregar estas etiquetas: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

POLÍTICA DE COMENTARIOS:

GCiencia non publicará comentarios ofensivos, que non sexan respectuosos ou que conteñan expresións discriminatorias, difamatorias ou contrarias á lexislación vixente.

GCiencia no publicará comentarios ofensivos, que no sean respetuosos o que contentan expresiones discriminatorias, difamatorias o contrarias a la ley existente.