Un equipo de investigadores do Centro de Investigación TIC (CITIC) da Universidade da Coruña bateu o récord mundial de precisión e velocidade de procesamento dun analizador sintáctico. Ata o de agora, o sistema máis rápido podía interpretar e comprender arredor de 400 oracións por segundo, e os investigadores galegos foron quen de rexistrar máis de 700.
O fito acadouno o do Grupo de Lingua e Sociedade da Información (LYS), especializado en Procesamento da Linguaxe Natural. O equipo está dirixido polo investigador Starting Grant Carlos Gómez Rodríguez e integrado por Daniel Fernández, Michalina Strzyz e David Vilares.
Ademais, o avance dos científicos coruñeses mellorou non só a velocidade, senón tamén a precisión do procesamento da linguaxe. A precisión destes sistemas de análise mídese segundo a proporción de relacións de palabras que é capaz de atopar nunha colección de noticias xornalísticas, interpretando de forma correcta os vínculos sintácticos entre cada un dos vocábulos. Así, ademais de conseguir un procesamento máis rápido, o sistema dos investigadores do CITIC conseguiu unha cifra do 94,43 %, superando o récord anterior de 94,21 %.
Os investigadores do CITIC presentarán os resultados do seu traballo no congreso norteamericano da Asociación de Lingüística Computacional, que se celebra ata o 7 de xuño en Minneapolis e é un referente mundial neste ámbito.
O procesamento e análise sintáctica
O proceso que realiza un programa de ordenador para entender a linguaxe humana chámase análise sintáctico e é un paso imprescindible nos sistemas de Intelixencia Artificial que comprenden texto. Por iso, conseguir programas analizadores sintácticos precisos e rápidos é un dos obxectivos máis desexados polos investigadores en procesamento da linguaxe natural.
O grupo LYS da Coruña recibiu nos últimos anos numerosos recoñecementos do seu traballo no eido do procesamento de linguaxe natural e a análise de información neste sentido. Un dos autores deste novo sistema, David Vilares, foi galardoado o ano pasado co Premio Nacional de Informática para mozos investigadores.