Un proxecto do Centro de Investigación en Tecnoloxías da Información e as Comunicacións (CITIC) da Universidade da Coruña (UDC), liderado polo investigador Carlos Gómez Rodríguez e centrado na lingüística computacional, recibirá 150.000 euros de fondos europeos. A inciativa acaba de ser seleccionada polo Consello Europeo de Investigación (ERC) na categoría Proba de concepto, a liña que dá cobertura a proxectos de innovación comercializables. Efficient Syntactic Analysis for Large-scale Sentiment Analysis (SALSA), que así se denomina, é o único proxecto que ERC recoñece nesta última convocatoria.
Máis polo miúdo, o obxectivo de SALSA é crear algoritmos que ‘traduzan’ a linguaxe natural a contornas dixitais actuais propias da intelixencia artificial; e os códigos, ferramentas e programas informáticos propios da chamada lingüística computacional. A investigación das tecnoloxías da linguaxe é a clave desta disciplina científica que conxuga o traballo de tecnólogos como matemáticos, informáticos ou enxeñeiros, co de lingüístas e outros especialistas das humanidades. Trátase dun campo interdisciplinar que se ocupa do desenvolvemento de formalismos que describen o funcionamento da linguaxe natural para que poidan ser transformados e, por tanto, procesados, en programas executables por un dispositivo tecnolóxico.
Este programa é a continuación do tamén financiado polo ERC en 2016, finalizado recentemente, Fast Natural Language Parsing for Large-Scale NLP (FASTPARSE), responsable, entre outros fitos, de deseñar o algoritmo capaz de axilizar a lectura do Quixote reducíndoa a tan só 20 segundos sen deteriorar a súa calidade conceptual. A finalidade deste innovador proxecto foi desenvolver novas técnicas para mellorar a velocidade dos analizadores sintácticos da linguaxe natural, facéndoos adecuados para o procesamento a escala web.
Software máis accesible e económico
“Acelerar enormemente a análise das opinións presentes en textos da linguaxe natural para facelas máis fáciles de interpretar pola intelixencia artificial é o que buscamos con este proxecto”, sinala Carlos Gómez, que lembra ademais que o principal obxectivo de SALSA é “democratizar a análise de datos da internet e redes sociais e transformalos en coñecemento para tomar decisións, utilizando os modelos e algoritmos de análises sintáctico desenvolvidos no proxecto ERC Starting Grant FASTPARSE para crear sistemas de análises de sentimento que sexan á vez precisos e eficientes (ao empregar analizadores rápidos que poden procesar da orde de 1.000 oracións por segundo en hardware estándar de consumo)”, apunta o investigador do CITIC.
SALSA seguirá un modelo de negocio de software de código aberto e pretende contribuír, en gran medida, á competitividade do mercado tecnolóxico da Unión Europea, “reducindo a súa dependencia do oligopolio de xigantes tecnolóxicos. Ademais de crear oportunidades para idiomas como o galego, non prioritarios para as multinacionais”, lembra.