O algoritmo galego que é quen de ler o Quixote en 20 segundos

O investigador da UDC Carlos Gómez vén de recibir financiamento europeo para desenvolver un procesador sintáctico punteiro na análise de sentimentos

David Vilares, Elena Solera e Carlos Gómez, investigadores do proxecto
David Vilares, Elena Solera e Carlos Gómez, investigadores do proxecto

Hai tempo que a análise sintáctica de oracións transcendeu as barreiras das aulas do ensino obrigatorio e incluso dos estudos estritamente filolóxicos. Hoxe, Internet é unha mina de textos na que profesionais e consumidores non deixan de plasmar as súas opinións a respecto de infinidade de temas. Sabelas xerarquizar e interpretar para extraer conclusións estratéxicas pode ser unha vantaxe competitiva para case calquera proxecto empresarial ou institucional. Ese é un dos motores que levou ao investigador da Universidade da Coruña Carlos Gómez a crear SALSA (Efficient Syntactic Analysis for Large-scale Sentiment Analysis), un espazo de investigación no que desenvolve ferramentas de lingüística computacional que trasladan todo tipo de textos a contornas dixitais. Non só iso, tamén os analizan sintáctica e emocionalmente para concluír se as opinións emitidas son positivas, negativas ou neutrais. Fano, ademais, en tempo récord: a través dun algoritmo, el e o seu equipo conseguiron axilizar a lectura do Quixote a menos de 20 segundos. Isto tradúcese nunha velocidade de procesamento de máis de mil oracións por segundo.

O interese científico das súas investigacións e a solvencia dos seus traballos fixeron que Gómez e o seu equipo veñan de recibir 150.000 euros por parte do Consello Europeo de Investigación (ERC) na categoría Proba de concepto, para dar cobertura a proxectos de innovación comercializables. E nesas están. “O  noso obxectivo agora con esta financiación europea é cristalizar toda a investigación nun produto final”, explica o investigador da UDC. “A idea é que lle sirva a calquera empresa ou institución á que lle sexa útil saber as opinións sobre os seus servizos ou produtos. Dende unha empresa de telefonía que quere saber se está a gustar o seu último móbil ata un concello que quere coñecer se os seus cidadáns están contentos co transporte público”, engade.

“Con esta tecnoloxía, unha empresa pode extraer conclusións das redes sociais para coñecer mellor o seu produto”

CARLOS GÓMEZ, investigador

Pero esa sondaxe da opinión pública a través de algoritmos —chamada análise de sentimentos na contorna académica— non produce conclusións xerais e pouco precisas, senón que é quen de desagregar con moito detalle tódolos eixos temáticos que os creadores perfilen. “No mesmo exemplo da empresa de telefonía, con esta tecnoloxía poderían acudir ás redes sociais, facer un baleirado de opinións sobre un modelo concreto e concluír cales son as debilidades e fortalezas de cada aspecto concreto do teléfono: a pantalla, a batería…”, argumenta o investigador responsable Carlos Gómez.

Esta nova liña de acción do equipo de Gómez é a continuación do programa tamén financiado polo ERC en 2016, finalizado recentemente, Fast Natural Language Parsing for Large-Scale NLP (FASTPARSE). Esa primeira parte podería enmarcarse máis nun proceso de investigación e, agora, nesta segunda, na concreción final dun produto que ofrecerá servizos concretos a institucións e empresas.

Software libre e fondos públicos

A filosofía de Carlos Gómez arredor do traballo que dirixe é profundamente democrática: “Eu entendo que se unha investigación como a nosa recibe financiación pública, a nosa obriga é poñela ao servizo da cidadanía, que é quen a paga”. E iso, explica, non é incompatible con que sexa rendible para eles como creadores e un posible modelo de negocio. Por iso, decidiron que o seu produto final será compartido como software libre para que calquera persoa poda empregalo con liberdade. “Creo que aínda así temos marxe para aplicar o noso know-how. Cada empresa ou institución precisará dunha adaptación concreta aos seus intereses e nós podemos ofrecerlla”, remata o investigador da Universidade da Coruña.

DEIXAR UNHA RESPOSTA

Please enter your comment!
POLÍTICA DE COMENTARIOS:

GCiencia non publicará comentarios ofensivos, que non sexan respectuosos ou que conteñan expresións discriminatorias, difamatorias ou contrarias á lexislación vixente.

GCiencia no publicará comentarios ofensivos, que no sean respetuosos o que contentan expresiones discriminatorias, difamatorias o contrarias a la ley existente.

Please enter your name here

Este sitio emprega Akismet para reducir o spam. Aprende como se procesan os datos dos teus comentarios.