Sábado 20 Abril 2024

O algoritmo galego que é quen de ler o Quixote en 20 segundos

O investigador da UDC Carlos Gómez vén de recibir financiamento europeo para desenvolver un procesador sintáctico punteiro na análise de sentimentos

Hai tempo que a análise sintáctica de oracións transcendeu as barreiras das aulas do ensino obrigatorio e incluso dos estudos estritamente filolóxicos. Hoxe, Internet é unha mina de textos na que profesionais e consumidores non deixan de plasmar as súas opinións a respecto de infinidade de temas. Sabelas xerarquizar e interpretar para extraer conclusións estratéxicas pode ser unha vantaxe competitiva para case calquera proxecto empresarial ou institucional. Ese é un dos motores que levou ao investigador da Universidade da Coruña Carlos Gómez a crear SALSA (Efficient Syntactic Analysis for Large-scale Sentiment Analysis), un espazo de investigación no que desenvolve ferramentas de lingüística computacional que trasladan todo tipo de textos a contornas dixitais. Non só iso, tamén os analizan sintáctica e emocionalmente para concluír se as opinións emitidas son positivas, negativas ou neutrais. Fano, ademais, en tempo récord: a través dun algoritmo, el e o seu equipo conseguiron axilizar a lectura do Quixote a menos de 20 segundos. Isto tradúcese nunha velocidade de procesamento de máis de mil oracións por segundo.

O interese científico das súas investigacións e a solvencia dos seus traballos fixeron que Gómez e o seu equipo veñan de recibir 150.000 euros por parte do Consello Europeo de Investigación (ERC) na categoría Proba de concepto, para dar cobertura a proxectos de innovación comercializables. E nesas están. “O  noso obxectivo agora con esta financiación europea é cristalizar toda a investigación nun produto final”, explica o investigador da UDC. “A idea é que lle sirva a calquera empresa ou institución á que lle sexa útil saber as opinións sobre os seus servizos ou produtos. Dende unha empresa de telefonía que quere saber se está a gustar o seu último móbil ata un concello que quere coñecer se os seus cidadáns están contentos co transporte público”, engade.

Publicidade

“Con esta tecnoloxía, unha empresa pode extraer conclusións das redes sociais para coñecer mellor o seu produto”

CARLOS GÓMEZ, investigador

Pero esa sondaxe da opinión pública a través de algoritmos —chamada análise de sentimentos na contorna académica— non produce conclusións xerais e pouco precisas, senón que é quen de desagregar con moito detalle tódolos eixos temáticos que os creadores perfilen. “No mesmo exemplo da empresa de telefonía, con esta tecnoloxía poderían acudir ás redes sociais, facer un baleirado de opinións sobre un modelo concreto e concluír cales son as debilidades e fortalezas de cada aspecto concreto do teléfono: a pantalla, a batería…”, argumenta o investigador responsable Carlos Gómez.

Esta nova liña de acción do equipo de Gómez é a continuación do programa tamén financiado polo ERC en 2016, finalizado recentemente, Fast Natural Language Parsing for Large-Scale NLP (FASTPARSE). Esa primeira parte podería enmarcarse máis nun proceso de investigación e, agora, nesta segunda, na concreción final dun produto que ofrecerá servizos concretos a institucións e empresas.

Software libre e fondos públicos

A filosofía de Carlos Gómez arredor do traballo que dirixe é profundamente democrática: “Eu entendo que se unha investigación como a nosa recibe financiación pública, a nosa obriga é poñela ao servizo da cidadanía, que é quen a paga”. E iso, explica, non é incompatible con que sexa rendible para eles como creadores e un posible modelo de negocio. Por iso, decidiron que o seu produto final será compartido como software libre para que calquera persoa poda empregalo con liberdade. “Creo que aínda así temos marxe para aplicar o noso know-how. Cada empresa ou institución precisará dunha adaptación concreta aos seus intereses e nós podemos ofrecerlla”, remata o investigador da Universidade da Coruña.

DEIXAR UNHA RESPOSTA

Please enter your comment!
Please enter your name here

Este sitio emprega Akismet para reducir o spam. Aprende como se procesan os datos dos teus comentarios.

Relacionadas

00:03:49

F de Fala: as palabras que nos sosteñen

'Veiga', 'laverca' e 'Rábade' son palabras que herdamos de linguas perromanas, xermanas e árabes e que hoxe forman parte do léxico galego

Unha campaña de doazón de voz recollerá as variedades fonéticas e dialectais de Galicia

O obxectivo é acadar as máis de 1.000 horas de gravación precisas para que dispositivos como Siri, Alexa ou Google recoñezan as distintas cadencias lingüísticas

As 10 palabras do Nadal en galego que debes saber

Existen moitas expresións para referirnos aos enfeites, as tradicións ou o tempo. Descúbreas e engádeas ao teu vocabulario

Máis xornalismo e máis divulgación

Editorial de Gciencia polo seu décimo aniversario