O encontro ‘Tecnoloxía en galego: resultados de ILENIA– Proxecto Nós’ serviu este xoves 18 para dar a coñecer os resultados dos últimos tres anos de traballo do Proxecto Nós no marco de ILENIA, unha iniciativa do Goberno de España orientada a avanzar en recursos e capacidades en tecnoloxías lingüísticas, en particular para as linguas do Estado.
Datos, casos de uso e ferramentas abertas de tradución automática, síntese de voz e modelos lingüísticos en galego déronse a coñecer neste foro que se desenvolveu no Centro de Estudos Avanzados e que foi clausurado pola vicerreitora de Política Científica da USC, Pilar Bermejo.
A xornada comezou coa apertura institucional a cargo de Aleida Alcaide, directora xeral de Intelixencia Artificial do Goberno de España, quen puxo en valor a importancia de contar coas linguas oficiais plenamente integradas nas novas tecnoloxías. “Os datos, infraestrutura e talento son elementos básicos para desenvolver a intelixencia artificial. O terceiro ingrediente esencial é o talento, ese que tedes tanto en Galicia, dou fe, porque a participación de persoas galegas nas convocatorias da AESIA é inxente e con grandes currículos”, destacou.
A continuación, Elisa Fernández Rei, directora do Instituto da Lingua Galega (ILG), e Senén Barro, director do Centro Singular de Investigación en Tecnoloxías Intelixentes da USC (CiTIUS), presentaron o marco xeral de ILENIA–Proxecto Nós durante o trienio 2022–2025. Para Fernández Rei, “temos que seguir avanzando nesta dirección co fin de garantir que poderemos exercer os nosos dereitos lingüísticos no mundo dixital”. Pola súa parte, Senén Barro puxo o foco en como “todos os recursos que se comprometan para poñer en valor estas tecnoloxías serán ben investidos e sempre serán escasos. O que será extraordinariamente caro é non facelo”.
385 horas de voces en galego
Un dos bloques centrais da xornada estivo dedicado á presentación de datos e casos de uso, no que participaron representantes do propio Proxecto Nós, así como entidades colaboradoras como a Fundación Mozilla, Imaxin Software, AMTEGA e CREAGAL. Así, por exemplo, nos últimos tres anos, as horas de voz para recoñecemento automático da fala pasaron de 10 a 3.227.
En Common Voice figuran na actualidade 385 horas de banco de voces cando inicialmente había só 18, multiplicando por 20 a súa presenza e convertendo así o galego na décima lingua das 163 existentes nesta plataforma pública. É unha plataforma en aberto deseñada para a creación comunitaria de conxuntos de datos de fala e texto na que calquera persoa pode preservar, revitalizar e promover a súa lingua compartindo, creando e organizando conxuntos de datos de texto e voz.
Alén diso, esta recollida de fragmentos de audio estase a realizar coa colaboración da Xunta de Galicia, buscando ademais a representación de acentos e variedades dialectais do galego, xerando así un corpus público alleo aos cambios tecnolóxicos e de libre uso.
Primeiro tradutor neuronal en galego
No encontro expúxose tamén o traballo desenvolvido en RAG (acrónimo anglosaxón de Xeración Aumentada de Información – Retrieval Augmented Generation), unha das técnicas empregadas para controlar as alucinacións dos modelos de intelixencia artificial mellorando en xeral a calidade da interacción do usuario cos modelos grandes de linguaxe.
Este espazo deu acollida tamén á presentación do primeiro tradutor neuronal en galego, que ademais ofrece mellores prestacións obxectivas respecto doutros existentes e que conta tamén con diversas vantaxes adicionais: é un recurso público, permite traducir tanto texto plano como arquivos e xa está integrado na Plataforma de Tradución Automática da Axencia Estatal de Administración Dixital (PLaTa).
Outros dos casos de uso expostos foron os vinculados aos sistemas de conversión de texto a voz (TTS, do inglés Text-to-Speech), en concreto os exemplos de voces sintéticas en galego e a iniciativa AhoMyTTS, unha ferramenta de síntese de voz que permite converter texto escrito en fala natural. AhoMyTTS funciona a partir de modelos de intelixencia artificial desenvolvidos pola Universidade do País Vasco e está adaptada para diferentes linguas, entre elas o galego, a través da colaboración do proxecto Nós.
Estes demostradores —o tradutor e o TTS— teñen como obxectivo facilitar a transferencia do coñecemento xerado polo Proxecto Nós cara a empresas, administracións públicas e a sociedade en xeral, promovendo o uso real da lingua galega en contornas dixitais avanzadas.
Ecosistema tecnolóxico en galego sostible e competitivo
A sesión ‘Acceso e uso dos recursos: datos, modelos e ferramentas’ afondou na filosofía aberta do proxecto, subliñando que tanto os datos como os modelos lingüísticos e as ferramentas desenvolvidas están dispoñibles para o seu uso libre, co fin de impulsar un ecosistema tecnolóxico en galego sostible e competitivo.
Outro dos puntos tratados foi a inminente integración do Proxecto Nós en ALIA, unha iniciativa pioneira na Unión Europea que busca dotar dunha infraestrutura pública de recursos de IA para promover o fomento do castelán e das linguas cooficiais no desenvolvemento e implantación da intelixencia artificial no mundo. A xornada incluíu tamén unha presentación das dúas factorías de IA en España, 1HealthAI, presentada por Lois Orosa, director do CESGA, o centro no que residirá o núcleo de infraestruturas e operativo de dita factoría.
O evento contou tamén cunha mesa redonda sobre a importancia do galego no mundo dixital, cunha moi destacada presenza de empresas galegas comprometidas co desenvolvemento tecnolóxico do galego en as tecnoloxías lingüísticas en xeral. Púxose de manifesto a necesaria colaboración entre investigación, empresa e administración para asegurar a presenza da lingua propia nos novos desenvolvementos tecnolóxicos e para fornecer unha industria galega en IA e tecnoloxías lingüísticas.
O encontro pechouse coas intervencións da vicerreitora Pilar Bermejo, de Valentín García, secretario xeral da Lingua da Xunta de Galicia; e Pedro Blanco Lobeiras, delegado do Goberno en Galicia. Todos eles coincidiron en sinalar nas súas intervencións o Proxecto Nós como unha peza clave para garantir o futuro do galego na era da intelixencia artificial.












