Que ocorre coa linguaxe pública cando unha parte crecente dos textos que circulan na prensa, internet e as redes comeza a ser escrita por máquinas? A cuestión non afecta só o xornalismo como actividade profesional. Tamén pode afectar a riqueza da lingua que usamos para comprender, describir e debater a realidade.
Historicamente, a prensa foi un dos espazos onde a lingua pública se expande e enriquece. Non é o único motor do cambio lingüístico, por suposto, pero si un dos ámbitos onde as sociedades poñen a circular palabras, xiros e formas de nomear feitos emerxentes. Distintos traballos sobre linguaxe xornalística e neoloxismos amosan xustamente que os xornais funcionaron como espazos de creación e difusión de vocabulario novo, especialmente, cando deben dar conta de acontecementos, tecnoloxías ou transformacións sociais para públicos amplos.
Ese papel pode debilitarse se unha parte importante da escritura xornalística se delega en sistemas xenerativos. Os grandes modelos de linguaxe baséanse, de xeito xeral, na predición do seguinte token ou palabra probable dentro dunha secuencia. Por iso, producen textos fluídos e plausibles, pero tamén tenden a privilexiar regularidades estatísticas, patróns frecuentes e formulacións xa estabilizadas. En si mesmo, isto non implica unha degradación automática da linguaxe. O problema aparece cando esa lóxica se volve dominante na escritura pública.
Adestramento da IA con textos producidos por outras IA
O risco vólvese máis serio cando eses sistemas empezan a adestrarse con textos producidos por outras IA. Iso é o que varias investigacións recentes describiron como unha dinámica de model collapse ou “colapso do modelo”: un proceso dexenerativo no que os datos xerados por un modelo contaminan o adestramento de xeracións posteriores.
Traducido ao plano da linguaxe, isto significa que se os sistemas aprenden cada vez máis de textos sintéticos e se eses textos comezan ademais a encher a web e o espazo público, o ecosistema verbal dispoñible para futuros adestramentos estréitase. Máis texto artificial significa menos contacto coa variación social efectiva da linguaxe humana, o que pode significar unha deterioración da lingua en diferentes ámbitos.
Reprodución e amplificación de rumbos
Para empezar, cando diminúe a variación dos datos e predominan patróns xa consolidados, os rumbos presentes no material de adestramento poden reforzarse en lugar de corrixirse. A literatura recente sobre evolución de modelos de linguaxe e rumbo advirte precisamente que os procesos recursivos poden amplificar prexuízos existentes no canto de diversificar perspectivas.
Doutra banda, a escritura empeza a soar cada vez máis parecida a si mesma: repítense estruturas sintácticas, tons medios, secuencias formularias e xeitos previsibles de desenvolver os parágrafos. Isto importa particularmente no xornalismo, porque a prensa non só transmite información: tamén media entre rexistros especializados e públicos amplos, selecciona énfases, traduce vocabularios e ensaia formulacións. Cando a prosa pública se volve demasiado uniforme, diminúe esa capacidade de axuste fino fronte á novidade.
Erosión da innovación lingüística
Así, redúcense as palabras raras ou específicas, as construcións menos frecuentes e algúns matices pragmáticos, como a ironía, a ambigüidade ou certas modulacións do punto de vista. O aumento do texto sintético no adestramento asóciase con degradación de desempeño e cunha cobertura máis pobre da distribución da linguaxe humana. En termos simples: o sistema conserva mellor o centro que os bordos.
E é que moitas innovacións nacen como desvíos inestables, usos raros ou solucións locais para nomear algo novo. Se o sistema favorece sempre o máis probable, esas formas emerxentes teñen menos espazo para circular e consolidarse. Este punto non debe entenderse como unha oposición abstracta entre “humano” e “máquina”, senón como unha diferenza entre unha lingua exposta á continxencia social e unha prosa xerada a partir de regularidades xa aprendidas.
Deterioración do ecosistema lingüístico público
Non se trata só de ter menos palabras distintas, senón tamén menos capacidade de establecer distincións finas. Cando a linguaxe se volve máis vago, máis repetitivo ou máis predicible, tamén se empobrecen as ferramentas con que unha sociedade describe problemas, matiza posicións e debate no espazo público.
Nun nivel máis amplo, o problema xa non é só que lle pasa a un modelo, senón que lle pasa ao ecosistema lingüístico público. Se a web se enche de textos sintéticos, os propios lectores, xornalistas e institucións pasarán a convivir cunha linguaxe pública menos diversa. Algúns traballos recentes falan mesmo de “contaminación” do ecosistema web por datos sintéticos e amosan que o modo en que se mesturan datos reais e artificiais é decisivo para evitar deterioracións maiores.
Está todo perdido?
Convén, iso si, non esaxerar. A investigación non sostén que calquera uso de IA produza inevitablemente colapso ou degradación. Algúns estudos mostran que, cando os datos sintéticos se mesturan cos datos reais no canto de substituílos por completo, o colapso non se comporta do mesmo xeito e o erro pode permanecer acoutado. É dicir, o problema non está en usar IA de forma puntual nin en mesturar prudentemente datos sintéticos e humanos, senón en substituír masivamente a escritura humana e logo reciclar esa substitución coma se fose linguaxe viva.
Coa incorporación da IA ás rutinas de produción xornalística, o xornalismo gaña en eficiencia. Pero que perde unha sociedade cando a linguaxe que circula publicamente se volve máis uniforme, máis predicible e menos aberto ao novo? Se a prensa renuncia, aínda que sexa en parte, á súa función de escribir, traducir, nomear e ensaiar formulacións novas, non só cambian as rutinas de traballo. Tamén, debilítase un dos espazos onde a lingua pública historicamente máis puido enriquecerse, renovarse e expandir as súas posibilidades.
Cláusula de divulgación: As persoas asinantes non son asalariadas, nin consultoras, nin posúen accións, nin reciben financiamento de ningunha compañía ou organización que poida obter beneficio deste artigo, e declararon carecer de vínculos relevantes máis aló do cargo académico citado anteriormente.














