

Secciones
Servicios
Destacamos
Edición
Euskaltzaindia, la Real Academia de la Lengua Vasca, presentó ayer su Corpus de Referencia del Euskera (Euskararen Erreferentzia Corpusa). Una «enorme» base de datos que ... ya está disponible en la web de la institución y recoge los usos y costumbres de este idioma en el siglo XXI. Se trata de una compilación «referencial, de calidad y equilibrada», en palabras del presidente de la entidad, Andrés Urrutia.
El objetivo de la iniciativa es poner a disposición del público y del ámbito investigador el material recopilado gracias a la colaboración de 68 entidades privadas y públicas «de toda Euskal Herria». En esta primera versión, el EEC reúne 123.124 documentos y 154,21 millones de palabras de texto, procedentes de textos escritos o producidos en euskera desde el año 2000 hasta 2023. En su intervención, Urrutia hizo hincapié en que el corpus pretende ser un «reflejo del euskera actual». Por ello, el 48% de los textos contenidos en la base de datos provienen de libros; otro 48%, de revistas; y el 4% restante, de las redes sociales.
La vicelehendakari primera y consejera de Cultura y Política Lingüística, Ibone Bengoetxea, ensalzó el corpus. «Es parte de nuestra historia y, al mismo tiempo, es un instrumento de referencia que guiará nuestro futuro», manifestó. La dirigente subrayó que el euskera es «una lengua joven», presente en campos como la educación o la investigación. «Pero queremos que dé el salto a otros ámbitos como el social o el laboral», indicó.
Por su parte, la responsable de la sección de investigación de Euskaltzaindia, Miriam Urkia, subrayó que la Academia «era consciente de la necesidad de un corpus más grande y equilibrado» para «conocer el día a día del euskera y hacer frente a los retos que plantean las tecnologías lingüísticas». Por ello, hace cuatro años puso en marcha el Corpus de Referencia del Euskera «para cubrir ese vacío».
A su juicio, se trata de «una herramienta fundamental para el análisis lingüístico, el aprendizaje automático o la validación de hipótesis en las investigaciones lingüísticas», pero también «puede utilizarse como un corpus estándar o referente para fines lingüísticos, literarios o de investigación». «En la medida en que refleje la situación actual, las personas dedicadas a la enseñanza de la lengua, traductores, correctores... tendrán a su disposición el EEC, para resolver dudas léxicas, gramaticales y, por supuesto, para validar modelos adecuados para estos grandes corpus», destacó Urkia.
¿Tienes una suscripción? Inicia sesión
Publicidad
Publicidad
Te puede interesar
Detenida la influencer Marta Hermoso por un robo millonario en un hotel de Madrid
El Norte de Castilla
Publicidad
Publicidad
Esta funcionalidad es exclusiva para suscriptores.
Reporta un error en esta noticia
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.