1. INICIO
  2. NOTICIAS
  3. Hobelex, el primer corrector de léxico para el euskera

Hobelex, el primer corrector de léxico para el euskera

Lexicografía, Noticias

El primer corrector de léxico para el euskera

Hobelex es el primer corrector léxico para el euskera, disponible para Microsoft Office; una herramienta que permite escribir en euskera sin faltas ortográficas y que, además, garantiza una escritura adaptada al léxico correcto y actualizado.

Las propuestas de corrección de Hobelex se basan principalmente en las normas de Euskaltzaindia y las propuestas de la Comisión de Terminología del Gobierno Vasco.

Una herramienta indispensable para la normalización del euskera

Cubre una demanda. Hasta el momento los correctores únicamente ayudaban a escribir sin faltas de ortografía, pero eso es insuficiente. Se trata de escribir MEJOR en euskera. Y, por tanto, resulta imprescindible contar con una herramienta que corrija el léxico de acuerdo a las normas del euskera batua.

Especificaciones

  • Hobelex está pensado para todo aquel que escribe en euskera. El único requisito para usarlo es tener instalado Microsoft Office para PCs, y necesitar y/o tener la voluntad de escribir correctamente en euskera.
  • Este plug-in puede utilizarse en el editor de textos Word así como en otros programas de Microsoft Office.
  • Funciona en Microsoft Office 2003 y en las versiones más recientes, dado que ha sido desarrollado para Microsoft Office 2003, Office 2007, Office 2010 y Office 2013.
  • Realiza propuestas de corrección y mejora a medida que el usuario escribe: el corrector verifica cada palabra del texto, y subraya las «incorrectas» o las susceptibles de mejora.
  • Este plug-in se instala fácilmente, sin necesidad de conocimientos informáticos.
  • Es gratuito y está disponible para cualquier usuario.
  • Se actualiza constantemente:
    • Constantemente se actualizan normas lingüísticas. Para garantizar la idoneidad de las propuestas que realiza Hobelex, se actualiza diariamente (literalmente, todos los días) la información lingüística en la que se basa.
    • Y no solo eso: aunque muchas palabras que se emplean habitualmente en el día a día no estén recopiladas por las autoridades normativas, los usuarios necesitan una respuesta inmediata. Para dar respuesta a esa necesidad UZEI verifica diariamente los textos publicados en euskera en medios de comunicación y en otras fuentes, y actualiza su base de datos con nuevas propuestas, a fin de ofrecer la mayor cobertura posible, respetando en todo momento los criterios de las autoridades normativas.
      A modo de ejemplo, la palabra ebola [ébola] es hoy imprescindible para cualquier medio, pero no aparece en las normas (ni siquiera está recogida en los diccionarios de euskera más habituales). Sin embargo, está incluida en nuestra base de datos. Asimismo, en vista de la actualidad reciente, hemos incluido nombres de ciudades y políticos relacionados con Ucrania.

 

  • Opción de crear diccionarios personales: el usuario puede crear y utilizar su propio diccionario personal, para adaptar así Hobelex a sus necesidades específicas.

Las fuentes de Hobelex

Una base de datos de 117.806 entradas

Hobelex emplea una base de datos diseñada para el tratamiento automático de la lengua, que recopila las normas de Euskaltzaindia y los criterios de la Comisión de Terminología del Gobierno Vasco. A partir de esa información, identifica las formas correctas y propone las formas para realizar correcciones y mejoras en el texto.

Además, Hobelex cuenta con un importante valor añadido: utiliza miles de nombres propios, abreviaturas y otras formas que aún no han sido recopiladas por las autoridades normativas. El uso de nombres propios de cualquier ámbito es constante en la producción escrita, y, por ello, un corrector también tiene que ser capaz de identificar esas formas. Por ejemplo, este año ha sido noticia el grupo islamista armado Boko Haram, ha llegado al País Vasco la empresa Cata, y el  Athletic ha jugado contra el Xakhtar Donetsk. Todos esos nombres han aparecido en los medios de comunicación y el corrector Hobelex las identifica; por tanto, no las subraya como desconocidas.

Ingeniería lingüística al servicio de la gente

Hobelex es la culminación de muchos años de trabajo. Para el desarrollo de este corrector léxico, UZEI ha necesitado desarrollar previamente numerosos recursos y herramientas imprescindibles para el tratamiento automático del euskera (lexicón, lematizador, etc.).

UZEI es una organización sin ánimo de lucro, y desde sus inicios su vocación ha sido la de servir a la sociedad. Es precisamente esa filosofía la que ha llevado a UZEI a poner Hobelex al alcance de cualquier usuario, al entender que se trata de una herramienta fundamental para la normalización del euskera. En este sentido, cabe subrayar el apoyo de Laboral Kutxa a este proyecto.

UZEI continuará en ese misma línea mejorando Hobelex y adaptándolo también a los editores de texto de código abierto y a otros sistemas operativos.

¿Qué hace Hobelex?

A medida que el usuario va escribiendo, el corrector verifica las palabras del texto, y subraya las que no son “correctas”.

¿Qué subraya exactamente?

  • Subrayado en rojo. Puede indicar tres tipos de palabras:
  1. una falta de ortografía o errata: *erabakki, por ejemplo, en lugar de la forma correcta erabaki; o la forma incorrecta*eritzaintza, si se ha querido escribir ertzaintza o erizaintza.
  2. una forma incorrecta cuyo uso hay que evitar, es decir, una forma que Euskaltzaindia recomienda no emplear: por ejemplo, *aseguru-konpainia, en lugar de la correcta aseguru-etxe, según la norma 121 de Euskaltzaindia.
  3. una forma desconocida que el diccionario no ha recopilado: por ejemplo, un término muy especializado como bioestratinomia.

 

  • Subrayado en verde[1]. Las formas subrayadas en verde no son, en principio, incorrectas, pero las normas recomiendan sustituirlo por otra forma de uso preferente. Por ejemplo, en euskera es más correcto utilizar film que pelikula, según la norma 97 de Euskaltzaindia.

 

Por tanto, Hobelex reconoce las formas “incorrectas” y las «no tan adecuadas” y propone las mejores opciones. En última instancia, siempre es el propio usuario quien decide implementar o no los cambios propuestos. Hobelex informa al usuario y, al mismo tiempo, le da la opción de mejorar el texto.

 

¿Cómo se hacen las correcciones?

  1. Haciendo click con el botón derecho sobre la palabra subrayada se visualiza una lista con las posibles opciones de corrección. Aquello que se selecciona de esa lista queda directamente escrito en el texto. La palabra propuesta aparece en el texto con las mismas marcas de declinación que aquella a la que ha sustituido. Así, en lugar de eritzaintzako se escribirá automáticamente ertzaintzako o erizaintzako, y en lugar de pelikularekin aparecerá filmarekin.

  1. Además de corregir a medida que se escribe, pulsando la tecla F7 también se puede utilizar la funcionalidad de ortografía y gramática de Word para corregir un texto previamente redactado.

 

Comparación de resultados entre Hobelex y los correctores ortográficos ordinarios

 

Propuestas de corrección Hobelex

Japoneko gobernuak desarmerako behin behineko elkarrizketen frakasoa iragarri du. Europako Batasuneko herrialeetako delegatuek deklaratu dute harmak inbentariatu beharko liratekeela, betirako arazorik ez sortzeko Ukrainian.

 

Propuestas de corrección de correctores ortográficos ordinarios

Japoneko gobernuak desarmerako behin behineko elkarrizketen frakasoa iragarri du. Europako Batasuneko herrialeetako delegatuek deklaratu dute harmak inbentariatu beharko liratekeela, betirako arazorik ez sortzeko Ukrainian.

 

Texto correcto, corregido con Hobelex

Japoniako gobernuak armagabetzerako behin-behineko elkarrizketen porrota iragarri du. Europar Batasuneko herrialdeetako ordezkariek adierazi dute armen inbentarioa egin beharko litzatekeela, betiko arazorik ez sortzeko Ukrainan.

 

Fecha de publicación: 2014-10-22.

 

[1] O azul, en función de la versión de MS Office.