Soporte multilingüe en RIMMF3

Este módulo está en desarrollo y esperamos que se produzcan muchos cambios en los próximos meses, que se destacarán aquí:



Para cambiar la lengua utilizada para las etiquetas y términos controlados hay que acceder desde el Menú principal, a 'Options|Setup' (Opciones|Configuración):




Después de seleccionar la opción del menú 'Set language …' (Configurar lengua) aparece el siguiente formulario:


Opciones de lengua

En RIMMF3, el objetivo es que todo el soporte multilingüe se base en el RDA Registry. De esta forma, la información que se muestra en el formulario del anterior pantallazo cambiará constantemente, dependiendo de los datos que haya disponibles en el Registry.

Cuando abres por primera vez este formulario, puede que esté bloqueado durante un par de segundos y muestre el mensaje 'Loading RDA Registry' (Descargando el RDA Registry) en la parte inferior. Una vez que el programa termina de analizar el RDF y recoger la información de lenguas contenida allí, la lista desplegable en la sección “Preferred RDA Vocabulary” (Vocabulario RDA preferido) se rellenará.

Si no ocurre nada de esto (es decir, si no ves el rótulo 'Loading …' o la lista no se rellena), pulsa el botón Update language data (Actualizar los datos de lengua) y RIMMF traerá una copia del Registry y procederá como se describe en el párrafo anterior. Pulsa también el botón Update language data (Actualizar los datos de lengua) para agregar lenguas, que hayan sido añadidas recientemente al RDA Registry, a la lista de “Preferred Language” (Lenguas preferidas)1).

La lista desplegable Preferred RDA Vocabulary (Vocabulario RDA preferido) contiene una fila por cada lengua de la que existan datos en el Registry. Comienza con el código de lengua (Formato ISO-639-1), seguido de un encabezado para la lengua, seguido del número de recursos que fueron etiquetados con este código de lengua en el Registry.

Estos recuentos se basan en un escaneo de todos los Elementos RDA y de todos los términos de los Vocabularios RDA. Fíjate en que, siempre que es aplicable, cada recurso se cuenta una única vez. Por ejemplo, si un valor de un vocabulario tiene una definición en español, así como una etiqueta de elemento en español, cuenta como 1, no como 2.

La lengua por defecto en RIMMF es inglés, 'en'. Si cambias la 'Preferred language' (Lengua preferida) a otra, por ejemplo, español, entonces RIMMF utilizará todas las etiquetas de los elementos y los términos de vocabularios que encuentre en el Registry. Cuando no haya un valor en español (o en cualquier otra lengua que no sea inglés estándar) para una etiqueta de un elemento o término de un vocabulario, RIMMF volverá a la opción por defecto, esto es, a un valor en inglés estándar.

El soporte para términos en lengua no inglesa ha comenzado aproximadamente a partir de la actualización del 3 de febrero de 2016 de RIMMF. 2). Por favor, revisa la información sobre cambios recientes en la página de descargas si quieres más detalles.

Lengua preferida del programa

La sección Preferred Program Language (Lengua preferida del programa) contiene opciones que se aplican a la propia aplicación RIMMF. Por ejemplo, si selecciones aquí 'Spanish' (Español), la mayor parte de los menús del programa se desplegarán en español.

Esta sección está en desarrollo y dependemos de la retroalimentación con nuestros usuarios. Así que si quieres traducir los menús RIMMF a tu lengua, utiliza este enlace de 'Contacto' para enviarnos un correo electrónico y te remitiremos una plantilla de menú.

Estilo preferido de etiquetas

Finalmente, pero no de menor importancia, en este formulario también verás la opción para seleccionar el Preferred Label Style (Estilo de etiquetas preferido): RDA Toolkit o RDA Registry. 3)

Un ejemplo breve de cada estilo de etiqueta se muestra a continuación:

RDA Toolkit:

  Preferred Title:      Absolute Friends
  Author:               Le Carré, John, 1931-
  

RDA Registry:

  Has Preferred Title:  Absolute Friends
  Has Author:           Le Carré, John, 1931-
  

En la actualidad, la opción Preferred Label Style (Estilo de etiqueta preferido) se aplica solo a las etiquetas en inglés, pero se aplicará a las etiquetas en otras lenguas, tan pronto como las traducciones de las etiquetas en el Registry estén disponibles.

Paquete de comprobación

En la parte inferior del formulario hay una casilla de verificación titulada 'Use language test pack' (Utilizar paquete de prueba de lengua). Para explicarlo brevemente, decir simplemente que al seleccionar esta opción se añadirán etiquetas de lengua no oficiales al programa para los elementos RDA. El usuario debería entender que esto solo se utiliza para comprobar los datos, cuyo contenido cambiará bastante cuando las etiquetas de elementos RDA en otras lenguas que no sean el inglés se publiquen en el RDA Registry. (Puedes encontrar más información sobre este testeo de datos en una nota al final de esta página).

Soporte multilingüe en Acción

En el contexto utilizado aquí, utilizamos el término 'lengua' para referirnos a las etiquetas de elementos y valores de vocabularios (cadenas de caracteres) que están disponibles en otras lenguas que no sean inglés estándar. 4)

Dada esa definición, un pantallazo típico de un registro de entidad RIMMF sería de esta manera:

En la parte inferior de la columna más a la izquierda, las etiquetas de los elementos están en inglés.

En el medio de la pantalla, la cadena de caracteres 'spoken word' (palabra hablada) se reproduce en inglés.

Cerramos este registro, abrimos las opciones de lengua desde el Menú principal y cambiamos la 'Preferred language' (Lengua preferida) a español. Tras un par de segundos (el programa tarda un segundo en cargar los datos del Registry y otro segundo en cambiar sus tablas internas de inglés a español, y después quizás un par de segundos más (dependiendo del tamaño) en regenerar el Entity Index (EI) si reabrimos el mismo registro, veremos:


En la columna más a la izquierda, las etiquetas de los elementos ahora aparecen en español.

En la parte media de la pantalla, la cadena de caracteres del vocabulario para Tipo de Contenido aparece ahora en español: palabra hablada.

Lo interesante aquí es que los datos del registro no han cambiado. Por ejemplo, además de utilizar bien uris opacas neutrales respecto a la lengua para todas las propiedades RDA (que denominamos 'elementos' en RIMMF), RDA también soporta uris opacas neutrales respecto a la lengua para los valores de los vocabularios. De esta forma, si la interfaz muestra

spoken word

o

palabra hablada

el valor que se almacena para el Tipo de Contenido en los datos del registro es:

http://rdaregistry.info/termList/RDAContentType/1023

Fíjate en que el mismo valor se ha cambiado de inglés a español en el Punto de Acceso Autorizado y en sus elementos.

¿Problemas?

Si no funciona el cambio de lengua cuando lo pruebas, existe una opción de datos que podrías necesitar que cambiar:

  • Ve a: Main Menu | Options | Data Options (Menú principal | Opciones | Opciones de datos)
  • Elige la etiqueta “EI y AAP”
  • Marca la opción: “Durante el proceso de creación del EI (Entity Index, Índice de entidades), se reemplazan los valores en forma de cadena de caracteres de los vocabularios publicados por uris”.

Si esta opción no está marcada y estás utilizando una carpeta de datos que contiene registros creados antes de la incorporación a RIMMF de este soporte multilingüe, el cambio de lengua preferida no tendrá efecto.



Sobre la opción de testeo de datos de lengua

Inicialmente necesitábamos algunas etiquetas en lengua no inglesa para diseñar y solucionar nuestra implementación. Para crear algunos datos de testeo, copiamos y pegamos las opciones de lenguas proporcionadas en el RDA Toolkit. Cambiando la configuración de lengua en nuestro perfil Toolkit y –mientras nos guiábamos por las plantillas RIMMF– ojeando los elementos siguiendo el orden de las reglas, fuimos capaces de copiar y pegar los nombres de elementos no ingleses en un archivo de texto. A partir de ahí, un script simple convertía el archivo de texto en un archivo de tripletas. Este archivo de tripletas imitaba tan detenidamente como era posible (pensamos) cómo estos datos se presentaban en el Registry, una vez están disponibles.

Es a este archivo de tripletas al que la casilla de verificación en la parte inferior del formulario se refiere. Cuando esta opción está marcada, el programa trae desde nuestra web el paquete de testeo de la lengua, lo agrega a los datos de lengua del Registry y vuelve a ejecutar el proceso que rellena la lista desplegable en el formulario de opciones.

Fíjate en que ninguna de las tripletas del paquete de testeo de lengua se usa en ninguna salida de datos generada por RIMMF. Solo se utilizan a nivel interno para comprobar las etiquetas de elementos en nuevas lenguas.

Fíjate también que tan pronto como se publica una lengua en el RDA Registry, cualquier elemento de testeo etiquetado con el código de la misma lengua se elimina de los datos de testeo.

Manual de Descarga de los archivos de datos de lenguas

Si, por alguna razón, RIMMF no consigue traer el fichero del Registry, puedes descargar los archivos requeridos directamente desde aquí:

http://rimmf.com/data/rda-registry.nt
http://rimmf.com/data/language-rimmf.nt
http://rimmf.com/data/language-test-rda.nt

Los archivos deben guardarse en la carpeta de ejecución 'tables'.
Para localizar esa carpeta sigue estos pasos y reemplaza la palabra 'data' con 'tables'

Notas

A partir de la versión del 28 de marzo de 2016:

  • Se distribuye con el programa el fichero 'language-rimmf.nt'.
  • No es necesario para el soporte de las lenguas francés y/o español el fichero 'language-test-rda.nt'.
  • El botón 'Update language data' (Actualizar datos de lengua) automáticamente intenta traer el fichero 'rda-registry.nt' como '.txt' si la descarga por defecto falla (que trae un fichero '.zip').

Ejemplos de visualización de lenguas

Aquí está el formulario de entrada de datos en RIMMF con las etiquetas de elementos en francés que muestran los datos WEMI que describen una Expresión inglesa de una obra española, con algunos datos ya completados por alguna agencia catalogadora anterior:


2)
Utilizamos aquí el término 'aproximadamente' porque este módulo se desarrollará en profundidad durante la primavera de 2016
3)
En el pasado, esta opción estaba presente en el menú del registro de entidad
4)
Damos por hecho que esta es una definición muy limitada y que no incluye todos los encabezados de los menús del programa, muchas de las cadenas de caracteres en el código del programa, etc. Sin duda, si tuvierámos que empezar de nuevo, diseñaríamos el programa de una forma mucho más neutral respecto a las lenguas desde el principio. “Buscando y metiendo la pata aprendemos”.
es/details/languages.txt · Last modified: 2023/06/07 20:39 by 127.0.0.1
Back to top
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki