lunes, 27 de junio de 2011
Oportunidades de los Lenguajes Documentales y los profesionales de la información en la Web 2.0
Delicious y el Tesauro
Una vez realizado el experimento de asignar los descriptores del Tesauro - en mi caso el de la UNESCO-, a los Booksmarks, he sacado varias conclusiones.
El uso del Tesauro en el repertorio de Booksmarks de Delicious como vocabulario de de indización ha sido dificultoso ya que los Tesauros han sido concebidos para ser utilizados en campos muy específicos y reducidos de información como (documentos, libros…etc.), y no en la web.
La tarea de asignar descriptores a los Booksmarks no me ha supuesto demasiados problemas ya que el Tesauro elegido se adaptaba muy bien a las temáticas de mi repertorio. Aunque el Tesauro en algunas ocasiones tenía la carencia de no ofrecer Descriptores suficientemente específicos para la correcta indización.
También existen muchas limitaciones en cuanto al uso de las relaciones entre los términos. Pretender asignar todos los términos posibles (TE, TG, TR, NA) a un Booksmarks produciría una amalgama que no sería ilegible.
Sí nos propusiéramos recuperar un marcador de un tema específico en mi Booksmarks utilizando los descriptores del Tesauro nos resultaría fácil y obtendríamos precisión en la búsqueda ya que el Tesauro elegido para indizar mis Booksmarks engloba genéricamente todas la materias de las que tratan mis Marcadores. En cambio, sí pretendiéramos realizar una búsqueda combinado los Encabezamientos de Materia obtendríamos demasiada exhaustividad ya que los Encabezamientos son muy genéricos.
En conclusión, el uso o no de un Tesauro en Delicious dependería de la información recogida en los Booksmarks. Sí todos los Booksmarks tratasen de una misma materia (por ejemplo: la Biblioteconomía) el uso de un Tesauro para indizar y recuperar información sería exhaustivo y preciso. Pero asignar descriptores a cualquier tipo de información es una tarea costosa pero eficaz.
En cuanto a los 20 Booksmarks registrados posteriormente e indizados con el Tesauro ha sido una tarea bastante sencilla ya que no hay más que guiarse por el Microtesauro e indizar con el término más específico. Igual que con las 75 entradas diferentes en éstas otras también resulta complicado establecer relaciones entre los términos.
En lo que se refiere a la recuperación de información, queda remarcado que los Tesauros están hechos para campos del conocimiento muy concretos, con lo que la recuperación de información en los últimas 20 Booksmarks resulta fácil y obtenemos la información deseada= exhaustividad y precisión.
Conclusión, a la hora de indizar y recuperar todo depende de la información con la que vayamos a trabajar.
Selección del Tesauro
Como ya bien sabemos los Tesauros son un “Vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas: de equivalencia, jerárquicas y asociativas. Es un instrumento de control terminológico que permite convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que se representa de manera unívoca el contenido de éstos, con el fin de servir tanto para la indización como para la recuperación de estos documentos”.
Y que este lenguaje normalmente se aplica a una temática específica del conocimiento.
Teniendo esto en cuenta, vamos a utilizar este lenguaje para indizar el repertorio de URL´s de mi Delicious.
Previamente antes de elegir un Tesauro debemos conocer el contenido y las materias que abarca mi repertorio.
En Delicious he almacenado Booksmarks de temáticas muy generales y diversas como: Arte, Bibliotecas, Documentación, Economía, Filosofía, Información, Informática, Literatura, Pintura, incluso vídeos.
Todas estas materias las he organizado en (Tag Bundled o paquete de etiquetas) que en mi Delicious funcionan como un Microtesauro. Es decir, son paquetes que engloban los (Booksmarks o marcadores) que tratan sobre esa materias.
Contenido muy diverso pero muy general, ¿he ahí una ventaja o problema?, sabiendo que los Tesauros han sido creados especialmente para campos muy específicos del conocimiento. Se crean así para ofrecer una mayor precisión y concreción a la hora de recuperar información dado que la información a controlar es muy específica.
¿Será difícil de indizar dicho contenido con un Tesauro? La respuesta es no, ya que existen Tesauros enciclopédicos, es decir, que abarcan muchas materias.
Teniendo todo esto en cuenta, el Tesauro elegido es el de la UNESCO ya que cubre mis necesidades para indizar el contenido de mi repertorio. Es bastante general dentro de su especificidad por lo que se adaptará bastante bien a la recuperación de información.
Elección: Tesauro de la UNESCO
domingo, 26 de junio de 2011
Caminando entre Tesauros
El Tesauro es un lenguaje documental que contiene un vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas y genéricas: jerárquicas, asociativas y de equivalencia que eliminan así las posibles ambigüedades y polisemias para facilitar la diferenciación semántica entre ellos términos. Su objetivo es convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa de manera unívoca el contenido de éstos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.
Para comprender el funcionamiento de un tesauro vamos hay que conocer la estructura del mismo. Los elementos principales que lo componen son los términos y las relaciones entre ellos.
Los términos son los siguientes:
Unidades Lexicales:
Estas pueden ser de las siguientes categorías: grupo de descriptores
Descriptores:
Son palabras o expresiones del lenguaje natural retenidas por el constructor del tesauro para designar los conceptos representativos del documento.
No Descriptores:
Son sinónimos o cuasi-sinónimos de los descriptores o términos que designan en el lenguaje de uso conceptos afines a los que cubren los descriptores. Los no descriptores no pueden ser utilizados para la indización de documentos, pero cada uno de ellos se reenvía a otro descriptor para representar los conceptos correspondientes.
Las relaciones que hay entre los términos de un tesauro son:
Relaciones de equivalencia:
Una relación de equivalencia es la relación entre descriptores o términos preferidos y los no descriptores o términos no usados en la indización referentes a un mismo concepto. Esta relación cubre dos tipos de términos: los sinónimos y los cuasi-sinónimos.
Los sinónimos son términos cuyo significado puede considerarse igual, por lo que son intercambiables y tienen diferente origen lingüístico.
Relaciones jerárquicas:
Una relación jerárquica es la relación vertical entre todos los descriptores de una misma clase, expresada en términos de subordinación de los conceptos.Relaciones asociativas :
Indican relación o uniones en el significado de los descriptores. Son relaciones simétricas entre dos descriptores, que son susceptibles de evocarse mutuamente por asociación de ideas. Las relaciones asociativas son las más difíciles de definir.Otro componente que tiene el tesauro son las Notas de Alcance:
Se usan para limitar el uso de los descriptores, para escribir un posible sentido del término cuando éste tiene diferentes significados, pues es usado en diferentes disciplinas.
Las siglas empleadas para expresar estas relaciones son las siguientes:
NA= Nota de Alcance > No es ningún tipo de relación sino una anotación para la compresión de los tesauros
USE= Término Preferido > Utilizado en la relaciones de equivalencia
UP = Usado por > Utilizado en la relaciones de equivalencia
TG = Término Genérico > Utilizado en la relaciones jerárquicas
TE = Término Especifico > Utilizado en la relaciones jerárquicas
TR= Término Relacionado > Utilizado en la relaciones asociativas
Tesauro de la UNESCO
< Temática: educación , cultura, ciencias naturales, ciencias sociales y humanas, comunicación e información
< Contiene: 7000 términos en inglés, 8.600 en francés y 6.800 en español
< Disponible online en la red y en CD ROM
< Dispone de tres listas:
Lista Alfabética
Lista Permutada
Lista Temática: Lista de siete temas principales, y sus respectivos microtesauros los cuales reagrupan los términos de acuerdo al tema escogido.
Macro Tesauro de la OCDE
< Materia vinculadas a: Economía, sociedad y política.
< Disponible en tres versiones: inglés, francés y español
< Contiene 4.807 términos agrupados en 19 áreas temáticas
< Índice alfabético kwic
< Consulta únicamente en Internet
< Carece de ayuda que explique su funcionamiento o el significado de las abreviaturas utilizadas.