El Tesauro es un lenguaje documental que contiene un vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas y genéricas: jerárquicas, asociativas y de equivalencia que eliminan así las posibles ambigüedades y polisemias para facilitar la diferenciación semántica entre ellos términos. Su objetivo es convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa de manera unívoca el contenido de éstos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.
Para comprender el funcionamiento de un tesauro vamos hay que conocer la estructura del mismo. Los elementos principales que lo componen son los términos y las relaciones entre ellos.
Los términos son los siguientes:
Unidades Lexicales:
Estas pueden ser de las siguientes categorías: grupo de descriptores
Descriptores:
Son palabras o expresiones del lenguaje natural retenidas por el constructor del tesauro para designar los conceptos representativos del documento.
No Descriptores:
Son sinónimos o cuasi-sinónimos de los descriptores o términos que designan en el lenguaje de uso conceptos afines a los que cubren los descriptores. Los no descriptores no pueden ser utilizados para la indización de documentos, pero cada uno de ellos se reenvía a otro descriptor para representar los conceptos correspondientes.
Las relaciones que hay entre los términos de un tesauro son:
Relaciones de equivalencia:
Una relación de equivalencia es la relación entre descriptores o términos preferidos y los no descriptores o términos no usados en la indización referentes a un mismo concepto. Esta relación cubre dos tipos de términos: los sinónimos y los cuasi-sinónimos.
Los sinónimos son términos cuyo significado puede considerarse igual, por lo que son intercambiables y tienen diferente origen lingüístico.
Relaciones jerárquicas:
Una relación jerárquica es la relación vertical entre todos los descriptores de una misma clase, expresada en términos de subordinación de los conceptos.Relaciones asociativas :
Indican relación o uniones en el significado de los descriptores. Son relaciones simétricas entre dos descriptores, que son susceptibles de evocarse mutuamente por asociación de ideas. Las relaciones asociativas son las más difíciles de definir.Otro componente que tiene el tesauro son las Notas de Alcance:
Se usan para limitar el uso de los descriptores, para escribir un posible sentido del término cuando éste tiene diferentes significados, pues es usado en diferentes disciplinas.
Las siglas empleadas para expresar estas relaciones son las siguientes:
NA= Nota de Alcance > No es ningún tipo de relación sino una anotación para la compresión de los tesauros
USE= Término Preferido > Utilizado en la relaciones de equivalencia
UP = Usado por > Utilizado en la relaciones de equivalencia
TG = Término Genérico > Utilizado en la relaciones jerárquicas
TE = Término Especifico > Utilizado en la relaciones jerárquicas
TR= Término Relacionado > Utilizado en la relaciones asociativas
Tesauro de la UNESCO
< Temática: educación , cultura, ciencias naturales, ciencias sociales y humanas, comunicación e información
< Contiene: 7000 términos en inglés, 8.600 en francés y 6.800 en español
< Disponible online en la red y en CD ROM
< Dispone de tres listas:
Lista Alfabética
Lista Permutada
Lista Temática: Lista de siete temas principales, y sus respectivos microtesauros los cuales reagrupan los términos de acuerdo al tema escogido.
Macro Tesauro de la OCDE
< Materia vinculadas a: Economía, sociedad y política.
< Disponible en tres versiones: inglés, francés y español
< Contiene 4.807 términos agrupados en 19 áreas temáticas
< Índice alfabético kwic
< Consulta únicamente en Internet
< Carece de ayuda que explique su funcionamiento o el significado de las abreviaturas utilizadas.
No hay comentarios:
Publicar un comentario