lunes, 27 de junio de 2011

Oportunidades de los Lenguajes Documentales y los profesionales de la información en la Web 2.0

A lo largo de la Historia los Lenguajes Documentales han sido habitualmente el instrumento esencial para controlar, regular y recuperar la información comprendida en los documentos. Con el avance inexorable de las tecnologías, los lenguajes controlados están comenzando a reclamar su lugar en la Web, y su adaptación al entorno de la Web 2.0, lo que supone nuevas perspectivas, pero también nuevas oportunidades. Oportunidades que los profesionales de la información debemos saber aprovechar.

La Web 2.0 está provocando una ingente producción de información por parte de los usuarios, los cuales han cambiado de rol, han dejado de ser consumidores (pasivos) de información para ser productores y consumidores de información, a la vez elaborando, compartiendo y produciendo información y contenidos: Blogs, Wikis, Redes Sociales…etc.

Lo que nos ha convertido en potenciales creadores de información, incluso mayores que cualquier medio de producción de información tradicional.

Ante éstos hechos el profesional de la información debe de actuar, aprovecharse y adaptarse a ésta nueva situación que le es favorable. -A río revuelto, ganancia de pescadores.- Éste debe aprender a ver las demandas y necesidades de los usuarios de la Web 2.0.

En la Red el lenguaje más utilizado es el lenguaje libre, natural, el de la mayoría de los usuarios. Este lenguaje lo vemos representado en forma de Folksonomías, que es una nueva forma para la indización de los recursos de información en el Web.

La indización social dada en Del.ici.ous (marcadores), Flickr (fotos) tiene como resultado de valor añadido de lo que se conoce como folksonomías, que en mi opinión pueden ser el nuevo paradigma en la evolución y desarrollo de los lenguajes de indización y por tanto de la organización y representación de la información en el mundo de la Web 2.0 o Web Semántica.

Aunque la indización social tiene algunas desventajas como la inclusión de términos sin significado y problemas lingüísticos como la sinonimia y la polisemia, con vistas a eliminar mediante diferentes mecanismos la ambigüedad y el ruido que dificulta la recuperación de la información contenida en los recursos indizados.

Dentro de la necesidades de los usuarios de la Web 2.0 entra el desarrollo de herramientas para corregir las desventajas señaladas a las folksonomías; el estudio de nuevas formas para la representación de los recursos; así como la creación de lenguajes nuevos y más precisos, como herramientas para la recuperación de la información, son un reto al que deberán hacer frente con eficaces soluciones, los Profesionales de la Información.


Conclusiones a tener en cuenta.

En la red el lenguaje más y mejor utilizado el lenguaje libre.

La información es poder sí sabes usarla, hoy en día, obtener, evaluar y utilizar adecuadamente la información indispensable para la empresa significa ser más eficiente, eficaz e indispensable.

Por eso, contar con los profesionales de la información y la documentación es puro valor añadido.

Los profesionales de la información somos necesarios en esta sociedad… lo que pasa es que las empresas aún no lo saben.

Buscar nuevas necesidades en las empresas, y reinventarse.

Ante los nuevos avances tecnológicos flexibilidad y adaptación. Constante formación y aprendizaje.

Debemos adoptar nuevos roles. Comunity Manager...etc.

Apertura a nuevos horizontes. Futuro multidisciplinar.

Delicious y el Tesauro

Una vez realizado el experimento de asignar los descriptores del Tesauro - en mi caso el de la UNESCO-, a los Booksmarks, he sacado varias conclusiones.

El uso del Tesauro en el repertorio de Booksmarks de Delicious como vocabulario de de indización ha sido dificultoso ya que los Tesauros han sido concebidos para ser utilizados en campos muy específicos y reducidos de información como (documentos, libros…etc.), y no en la web.

La tarea de asignar descriptores a los Booksmarks no me ha supuesto demasiados problemas ya que el Tesauro elegido se adaptaba muy bien a las temáticas de mi repertorio. Aunque el Tesauro en algunas ocasiones tenía la carencia de no ofrecer Descriptores suficientemente específicos para la correcta indización.

También existen muchas limitaciones en cuanto al uso de las relaciones entre los términos. Pretender asignar todos los términos posibles (TE, TG, TR, NA) a un Booksmarks produciría una amalgama que no sería ilegible.

Sí nos propusiéramos recuperar un marcador de un tema específico en mi Booksmarks utilizando los descriptores del Tesauro nos resultaría fácil y obtendríamos precisión en la búsqueda ya que el Tesauro elegido para indizar mis Booksmarks engloba genéricamente todas la materias de las que tratan mis Marcadores. En cambio, sí pretendiéramos realizar una búsqueda combinado los Encabezamientos de Materia obtendríamos demasiada exhaustividad ya que los Encabezamientos son muy genéricos.

En conclusión, el uso o no de un Tesauro en Delicious dependería de la información recogida en los Booksmarks. Sí todos los Booksmarks tratasen de una misma materia (por ejemplo: la Biblioteconomía) el uso de un Tesauro para indizar y recuperar información sería exhaustivo y preciso. Pero asignar descriptores a cualquier tipo de información es una tarea costosa pero eficaz.

En cuanto a los 20 Booksmarks registrados posteriormente e indizados con el Tesauro ha sido una tarea bastante sencilla ya que no hay más que guiarse por el Microtesauro e indizar con el término más específico. Igual que con las 75 entradas diferentes en éstas otras también resulta complicado establecer relaciones entre los términos.

En lo que se refiere a la recuperación de información, queda remarcado que los Tesauros están hechos para campos del conocimiento muy concretos, con lo que la recuperación de información en los últimas 20 Booksmarks resulta fácil y obtenemos la información deseada= exhaustividad y precisión.

Conclusión, a la hora de indizar y recuperar todo depende de la información con la que vayamos a trabajar.

Selección del Tesauro

Como ya bien sabemos los Tesauros son un Vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas: de equivalencia, jerárquicas y asociativas. Es un instrumento de control terminológico que permite convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que se representa de manera unívoca el contenido de éstos, con el fin de servir tanto para la indización como para la recuperación de estos documentos”.

Y que este lenguaje normalmente se aplica a una temática específica del conocimiento.

Teniendo esto en cuenta, vamos a utilizar este lenguaje para indizar el repertorio de URL´s de mi Delicious.

Previamente antes de elegir un Tesauro debemos conocer el contenido y las materias que abarca mi repertorio.

En Delicious he almacenado Booksmarks de temáticas muy generales y diversas como: Arte, Bibliotecas, Documentación, Economía, Filosofía, Información, Informática, Literatura, Pintura, incluso vídeos.

Todas estas materias las he organizado en (Tag Bundled o paquete de etiquetas) que en mi Delicious funcionan como un Microtesauro. Es decir, son paquetes que engloban los (Booksmarks o marcadores) que tratan sobre esa materias.

Contenido muy diverso pero muy general, ¿he ahí una ventaja o problema?, sabiendo que los Tesauros han sido creados especialmente para campos muy específicos del conocimiento. Se crean así para ofrecer una mayor precisión y concreción a la hora de recuperar información dado que la información a controlar es muy específica.

¿Será difícil de indizar dicho contenido con un Tesauro? La respuesta es no, ya que existen Tesauros enciclopédicos, es decir, que abarcan muchas materias.

Teniendo todo esto en cuenta, el Tesauro elegido es el de la UNESCO ya que cubre mis necesidades para indizar el contenido de mi repertorio. Es bastante general dentro de su especificidad por lo que se adaptará bastante bien a la recuperación de información.


Elección: Tesauro de la
UNESCO

domingo, 26 de junio de 2011

Caminando entre Tesauros

El Tesauro es un lenguaje documental que contiene un vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas y genéricas: jerárquicas, asociativas y de equivalencia que eliminan así las posibles ambigüedades y polisemias para facilitar la diferenciación semántica entre ellos términos. Su objetivo es convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa de manera unívoca el contenido de éstos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.

Para comprender el funcionamiento de un tesauro vamos hay que conocer la estructura del mismo. Los elementos principales que lo componen son los términos y las relaciones entre ellos.

Los términos son los siguientes:

Unidades Lexicales:

Estas pueden ser de las siguientes categorías: grupo de descriptores

Descriptores:

Son palabras o expresiones del lenguaje natural retenidas por el constructor del tesauro para designar los conceptos representativos del documento.

No Descriptores:

Son sinónimos o cuasi-sinónimos de los descriptores o términos que designan en el lenguaje de uso conceptos afines a los que cubren los descriptores. Los no descriptores no pueden ser utilizados para la indización de documentos, pero cada uno de ellos se reenvía a otro descriptor para representar los conceptos correspondientes.

Las relaciones que hay entre los términos de un tesauro son:

Relaciones de equivalencia:

Una relación de equivalencia es la relación entre descriptores o términos preferidos y los no descriptores o términos no usados en la indización referentes a un mismo concepto. Esta relación cubre dos tipos de términos: los sinónimos y los cuasi-sinónimos.

Los sinónimos son términos cuyo significado puede considerarse igual, por lo que son intercambiables y tienen diferente origen lingüístico.

Relaciones jerárquicas:

Una relación jerárquica es la relación vertical entre todos los descriptores de una misma clase, expresada en términos de subordinación de los conceptos.

Relaciones asociativas :

Indican relación o uniones en el significado de los descriptores. Son relaciones simétricas entre dos descriptores, que son susceptibles de evocarse mutuamente por asociación de ideas. Las relaciones asociativas son las más difíciles de definir.

Otro componente que tiene el tesauro son las Notas de Alcance:

Se usan para limitar el uso de los descriptores, para escribir un posible sentido del término cuando éste tiene diferentes significados, pues es usado en diferentes disciplinas.

Las siglas empleadas para expresar estas relaciones son las siguientes:

NA= Nota de Alcance > No es ningún tipo de relación sino una anotación para la compresión de los tesauros

USE= Término Preferido > Utilizado en la relaciones de equivalencia

UP = Usado por > Utilizado en la relaciones de equivalencia

TG = Término Genérico > Utilizado en la relaciones jerárquicas

TE = Término Especifico > Utilizado en la relaciones jerárquicas

TR= Término Relacionado > Utilizado en la relaciones asociativas

Tesauro de la UNESCO

< Temática: educación , cultura, ciencias naturales, ciencias sociales y humanas, comunicación e información

< Contiene: 7000 términos en inglés, 8.600 en francés y 6.800 en español

< Disponible online en la red y en CD ROM

< Dispone de tres listas:

Lista Alfabética

Lista Permutada

Lista Temática: Lista de siete temas principales, y sus respectivos microtesauros los cuales reagrupan los términos de acuerdo al tema escogido.

Macro Tesauro de la OCDE

< Materia vinculadas a: Economía, sociedad y política.

< Disponible en tres versiones: inglés, francés y español

< Contiene 4.807 términos agrupados en 19 áreas temáticas

< Índice alfabético kwic

< Consulta únicamente en Internet

< Carece de ayuda que explique su funcionamiento o el significado de las abreviaturas utilizadas.