Etiquetado social y blog-scraping como alternativa para la actualización de vocabularios controlados: aplicación práctica a un tesauro de Biblioteconomía y Documentación

Gonzalo Mochon Bezares, Eva Méndez Rodríguez, Ángela Sorli Rojo

Resumen


El objetivo de este artículo es comparar las etiquetas en lenguaje libre, tomadas en nuestro caso de blogs especializados en ciencias de la información (information sciences), frente al lenguaje controlado no estructurado de las listas de palabras clave, con el fin de comprobar cuál de estos dos es una mejor fuente de nueva terminología para el Tesauro de Biblioteconomía y Documentación. Para ello, se extrajeron las etiquetas de autor de 127 blogs sobre biblioteconomía y documentación mediante técnicas de web scraping, y se compararon con los listados de descriptores e identificadores de la base de datos ISOC Biblioteconomía y Documentación (ISOC-BD). El análisis de las etiquetas de autor de blogs ha aportado 186 nuevos términos, mientras que los listados de la base de datos han proporcionado 130términos. Se concluye que las etiquetas en lenguaje libre pueden ser una mejor y más rápida vía de aporte de nueva terminología a los vocabularios controlados que los listados de lenguaje controlado no estructurado.

Texto completo



Licencia Creative Commons
Los trabajos publicados en esta revista están bajo la licencia Creative Commons Atribución-NoComercial 2.5 Argentina.

 

Información, cultura y sociedad. ISSN 1851-1740. Instituto de Investigaciones Bibliotecológicas (ics@filo.uba.ar / inibi@filo.uba.ar / http://www.filo.uba.ar/contenidos/investigacion/institutos/inibi_nuevo/home.html), Universidad de Buenos Aires. Facultad de Filosofía y Letras. Puán 480 - Piso 4 Of. 8 (C1406CQJ) - Ciudad Autónoma de Buenos Aires. República Argentina