Etiquetado automático mediante Programación de Lenguaje Natural (PNL) y visualización de la información utilizando repositorios web bajo protocolo OAI-PMH

Autores/as

  • Fernando Ruben Aramayo Facultad de Ciencias Agrarias

Palabras clave:

Repositorios, protocolo OAI-PHM, harvester, Programacion Lenguaje Natural (PNL)

Resumen

El presente trabajo propone el desarrollo de un sistema que logre procesar información que se encuentra en repositorios de la Web los cuales son de libre acceso, comúnmente a estos tipos de sistemas se los denomina “Harvester”. Son sistemas clientes que manejan llamadas y respuestas a los repositorios, los cuales se encuentran en algunas de estas plataformas Archimede, ARNO, CDSware, DSpace, Fedora, Eprints, i-Tor, Mycore y OPUS, etc. las cuales son las encargadas de proveer datos y servicios. Las mismas utilizan el protocolo OAI-PMH para poder establecer la comunicación con los sistemas que extraen información de ellas, su arquitectura está basada en clientes y servidores. Los primeros son los archivos que proporcionan la información, y los segundos son los recolectores o servicios que toman los datos, con el objetivo de incorporarles algún valor añadido y presentarlos a los usuarios finales.

Se analizaron los repositorios listados en ROAR (listado de repositorios) y se observó que, si bien cada repositorio tiene su propio sistema de búsqueda, la misma se establece analizando el nombre de los documentos que los usuarios hayan subido a dicha plataforma y en algunas ocasiones con solo esa información no es suficiente para poder realizar una búsqueda óptima.

El sistema debe obtener la información de cada uno de los recursos que se encuentran en un determinado repositorio, interpretar/procesar la información obtenida y etiquetar ese recurso automáticamente, la o las etiquetas resultantes de este procesamiento permitirán el agrupado de los recursos formando conjuntos o clúster con contenidos similares.

Descargas

Publicado

2017-08-18

Cómo citar

Aramayo, F. R. (2017). Etiquetado automático mediante Programación de Lenguaje Natural (PNL) y visualización de la información utilizando repositorios web bajo protocolo OAI-PMH. Difusiones, 12(12), 96–118. Recuperado a partir de http://revistas.ucse.edu.ar/ojsucse/index.php/difusiones/article/view/153