sábado, 16 de mayo de 2009

Sistemas de Recuperación de Información

Los SRI, son sistemas que facilitan de manera automatizada la recuperación de información, utilizando algoritmos de búsqueda, con el fin de recuperar los documentos más significativos. Ejemplo: las bases de datos y los metabuscadores.

Pero también existen otro tipo de SRI, como los desktop search y los indizadores como SWISH-E, son fáciles de usar y de instalar.

Los DESKTOP SEARCH, son herramientas de búsqueda, que permiten localizar información dentro de un computador personal o directamente desde de la web. Localizan archivos dentro del historial de búsquedas del navegador, archivos de correo Electrónico, documentos des texto, archivos de sonido, imágenes y video. Una de las principales ventajas de estas herramientas, es que los resultados tardan en aparecer solo unos segundos, convirtiendose en una gran solución para facilitar la recuperación de información en este medio. Los motores de búsqueda de escritorio, crean, mantienen y actualizan un índice de datos para lograr un desempeño razonable en la búsqueda de grandes cantidades de información. En el índice se tiene en cuenta los siguientes criterios:

1. Los nombres de los documentos y sus rutas.

2. Los metadatos (título, autor, comentarios) y tipos de archivo (doc, mp3, pdf).

3. El contenido del documento.

Logrando de ésta manera reducir los tiempos de búsqueda y generar resultados confiables.


SWISH-E: Es una herramienta rápida, flexible, libre y de código abierto, utilizado para indexar colecciones con más de un millón de documentos (páginas Web u otros archivos). Utiliza el analizador de GNOME ™ libxml2 y una colección de filtros, con los que puede indexar documentos txt, correo electrónico, PDF, HTML, XML, Word , PowerPoint, Excel.

Swish-e suele utilizarse como complemento de las bases de datos que utilizan como gestor de bases de datos MySQL, para obtener mejores resultados de búsqueda en las colecciones.

Básicamente este aplicativo se compone de 2 partes, un indexador y un buscador. El indexador se encarga de analizar los documentos y extraer toda la información necesaria que permita crear la base de datos de índices. Una vez obtenida esta, se puede localizar la información a través del buscador.

No hay comentarios:

Publicar un comentario

Subscribe in a reader

directorio enlaces gratis directorio de enlaces