sábado, 5 de marzo de 2011

Concepto de recuperación de información



Es un proceso para satisfacer necesidades de información de los usuarios, materializada en una pregunta que no está estructurada y que se representa en un lenguaje natural. De esta forma el usuario trata de llenar un vacío conceptual  con información.

La recuperación de información se encarga de seleccionar automáticamente, en una colección documental la respuesta a la pregunta del usuario y ordenarla según un criterio de relevancia.
En la actualidad la recuperación de información está jugando un papel crucial en la llamada “sociedad de la información” y más en la web donde tenemos cúmulos de información sin estructura ni formatos definidos es por esto que los conceptos de indexación y estructuración documental son temas que deben tenerse en cuenta a la hora de crear un sitio web. El ejemplo más claro de un buscador que está desarrollando este importante tema de relevancia, además, de centrarse en lo que el usuario quiere encontrar es google que cada vez estructura su interfaz y mejora los resultados de relevancia.  

La recuperación de información se pude hablar de cuatro procesos básicos:

·    Representación del texto: (indización o indexación) se trata de identificar los términos que describen de forma optima el contenido del texto, y representarlos en un lenguaje de máquina.
·    Representación de la consulta: Descripción y normalización de aquello que se busca en forma de consulta explicita
·   Recuperación de documentos: En este paso se compara la representación de la consulta y de los documentos, para definir cuáles son relevantes, y establecer un orden de relevancia.
·       Evaluación de los documentos y evaluación de la búsqueda: Los documentos se presentan al usuario, y se utiliza la información  sobre aquellos que efectivamente le interesan para realimentar el proceso de búsqueda esto suele producir grandes mejoras en el proceso de recuperación


Como recuperar Información:

1.    Manejo de índices:

Los índices son un listado de términos normalizados que representan el contenido de un recurso.

Los índices se utilizan para indexar y recuperar documentos la elaboración de índices bien estructurados es fundamental para lograr recuperar la información precisa que el usuario busca.

2.    Especificar un conjunto de términos:

Es de suma importancia establecer un conjunto de términos que deben hallarse entre los índices de un documento, estableciendo un ranking de relevancia.