Búsqueda de Información, Datos y Documentos
La clave de todo proceso documental se encuentra en la recuperación de información. En términos generales, los sistemas que empleamos no recuperan conocimiento, solo recuperan datos y documentos. La búsqueda de información siempre dependerá del estado de conocimiento de la persona que busca esa información. A mayor conocimiento, menor probabilidad de encontrar información novedosa y viceversa. Ante la gran cantidad de información existente, necesitaremos criterios sólidos para poder discriminar la calidad de la información.
Procedimiento de Búsqueda, Lenguajes de Interrogación y Evaluación de la Recuperación de Información
La recuperación de información se basa en los términos que incorporamos en los distintos formularios. Ante una determinada palabra, el sistema de recuperación, ya sea en web o en base de datos, buscará documentos y sitios web en los que se encuentre ese término. A partir de esa base, se irán sumando otros filtros y algoritmos que mejorarán el resultado final. Estos cambios pueden estar orientados a: los metadatos, la eliminación de la redundancia, etc.
Como procedimientos de búsqueda, podemos encontrar:
- Lógica de Boole o básica: Tiene 3 modalidades:
- Intersección: El sistema recupera documentos que contengan las dos palabras seleccionadas. El operador es
AND
oY
, y en los sistemas de recuperación web es implícito al incluir dos términos. - Unión: El sistema recupera documentos donde aparezca una de las palabras, la otra palabra o las dos al mismo tiempo. El operador es
OR
uO
, y ya no se suele emplear. - Negación: El sistema de recuperación recupera aquellos documentos en los que se incluye el primer término y no el segundo. El operador es
NOT
oNO
.
- Intersección: El sistema recupera documentos que contengan las dos palabras seleccionadas. El operador es
- Otros procedimientos:
- Búsqueda literal: El sistema recupera la expresión que aparece en el formulario de modo literal.
- Búsqueda de proximidad: El operador es
NEAR
. Nos recupera los términos que se encuentran próximos en el texto. - Búsqueda especializada o por campos: El sistema permite discriminar la búsqueda a partir del título, la fecha, el idioma, etc.
- Búsqueda semántica: En sistemas más complejos, al introducir un término, el buscador es capaz de recuperar a partir de términos vinculados.
Por último, hay dos tipos de tasas que nos permiten evaluar la recuperación de la información:
- La tasa de precisión (documentos relevantes recuperados / documentos recuperados).
- La tasa de llamada (documentos relevantes recuperados / documentos relevantes).
Métodos y Herramientas de Búsqueda en la Web
El buscador es la clave de la recuperación de información en Internet. Su funcionamiento es parecido al de una base de datos, no obstante, la cantidad de información y su diversidad hace más compleja la recuperación de información. Podemos distinguir tres tipos de buscadores:
- Buscadores generalistas: Intentan abarcar toda la web y funcionan a partir de formularios sencillos de búsqueda.
- Buscadores especializados: Orientados a un tipo concreto de información, de contenido, etc. Algunos se especializan en el soporte, otros en el tipo de documento. En algunos casos, son desarrollos de los generalistas.
- Metabuscadores: Aprovechan el sistema de búsqueda de otros buscadores.
Otros sistemas de búsqueda y acceso a la información son:
- Los agentes de búsqueda: Programas informáticos que trabajan en local y tienen alta capacidad de recuperación.
- La sindicación de contenidos: A través de programas y plataformas, nos permite estar actualizados constantemente.
Cualquiera de estos instrumentos puede ser evaluado en función de criterios como:
- Cobertura: Información a la que potencialmente pueden acceder.
- Flexibilidad y adaptación: Capacidad de adaptarse a las necesidades de los usuarios.
- Interactividad y recuperación: Capacidad que tiene el sistema para relacionarse con el usuario y su capacidad de recuperación.
Tipos y Elementos de las Bases de Datos
Una base de datos es un conjunto de datos almacenados en un soporte informático que se estructuran y organizan para que puedan ser organizados de diferentes modos. Una base de datos se compone de los siguientes elementos:
- Campos: Ángulos o puntos que estructuran y organizan los datos que tenemos.
- Valores de campo: Valores que influyen en cada campo y que pueden ser de distintos tipos (textuales, numéricos, etc.).
- Registro: Conjunto de campos y valores de campo relacionados y vinculados con una cosa, un objeto, persona o institución.
- Entidad: Persona, objeto, cosa o institución a la que hace referencia un registro.
Con respecto a la base o tipo de base de datos, podemos diferenciar dos grandes tipos:
- Bases de datos relacionales: Se presentan en forma de tablas. Tienen información estructurada, con una capacidad media de recuperación y con una presencia alta de valores numéricos.
- Bases de datos documentales: Su estructura es más flexible, tienen una capacidad más alta de recuperación y suelen tener mayor nivel de información textual. Hay dos tipos diferentes:
- Las bases de datos referenciales: No incluyen la información original, solo la referencia a los documentos.
- Las bases de datos fuente: Incluyen el documento original y pueden ser documentos científicos, sonoros, una fotografía, etc.
Creación y Aplicación de las Bases de Datos
Una base de datos pasa por distintas fases en su creación:
- Estudio de viabilidad: Se analizan los recursos humanos, económicos y materiales de los que se dispone para determinar el futuro del proyecto. También se tiene en cuenta si existe una necesidad social o empresarial para la base de datos.
- Toma de decisiones sobre el contenido: Se analiza con detenimiento el tema, el tipo de información con la que se va a trabajar, la temática, etc.
- Toma de decisiones sobre la estructura: Se deciden los campos y los tipos de valores de campo de la base de datos. De igual modo, se tomará en consideración el software que se va a emplear y los campos que serán recuperables.
- Evaluación: Se evalúa el funcionamiento de la base de datos. Se estudiará la cantidad y calidad de la información, la eficiencia de la recuperación, etc.