A logical model of information retrieval based on propositional logic and belief revision
- Álvaro Barreiro García Doktorvater/Doktormutter
Universität der Verteidigung: Universidade da Coruña
Fecha de defensa: 27 von September von 2001
- José Mira Mira Präsident/in
- Ramón Pérez Otero Sekretär/in
- José Luis Freire Nistal Vocal
- Fabio Crestani Vocal
- Mounia Lalmas Vocal
Art: Dissertation
Zusammenfassung
En esta tesis se propone un modelo lógico para modelar el problema de Recuperación de Información RI, A partir un formalismo básico se han formalizado varias tareas clásicas de RI, estudiado sus costes comptuacionales y propuesto implementaciones eficientes. En todos los pasos se ha enfatizado al ventajas del uso de una aproximación lógica. La flexibilidad representacional de la lógica ha permitido la creación de un marco homogéneo donde se modelan distintos elementos involucrados en el problema de RI. Primeramente se ha modelado el problema básico de RI dentro de un formalismo lógico. Seguidamente se ha definido una implementación eficiente para el modelo propuesto. Esta implementación ha permitido la evaluación del modelo con colecciones de prueba estándar en RI. Estos experimentos permiten valorar cuantitativamene el rendimiento del modelo teórico propuesto. A continuación el modelo se ha extendido para manejar situaciones de recuperación y para modelar el proceso de relevance feedback. Esto permite mostrar que un marco formal puede manejar extensiones de forma homogénea. Por último, las nociones de similaridad entre términos y frecuencia inversa en documentos han sido incluidas en el modelo. Estas últimas extensiones han sido acompañadas de sus correspondientes tests de evaluación. Las principales aportaciones de esta investigación son las siguientes. Primero, el modelo teórico propuesto ha sido implementado y evaluado, asegurando su aplicabilidad real. De hecho, muy pocas aproximaciones lógicas a RI han sido implementadas y evaluadas. El modelo básico puede representar vectores clásicos con pesos binarios y, además, nuestra medida de relevancia se corresponde con la medida clásica del producto interno consulta-documento. De esta forma, hemos formalizado tareas clásicas como casos dentro del modelo. Sin embargo, el modelo propuesto es inherentemente más expresivo que los formalismos clásicos.