Técnicas de indexación y recuperación de documentos utilizando referencias geográficas y textuales

  1. Seco, Diego
Dirixida por:
  1. Miguel Rodríguez Luaces Director
  2. José Ramón Ríos Viqueira Director

Universidade de defensa: Universidade da Coruña

Fecha de defensa: 23 de setembro de 2009

Tribunal:
  1. José Miguel Toro Bonilla Presidente/a
  2. Nieves R. Brisaboa Secretario/a
  3. Antonio Corral Liria Vogal
  4. Javier Nogueras Iso Vogal
  5. Francisco Javier Rodríguez Martínez Vogal

Tipo: Tese

Teseo: 281045 DIALNET lock_openRUC editor

Resumo

Internet y la World Wide Web se han convertido en un enorme repositorio de información que consultan diariamente millones de usuarios, Además, otros repositorios de información, como las bases de datos documentales o las bibliotecas digitales, también han aumentado su popularidad considerablemente. Esto ha provocado que la recuperación de información se haya convertido en una de las áreas de investigación más importantes dentro de la informática. Aunque estos repositorios contienen información de distinta naturaleza, la información más común es de tipo textual. A menudo, en el texto de un documento se pueden encontrar referencias geográficas que permiten asignar a ese documento una zona del espacio en la cual es relevante. Los usuarios de los sistemas que enumerábamos demandan cada vez más servicios que les permitan situar la información recuperada en un mapa. Además, también está aumentando el interés en consultas que permitan recuperar documentos relevantes no sólo para un tema determinado sino también para una zona determinada. El desarrollo de arquitecturas de sistemas, estructuras de indexación y otros componentes que permitan satisfacer estas necesidades es el objetivo principal de una nueva área de investigación denominada recuperación de información geográfica (GIR). En esta tesis abordamos varios problemas de interés en el área. En primer lugar, las estructuras de indexación que permiten recuperar documentos empleando tanto su ámbito textual como su ámbito espacial no tienen en cuenta la naturaleza jerárquica del espacio geográfico ni las relaciones topológicas entre los objetos espaciales que indexan. Por tanto, nuestro primer objetivo es desarrollar una estructura que solucione los problemas causados por estas limitaciones. Esta estructura constituye la base de la arquitectura para sistemas GIR que proponemos como segundo objetivo de la tesis. Estudiamos las limitaciones de las arquitecturas de los sistemas GIR propuestos hasta la fecha y proponemos una arquitectura genérica, modular y extensible. Además desarrollamos un prototipo de sistema basado en dicha arquitectura. Finalmente, como tercer objetivo de esta tesis proponemos una estructura para indexar objetos geográficos optimizada para las características de la información que se maneja habitualmente en sistemas GIR.