Make your own free website on Tripod.com

Motores de recuperacion de documentos XML/RDF - Recuperacion y Organizacion de la Informacion

Motores de recuperacion de documentos XML/RDF Recuperacion y Organizacion de la Informacion

 ::--Wikipedia--:: 


SWoogle y Futuro

Futuro del uso de la Web Semántica

La Web semántica es sin duda la tecnología casi presente y del futuro que van a utilizar todos los motores de búsquedas venideros. En nuestros días se utiliza un porcentaje ínfimo de todo el potencial que nos aporta la Web semántica

Con vistas a un futuro se están desarrollando aplicaciones que intentan transferir una parte significativa de la carga del proceso del servidor al cliente Web con un subprograma Java que se insertará en el PC del cliente. Esta carga hará que muchas de las funciones de modificación puedan desarrollarse desde el mismo navegador Web del cliente. Por ejemplo, dentro de una intranet con una aplicación de gestión bibliotecaria sobre los documentos disponibles en el centro bibliotecario. Se establecerán categorías específicas como los datos de la ficha catalográfica, fecha de préstamo, fecha de devolución, nombre del usuario, número de registro, etc. Todos estos ítems se pueden agrupar por categorías y estarán descritos externamente desde los "esquemas" (schemas) o los RDF del XML. Permite actualizarse en el acto y con la posibilidad interactiva por parte del usuario en el pedido, gestión y modificación de documentos desde su lejano navegador. El lado más negativo es que se necesitará mayor ancho de banda y mayor potencia del procesador del equipo para poder soportar esta arquitectura de tres-niveles.

Una de las ventajas de combinar XML y RDF, es la especificación y recuperación (acceso) a la información que presenta una página Web. Aunque existen diferentes estándares para este fin, el sistema es siempre el mismo: una página Web, utilizando uno de los formatos disponibles, publica un feed o resumen de la información que contiene, de manera que el usuario pueda acceder a ellos, por ejemplo, de forma automática mediante un programa lector.

Uno de los formatos disponibles hoy en día es RSS; dicho acrónimo se utiliza para los siguientes estándares:

  • Rich Site Summary (RSS 0.91; versión anticuada)
  • RDF Site Summary (RSS 0.9 y 1.0)
  • Really Simple Syndication (RSS 2.0)

También existe Atom que es un formato basado en XML muy similar a RSS. Nació de la mano de Google o IBM, entre otras, con la intención de ofrecer una API y formato de sindicación más flexibles. Actualmente su última versión es Atom 1.0 publicada en Junio del 2005.

Otros usos interesantes de los documentos XML/RDF son FOAF ó SKOS :

  • FOAF es una aplicación de archivos XML/RDF para describir personas, documentos, etc (aunque es su uso en la descripción de personas el más interesante en la actualidad). Dicha descripción se realiza en un documento y contiene información sobre las amistades que tiene, los proyectos que está realizando y otros muchos datos, de forma que se pueden crear sistemas que generen mapas con la información de las personas que viven en cada uno de los sitios (FOAF People Map) ó aplicaciones que permitan ver toda la información relatica a un usuario y formar una red con las conexiones de amistad entre ellos (foafnaut!).
  • - SKOS-Core es un schema RDF para la representación de tesauros y sistemas similares de organización de conocimiento en el entorno de la web semántica; es un modelo que permite la migración de los tesauros hacia la web semántica y, además, la construcción de esquemas de conceptos simples para su utilización en la Web.

SWoogle2006

En la actualidad, y ya disponible en la dirección Web: http://swoogle.umbc.edu/, SWoogle es la herramienta que utilizando las ventajas de la Web Semántica es accesible por cualquier usuario de Internet.

Swoogle es un sistema de indización y recuperación para Documentos de la Web Semántica, lo que se denomina en SWoogle (SWDs, Semantic Web Documents), o lo que es lo mismo documentos escritos básicamente en RDF y OWL, aunque también DAML en algunos casos. Este buscador recupera, procesa, analiza e indiza documentos SW que estén disponibles online, pero lo más curioso es que lo hace a través de un sistema de búsqueda y resultados de interfaz Web similar a Google.

El grupo de trabajo de la Universidad de Maryland que ha desarrollado este proyecto eBiquity, parte de la base de que Google ha cambiado la forma en que accedemos a la información Web y que se ha convertido en una tecnología clave para la búsqueda de información. Por ello, SWoogle, en vez de crear una alternativa semántica a Google, crea un Google para la Web Semántica, lo cual me parece, tanto desde un punto de vista estratégico, como operativo en términos de funcionamiento y aceptación, brillante.

La nueva versión de SWoogle tiene un modelo y una base más simple que la anterior, y hasta un diseño mucho más claro. Recoge más de 850K de documentos Web semánticos recolectados de la Web, bien buscando directamente en ficheros RDF y OWL o a través de páginas Web (HTML) que pueden contener documentos SW. Más de 10.000 ontologías disponibles en la Web (1.0, y 2.0), almacenadas (de momento, no en triples) en una base de datos MySQL en forma de URIs, pero también permite buscar en los términos de cada vocabulario/esquema/ontología. Por ejemplo, podemos buscar todos los esquemas que contienen la propiedad title.

Ahora mismo, SWoogle es una herramienta utilísima para los desarrolladores de la Web semántica y para los agentes de software basado en estas tecnologías:

  • Para estudiar la magnitud y el crecimiento de la Web semántica
  • Para recopilar y buscar clases y propiedades (términos de la Web Semántica, SWTs) o las ontologías en que se conforman
  • Para apoyar herramientas de carácter semántico.

Hasta hace muy poco tiempo las herramientas semánticas, me refiero a editores de ontologías o herramientas para la creación de esquemas de metadatos, habían sido de acceso libre como Protégé o las aplicaciones de MindSWap (SWOOP y SMORE) y/o pertenecientes a proyectos en desarrollo. Sin embargo, también a principios de este año, la famosa compañía Altova (los creadores de XMLSpy) han lanzado SemanticWorks un editor de vocabularios que trabaja tanto con RDF y XML como con N-triples.

SWoogle es una herramienta para medir, controlar y analizar los vocabularios de la Web semántica u Ontologías (A efectos de SWoogle tenemos que considerar el Dublin Core o FOAF como una Ontología). Aún no es un buscador dirigido al usuario final para encontrar recursos Web, sino que es más bien un parabuscador para buscar, clasificar e incluso validar documentos y vocabularios de la Web Semántica.

© 2006 RaI - UC3M