Make your own free website on Tripod.com

Motores de recuperacion de documentos XML/RDF - Recuperacion y Organizacion de la Informacion

Motores de recuperacion de documentos XML/RDF Recuperacion y Organizacion de la Informacion

 ::--Wikipedia--:: 


Motores de recuperacion de documentos XML/RDF

Hoy en día los buscadores Web son utilizados por la mayoría de los internautas. ¿Quién no ha oído hablar de Google, Yahoo o MSN? Estos buscadores funcionan mediante motores de búsquedas, los cuales recuperan información de la Web mediante distintos mecanismos.

El problema de los buscadores de Internet actuales como Google, se basan en un sistema en el que los usuarios meten manualmente los enlaces y al hacer una búsqueda se aplica un algoritmo de emparejamiento de patrones, que tiene en cuenta el número de veces que se hace referencia a cada URL candidata a ser resultado de búsqueda. Aunque su utilidad no se puede negar, y ha hecho que se cambie la forma de buscar información, también estamos hartos de realizar búsquedas en el que se pida un determinado tema y el buscador nos devuelva muchísimas respuestas que no solucionan nuestra petición.

La Web semántica nos permitirá hacer búsquedas muy precisas teniendo en cuenta diferentes parámetros. Por ejemplo, se podrá buscar una reserva de hotel en una determinada zona, para unas fechas concretas, dónde la habitación tenga un número determinado de camas, etc. Podemos pensar que este tipo de selecciones las podemos realizar actualmente, y es cierto, ya que mediante los sistemas multiagente se consiguen estos resultados. Un agente es una entidad de software que funciona continua y autónomamente en un medio particular a menudo habitado por otros agentes y procesos, sin requerir de guía constante o intervención humana. Los sitemas multiagentes se han propuesto como la mejor herramienta para realizar aprendizaje automático en Internet. Mediante esta herramienta es posible hacer recomendaciones acertadas del tipo "pincha en este sitio Web, pues me parece que te interesa" o "esta persona tiene intereses muy similares a los tuyos, te interesaría contactar con ella" y esto lo hará software puro y duro, sin más intervención humana que la de la propia acción del usuario y acertarán. También será posible clasificar automáticamente sitios o documentos de una manera acertada y un montón de más cosas que ni siquiera nos imaginamos.

El problema con el que ahora se topa la tecnología de sistemas multiagente es la volatilidad y desestructuración de la información base para realizar las inferencias. Volviendo al ejemplo del sistema multiagente para encontrar el viaje de tus sueños el único lugar desde el que puede recuperar la información son páginas html en forma de tablas. Éstas páginas pueden cambiar su estructura cada mes, lo que requiere cambios de programación.

Este problema se soluciona si la información se almacenada adecuadamente en una base de datos o en ficheros xml/rdf.

Para conseguir todo lo que se ha comentado es necesario una serie de estándares sobre la creación de documentos que contengan la información (XML) y también sobre la transmision de los datos en la web (RDF).

Actualmente se están desarrollando motores de búsquedas que utilizan las nuevas tecnologías como RDF, XML, etcétera, es decir, buscadores que aprovechen las ventajas que aporta la Web Semántica.

Se ha escrito mucho acerca de la Web Semántica, como si fuese una tecnología que fuese a reemplazar a la Web de hoy. "En realidad," contó Eric Miller, Líder de la Actividad de Web Semántica del W3C, "es más una Evolución que una Revolución Web". La Web Semántica se construye a través de cambios incrementales, llevando a los documentos y datos ya disponibles en la Web descripciones legibles por máquinas. XML, RDF y OWL permiten a la Web ser una infraestructura global para la compartición de datos y documentos, lo que también hace más fácil y fiable la búsqueda y reutilización de información."

La Actividad de Web Semántica del W3C se apoya en trabajo de otras Actividades del W3C, tales como la Actividad XML. Se concentra en desarrollar tecnologías estándar, encima de XML, que permitan el crecimiento de la Web Semántica.

© 2006 RaI - UC3M