Make your own free website on Tripod.com

Motores de recuperacion de documentos XML/RDF - Recuperacion y Organizacion de la Informacion

Motores de recuperacion de documentos XML/RDF Recuperacion y Organizacion de la Informacion

 ::--Wikipedia--:: 


Documentos XML/RDF

¿Qué es XML?

XML se trata de un lenguaje de definición de datos de carácter general utilizado para ofrecer una mayor cohesión en el intercambio de datos B2B (Business-to-bussines) o B2C (Business-to-consumer) y que permite la creación de nuevos lenguajes gracias a sus mecanismos de extensibilidad. Aunque ocasionalmente pueda utilizarse XML para definir formatos, de forma habitual se utiliza apoyado por una serie de lenguajes o tecnologías adicionales que sirven para proporcionar datos en pantalla o impresora.XML en Dublin Core

XML se trata de un nuevo lenguaje de marcado, derivado de SGML, pero mucho más moderno y preparado para la era de Internet.

XML es una forma de representar datos que han de circular por la red y por ello no está ligado necesariamente a su presentación en un navegador. Su uso puede ir más allá de la Red, e incluso de la propia informática, al tratarse de un metalenguaje. Este estándar responde a la necesidad de disponer formatos para describir diferentes tipos de contenidos de forma electrónica, para poder almacenarlos, procesarlos y transmitirlos. Sin entrar en aplicaciones específicamente informáticas, en múltiples campos es necesario disponer de notaciones que permitan describir contenidos.

XML está siendo aplicado en multitud de campos y para diversos fines: archivo electrónico y gestión de contenidos, publicaciones web, intercambio electrónico de documentos, formato interno de herramientas, software, comercio electrónico, educación, y tantos otros campos que sería imposible reflejar (algunos campos menos obvios son: química, biología, teología, turismo, derecho, sanidad,...). Y es que XML es un estándar no sólo para la Web, es un estándar que ha nacido en el mundo Web y que se utiliza dentro y fuera de su ámbito.

XML, es el estándar de Extensible Markup Language. XML no es más que un conjunto de reglas para definir etiquetas semánticas que nos organizan un documento en diferentes partes. XML es un metalenguaje que define la sintaxis utilizada para definir otros lenguajes de etiquetas estructurados. Es un subconjunto de SGML especializado en la gestión de información para la Web.

XML es un método para introducir datos estructurados en un fichero de texto. Cuando hablamos de datos estructurados, hablamos de cosas tales como hojas de cálculo, libretas de direcciones, parámetros de configuración, transacciones financieras, dibujos técnicos, etc. Los programas que producen esta clase de datos a menudo también los guardan en disco, por lo que pueden usar tanto un formato binario como un formato de texto. XML consiste en una serie de reglas, pautas, convenciones, para planificar formatos texto para tales datos, de manera que produzcan archivos que sean fácilmente generados y leídos (por un ordenador) que son inequívocos, y que evitan escollos comunes como la falta de extensibilidad, falta de soporte para la internacionalización o localismo, y la dependencia de una determinada plataforma.

Los archivos XML son archivos de texto porque permiten a los expertos depurar errores en las aplicaciones, más fácilmente, y en casos de emergencia, pueden usar un simple editor de texto para arreglar un archivo XML estropeado. Por ver un inconveniente, se puede hablar de que las reglas para los archivos XML son más estrictas que para los archivos HTML, ya que el olvido de una etiqueta, o un atributo sin comillas, hacen que el archivo sea inservible. En la especificación oficial de XML está escrito que no le está permitido a aplicaciones intentar justificar al creador de un archivo XML dañado; si el archivo está dañado, la aplicación debe detenerse inmediatamente y emitir un error.

Puesto que XML es un formato de texto y que usa etiquetas para delimitar los datos, los archivos XML son casi siempre comparablemente mayores que los formatos binarios. Pero está desventaja puede ser usualmente compensada en distintos niveles. Además el espacio en disco ya no es tan caro, y los programas como zip y gzip (gratis en varias plataformas) pueden comprimir archivos muy bien y muy rápidamente.


¿Qué es Resource Description Framework(RDF)?

Definición: esquema de descripción de recursos. Una de las aplicaciones más importantes que permitirá describir los datos de cada documento y definir las relaciones que hay entre los datos XML.RDF en Dublin Core

RDF es un estándar para realizar descripciones sencillas. XML es a la sintaxis, lo que RDF a la semántica - un conjunto claro de reglas para proporcionar información descriptiva sencilla. El Esquema RDF entonces proporciona un modo de combinar esas descripciones en un vocabulario único. RDF se integra en una variedad de aplicaciones incluyendo:

  • catálogos de biblioteca
  • directorios mundiales
  • sindicación y agregación de noticias, software y contenido
  • colecciones personales de música, fotos y eventos

En definitiva las especificaciones RDF proporcionan una infraestructura potente para el intercambio de conocimiento en la Web

RDF ofrece una estructura semántica inambigua (por el uso de los URI, Uniform Resource Identifier) que permite codificación, intercambio y procesamiento automático de los metadatos normalizados.

RDF proporciona también reglas para facilitar técnicamente la manera de explicar conceptos de modo que los ordenadores puedan procesarlo rápidamente y proporciona un medio que posibilita la edicición de vocabularios con propiedades definidas para la descripción de los recursos de una comunidad.

La sintaxis RDF define, de forma simple, el modelo para la descripción de recursos. Este modelo es fundamental para poder almacenar información de forma eficiente, procesarla automáticamente e intercambiar datos entre aplicaciones. Resumen sintaxis RDF

© 2006 RaI - UC3M