lunes, 15 de abril de 2013

Lenguaje XML

XML significa en Inglés eXtensible Markup Language y es un lenguaje de descripción de documentos que no incluye ninguna información relativa al diseño de éstos.

HTML (HyperText Markup Language) es el lenguaje de marcas (etiquetas) mas conocido y utilizado para la creación de páginas web que permite la navegación tipo hipertexto. Pero XML es mas que un lenguaje, es un metalenguaje que permite definir otros lenguajes de marcas con objetivos diferentes. Por ese motivo se le llama 'eXtensible'. Por lo tanto, XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes específicos. Un ejemplo de lenguaje que usa XML para su definición es XHTML (eXtensible, Hypertext Markup Language), nueva versión de HTML que cumple la especificación SGML y cuyo objetivo es sustituirlo como estándar de páginas web.

XML aparece en 1997 como un subconjunto de SGML (Structured Generalized Markup Language, ISO 8879), lenguaje que permite especificar las reglas de etiquetado de documentos. XML es algo así como SGML simplificado. Una aplicación no necesita comprender SGML completo para interpretar un documento XML. Los editores SGML, sin embargo, pueden comprender XML.




El lenguaje de descripción de documentos SGML se creó con el objetivo de que los documentos electrónicos fuesen independientes de los formatos generados por los procesadores de texto y de los sistemas operativos. En sus orígenes sólo era utilizado en el ámbito universitario debido a su complejidad y a los costes de las herramientas necesarias para generar SGML.

Como ejemplo práctico de la utilidad de XML podemos decir que muchos portales y sitios de noticias están basados en XML, ya que su utilización permite estructurar la información y luego aplicar transformaciones para presentar dicha información. Es decir, la información estará almacenada en la base de datos del sitio, se exporta a XML y a partir de aquí se aplican las transformaciones necesarias para presentarla.

Otro ejemplo de utilización es la suite ofimática OpenOffice, basada totalmente en la utilización del formato XML. Es decir, todos los archivos se guardan en formato XML.

Por lo tanto y como resumen:

¿Qué es XML?
XML es un metalenguaje que permite definir lenguajes de marcado con objetivos determinados.

¿Para qué sirve XML?
XML permite representar información estructurada en la web (en forma de documentos), de modo que pueda ser almacenada, transmitida, procesada, presentada e impresa por diferentes tipos de aplicaciones y dispositivos.

Características de XML.
Las características mas importantes de XML son las siguientes:
  • Permite la creación de etiquetas propias y permite asignar atributos a las etiquetas.
  • Trabaja con los llamados DTDs (Definición de Tipo de Documento) que en realidad son archivos de texto cuyo contenido son las definiciones de las etiquetas y sus atributos con los que se puede trabajar en un determinado documento. Es decir, el DTD contiene la estructura de los datos.
  • Como consecuencia de los puntos anteriores, XML permite la creación de nuevos DTDs. Por ese motivo, entre otros, este metalenguaje se llama extensible.
  • En un documento XML la estructura y el diseño están completamente separados.
  • Cada documento XML se puede validar ante un DTD, y si no es posible, se puede declarar como documento 'bien formado'1.
  • XML se almacena en formato texto (no binario) lo cual hace que los documentos sean directamente entendibles. Es decir, los documentos tienen una estructura entendible tanto por los ordenadores como por las personas.
  • Cada documento incluye metadatos2 sobre sí mismo, lo cual facilita la tarea de los motores de búsquedas en la web, ya que devolverán respuestas más adecuadas y precisas.
  • Permite la exportabilidad a otros formatos de publicación de datos (HTML, PDF, texto enriquecido RTF, voz, etc).




  • XML es un estándar abierto no sujeto a ningún tipo de licencia (www.w3c.org).
  • XML permite la internacionalización, es decir puede trabajar con cualquier conjunto de caracteres, entre ellos el juego de caracteres UNICODE (utf-8).
  • XML utiliza reglas de generación concretas y, por tanto, los documentos son fácilmente procesables.
  • XML permite compartir información entre sistemas o fuentes de datos heterogéneas, por ejemplo, páginas web, distintas bases de datos, etc.
  • XML no es compatible con HTML, pero los documentos HTML v4.0 pueden ser convertidos a XML.
  • Se debe descartar la idea de que XML, al ser un lenguaje de marcas, se utiliza para la creación de páginas web.
Como vemos por las características descritas, las ventajas de la utilización del formato XML son muchas. Pero también tiene sus inconvenientes:
  • Al utilizar el formato texto los documentos ocupan mayor cantidad de espacio en disco para su almacenamiento. Aunque esto ya no es un gran problema debido al abaratamiento del hardware. Además permite compresión, con lo que se optimiza algo mas la ocupación en disco.
  • Ya que la estructura y el diseño están separados habrá que preparar el documento para su presentación. Existe un lenguaje de transformación especialmente diseñado para XML que es XSL que permite pasar documentos XML a otros formatos.
Espero les haya servido tanto como a mí, ampliando conocimientos sobre temas con los que nos vamos interactuando cada vez más.

Saludos!!!

Fuente:

3 comentarios:

  1. Hola! Muy completo tu post, me sirvió para saber un poco mas sobre el lenguaje XML ya que no me había interiorizado en este tema.
    Saludos!!!

    ResponderEliminar
  2. Muy buen post!!!! me gusta tu foma de redactar.
    Saludos!!!

    ResponderEliminar