miércoles, 21 de diciembre de 2011

INTRODUCCIÓN A XML

INTRODUCCIÓN, CARACTERÍSTICAS Y HERRAMIENTAS DE EDICIÓN

XML es un metalenguaje que nos permite definir lenguajes de marcado adecuados a usos determinados.
Aunque a primera vista, un documento XML puede parecer similar a HTML, hay una diferencia principal. Un documento XML contiene datos que se autodefinen, exclusivamente. Un documento HTML contiene datos mal definidos, mezclados con elementos de formato. En XML se separa el contenido de la presentación de forma total.


Como herramientas de edición tenemos, por ejemplo, XML Editor, herramienta libre para la edición tanto de ficheros XML como de DTD.

DOCUMENTOS XML BIEN FORMADOS.

Estructura jerárquica de elementos: los documentos XML deben seguir una estructura estrictamente jerárquica con lo que respecta a las etiquetas que delimitan sus elementos. Una etiqueta debe estar correctamente incluida en otra. Además, los elementos con contenido deben estar correctamente cerrados.

Etiquetas vacías: XML permite etiquetas vacías, pero la etiqueta debe tener la siguiente forma:

Un solo elemento raiz: sólo se permite un elemento raíz, del que todos los demás sean parte.

Valores de atributos: los valores de atributos siempre deben estar encerrados en comillas simples o dobles.

Tipo de letra, espacios en blanco: XML es sensible al tipo de letra utilizado (trata las mayúsculas y las minúsculas como caracteres diferentes.

Nombrando cosas: al utilizar XML, es necesario asignar nombres a las estructuras, tipos de elemenntos, entidades... En XML los nombres tienen algunas características en común:
· Según las especificación XML 1.0 - Un nombre [empieza] con una letra o uno o más signos de puntuación y [continua] con letras, dígitos, guiones, rayas, dos puntos o puntos, denominados de forma global como caracteres de nombre. Los nombres que empiezan con la cadena "xml" se reservan para la estandarización de esta o de futuras versiones de esta especificación.

Resumiendo, no se pueden crear nombres que empiecen con la cadena "xml", "xMl", "XML" o cualquier otra variante. Las letras y rayas se pueden usar en cualquier parte de nombre. También se pueden incluid dígitos, guiones y caracteres de punto, pero no se puede empezar por ninguno de ellos. el resto de caracteres, como algunos símbolos, y espacios en blanco, no se pueden usar.

Marcado y datos: las construcciones como etiquetas o declaraciones se denominan "marcas". Éstas son las partes del documentos que el procesador XML espera entender. El resto del documentos que se encuentra entre las marcas son son los datos que resultan entendibles por las personas. Es sencillo reconocer las marcas en un documento XML. Son aquellas que empiezan con "<" y acaban con ">", o bien, en el caso de las referencias de entidad, empiezan por "&" y acaban con ";".

ESTRUCTURA Y SINTAXIS.

Prólogo:

Aunque no es obligatorio, los documentos XML pueden empezar con unas líneas que describen la versión XML, el tipo de documento y otras cosas.
El prólogo de un documento XML contiene:
Una declaración XML. Es la sentencia que declara al documento como un documento XML.
Una declaración de tipo de documento. Enlaza el documento con su DTD (definición de tipo de documento), o el DTD puede estar incluido en la propia declaración o ambas cosas al mismo tiempo.
Uno o más comentarios e instrucciones de procesamiento.

Cuerpo:

A diferencia del prólogo, el cuerpo no es opcional en un documento XML, el cuerpo debe contener solo un elemento raíz, característica indispensable también para que el documento esté bien formado. Sin embargo es necesaria la adquisición de datos para su buen funcionamiento.

Elementos:

Los elementos XML pueden tener contenido (más elementos, caracteres o ambos), o bien ser elementos vacíos.

Atributos:

Los elementos pueden tener atributos, que son una manera de incorporar características o propiedades a los elementos de un documento. Deben ir entre comillas.
Por ejemplo, un elemento «estudiante» puede tener un atributo «Mario» y un atributo «tipo», con valores «come croquetas» y «taleno» respectivamente.
Ejemplo: Esto es un día que Mario va paseando…

Entidades predefinidas:

Entidades para representar caracteres especiales para que, de esta forma, no sean interpretados como marcado en el procesador XML.
Ejemplo: entidad predefinida: & carácter: &.