34 Formato XML

El XML es un lenguaje de marcado, al igual que el HTML (utilizado para programar páginas Web), definido y mantenido por el World Wide Web Consortium (W3C). El objetivo del XML se enfoca en la simplicidad, generalidad y usabilidad por parte de toda la Internet. Aunque el XML apunte en particular a la generación de documentos, también se lo utiliza para representar estructuras de datos arbitrarias, apuntando a su integración entre sistemas de computadores. Un típico archivo XML cuenta con la siguiente estructura:

<?xml version="1.0" encoding="UTF-8"?>
<Exemplo>
  <Localidade número="1">
   <Continente>áfrica</Continente>
   <País>Angola</País>
   <Capital>Luanda</Capital>
  </Localidade>
  <Localidade número="2">
   <Continente>América do Norte</Continente>
   <País>Estados Unidos</País>
   <Capital>Washington DC</Capital>
  </Localidade>
  <Localidade número="3">
   <Continente>América Central</Continente>
   <País>México</País>
   <Capital>Cidade do México</Capital>
  </Localidade>
  <Localidade número="4">
   <Continente>América do Sul</Continente>
   <País>Brasil</País>
   <Capital>Brasília</Capital>
  </Localidade>
  <Localidade número="5">
   <Continente>Europa</Continente>
   <País>Espanha</País>
   <Capital>Madri</Capital>
  </Localidade>
  <Localidade número="6">
   <Continente>Europa</Continente>
   <País>Alemanha</País>
   <Capital>Berlim</Capital>
  </Localidade>
  <Localidade número="7">
   <Continente>Oceania</Continente>
   <País>Austrália</País>
   <Capital>Camberra</Capital>
  </Localidade>
  <Localidade número="8">
   <Continente>ásia</Continente>
   <País>Japão</País>
   <Capital>Tóquio</Capital>
  </Localidade>
</Exemplo>

Marcadores y contenido

Un archivo XML posee dos características principales: marcadores y contenido. Generalmente, las secuencias de caracteres que comienzan con < y terminan con >, o comienzan con & y terminan con ; son llamadas "marcadores". Las secuencias de caracteres que no son marcadores, son consideradas como "contenido". En el ejemplo de arriba, <Localidad> y <Continente>, por ejemplo, son marcadores. Los nombres de los países y sus capitales son "contenido".

Tags

Los tags o etiquetas son aquellos marcadores que comienzan con > y termina con <. Existen tres tipos de tags:

tags de inicio; por ejemplo: <Localidad>

tags de cierre; por ejemplo: </Localidad>

tags de elemento vacío; por ejemplo: <line break />

Elementos

Los elementos son componentes del XML que comienzan con un tag de inicio y terminan con un tag de cierre correspondiente, o bien consisten sólo en un tag de elemento vacío. La secuencia de caracteres entre los tags de inicio y cierre, si existieren, son el contenido del elemento y pueden incluir marcadores, además de otros elementos, llamados "hijos". En el ejemplo de arriba, Brasil constituiría un elemento.

<País>Brasil</País>.

Atributos

Los atributos son pares de "nombre/valor" que existen dentro del tag de inicio o de elemento vacío. En el ejemplo de arriba, el elemento <Localidad> posee un atributo "número" y un valor correspondiente:

<Localidad número="8">

El nombre del atributo es "número" y su valor es "8". Los atributos sólo pueden presentar un valor entre comillas, y cada atributo no puede aparecer más de una vez en cada elemento.

Declaración XML

Los documentos XML deben comenzar declarando alguna información sobre sí mismos, como en el ejemplo:

<?xml version="1.0" encoding="UTF-8"?>