34 Formato XML
El XML es un lenguaje de marcado, al igual que el HTML (utilizado para programar páginas Web), definido y mantenido por el World Wide Web Consortium (W3C). El objetivo del XML se enfoca en la simplicidad, generalidad y usabilidad por parte de toda la Internet. Aunque el XML apunte en particular a la generación de documentos, también se lo utiliza para representar estructuras de datos arbitrarias, apuntando a su integración entre sistemas de computadores. Un típico archivo XML cuenta con la siguiente estructura:
<?xml version="1.0" encoding="UTF-8"?>
<Exemplo>
 <Localidade número="1">
 <Continente>áfrica</Continente>
 <País>Angola</País>
 <Capital>Luanda</Capital>
 </Localidade>
 <Localidade número="2">
 <Continente>América do Norte</Continente>
 <País>Estados Unidos</País>
 <Capital>Washington DC</Capital>
 </Localidade>
 <Localidade número="3">
 <Continente>América Central</Continente>
 <País>México</País>
 <Capital>Cidade do México</Capital>
 </Localidade>
 <Localidade número="4">
 <Continente>América do Sul</Continente>
 <País>Brasil</País>
 <Capital>Brasília</Capital>
 </Localidade>
 <Localidade número="5">
 <Continente>Europa</Continente>
 <País>Espanha</País>
 <Capital>Madri</Capital>
 </Localidade>
 <Localidade número="6">
 <Continente>Europa</Continente>
 <País>Alemanha</País>
 <Capital>Berlim</Capital>
 </Localidade>
 <Localidade número="7">
 <Continente>Oceania</Continente>
 <País>Austrália</País>
 <Capital>Camberra</Capital>
 </Localidade>
 <Localidade número="8">
 <Continente>ásia</Continente>
 <País>Japão</País>
 <Capital>Tóquio</Capital>
 </Localidade>
</Exemplo>
Marcadores y contenido
Un archivo XML posee dos características principales: marcadores y contenido. Generalmente, las secuencias de caracteres que comienzan con < y terminan con >, o comienzan con & y terminan con ; son llamadas "marcadores". Las secuencias de caracteres que no son marcadores, son consideradas como "contenido". En el ejemplo de arriba, <Localidad> y <Continente>, por ejemplo, son marcadores. Los nombres de los países y sus capitales son "contenido".
Tags
Los tags o etiquetas son aquellos marcadores que comienzan con > y termina con <. Existen tres tipos de tags:
● tags de inicio; por ejemplo: <Localidad>
● tags de cierre; por ejemplo: </Localidad>
● tags de elemento vacío; por ejemplo: <line break />
Elementos
Los elementos son componentes del XML que comienzan con un tag de inicio y terminan con un tag de cierre correspondiente, o bien consisten sólo en un tag de elemento vacío. La secuencia de caracteres entre los tags de inicio y cierre, si existieren, son el contenido del elemento y pueden incluir marcadores, además de otros elementos, llamados "hijos". En el ejemplo de arriba,
<País>Brasil</País>.
Atributos
Los atributos son pares de "nombre/valor" que existen dentro del tag de inicio o de elemento vacío. En el ejemplo de arriba, el elemento <Localidad> posee un atributo "número" y un valor correspondiente:
<Localidad número="8">
El nombre del atributo es "número" y su valor es "8". Los atributos sólo pueden presentar un valor entre comillas, y cada atributo no puede aparecer más de una vez en cada elemento.
Declaración XML
Los documentos XML deben comenzar declarando alguna información sobre sí mismos, como en el ejemplo:
<?xml version="1.0" encoding="UTF-8"?>