24 Publicação

Com os dados em mãos, num formato aberto e com uma licença que permita a sua reutilização de forma livre, chegará a hora de publicar as bases na Web. Esse é um momento importante do Plano de Abertura de Bases e deve ser planejado com calma e diligência. A publicação depende de quantas estrelas o órgão interessado deseja conquistar com a abertura dos dados. Idealmente, uma publicação que visa a conseguir cinco estrelas no longo prazo deve se preparar desde o início para que os ajustes ao longo do caminho sejam suaves e previsíveis.

O melhor caminho para conquistar a abertura e interoperabilidade dos dados, no que diz respeito à sua viabilização de acesso na Web, é por meio de repositórios estruturados e planejados. Isso não quer dizer, necessariamente, que o órgão interessado deverá adquirir sistemas complexos de armazenamento de dados. Uma página simples da Web com uma lista bem estruturada de documentos pode servir como um bom repositório de dados, ou um catálogo, desde que alguns cuidados sejam tomados. A complexidade do sistema dependerá da quantidade de bases abertas e dos recursos, técnicos e humanos, de cada órgão.

A forma como essas informações serão organizadas deve ser convencionada com antecedência, com a participação de todos os atores envolvidos. De preferência entre órgãos que publicam dados correlacionados e podem publicar bases que têm o potencial de "conversarem" umas com as outras. Isso é importante para que todos tenham entendimento comum do significado dos dados que serão compartilhados.

O objetivo dessa organização é que toda a sociedade que tem o acesso à informação seja capaz de interpretar os dados de maneira uniforme, utilizando sistemas e plataformas de trocas de dados. Essa padronização prévia entre as partes ganha forma quando se publica na Web os nomes e definições dos elementos usados em forma partilhável e referenciável, independentemente do grau de apoio que se obteve.

Esse planejamento abre caminho para a construção de bases de dados cinco estrelas, independente dos aplicativos utilizados para organizá-los e publicá-los. Qualquer que seja a estratégia adotada, é importante incluir no planejamento os conceitos de alguns padrões:

URI: é um identificador de recursos que serve para identificar ou apontar para alguma coisa na Web.

Um URL é um URI que identifica um recurso e provê meios de agir sobre ele, obter e/ou representar este recurso, descrevendo seu mecanismo de acesso primário ou a localização na “rede”. Por exemplo, o URL http://www.w3c.br/ é um URI que identifica um recurso (Sítio do W3c Brasil) e representa este recurso (o HTML da página por exemplo) e está disponível via HTTP de um hospedeiro de redes chamado http://www.w3c.br.

RDF/XML: O XML <link para parte de formatos> é um formato padrão do W3Cpara a criação de documentos com dados organizados de forma hierárquica, como se vê, frequentemente, em documentos de texto formatados, imagens vetoriais ou bancos de dados.

SPARQL: o “sparkle“, também recomendado pelo W3C e aos cuidados dos grupos de Web Semântica do W3C é utilizado para buscar a informação independente do formato dos resultados.

Existem padrões para publicações de dados em formato aberto. É imprescindível que esses padrões estejam especificados e regulamentados também em normas ou qualquer outra recomendação governamental para possibilitar um ambiente interoperável em todos os domínios e-gov.