DADOS ABERTOS

Segundo a Open Knowledge International (OPEN KNOWLEDGE, 2012), Dado Aberto é qualquer dado que pode ser livremente utilizado, reutilizado e redistribuído por qualquer um. Assim, dados abertos consistem na publicação e disseminação de informações na Internet, compartilhadas em formatos abertos, legíveis por máquinas, e que possam ser livremente reutilizadas de forma automatizada pela sociedade. Assim, a abertura de dados está interessada em evitar um mecanismo de controle e restrições sobre os dados que forem publicados, permitindo que tanto pessoas físicas quanto jurídicas possam explorar estes dados de forma livre (ISOTANI; BITTENCOURT, 2015). Um dado é considerado aberto quando apresenta as seguintes características (OPEN KNOWLEDGE, 2012):

  1. Disponibilidade e acesso: o dado precisa estar disponível por inteiro. Deve estar num formato conveniente e modificável;
  2. Reúso e redistribuição: o dado precisa ser fornecido em condições de reúso e redistribuição podendo ser combinado com outros;
  3. Participação universal: todos podem usar, reusar e redistribuir o dado sem restrições de áreas, pessoas ou grupos.

Os dados abertos podem ser classificados de acordo com uma escala, baseada em estrelas, proposta por Tim Berners-Lee (BERNERS-LEE, 2006). Segundo essa classificação, apresentada na Figura 1, um dado publicado na Web em qualquer formato (imagem, tabela ou documento) e associado a uma licença que permita o seu uso e reúso sem restrições é avaliado como sendo 1 Estrela. Apesar de já ser um avanço, os dados com 1 Estrela precisam ser manipulados manualmente ou por meio de extratores construídos especificamente para o acesso aos dados.

Capa - Fundamentos para a publicação de dados na Web

A partir do momento em que os dados são publicados em um formato que pode ser processado automaticamente por algum software (por exemplo, planilhas Excel ao invés de uma imagem), os dados passam a ser classificados como 2 Estrelas. Por um lado, isso pode facilitar o trabalho do consumidor de dados, porém, por outro lado, pode tornar a tarefa de publicação um pouco mais complexa.

Os dados recebem a classificação de 3 Estrelas quando são publicados em formatos não proprietários (por exemplo, CSV ao invés de Excel). Novamente, a publicação de dados em formatos abertos pode trazer custos adicionais para os provedores. Isso acontece quando o formato de origem é diferente do formato adotado para a publicação, e requer a conversão dos dados, bem como a manutenção da consistência entre a fonte de dados original e os dados publicados em formato aberto.

A medida em que os dados recebem uma identificação única e podem ser conectados com outros dados, eles podem ser classificados como 4 Estrelas. A criação de links entre os dados permite que eles façam parte de uma rede maior de dados abertos e conectados (BIZER; HEATH; BERNERS-LEE, 2009). Finalmente, os dados abertos recebem a classificação 5 Estrelas se estiverem conectados com dados já disponíveis na Web. Nesse caso, é necessário identificar dados que representem o mesmo conceito a fim de estabelecer os links entre eles.

Seguindo o movimento dos dados abertos, governos de diversos países estão usando a Web como meio para publicação de dados e informações sobre suas administrações. Esses dados, denominados Dados Abertos Governamentais, podem ser facilmente encontrados nos chamados Portais de Dados Abertos, os quais oferecem uma interface mais amigável para catalogação e acesso aos dados. Como exemplos de portais de dados abertos já consolidados, destacam-se o portal dos EUA1 e o portal do Reino Unido2 . Diversos países na Europa, como França3 e Holanda4, bem como países na América Latina, como Chile5 e Uruguai6, também possuem portais de dados governamentais abertos. No caso do Brasil, o Portal Brasileiro de Dados Abertos7 foi lançado no início de 2012, e foi liderado pelo Ministério do Planejamento.


A iniciativa de abertura dos dados por parte dos governos foi impulsionada pela procura de transparência, de colaboração e de participação da sociedade/comunidade (GOLDSTEIN; DYSON, 2013). Com o intuito de chegar a um consenso dos requisitos necessários para se caracterizar uma base de dados abertos, o grupo de trabalho, Open Government Working Group, elaborou os oito princípios dos dados governamentais abertos (TAUBERER; LESSIG, 2007):

  • Completos: todos os dados devem estar disponíveis e não limitados. Um dado público é o dado que não está sujeito a limitações válidas de privacidade, segurança ou privilégios de acesso.
  • Primários: os dados devem estar em formato bruto, sem agregação ou modificação.
  • Atuais: os dados devem ser publicados tão rapidamente quanto necessário para preservar o seu valor.
  • Acessíveis: os dados devem ser acessíveis pelo maior número possível de usuários e para o maior número possível de finalidades.
  • Processáveis por máquinas: os dados devem ser razoavelmente estruturados para permitir processamento automatizado.
  • Não-discriminatórios: os dados devem ser disponíveis para todos, sem necessidade de cadastro.
  • Não-proprietários: os dados devem ser publicados em formato aberto sobre o qual nenhuma entidade tem controle exclusivo.
  • Licenças livres: os dados não devem estar sujeitos a nenhuma regulamentação de direitos autorais, patentes, propriedade intelectual ou segredo industrial. Restrições sensatas relacionadas à privacidade, segurança e privilégios de acesso podem ser permitidas.

Os dados abertos governamentais dizem respeito a assuntos diversos e podem envolver desde dados sobre despesas e receitas do governo até dados sobre censo escolar, pontos turísticos, reclamações de consumidores, demandas de serviços, entre outros. Em geral, os dados disponibilizados são provenientes de atividades rotineiras realizadas por órgãos governamentais, como ministérios e secretarias.

Uma vez que os dados governamentais sejam disponibilizados em formato aberto, espera-se que sejam usados no desenvolvimento de aplicativos que possam ser facilmente usados e acessados tanto por cidadãos comuns, bem como pelo próprio governo. Os aplicativos oferecem meios para análise dos dados, por meio de filtros, bem como permitem a visualização de dados de forma simples e criativa. Diversos aplicativos e visualizações já estão disponíveis na Web, os quais resultaram, principalmente, de concursos e hackathons promovidos para a divulgação e popularização dos portais de dados abertos.