2. O que são "Dados Abertos"?

"Dados abertos" é um termo que ganhou popularidade no movimento de transparência e governo aberto em todo mundo, mas nem sempre é tratado com clareza. A abertura de dados segue o mesmo princípio do Governo Aberto: tratar o acesso à informação pública como regra, não como exceção. No âmbito deste guia, os "dados" que aqui se referem são as informações produzidas por todos os órgãos públicos no estado de São Paulo, fruto da atividade administrativa da gestão governamental: seus contratos, suas funções, seus projetos, suas políticas e suas parcerias com outros setores. Em suma, todos os dados que estão sob a guarda do governo estadual ou de entes ligados a ele.

A abertura desses dados quer dizer que essas informações governamentais podem ser utilizadas livremente, reutilizadas e redistribuídas por qualquer pessoa, sem qualquer restrição — a exceção seria, no máximo, a indicação da fonte da base de dados e a redistribuição dessas informações sob as mesmas condições, ou licenças, em que elas foram adquiridas originalmente.

Para que um conjunto de dados possa ser considerado "aberto", ele precisa reunir, no mínimo, as três características abaixo:

  • Disponibilidade e acesso: os dados precisam estar disponíveis de forma completa e de uma forma que não gere cursos exorbitantes para a parte interessada em copiá-los. O cenário mais favorável é disponibilizar os dados para que sejam baixados por meio da Internet. Os dados também precisam estar disponíveis num formato conveniente e modificável.
  • Reutilização e redistribuição: os dados devem ser disponibilizados a partir de termos de utilização que permitam o reuso e a redistribuição, inclusive a mistura desses dados com outras bases.
  • Participação universal: qualquer pessoa deve poder usar, reutilizar e redistribuir os dados. Não deve haver discriminação contra campos de atuação, indivíduos ou grupos. Por exemplo, restrições "não comerciais" que impediriam o uso "comercial" dos dados, ou restrições de uso para um fim específico (por exemplo, só para pesquisa pessoal), não são permitidas.

Essas três caracteristicas são resumidas em três "leis" sugeridas pelo ativista dos dados abertos David Eaves:

  1. Se o dado não pode ser encontrado ou indexado na Web, ele não existe;
  2. Se o dado não está disponível num formato aberto e legível por máquina, ele não pode ser reutilizado;
  3. Se dispositivos legais não permitem que ele seja compartilhado, ele não é útil.

Existem muitos motivos para se ter tanta clareza sobre o significado de "dados abertos". Por se tratarem de palavras com significado amplo, é preciso demarcar exatamente quais características são consideradas ideais no escopo deste guia, de modo que as informações publicadas pelo governo possam ser utilizadas por todos os setores da sociedade de forma compatível.

A abertura de bases com as características descritas acima é relevante pois dá condições para a interoperabilidade, ou seja, o trabalho em conjunto de diferentes bases de dados, por diferentes atores da sociedade. A construção de sistemas e soluções cada vez melhores, sejam aquelas desenvolvidas na esfera governamental, na privada, na acadêmica ou na sociedade civil, dependem da interoperabilidade das bases de dados.

A clareza sobre a definição de "dados abertos" também garante que duas ou mais bases de dados vindas de fontes diferentes possam ser combinadas sem grandes empecilhos técnicos. Evita, dentre outras coisas, que o governo seja um grande armazém de bases de dados "fechadas", ou seja, que não servem senão para a consulta humana, inúteis para aplicação em sistemas maiores e complexos, capazes de proporcionar soluções, visualizações, serviços ou valor para qualquer cidadão ou grupo da sociedade.