ANEXO: Roadmap de Publicação de Dados Abertos
1. PREPARAÇÃO
O QUE FAZER? | COMO FAZER? | ARTEFATOS | METADADOS |
---|---|---|---|
Identificar demandas de dados | 1. Interagir com potenciais consumidores por meio de entrevistas ou consultas públicas 2. Analisar solicitação de acesso à informação 3. Avaliar portais corporativos ou outras fontes de disseminação de dados |
Plano de demandas de dados | Identificação dos dados |
Identificar conjuntos de dados em potencial | 1. Agrupar as demandas que dizem respeito a itens de dados similares em um mesmo conjunto de dados | Lista de conjuntos de dados | Descritivos |
Definir a prioridade dos conjuntos de dados a serem abertos | 1. Definir a prioridade de abertura de cada conjunto de acordo com o número de solicitantes de cada demanda | Lista de prioridades para abertura |
2. CRIAÇÃO
O QUE FAZER? | COMO FAZER? | ARTEFATOS | METADADOS |
---|---|---|---|
Modelagem do conjunto de dados | 1. Avaliar as propriedades de cada demanda associada ao conjunto de dados para definir a estrutura do conjunto como um todo 2. Agrupar as propriedades semelhantes, eliminar propriedades redundantes |
Esquema inicial do conjunto de dados | Estruturais |
Identificar fontes de dados de origem | 1. Avaliar sistemas e documentos existentes a fim de identificar a fonte de origem dos dados | Lista de fontes de dados de origem | Proveniência |
Mapeamento entre as fontes de origem e o conjunto de dados | 1. Estabelecer a correspondência entre as propriedades do esquema do conjunto de dados e as propriedades das fontes de dados de origem | Documento de mapeamento entre fonte de dados de e conjunto de dados | Descritivos |
Identificar dados sensíveis | 1. Consultar especialistas ou legislação correspondente para identificação de dados sensíveis | Lista de dados sensíveis | |
Identificar vocabulários | 1. Avaliar o uso de vocabulários conhecidos (ex: dcterms, foaf, schema.org) na definição das propriedades do conjunto de dados 2. Fazer busca em respositórios de vocabulários para identificar vocabulários adequados para o domínio |
Lista de vocabulários a serem usados no esquema do conjunto | |
Mapeamento entre os vocabulários e o esquema do conjunto de dados | 1. Estabelecer a correspondência entre as propriedades do esquema do conjunto de dados e os termos dos vocabulários previamente escolhidos | Documento de mapeamento entre o esquema e vocabulários | |
Definir estratégia de extração dos dados | 1. De acordo com o tipo de fonte de dados (ex: banco de dados, planilha, documento de texto), especificar a forma de extração dos dados | Plano de extração de dados | Proveniência |
Definir subconjuntos de dados | 1. Caso o volume de dados seja muito grande, definir possíveis conjuntos de dados 2. A divisão dos subconjuntos pode ser feita com base em algum atributo temporal ou espacial, por exemplo. Outros atributos mais específicos também podem ser usados |
Lista de subconjuntos de conjuntos dados | |
Gerar distribuições | 1. Aplicar estratégia de extração previamente definida e gerar as distribuições de dados desejadas | Distribuições do conjunto de dados | Descritivos das distribuições |
3. AVALIAÇÃO
O QUE FAZER? | COMO FAZER? | ARTEFATOS | METADADOS |
---|---|---|---|
Avaliar a qualidade dos dados | 1. Definir critérios de qualidade a serem avaliados (ex: completude, corretude, atualidade) 2. Definir métricas para avaliação dos critérios 3. Definir requisitos mínimos para cada critério de qualidade 4. Avaliar os critérios de qualidade de forma manual ou automática |
Documento de qualidade dos dados | Qualidade dos dados |
Liberar dados para publicação | 1. Preencher documento de liberação do conjunto de dados | Documento de liberação do conjunto de dados | Descritivos |
Retornar conjunto de dados para a fase de criação | 1. Preencher documento de retorno à fase de criação com devida justificativa e descrição de melhorias necessárias | Documento de retorno à fase de criação |
4. PUBLICAÇÃO
O QUE FAZER? | COMO FAZER? | ARTEFATOS | METADADOS |
---|---|---|---|
Publicar conjunto de dados em uma ferramenta de catalogação de dados | 1. O procedimento pode variar de acordo com a ferramenta utilizada. Em geral, é necessário fazer o upload dos arquivos das distribuições e dos metadados do conjunto de dados 2. Preencher todos os metadados solicitados e, se necessário, acrescentar novos metadados |
Conjunto de dados disponível para acesso e download na ferramenta de catalogação | Descritivos, Versionamento |
Publicar conjunto de dados em uma página HTML | 1. Criar a página HTML tanto na versão para o consumo humano quanto para ser processada pela máquina 2. Inserir tags RDFa no código HTML com as informações semânticas para o processamento pela máquina |
Conjunto de dados disponível para acesso e download em uma página HTML | Descritivos, Versionamento |
Desenvolver API de acesso aos dados | 1. Criar API que permita o acesso aos conjuntos de dados 2. Criar documentação da API |
Conjunto de dados disponível para acesso e download por meio de uma API e documentação da API | Descritivos, Versionamento |
Estabelecer canal de comunicação com os consumidores de dados | 1. O canal de comunicação dependerá da forma como o conjunto de dados foi publicado. Caso a ferramenta usada não ofereça um canal de comunicação, crie uma página HTML | Página de contato | Uso dos dados |