CICLO DE VIDA DOS DADOS NA WEB
O processo de publicação e consumo de dados na Web envolve várias fases que vão desde a seleção e publicação dos dados até o uso dos dados e feedback sobre os dados utilizados. Esse conjunto de fases que compõem o processo de publicação e consumo dos dados é chamado de Ciclo de Vida dos Dados na Web. A Figura 3 apresenta as fases do ciclo de vida dos Dados na Web, as quais são brevemente descritas a seguir.
- Preparação: Esta fase se estende desde o momento em que surge a intenção de publicar os dados até a seleção dos dados que serão publicados. Vale lembrar que não existem regras que determinem a prioridade dos dados a serem publicados, porém é sempre importante levar em consideração a relevância dos dados, ou seja, dados que possuem um grande potencial de utilização deveriam ter prioridade no momento da escolha. Dessa forma, sempre que possível, é importante fazer uma consulta prévia junto aos potenciais consumidores de dados para identificar a relevância dos dados.
- Criação: Diz respeito ao momento em que os dados são criados, ou seja, compreende a fase de extração dos dados de fontes de dados já existentes até a sua transformação para o formato adequado para publicação na Web. Durante a fase de criação, além dos dados propriamente ditos, também devem ser criados os metadados que irão descrever os dados. Na fase de criação, também será feita a escolha dos formatos de dados a serem usados para a publicação de dados e metadados. Além disso, é sempre bom considerar a publicação de dados em diferentes formatos, minimizando a necessidade de transformação dos dados por parte dos consumidores
- Avaliação: Esta fase diz respeito à avaliação dos dados antes da sua publicação. É importante que os especialistas sejam capazes de avaliar os dados a fim de detectar inconsistências ou erros nos dados, bem como apontar dados que sigilosos que não devem ser publicados, por exemplo. Somente após uma avaliação criteriosa, os dados devem ser disponibilizados para publicação. Quando necessário, os dados podem voltar para a fase anterior a fim de resolver os problemas detectados pelos especialistas.
- Publicação: Compreende o momento em que os dados serão disponibilizados de forma pública na Web. Para isso, podem ser usadas ferramentas de catalogação de dados, como CKAN10 e Socrata11. Também podem ser utilizadas APIs (Application Programming Interface) que permitam o fácil acesso aos dados publicados, ou páginas Web, por exemplo. Em todos os casos, o provedor de dados deverá oferecer toda a informação necessária para que o consumidor tenha fácil acesso aos dados. Além disso, é importante garantir que os dados serão atualizados de acordo com uma frequência pré-determinada, a qual deverá ser informada juntamente com os dados.
- Consumo: Implica o momento em que os dados são usados para a criação de visualizações, como gráficos e mapas de calor, bem como para aplicações que permitem o cruzamento e a realização de análises sobre os dados. Esta fase do ciclo de vida está diretamente relacionada ao consumidor de dados, que pode ser desde uma grande empresa interessada em usar os dados disponíveis na Web para a melhoria de seus produtos e serviços, até um único desenvolvedor interessado em usar os dados para criar uma aplicação que irá melhorar a qualidade de vida na sua cidade.
- Feedback: Esta fase compreende o momento em que os consumidores proveem comentários sobre os dados e metadados previamente utilizados. Esta fase é de fundamental importância, pois a partir do feedback dos consumidores será possível identificar melhorias e realizar correções nos dados previamente publicados. Além disso, esse canal de comunicação entre consumidores e provedores de dados também facilita a identificação de novos dados relevantes que devem ter prioridade no momento da escolha de novos dados a serem publicados.
- Refinamento: Esta fase compreende todas as atividades relacionadas a adições ou atualizações nos dados que já foram publicados. É muito importante garantir a manutenção dos dados previamente publicados, a fim de oferecer maior segurança para aqueles que irão consumir os dados. A manutenção pode ser feita de acordo com o feedback dos consumidores ou novas versões podem ser geradas a fim de garantir que os dados não fiquem obsoletos. Para isso, é importante fazer o correto gerenciamento das diferentes versões dos dados e garantir que os consumidores tenham acesso à versão correta dos dados.
Com relação aos atores que participam do ciclo de vida dos dados na Web, estes podem desempenhar dois papéis principais: os provedores de dados e os consumidores de dados. O papel de provedor de dados pode ser desempenhado por vários atores, os quais são responsáveis por realizar atividades como criação de metadados, criação e publicação de dados. Os consumidores de dados são atores que recebem e consomem os dados. Ressalta-se que os consumidores de dados também podem ser provedores de dados, uma vez que os consumidores podem realizar melhorias e refinamentos nos dados a fim de oferecê-los novamente para a comunidade. É importante notar que o ciclo de vida proposto não requer que todas as fases sejam seguidas até que uma nova iteração seja iniciada.