35 Formatos separados por delimitadores (CSV)

Os arquivos CSV (do inglês "Character-separated values" ou "valores separados por um delimitador") servem para armazenar dados tabulares (números e texto) em texto simples. O "texto simples" significa que o arquivo é uma sequência de caracteres puros, sem qualquer informação escondida que o computador tenha que processar.

Um arquivo CSV abriga um sem número de "registros", separados por quebras de linha (cada "registro" permanece numa linha do arquivo) e cada registro possui um ou mais "campos", separados por um delimitador, os mais comuns sendo a vírgula (","), o ponto e vírgula (";") e o caractere "invisível" que surge ao se pressionar a tecla "tab". Arquivos separados por vírgula e ponto e vírgula normalmente recebem a extensão "CSV" e arquivos separados por "tab" a extensão "TSV". Há também bases de dados nesses formatos que recebem a extensão "TXT". Arquivos CSV são simples e funcionam na maior parte das aplicações que lidam com dados estruturados.

Fazendo uma comparação com linhas e colunas numa planilha, os "registros" de um arquivo CSV são as linhas e os "campos" são as colunas. Os valores dos "campos" do primeiro "registro", ou seja, da primeira linha, normalmente são os nomes das colunas. Apesar de não existir um padrão internacional para o CSV, suas variações são simples o suficiente para que os aplicativos compatíveis possam consertar facilmente as diferenças. Tipicamente, é assim que um arquivo CSV é exibido quando aberto num editor de textos:

Macintosh HD:Users:cburle:Documents:W3C Br:Dados Abertos:SPUK:Guias Abertura de Dados e Web Semântica:Ilustrações:arte_final_figuras_guia_de_abertura_de_dados:PNG:lista_continentes_paises_pag58.png

Esse arquivo possui três colunas separadas pelo delimitador ponto e vírgula (";"): Continente, País e Capital, como descrito na primeira linha. Ao todo, são oito registros. O primeiro é a tríade Á frica-Angola-Luanda e o último Ásia-Japão-Tóquio. Não há limite prático para o número de linhas ou colunas em um arquivo CSV. Esse número pode chegar a milhões ou dezenas de milhões, dependendo exclusivamente da capacidade de processamento do computador que vai ser utilizado na consulta. Se o mesmo arquivo CSV fosse aberto num processador de planilhas, ele seria exibido assim:

Macintosh HD:Users:cburle:Documents:W3C Br:Dados Abertos:SPUK:Guias Abertura de Dados e Web Semântica:Ilustrações:arte_final_figuras_guia_de_abertura_de_dados:PNG:tabela_continentes_paises_pag58.png