33 Formatos separados por delimitadores (CSV)

CSV files (Comma-separated values) are used to store tabular data (numbers and text) in plain text. "Plain text" means that the file is a pure string of characters without any hidden information that the computer has to process.

Los archivos CSV (del inglés "Character-separated values", Valores Separados por un Delimitador) sirven para almacenar datos tabulares (números y texto) en texto simple. "Texto simple" significa que el archivo es una secuencia de caracteres puros, sin ninguna información "escondida" que el computador deba procesar.

Un archivo CSV alberga un sinnúmero de "registros", separados por quebraduras de línea (cada "registro" permanece en una línea del archivo), y cada registro posee uno o más "campos", separados por un delimitador, siendo los más comunes la coma (","), el punto y coma (";") y el carácter "invisible" que surge al presionar la tecla "tab". Los archivos separados por coma y por punto y coma, reciben normalmente la extensión "CSV"; y los archivos separados por "tab", la extensión "TSV". Existen también bases de datos en dichos formatos que reciben la extensión "TXT". Los archivos CSV son simples y funcionan con la mayoría de las aplicaciones que trabajan con datos estructurados.

Haciendo una comparación de las líneas y columnas de una planilla de cálculo, los "registros" de un archivo CSV son las líneas, y los "campos" son las columnas. Los valores de los "campos" del primer "registro", es decir, de la primera línea, normalmente son los títulos de las columnas. A pesar de que no existe un estándar internacional para el CSV, sus variaciones son lo suficientemente simples como para que las aplicaciones compatibles puedan interpretar las diferencias con facilidad. De manera típica y genérica, un archivo CSV se ve así cuando se lo abre con un editor de textos:

Continente;País;Capital
África;Angola;Luanda
América do Norte;Estados Unidos;Washington DC
América Central;México;Cidade do México
América do Sul;Brasil;Brasília
Europa;Espanha;Madri
Europa;Alemanha;Berlim
Oceania;Austrália;Camberra
Ásia;Japão;Tóquio

Este archivo consta de tres columnas separadas por el delimitador punto y coma (";"): Continente, País y Capital, como lo describe la primera línea. En total, existen ocho registros. El primero es la tríada África-Angola-Luanda y el último Asia-Japón-Tokio. No hay un límite práctico para el número de líneas o columnas en un archivo CSV. Ese número puede alcanzar millones o decenas de millones, dependiendo exclusivamente de la capacidad de procesamiento del computador que habrá de utilizarse para la consulta. Si el mismo archivo CSV fuese abierto en un procesador de planillas, se lo vería así:

Continente País Capital
África Angola Luanda
América do Norte Estados Unidos Washington DC
América Central México Cidade do México
América do Sul Brasil Brasília
Europa Espanha Madri
Europa Alemanha Berlim
Oceania Austrália Camberra
Ásia Japão Tóquio