Analizador CSV/TSV

CSV (Valores Separados por Comas) es un formato simple para datos tabulares, ampliamente soportado por hojas de cálculo y bases de datos. Esta herramienta analiza archivos CSV y TSV, detecta automáticamente los delimitadores, maneja campos entrecomillados y muestra los datos en una tabla formateada.

Especificaciones

Casos de uso comunes

  • Previsualizar exportaciones CSV antes de importar a una base de datos
  • Convertir CSV a JSON para consumo de API
  • Validar exportaciones de datos desde hojas de cálculo
  • Inspección rápida de archivos de registro y volcados de datos

Funcionalidades

  • Detección automática del delimitador (coma, tabulación, punto y coma, barra vertical)
  • Mostrar como tabla formateada con encabezados
  • Convertir a array JSON de objetos
  • Vista de árbol interactiva para la representación JSON
  • Copiar como tabla HTML
  • Transponer filas y columnas

Ejemplos

Datos de usuario

Pruébalo →

Un archivo CSV con información de usuarios.

name,email,role
Alice,alice@example.com,admin
Bob,bob@example.com,user
Charlie,"charlie@example.com",user

Consejos

  • La primera fila se trata típicamente como encabezados.
  • Encierre los campos que contienen comas o saltos de línea entre comillas dobles.
  • Las comillas dobles dentro de campos entrecomillados se escapan como "".
  • TSV (separado por tabulaciones) evita muchos problemas de entrecomillado.

Comprender Analizador CSV/TSV

CSV (Valores Separados por Comas) es uno de los formatos de intercambio de datos más antiguos y ampliamente soportados. A pesar de su simplicidad, CSV tiene suficiente ambigüedad para causar problemas persistentes de interoperabilidad. RFC 4180 define un estándar, pero muchos productores se desvían de él, generando problemas de análisis con delimitadores, entrecomillado, codificación y finales de línea.

La estructura básica es un registro por línea con campos separados por comas. Cuando un campo contiene una coma, salto de línea o comilla doble, debe encerrarse entre comillas dobles. Las comillas dobles dentro de un campo entrecomillado se escapan duplicándolas (""). La primera fila se trata comúnmente como fila de encabezado, aunque esto es convención y no requisito.

Las variaciones de delimitador son comunes. TSV (Valores Separados por Tabulaciones) usa tabulaciones, evitando la mayoría de problemas de entrecomillado. Las configuraciones regionales europeas que usan comas como separadores decimales frecuentemente usan punto y coma como delimitadores de campo. Los archivos delimitados por barras verticales aparecen en sistemas heredados. Un buen analizador CSV detecta automáticamente el delimitador analizando las primeras líneas.

La codificación de caracteres es otra fuente frecuente de problemas. Excel en Windows guarda CSV en la codificación local del sistema en lugar de UTF-8. Abrir un CSV UTF-8 en Excel puede mostrar caracteres ilegibles. Agregar un BOM (marca de orden de bytes) UTF-8 al inicio del archivo señala a Excel que el archivo está codificado en UTF-8. Al intercambiar archivos CSV entre sistemas, siempre verifique la codificación de caracteres.

Cuando los datos CSV se ven mal en Excel, las dos causas más comunes son desajustes de codificación y desajustes de delimitador. Un archivo UTF-8 abierto por Excel asumiendo una codificación local mostrará caracteres ilegibles, y agregar un BOM generalmente soluciona esto. Los problemas de delimitador surgen en configuraciones regionales europeas donde Excel espera punto y coma en lugar de comas. Usar el asistente Datos > Desde texto en lugar de hacer doble clic en el archivo da control explícito sobre la codificación y el delimitador.

Según RFC 4180, cualquier campo que contenga una coma, salto de línea o comilla doble debe encerrarse entre comillas dobles. Las comillas dobles dentro de un campo entrecomillado se escapan duplicándolas. La mayoría de las bibliotecas CSV manejan esto correctamente, pero los problemas aparecen cuando los archivos se editan manualmente o se analizan con división de cadenas ingenua en lugar de un analizador CSV apropiado. TSV (Valores Separados por Tabulaciones) evita la mayoría de estas complicaciones de entrecomillado porque las tabulaciones rara vez aparecen en los datos, haciéndolo una opción popular en bioinformática, ciencia de datos y contextos donde los valores de campo frecuentemente contienen comas.

CSV y JSON sirven diferentes necesidades de intercambio de datos. CSV es ideal para datos tabulares planos con columnas consistentes — es universalmente soportado por hojas de cálculo y herramientas de datos y sigue siendo compacto para conjuntos de datos grandes. JSON es la mejor opción para datos anidados o jerárquicos y es el formato estándar para APIs. Para exportaciones de bases de datos, reportes y flujos de trabajo con hojas de cálculo, CSV sigue siendo el predeterminado práctico.

← Volver a todas las herramientas