¿Qué significa archivo plano?
Una base de datos de archivo plano es una colección de registros en la que los datos siguen un formato uniforme y siguen reglas sobre tipos de valores cuando procede. La base de datos es plana porque cada línea sólo contiene una entrada de datos, según la categorización de las columnas.
Las bases de datos de archivos planos almacenan registros de texto plano y archivos binarios necesarios para un fin concreto en un único directorio para facilitar el acceso y la transferencia.
Los principales sistemas operativos (SO), como Windows, Linux y macOS, utilizan una serie de archivos planos para iniciar y ejecutar el SO, todo ello conservando el espacio de almacenamiento y garantizando que ninguno de los archivos esenciales para ejecutar el SO se dañe o altere.
Uno de los ejemplos más comunes de archivo plano es un archivo de valores separados por comas (CSV). En un archivo CSV, los datos de la tabla se representan mediante líneas de texto ASCII. El valor de cada celda de la tabla en el ejemplo siguiente está separado por una coma y cada fila está representada por una nueva línea en el Bloc de Notas.
Guardar los datos en archivos planos proporciona un método fiable y de confianza para transferir datos a distancia, al tiempo que garantiza que los datos conservan su estado original y su autenticidad.
Dado que los archivos planos no requieren mucho espacio de almacenamiento, suelen utilizarse en proyectos de almacenes y lagos de datos para almacenar grandes volúmenes de datos no estructurados y semiestructurados.
Definición de archivo plano
Debido a su estructura plana, los datos de un archivo plano no pueden manipularse ni analizarse fácilmente sin importarlos a otra aplicación. La facilidad de importación de una base de datos de archivo plano depende principalmente de su estructura.
La importación inadecuada de un archivo plano a una aplicación de gestión de bases de datos puede dejar caracteres adicionales, espacios y puntos de datos mal colocados que podrían afectar a la credibilidad e integridad de cualquier análisis y manipulación de datos.
Estructura de las bases de datos de archivos planos
En una base de datos de archivos planos, la primera fila de la base de datos contiene las claves y los campos para identificar y categorizar los puntos de datos. Todas las filas siguientes representan puntos de datos en los que cada fila -o, en algunos casos, una colección de celdas- representa un único registro.
Hay dos estructuras que pueden utilizar los archivos planos, dependiendo de cómo se recopilaron los datos y qué especificaciones se seleccionaron al convertir los datos de un archivo manejable a un archivo plano.
- Anchura fija – Estos archivos tienen cada entrada de datos aislada en una sola columna de anchura fija. La columna podía ocultar parte de los datos si requería un espacio mayor que su anchura o proporcionar espacio suficiente con espacios en blanco.
- Delimitados – Los archivos planos delimitados, también conocidos como archivos CVS (archivos de valores separados por comas), no se basan en celdas y columnas preprogramadas para dividir las entradas de datos. En su lugar, utilizan divisores digitales para separar los campos entre sí. Los divisores van desde comas y tubos hasta punto y coma y un carácter de tabulación con un número determinado de espacios.
Archivos planos y lagos de datos
La variedad de estructuras y formatos de almacenamiento es lo que está permitiendo que las bases de datos de archivos planos regresen a las ciencias y análisis de datos modernos en forma de lagos de datos.
La eficacia de las bases de datos de archivos planos permite utilizarlas para almacenar y luego gestionar big data, que puede utilizarse para entrenar aplicaciones de inteligencia artificial (IA) y aprendizaje automático (AM).