¿Qué significa deduplicación de datos?
La deduplicación de datos es una técnica de compresión de datos en la que se eliminan de un sistema las copias redundantes o repetidas de datos.
Se aplica en las copias de seguridad de datos y en los mecanismos de datos en red, y permite almacenar una única instancia de datos dentro de una base de datos o sistema de información (SI).
La deduplicación de datos también se conoce como compresión inteligente, almacenamiento de instancia única, factorización de lo común o reducción de datos.
Diccionario de deduplicación de datos
La deduplicación de datos funciona analizando y comparando los segmentos de datos entrantes con los datos almacenados previamente. Si los datos ya están presentes, los algoritmos de deduplicación de datos descartan los nuevos datos y crean una referencia.
Por ejemplo, si se hace una copia de seguridad de un archivo de documento con cambios, el archivo anterior y los cambios aplicados se añaden al segmento de datos.
Sin embargo, si no hay ninguna diferencia, se descarta el archivo de datos más reciente y se crea una referencia. Del mismo modo, un algoritmo de deduplicación de datos escanea los datos salientes en una conexión de red para comprobar si hay duplicados, que se eliminan para aumentar la velocidad de transferencia de datos.