¿Qué es la integridad de datos en base de datos?
La integridad de datos es la completitud, exactitud y coherencia de los datos a lo largo de todo su ciclo de vida. Este término es ampliamente usado en el desarrollo de softwares.
Cuando los datos tienen integridad, se han establecido mecanismos para garantizar que los datos en uso, en tránsito y en reposo no puedan ser modificados por una persona o un programa no autorizados. Un objetivo importante del mantenimiento de la integridad de los datos es garantizar que, cuando se recuperen tras una interrupción, sean fiables.
La integridad de los datos desempeña un papel importante en la continuidad del negocio y la recuperación de desastres, y puede aplicarse tanto a nivel físico como lógico. Las iniciativas lógicas de integridad física tratan de proteger los datos de factores externos perjudiciales, como cortes de energía o fallos de hardware. Las iniciativas lógicas de integridad pretenden garantizar que los datos permanezcan accesibles y libres de errores.
Las razones más comunes por las que la integridad de los datos puede verse comprometida incluyen errores de formato, errores de sintaxis, malware, ataques de ransomware y otras acciones maliciosas.
Definición de integridad de los datos
La integridad de los datos se aplica tanto en los modelos de bases de datos jerárquicos como en los relacionales. La integridad suele imponerse durante la fase de diseño de la base de datos mediante el uso de procedimientos y reglas estándar. Se mantiene mediante el uso de varios métodos de comprobación de errores y procedimientos de validación.
Las tres restricciones de integridad siguientes se utilizan en una estructura de base de datos relacional para lograr la integridad de los datos:
Integridad de entidad
Se refiere al concepto de claves primarias y garantiza que no haya datos redundantes ni campos nulos (por ejemplo, cuando una celda numérica contiene información textual). La regla establece que cada tabla debe tener su propia clave primaria y que cada una debe ser única y no nula.
Integridad referencial
Se refiere a todos los procedimientos y reglas que se aplican para garantizar que los datos se almacenan y utilizan de forma coherente. Es el concepto de claves externas.
La regla de las claves externas establece que el valor de la clave externa puede estar en dos estados. El primer estado es que el valor de la clave foránea haga referencia a un valor de clave primaria de otra tabla, o puede ser nulo. Ser nulo podría significar simplemente que no hay relaciones, o que la relación es desconocida.
Integridad de dominio
La integridad de dominio es una serie de reglas y procedimientos que garantizan que todos los elementos de datos pertenecen a los dominios correctos. Por ejemplo, si un usuario teclea una fecha de nacimiento en un campo de dirección, el sistema mostrará un mensaje de error que evitará que el usuario rellene ese campo con información errónea.
El concepto de integridad de los datos garantiza que todos los datos de una base de datos puedan rastrearse y conectarse con otros datos. Esto garantiza que todo sea recuperable y pueda ser susceptible de ser consultado o buscado. Disponer de un sistema de integridad de datos único, bien definido y controlado aumenta la estabilidad, el rendimiento, la reutilización y la capacidad de mantenimiento.
Si alguna de estas características no puede implementarse en la base de datos, debe hacerse a través del software. Un conjunto de buenas prácticas como la planificación de copias de seguridad periódicas, la limitación de los permisos necesarios para acceder a conjuntos de datos sensibles o el seguimiento de los cambios mediante registros suelen ayudar a proteger la integridad de los datos.