Was ist Datenqualität?
Datenqualität (DQ) ist der Grad, in dem ein bestimmter Datensatz den Bedürfnissen eines Nutzers entspricht. Datenqualität ist ein wichtiges Kriterium, um sicherzustellen, dass datengestützte Entscheidungen so genau wie möglich getroffen werden.
Qualitativ hochwertige Daten sind in ausreichender Menge und Detailliertheit vorhanden, um den beabsichtigten Verwendungszweck zu erfüllen. Sie stimmen mit anderen Quellen überein, werden auf angemessene Weise dargestellt und weisen einen hohen Grad an Vollständigkeit auf. Weitere wichtige Komponenten der Datenqualität sind:
- Genauigkeit – Das Ausmaß, in dem Daten reale Ereignisse genau wiedergeben.
- Glaubwürdigkeit – Das Ausmaß, in dem die Daten als vertrauenswürdig und wahr angesehen werden.
- Aktualität – Das Ausmaß, in dem die Daten den aktuellen Bedürfnissen des Benutzers entsprechen.
- Konsistenz – Das Ausmaß, in dem die gleichen Daten in verschiedenen Datensätzen den gleichen Wert haben.
- Integrität – Das Ausmaß, in dem alle Datenreferenzen korrekt verbunden wurden.
Derzeit gibt es keinen globalen Standard für die Bewertung und Überprüfung der Datenqualität. Stattdessen gehen die meisten Organisationen die Verbesserung der Datenqualität auf organisatorischer oder projektbezogener Basis an und verwenden Richtlinien und Rahmenwerke, um sicherzustellen, dass die Daten in allen Phasen des Informationslebenszyklus ordnungsgemäß erfasst, gehandhabt und verarbeitet werden.
Richtlinien zur Datenqualität
Um zuverlässige und nützliche Informationen aus einer großen Datenmenge zu gewinnen, müssen die Daten so vollständig und fehlerfrei wie möglich sein. Wenn die Datenqualität unzuverlässig ist, kann dies zu schlechten Entscheidungen und verschwendeten Mitteln führen.
Werden beispielsweise minderwertige Daten verwendet, um Entscheidungen über eine Online-Werbekampagne zu treffen, ist es wahrscheinlich, dass wertvolle Werbegelder für Verbraucher ausgegeben werden, die nicht zum Zielpublikum gehören.
Die Qualität der Daten sollte ständig überprüft und neu bewertet werden, um sicherzustellen, dass ein angemessenes Qualitätsniveau auf akzeptable und transparente Weise aufrechterhalten wird. Dies erfordert, dass Organisationen Richtlinien zur Datenqualität für Datenmanager, Datenverwalter und andere Interessengruppen, die die Daten nutzen, aufstellen. Dies umfasst:
- Frühzeitige und häufige Bewertung der Datenqualität.
- Annahme eines Rahmens für die Bewertung der Datenqualität, um sicherzustellen, dass alle Aspekte der Datenqualität einheitlich bewertet und überprüft werden. Datenqualitätsbewertungen (DQAs) können Managern helfen zu verstehen, wie viel Vertrauen sie in bestimmte Datensätze haben sollten.
- Regelmäßige Überprüfung der Datenqualitätsrichtlinien, um sicherzustellen, dass sie den Compliance-Vorschriften entsprechen.
- Beauftragung einer neutralen dritten Partei mit der Überwachung der Datenqualität. Suchen Sie sich einen Partner, der sowohl über das Fachwissen als auch über die Mittel verfügt, um festzustellen, welche Datensätze qualitativ hochwertig und datenschutzkonform sind und welche von Natur aus fehlerhaft sind und Anlass zu Bedenken geben.
Interne Datenqualitätsrichtlinien sollten Richtlinien für die Dateneingabe, die Überprüfung von Änderungen, die Validierung und Prüfung von Daten, die Korrektur von Datenfehlern und die Beseitigung der Ursachen von Datenverunreinigungen enthalten. Die Richtlinien sollten auch Richtlinien und Verfahren für die Änderungskontrolle, die Standardisierung von Datenformaten und die Beilegung von Datenstreitigkeiten enthalten.
Techopedia erklärt die Datenqualität
Es gibt immer mehr Faktoren, die bei der Datenqualität zu berücksichtigen sind, und diejenigen, die Daten verwenden, sind oft auf eine unzusammenhängende Ad-hoc-Bewertung der Datenqualität angewiesen. Es ist wichtig, dass Unternehmen die Interessenvertreter aus allen relevanten Unternehmensbereichen einbeziehen, um sich auf Folgendes zu einigen:
- Wie wird die Datenqualität überwacht?
- Welche Ziele können besser erreicht werden, wenn die Datenqualität verbessert wird?
- Wie werden die Prioritäten für die Verbesserung der Datenqualität gesetzt?
- Welche Risiken birgt eine schlechte Datenqualität in Bezug auf Kosten, Einhaltung der Vorschriften und Produktivität?
- Wer wird die Verbesserungsbemühungen leiten und koordinieren?
- Wie werden Verbesserungen der Datenqualität im Laufe der Zeit gemessen, analysiert und darüber berichtet?
Wenn Prozesse, Methoden und Verfahren unabhängig voneinander entwickelt werden, besteht für das Unternehmen ein Risiko:
- Mangelndes Bewusstsein der Mitarbeiter in den Unternehmen für die Qualitätsanforderungen im gesamten Lebenszyklus der Daten;
- Unangemessener Aufwand und doppelte Kosten; und
- Ineffiziente Implementierungen (z. B. wiederholte Bereinigung von Daten in einem nachgelagerten Datenspeicher, ohne die Datenqualität an der Quelle zu verbessern).
Datenqualität und Compliance
Die Datenqualität spielt eine wichtige Rolle bei der Einhaltung von Datenschutzbestimmungen. Vorschriften wie GDPR und COPPA sollen sicherstellen, dass Verbraucherdaten transparent erfasst und alle personenbezogenen Daten (PII) sicher gehandhabt werden. Schlechte Datenqualitätspraktiken, wie z. B. das Sammeln von Daten ohne die entsprechende Zustimmung der Verbraucher, können bei Nichteinhaltung der Vorschriften zu empfindlichen Geldstrafen führen.
Wenn Unternehmen Daten von einem Datenbroker kaufen, haben sie keine Transparenz darüber, wie die Daten gesammelt oder gespeichert und gesichert werden. Wenn die Datenbeschaffung und -speicherung transparenter gestaltet und die allgemeine Datenqualität hervorgehoben wird, haben die Mitarbeiter, die die Daten nutzen, mehr Vertrauen in die Ergebnisse.
Dies ist eine wichtige geschäftliche Überlegung, da sich mangelndes Vertrauen negativ auf das Reputationsrisiko auswirken kann. Für Unternehmen ist es heute wichtiger denn je, im Vorfeld nachweisen zu können, dass sie Daten auf transparente und sichere Weise erheben und die Daten während der Übertragung und nach der Erhebung angemessen sichern.
Datenqualität ist ein sich entwickelnder Bereich. Mit der Ausweitung der Datenschutzbestimmungen wird die Überprüfung der Datenqualität zu einer noch wichtigeren Komponente des Geschäftsbetriebs. In einem großen Unternehmen kann sich die Planung über einige Wochen erstrecken. In einer kleinen Organisation kann die strategische Planung für die Datenqualität in einigen kurzen Sitzungen abgeschlossen werden.