Kriterien und Tipps für eine bessere Datenqualität
Datenqualität im Managementsystem
In Zeiten der Digitalisierung werden Daten immer mehr und immer wichtiger. Aber mehr Daten bedeutet nicht gleich Mehrwert, wenn die Qualität der verfügbaren Daten nicht hoch genug ist. Welche Kriterien zu beachten sind, welchen Einfluss diese haben und wie dies im QM-Pilot umgesetzt werden kann, wird im folgenden Artikel erklärt.
Datenqualitätskriterien und Mängel
Kriterien für eine hohe gute Datenqualität können folgende sein:
- Vollständigkeit
- Eindeutigkeit
- Korrektheit
- Aktualität
- Genauigkeit
- Einheitlichkeit
- Verständlichkeit
- Redundanzfreiheit
Diese müssen/können nicht immer alle gleichzeitig berücksichtigt werden sondern werden nach Sinnhaftigkeit und Zweck der Daten angewendet. So kann es beispielsweise dazu kommen, dass zu Prozessen bestimmte Daten-Felder optional sind und nicht bei jedem Prozess vollständig ausgefüllt werden müssen.
Mögliche Mängel in der Datenqualität können sein:
- leere Datenfelder
- vermischte Formatierungen (01.01.2020 oder 01/01/2020)
- unterschiedliche Schreibweisen und Abkürzungen: keine definierten Standards zur Datenerfassung
- Schreib- oder Tippfehler
- Falsche Werte (m/w/d stattdessen wird f für weiblich (Frau) eingtragen)
Beispiel:
Nr. | Verantwortung | Normative Grundlage | Risikorelevant | Einstufung | Standort |
1 | CEO | ISO9001 | 1 | Prio 1 | BS |
2 | Geschäftsführer | ISO9001:2015 QM-Norm | Ja | gravierend | Basel |
Folge: Mängel in der Datenerfassung können dazu führen, dass keine einheitliche Darstellung gegeben ist, es zu Eintragungen von falschen Werten kommt und die Vergleichbarkeit bzw. Analyse von Daten nicht mehr erfolgen kann.
Möglichkeiten im QM-Pilot die Datenqualität zu verbessern
Um die Datenqualität so hoch wie möglich zu halten, sollten Basis-Daten in Stammdatentabellen erfasst werden und diese Inhalte in Auswahllisten statt in Freitextfeldern zur Verfügung gestellt werden. Ebenfalls können statt Auswahllisten auch Checkboxen für eine simple Ja/Nein-Entscheidung angelegt werden.
Für das Beispiel oben könnten folgende Daten in Stammdaten-Tabellen erfasst werden:
Funktionsbezeichnungen
Normative Grundlagen
Einstufung
Standorte
Dateneingabe aus Stammdaten-Tabellen
In den Feldern, welche als Auswahllisten auf die Stammdaten-Tabellen zugreifen, stehen nun alle erfassten Inhalte (hier Normative Grundlagen) zur Auswahl zur Verfügung. Somit wird verhindert, dass es zu Schreibfehlern, Abkürzungen oder anderen Bezeichnungen und Abweichungen kommt:
Andere Feldtypen
Checkbox
Die Angabe, ob der Datensatz risikorelevant ist, könnte über eine Checkbox gelöst werden:
Datumsfeld
Das festgelegte Datumsformat verhindert unterschiedliche Formate:
Zahlenfeld
Mit dem Zahlenfeld wird sichergestellt, dass hier zur Datenerfassung nur Ziffern und keine Buchstaben eingetragen werden können:
Fazit: Es sollten so viele Daten wie möglich über Stammdaten-Tabellen und Auswahllisten zur Verfügung gestellt werden. Je mehr Vorgaben es gibt, desto weniger Fehler können in der Dateneingabe entstehen.
Zusätzlich erleichtert es die Datenerfassung, da nicht alles manuell getippt werden muss und verbessert die Auswertungsmöglichkeiten und Vergleichbarkeit von Daten.
Kommentare
Kommentar von Markus Achatz |
Guten Tag,
vielen Dank für Ihren interessanten Blog. Das ein "Mehr" an Daten nicht gleich auch "Datenqualität" bedeutet kann ich nur bestätigen. In einem Zeitalter wo Speicherung so gut wie nichts mehr kostet, ist das Risiko Daten zu generieren und diese auch einfach nur abzuspeichern relativ hoch. Später führt dann diese Vielzahl an Daten zu Missverständnissen und fehlerhaften Ergebnissen.
Stattdessen sollte überlegt werden, wie selektiere ich meine Daten. Wann wird benötigt, was unterstützt den gewünschten und benötigten Mehrwehrt? Hier kann ein Datenfriedhof auch hinderlich sein. Es sollte daher überlegt werden, systematisch auch Daten die nicht mehr benötigt, oder aber auch sogar fehlerhaft sind, nachhaltig zu löschen. Auch hier kann eine Software von Nutzen sein.
Viele Grüße.
Markus Achatz