Datenqualität25. April 20268 Min. Lesezeit

Datenqualitätsmessung im operativen Klinik-Alltag: Was sich tatsächlich messen lässt

Datenqualität wird in Kliniken als Konzept diskutiert und selten gemessen. Fünf operative Indikatoren — Vollständigkeit gegen ein Schema, Aktualität gegen ein Quell-Datum, Konsistenz zwischen redundant geführten

Dr. Sven Jungmann

CEO

Datenqualitätsmessung Klinik-Alltag braucht keinen Spezial-Stack — fünf operative Indikatoren aus dem vorhandenen KIS-Datenexport machen sichtbar, wo die eigene Datenqualität stiller verfällt, als der Diskurs vermuten lässt.

Eine IT-Leitung eines mittelgroßen Klinikverbundes — drei Standorte, gemeinsames Krankenhaus-Informations-System (KIS), insgesamt 1.100 Betten — bekommt im März 2026 von der Geschäftsführung einen Auftrag, der nüchtern klingt: „Wir wollen wissen, wie es um unsere Datenqualität steht.“ Der Auftrag ist keine Reaktion auf einen konkreten Vorfall. Er ist die Folge einer Vorstands-Sitzung, in der über eine Klinik-KI-Beschaffung gesprochen und gefragt wurde, ob die eigene Datenbasis trägt. Die IT-Leitung kennt die methodische Literatur — Wang & Strong, ISO 8000, die DAMA-Dimensionen. Sie kennt auch den Markt der kommerziellen Datenqualitäts-Werkzeuge, der mit sechsstelligen Lizenz-Schwellen einsteigt. Beide Wege sind im Auftrag nicht der Engpass. Der Engpass ist die Frage, was sich in den nächsten vier Wochen mit einem KIS-Datenexport und einem Tabellen-Programm tatsächlich erheben lässt — und was davon klinisch und kaufmännisch zu lesen ist.

Die methodische Lage ist seit dreißig Jahren stabil. Wang und Strong (1996) haben den Begriff der Datenqualität als mehrdimensional und kontextabhängig festgeschrieben — Genauigkeit allein trägt nicht. Kahn et al. (2016) haben das in der Open-Access-Zeitschrift eGEMS für die klinische Sekundärnutzung harmonisiert — drei Hauptkategorien, jeweils mit Sub-Achsen. Die systematische Übersicht von Weiskopf und Weng im JAMIA (2013) hat über 95 EHR-Studien fünf Kern-Dimensionen identifiziert, die in der Forschungs-Praxis tatsächlich gemessen werden — Vollständigkeit, Korrektheit, Konsistenz, Plausibilität, Aktualität. Die internationale Norm ISO 8000-61 und das Datenqualitäts-Modell ISO/IEC 25012 formalisieren die Mess-Disziplin: Datenqualität wird gegen ein dokumentiertes Erwartungs-Schema gemessen, nicht intuitiv beurteilt. Die Übersicht ist also nicht knapp; sie ist im Gegenteil dicht — und genau deshalb kommt sie im Klinik-Alltag selten an. Die Dimensions-Inflation aus dem DAMA-Body-of-Knowledge mit zehn Achsen oder aus ISO/IEC 25012 mit fünfzehn ist methodisch sauber. Sie ist nicht das, womit eine IT-Leitung in vier Wochen einen ersten Bericht vorlegt.

Die operative Verdichtung ist möglich, weil die fünf Weiskopf-Dimensionen — Vollständigkeit, Korrektheit, Konsistenz, Plausibilität, Aktualität — sich auf eine Teilmenge zuschneiden lassen, die mit dem KIS-Datenexport allein gemessen werden kann. Korrektheit setzt eine externe Referenz voraus — eine Vergleichs-Quelle außerhalb des KIS, gegen die die Aussage geprüft wird; sie ist ohne diesen externen Anker nicht in der eigenen Hand. Die übrigen vier — Vollständigkeit, Konsistenz, Aktualität, Plausibilität — sind aus dem KIS-Korpus selbst erhebbar. Plausibilität teilen wir in zwei operative Sub-Indikatoren: Provenienz-Abdeckung (für jede klinische Aussage ist eine Quelle verzeichnet) und Widerspruchsrate (zwei plausibilisierbare Quellen sagen das Gleiche oder nicht). Damit ergeben sich fünf Indikatoren, die in der eigenen Datenbasis prüfbar sind. Sie sind keine Erfindung; sie sind eine pragmatische Auswahl aus dem methodischen Konsens.

Indikator 1 — Vollständigkeit gegen ein dokumentiertes Schema

Vollständigkeit ist nicht die Frage, ob ein Feld ausgefüllt ist. Sie ist die Frage, ob alle für die Indikation oder den Behandlungs-Anlass erwarteten Felder ausgefüllt sind. Die Mess-Logik braucht zwei Schritte. Erstens: ein Erwartungs-Schema. Welche Felder gehören zu einer kardiologischen Aufnahme, welche zu einer orthopädischen, welche zu einer neurologischen? Das Schema entsteht nicht in der IT-Abteilung, sondern in einem dreißig-Minuten-Gespräch zwischen ärztlicher Leitung, Klinik-IT-Leitung und gegebenenfalls dem Medizinischen Controlling — die Felder pro Indikation sind in jedem Haus benennbar, weil sie ohnehin erhoben werden. Zweitens: die Auswertung. Pro Aufnahme-Datensatz wird gegen das indikations-spezifische Schema gezählt, wieviele der erwarteten Felder belegt sind. Aggregiert über das Quartal entsteht eine Vollständigkeits-Quote pro Indikations-Klasse — und vor allem: eine Liste der Felder, die strukturell häufig fehlen. Das ist die klinisch handlungsrelevante Aussage. Eine Quote von 91 Prozent ist eine Zahl. Die zwei Felder, die in 40 Prozent der orthopädischen Aufnahmen fehlen, sind ein Befund.

Indikator 1 — Vollständigkeitsmessung im Klinik-Alltag entsteht nicht aus der globalen Quote, sondern aus dem indikations-spezifischen Erwartungs-Schema; die belastbare Aussage benennt die Felder, die strukturell fehlen, nicht die Prozent-Zahl. — Vollständigkeit ist eine Schema-Messung, keine Quoten-Messung — die handlungsrelevante Aussage liegt in den Felder-Lücken, nicht·aiomics

Indikator 2 — Aktualität gegen ein Quell-Datum

Aktualität misst die zeitliche Distanz zwischen dem Datum, das ein Datenpunkt aus seiner Quelle trägt, und dem Datum, an dem dieser Datenpunkt klinisch verwendet wird. Eine Medikations-Liste, die im KIS aus einem Vorbefund von vor vier Monaten stammt, ist nicht falsch — sie ist veraltet. Operativ ist der Indikator als Median oder 95-Perzentil der Quelldaten-Distanz zu einer Behandlungs-Entscheidung erhebbar. Voraussetzung ist, dass das KIS pro Datenpunkt ein Erfassungs-Datum führt — das tun die meisten Systeme; der Aufwand liegt im Export-Mapping, nicht in der Datenstruktur. Aggregiert pro Datenpunkt-Klasse — Diagnose-Liste, Medikation, Funktionsstatus, Vorbefund-Dokumente — entsteht ein Aktualitäts-Profil. Eine Klinik, die für die Diagnose-Liste eine Median-Distanz von 28 Tagen ausweist und für die Medikations-Liste eine von 4 Tagen, hat damit eine messbare Aussage in der Hand. Sie kennt nicht nur den Wert, sondern die Stelle, an der der Wert geringer ist als die klinische Erwartung — und der Wert, der von der klinischen Erwartung abweicht, ist die Stelle, an der die Folge-Untersuchung beginnt.

Indikator 3 — Konsistenz zwischen redundant geführten Feldern

In jedem KIS gibt es Felder, die denselben Sachverhalt an zwei oder drei Stellen führen — die Hauptdiagnose im strukturierten Feld und im Aufnahme-Frei-Text, das Aufnahme-Gewicht in der Pflege- und in der ärztlichen Doku, die Allergien in der Medikations-Liste und in der Anamnese. Konsistenz misst, wie häufig zwei für denselben Sachverhalt vorgesehene Felder unterschiedliche Werte tragen. Operativ ist der Indikator über paarweise Vergleiche im KIS-Export erhebbar — die IT-Leitung definiert pro Sachverhalt zwei Quell-Felder, ein Skript prüft die Übereinstimmung, und die Quote der Konflikte wird pro Sachverhalt-Klasse berichtet. Eine systematische Übersicht von Verbiest et al. (2022) im BMC Medical Informatics and Decision Making zeigt über 18 europäische und US-Datensätze hinweg, dass inkonsistent geführte Felder zu den wiederkehrenden Datenqualitäts-Klassen gehören — die Häufigkeit ist messbar, der Effekt auf die nachgelagerte Verwendung erheblich. Die Studie aggregiert Datensätze unterschiedlicher Provenienz; die genauen Konflikt-Raten variieren. Konvergenz besteht in der Klassifikation: Konsistenz-Konflikte sind nicht selten, sie sind in jeder größeren Datenbasis nachweisbar.

Häufiger Denkfehler: Eine globale Datenqualitäts-Quote ist eine Diskurs-Zahl, kein Befund

Eine in der Praxis beliebte Form des Datenqualitäts-Berichts ist die globale Quote: „Unsere Datenqualität liegt bei 94 Prozent.“ Die Aussage hat das Format einer Kennzahl, sie hat nicht die Struktur eines Befunds. Eine globale Quote aggregiert Indikatoren mit unterschiedlichen Erhebungs-Logiken zu einer Zahl, die weder klinisch noch operativ adressiert ist. Wer sie liest, weiß nicht, an welchen Stellen die fehlenden 6 Prozent liegen — und an welchen Stellen die ausgewiesenen 94 Prozent eine veraltete Quelle widerspiegeln, deren Quell-Datum nicht in die Quote eingeflossen ist. Der operative Bericht ist die Tabelle der fünf Indikatoren pro Indikations-Klasse oder pro Datenpunkt-Klasse — nicht die Verdichtung auf einen Wert. Die Verdichtung ist Diskurs; die Tabelle ist Befund.

Indikator 3 und 5 — Konsistenz und Widerspruchsrate werden im KIS-Datenexport durch paarweise Vergleiche zwischen zwei plausibilisierbaren Feldern für denselben Sachverhalt erhoben; die Quote der Konflikte ist messbar, der Effekt auf die nachgelagerte Verwendung erheblich. — Konsistenz und Widerspruchsrate werden über paarweise Feld-Vergleiche im KIS-Export erhoben·aiomics

Indikator 4 — Provenienz-Abdeckung pro klinischer Aussage

Provenienz ist die Frage, ob für jede klinische Aussage in der Akte verzeichnet ist, woher sie stammt. „Hypertonie seit 2019“ stammt entweder aus dem Vorbefund einer ambulanten Praxis, aus dem Akut-Bericht oder aus der Eigenanamnese im Aufnahme-Gespräch. Wenn die Aussage in der Akte ohne Quell-Verweis steht, fehlt der Nachweis. Operativ ist der Indikator als Anteil der klinischen Aussagen mit Quell-Verweis am Gesamt-Bestand der Aussagen erhebbar. Voraussetzung ist eine Konvention, die die Klinik selbst setzt — strukturierte Felder mit einem Quell-Attribut, freie Texte mit einer Quell-Notation in einer kurzen Form. Die Konvention ist der teure Teil; die Messung ist trivial, sobald die Konvention steht. Provenienz-Abdeckung ist auch der Indikator, der für die spätere Klinik-KI-Architektur die strukturell wichtigste Voraussetzung ist: Ein KI-System, das eine klinische Synthese ausgibt, kann nur dann eine Quelle pro Aussage zurückgeben, wenn die Daten-Eingangs-Seite eine Quelle pro Aussage führt. Provenienz-Abdeckung im KIS ist also nicht nur eine Datenqualitäts-Aussage; sie ist eine Investition in die Bedingung der Möglichkeit nachvollziehbarer KI-Anwendung.

Indikator 5 — Widerspruchsrate aus zwei plausibilisierbaren Quellen

Konsistenz misst, wie häufig zwei Felder für denselben Sachverhalt unterschiedliche Werte tragen. Widerspruchsrate misst eine Stufe darüber: wie häufig zwei plausibilisierbare Quellen zu einem klinischen Sachverhalt einander widersprechen. „Plausibilisierbar“ heißt: nicht zwei beliebige Datenpunkte, sondern Datenpunkte, deren wechselseitige Stützung medizinisch erwartbar ist. Eine ICD-10-Diagnose „Z95.1 Vorhandensein einer aortokoronaren Bypass-Anastomose“ und ein Operations-Bericht ohne dokumentierte Bypass-OP — das ist ein plausibilisierbarer Widerspruch. Eine Allergie-Angabe in der Anamnese und eine Medikations-Verordnung, die diese Allergie ignoriert — ebenfalls. Operativ ist der Indikator über vorab definierte Plausibilisierungs-Regeln erhebbar; die Klinik setzt eine kleine Liste an — fünfzehn bis dreißig Regeln reichen für den ersten Quartals-Zyklus —, die für die typischen Indikations-Klassen die strukturellen Widerspruchs-Stellen abprüfen. Pro Quartal entsteht eine Tabelle der ausgelösten Regeln. Sie ersetzt nicht die ärztliche Plausibilisierung am Einzelfall. Sie macht die strukturellen Wiederholungs-Muster sichtbar — und das ist der Befund, der zwischen einzelnen Patientenakten nicht entsteht.

“Eine globale Datenqualitäts-Quote ist eine Diskurs-Zahl. Eine Tabelle der Indikatoren entlang der Indikations- und Datenpunkt-Klassen ist ein Befund — und der Befund ist der Auftrag an die nächste Mess-Iteration.”

Der Quartals-Rhythmus macht aus einer einmaligen Audit-Frage eine laufende Mess-Disziplin — der Bericht entsteht nicht in der Werkzeug-Beschaffung, sondern im wiederkehrenden Lese-Termin zwischen ärztlicher Leitung und Klinik-IT. — Der Quartals-Rhythmus macht die Indikatoren zu einer laufenden Mess-Disziplin — nicht zu einem einmaligen Audit-Ereignis.·aiomics

Was das für Sie heißt

Vor der Beauftragung eines kommerziellen Datenqualitäts-Werkzeugs lassen sich drei Fragen anlegen. Erstens: Liegt im eigenen Haus ein dokumentiertes Erwartungs-Schema pro Indikations-Klasse vor — und wenn nicht, ist das die Stelle, an der die Mess-Logik beginnt, nicht das Werkzeug? Zweitens: Welche der fünf Indikatoren sind im KIS-Datenexport ohne zusätzliche Schnittstellen-Arbeit erhebbar — und welche brauchen eine Konvention, bevor sie messbar werden? Drittens: Welcher Quartals-Rhythmus passt zur eigenen Datenfluss-Geometrie — quartalsweise als Default, monatlich für Aktualität und Provenienz-Abdeckung, wenn die Drift-Wahrscheinlichkeit es nahelegt? Drei Antworten — und sie unterscheiden eine Mess-Disziplin, die mit den vorhandenen Mitteln trägt, von einer, die auf eine sechsstellige Lizenz-Beschaffung wartet.

Eine IT-Leitung, die nach drei Quartalen den Indikator-Bericht das dritte Mal vorlegt, wird keinen Innovationspreis bekommen. Sie wird die Stellen kennen, an denen die eigene Datenqualität stiller verfällt, als die Diskurs-Lautstärke vermuten lässt — die Felder, die strukturell fehlen; die Datenpunkt-Klassen, deren Quell-Datum hinter der klinischen Erwartung zurückbleibt; die Sachverhalt-Paare, deren Werte häufiger auseinanderlaufen als angenommen; die Aussagen ohne Quell-Verweis; die Plausibilisierungs-Regeln, die wiederkehrend auslösen. Das ist nicht alles, was eine Klinik über ihre Daten wissen sollte. Es ist genau der Bestand, den eine spätere Klinik-KI-Beschaffung als Datenbasis-Lage erwarten wird — und es ist der Bestand, den eine Klinik mit ihren eigenen Mitteln in einem Quartal aufbaut. Datenqualität wird nicht durch Werkzeug-Beschaffung sichtbar. Sie wird sichtbar, wenn jemand sie misst.

#Datenqualitätsmessung Klinik#Datenqualität Indikatoren#Klinik-Daten messen#Datenqualität KPI#operative Datenqualität#Klinik-Datenanalyse

Aiomics betreibt eine Klinik-Doku-Architektur, die explizit gegen die Klasse von Datenqualitäts-Verfall arbeitet, die in diesem Beitrag beschrieben wird. Die fünf Indikatoren sind methodisch aus der peer-reviewed Literatur abgeleitet — Wang & Strong (1996), Kahn et al. (2016), Weiskopf & Weng (2013), Verbiest et al. (2022) — und in der ISO-8000- und ISO/IEC-25012-Norm-Logik verankert. Der Beitrag gibt keine Empirie zu konkreten Anbietern oder Produkten und keine Rechtsauslegung zu Datenschutz-, Medizinprodukte- oder Aufsichts-Anforderungen. Die Übersetzung der Mess-Logik in den eigenen Klinik-Alltag bleibt Sache der ärztlichen Leitung, der Klinik-IT-Leitung und der Geschäftsführung.

Datenqualitätsmessung im operativen Klinik-Alltag: Was sich tatsächlich messen lässt

Indikator 1 — Vollständigkeit gegen ein dokumentiertes Schema

Indikator 2 — Aktualität gegen ein Quell-Datum

Indikator 3 — Konsistenz zwischen redundant geführten Feldern

Indikator 4 — Provenienz-Abdeckung pro klinischer Aussage

Indikator 5 — Widerspruchsrate aus zwei plausibilisierbaren Quellen

Weiterlesen

Warum aiomics für QM-Berichte und Qualitätsanalytik

Arztbrief mit KI: was zwischen Entwurf und Unterschrift passieren muss

KI-Spracherkennung in der Klinik: das Wer-hat-was-gesagt-Problem

Diese Analyse stammt von den Leuten hinter Visite.

Sie möchten das in Ihrer Klinik sehen?