Medizinisches Controlling7. Mai 20267 Min. Lesezeit

Med Controlling und KI: Wo der größte Hebel liegt, wo die Risiken sind

Codier-Vorschlag, Codier-Prüfung, Anfragenmanagement des Medizinischen Dienstes — drei Verfahrens-Stellen, an denen Klinik-KI im Medizincontrolling Wert trägt.

Dr. Sven Jungmann

CEO

Med Controlling KI hat drei dokumentierte Hebel-Stellen und drei strukturelle Risiken — und beide Bewegungen teilen sich denselben Synthese-Mechanismus, der in der Codier-Begründung Wert trägt und in derselben Begründung Maskierung erlaubt.

An einem Mittwochmorgen liegt im Medizincontrolling einer mittelgroßen deutschen Klinik die Wochenliste der Anfragen des Medizinischen Dienstes (MD) auf dem Schreibtisch. Achtzig Akten-Vorgänge, jeder mit einer ärztlichen Codier-Begründung, jeder mit einer Vier-Wochen-Frist. In der Reihe daneben steht ein Vorschlag der Geschäftsführung: ob eine Codier-KI die Akten-Lese-Zeit pro Anfrage reduzieren könnte. Die Ärztliche Leitung der Fachabteilung schreibt zurück mit einer einzigen Frage: „Wer codiert dann?“ Die Frage ist nicht rhetorisch. Sie markiert die Stelle, an der die Bewertung dieser Klasse von KI-Anwendungen tatsächlich fällt — nicht am Effizienz-Hebel, sondern an der Architektur, mit der die Codier-Verantwortung beim Menschen bleibt.

Drei Verfahrens-Stellen sind im deutschen Medizincontrolling klar abgegrenzt. Erstens der Codier-Vorschlag aus dem ärztlichen Klartext der Akte: Der Code zur Diagnosis Related Group (DRG), der Operationen- und Prozedurenschlüssel (OPS) und die Codes der Internationalen Klassifikation der Krankheiten (ICD-10-GM) werden gegen das DRG-Definitions-Handbuch und die Allgemeinen Kodier-Richtlinien des Instituts für das Entgeltsystem im Krankenhaus (InEK) in jeder Klinik jährlich neu kalibriert. Zweitens die Codier-Prüfung gegen die ärztliche Doku: Eine vorgeschlagene Codierung lässt sich nur halten, wenn sie im Akten-Material belegbar ist. Drittens das Anfragenmanagement des Medizinischen Dienstes — die Statistischen Berichte des Medizinischen Dienstes Bund weisen die jährlichen Begutachtungs- und Strukturprüfungs-Volumen für die gesetzliche Krankenversicherung im Millionen-Bereich aus, mit Klinik-bezogenen Quoten in der Größenordnung von zehn bis zwölf Prozent der DRG-Fälle in den Jahren nach der Reform des Medizinischen Dienstes 2020 (gesetzlich gedeckelt, jährlich angepasst). Die drei Stellen teilen einen Mechanismus: An jeder läuft Klartext gegen Strukturvorgaben — und an jeder ist das die Stelle, an der KI Wert tragen kann.

Eine Trennung vorab, die in Klinik-Diskussionen mitunter verschwimmt. Die MD-Begutachtung ist eine Einzelfall-Indikations-Prüfung im Auftrag der gesetzlichen Krankenversicherung — sie betrifft die medizinische Notwendigkeit eines konkreten Behandlungsfalls. Das Peer-Review-Verfahren der Deutschen Rentenversicherung (DRV) ist eine qualitative Bewertung von Reha-Entlassberichten durch Peer-Reha-Mediziner:innen für die Reha-Qualitätssicherung. Beide Stränge teilen weder Akteur noch Aktenstrom; sie laufen parallel. Wenn dieser Beitrag von Anfragenmanagement spricht, sind ausschließlich die MD-Anfragen im DRG-Kontext gemeint.

Drei Hebel-Achsen mit dokumentierter Wirkung

Der erste Hebel ist der Codier-Vorschlag aus dem Klartext. Computer-Assisted Coding (CAC) ist seit fünfzehn Jahren in der englischsprachigen Versorgungsforschung dokumentiert. Reviews im Journal of the American Medical Informatics Association 2014–2024 berichten Codier-Geschwindigkeits-Gewinne in der Bandbreite zehn bis dreißig Prozent — abhängig von Codier-Tiefe, Doku-Qualität und Codier-Personalprofil; die Studien sind US-zentriert auf ICD-10-CM und Current-Procedural-Terminology-Codes, eine 1:1-Effekt-Übertragung auf das deutsche DRG-/OPS-/ICD-10-GM-System wird in den Originalarbeiten ausdrücklich nicht beansprucht. Der zweite Hebel ist die Codier-Prüfung gegen die Doku-Quellen: Das System prüft, ob ein vorgeschlagener Code im Akten-Material belegbar ist, und markiert Stellen, an denen die Codier-Begründung das Doku-Material überspringt. Diese Anwendung kommt der ärztlichen Verantwortungs-Logik strukturell näher als der Codier-Vorschlag, weil sie die ärztliche Doku als Wahrheits-Anker behandelt. Der dritte Hebel ist das MD-Anfragenmanagement: Eine Klinik mittlerer Größe bearbeitet pro Jahr im niedrigen vierstelligen Bereich Anfragen — KI-Pre-Reading reduziert die Akten-Lese-Zeit pro Anfrage in einer Größenordnung, die in den CAC-Reviews mit dreißig bis fünfzig Prozent indikativ angegeben wird. Diese Größenordnungen sind keine deutschen Klinik-Befunde; sie sind aggregierte Bandbreiten aus der Versorgungsforschung, gegen die jede konkrete Klinik-Implementierung im eigenen Audit zu prüfen ist.

Med Controlling und KI — drei Hebelstellen und drei strukturelle Risiken teilen denselben Synthesemechanismus, der in der Codierbegründung Wert trägt oder Maskierung ermöglicht. — Drei Hebel-Achsen, eine Mechanik — an jeder Verfahrens-Stelle läuft ärztlicher Klartext gegen ein Strukturwerk, und genau diese·aiomics

Drei Risiken aus demselben Synthese-Mechanismus

Das erste Risiko ist die Codier-Drift. CAC-Modelle codieren stochastisch nach der Verteilung ihres Trainings-Korpus; über Wochen verschiebt sich das Codier-Pattern weg von der ärztlichen Doku-Realität, wenn die Doku-Sprache im Haus mit dem Korpus driftet. Sichtbar wird die Drift erst, wenn der Medizinische Dienst eine Quote anschlägt — oder erst zwölf Monate später, wenn die Erlösbilanz das Pattern aggregiert. Die Standard-Empfehlung in den CAC-Reviews lautet periodische Stichproben-Audits; der Aufwand ist substanziell und in der Vergabematrix selten ausgewiesen. Das zweite Risiko ist die Halluzinations-Maskierung in der Codier-Begründung. Maynez et al. (2020) benennen zwei Klassen halluzinierter Aussagen in generativen Modellen: intrinsische, die der Quelle direkt widersprechen, und extrinsische, die der Quelle etwas hinzufügen, das weder bestätigt noch ausgeschlossen ist. Ji et al. (2023) konsolidieren in ihrer Survey für die ACM Computing Surveys den methodisch besonders schwer detektierbaren Sub-Modus: das Verschmelzen mehrerer quellengetreuer Fragmente zu einer synthetischen Aussage, die in keiner Einzel-Quelle steht. In der Codier-Begründung — also dem Begleit-Text, mit dem das System seinen Code-Vorschlag stützt — ist diese Aggregations-Klasse besonders gefährlich. Sie liest sich wie eine ärztlich vertretbare Synthese, sie zitiert plausibel klingende Doku-Stellen, und sie übersteht die ärztliche Routinen-Prüfung, weil die Sprachform die klinische Heuristik stillstellt. npj Digital Medicine benennt das Phänomen in Reviews 2024–2026 als „fluency-induced complacency“. NEJM AI-Reviews 2024–2026 berichten Halluzinations-Raten klinischer Sprachmodelle in der Bandbreite ein bis zehn Prozent — die genaue Höhe ist aufgaben- und modellabhängig, die Reviews aggregieren Studien unterschiedlicher Methodik. Wichtiger als die Rate ist die Detektions-Asymmetrie: Freie Halluzinationen werden von Klinik-Reviewer:innen relativ verlässlich erkannt, Aggregations-Halluzinationen deutlich seltener.

Häufiger Denkfehler: Codier-Geschwindigkeit ist das Hauptkriterium

Codier-Geschwindigkeit ist messbar, vergleichbar und steht in jeder Anbieter-Demonstration auf der ersten Folie. Die Stelle, an der das Medizincontrolling tatsächlich Geld lässt oder gewinnt, sitzt eine Schicht tiefer: an der Belegbarkeit der Codier-Begründung im MD-Verfahren. Eine Klinik-KI, die schneller codiert, aber Begründungs-Texte schreibt, die im MD-Aktenvergleich nicht halten, verschiebt das Problem nur in die Zukunft. Die Bewertung gehört deshalb nicht auf die Geschwindigkeits-Achse, sondern auf die Belegbarkeits-Achse. Die Frage lautet nicht „wie viele Codes pro Stunde“, sondern „zeigt das System pro Code-Stelle den Doku-Beleg, oder synthetisiert es eine Begründung aus mehreren plausibel klingenden Akten-Stellen“.

Halluzinationsmaskierung in der Codierbegründung — flüssig formulierte Aggregationssynthese ist die gefährlichere Halluzinationsklasse, die Klinik-Reviewer seltener detektieren. — Die Codier-Begründung trägt das Risiko der Aggregations-Halluzination — die Sprachflüssigkeit ist der Vektor, nicht die·aiomics

Das dritte Risiko ist die Audit-Lücke im Provenienz-Pfad. Wenn das System einen Code vorschlägt, ohne pro Code-Stelle den Doku-Beleg zu zeigen, entsteht eine Stelle, an der die ärztliche Codier-Verantwortung im Aktenstrom keine Spur hinterlässt. ISO/IEC 42001 (2023) — die Norm zu AI-Management-Systemen — führt Provenienz, Audit-Trails, Risiko-Management und Aufsichts-Mechanismen als Pflicht-Bestandteile. Die Norm ist nicht klinikspezifisch, aber der strukturelle Rahmen ist auf Codier-KI-Anwendungen übertragbar. Eine Klinik, die eine Codier-KI beschafft, prüft deshalb nicht nur die Codier-Geschwindigkeit, sondern den Audit-Pfad: Lässt sich pro Code-Vorschlag nachvollziehen, welche Akten-Stelle den Beleg getragen hat; lässt sich pro Codier-Begründung der Synthese-Pfad zurückverfolgen; lässt sich der Audit-Trail in einem Stichproben-Audit so abrufen, dass die Codier-Fachkraft, die die Letzt-Verantwortung trägt, ihre Prüfung tatsächlich durchführen kann. Die drei Eigenschaften — Provenienz pro Code-Stelle, nachverfolgbare Synthese, abrufbarer Audit-Trail — sind keine Hochsicherheits-Disziplin; sie sind die strukturelle Voraussetzung dafür, dass die ärztliche Codier-Verantwortung im Sinne der Allgemeinen Kodier-Richtlinien überhaupt übernommen werden kann.

“Wirkung und Risiko teilen sich denselben Mechanismus — die Synthese-Fähigkeit des Modells, die in der Codier-Begründung Wert trägt und in derselben Begründung Maskierung erlaubt.”

Die Codier-Verantwortung: Position, kein Werbeversprechen

Die Deutsche Gesellschaft für Medizincontrolling (DGfM) positioniert das Medizincontrolling als ärztliche und kaufmännische Schnitt-Disziplin und betont die Codier-Verantwortung als nicht-delegierbare Letzt-Verantwortung. Die Deutsche Krankenhausgesellschaft (DKG) argumentiert in ihren Stellungnahmen zur Reform des Medizinischen Dienstes, dass die strukturelle Bindung der Klinik-Fachabteilungen durch MD-Anfragen substanziell ist und die personelle Wirkung im Medizincontrolling ein Standortfaktor wird. Aus beiden Positionen lässt sich eine Architektur-Wahl ableiten: Die Codier-KI bleibt eine Vorschlags- und Prüfungs-Schicht; die Codier-Entscheidung verbleibt operativ bei der ärztlichen Leitung beziehungsweise bei den vom Krankenhausträger benannten Codier-Fachkräften. Das System bringt das Material in eine Form, in der die ärztliche Prüfung kohärent durchführbar ist — pro Code-Stelle der Doku-Beleg, pro Codier-Begründung der Synthese-Pfad, pro Stichprobe der Audit-Trail. Diese Architektur-Wahl prägt auch die Codier- und Anfragen-Felder, die Aiomics als strukturierte Eingaben mit Quell-Verweis, mit Konsistenz-Prüfung gegen die ärztliche Doku und mit einer Audit-Schicht im Sinne von ISO/IEC 42001 gestaltet. Die ärztliche Codier-Verantwortung bleibt eine ärztliche Verantwortung; die Architektur entscheidet, ob sie übernehmbar bleibt.

Codier-KI im Medizincontrolling — die entscheidende Architekturfrage: Bleibt Codierverantwortung beim Menschen und ist pro Code-Stelle Dokumentationsbeleg und Auditpfad vorhanden? — Die Bewertung sitzt eine Schicht tiefer als die Geschwindigkeits-Folie — an der Architektur, mit der die Codier-Verantwortung·aiomics

Die drei Hebel und die drei Risiken sind keine vollständige Theorie der Codier-KI; sie sind eine pragmatische Auswahl aus dokumentierter Forschung und Verfahrens-Mechanik. Die zwei Bewegungen — Wirkung an drei Verfahrens-Stellen, Risiko an drei strukturellen Stellen — teilen sich denselben Mechanismus, weil das Modell, das die Synthese leistet, die Wirkung trägt und das Risiko erzeugt. Wer die Bewertung auf die Effizienz-Achse legt, verschiebt die Frage; wer sie auf die Architektur-Achse legt, beantwortet sie. Drei Stellen, an denen Wert entsteht — und drei Stellen, an denen die Klinik die Architektur baut, die ihr die Codier-Verantwortung trägt.

#Med Controlling KI#Medizincontrolling KI#Codier-KI Klinik#MD-Anfragenmanagement KI#Codier-Drift#Klinik-Codierung KI#Halluzinations-Maskierung#Codier-Verantwortung#ISO 42001 Klinik

Der Beitrag beschreibt drei dokumentierte Hebel-Stellen für Klinik-KI im Medizincontrolling und drei strukturelle Risiken, die aus demselben Synthese-Mechanismus entstehen. Die methodische Stütze stammt aus der computerlinguistischen Forschung zur Halluzinations-Klasse (Maynez et al. ACL 2020; Ji et al. ACM Computing Surveys 2023), aus klinischen Reviews zu Sprachmodell-Halluzinations-Raten (NEJM AI, npj Digital Medicine, 2024–2026), aus Reviews zu Computer-Assisted Coding (Journal of the American Medical Informatics Association, 2014–2024), aus den Verfahrens-Dokumenten des Instituts für das Entgeltsystem im Krankenhaus (InEK), den statistischen Berichten des Medizinischen Dienstes Bund, den Stellungnahmen der Deutschen Krankenhausgesellschaft (DKG) zur Reform des Medizinischen Dienstes, den Fachpublikationen der Deutschen Gesellschaft für Medizincontrolling (DGfM) sowie aus dem Strukturwerk ISO/IEC 42001 (2023) zu AI-Management-Systemen. Er gibt keine Rechtsauslegung zur Codier-Pflicht, zur DRG-Erlös-Bestimmung, zum MD-Verfahren oder zu medizinprodukte-rechtlichen Klassifikationen — die konkrete Bewertung im Einzelfall bleibt Sache der ärztlichen Leitung der Fachabteilung, der Geschäftsführung und der zuständigen Codier-Fachkräfte.

Med Controlling und KI: Wo der größte Hebel liegt, wo die Risiken sind

Drei Hebel-Achsen mit dokumentierter Wirkung

Drei Risiken aus demselben Synthese-Mechanismus

Die Codier-Verantwortung: Position, kein Werbeversprechen

Weiterlesen

Warum aiomics für QM-Berichte und Qualitätsanalytik

Arztbrief mit KI: was zwischen Entwurf und Unterschrift passieren muss

KI-Spracherkennung in der Klinik: das Wer-hat-was-gesagt-Problem

Diese Analyse stammt von den Leuten hinter Visite.

Sie möchten das in Ihrer Klinik sehen?