Was sich aus Freiburg und UKE über Klinik-KI-Implementierung lernen lässt
Das Universitätsklinikum Freiburg und das Universitätsklinikum Hamburg-Eppendorf (UKE) haben 2024–2025 KI-Sprachmodelle für Arztbriefe in den Regelbetrieb überführt.

Dr. Sven Jungmann
CEO

Eine Anbieter-Demo zu KI-Arztbriefen dauert zwei Minuten. Eine Klinik-KI-Implementierung in den Regelbetrieb dauert zwei Jahre. Beide werden in deutschen Häusern regelmäßig verwechselt. Wer im Mai 2026 als Geschäftsführung einer Misch-Klinik aus Akut- und Reha-Bereich die Beschaffungs-Frage zu KI-Sprachmodellen für Arztbriefe stellt, hat zwei publizierte deutschsprachige Implementations-Berichte als Anker zur Hand: das Universitätsklinikum Freiburg, das im September 2024 eine Pilot-Studie an der Klinik für Augenheilkunde mit einem hauseigen entwickelten Sprachmodell veröffentlicht hat, und das Universitätsklinikum Hamburg-Eppendorf (UKE), das ab Juli 2024 ein selbst entwickeltes Modell unter dem internen Namen ARGO auf einer Aufnahme-Station in den klinischen Regelbetrieb überführt hat. Aus beiden Berichten lassen sich fünf strukturelle Lehren herausarbeiten. Sie sind keine Aiomics-Beobachtungen aus eigenen Implementierungen — sie stehen in den publizierten Quellen der beiden Häuser. Was hier folgt, ist eine geordnete Lese-Hilfe, die zwischen Demo-Versprechen und Implementations-Realität unterscheidet.
Lehre 1 — Daten-Vorbereitung trägt die Implementierung, nicht das Modell allein
Die Pressemitteilung der Universitätsklinik Freiburg vom September 2024 beschreibt die Augenheilkunde-Pilotstudie der Universitätsklinik, in der ein hauseigenes Sprachmodell mit dem Projekt-Namen Bloom auf rund 150.000 historischen Arztbriefen aus dem eigenen Bestand trainiert wurde. Das Trainings-Korpus ist die strukturelle Voraussetzung der Studie — nicht das Modell. Eine vergleichbare Beobachtung trägt der Berichts-Beitrag im Deutschen Ärzteblatt vom Februar 2025: die ärztliche Bewertung der KI-Brief-Qualität fällt überwiegend praxistauglich aus, mit Korrektur-Pflicht durch die behandelnde Ärzt:in. Was hier in der Pilot-Phase trägt, trägt nicht ohne den Brief-Korpus, der vorher kuratiert vorliegt. Für ein gemischt aufgestelltes Haus im Frühjahr 2026 lautet die Lese-Frage damit nicht „funktioniert das Modell“, sondern „welcher Brief-Korpus liegt im eigenen Haus historisch in welcher Qualität vor“. Eine Klinik mit lückenhafter, in mehreren Quell-Systemen verstreuter Brief-Historie hat eine andere Vor-Strecke vor sich als eine Klinik mit einem konsolidierten elektronischen Korpus aus dem Krankenhaus-Informations-System (KIS). Die Vor-Strecke ist nicht der spektakuläre Teil der Implementierung — sie ist der Teil, der über die Tragfähigkeit der späteren Modell-Stufe entscheidet, und sie wird in keinem Anbieter-Pitch sichtbar.
Lehre 2 — eigene Modelle stehen 2026 neben Standard-Sprachmodellen
Beide deutschsprachigen Implementations-Berichte führen ein eigen-entwickeltes Sprachmodell. Bloom in Freiburg ist auf den hauseigenen Brief-Korpus trainiert; ARGO am UKE ist ein hauseigenes Sprachmodell, das laut den UKE-Pressemitteilungen seit Sommer 2024 auf einer ersten Station im Regelbetrieb läuft und in der frühen Einführungs-Phase rund zweihundert Ärzt:innen im klinischen Alltag erreicht. Dass beide Häuser einen Eigen-Modell-Pfad gewählt haben, ist nicht zufällig — die Fraunhofer-IAIS-Projekt-Dokumentation zum Arztbriefgenerator beschreibt den deutschsprachigen Klinik-Kontext als Bereich, in dem die spezifische Ausdrucks-Tradition der Arztbrief-Sprache, die hauseigenen Doku-Konventionen und die Datenschutz-Anforderungen den Eigen-Modell-Pfad nahelegen. Für eine Mischklinik im Mai 2026 trägt diese Lehre als Beschaffungs-Frage: trägt das eigene Haus den Eigen-Modell-Pfad, kommt ein Dritt-Modell mit hauseigener Anpassung in Frage, oder genügt eine direkte Anbieter-Übernahme — und welche der drei Varianten ist im laufenden Pilot-Plan überhaupt realistisch? Die Antwort hängt nicht primär an der Modell-Qualität — sie hängt an der eigenen Trägerstruktur, an der hauseigenen Daten-Verfügbarkeit und an der personellen Begleitung, die das Haus dauerhaft stellt. Eine Klinik, die Lehre 1 nicht trägt, kann Lehre 2 nicht eigenständig wählen.

Lehre 3 — Schulung und ärztliche Korrektur sind nicht Zubehör
Sowohl die Freiburger Pilot-Beschreibung als auch die UKE-Berichte halten fest, dass die ärztliche Korrektur fester Bestandteil der KI-Brief-Generierung bleibt. Das AOK-Interview mit Dario Antweiler vom Fraunhofer IAIS (2024) ordnet die Beobachtung deutschsprachig ein: KI-Briefe sind Entwürfe, die in der ärztlichen Schluss-Lektüre validiert, korrigiert und freigegeben werden. Die Schulung der Behandelnden — wie ein Entwurf gelesen wird, an welchen Stellen typische Modell-Fehler auftreten, welche Verantwortungs-Linie die Freigabe trägt — ist damit kein Anhang an die Implementation, sondern eine eigene Voraussetzung. Eine Mischklinik, die im eigenen Beschaffungs-Plan keine Schulungs-Linie führt, kauft ein KI-Werkzeug ohne die Bedienungs-Vor-Strecke, die der publizierte Regelbetrieb voraussetzt. Diese Lehre wirkt unspektakulär — und genau deshalb wird sie in Anbieter-Pitches selten als eigene Position ausgewiesen. Der Punkt ist nicht, dass die Schulung schwer wäre; der Punkt ist, dass sie ohne hauseigene Trägerschaft nicht entsteht und im Anbieter-Vertrag in der Regel nicht abrechenbar abgebildet ist.
Lehre 4 — schrittweise Einführung statt ganzhausige Schaltung
Die UKE-Berichte beschreiben einen Einführungs-Pfad, der im Juli 2024 auf einer Aufnahme-Station begann und im Lauf des folgenden Jahres in weitere Bereiche ausgedehnt wurde — keine ganzhausige Schaltung an einem Stichtag. Die Freiburger Studie blieb in der Pilot-Phase auf eine Klinik für Augenheilkunde fokussiert, und die publizierte Bewertung ist eine Pilot-Bewertung, keine ganzhausige Generalisierung. Beide Linien tragen die gleiche strukturelle Lehre: der schrittweise Pfad ist nicht Vorsicht aus Mangel an Vertrauen, er ist die Methode, die für jede neue Fach-Abteilung die Lehren 1 bis 3 in der jeweiligen Daten-, Modell- und Schulungs-Realität neu prüft. Eine Mischklinik führt die Frage damit nicht als „starten wir mit KI-Briefen im ganzen Haus“, sondern als „welche Aufnahme-Station, welche Fach-Abteilung trägt im eigenen Haus den ersten Einführungs-Schritt — und welche Endpunkte messen wir auf dieser Stufe, bevor die zweite folgt“. Eine Mischklinik unterscheidet sich von einer Universitätsklinik in zwei Punkten, die hier zusammenwirken: kleinere Fach-Abteilungen, geringere personelle Reserven für die Begleitung. Beide Punkte sprechen für eine engere Schritt-Folge, nicht gegen sie.

Lehre 5 — Mess-Disziplin trägt den Übergang in den Regelbetrieb
Die Freiburger Pilot-Studie trägt eine Verwendbarkeits-Bewertung der KI-Briefe als Endpunkt. Die UKE-Berichte führen Doku-Zeit, ärztliche Akzeptanz und Korrektur-Aufwand als beobachtete Größen. Die internationale Studienlage zur Ambient-Sprach-Doku — insbesondere Tierney und Kolleg:innen (NEJM AI, 2024) sowie Garcia und Kolleg:innen (JAMA Network Open, 2024) — zeigt, dass Doku-Zeit-Reduktion in randomisierten und prospektiven Studien beobachtbar ist, ohne dass Patient-Outcomes signifikant betroffen wären. Was beide Stränge zusammen tragen, ist eine Mess-Pflicht: Endpunkte werden vor dem Pilot-Beginn schriftlich definiert, im Pilot beobachtet und beim Übergang in den Regelbetrieb fortgeschrieben. Ohne diese Mess-Linie ist der Schritt aus dem Pilot in den Regelbetrieb eine Behauptung, keine Beobachtung. Ein Stanford-HAI-Bericht 2024 ordnet die Lage international: weniger als fünfzehn Prozent klinischer KI-Studien sind randomisiert, ein deutlicher Anteil bleibt retrospektiv — die hauseigene Mess-Disziplin schließt eine Lücke, die die publizierte Studienlage nicht von außen schließt. Für die Beschaffungs-Lese in der Mischklinik bedeutet das konkret: vor dem Pilot-Vertrag steht ein Endpunkt-Papier, das mindestens vier Größen führt — Doku-Zeit pro Brief, Korrektur-Aufwand pro Brief, ärztliche Verwendbarkeits-Quote, Zahl der Korrektur-Iterationen pro Brief. Wer diese vier Größen nicht vor dem Pilot definiert, hat nach dem Pilot keinen belastbaren Vergleich.
Was die fünf Lehren für die Mischklinik-Beschaffung im Mai 2026 verändern
Die fünf Lehren sind keine Bedenken-Liste. Sie sind eine geordnete Vorlage für die Beschaffungs-Lese: bevor ein Anbieter-Pitch zu Sprach-Modellen im Klinik-Kontext akzeptiert wird, werden die fünf Linien im eigenen Haus geprüft. Daten-Korpus — welche Brief-Historie liegt in welcher Qualität vor, in welchem Quell-System. Modell-Pfad — eigen entwickeltes Modell, Dritt-Modell mit hauseigenem Anpassungs-Schritt, direkte Anbieter-Übernahme. Schulungs-Linie — welche ärztliche Begleitung ist im Haus etabliert, welche fehlt. Einführungs-Pfad — auf welcher Station, in welchem Fachbereich beginnt die Einführung. Mess-Disziplin — welche Endpunkte werden vor Pilot-Beginn schriftlich definiert. Eine Klinik, die diese fünf Linien für sich selbst beantwortet hat, liest die Anbieter-Demo in der Folge anders: nicht als Vorhersage über das eigene Haus, sondern als Hinweis auf einen Werkzeug-Ausschnitt aus einer Implementations-Realität, deren strukturelle Voraussetzungen die Klinik selbst tragen muss.

Eine letzte Beobachtung am Rand. Beide deutschsprachigen Häuser publizieren ihre Implementations-Erfahrung mit einer Offenheit, die in der Anbieter-Markt-Kommunikation selten vorkommt — Pilot-Stichprobe genannt, Korrektur-Pflicht benannt, Schritt-Folge der Einführung dokumentiert. Wer als Geschäftsführung einer Mischklinik im Mai 2026 die nächste Pitch-Schicht angeht, hat in dieser publizierten Offenheit eine Vergleichs-Linie, die der Pitch selbst nicht zur Verfügung stellt: was eine Universitätsklinik öffentlich über ihren eigenen Implementierungs-Pfad sagt, gegen das, was eine Anbieter-Folie zur eigenen Schaltung in einem fremden Haus impliziert. Die fünf Lehren sind in dieser Lese-Disziplin nicht das Resultat — sie sind ihre Eingangs-Frage. Die Demo zeigt zwei Minuten. Der Übergang in den Regelbetrieb füllt zwei Jahre. Wer die fünf Linien aus Freiburg und UKE in der eigenen Beschaffungs-Lese führt, hat den Unterschied vor sich liegen, statt ihn nachträglich aus dem Pilot-Verlauf zu lesen.
Der Beitrag bezieht sich auf publizierte Quellen der Universitätsklinik Freiburg (Pressemitteilung September 2024 zur Pilot-Studie an der Klinik für Augenheilkunde, Berichts-Beitrag im Deutschen Ärzteblatt Februar 2025) und des Universitätsklinikums Hamburg-Eppendorf (UKE, Pressemitteilungen und Implementierungs-Berichte 2024–2025 zum ARGO-Sprachmodell), ergänzt um Forschungs-Quellen aus dem Fraunhofer IAIS, NEJM AI, JAMA Network Open und Stanford HAI. Die Aussagen über die beiden Häuser stammen ausschließlich aus diesen publizierten Quellen — der Beitrag macht keine Aiomics-Eigenbehauptungen über Freiburg oder UKE. Pilot-Befunde sind monozentrisch und nicht eins zu eins auf andere Häuser übertragbar; ärztliche Korrektur bleibt fester Bestandteil der Brief-Generierung. Der Beitrag gibt keine Anbieter-Empfehlung, keine Beschaffungs-Beratung und keine Rechtsauslegung. Keine Aiomics-internen Allowlist-Claims (AI-1 bis AI-4) im Body aktiviert.


