Es liegt nicht am Modell: ein WEF-Standpunkt zur Datenarchitektur, genau gelesen
Wenn klinische KI enttäuscht, lautet der Reflex: ein besseres Modell. Ein Essay des Weltwirtschaftsforums verortet den Engpass eine Ebene tiefer, in den Daten. Die Intuition stimmt. Der Bauplan ist eine Meinung, und seine einzige harte Zahl belegt Schmaleres.

Dr. Sven Jungmann
CEO

Wenn ein klinisches KI-Werkzeug auf Station enttäuscht, lautet die übliche Antwort: ein besseres Modell beschaffen. Das neuere Basismodell ausprobieren, die Prompts feinjustieren, auf die nächste Version warten. Ein im Januar 2026 vom Weltwirtschaftsforum veröffentlichter Standpunkt vertritt ein leiseres Argument, das es wert ist, kurz innezuhalten: Das Modell ist selten der entscheidende Engpass. Die Daten darunter sind es meist.
Es lohnt sich, genau zu benennen, was dieser Text ist, denn davon hängt ab, wie viel er tragen kann. Es ist keine Studie. Es ist ein Essay von Gianrico Farrugia, dem Vorstandsvorsitzenden der Mayo Clinic, unter Mitwirkung eines Mayo-Kollegen sowie von Peter Lee von Microsoft. Es gibt keinen Datensatz, keinen Vergleichsarm, keinen vorab festgelegten Endpunkt — es ist ein Positionspapier von Menschen, die die beschriebenen Systeme bauen und verkaufen. Das macht es nicht falsch. Es heißt aber, dass wir es als fundiertes Argument lesen, nicht als Evidenz.
Das Argument des Essays
Die Kernthese ist schlicht und nach meiner Erfahrung auf Station weitgehend richtig. Gesundheitsdaten sind über Jahrzehnte aus inkompatiblen Systemen, abgeschotteten Akten und veralteter Infrastruktur zusammengewachsen. Dieses Sediment, so die Autoren, sperre KI in eng umrissene Einzelwerkzeuge und verhindere jene Systeme, die über die gesamte Breite einer Akte hinweg schlussfolgern, lernen und handeln könnten. Ihre Verordnung ist eine Architektur, keine Anwendung: eine einheitliche Pipeline, die Daten in Echtzeit bereinigt und etikettiert; Daten, die durch Vektorisierung und Wissensgraphen (ein Netz aus Knoten und Beziehungen zwischen Diagnosen, Medikamenten und Kontraindikationen) für Maschinen navigierbar werden; eine Speichergrundlage für sämtliche Modalitäten; und eine Daten-Fabric, die Zugriff, Sicherheit und Datenschutz über das Ganze hinweg regelt.
Nimmt man das Vokabular weg, ist die Intuition tragfähig. Eine elektronische Akte, gebaut, um zu dokumentieren, was geschah — in der Reihenfolge der Eingabe, zum Zweck von Abrechnung und Revision —, ist ein schlechter Untergrund für ein System, das über den aktuellen Zustand einer Patientin schlussfolgern soll. Ein Modell kann nicht prüfen, ob es genug Information zum Handeln hat, wenn es keine strukturierte Repräsentation gibt, die es abfragen kann. In diesem Punkt sind sich die Autoren und jede behandelnde Person, die einen vielversprechenden Piloten im Datenextraktions-Stau hat stranden sehen, vollkommen einig.
Wo die Evidenz endet
Die Lücke liegt zwischen der Intuition und dem Bauplan. Der Essay präsentiert eine bestimmte vierteilige Architektur als Weg zu sicherer, autonomer, schlussfolgernder KI — und liefert als Beleg genau ein quantifiziertes Ergebnis. Vorhersagewerkzeuge wie CHARTWatch am St. Michael's Hospital in Toronto, heißt es, hätten die unerwartete Sterblichkeit auf der internistischen Station um 26 Prozent gesenkt.
Diese Zahl ist real, und sie ist gut. Sie stammt aus einer Studie im Canadian Medical Association Journal mit 13.649 Patient:innen: Die Zahl nicht-palliativer Todesfälle sank nach Inbetriebnahme des Frühwarnmodells von 2,1 auf 1,6 Prozent — eine relative Senkung um 26 Prozent, im Vorher-Nachher-Vergleich mit Stationen, die es nicht nutzten. Doch lesen Sie, was sie tatsächlich zeigt. CHARTWatch ist ein einzelnes, in Betrieb befindliches Risikomodell, das auf routinemäßig erfassten Aktendaten läuft — also genau jenen Daten aus der Dokumentationsära, die der Essay für unzureichend hält. Sein Erfolg belegt, dass ein fokussiertes Werkzeug, gut in eine klinische Reaktion eingebettet, Leben retten kann. Er belegt nicht, dass die vorgeschlagene Architektur aus Wissensgraph und Daten-Fabric das Ergebnis erbracht hat, noch dass autonome Schlussfolgerungssysteme diese Architektur benötigen. Die einzige harte Zahl des Textes stützt eine schmalere — und ermutigendere — Aussage als die Architektur, zu deren Verteidigung sie aufgeboten wird.
“Die Intuition, dass die Datenebene der Engpass ist, trägt. Der vierteilige Bauplan darüber ist ein Argument, kein Befund.”
Warum das hier zählt
Für eine europäische Leserin ist das Nützliche die Umdeutung, nicht die Einkaufsliste. Die richtige Frage an jede Beschaffung klinischer KI lautet weniger, welches Modell auf einem Benchmark am besten abschneidet, als vielmehr: Welche Daten braucht dieses System, in welcher Struktur, um auf unseren Stationen sicher zu funktionieren? Vieles davon ist in anderer Sprache längst im Gange: In Deutschland setzt das Interoperabilitätsgesetz eine regulatorische Grundlage für die einheitliche Pipeline, und Standards wie Fast Healthcare Interoperability Resources (FHIR) leisten echte Arbeit dabei, Akten maschinenlesbar zu machen. Der Essay benennt eine tatsächlich fehlende Ebene — klinisch strukturierte, abfragbare Daten —, ohne zu belegen, dass sein konkreter Entwurf der einzige Weg dorthin ist.
Eine Einschränkung gehört offen ausgesprochen. Die beschriebene Architektur deckt sich eng mit den Cloud-, Daten- und KI-Plattformen, die die Organisationen der Autoren selbst verkaufen. Der Interessenkonflikt ist nicht verborgen, und das Argument kann unabhängig davon stichhaltig sein. Doch ein Bauplan, der zufällig den Stapel des Anbieters voraussetzt, gewinnt sein Gewicht erst, wenn ein unabhängiges Team auf einem anderen klinischen Nutzen schafft. Die ehrliche Fassung der These ist die bescheidene: Bevor Sie das Modell verantwortlich machen, sehen Sie sich die Daten an, die es bekommen hat. Das ist es wert, an die Wand zu schreiben.
Quelle: Farrugia G, unter Mitwirkung von Callstrom M und Lee P. AI can transform healthcare – if we transform our data architecture. World Economic Forum, 14. Januar 2026. Ein Standpunkt-Essay ohne Primärdaten, verfasst von Führungspersonen aus Organisationen, die die befürworteten Plattformen selbst entwickeln; seine einzige quantifizierte Aussage stammt aus einer unabhängigen Vorher-Nachher-Studie zu einem einzelnen, in Betrieb befindlichen Modell.


