Was Patient:innen von klinischer KI erwarten: Erklärbarkeit und eine Ärztin, die entscheidet
Die bislang größte Befragung von Krankenhauspatient:innen zu medizinischer KI — 13.806 Menschen, 43 Länder — zeigt: Die Schlagzeile ist nicht Begeisterung. Es sind zwei Bedingungen: zeigt mir, wie es schließt, und lasst eine Ärztin entscheiden.

Dr. Sven Jungmann
CEO

Die Zahl, bei der man innehalten sollte, ist nicht, wie viele Patient:innen medizinische KI mögen. Es ist, wie wenige ihr zutrauen, vorherzusagen, wie eine Behandlung bei ihnen verlaufen wird: 41,8 Prozent. Bei nahezu allen anderen Fragen waren die Befragten wohlwollender, als es die Debatte über KI gewöhnlich unterstellt — 71,4 Prozent würden sogar eine Einrichtung bevorzugen, die KI-Software einsetzt, deutlich mehr, als sich überhaupt grundsätzlich positiv äußern. Doch je näher die Technik an eine Aussage über den eigenen Körper rückte, desto kühler wurde dieses Wohlwollen. Dieser Verlauf, mehr als jeder einzelne Zustimmungswert, ist der eigentliche Befund.
Die Untersuchung ist eine Querschnittsbefragung des COMFORT-Konsortiums, geleitet von der Technischen Universität München und der Charité Berlin und in JAMA Network Open veröffentlicht. Zwischen Februar und November 2023 wurden 13.806 Antworten von Krankenhauspatient:innen an 74 Kliniken in 43 Ländern erhoben, in 26 Sprachen, darunter Deutsch — rund zwei Drittel aus dem Globalen Norden, ein Drittel aus dem Globalen Süden. Als Bild dessen, was Patient:innen über klinische KI sagen, ist sie die bislang umfassendste, die wir haben.
Was erhoben wurde
Es handelt sich um eine Befragung, nicht um einen Versuch — und diese Unterscheidung bestimmt, wie viel jede Zahl tragen kann. Ein Instrument mit 26 Punkten fragte nach Vertrauen in KI, KI in der Diagnostik sowie Präferenzen und Sorgen, mit Untergruppenmodellen für Alter, Geschlecht, Bildung, Gesundheitszustand und technische Vertrautheit. Entscheidend: Es war eine nicht-zufällige Stichprobe — Papierfragebögen, die in Kliniken ausgegeben und ausgehängt wurden und von denjenigen ausgefüllt wurden, die wollten und konnten. Das erreicht die Bereitwilligen und die Schreibgewandten und ergibt keinen repräsentativen Querschnitt der Bevölkerung eines Landes. Die Autor:innen sind offen: Niedrige Rücklaufquoten und Selektionsverzerrung sind wahrscheinlich, und die Rekrutierung lief überwiegend über radiologische Abteilungen, die eher ambulante, stabile und für Diagnostik bereits sensibilisierte Patient:innen sehen. Die Prozentwerte beschreiben die Menschen, die geantwortet haben, nicht die Bürger:innen insgesamt. So gelesen sind sie aufschlussreich; als Abstimmung gelesen würden sie in die Irre führen.
Was die Evidenz belegt
Die Grundhaltung ist verhalten positiv: 57,6 Prozent der Befragten äußerten eine insgesamt positive Einstellung zu KI im Gesundheitswesen. Doch die beiden klarsten Signale handeln gar nicht von Begeisterung — sie handeln von Bedingungen. 70,2 Prozent bevorzugten ein KI-System, dessen Schlussfolgerungen sie nachvollziehen können, ausdrücklich selbst um den Preis einer leicht geringeren Genauigkeit gegenüber einem undurchsichtigen Modell. Und gefragt, wie sie sich bei gleicher Genauigkeit von KI und Ärzt:innen entscheiden würden, bevorzugten 72,9 Prozent eine gemeinsame Vorgehensweise, bei der die behandelnde Person die endgültige Entscheidung trifft. Nur 4,4 Prozent wünschten sich eine vollständig autonome KI in der Diagnostik, nur 6,6 Prozent eine ärztliche Diagnose gänzlich ohne KI. Was Patient:innen verlangen, ist nachvollziehbares Schließen und ein Mensch, der verantwortlich bleibt — nicht die genaueste Blackbox auf dem Markt. Diese Erwartungen galten über Alter, Bildung und selbst eingeschätztes KI-Wissen hinweg, nicht nur in einer skeptischen Minderheit.
Die Vertrauenswerte schärfen den Punkt. Als zweites Augenpaar war KI akzeptiert — 67,9 Prozent vertrauten ihr als Zweitmeinung für Ärzt:innen — doch deutlich weniger als Prognostikerin der eigenen Zukunft. Bei keinem der Vertrauensitems war mehr als die Hälfte der Befragten positiv gestimmt, und am niedrigsten von allen lag das Vertrauen darin, dass KI zutreffend über das eigene Ansprechen auf eine Behandlung informiert: 41,8 Prozent.
Was die Evidenz nicht belegt
Sie sagt uns nicht, was Patient:innen tun würden, nur, was sie sagen — und geäußerte Einstellungen sind ein schwacher Prädiktor für das Verhalten am Krankenbett, wo Angst, Krankheit und die Empfehlung einer vertrauten Ärztin sich einmischen. Sie spricht nicht für die Bevölkerungsgruppen, die sie nicht erreicht hat: Eine Gelegenheitsstichprobe in Kliniken verschiebt sich zu jenen, die ohnehin mit Versorgung befasst und in der Lage sind, einen schriftlichen Fragebogen auszufüllen. Die Heterogenität zwischen den Standorten war zudem so groß (Intraklassenkorrelation 0,22), dass die Autor:innen auf Ländervergleiche verzichteten; erhoben über 43 Gesundheitssysteme, erfasst die Studie einen Durchschnitt, der auf keines genau passen muss. Was eine Patientin in München von einem diagnostischen Werkzeug erwartet, erwartet eine Patientin in Lagos oder São Paulo nicht zwangsläufig. Die Autor:innen sind deutlich: Die Einführung sollte auf die lokalen Verhältnisse zugeschnitten werden, nicht von einem globalen Mittelwert abgelesen.
Ein Untergruppenergebnis verdient sorgfältige Beachtung, weil es einer bequemen Annahme widerspricht. Je kränker die Befragten, desto kühler die Haltung: 29,2 Prozent derjenigen, die ihre Gesundheit als sehr schlecht einstuften, hatten eher negative Ansichten zu medizinischer KI, gegenüber 5,3 Prozent derjenigen mit sehr gutem Gesundheitszustand. Gerade die Menschen, die diesen Systemen am ehesten begegnen werden, sind am wenigsten überzeugt. Das ist kein Grund, die Einführung zu verlangsamen; es ist ein Grund, sie nicht an den Gesunden und technisch Versierten auszurichten, die sich am leichtesten befragen lassen und die Station am wenigsten repräsentieren.
“Patient:innen verlangen nicht die genaueste Blackbox auf dem Markt. Sie verlangen ein Schließen, dem sie folgen können, und eine Ärztin, die verantwortlich bleibt.”
Warum das hier zählt
Für europäische Systeme, die abwägen, wo klinische KI hingehört, weist die Befragung weg von der üblichen Frage nach der reinen Leistung und hin zu zwei Gestaltungsanforderungen, die Patient:innen selbst benennen. Erklärbarkeit ist für sie keine regulatorische Feinheit, sondern eine Voraussetzung der Einwilligung. Und ärztliche Aufsicht ist keine Übergangsphase auf dem Weg zur Autonomie, sondern das, was die große Mehrheit aktiv bevorzugt. Ein Werkzeug, das genauer, aber undurchsichtig ist, oder eines, das die behandelnde Person aus der Entscheidung nimmt, optimiert auf etwas, das Patient:innen nicht verlangt haben. Die ehrliche Lesart ist bescheiden und brauchbar: Akzeptanz ist an Bedingungen geknüpft, die Bedingungen sind benennbar, und die am stärksten Betroffenen sind die Vorsichtigsten.
Quelle: Busch F, Hoffmann L, Xu L, et al. Multinational Attitudes Toward AI in Health Care and Diagnostics Among Hospital Patients. JAMA Network Open 2025;8(6):e2514452. Eine Querschnittsbefragung von Krankenhauspatient:innen mit nicht-zufälliger Stichprobe — groß und ungewöhnlich international, aber eine Stichprobe der Bereitwilligen statt einer repräsentativen Bevölkerung, überwiegend über radiologische Abteilungen rekrutiert, die geäußerte Einstellungen misst, nicht das Verhalten. Laut PubMed.


