18. Mai 20264 Min. Lesezeit

Was Patient:innen wirklich Vertrauen in medizinische KI gibt

Wenn Patient:innen entscheiden, ob sie ein KI-gestütztes Gerät nutzen, ist die überzeugendste Angabe nicht der Genauigkeitswert und nicht das Datenschutzkonzept. Ein Befragungsexperiment hat gemessen, was wirklich überzeugt — ernüchternd für alle, die solche Technik bauen.

Dr. Sven Jungmann

CEO

Editorial-Collage: die Hand einer Patientin hält ein gedrucktes Geräteetikett, gerahmt von einem Tealrechteck und einem navyfarbenen Zulassungssiegel, dazu ein einzelner Amber-Akzent auf einer Zeile.

Fragen Sie eine Entwicklerin, was Patient:innen Vertrauen in eine medizinische KI geben sollte, hören Sie von der Validierung, von der Fläche unter der Grenzwertoptimierungskurve, von der Datenschutzarchitektur. Fragen Sie 340 Patient:innen, kehrt sich die Rangfolge um. In einem Befragungsexperiment von Teams der Mayo Clinic und der Yale School of Medicine war die überzeugendste einzelne Angabe, dass eine Zulassungsbehörde zugestimmt hatte — sie erhöhte die Wahrscheinlichkeit, einem Gerät zu vertrauen, um 19,3 Prozentpunkte. Die externe Validierung, um die sich die Methodik zu Recht sorgt, bewegte das Vertrauen um 2,76 Punkte. Der Abstand zwischen diesen beiden Zahlen ist die ganze Studie.

Man sollte genau sein, was diese Arbeit ist, denn das bestimmt, was sie aussagen kann und was nicht. Sie ist keine Geräteprüfung. Sie ist ein Präferenzexperiment: ein Discrete-Choice-Experiment, kombiniert mit einem Einzelprofil-Faktorexperiment, in dem die Teilnehmenden simulierte einseitige Etiketten für ein hypothetisches KI-gestütztes Herz-Kreislauf-Gerät verglichen und bewerteten. Niemand benutzte ein echtes Produkt; für niemanden stand eine echte Diagnose auf dem Spiel. Gemessen wurde, was Patient:innen beim Lesen eines Etiketts angeben, überzeugend zu finden — eine Frage der Kommunikation, nicht der klinischen Leistung.

Was die Evidenz belegt

Innerhalb dieser Grenzen sind die Befunde sauber und stimmig. Vier Informationselemente bewegten das Vertrauen am stärksten: regulatorische Zulassung (+19,3 Prozentpunkte), hohe Geräteleistung (+16,6), ärztliche Aufsicht (+15,5) und der Mehrwert gegenüber der Standardversorgung (+14,1). Dieselben vier dominierten die Akzeptanz, dort lag die ärztliche Aufsicht vorn (+17,9). Ein zweites Experiment, ausgewertet über Chancenverhältnisse, erzählte dasselbe: Diese Elemente erhöhten Glaubwürdigkeit und Nutzungsabsicht, während Angaben zu Datenschutz und Sicherheitsüberwachung kaum etwas bewegten. Die Etiketten galten den meisten zudem als gut lesbar und verständlich.

Das Muster ist einleuchtend, sobald man es ausspricht. Patient:innen verankern Vertrauen an Signalen, die aus einer Laienperspektive etwas bedeuten: Ein Mensch bleibt verantwortlich, eine Behörde hat zugestimmt, das Gerät hilft nachweislich. Die technischen Garantien, die den Entwickelnden und Regulierenden am wichtigsten sind — wie das Modell validiert, wie Daten geschützt wurden —, fallen dagegen schwach ins Gewicht. Das ist kein Irrtum der Patient:innen. Es erinnert daran, dass Vertrauen und Qualität verschiedene Größen sind und dass das Etikett, das am meisten Vertrauen erzeugt, nicht zwangsläufig am besten Gerät klebt.

Was die Evidenz nicht belegt

Hier muss man als sorgfältige Leserin die Linie halten. Die Studie misst Überzeugungskraft, nicht Kalibrierung. Sie sagt, welche Worte das Zutrauen einer Patientin heben; sie sagt nichts darüber, ob dieses Zutrauen berechtigt ist, denn jedes Etikett beschrieb dasselbe fiktive Gerät. Der Befund, „regulatorische Zulassung“ sei der stärkste Vertrauenshebel, ist leichtfertig gelesen eine Einladung, jedes Patient:innengespräch mit dem Zulassungssiegel zu eröffnen — auch bei Produkten, deren Zulassung wenig über die Genauigkeit im Alltag aussagt. Der ehrliche Umgang mit dieser Evidenz ist das Gegenteil: Zu wissen, dass die Zulassung unverhältnismäßig schwer wiegt, ist ein Grund, sehr genau zu prüfen, was eine Zulassung tatsächlich bescheinigt, bevor man sie ins Feld führt.

Die Subgruppen schärfen den Punkt und verlangen Vorsicht. Patient:innen ab 55 Jahren reagierten weit stärker auf Angaben zur ärztlichen Aufsicht als jüngere (ein Effekt von 23,4 Punkten gegenüber 10,3; p < 0,001) — ausgerechnet die Gruppe, die am ehesten mit KI-gestützter kardiologischer Überwachung in Berührung kommt, braucht die ausdrückliche Rückversicherung, dass ein Mensch die Kontrolle behält. Frauen reagierten stärker auf Leistungs- und Zulassungsangaben; Personen, die sich nicht-weißen Bevölkerungsgruppen zurechneten, stärker auf den Mehrwert des Geräts. Das sind echte Hinweise, dass eine Botschaft nicht für alle passt, doch sie stammen aus einer einzigen, online rekrutierten Gelegenheitsstichprobe, fast durchweg krankenversichert, niemand vor einer realen Entscheidung. Es sind Hypothesen für zugeschnittene Kommunikation, keine gesicherten Aussagen über Bevölkerungsgruppen.

“Die Studie misst, welche Worte das Zutrauen einer Patientin heben. Sie sagt nichts darüber, ob dieses Zutrauen berechtigt ist — jedes Etikett beschrieb dasselbe fiktive Gerät.”

Eine Koinzidenz, die man benennen sollte

Die Arbeit wurde vollständig von der US-amerikanischen Food and Drug Administration finanziert, mit 712.431 US-Dollar. Dass eine Studie „regulatorische Zulassung“ als stärksten einzelnen Treiber für Patientenvertrauen findet — finanziert von der Behörde, deren Zulassung zur Debatte steht —, ist ein Zusammentreffen, das man schlicht aussprechen und die Leserin abwägen lassen sollte. Die Autor:innen legen es offen; es entwertet ein Präferenzergebnis nicht, gehört aber in jede faire Lesart.

Warum das hier zählt

Für Ärzt:innen in Deutschland und Europa ist die praktische Übersetzung direkt und unspektakulär. Wenn Sie mit einer Patientin über ein KI-gestütztes Gerät sprechen, landen die menschlichen Signale: dass Sie verantwortlich bleiben, dass eine kompetente Behörde es nach der Medizinprodukteverordnung (MDR) bewertet hat, dass es etwas zum üblichen Weg hinzufügt. Die Genauigkeitswerte und Datenschutzdetails, die Beschaffungsunterlagen beherrschen, zählen für das Gegenüber weniger — was die Last auf die Ärztin verschiebt, sie selbst geprüft zu haben, damit das Vertrauen, das diese einfacheren Signale erzeugen, verdient und nicht bloß hergestellt ist. Zu wissen, was eine Patientin beruhigt, nützt nur, wenn man zuvor sichergestellt hat, dass die Beruhigung zutrifft.

Quelle: Zhu X, Stroud AM, Minteer SA, et al. Key Information Influencing Patient Decision-Making About AI in Health Care: Survey Experiment Study. J Med Internet Res 2026;28:e75615. Finanziert von der US-amerikanischen Food and Drug Administration (712.431 US-Dollar). Ein US-amerikanisches Präferenz-Befragungsexperiment mit einer einzigen Stichprobe und simulierten Etiketten für ein hypothetisches Gerät: Es misst, was Patient:innen als überzeugend angeben, nicht, ob ein reales Gerät hält, was es verspricht.

#Journal Club#Klinische KI#Patientenvertrauen#Evidenzbasierte Medizin#Gesundheitskommunikation

Was Patient:innen wirklich Vertrauen in medizinische KI gibt

Was die Evidenz belegt

Was die Evidenz nicht belegt

Eine Koinzidenz, die man benennen sollte

Warum das hier zählt

Weiterlesen

Warum aiomics für QM-Berichte und Qualitätsanalytik

Warum aiomics für Kodiervorschläge und die §301-Vorbereitung

Warum aiomics für Entlassbriefe und Arztbriefe

Diese Analyse stammt von den Leuten hinter Visite.

Sie möchten das in Ihrer Klinik sehen?