Medizin
Künstliche Intelligenz im Gesundheitswesen

Künstliche Intelligenz (KI) nimmt im Bereich der medizinischen Forschung mittlerweile eine wichtige Rolle ein, weswegen eine Auseinandersetzung mit der »Arbeitsweise« von KI und deren Einsatz in der Medizin unverzichtbar ist. Der Artikel geht auf die Grundsätze von KI ein, gibt Beispiele aus der Praxis und weist auf die Bedeutung der Zuverlässigkeit, Robustheit und Effizienz der Algorithmen hin, die durch strenge Tests und Validierung nachgewiesen werden müssen. Zahlreiche Studien verdeutlichen den Vorteil einer gemeinsamen Leistung von klinischen Experten und KI, weshalb der Artikel einen Überblick über den aktuellen Stand medizinischer KI gibt, wichtige Durchbrüche zusammenfasst und übergreifende Trends aufzeigt.

Ärztinnen begutachten medizinisches Bildmaterial

Es ist noch gar nicht so lange her, dass das gesamte medizinische Wissen in nur einer Handvoll Bücher der erfahrensten Ärzte zusammengefasst werden konnte. Avicenna, ein persischer Universalgelehrter, der weithin als Vater der frühen modernen Medizin gilt, war einer der Pioniere dieser Ära. Sein Hauptwerk, der Kanon der Medizin, war eine medizinische Enzyklopädie, die an vielen mittelalterlichen Universitäten in Europa zu einem Standardwerk wurde und noch bis 1650 in Gebrauch war. Mit (gerade einmal) 5.700 Seiten galt der Kanon der Medizin damals als umfassende Sammlung des gesamten medizinischen Wissens.

Seit Avicennas Zeit hat sich der medizinische Fortschritt jedoch erheblich beschleunigt und spezialisiert. Im Jahr 2009 ging zum Beispiel der Nobelpreis für Medizin an Elisabeth Blackburn für ihre Entdeckung der Telomerase, die den Mechanismus der Zellalterung erklärt. Telomere, sich wiederholende Sequenzen an den Enden von Chromosomen, schützen Chromosomen vor DNA-Schäden und der Verschmelzung mit benachbarten Chromosomen. Die Erforschung von Telomeren und Telomerase ist für das Verständnis und die Behandlung von Krebs von entscheidender Bedeutung, da Krebszellen in der Regel mehr Telomerase besitzen als normale Zellen.

Im Jahr 2022 veröffentlichte allein die Zeitschrift Nature Aging 179 Artikel über die Zellalterung, und PubMed, eine der größten Onlinebibliotheken für Medizin, verzeichnet im gleichen Jahr über zwei Millionen neue, von Experten begutachtete wissenschaftliche Artikel. Die Herausforderung für praktizierende Ärzte besteht heute darin, mit dieser Flut neuer Informationen Schritt zu halten und sie effizient in der Patientenversorgung einzusetzen. Eine vielversprechende Lösung für diese Herausforderung ist der Einsatz von KI. Es handelt sich dabei um eine Sammlung von Technologien, die große Datenmengen effizient zusammenfassen kann, was sie zu einem wertvollen Werkzeug u.a. für viel beschäftigte Ärzte macht. Durch den Einsatz von KI-Algorithmen können Ärzte die neuesten medizinischen Erkenntnisse schnell erfassen, verarbeiten und sie mit maximaler Effizienz in der Patientenversorgung einsetzen. Da die Menge an medizinischem Wissen weiterhin in einem noch nie dagewesenen Tempo wächst, hat KI das Potenzial, zu einem immer wichtigeren Werkzeug für Ärzte zu werden, die in der medizinischen Praxis an der Spitze des Fortschritts stehen wollen.

Zitat

Mit KI-Algorithmen können Ärzte medizinische Erkenntnisse schnell erfassen, verarbeiten und sie effizient in der Patientenversorgung einsetzen.

@webroot/assets/icons/core/quote-close.svg
Dr. Narges Ahmidi

Wie lernt KI ein Konzept?

KI-Algorithmen lernen Konzepte, indem sie große Datensätze mit medizinischen Informationen analysieren, z.B. Patientenakten, medizinische Bilder und Laborergebnisse. Der Algorithmus identifiziert Muster in den Daten und erstellt ein Modell, das diese Muster erkennen und Vorhersagen treffen kann.

Um einen (überwachten) KI-Algorithmus zu trainieren, muss ihm ein großer, vorklassifizierter Datensatz zur Verfügung gestellt werden, d.h., jedem Datenpunkt wird eine bestimmte Kategorie oder „Etikett“ zugewiesen, beispielsweise eine Diagnose oder ein Behandlungsergebnis. Der Algorithmus verwendet dann diesen annotierten Datensatz, um ein Modell zu erstellen, das Muster erkennen und Vorhersagen machen kann.

Nach dem Training wird der Algorithmus mit neuen Daten getestet, die er noch nicht gesehen hat. Auf diese Weise lässt sich feststellen, wie gut der Algorithmus verallgemeinern kann und wie genau er die Ergebnisse neuer Eingaben vorhersagen kann. Der Testprozess ist von entscheidender Bedeutung, da er dazu beiträgt, etwaige Einschränkungen oder Verzerrungen („Bias“) des Algorithmus zu erkennen.

Bei der Validierung des KI-Algorithmus wird seine Leistung mit anderen, bereits entwickelten Algorithmen oder der menschlichen Leistung verglichen. Außerdem werden andere Datensätze verwendet, um die Fähigkeit des Algorithmus zur Verallgemeinerung und zur Erstellung genauer Vorhersagen zu testen. Wenn der Algorithmus besser abschneidet als andere Algorithmen und bei verschiedenen Datensätzen gleichbleibend gute Ergebnisse erzielt, gilt er als validiert.

Es ist wichtig, zu wissen, dass die Leistung von KI-Algorithmen stark von der Qualität und Vielfalt der Daten abhängt, die zum Trainieren und Testen der Algorithmen verwendet werden. Daher muss sichergestellt werden, dass die verwendeten Daten repräsentativ für die Bevölkerung und frei von Verzerrungen sind. Darüber hinaus ist es von entscheidender Bedeutung, dass ein menschlicher Experte die Vorhersagen des Algorithmus überprüft, um seine Genauigkeit und Sicherheit zu gewährleisten, bevor er in der klinischen Praxis eingesetzt wird.

Wie entwickeln Wissenschaftler KI-Systeme für das Gesundheitswesen?

KI umfasst eine Vielzahl von Algorithmen, die unterschiedlichste Funktion erfüllen. So gruppieren beispielsweise Clustering-Algorithmen Patienten mit ähnlichen Merkmalen in Untergruppen, Vorhersagealgorithmen prognostizieren das Ergebnis eines diagnostischen Tests, bevor dieser durchgeführt wird, Auto-Encoder-Algorithmen fassen riesige Datensätze in besser handhabbare Formate zusammen, und Reinforcement-Learning-Algorithmen bestimmen die optimale Abfolge von Aktionen, um z.B. Strategiespiele wie Schach zu gewinnen – oder auch Patientenbehandlungen erfolgreich abzuschließen. KI-Forscher im Allgemeinen setzen diese Algorithmen ein, wandeln sie ab oder erfinden neue, um bislang verborgene Muster in großen Datensätzen aufzudecken, Gewinnstrategien für interaktive Spiele zu entwickeln oder Informationen auf ihre wesentlichen Elemente zu verdichten. Dies ist grundsätzlich vergleichbar mit der Arbeit erfahrener Ärzte nach jahrelanger Praxis. KI erlernt diese Fähigkeiten durch die Analyse zahlreicher Datenproben, doch ohne Daten ist ihr Einsatz wenig hilfreich.

Deep-Learning-Modelle basieren auf dem Konzept neuronaler Zellen und können Daten in verschiedensten Formaten verarbeiten, so z.B. Zahlenreihen, Text, Bilddaten oder unterschiedlichste Kombinationen von Eingabearten.

Zitat

Deep-Learning-Modelle basieren auf dem Konzept neuronaler Zellen und können Daten in verschiedensten Formaten verarbeiten.

@webroot/assets/icons/core/quote-close.svg
Dr. Narges Ahmidi

Jüngste Studien greifen auf verschiedene reichhaltige Datenquellen zurück, z.B. molekulare Informationen, natürliche Sprache, medizinische Signale wie Elektroenzephalogramm-(EEG)-Daten, radiologische Bildgebung oder eben auch multimodale Daten.

Radiologie

KI-Algorithmen haben sich als sehr vielversprechend erwiesen, wenn es darum geht, Radiologen bei der Interpretation von CT- und MRT-Bildern (und anderen Formaten) für die Krankheitsdiagnose zu unterstützen. Sie haben die Genauigkeit bei radiologischen Aufgaben wie der Interpretation von Mammographien, der Beurteilung der Herzfunktion und der Lungenkrebsvorsorge erheblich verbessert, nicht nur in der Diagnose, sondern auch in der Risikovorhersage und der Behandlung.

Zitat

Es gibt inzwischen eine Vielzahl von Beispielen für erfolgreiche KI-Algorithmen für die Diagnose von Krankheiten anhand von Bilddaten.

@webroot/assets/icons/core/quote-close.svg
Dr. Narges Ahmidi

Es gibt inzwischen eine Vielzahl von Beispielen für erfolgreiche KI-Algorithmen für die Diagnose von Krankheiten anhand von Bilddaten.

Erkennung von Brustkrebs anhand von Mammogrammen

Ein von Forschern und mehreren akademischen Einrichtungen entwickelter KI-Algorithmus kann Brustkrebs anhand von Mammogrammen erkennen und klassifizieren. Der Algorithmus erreichte eine AUC (area under the curve) von 0,87 bei einer Validierungsgruppe und übertraf damit um 0,11 die Erfolgsquote aller sechs Radiologen in der Studie [1].

Erkennung von Lungenkrebs auf CT-Scans

In einer in Nature Medicine veröffentlichten Studie haben Forscher einen KI-Algorithmus entwickelt, der Radiologen bei der Erkennung von Lungenkrebs auf CT-Scans unterstützt. Der Algorithmus wurde anhand eines Datensatzes von über 42.000 CT-Scans von mehr als 14.000 Patienten trainiert. Die Forscher fanden heraus, dass der Algorithmus in der Lage war, Lungenknötchen genau zu erkennen und die Wahrscheinlichkeit von Krebs mit einer AUC von 0,94 vorherzusagen, womit er alle sechs Radiologen in der Studie übertraf. Damit zeigt die Studie das Potenzial von KI-Algorithmen zur Verbesserung von Genauigkeit und Effizienz in der Lungenkrebsvorsorge und -diagnose [1].

Diagnose von Netzhauterkrankungen

In einer 2018 in Nature Medicine veröffentlichten Studie beschreiben Forscher die Entwicklung eines Deep-Learning-Algorithmus, der Netzhauterkrankungen anhand von dreidimensionalen optischen Kohärenztomographie-Scans (OCT) diagnostizieren kann. Der Algorithmus wurde mit über 14.000 Scans trainiert und erreicht eine hohe Genauigkeit (AUC von 0,99), die sich als klinisch anwendbar in einer realen Umgebung erweist [2].

Koloskopie

Auch bei der Koloskopie, einem wichtigen Verfahren zur Erkennung von Darmkrebs, hat die KI Fortschritte gemacht. Hier kann KI vorhersagen, ob Kolonläsionen bösartig sind, mit einer Leistung, die der von erfahrenen Endoskopikern vergleichbar ist. Da Polypen und andere mögliche Krankheitsanzeichen bei solchen Untersuchungen häufig übersehen werden, wurden außerdem KI-Systeme entwickelt, die den Endoskopiker unterstützen. Solche Systeme verbessern nachweislich die Fähigkeit der Mediziner, Unregelmäßigkeiten zu erkennen. Hier sind einige Beispiele für solche KI-Systeme:

Ein weltweit führendes Medizintechnikunternehmen hat einen KI-Algorithmus zur Erkennung und Charakterisierung von kolorektalen Polypen während der Koloskopie entwickelt. Der Algorithmus analysiert Koloskopie-Bilder in Echtzeit und hebt Bereiche des Dickdarms hervor, die Polypen enthalten könnten.

In einer klinischen Studie entdeckte der Algorithmus 10% mehr Polypen (Genauigkeit von 83,2%) als die nicht-AI-gestützte Erkennung [3].

Ein japanisches multinationales Unternehmen für Fotografie und Bildgebung hat einen KI-Algorithmus entwickelt, der Endoskopiker bei der Identifizierung von Polypen während der Koloskopie unterstützt. Der Algorithmus analysiert die Bilder der Koloskopie und bietet eine »zweite Meinung« in Echtzeit, um potentiell übersehene Polypen zu erkennen. In einer klinischen Studie zeigte der Algorithmus eine Polypenerkennungsrate von 100% [4].

Pathologie

Im Bereich der Pathologie hat die KI große Fortschritte bei der Krebsdiagnose und der Gewinnung neuer Erkenntnisse über Krankheiten gemacht, vor allem durch die Verwendung von Ganzkörperbildgebung. Diese Algorithmen können große Mengen digitaler Bilder analysieren, um Muster und Anomalien zu erkennen, die für menschliche Pathologen möglicherweise nur schwer zu entdecken sind. Hier sind einige aktuelle Beispiele:

Vorhersage von Metastasen bei Brustkrebs

Im Jahr 2018 haben Forscher der Universität Stanford einen KI-Algorithmus entwickelt, der Brustkrebs mit einer ähnlichen Genauigkeit wie menschliche Pathologen (in dieser Studie 21 zertifizierte Dermatologen) erkennen konnte. Der Algorithmus analysiert digitale Bilder von Brustgewebeproben, um Krebszellen zu identifizieren und die Wahrscheinlichkeit einer Metastasierung vorherzusagen. Der Algorithmus wurde anhand über 100.000 Bildern trainiert und erreicht bei der Diagnose von Brustkrebs eine Genauigkeit von 94% [5].

Lungenkrebsdiagnose

Im Jahr 2020 nahmen zahlreiche Forscher an der BACH-Challenge teil, deren Ziel die Klassifizierung und Lokalisierung klinisch relevanter histopathologischer Klassen in Mikroskopie- und Ganzbildaufnahmen aus einem großen annotierten Datensatz war, der speziell für die Challenge zusammengestellt und öffentlich zugänglich gemacht wurde. Das siegreiche Team hat einen KI-Algorithmus entwickelt, der Lungenkrebs anhand von Pathologiebildern mit 87% Genauigkeit diagnostiziert. Der Algorithmus analysiert Bilder von Lungengewebeproben, um Krebszellen zu identifizieren und die Wahrscheinlichkeit einer Bösartigkeit vorherzusagen [6].


Prostatakrebsdiagnose

Ein von Forschern des Memorial Sloan Kettering Cancer Center gegründetes Start-up hat 2020 einen KI-Algorithmus entwickelt, der Prostatakrebs anhand von Pathologiebildern mit hoher Genauigkeit diagnostizieren kann. Der Algorithmus analysiert Bilder von Prostatagewebeproben, um auch hier Krebszellen zu identifizieren und die Wahrscheinlichkeit einer Bösartigkeit vorherzusagen. Der Algorithmus wurde anhand eines Datensatzes von über 44.000 Bildern bewertet und erreicht bei der Diagnose von Prostatakrebs eine Trefferquote von 98%. In einer unabhängigen Studie bewerteten Forscher aus Yale die Leistung des Paige-Prostate-Algorithmus anhand von Whole Slide Imaging (digitalisierten Objektträgern) von 1.876 Prostatabiopsien und erzielten eine Sensitivität von 97,7% und eine Spezifität von 99,3% [7].

Pflege auf der Intensivstation

Intensivstationen sind komplexe Umgebungen, in denen Patienten mit schweren Krankheiten oder Verletzungen engmaschig überwacht und speziell betreut werden müssen. KI-Algorithmen haben sich als vielversprechend erwiesen, wenn es darum geht, die Pflege auf der Intensivstation zu verbessern, indem sie in Echtzeit Einblicke in Patientendaten geben und unerwünschte Ereignisse vorhersagen, wie die folgenden Beispiele zeigen:

Klinische Entscheidungshilfe in Echtzeit

In einer 2018 veröffentlichten Studie haben Forscher einen KI-Algorithmus entwickelt, der Klinikern auf der Intensivstation klinische Entscheidungshilfen in Echtzeit bietet. Der Algorithmus wurde anhand von Daten von über 17.000 Intensivstationen und deren elektronischen Gesundheitsakten trainiert. Der Algorithmus ist in der Lage, Patientenergebnisse genau vorherzusagen und Empfehlungen für klinische Maßnahmen in Echtzeit zu geben. Die Studie zeigt das Potenzial von KI-Algorithmen zur Verbesserung der klinischen Entscheidungsfindung auf der Intensivstation und zur Senkung der 90-Tage-Sterblichkeitsrate [8].


Frühzeitige Vorhersage von Sepsis auf der Intensivstation

Sepsis ist ein lebensbedrohlicher Zustand, der auftritt, wenn die Reaktion des Körpers auf eine Infektion eine Entzündung im gesamten Körper verursacht. Die frühzeitige Erkennung und Behandlung von Sepsis ist entscheidend für die Verbesserung der Patientenergebnisse. In einer Studie von 2015 entwickelten Forscher einen KI-Algorithmus zur Vorhersage von septischen Schocks auf der Intensivstation. Der Algorithmus wurde anhand von elektronischen Gesundheitsakten von über 26.000 Intensivstationen trainiert. Die Forscher ermittelten, dass der Algorithmus einen septischen Schock bis zu 28 Stunden im Voraus mit hoher Genauigkeit vorhersagen kann. Eine Folgestudie an fünf Krankenhäusern wurde 2022 veröffentlicht. Gemäß einer Analyse von 6.877 Patienten mit Sepsis, die durch diesen sog. TREWS-Alarm identifiziert (und innerhalb von drei Stunden medizinisch bestätigt) wurden, bevor eine Antibiotikatherapie eingeleitet wurde, waren die Sterblichkeitsrate im Krankenhaus und das Organversagen geringer [9].

Pharmakologische Forschung

Die Entwicklung von Arzneimitteln ist ein komplexer und zeitaufwändiger Prozess, bei dem sich KI-Algorithmen als vielversprechend erwiesen haben, um die Entdeckung neuer Arzneimittel zu beschleunigen und den Bedarf an kosten- und zeitaufwändigen Experimenten zu verringern. Hier sind einige Beispiele für erfolgreiche KI-Algorithmen in der Arzneimittelforschung:

Entwerfen neuer Moleküle

In einer in „Science“ veröffentlichten Studie haben Forscher generative adversarial networks (GANs), eine Art Deep Learning Network, verwendet, um neue Moleküle mit gewünschten Eigenschaften zu entwerfen. Die GANs wurden anhand eines Datensatzes von über zehn Billionen arzneimittelähnlichen Molekülen und den damit verbundenen Eigenschaften trainiert. Die Forscher nutzten die GANs, um neue Moleküle mit spezifischen Eigenschaften zu entwickeln, z.B. mit hoher Wirksamkeit gegen ein bestimmtes Protein oder mit geringer Toxizität. Anschließend wurden die vielversprechendsten Verbindungen in vitro synthetisiert und getestet und dabei konstatiert, dass viele von ihnen die gewünschten Eigenschaften aufweisen [10].
Identifizierung potenter Hemmstoffe

Im Jahr 2020 hat ein auf KI für Arzneimittelforschung spezialisiertes Unternehmen die erfolgreiche Entwicklung eines neuartigen niedermolekularen DDR1-Inhibitors (DNA damage response) bekannt gegeben, der mit Hilfe der KI-Plattform GENTRL (Generative Tensorial Reinforcement Learning Network) entwickelt wurde. Der Wirkstoff erwies sich als wirksam bei der Hemmung von DDR1 in vitro und in vivo und zeigte in präklinischen Studien vielversprechende Ergebnisse bei der Behandlung von Fibrose. Bemerkenswert ist dabei, dass der Wirkstoff in nur 21 Tagen entdeckt und in 46 Tagen experimentell getestet wurde – eine drastische Beschleunigung eines Prozesses, der normalerweise mehrere Jahre dauert [11].

Krebstherapie

Weitere KI-Algorithmen sind entwickelt worden, um in der Krebstherapie zu helfen, z.B. bei der Vorhersage des Ansprechens von Patienten auf die Behandlung, der Ermittlung optimaler Arzneimittelkombinationen oder der Personalisierung von Behandlungsplänen. Einige Beispiele in diesem Gebiet sind:

Entscheidungshilfe für Behandlungen

Ein KI-System, das Onkologen hilft, Behandlungsentscheidungen für Krebspatienten zu treffen. Das System nutzt Algorithmen zur Sprachverarbeitung, um medizinische Unterlagen eines Patienten zu analysieren, einschließlich der Pathologie- und Radiologieberichte, und bietet evidenzbasierte Behandlungsoptionen auf der Grundlage der neuesten medizinischen Literatur und Leitlinien. In einer Studie mit 638 Brustkrebsfällen hat das System in 93% der Fälle die gleiche Behandlung wie menschliche Onkologen empfohlen [12].

Überlebensvorhersage bei Lungenkrebs

Forscher der Stanford University haben einen KI-Algorithmus entwickelt, der das Überleben von Lungenkrebspatienten anhand von CT-Scans vorhersagen kann. Der Algorithmus nutzt Deep-LearningTechniken, um CT-Scans zu analysieren und Merkmale zu identifizieren. In einer Studie mit 1.010 Lungenkrebspatienten hat der Algorithmus in mehreren internationalen Datensätzen dabei einen Konkordanzindex von 0,62 erreicht. Der Algorithmus identifizierte auch weitere relevante Vorhersagemerkmale, darunter Größe und Textur von Tumoren [13].

Wearables

Wearables – am Körper tragbare elektronische Kleingeräte – sind in den letzten Jahren immer beliebter geworden und es wurden KI-Algorithmen entwickelt, um die von diesen Geräten erzeugten riesigen Datenmengen zu interpretieren. Hier sind einige Beispiele für erfolgreiche KI-Algorithmen im Bereich der Wearables:

Vorhersage von epileptischen Anfällen

Ein Forscherteam der Mayo Clinic hat einen KI-Algorithmus entwickelt, der die Daten eines tragbaren Geräts nutzt, um epileptische Anfälle vorherzusagen. Der Algorithmus analysiert Herzfrequenz, Blutdruck und andere physiologische Daten, um Muster zu erkennen, die auf einen bevorstehenden Anfall hindeuten. In einer klinischen Studie mit sechs Patienten konnte der Algorithmus Anfälle mit einer durchschnittlichen Genauigkeit von 80% bis zu 33 Minuten im Voraus vorhersagen [14].

Erkennung von Vorhofflimmern

Die EKG-Funktion einer Smart Watch nutzt einen KI-Algorithmus, um unregelmäßige Herzrhythmen, insbesondere Vorhofflimmern, anhand der von den Sensoren der Uhr erfassten Daten zu erkennen. In einer klinischen Studie mit über 400.000 Teilnehmern konnte der Algorithmus Vorhofflimmern mit einer Genauigkeit von 84% erkennen. Der Erfolg dieses KI-Algorithmus bei der Erkennung von Vorhofflimmern führte zur Freigabe der EKGFunktion der Smart Watch durch die US Food and Drug Administration [15].

Große Sprachmodelle

Anfang 2023 hat ein erheblicher Innovationsschub im Bereich der generativen KI durch große Sprachmodelle (Large Language Models, LLMs) die Aufmerksamkeit von Wissenschaftlern, Medien und der breiten Öffentlichkeit gefesselt. Beispiele für LLMs sind die derzeit breit diskutierten GPT-3, BERT oder ChatGPT, die alle umfangreich auf massiven Datenmengen aus dem Internet trainiert wurden, was ihnen erlaubt, bemerkenswerte Antworten auf Freitextanfragen zu geben. Diese vielseitigen LLMs haben ihre Fähigkeiten beim Verfassen von fiktiven Texten, beim Programmieren und beim Zusammenfassen von Informationen unter Beweis gestellt. Es gibt auch Beispiele für LLMs, die für Anwendungen im Gesundheitswesen ausgebildet wurden. Eines davon wurde mit mehr als 90 Milliarden Wörtern aus elektronischen Gesundheitsakten trainiert – 82 Milliarden Wörter aus UF Health, 6 Milliarden aus Pubmed, 2,5 Milliarden aus Wikipedia und 0,5 Milliarden aus MIMIC III. Diese Modelle wurden systematisch an fünf klinischen NLP-Aufgaben evaluiert, einschließlich der Extraktion klinischer Konzepte (Leistung F1: 0,78–0,80), der Extraktion medizinischer Beziehungen (F1 0,95–0,97), der semantischen Textähnlichkeit (Pearson-Korrelation von 0,87–0,89), der natürlichsprachlichen Inferenz (Genauigkeit 0,80–0,90) und der Beantwortung medizinischer Fragen (exakte Übereinstimmung 0,31 für emrQA-Medikamente und 0,93 für den emrQA-Beziehungsdatensatz) [16].

Forscher bewerteten kürzlich die Leistung des viel diskutierten ChatGPT beim United States Medical Licensing Exam (USMLE). Das USMLE ist eine Reihe von drei standardisierten Tests für Fachwissen, die für die medizinische Zulassung in den Vereinigten Staaten erforderlich sind. ChatGPT besteht diese Tests mit einer Genauigkeit von 60%. Beeindruckenderweise ist ChatGPT in der Lage, dieses Ergebnis ohne spezielle Eingaben oder Training von menschlichen Ausbildern zu erreichen [17].

Ethische Bedenken gegen den Einsatz von KI in Kliniken

Der Einsatz von KI in Kliniken wirft eine Vielzahl ethischer Bedenken auf, darunter Fragen im Zusammenhang mit dem Schutz der Privatsphäre von Patienten, Transparenz, Voreingenommenheit und Verantwortlichkeit.

Patientendatenschutz

Der Einsatz von KI in Kliniken beinhaltet häufig die Verarbeitung und Analyse großer Mengen von Patientendaten. Dies wirft Bedenken hinsichtlich des Schutzes der Privatsphäre der Patienten und der Möglichkeit des unbefugten Zugriffs oder der Offenlegung von sensiblen Gesundheitsdaten auf. Darüber hinaus gibt es Bedenken hinsichtlich der Sicherheit von KI-Systemen und der Möglichkeit von Cyberangriffen.

Transparenz

Die Komplexität vieler KI-Algorithmen macht es schwierig, zu verstehen, wie sie zu ihren Entscheidungen kommen. Dieser Mangel an Transparenz kann es für Patienten und Gesundheitsdienstleister erschweren, die von diesen Algorithmen erstellten Diagnosen und Behandlungsempfehlungen zu verstehen und ihnen zu vertrauen.

Voreingenommenheit

KI-Algorithmen sind nur so unvoreingenommen wie die Daten, mit denen sie trainiert werden.

Zitat

KI-Algorithmen sind nur so unvoreingenommen wie die Daten, mit denen sie trainiert werden.

@webroot/assets/icons/core/quote-close.svg
Dr. Narges Ahmidi

Das heißt, wenn die zum Trainieren eines Algorithmus verwendeten Daten verzerrt sind – z.B. durch Unterrepräsentation bestimmter demografischer Gruppen –, kann auch der Algorithmus verzerrt werden. Dies kann zu Ungleichheiten bei den Ergebnissen der Gesundheitsversorgung für verschiedene Patientengruppen führen.

Rechenschaftspflicht

KI-Algorithmen können Fehler machen, und es stellt sich die Frage, wer in dem Falle dafür verantwortlich ist. Sollte die Verantwortung bei den Entwicklern des Algorithmus, den Gesundheitsdienstleistern, die ihn verwenden oder bei beiden liegen? Es stellt sich auch die Frage, wie sichergestellt werden kann, dass für KI-Algorithmen die gleichen Sicherheits- und Wirksamkeitsstandards gelten wie für andere medizinische Technologien.

Konkurrent oder Assistent?

Ist KI ein Assistent oder ein Konkurrent des Menschen in der medizinischen Praxis? Obwohl in vielen Studien die Leistung von KI und Menschen verglichen wird, arbeiten in realen medizinischen Szenarien in der Regel jedoch Menschen mit KI-Systemen zusammen und üben die Aufsicht aus. Deshalb haben neuere Studien die Zusammenarbeit zwischen Mensch und KI untersucht, wenn KI bei der klinischen Entscheidungsfindung unterstützt. Mehrere Studien haben gezeigt, dass die kombinierte Leistung von klinischen Experten und KI zusammen der Leistung von Experten allein überlegen ist. Darüber hinaus können weniger erfahrene Kliniker, wie z.B. Ärzte im Praktikum, stärker von KI-Unterstützung profitieren als ihre erfahreneren Kollegen.

Zitat

Studien haben gezeigt, dass die kombinierte Leistung von klinischen Experten und KI zusammen der Leistung von Experten allein überlegen ist.

@webroot/assets/icons/core/quote-close.svg
Dr. Narges Ahmidi

Die Umsetzungslücke

Trotz der zahlreichen erfolgreichen KI-Systeme, die in der Forschung entwickelt wurden, werden bisher nur wenige tatsächlich in der klinischen Praxis eingesetzt. Diese KI-Tools stützen sich hauptsächlich auf retrospektive Daten, die möglicherweise nicht repräsentativ für die reale medizinische Praxis vor Ort sind.

Kritiker argumentieren, dass KI-Systeme möglicherweise zu langsam oder zu komplex sind, um in der realen Gesundheitsversorgung eingesetzt und zeitnah angepasst zu werden, oder dass es zu unvorhergesehenen Komplikationen kommen kann, wenn Menschen und KI zusammenarbeiten, die im Training nicht repräsentiert waren. Außerdem werden retrospektive Datensätze umfangreich gefiltert und bereinigt, was sie zusätzlich weniger repräsentativ für die tatsächliche medizinische Praxis macht. Randomisierte kontrollierte Studien (RCTs) und prospektive Studien können dazu beitragen, diese Kluft zwischen Theorie und Praxis zu überbrücken, wenn sie zeigen, dass KI-Modelle einen messbaren positiven Einfluss haben, wenn sie in der realen medizinischen Praxis eingesetzt werden.

Zusammenfassung

Zusammenfassend lässt sich sagen, dass die in dieser Übersichtsarbeit vorgestellten Beispiele nur einen kleinen Ausschnitt der Vielzahl an KI-Algorithmen darstellen, die für Anwendungen im Gesundheitswesen entwickelt werden, sie aber einen wertvollen Einblick in das Potenzial von KI für die Umgestaltung des Gesundheitswesens bieten.

Während sich das Feld weiterentwickelt, ist es von entscheidender Bedeutung, dass die Zuverlässigkeit, Robustheit und Effizienz dieser Algorithmen durch strenge Tests und Validierung nachgewiesen werden. Wenn sich diese Algorithmen als wirksam und genau erweisen, besteht ein großes Potenzial für Kliniker, diese Technologien rasch in die klinische Praxis zu übernehmen und zu integrieren. Damit ist kontinuierliche Forschung und Entwicklung in diesem Bereich unerlässlich, um den Einsatz von KI im Gesundheitswesen voranzutreiben und so die Ergebnisse für Patienten zu verbessern.

Quellen:

[1] Ardila D et al: End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography. Nature Medicine 2019; 25; 954–961.

[2] De Fauw J et al: Clinically applicable deep learning for diagnosis and referral in retinal disease. Nature Medicine 2018; 24; 1342–1350.

[3] Biffi C et al: Ein neuartiges KI-Gerät zur optischen Echtzeit-Charakterisierung von kolorektalen Polypen. NPJ Digital Medicine 2022.

[4] Neumann H et al: Evaluation of novel LCI CAD EYE system for real time detection of colon polyps. PLOS ONE; 2021; DOI https://doi.org/10.1371/journa... (abgefragt 3. 4. 2023)

[5] Esteva A et al: Dermatologist-level classification of skin cancer with deep neural networks. Nature Medicine 2018; 542; 115–118.

[6] Aresta G et al: BACH: Grand Challenge on Breast Cancer Histology Images. Medical Image Analysis 2020; 56; 122–139. 7

[7] Perincheri S: An independent assessment of an artificial intelligence system for prostate cancer detection shows strong diagnostic accuracy. Moderne Pathologie 2021; DOI: 10.1038/s41379–021-00794- x (abgefragt 3. 4. 2023).

[8] Komorowski M et al: The Artificial Intelligence Clinician learns optimal treatment strategies for sepsis in intensive care. Nature Medicine 2018; 24; 1716–1720.

[9] Henry K E et al: A targeted real-time early warning score (TREWScore) for septic shock. Science Translational Medicine 2015; 7; 299; Adams R et al: Prospective, multi-site study of patient outcomes after implementation of the TREWS machine learning-based early warning system for sepsis. Nature Medicine 2022; 28; 1455–1460.

[10] Brown N et al: GuacaMol: Benchmarking Models for de Novo Molecular Design. Journal of Chemical Information and Modeling 2019; 59; 1096–1108.

[11] Zhavoronkov A et al: Deep learning enables rapid identification of potent DDR1 kinase inhibitors. Nature Biotechnology 2019; 37; 1038–1040.

[12] 12 Somashekhar S P et al: Watson for Oncology and breast cancer treatment recommendations: agreement with an expert multidisciplinary tumor board. Annals of Oncology 2018; DOI: https:// doi.org/10.1093/annonc/mdx781 (abgefragt 3. 4. 2023).

[13] Mukherjee P et al: A Shallow Convolutional Neural Network Predicts Prognosis of Lung Cancer Patients in MultiInstitutional CT-Image Data. Nature Machine Intelligence 2020; 2; 274–282.

[14] Nasseri M et al: Ambulatory seizure forecasting with a wrist-worn device using long-short term memory deep learning. Scientific Reports 2021; DOI: 10.1038/s41598–021-01449–2 (abgefragt 3. 4. 2023).

[15] Perez M V et al: Large-Scale Assessment of a Smartwatch to Identify Atrial Fibrillation. The New England Journal of Medicine 2019; 381; 1909–1917

[16] Yang X et al: A large language model for electronic health records. Nature Digital Medicine 2022; 5; 194.

[17] Kung T et al: Leistung von ChatGPT beim USMLE: Potential for AI-assisted medical education using large language models. PLOS Digital Health 2023; DOI: 10.1371/ journal.pdig.0000198 (abgefragt 3. 4. 2023).


Dieser Artikel erschien zuerst in der österreichischen Zeitschrift »Das Ärztliche Gutachten«, 2023, Heft 2, Seite 23 bis 27, Manz-Verlag Wien.
Deswegen verwenden wir in diesem Artikel ausschließlich das generische Maskulinum, um den Ursprungstext nicht zu verändern.

Nächster Artikel

Healthcare Hackathon 2023
So hilft KI bei der Personalplanung im Krankenhaus

Johanna Schmidhuber
Johanna Schmidhuber
Künstliche Intelligenz & Machine Learning / Fraunhofer IKS
KI in der Medizin