Ärzte testen KI bei Darmspiegelungen – das Ergebnis überrascht

Eine KI erkannte bei Darmspiegelungen mehr kleine Polypen. Erfahrene Ärzte blieben jedoch oft ebenso treffsicher.

Aufnahme einer Darmspiegelung

Die KI EndoMind markiert während der Darmspiegelung einen verdächtigen Darmpolypen mit einem blauen Quadrat. © AG InExEn / UKW

Darmkrebs entsteht leise. Erst wächst im Darm ein kleiner Polyp. Jahrelang bleibt er unbemerkt, doch später kann daraus ein Tumor werden. Bei der Vorsorge zählt deshalb ein genauer Blick auf die Schleimhaut. Nun soll eine neue KI Ärzten bei der Darmspiegelung helfen – doch eine Studie des Universitätsklinikums Würzburg zeigt: Die Technik findet kleine Polypen zuverlässig, doch den Blick erfahrener Ärzte schlägt sie kaum.

Am Universitätsklinikum Würzburg entstand „EndoMind“, eine Künstliche Intelligenz für die Darmspiegelung, die verdächtige Stellen während der Untersuchung automatisch markieren soll. Die Ergebnisse einer größeren Studie erschienen nun im Fachjournal NPJ Digital Health. Das überraschende Resultat: Erfahrene Gastroenterologen fanden mit Unterstützung der Software kaum mehr Polypen als ohne KI.

Professor Alexander Hann, Professor für Digitale Transformation in der Gastroenterologie am Uniklinikum und Leiter der Arbeitsgruppe InExEn – Interventional and Experimental Endoscopydas System, bewertet die Arbeit dennoch positiv. „Dass wir die Studie in einem so hochrangigen Journal publizieren konnten, macht zudem Mut“, sagt er. „Das zeigt, dass wir an einer Uniklinik alles haben, um etwas zu entwickeln und zu validieren, was sonst nur große Unternehmen können.“

Was erfahrene Ärzte der KI immer noch voraus haben

Das Forschungsteam testete die Software nicht im Labor, sondern in gastroenterologischen Schwerpunktpraxen. Dort laufen jeden Tag Vorsorgeuntersuchungen und bieten daher reale Bedingungen. Deshalb gelten die Ergebnisse als besonders interessant. Bei einer Darmspiegelung führen Ärzte eine kleine Kamera durch den Darm und suchen nach auffälligen Veränderungen der Schleimhaut. Die KI analysiert dabei das laufende Videobild. Erkennt die Software einen möglichen Polypen, erscheint auf dem Monitor ein blaues Rechteck.

Solche Systeme gelten seit Jahren als große Hoffnung in der Vorsorgemedizin. Denn dem menschlichen Auge können kleine oder flache Veränderungen entgehen. Viele Fachleute erwarteten deshalb, dass Computerprogramme die Trefferquote deutlich verbessern würden. In der Würzburger Studie zeigte sich jedoch ein anderes Bild. Die KI half zwar dabei, zusätzliche kleine Polypen zu entdecken, doch der Unterschied zu einer Untersuchung mit nur menschlichen Augen fiel gering aus. Der Grund: Erfahrene Ärzte arbeiten auch ohne technische Hilfe bereits auf sehr hohem Niveau.

Wie aus einer Servietten-Skizze eine Medizin-KI wurde

Die Entwicklung von EndoMind begann Ende 2018. Damals arbeitete Hann noch an der Uniklinik Ulm. Erste Projektskizzen entstanden nach seinen Angaben auf Servietten gekritzelt, während eines Urlaubs. Im Sommer 2020 startete das Projekt dann offiziell. Gemeinsam mit Informatikern und Ärzten entwickelte das Team innerhalb eines Jahres ein System, das Polypen auf Live-Bildern erkennen kann. Später folgten mehrere Vergleichsstudien mit kommerziellen KI-Produkten.

Dabei zeigte sich, dass die Würzburger Software mit deutlich größeren Konkurrenzsystemen mithalten konnte. Hann freut sich, „dass dieses Projekt, das das längste wissenschaftliche Projekt meiner Karriere war, nun endlich veröffentlicht wurde.“ Die große randomisierte Studie lief schließlich von November 2021 bis November 2022. Solche Studien gelten als besonders aussagekräftig, weil unterschiedliche Gruppen direkt miteinander verglichen werden.

Die Software ist besonders gut im Finden kleiner Polypen

Obwohl der Unterschied zur menschlichen Analyse nur gering ausfiel, ganz ohne Mehrwert bleibt die Technik nicht. Eine Metaanalyse verschiedener Untersuchungen kam zu dem Ergebnis, dass KI-Systeme durchschnittlich 7,4 Prozent mehr Polypen entdecken. Meist handelte es sich dabei um kleine Veränderungen im Darm.

Anschließend simulierten Wissenschaftler, wie sich dieser Effekt langfristig auswirken könnte. Sie rechneten ein Szenario mit 10.000 untersuchten Personen über zehn Jahre durch. Dabei sank die Zahl neu auftretender Darmkrebsfälle von 82 auf 71. Die Zahl der Todesfälle verringerte sich von 15 auf 13.

Warum medizinische Fachgesellschaften der Technik misstrauen

Trotz der positiven Zahlen bewerten Fachgesellschaften den Nutzen unterschiedlich. Die amerikanische Gesellschaft für Gastroenterologie sprach keine klare Empfehlung aus. Das British Medical Journal sah nur einen begrenzten Vorteil. Die europäische Fachgesellschaft ESGE formulierte dagegen eine vorsichtige Empfehlung für den Einsatz solcher Systeme.

Ein Grund für die Skepsis liegt möglicherweise in einem Phänomen, dass mit dem Einsatz von KI immer häufiger auftaucht, dem sogenannten „Deskilling“: Werden Ärzte durch KI möglicherweise unaufmerksamer? Eine Studie aus Polen deutete darauf hin. Dort fanden Ärzte mit aktivierter KI zwar mehr Polypen. Schalteten sie das System später wieder aus, verschlechterte sich ihre Leistung jedoch. Manche Experten befürchten deshalb einen Gewöhnungseffekt. Ärzte könnten sich zu stark auf die Hinweise der Software verlassen.

Auch Eye-Tracking-Analysen liefern Hinweise darauf. Sie zeigen, dass sich das Blickverhalten während einer KI-unterstützten Darmspiegelung verändert. Ärzte beobachten bestimmte Bereiche des Bildschirms anders als zuvor. Ganz eindeutig ist die Lage allerdings nicht. Eine Langzeitstudie aus Japan fand über mehrere Jahre keinen solchen negativen Effekt. Deshalb bleibt offen, wie stark das „Deskilling“ tatsächlich ausfällt.

Wo die KI bei Darmspiegelungen noch Schwächen zeigt

Ein großes Problem betrifft fortgeschrittene Adenome. Größere oder flache Veränderungen gelten als besonders relevant, weil aus ihnen häufiger Krebs entsteht. Nach Einschätzung von Hann erkennen aktuelle KI-Systeme solche schwierigen Befunde noch nicht zuverlässig genug. „Meines Wissens gibt es noch keine KI, die große Adenome oder solche mit deutlich mehr krankhaften Veränderungen ebenso verlässlich wie das menschliche Auge erkennt“, stellt er fest.

Besonders flache Polypen bereiten Schwierigkeiten. Sie heben sich oft nur minimal von der Darmwand ab und lassen sich leicht übersehen. Erfahrene Spezialisten entdecken solche Veränderungen häufig besser als KI-Systeme. Die Würzburger Arbeitsgruppe arbeitet deshalb bereits an weiteren Funktionen. Im Projekt „Poseidon“ entwickelt das Team eine KI-gestützte Größenmessung für Polypen. Dabei dient ein Wasserstrahl während der Untersuchung als Orientierungshilfe.

KI kann helfen, die Qualität von Darmuntersuchungen zu steigern

Bei einer Darmspiegelung spielt die sogenannte Rückzugszeit eine wichtige Rolle. Gemeint ist die Zeitspanne, in der Ärzte beim Zurückziehen des Endoskops, der Kamera im Darm, diesen sorgfältig absuchen. Fachleute empfehlen mindestens eine Rückzugszeit von sechs Minuten, denn es gilt: Patienten erkranken seltener an Darmkrebs, wenn Ärzte sich ausreichend Zeit nehmen. Deshalb entwickelte das Team zusätzlich eine KI, die diese Rückzugszeit automatisch misst.

In weiteren Projekten erkannte die Software bereits Instrumente zur Gewebeentnahme oder Gefäßveränderungen im Darm. Langfristig sollen alle Funktionen zusammengeführt werden. Dann könnte die KI während der Darmspiegelung automatisch prüfen:

  • ob der gesamte Darm untersucht wurde,
  • welche Polypen gefunden wurden,
  • wie groß die Veränderungen sind,
  • und ob die Untersuchung lange genug dauerte.

Hann beschreibt das Ziel so: „All diese einzelnen Puzzlestücke führen wir am Ende zu einem Bericht zusammen, der ein gewisses Qualitätsniveau erreicht.“

Kurz zusammengefasst:

  • EndoMind, eine am Universitätsklinikum Würzburg entwickelte KI, markiert bei Darmspiegelungen verdächtige Stellen und fand in Studien vor allem mehr kleine Polypen als Ärzte.
  • Erfahrene Gastroenterologen entdeckten mit der KI jedoch kaum mehr Polypen als ohne Hilfe, weil sie bereits auf hohem Niveau arbeiten.
  • Der mögliche Nutzen liegt künftig weniger im Ersetzen der Ärzte, sondern in besseren Qualitätskontrollen: etwa bei Rückzugszeit, Polypengröße und vollständiger Dokumentation einer Untersuchung.

Übrigens: Die Würzburger Studie zeigt, wie die Darmkrebsvorsorge mithilfe von KI effizienter wird und so mehr Krebsfälle verhindern kann. Warum eine Darmspiegelung auch schon unter 50 sinnvoll ist, mehr dazu in unserem Artikel.

Bild: © AG InExEn / UKW

What do you feel about this?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert