Melanomerkennung: Künstliche Intelligenz schlägt ärztliche Erfahrung


  • Michael Simm
  • Studien – kurz & knapp
Der Zugang zum gesamten Inhalt dieser Seite ist nur Angehörigen medizinischer Fachkreise vorbehalten. Der Zugang zum gesamten Inhalt dieser Seite ist nur Angehörigen medizinischer Fachkreise vorbehalten.

Kernbotschaft

Eine selbstlernende Software, die anhand von Bildern auf das Erkennen von Melanomen geschult wurde, übertraf bezüglich Spezifität und Sensitivität in einem Wettbewerb 136 von 157 Dermatologen - vom Assistenz- bis zum Chefarzt.

Hintergrund

In jüngster Vergangenheit mehren sich die Beispiele für Künstliche Intelligenz-Systeme, die auf selbst lernenden Algorithmen beruhen, und zur Klassifizierung bzw. Diagnose von Krankheiten entwickelt wurden. Hier wurde zum ersten Mal die Leistungsfähigkeit solch eines Systems, das ausschließlich mit öffentlich verfügbaren Bildern (Open-Source) „gefüttert“ wurde, mit der einer größeren Anzahl von Dermatologen aller klinischen Hierarchien verglichen.

Design

Die Forscher des Deutschen Krebsforschungszentrums (DKFZ), der Universitäts-Hautklinik und des Nationalen Centrums für Tumorerkrankungen (NCT) Heidelberg nutzten ein sogenanntes Convolutional Neural Network. Dieses trainierten sie mit 12.378 frei verfügbaren Bildern von histopathologisch bestätigten Melanomen und ebenfalls bestätigten atypischen Naevi aus der Datenbank der International Skin Imaging Collaboration. Die Leistungsfähigkeit des Systems wurde dann anhand zufällig ausgewählter Bilder von 80 Naevi und 20 Melanomen mit der von 157 Dermatologen and 12 deutschen Universitätskliniken verglichen.

Hauptergebnisse

  • Die Dermatologen erreichten im Durchschnitt eine Sensitivität von 74,1 % (Bandbreite 40,0 – 100 %) und eine Spezifität von 60 % (Bandbreite 21,3 – 91,3 %).
  • Dagegen erzielte das neuronale Netz bei einer Sensitivität von 74,1 % eine Spezifität von 86,5 % (Bandbreite 70,8 – 91,3 %), und bei einer Spezifität von 60 % eine durchschnittliche Sensitivität von 87,5 % (Bandbreite 80 – 95 %).
  • Unter den Dermatologen hatten die Chefärzte mit einer Spezifität von 69,2 % bei einer Sensitivität von 73,3 % die besten Werte. Das KI-System erreichte dagegen bei der gleichen Spezifität von 69,2 % eine durchschnittliche Sensitivität von 84,5 %.
  • In der Einzelwertung hatten lediglich 7 der 157 Dermatologen besser abgeschnitten, als der Algorithmus, 14 waren ähnlich gut, und 136 schlechter.

Klinische Bedeutung

"Der Einsatz von künstlicher Intelligenz wird in der Dermatologie zukünftig wichtiger werden, um präzise Diagnosen zu erstellen. Der Algorithmus könnte die klinische Beurteilung von Hauttumoren sinnvoll ergänzen", kommentiert Jochen Sven Utikal, Leiter der Klinischen Kooperationseinheit des DKFZ, in einer begleitenden Pressemitteilung. Zu bedenken ist jedoch, dass hier nur zwischen zwei Optionen zu wählen war, während in der Praxis eine Vielzahl höchst unterschiedlicher Hautveränderungen vorliegen, deren Beurteilung alleine am Bild nicht ohne zusätzliche Untersuchungen möglich ist.

Finanzierung: Bundesministerium für Gesundheit.