Eine selbstlernende Software verbessert die Interpretation von Lungen-CTs

  • Nature Medicine

  • von Michael Simm
  • Studien – kurz & knapp
Der Zugang zum gesamten Inhalt dieser Seite ist nur Angehörigen medizinischer Fachkreise vorbehalten. Der Zugang zum gesamten Inhalt dieser Seite ist nur Angehörigen medizinischer Fachkreise vorbehalten.

Kernbotschaft

Wissenschaftler der Firma Google haben ein Computerprogramm entwickelt, das anhand von CT-Aufnahmen Lungenkarzinome besser erkennt und vorhersagt als erfahrene Radiologen.

Hintergrund

Ob eine Niedrigdosis-Computertomographie zur Lungenkrebs-Früherkennung (Screening) geeignet ist, wird in Deutschland kontrovers diskutiert; derzeit wird diese Maßnahme nur für Personen mit hohem Risiko empfohlen. Das Verhältnis von Nutzen zu potenziellen Schäden durch belastende Folgeuntersuchungen ließe sich verbessern, wenn es gelänge, die Rate falsch-positiver Ergebnisse zu senken.

Design

Die Autoren wollten die Bildanalyse von CT-Scans der Lunge durch den Einsatz der „Deep Learning“-Technologie verbessern, also durch ein an das Problem angepasstes künstliches neuronales Netzwerk, welches selbstlernend ist. Dabei sollte über die Diagnose hinaus ein vollständigerer Bereich des Arbeitsprozesses der Radiologen abgebildet werden, einschließlich einer Vorhersage der Malignität und der Lokalisation von Krebsgeschwülsten.

Ergebnisse und Empfehlungen (Auswahl)

  • Die Forscher nutzten zur Entwicklung ihres Models sämtliche öffentlich zugänglichen Daten aus dem National Lung Cancer Screening Trial mit 42.290 CT-Aufnahmen von 14.851 Patienten, unter denen 578 im Folgejahr ein durch Biopsie bestätigtes Bronchialkarzinom entwickelten. Die Daten von 70 % der Patienten wurden für das Training des Modells genutzt, weitere 15 % für die Feineinstellung, und nochmals 15 % für den eigentlichen Test.
  • Im Testdatensatz mit 6716 Fällen, darunter 86 mit positivem Nachweis eines Bronchialkarzinoms erreichte das Model einen ROI-AUC Wert von 94,4 %. Dieses statistische Verfahren beschreibt für jeden angenommen Grenzwert die Kombination aus Sensitivität und Spezifität; die Fläche unter dieser Kurve dann die Qualität, mit einem theoretischen Maximalwert von 100 %.
  • Eine Stichprobe aus dem Test-Datensatz mit 507 Patienten, darunter 83 Erkrankte, wurde 6 zertifizierten Radiologen mit durchschnittlich 8 Jahren Berufserfahrung vorgelegt, die im Gegensatz zum Deep Learning-Algorithmus zusätzliche demographische Daten und die Krankengeschichten vorgelegt bekamen. Stand ein früherer Scan zur Verfügung, so erreichten die Ärzte fast die Leistung des Modells; ohne diese Bewertungshilfe aber lieferte das Computerprogramm eindeutig weniger falsch positive und falsch negative Befunde.

Klinische Bedeutung

Mustererkennung und die Interpretation von Bildern sind eine Domäne, bei denen lernfähige neuronale Netzwerke in einer zunehmenden Zahl von klinischen Studien ausgebildete Ärzte übertreffen. Bevor derartige Systeme in der Praxis Einzug halten, sind jedoch weitere rigorose Tests und vermutlich auch regulatorische Hürden zu nehmen.

Finanzierung: Google Inc.