Tausende Data Scientists traten kürzlich in einem Machine-Learning-Wettbewerb gegeneinander an. Ihr Ziel: einen bedeutenden Fortschritt für die Krebsforschung zu erzielen. [...]
Von Anfang Januar bis Mitte April 2017 nahmen knapp 10.000 Data Scientists aus aller Welt am Online-Wettbewerb „Data Science Bowl“ teil. Das Ziel der vom Beratungsunternehmen Booz Allen Hamilton und dem Machine-Learning-Spezialisten Kaggle ins Leben gerufenen Aktion: Die Datenwissenschaftler sollten den effektivsten Algorithmus zur Früherkennung von Lungenkrebs entwickeln. Tumore sollten dabei aber nicht nur möglichst früh, sondern vor allem mit höchstmöglicher Zuverlässigkeit erkannt werden. KREBSVORSORGE: MACHINE-LEARNING-KAMPF GEGEN FEHLALARME
In den USA wollte bereits im Jahr 2010 das „National Lung Screening Trial“ belegen, dass ein jährliches Niedrigdosis-CT-Screening das Sterberisiko bei Lungenkrebs um 20 Prozent reduzieren kann. In Deutschland gilt das unter Experten als umstritten. Inzwischen empfehlen aber auch europäische Fachgesellschaften den Einsatz von Niedrigdosis-CT zur Lungenkrebs-Früherkennung – zumindest bei Risikopatienten. Die deutsche Skepsis rührt insbesondere daher, „dass noch nicht klar ist, ob der Nutzen die Risiken überwiegt“, wie in einem Infoblatt des Deutschen Krebsforschungszentrums nachzulesen ist.
Diese Risiken sind in der Technologie begründet: Beim Niedrigdosis-CT kommt ein Scanner zum Einsatz, der die von einem Rechner generierten Röntgen-Bilder und ihre unterschiedlichen Perspektiven zu kontrastreichen 3D-Bildern verarbeitet – mit Hilfe eines Algorithmus. Das Problem: Im Vergleich zur traditionellen Röntgenaufnahme gibt es bei diesem Verfahren eine drastisch erhöhte Fehlalarm-Rate zu beklagen.
Ein solcher Fehlalarm kann im Zusammenhang mit einer Krankheit wie Krebs unwiederbringlichen Schaden anrichten, wie der CEO von Kaggle, Anthony Goldbloom, verdeutlicht: „Viele Leute haben die Nachricht erhalten, dass sie an Lungenkrebs leiden. Nur um später herauszufinden, dass es doch nicht so ist. So etwas stellt eine unglaubliche psychische Belastung dar.“
Die „False positive“-Quote der Niedrigdosis-CT-Technologie mit Hilfe von Data-Science- und Machine-Learning-Power zu eliminieren, lautete deshalb das Ziel des diesjährigen „DataScience Bowl“. Die besten zehn Teilnehmer durften sich außerdem dank der Laura and John Arnold Foundation auch noch ein Preisgeld in Höhe von einer Million Dollar teilen.
Video: IBM’s artificial intelligence system joins cancer fight
ALGORITHMEN TRAINIEREN KREBSERKENNUNG
Booz Allen Hamilton und Kaggle riefen den „Data Science Bowl“ bereits im Jahr 2015 ins Leben, um den Blick der in vielen Unternehmen äußerst begehrten Data Scientists auf das Allgemeinwohl zu richten, wie Josh Sullivan, Senior Vice President und Chief Data Scientist bei Booz Allen erklärt: „Es ging darum, etwas für die Allgemeinheit zu tun. Wir wollten ein Event erschaffen, das die Leute zusammenbringt und sie dazu anspornt, gemeinsam etwas Gutes zu tun. Etwas, das größer ist als sie selbst. Dabei sollte auch ein wissenschaftlicher Nutzen herauskommen, aber es sollte dem Open-Source-Gedanken folgen und Leute auf der ganzen Welt erreichen.“
Laut Sullivan wurden im Vorfeld mehr als 300 Ideen und Vorschläge eingereicht, worum sich der diesjährige „Data Science Bowl“ drehen sollte. In den Vorjahren wurden beispielsweise bereits Algorithmen zur Bestimmung der Sauberkeit der Ozeane sowie zur Erkennung von Herzkrankheiten entwickelt. Am Ende entschlossen sich die Initiatoren schließlich, das National Cancer Institute (NCI) und seine „Beau Biden Cancer Moonshot“-Initiative zu unterstützen.
Das NCI versorgte die Teilnehmer mit 2000 anonymisierten, hochauflösenden CT-Scans. Jedes einzelne Bild bestand dabei aus mehreren Gigabytes. Wie Sullivan erklärt, waren die ersten 1500 Aufnahmen das Trainings-Set – inklusive Schlussdiagnose. Die übrigen 500 Bilder waren das Problem-Set. Mit Hilfe des Trainings-Sets konnten die Teilnehmer ihre Machine-Learning-Algorithmen so trainieren, dass diese erkennen, ob die Läsionen in den restlichen 500 Lungenaufnahmen krebshaltig sind oder nicht. Basierend auf dem Prozentsatz der korrekten Diagnosen wurden die Algorithmen schließlich bewertet. NEURONALE NETZE FÜR DIE KREBSFORSCHUNG
Zusammengestellt wurden die Daten auf der Plattform von Kaggle. Das Unternehmen wurde von Anthony Goldblum im Jahr 2010 unter anderem mit dem Ziel gegründet, Wettbewerbe in den Bereichen Predictive Modeling und Analytics zu veranstalten. Im März 2017 wurde Kaggle von Google übernommen.
Für den Data Science Bowl 2017 mussten die teilnehmenden „Kaggler“ besonders fit sein, wenn es um sogenannte Convolutional Neural Networks (CNN) ging. Diese künstlichen, neuronalen Netze sind für viele verschiedene Problemstellungen nützlich, für computerbasierte Visualisierungsprobleme eignen sie sich jedoch besonders gut. Video: Convolutional Neural Networks – Ep. 8 (Deep Learning SIMPLIFIED)
„Medizinische Daten sind immer eine Herausforderung – alleine wegen ihrer schieren Größe“, erklärt Goldbloom. „Die vom NCI zur Verfügung gestellten CT-Scans haben die CNNs in eine für sie völlig neue Richtung gepusht.“ Leider sind die CNNs aber auch anfällig für ein Phänomen namens Überanpassung („overfitting“). Gemeint ist damit, dass das Statistik-Modell eher dazu tendiert, ein Rauschen zu beschreiben, statt die darunterliegenden Beziehungen aufzudecken. Der Grund dafür: Es gibt in Relation zu den Beobachtungen zu viele Parameter. „Ein CNN aufzubauen, bei dem kein ‚overfitting‘ vorkommt ist schwer und wird immer schwerer, je kleiner der Datensatz wird“, weiß Goldbloom.
Die knapp 10.000 Teilnehmer des „Data Science Bowl“ brachten es 2017 zusammengenommen auf mehr als 150.000 Arbeitsstunden und reichten knapp 18.000 Algorithmen ein. Um die Bemühungen der Data Scientists weiter zu verfeinern, meldeten sich einige Radiologen als freiwillige Unterstützer. Die Sieger des Data Science Bowl 2017 hießen am Ende Liao Fangzhou und Zhe Li – zwei Wissenschaftler von der chinesischen Tsinghua University. Auf den Plätzen zwei und drei landeten jeweils Teams aus den Niederlanden.
Josh Sullivan geht davon aus, dass sich die US-Behörden NIH und FDA einige der topplatzierten Algorithmen genauer ansehen werden. Alle Top Teams lagen am Ende nur Prozentbruchteile auseinander – wobei das keine Aussage darüber trifft, wie es bei den Tumor-aufspürenden Algorithmen mit Einsatzfähigkeit und Skalierbarkeit aussieht. Dieser Artikel basiert auf einem Beitrag der US-Publikation cio.com.
*Thor Olavsrud ist Senior Writer bei CIO.com und Florian Maier beschäftigt sich mit dem Themenbereich IT-Security und schreibt über reichweitenstarke und populäre IT-Themen an der Schnittstelle zu B2C
Wer Künstliche Intelligenz nutzen will, muss über eine vertrauenswürdige Datengrundlage verfügen. Daten sind das Lebenselixier von KI-Systemen und bestimmen maßgeblich die Qualität und Zuverlässigkeit der Ergebnisse. Nur so können KI-Modelle robust, anpassungsfähig und vertrauenswürdig arbeiten. […]
Der ICS/OT Cybersecurity Budget Report 2025 von OPSWAT deckt erhebliche Lücken in den Cybersicherheitsbudgets sowie einen Anstieg von ICS/OT-fokussierten Angriffen auf. Ferner wird deutlich, wie durch eine unzureichende Finanzierung, falsch gesetzte Prioritäten und uneinheitliche Abwehrmaßnahmen kritische Infrastrukturen immer raffinierteren Bedrohungen ausgesetzt sind. […]
Die vergangenen zwei Jahre haben einen regelrechten KI-Boom erlebt. Insbesondere generative Modelle (GenAI) haben sich rasant weiterentwickelt und etablieren sich zunehmend als feste Größe in den Arbeitsprozessen von Organisationen weltweit. Angesichts dieser Dynamik fragen sich nun viele Unternehmen, welche Entwicklungen das Jahr 2025 bestimmen werden und welche Potenziale sich daraus ergeben. […]
Astrid Zöchling, CIO des ORF, und Horst Ulrich Mooshandl, CIO & CPO der Österreichischen Post, wurden von Confare mit dem CIO Award 2025 ausgezeichnet. Die weiteren Top CIOs des Jahres sind Franz Hillebrand, ehemaliger CIO der SIGNA, Martin Karanitsch, CIO der Österreichischen Nationalbank und Peter Reichstädter, CIO der Parlamentsdirektion. […]
Die Welt der Wi-Fi-Standards wirkt kompliziert. Es gibt Wi-Fi 5, Wi-Fi 6 und bald Wi-Fi 7. Doch welcher Standard kann was? Wir erklären Ihnen die aktuellen Wi-Fi-Standards und verraten, was diese taugen. […]
METRO Markets implementiert Storyblok als CMS und automatisiert zentrale Prozesse. Dadurch steigern sich Effizienz, SEO-Leistung und Personalisierung im E-Commerce. […]
Am 25. März startete der europäische IT-Sicherheitshersteller ESET die ESET World 2025 im ARIA Resort & Casino in Las Vegas. CEO Richard Marko gab in seiner Keynote eine Übersicht der aktuellen Herausforderungen in Sachen Cybersecurity und der Möglichkeiten, diese zu meistern. […]
Eine neue Studie von Netskope zeigt einen 30-fachen Anstieg der Daten, die von Unternehmensanwendern im letzten Jahr an GenAI-Apps (generative KI) gesendet wurden. Dazu gehören sensible Daten wie Quellcode, regulierte Daten, Passwörter und Schlüssel sowie geistiges Eigentum. Dies erhöht das Risiko von kostspieligen Sicherheitsverletzungen, Compliance-Verstößen und Diebstahl geistigen Eigentums erheblich. […]
Die Integration von künstlicher Intelligenz am Edge schafft einen Paradigmenwechsel in der Datenverarbeitung. Moderne IT-Plattformen mit ihren kompakten KI-Servern ermöglichen es, wichtige Informationen direkt an der Quelle zu analysieren. […]
Aktuelle Business IT-News für Österreich. Die ITWELT (vormals: COMPUTERWELT) ist Österreichs führende IT- Zeitung für den gesamten Bereich der Informationstechnik und Telekommunikation. Wir schreiben für leitende IT- Experten (IT-Leiter, CIO) in IT-Branche und EDV-Abteilungen. Unsere Themen: Business Software, Netzwerk, Security, Mobile Kommunikation, Infrastruktur, Cloud, Wirtschaft, IT-Innovation. Zudem finden Sie hier IT-Anbieter, Whitepaper, Webinare, Termine, Social Events und Praxisreports aus der IT und ITK Branche. (c) 2024 - ITW Verlag GmbH
Artikel Empfehlung
Anmeldung Roundtable
Keine Felder gefunden.
Datenschutz Newsletter
Ich erhalte den Newsletter der Computerwelt c/o CW Fachverlag GmbH, Halbgasse 3-5 in 1070 Wien.
Meine Daten werden sicher gespeichert und niemals an Dritte weitergegeben.
Eine Abmeldung vom Newsletter, sowie Anmeldungen zu weiteren Services ist durch einen Link am Ende des Newsletters möglich.
Sie sehen gerade einen Platzhalterinhalt von Facebook. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Sie sehen gerade einen Platzhalterinhalt von Instagram. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Sie sehen gerade einen Platzhalterinhalt von X. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Be the first to comment