Big Data und Medizin: Wie maschinengeneriertes Lernen die Ursachen von Asthma erforscht

Im Laufe des letzten Jahrzehnts hat die Forschung und Entwicklung von maschinellen Lernen zu einigen bemerkenswerten Fortschritten geführt. Handschrifterkennungen, treffsichere Vorhersagen oder die neueste Gestensteuerung der Xbox sind nur einige Beispiele.

In den Microsoft Research Laboren forschen Computerwissenschaftler zusammen mit Forschern verschiedenster Disziplinen wie Medizin, Biologie, etc. an neuen Methoden des maschinellen Lernens und implementieren Anwendungen, welche schließlich das Herz aktueller Consumer-Geräte und Enterprise-Systeme bilden.  

Die Handschriftenerkennung auf Tablet PCs war laut Christopher Bishop, Leiter der Gruppe maschinelles Lernen bei Microsoft Research Cambridge, das früheste Beispiel eines erfolgreichen Übersetzungsprozesses. „Zum ersten Mal konnten kommerzielle Systeme Handschriften erkennen und das auf einem Niveau, das auch für den Consumer-Markt geeignet war.“

Bishop und sein Team haben mit Infra.NET ein leistungsfähiges Werkzeug für maschinelles Lernen entwickelt, welches für den nicht-kommerziellen Gebrauch frei verfügbar ist und neben Forschungszwecken auch für die Generierung größerer Daten genutzt werden kann.

Infer.NET ist ein „Rahmen“ bzw. eine Software, die sich flexibel dem Untersuchungsgegenstand anpasst. Das bedeutet, sobald neue Informationen hinzukommen oder sich der Sachverhalt der Untersuchung ändert, entwickelt sich die Software selbstständig weiter. Dieses Programm erhöht dadurch maschinelles Lernen um eine Ebene, in der Algorithmen sowohl die skalierten Datenpunkte als auch die Big Data-Flut bündeln, um dadurch effizienter Erkenntnisse zu erhalten.

In der aktuellsten Zusammenarbeit des Microsoft Research Labors Cambridge und der Universität Manchester wird diese Software für die Untersuchung von Asthma und Allergien angewendet.   

Asthma und Allergien zählen zu den häufigsten chronischen Erkrankungen bei Kindern, Tendenz weiterhin steigend. Am dringendsten zu lösen war daher die Frage, was die Ursache dieses Phänomens ist.

Jüngste Zwillingsstudien geben Grund zur Annahme, dass eine starke Korrelation zwischen der genetischen Veranlagung und Asthma und Allergien besteht. Umwelteinflüsse tragen ebenfalls maßgeblich zu der Entwicklung von Asthma und Allergien bei, vor allem die rasche Zunahme dieser Erkrankungen in den letzten vier bis fünf Jahrzehnten lässt vermuten, dass genetische Faktoren alleine die Entstehung dieser Symptome nicht begünstigen. Zwar gibt es verschieden Anhaltspunkte für die begründete Annahme von Umwelteinflüssen und Genen als Auslöser der Krankheiten, belegende Daten und Zusammenhänge fehlen jedoch bisher.  

2012 wurde das Forschungsprogram im Zuge einer Initiative der Regierung des U.S Präsidenten Obamas ausgezeichnet. Das sogenannte „Patent for Humanity Program“ zeichnete patentierte Technologien aus, die weitere Innovationen in der Entwicklung und Forschung zu Herausforderungen wie Gesundheit, Lebensmittelsicherheit und Klimawandel ermöglichten. Unternehmen wurden dabei ermutigt ihre Technologien für humanitäre Herausforderungen zur Verfügung zu stellen. Infer.NET ein Framework für maschinelles Lernen, bietet mit seinen State- of- the Art Algorithmen und statistischen Routinen für die Durchführung Bayesscher Inferenzen, eine hervorragende Technologie für weitere Forschungen. Die Software ist als Download erhältlich.

Neben der Analyse der Symptome und Ursachen von Asthma forscht das Microsoft Research Team mit Hilfe von Infer.NET an den DNA Sequenzen und an Korrelationen und Aktivitäten von Genen in verschiedenen Geweben. Im „Forest- dynamics research Program“ nutzt Microsoft Research Cambridge das Infer.NET um die wichtigsten Treiber für das Wachstum und die Mortalität von Bäumen in verschiedenen Arten von Wäldern zu untersuchen.

Infer.NET soll vor allem wertvolle neue Technologien bündeln, um dadurch das Lösen komplexer Herausforderungen und Probleme in unterschiedlichsten Disziplinen zu unterstützen.