Die Verantwortlichen des U.S. Geological Survey (USGS) erwarten, dass die Verbreitung von vernetzten Geräten, kostengünstigen Sensoren und Drohnen die Anzahl an verfügbaren Datensätzen für Geowissenschaftler*innen explodieren lässt. Gleichzeitig werden Fortschritte im Cloud Computing und bei der künstlichen Intelligenz immer leistungsfähigere Modelle ermöglichen, um diese Daten zu verstehen und sie für Zukunftsprojektionen zu nutzen. Dies ist der Ausblick aus der USGS 21st-Century Science Strategy 2020-2030. Der Bericht, der im Januar veröffentlicht wurde, beschreibt die Entwicklung des USGS von der traditionellen Beobachtungswissenschaft zu einer Ressource für prädiktive Werkzeuge, die Entscheidungsträger*innen bei der Bewirtschaftung von natürlichen Ressourcen und Umweltgefahren unterstützen können.
Expert*innen gehen davon aus, dass die Verwirklichung dieser Vision die Kommunikation zwischen den Disziplinen und die Unterstützung von Wissenschaftler*innen, die interdisziplinär arbeiten, erfordert. „Um Dinge, die kurz- und langfristig passieren könnten, vorhersehen zu können, müssen wir anfangen, die Erde als ein System von Systemen zu betrachten“, sagt Geoffrey Plumlee, leitender Wissenschaftler beim USGS. Ursprünglich als Geologe ausgebildet, hat Plumlee viele Jahre damit verbracht, die Überschneidungen zwischen Geologie, Umweltkatastrophen und menschlicher Gesundheit zu untersuchen.
„Der Fokus auf eine einzelne Disziplin ist immer noch notwendig“, sagt Plumlee, „aber wir brauchen auch viel mehr Leute, die diese interdisziplinäre Arbeit machen können. Soweit ich weiß, ist die jüngere Generation bereits dabei, sich damit zu beschäftigen, weil sie die transdisziplinäre Idee mag, wie Forschende aus der Erd- und Weltraumforschung mit Forschenden aus dem Bereich der menschlichen Gesundheit zusammenarbeiten können. Außerdem ist es ziemlich klar, dass viele unserer Nachwuchsforschenden sehr versiert mit Dingen wie künstlicher Intelligenz umgehen.“
Das Versprechen des maschinellen Lernens in Erdsystemen
Wo andere geophysikalische, biomedizinische und klimawissenschaftliche Probleme sehen, sieht Karianne Bergen vor allem ein Datenproblem. Wissenschaftler*innen gehen in ihre jeweiligen Gebiete hinaus und sammeln Unmengen von Daten. Daraus werden dann Modelle entwickelt, die nicht nur die Beobachtungen erklären, sondern auch unzählige andere mögliche Beobachtungen. Das ist das Datenproblem – und das Lösen des Datenproblems ermöglicht einen Blick in die Zukunft.
„Fortschritte im Zusammenhang mit der Datenverarbeitung und der Datenwissenschaft können von einer Disziplin auf eine andere übertragen werden“, sagt Bergen. „Wenn jemand eine gute Strategie findet, die in der Geophysik funktioniert, kann jemand in der Klimawissenschaft sie vielleicht übernehmen.“ Als Assistenzprofessorin für Erd-, Umwelt- und Planetenwissenschaften und Datenwissenschaft an der Brown University nutzt Bergen maschinelles Lernen, um nach solchen Lösungen zu suchen.
Maschinelles Lernen ist ein Zweig der künstlichen Intelligenz, der mit Hilfe von Optimierung Modelle auf der Grundlage vorhandener Daten erstellt, die dann für Vorhersagen verwendet werden können. Anstatt einem Computer eine Gleichung zu geben und ihn zu bitten, eine Lösung zu finden, geben Wissenschaftler*innen dem Computer eine Reihe von Ergebnissen und bitten ihn, die beste Gleichung zu finden. Bei der Anwendung auf Erdsysteme können diese Modelle verwendet werden, um die Auswirkungen politischer Entscheidungen und zukünftiger Veränderungen in der Umwelt vorherzusehen.
Das Potenzial des maschinellen Lernens in den Geowissenschaften ist seit Jahrzehnten bekannt, aber erst in jüngster Zeit haben Fortschritte in der Computerwissenschaft diese Art von Projekten möglich gemacht. „Forscher in der Informatik haben herausgefunden, wie man einige der leistungsstärkeren Modelle für tiefe neuronale Netze mit Hilfe von GPU-Computern (Graphics Processing Unit) trainieren kann, was ihnen ermöglicht, diese Modelle in einer Größenordnung zum Laufen zu bringen, wie es vorher nicht möglich war“, so Bergen. „Der Engpass bei der Datenverarbeitung hat sich also in den letzten zehn Jahren stark verändert, was die Arbeit mit diesen Modellen erleichtert. Die Menschen haben auch mehr Daten, die sie in diese Modelle einspeisen können, weil es mehr Sensoren gibt und mehr Menschen, die Daten sammeln.“
Die Verfügbarkeit von Daten ist wichtig dafür, wie maschinelles Lernen funktioniert, indem Modelle für Datenpunkte optimiert werden. „Sie wollen etwas, das auf breiter Basis funktioniert, über einen großen Bereich von Daten. Wenn man nur ein paar Datenpunkte hat, lernt man vielleicht, nur das Rauschen in diesen Datenpunkten abzubilden und nicht das allgemeine Muster“, sagt Bergen. „Das ist der Grund, warum maschinelles Lernen so datenintensiv ist.“
Förderung einer vernetzten Gemeinschaft
Die Verfügbarkeit und Notwendigkeit noch nie dagewesener Datensätze, die Vernetzung natürlicher Systeme und das Versprechen neuer Daten-Tools führen zu einem Ruf nach mehr Verbindungen zwischen Forschenden verschiedener Disziplinen, Hochschulen und Regierungsbehörden sowie zwischen Forschenden und Entscheidungsträger*innen.
„Die Arten von Problemen, mit denen die Gesellschaft konfrontiert ist, sind multidisziplinär“, sagte Gary Rowe, Leiter des EarthMAP-Programms (Earth Monitoring, Analyses, and Projections) beim USGS. „Sie beinhalten Menschen, sie beinhalten natürliche Systeme, sie beinhalten Annahmen darüber, wie sich die Zukunft entwickeln könnte. Es ist also eine große Herausforderung für uns und andere wissenschaftliche Einrichtungen, hier gemeinsam voranzukommen.“

Autor: Matthew Stonecash
Dieser Artikel erschien ursprünglich im AGU’s Eos Magazine und wurde hier im Rahmen von Covering Climate Now, einer globalen Initiative zur Stärkung der Klimaberichterstattung, nochmals veröffentlicht. Übersetzt hat den Artikel Sarah-Indra Jungblut.