Wer sich als Citizen Scientist bzw. Bürgerwissenschaftler*in engagiert, hilft bei verschiedenen Forschungsprojekten mit, sei es, Pinguine auf Fotos und Satellitenbildern zu zählen oder Messwerte über die Luftqualität zu erheben. Davon haben beide Seiten etwas: Während die Bürger*innen Einblicke in die Forschungsarbeit erhalten und sich neues Wissen aneignen können, bekommen die Forschungsprojekte kostengünstige Unterstützung. Aber es gibt immer noch einen begrenzenden Faktor: Viele Menschen müssen sich aktiv beteiligen, idealerweise über einen langen Zeitraum.
Doch wo viele Menschen schon sehr aktiv sind, ist in den sozialen Medien. Jeden Tag werden Tausende von Fotos ins Internet gestellt, zum Beispiel über die Fotoplattform Flickr. Viele der Bilder zeigen nicht nur Menschen oder Landschaften, sondern auch Tiere und Pflanzen, die in freier Wildbahn gesichtet wurden. Für Forschende könnten darin wichtige Informationen über den Gesundheitszustand verschiedener Arten oder die Ausbreitung invasiver Arten stecken. Ein Team aus Forschenden der Universität Cardiff will sich daher diesen medialen Mitteilungsdrang zunutze machen und hat ein Modell entwickelt, bei dem die Daten der Nutzer*innen sozialer Medien in Naturschutzstudien zum Einsatz kommen – die Geburtsstunde der „passiven Bürgerwissenschaft“.
Obwohl Flickr vielleicht nicht so populär ist wie Facebook oder Twitter, war die Plattform ein ideales Testfeld für das Projekt, denn viele Nutzer*innen sind Fotografie-Enthusiasten, die ihre Bilder sehr detailliert taggen. Und genau diese Informationen – Hashtags, geografische Markierungen und Bildunterschriften – helfen dem Team, einen Algorithmus zur Erkennung von Flora und Fauna zu trainieren.
Das Herzstück des Projekts ist die Google Cloud Vision API, die auch schon in anderen Projekten zur Identifizierung von Tieren verwendet wurde. Das KI-gestützte System funktioniert wie eine umgekehrte Bildsuche und kann Muster und Formen mit zunehmender Genauigkeit erkennen. Das Bild und seine Metadaten werden dann mit dem Nationalen Biodiversitätsnetzwerk-Altas (NBN) verglichen, einem digitalen Datensatz, der Informationen über rund 1.500 britische Pflanzen und Tiere enthält – einschließlich ihrer Verbreitung und Population. Durch den Vergleich der Flickr-Fotos mit dieser Datenbank konnte das Team feststellen, ob Tiere an Orten gesichtet wurden, an denen sie bisher nicht aufgetaucht sind. Mit Hilfe dieses Systems kann der Algorithmus sogar Tiere und Pflanzen erkennen, die unbeabsichtigt im Hintergrund fotografiert wurden.
Ausbildung eines digitalen Vogelbeobachters
Natürlich ist der Algorithmus nicht perfekt, und das Team musste viele seiner früheren Beobachtungen verifizieren, um die Genauigkeit zu gewährleisten. Laut Studienautor Thomas Edwards wird der Algorithmus manchmal durch nicht wildlebende Objekte auf den Fotos abgelenkt, und er kann nicht zwischen gleich aussehenden Arten oder Unterarten der gleichen Gattung unterscheiden – zum Beispiel zwischen 10- und 22-fleckigen Marienkäfern.
Die Verwendung von Tags kann auch zu einigen Rätseln führen, die nur von menschlichen Gehirnen gelöst werden können. Als der Algorithmus anzeigte, dass viele Fischadler in Swansea gesichtet worden waren – einem Gebiet, in dem die Vögel noch nie zuvor gesehen worden waren – fand das Team schließlich heraus, dass der Algorithmus getaggte Bilder des Rugbyteams Swansea Ospreys abgerufen hatte.
Das Verständnis für den Kontext der Tags wird sich hoffentlich verbessern, wenn die KI weiter trainiert wird, doch ganz auflösen lassen sich diese „Irrwege“ der KI wahrscheinlich erstmal nicht. Das Team räumt ein, dass die KI zwar riesige Datenmengen erfassen kann, dass es aber eine stärkere Filterung erfordert als die von aktiven Bürgerforschungsplattformen angebotenen. Wie Thomas Edwards gegenüber Popular Science erklärte: „Es wird eine Menge Müll dabei herauskommen, aber man erhält auch viel mehr Daten. Genau hier kommen Ansätze wie dieser und die Klassifizierung ins Spiel, denn dann kann man sie filtern. Es ist vielleicht nicht so schön wie eine perfekte Kampagne, bei der man alle Personen, die sie durchführen, überprüft, aber man erhält immer noch eine Menge Daten, und sie sind immer noch genau genug, um einen Nutzen zu haben.“
Diese Aussage verdeutlicht den grundlegenden Unterschied zwischen aktiven und passiven Citizen-Science-Ansätzen. Aktive Bürgerwissenschaftler*innen können große Mengen an ausgewählten Daten liefern, benötigen aber auch zusätzliche Ressourcen und Unterstützung. Freiwillige müssen gefunden, bis zu einem gewissen Grad geschult und Beziehungen gepflegt werden. Beim passiven Ansatz entfällt die Notwendigkeit, eine Gemeinschaft oder gar eine Plattform zu unterhalten, und es können auch Personen einbezogen werden, die sich des Konzepts der Bürgerwissenschaft vielleicht gar nicht bewusst sind.
Derzeit kann der Algorithmus Wildtiere und Pflanzen in etwa 70 bis 80 Prozent der Fälle genau identifizieren. Das Team hofft, dass das System mit weiteren Verbesserungen bereits identifizierte Arten über einen längeren Zeitraum verfolgen und Informationen über ihre Wanderrouten und Gewohnheiten liefern kann. Zudem gibt es Pläne, das passive System auf andere soziale Netzwerke wie Facebook und Twitter auszuweiten. Ein solcher Schritt bringt jedoch neue Herausforderungen mit sich, nicht zuletzt im Bereich des Datenschutzes.
Dieser Artikel ist eine Übersetzung von Sarah-Indra Jungblut und erschien im Original zuerst auf unserer englischsprachigen Seite.
Der Artikel ist Teil des Dosssiers „Civic Tech – Wege aus der Klimakrise mit digitalem bürgerschaftlichen Engagement“. Alle Artikel des Dossiers findest du hier: Dossier Civic Tech
Das Dossier ist Teil der Projekt-Förderung der Deutschen Bundesstiftung Umwelt (DBU), in deren Rahmen wir vier Dossiers über zwei Jahre zum Thema „Chancen und Potenziale der Digitalisierung für eine nachhaltige Entwicklung“ erstellen. Mehr Informationen hier.