Big Data

Wenn Google entscheidet, welche Seiten wir sehen sollen und Amazon Artikel verschicken will, schon bevor sie bestellt wurden, dann kann man sich sicher sein, dass Big Data im Spiel ist. Doch woher kommen diese als Big Data bezeichneten Daten eigentlich, was bedeuten sie für uns und können sie sinnvoll eingesetzt werden?

Autor*in Henriette Schmidt, 28.05.15

Mit neuesten Analysemethoden und innovativer Technik können für das menschliche Gehirn unfassbare Datenmassen gespeichert und analysiert werden. Egal, ob wir im Internet auf Daten zugreifen oder Einkaufen gehen; viele unserer alltäglichen Handlungen hinterlassen Spuren und werden in Form von Daten gespeichert. Aus tausenden von Einzelhandlungen entsteht ein riesiges Big Data-Meer. Big Data bzw. Smart Data sind verantwortlich für eine gerade von Statten gehende Neugestaltung unseres öffentlichen und privaten Lebens. Denn im digitalen Zeitalter sind Daten die Schlüsselressource für sowohl wirtschaftliche Strategien, individuell zugeschnittene Werbeanzeigen als auch für soziale Anliegen wie Krisenmanagement und Umweltschutz.

Was aber sind das für Daten, wieso werden sie gespeichert und wer hat Zugriff darauf?

Von Big Data zu Smart Data

Hinter dem Begriff „Big Data“ steckt weit mehr als nur eine große Datenmenge. Fachleute definieren die neue gesellschaftliche Ressource über drei Komponenten – die drei Vs „Volume“, „Velocity“ und „Variety“. „Volume“ steht dabei für die sich weiter vermehrenden Daten, „Velocity“ für die immer schneller werdende Verarbeitung der Daten und „Variety“ für die größer werdende Vielfalt der Datenquellen. Der weltweite Datenbestand 2011 belief sich auf 1,8 Zettabyte, eine Zahl mit 21 Nullen, zu der täglich 2,5 Exabytes hinzu kommen (Quelle: die Welt).

Zum einen werden diese unfassbaren Datenmengen durch den Internetzugang von immer mehr Geräten generiert. Waschmaschinen, Digitalkameras oder auch Fahrscheinautomaten sammeln selbstständig Informationen über Standort, Zeit, Datum, Benutzeraktivitäten etc. und geben die Daten an das „Internet der Dinge“ ab (Quelle: Studie Handelsblatt). Eine weitere Datenquelle sind wir, denn unsere Online-Aktivitäten machen einen großen Teil der gesammelten Daten aus. Wir tweeten, bloggen, posten, suchen Wege mit Navigationsgeräten, überweisen per Onlinebanking und bestellen im Internet Kleider. Dadurch füttern wir bewusst oder unbewusst das Internet mit Informationen (Quelle: lfm-Studie). Das „Volume“ der Daten steigt somit weiter exponentiell an: hatten sich seit Beginn der Zeitrechnung bis 2003 ca. 5 Milliarden GB an Daten angesammelt, entsteht diese Menge mittlerweile in nur 15 Minuten!

Allein mit der Datensammlung jedoch ist noch nichts erreicht. Daten sind nutzlos, wenn sie nicht verarbeitet und analysiert werden – oder in anderen Worten: zu Smart Data umgewandelt werden. Im Internet kursieren so viele Informationen, dass ohne den automatisierten Analyseprozess von Computern kein Muster erkennbar ist. Um also Verbindungen zwischen einzelnen Informationsfetzen herauszufinden benötigt es den Speicherplatz von mehreren Prozessoren, die gleichzeitig an einem Problem arbeiten. Dadurch, dass sich Maschinen selbstständig passende Daten heraussuchen und sie miteinander in Beziehung setzen, können sich ganz neue Verbindungen ergeben, die womöglich von Menschen, die fragestellungsorientiert arbeiten, niemals gefunden worden wären (Quelle: Universitas).

Wer hat Zugang zu der Smart Data?

Natürlich verfügt nicht jeder über die Mittel, eine Analyse von Big Data zu vollziehen. Es benötigt Know-How und die richtige Software, um sich Big Data-Analysen zum Vorteil zu machen. Gerade die enorme Höhe des benötigtem Speicherplatzes, der 250 000 mal größer sein muss als der eines Tablets, schließt die Analyse für Einzelpersonen wie auch die meisten Unternehmen aus. Daher können sich vor allem größere Unternehmen eine Analyse der Datenmengen leisten. Facebook oder Amazon z.B. analysieren selbstständig meist personenbezogenen Daten, welche beim Nutzen ihrer Seiten oder bei dem Bestellen von Artikeln entstehen. Damit können sie mehr über ihre User herauszufinden und Verkaufskonzepte und Werbung individuell auf jeden Seitenbesucher zuschneiden.

Daneben existieren auch kommerzielle Analyseinstitutionen, die Daten nach Anfrage und Bezahlung auswerten, Prognosen erstellen und Unternehmen aushändigen, wie z.B der ehemalige Computerhersteller IBM. Wer dabei alles Zugriff auf unsere Daten hat und wofür sie verwendet werden, bleibt allerdings oft unklar.

Die Open Data Bewegung plädiert daher dafür, alle einmal aufgearbeiteten Daten transparent für jeden Menschen verfügbar zu machen. Die Vision: Eine Gesellschaft zu schaffen, in der jeder Zugang zu den gesammelten Daten hat und so jeder seinen Nutzen daraus ziehen kann. Wo zuvor lediglich exklusive Verträge mit Regierungsstellen einen Gebrauch der Daten über z.B. das Bildungswesen, den Verkehr oder das Finanzwesen zuließen, können mittels Ansätzen wie z.B. Open Government alle, meist sogar kostenlos, auf diese Informationen zugreifen und Unternehmen, Social Entrepreneurs und NROs neue Türen öffnen. Mehr dazu: Open Knowledge Foundation Deutschland

Die Quelle der offenen Daten sind meist Regierungen, hauptsächlich in den Bereichen Geoinformationen, Kultur, Wissenschaft, Finanzen, Verbraucherschutz, Statistik, Wetter, Umwelt, Transport sowie Politik und Verwaltung (Quelle: Open Data Handbuch). Damit beschränkt sich Open Data nur auf personenunabhängige Daten, was besonders hinsichtlich datenschutzrechtlicher Problematiken äußerst wichtig und von der Open Data Bewegung als wesentlicher Kontrastpunkt zur kommerziellen Big Data-Verwertung hervorgehoben wird.

Doch ob nun transparent verwendet oder als Dienstleistungsprodukt – wofür sind Smart Data eigentlich konkret zu gebrauchen?

Potenzial von Big Data

Die neuen Möglichkeiten der Datennutzung bieten großes Potenzial zur Verbesserung von Ungerechtigkeit und Missständen wie auch zur Effizienzsteigerung in den Bereichen Energie und Ressourcen.

Umweltsektor

Viele große, einflussreiche Unternehmen stehen in der Kritik, umweltschädlich und nicht nachhaltig zu agieren und dadurch einen großen Teil zu Klimawandel und Umweltverschmutzung beizutragen. Gleichzeitig bereitet sich unsere Gesellschaft gerade auf eine Energiewende vor, in der erneuerbare Energien in den Vordergrund treten. Um die angestrebten Ziele zu erreichen und im Wettbewerb mithalten zu können ist es für Unternehmen vor allem wichtig, effizient und weitsichtig zu arbeiten und Defizite zu beheben. Während man dafür früher lange auf Studien warten musste und meistens erst im Nachhinein die Unternehmensstrategie wechseln konnte, kann der intelligente Gebrauch von Daten zu einer effizienteren Nutzung unserer Ressourcen beitragen. Smart Meter z.B. verarbeiten Informationen über Strom- oder Wasserverbrauch in Echtzeit und bereiten diese auf simple Art und Weise für den Endnutzer auf. Ebenso bietet der Großkonzern IBM der Energiebranche Echtzeit Analysen, die zeigen, wie viel Strom in den Spannungsleitungen zugeschaltet werden muss. So kann die Stromerzeugung auf den wirklichen Verbrauch zugeschnitten werden (Quelle: IBM ). Diese Daten sind jedoch, trotz dem offensichtlichen Nutzen für alle, nicht offen zugänglich, sondern exklusiv für diejenigen, die das Analyseunternehmen engagieren.

Die Verbindung der Big Data Nutzung und neuester ziviler Drohnen- bzw. Satellitentechnologien liefert uns mittlerweile Echtzeit Bilder aus Gebieten, in denen gerade Naturkatastrophen stattgefunden haben. Die Drohnen können durch Datenfütterung selbst ihren Weg bestimmen und liefern gleichzeitig genügend Bilder und Daten, um Karten anzufertigen mit denen Verletzte lokalisiert oder logistische Probleme behoben werden können. Diese werden als Open Source im Internet veröffentlicht.

Eine weitere Möglichkeit, bei der durch Crowdsourcing und Open Source Kartenmaterial für die Umwelt entsteht, ist die neue App Wildlife Witness. Mit ihrer Hilfe können Menschen wichtige Informationen zusammentragen und damit Tierarten schützen: die Nutzer der App können mit Fotos, Videos und der Angabe des Standorts auf den illegalen Handel mit Wildtieren hinweisen. Auf Grundlage dieser Informationen erstellt die App eine Karte, auf die Schutzorganisationen und Regierungen zugreifen können.

Ökonomischer Sektor

Besonders in ärmeren Ländern eröffnen Big Data-Analysen neue Wege, um die ökonomische Situation der Bevölkerung zu verbessern. Die zeitnahe Gewinnung von sozio-ökonomischen Informationen aus sozialen Netzwerken z.B. hat den Vorteil, dass bei Problemen schnell gehandelt werden kann. Social Media-Analysen erlauben es der UN-Initiative Global Pulse Aussagen über bevorstehende Arbeitslosigkeit oder wechselnde Marktpreise zu machen. Durch die Analyse von Tweets kann Global Pulse sich beispielsweise an die Änderung der Lebensmittelpreise in Indonesien herantasten und die Bevölkerung rechtzeitig vor Preissteigungen warnen. Inwieweit Twitter Tweets jedoch zu persönlichen Daten gehören oder verschlüsselt werden sollten ist schwierig zu beurteilen; zu groß ist noch die rechtliche Grauzone bezüglich der intelligenten Datenverarbeitung.

Sozialer Sektor

Es liegt nahe, dass schnelle Informationen mehr Transparenz und mehr Wissen mit sich bringen und somit besonders im sozialen Bereich eine große Bereicherung darstellen. Politische Fehltritte, Probleme bei Hilfsprojekten oder Krankheiten können auf diesem Weg im Vorhinein verhindert werden.

  • Politik

In der Politik erhofft man sich durch die schnelle Auswertung und das Öffnen von Daten eine Effizienzsteigerung der politischen Maßnahmen. Interne Probleme der Bevölkerung könnten unmittelbar mit den Aktionen der Politiker und der daraus resultierenden Veränderung in Verbindung gebracht werden. Das hieße, dass man Gesetze direkt auf ihre Wirksamkeit prüfen und Verantwortliche somit einfacher zur Rechenschaft ziehen könnte. Zusätzlich kann die Öffnung der Daten dem politischen Sektor auch zu mehr Transparenz verhelfen und z.B. Korruption verhindern (Quelle: Universitas).

Das Portal GovData.de der deutschen Bundesregierung bietet Zugang zu einer Vielzahl von Informationen zum Gesundheitswesen, der Bevölkerung, dem Bildungswesen und vielem mehr. Die darüber erstellten Berichte sind für alle zugänglich und werden z.B. als Kartenmaterial aufgearbeitet. So können alle Bürger von den erhobenen Daten in ihrer Umgebung profitieren.

Mehr Transparenz bieten die Angebote des Portals abgeordnetenwatch.de. Es bringt z.B. alle Wahlergebnisse und Abstimmungspläne der Abgeordneten im Bundestag und Europaparlament zutage. Hier wird jahrelang das Stimmverhalten von Abgeordneten gespeichert, sodass lange nachverfolgt werden kann, wie treu die Abgeordneten ihren Versprechen bleiben.

  • Zivilgesellschaft

Zwischen NGOs, Hilfsorganisationen, Spendern und Nehmern herrscht leider meist ein geringer Austausch, weshalb Projekte trotz guter Vorsätze oftmals nicht ideal realisiert werden. Das soll sich durch einige neue Initiativen, die sich auf Datensammlung und Weitergabe spezialisiert haben, ändern.

Markets for Good beispielsweise wollen eine Informationsinfrastruktur für den sozialen Sektor schaffen und eine Übersicht von allen Berichten, Studien und Beobachtungen im non-profit Bereich online erstellen. Zudem veranschaulichen sie online, welche Organisationen Daten sammeln und bereit sind, diese zu teilen, sodass eine Vernetzung zwischen den Organisationen und ein besserer Austausch geschaffen werden kann. Jene Organisationen, die noch Schwierigkeiten bei der Analyse ihrer Daten haben, können sich von Data Kind helfen lassen. Data Kind bringt Statistikexperten mit NGOs zusammen und hilft dabei, die richtigen Informationen aus den Datenbergen herauszuziehen.

Die britische Initiative der Abteilung für internationale Entwicklung, International Aid Transparency und die Organisation Washfunders haben sich auf die Offenlegung der Ausgaben von Hilfsorganisationen konzentriert und wollen damit die Entwicklungshilfe transparenter und wirkungsvoller gestalten. Ziel ist, dass Spender und Politiker besser darüber informiert sind, wo und wie viel Geld wirklich gebraucht wird.

In unserem Artikel Digitaler Aktivismus findest du noch weitere Besipiele wie Datengewinnung konkret zur Hilfe in Krisengebieten eingesetzt werden kann.

  • Gesundheit

Offene Daten nutzen auch dem Gesundheitswesen überall auf der Welt, denn je mehr die Menschen über Krankheiten wissen, desto besser können sie sich selbst schützen. Das Malaria Atlas Projekt entwickelt deswegen mit einem Team aus Experten Malaria Maps, welche die Verteilung und Ausbreitung von Malaria in verschiedenen Gebieten darstellen und jedem als Open Source zugänglich sind.

Tendai ist ein Projekt, das mit der Erfassung von Daten in acht verschiedenen Entwicklungsländern die Gesundheitsversorgung verbessern will. Gesundheitsberater werden ausgebildet, die in den entsprechenden Ländern Verfügbarkeit und Marktpreise von Medikamenten sammeln, sie mit ihrem Smartphone erfassen und Interviews führen. Diese Daten werden dann wiederum in der Leitstelle analysiert und veröffentlicht. So konnten bereits extreme Schwankungen der Medikamentenpreise entdeckt und behoben werden.

Betrachtete man diese vielen auf Big Data basierenden Projekte und Initiativen scheint das Potenzial unserer neuen Ressource unendlich zu sein. Wenn alle alles wissen ist jedem geholfen – doch gibt es auch Informationen, die niemand über uns wissen soll und über die wir lieber die Kontrolle behalten wollen?

Risiken und Herausforderungen

Spätestens seit dem Geheimdienst-Skandal über den Zugriff auf persönliche Daten im Sommer 2013 erhitzte sich die Diskussion über die Risiken und Probleme der Nutzung von Big Data. Das Problem dabei ist die Frage nach dem Gebrauch von persönlichen Daten, denn in vielen Fällen haben wir keinen Einfluss darauf, von wem und wofür unsere Daten gesammelt und genutzt werden. Die rechtlichen Bestimmungen zu diesem Problem existieren in Deutschland noch nicht, da die Gesetze zum Datenschutz noch aus einer Zeit stammen, in der es nicht mal das Internet gab (Quelle: Studie Handelsblatt). Die neue Gesellschaftsressource ist aus diesem Grund ambivalent zu betrachten, vor allem auch, weil die Entwicklung der Big Data, einmal in Gang getreten, nicht mehr aufhaltbar ist.

Solange verantwortungsvoll mit den Daten umgegangen wird, kann Big Data bei der Lösung sozialer und ökologischer Herausforderungen helfen und mehr Transparenz in Entscheidungsprozesse bringen. Projekte wie Smartcitizen bieten ein positives Beispiel, wie Big Data in Zukunft jedem Einzelnen dabei helfen kann, sich ein objektiveres Bild von seiner Umwelt zu machen und diese gemeinsam mit anderen zu verbessern. Werden jedoch personenbezogene Daten an Unternehmen verkauft oder von ihnen genutzt, um kommerzielle Ziele zu verfolgen, wie es z.B. bei individuellen Werbeanzeigen der Fall ist, ergibt sich kein Mehrwert für Gesellschaft und Umwelt und andere verfügen unkontrolliert über unsere persönlichen Informationen.

Die Sammlung und Analyse der Big Data kann ein echter Gewinn für unsere Gesellschaft sein insofern sie so transparent wie möglich gestaltet und nach Möglichkeit allen Menschen offen zugänglich gemacht werden.

Quellen und Links

Autorin: Henriette Schmidt /RESET-Redaktion (2014)

MARKIERT MIT
Smart Grid – Die Hoffnung der Energiewende?

Bis zum Jahre 2020 soll ein Drittel des erzeugten Stroms aus erneuerbaren Energien stammen, die großen Kohle- und Atomkraftwerke sollen bis dahin abgedankt haben. Viel wird in den Medien und der Politik über die hohen Kosten der Energiewende gesprochen. Warum können wir nicht einfach die Energiequellen austauschen und was wird sich alles bei der Energiewende verändern müssen?

Digitaler Aktivismus

Handys, Blogs und Social Networks: wie Aktivisten heute digitale Technologien nutzen, um für sozialen Fortschritt zu streiten, zeigen konkrete Beispiele aus der ganzen Welt - von ägyptischen Bloggern über Videoaktivisten in Syrien bis zum kenianischen Handyprojekt Ushahidi.

Smart Metering – Die Zukunft des Energiesparens

Wenn wir ein Gefühl dafür entwickeln, wie viel Energie wir wann und wo verbrauchen, können wir Energiefresser in unseren vier Wänden aufspüren, unser Verbrauchsverhalten optimieren und Energie und Kosten sparen, so die Hoffnung. Möglich machen sollen das intelligente Stromzähler, die sogenannten „Smart Meter“.