Big Data - was bringt denn das?

Die ständig wachsenden Datenmengen bringen mehr als Überwachung und Marketing. Richtig analysiert, könnte Big Data die drängendsten Probleme der Menschheit entschärfen helfen

Verena Ahne | aus HEUREKA 4/13 vom 16.10.2013

Schon von Petabyte gehört? Oder Exabyte? Alle paar Jahre kommt ein neues Wort für jene unfassbaren Datenmengen, die entstehen, indem wir das Internet und andere elektronische Kommunikationsformen nutzen und die Welt in allen Aspekten vermessen. Alle zwei Jahre verdopple sich das "Digitale Universum", hieß es vor zwei Jahren. Inzwischen wächst es noch schneller. Wir messen jetzt in Zettabyte - eine Zahl mit 21 Nullen.

Big Data für Google und Smart Cities

Was ist Big Data? Gewaltige Datenmengen, mit denen man viel Geld verdienen und Macht sowie Einfluss gewinnen kann. Die großen Internetfirmen wie Google, Amazon und Facebook nutzen Big Data längst, um ihre (Werbe-)Angebote immer präziser dem Nutzerverhalten anzupassen. Die Nachrichtendienste versuchen sich damit in der totalen Überwachung.

Auch viel, was sich "smart" nennt, nutzt Big Data. Smart Cities optimieren damit den Verkehr oder senken den Energieverbrauch, Smart Grids sorgen mit Big Data für ein stabileres Stromnetz, smart Logistics für besser ausgelastete Lkw und Container, effizientere Bahnhöfe und Häfen. Durch Big-Data-Analysen könnten Grippewellen prognostiziert, Polio oder Malaria ausgerottet und medizinische Behandlungen personalisiert werden, heißt es -und so manches andere mehr.

Big Data für Babywindelwerbung

Laut BITCOM, dem deutschen Bundesverband Informationswirtschaft, Telekommunikation und neue Medien, wurden im Jahr 2012 weltweit 4,6 Milliarden Euro mit Big-Data-Anwendungen umgesetzt, in drei Jahren sollen es 16 Milliarden sein. Nichts im Vergleich zu Prognosen der Unternehmensberater McKinsey: Big Data sei "The Next Frontier für Innovation, Wettbewerb und Produktivität". Damit könnten beispielsweise europäische Verwaltungen mindestens 100 Milliarden pro Jahr einsparen.

Die Betonung liegt auf "könnten": Denn viel zu wenige wüssten mit den Daten umzugehen. In US-Unternehmen, so McKinsey, werden in den nächsten Jahren bis zu 190.000 Personen fehlen, die Datenauswertungen beherrschen, und bis zu 1,5 Millionen Manager und Analysten, die wissen, was mit den Ergebnissen anzufangen wäre.

Alle diese Fragestellungen seien "Peanuts", meint dagegen der Physiker und Ökonom Stefan Thurner vom Institut für die Wissenschaft Komplexer Systeme an der MedUni Wien und einer der wenigen Big-Data-Experten in Österreich. "Im Moment arbeiten alle mit Korrelationen - die ja auch beeindrucken auf den ersten Blick."

Damit bekommt etwa in den datenschutzschwächelnden USA eine Frau Babywindelwerbung aufs Handy, noch bevor sie jemandem von ihrer Schwangerschaft erzählt hat.

Der Grund: Junge Frauen, die bestimmte Nahrungsergänzungsmittel kaufen, sind meist schwanger - der Supermarkt, der um ihr Kaufverhalten weiß, schickt die dazu passende Werbung.

Big Data für Polizei und Diabetiker

Korrelationen von Daten führen auch dazu, dass Polizeistreifen zu bestimmten Zeiten an heiklen Orten postiert werden, um Verbrechen zu verhindern. Diese Form der in einigen US-amerikanischen Städten bereits recht erfolgreichen Verbrechensbekämpfung beruht auf einer Auswertung aller Polizeidaten. "Big Data funktioniert gut bei Überwachung und Marketing", so Thurner, also dort, wo Informationen gesammelt, systematisch ausgewertet und auf einzelne Personen bezogen werden. Das wurde schon früher gemacht. Neu ist jetzt nur die ungeheure Menge an verarbeiteten Daten.

Thurner findet die Ergebnisse durchaus interessant und oft überraschend, wie er zum Beispiel an den Gesundheitsdaten aller österreichischen Diabeteskranken selbst feststellen konnte. Die Analyse ergab, dass ungewöhnlich viele, die in den Jahren 1920,1938 und 1947 geboren worden waren, später zuckerkrank wurden. Der Zusammenhang: In einigen Regionen Österreichs herrschte in jenen Jahren Nahrungsmittelknappheit - und die Nachkommen hungernder Schwangerer sind später im Leben anfälliger für Diabetes.

An der Mathematik, die dem Datensatz die "richtigen" Antworten entlockt, tüftelten die Forscher zwei Jahre lang. "Aber jetzt können wir uns hunderte medizinische Studien sparen", sagt Thurner: "In ein paar Minuten spuckt uns der Computer zwanzig Millionen Studien aus. Darin sind vielleicht tausend Fragestellungen relevant." Viele davon sind bekannt, etwa, dass Diabetes oft mit Hautjucken oder Nierenproblemen einhergeht, und bestätigen damit, dass das Modell funktioniert. "Übrig bleiben rund zweihundert Aussagen, an die bisher niemand gedacht hat."

Big Data für Netzwerkverständnis

Die wahre Chance in Big Data liegt jedoch anderswo: in der Möglichkeit zu verstehen, wie Netzwerke funktionieren - oder Netzwerke von Netzwerken, "Multiplex-Netzwerke" genannt. Erst ein paar hundert Expertinnen und Experten haben begonnen - und das mathematisch-mentale Rüstzeug dafür -, darüber nachzudenken, wie diese Netzwerke ineinandergreifen, sich durch Wechselwirkungen verändern (Koevolution) und welche ihre Risiken sind.

Das ist das Feld der Komplexitätsforschung. "Durch das flächendeckende Mitschreiben von fast allem, was derzeit auf der Welt vor sich geht", sagt Thurner, "hat der Mensch erstmals die Möglichkeit, Komplexität wirklich in den Griff zu bekommen". Und damit die großen Probleme der Menschheit: Finanzmärkte, Klimawandel, Urbanisierung sowie die Finanzierung des Sozial- und Gesundheitssystems.

Big Data für die Klimaforschung

Die Klimaforschung nutzt Big Data in großem Stil. Millionen von Messdaten und tausende Analysen flossen etwa in den neuen IPPC-Bericht ein. Zum Teil können relativ komplexe Klimavorgänge heute halbwegs genau abgebildet und Verläufe simuliert werden. Trotzdem steht die Forschung erst am Anfang: "Wir wissen noch immer nicht, wie schnell sich das Klima ändert. Oder was die wirklichen - nicht nur die vermuteten - Konsequenzen daraus sind." Was passiert in der vernetzten Welt, wenn Küstenstaaten und Inseln im Meer versinken? Was bedeutet das zum Beispiel für Nahrungsmittelproduktion, Arbeit und Seuchenwahrscheinlichkeit?

"Um Vernetzung, die sich ständig ändert, zu verstehen", so Thurner, "braucht man eine Mathematik, die gerade erst entwickelt, ja, neu erfunden wird". Die EU hat acht Forschungsgruppen damit beauftragt, sich dieses Themas anzunehmen, eine davon ist Thurners Gruppe in Wien. In den USA arbeiten sechs Forschungsgruppen mit einem Vielfachen der EU-Mittel.

Big Data für Finanzmärkte

Im Jänner erklärte Thurner im renommierten Wissenschaftsmagazin nature, wie mit Big-Data-Analysen das Multiplex-Netzwerk Finanzmarkt so stabilisierbar wäre, dass kein neues 2008 mehr zu befürchten ist - wofür es die Freigabe aller Finanzmarktdaten bräuchte. Wird an solchen Fragestellungen gearbeitet, könnte Big Data aber nicht nur wenigen viel Geld und Macht bringen, sondern allen Menschen bei den großen Herausforderungen der Zukunft nützen.

Forschen für die Zukunft

Zu diesem Thema findet im Oktober ein Science Talk statt: Es diskutieren Wissenschafts-und Forschungsminister Karlheinz Töchterle, Henrietta Egerth, Geschäftsführerin der Österreichischen Forschungsförderungsgesellschaft (FFG), Christoph Zielinski, Onkologe an der MedUni Wien, und Josef Penninger, Wissenschaftlicher Leiter des Instituts für Molekulare Biotechnologie (IMBA).

Termin: Montag, 21. Oktober 2013, 19 Uhr

Ort: Aula der Wissenschaften, 1., Wollzeile 27a

Zu den Illustrationen

In der Eiswüste des Polarmeeres treiben zwischen den sich türmenden Packeismassen Eisschollen riesigen Ausmaßes und enormer Dicke. Diese schwimmenden Eisinseln, die auf gleichbleibendem Kurs um den Nordpol kreisen, sind ideale Stützpunkte für den Weltluftverkehr; denn die kürzesten Flugwege kreuzen den Pol. Vielleicht schon morgen wird man Hangars und Montagehallen metertief in das massive Eis schlagen und so den ersten, gegen Schneestürme und grimmige Kälte geschützten Luftbahnhof in der Region des ewigen Eises schaffen.

Illustration: Klaus Bürgle, 1953

Weitere Artikel lesen


Anzeige

Anzeige