Big Data Tata

Big Data verändert unsere Welt: Beruf und Freizeit, Wissenschaft und Rechtsprechung

SABINE EDITH BRAUN | aus HEUREKA 2/14 vom 28.05.2014

War anderes zu erwarten in einer Zeit, da wir uns vor Big Data fürchten? Der Europäische Gerichtshof hat die EU-Richtlinie zur Vorratsdatenspeicherung für grundrechtswidrig erklärt.

Doch der Wunsch nach dem Datenschutz lässt vergessen, dass Big Data neue Möglichkeiten bringt. Wer zur Analyse eines Problems eine Gesamtmenge und nicht nur Stichproben zur Verfügung hat, kann dank Big Data neue Erkenntnisse gewinnen: Beim Vorliegen aller Daten zeigen sich plötzlich Zusammenhänge, die man so nie erwartet hätte. Relativiert dies Statistik? Und kommt in der Wissenschaft nun Korrelation vor Kausalität?

Big Data verändert die Wissenschaft "Big Data hat die Wissenschaft verändert", sagt Arno Scharl vom Institut für Neue Medientechnologie der Modul University Vienna. "Es hat Disziplinen verändert und neue geschaffen wie das Natural Language Processing NLP -ein Sammelbegriff für Verfahren, die versuchen, aus der menschlichen Sprache Wissen zu extrahieren -, oder Web Science mit den Neuen Medien als Forschungsobjekt. Aber Statistik wird nicht obsolet, im Gegenteil. Korrelationen zu erkennen ist wichtig. Man sollte aber nicht blind nach Mustern suchen, um eine beobachtete Abweichung zu erklären. Natürlich soll man Theorien als Grundlage verwenden und mit Hypothesen an eine Studie herangehen. Man kann nicht alles vorab modellhaft abbilden, denn die Verfahren sind komplexer geworden. Das Erkennen von Kausalität ist nach wie vor das Ziel."

Was aber ist "Big Data" eigentlich? Eine Definition gibt es nicht. Wikipedia erklärt pragmatisch: "Datenmengen, die zu groß sind, um sie mit händischen und klassischen Methoden der Datenverarbeitung auszuwerten". Ein weiteres Merkmal: für die Erfassung, Verteilung, Speicherung, Durchsuchung, Analyse und Visualisierung braucht es neue Technologien.

Grippetrends -täglich aktualisiert

Big Data verändert die Art der Analyse und das Tempo, mit dem man auf Phänomene reagieren kann. "Google flu trends", die Vorhersage von Grippeepidemien durch die Auswertung von grippebezogenen Suchanfragen via Google, ist dafür ein Beispiel.

Auf rund 50 Millionen Suchanfragen basiert "Google flu trends". Die IP-Adressen der Anfragen zeigen die Ausbreitung der Krankheit an. Außerdem aktualisiert Google flu trends die bereits diagnostizierten Fälle täglich - nationale Behörden hingegen "nur" wöchentlich. Beide Ergebnisse werden abgeglichen. Für Europa liefert das "European Influenza Surveillance Network" die Daten an Google.

Kann alles datafiziert werden?

Der aktuellen "Digital-Universe"-Studie des US-Computerherstellers EMC zufolge wird sich die digitale Datenmenge von 4,4 Billionen Gigabyte (GB) im Jahr 2013 auf 44 Billionen GB im Jahr 2020 verzehnfachen. Würde man die Daten auf einem Tablet mit 128-GB-Speicherplatz speichern, wäre ein Tablet-Turm letztes Jahr 13.000 Kilometer hoch gewesen - 2020 wäre er 63.000 Kilometer hoch.

Hauptgrund für die Datenexplosion ist das Anwachsen der Sensordaten. Sie entstehen etwa, wenn Hobbyläufer ihre Geschwindigkeit messen lassen, oder aus der Verkehrsüberwachung. Diese Verschiebung der Erfassung vom Computer zu "intelligenten" Geräten heißt "Internet der Dinge", "Internet of Things", oder kurz: IoT.

Im IoT wird immer mehr wertfreie Information zu Daten. Viktor Mayer-Schönberger vom Oxford Internet Institute nennt diese Entwicklung "Datafizierung". In seinem Buch "Big Data" setzt er sich mit den zu erwartenden Veränderungen auseinander. Kann alles zu Daten werden? "Nein, nicht alles kann heute datafiziert werden. Aber in den letzten Jahrzehnten ist es uns gelungen, wesentliche neue Bereiche der Wirklichkeit dank besserer Sensorik kostengünstig in Daten abzubilden. Diese Entwicklung wird sich fortsetzen."

Gibt es einen Punkt der totalen Datensättigung? "Physikalisch natürlich", meint Mayer-Schönberger und verweist auf die Literatur: "Der theoretische Endpunkt ist in einer Geschichte von Borges schön verpackt: Jemand deckt die ganze Welt mit Leinwand ab, um darauf das zu malen, was darunterliegt. Nun stellt sich die Frage: Wenn die Leinwand auf der ganzen Welt liegt, ist sie und nicht das, was darunterliegt, dann die Welt? Ist die Information nicht die Sache selbst, die sie eigentlich abbilden will? Informationelle Ansätze in der modernen Physik fragen in diese Richtung."

Den Klimawandel analysieren Ursache und Wirkung der permanenten Datafizierung ist die Globalisierung. Da scheint ein Phänomen wie der Klimawandel, das die ganze Welt betrifft, prädestiniert für die Bearbeitung mittels Big Data.

Tatsächlich geschieht dies bei "Media Watch on Climate Change", einem seit 2005 bestehenden Webportal der Modul University Vienna. Aus vier Arten von (Internet-)Quellen wird der Diskurs über den Klimawandel extrahiert: aus Nachrichtenmedien, Sozialen Medien sowie den Websites von Umweltorganisationen und Unternehmen. Wöchentlich zwei bis drei Millionen Dokumente werden erfasst und automatisiert verarbeitet. "Sobald ein Dokument klimawandelrelevant ist, beginnt die Maschinerie zu arbeiten", erklärt Arno Scharl.

Ziel ist, "zu verstehen, wie die Kommunikation auf den Plattformen das Thema beeinflusst, was die verschiedenen Stakeholdergruppen damit assoziieren, und zu erkennen, welche Ziele diese Gruppen verfolgen. Die US-Klimabehörde NOAA hat als erste Organisation unsere Technologie eingesetzt." Das alles ist frei verfügbar im Netz. Wenn Firmen dieselbe Technologie für Marken und Produkte verwenden möchten, können sie auf das "Brand Reputation Radar" des kommerziellen Spin-offs "web-Lyzard" zurückgreifen.

Zur Weiterentwicklung der "Media Watch on Climate Change" läuft seit Oktober das EU-Projekt DecarboNet. Daran sind neben anderen Instituten die Open University, die WU Wien und die Universität Sheffi eld beteiligt. Sie entwickeln die Media Watch zur Kooperationsplattform weiter: "Die Technologie aus dem DecarboNet-Projekt soll helfen, Strategien zu entwickeln, um den Carbon Footprint zu verkleinern und nachhaltige Verhaltensänderungen anzuregen", sagt Arno Scharl.

Facebook - Recht auf Datenschutz?

Nicht alle, die sich die Vorteile von Big Data zunutze machen, haben hehre Motive. In der Mehrzahl der Fälle dient Big Data der Umsatzsteigerung -und geht auf Kosten der Anonymität des Einzelnen. Was für Unternehmen zielgerichtete Kommunikation mit wenig Streuverlust bedeutet, ist für Konsumenten in erster Linie lästig. Sie nehmen für Rabatte und Bonuspunkte unverlangte Werbeprospekte, Werbemails und Empfehlungen auf Amazon in Kauf.

Man hinterlässt mit Kundenkarten aber auch Daten, die Aufschlüsse über politische Einstellung, Sexualität, Religion und Gesundheit geben können - Bereiche, die im Datenschutzgesetz als "besonders schutzwürdig" gelten. Denn wer garantiert, dass die Werbepost beim Besitzer der Kundenkarte selbst ankommt?

Viktor Mayer-Schönberger beschreibt in seinem Buch, wie ein US-Diskonter durch Änderungen im Kaufverhalten Schwangerschaften von Kundinnen eruiert -um dann die Gutscheinzusendungen anzupassen. So erfuhr ein Vater von der Schwangerschaft seiner minderjährigen Tochter.

Was aber, wenn solche Daten zum Arbeitgeber, Bankbetreuer oder Versicherungsmakler kommen? Hat jemand, der jeden Einkauf von der Kundenkarte registrieren lässt oder jede Stunde auf Facebook postet, wo er ist und was er gerade macht, überhaupt noch ein Recht auf Datenschutz?

Johann Čas vom Institut für Technikfolgenabschätzung (ITA) meint, "dass sojemand trotzdem noch ein Recht auf dieses Grundrecht hat. Wir sind in einer Übergangsphase, was das Verständnis von Privatsphäre anlangt. Das ist auch ein Problem fehlenden Wissens. Wenn den Menschen bewusst wird, wie lange diese Daten abrufbar bleiben, werden sich die meisten mehr Gedanken darüber machen -etwa darüber, dass auch Personalchefs in Sozialen Netzwerken nachschauen."

Überwachung: USA und Europa Ist das Recht auf Datenschutz eine Pflicht? Kann man darauf verzichten und wie bei der elektronischen Gesundheitsakte ELGA ein Opt-out wählen?"In den Artikeln 8 und 9 des Datenschutzgesetzes gibt es Ausnahmen für selbst veröffentlichte Daten. Das sagt zwar nicht, dass der Datenschutz nicht mehr anwendbar ist, sondern nur, dass es kein Geheimhaltungsinteresse mehr gibt", erklärt Rechtsinformatiker Walter Hötzendorfer. Allerdings gebe es einen Restschutz, und der betreffe Speicherdauer wie Nutzung: "Man darf nicht alles hervorzerren, was jemand vor zehn Jahren gespeichert hat."

Das heißt, selbst wenn jemand im Freundeskreis auf Facebook etwas veröffentlicht, kann er erwarten, dass es nicht alle Welt erfährt, sondern nur seine "Freunde". Es kommt da wohl in erster Linie darauf an, wie gut man seine Freunde kennt. Andererseits gibt es kaum Transparenz darüber, was der Betreiber mit den Daten macht.

"Wenn man bei Google, Facebook oder sonst wo seine Daten hergibt, benutzt sie das Unternehmen. Dafür bekommt man ein kostenloses, gutes Service", sagt der Jurist Erich Schweighofer. "In den USA wird das als gut angesehen, in Europa als schlecht. Wir hatten zu viel Überwachung -Metternich, die Gestapo, die Stasi."

In den USA unterliegt der öffentliche Raum einer starken Überwachung, doch die Privatsphäre ist geschützt. "Dafür ist es bei freiwillig preisgegebenen, personenbezogenen Daten schlimmer. Kreditschutzverbände und Arbeitgeber sammeln alles. Es gibt keinen Rechtsschutz, weil man darauf verzichten muss." Auch an US-Universitäten, sagt Walter Hötzendorfer: "Bei der Inskription in den USA verzichte ich auf meinen Rechtsschutz und muss der Universität das Recht einräumen, Daten, die über mich anfallen, weiterzugeben."

Skivergnügen total überwacht Schweighofer, Hötzendorfer und Janos Böszörmenyi beschäftigen sich im Rahmen der Arbeitsgruppe Rechtsinformatik an der Uni Wien mit Big Data, etwa beim EU-Projekt SMART, das technische, rechtliche und soziologische Aspekte von Überwachungssystemen analysiert. Smarte Überwachung hat drei Merkmale, sagt Hötzendorfer: "Die automatisierte Erfassung durch einen Sensor, eine automatische Entscheidung, basierend auf diesen Daten und drittens einen Akteur zur Umsetzung." Eine Kamera nimmt digitale Bilder auf, die aufgenommene Person wird analysiert und per Bilddatenbank mit gesuchten Personen verglichen. Bevor Polizisten losgeschickt werden, ist also jede Menge Technik im Spiel.

Smarte Überwachung existiere vor allem dort, wo man es nicht vermutet. Etwa in einem Skigebiet: Beim Lift wird ein Foto gemacht, damit man die Tageskarte nicht teilen kann. Außerdem speichert die Karte alle Daten, etwa welche Lifte und Abfahrten wie oft benutzt wurden. "Die Betreiber animieren die Gäste, mit der Karte zu zahlen -so ist kein Skifahrer mehr anonym", sagt Erich Schweighofer. Problematisch sei die polizeiliche Befugnis zur Standortfeststellung via Handyortung ohne richterliche Genehmigung. "Wir schlagen hier eine nachträgliche Informationspflicht über eine Ortung vor, damit diese Befugnis tatsächlich nur bei Gefahren wie etwa bei einem Lawinenabgang eingesetzt wird", ergänzt Hötzendorfer. "Unter der Lawine ist der Datenschutz sekundär. Das wird gelegentlich missbraucht", meint Schweighofer.

Das auf SMART aufbauende EU- Projekt RESPECT untersucht, ob beim Einsatz von Überwachungstechnologien eine Balance zwischen dem Schutz der Privatsphäre, der Effektivität und den Kosten besteht. Die Wiener Rechtsinformatiker beschäftigen sich vor allem mit der Überwachung von grenzüberschreitenden Finanztransaktionen. Denn große Mengen an Daten werden gesammelt, um Geldwäscher, Terroristen oder Kreditkartenbetrüger zu entlarven.

Per Big Data auf die Schwarze Liste "Es gibt voreingestellte Regeln. Der Algorithmus überwacht, ob eine Transaktion einem bestimmten Muster entspricht", sagt Janos Böszörmenyi. Bei Auffälligkeiten hinsichtlich Summe, Ort, Partner oder Häufigkeit ist die Bank verpflichtet, nachzuprüfen und bei konkretem Verdacht dem Staat zu melden. Das Problem dabei: Überweist ein Unbescholtener 10.000 Euro nach Nicaragua, kann das System anschlagen. Ebenso beim ersten Abheben größerer Summen in einem fernen Land.

Um Kunden zu erkennen, von denen ein besonderes Risiko ausgeht, können Banken auf "Schwarze Listen" zurückgreifen, wie sie etwa das Unternehmen Thomson Reuters erstellt. Terroristen, Geldwäscher, Politiker und ihre Anwälte sowie Freunde und Berater stehen darauf.

Einmal auf eine Liste geraten, ist die Tilgung schwierig. Yassin Abdullah Kadi, ein saudi-arabischer Scheich, der von den USA auf die UN-Terrorfinanzliste gesetzt wurde, hat es geschafft, die Löschung von den Listen der EU und UN durchzusetzen. Der Europäische Gerichtshof bewertete Kadis Menschenrechte wichtiger als die Vorgaben des UN-Sicherheitsrates, durch die er auf die Liste gekommen war. Ob sein Name jemals von den Listen der privaten Anbieter gelöscht wird, ist unklar. "Es kann jeden treffen", meint Walter Hötzendorfer. "Das ist eines der großen Probleme mit Big Data. Automatische Entscheidungen sind nicht immer richtig, da kann auch der Unbescholtene Probleme bekommen."

Hilfe für Pflegebedürftige Johann Čas erforscht am ITA ethische Fragen der Anwendung von Informationstechnologien für pflegebedürftige Menschen. "Hier werden sehr intime Daten über die Lebenszusammenhänge erfasst: Wann die Medikamente eingenommen werden, ob gekocht wird, etc. Es geht darum, älteren Personen ein längeres Leben zu Hause zu ermöglichen. Dazu braucht es auch Kontrolle, etwa wenn jemand stürzt, sollen Sensoren dies gleich melden. Eine Abwägung ist schwierig: Was ist notwendig und wie weit wird in die Rechte von älteren Menschen eingegriffen, ohne dass sie einverstanden sind? Ab einem bestimmten Stadium der Pflegebedürftigkeit gehen Autonomie und Intimität verloren. Das soll möglichst im Einverständnis mit den Betroffenen geschehen."

Derzeit arbeitet Čas am EU-Projekt SurPRISE zum Thema Überwachung und Sicherheitstechnologien. Hier ist die Meinung der Bevölkerung wichtig. "Wir fragen nach Alternativen zu Datenanalyse und technischer Überwachung -etwa, ob mehr Polizisten oder mehr Kameras auf der Straße sein sollen. Und worüber Menschen sich Sorgen machen." Im April wurden die empirischen Arbeiten mit "Citizen Summits" in neun Ländern Europas abgeschlossen. Bei einem Vorgängerprojekt kam heraus, dass Terrorismus keine große Rolle spielt.

Aussichten für den Datenschutz Im April erklärte der EuGH die Vorratsdatenspeicherung für grundrechtswidrig. Zuvor hatten sich mehr als 100.000 Österreicher dagegen ausgesprochen und mehr als 11.000 namentlich der Klage angeschlossen. Die Telefonbetreiber in Österreich waren seit 1. April 2012 verpflichtet, die Verbindungsdaten ihrer Kunden sechs Monate lang "auf Vorrat" zu speichern -laut EuGH ein massiver Eingriff in die Grundrechte: "Kriminalität wird immer weiter ins Vorfeld der eigentlichen Tat gerückt", sagt Walter Hötzendorfer. Die formale Aufhebung der Vorratsdatenspeicherung durch den VfGH wird für Herbst erwartet.

"Im Datenschutz verlagert sich der Fokus von der Sammlung auf die Verwendung von Daten", sagt Viktor Mayer-Schönberger. "Richtig gemacht, bedeutet das sogar einen besseren Schutz als heute."

Linktipps: www.ecoresearch.net/climate www.decarbonet.eu www.smartsurveillance.eu respectproject.eu www.oeaw.ac.at/ita/projekte www.google.org/flutrends

Weitere Artikel lesen


Anzeige

Anzeige