Big Data: Das Glossar

JOCHEN STADLER | aus HEUREKA 2/14 vom 28.05.2014

Aadhaar

Zentrale Datenbank in Indien, mit der jeder Bürger und Migrant bis 2015 auf eine zwölfstellige Nummer reduziert wird. Dazu werden Foto, Fingerabdrücke und Iris-Bild nebst Adresse, Telefonnummer und persönlichen Daten gespeichert, damit er jederzeit und überall in Echtzeit identifizierbar ist. Derzeit ist halb Indien registriert, also 750 Millionen Menschen.

Ambient Intelligence

Outsourcing von Denkarbeit an Maschinen. Damit sollen Häuser energiesparender, der Stadtverkehr flüssiger und der Alltag bequemer werden. Hacker bekommen so die Möglichkeit, in fremden Häusern Lichtspiele zu veranstalten. Behörden sowie Konzerne wissen bald mehr über den Tagesablauf der Bürger als diese selbst.

Big Data

Spiel, bei dem man in einem möglichst großen Heuhaufen von Daten Gesetzmäßigkeiten erkennen soll, etwa wie die einzelnen Halme zueinander angeordnet sind, welche einst zum selben Stängel gehörten, und welche vorhaben, den ganzen Haufen zum Einsturz zu bringen.

Bill Gates

Unter anderem für seine Prophezeiung von 1981 berüchtigt: "640 Kilobytes sollten genug für jeden sein." Was er heute übrigens abstreitet.

Cloud

Ort irgendwo im Internet, an dem die Daten von Benutzern gespeichert und Rechenprozesse für sie am Köcheln sind. Man kann von überall zugreifen. Die Arbeit wird dort erledigt, wo Kapazitäten zur Verfügung stehen.

Crowdsourcing

Arbeit wird an unbezahlte Freiwillige abgegeben, die genauso gut arbeiten wie bezahlte Mitarbeiter -und vielleicht auch so kreativ sind, nebenher ihre Familien zu ernähren und Geld für die Miete aufzutreiben.

Data mining

Extrahieren von wertvollen Informationen aus einem Datenberg. Damit kann man etwa Terroristen oder Krebsgene finden und Online-Konsumenten "ähnliche Produkte" andienen.

Datenbank

System, mit dem Daten systematisch so verwahrt werden, wie Eichhörnchen ihre Nüsse für den späteren Gebrauch im Winter vergraben.

Datenflut

Von 2000 bis 2002 hat die Menschheit mehr Daten erzeugt als in den 160.000 Jahren davor. In den folgenden drei Jahren vervierfachte sich diese Menge, und von 2006 bis 2012 wurde sie noch einmal verzehnfacht. 2020 sollen weltweit 100 Zettabytes an verschiedensten Daten existieren.

Datenmüllmanagement

Der Versuch, mit unstrukturierten, doppelt und dreifach vorhandenen, nicht zueinanderpassenden, veralteten und nutzlosen Daten umzugehen, die man sich nicht zu löschen wagt.

Datenschutz

Sollte laut Gesetz dafür sorgen, dass jeder selbst entscheiden kann, wer welche Informationen über ihn aufzeichnet oder erhält.

Datenvielfalt

Ausdruck für kaum vergleichbare, unstrukturierte Daten aus dubiosen Quellen.

Echtzeit

Titel, den Systeme bekommen, die ständig bereit sind, ihre Aufträge zu erledigen, egal ob dies rasch wie bei der Feuerwehr oder allmählich wie an einem Postschalter geschieht.

ELGA

Die "Elektronische Gesundheitsakte" ist eine derzeit leere Datenbank, die sämtliche Gesundheitsdaten der Österreicher vernetzen wird, damit Ärzte, Krankenhäuser und Apotheken in allen Befunden surfen können.

Fraud Detection

Mittels Big Data sollen bei Onlineüberweisungen und Kreditkartenzahlungen Muster erkannt werden, die beweisen, dass Diebe den Code oder die Karte gekapert haben und das Konto schröpfen wollen.

Google

Suchmaschine, die Daten ihrer Benutzer nur zu deren Nutzen sammelt und fallweise an eine Organisation namens NSA weiterleitete.

Hype-Zyklus

Heiß-Kaltbad, durch das Herdentrieb und Unbelehrbarkeit der Menschheit jede neue Technologie schicken.

Zunächst wird sie von Freaks und Spekulanten "gehypt" und erklimmt den "Gipfel der überzogenen Erwartungen", dann folgt der Absturz ins "Tal der Enttäuschungen", bevor sie am "Pfad der Erleuchtung" von Realisten vorangetrieben wird und das "Plateau der Produktivität", das Alltagsleben, erreicht.

Internet

Nadelöhr, durch das Big Data gequetscht werden, wenn Zeit keine Rolle spielt.

Internet der Dinge

Statt Benutzer an ihren PCs, Laptops, Tablets und Smartphones werden immer mehr "intelligente" Eiskästen, Autos und Kleidungsstücke durch eingebettete Computer mit dem Internet verbunden. Das soll die Menschen unterstützen, ohne dass sie es merken.

Metadaten

Daten, die Daten über Daten, aber nicht die Daten selbst enthalten.

NSA

Mutmaßlich größter Kunde von Festplatten weltweit. Sorgt dafür, dass die historisch wohl ungemein bedeutenden Telefonate der deutschen Kanzlerin der Nachwelt ebenso erhalten bleiben wie unser letztes Gespräch mit der Mizzi-Tant', ihre Krampfadern betreffend.

omik

Anhängsel, das Big Data Ansätzen in der Biologie anhaftet. Die Genomik beschäftigt sich mit allen Genen gleichzeitig, die Proteomik mit sämtlichen Eiweißstoffen (Proteinen), die Systeomik mit den Wirkungsgefügen, und die Interaktomik untersucht Wechselwirkungen.

Produktionsfaktoren

Rohstoffe, Arbeitskraft und Kapital sind die traditionellen Quellen, mit denen die Wirtschaft Gewinn machen will. Daten sollen in der Informationsgesellschaft der vierte Produktionsfaktor sein.

Schwarmintelligenz

Ermöglicht, dass eine Stadt voller Menschen oder ein Ameisenhaufen voller Ameisen nicht im Chaos versinkt, obwohl kein einziger der Bewohner oder Ameisen den Überblick über die gesamten Vorgänge in solch einem System hat, geschweige denn sie steuern könnte.

Smart grid

Stromnetz, bei dem die Energie aus vielen kleinen, lokalen und nachhaltigen Quellen strömt und auch dann noch zum Aufladen der Elektroautos und für das Internetsurfen reicht, wenn der Himmel wolkenverhangen ist und sich kein Blättchen bewegt.

Snapchat

App, mit der gerne per Tablet oder Smartphone zum Beispiel nicht ganz jugendfreie Selbstbildnisse verschickt werden, die sich nach wenigen Sekunden selbst zerstören. Freilich hat das Ganze einen Haken. Man kann sie recht einfach wiederherstellen, außerdem hatten Hacker Ende Dezember die Daten von über 4,6 Millionen Snapchat-Nutzern im Internet veröffentlicht.

Social Media

Mittels Big Data ausgeweidete Allmende, die Behörden und Firmen unter anderem verrät, wie das Volk so tickt und was es alles kaufen würde.

Text mining

Was in Österreich angeblich eine Million Jugendliche und Erwachsene nicht können, sollen nun Computerprogramme übernehmen: sinnerfassendes Lesen.

Verschlüsselung

Der Versuch, durch Computer-und Quantentechnik oder durch die Verwendung Vorarlberger Dialekts Gespräche, SMS-und E-Mail-Verkehr abhörsicher zu machen.

Wearable Computing

GPS-Armbanduhren, die den Puls messen und ihn samt Standort des Trägers an die Facebook-Community melden; Brillen, welche die Umgebung permanent filmen sowie Schuhe für Pensionisten, die sie mit einem "Moonwalking-artigen Ausfallschritt durch ein Mini-Fließband an der Sohle" wieder ins Gleichgewicht bringen sollen, wenn sie unterwegs straucheln.

Zettabyte

Größenordnung der aktuellen weltweiten Datenmenge. Sie besteht aus rund 1.000.000.000.000.000.000.000 Bytes, die jeweils zum Beispiel einem einzelnen Textzeichen entsprechen.

Weitere Artikel lesen


Anzeige

Anzeige