Daten im Kleinen. Eine Reminiszenz

Der Autor, ein Pionier des Internets im akademischen Bereich und Gründer eines Lehrstuhls für Internet und Philosophie an der Uni Wien, über Aspekte der Internetgeschichte

HERBERT HRACHOVEC | aus HEUREKA 2/14 vom 28.05.2014

Sind 20 Jahre eine lange Zeit? In diesem Zeitraum haben wir uns an die globale digitale Vernetzung und ihre weltgeschichtlich einzigartigen Ergebnisse gewöhnt. Und doch ist es noch nicht so lange her, dass die neu erschlossenen Möglichkeiten fantastisch schienen.

Zwei relativ bescheidene Beispiele aus der frühen Zeit des Internets können als Beleg dienen. Das eine ist CDDB, ein Archiv zur Erfassung der Metadaten von Audio-CDs, also von Musikernamen, Produktions-und Songtitel, Dauer, Genre etc. Solange man einzelne Platten oder auch CDs in Geräte einlegte, waren diese Informationen eng mit den Handgriffen zum Abspielen der Musik verbunden. Mit dem Aufkommen mobiler mp3-Spieler haben sich die Verhältnisse geändert.

Von Metadaten für Musik ...

Diese Vorrichtungen erlauben es, die eigene Musiksammlung zur Gänze auf einen digitalen Massenspeicher zu übertragen und jedes Stück augenblicklich verfügbar zu halten. Die Metadaten spielen dabei eine entscheidende Rolle. Sie regeln den Zugriff auf die umfangreichen akustischen Bestände, die wir in der Tasche herumtragen, aber sie müssen von den CDs eigens auf die Festplatte übertragen werden.

Die faszinierende Idee bestand nun darin, dass jemand, der die Metadaten per Hand eingegeben hatte, sie über ein Skript an eine Sammelstelle im Internet weiterreichte. Von dort können sie in der Folge von jeder Person, die einen solchen Transfer durchführt, automatisch abgerufen werden.

...und Multi-User-Dungeons...

Das zweite Beispiel kommt aus dem Umkreis der experimentierfreudigen Spiel-und Unterhaltungsszene der Anfangsjahre.

"Virtuelle Gemeinschaften" konnten im Rahmen eigener Nachrichtendienste ("Usenet") oder Mailinglisten aufgebaut werden. Sie agglomerierten asynchron Textmitteilungen unter einer gegebenen Adresse. Und dann gab es synchron angebotene Textwelten ("Chats"). Sie konnten erweitert werden, indem die Eingaben der Beteiligten mit einer Szenerie versehen wurden, einer Infrastruktur von Beschreibungen, die aus "Kanälen" Räume machte. In sogenannten "MUDs" konnten Avatare der Mitspieler-Innen sich durch Landschaften bewegen, die eine Datenbank erzeugte.

Ein bis dato unbekanntes Verhältnis zwischen der Echtzeit körperlich geografisch verteilter Personen und der Echtzeit ihrer in einem technisch generierten Raum interagierender Spielfiguren war geschaffen.

zum Service des Großkonzerns Das eine Beispiel betrifft die Verteilung von Produkten, das andere den Aufbau sozialer Konstellationen im Internet. Beides war einmal deutlich getrennt. Wenn man sich ansieht, was aus diesen Ansätzen geworden ist, bietet sich ein anderes Bild. Es gibt bequem zu handhabende Programme zur Archivierung der eigenen Bücheroder DVD-Sammlung. Sie greifen auf Repositorien für die benötigten Metadaten zurück. Dabei sind Amazon und die Internet Movie Database prominente, oft unübertreffliche Anbieter. Die Daten kommen nicht mehr durch die Beiträge einer aktiv gestaltenden Benutzergruppe zusammen, sondern werden über die Schnittstelle eines Großkonzerns bereitgestellt. Die Messlatte ist, was dieser verkauft.

Maschinenzeit und Echtzeit Virtuelle Gemeinschaften haben eine vergleichbare Entwicklung genommen. Im Wechsel von der ressourcenschonenden Textversion zu grafisch gut ausgestatteten "Welten" waren neue Finanzierungsquellen nötig. "Second Life" führte das Doppelspiel - "real life" versus "virtual life" - auf einer kommerziellen Basis weiter. Doch diese Art des Versteckspiels in der Rollenvielfalt war auf Dauer weniger attraktiv, als die Transparenz der Personenzuordnung in den "social sites" MySpace und Facebook.

Viel wurde über die postmoderne Raffinesse und die verzwickten ethischen Herausforderungen geschrieben, die innerhalb des "zweiten Lebens" angeboten wurden. Herausgekommen ist ein Angebot im Web, das die maschinengesteuerte an die herkömmliche Echtzeit assimiliert. Nicht bloß eine E-Mail von minimaler Größe, sondern auch die Inhalte einer für Millionen permanent verfügbaren Kommunikationsplattform werden mühelos verbreitet. Das ist nicht umsonst.

Nutzer -Konsument -Objekt Die Finanzierung dieses -mittlerweile - Normalzustandes ist dadurch möglich geworden, dass sich die Bereiche, aus denen die beiden anfangs gewählten Beispiele genommen sind, vermischten. Die gründliche, systematische Erfassung der Daten über Waren und die ebenso weitreichende Einbindung großer Teile der Bevölkerung in soziale Netzwerke haben eine neue Perspektive eröffnet. Nutzerinnen des Internet sind nun prospektive KonsumentInnen. Ihr Verhalten in diversen interaktiven Zusammenhängen (skriptgesteuert oder kommunikativ) lässt sich im Hinblick auf Verkaufsstrategien erfassen und auswerten.

Hier setzt die Expertise im Umgang mit großen Datenmengen ein. Je anziehender die Online-Umgebungen sind, in denen sich SurferInnen aufhalten, desto größer die Teilnahmezahl, und desto mehr ist auch der Zugang zu den dabei anfallenden Daten wert. Es handelt sich nicht einfach um eine Vermischung der Sphären. Die Informationen über das Kundenverhalten werden selbst zum Verkaufsobjekt. So wie die Sendungen der kommerziellen TV-Sender so kalkuliert sind, dass sie das nötige Werbegeld einspielen, dienen die Annehmlichkeiten der großen Provider der sozialen Netze der Anwerbung der entsprechenden Handelsware.

Facebook für Akademiker Der problematische Umgang mit Nutzerdaten durch Facebook hat sich herumgesprochen. Das Geschäftsmodell ist jedoch allgemein verbreitet. Academia.edu zum Beispiel bietet einen Präsentationsteller für WissenschafterInnen. Sie können ihre Publikationen mit Bild und CV komfortabel vorstellen. Als Bonus erhalten sie Zugang zu den Zugriffsstatistiken ihrer Eintragungen.

Seinen Geschäftspartnern erklärt der Gründer der Plattform, warum sie in sie investieren sollen: Metadaten. An ihnen ließe sich ablesen, wer die gegenwärtigen (und künftigen) Stars in den einzelnen Disziplinen sind und auf welche Entwicklungen man setzen sollte. Nicht ohne Grund gibt er als Ziel seiner Plattform an, den wissenschaftlichen Output der Welt insgesamt in PDF zu erfassen.

Nur dadurch wird das kommerzielle Verwertungsziel plausibel. Big Data würde in diesem Fall kein Bild der Zustände abgeben, sondern die komplette Bestandsaufnahme wissenschaftlicher Ergebnisse und ihrer Rezeption würde den Zustand selbst handfest machen.

Die Vorstellung, man könne die ganze Wissenschaft (oder gar das gesamte Sozialverhalten einer Bevölkerung) in ein Depot fassen, ist illusorisch. Aber es ist aufschlussreich zu sehen, dass diese Fantasie sich aus vielversprechenden Praktiken im digitalen Netzverkehr entwickelt hat. Für die Internetprotokolle sind fixe Adressen der TeilnehmerInnen nötig, zwischen denen ein Austausch nach vorweg festgelegten Regeln stattfindet. Damit liegen Anhaltspunkte vor, die ausgewertet werden können - Metadaten. Die Spuren, die in solchen kommunikativen Abläufen erzeugt werden, bleiben jedoch nicht unverfänglich.

Das Protokoll zum Mailverkehr (SMTP) enthält keine Authentifizierung -die Folge sind Spamattacken. Das Protokoll des WWW baut keine kontinuierliche Verbindung zwischen den Servern und den Browsern auf. Eine Anfrage wird erledigt, damit ist die Prozedur zu Ende. Für komfortables Surfen, für Formularabfragen, für Bestellvorgänge und für Streaming ist es nötig, dass die beiden Enden der Leitung in Verbindung bleiben -die Folge sind Cookies und alles, was im Anschluss daran auf der Empfängerseite platziert wird, um die Identität der Benutzer zu bestimmen und ihr Verhalten zu durchforschen..

Es musste nicht so kommen, aber im Nachhinein dämmert es doch: Es ist kein Wunder, dass es so gekommen ist. Die Effektivität der Warenwirtschaft ist schwer zu überschätzen.

Weitere Artikel lesen


Anzeige

Anzeige