Big Data: Wir schwimmen im Datenmeer

Nr. 49 –

Der Einzelne kann nicht kontrollieren, was Algorithmen über ihn herausfinden. Wer schützt uns vor den Schlüssen, die die Wirtschaft aus unserer Datenspur zieht?

Wer nichts zu verbergen hat, hat nichts zu befürchten. Schön wäre es. Es sind nicht primär die Geheimdienste, vor denen wir uns fürchten sollten. Es sind Google, Facebook, Twitter und alle andern, denen wir uns unablässig anvertrauen.

Was sie tun, ist nicht grundsätzlich schlecht. Sie tun letztlich nur, was man tun kann: Daten sammeln. Erst seit wenigen Jahren ist es überhaupt möglich, diese unvorstellbaren Mengen an Daten zu speichern. «Big Data» nennt sich das – und meint die Gesamtheit aller verfügbaren Daten, die erlauben, die Welt aus einer epochal neuen Perspektive zu betrachten. Klebten wir mit unserer Wahrnehmung bislang am Boden, können wir plötzlich fliegen. Es lassen sich mit Big Data Zusammenhänge sehen, die man vorher nicht einmal erahnte.

Vieles davon ist hilfreich – wie zum Beispiel die Wettervorhersage. Die MeteorologInnen füttern ihre Computer mit unendlich vielen Wetterdaten, komplexe Algorithmen errechnen daraus, dass es morgen auf dem Pilatus schneit und in Basel die Sonne scheint. Algorithmen beantworten eine Frage, indem sie sie in mathematische Einzelschritte und Formeln zerlegen. Die Frage ist verständlich (wie wird das Wetter?), die Antwort begreifen wir ebenfalls (es schneit) – aber was dazwischenliegt, ist nur etwas für MathematikerInnen. Alle andern kapitulieren vor der Komplexität der Algorithmen, die immer mehr unser Leben beeinflussen.

Eines der bekanntesten Big-Data-Beispiele stammt von Google. Google schaffte es, ein Modell zu entwickeln, das es erlaubt, die Ausbreitung einer Grippeepidemie exakt abzubilden. Die Gesundheitsbehörden, die jeweils die Meldungen der HausärztInnen analysierten, hinken mit ihren klassischen Auswertungen ein bis zwei Wochen hinterher.

Google-Leute taten nichts anderes, als Suchbegriffe wie «Husten», «Fieber», «Grippemittel» zu analysieren. Sie mussten allerdings viele mathematische Modelle testen, bevor sie die Lösung fanden. Am Ende hatten sie ein Modell, das mit 45 Suchbegriffen auskommt und die Ausbreitung der Grippewelle sozusagen in Echtzeit abbildet.

Bei einer gefährlichen Epidemie kann ein solches Programm hilfreich sein, weil es den Gesundheitsbehörden hilft, ihre beschränkten Mittel schnell am richtigen Ort einzusetzen.

Big Data wird das Gesundheitssystem ohnehin fundamental umkrempeln, weil damit Diagnosen genauer und Therapien individueller angepasst werden.

Steve Jobs konnte sich das schon leisten. Der ehemalige Chef von Apple liess seine DNA komplett analysieren, als er an Krebs erkrankte. Die ÄrztInnen konnten deshalb die Medikamente exakt auf Jobs Krebs einstellen. Wenn der Krebs mutierte und ein Medikament nicht mehr wirkte, setzten sie das nächste massgeschneiderte Medikament ein. Das bescherte Jobs einige zusätzliche Lebensjahre. Im Normalfall muss eine Ärztin heute noch darauf vertrauen, dass ihre PatientInnen etwa gleich reagieren wie die ersten Testpersonen – was eigentlich eine völlig falsche Annahme ist. Eine individualisierte Therapie ist in vielen Fällen noch zu teuer. Je mehr individualisierte Daten über Krankheitsverläufe verfügbar sind, desto präziser und günstiger lassen sich jedoch künftig die Karzinome behandeln.

Das Warum interessiert nicht mehr

Bislang ging die Wissenschaft so vor: Man hat ein Problem, stellt eine Vermutung auf, die das Problem erklären könnte – danach versucht man, die Vermutung mit verschiedenen Methoden zu belegen. Wenn dies gelingt, hat man eine Kausalität und kann zum Beispiel feststellen: Rauchen verursacht Krebs. Auch wenn nicht jeder an Krebs erkrankt, der raucht, gilt die Kausalität als bewiesen.

Mit Big Data läuft es anders. Man will wissen, «was» passiert, das Warum interessiert nicht mehr. «In der Big-Data-Welt müssen wir uns nicht auf Kausalitäten festlegen, sondern können viel öfter nach Mustern und Korrelationen in den vorliegenden Daten Ausschau halten, die uns neuartige und wertvolle Erkenntnisse gewähren. Die Korrelationen sagen uns nicht, warum etwas geschieht, aber sie machen uns darauf aufmerksam, dass etwas geschieht», schreiben Viktor Mayer-Schönberger und Kenneth Cukier in ihrem Buch «Big Data. Die Revolution, die unser Leben verändern wird».

Die beiden Autoren bringen das Beispiel von Wal Mart. Die US-amerikanische Supermarktkette hat mit ihren Datenanalysen herausgefunden, dass Menschen, die plötzlich parfümfreie Körperlotionen, Magnesium, Folsäure und Zink kaufen, mit grösster Wahrscheinlichkeit schwanger sind. Wal Mart deckt diese Kundinnen dann gezielt mit Werbung ein.

Denn darum geht es: Man will vorhersagen können, was die Menschen tun und brauchen, um den Profit zu maximieren.

Da kommt dann auch die dunkle Seite von Big Data zum Vorschein. Schickt man den richtigen Algorithmus in die Tiefen des Datenmeers, lässt sich herausfinden, ob wir brav unsere Rechnungen zahlen, wie gross unser Einkommen künftig sein wird, ob wir krank werden, Unfälle verursachen oder vielleicht ein Delikt begehen.

Das ist nicht Science-Fiction, das ist Realität. Bereits liefern spezialisierte Firmen Informationen über die Kreditwürdigkeit einer Person. Wer dabei schlecht abschneidet, erhält keine Kredite mehr, weiss aber nicht, warum. Dasselbe gilt für Krankenversicherungen, die eine Person nicht mehr versichern, wenn sie ungesund lebt, raucht oder übergewichtig ist. Und es gilt in gewissen US-Bundesstaaten bereits für StraftäterInnen: Ein Computerprogramm evaluiert ihr Rückfallrisiko und entscheidet, ob jemand auf Bewährung freigelassen wird oder nicht.

Es sind bequeme Programme, weil sie viel mehr Daten verarbeiten können als menschliche ExpertInnen. Und vor allem braucht kein Mensch mehr Verantwortung zu übernehmen. Der Algorithmus tut das.

Anonymisierung nützt nichts

Das Hauptproblem ist, dass die unendlichen Datenmengen einen nicht schützen. Es ist ein fataler Irrtum zu glauben, man würde im Datenmeer abtauchen und verschwinden können.

Wir sind nicht einmal geschützt, wenn wir nur anonymisierte Spuren hinterlassen. Der Zürcher Datenschutzbeauftragte Bruno Baeriswyl schreibt: «‹Big Data› ist grundsätzlich eine Menge anonymisierter Daten. Je grösser diese Menge aber ist, desto höher ist die Wahrscheinlichkeit, dass Daten einer bestimmten Person zugeordnet werden können. Bekannte Studien zeigen auf, dass mit lediglich drei einfachen demografischen Merkmalen (Geschlecht, fünfstellige Postleitzahl, Geburtsdatum) zwischen 61 und 87 Prozent der US-amerikanischen Bevölkerung eindeutig identifizierbar werden, bei zirka 250 Millionen Menschen immerhin zwischen 150 und 220 Millionen Personen.» Auch bei anonymen Gensequenzen, die sich auf öffentlichen Forschungsdatenbanken befinden, liessen sich in Kombination mit wenigen anderen Daten die Personen «deanonymisieren». Die Versicherungen brauchen sich nur noch zu bedienen.

Die Anonymisierung ist also ein Phantom. «‹Big Data› wirkt deshalb in Bezug auf den Datenschutz wie eine Zeitbombe, für die aber das Datenschutzrecht keine Mittel bereitstellt, um sie zu entschärfen», stellt Baeriswyl fest. Es braucht eine völlig neue Debatte, wie wir mit dem Datenmeer umgehen wollen. Wer darf darin fischen? Was darf gefischt werden, was nicht? Wer legt das fest? Wer kontrolliert? Wer steht den Opfern bei? Wer ist überhaupt noch in der Lage zu verstehen, was die Algorithmen tun?

Es wird immer mehr Geschädigte geben, die keine Hypothek, keine Kreditkarte oder keine Versicherung mehr bekommen, weil Algorithmen sie für unzuverlässig, arm oder krank erklärt haben. Sie brauchen nicht nur einen Rechtsbeistand, sie bräuchten vor allem auch SpezialistInnen, die aufspüren können, wer mit welchem Programm diese Menschen aus dem System der Geschäftswürdigen getilgt hat. Sonst macht das Netz sie zu Nichtmenschen.

Literatur:

«Digma, Zeitschrift für Datenrecht und Informationssicherheit» (Heft 1/13): «Schwerpunkt: Big Data ohne Datenschutz». Schulthess Verlag. Zürich 2013. www.digma.info

Viktor Mayer-Schönberger, Kenneth Cukier: 
«Big Data. Die Revolution, die unser Leben verändern wird». Redline Verlag. München 2013.

Nora S. Stampfl: «Die berechnete Welt. Leben unter dem Einfluss von Algorithmen». Heise Zeitschriften Verlag. Hannover 2013.