Gastbeitrag „Warum Big Data keine psychologische Bombe ist“

Gastbeitrag von Dr. Max Vetter, Berlin

„Das Magazin“, eine Schweizer Wochenzeitung, schreibt in seiner Dezemberausgabe über den Psychologen Michal Kosinski, er habe eine Methode entwickelt, um Menschen anhand ihres Verhaltens auf Facebook minutiös zu analysieren (https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/). Damit, so die Behauptung der Autoren, habe er Donald Trump zum Wahlsieg und Ted Cruz zur Aufholjagd im Vorwahlkampf verholfen. Rechtspopulisten aus ganz Europa und auch die deutsche AfD stünden nun bereits Schlange.

https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/

Keine verheißungsvolle Schlagzeile und eine, die für das Image von Psychologinnen und Psychologen eine Reihe negativer Implikationen haben könnte. In der Tat hat Kosinski in etlichen Publikationen Modelle publiziert, in denen er mit Hilfe von online hinterlassenen Spuren wie Facebook Likes verschiedene Variablen wie Geschlecht, sexuelle Orientierung oder die Big Five vorhersagen konnte (z.B. Kosinksi, Stillwell & Graepel, 2013; Kosinski, Bachrach, Kohli, Stillwell & Graepel, 2014; Youyou, Kosinski & Stillwell, 2015).

Aus dem Artikel in „Das Magazin“ mit dem plakativen Titel „Ich habe nur gezeigt, dass es die Bombe gibt“, der also den Vergleich mit der Entwicklung der Atombombe bemüht und einen Psychologen als modernen Bombenbauer präsentiert, ergeben sich aus meiner Sicht zwei Kernfragen:

  1. Sind da tatsächlich Psychologen dabei, eine mediale Atombombe zu entwickeln, die in der Konsequenz dazu führt, dass sie demokratische Wahlen entscheidet oder bereits entschieden hat?
  2. Wenn sich aus digital hinterlassenen Spuren bereits jetzt vergleichbar akkurate Vorhersagen menschlichen Verhaltens bzw. Rückschlüsse auf latente Konstrukte wie Persönlichkeitsvariablen schließen lassen, wozu braucht es dann eigentlich noch die Persönlichkeitspsychologie und mit ihr die Entwicklung von Testverfahren und Methoden? Brauchen wir also Big Data statt Big Five?

Frage 1 ist sicherlich die politischere, aber zugleich aus meiner Sicht vorerst gänzlich unpolitisch mit psychologischer Methodenlehre zu beantworten. Was abstrakt klingt ist eigentlich eine sehr simple Lektion: Korrelation ist nicht gleichbedeutend mit Kausalität. Mit anderen Worten: Die zeitlich sequenzierte Abfolge plausibel klingender Ereignisse erlaubt noch keinen Rückschluss über deren kausalen Zusammenhang. Im vorliegenden Fall bedeutet das:

a)    Donald Trump mag im Wahlkampf statistische Modelle zur Vorhersage einzelner oder mehrerer Traits bzw. sozio-demographischer Variablen aus online hinterlassenen Spuren genutzt haben.
b)    Er mag daraufhin personalisierte Wahlwerbung platziert haben. Das ist strategisch klug und könnte personalisierte Persuasion genannt werden.
c)    Er hat die US-Wahl gewonnen.

Aus a und b folgt jedoch nicht zwingend c. Wir wissen nicht, was letztlich den Ausschlag für seinen Wahlsieg gegeben hat. Es gab keine Kontrollgruppe. Auch der naheliegende Vergleich zu Hillary Clinton, der in „Das Magazin“ bemüht wird, scheidet wegen zu vieler nicht kontrollierter Störfaktoren aus. Die Schlussfolgerung erscheint mir daher zu voreilig, gefährlich daran ist, dass sie so schlüssig daher kommt. Nun gibt es in den Medien und vereinzelt auch in der Psychologie („end with a bang, not a whimper“; Bem, 1987, S. 14) die Tendenz, Kausalitäten herzustellen, um eine schlüssige Geschichte zu erzählen. Und in der Tat, der Artikel in „Das Magazin“ drängt der Leserin oder dem Leser diesen Schluss förmlich auf. Das aber halte ich für einen Fehlschluss; einen für den portraitierten Psychologen schmeichelhaften zwar (denn ist jemand, der dem mächtigsten Mann der Welt ins Amt verhilft nicht eigentlich der mächtigste Mann der Welt?), aber einer, der höchstens für eine zu testende Hypothese taugt – nicht für eine Schlussfolgerung.

Frage 2 stellt gewissermaßen die Daseinsberechtigung psychologischer Methoden wie der rationalen Fragebogen- oder Testkonstruktion in Frage. Psychometrisch gedacht lassen sich unterschiedliche Methoden der Testentwicklung unterscheiden: Die rational-deduktive Methode leitet Items (oder Fragen) von einem zuvor definierten Konstrukt ab, die im zweiten Schritt empirisch geprüft und selektiert werden können. Die Frage „Wie stehen Sie zu einer Flüchtlingsobergrenze?“ könnte so zu einem Item für das Konstrukt „Rechtspopulismus“ werden. Anders geht die external-empirische Methode vor, die rein empirisch selektiert, welche Items eine Merkmalsausprägung besonders gut anzeigen bzw. besonders gut zwischen zwei Gruppen trennen. Falls also gelbe Haare besonders prädiktiv für Rechtspopulismus wären, würde in diesem Falle „Haarfarbe“ zum Prädiktor für Rechtspopulismus.

Im Falle der Kosinski’schen Facebook-Like-Analyse (und in weiten Teilen der Anwendung von Big Data) kommt also die zweite Methode zum Einsatz. Dass dies durchaus erfolgreich sein kann, zeigen die Modelle und Publikationen von Kosinski, deren Wert ich hier nicht schmälern möchte. Was aber ist nun der Mehrwert rational-deduktiver psychologischer Herangehensweisen (und Mehrwert beziehe ich hier nicht nur auf wissenschaftlichen Mehrwert, sondern auch auf gesellschaftlichen)? Diese Methode baut auf einer Theorie auf. Theorien besitzen mindestens zwei klare Vorteile: Sie lassen sich prüfen und sie ermöglichen einen Erkenntnisüberschuss über das direkt Beobachtbare hinaus. Sie bilden sozusagen ein Netz aus Erkenntnissen, das auch dann trägt, wenn nicht jeder einzelne Faden des Netzes bekannt ist. Was aber lernen wir daraus, dass gelbe Haare und Rechtspopulismus zusammenhängen? Psychologie sollte letztlich mehr sein als Wetter- oder Wahlvorhersage und eben nicht nur genau vorhersagen, sondern auch genau erklären können. Daraus, warum unterschiedliche Vorlieben, Willensäußerungen oder weniger offensichtliche Handlungen (online wie offline) offenbar mit einer besonderen Empfänglichkeit für simplifizierende Erklärungen oder populistische Thesen zusammenhängen, könnten wir (und die Politik) lernen, wie Populismus inhaltlich begegnet werden kann. Darüber aber geben Kosinskis Modelle oder deren Anwendung durch Donald Trumps Wahlkampfteam keine Auskünfte.

Schließlich übt die Vorhersage aus virtuellen Spuren eine für mich nicht ganz nachvollziehbare Faszination aus. Zur Erinnerung: Die Wahrscheinlichkeit, das Geschlecht einer fremden Person durch Raten korrekt vorherzusagen beträgt ziemlich genau 50%. Kosinski steigert diese Wahrscheinlichkeit in einem Modell durch die Verwendung von 300 Likes auf 93% (die Präzision steigt zwar nicht perfekt linear aber dennoch annähernd). Ich wage zu behaupten, dass fast jeder Psychologie Bachelorabsolvent und jede Absolventin in der Lage ist, diese Präzision mit deutlich weniger Fragen (ich wage sogar die Behauptung, mit maximal zehn) zu erreichen. Ist das also die künstliche Intelligenz, vor der wir uns fürchten? Unter diesen Umständen fürchte ich mich allerdings mehr vor der humanoiden psychologischen Intelligenz.

Das für mich Faszinierende sind nicht die Big Data Modelle und deren Vorhersagen, sondern die massenhafte Verfügbarkeit von Antworten auf relativ standardisiert gestellte Fragen im Netz, ein riesiger Stimulustest quasi. Statt mit „thin slices“ (Ambady & Rosenthal, 1992) haben wir es hier wohl eher mit dicken Scheiben zu tun. Das Neue, und dafür sensibilisiert „Das Magazin“ zu Recht, ist Folgendes: In psychologischen Studien holen wir uns die explizite Zustimmung zur Datensammlung für einen bestimmten Zweck („informed consent“) und garantieren eine nicht Rückführbarkeit auf die einzelne Person. Wenn bislang diagnostische Verfahren eingesetzt wurden, geschah dies in der Regel sehr transparent (Screening Verfahren, Intelligenztests, Assessment Center, Anamnesegespräche) und daher bestand auch kein Grund zu der häufig geäußerten Sorge, jederzeit und ohne es zu bemerken von Psychologinnen und Psychologen „analysiert“ zu werden. Das ändert sich gerade. Eine Nutzung dieser Daten hat sicherlich viele Vorteile – auch außerhalb des US-Wahlkampfes –wirft aber etliche ethische Fragen auf. Nicht alle sind aber so neu, wie es ihr digitales Gewand verheißt: Wählergruppen gezielt zu ignorieren etwa, weil deren Status als Nichtwähler bekannt ist, dürfte auch für deutsche Politikerinnen und Politikern keine ganz neue Strategie sein. Sie mag durch neue Daten zielgenauer werden, überhaupt erst möglich wird sie dadurch jedoch nicht. Und in der Konsequenz ist sie jetzt so verwerflich wie eh und je. Statt also durch statistische Modelle niedrig hängende „Wählerfrüchte“ zu ernten (bzw. die hoch hängenden gezielt zu ignorieren), sollte die Diskussion endlich stärker dahingehend geführt werden, wie wir an diesen Stellen mehr verstehen können. Dabei wird die eine oder andere psychologische Theorie langfristig hilfreich sein, Big Data als Methodik meinetwegen auch.

Zum Nachlesen:

Ambady, N., & Rosenthal, R. (1992). Thin slices of expressive behavior as predictors of interpersonal consequences: A meta-analysis. Psychological Bulletin, 111, 256–274.

Bem, D. J. (1987). Writing the empirical journal article. In Darley, J. M., Zanna, M. P., & Roediger III, H. L. (Eds) (2002), The Compleat Academic: A Career Guide. Washington, DC: American Psychological Association.

Kosinski, M., Stillwell, D., & Graepel, T. (2013). Private traits and attributes are predictable from digital records of human behavior. Proceedings of the National Academy of Sciences, 110(15), 5802-5805.

Kosinski, M., Bachrach, Y., Kohli, P., Stillwell, D., & Graepel, T. (2014). Manifestations of user personality in website choice and behaviour on online social networks. Machine Learning, 95, 357-380.

Youyou, W., Kosinski, M., & Stillwell, D. (2015). Computer-based personality judgments are more accurate than those made by humans. Proceedings of the National Academy of Sciences of the United States of America, 112, 1036–1040.

Über den Autor: Dr. Max Vetter hat in Heidelberg Psychologie studiert und dort auch zum Thema Entscheidungsarchitekturen zur Förderung nachhaltigen Verhaltens promoviert. Aktuell arbeitet er als Politikberater für Verbraucherpolitik bei ConPolicy (http://www.conpolicy.de/institut/dr-max-vetter/) in Berlin.

Nachtrag JF 10.12.16: Es gibt noch ein paar weitere Links zum Thema:

Big Data allein entscheidet keine Wahl:
http://www.zeit.de/digital/internet/2016-12/us-wahl-donald-trump-facebook-big-data-cambridge-analytica/komplettansicht

Können Facebook-Likes wirklich Wahlen entscheiden:
http://www.n24.de/n24/Nachrichten/Wissenschaft/d/9529238/koennen-facebook-likes-wirklich-wahlen-entscheiden-.html

Wie unser Technik-Aberglaube allen schadet: http://www.spiegel.de/netzwelt/web/magischer-digitalismus-wie-unser-technik-aberglaube-uns-allen-schadet-a-1124836.html

Datenpsychologe Kosinski: https://www.welt.de/wissenschaft/article160088355/Je-weniger-Likes-desto-leichter-durchschaubar.html

Nachtrag JF 18.3.2018: Ausschluss von Cambridge Analytica aus Facebook http://www.thomashutter.com/index.php/2018/03/facebook-und-dann-hat-es-bumm-gemacht-facebook-suspendiert-cambridge-analytica-von-facebook/

Archive
Kategorien