Facebook und die Emotionen

In der Medienöffentlichkeit schlagen wieder einmal hohe Wellen über dem sozialen Netzwerk „Facebook“ (FB) zusammen. Mit viel Emotion und Emphase heisst es etwa unter dem Titel „Gruselig und superverstörend“ in der Rhein-Neckar-Zeitung vom 30.6.14: „Geheimer Facebook-Psychotest sorgt für Empörung im Netz“! Was war geschehen?

In der renommierten amerikanischen Fachzeitschrift PNAS (Proceedings of the National Academy of Science) ist ein Artikel erschienen, in dem über eine experimentelle Manipulation im News-Feed von knapp 700.000 Facebook-Nutzern berichtet wird:

Kramer, A. D. I., Guillory, J. E., & Hancock, J. T. (2014). Experimental evidence of massive-scale emotional contagion through social networks. PNAS, 111(24), 8788–8790. doi:10.1073/pnas.1320040111

Die Autoren haben im Januar 2012 eine Woche lang die Nachrichten, die man über die Aktivitäten seiner Freunde erhält (der sogenannte „News-Feed“), so manipuliert, dass entweder positive oder negative Nachrichten in unterschiedlichem Ausmaß herausgefiltert wurden (bis zu jeweils 90%). Dadurch konnten sie zeigen, dass Benutzer mit überwiegend schlechten Nachrichten im Vergleich zu einer normalen Kontrollgruppe nicht-manipulierter Personen dann selbst verstärkt schlechte Nachrichten in FB eingestellt haben und umgekehrt (siehe Abbildung, aus dem Artikel entnommen). Dieses Phänomen – emotionale Ansteckung – ist nicht neu, aber in diesem Ausmass noch nie untersucht worden.

Es stellen sich einige Fragen, über die es nachzudenken lohnt, bevor man sein (Vor-)Urteil fällt – es ist nicht ganz so eindeutig, wie es in den Medien dargestellt wird, und vor allem sind es aus meiner Sicht andere als die öffentlich diskutierten Punkte, über die man stutzen kann.

1 Darf FB, dürfen die beteiligten Wissenschaftler so etwas machen?

FB und Wissenschaft sind zwei verschiedene Welten mit unterschiedlichen Zielsetzungen und unterschiedlichen Spielregeln. FB darf das sicherlich machen (da laufen ja noch ganz andere Auswertungen im Hintergrund, von denen wir als normale Nutzer nichts wissen), weil alle Benutzer den Geschäftsbedingungen (viele Seiten kleingedruckter Text, den man normalerweise nicht liest) zustimmen mussten. Aber dürfen die beiden mitbeteiligten Wissenschaftler von der Cornell-University (Jamie Guillory und Jeffrey Hancock) das machen? Sie sind an die ethischen Standards ihrer Hochschule gebunden und müssen sich in anderer Weise rechtfertigen als der FB-Mitarbeiter Adam Kramer. Zuständig sind bei Experimenten mit Menschen die „Institutional Review Boards“ (IRBs), die lokalen Ethik-Kommissionen, die der amerikanischen „Common Rule“ (einer Variante der medizinisch geprägten Deklaration von Helsinki) unterworfen sind.

Tatsächlich sind die unfreiwilligen Teilnehmer nicht über das sonst übliche Maß hinaus mit News belästigt wurden; man hat ihnen auch keine falschen oder unnötig harten Nachrichten präsentiert, sondern den ganz normalen Gang der Dinge ein wenig beeinflusst durch selektives Filtern.

2 Liegt ein Verstoß gegen ethische Prinzipien vor?

Zumindest in der psychologischen Forschung ist es inzwischen Standard, vor Beginn eines Experiments eine informierte Einwilligung („informed consent“) einzuholen, in der eine einwilligungsfähige Testperson über das geplante Geschehen aufgeklärt und informiert wird, um dann durch ihre Unterschrift ihr Einverständnis zu erteilen. Ein Teil dieser Zustimmung sieht auch vor, dass jederzeit ohne Angabe von Gründen und ohne weitere Nachteile die Experiment-Teilnahme abgebrochen werden kann. Allerdings gibt es Ausnahmen von dieser Regel, z.B. im Fall notwendiger Täuschung der Teilnehmer – eine Ausnahme, die sehr gut begründet werden muss und die auf gar keinen Fall von der anschließenden Aufklärung über die durchgeführte Massnahme entbindet. Die anschließenden Aufklärung ist immer notwendig (und im vorliegenden Fall unentschuldbar unterblieben).

Im vorliegenden Fall wird argumentiert, der bei FB angestellte Erstautor habe die Daten rechtmäßig (auf der Basis der FB-Geschäftsbedingungen) gesammelt, die beiden Cornell-Wissenschaftler hätten dagegen nur die bereits vorliegenden Daten ausgewertet und seien daher nicht der Common Rule zu unterziehen. Spitzfindig, oder?

3 Ist bei dieser Untersuchung etwas Neues herausgekommen?

Natürlich ist der Effekt emotionaler Ansteckung nicht neu, eigentlich sogar steinalt: den Begriff der Gefühlsansteckung prägte wohl der Philosoph und Psychologe Max Scheler bereits im Jahr 1914. Heute wird – vermutlich fälschlich! – der neuronale Mechanismus dafür in den Spiegelneuronen vermutet.

Warum also noch ein Experiment zu altbekannten Phänomenen hinzufügen? Neu ist es, diesen Effekt in einem „social media“-Kontext am Werk zu sehen. Das unterstreicht die ökologische Validität des Phänomens. Aber dies ist wohl die einzige Neuigkeit, die ich erkennen kann – aus theoretischer Sicht keine wirklich neue Perspektive.

4 Brauchte es für diese Untersuchung 700.000 (un)freiwillige Testpersonen?

In allen experimentellen Wissenschaften versucht man, mit möglichst wenig Aufwand möglichst effektive Aussagen zu erreichen. In kritischen Bereichen wie z.B. Pharma-Experimenten oder neuartigen Operationstechniken wird sogar während der Datenerhebung fortlaufend überwacht, ob ein Abbruch gerechtfertigt oder gar nötig ist, wenn z.B. Nebenwirkungen eines neuen Präparats so schwerwiegend sind, dass weitere Datensammlungen nicht zu verantworten wären (die sequentielle Statistik nach Wald, 1945, wurde zu Kriegszeiten entwickelt, als die Ressourcen knapp waren).

Nun stehen benötigte Teilnehmerzahlen immer in Abhängigkeit von der vermuteten Stärke des Effekts: kleine Effekte zeigen sich verläßlich erst bei größeren Stichproben, starke Effekte zeigen sich schon in kleinen Fallzahlen. Berechnet man als kleiner Statistiker mit Neyman-Pearson-Hintergrund nun mit Hilfe des großartigen, frei zugänglichen Programms G-Power den benötigten Stichprobenumfang für einen t-Test mit Standard-Irrtumswahrscheinlichkeiten Alpha=0.05 und Beta=0.95 sowie einer Effektstärke d=0.02 (eine der empirisch gefundenen Effektstärken), erfährt man, dass ein Stichprobenumfang von N=4.330 zum Test dieser Hypothese ausreichen würde. Die Differenz zwischen der benötigten und der verwendeten Teilnehmerzahl (N= 689.003) ist beachtlich, sozusagen 684.673 Teilnehmer zuviel! Gut, dass diese Teilnehmer kein Honorar erwartet haben (in DFG-geförderten Projekten ist übrigens heutzutage ein Stundenlohn in der Höhe des Mindestlohns Standard).

5 Gibt es Schwächen in der Durchführung oder Auswertung dieser Arbeit?

Ein interessanter Aspekt liegt in der technischen Auswertung des News-Feed (der eigentlichen Nachrichten also). Insgesamt wurden  >3 Millionen Posts ausgewertet, in denen >122 Millionen Wörter vorkamen, davon waren 4 Millionen positive (3.6%) und 1.8 Millionen negative (1.6%) Wörter. Etwa 94,8% der Wörter in den Posts waren neutral! Wow! Langweilig?

Ausgewertet wurden diese Wort-Corpora mit einem Werkzeug namens LIWC (Linguistic Inquiry and Word Count) von James Pennebaker und Mitarbeitenden. Dieses zählt die Häufigkeiten der Überstimmungen aufgetretener Wörter mit Listen vordefinierter positiver und negativer Wörter bzw. Wortstämme (ca. 1000 sind in der Referenzliste erfasst). Das ist schön, aber übersieht leider alle Spielarten von Ironie („Heute war aber ein schöner Tag – alles schiefgegangen…“ – zählt positiv) und Negation („nicht schlecht, dieses Spiel“ – zählt negativ). Das erzeugt Rauschen in den Daten, vielleicht kein Wunder, dass so kleine Effekte auftraten.

[Prüft man übrigens bei http://www.analyzewords.com/index.php mal die LIWC-Analyse meiner eigenen Tweets unter meinem Twitter-Account „jofu01“, werden meinen letzten 819 Twitter-Wörter (Stand: 3.7.2014) als depressiv (41) und arrogant/distant (71) bewertet; nach meinem Dafürhalten nicht sehr valide 🙂 ]

6 Was lernen wir aus der ganzen Sache?

Ein pädagogischer Sekundärnutzen der Debatte ist die wiederholte Erkenntnis über FB-Praktiken, die aus Sicht des Unternehmens nachvollziehbar sind, aber trotzdem bedenkliche Folgen haben können (wie sehr manipuliert FB seine Nutzerinnen und Nutzer?).

Wir lernen aber auch, nicht vorschnell in die Falle zu tappen und jede FB-Aktivität als unethisch abzutun, sondern genau hinzuschauen: In ethischer Hinsicht unverzichtbar (und unverzeihlich) ist für mich die fehlende Aufklärung im Anschluß an die Untersuchung. Fraglich ist die Größe der Stichprobe, problematisch ist die „blinde“ Wortzählung.

Und wir lernen, dass Experimente mit Menschen auch dann ethische Probleme aufwerfen können, wenn man nur ganz geringfügig manipuliert – knapp 700.000 Mini-Manipulationen summieren sich dann doch auf!

Ein letzter Punkt: Wie gut, dass es FB gibt! Dort kann ich einen Link auf diesen Bericht jetzt nämlich posten 🙂

PS: Hier ein noch paar weiterführende Links zu Debatten-Beiträgen (mit Dank an Matthias Blümke und Daniel Holt, nicht nur für die Links!):

Kategorien:

Archive
Kategorien