Quantified Personality. Automatisierte Persönlichkeitsanalyse anhand von Online- und Mobilfunknutzungsdaten


Essay, 2017

20 Seiten


Leseprobe

Quantified Personality - Automatisierte Persönlichkeitsanalyse anhand von Online- und Mobilfunknutzungsdaten

Steffen Schumacher

11/2017

Algorithmen sind formulierte Anweisungen zur schrittweisen Durchführung einer Methode. Sozial- und Kulturwissenschaftler tendieren jedoch dazu, diesen Begriff auszuweiten und als Generalbegriff für digitale Automatisierung zu verwenden. Computerprogramme enthalten aber auch nicht-algorithmische Anweisungen. Algorithmen sind außerdem wandelbar, wandeln sich während ihrer Implementierung und ihrer Verwendung, weshalb die Rede von „dem“ mit sich selbst immer identischen Algorithmus oft nicht zutrifft. Eine zu große Distanz vom Verständnis, das die Informatik vom Begriff des Algorithmus hat, beeinträchtigt die Verständlichkeit sozial- und kulturwissenschaftlicher Erörterungen seitens Computerwissenschaftlern, gleichzeitig sollten diese Wissenschaften ihr Verständnis des Begriffs nicht auf dasjenige der Informatik einschränken, um das Phänomen auch weiterhin aus anderen Perspektiven behandeln zu können. (vgl. Dourish 2016)

Automatisierte Persönlichkeitsanalyse braucht keine Fragebögen mehr, die von den zu analysierenden Personen ausgefüllt werden, sie braucht nicht einmal mehr eigens für ihren Zweck erhobene Daten, sondern verwendet Nutzungsdaten, die ohnehin bzw. in anderen Kontexten anfallen. Das ist die große Neuheit, die dieses Gebiet mit sich bringt und die dazu führte, dass die beiden in den Jahren 2013 und 2015 in den „Proceedings of the National Academy of Sciences of the United States of America“ erschienenen Artikel von Kosinski und Stillwell über die Ermittlung der Persönlichkeit von Facebook-Usern aus deren Likes nach eigenen Angaben Kosinskis auf seiner Webseite gemäß ihres Altmetric Scores die beiden einflussreichsten jemals in den „Proceedings“ erschienenen Artikel sind und der viert- bzw. 19.-einflußreichste wissenschaftliche Artikel überhaupt.

Da die betreffenden Algorithmen für die massenhafte Persönlichkeitsermittlung auf Big Data angewiesen sind, sowohl für ihre Entwicklung als auch später für ihre Anwendung, fallen sie unter die drei Paradoxe, die nach Richards und King (2013) Big Data ganz allgemein betreffen: 1. das Transparenz-Paradox, es besteht darin, dass zum einen immer mehr Daten gesammelt werden, um mehr Informationen über die Welt zu bekommen, sie transparenter zu machen, zum anderen das Sammeln und die Auswertung der Daten unsichtbar und undurchdringlich sind. Sie werden an unbekannten Orten auf Servern gespeichert und mit schwer zu durchschauenden Methoden, Algorithmen, analysiert. Das gilt ganz allgemein, d.h. auch für die Auswertungsdaten und Algorithmen der automatisierten Persönlichkeitsanalyse.

2. Das Identitäts-Paradox, das darin besteht, dass durch die Analyse von massenhaft anfallenden Nutzungsdaten zum einen die Präferenzen, Verhaltensweisen und jetzt auch die Persönlichkeit der Nutzer ermittelt werden sollen, zum anderen die Ergebnisse aber dafür verwendet werden, um bei den so analysierten Personen bestimmte Einstellungen und Verhaltensweisen zu induzieren, ihre Identität also zu beeinflussen, in eine bestimmte Richtung zu lenken. Als Beispiel werden die Filterblasen (filter bubbles) genannt, in die Nutzer aufgrund von automatisierten Nachrichten- und Mitteilungssystemen geraten, die ihnen immer nur solche Nachrichten schicken und zugänglich machen, die ihren bereits existierenden, automatisiert ermittelten Präferenzen entsprechen. Auch die automatisierte Persönlichkeitsanalyse soll, wie die Präferenzanalyse, dazu dienen, Werbe- und politische Botschaften ihrer Form und ihrem Inhalt nach so zu gestalten, dass sie die Persönlichkeit der Nutzer ansprechen. Auch kommerzielle Webseiten und Services und das Verhalten virtueller Agenten sollen so auf den einzelnen User zugeschnitten werden können. Kommt hier also eine über die Filterblase hinausgehende Persönlichkeitsblase auf die Nutzer zu, die die digitale Umwelt der Nutzer maximal gefällig macht?

3. Das dritte Big-Data-Paradox, welches mit den ersten beiden zusammenhängt, ist das Macht-Paradox, das darin besteht, dass einerseits Big Data jedermann zur Information über die Welt und zur Kommunikation mit anderen Nutzern dienen sollen, die in ihnen gespeicherten Nutzungsspuren der Individuen aber zum anderen von denjenigen, die über diese Daten verfügen können, also große Organisationen und staatliche Behörden, dazu benutzt werden können, Informationen über die Nutzer zu gewinnen, um sie so besser kontrollieren zu können. Dieses Risiko besteht im Falle der automatisierten Persönlichkeitsanalyse natürlich im erhöhten Maße, da es um intimes Wissen geht, das Schwachpunkte der Individuen und Möglichkeiten ihrer Beeinflussung aufdeckt, die in ihrer Persönlichkeitsstruktur liegen.

Automatisierte Persönlichkeitsermittlung ist ein sehr junges Forschungsfeld, der erste Überblicksartikel über es erschien im Jahre 2014 (Vinciarelli 2014). Laut ihm stieg die Zahl der Aufsätze, die in Zeitschriften der beiden größten internationalen Informatikorganisationen ACM und IEEE[1]publiziert wurden und den Begriff „personality“ im Titel haben, im Jahre 2010 sprunghaft an. Alle von mir gefundenen Aufsätze über das Thema stammen aus den Jahren 2011 und später und sind fast falle in Zeitschriften der beiden genannten Fachorganisationen erschienen. Die Autoren haben zum größten Teil einen Abschluß in Informatik oder Psychologie bzw. Psychometrie.

Das verwendete Persönlichkeitsmodell ist in allen von mir ausgewerteten Publikationen das Big-Five-Persönlichkeitsmodell. Es ist ein psychologisches Persönlichkeitsmodell, das davon ausgeht, dass sich die Persönlichkeit jedes Menschen aus fünf Dimensionen zusammensetzt, die mehr oder weniger stark ausgeprägt sein können. Diese fünf Dimensionen werden Charakterzüge (personality traits) genannt. Es sind Offenheit (openness), Gewissenhaftigkeit (conscientiousness), Geselligkeit (extraversion), Verträglichkeit (agreeableness) und Neurotizismus (neuroticism). [2]Dass es ein psychologisches Persönlichkeitsmodell ist, bedeutet, dass grundlegende Werte und Einstellungen, welche ebenfalls zur Persönlichkeit von Individuen gehören, nicht ermittelt werden. [3]Das Big-Five-Modell ist zurzeit das in der Psychologie am weitesten verbreitete und akzeptierte Persönlichkeitsmodell und besitzt insbesondere auch signifikante Beziehungen zu externen Variablen wie Arbeitszufriedenheit, beruflicher Position und Leistung sowie Partner- und Freundeswahl (Golbeck et al. 2011a).

In einer Studie von Mitarbeitern des IBM Almaden Research Centers (Gou et al. 2014) werden zusätzlich noch zwei andere Persönlichkeitsmodelle für die Analyse verwendet: die „basic human values“ von Shalom H. Schwartz – Selbsttranszendenz (self-transcendence), Bewahrung (conservation), persönliche Entwicklung (self-enhancement), Offenheit gegenüber Wandel (openness-to-change) und Bedürfnisbefriedigung (hedonism) – sowie ein von den Autoren selbst entwickeltes Persönlichkeitsmodell, das auf Maslows Bedürfnispyramide und auf Marketingliteratur basiert, die sogenannten „fundamental needs“ Ideale (ideals), Harmonie (harmony), Nähe (closeness), Selbstverwirklichung (self-expression), Spannung (excitement) und Neugier (curiosity).

Zum Big-Five-Modell muß noch gesagt werden, dass es auch Kritik an ihm gibt, die insbesondere seine intraindividuelle, zeitliche Stabilität betrifft: Personen, die den Big-Five-Fragenbogen zu mehreren unterschiedlichen Zeitpunkten ausfüllen, werden bzgl. der fünf Charakterzüge nicht jedes Mal gleich klassifiziert (Neuman 2016: 13). Das betrifft also die Test-Retest-Reliabilität.

Die erste Art von Daten, aus denen die Persönlichkeit der Nutzer automatisiert ermittelt werden können soll, sind Smartphone-Nutzungsdaten.

Hier gibt es eine Reihe von ersten Aufsätzen, die Versuche mit Smartphone-Usern beschreiben. Diesen wird zum einen ein Persönlichkeitsfragebogen vorgelegt, zum anderen werden Smartphonenutzungsdaten entweder von einer speziellen App gespeichert – Call Logs, SMS Logs, App Logs, Bluetooth Scans der Umgebung und Profile Logs, also Logs der Profileinstellung, Herzfrequenz, GPS-Position und, davon abgeleitet, die Gehgeschwindigkeit, Beschleunigung, Schlafdauer, Helligkeit, Druck [4]- oder es werden die Mobilfunknutzungsdaten verwendet, die der Mobilfunkbetreiber speichert, - Metadaten - und dann mathematisch Verbindungen zwischen beiden gesucht, durch Methoden wie Regressions- und Korrelationsanalysen. Das ist generell bei diesen Algorithmen, Programmen zur Persönlichkeitsermittlung so: sie basieren immer auf Formeln, die durch in Inbeziehungsetzen von Ergebnissen von Persönlichkeitsfragebögen mit den anderen Daten gewonnen wurden, aus denen man die Persönlichkeit der User dann später ohne Persönlichkeitsfragebogen herauslesen will.

In einer Studie von 2011 (Chittaranjan et al. 2011) wird eine große Anzahl von Nutzungs-Logdaten als unabhängige Variablen verwendet, welche über einen Zeitraum von acht Monaten von einer speziellen Software auf den Smartphones von 83 Testpersonen gespeichert wurden: Nutzung von Office, Internet, Video, Audio, Maps, Youtube, Kalenderfunktion, Kamera, Chatfunktion, SMS, Spielen, Anzahl der ausgehenden Anrufe, Dauer der ausgehenden Anrufe (durchschnittlich und insgesamt), Anzahl der eingehenden Anrufe, Dauer der eingehenden Anrufe (durchschnittlich und insgesamt), Anzahl der aus- und eingehenden e-Mails, Anzahl der aus- und eingehenden SMS, Wortlänge in aus- und eingehenden e-Mails (durchschnittlich und als Median), Anzahl der Kontakte: Anzahl der Telefonnummern, die angerufen wurden, Anzahl der Telefonnummern, die anriefen, dasselbe für die SMS-Kontakte etc. Es wurden die Big-Five-Traits verwendet. Eine Regressionsanalyse mit all diesen Variablen als unabhängigen Variablen erzielte eine Erhöhung der Genauigkeit der Persönlichkeitsvorhersage, verglichen mit zufälliger Klassifizierung, von zwischen 17% und knapp 40% für die einzelnen fünf Traits (durchschnittlich 25%, am besten Extraversion und Neurotizimus). Das entspricht einer richtigen Persönlichkeitsklassifizierung von gut 69% bis knapp 76%. Die Interpretation der Ergebnisse ist nicht einfach wiederzugeben, zum Teil sind die Zusammenhänge, die die Variablen mit Traits hatten, direkt plausibel, zum Teil sind sie nicht ohne weiteres einsehbar. Dass z.B. extrovertierte Personen mehr Anrufe bekamen und diese Gespräche dann auch länger dauerten, ist plausibel. Ein entsprechender Zusammenhang für ausgehende Anrufe bestand aber nicht. Ein anderes Beispiel: für das Ergebnis, dass bei emotional stabilen (d.h. wenig neurotischen) Personen sowie bei nicht verträglichen Personen ein und dieselben Bluetooth-IDs häufiger registriert wurden (über Bluetooth-Scans der Umgebung), finden die Autoren die spekulative Erklärung, dass Personen mit diesen Persönlichkeitszügen sich länger an ein und demselben Ort aufhalten als andere Personen.

In zwei Studien aus den Jahren 2011 und 2013 (Oliveira et al. 2011, Montjoye et al. 2013) werden ausschließlich Daten verwendet, die dem sogenannten call detail record (CDR) entnommen werden können, d.h. aus den von den Telefongesellschaften gespeicherten Metadaten der Anrufe, SMS und MMS ihrer Kunden. Das sind etwa die Anzahl der Anrufe, der SMS und der MMS, jeweils ausgehend und eingehend, die Dauer der Anrufe, der Zeitabstand zwischen Erhalt und Beantwortung von Textnachrichten sowie zwischen Telefongesprächen mit ein und demselben Kontakt (Telefonnummer), das Verhältnis zwischen Anzahl von Telefongesprächen und Textnachrichten und der Zahl der Kontakte. Es ist also nicht mehr nötig, das oben geschilderte Nutzungsverhalten aus Smartphone-Logs auszulesen. Auch diese beiden Studien verwenden das Big-Five-Modell. Die durchschnittliche Verbesserung der Vorhersage der Big-Five-Nutzerpersönlichkeit gegenüber der Zufallswahl ist höher als in der oben genannten Studie: 39% (bezogen auf die Varianz) und 42% (bezogen auf die Einstufung der Individuen in die drei Kategorien niedrig, mittel, hoch pro Trait). Während in letzterer Studie, wie bei Chittaranjan et al. 2011, Extraversion und Neurotizimus am besten vorhergesagt werden konnten, waren es in ersterer Offenheit und Gewissenhaftigkeit. Nach dem Einbezug zusätzlich von Eigenschaften des sozialen Netzwerks der Testpersonen, wie Anzahl der Kontakte, Dichte des Netzwerks, Anzahl von häufigen Kontakten, wurde in ersterer Studie Offenheit am besten vorhergesagt und Neurotizismus am schlechtesten, ein Muster, das in den unten beschriebenen, auf Daten aus sozialen Netzwerken beruhenden, Studien ebenfalls oft zu finden ist.

Nach 2013 habe ich solche Studien, die Smartphone-Nutzungsdaten verwenden, nicht mehr gefunden. In einem Aufsatz aus dem Jahre 2016 (Guo 2016) werden immerhin Überlegungen darüber angestellt, welche Smartphone-Nutzungsdaten für die Persönlichkeitsanalyse der User geeignet sein könnten, sie werden aber nicht empirisch überprüft: physische Variablen wie Herzfrequenz und GPS-Position sowie „andere“ Variablen wie etwa die durch den Browserverlauf ermittelbaren Präferenzen der User.

Die zweite Art von Daten, die in Studien verwendet werden, um die Nutzerpersönlichkeit zu ermitteln, sind Facebook-Likes.

Diese Datenart wurde durch die oben bereits erwähnten Michael Kosinski, Psychologe und Psychologieinformatiker, und David Stillwell, Psychologe und Psychometriker, erfolgreich verwendet und berühmt gemacht, auch durch die Art und Weise der Formulierung der erreichbaren Genauigkeitsgrade: sie vergleichen die Genauigkeit ihres Verfahrens mit der von Bekannten, Freunden und Lebenspartnern erreichbaren Genauigkeit bei der Einschätzung der Persönlichkeit von Individuen. Beide arbeiteten noch im Jahre 2013 am Zentrum für Psychometrie der Universität Cambridge. Im Jahr 2015 war Kosinski an die Stanford-Universität gewechselt. Auch sie verwenden das Big-Five-Persönlichkeitsmodell.

Im ersten ihrer beiden einschlägigen Aufsätze (Kosinski et al. 2013) sagen sie außer der Big-Five-Persönlichkeit auch andere persönlichen Eigenschaften wie sexuelle Orientierung, Geschlecht, Alter, Rasse und politische Überzeugung aus Facebook-Likes voraus, im zweiten geht es dann nur noch um die Big Five (Youyou et al. 2015). Sie verwenden beidesmal die Daten von Zehntausenden von Personen, die einen Big-Five-Persönlichkeitsfragebogen in einer von Stillwell entwickelten Facebook-App namens myPersonality ausgefüllt und der Verwendung ihrer Persönlichkeits- und ihrer Facebookprofildaten für die wissenschaftliche Forschung zugestimmt haben. Insgesamt 7,5 Millionen Facebook-Nutzer haben einen der Persönlichkeitsfragebogen, die aus 20 bis 100 Fragen bestanden (Schwartz et. al. 2013: 6), in den Jahren von 2007 bis 2012 ausgefüllt, als die App bei Facebook in Betrieb war. Auch andere psychometrische Tests konnten gemacht werden. Sie werden im 2015er-Aufsatz zur externen Validierung der Persönlichkeitsmessungen herangezogen. Motivation für die Teilnahme war, dass man sich danach das Testresultat anschauen konnte. Es gab auch eine Opt-Out-Möglichkeit, mit der man der Verwendung des eigenen Persönlichkeitsprofils zu Forschungszwecken widersprechen konnte (Youyou et al. 2015, p.1). Facebook-Likes waren vom Jahre 2009 an bis 30. April 2015 öffentlich per API zugänglich (Anonymous 2016), sodass sie zu dieser Zeit ein öffentlich zugängliches Reservoire an Daten darstellten.

Im Aufsatz von 2015 arbeiten die Psychometrie-Forscher mit den Daten von 70.000 Testteilnehmern, die alle den 100-Item-Big-Five-Persönlichkeitsfragebogen ausgefüllt haben. Gut 17.000 von diesen wurden auch von einem Facebook-Freund bzgl. ihrer Persönlichkeit eingestuft, mit einem 10-Item-Big-Five-Persönlichkeitsfragebogen, und 14.000 davon von einem weiteren Facebook-Freund, sodass in diesen Fällen die Übereinstimmung zwischen beiden Beurteilungen ermittelt werden konnte. Mittels einer Regressionsanalyse haben sie nun den Zusammenhang zwischen Facebook-Likes und Big-Five-Persönlichkeitszügen berechnet und dann untersucht, wie gut sie mit der resultierenden Regressionsformel die aus dem von den Usern selbst ausgefüllten Fragebogen ermittelten Persönlichkeitszüge vorhersagen konnten und zwar bei solchen Usern, deren Daten nicht schon in die Berechnung der Formel eingegangen waren. Sie reservierten ein Zehntel der Stichprobe für diese Überprüfung der Genauigkeit. Die Genauigkeit der Vorhersage stieg mit der Anzahl der einbezogenen Facebook-Likes, was ja plausibel ist. Genauigkeitsschwellen haben sie aus einer Metaanalyse von Publikationen ermittelt, d.h. Genauigkeiten, mit denen Arbeitskollegen, Mitbewohner, Freunde und Partner jemandes Persönlichkeit via Fragebogen einschätzen können, ausgedrückt in Produkt-Moment-Korrelationen r. Das Ergebnis war, dass die so gewonnene Regressionsformel bei der Einbeziehung von 10 Facebook-Likes die Persönlichkeit – konzeptualisiert als Durchschnittswert der Big-Five-Persönlichkeitszüge - besser einschätzen konnte als ein Arbeitskollege, bei der Einbeziehung von 70 Likes besser als ein Freund oder ein Mitbewohner, bei 150 Likes besser als ein Familienmitglied und bei 300 Likes besser als der Partner. [5]Außerdem war auch die Übereinstimmung zwischen Urteilen unterschiedlicher Instanzen bei Algorithmen besser als bei Menschen. Im Falle von Menschen sind diese unterschiedlichen Instanzen unterschiedliche Menschen, im Falle von Algorithmen sind es zwei unabhängig voneinander erstellte, auf jeweils einer zufällig ausgewählten Hälfte der Likes basierende Algorithmen. Schließlich korrelieren die aus dem Algorithmus folgenden Persönlichkeitsurteile auch besser mit menschlichem Verhalten und anderen Aspekten, die aus den Facebook-Profilen der Teilnehmer sowie aus den anderen psychometrischen Tests, die in der App gemacht werden konnten, ermittelt wurden: dem Studienfach, der Größe des Facebooknetzwerks, Einnahme von Drogen, körperlicher Gesundheit, den Facebook-Aktivitäten und Einstellungen wie Parteipräferenz, allgemeinen Werten und Lebenszufriedenheit sowie mit Depression als psychischer Befindlichkeit. Daraus schließen sie, dass Facebook-Likes ein besserer Prädiktor für die Persönlichkeit von Menschen sind als die sozialkognitiven Fähigkeiten von Menschen. Letztere lassen sich in ihrer Wahrnehmung von nicht zur Sache gehörigen Dingen beeinflussen. Computer seien also besser darin, die Persönlichkeit von Menschen einzuschätzen als Menschen. Andererseits konstatieren die Autoren, dass Persönlichkeit hier auf die Big-Five-Persönlichkeitszüge beschränkt ist und es vermutlich noch andere, etwa auch subtilere, Persönlichkeitseigenschaften geben wird, die mit dem Big-Five-Fragebogen nicht erfasst, sondern bisher nur von Mitmenschen erkannt werden können.

[...]


[1]Die Association for Computing Machinery (ACM) ist die größte internationale, wissenschaftliche Organisation für Informatik und das Institute for Electrical and Electronics Engineers (IEEE) ist der größte internationale Berufsverband für Ingenieure aus dem Bereich der Elektro- und Informationstechnik.

[2]Das Modell wird auch oft nach dem Acronym, das man aus den Anfangsbuchstaben der englischen Begriffe für die fünf Dimensionen in dieser Reihenfolge erhält, OCEAN-Modell genannt.

[3]Sie werden aber durch die Techniken von Sentiment Analysis und Opinion Mining ermittelt, bei denen es darum geht, welche positiven und negativen Einstellungen Personen zu welchen Eigenschaften von bestimmten Objekte haben (Liu/Zhang 2013), wobei es hier auch um kurzfristige bzw. ephemere Einstellungen gehen kann, etwa zu Produkten, die man nicht als Teil der individuellen Persönlichkeit bezeichnen würde.

[4]Denkbar wäre auch die Nutzung von Daten, die von wearable devices wie Smart Watches und Fitness-armbändern an das Smartphone übermittelt werden.

[5]Von den fünf Charakterzügen war Offenheit deutlich am besten vorherzusagen; die restlichen vier Charakterzüge lagen enger zusammen, am schlechtesten war Neurotizismus voherzusagen.

Ende der Leseprobe aus 20 Seiten

Details

Titel
Quantified Personality. Automatisierte Persönlichkeitsanalyse anhand von Online- und Mobilfunknutzungsdaten
Autor
Jahr
2017
Seiten
20
Katalognummer
V383162
ISBN (eBook)
9783668587366
ISBN (Buch)
9783668587373
Dateigröße
493 KB
Sprache
Deutsch
Schlagworte
quantified, personality, automatisierte, persönlichkeitsanalyse, online-, mobilfunknutzungsdaten
Arbeit zitieren
Steffen Schumacher (Autor), 2017, Quantified Personality. Automatisierte Persönlichkeitsanalyse anhand von Online- und Mobilfunknutzungsdaten, München, GRIN Verlag, https://www.grin.com/document/383162

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Quantified Personality. Automatisierte Persönlichkeitsanalyse anhand von Online- und Mobilfunknutzungsdaten



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden