3,5 års forhold, i Whatsapp-meddelelser

Analyser data fra en Whatsapp-chat med min kæreste

Valentinsdag 2020 er for nylig gået. Årets dag, hvor par fejrer deres forhold og sociale medier er overvældet af indlæg, billeder og ros for 'andre halvdele. Det er ofte en uforglemmelig tid på året for alle, der ikke er i et forhold, der har at gøre med de skildringer af perfektion, vi så ofte ser på vores tidslinjer. På trods af at jeg var i et forhold, er jeg også træt af at se urealistiske skildringer af par online, så i år besluttede jeg at slå tilbage med nogle kolde hårde data. For at gøre dette ofrede jeg mit privatliv og vendte mig mod det medium, som jeg mener er det mest virkelige - min Whatsapp-chat med min kæreste.

Jeg opdagede for nylig, at det er muligt at downloade hele din chathistorie fra Whatsapp til en enkelt tekstfil. Det fandt mig, at dette kunne være en meget interessant datakilde, der muligvis giver en langt mere realistisk, unik skildring af, hvordan et forhold faktisk er. Så her i denne artikel vil jeg sætte mine derude i det fri i håb om, at du måske finder analysen interessant, eller at den kan inspirere dig til a) at tænke over, hvordan data kan modvirke den falske virkelighed, vi ser på sociale medier, b) grave lidt dybere i de data, du selv fremstiller, eller c) give din partner en meget nørdig, datavidenskabeligt tema Valentinsdag-gave.

(Bonuspoint, hvis du kan identificere alle sektionsoverskrifter ...)

Her kommer solen

Som nævnt giver Whatsapp dig mulighed for at downloade hele historien til nogen af ​​dine chats meget let og eksportere som en enkelt tekstfil, som jeg derefter transformerede og analyserede ved hjælp af programmeringssprog R. Den aktuelle chat blev startet i oktober 2016 ( siden jeg sidst skiftede telefonnumre - min kæreste og jeg har været sammen siden marts 2016).

Det er vores vigtigste form for virtuel kommunikation (vi tekst sjældent eller bruger f.eks. Facebook) og resultatet var et datasæt på 52.163 individuelle meddelelser - i gennemsnit 43 meddelelser pr. Dag. Dette overrasker mig allerede, og vi har ikke engang ridset overfladen endnu ...

Kraften i data

Målet er at opsummere vores forhold så lige fra det flagermus, vi skal aggregerer og se på tallene på højt niveau. Så her er en kort oversigt:

  • 1.212 dage - mellem 18. oktober 2016 og 12. februar 2020.
  • 980 (81%) af disse var 'aktive' dage (dvs. meddelelser blev sendt).
  • 52.163 meddelelser. Jeg sendte 1.495 flere beskeder end min kæreste - igen, ikke hvad jeg forventede at finde!
  • 11.670 unikke ord blev brugt (hvoraf mange ikke er rigtige ord). Jeg brugte 8.844 unikke ord, hvor min kæreste brugte 7.043.
  • 2 deltagere - min kæreste og jeg - der bor i England og i vores tidlige tyverne.

Jeg vil ikke skrive en ting

Antallet af meddelelser, vi sender hver dag, er i gennemsnit faldende i det tidsrum, vi har været sammen.

Antal Whatsapp-meddelelser sendt pr. Dag mellem min kæreste og jeg, 16. oktober - 20. februar. Den blå linje angiver det glatte gennemsnit.

Dette skyldes for det meste, at vi i begyndelsen af ​​denne tidsperiode begge var på universitetet og levede fra hinanden, derfor messaging oftere. Du kan derefter se i midten af ​​2017, når vi er færdig med universitetet og bor sammen, men endnu ikke i et fuldtidsjob. På grund af dette tilbragte vi det meste af vores tid sammen hver dag og sendte derfor ikke besked til hinanden. I september 2017 startede vi job, og meddelelsesfrekvensen blev plukket op igen (ups).

Hvis du ser nøje, vil du også se et mønster af en pigge omkring juletid - som vi tilbringer sammen med vores respektive familier - og en efterfølgende dukkert omkring det nye år - som vi har tendens til at tilbringe sammen.

Fredag ​​jeg er forelsket

Den næste graf kan let være en graf over motivationsniveauer gennem ugen. Vi sender flere beskeder på hverdage end i weekender.

Gennemsnitligt antal sendte meddelelser pr. Ugedag.

Vores meddelelsesmønstre reflekterer ofte mine generelle følelser overfor hver ugedag og når et crescendo på fredag, når vi mest sandsynligt har travlt og socialt. Dette involverer ofte planlægning og formidling af relevant information (så flere meddelelser). Søndag er den dag i den uge, vi mest sandsynligt vil tilbringe sammen, så vi sender markant færre beskeder.

Igen og igen

Efterfølgende med temaet mere messaging i løbet af ugen, lad os se, om vi virkelig er så dårlige til at udskyde, eller om jeg kan redde lidt ansigt ...

Gennemsnitligt antal meddelelser pr. Minut i løbet af en 24-timers dag.

Du kan se, at vores meddelelser gradvist øges i løbet af formiddagen og når et højdepunkt omkring frokosttid (overraskende). De dypper derefter lidt efter frokosten, når vi går tilbage til arbejde og henter igen efter 16:00, omkring det tidspunkt, vi normalt er færdige med at arbejde. Færre beskeder om aftenen er simpelthen en anden afspejling af det faktum, at vi ikke sender beskeder, når vi er sammen.

Mere end ord

Nu for det rigtige fordømmende bevis… tid til at se, hvad vores mest almindeligt anvendte ord var. Til dette fjernede jeg alle stopwords ('a', 'the', 'og' etc.), og de 10 mest anvendte ord fra hver af os kan ses nedenfor:

Top 10 mest anvendte ord for hver af os, ekskl. Stopwords

Vi er åbenbart enige med hinanden… meget. Jeg er temmelig sikker på, at min engelsksprogede far ville blive skuffet over min hyppige brug af 'gonna'. Det er også klart, at 'ah' er vores foretrukne fillerord - eller hvad der ellers svarer til tekstsamtaler.

Jeg finder det interessant, at 'tid' er et så almindeligt ord for os begge, og sandsynligvis afspejler situationer, når vi prøver at organisere eller planlægge noget ('hvad tid?', 'Hvis vi har tid' osv.). Det er også temmelig indlysende, hvem der siger 'god nat' og 'god morgen' oftest.

Total formørkelse af hjertet (Emoji)

Emojier er en ekstremt populær form for kommunikation i disse dage og bruges ofte til komisk effekt eller til at skildre følelser uden at skulle skrive ordene. For at afslutte denne flygtige analyse af Whatsapp-chatten mellem min kæreste og jeg, lad os se på, hvad vores yndlings-emojer er:

Diagram, der viser hver af vores top 10 mest brugte emojer over tidsperioden

Ingen af ​​os er overraskede over, hvad vores mest anvendte emojer er. Jeg er dog meget overrasket over, hvor meget jeg bruger øjenrulle-emojiene ... især når du overvejer at det er mere end dobbelt så meget som enhver emoji, som min kæreste bruger, bortset fra de to øverste.

Jeg finder det også interessant at se, hvordan skemaet afspejler forskelle i den måde, vi bruger emojier på. Jeg har en tendens til at bruge en bredere vifte og - selvom jeg helt klart har nogle favoritter - spredningen af ​​antallet af gange, jeg bruger hver emoji, er temmelig jævn. Min kæreste har på den anden side to emojier, som helt klart er hendes 'gå til' emojier - den ikke-onde one og det grinerende græde ansigt.

EDIT: Koden, der bruges i denne artikel, er nu tilgængelig på min Github her.

Dine data er et eventyrland

Jeg håber, at du har haft denne korte indsigt i mit forhold - jeg er sikker på, at du har fundet det spændende. Generelt ser det ud til, at 3,5 års forhold til Whatsapp kan sammenfattes med en øjenrullende emoji.

I al alvorlighed, hvis denne type analyse og præsentation af data interesserer dig, så giv mig en opfølgning og giv min publikation (Data Slice) også for at holde mig ajour med mine artikler! Jeg overvejer også at oprette en app, så enhver hurtigt kan se en visualisering af deres Whatsapp-chat ved hjælp af lignende grafer / diagrammer til det, du ser her - lad mig vide det i kommentarer eller ved direkte besked, hvis det er noget, du ville være interesseret i.