👨‍💻 Eigene Facebook-Daten analysieren [Aufruf]

Dies ist ein kurzer Beitrag mit einer Idee, welche ich mit Euch teilen möchte. Keine fertige Lösung – dafür brauche ich Dich!

Einige Plattformen/Web-Services wie Facebook und Google bieten seit einiger Zeit eine “Takeout-Option” an. Also das Herunterladen einiger der persönlichen gesammelten/angehäuften Daten, die man mit dem entsprechenden Dienst (wissentlich/unwissentlich) geteilt hat. Zum einen sind diese als “lokale Website” (im HTML-Format) verfügbar, aber zum Teil (so bei Facebook und einigen Google-Diensten) als sog. JSON-Dateien.

Um diese kleinen Datenformate mache ich mir nun Gedanken. Um nicht alle Leser*innen so früh zu verlieren: Dieses Format erlaubt es, dass die enthaltenen Items von unterschiedlichen Anwendungen in verschiedener Art und Weise interpretiert werden können. Und genau das finde ich sehr reizvoll. Denn ich sitze auf einem großen Datenberg der persönlichsten und intimsten Informationen, welche ich bereitwillig zur Analyse auf Facebook eingehackt habe.

Im Screenshot unten bekommt hier eine erste Idee davon, welche Kategorien bei dem Facebook-Takeout zur Verfügung gestellt werden:

Ordnerstruktur des Facebook-Takeouts

Bei mir sind über ein paar wenige Jahre so 800 MB zusammengekommen:  1.717 Dateien, 619 Ordner. Und nun möchte ich mit diesen Daten arbeiten (denn schließlich macht dies Facebook auch – und zwar mit Milliarden User*innen). Die Aussagekraft betrifft vielleicht “nur” meine Person und “nur” mein Nutzungsverhalten: aber es könnte mir einige Dinge aufzeigen.

Was können mir die Daten beispielsweise verraten:

  1. Mit wem schrieb ich wie oft zu welchen Uhrzeiten und wie intensiv?
  2. An welchen Tagen schrieb ich am meisten?
  3. Wann habe ich die meisten neuen Freund*innen/Kontakte hinzugefügt?
  4. Welche Frequenz hatte mein Nutzungsverhalten (Posten, Liken, Sharen…)?
  5. Wann loggte ich mich ein und wie lange besuchte ich Facebook?
  6. Auf wessen Beiträge reagierte ich in welchem Zeitraum am ehesten?
  7. Map: Welche Orte an denen ich mich befunden habe (oder welche durch meine IP ermittelt wurden) wurden an welchem Tag wie an Facebook übermittelt?
  8. Wortanalyse: In welchem Jahr schrieb ich über welche Themen am meisten?
  9. … und sicher noch viel viel mehr.

Die Idee

Zum einen liesen sich diese Dinge automatisiert in tabellarischer Form errechnen und darstellen. Zum andern in visuell-aufbereiteter Form. Und dabei würden – so denke ich – einige “Aha-Momente” möglich werden. Also: Ein Programm muss her: Und zwar eines, welches mir (als absoluter N00b) genau diese Arbeit abnimmt. Die statistische Auswertung und im besten Falle die visuelle Aufbereitung des Ganzen Datenwustes. Die Ergebnisse könnten sehr erhellend sein.

Die Herausforderung

a) ich habe keinen Programmierkenntnisse, b) ich kann keine Eingabezeile bedienen, c) die mir bekannten Analyse-Programme sind für mich nicht bedienbar. Aber ich bin davon überzeugt, dass ein solches Tool Anklang finden würde. Und darüber hinaus Datenschutzbewusstsein herstellen und so die Diskussion um Privatsphäre verstärken könnte.

Wie geht es weiter?

Keine Ahnung. Teilt diese Idee. Vermittelt Kontakte. Sprecht darüber und lasst mich wissen, was Ihr dazu denkt. Wer helfen könnte (sowohl finanziell, als auch ideell).

Ich haue das einfach mal raus und schaue was passiert… 💁‍♂

👨‍💻 Ich freue mich von Euch zu lesen.

Links

dataselfie.it (Website-Archiv) / data-selfie (GitHub)

6 Interesting Things You Can Do with Python on Facebook Data

facebook_data_analyzer (GitHub)

FacebookChatStatistics (GitHub)

Facebook Downloaded Data Processor (process Facebook archive messages) (GitHub)