Recherche in (ganz unterschiedlichen) Datenleaks
06.09.2025 , Seminarraum 2 (unten)
Sprache: Deutsch

Geleakte Daten sind immer wieder ein wichtiger Ausgangspunkt für Recherchen. Sie ermöglichen oft Einblicke in sonst verschlossene Welten – und nicht selten setzt ein Whistleblower viel aufs Spiel, um Informationen von öffentlichem Interesse mit den Rechercheuren zu teilen. Doch wie findet man sich in den internen Unterlagen eines fremden Unternehmens zurecht, wie in den geheimen Dokumenten von Hackern, wie in Audioaufnahmen von Telefonaten mutmaßlicher Betrüger:innen?

Die Beispiele zeigen schon: Es gibt sehr unterschiedliche Arten von Datenleaks. Manche bestehen aus unstrukturierten Daten, andere sind sehr strukturiert. Viele basieren hauptsächlich auf schriftlichen Dokumenten, einige aber auf Audio- oder Videoaufnahmen. Die einen sind in einer einzigen Sprache gehalten, andere in vielen verschiedenen Sprachen und Schriften.

Und doch haben sich in der Praxis einige Leitlinien etabliert, die für fast alle Recherchen in Datenleaks gelten – und sehr hilfreich sein können.

Zum Beispiel sollten Leaks vor dem eigentlichen Suchen sorgfältig vorbereitet werden, indem man sie in eine einheitliche Sprache übersetzt und durchsuchbar macht. Darüber hinaus ist es empfehlenswert, sich zu Beginn einen Überblick über die Struktur der Daten zu verschaffen, das kann die spätere Suche nach vielversprechenden Recherchesträngen enorm erleichtern. Wertvolle Tipps gibt es auch zum Suchen mit Operatoren und Schlagwortlisten. Und selbst dann, wenn man ein vielversprechendes Ergebnis entdeckt hat, steht man immer wieder vor derselben Herausforderung: Entweder, es gibt viel zu viele Treffer im Leak – oder aber viel zu wenige. Für den Umgang mit beiden Extremen haben sich aber in der Praxis hilfreiche Strategien etabliert.

Ziel dieser Präsentation ist, eine praxisnahe Anleitung zur Recherche in Datenleaks an die Hand zu geben. Der Vortrag richtet sich an eine breite Zielgruppe, weshalb die allgemeinen Strategien anhand von Beispielen ganz unterschiedlicher Datenleaks erklärt werden sollen.

Sophia Baumann (*1997) ist Investigativreporterin, die auf internationale Kooperationen spezialisiert ist. Sie leitete das Projekt "Cyprus Confidential" für “paper trail media”, zusammen mit dem ICIJ. Zuvor war sie unter anderem auch an der "Vulkan Files"-Recherche beteiligt, bei der interne Dokumente eines russischen IT-Unternehmens analysiert wurden – ein Projekt, das mit dem Deutschen Journalistenpreis ausgezeichnet wurde. 2023 wurde sie vom “medium magazin” zu den “Top 30 Journalist:innen bis 30” gekürt.