Von analog zu digital – wie wir aus Ski-Atlanten einen Datensatz gemacht haben
2025-09-06 , Saal
Language: Deutsch

Ausdrucke aus IFG-Anfragen, alte Bücher oder PDFs ohne Texterkennungs-Overlay – immer wieder liegen wertvolle Daten gleichzeitig offen, sind aber trotzdem maschinell nicht nutzbar. Sie müssen also aufbereitet werden: Von gedrucktem Papier über digitale Scans bis zum aufgeräumten Datensatz ist es ein weiter Weg.

Verschiedene Tools können helfen, diese Datenschätze zu heben. Welche das sind, wie sie funktionieren und wo die Grenzen liegen, haben wir im Rahmen unserer Recherche zur Industrialisierung von Skigebieten ausprobiert. Dafür mussten wir Daten aus Ski-Atlanten, also stapelweise Papier in dicken Büchern, aus dem Archiv des ADAC in immer wieder anderen Layouts seit den 1980er Jahren extrahieren und am Ende in eine Tabelle überführen.

In der Session stellen wir den Arbeitsprozess von den analogen Daten bis zur digitalen Analyse vor, was wir über Werkzeuge und Arbeitsabläufe gelernt haben: Wann lohnen sich kommerzielle Scan-Firmen? Was sind gute (KI-)Werkzeuge für die Texterkennung und Textextraktion? Wo ist tatsächlich Handarbeit gefragt? Und wie hält man das alles zusammen?

Crossmediale Ausspielung der Geschichte:

Constanze arbeitet als Datenjournalistin mit an Geschichten rund um Klima und Umwelt. Das können große Storytelling-Projekte wie ein CO2-Rechner sein, der die Wirkung von Heizungsgesetz und Co illustriert, aber auch Geschichten über die Finanzierung der Klima-Entwicklungshilfe. Constanze hat zuvor VWL studiert und beim MDR volontiert.

This speaker also appears in:

Julia Barthel arbeitet als Daten- und Investigativjournalistin für den Bayerischen Rundfunk bei BR Recherche / BR Data. Volontiert hat sie beim NDR, nach einem Studium in Jena und Osnabrück – immer mit viel Herz fürs Hörbare.

This speaker also appears in: