<?xml version='1.0' encoding='utf-8' ?>
<!-- Made with love by pretalx v2026.1.1. -->
<schedule>
    <generator name="pretalx" version="2026.1.1" />
    <version>0.5</version>
    <conference>
        <title>SciCAR 2025</title>
        <acronym>scicar25</acronym>
        <start>2025-09-05</start>
        <end>2025-09-06</end>
        <days>2</days>
        <timeslot_duration>00:05</timeslot_duration>
        <base_url>https://25.scicar.de</base_url>
        <logo>https://25.scicar.de/media/scicar25/img/SciCAR_Logo_rgb_Weiss_L_OGmSwsC.png</logo>
        <time_zone_name>Europe/Berlin</time_zone_name>
        
        
    </conference>
    <day index='1' date='2025-09-05' start='2025-09-05T04:00:00+02:00' end='2025-09-06T03:59:00+02:00'>
        <room name='Saal' guid='2b533f50-53ec-5772-9a60-b7f11eb48316'>
            <event guid='e2257961-6710-5a2d-b96a-1dcc52352c9a' id='81101' code='EHEPBH'>
                <room>Saal</room>
                <title>Begr&#252;&#223;ung zur SciCAR 2025</title>
                <subtitle></subtitle>
                <type>Greeting</type>
                <date>2025-09-05T10:00:00+02:00</date>
                <start>10:00</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-81101-begruung-zur-scicar-2025</slug>
                <track></track>
                
                <persons>
                    <person id='82563'>Prof. Christina Elmer</person><person id='82565'>Prof. Dr. Wiebke M&#246;hring</person>
                </persons>
                <language>de</language>
                <description>Begr&#252;&#223;ung und Gru&#223;wort zur SciCAR 2025</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/EHEPBH/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/EHEPBH/feedback/</feedback_url>
            </event>
            <event guid='0aa3e5eb-2c5a-50a3-945e-6aee77ac5d09' id='78409' code='GP7KZT'>
                <room>Saal</room>
                <title>Datenrettung in der Demokratie</title>
                <subtitle></subtitle>
                <type>Greeting</type>
                <date>2025-09-05T10:30:00+02:00</date>
                <start>10:30</start>
                <duration>00:45</duration>
                <abstract>None</abstract>
                <slug>scicar25-78409-datenrettung-in-der-demokratie</slug>
                <track></track>
                
                <persons>
                    <person id='79532'>Prof. David Schiller</person>
                </persons>
                <language>de</language>
                <description>In der Theorie des Datenmanagements dienen Daten als Repr&#228;sentation der realen Welt. Um diesem Ziel so nahe wie m&#246;glich zu kommen, m&#252;ssen Daten zielf&#252;hrend modelliert werden. Dabei sollen Daten so objektiv wie m&#246;glich die reale Welt darstellen. Diese Prozesse brauchen Expertinnen und Experten und kuratierter Datenbest&#228;nde. Je mehr Entscheidungen in Gesellschaften aufgrund von Daten getroffen werden und je mehr das Wissen einer Gesellschaft auf digitalen Daten aufbaut, desto wichtiger werden diese Datenbest&#228;nde f&#252;r die Demokratie und eine Partizipation durch informierte Individuen. Das Sammeln von Daten, das Speichern von Daten und die Analyse von Daten sind daher eine gesellschaftliche Verantwortung.

Am Beispiel USA lassen sich die Herausforderungen und der Bedarf zur Rettung von Daten in der Demokratie gerade gut darstellen. Es ist nichts Neues, dass nach einem Regierungswechsel Daten gesichert werden m&#252;ssen. Neue Regierungen wechseln Webseiteninhalte aus und stellen bestimmte Dokumente oder Daten nicht mehr zur Verf&#252;gung. Die aktuelle Situation ist aber anders. Nun sind es die Expertinnen und Experten und deren Organisationen, denen die M&#246;glichkeit genommen wird, Datenbest&#228;nde zu verwalten und verf&#252;gbar zu machen. Die aktuelle Politik in den USA ist immer weniger auf Konsens ausgerichtet. Die aktuelle Regierung hat wenig Interesse an objektiven Datenbest&#228;nden.

Als Reaktion der Expert-Community kommt es zu verst&#228;rkten Bem&#252;hungen, Daten zu retten. Dahinter steckt die Idee, dass Daten der Gesellschaft (der heutigen und der zuk&#252;nftigen) geh&#246;ren und nicht der Regierung. Das Aufkommen von k&#252;nstlicher Intelligenz, zu verstehen als datengest&#252;tzte Systeme, macht es offensichtlich, dass eine Gesellschaft immer st&#228;rker durch die in ihr verf&#252;gbaren Datenbest&#228;nde bestimmt wird. Objektive Datenbest&#228;nde, auch Zeitreihen, und ein Verst&#228;ndnis von Daten in der Gesellschaft sind daher von hoher Bedeutung f&#252;r das Funktionieren einer Demokratie und selbstbestimmte Entscheidungen von Individuen.

Die Keynote beschreibt die Vorg&#228;nge in den USA anhand von Beispielen zu Daten, Institutionen und Personen. Die Diskussion erfolgt aus soziologischer, historischer und Datenmanagement-Perspektive.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/GP7KZT/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/GP7KZT/feedback/</feedback_url>
            </event>
            <event guid='4a448421-16e6-5d5d-8036-d395052f7381' id='67249' code='J8AWHC'>
                <room>Saal</room>
                <title>Datenrettung - auch in Europa?</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-05T11:30:00+02:00</date>
                <start>11:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67249-datenrettung-auch-in-europa</slug>
                <track></track>
                
                <persons>
                    <person id='67904'>Simon Koenigsdorff</person><person id='79533'>Prof. Dr. Katja Ickstadt</person><person id='79532'>Prof. David Schiller</person><person id='80776'>Stefan Wehrmeyer</person>
                </persons>
                <language>de</language>
                <description>In den USA stehen Forschung und (&#246;ffentliche) Daten zunehmend unter politischem Druck. Das Panel kn&#252;pft an die Keynote an und richtet anschlie&#223;end den Blick unter anderem auf Deutschland und die Schweiz. 

Welche Folgen hat die Entwicklung in den USA? Wie steht es hierzulande um Daten, den Zugang zu ihnen sowie die Institutionen, die sie produzieren und vermitteln? Welche Rolle spielen sie in einer wehrhaften Demokratie?
Dazu sind Fragen aus dem Publikum erw&#252;nscht.

Es diskutieren:
**Prof. Dr. Katja Ickstadt** ist Vorsitzende der Deutschen Arbeitsgemeinschaft Statistik (DAGStat) und Professorin f&#252;r Mathematische Statistik und Biometrische Anwendungen an der TU Dortmund
**Stefan Wehrmeyer** ist OpenData-Aktivist und Gr&#252;nder von FragDenStaat. Er hat unter anderem als Datenjournalist f&#252;r Correctiv gearbeitet
**Prof. David Schiller** ist European Secretary der IASSIST und Professor f&#252;r Datenmanagement an der Fachhochschule Graub&#252;nden in Chur

Moderation: Simon Koenigsdorff, Datenjournalist (Stuttgarter Zeitung/Nachrichten)</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/J8AWHC/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/J8AWHC/feedback/</feedback_url>
            </event>
            <event guid='1a212f09-6444-5fed-91fd-f716c2c44c03' id='67316' code='XANF8S'>
                <room>Saal</room>
                <title>Warum w&#228;hlt ihr eigentlich so? Wie ihr mit den Daten aus Party Check &#252;ber die Stimmung in der Bev&#246;lkerung berichten k&#246;nnt.</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T13:30:00+02:00</date>
                <start>13:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67316-warum-wahlt-ihr-eigentlich-so-wie-ihr-mit-den-daten-aus-party-check-uber-die-stimmung-in-der-bevolkerung-berichten-konnt</slug>
                <track></track>
                
                <persons>
                    <person id='67974'>S&#246;ren M&#252;ller-Hansen</person><person id='68199'>Dr. Jan Philipp Thomeczek</person>
                </persons>
                <language>de</language>
                <description>Rund um Wahlen berichten wir Datenjournalist:innen noch immer mehr &#252;ber Umfragen, Ergebnisse und Parteiprogramme als &#252;ber Menschen und ihre Beweggr&#252;nde f&#252;r ihre Wahl. Das liegt auch daran, dass es an gro&#223;en und aktuellen Datens&#228;tzen mangelt. Im Politbarometer oder Deutschlandtrend werden zwar aktuelle Stimmungen erfragt, aber nur von wenigen Menschen. Bessere Datens&#228;tze wie [GLES](https://www.gesis.org/en/gles) werden erst mit erheblicher Verz&#246;gerung ver&#246;ffentlicht. Wir zeigen euch in diesem Workshop am Beispiel der Bundestagswahl, wie ihr mit den Daten aus [Party Check](https://party-check.org/) hochaktuell &#252;ber Stimmungen und Meinungen auch in kleinteiligen Bev&#246;lkerungsgruppen berichten k&#246;nnt.
Party Check ist ein wissenschaftliches Projekt unter der Leitung von Philipp Thomeczek an der Uni Potsdam in Kooperation mit der S&#252;ddeutschen Zeitung. In einem Tool &#228;hnlich dem Wahl-O-Mat k&#246;nnen Nutzer:innen vor Wahlen Position zu verschiedenen Fragen beziehen. Anschlie&#223;end erhalten sie ein Ergebnis, wie gro&#223; ihre &#220;bereinstimmung mit den Positionen der Parteien ist. Diese werden zuvor in einer Befragung von Politikwissenschaftler:innen ermittelt. Bei der Europa- und Bundestagswahl haben jeweils Zehntausende das Tool genutzt und dabei auch soziodemografische Daten gespendet.
Anders als bei vergleichbaren Projekten sind die erhobenen Daten als Open Data f&#252;r alle Interessierten aus Wissenschaft und Datenjournalismus quasi live verf&#252;gbar.
Wir planen, Party Check f&#252;r alle zehn in den Jahren 2026 und 2027 anstehenden Landtagswahlen auf den Weg zu bringen. Wir zeigen euch in diesem Workshop, wie ihr an die Daten kommt, wie sie aussehen, wie ihr damit arbeiten k&#246;nnt und was ihr dabei beachten solltet. Und wir freuen uns auf euren Input und eure Ideen: Welche Fragen sind f&#252;r euer Bundesland besonders interessant? Habt ihr Ideen, wie sich Menschen aus allen Bev&#246;lkerungsgruppen am besten ansprechen lie&#223;en? Welche Ideen habt ihr noch, um gemeinsam f&#252;r mehr offene Daten rund um Wahlen zu sorgen?</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/XANF8S/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/XANF8S/feedback/</feedback_url>
            </event>
            <event guid='a2e33796-7ecd-596f-bd18-aa6889d45964' id='67158' code='NA3EYB'>
                <room>Saal</room>
                <title>Politik auf TikTok: Ein interdisziplin&#228;res Datenspende-Projekt zur Bundestagswahl</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-05T14:30:00+02:00</date>
                <start>14:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67158-politik-auf-tiktok-ein-interdisziplinares-datenspende-projekt-zur-bundestagswahl</slug>
                <track></track>
                
                <persons>
                    <person id='67904'>Simon Koenigsdorff</person><person id='79758'>Dr. Nico Pfiffner</person><person id='79767'>Alina Hanss</person>
                </persons>
                <language>de</language>
                <description>Wahlkampf und politische Kommunikation finden zunehmend in sozialen Medien statt. TikTok gilt unter jungen W&#228;hler:innen als besonders einflussreiche Plattform. Aber wie viel Politik landet wirklich in den TikTok-Feeds? Welche Parteien sind dort erfolgreich und mit welchen Mitteln? Am wichtigsten: beeinflusst das die Meinung der Nutzer:innen? 

Das haben Journalist:innen von BR und Stuttgarter Zeitung sowie Forscher des Weizenbaum-Instituts und der Uni Z&#252;rich in einem interdisziplin&#228;ren Datenspende-Projekt untersucht (https://www.dein-feed-deine-wahl.de). Mit Daten von 930 Nutzer:innen entstand der bis jetzt mit Abstand gr&#246;&#223;te Datensatz dieser Art. Auch die quantitativen und qualitativen Analysen zeigen, dass Datenspenden f&#252;r Recherchen zu hyper-individualisierten Medien wie TikTok hervorragend geeignet sind. 

Die Methode ist im Journalismus bereits f&#252;r andere Themen eingesetzt worden (z.B. OpenSchufa, Wem geh&#246;rt Berlin, WhoTargetsMe, DataSkop). Das Projekt offenbart nun ein ganz neues und sehr gro&#223;es Potenzial f&#252;r Recherchen zu Tiktok, da es in der Lage ist aufzuzeigen, welche Inhalte Nutzer:innen wirklich sehen und mit welchen sie interagieren. Zus&#228;tzlich haben wir dieses Wissen mit Informationen zur Wahlentscheidung verkn&#252;pft.
Das Projekt stellt einen in dieser Art bisher einzigartigen Erfolg einer Kooperation zwischen Wissenschaft und Forschung dar. Dabei zeigt es nicht nur die bisher ungenutzten Potentiale der Methode auf, sondern auch  deren Limitationen, und kann dadurch einen Beitrag zum andauernden Diskurs zu Plattformregulierung und den Datenzugang f&#252;r Journalismus, Forschung und Zivilgesellschaft leisten. 

Im Vortrag berichten die Beteiligten anschaulich und anhand konkreter Beispiele von den Herausforderungen und Chancen dieses Datenspende-Projekts. Es geht um die gewonnenen Erkenntnisse zum Wahlkampf auf TikTok und um Ans&#228;tze f&#252;r weitere Datenspende-Projekte auch und ganz besonders als Kooperation von Journalist:innen und Wissenschaftler:innen. Eine Interaktion mit dem Publikum und dessen Erfahrungen sowie Ideen ist ausdr&#252;cklich gew&#252;nscht.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/NA3EYB/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/NA3EYB/feedback/</feedback_url>
            </event>
            <event guid='1f07eb64-8e24-5c13-a561-58dc4795a1fa' id='67371' code='YHEW3U'>
                <room>Saal</room>
                <title>AQuA: A Tool to Automatically Measure Deliberative Quality of Online Discussions Using Artificial Intelligence</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-05T16:30:00+02:00</date>
                <start>16:30</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-67371-aqua-a-tool-to-automatically-measure-deliberative-quality-of-online-discussions-using-artificial-intelligence</slug>
                <track></track>
                
                <persons>
                    <person id='68022'>Dr. Carina Weinmann</person><person id='68020'>Maike Behrendt</person>
                </persons>
                <language>en</language>
                <description>Assessing the quality of political online discussions is crucial for understanding and fostering democratic discourse, yet automating this process remains challenging. While research has identified various indicators to evaluate the deliberative quality of online discussions, existing approaches often focus on isolated aspects rather than a holistic measure of deliberative quality. In addition, most approaches are based on manual content analysis. With advancements in deep learning, it is now possible to develop AI-driven methods that enhance transparency and reliability in the analysis of online deliberation.
We introduce AQuA, an additive score that quantifies deliberative quality based on multiple indices for each discussion post. Unlike singular scores, AQuA retains detailed information on different deliberative aspects, ensuring greater interpretability. We develop adapter models for 20 deliberative indices and use correlation coefficients between expert annotations and non-expert perceptions to weigh these indices into a unified deliberative score. Our results demonstrate that AQuA can be efficiently computed from pre-trained adapters and generalizes well to unseen datasets. Moreover, our comparison of expert and non-expert annotations provides empirical support for theoretical findings in social science research.
This presentation will be relevant for data journalists, data scientists, and researchers from communication science as well as computational social science working on AI applications to analyze online deliberation. We will discuss the methodological foundations of AQuA, demonstrate its practical applications in assessing the deliberative quality of online discussions, and show its potential for integrating AI-driven analysis of online deliberation into journalistic and academic workflows.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/YHEW3U/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/YHEW3U/feedback/</feedback_url>
            </event>
            <event guid='85f9f6cf-be3a-534a-a91e-88680d743b45' id='67321' code='ENTWKD'>
                <room>Saal</room>
                <title>Kanzlersprache, Koalitionsvertr&#228;ge, Bundestag: Learnings aus KI-basierten Textanalysen</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T17:00:00+02:00</date>
                <start>17:00</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-67321-kanzlersprache-koalitionsvertrage-bundestag-learnings-aus-ki-basierten-textanalysen</slug>
                <track></track>
                
                <persons>
                    <person id='67978'>Helen Bielawa</person>
                </persons>
                <language>de</language>
                <description>Im Team Daten &amp; Visualisierungen beim SPIEGEL haben wir in den vergangenen Monaten auf unterschiedliche Weise K&#252;nstliche Intelligenz genutzt, um Texte zu analysieren. Wir haben sowohl generative LLMs genutzt, als auf Klassifikation trainierte (repr&#228;sentative) Modelle.

Mit repr&#228;sentativen Modellen haben wir in Koalitionsvertr&#228;gen etwa **Themen** identifiziert oder **&#196;hnlichkeit** gemessen. Mit einer selbst konfigurierten **ChatGPT-Pipeline** haben wir **Emotionen** und Themen in Wahlkampfauftritten identifiziert. F&#252;r beide Varianten war wie immer eine strukturierte Vorverarbeitung der Daten n&#246;tig, mit etablierten Bibliotheken. Wie wir passende repr&#228;sentative Modelle gefunden haben, wie viel Aufwand es war, mit einem selbst konfigurierten generativen Modell zu arbeiten und wie viel **h&#228;ndische Korrektur** am Ende noch n&#246;tig war, berichten wir in unserem Vortrag.

Die wichtigste Frage war und ist dabei f&#252;r uns: Welchen **Mehrwert** bringt der Einsatz von KI? Dazu geh&#246;rt die Frage, ob uns diese Art der Analyse im Vergleich zu den Analysen unserer Reporter:innen-Kolleg:innen einen Mehrwert liefert. Auch mussten wir uns immer wieder fragen, ob der Aufwand den Nutzen rechtfertigt - vor allem, wenn man am Ende noch h&#228;ndisch korrigieren muss. Wir m&#246;chten au&#223;erdem darauf eingehen, wie wir die KI-Ergebnisse strukturiert verifizieren k&#246;nnten.

Ziel des Vortrags ist, dem Publikum unsere Erfahrungen mit verschiedenen Modellen versus eigener Pipeline vorzustellen, und aufzuzeigen, wann und warum sich eine solche Methode lohnt. Am Ende w&#252;rden wir gerne diskutieren, wie das Publikum auf unsere Analysen blickt, und wer andere Erfahrungen gemacht hat.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/ENTWKD/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/ENTWKD/feedback/</feedback_url>
            </event>
            <event guid='95a22299-38e7-562d-aa54-200218f04d32' id='78408' code='QVRJPG'>
                <room>Saal</room>
                <title>KI-Pub-Quiz</title>
                <subtitle></subtitle>
                <type>Other format</type>
                <date>2025-09-05T17:30:00+02:00</date>
                <start>17:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-78408-ki-pub-quiz</slug>
                <track></track>
                
                <persons>
                    <person id='80328'>Jan Eggers</person>
                </persons>
                <language>de</language>
                <description>Du kennst alle Bewohner im LLM-Zoo pers&#246;nlich? &#220;ber die Leute, die den Unterschied zwischen einer ChatGPT-Anfrage und einer Websuche nicht kennen, kannst du nur m&#252;de l&#228;cheln? Und Transformer und Diffusoren sind deine besten Freunde?

So you think you know shit? Zeit f&#252;r: probieren und blamieren! KI-Pub-Quiz, SCICAR25 Edition - mit Spielen und R&#228;tselfragen f&#252;r KI-Interessierte - die uns vielleicht auch alle ein wenig kl&#252;ger machen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/QVRJPG/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/QVRJPG/feedback/</feedback_url>
            </event>
            
        </room>
        <room name='Room 1 (Upstairs)' guid='391abb75-7a1f-5335-bc5d-6927842a5237'>
            <event guid='ac79d3a5-ad0f-5809-8c9f-45fd1f4709eb' id='71733' code='KYEAWQ'>
                <room>Room 1 (Upstairs)</room>
                <title>North Data als Datenquelle</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-05T11:30:00+02:00</date>
                <start>11:30</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-71733-north-data-als-datenquelle</slug>
                <track></track>
                
                <persons>
                    <person id='71809'>Christina Brause</person>
                </persons>
                <language>de</language>
                <description>21 L&#228;nder, 78 Millionen Firmen, 530 Millionen Publikationen &#8211; North Data ist ein datenbasiertes Recherchetool f&#252;r investigative Recherchen mit Informationen aus offiziellen Handels- und Unternehmensregistern. Journalisten und Forscher k&#246;nnen die Plattform kostenfrei nutzen und damit komplexe Firmenverflechtungen aufdecken, verd&#228;chtige Geldw&#228;schekonstrukte durchleuchten oder Strukturen von Lobbyismus.

Der Workshop zeigt, welche Datenschichten jenseits der bekannten Netzwerkansicht liegen: Handelsregisterakten, Jahresabschl&#252;sse, Patente, Mitarbeiterzahlen und mehr. Es wird gezeigt, wie sich dadurch Branchen ausleuchten lassen, wie CEO-Wechsel, Ketteninsolvenzen oder verd&#228;chtige Netzwerkzentralit&#228;t als Fr&#252;hwarnsignale auftauchen und welche l&#228;nderspezifischen Fallen es zu umgehen gilt. Au&#223;erdem gibt es Einblick, wie aus Millionen Registereintr&#228;gen eine Datenbank entsteht und welche Herausforderungen dabei auftreten und wie KI helfen kann.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/KYEAWQ/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/KYEAWQ/feedback/</feedback_url>
            </event>
            <event guid='228348cb-a270-5a20-9dfe-9ef15bbf3040' id='67060' code='Z9NCLP'>
                <room>Room 1 (Upstairs)</room>
                <title>Werbebibliotheken von Google und Meta: Learnings und Tipps f&#252;r die Recherche</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-05T12:00:00+02:00</date>
                <start>12:00</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-67060-werbebibliotheken-von-google-und-meta-learnings-und-tipps-fur-die-recherche</slug>
                <track></track>
                
                <persons>
                    <person id='67320'>Stella Hesch</person><person id='67811'>Stephanie Jauss</person><person id='67982'>Julia Barthel</person>
                </persons>
                <language>de</language>
                <description>Gro&#223;e Digitalkonzerne wie Google und Meta m&#252;ssen ihr Gesch&#228;ft mit Werbeanzeigen zumindest teilweise transparent machen &#8211; trotzdem ist es nicht leicht, diese Inhalte systematisch abzurufen und zu analysieren. Correctiv und ARD Datenjournalist:innen haben zur Bundestagswahl recherchiert und sind dabei sehr unterschiedlich vorgegangen. 

Bei dieser Pr&#228;sentation geben wir Einblicke in unsere Analysen und zeigen, welche Informationen beispielsweise &#252;ber den Inhalt einer Werbeanzeige, zu Kosten und Reichweite, sowie zum Targeting und der Ausspielung vorhanden sind, wie man auf diese zugreift und welche Herausforderungen man dabei bew&#228;ltigen muss. Unser Fokus liegt dabei auf der technischen Umsetzung, der journalistischen Verwertbarkeit und der &#220;bertragbarkeit auf zuk&#252;nftige Projekte. 

Mit unserer Session wollen wir f&#252;r Kolleg:innen den Einstieg in die Arbeit mit den Daten erleichtern und Grenzen der Werbebibliotheken sichtbar machen. Denn klar ist: Die Arbeit mit den Daten ist komplex, obwohl die Konzerne scheinbar ihrer Transparenzpflicht nachkommen und Daten zu politischen Werbeanzeigen ver&#246;ffentlichen, die auf Google, YouTube, Facebook oder Instagram geschaltet werden.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/Z9NCLP/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/Z9NCLP/feedback/</feedback_url>
            </event>
            <event guid='8c7d86b2-af74-516f-bc6b-5edddb55d973' id='67157' code='ZQJPBN'>
                <room>Room 1 (Upstairs)</room>
                <title>Energiewende tracken: Wie k&#246;nnen wir die Datenqualit&#228;t und -nutzbarkeit des Marktstammdatenregisters verbessern?</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T13:30:00+02:00</date>
                <start>13:30</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-67157-energiewende-tracken-wie-konnen-wir-die-datenqualitat-und-nutzbarkeit-des-marktstammdatenregisters-verbessern</slug>
                <track></track>
                
                <persons>
                    <person id='67933'>Florian Kotthoff</person><person id='82414'>Timo Beyer</person>
                </persons>
                <language>de</language>
                <description>Das Marktstammdatenregister (MaStR) der Bundesnetzagentur ist f&#252;r Datenjournalist:innen eine wichtige Quelle, um &#252;ber den Stand der Energiewende zu berichten und diesen tagesaktuell zu verfolgen. Denn es enth&#228;lt detaillierte Daten von Anlagenbetreibern, Netzbetreibern und Energielieferanten f&#252;r den deutschen Strom- und Gasmarkt.

 

Der Vortrag besteht aus drei Teilen:

1. Zun&#228;chst stellt Florian grundlegende Informationen zum Datensatz vor: Wie kann ich auf die Daten zugreifen? Welche Informationen bietet der Datensatz?

2. Im zweiten Teil thematisiert Florian die Datenqualit&#228;t des MaStR, die oft unzureichend oder unbekannt ist und somit zu fehlerhaften Analysen f&#252;hrt. Ein Problem, das insbesondere in der regionalen und lokalen Berichterstattung bekannt sein d&#252;rfte. Hier pr&#228;sentiert er unsere Ideen und ersten Schritte f&#252;r eine gemeinsame und offene Datenvalidierung des Marktstammdatenregisters.

3. Timo stellt das Projekt MaStR4all vom Reiner Lemoine Institut (RLI) vor. Wissenschaftler:innen des RLI wollen in diesem Projekt das Open-Source-Tool open-mastr durch direkten Austausch mit den Nutzenden verbessern, um den Zugang zu energiewirtschaftlichen Daten aus dem MaStR zu erleichtern. Mit dem Tool k&#246;nnen Nutzende die Daten geb&#252;ndelt herunterladen und f&#252;r Auswertungen nutzen &#8211; ohne tief in komplexe Datenstrukturen eintauchen zu m&#252;ssen. So sollen noch mehr Akteure mit Daten der Energiewende arbeiten k&#246;nnen sowie neue Zielgruppen f&#252;r Wissenstransfer und Kooperationen angesprochen werden.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/ZQJPBN/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/ZQJPBN/feedback/</feedback_url>
            </event>
            <event guid='951181c4-c28d-541c-8189-b2b8b7808d63' id='67283' code='ZWPPYE'>
                <room>Room 1 (Upstairs)</room>
                <title>It Needs Energy &#8211; Wie wir Datenl&#252;cken in der Energiewende schlie&#223;en</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T14:00:00+02:00</date>
                <start>14:00</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-67283-it-needs-energy-wie-wir-datenlucken-in-der-energiewende-schlieen</slug>
                <track></track>
                
                <persons>
                    <person id='80090'>Christian Endt</person><person id='67939'>Dr. Anne Berner</person><person id='73491'>Frederik Digulla</person><person id='73494'>Bahne Carstensen</person>
                </persons>
                <language>de</language>
                <description>Fundierte Daten sind essenziell, um die Energiewende wirksam zu steuern, politische Ma&#223;nahmen zu bewerten und Fortschritte messbar zu machen. Doch oft fehlen pr&#228;zise oder harmonisierte Daten &#8211; sei es durch uneinheit-liche Erfassungsmethoden, f&#246;derale Strukturen oder die zunehmende Dezentralisierung des Energiesystems. Diese L&#252;cken erschweren faktenbasierte Entscheidungen und eine transparente &#246;ffentliche Debatte. 

*Wo und warum bestehen Datenl&#252;cken? Welche Strategien haben sich bew&#228;hrt, um sie zu schlie&#223;en? Wie lassen sich komplexe Energiedaten journalistisch aufbereiten?*

In unserem Workshop stellen wir praxisnahe Strategien zur Schlie&#223;ung von Datenl&#252;cken in der Energiewende vor und diskutieren innovative journalistische Ans&#228;tze, die dezentraler Energiedaten transparent aufbereiten.

Vier Impulsvortr&#228;ge liefern praxisnahe Einblicke:
- **Datenl&#252;cken in der Energiewende: &#220;berblick und politische Relevanz**
*Dr. Anne Berner, Deutsche Energie-Agentur*
Einf&#252;hrung in zentrale Datenl&#252;cken entlang der politischen Steuerung der Energiewende: Wo fehlen In-formationen, welche Auswirkungen hat das und welche L&#246;sungen sind denkbar?
- **Goal100: Digitales Fortschrittsbarometer f&#252;r den Windenergieausbau in Deutschland**
*Bahne Carstensen, Goal100/ProjectTogether*
Mit Goal100 wurde durch detektivische Datensuche in f&#246;deralen Strukturen ein Dashboard geschaffen, das den Windenergieausbau erstmals umfassend und aktuell sichtbar macht. Die Plattform bietet eine datenbasierte Prognose bis 2030 und erm&#246;glicht es, Engp&#228;sse, Genehmigungsprozesse und regionale Unterschiede pr&#228;zise zu analysieren.
- **Energiewende greifbar machen: Personas f&#252;r eine soziale Klimapolitik**
*Frederik Digulla, Sozialklimarat*
Mithilfe der kommerziellen Geb&#228;udedatenbank von infas 360 wurden sozio&#246;konomische Merkmale mit Mikrodaten zu Geb&#228;uden verkn&#252;pft, um soziale Gruppen in der W&#228;rmewende sichtbar zu machen. Die entwickelten 16 Personas geben den Energiewendedaten ein lokales, lebensnahes Gesicht und zeigen, wie datenbasierte Kommunikation sozial gerechte L&#246;sungen f&#246;rdern kann. 
- **Energiedaten im Journalismus: Best Practices zur Visualisierung und Kommunikation**
*Christian Endt, Stellvertretender Leiter des Ressorts Daten und Visualisierung von ZEIT ONLINE*
Wie lassen sich verstreute Energiedaten recherchieren, strukturieren und f&#252;r ein breites Publikum zug&#228;nglich machen? Anhand von Beispielen wie dem ZEIT Energy Monitor zeigt der Impuls auf, wie datenjournalistische Ans&#228;tze Transparenz schaffen und zur faktenbasierten Energiewende-Debatte beitragen.

**Interaktive Diskussion &amp; Austausch**
Im Anschluss an die Impulsvortr&#228;ge diskutieren die Teilnehmenden gemeinsam:
- In welchen politischen und regulatorischen Bereichen der Energiewende gibt es besonders gravierende Datenl&#252;cken und wie k&#246;nnen diese geschlossen werden?
- Welche Herausforderungen bestehen bei der Schlie&#223;ung von Datenl&#252;cken in der Energiewende
- Welche Formate und Werkzeuge eignen sich zur Aufbereitung und Vermittlung von fragmentierten Energiedaten?</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/ZWPPYE/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/ZWPPYE/feedback/</feedback_url>
            </event>
            <event guid='2f1d3b20-81ed-5cbd-802e-6ffe531db933' id='67146' code='R9RXTG'>
                <room>Room 1 (Upstairs)</room>
                <title>Energie.Daten.Kommunikation - Schnittstellen zwischen Energiesystemforschung und Journalismus</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T14:30:00+02:00</date>
                <start>14:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67146-energie-daten-kommunikation-schnittstellen-zwischen-energiesystemforschung-und-journalismus</slug>
                <track></track>
                
                <persons>
                    <person id='67819'>Dr. Mirko Sch&#228;fer</person><person id='67820'>Christina Speck</person>
                </persons>
                <language>de</language>
                <description>Immer mehr Daten aus der Energieforschung werden &#246;ffentlich zug&#228;nglich &#8211; &#252;ber Plattformen, Repositorien und offene Infrastrukturen. Diese Datens&#228;tze bieten eine wertvolle Grundlage f&#252;r datenjournalistische Recherchen, Analysen und Visualisierungen. Gleichzeitig entwickelt auch die Wissenschaft zunehmend Formate, um ihre Ergebnisse visuell und digital aufzubereiten &#8211; h&#228;ufig mit dem Ziel, eine breitere &#214;ffentlichkeit zu erreichen.
Doch wie gelingt der Austausch zwischen Wissenschaft und Datenjournalismus? Welche Datenformate, Plattformen und Zusatzinformationen sind n&#246;tig, damit Energiedaten und das zugeh&#246;rige Expertenwissen aus der Forschung sinnvoll in journalistische Arbeiten einflie&#223;en k&#246;nnen? Und umgekehrt: Was kann die Wissenschaft vom Journalismus lernen, wenn es um verst&#228;ndliche, zug&#228;ngliche und wirkungsvolle Datenkommunikation geht?
Im Rahmen eines Workshops m&#246;chten wir gemeinsam mit Datenjournalist:innen, Datenexpert:innen und Forschenden konkrete Bedarfe identifizieren: Welche Services, Schnittstellen und unterst&#252;tzenden Tools w&#252;rden die Zusammenarbeit erleichtern? Welche Formate haben sich in der Praxis bew&#228;hrt? Welche Rolle k&#246;nnen Forschungsdateninfrastrukturen dabei spielen?
Der Workshop wird veranstaltet durch Forschende aus dem Konsortium [NFDI4Energy](https://nfdi4energy.uol.de/), das im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) eine dezentrale Infrastruktur f&#252;r Energiedaten aufbaut. Neben der technischen Entwicklung versteht sich NFDI4Energy auch als Br&#252;cke zur Gesellschaft &#8211; mit dem Ziel, Forschungsdaten nicht nur innerhalb der Wissenschaft, sondern auch f&#252;r weitere Stakeholder aus Gesellschaft und Industrie nutzbar zu machen. Gleichzeitig sollen Strukturen geschaffen werden, um diese Akteure st&#228;rker in die Energiesystemforschung einzubeziehen.
Zielgruppe des Workshops sind sowohl datenjournalistisch arbeitende Personen und Datenexpert:innen mit Interesse am Thema Energie als auch Wissenschaftler:innen, die ihre Daten gezielter f&#252;r die &#246;ffentliche Kommunikation aufbereiten m&#246;chten. Der Austausch soll Impulse geben f&#252;r neue Kooperationen und Formate an der Schnittstelle von Energiesystemforschung und Journalismus.</description>
                <recording>
                    <license></license>
                    <optout>true</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/R9RXTG/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/R9RXTG/feedback/</feedback_url>
            </event>
            <event guid='70752215-cbd6-59a1-8727-36d4c240e637' id='67290' code='WDGNJY'>
                <room>Room 1 (Upstairs)</room>
                <title>Lass KI-Agents die Arbeit machen: Daten aus Text &amp; Bild extrahieren und anreichern.</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T16:30:00+02:00</date>
                <start>16:30</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-67290-lass-ki-agents-die-arbeit-machen-daten-aus-text-bild-extrahieren-und-anreichern</slug>
                <track></track>
                
                <persons>
                    <person id='67948'>Marcel Pauly</person>
                </persons>
                <language>de</language>
                <description>Dieser Workshop zeigt, wie man mit LLM-Agents unstrukturierte Daten aus Texten und Grafiken automatisiert ausliest und anreichert. Wir schauen uns an, wie man mithilfe des Agent-Frameworks [PydanticAI](https://ai.pydantic.dev/)

- Entit&#228;ten und Zahlenwerte aus Flie&#223;text extrahiert,
- Daten kategorisiert,
- Daten aus komplex strukturierten Grafiken einliest,

und jeweils das gew&#252;nschte Zielformat pr&#228;zise definiert. Agents erlauben es dabei, nat&#252;rliche Sprachverarbeitung, OCR-F&#228;higkeit und Webrecherche automatisiert zu kombinieren. Arbeitsschritte, die h&#228;ndisch eine Ewigkeit dauern w&#252;rden, lassen sich so massiv beschleunigen.

**Voraussetzungen:**
- Kenntnisse in Python und Pandas, Erfahrung mit Jupyter Notebooks oder Google Colab
- wenn ihr lokal mitmacht: Python 3.10+, Pandas und PydanticAI
- optional ein API-Key f&#252;r ChatGPT/OpenAI, Claude/Anthropic oder Gemini

**Lernziele:**
Nach Abschluss der Session k&#246;nnen Teilnehmer:innen skriptbasiert eigene LLM-Agents erstellen, die aus un- und halbstrukturierten Quellen wie Texten und Bildern strukturierte Daten extrahieren und bei Bedarf mit online recherchierten Informationen anreichern.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/WDGNJY/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/WDGNJY/feedback/</feedback_url>
            </event>
            <event guid='03a846ea-e644-550f-a102-db8e21f355c0' id='66993' code='KEP3YA'>
                <room>Room 1 (Upstairs)</room>
                <title>Von Daten zur RAG: Ein Praxiseinblick in die Entwicklung RAG basierter Chatbots</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T17:00:00+02:00</date>
                <start>17:00</start>
                <duration>00:30</duration>
                <abstract>None</abstract>
                <slug>scicar25-66993-von-daten-zur-rag-ein-praxiseinblick-in-die-entwicklung-rag-basierter-chatbots</slug>
                <track></track>
                
                <persons>
                    <person id='67676'>Mani Erfanian Abdoust</person>
                </persons>
                <language>de</language>
                <description>Jeder, der schon einmal ChatGPT oder &#228;hnliche Chatbots benutzt hat, kennt das Problem: Die Antwort klingt &#252;berzeugend, ist aber faktisch falsch &#8211; sogenannte &#8222;Halluzinationen&#8220;. Eine M&#246;glichkeit Halluzinationen zu reduzieren bietet der Retrieval-Augmented Generation (RAG) Ansatz: Daf&#252;r wird die KI mit selektierten Informationen aus einer eigenen Wissensbasis angereichert. Das Ergebnis sind generierte Antworten, deren Aussagen direkt aus der externen Quelle abgeleitet  und dadurch faktisch besser &#252;berpr&#252;fbar sind.
Gerade im daten- und wissenschaftsjournalistischen Kontext, wo Fakten und korrekte Quellenangaben entscheidend sind, bietet das RAG Verfahren ein enormes Potenzial. Egal ob bei der automatisierten Recherche, Faktenpr&#252;fung oder der gezielten Auswertung riesiger Textmengen: Ein gut eingerichtetes RAG-System hilft Journalist:innen, Daten mit Hilfe von KI sinnvoll zu nutzen und zuverl&#228;ssig in ihren Arbeitsalltag zu integrieren.

Im Rahmen des Workshops &#8222;Von Daten zur RAG&#8220; soll praxisnah aufgezeigt werden, wie Redaktionen und Newsrooms ein eigenes RAG-System von Grund auf entwickeln, testen und schrittweise optimieren k&#246;nnen. Der Schwerpunkt liegt dabei auf folgenden Bereichen:

**Aufbau einer eigenen Wissensbasis** 
&lt;br&gt;Wie k&#246;nnen redaktionelle Inhalte (Artikel, Reportagen, Interviews) effizient aufbereitet und in eine durchsuchbare Datenbank &#252;berf&#252;hrt werden?
&lt;br&gt;**Generierung synthetischer Testdaten**
&lt;br&gt;Wie erstellt man mithilfe von LLMs aus dem vorhandenem redaktionellem Content einen Testdatensatz (Frage-Antwort-Paare), um das KI-System objektiv bewerten zu k&#246;nnen?
&lt;br&gt;**Aufsetzen eines &#8222;naiven&#8220; RAG-Systems**:
&lt;br&gt;Demonstration, wie ein erster, einfacher Prototyp mit grundlegenden Kompontenten (Vektorsuche, Kontexteinbettung, Textgenerierung) eingerichtet werden kann. Wie sehen die ersten Ergebnisse aus?
&lt;br&gt;**Definition sinnvoller Metriken**
&lt;br&gt;Anhand welcher konkreter Kriterien (Halluzinationsrate, Faktentreue, Verst&#228;ndlichkeit, Antwortrelevanz) soll die Qualit&#228;t eines RAG-Systems evaluiert werden? 
&lt;br&gt;**Systematische Verbesserung des Systems**
&lt;br&gt;Welche Methoden kann man nutzen, um die Performance des Systems zu verbessern (z.B. Optimierung der Suchfunktion, Kontextmanagement, Prompt Engineering)? Wir vergleichen systematisch die Ergebnisse mit dem naiven System.

Ziel des Workshops ist es, den Teilnehmer*innen einen ersten systematischen Einblick zu geben, wie RAG-Ans&#228;tze praktisch implementiert und evaluiert werden k&#246;nnen, um so verl&#228;sslichere KI-L&#246;sungen f&#252;r die journalistische Praxis zu schaffen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/KEP3YA/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/KEP3YA/feedback/</feedback_url>
            </event>
            
        </room>
        <room name='Room 2 (ground level)' guid='6c097fd5-0f0f-5578-9577-da61853414d5'>
            <event guid='5680184b-1679-5a04-b3a9-5837bfc97edb' id='67070' code='MVLTWW'>
                <room>Room 2 (ground level)</room>
                <title>Vibe Coding - interaktiv</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T11:30:00+02:00</date>
                <start>11:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67070-vibe-coding-interaktiv</slug>
                <track></track>
                
                <persons>
                    <person id='67732'>Camillo Sulzer</person><person id='67741'>Linus Netze</person>
                </persons>
                <language>de</language>
                <description>In der Session &quot;Vibe Coding - interaktiv&quot; wird gezeigt, wie Programmieren mit AI aussehen kann. Die Teilnehmenden erhalten die M&#246;glichkeit, mithilfe des Cursor Editors eine Website allein durch Prompts zu erstellen. Dabei wird interaktiv gearbeitet: Teilnehmende k&#246;nnen eigene Ideen einbringen, die direkt live umgesetzt werden.
Dieser Workshop soll nicht nur die einfache Nutzung und die kreativen M&#246;glichkeiten darstellen, sondern auch die Grenzen aufzeigen. Wird der resultierende Code immer sauber und wartungsfreundlich sein? Wir diskutieren die St&#228;rken und Schw&#228;chen dieser Methode und bieten praktische Einblicke, welche Aspekte bei der Nutzung solcher Tools bedacht werden sollten.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/MVLTWW/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/MVLTWW/feedback/</feedback_url>
            </event>
            <event guid='85922786-0f07-5994-9c6b-a2b5e5b756ed' id='67374' code='ETJE3C'>
                <room>Room 2 (ground level)</room>
                <title>Wenn die Daten nicht kommen, holen wir sie uns? Wie man fehlende und l&#252;ckenhafte lokale Beh&#246;rdendaten doch noch nutzbar macht</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T13:30:00+02:00</date>
                <start>13:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67374-wenn-die-daten-nicht-kommen-holen-wir-sie-uns-wie-man-fehlende-und-luckenhafte-lokale-behordendaten-doch-noch-nutzbar-macht</slug>
                <track></track>
                
                <persons>
                    <person id='68025'>Nina Breher</person>
                </persons>
                <language>de</language>
                <description>Wie l&#228;sst sich datenjournalistisch lokal recherchieren, wenn amtliche Daten fehlen oder schwer zug&#228;nglich sind? In einem Werkstattbericht erz&#228;hlen wir, wie wir trotz Widerst&#228;nden an lokalpolitisch relevante Daten kommen &#8211; sei es etwa zu intransparenten Grundst&#252;ckspreisen, politischen Vorg&#228;ngen in Berlin, Unterrichtsausfall oder Kleing&#228;rten.

Dabei soll es insbesondere um ganz konkrete Recherchewege gehen - vom Scraping l&#252;ckenhafter PDFs &#252;ber Grundbuchauswertungen, das manuelle Klassifizieren von Rohdaten bis hin zur KI-gest&#252;tzten Datenbereinigung und zur interdiszplin&#228;ren Zusammenarbeit mit Wissenschaftler*innen - und darum, wie manchmal aus den Datenl&#252;cken selbst Geschichten entstehen. Welche L&#246;sungen haben wir gefunden und welche Herausforderungen bestehen noch immer?

Aus unserer t&#228;glichen Arbeit teilen wir in einem kurzen Impulsvortrag Erfahrungen, Tipps und Fails. Im Anschluss wollen wir gemeinsam diskutieren, wie man fehlende und unzug&#228;ngliche Daten im Lokalen findet, erg&#228;nzt, doch noch bekommt - und welche Grenzen es gibt.

Diese Session bezieht sich auf den nachfolgenden Workshop &quot;Parlamentsdaten &amp; KI: Wie moderne Technologien technische H&#252;rden absenken k&#246;nnen&quot; und dient als inhaltliche Einf&#252;hrung f&#252;r ihn. Im zweiten Teil wollen wir dann gemeinsam ausprobieren, neue Informationen man aus den Protokollen aller Landesparlamente zu ziehen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/ETJE3C/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/ETJE3C/feedback/</feedback_url>
            </event>
            <event guid='d697fc04-ca18-5b24-9137-d3736f211380' id='67356' code='WZRWRG'>
                <room>Room 2 (ground level)</room>
                <title>Parlamentsreden analysieren: Wie moderne Technologien technische H&#252;rden absenken k&#246;nnen</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T14:30:00+02:00</date>
                <start>14:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67356-parlamentsreden-analysieren-wie-moderne-technologien-technische-hurden-absenken-konnen</slug>
                <track></track>
                
                <persons>
                    <person id='68004'>Eric Beltermann</person>
                </persons>
                <language>de</language>
                <description>**Bringen Sie gern einen eigenen Laptop und Themenideen mit!**

Parlamentsprotokolle enthalten einen Schatz an Informationen f&#252;r die Regional- und Lokalberichterstattung &#8211; doch bisher waren sie nur schwer systematisch zug&#228;nglich. Wie k&#246;nnen wir zehntausende Protokolle gleichzeitig analysieren und dabei lokale Geschichten entdecken, die in der Masse untergehen w&#252;rden?

##### Vom PDF zur Story: Systematische Analyse parlamentarischer Debatten

Mit der StateParl-Datenbank stehen erstmals **14 Millionen Redebeitr&#228;ge aus allen 16 Landesparlamenten** f&#252;r datengetriebene Recherchen zur Verf&#252;gung. Text-as-Data-Methoden und moderne KI-Tools verwandeln diese Textmengen in konkrete journalistische Erkenntnisse &#8211; und das ohne tiefe Programmierkenntnisse.

##### M&#246;gliche Analyseans&#228;tze

- **Wie werden bestimmte Orte besprochen?**: Wof&#252;r steht Dortmund? Dient es Parlamenten in anderen L&#228;ndern als positives oder negatives Beispiel? Ver&#228;nderte sich der Ruf Dortmunds &#252;ber Zeit?
- **Themen-Tracking**: Wann wird ein lokales Problem zur Landesdebatte? Wie verbreiten sich politische Trends zwischen Bundesl&#228;ndern und Gemeinden?
- **Agendasetting**: Welche Abgeordneten bringe Themen auf die Agenda? Wer sind die regionalen Meinungsmacher:innen?

##### Hands-on Methoden f&#252;r die Praxis

Im Workshop erarbeiten wir Techniken, um aus parlamentarischen Debatten konkrete Datenstories zu entwickeln. Teilnehmende bringen ihre Recherchefragen mit &#8211; gemeinsam finden wir die Antworten in den Daten. Ob Schulpolitik, Klimaschutz oder Wohnungsmarkt: **praktische &#220;bungen** zeigen, wie aus gro&#223;en Textmengen investigative Geschichten werden.

##### F&#252;r wen ist der Workshop geeignet?

Moderne KI-Tools erlauben einen einfachen ersten Zugang zu komplexe Textanalysen. Programmierkenntnisse sind f&#252;r diesen Workshop nicht notwendig. Erfahrenheit im Umgang mit KI oder grundlegende Coding-Kenntnisse erleichtern jedoch den Zugang. Die Veranstaltung ist Ideal f&#252;r:
- Lokaljournalist:innen, die systematischer in Daten recherchieren m&#246;chten
- Datenjournalist:innen auf der Suche nach neuen Quellen  
- Alle, die Politik datengetrieben verstehen wollen


*Dieser Workshop baut thematisch auf der Session &#8222;Wenn die Daten nicht kommen, holen wir sie uns? Wie man fehlende und l&#252;ckenhafte lokale Beh&#246;rdendaten doch noch nutzbar macht&#8220; auf.  Er zeigt, wie exemplarisch, wie eine Datenl&#252;cken geschlossen wurde und diese Daten journalistisch erschlossen werden k&#246;nnen*</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links>
                    <link href="https://interaktiv.tagesspiegel.de/lab/von-messermaennern-und-ficki-ficki-bereicherern-so-trug-die-afd-den-hass-in-die-parlamente/">Beispielartikel: Wie die AfD Fremdenfeindlichkeit in die Parlamente trug</link>
                
                    <link href="https://stateparl.de/">Link zum StateParl-Website</link>
                </links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/WZRWRG/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/WZRWRG/feedback/</feedback_url>
            </event>
            <event guid='37fed825-24c7-52c9-b36d-bd4aefdd15c1' id='67363' code='WHZBJY'>
                <room>Room 2 (ground level)</room>
                <title>Analyse von politischen Trends: Wie wir Abstimmungsergebnisse des Europaparlaments transparenter machen</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T16:30:00+02:00</date>
                <start>16:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67363-analyse-von-politischen-trends-wie-wir-abstimmungsergebnisse-des-europaparlaments-transparenter-machen</slug>
                <track></track>
                
                <persons>
                    <person id='68012'>Linus Hagemann</person><person id='68014'>Till Prochaska</person>
                </persons>
                <language>de</language>
                <description>Wir pr&#228;sentieren HowTheyVote.eu, eine Datenbank, die die Ergebnisse der namentlichen Abstimmung im Europ&#228;ischen Parlament einfach zug&#228;nglich und durchsuchbar macht. Wir gehen darauf ein, welche Daten verf&#252;gbar sind und wie damit gearbeitet werden kann, anhand von Demos und konkreten Beispielen von Berichterstattung.

Au&#223;erdem geben wir einen &#220;berblick &#252;ber die verschiedenen offiziellen und externen Datenquellen f&#252;r Informationen zu EU-Gesetzgebungsprozessen und Aktivit&#228;ten im Europ&#228;ischen Parlament. Dabei gehen wir auch darauf ein, wie wir diese f&#252;r unser Projekt nutzen und Daten aus verschiedenen Quellen verbinden.
 
Das Europ&#228;ische Parlament ist die einzige direkt demokratisch gew&#228;hlte EU-Institution. Daher ist das Abstimmungsverhalten der Abgeordneten von besonderem Interesse. Seit den Wahlen im letzten Jahr ist die Zahl der (extrem) rechten Abgeordneten im Parlament deutlich gestiegen. Das macht es umso wichtiger, die Geschehnisse im Parlament im Auge zu behalten.

Zwar ver&#246;ffentlicht das Parlament auf seiner Website namentliche Abstimmungsergebnisse und Plenarprotokolle. Trotzdem kann es schwierig sein, herauszufinden, wor&#252;ber die Abgeordneten genau abgestimmt haben oder wie eine bestimmte Abstimmung ausgegangen ist, weil die Daten &#252;ber verschiedene Quellen verstreut sind, in unterschiedlichen Formaten vorliegen und zu verschiedenen Zeitpunkten zur Verf&#252;gung gestellt werden.

Mit HowTheyVote.eu betreiben wir seit 2020 eine vollst&#228;ndig frei nutzbare Webseite, auf der wir Informationen zu Abstimmungen und Abgeordneten aus verschiedensten offiziellen Quellen b&#252;ndeln. Dar&#252;ber hinaus stellen wir unsere gesamte Datenbank und auch den Quelltext der Software unter einer offenen Lizenz zur Weiterverwendung bereit.

In unserer Session lernen Teilnehmerinnen wie sie:

- Offizielle und externe Quellen, die Informationen &#252;ber Verfahren im Europ&#228;ischen Parlament enthalten, finden und navigieren;
- HowTheyVote.eu nutzen, um Abstimmungen zu bestimmten Themen zu finden und  Abstimmungsergebnisse f&#252;r einzelne Abstimmungen und &#196;nderungsantr&#228;ge einzusehen;
- Mit der HowTheyVote.eu-Datenbank und der API arbeiten, um sie f&#252;r ihre eigenen Recherchen und Analysen zu nutzen.

Wir kombinieren Vortragselemente mit interaktiven Elementen und Live-Coding zum mitmachen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/WHZBJY/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/WHZBJY/feedback/</feedback_url>
            </event>
            
        </room>
        <room name='Room 3 (by the kitchen)' guid='471c9d74-30db-5dfd-9670-12d26c331324'>
            <event guid='ffdf4e4f-66d4-599d-8565-35656f7690bb' id='78406' code='YB9AQ9'>
                <room>Room 3 (by the kitchen)</room>
                <title>Die Daten der Deutschen Wahlstudie (GLES)</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-05T11:30:00+02:00</date>
                <start>11:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-78406-die-daten-der-deutschen-wahlstudie-gles</slug>
                <track></track>
                
                <persons>
                    <person id='79712'>Jan Marquardt</person>
                </persons>
                <language>de</language>
                <description>Die Deutsche Wahlstudie (GLES) ist das zentrale Umfrageprogramm in Deutschland zur kontinuierlichen Erhebung und Bereitstellung hochwertiger Daten f&#252;r die nationale und internationale Wahlforschung. GESIS &#8211; Leibniz-Institut f&#252;r Sozialwissenschaften stellt diese Daten f&#252;r Forschung und &#214;ffentlichkeit bereit.

Im Vortrag werden zentrale Studienteile wie Querschnitt, Tracking, Rolling Cross-Section, Panel und die Kandidierendenstudie vorgestellt. Anhand konkreter Beispiele wird gezeigt, wie die verschiedenen Designs unterschiedliche politische Dynamiken erfassen &#8211; etwa kurzfristige Meinungsverschiebungen im Wahlkampf oder langfristige Trends.

Ein Schwerpunkt liegt auf der offenen Frage nach den &#8222;wichtigsten politischen Problemen&quot;. Die automatisierte Auswertung freier Texte mit einem BERT-Modell wird als Fallbeispiel pr&#228;sentiert &#8211; mit dem Ziel, den methodischen Transfer in den Datenjournalismus zur Diskussion zu stellen.

Zum Abschluss werden Chancen und Grenzen der journalistischen Nutzung von GLES-Daten thematisiert: Welche Zug&#228;nge gibt es? Welche Anforderungen gelten f&#252;r Interpretation und Kontextualisierung? Und wo liegen die Potenziale f&#252;r evidenzbasierte Berichterstattung?</description>
                <recording>
                    <license></license>
                    <optout>true</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/YB9AQ9/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/YB9AQ9/feedback/</feedback_url>
            </event>
            <event guid='f073f74e-f956-5497-88e8-9d80b9aebcf2' id='71734' code='WZDHVK'>
                <room>Room 3 (by the kitchen)</room>
                <title>Data traces of disinformation: FIMI and the analytical frameworks of the defender community</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T13:30:00+02:00</date>
                <start>13:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-71734-data-traces-of-disinformation-fimi-and-the-analytical-frameworks-of-the-defender-community</slug>
                <track></track>
                
                <persons>
                    <person id='71811'>Dr. Timo Lenk</person><person id='71812'>Julian Neylan</person>
                </persons>
                <language>en</language>
                <description>Forms of information manipulation, such as disinformation and manipulative narratives, pose a threat to free discourse in democratic societies. Beyond verifying factual accuracy, newsrooms must also be able to identify and categorize a wider range of manipulation techniques in order to uphold journalistic quality and inform the public about such phenomena. 

In this interactive workshop, Julian Neylan (Alliance4Europe) and Timo Lenk (TU Dortmund) explore how (foreign) information manipulation takes shape and introduce practical analytical frameworks from the defender community for recognizing and countering these techniques.

Disarm-Framework: https://disarmfoundation.github.io/disarm-navigator/ 
OpenCTI: https://filigran.io/solutions/open-cti/</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/WZDHVK/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/WZDHVK/feedback/</feedback_url>
            </event>
            <event guid='ee6295be-1035-52c6-8f19-adbbe14e932d' id='67094' code='Y8AGAN'>
                <room>Room 3 (by the kitchen)</room>
                <title>Webscraping f&#252;r Datenjournalist:innen: Hands-on workshop zum Extrahieren von Daten aus dem Internet</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T14:30:00+02:00</date>
                <start>14:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-67094-webscraping-fur-datenjournalist-innen-hands-on-workshop-zum-extrahieren-von-daten-aus-dem-internet</slug>
                <track></track>
                
                <persons>
                    <person id='67778'>Kai-Robin Lange</person><person id='67765'>Dr. Henrike Weinert</person><person id='82675'>Prof. Dr. Katja Ickstadt</person><person id='79422'>Lisa-Marie Eckardt</person>
                </persons>
                <language>de</language>
                <description>In diesem Workshop lernen Datenjournalist:innen die Grundlagen des Webscrapings, um automatisiert Daten aus dem Netz zu extrahieren. Anhand praxisnaher Beispiele und Open-Source-Tools zeigen wir, wie sich strukturierte und unstrukturierte Daten effizient sammeln und f&#252;r Recherchen nutzen lassen. Anf&#228;nger:innen erhalten eine Einf&#252;hrung, w&#228;hrend Fortgeschrittene Tipps zur Umgehung technischer H&#252;rden und zur rechtlichen Einordnung bekommen. Teilnehmer:innen sollten wenn m&#246;glich einen Laptop mit R oder Python installiert mitbringen und entsprechende Vorkenntnisse in einer dieser Programmiersprachen w&#228;ren w&#252;nschenswert, um direkt mit dem scrapen starten zu k&#246;nnen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/Y8AGAN/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/Y8AGAN/feedback/</feedback_url>
            </event>
            <event guid='575d3ef0-f97b-5b6b-85e8-b5c0cf6d8659' id='71746' code='GTG8JT'>
                <room>Room 3 (by the kitchen)</room>
                <title>Zwischen Hinterb&#252;hne und Marktplatz. Auf der Suche nach einem Kompass f&#252;r KI-Richtlinien zum medialen Umgang mit KI.</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-05T16:30:00+02:00</date>
                <start>16:30</start>
                <duration>01:00</duration>
                <abstract>None</abstract>
                <slug>scicar25-71746-zwischen-hinterbuhne-und-marktplatz-auf-der-suche-nach-einem-kompass-fur-ki-richtlinien-zum-medialen-umgang-mit-ki</slug>
                <track></track>
                
                <persons>
                    <person id='68066'>Prof. Dr. Marlis Prinzing</person>
                </persons>
                <language>de</language>
                <description>## Thema: Justieren eines ethischen Kompasses f&#252;r KI (&amp; more)

### Leitfragen:

Wie werden **journalistische Werte** im Kontext von KI ausgehandelt? 
Welche **Konstanten** gibt es? 
Welche Punkte sind Anlass f&#252;r eine fortw&#228;hrende **Anpassung**? 
Welche **Erfahrungen** liegen vor?

In diesem Workshop mit einleitendem Impuls geht es um ethische Leitplanken und journalistische Werte im Kontext von KI und um deren Aushandlung: Was ist unerl&#228;sslich? Was kann erst Work-in-Progress sein? Wem ist Verantwortung zuzuweisen? Wof&#252;r und auf welcher Basis? Was ist aktuell der Stand, was soll sein, woran muss man insbesondere weiterarbeiten? Wo gibt es Unsicherheiten und Fehlleistungen?

### Ziel: 
Wichtig ist, dass wir **miteinander ins Gespr&#228;ch** kommen. Ein offener Erfahrungsaustausch mit einer Community aus virtuosen Anwender:innen und in Daten- und KI-Themen kundigen Menschen verspricht besonders wertvoll und gegenseitig nutzbringend zu sein. **Justieren wir gemeinsam unseren ethischen Kompass**!

### Auftaktimpuls:

#### Welche Regeln gibt es bereits, wer setzt diese? 
Der Impuls beginnt mit einem kurzen &#220;berblick zu Kernpunkten der gegenw&#228;rtigen Normensetzung auf den Ebenen Nichtregierungsorganisationen / Medienh&#228;user / Branchenselbstregulierung vor allem im deutschsprachigen Raum; hier ver&#228;ndert und bewegt sich einiges; eines der j&#252;ngsten Beispiele sind die am 17.2.2025 publizierten Richtlinien des ORF https://der.orf.at/unternehmen/leitbild-werte/ki-guidelines/index.html.

#### Wor&#252;ber wird in Medienh&#228;usern gerade nachgedacht? Ein Laborblick. 
Was denken Personen, die in Medienh&#228;usern im deutschsprachigen Raum entsprechende strategische Schl&#252;sselpositionen haben, &#252;ber die Richtlinien-Gestaltung?  
Basis sind Befunde aus 15 qualitativen Interviews mit Personen aus Medienorganisationen (&#246;ffentlich-rechtlich, privat, verschiedene Ausspielwege, Regionen; u.a. Der Spiegel, die Bild, der BR, Ringier etc.). 
Der Leitfaden aus 25 Hauptfragen adressiert Ethik und Werte, Kompetenzen, Strategie und Implementierung. 
Als Theoriezugriff wird auf Kernaspekte der journalistischen Berufsethik eingegangen, wie u.a. Richtigstellung und Transparenz. 
Letztere etwa wird neu als Wert aufgenommen. 
Andere &quot;klassische&quot; Werte wie Sorgfalt und Ausgewogenheit werden im Kontext von KI neu bewertet. 
Wieder andere Orientierungen wie das Human-in-the-loop-Prinzip, das viele Medienh&#228;user anfangs als eine Art Gew&#228;hrleistung f&#252;r Glaubw&#252;rdigkeit deklariert haben, m&#252;ssen, so mehrere Einsch&#228;tzungen, modifiziert werden. Angesichts der rasanten Ausbreitung von KI-Technik sei es mittlerweile gar nicht mehr m&#246;glich, dass jedes Wort, das irgendwo mit KI in Ber&#252;hrung kommt, von einem Menschen kontrolliert und freigegeben wird. Dies m&#252;sse in Guidelines angepasst werden. 
Eine Interviewte beschrieb einen Ethikkodex als ein &quot;living document&quot;, in dem man auch markiere, an welchen Themenaspekten man gerade arbeite.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/GTG8JT/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/GTG8JT/feedback/</feedback_url>
            </event>
            
        </room>
        
    </day>
    <day index='2' date='2025-09-06' start='2025-09-06T04:00:00+02:00' end='2025-09-07T03:59:00+02:00'>
        <room name='Saal' guid='2b533f50-53ec-5772-9a60-b7f11eb48316'>
            <event guid='40de4f7b-86fd-5bd5-9065-38f1813bd566' id='81103' code='M9NDPA'>
                <room>Saal</room>
                <title>Begr&#252;&#223;ung</title>
                <subtitle></subtitle>
                <type>Greeting</type>
                <date>2025-09-06T09:45:00+02:00</date>
                <start>09:45</start>
                <duration>00:15</duration>
                <abstract>None</abstract>
                <slug>scicar25-81103-begruung</slug>
                <track></track>
                
                <persons>
                    <person id='82564'>Anna Behrend</person><person id='68124'>Prof. Holger Wormer</person>
                </persons>
                <language>de</language>
                <description>Begr&#252;&#223;ung zum zweiten Tag der SciCAR 2025</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/M9NDPA/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/M9NDPA/feedback/</feedback_url>
            </event>
            <event guid='3ceeacb0-1189-50d9-9666-505fcbb96765' id='78130' code='3N8GH3'>
                <room>Saal</room>
                <title>Data Stories of Migration: What&apos;s left behind and what gets recorded</title>
                <subtitle></subtitle>
                <type>Other format</type>
                <date>2025-09-06T10:00:00+02:00</date>
                <start>10:00</start>
                <duration>00:45</duration>
                <abstract>None</abstract>
                <slug>scicar25-78130-data-stories-of-migration-what-s-left-behind-and-what-gets-recorded</slug>
                <track></track>
                
                <persons>
                    <person id='79192'>Ida Reihani</person>
                </persons>
                <language>en</language>
                <description>In the space between journalism and science communication, stories of migration are shaped not just by what happens, but by what gets counted, coded, or ignored. Drawing on her experience as an investigative journalist and current work on a migration docuseries, as well as her role as the science communication officer for the Algorithmic Fairness for Asylum Seekers and Refugees (AFAR) project, Ida Reihani explores how data-driven systems influence public narratives and policy decisions. From algorithmic forecasts to empty data fields, she traces how the drive for clarity can sometimes obscure the full picture and how absence, too, can be a powerful part of the story. This keynote invites journalists and researchers to become co-storytellers, not just of facts, but of what they mean.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/3N8GH3/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/3N8GH3/feedback/</feedback_url>
            </event>
            <event guid='28d3d523-6b83-559a-aae2-3fef166dc4bf' id='67279' code='7CD3GA'>
                <room>Saal</room>
                <title>Boost your Health Reporting: Wie wir mit Hilfe von KI die Qualit&#228;t des Medizinjournalismus verbessern k&#246;nnen</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-06T11:00:00+02:00</date>
                <start>11:00</start>
                <duration>00:35</duration>
                <abstract>None</abstract>
                <slug>scicar25-67279-boost-your-health-reporting-wie-wir-mit-hilfe-von-ki-die-qualitat-des-medizinjournalismus-verbessern-konnen</slug>
                <track></track>
                
                <persons>
                    <person id='80605'>Tobias Schmidt</person>
                </persons>
                <language>de</language>
                <description>Im Rahmen der SciCAR m&#246;chten wir unser Projekt &#8222;Medien-Doktor Assistance&#8220; vorstellen &#8211; eine App, mit deren Hilfe Journalist*innen die Qualit&#228;t medizinjournalistischer Beitr&#228;ge nach den bew&#228;hrten Medien-Doktor-Qualit&#228;tskriterien automatisiert pr&#252;fen k&#246;nnen.
Die App soll Redaktionen dabei unterst&#252;tzen, Schwachstellen in medizinjournalistischen Artikeln aufzusp&#252;ren und so die Qualit&#228;t journalistischer Inhalte zu verbessern.
Bei der Entwicklung und Testung der App haben wir eng mit den Wissen-Ressorts von NDR Info und Tagesschau sowie mit der N&#252;rnberger Zeitung zusammengearbeitet; mit dem Tagesspiegel und der Apotheken Umschau sind weitere Kooperationen in Planung.

Im Vortrag geben wir Einblicke in die App und ihre methodische Grundlage. Dabei stellen wir zwei zentrale Modelltypen vor:

- einen Random-Forest-Klassifikator, der speziell f&#252;r diesen Zweck auf 240 Trainingsbeispielen entwickelt und trainiert wurde, sowie
- drei fein&#173;getunte Large Language Models (LLM), die wir auf eine Reihe von Mediendoktor-Qualit&#228;tsgutachten trainiert haben, sodass sie detaillierte Qualit&#228;tsberichte im Stil menschlicher Gutachten erzeugen k&#246;nnen.

Unsere Evaluation zeigt, dass beide Ans&#228;tze in verschiedenen Tests eine verl&#228;ssliche &#220;bereinstimmung mit den Bewertungen erfahrener Medien-Doktor-Gutachter:innen erreichen. Besonders die fein&#173;getunten LLMs konnten dabei in mehreren Kriterien an die Leistung menschlicher Expertinnen heranreichen oder diese sogar &#252;bertreffen.
Die Medien-Doktor-Assistance-App ist ein gemeinsames Projekt der Lehrst&#252;hle f&#252;r Wissenschaftsjournalismus und Wirtschaftspolitischen Journalismus sowie der Fakult&#228;t Statistik an der TU Dortmund.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/7CD3GA/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/7CD3GA/feedback/</feedback_url>
            </event>
            <event guid='fbb48515-9b45-52fc-8f07-1f5ad7c9d040' id='67107' code='KBCLQX'>
                <room>Saal</room>
                <title>Bewertung der Datenqualit&#228;t von Online-Umfragen: Eine explorative Untersuchung der Potenziale von Large-Language Models zur Detektion von unzureichendem Antwortaufwand</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-06T11:40:00+02:00</date>
                <start>11:40</start>
                <duration>00:35</duration>
                <abstract>None</abstract>
                <slug>scicar25-67107-bewertung-der-datenqualitat-von-online-umfragen-eine-explorative-untersuchung-der-potenziale-von-large-language-models-zur-detektion-von-unzureichendem-antwortaufwand</slug>
                <track></track>
                
                <persons>
                    <person id='67772'>Nick von Felten</person><person id='67775'>Prof. Dr. Johannes Sch&#246;ning</person>
                </persons>
                <language>de</language>
                <description>## Einf&#252;hrung
Online-Umfragen sind in der empirischen Forschung als Instrument zur Datenerhebung weit verbreitet. Um Teilnehmer f&#252;r Online-Umfragen zu erreichen, gewinnen Crowdsourcing-Plattformen wie Amazon Mechanical Turk oder Prolific zunehmend an Bedeutung. Solche Plattformen erm&#246;glichen eine schnelle Datenerhebung und den Zugang zu oft diverseren Stichproben als herk&#246;mmliche Rekrutierungsmethoden. Es besteht jedoch die Gefahr, dass Teilnehmende haupts&#228;chlich aus &#228;usseren Anreizen wie beispielsweise der Verg&#252;tung teilnehmen und die Fragen daher unachtsam beantworten. Dieses als &#8222;Insufficient Effort Responding&#8220; (IER) bekannte Ph&#228;nomen kann die Untersuchungsergebnisse erheblich verzerren.

## Erkennung und Kontrolle von Insufficient Effort Responding
Zur Erkennung und Kontrolle von IER wurden verschiedene Ans&#228;tze entwickelt. Beispielsweise testen instruierte Antworten, ob Teilnehmende Anweisungen befolgen, w&#228;hrend statistische Verfahren Unstimmigkeiten in Antwortmustern aufdecken. Letztere erfordern jedoch h&#228;ufig komplexe Analysen oder spezifische Datenvoraussetzungen. Besonders herausfordernd ist die &#220;berpr&#252;fung offener Antworten, da diese meist manuell beurteilt werden m&#252;ssen und stark vom jeweiligen Kontext abh&#228;ngen, was besonders bei gr&#246;sseren Stichproben erheblichen Aufwand bedeutet. Large Language Models (LLMs) k&#246;nnen dabei unterst&#252;tzen, doch ihre Zuverl&#228;ssigkeit bei der Erkennung von IER ist noch unklar.

## Ziel des Workshops  
In diesem Workshop werden wir gemeinsam mit den Teilnehmenden explorieren, inwieweit sich LLMs zur Identifikation von IER eignen. Anhand &#246;ffentlich zug&#228;nglicher Datens&#228;tze sowie gr&#246;sseren Datens&#228;tze aus unserer eigenen Forschung wollen wir gemeinsam erarbeiten, wie gut LLMs im Vergleich zu menschlichen Einsch&#228;tzungen und statistischen Kennwerten abschneiden.

## Ablauf
1. **Einf&#252;hrung**:  Der Workshop beginnt mit einer kurzen Einf&#252;hrung in die Thematik der Datenqualit&#228;t in Online-Untersuchungen und den Herausforderungen von IER. Wir stellen g&#228;ngige Techniken vor, beleuchten deren Vor- und Nachteile und entwickeln gemeinsam erste Hypothesen zu den Potenzialen und Schw&#228;chen von LLMs in diesen Aufgaben. 
2. **Praktische &#220;bung**:  Anschliessend erhalten die Teilnehmenden einen Datensatz mit offenen Antworten aus einer fr&#252;heren Studie, die bereits manuell bewertet wurden. In Gruppenarbeit erfolgt zun&#228;chst eine eigene Bewertung, die als zus&#228;tzliche Baseline dient. Im Anschluss vergleichen wir die aktuellen Einsch&#228;tzungen mit fr&#252;heren Ergebnissen, den Bewertungen eines LLMs und statistischen Kennzahlen. Ziel ist es, systematische &#220;bereinstimmungen oder Abweichungen herauszuarbeiten.

3. **Reflexion und Diskussion**:  Abschliessend folgt eine gemeinsame Reflexion dar&#252;ber, unter welchen Bedingungen LLMs eine sinnvolle Erg&#228;nzung oder gar Alternative zu etablierten Verfahren darstellen k&#246;nnten, wie sich m&#246;gliche Fehler systematisch erkl&#228;ren lassen und welche Prompt-Strategien zu besseren Ergebnissen f&#252;hren k&#246;nnten.

Mit diesem Workshop m&#246;chten wir praxisnah ermitteln, ob und unter welchen Bedingungen LLMs die Identifikation von IER sinnvoll unterst&#252;tzen k&#246;nnen. Dabei werden systematisch St&#228;rken, Schw&#228;chen und Optimierungsm&#246;glichkeiten herausgearbeitet.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/KBCLQX/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/KBCLQX/feedback/</feedback_url>
            </event>
            <event guid='8c44105b-ed1c-5653-b33e-e3a981d461b5' id='66857' code='U9BAVK'>
                <room>Saal</room>
                <title>Electify: Mit KI W&#228;hler:innen helfen, sich vor der Europa- und Bundestagswahl zu informieren</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-06T12:30:00+02:00</date>
                <start>12:30</start>
                <duration>00:35</duration>
                <abstract>None</abstract>
                <slug>scicar25-66857-electify-mit-ki-wahler-innen-helfen-sich-vor-der-europa-und-bundestagswahl-zu-informieren</slug>
                <track></track>
                
                <persons>
                    <person id='71810'>Anna Neifer</person>
                </persons>
                <language>de</language>
                <description>Wahltag. Und welche Partei soll ich w&#228;hlen? Wer sich diese Frage stellt, dem kann Electify helfen sich zu informieren. Die F&#252;lle an Wahlinformationen kann &#252;berw&#228;ltigend sein, mit Electify k&#246;nnen sich W&#228;hler:innen eine &#220;bersicht verschaffen. In einem interdisziplin&#228;ren Team aus Data Scientists hat Anna Neifer mit zwei Kollegen eine Web-App entwickelt, die Retrieval-Augmented Generation (RAG) und ein Large Language Model (LLM) nutzt. Mithilfe dieser Architektur werden politische Dokumente schnell zusammengefasst. Nutzer:innen geben ihre Frage in der Web-App ein und erhalten pr&#228;gnante Zusammenfassungen von jeweils sechs Parteipositionen, die sich miteinander vergleichen lassen. 
In ihrem Vortrag gew&#228;hrt Anna Neifer einen Blick hinter die Kulissen von Electify. Anna Neifer erl&#228;utert die technische Architektur, die zentralen Herausforderungen w&#228;hrend der Entwicklung, Nutzererfahrungen und was das Team von Electify beim n&#228;chsten Mal anders machen w&#252;rde.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/U9BAVK/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/U9BAVK/feedback/</feedback_url>
            </event>
            <event guid='eca90ff6-d0d6-5a34-9385-268d3c1f4d6f' id='67322' code='TY7EYK'>
                <room>Saal</room>
                <title>Von analog zu digital &#8211; wie wir aus Ski-Atlanten einen Datensatz gemacht haben</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-06T13:10:00+02:00</date>
                <start>13:10</start>
                <duration>00:35</duration>
                <abstract>None</abstract>
                <slug>scicar25-67322-von-analog-zu-digital-wie-wir-aus-ski-atlanten-einen-datensatz-gemacht-haben</slug>
                <track></track>
                
                <persons>
                    <person id='67931'>Constanze Bayer</person><person id='67982'>Julia Barthel</person>
                </persons>
                <language>de</language>
                <description>Ausdrucke aus IFG-Anfragen, alte B&#252;cher oder PDFs ohne Texterkennungs-Overlay  &#8211; immer wieder liegen wertvolle Daten gleichzeitig offen, sind aber trotzdem maschinell nicht nutzbar. Sie m&#252;ssen also aufbereitet werden: Von gedrucktem Papier &#252;ber digitale Scans bis zum aufger&#228;umten Datensatz ist es ein weiter Weg. 

Verschiedene Tools k&#246;nnen helfen, diese Datensch&#228;tze zu heben. Welche das sind, wie sie funktionieren und wo die Grenzen liegen, haben wir im Rahmen unserer Recherche zur Industrialisierung von Skigebieten ausprobiert. Daf&#252;r mussten wir Daten aus Ski-Atlanten, also stapelweise Papier in dicken B&#252;chern, aus dem Archiv des ADAC in immer wieder anderen Layouts seit den 1980er Jahren extrahieren und am Ende in eine Tabelle &#252;berf&#252;hren.

In der Session stellen wir den Arbeitsprozess von den analogen Daten bis zur digitalen Analyse vor, was wir &#252;ber Werkzeuge und Arbeitsabl&#228;ufe gelernt haben: Wann lohnen sich kommerzielle Scan-Firmen? Was sind gute (KI-)Werkzeuge f&#252;r die Texterkennung und Textextraktion? Wo ist tats&#228;chlich Handarbeit gefragt? Und wie h&#228;lt man das alles zusammen?

**Crossmediale Ausspielung der Geschichte:**

* Online-Text: https://www.br.de/nachrichten/bayern/hoeher-schneller-kuenstlicher-skigebiete-und-die-klimakrise,UeV4AjQ 
* Interview-Podcast: https://www.ardaudiothek.de/sendung/11km-der-tagesschau-podcast/12200383/ 
* Hintergrund-Podcast: https://www.ardaudiothek.de/episode/der-funkstreifzug/hightech-und-klimakrise-wie-skigebiete-in-bayern-und-oesterreich-um-ihre-zukunft-kaempfen/br24/14241015/ 
* Fernsehen: https://www.ardmediathek.de/video/kontrovers/was-unterscheidet-bayern-von-oesterreich/br/Y3JpZDovL2JyLmRlL2Jyb2FkY2FzdC9GMjAyNFdPMDE1NjEwQTAvc2VjdGlvbi8zYWVkNjY0Yi00ZWFkLTQyZTMtYjBjZC00MGI3NDZhMGNhMTI</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/TY7EYK/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/TY7EYK/feedback/</feedback_url>
            </event>
            
        </room>
        <room name='Room 1 (Upstairs)' guid='391abb75-7a1f-5335-bc5d-6927842a5237'>
            <event guid='ef245342-6b8f-5495-9a62-5c20accda9ca' id='67278' code='BQTKTW'>
                <room>Room 1 (Upstairs)</room>
                <title>Bewegte Daten &#8211; Best und Worst Practice f&#252;r Datenvisualisierung im Video</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-06T11:00:00+02:00</date>
                <start>11:00</start>
                <duration>01:15</duration>
                <abstract>None</abstract>
                <slug>scicar25-67278-bewegte-daten-best-und-worst-practice-fur-datenvisualisierung-im-video</slug>
                <track></track>
                
                <persons>
                    <person id='67931'>Constanze Bayer</person><person id='67932'>Dr. Francesca Morini</person>
                </persons>
                <language>de</language>
                <description>Datenvisualisierungen im Online- und Print-Bereich haben sich in den letzten Jahren professionalisiert: Standards und Best-Practice-Beispiele sind etabliert und werden weithin genutzt. Im Bereich Bewegtbild ist das anders: Entweder werden statistische Grafiken erl&#228;utert (Wahlen) oder kurze Animationssequenzen in zB klassischen Magazinsendungen verwendet. Dass Daten und ihre Darstellung die Hauptlast des Storytellings tragen, ist in Videos die absolute Ausnahme, egal ob im linearen Fernsehen oder in Social Media.  

Wir haben Beispiele gesammelt und Ideen f&#252;r Strategien gesammelt, wie Daten auch im Video besser zur Geltung kommen. Diese Erkenntnisse wollen wir teilen: Was sind Best Practices f&#252;r Daten im Film? Welche Standards aus interaktiven Grafiken lassen sich &#252;bertragen? Was ist im Film anders als im Netz? 

Unser Ziel ist es, den Teilnehmenden Ideen f&#252;r Datenvideos und Einblicke in die besonderen Vorteile und H&#252;rden beim Gestalten von Filmen und Videos zu geben, aber ihnen auch zu vermitteln, dass sich der Aufwand lohnen kann, um neue Zielgruppen f&#252;r aufwendige Daten-Recherchen zu gewinnen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/BQTKTW/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/BQTKTW/feedback/</feedback_url>
            </event>
            <event guid='d972b555-b5b2-5a6a-9a73-02c2e1266f69' id='67386' code='H8XGEB'>
                <room>Room 1 (Upstairs)</room>
                <title>Investigative journalism with satellite images: a beginner&apos;s guide to Google Earth Engine</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-06T12:30:00+02:00</date>
                <start>12:30</start>
                <duration>01:15</duration>
                <abstract>None</abstract>
                <slug>scicar25-67386-investigative-journalism-with-satellite-images-a-beginner-s-guide-to-google-earth-engine</slug>
                <track></track>
                
                <persons>
                    <person id='68033'>Eva Richter</person>
                </persons>
                <language>en</language>
                <description>**Have you ever found yourself wanting to use satellite imagery in your investigation but unsure where to start without relying on expensive subscription services?**
 
Satellite images can help journalists investigate what is happening at a location at different points in time. Or they uncover hidden changes in the environment by capturing light waves not visible to the human eye. These techniques are applicable to a wide range of environmental investigations and OSINT tasks.
 
Google Earth Engine is an open-access, cloud-based platform for analyzing and visualizing satellite imagery and a wide range of geospatial datasets. It allows users to monitor environmental changes and run large-scale analyses without needing powerful local computers.
 
This workshop will cover:
 
- How to set up Google Earth Engine (GEE)
- Getting started with the GEE code editor and using built-in datasets
- Accessing and viewing free satellite images from Landsat and Sentinel-2 missions
- Understanding the basics of multispectral imaging and using false-color images to see more
 
This session is suitable for remote sensing beginners, but a basic familiarity with any programming language is a prerequisite.
 
Note: you will get the most out of this workshop if you register your Google Account for Earth Engine access ahead of the workshop - it is free but takes a few days to be approved. You will still be able to participate in this workshop either way: [Register for Google Earth Engine](https://console.cloud.google.com/earth-engine/configuration/register?inv=1&amp;invt=AbzORg&amp;project=gleaming-glass-298416)</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/H8XGEB/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/H8XGEB/feedback/</feedback_url>
            </event>
            
        </room>
        <room name='Room 2 (ground level)' guid='6c097fd5-0f0f-5578-9577-da61853414d5'>
            <event guid='5f58c71c-a2ba-5ec7-8264-1468616ef0ee' id='66390' code='HXKLMQ'>
                <room>Room 2 (ground level)</room>
                <title>Recherche in (ganz unterschiedlichen) Datenleaks</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-06T11:00:00+02:00</date>
                <start>11:00</start>
                <duration>00:35</duration>
                <abstract>None</abstract>
                <slug>scicar25-66390-recherche-in-ganz-unterschiedlichen-datenleaks</slug>
                <track></track>
                
                <persons>
                    <person id='67111'>Sophia Baumann</person>
                </persons>
                <language>de</language>
                <description>Geleakte Daten sind immer wieder ein wichtiger Ausgangspunkt f&#252;r Recherchen. Sie erm&#246;glichen oft Einblicke in sonst verschlossene Welten &#8211; und nicht selten setzt ein Whistleblower viel aufs Spiel, um Informationen von &#246;ffentlichem Interesse mit den Rechercheuren zu teilen. Doch wie findet man sich in den internen Unterlagen eines fremden Unternehmens zurecht, wie in den geheimen Dokumenten von Hackern, wie in Audioaufnahmen von Telefonaten mutma&#223;licher Betr&#252;ger:innen?

Die Beispiele zeigen schon: Es gibt sehr unterschiedliche Arten von Datenleaks. Manche bestehen aus unstrukturierten Daten, andere sind sehr strukturiert. Viele basieren haupts&#228;chlich auf schriftlichen Dokumenten, einige aber auf Audio- oder Videoaufnahmen. Die einen sind in einer einzigen Sprache gehalten, andere in vielen verschiedenen Sprachen und Schriften.

Und doch haben sich in der Praxis einige Leitlinien etabliert, die f&#252;r fast alle Recherchen in Datenleaks gelten &#8211; und sehr hilfreich sein k&#246;nnen.

Zum Beispiel sollten Leaks vor dem eigentlichen Suchen sorgf&#228;ltig vorbereitet werden, indem man sie in eine einheitliche Sprache &#252;bersetzt und durchsuchbar macht. Dar&#252;ber hinaus ist es empfehlenswert, sich zu Beginn einen &#220;berblick &#252;ber die Struktur der Daten zu verschaffen, das kann die sp&#228;tere Suche nach vielversprechenden Recherchestr&#228;ngen enorm erleichtern. Wertvolle Tipps gibt es auch zum Suchen mit Operatoren und Schlagwortlisten. Und selbst dann, wenn man ein vielversprechendes Ergebnis entdeckt hat, steht man immer wieder vor derselben Herausforderung: Entweder, es gibt viel zu viele Treffer im Leak &#8211; oder aber viel zu wenige. F&#252;r den Umgang mit beiden Extremen haben sich aber in der Praxis hilfreiche Strategien etabliert.

Ziel dieser Pr&#228;sentation ist, eine praxisnahe Anleitung zur Recherche in Datenleaks an die Hand zu geben. Der Vortrag richtet sich an eine breite Zielgruppe, weshalb die allgemeinen Strategien anhand von Beispielen ganz unterschiedlicher Datenleaks erkl&#228;rt werden sollen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/HXKLMQ/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/HXKLMQ/feedback/</feedback_url>
            </event>
            <event guid='2630a72f-426d-5f51-b7d9-517f6d447e99' id='67306' code='MYJKSN'>
                <room>Room 2 (ground level)</room>
                <title>Werkstattbericht &#8211; Investigative Recherche trifft auf IT-Experiment</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-06T11:40:00+02:00</date>
                <start>11:40</start>
                <duration>00:35</duration>
                <abstract>None</abstract>
                <slug>scicar25-67306-werkstattbericht-investigative-recherche-trifft-auf-it-experiment</slug>
                <track></track>
                
                <persons>
                    <person id='67964'>Caroline Uhl</person><person id='68378'>Katharina Bogad</person><person id='72075'>Andreas Korb</person>
                </persons>
                <language>de</language>
                <description>Wie funktioniert Zusammenarbeit von Investigativ-Reporter:innen und Wissenschaftler:innen? Was kann dabei herauskommen? Der Werkstattbericht von Journalist:innen des Saarl&#228;ndischen Rundfunks (SR) und Forschenden des Fraunhofer-Instituts f&#252;r Angewandte und Integrierte Sicherheit (AISEC) stellt eine solche Zusammenarbeit vor &#8211; von Vorbereitung und Methodenfindung eines gemeinsamen Recherche-Experiments, &#252;ber Durchf&#252;hrung bis hin zu den Ergebnissen. 

Gemeinsam lie&#223;en Reporter:innen und Forschende einen fragw&#252;rdigen IT-Dienstleister auffliegen. Sie konnten zeigen, wie der Anbieter offenbar seine Privatkunden t&#228;uschte &#8211; w&#228;hrend er gleichzeitig als externer Dienstleister f&#252;r Strafverfolgungsbeh&#246;rden aus ganz Deutschland und dem Ausland aktiv war. 

F&#252;r ein eigens daf&#252;r aufgesetztes Recherche-Experiment hatten die AISEC-Wissenschaftler:innen Ger&#228;te pr&#228;pariert, die die SR-Reporter:innen, als Privatkunden getarnt, bei dem Anbieter einschickten. Die Fehlerbilder der pr&#228;parierten Ger&#228;te variierten von kleineren, h&#228;ufig vorkommenden mechanischen Defekten bis hin zum bewusst herbeigef&#252;hrten Totalschaden. 

Dar&#252;ber hinaus hatten die Forschenden die Ger&#228;te mit versteckten Features versehen. Bei einem Ger&#228;t kam beispielsweise ein Streifen eines Negativ-Films f&#252;r Foto-Kameras ins Spiel. F&#252;r zwei andere hatten die Fraunhofer-Expert:innen eigens eine App programmiert und versteckt aufgespielt. Diese sendete bspw. Informationen, sobald das Ger&#228;t ausgepackt und bewegt wurde. 

Die App lieferte schlie&#223;lich entscheidende Hinweise und mit deren Hilfe konnte der Anbieter am Ende der L&#252;ge &#252;berf&#252;hrt werden. Dies kombiniert mit neuerlichen Untersuchungen an der Hardware der Ger&#228;te ergab einen umfangreichen Eindruck bzgl. der Arbeitsweise des Anbieters. 

In dem Werkstattbericht stellen die Referent:innen &#220;berlegungen, Vorgehen und Ergebnisse ihres Recherche-Experiments vor &#8211; ebenso wie H&#252;rden und Hindernisse.</description>
                <recording>
                    <license></license>
                    <optout>true</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/MYJKSN/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/MYJKSN/feedback/</feedback_url>
            </event>
            <event guid='b0e0432c-2c90-56f6-a0f7-bf588bd336b7' id='67141' code='EW8DAL'>
                <room>Room 2 (ground level)</room>
                <title>Geheimakte Gesundheitsdaten: Der Kampf um Daten der Kassen&#228;rztlichen Vereinigungen</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-06T12:30:00+02:00</date>
                <start>12:30</start>
                <duration>01:15</duration>
                <abstract>None</abstract>
                <slug>scicar25-67141-geheimakte-gesundheitsdaten-der-kampf-um-daten-der-kassenarztlichen-vereinigungen</slug>
                <track></track>
                
                <persons>
                    <person id='67810'>Katharina Forstmair</person><person id='67811'>Stephanie Jauss</person>
                </persons>
                <language>de</language>
                <description>Eine Recherche des SWR Data Lab macht deutlich, wie intransparent das deutsche Gesundheitssystem f&#252;r Datenjournalist:innen ist. Monatelang haben wir versucht, an Daten zum 116117 Terminservice zu kommen. Dieser wird von den Kassen&#228;rztlichen Vereinigungen (KVen) organisiert, die in Deutschland f&#252;r die Sicherstellung der ambulanten Versorgung der gesetzlich Krankenversicherten zust&#228;ndig sind.
Im September 2024 haben wir die ersten Anfragen verschickt. Nachdem wir monatelang immer wieder nachgehakt, unsere Auskunftsanspr&#252;che juristisch argumentiert, Klagen angedroht und IFG-Anfragen gestellt haben, ist das Ergebnis ern&#252;chternd. Monate sp&#228;ter stehen wir mit einem Bruchteil der angefragten Daten da. Systemischen Problemen und regionalen Unterschieden in der Gesundheitsversorgung, von denen Patient:innen und Expert:innen in Hintergrundgespr&#228;chen berichten, k&#246;nnen wir damit kaum nachgehen.

Der Kampf um die Daten ist teilweise absurd. Die KVen ver&#246;ffentlichen in ihren Arztsuchen die Adressen von Arztpraxen. Fragt man nach den Rohdaten, wollen sie diese aber aus datenschutzrechtlichen Gr&#252;nden nicht herausgeben. Die Kassen&#228;rztliche Bundesvereinigung, Zusammenschluss der KVen und Betreiberin der Website des 116117-Terminservice, ver&#246;ffentlicht Berichte mit Grafiken zum Terminservice. Fragt man nach den Daten, hei&#223;t es: &#8222;Sie werden ums Abtippen leider nicht drum herum kommen.&#8220;

Auch Anfragen an die Landesministerien, die die Rechtsaufsicht &#252;ber die KVen haben, gestalten sich schwierig. Das Ministerium f&#252;r Soziales und Integration BW bittet mehrfach um R&#252;ckzug unseres IFG-Antrags zu seiner Kommunikation mit der KV BW. In RLP verweist man auf ein Drittbeteiligungsverfahren &#8211; man brauche erst die Zustimmung der KV RLP. Die Ministerien verweisen darauf, nur eine Rechtsaufsicht, keine Fachaufsicht &#252;ber die KVen zu haben. Es scheint als k&#246;nnten die KVen tun was sie wollen.

Wir wollen Erfahrungen wie diese mit euch teilen und eure Geschichten h&#246;ren: Welche H&#252;rden habt ihr beim Arbeiten mit Gesundheitsdaten erlebt? Wir wollen &#252;berlegen und diskutieren, wie wir uns gegenseitig unterst&#252;tzen und die M&#246;glichkeiten des Presserechts und der Informationsfreiheitsgesetze besser nutzen k&#246;nnen.</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/EW8DAL/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/EW8DAL/feedback/</feedback_url>
            </event>
            
        </room>
        <room name='Room 3 (by the kitchen)' guid='471c9d74-30db-5dfd-9670-12d26c331324'>
            <event guid='fc28b2e4-a7c8-5e4b-9854-bc14e534e069' id='67230' code='CRWTBS'>
                <room>Room 3 (by the kitchen)</room>
                <title>Datenbanken der amtlichen Statistik - Aktuelle Neuerungen</title>
                <subtitle></subtitle>
                <type>Lecture/Presentation</type>
                <date>2025-09-06T11:00:00+02:00</date>
                <start>11:00</start>
                <duration>01:15</duration>
                <abstract>None</abstract>
                <slug>scicar25-67230-datenbanken-der-amtlichen-statistik-aktuelle-neuerungen</slug>
                <track></track>
                
                <persons>
                    <person id='67883'>Michael Neutze</person>
                </persons>
                <language>de</language>
                <description>Die drei gro&#223;en Datenbanken der Statistischen Landes&#228;mter und des Statistischen Bundesamtes, Regionaldatenbank, Zensusdatenbank und Genesis-Online basieren auf derselben Technologie und haben in j&#252;ngster Vergangenheit umfangreiche Neuerungen erfahren. 

Wir berichten &#252;ber die Inhalte der abschlie&#223;end bef&#252;llten Zensusdatenbank, den Stand des Umstiegs auf die neue Nutzungsoberfl&#228;che von Genesis-Online als auch aktuelle &#196;nderungen bei der API im Sommer 2025.  

Die Inhalte werden anhand von funktionsf&#228;higem Programmcode zur automatisierten Nutzung vorgestellt. Ebenfalls wird auf die Statistikpakete R und Python eingegangen.  
https://github.com/StatistischesBundesamt/GENESIS-Online</description>
                <recording>
                    <license></license>
                    <optout>false</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/CRWTBS/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/CRWTBS/feedback/</feedback_url>
            </event>
            <event guid='bc0ee858-58c1-5e76-8d27-f5c3b39721eb' id='78407' code='7VJ7XJ'>
                <room>Room 3 (by the kitchen)</room>
                <title>AI Support for Investigative Reporting: How Can AI Support the Data Workflows of Investigative Journalists?</title>
                <subtitle></subtitle>
                <type>Workshop</type>
                <date>2025-09-06T12:30:00+02:00</date>
                <start>12:30</start>
                <duration>01:15</duration>
                <abstract>None</abstract>
                <slug>scicar25-78407-ai-support-for-investigative-reporting-how-can-ai-support-the-data-workflows-of-investigative-journalists</slug>
                <track></track>
                
                <persons>
                    <person id='79519'>Besjon Cifliku</person>
                </persons>
                <language>en</language>
                <description>AI-powered tools can quickly process enormous amounts of data. They can mine relations and find patterns that humans might miss. However, they are black boxes, which makes it challenging to apply them in a trustworthy manner and to ensure accurate reporting with high source transparency. Our vision as Human-Computer Interaction and AI scholars is to empower journalists and to give them more control over automation. In this interactive workshop, we will present practical use cases where AI and automation could support investigative reporters and underline the challenges journalists must keep an eye on. We want to equip reporters with more structure to automate certain aspects of their investigations. For this, we combine Programming-by-Demonstration (PbD) with the power of large language models. PbD enables end users to automate tasks without programming experience and makes the underlying automation processes transparent.  We report our findings on potential applications in journalists&apos; workflows and the practical utility of such automation tools based on in-depth interviews with investigative and data journalists. We further explain how to adapt these automation systems to the way journalists work. 

In this interactive workshop, we invite participants to collaborate with us to conceptualize, design, and shape the features of an automated system created by journalists for journalists.</description>
                <recording>
                    <license></license>
                    <optout>true</optout>
                </recording>
                <links></links>
                <attachments></attachments>

                <url>https://25.scicar.de/scicar25/talk/7VJ7XJ/</url>
                <feedback_url>https://25.scicar.de/scicar25/talk/7VJ7XJ/feedback/</feedback_url>
            </event>
            
        </room>
        
    </day>
    
</schedule>
