Automatisierte Methoden zur Analyse politischen Verhaltens im Fokus
News vom 24.11.2025
Am 31.Oktober 2025 fand der Workshop „Text-as-Data, KI und multimodale Ansätze: Automatisierte Methoden zur Erforschung politischen Verhaltens“ an der FU Berlin statt. Der Workshop war Teil des Forschungsprojekts „Reusing qualitative data for automated text analysis. A dictionary for federalism research”, das von Sabine Kropp, Antonios Souris (beide FU Berlin) und Jan Schwalbach (GESIS) geleitet und von der VolkswagenStiftung gefördert wurde. Ziel des Workshops war es, Wissenschaftlerinnen und Wissenschaftler zusammen zu bringen, die mit automatisierten Methoden politisches Verhalten erforschen und dabei unterschiedliche Datenquellen und Analyseansätze nutzen.
Im ersten Panel lag ein besonderer Fokus auf Dictionary-basierten Ansätzen zur automatisierten Analyse politischer Texte: Sabine Kropp und Antonios Souris stellten das neue Föderalismus-Dictionary vor, das in ihrem Projekt erstellt worden ist. Das Dictionary basiert auf einer Datensammlung, die durch eine qualitative Inhaltsanalyse von Parlamentsdebatten im Forschungsprojekt „COVFED“ entstanden ist. In Kombination mit „StateParl“ konnte ein Wörterbuch entwickelt und validiert werden, das die sprachlichen Bezüge zur föderalen Arena Deutschlands und ihren Institutionen und Akteuren umfasst. Erste empirische Analysen zeigen bereits den großen Mehrwert dieses neuen Instruments, um parteipolitische Diskurse und Strategien im föderalen Mehrebenensystem besser zu verstehen. Im Anschluss diskutierte Lea Kaftan (GESIS) in ihrem Vortrag „Optimized Dictionaries: A Semi-Automated Workflow of Concept Identification in Text-Data“ die Vor- und Nachteile von Dictionaries im Vergleich zu Machine-Learning oder Large-Language-Modellen. Die besonderen Vorteile von Dictionaries gegenüber anderen Methoden, so ihr Argument, ergeben sich vor allem aus ihrer Replizierbarkeit, ihrer Transparenz und den im Vergleich geringeren Ressourceneinsatz bei ihrer Anwendung.
Im zweiten Panel stellten Bruno Castanho Silva (FU Berlin) und Hauke Licht (Universität Innsbruck) in ihren jeweiligen Vorträgen, „Talkin‘ ‚Bout my Generation: Age-Based Representation in Parliament“ sowie „Detecting Group Mentions in Political Rhetoric: A Supervised Learning Approach“, Machine-Learning Verfahren zur automatisierten Textanalyse vor. Thematisch konzentrierten sich der erste Beitrag auf die deskriptive und substantielle Repräsentation unterschiedlicher Alterskohorten in Parlamenten. Der zweite Beitrag stellte einen neu entwickelten Ansatz vor, um die Erwähnungen sozialer Gruppen in politischen Texten automatisiert zu erkennen und zu extrahieren.
Im dritten Panel ging es darum, wie politische Textkorpora erstellt und kuratiert werden können, sowie um die langfristige Sicherung von Dateninfrastrukturen. Jan Schwalbach und Christian Rauh (Universität Potsdam und WZB) stellten den Korpus „ParlLawSpeech“ vor, eine Sammlung von Parlamentsreden, Gesetzen und Gesetzesentwürfen aus sieben europäischen Staaten und dem europäischen Parlament. Danach präsentierte Andreas Blätte (Universität Duisburg-Essen) den Korpus „GermaParl“, der die Plenardebatten des Deutschen Bundestags seit 1949 umfasst. Im Kontext der beiden Vorträge wurden wichtige Fragen diskutiert, u.a. wie Beziehungen mit den jeweiligen Parlamenten, beispielsweise dem Archiv des Deutschen Bundestags, aufgebaut, welche Infrastruktur für die Sicherung und Bereitstellung der Textkorpora benötigt und wie diese bereitgestellt werden können.
Die Vorträge im letzten Panel von Peter Kompiel (Universitätsbibliothek der FU Berlin) und Rebecca Kittel (FU Berlin und WZB) erweiterten den Workshop durch multimodale und interdisziplinäre Perspektiven. Rebecca Kittel stellte Ergebnisse aus dem ERC- Projekt „LOOPS: The Logistics of Protest Camps“ vor. Durch die Analyse von Bildern auf Twitter – im Vortrag präsentiert anhand des „Umbrella Movements“ 2014 in Hongkong – lassen sich demnach Rückschlüsse auf die Professionalisierung von Protestcamps und die Beteiligung von marginalisierten Gruppen an Protesten in Autokratien gewinnen. Peter Kompiel präsentierte das Projekt „Oral-History.Digital“ , im Rahmen dessen ein Portal zur Erschließung und Recherche in wissenschaftlichen Sammlungen von audiovisuell aufgezeichneten narrativen Interviews erstellt wurde. Das Portal beinhaltet dabei eine breite Sammlung an audiovisuellen Quellen. Besonders die automatischen Transkriptionen und die aus ethischen oder datenschutzrechtlichen anonymisierten Versionen der Interviews zeigen neue Möglichkeiten auf, Quellen zu erschließen und einer breiten (Forschungs-)Öffentlichkeit zur Verfügung zu stellen.
In der Abschlussdiskussion In der Abschlussdiskussion wurden insbesondere folgende Punkte deutlich:
- die zunehmende Bedeutung von interdisziplinärem Austausch, um sich über Grenzen der eigenen Wissenschaftscommunity bzw. auch die Grenzen von wissenschaftlichen Institutionen hinweg zu vernetzen und neue methodische wie theoretische Ansätze kennenzulernen;
- die Entwicklung neuer Forschungsfragen und -perspektiven, die erst durch die methodischen Fortschritte in der Textanalyse durch die Nutzung von Large-Language-Modellen und die Weiterentwicklungen von Mixed-Methods-Ansätzen wie Dictionaries und Machine-Learning bearbeitbar werden;
- die Erweiterung von Text-as-Data um weitere Datenarten, also Videos, Fotos und Audios; Fragen nach der Dateninfrastruktur, dem ethisch verantwortungsvollen Umgang mit den Daten, der Auffindbarkeit und dem Verschwinden von Daten gewinnen erheblich an Relevanz.
Schließlich wurde betont, dass die Bereitstellung von Forschungsdaten als eigenständige wissenschaftliche Leistung künftig noch stärker gewürdigt und auch finanziell unterstützt werden sollte.


