Skip to content

Crowds, sources and manipulation. Begriffshistorische Analysen der Wikipedia am Beispiel des Artikels "Populismus" zwischen 2014 und 2017.

License

Notifications You must be signed in to change notification settings

krugbuild/crowds-sources-manipulation

Repository files navigation

Crowds, sources and manipulation

Begriffshistorische Analysen mittels Wikipedia am Beispiel des Artikels "Populismus" zwischen 2014 und 2017.

DOI

zum Repositorium (Github) | zur Leseansicht (Github Pages)

Dieses Projekt ist als kommentiertes Forschungsdatenrepositorium zu verstehen, in dem Forschungsdaten, Dokumentation und Analyse im Verbund zur Verfügung gestellt werden. Es basiert auf einer Vorstudie, die im Juni und Juli 2019 im Rahmen einer Lehrveranstaltung an der Humboldt-Universität zu Berlin durchgeführt wurde.

Alexandra Krug, 27.11.2019.


Zitationsvorschlag:

Krug, Alexandra: Crowds, sources and manipulation. Begriffshistorische Analysen mittels Wikipedia am Beispiel des Artikels "Populismus" zwischen 2014 und 2017, https://github.com/krugbuild/crowds-sources-manipulation, 27.11.2019, doi:10.5281/zenodo.3784559.


Fragt man einen der weit verbreiteten virtuellen Assistenten wie Alexa, Cortana oder Siri nach einer Begriffsdefinition, dann stammt die Antwort mit hoher Wahrscheinlichkeit aus der Wikipedia.1 Ganz ähnlich verhält es sich bei der Suche nach einem beliebigen Stichwort mittels der gebräuchlichen Suchmaschinen. Der erste Treffer ist sicherlich der zugehörige Artikel in der Wikipedia, oder die Begriffsdefinition wird direkt neben den sonstigen Suchergebnissen als Seitenleiste eingeblendet. Die Bedeutung der Wikipedia als alltägliches Hilfsmittel ist wohl unbestritten - ihre Eignung als (historische) Quelle hingegen wird nur zögerlich überprüft.2 Dabei stellt uns Mediawiki, die eigentliche Software hinter Wikipedia, bereits einige hilfreiche Werkzeuge zur Auswertung bereit. Eine Kernfunktion des Mediawikis ist es, dass bei Korrekturen, Löschungen oder dem Hinzufügen neue Textabschnitte nicht einfach der bestehende Artikel überschrieben wird. Stattdessen wird für jede Änderung eine neue Version des Artikels erstellt. Dabei werden neben der eigentlichen Änderung insbesondere der Zeitpunkt der Änderung (üblicherweise als timestamp bezeichnet) und der Benutzername des Verantwortlichen gespeichert. Diese Versionsgeschichte wird zur Pflege der Wikipedia verwendet, zum Beispiel zur Erkennung von Manipulationsversuchen.3 Da diese Versionsgeschichte bei vielen Artikeln seit den frühen 2000ern anwächst und jeder Versionssprung präzise dokumentiert ist, eignet Sie sich vermutlich hervorragend als Ausgangspunkt einer begriffshistorischen Untersuchung. Den Quellenwert der Wikipedia unter diesem Gesichtspunkt am zuvor definierten Begriff Populismus zu bewerten sowie verschiedene methodische Zugänge zu prüfen ist das Kernanliegen dieses Projekts.

Quellenarbeit

Die Auseinandersetzung mit dem Quellenmaterial sowie die Exploration digitalhistorischer Methoden zum Umgang mit diesen digital born Daten verlangt nach einer feingliedrigen und detaillierten Dokumentation.4 Um den Projektverlauf dennoch möglichst nachvollziehbar zu gestalten, werden im Folgenden die verschiedenen Stufen der Quellenarbeit (die sich in der Struktur des Repositoriums widerspiegeln) kurz umrissen. Diese komprimierte Darstellung kann die eigentliche Dokumentation der Quellenarbeit nur ergänzen, keinesfalls jedoch ersetzen. Die detaillierte Dokumentation der einzelnen Abschnitte findet sich in den jeweiligen Unterordnern.

01 Aufbereitung der Quelldaten

Da die Informationen zur Versionsgeschichte zur besseren Lesbarkeit in einer HTML-Struktur eingebettet sind, müssen diese zunächst in Reinform gebracht werden. Denn nur so wird eine Weiterverarbeitung überhaupt erst möglich. Das Ergebnis dieser Datenaufbereitung ist eine Tabelle, in der alle 1045 Versionen des Lemmas Populismus zwischen dem 02. Juni 2019 und dem 04. März 2004, dem Tag der Erstellung dieses Artikels, mit Datum, verantwortlichem Benutzer, Kommentar und weiteren, technischen Details verzeichnet sind.

| zum Unterordner 01_Quelldaten |

02 Ermittlung des Referenzzeitraums

Um einen Abgleich mit dem öffentlichen Diskurs zu ermöglichen, muss ein Referenzzeitraum bestimmt werden. Der Konjunkturzyklus eines Begriffes kann zum Beispiel über die Wortverlaufskurve innerhalb eines gesellschaftlich relevanten Textkorpus nachvollzogen werden. Als Grundlage für dieses Projekt wurde der Korpus der Wochenzeitschrift DIE ZEIT gewählt, welche zu den deutschen Leitmedien gezählt wird.5

Wortverlauf_ZEIT

Dieser Verlauf vermittelt einen Eindruck der medialen Aufmerksamkeit für das Thema Populismus seit Erstellung des zugehörigen Lemmas in der Wikipedia. Zwischen 2014 und 2016/2017 zeigt sich hier ein starker Anstieg, dessen Auswirkung auf die Begriffsbestimmung im Folgenden untersucht werden soll - und somit den Referenzzeitraum definiert. Die zeitliche Parallele zur sogenannten Flüchtlingskrise ist dabei bemerkenswert.

| zum Unterordner 02_Referenzzeitraum |

03 Darstellung des Versionsverlaufs

Um die konjunkturelle Entwicklung des Lemmas mit der öffentlichen Berichterstattung vergleichen zu können, hilft es, die im 1. Abschnitt erhobenen Daten zu visualisieren. Die tabellarische Notation suggeriert möglicherweise eine zeitliche Gleichverteilung der einzelnen Versionen, weshalb diese stattdessen auf einem Zeitstrahl angeordnet dargestellt werden.

Zeitstrahl

Dieser Plot zeigt den zuvor ermittelten Referenzzeitraum. Dargestellt ist jeder einzelne Versionssprung des Lemmas durch den zugehörigen timestamp. Es lassen sich Strukturen erkennen, die als Phasen hoher bzw. niedriger Bearbeitungsfrequenz identifiziert werden können. Zu Beginn und Ende des Untersuchungszeitraumes findet sich jeweils eine Phase mit geringer Bearbeitungsfrequenz (rot markiert). Die daraus entnommenen Grenzversionen bilden die Grundlage für die folgende begriffshistorische Analyse und werden fortan als V2014 und V2017 identifiziert und als lokale Kopie vorgehalten.

| zum Unterordner 03_Versionsverlauf |

04 Referenzkollokationen

Zur Untersuchung einer möglichen Veränderung der Begriffsbedeutung orientieren wir uns erneut an einen Abgleich mit dem öffentlichen Diskurs. Hierzu werden mittels einer Kollokationsanalyse jene Begriffe ermittelt, die im Referenzzeitraum häufig in Verbindung mit dem Lemma auftreten. Die erzeugte Liste beinhaltet neben den ermittelten Kollokationen auch Informationen zu deren Frequenz und Wortart.

| zum Unterordner 04_Referenzkollokationen |

05 Abgleich der Kollokationen und Grenzversionen

Die Prüfung und Dokumentation der Verteilung der ermittelten Kollokationen in den Grenzversionen V2014 und V2017 bildet die Grundlage für die folgende Analyse. Hierzu wird für jeden Begriff dessen Häufigkeit in beiden Grenzversionen ermittelt, sowie Auffälligkeiten notiert. Das Ergebnis ist eine kommentierte Liste mit Wortverteilungen für beide Grenzversionen.

| zum Unterordner 05_Abgleich |

06 Analyse der Ergebnisse

Im letzten Schritt findet die Aus- und Bewertung der erhobenen Daten statt. Neben der Dokumentation der Begriffsänderung und öffentlichen Debatte, lassen sich dabei Rückschlüsse auf den Einfluss der medialen Berichterstattung auf das Medium Wikipedia ziehen. Anzunehmen ist dabei, dass Begriffe mit hoher Kollokationsfrequenz sich auch durch eine hohe Worthäufigkeit in den Grenzversionen wiederfinden. Das Ergebnis wird vermutlich zwischen folgenden beiden Grenzfällen eingeordnet werden müssen:

  • Eine weitgehende Übernahme der sich verändernden Kollokationen vom ZEIT-Korpus in das Lemma würde auf einen direkten Einfluss der medialen Debatte auf die allgemeingültige Begriffsdefinition in der Wikipedia hindeuten.
  • Eine ausbleibende Übernahme der Änderungen hingegen würde auf eine Trennung der beiden medialen Sphären hindeuten. In diesem Falle würde sich die Begriffsdefinition in der Wikipedia losgelöst von einer übergeordneten medialen Debatte entwickeln.

| zum Unterordner 06_Analyse |

Auswertung

In Anbetracht des ermittelten Referenzzeitraumes wäre es zu erwarten gewesen, dass der Begriff rechts einen deutlicheren Zuwachs an Einfluss erfährt. Gemäß Kollokationsanalyse spielte dieser im Vergleichskorpus vor 2017 praktisch keine Rolle, sprang dann jedoch mit einer Kollokationsfrequenz von 15 direkt ins obere Viertel der Liste. Diese mediale Aufgeregtheit findet sich in der Wikipedia jedoch nicht wieder. Dort ist die Worthäufigkeit des Begriffes im selben Maße gestiegen, wie die gesamte Textmenge - folglich ist dort keine Begriffsentwicklung hin zu einem als politisch rechts geprägten Populismus zu erkennen. Dabei ist jedoch zu beachten, dass im Rahmen dieses Projekts nur das allgemeine Lemma Populismus untersucht wurde. Das verwandte und im Artikel selbst auch referenzierte Lemma Rechtspopulismus war nicht im Fokus der Untersuchung, weshalb Entwicklungen dort dieses Ergebnis relativieren könnten. Gleichwohl fand die Ausgliederung des Lemmas Rechtspopulismus bereits 2007 statt,6 sodass dessen Existenz zumindest keine Folge der sogenannten "Flüchtlingskrise" sein kann - eine Ausweitung der untersuchten Artikel würde jedoch fraglos zu robusteren Ergebnissen führen. Ein ähnliches Muster lässt sich beim Begriff Europa erkennen. Im Vergleichskorpus tritt dieser als Kollokation zu Populismus regelmäßig mit steigender Frequenz seit 2013 auf, was jedoch zu keinem vermehrten Einfluss auf die Begriffsentwicklung im Artikel führt. Den größten Zuwachs an Einfluss kann hingegen ein im Referenzkorpus wenig behandelter Begriff verzeichnen: Volk. Von V2014 auf V2017 vervierfacht dieser seine Worthäufigkeit und findet sich schließlich an 36 Stellen im Artikel. Die Entwicklung des Artikels Populismus zwischen 2014 und 2017 ist also nicht von klassischen politischen Strömungen dominiert, sondern von Variationen des Begriffs Volk.

Die These, dass eine hohe Kollokationsfrequenz (f12) zwangsläufig eine hohe Worthäufigkeit bedingt, kann angesichts der Daten als widerlegt angesehen werden, denn viele im Referenzkorpus hochfrequent auftretende Begriffe finden sich entweder gar nicht oder mit nur geringer Häufigkeit in den Grenzversionen. Dies lässt sich an Begriffen wie Europa (f12=5-18, Häufigkeit: 4-8) oder AfD (f12=5-11, Häufigkeit 1) gut erkennen. Es ist somit festzuhalten, dass die Begriffsentwicklung in der Wikipedia im Fall des Artikels Populismus keine direkte Folge des in den Medien ausgetragenen Diskurses sein kann, sondern nur in Teilen davon beeinflusst wurde. Dies ist weiterhin auch stilistisch nachvollziehbar, da sowohl normative Begriffe, als auch Referenzen zu einzelnen Politikern und Parteien im Textkorpus des untersuchten Lemmas praktisch nicht vorkommen.

Die Signifikanz der Ergebnisse zeigt, dass auch Plattformen wie die Wikipedia unter Verwendung einer angepassten Quellenkritik durchaus als begriffshistorische Quellenkorpora in Frage kommen. Jedoch zeigen die Auffälligkeiten im Hinblick auf die Rolle des Begriffs rechts für die Begriffsentwicklung, dass die Begrenzung der Untersuchung auf einen einzelnen Artikel problematisch ist. Durch das Ausgliedern einzelner Unterabschnitte in eigene Artikel versucht die Wikipedia die Artikel selbst übersichtlich zu halten. Für begriffshistorische Analysen bedeutet das jedoch, dass Teile der Begriffsbestimmung an anderer Stelle diskutiert werden und somit nicht in die Untersuchung mit einbezogen werden können. Weiterhin ermöglicht die Betrachtung verschiedener, voneinander abhängiger Artikel zum Beispiel den Abgleich der Versionsgeschichten untereinander oder sogar die Erstellung von Netzwerkanalysen anhand der Autoren. Anstatt also den Quellenkorpus auf Artikelebene zu definieren, müsste in einer Voranalyse das zu untersuchende Netzwerk aus Artikeln (und möglicherweise weiterer Quellen) zu einem definierten Thema zusammengetragen werden.

Der vorgestellte methodische Ansatz ist abschließend trotz der experimentellen Herangehensweise als absolut praxistauglich anzusehen. Ein häufig befürchteter, unangemessen hoher Arbeitsaufwand zur Aufbereitung der Daten sowie Durchführung der einzelnen Analysen war hier nicht zu beobachten. Durch eine Teilautomatisierung könnte zudem insbesondere die Datenerhebung und -aufbereitung nochmals optimiert werden. Dies wäre insbesondere in Hinblick auf die Erweiterung des Quellenkorpus auf ein Netzwerk von Artikeln empfehlenswert. Ungewöhnlich war allenfalls der zusätzliche Aufwand zur kleinteiligen Dokumentation und Kommentierung der Zwischenergebnisse, der jedoch für folgende Projekte sicher einen Mehrwert darstellt. Weiterhin sind die gute Nachvollziehbarkeit der Auswertung sowie damit einhergehende Falsifizierbarkeit bemerkenswerte Qualitäten dieser Publikationsart.


Creative Commons Lizenzvertrag Sofern in den einzelnen Dateien nicht anders angegeben, ist dieses Werk lizenziert unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland Lizenz. Die Autorin folgt hierbei der CC BY-SA-Lizenzierung der Wikipediaartikel, welche die Quellenbasis des Projektes bilden.

Footnotes

  1. Vgl. Naughton, John: Amazon’s Echo seems great, but what does it hear?, in: The Guardian, 15.01.2017. Online: https://www.theguardian.com/commentisfree/2017/jan/15/amazon-echo-is-great-but-what-does-it-hear, Stand: 18.11.2019.

  2. Vermehrt wird die Wikipedia zum Beispiel als Quelle für digitale Diskursanalysen verwendet. Zum Beispiel in: Gredel, Eva: Digital discourse analysis and Wikipedia: Bridging the gap between Foucauldian discourse analysis and digital conversation analysis, in: Journal of Pragmatics 115, 01.07.2017, S. 99–114. Online: https://doi.org/10.1016/j.pragma.2017.02.010 ; Esteves Gonçalves da Costa, Bernardo; Cukierman, Henrique Luiz: How anthropogenic climate change prevailed: A case study of controversies around global warming on Portuguese Wikipedia, in: New Media & Society 21 (10), 10.2019, S. 2261–2282. Online: https://doi.org/10.1177/1461444819838227.

  3. Siehe z.B.: Koenigsdorff, Simon: Fall Relotius: Manipulationen im Wikipedia-Artikel, in: heise online, 11.08.2019. Online: https://www.heise.de/newsticker/meldung/Fall-Relotius-Manipulationen-im-Wikipedia-Artikel-4582927.html, Stand: 13.11.2019.

  4. Vgl. Rehbein, Malte: Geschichtsforschung im digitalen Raum. Über die Notwendigkeit der Digital Humanities als historische Grund- und Transferwissenschaft., in: Herbers, Klaus; Trenkle, Viktoria (Hg.): Papstgeschichte im digitalen Zeitalter: neue Zugangsweisen zu einer Kulturgeschichte Europas, Köln; Weimar; Wien 2018 (Beihefte zum Archiv für Kulturgeschichte BV023554989 Heft 85), S. 41f.

  5. Vgl. Weischenberg, Von Siegfried; Malik, Maja; Scholl, Armin: Journalismus in Deutschland 2005. Zentrale Befunde der aktuellen Repräsentativbefragung deutscher Journalisten, in: Media Perspektiven 7, 2006, S. 359.

  6. Vgl. „Rechtspopulismus“ – Versionsgeschichte, in: Wikipedia, Online: https://de.wikipedia.org/w/index.php?title=Rechtspopulismus&dir=prev&action=history, Stand: 21.11.2019.

About

Crowds, sources and manipulation. Begriffshistorische Analysen der Wikipedia am Beispiel des Artikels "Populismus" zwischen 2014 und 2017.

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Languages