<div class="csl-bib-body">
<div class="csl-entry">Grill, G. (2023). <i>Network analysis on the Austrian media corpus: Examining measures of co-occurrence between entities in Austrian media</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.41932</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2023.41932
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/188332
-
dc.description.abstract
The quantitative study of news media can provide insights into reporting patterns and enable public discourse. Print media is essential in democratic societies, so its study remains important. This thesis examines Austrian reporting using network-based methods and unpacks the suitability of such an approach for news analysis. We seek to contribute to scholarly debates around the benefits and risks of using such methods to make sense of reporting. We conduct a comparative analysis of six news outlets (Der Standard, Die Presse, Österreich, Die Kronen Zeitung, Kurier, Die Heute) and discuss differences in reporting during the 2016 Austrian presidential elections. This is the first research effort applying a network-based approach to the Austrian Media Corpus (AMC), a complete and unique collection encompassing the last three decades of Austrian media coverage. We use natural language processing to extract an expressive subset of named entities representing network nodes. Several entity recognition schemes are evaluated based on a set of labeled articles. An approach combining named entity linking based on a Wikidata dictionary with an open-source recognition model performed best. The networks are constructed by relating the extracted entities and certain terms when they co-occur in a sentence. We apply various algorithms to the resulting networks to rank entities according to relevance and cluster nodes to detect themes during the election. We provide several descriptive statistics on publishing patterns and the occurrence of entities in the newspapers, revealing gender bias and the presidential candidates most mentioned. Our network-based approach reveals differences in reporting compared to results based on counting mentions. However, we also point out issues of these methods, such as flexibility in parameterization and messy visualizations. We argue these challenges are a double-edged sword as, for example, flexibility may also give researchers agency to enable more exploration and qualitative interpretation.
en
dc.description.abstract
Quantitative Forschung zu Zeitungen kann Einblicke in Berichterstattungsmuster liefern und damit einen öffentlichen Diskurs ermöglichen. Printmedien sind in demokratischen Gesellschaften unverzichtbar, daher bleibt ihre Erforschung wichtig. Diese Arbeit untersucht österreichische Berichterstattung mit netzwerkbasierten Methoden und diskutiert die Eignung eines solchen Ansatzes für die Analyse von Zeitungen. Die Arbeit trägt zu wissenschaftlichen Debatten über die Vorteile und Risiken des Einsatzes solcher Methoden bei. Wir führen eine vergleichende Analyse von sechs Zeitungen durch (Der Standard, Die Presse, Österreich, Die Kronen Zeitung, Kurier, Die Heute) und diskutieren Unterschiede in der Berichterstattung während der österreichischen Präsidentschaftswahlen 2016. Dies ist die erste Forschungsarbeit die einen netzwerkbasierten Ansatz für den Austrian Media Corpus (AMC) anwendet, eine vollständige und einzigartige Sammlung, die die letzten drei Jahrzehnte österreichischer Medienberichterstattung umfasst. Wir wenden Natural Language Processing Methoden an um textliche Referenzen zu Entitäten zu erkennen und daraus, welche die Knoten in den Netzwerken darstellen. Wir evaluieren mehrere Erkennungsalgorithmen für Entitäten anhand von annotierten Artikeln. Die beste Methode war eine Kombination aus einer Erkennung basierend auf Wikidata-Einträgen und einem open-source machine learning Modell. Wir konstruieren die Netzwerke indem extrahierten Entitäten und erkannte Begriffe in Beziehung gesetzt werden, wenn sie in einem Satz gleichzeitig vorkommen. Wir wenden verschiedene Algorithmen auf die resultierenden Netzwerke an, um Entitäten nach Relevanz zu ordnen und Knoten zu gruppieren, um Themen während der Wahl zu erkennen. Wir präsentieren mehrere deskriptive Statistiken zu Veröffentlichungsmustern und dem Auftreten von Entitäten in den Zeitungen, die geschlechtsspezifische Benachteiligungen und die am häufigsten genannten Präsidentschaftskandidaten aufzeigen. Im Vergleich zu diesen Ergebnissen, zeigt unser netzwerkbasierter Ansatz andere Eigenschaften der Berichterstattung auf. Abschließend weisen wir auf Probleme netzwerkbasierender Methoden hin, wie z. B. Flexibilität bei der Parametrisierung und Unübersichtlichkeit von Netzwerkvisualisierungen. Wir argumentieren, dass diese Herausforderungen ein zweischneidiges Schwert sind, da beispielsweise Flexibilität Forschenden auch mehr Möglichkeiten geben kann für Erkundung von Daten und qualitative Interpretation.
de
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
network analysis
de
dc.subject
big data
de
dc.subject
media analysis
de
dc.subject
News Analysis
en
dc.subject
Austrian Media Corpus
en
dc.subject
Network Analysis
en
dc.subject
Natural Language Processing
en
dc.subject
Information Extraction
en
dc.subject
Entity Recognition
en
dc.subject
Elections
en
dc.subject
Media Bias
en
dc.subject
Co-Occurance Networks
en
dc.subject
Data Mining
en
dc.title
Network analysis on the Austrian media corpus: Examining measures of co-occurrence between entities in Austrian media
en
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2023.41932
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Gabriel Grill
-
dc.publisher.place
Wien
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
dc.contributor.assistant
Neidhardt, Julia
-
tuw.publication.orgunit
E188 - Institut für Softwaretechnik und Interaktive Systeme