Network analysis on the Austrian media corpus: Examining measures of co-occurrence between entities in Austrian media

Grill, Gabriel

doi:10.34726/hss.2023.41932

DC Field

Value

Language

dc.contributor.advisor

Werthner, Hannes

dc.contributor.author

Grill, Gabriel

dc.date.accessioned

2023-09-18T14:47:44Z

dc.date.issued

2023

dc.date.submitted

2023-09

dc.identifier.citation

<div class="csl-bib-body"> <div class="csl-entry">Grill, G. (2023). <i>Network analysis on the Austrian media corpus: Examining measures of co-occurrence between entities in Austrian media</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.41932</div> </div>

dc.identifier.uri

https://doi.org/10.34726/hss.2023.41932

dc.identifier.uri

http://hdl.handle.net/20.500.12708/188332

dc.description.abstract

The quantitative study of news media can provide insights into reporting patterns and enable public discourse. Print media is essential in democratic societies, so its study remains important. This thesis examines Austrian reporting using network-based methods and unpacks the suitability of such an approach for news analysis. We seek to contribute to scholarly debates around the benefits and risks of using such methods to make sense of reporting. We conduct a comparative analysis of six news outlets (Der Standard, Die Presse, Österreich, Die Kronen Zeitung, Kurier, Die Heute) and discuss differences in reporting during the 2016 Austrian presidential elections. This is the first research effort applying a network-based approach to the Austrian Media Corpus (AMC), a complete and unique collection encompassing the last three decades of Austrian media coverage. We use natural language processing to extract an expressive subset of named entities representing network nodes. Several entity recognition schemes are evaluated based on a set of labeled articles. An approach combining named entity linking based on a Wikidata dictionary with an open-source recognition model performed best. The networks are constructed by relating the extracted entities and certain terms when they co-occur in a sentence. We apply various algorithms to the resulting networks to rank entities according to relevance and cluster nodes to detect themes during the election. We provide several descriptive statistics on publishing patterns and the occurrence of entities in the newspapers, revealing gender bias and the presidential candidates most mentioned. Our network-based approach reveals differences in reporting compared to results based on counting mentions. However, we also point out issues of these methods, such as flexibility in parameterization and messy visualizations. We argue these challenges are a double-edged sword as, for example, flexibility may also give researchers agency to enable more exploration and qualitative interpretation.

dc.description.abstract

Quantitative Forschung zu Zeitungen kann Einblicke in Berichterstattungsmuster liefern und damit einen öffentlichen Diskurs ermöglichen. Printmedien sind in demokratischen Gesellschaften unverzichtbar, daher bleibt ihre Erforschung wichtig. Diese Arbeit untersucht österreichische Berichterstattung mit netzwerkbasierten Methoden und diskutiert die Eignung eines solchen Ansatzes für die Analyse von Zeitungen. Die Arbeit trägt zu wissenschaftlichen Debatten über die Vorteile und Risiken des Einsatzes solcher Methoden bei. Wir führen eine vergleichende Analyse von sechs Zeitungen durch (Der Standard, Die Presse, Österreich, Die Kronen Zeitung, Kurier, Die Heute) und diskutieren Unterschiede in der Berichterstattung während der österreichischen Präsidentschaftswahlen 2016. Dies ist die erste Forschungsarbeit die einen netzwerkbasierten Ansatz für den Austrian Media Corpus (AMC) anwendet, eine vollständige und einzigartige Sammlung, die die letzten drei Jahrzehnte österreichischer Medienberichterstattung umfasst. Wir wenden Natural Language Processing Methoden an um textliche Referenzen zu Entitäten zu erkennen und daraus, welche die Knoten in den Netzwerken darstellen. Wir evaluieren mehrere Erkennungsalgorithmen für Entitäten anhand von annotierten Artikeln. Die beste Methode war eine Kombination aus einer Erkennung basierend auf Wikidata-Einträgen und einem open-source machine learning Modell. Wir konstruieren die Netzwerke indem extrahierten Entitäten und erkannte Begriffe in Beziehung gesetzt werden, wenn sie in einem Satz gleichzeitig vorkommen. Wir wenden verschiedene Algorithmen auf die resultierenden Netzwerke an, um Entitäten nach Relevanz zu ordnen und Knoten zu gruppieren, um Themen während der Wahl zu erkennen. Wir präsentieren mehrere deskriptive Statistiken zu Veröffentlichungsmustern und dem Auftreten von Entitäten in den Zeitungen, die geschlechtsspezifische Benachteiligungen und die am häufigsten genannten Präsidentschaftskandidaten aufzeigen. Im Vergleich zu diesen Ergebnissen, zeigt unser netzwerkbasierter Ansatz andere Eigenschaften der Berichterstattung auf. Abschließend weisen wir auf Probleme netzwerkbasierender Methoden hin, wie z. B. Flexibilität bei der Parametrisierung und Unübersichtlichkeit von Netzwerkvisualisierungen. Wir argumentieren, dass diese Herausforderungen ein zweischneidiges Schwert sind, da beispielsweise Flexibilität Forschenden auch mehr Möglichkeiten geben kann für Erkundung von Daten und qualitative Interpretation.

dc.language

English

dc.language.iso

dc.rights.uri

http://rightsstatements.org/vocab/InC/1.0/

dc.subject

network analysis

dc.subject

big data

dc.subject

media analysis

dc.subject

News Analysis

dc.subject

Austrian Media Corpus

dc.subject

Network Analysis

dc.subject

Natural Language Processing

dc.subject

Information Extraction

dc.subject

Entity Recognition

dc.subject

Elections

dc.subject

Media Bias

dc.subject

Co-Occurance Networks

dc.subject

Data Mining

dc.title

Network analysis on the Austrian media corpus: Examining measures of co-occurrence between entities in Austrian media

dc.type

Thesis

dc.type

Hochschulschrift

dc.rights.license

In Copyright

dc.rights.license

Urheberrechtsschutz

dc.identifier.doi

10.34726/hss.2023.41932

dc.contributor.affiliation

TU Wien, Österreich

dc.rights.holder

Gabriel Grill

dc.publisher.place

Wien

tuw.version

vor

tuw.thesisinformation

Technische Universität Wien

dc.contributor.assistant

Neidhardt, Julia

tuw.publication.orgunit

E194 - Institut für Information Systems Engineering

dc.type.qualificationlevel

Diploma

dc.identifier.libraryid

AC16945966

dc.description.numberOfPages

129

dc.thesistype

Diplomarbeit

dc.thesistype

Diploma Thesis

dc.rights.identifier

In Copyright

dc.rights.identifier

Urheberrechtsschutz

tuw.advisor.staffStatus

staff

tuw.assistant.staffStatus

staff

tuw.assistant.orcid

0000-0001-7184-1841

item.openairecristype

http://purl.org/coar/resource_type/c_bdcc

item.fulltext

with Fulltext

item.openaccessfulltext

Open Access

item.mimetype

application/pdf

item.languageiso639-1

item.grantfulltext

open

item.openairetype

master thesis

item.cerifentitytype

Publications

crisitem.author.dept

E184 - Institut für Informationssysteme

crisitem.author.parentorg

E180 - Fakultät für Informatik

Appears in Collections:

Thesis

Fulltext (Version of Record (published version))

Adobe PDF

(12.41 MB)

In Copyright

Show simple item record

Page view(s)

532

checked on Nov 20, 2023

Download(s)

2,006

checked on Nov 20, 2023

Google Scholar^TM

Check

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM