Salbrechter, S. (2024). Financial news and the equity market: a machine learning approach to news anaysis [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2024.109761
Die Dissertation mit dem Titel "Financial News and Stock Returns" (Finanznachrichten und Aktienrenditen) zielt darauf ab, verschiedene Fragen im Zusammenhang mit den Auswirkungen von Finanznachrichten auf den Aktienmarkt zu beantworten. Ein Beitrag zur Literatur ist die Anwendung neuartiger maschineller Lernmodelle, wie z.B. vortrainierte Sprachmodelle (BERT) auf Finanznachrichten, um Textdaten in großem Umfang zu analysieren. Wir trainieren ein Modell auf einem großen Korpus an Thomson Reuters Finanznachrichten zur Stimmungsanalyse, um Fragen im Zusammenhang mit der Markteffizienz und der Bewertung von Aktien zu untersuchen. Wir beantworten die folgenden Fragen: Wie effizient ist der US-Aktienmarkt, d. h. wie lange dauert es, bis positive oder negative Nachrichten in die Preise von Vermögenswerten einfließen? Reagieren die Anleger über- oder untertrieben auf die Veröffentlichung positiver oder negativer Nachrichten? Darüber hinaus wird ein neuer Ansatz zur Themenmodellierung entwickelt, der in der Lage ist, spezifische und umfassende thematische Wortcluster zu erstellen. Durch den Einsatz dieses Themenmodellierungsansatzes messen wir das Klimarisiko einzelner Unternehmen anhand der Ausprägung von Unternehmensnachrichten bezüglich der Klimarisikothemen. Dies wiederum wird verwendet, um einen Klimarisikofaktor zu erstellen - ein Long/Short-Portfolio, das in grünen Vermögenswerten long und in braunen Vermögenswerten short ist -, der als zusätzlicher Faktor für klassische Asset-Pricing-Modelle verwendet werden kann.
de
The dissertation, entitled "Financial News and Stock Returns," aims to answer several questions related to the impact of financial news on the stock market. One contribution to the literature is the application of novel machine learning models, i.e. pre-trained language models (BERT) on financial news to analyze text data at scale. We train a model on a large corpus of Thomson Reuters financial news on the sentiment analysis task to investigate questions related to market efficiency and asset pricing. We answer the following questions: How efficient is the US equity market, i.e. how long does it take until positive or negative news are incorporated into asset prices? Do investors over- or underreact to the release of positive or negative news? Furthermore, a new topic modeling approach is developed that is able to create specific and comprehensive topic word clusters. By leveraging this topic modeling approach we measure individual firms’ climate risk by the exposure of company news to climate risk topics. This in turn is used to create a climate risk factor - a long/short portfolio that is long in green assets and short in brown assets -that can be used as an additional factor to classic asset pricing models.