URN zum Zitieren der Version auf EPub Bayreuth: urn:nbn:de:bvb:703-epub-7890-4
Titelangaben
Pöferlein, Matthias:
Advancements in Sentiment Analysis and Dictionary Building for German Financial Texts.
Bayreuth
,
2024
. - 101 S.
(
Dissertation,
2024
, Universität Bayreuth, Rechts- und Wirtschaftswissenschaftliche Fakultät)
Volltext
|
|||||||||
Download (3MB)
|
Abstract
Textual analysis is an increasingly important field in accounting and finance research, primarily focusing on the analysis of English texts. The thesis discusses several important adaptions and extensions as well as use cases for textual analysis of German-speaking finance-related texts. The research is divided into three interconnected studies. The first study addresses the limitations of sentiment analysis for German financial texts by reforming and extending the first finance-specific German dictionary developed by Bannier et al. (2019). Through proposing several reforms and extensions of the existing dictionary and evaluating the most appropriate measurement of the tone of textual documents in finance, this study enhances the accuracy and reliability of sentiment analysis. The second study builds upon these advancements by further expanding the dictionary with 11,179 additional words, including basic forms and synonyms. This expanded dictionary is then used to analyze the sentiment of German-speaking annual reports, with a particular focus on predicting the future financial performance metrics return on assets (ROA) and return on equity (ROE). In a novel approach, regarding the original dictionary by Bannier et al. (2019), the study also explores the impact of negations on sentiment analysis, by testing various lists and methods of implementation. The results demonstrate that incorporating term-shifted PR negations improves the predictive power of sentiment analysis. The third study demonstrates the broad range of applications for text analysis by examining the external communication of savings and cooperative banks as an alternative for surveys to determine the extent to which these banks use artificial intelligence. We train four different neural networks based on Word2vec to create a comprehensive dictionary of 6,935 elements. Through further manual classification based on the respective references in the text corpus, we are able to reduce the relevant terms for the identification of the usage of artificial intelligence to 36. Based on our approach, we can demonstrate a very moderate usage of AI at savings and cooperative banks, primarily limited to the use of chatbots. The demonstrated approach can contribute as a structured alternative to surveys, which can be adapted to the respective research purpose to be investigated. Considering the results of all three parts the contribution of this thesis to the literature of textual analysis of German-speaking financial texts is an extension and optimization of the first available German finance-related dictionary. Therefore, future research in analyzing the sentiment of German-speaking texts in finance can be conducted more accurately and more thoroughly. Additionally, this thesis provides a domain-specific dictionary for analyzing the usage of artificial intelligence by German banks. The proposed method for creating domain-specific dictionaries, as well as the approach to use external communication instead of surveys can be applied to solve other research questions.
Abstract in weiterer Sprache
Textanalyse ist ein zunehmend wichtiges Forschungsfeld in der Rechnungslegungs- und Finanzforschung, welches sich hauptsächlich auf die Analyse englischsprachiger Texte konzentriert. Die vorliegende Arbeit behandelt mehrere wichtige Anpassungen und Erweiterungen sowie Anwendungsfälle der Textanalyse deutschsprachiger finanzbezogener Texte. Die Arbeit ist in drei miteinander verbundene Studien unterteilt. Die erste Studie befasst sich mit den Einschränkungen der Sentiment-Analyse für deutsche Finanztexte, indem das erste finanzspezifische deutsche Wörterbuch, welches von Bannier et al. (2019) entwickelt wurde, reformiert und erweitert wird. Durch mehrere Änderungen und Erweiterungen des bestehenden Wörterbuchs sowie die Evaluation der geeignetsten Sentiment-Messung, kann die Genauigkeit und Zuverlässigkeit der Sentiment-Analyse in dieser Studie verbessert werden. Die zweite Studie baut auf diesen Fortschritten auf, indem das Wörterbuch um 11.179 zusätzliche Wörter, einschließlich Grundformen und Synonymen, erweitert wird. Dieses verbesserte Wörterbuch wird anschließend verwendet, um das Sentiment deutschsprachiger Geschäftsberichte zu analysieren. In einem neuartigen Ansatz, bezogen auf das ursprüngliche Wörterbuch von Bannier et al. (2019), untersucht die Studie ergänzend den Einfluss von Negationen auf die Sentiment-Analyse, indem verschiedene Listen und Implementierungs-methoden getestet werden. Die Ergebnisse zeigen, dass die Einbeziehung von bedeutungs-umgekehrten PR-Verneinungen die Vorhersagekraft der Sentiment-Analyse verbessern. Die dritte Studie zeigt das breite Anwendungsspektrum der Textanalyse auf, indem die externe Kommunikation von Sparkassen und Genossenschaftsbanken als Alternative zu Umfragen untersucht wird, um den Umfang der Nutzung von künstlicher Intelligenz in diesen beiden Bankengruppen zu bestimmen. Hierfür wurden vier verschiedene neuronale Netze basierend auf Word2vec trainiert, um ein umfassendes Wörterbuch zu erstellen. Durch weitere manuelle Klassifikation konnten 36 relevanten Begriffe zur Identifizierung von KI Nutzung identifiziert werden. Basierend auf diesem Ansatz kann eine sehr moderate Nutzung von KI in Sparkassen und Genossenschaftsbanken nachgewiesen werden. Unter Berücksichtigung der Ergebnisse aller drei Teile besteht der Beitrag dieser Arbeit zur Literatur der Textanalyse deutschsprachiger Finanztexte in einer Erweiterung und Optimierung des ersten verfügbaren deutschsprachigen finanzbezogenen Wörterbuchs. Darüber hinaus bietet diese Arbeit ein domänenspezifisches Wörterbuch zur Analyse der Nutzung von künstlicher Intelligenz durch deutsche Banken. Die vorgeschlagene Methode zur Erstellung domänenspezifischer Wörterbücher sowie der Ansatz, externe Kommunikation anstelle von Umfragen zu nutzen, können angewendet werden, um andere Forschungsfragen zu lösen.