Kueffner, K. R. (2021). A comprehensive Survey of the actual causality literature [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2021.90003
Causality; Counterfactuals; Reasoning; Causal Inference; Actual Causality; Survey
en
Abstract:
Der Forschungsbereich um Kausalität gewann in der Informatik in den letzten Jahren zunehmend an Bedeutung. Eine Definition die Kausalität formal erfasst würde es Computern ermöglichen, ”Warum”-Fragen zu beantworten und hätte vielversprechende Anwendungen im Bereich der Verifikation, des maschinellem Lernen, der Erklärbarkeit, dem formalen rechtlichem Schließen und der algorithmischer Gerechtigkeit führen. Um das Erreichen zu können müssen kausale Beziehungen aus Daten abgeleitet werden. Diese werden anschließend verwendet um die tatsächlichen Ursachen für Ereignisse in konkreten Situationen zu identifizieren. Das Ermitteln solcher Ursachen wird als token-kausale Inferenz bezeichnet. Nach jetzigem Kenntnisstand existiert kein ausreichend umfangreiches Werk, welches den aktuellen Stand der Technik im Bereich token-kausaler Inferenzsysteme offenlegt. Diese Dissertation soll das eben genannte Defizit begleichen. Die hierfür durchgeführte Literaturrecherche ist in drei verschiedene Granularitätsebenen unterteilt. Die erste Ebene betrachtet die Literatur als eigenständiges Studienobjekt. Im Kontext dessen werden Techniken der Netzwerkanalyse verwendet, um wichtige Publikationen, Autoren und Forschungsgemeinschaften zu identifizieren. Die zweite Ebene ist eine klassische Literaturrecherche, bei der eine Teilmenge der gesammelten Literatur im Detail untersucht wird. Das Ziel hierbei ist es die wichtigsten Werkzeuge zur Formalisierung von Kausalität zu extrahieren, zu beschreiben und zu kategorisieren. Dieser Teilmenge gehören unter anderem die formalen Sprachen zur Codierung kausaler Beziehungen an, aber auch die verschiedenen Kausalitätsdefinitionen sowie diverse Szenarien welche verwendet werden um diese Definitionen zu testen. Die dritte Ebene beschäftigt sich mit vier solcher Kausalitätsdefinitionen im Detail. Diese werden formal eingeführt und anhand der vorgestellten Testszenarien verglichen. Dieser letzte Teil erforderte einige Originalarbeiten, da nicht alle Szenarien in der Literatur formalisiert zu finden sind.
de
The study of causality has recently gained traction in computer science. Formally capturing causal reasoning would allow computers to answer “Why”-questions and would result in significant advances in fields such as verification, machine learning, explainability, legal reasoning and algorithmic fairness. To accomplish this, one needs to be able to infer type causal relationships, i.e. general statements about causal dependencies, from data and then use those relationships to identify the actual causes of an event in a given situation; such causes are referred to as token causes. To the best of our knowledge, there does not exist a comprehensive survey, reviewing the state of the art of formal systems for token causality. The present thesis addresses this deficit. The literature review that we have performed operates on three different levels of granularity. The first considered the literature landscape itself as an object of study, employing network analysis techniques to identify important publications, authors and research communities. The second is a classical literature review, where a subset of the collected literature is investigated in detail, to extract, describe and categorise the tools used for formalising causation. This includes the languages for encoding causal relationships, the various definitions that try to capture token causality, as well as the benchmark used to test the capabilities of those definitions. In the third part we describe and compare the four main token causality definitions, w.r.t. the most prominent benchmarks in the literature. This last part also required some original work, as not all the examples are found in the literature.