Please use this identifier to cite or link to this item: doi:10.22028/D291-45054
Title: Practically Applicable Causal Discovery
Author(s): Mian, Osman Ali
Language: English
Year of Publication: 2024
DDC notations: 500 Science
Publikation type: Dissertation
Abstract: This thesis focuses on discovering causal dependencies from observational data, which is one of the most fundamental problems in science. In particular, causal discovery aims to discover directed graphs among a set of observed random variables under specified assumptions. While an active area of research, existing causal discovery approaches are not always applicable to real-world scenarios. This is mainly due to their underlying assumptions, which limit their applicability in practice. In this dissertation, we aim to develop approaches that can be applied to several real-world scenarios to discover causal dependencies, under mild assumptions. We first focus on a setting where we discover the complete causal DAG and not just the Markov equivalence class from observational data. We do so by using the principle of choosing the simplest explanation, measured in information-theoretic terms, to develop a theoretically sound causal discovery method. Next, we extend causal discovery to data collected across multiple environments, addressing biases from pooling data with different interventional distributions. To this end, we propose an approach that uses a similar information-theoretic score to discover causal networks in distributed settings without requiring prior knowledge of whether the data is observational or interventional. Furthermore, we develop a method for continual causal discovery from episodic data that updates causal hypotheses as new data arrives, without the need to re-learn causal networks from scratch each time. Our proposed approach for this scenario can learn causal networks adaptively over time and distinguish between episodes that do not belong to the same causal mechanism. Lastly, we tackle the important aspect of privacy-preserving federated causal discovery. To do so, we propose a general framework that effectively identifies global causal networks without ever sharing the data or learning parameters, while ensuring differential privacy.
Diese Arbeit befasst sich mit der Entdeckung kausaler Abhängigkeiten aus Beobachtungsdaten, eines der grundlegendsten Problemen der Wissenschaft. Insbesondere zielt die kausale Entdeckung darauf ab, gerichtete Graphen über einer Reihe von beobachteten Zufallsvariablen unter bestimmten Annahmen zu entdecken. Obwohl es sich hierbei um ein aktives Forschungsgebiet handelt, sind bisherige Ansätze nicht in reale Szenarien anwendbar. Dies liegt vor allem an den ihnen zugrunde liegenden Annahmen, die ihre Anwendbarkeit in der Praxis einschränken. In dieser Dissertation wollen wir Ansätze entwickeln, die unter milden Annahmen auf verschiedene reale Szenarien angewendet werden können, um kausale Abhängigkeiten zu entdecken. Wir konzentrieren uns zunächst auf eine Situation, in der wir den vollständingen kausalen Graphen und nicht nur die Markov-Äquivalenzklasse aus Beobachtungsdaten ermitteln. Dazu verwenden wir das sogenannte Minimum Description Length Prinzip, bei dem die kausale Hypothese nach der einfachsten Erklärung ausgewählt wird, um eine theoretisch fundierte Methode zur Entdeckung von kausalen Abhangigkeiten zu entwickeln. Als Nächstes erweiten wir die kausale Entdeckung auf Daten aus, die in verschiedenen Umgebungen erhoben wurden, und gehen dabei auf Verzerrungen ein, die sich aus der Zusammenführung von Daten mit unterschiedlichen Interventionsverteilungen ergeben. Zu diesem Zweck schlagen wir einen Ansatz vor, der eine ähnliche informationstheoretische Bewertungsmetrik verwendet, um kausale Netzwerke in verteilten Umgebungen zu entdecken, ohne dass vorher bekannt sein muss, ob es sich um Beobachtungs- oder Interventionsdaten handelt. Darüber hinaus entwickeln wir eine Methode zur kontinuierlichen Entdeckung kausaler Zusammenhänge aus episodischen Daten, die kausale Hypothesen beim Eintreffen neuer Daten aktualisiert, ohne kausale Netzwerke jedes Mal von Grund auf neu zu lernen. Der von uns vorgeschlagene Ansatz für dieses Szenario kann kausale Netzwerke über die Zeit hinweg adaptiv lernen und zwischen Episoden unterscheiden, die nicht zum selben kausalen Mechanismus gehören. Schließlich befassen wir uns mit dem wichtigen Aspekt der datenschutzfreundlichen föderierten Kausalerkennung. Zu diesem Zweck schlagen wir einen allgemeinen Rahmen vor, der effektiv globale kausale Netzwerke identifiziert, ohne dass die Daten oder Lernparameter geteilt werden müssen, während gleichzeitig der Schutz der Privatsphäre gewährleistet wird.
URL of the first publication: https://eda.rg.cispa.io/pubs/2025/phd-mian-practically_applicable_causal_discovery.pdf
Link to this record: urn:nbn:de:bsz:291--ds-450549
hdl:20.500.11880/39974
http://dx.doi.org/10.22028/D291-45054
Advisor: Prof. Dr. Vreeken, Jilles
Date of oral examination: 28-Feb-2025
Date of registration: 7-May-2025
Faculty: MI - Fakultät für Mathematik und Informatik
Department: MI - Informatik
Professorship: MI - Keiner Professur zugeordnet
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
SULB_submission.pdfPh.D. dissertation, Mian, Osman Ali854,16 kBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.