Practically Applicable Causal Discovery

Mian, Osman Ali

Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-45054

Titel:	Practically Applicable Causal Discovery
VerfasserIn:	Mian, Osman Ali
Sprache:	Englisch
Erscheinungsjahr:	2024
DDC-Sachgruppe:	500 Naturwissenschaften
Dokumenttyp:	Dissertation
Abstract:	This thesis focuses on discovering causal dependencies from observational data, which is one of the most fundamental problems in science. In particular, causal discovery aims to discover directed graphs among a set of observed random variables under specified assumptions. While an active area of research, existing causal discovery approaches are not always applicable to real-world scenarios. This is mainly due to their underlying assumptions, which limit their applicability in practice. In this dissertation, we aim to develop approaches that can be applied to several real-world scenarios to discover causal dependencies, under mild assumptions. We first focus on a setting where we discover the complete causal DAG and not just the Markov equivalence class from observational data. We do so by using the principle of choosing the simplest explanation, measured in information-theoretic terms, to develop a theoretically sound causal discovery method. Next, we extend causal discovery to data collected across multiple environments, addressing biases from pooling data with different interventional distributions. To this end, we propose an approach that uses a similar information-theoretic score to discover causal networks in distributed settings without requiring prior knowledge of whether the data is observational or interventional. Furthermore, we develop a method for continual causal discovery from episodic data that updates causal hypotheses as new data arrives, without the need to re-learn causal networks from scratch each time. Our proposed approach for this scenario can learn causal networks adaptively over time and distinguish between episodes that do not belong to the same causal mechanism. Lastly, we tackle the important aspect of privacy-preserving federated causal discovery. To do so, we propose a general framework that effectively identifies global causal networks without ever sharing the data or learning parameters, while ensuring differential privacy. Diese Arbeit befasst sich mit der Entdeckung kausaler Abhängigkeiten aus Beobachtungsdaten, eines der grundlegendsten Problemen der Wissenschaft. Insbesondere zielt die kausale Entdeckung darauf ab, gerichtete Graphen über einer Reihe von beobachteten Zufallsvariablen unter bestimmten Annahmen zu entdecken. Obwohl es sich hierbei um ein aktives Forschungsgebiet handelt, sind bisherige Ansätze nicht in reale Szenarien anwendbar. Dies liegt vor allem an den ihnen zugrunde liegenden Annahmen, die ihre Anwendbarkeit in der Praxis einschränken. In dieser Dissertation wollen wir Ansätze entwickeln, die unter milden Annahmen auf verschiedene reale Szenarien angewendet werden können, um kausale Abhängigkeiten zu entdecken. Wir konzentrieren uns zunächst auf eine Situation, in der wir den vollständingen kausalen Graphen und nicht nur die Markov-Äquivalenzklasse aus Beobachtungsdaten ermitteln. Dazu verwenden wir das sogenannte Minimum Description Length Prinzip, bei dem die kausale Hypothese nach der einfachsten Erklärung ausgewählt wird, um eine theoretisch fundierte Methode zur Entdeckung von kausalen Abhangigkeiten zu entwickeln. Als Nächstes erweiten wir die kausale Entdeckung auf Daten aus, die in verschiedenen Umgebungen erhoben wurden, und gehen dabei auf Verzerrungen ein, die sich aus der Zusammenführung von Daten mit unterschiedlichen Interventionsverteilungen ergeben. Zu diesem Zweck schlagen wir einen Ansatz vor, der eine ähnliche informationstheoretische Bewertungsmetrik verwendet, um kausale Netzwerke in verteilten Umgebungen zu entdecken, ohne dass vorher bekannt sein muss, ob es sich um Beobachtungs- oder Interventionsdaten handelt. Darüber hinaus entwickeln wir eine Methode zur kontinuierlichen Entdeckung kausaler Zusammenhänge aus episodischen Daten, die kausale Hypothesen beim Eintreffen neuer Daten aktualisiert, ohne kausale Netzwerke jedes Mal von Grund auf neu zu lernen. Der von uns vorgeschlagene Ansatz für dieses Szenario kann kausale Netzwerke über die Zeit hinweg adaptiv lernen und zwischen Episoden unterscheiden, die nicht zum selben kausalen Mechanismus gehören. Schließlich befassen wir uns mit dem wichtigen Aspekt der datenschutzfreundlichen föderierten Kausalerkennung. Zu diesem Zweck schlagen wir einen allgemeinen Rahmen vor, der effektiv globale kausale Netzwerke identifiziert, ohne dass die Daten oder Lernparameter geteilt werden müssen, während gleichzeitig der Schutz der Privatsphäre gewährleistet wird.
URL der Erstveröffentlichung:	https://eda.rg.cispa.io/pubs/2025/phd-mian-practically_applicable_causal_discovery.pdf
Link zu diesem Datensatz:	urn:nbn:de:bsz:291--ds-450549 hdl:20.500.11880/39974 http://dx.doi.org/10.22028/D291-45054
Erstgutachter:	Prof. Dr. Vreeken, Jilles
Tag der mündlichen Prüfung:	28-Feb-2025
Datum des Eintrags:	7-Mai-2025
Fakultät:	MI - Fakultät für Mathematik und Informatik
Fachrichtung:	MI - Informatik
Professur:	MI - Keiner Professur zugeordnet
Sammlung:	SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:

Datei	Beschreibung	Größe	Format
SULB_submission.pdf	Ph.D. dissertation, Mian, Osman Ali	854,16 kB	Adobe PDF	Öffnen/Anzeigen

Export: BibTex Statistik anzeigen

Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.