Towards a better understanding of under-explored facets of Internet censorship

Lipphardt, Friedemann

Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-46777

Titel:	Towards a better understanding of under-explored facets of Internet censorship
VerfasserIn:	Lipphardt, Friedemann
Sprache:	Englisch
Erscheinungsjahr:	2025
DDC-Sachgruppe:	004 Informatik 510 Mathematik
Dokumenttyp:	Dissertation
Abstract:	The Internet has fundamentally transformed how information is accessed, shared, and controlled across the globe, creating unprecedented opportunities for both free expression and systematic information control. As digital communication technologies have evolved, so too have the mechanisms by which governments, corporations, and platforms regulate and restrict information ﬂow. Internet censorship, traditionally understood as government-imposed restrictions on information access, has evolved into a complex ecosystem of control mechanisms operating at multiple levels of the technology stack. From network-level packet ﬁltering and Domain Name System (DNS) manipulation to application-layer content blocking, censorship techniques have become increasingly sophisticated. Current censorship systems can selectively target speciﬁc services, protocols, or even individual features within applications while leaving others untouched. Parallel to traditional censorship, content moderation in Large Language Models (LLMs) has emerged as an additional type of information control. Traditional content moderation systems ﬁlter user-generated content after it has been created, but Large Language Model (LLM) content moderation operates at the point of generation, determining what information these Artiﬁcial Intelligence (AI) systems provide in response to user queries. These systems use sophisticated safety mechanisms and content ﬁlters that can refuse to answer questions, provide evasive responses, or redirect conversations away from certain topics. The rise of LLMs as primary information sources for millions of users has made their content moderation decisions increasingly consequential for public access to information. While information control mechanisms serve important functions such as protecting users from harmful content, misinformation, and illegal material while helping platforms maintain community standards, these same systems can threaten free expression and create digital inequalities. This research reveals how LLMs arbitrarily limit users’ access to information based on their location or language, potentially suppressing legitimate discourse and reinforcing existing power structures. Through our empirical studies, this dissertation provides an analysis of today’s censorship and content moderation practices. We examine how AI-driven content ﬁltering systems exhibit geographic and linguistic biases (location and language-dependent ﬁltering) in their moderation decisions, investigating the behavior of 15 prominent LLMs across 12 global vantage points and 13 languages. Our analysis reveals systematic variations in content moderation, with rates differing by up to 60% across locations, and fundamental differences between Chinese and Western model behaviors, particularly regarding political and religious content. While LLM content moderation is one form of information control, we also investigate another form of censorship: Sophisticated network-level censorship techniques deployed in the Middle East, focusing on Voice over Internet Protocol (VoIP) service restrictions in Saudi Arabia (SA) and the United Arab Emirates (UAE). Our research uncovers advanced middlebox technologies that achieve granular censorship by selectively blocking voice communication while preserving other application features. Through systematic experimentation across popular communication platforms, we identify novel application ﬁngerprinting techniques that exploit protocol characteristics to enable targeted service restrictions. Additionally, we address the analytical challenges inherent in studying large-scale Internet censorship by proposing new approaches for correlating censorship measurements with network infrastructure data. By integrating over 36 million monthly censorship measurements into a comprehensive knowledge graph framework, we enable researchers to examine the relationship between censorship events, network topology, and geopolitical factors at unprecedented scale. Collectively, this research reveals the multi-layered and increasingly sophisticated nature of today’s information control. Our ﬁndings demonstrate how censorship and content moderation techniques operate with growing precision and context-awareness, while often lacking transparency and consistency. These insights have signiﬁcant implications for digital rights, algorithmic fairness, and the development of more equitable information systems in an increasingly connected world. Das Internet hat grundlegend verändert, wie Informationen weltweit zugänglich gemacht, geteilt und kontrolliert werden, und dabei beispiellose Möglichkeiten sowohl für freie Meinungsäusserung als auch für systematische Informationskontrolle geschaffen. Mit der Entwicklung digitaler Kommunikationstechnologien haben sich auch die Mechanismen weiterentwickelt, durch die Regierungen, Unternehmen und Plattformen den Informationsﬂuss regulieren und beschränken. Internetzensur, traditionell verstanden als von Regierungen auferlegte Beschränkungen des Informationszugangs, hat sich zu einem komplexen Ökosystem von Kontrollmechanismen entwickelt, die auf mehreren Ebenen des Technologie-Stacks operieren. Von netzwerkbasierter Paketﬁlterung und DNS-Manipulation bis hin zur anwendungsschichtbasierten Inhaltsblockierung sind Zensurtechniken zunehmend ausgeklügelt geworden. Aktuelle Zensursysteme können gezielt bestimmte Dienste, Protokolle oder sogar einzelne Funktionen innerhalb von Anwendungen anvisieren, während andere unberührt bleiben. Parallel zur traditionellen Zensur ist die Inhaltsmoderation in LLMs als zusätzlicher Typ der Informationskontrolle entstanden. Traditionelle Inhaltsmoderationssysteme ﬁltern nutzergenerierte Inhalte, nachdem sie erstellt wurden, aber LLM-Inhaltsmoderation operiert zum Zeitpunkt der Generierung und bestimmt, welche Informationen diese AI-Systeme als Antwort auf Nutzeranfragen bereitstellen. Diese Systeme verwenden ausgeklügelte Sicherheitsmechanismen und Inhaltsﬁlter, die Fragen ablehnen, ausweichende Antworten geben oder Gespräche von bestimmten Themen weglenken können. Der Aufstieg von LLMs als primäre Informationsquellen für Millionen von Nutzern hat ihre Inhaltsmoderationsentscheidungen zunehmend folgenreich für den öffentlichen Zugang zu Informationen gemacht. Während Informationskontrollmechanismen wichtige Funktionen erfüllen, wie den Schutz von Nutzern vor schädlichen Inhalten, Fehlinformationen und illegalem Material, während sie Plattformen dabei helfen, Gemeinschaftsstandards aufrechtzuerhalten, können diese selben Systeme die freie Meinungsäusserung bedrohen und digitale Ungleichheiten schaffen. Diese Forschung zeigt auf, wie LLMs willkürlich den Zugang der Nutzer zu Informationen basierend auf ihrem Standort oder ihrer Sprache beschränken und dabei möglicherweise legitimen Diskurs unterdrücken und bestehende Machtstrukturen verstärken. Durch unsere empirischen Studien bietet diese Dissertation eine Analyse heutiger Zensur- und Inhaltsmoderationspraktiken. Wir untersuchen, wie AI-gesteuerte Inhaltsﬁltersysteme geograﬁsche und sprachliche Verzerrungen (standort- und sprachabhängige Filterung) in ihren Moderationsentscheidungen aufweisen, indem wir das Verhalten von 15 prominenten LLMs über 12 globale Aussichtspunkte und 13 Sprachen hinweg untersuchen. Unsere Analyse offenbart systematische Variationen in der Inhaltsmoderation, wobei sich die Raten um bis zu 60% zwischen den Standorten unterscheiden, sowie grundlegende Unterschiede zwischen chinesischen und westlichen Modellverhalten, insbesondere bezüglich politischer und religiöser Inhalte. Während LLM-Inhaltsmoderation eine Form der Informationskontrolle ist, untersuchen wir auch eine andere Form der Zensur: ausgeklügelte netzwerkbasierte Zensurtechniken, die im Nahen Osten eingesetzt werden, mit Fokus auf VoIP-Dienstbeschränkungen in SA und den UAE. Unsere Forschung deckt fortgeschrittene Middlebox-Technologien auf, die granulare Zensur erreichen, indem sie selektiv Sprachkommunikation blockieren, während andere Anwendungsfunktionen erhalten bleiben. Durch systematische Experimente über beliebte Kommunikationsplattformen hinweg identiﬁzieren wir neuartige Anwendungsﬁngerprinting-Techniken, die Protokolleigenschaften ausnutzen, um gezielte Dienstbeschränkungen zu ermöglichen. Zusätzlich behandeln wir die analytischen Herausforderungen, die bei der Untersuchung grossﬂächiger Internetzensur inhärent sind, indem wir neue Ansätze zur Korrelation von Zensurmessungen mit Netzwerkinfrastrukturdaten vorschlagen. Durch die Integration von über 36 Millionen monatlichen Zensurmessungen in ein umfassendes Wissensgraph-Framework ermöglichen wir es Forschern, die Beziehung zwischen Zensurereignissen, Netzwerktopologie und geopolitischen Faktoren in beispiellosem Massstab zu untersuchen. Insgesamt offenbart diese Forschung die vielschichtige und zunehmend ausgeklügelte Natur heutiger Informationskontrolle. Unsere Erkenntnisse demonstrieren, wie Zensur und Inhaltsmoderationstechniken mit wachsender Präzision und Kontextbewusstsein operieren, während ihnen oft Transparenz und Konsistenz fehlt. Diese Einsichten haben bedeutende Implikationen für digitale Rechte, algorithmische Fairness und die Entwicklung gerechterer Informationssysteme in einer zunehmend vernetzten Welt.
Link zu diesem Datensatz:	urn:nbn:de:bsz:291--ds-467773 hdl:20.500.11880/41289 http://dx.doi.org/10.22028/D291-46777
Erstgutachter:	Feldmann, Anja Gosain, Devashish Houmansadr, Amir
Tag der mündlichen Prüfung:	18-Dez-2025
Datum des Eintrags:	10-Mär-2026
Fakultät:	MI - Fakultät für Mathematik und Informatik
Fachrichtung:	MI - Informatik
Professur:	MI - Keiner Professur zugeordnet
Sammlung:	SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:

Datei	Beschreibung	Größe	Format
Dissertation_LipphardtFriedemann.pdf		8,28 MB	Adobe PDF	Öffnen/Anzeigen

Export: BibTex Statistik anzeigen

Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.