SciDok

Eingang zum Volltext in SciDok

Lizenz

Dissertation zugänglich unter
URN: urn:nbn:de:bsz:291-scidok-64765
URL: http://scidok.sulb.uni-saarland.de/volltexte/2016/6476/


Question answering and query processing for extended knowledge graphs

Frage-Antworten und Abfrageverarbeitung für erweiterte Wissengraphen

Yahya, Mohamed

pdf-Format:
Dokument 1.pdf (1.135 KB)

Bookmark bei Connotea Bookmark bei del.icio.us
SWD-Schlagwörter: Information Extraction , Abfrageverarbeitung , Natürlichsprachiges System
Freie Schlagwörter (Englisch): question answering , query processing , knowledge graphs , information extraction
Institut: Max-Planck-Institut für Informatik
Fakultät: Fakultät 6 - Naturwissenschaftlich-Technische Fakultät I
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Weikum, Gerhard (Prof. Dr.-Ing.)
Sprache: Englisch
Tag der mündlichen Prüfung: 15.04.2016
Erstellungsjahr: 2016
Publikationsdatum: 26.04.2016
Kurzfassung auf Englisch: Knowledge graphs have seen wide adoption, in large part owing to their schemaless nature that enables them to grow seamlessly, allowing for new relationships and entities as needed. With this rapid growth, several issues arise: (i) how to allow users to query knowledge graphs in an expressive and user-friendly manner, which shields them from all the underlying complexity, (ii) how, given a structured query, can we return satisfactory answers to the user despite possible mismatches between the query vocabulary and structure and the knowledge graph, and (iii) how to automatically acquire new knowledge, which can be fed into a knowledge graph.
In this dissertation, we make the following contributions to address the above issues:
- We present DEANNA, a framework for question answering over knowledge graphs, allowing users to easily express complex information needs using natural language and obtain tuples of entities as answers thereby taking advantage of the structure in the knowledge graph.
- We introduce TriniT, a framework that compensates for unsatisfactory results of structured queries over knowledge graphs, either due to mismatches with the knowledge graph or the knowledge graph's inevitable incompleteness. TriniT tackles the two issues by extending the knowledge graph using information extraction over textual corpora, and supporting query relaxation where a user's query is rewritten in a manner transparent to the user to compensate for any mismatches with the data.
- We present ReNoun, an open information extraction framework for extracting binary relations mediated by noun phrases and their instances from text. Our scheme extends the state-of-the-art in open information extraction which has thus far focused on relations mediated by verbs.
Our experimental evaluations of each of the above contributions demonstrate the effectiveness of our methods in comparison to state-of-the-art approaches.
Kurzfassung auf Deutsch: Der Einsatz von Wissensgraphen erfreut sich großer Beliebtheit, die vor allem der schemafreien Natur der Graphen geschuldet ist. Diese ermöglicht ein reibungsloses Anwachsen des Graphen, so dass neue Relationen und Entitäten je nach Bedarf hinzugefügt werden können. Durch dieses rapide Anwachsen des Graphen treten allerdings auch einige Fragestellungen auf: (i) Wie kann man Nutzern ermöglichen, Wissensgraphen in einer ausdrucksstarken und zugleich nutzerfreundlichen Weise anzufragen, die die Nutzer von der zugrundeliegenden Komplexität abschirmt, (ii) wie können für eine strukturierte Suchanfrage trotz möglicher Diskrepanzen in Vokabular und Struktur zwischen Suchanfrage und Wissensgraph zufriedenstellende Antworten geliefert werden, und (iii) wie kann neues Wissen automatisiert akquiriert werden, um es in einen Wissensgraphen zu integrieren? In der vorliegenden Dissertation werden die folgenden Beiträge entwickelt, um die obigen Problemstellungen zu adressieren:
- Wir präsentieren mit DEANNA ein Frage-Antwort-System für Wissensgraphen, das Nutzern ermöglicht, auf einfache Art und Weise komplexe Informationsbedürfnisse natürlichsprachlich auszudrücken. Die Struktur des Wissensgraphen wird dabei dahingehend ausgenutzt, das die Antworten als Entitätentupel ausgegeben werden.
- Mit TriniT entwickeln wir ein Framework, dass unbefriedigende Ergebnisse für strukturierte Suchanfragen auf Wissensgraphen kompensiert. Dabei werden sowohl Fehltreffer als auch unvermeidbare Lücken im Wissensgraphen berücksichtigt. Beide Probleme werden durch TriniT dadurch angegangen, dass der Wissensgraph mithilfe von Methoden der Informationsextraktion aus Textkorpora erweitert wird, und dass Suchanfragen relaxiert werden. Dafür wird die Suchanfrage eines Nutzers auf transparente und für den Nutzer nachvollziehbare Weise umgeschrieben, um Fehltreffer auszugleichen.
- Außerdem stellen wir ReNoun vor, ein Framework für Open Information Extraction zum Extrahieren von binären Relationen, die durch Nominalphrasen ausgedrückt werden. Unser Schema erweitert dabei den aktuellen Forschungsstand im Bereich der offenen Informationsextraktion, da bislang der Fokus auf verbalen Relationen lag.
Unsere experimentellen Evaluierungen der oben genannten Methoden und Systeme verdeutlichen die Effektivität unserer Methoden im Vergleich zu State-of-the-Art Ansätzen.
Lizenz: Veröffentlichungsvertrag für Dissertationen und Habilitationen

Home | Impressum | Über SciDok | Policy | Kontakt | Datenschutzerklärung | English