SciDok - Wissenschafts-Server der Universitaet des Saarlandes
Home
Home
Suchen
Suche
Volltextsuche
Volltextsuche
Browsen
Browsen
Veröffentlichen
Veröffentlichen
Uni-Homepage

Eingang zum Volltext

Urheberrechtshinweis / Copyright notice

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:291-scidok-665
URL: http://scidok.sulb.uni-saarland.de/volltexte/2002/66/


Bachelier, Günter

Polyrepräsentation, Relevanz-Approximation und aktives Lernen im Vektorraummodell des Information-Retrievals

Polyrepresentation, relevance-approximation and active learning in the linear space model of information retrieval

pdf-Format:
Dokument 1.pdf (12.990 KB)


Kurzfassung in Deutsch

Relevance-Feedback (RF) bezeichnet die Relevanzbewertung von Dokumenten eines Information Retrieval Systems (IRS) durch den Nutzer, sowie Adaptionsstrategien interner Repräsentationen des IRS. Relevanz-Approximationsmodelle (Rel-AM) sind RF-Verfahren, da die Dokumentvektoren und Relevanzwerte als Stützpunkte eines instanzbasierten bzw. als Lernstimuli eines prototypbasierten AMs verwendet werden. Mit einem Rel-AM kann für alle Punkte des Dokumentvektorraums eine Relevanzschätzung gebildet werden, die für Retrievalstrategien genutzt werden. Die passive Nutzung von Rel-AM verwendet das Relevanz-Maximierungskriterium, bei dem die Dokumentvektoren ausgewählt werden, von denen das IRS annimmt, dass die zugehörigen Dokumente die höchsten Relevanzwerte besitzen, was zu Modellverzerrungen führen kann, da Stimuli mit niedrigem Relevanzwert untergewichtet werden. Bei aktivem Lernen (AL) besitzt der Lernende Einfluss auf die Komponenten des Lernprozesses. Im IR soll AL zum Aufbau von guten Rel-AM mit wenigen Stimuli verwendet werden. Die aktive Nutzung von Rel-AM verwendet das Modell-Maximierungskriterium, bei dem Dokumentvektoren ausgewählt werden, von denen das IRS annimmt, dass sie zu der größten Modellverbesserung führen. Die Integration des AL im IR erfordert die Integration der beiden Kriterien durch konfliktlösende Strategien wie der Reformulierung als Mehr-Ziel-Optimierungsproblem. Polyrepräsentation (PR) ist die mehrfache und unterschiedliche Repräsentation von Informationsobjekten. Es wird gezeigt, was PR innerhalb des Vektorraummodells des IR bedeuten kann. Weiterhin benötigen nahezu alle Modelle zum AL eine AM-PR. Diese kann bei einer Monorepräsentation im IRS ad-hoc durch Stochastisierung der deterministischen Rel-AM erzeugt werden.

Kurzfassung in Englisch

--

SWD-Schlagwörter: Information Retrieval , Informationssystem , Neuronales Netz , Maschinelles Lernen , Approximation
Freie Schlagwörter (deutsch): adaptives Information Retrieval System , Relevanz-Feedback , Relevanz-Approximation , aktives Lernen , Mehr-Ziel-Optimierung , Pareto-Menge
Freie Schlagwörter (englisch): Information Retrieval , Machine Learning , Active Learning , Self-Organizing Maps , Clustering
Institut: Fachrichtung 5.6 - Informationswissenschaft
Fakultät: Fakultät 5 - Philosophische Fakultät III
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Zimmermann, Harald H. Prof. Dr.
Sprache: Deutsch
Tag der mündlichen Prüfung: 31.01.2002
Erstellungsjahr: 2001
Publikationsdatum: 21.02.2002
Home Hilfe Policy Viewer SULB SaarDok Impressum Kontakt