SciDok

Eingang zum Volltext in SciDok

Hinweis zum Urheberrecht

InProceedings (Aufsatz / Paper einer Konferenz etc.) zugänglich unter
URN: urn:nbn:de:bsz:291-scidok-8373
URL: http://scidok.sulb.uni-saarland.de/volltexte/2007/837/


Automatische Indexierung und elektronische Thesauri

Zimmermann, Harald H.

Quelle: (1996) Zukunft der Sacherschliessung im OPAC : Vorträge des 2. Düsseldorfer OPAC-Kolloquiums am 21. Juni 1995 / [Universitäts- und Landesbibliothek Düsseldorf]. Hrsg. von Elisabeth Niggemann und Klaus Lepsky. - Düsseldorf : Univ.- und Landesbibliothek, 1996
pdf-Format:
Dokument 1.pdf (55 KB)

Bookmark bei Connotea Bookmark bei del.icio.us
SWD-Schlagwörter: Automatische Indexierung , Thesaurus
Institut: Fachrichtung 5.6 - Informationswissenschaft
DDC-Sachgruppe: Bibliotheks- und Informationswissenschaft
Dokumentart: InProceedings (Aufsatz / Paper einer Konferenz etc.)
Sprache: Deutsch
Erstellungsjahr: 1996
Publikationsdatum: 21.02.2007
Kurzfassung auf Deutsch: Die Diskussion über den praktischen Wert des Einsatzes sprachanalytischer Verfahren in der Erschließung und Verfügbarmachung von Texten (und Titeln) ist fast so alt wie die Erstellung elektronischer Textdatenbanken bzw. bibliographischer Datenbanken (Literaturdatenbanken).

Gerald Salton, zunächst ein Pionier des sprachanalytischen Information Retrieval, hatte sich aufgrund wenig überzeugender Ergebnisse zunehmend auf rein statistische Konzepte (v.a. des Document Clustering) verlegt. Vor allem bei Datensammlungen, denen englischsprachige Texte zugrundeliegen, schien die simple Vorgehensweise einer Rechtstrunkierung beim Retrieval, verbunden mit der Ausnutzung von Wortabständen (Adjacency- und Same-Funktion) angesichts der an sich schon großen Variationsbreite sprachlicher Ausdrucksformen, die von "höherwertigen" Systemen auch nicht bewältigt wurden, ein angemessenes Verfahren.

In Deutschland gab es allerdings - bedingt durch die stärkere Flexion deutschsprachiger Wörter, v.a. auch durch die Problematik der Wortzusammensetzungen - schon frühzeitig die Bemühung, Verfahren zu entwickeln, die zumindest an der Oberfläche eine grundformorientierte Indexierung ermöglichten und darüberhinaus bei den Komposita eine Dekomposition in (möglichst sinnvolle) Wortbestandteile erzielten. Das von Siemens entwickelte System PASSAT kann hier als Beleg dienen.

Home | Impressum | Über SciDok | Policy | Kontakt | Datenschutzerklärung | English