Indexierung
Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung
Als Indexierung bezeichnet man beim Information Retrieval die Zuordnung von Deskriptoren oder Notationen zu einem Dokument zur Erschließung der darin enthaltenen Sachverhalte.
Indexierungsmethoden
Es lassen sich verschiedene Indexierungsarten und -methoden unterscheiden.
- Manuelle, computergestützte und automatische Indexierung
- Kontrollierte und freie Indexierung
siehe auch unter: Deskriptor
Manuelle Indexierung
Die Manuelle Indexierung, Intellektuelle Indexierung oder Verschlagwortung ist ein Verfahren der Sacherschließung von Dokumenten, bei der einem Dokument repräsentative Schlagwörter (Keywords) zugewiesen werden. Da die freie Indexierung mit beliebigen Wörtern sehr ungenau ist, sollten Schlagwörter aus einem kontrolliertem Vokabular (z.B der Schlagwortnormdatei) oder einer anderen Dokumentationssprache verwendet werden.
Automatische Indexierung
Ein häufiges Verfahren der automatischen Indexierung ist die Volltextindexierung bei der bis auf Stoppwörter alle Wörter eines Textes in den Index aufgenommen werden (z.B. für eine Suchmaschine). Ggf. werden Wörter mittels Stemming auf einen gemeinsamen Wortstamm zurückgeführt.
Mit statistischen Indexierungsverfahren wird durch die Ermittlung von Worthäufigkeiten eine Auswahl getroffen und somit nur Wörter in den Index aufgenommen, die mit einer gewissen Frequenz im Text auftreten.
Mit Hilfe der Computerlinguistik sind auch intelligentere automatische Verfahren möglich, die zwar nicht an die manuelle Indexierung heranreichen, aber wesentlich stabiler hinsichtlich der Indexierungskonsistenz sind.
Computergestütze Indexierung
Bei der computergestützen Indexierung werden Vorschläge zu Deskriptoren vorgeschlagen und manuell ausgewählt.
Literatur
- Nohr, Holger: Grundlagen der automatischen Indexierung. Ein Lehrbuch. Logos-Verlag, Berlin, 2003, ISBN 3-8325-0121-5
siehe auch:
- Automatische Indexierung, Manuelle Indexierung (sollten noch eigen Artikel werden)
- Gleichordnende Indexierung / Strukturierte Indexierung
- Syntaktische Indexierung u.a. Kopplungsindikator/Rollenindikator
- Indexierungskonsistenz