Thesaurus
Ein Thesaurus ist in der Dokumentationswissenschaft ein kontrolliertes Vokabular, dessen Begriffe durch Relationen miteinander
verbunden sind. Die Bezeichnung wird gelegentlich auch für linguistische Thesauri oder wissenschaftliche Sammlungen von Wortschätzen verwendet. Das Wort "Thesaurus" stammt aus dem Griechischen thesauros für Schatz, Schatzhaus aus dem Lateinischen).
Thesaurus zur Dokumentation
In der Dokumentationswissenschaft hat sich der Thesaurus als geeignetes Hilfsmittel zur Sacherschließung und zum Auffinden von Dokumenten erwiesen. Dabei dienen Relationen zwischen den einzelnen Begriffen zum Auffinden bei der Indexierung (Vergabe von Schlagworten) und bei der Recherche. Im Gegensatz zu einem linguistischen Thesaurus enthält ein Thesaurus zur Dokumentation ein kontrolliertes Vokabular, d.h. eindeutige Bezeichnungen (Deskriptoren) für die gleichen Begriffe. Unterschiedliche Schreibweisen (Photo/Foto), Synonyme bzw. als gleichbedeutend behandelte Quasi-Synonyme, Abkürzungen, Übersetzungen etc. werden durch Äquivalenzrelationen miteinander in Beziehung gesetzt. Andere Relationen sind Assoziations- und hierarchische Relationen.
Der Thesaurus dient als Dokumentationssprache zum Indexieren, Speichern und Wiederauffinden von Dokumenten. Die Relationen dienen in erster Linie dazu bei der Indexierung und Recherche passende Benennungen für gesuchte Begriffe zu finden. Bei der Suche können Thesauri durch die automatische Erweiterung mit Synonymen und Unterbegriffen hilfreich sein.
Ein Thesaurus kann damit auch allgemein zur Begriffsklärung dienen. Im Gegensatz zu einer Systematik treten in einem Thesauri häufig Polyhierarchien. Daher ist es auch nicht Aufgabe eines Thesaurus, ein Wissensgebiet systematisch in seiner Gesamtheit zu strukturieren. Da Menschliche Drang Objekte durch Klassifikation zu ordnen, kann die Erstellung eines Thesaurus sogar sehr behindern.
Die Thesaurusnormen DIN 1462 bzw. das internationale Äquivalent ISO 2788 sehen folgende Relationsarten und dazugehörige Abkürzungen vor:
Kürzel und Bezeichnung | |
---|---|
DIN 1462 | ISO 2788 |
BF - Benutzt für Synonym | UF - Used for |
BS - Benutze Synonym | USE/SYN Use synonym |
OB - Oberbegriff | BT - Broader Term) |
UB - Unterbegriff | NT - Narrower term |
VB - Verwandter Begriff | RT - Related term |
TT - Top term |
Die häufigsten Relationen in einem Thesaurus sind Äquivalenz-, Assoziations- und hierarchische Relationen.
I.d.R. definieren die Äquivalenzrelationen bestimmte Bezeichnungen
als Vorzugsbenennungen. Die Nicht-Vorzugsbenennungen erhalten dabei
einen Verweis auf die ihnen äquivalente Vorzugsbenennung.
- Beispiel:
- Fahrzeuge verweist auf die Unterbegriffe LKW und PKW.
- Auto verweist auf die Vorzugsbenennung PKW und mit einer Assoziationsbeziehung ("siehe auch") auf LKW.
siehe auch: semantisches Netz
Thesaurus als Sammelwerk
Früher verstand man unter einem Thesaurus ein wissenschaftliches Sammelwerk mit dem gesamten Wortschatz einer Sprache. Bekannt sind unter anderem der Thesaurus Linguae Graecae und der Thesaurus Linguae Latinae. Bei dieses Werken handelt es sich genaugenommen um Wörterbücher.
Linguistische Thesauri
In einem linguistischem Thesaurus sind Wörter ähnlicher und verwandter Bedeutung durch Verweise verknüpft, so dass er unter anderem als Formulierungshilfe benutzt werden kann (beispielsweise Roget's Thesaurus of English Words & Phrases). Dazu enthalten einige Textverarbeitungen eine Thesaurusfunktion.