Thesaurus
Ein Thesaurus bzw. Wortnetz ist in der Dokumentationswissenschaft ein kontrolliertes Vokabular, dessen Begriffe durch Relationen miteinander verbunden sind. Die Bezeichnung wird gelegentlich auch für linguistische Thesauri oder wissenschaftliche Wortschatz-Sammlungen verwendet. Der Ausdruck „Thesaurus“ stammt aus dem Griechischen (thesauros für Schatz, Schatzhaus) bzw. aus dem Lateinischen.
Thesaurus
Als Thesaurus bezeichnet man ein Modell, das versucht, ein Themengebiet genau zu beschreiben und zu repräsentieren. Es besteht aus einer systematisch geordneten Sammlung von Begriffen, die in Beziehung zueinander stehen, der Thesaurus ist ein kontrolliertes Vokabular (Attributwertebereich) für das jeweils zu beschreibende Attribut. Es werden in erster Linie Synonyme, aber auch Ober- und Unterbegriffe verwaltet.
Beispiel: Bildnis (Synonym: Abbild, Bild, Spiegelbild), Tischler (Oberbegriff: Handwerker)
Thesaurus zur Dokumentation
In der Dokumentationswissenschaft hat sich der Thesaurus als geeignetes Hilfsmittel zur Sacherschließung und zum Auffinden von Dokumenten erwiesen. Dabei dienen Relationen zwischen den einzelnen Begriffen zum Auffinden bei der Indexierung (Vergabe von Schlagworten) und bei der Recherche. Im Gegensatz zu einem linguistischen Thesaurus enthält ein Thesaurus zur Dokumentation ein kontrolliertes Vokabular, d.h. eindeutige Benennungen (Deskriptoren) für jeden Begriff. Unterschiedliche Schreibweisen (Photo/Foto), Synonyme bzw. als gleichbedeutend behandelte Quasi-Synonyme, Abkürzungen, Übersetzungen etc. werden durch Äquivalenzrelationen miteinander in Beziehung gesetzt. Begriffe werden außerdem durch Assoziationsrelationen und hierarchische Relationen vernetzt.
Der Thesaurus dient als Dokumentationssprache zum Indexieren, Speichern und Wiederauffinden von Dokumenten. Die Relationen ermöglichen es, bei der Indexierung und Recherche passende Benennungen für gesuchte Begriffe zu finden. Bei der Suche können Thesauri durch die automatische Erweiterung der Suchanfrage durch Synonyme und Unterbegriffe hilfreich sein.
Ein Thesaurus kann damit auch allgemein zur Begriffsklärung dienen und hat im besten Fall die Funktion einer Normdatei inne. Im Gegensatz zu einer monohierarchischen Tabelle oder Datenbank kann der Thesaurus eine polyhierarchische Struktur besitzen (d.h. ein Unterbegriff kann mehrere Oberbegriffe haben).
Die Thesaurusnormen DIN 1463-1 bzw. das internationale Äquivalent ISO 2788 sehen folgende Relationsarten und dazugehörige Abkürzungen vor:
Kürzel und Bezeichnung | |
---|---|
DIN 1463-1 | ISO 2788 |
BF - Benutzt für | UF - Used for |
BS - Benutze Synonym | USE/SYN Use synonym |
OB - Oberbegriff | BT - Broader term |
UB - Unterbegriff | NT - Narrower term |
VB - Verwandter Begriff | RT - Related term |
SB - Spitzenbegriff | TT - Top term |
Die häufigsten Relationen in einem Thesaurus sind Äquivalenz-, Assoziations- und hierarchische Relationen.
In der Regel wird ein Element einer Äquivalenzrelation, also eine Benennung, als Vorzugsbenennung festgelegt. Die Nicht-Vorzugsbenennungen erhalten einen Verweis auf die ihnen äquivalente Vorzugsbenennung.
- Beispiel:
- Fahrzeug verweist auf die Unterbegriffe LKW und PKW.
- Auto verweist auf die Vorzugsbenennung PKW und mit einer Assoziationsbeziehung („siehe auch“) auf LKW.
Siehe auch: semantisches Netz
Thesaurus als Sammelwerk
Früher verstand man unter einem Thesaurus ein wissenschaftliches Sammelwerk mit dem gesamten Wortschatz einer Sprache. Bekannt sind unter anderem der Thesaurus Linguae Graecae und der Thesaurus Linguae Latinae. Bei diesen Werken handelt es sich genaugenommen um Wörterbücher.
Linguistische Thesauri
In einem linguistischen Thesaurus sind statt Begriffen Wörter ähnlicher und verwandter Bedeutung durch Verweise verknüpft. Diese Art von lexikalisch-semantisch organisiertem Nachschlagewerk kann unter anderem als Formulierungshilfe benutzt werden. Es gibt Nachschlagewerke dieser Art in gedruckter Form (z.B. DUDEN Band 8, Sinn- und sachverwandte Wörter) oder in elektronischer Form, hier zumeist als Hintergrundressource von Textverarbeitungsprogrammen.
Beispiele
- Getty Thesaurus of Geographic Names
- UNESCO Thesaurus
- INFODATA Thesaurus
- StandardThesaurus Wirtschaft
- http://www.dandelon.com Internationales Wissenschaftsportal dandelon.com: über 415.000 Terme in mehreren multilingualen Thesauri mit grafischer Visualisierung. Anwendung: Suchwort eingeben - "Topic Maps Visualization" drucken. Technische Voraussetzung: Macromedia Flash Player.
Siehe auch
Weblinks
- http://www.openthesaurus.de/ - OpenThesaurus (Projekt zur Erstellung eines deutschsprachigen linguistischen Thesaurus)
- eurovoc - Ein mehrsprachiger Thesaurus, der sämtliche Tätigkeitsbereiche der Europäischen Gemeinschaften abdeck.
- Standard-Thesaurus-Wirtschaft [1]
- http://www.din.de/ - Deutsches Institut für Normung e.V.
- http://www.bluerider.com/randomwordservice.php - free online thesaurus