Zum Inhalt springen

Volltextrecherche

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 19. Oktober 2004 um 00:58 Uhr durch Heliosteam (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Eine Volltextrecherche ist das Auffinden von von Texten in einer Vielzahl gleicher oder verschiedenartiger Dateien auf einem Computer, einem Server und/oder im Internet. Die Suchbereiche werden mit entsprechenden programminternen oder programmunabhängigen Index-Werkzeugen zuvor indiziert.

Zur schnellen Informationsgewinnung und Auffinden aus bekannten aber auch nicht bekannten, aber auf den Medien vorhandenen, Dokumenten, ist die Volltextrecherche unverzichtbar.

Die Volltextrecherche dient daher dem Auffinden, Entdecken und Extrahieren unbekannter, nicht trivialer und wichtiger Informationen aus großen Mengen von unstrukturierten Texten/Dateien.

Grundlegende Sucharten

Je nach verwendetem Suchsystem gibt es folgende Suchmöglichkeiten:

  • Wortsuche
  • beliebige Wörter
  • Phrasensuche: "Mit Wikipedia kann man"
  • Boolesche Operatoren: "und/ oder/nicht"
  • Umfeldsuche: Wörter oder Phrasen die "n" Wörter voneinander entfernt sind (bei PDF-Index kleiner als 3 Seiten)
  • Platzhaltersuche:
    • für einzelne Buchstaben "?" wie Ma?er = Mayer/Maier/Mauer...
    • für bliebig viele Buchstaben "*"
  • Unscharfe (Fuzzy)-Suche
  • Thesaurus-/Synonym-Suche
  • Natürlichsprachliche Suche mit Relevanzsortierung: "Finde alle IT-Artikel in Wikipedia"
  • Kombination mit den vorgenannten Möglichkeiten
  • Feldsuche: "Je nach verwendetem bis mit den vorgenannten Möglichkeiten"
  • Makro-Suche: Eine Möglichkeit mit vordefinierten Makros wiederkehrende Suchabfragen durchzuführen
  • diese Aufzählung ist nicht abschließend...

Warum also Volltextrecherche?

Die Volltextrecherche ist eine Sofortlösung, ohne auf komplexe Dokumentenmanagement-, Data-Mining-Systeme zugreifen zu müssen, die im Regelfall größeren Firmen und dem öffentlichen Dienst (perspektivisch) zur Verfügung stehen.

Durch die Volltextrecherche kann Organisationswissen, nicht nur rudimentär, verfügbar gemacht werden.

Gute Volltextrecherchesysteme durchsuchen mehere Gigabyts in weniger als 5 Sekunden.


Siehe auch

Verwandte Gebiete und weitergreifende Systeme

Volltext, E-Text Suchmaschinen, Datenanalyse, Künstliche Intelligenz, Statistik, Information-Retrieval, Bibliometrie, Informationsmanagement, Wissensmanagement, Web Mining, Text-Mining