Suchmaschine

Programm zur Recherche von Dokumenten
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 1. Mai 2003 um 07:26 Uhr durch 24.103.77.28 (Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Eine Suchmaschine ist ein Programm, das Anwendern hilft, auf Dokumente zuzugreifen, die in einem Computer oder einem Computernetzwerk (z.B. im World Wide Web) gespeichert sind. Im Gegensatz zu einem Inhaltsverzeichnis (bzw. einem Katalog wie z.B. Yahoo), das Dokumente in einer vorbestimmten hierarchischen Struktur organisiert, sucht eine Suchmaschine nur nach Dokumenten, die vom Anwender vorgegebene Suchbegriffe enthalten. Als Beispiele können Altavista oder Google dienen.

Suchmaschinen speichern die Informationen aus einer großen Anzahl von Webseiten, die sie selbst mit Hilfe so genannter Web-Crawler aus dem Web abrufen. Dies sind im wesentlichen automatische Browser, die jeden Link im Dokument weiterverfolgen. Der Inhalt jeder Seite wird analysiert um festzulegen, wie der Index angelegt werden soll (z.B. Wörter werden aus den Titeln, Überschriften und speziellen Feldern, den Metatags, extrahiert).

Wenn ein Anwender eine Anfrage an die Suchmaschine stellt (vermutlich durch Eingabe einiger Schlüsselwörter), schaut der Mechanismus im Index nach und stellt eine Liste von relevanten Webseiten zur Verfügung, meist mit einer kurzen Zusammenfassung zumindest des Dokumenttitels.

Für die Ermittlung der Relevanz - und damit der Reihenfolge der ausgegebenen Webseiten - zieht jede Suchmaschine eigene Kriterien heran. Die zur Zeit recht erfolgreiche Suchmaschine Google z.B. bewertet jede Seite danach, wieviele andere, als qualitativ hochwertig eingestufte Seiten auf sie verweisen. Die Einstufung der gelinkten Seiten als auch deren Anzahl bestimmen den Rang der Seite.
Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z.B. dem World Wide Web gespeichert sind. Nach Eingabe einer Suchanfrage - bestehend aus Schlagwoertern und der Art ihrer logischen Verknuepfung - liefert eine S. eine Liste von Verweisen auf relevante Dokumente oder Webseiten, meist dargestellt mit Titel und einem kurzen Auszug des jeweiligen Dokuments.

Im Gegensatz zu gelegentlich vom Begriff der S. miterfassten Such-Kataloge wie z.B. Yahoo), die Dokumente hierarchisch in einem Inhaltsverzeichnis nach Themen organisieren, ist die Recherche mit S. im eigentlichen Sinne (z.B. Altavista, Google) nach Schlagworten bzw. Suchbegriffen organisiert.

Die zur Suche noetige Datenbasis gewinnen S. meist durch automatisierten Abruf und Verschlagwortung einer großen Anzahl von Webseiten sowie Verfolgung der darin enthaltenen Verweise, d.h. Links, oder im Fall von Metasuchmaschinen durch Rueckgriff auf mehrere andere S.

Die Darstellung der Suchergebnisse geschieht sortiert nach Relevanz, wofuer jede Suchmaschine eigene Kriterien heranzieht. Die zur Zeit recht erfolgreiche Suchmaschine Google z.B. bewertet jede Seite danach, wieviele andere, als qualitativ hochwertig eingestufte Seiten auf sie verweisen. Die Einstufung der gelinkten Seiten als auch deren Anzahl bestimmen den Rang der Seite. Weiteres Kriterium sind die Haeufigkeit und Stellung der Suchbegriffe in den gefundenen Dokumenten.

Manche Suchmaschinen sortieren Suchergebnisse nicht nur nach Relevanz fuer die Suchanfrage sondern lassen gegen Bezahlung auch Einflussnahme auf ihre Ausgabe zu.

Herausforderungen für Suchmaschinen:

  • Das Web wächst schneller als die Suchmaschinen mit der derzeitigen Technik indizieren können.
  • Viele Webseiten werden häufig aktualisiert, was die Suchmaschinen zwingt, diese Seiten immer wieder zu besuchen.
  • Die Anfragen sind auf das Suchen von Schlüsselworten beschränkt, was auch viele unbrauchbare Ergebnisse hervorbringt.
  • Mittels Suchmaschinen-Spamming, d.h. mit unlauteren Methoden, versuchen selbsternannte "Suchmaschinen-Optimierer", die Resultate, die eine Suchmaschine liefert, zu manipulieren und ihre Seiten oder die ihrer Kundschaft in den Ergebnislisten möglichst weit vorn zu platzieren. Die meisten Suchmaschinen versuchen, sich gegen diese Form der Manipulation zu wehren.

Geschichte von Suchmaschinen: Eine der ersten Suchmaschinen war Lycos, die 1994 als Universitätsprojekt gestartet ist. Vorher gab es schon andere, z.B. Archie, die aber nicht mit einer graphischen Web-Oberfläche ausgestattet waren.

Verweise zu S.:

  • klug-suchen.de bietet eine Übersicht über allgemeine, wie auch regional oder thematisch begrenzte Suchmaschinen und Kataloge
  • Die Suchfibel liefert weitere Informationen zur Vorgehensweise von Suchmaschinen und gibt hilfreiche Recherchetipps
  • Google ist im Moment die bekannteste Suchmaschine, auch für PDF und Postscript geeignet. Bsp: Suche "Wort" in Wikipedia per Google. Google bietet durch seinen guten Mechanismus eine unendliche Vielzahl von Links zu beinahe jedem Suchwort, teilweise ist es zu einem Sport geworden Worte zu finden zu denen Google nichts oder nur wenige Ergebnisse liefert (Knack den Google)
  • Es gibt auch Suchmaschinen, die geziehlt nur bestimmte Themen bearbeiten:
  • Eine Abhilfe für die Linkflut bieten Suchmaschinen mit Sortieralgorithmen, wie sie sich in Zukunft wohl durchsetzen dürften, ein gutes Beispiel: Vivisimo