Zum Inhalt springen

Yacy

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 23. Juli 2005 um 19:54 Uhr durch Head (Diskussion | Beiträge) (Das Programm). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Yacy ist eine Suchmaschine, die nach dem Peer-to-Peer-Prinzip (abgekürzt P2P) arbeitet. Dabei gibt es keinen zentralen Server, sondern alle Teilnehmer daran sind gleichwertig.

Die hinter dem Verfahren liegende Technik basiert auf einem Caching Proxy. Um Seiten zu indizieren, kann man entweder einfach mit dem Proxy surfen, und alle besuchten Seiten werden in den Index aufgenommen, oder man schickt selber einen Crawler los, der dann vollautomatisch Webseiten lädt und indiziert.

Wenn nun irgendein anderer Peer im YaCy-Netzwerk eine Suche startet, kann er alle Seiten finden, die andere Peers indiziert haben. Umgekehrt können Sie alle Seiten finden, die bei anderen indiziert wurden. Dadurch entsteht ein globaler Index.

Vorteile

  • Die mit Yacy aufgebaute globale Suchmaschine ist praktisch ausfallsicher, da immer ein Teil des Netzwerks erreichbar sein wird.
  • Die Internetnutzer sind durch Yacy als Suchmaschine unabhängig von Firmen, deren Ranking (das diese sich evtl. bezahlen lassen) und deren Filterung (und gar evtl. Zensur).
  • Das zu Grunde liegende P2P-Prinzip und das für eine Suchmaschine, eine unverzichtbare Infrastruktur zur Nutzung des WWW, zeigt im schönsten Sinne die ursprüngliche Philosophie des Internets, durch die es die heutige Größe erreicht hat - wer wollte da abseits stehen?
  • Die Software ist Open Source, wurde unter der GNU General Public License veröffentlicht und ist kostenlos.

Das Programm

Das Herzstück der Suchmaschine ist anders als bei anderen Suchmaschinen nicht eine zentrale Seite, sondern ein Programm. Dieses ist in Java geschrieben und läuft daher auf fast allen Betriebssystemen.

Gekoppelt mit dem P2P-System läuft ein Proxy-Server, der automatisch die meisten weitergereichten Seiten indiziert. Dies findet allerdings selbstverständlich nicht bei Seiten statt, denen via GET oder POST weitere Daten übergeben werden (z. B. Seiten in einem Login-Bereich). Somit ist sichergestellt, dass auch wirklich nur öffentlich zugängliche Daten indiziert werden.

Der Zugriff auf die Suchfunktionalität erfolgt über eben diesen lokal laufendem Server, in dem über eine gewohnte Suchmaske der Suchbegriff oder die Suchbegriffe eingegeben werden. Die Anzeige der Ergebnisse erfolgt hier ebenfalls wie gewohnt als HTML-Seite.

Weitere Features

Weiters bietet Yacy eine zusätzliche Top-Level-Domain ".yacy", die über sämtliche weiteren yacy-Proxies erreicht werden kann und als normale Webseite geöffnet wird. Unter dieser Domain hat der Benutzer die Möglichkeit, eine eigene Website zu hinterlegen. Da das P2P-System ohnehin seine IP-Adresse seinen Peers mitteilen muss, und auch über eine eventuelle Änderung benachrichtigen, bietet sich hiermit obendrein die Möglichkeit, wenigstens für andere yacy-Nutzer eine Homepage aufzubauen, ohne Probleme mit dynamischer Adressvergabe seitens des Providers zu haben.

Ausserdem wird die Möglichkeit angeboten, Dateien auf seinem lokalen Server freizugeben, auf die andere yacy-Benutzer nach Belieben Zugriff haben. Tatsächlich ist dies durch den HTTP-Server zwar sowieso schon der Fall, aber zusätzlich wird hier noch eine nette Übersicht angezeigt.

Weiters hat man die Möglichkeit, anderen yacy-Nutzern simple Textnachrichten zu senden (je nach Einstellungen auch mit Dateianhängen). Auch hier bietet sich also ein Weg, verbreitete und bekannte - daher also potentiell wahrscheinlicher zensierte - Medien zu meiden.

Zusätzlich dazu ist in yacy ein Wiki integriert, das als lokale Wissensdatenbank aufgebaut werden kann.