Zum Inhalt springen

Google

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 25. Mai 2004 um 21:57 Uhr durch JensM (Diskussion | Beiträge) (GMail). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Google ist eine Internet-Suchmaschine, die 1998 von Larry Page und Sergey Brin gegründet wurde.

Seit einigen Jahren ist Google die bekannteste und am meisten genutzte Suchmaschine. Google ist auch für die Suche nach PDF-, Postscript-, Word- und PowerPoint-Dateien geeignet. Bsp: Suche "Wort" in Wikipedia per Google.

Der Name basiert auf dem gleich auszusprechenden englischen googol (=10100) und soll die Assoziation mit einer ungeheuerlichen Zahl von indizierten Webseiten aufkommen lassen. In Wirklichkeit handelt es sich zur Zeit (Februar 2004) "nur" um etwas über 4 Milliarden (=4 109) [1] (laut Betreiberangaben: 4,28 Mrd.) Seiten. Diese Zahl wiederum nimmt sich noch klein aus gegenüber der geschätzten totalen Größenordnung von Webseiten von an die 500 Milliarden [2] unter Berücksichtigung des Deep Web.

Neben Webseiten lassen sich auch Bilder auffinden. Die Anzahl der indizierten Bilder liegt derzeit bei ca. 880 Millionen. Es können zusätzlich, durch den Aufkauf der Firma DejaNews, die vorher das Usenet indiziert hatte, ca. 845 Millionen Diskussionbeiträge aus dem Usenet zu über 35.000 Themengebieten durchsucht werden. Die Computer von Google bearbeiten zur Zeit pro Tag mehr als 200 Millionen Anfragen.

Im Laufe des Jahres 2004 wird Google auch seinen E-Mail-Dienst GMail starten.

Seitenreihenfolge

google.de verwendet zur Erstellung der Seitenreihenfolge einen Algorithmus, der die Seite u.a. anhand der Quantität und Qualität der Links bewertet, die zu ihr führen. Das grundsätzliche Pageranking (etwa: "Seiten mit Rang versehen"; die Methode wurde nach ihrem Erfinder Larry Page benannt) funktioniert im Prinzip nach einer der beiden Formeln:



wobei

  • PR(A) der Seitenrang einer Seite A,
  • PR(Ti) der Seitenrang der Seiten Ti, i=1..m, von denen ein Link auf die Seite A zeigt,
  • C(Ti) die Gesamtanzahl der Links, die von der Seite Ti ausgehen
  • d ein Dämpfungsfaktor, mit 0 <= d <= 1 und
  • N die Anzahl aller Seiten des Webs

ist. Man beachte, dass diese Definition rekursiv ist. Praktisch wird zu Anfang allen Seiten ein konstanter Rang zugewiesen und die Formel so lange iteriert, bis Konvergenz auf die Endrangreihenfolge eintritt.

Wie der Algorithmus genau funktioniert bleibt ein Betriebsgeheimnis. Die aufkommende monopolartige Stellung im Markt für Suchmaschinen wird vielfach angesprochen, da Google seine Leistungen auch an andere Suchmaschinen verkauft. (Marktanteile-Quelle: [3]).

Werbung, Finanzierung

Google ist ein kommerzielles Unternehmen. Google kommt ohne grafische Werbebanner aus, verkauft dafür aber für beliebige Suchbegriffe einen "Platz an der Sonne". Diese reine Text-Werbung -- sog. "AdWords" -- ist aber speziell hervorgehoben, so dass die eigentlichen Suchergebnisse nicht beeinflusst werden. Wird ein Suchbegriff eingegeben, der zum Angebot eines Adwords-Teilnehmer passt, wird dessen Link angezeigt. Die Einnahmen des Unternehmens stammen auch von Internet-Portalen, welche die Google-Suchtechnik für ihre eigenen Dienste übernehmen. Zusätzlich entstehen Gewinne durch das Google "AdSense" Programm; dies ist kontextabhängige Werbung, welche Webmaster auf ihren Webseiten einbinden können. Hierüber können seit Mai 2004 auch grafische Werbebanner in 4 Standardgrößen plaziert werden.

Das Unternehmen hat seinen Sitz im kalifornischen Mountain View. Es beschäftigt zur Zeit rund 800 Mitarbeiter.

Aufgrund seiner bedeutenden Marktposition ist Google Hauptziel von Suchmaschinen-Spamming. Dabei wird versucht, gute Positionen bei möglichst vielen Suchbegriffen (die meist nichts mit dem Angebot des Spammers zu tun haben) zu erzielen. Es werden zum Beispiel Techniken wie Doorway-Pages eingesetzt, bei der dem Suchroboter von Google ein zum Suchbegriff passender Inhalt vorgegaukelt wird, von Google kommende Besucher aber auf eine Seite des Spammers weitergeleitet werden.

Verwendete Computer

Die verwendeten Computer bei Google sind normale Standard-PCs, die sich die Arbeit teilen (Computercluster von etwa 100.000 Rechnern). Sie laufen unter dem Betriebssystem GNU/Linux und werden bei einem Defekt einfach abgeschaltet, so dass die Arbeit anschließend von einem anderen PC erledigt wird. Dieses System erweist sich bei Google als kostengünstige Alternative zu einem Großrechner.

Datenschutz

Die Verwendung von sehr "langlebigen" Cookies und andere Vorwürfe, u.a. das Speichern der "Cookie ID", der IP-Adresse, Zeit, Datum und Inhalt der Suchabfrage sowie der Browser-Konfiguration reichten für Bürgerrechtsgruppe Public Information Research, um Google in den USA für die "Big Brother Award" zu nominieren [4].

Manipulation

Dass sich die Reihenfolge der Treffer bei Google manipulieren lässt, belegt u.a. der Kampf um den vordersten Platz beim Suchbefehl "miserable failure" ("kläglisches Scheitern"). Gegner des amtierenden Präsidenten George W. Bush sorgten durch Einsatz einer Google-Bombe dafür, dass die Webseite des Weißen Hauses mit Bushs Biographie auf Platz 1 landete. Im Gegenzug versuchten andere, Michael Moore dort zu platzieren. Die Plätze wechseln seither gelegentlich.

Durch den Aufbau von sogenannten Linkfarmen können Suchbegriffe bei Google gepusht werden.

Manipulationen, die zum Zweck haben, das Ranking von Websites bei Google zu verbessern, werden auch als Google-Spamming bezeichnet.

Sonstiges

Zunächst im Usenet und mittlerweile auch in der Alltagssprache hat sich das Verb googeln (inzwischen sogar gugeln) für die Internetsuche mit Google eingebürgert.

Google arbeitet ständig an Neuerungen und weiteren Features, die man unter http://labs.google.com testen kann. In kurzen Zeitabständen werden auch Statistiken über gerade aktuelle Suchbegriffe veröffentlicht (so genannte Zeitgeist-Statistiken, siehe [5]). Google indiziert immer nur die ersten 100 KB einer datei, was besonders bei PDF-Dokumenten stark ins Gewicht fällt.


Siehe auch: Suchmaschinen-Spamming, Google-Bombe, schnitzelmitkartoffelsalat, Gesponserte Links, Wikipedia:Darwikinismus