Google ist die Internet-Suchmaschine der Firma Google Inc. mit Sitz in Mountain View (USA). Die Firma wurde am 7. September 1998 von Larry Page und Sergey Brin gegründet. Am gleichen Tag wurde eine erste Testversion des Programms auf den Markt gebracht. Noch im selben Jahr ging die Suchmaschine offiziell ans Netz.
Rechtsform | |
Sitz |

Dienstleistungen
Hauptartikel Google-Dienstleistungen
Google bietet eine Vielzahl von größtenteils werbefinanzierten kostenlosen Dienstleistungen im World Wide Web an. Dabei handelt es sich vor allem um die Suche auf verschiedenen Datenquellen. Nachfolgend eine Übersicht der wichtigsten Dienste.
- Textdokumente im Web – Die bekannteste und meistgenutzte Dienstleistung ist die Volltextsuche von Dokumenten im World Wide Web. Neben dem im Web üblichen HTML-Format durchsucht Google auch andere Dokumententypen wie etwa PDF, Postscript oder das Doc-Format von Microsoft Word. Hauptfaktor bei der Gewichtung der Suchergebnisse ist die Linkpopularität; der vollständige Algorithmus wird jedoch von Google Inc. geheim gehalten, um ein Kopieren der Dienstleistung einerseits und eine irreführende Optimierung kommerzieller oder anderer Seiten auf die Googlesuche andererseits zu erschweren.
- Bilddateien im Web – Googles Bildsuche verwendet Wörter im Dateinamen sowie in HTML-Dokumenten, die ein Bild verwenden, um eine Suche nach Bilddateien anzubieten. Es werden die Grafikformate JPEG, PNG und GIF unterstützt. Eine Suche nach Bildinhalten oder zu einem gegebenen Bild ähnlichen Bildern ist nicht möglich.
- Usenet – Google besitzt mit Google Groups ein umfangreiches Archiv von Newsgroup-Artikeln, welche bis 1981 zurückreichen. In den Beiträgen der verschiedensprachigen Diskussionsforen kann nach Begriffen und Autoren gesucht werden. Die noch unfertige Version 2 ermöglicht außerdem das Anlegen von eigenen Diskussionsforen, allerdings unabhängig vom Usenet.
- Katalog – Das Webverzeichnis Google Directory, welches auf den Daten des Open Directory Project basiert, bietet einen Überblick von Websites, die von Redakteuren nach Themengebieten katalogisiert werden.
- Nachrichten – Der Inhalt von Nachrichten-Websites wird von Google besonders häufig abgerufen. Unter Google News wird dann auf diese Artikel – gruppiert nach Themen, bestimmten Ereignissen und geordnet nach ihrer Bedeutung – verwiesen. So kann der Leser verschiedene Artikel zum selben Ereignis schnell auffinden.
- Produkte – Mit Froogle kann man nach bei Online-Händlern angebotenen Waren suchen. Insbesondere ist ein Preisvergleich möglich.
- E-Mail – Gmail (in Deutschland Google Mail) ist Googles E-Mail-Dienst. Man kann seine Mails entweder komplett im Web lesen oder per POP3 mit dem eigenen E-Mail-Programm abholen.
- Übersetzung – Eine automatische Übersetzung zwischen einigen Sprachen wird für Webseiten angeboten.
Der Begriff „Google“
Die Bezeichnung Google basiert auf einem Wortspiel bei der amerikanischen Aussprache des Wortes googol. Diesen Ausdruck erfand Milton Sirotta (Neffe des US-amerikanischen Mathematikers Edward Kasner) im Jahre 1938. Er wollte der Zahl mit einer Eins und hundert Nullen (10100) einen Namen geben. Die Google-Gründer wiederum waren auf der Suche nach einer treffenden Bezeichnung für die Fülle an Informationen, welche mit ihrer Suchmaschine im Web aufgefunden werden sollte.
Der Name soll die Assoziation mit einer ungeheuerlichen Zahl von indexierten Webseiten aufkommen lassen. In Wirklichkeit handelt es sich zurzeit um etwas über 8 Milliarden (laut Betreiberangaben: 8.168.684.336 am 11. August 2005 22:43 MESZ) Seiten. Diese Zahl wiederum nimmt sich noch klein aus gegenüber der geschätzten totalen Größenordnung von Webseiten von an die 500 Milliarden unter Berücksichtigung des Deep Web.
Das Verb „googeln“
Google ist als Suchmaschine so populär geworden, dass das Verb googeln (sprich: gugeln) 2004 in den Duden aufgenommen wurde. (Beinahe ebenso häufig findet man die näher am Ursprung orientierte Schreibweise googlen, die aber nicht im Duden aufgeführt ist.) Dabei steht das Wort nicht nur für die Suche mit Google, sondern wird teilweise schon allgemein als Synonym für Websuche mit beliebigen anderen Suchmaschinen gebraucht (vgl. [1]).
Geschichtlicher Abriss
- 1995 – Larry Page und Sergey Brin begegnen sich an der Stanford University. Sie konzipieren die Suchmaschine BackRub – einen Google-Vorläufer.
- 1998 – Internetportale äußern Desinteresse an der entwickelten Suchtechnologie - die Gerätschaften befinden sich im Schlafzimmer von Larry Page.
- 7. September 1998 – In einer Garage gründen Page und Brin die Google Inc. Mit einem Startkapital von umgerechnet 810.000 Euro (aufgebracht von den Familien, Freunden und Andreas von Bechtolsheim) bringen sie die erste Testversion des Programms auf den Markt.
- Februar 1999 – Google bezieht mit acht Angestellten ein Büro in Palo Alto. Etwa 500.000 Suchanfragen werden täglich verzeichnet.
- September 1999 – AOL und Netscape arbeiten mit Google zusammen, die Suchanfragen versechsfachen sich.
- 21. September 1999 – Google beendet offiziell seine Testphase und entfernt den „beta“ Hinweis von der Webseite
- Juni 2000 – Mit mehr als einer Milliarde Seiten im Index ist Google Marktführer bei Suchmaschinen geworden.
- 2001 Neuer CEO wird Eric Schmidt.
- Februar 2001 – Google übernimmt das Usenet-Archiv von Deja News und startet seine eigene Usenet-Suche Google Groups.
- Dezember 2001 – Die Zahl von drei Milliarden Dokumentenzugriffen, darunter Beiträge bis zum Jahr 1981 zurück, wird erreicht.
- Juli 2003 – Ein deutschsprachiger Nachrichtendienst wird angeboten. Angeblich entstehen hier Google-News ohne menschliches Eingreifen.
- 1. April 2004 - Google startet die Betaversion des kostenlosten E-Mail Service Gmail mit 1 GB Speicher
- 29. April 2004 – Google verkündet den seit geraumer Zeit erwarteten Gang an die US-Börse.
- Am 1. August 2004 startete die Online-Registrierung für den IPO (Börsengang), von dem man sich einen Erlös von 3,3 Milliarden US-Dollar erhoffte. Der ursprünglich geplante Ausgabepreis von 108 bis 135 Dollar je Aktie musste auf 80 bis 85 Dollar gesenkt werden, bevor die Aktie am 19. August 2004 zum ersten Mal in den Handel kam. Bereits am ersten Handelstag stieg der Kurs auf über 100 Dollar und machte damit Larry Page und Sergey Brin, die jeder noch etwa 38 Millionen Aktien halten, zu Multimilliardären.
- Im Jahre 2005 wurde Google Inc. erstmalig auf der Forbes-Liste geführt und zwar gleich auf Platz 38. Der Firmenwert wird im Jahr 2005 auf etwa 55 Milliarden Dollar geschätzt.
- 18. November 2005 - Google-Aktie klettert über 400-Dollar-Marke. Bei 179.123.000 ausgegebenen Aktien hat Google damit einen Marktwert von 112 Milliarden US-Dollar. Damit übertrifft Google große Konzerne wie Coca-Cola, IBM, Cisco und Time Warner. Die Google-Gründer befinden sich nun in den Top 20 der reichsten Männer der USA. Google zählt neben Microsoft, Yahoo und Aol zu den Big Four im Internet. (siehe Heise-Newsticker)
- 21. Dezember 2005 - Google gibt die Akquisition von 5 Prozent der Aktien von AOL (Time Warner) bekannt. Damit gelang Google ein großer Erfolg gegen Microsoft, welche ebenfalls an einer solchen Übernahme interessiert waren.
- 23. Januar 2006 - Google wird zur einflussreichsten Marke 2005 gewählt. [2]
- 9. März 2006 - Google kauft die StartUp-Firma Writely
- 14. März 2006 - Google kauft die 3D-Firma SketchUp zur Integration von 3D-Skizzen in Google Earth
Technik
Architektur
Google Inc. betreibt weltweit eine Reihe von Rechenzentren, die jeweils die komplette Funktionalität der Suchmaschine enthalten. Eine Benutzeranfrage wird, durch das Domain Name System (welches Namen wie google.com in IP-Adressen übersetzt) gesteuert, im Idealfall an das netztopologisch nächste Rechenzentrum – nur manchmal mit dem geographisch nächstgelegenen identisch – geleitet und von diesem beantwortet. Fällt ein Rechenzentrum komplett aus, können die verbleibenden Rechenzentren die Last übernehmen.
Jedes Rechenzentrum besteht aus einem Computercluster. Die verwendeten Rechner sind IBM-kompatible Personal-Computer, bestehen also aus preiswerten Standardkomponenten. Man verwendet eine verteilte Architektur, bei der alle Daten mehrfach redundant auf verschiedenen Geräten gespeichert sind. Ist einer der Rechner oder nur eine Festplatte eines Rechners ausgefallen, werden die entsprechenden Daten von einer anderen Stelle im Cluster auf einen Ersatzrechner umkopiert und die ausgefallene Hardware-Komponente kann im laufenden Betrieb ausgetauscht werden, ohne dass Ausfälle entstehen. Das Gesamtsystem ist auch leicht skalierbar, da nach Bedarf immer weitere Rechner und Festplatten hinzugefügt werden können.
Durch Ablage der einzelnen Datenstrukturen (Indizes, Dokumentenkopien, Verzeichnisse aller Art) auf verschiedenen Rechnern und die große Anzahl verfügbarer Einzelrechner lassen sich Anfragen auch relativ schnell beantworten, da die Einzelinformationen parallel gelesen werden. Eine Antwortzeit von höchstens einer halben Sekunde wird als Richtwert angestrebt. Die schnelle Lieferung von Ergebnissen hatte auch frühzeitig zur Popularität von Google beigetragen. Die Konkurrenz ließ sich mit der Anfragebeantwortung oft mehr Zeit. Insbesondere bei inkrementellen Anfragen, also immer weiter verfeinerten Anfragen des Benutzers, der das jeweils vorige Suchergebnis berücksichtigt, ist die Zeitersparnis insgesamt deutlich spürbar.
Software
Als Betriebssystem wird eine abgespeckte Variante der Linux-Distribution Red Hat verwendet. Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware.
Hardware
Nach einer Schätzung auf Basis der Unterlagen zum Börsengang (IPO) vom April 2004 sieht die Hardwareausstattung bei Google etwa wie folgt aus:
- 719 Racks
- 63.272 Rechner
- 126.544 CPUs
- 253 Terahertz Ersatz-Taktfrequenz
- 127 Terabyte RAM
- 5 Petabyte Festplattenspeicher
Seitenreihenfolge
Die Anzahl der auf eine Suchanfrage passenden Dokumente kann sehr groß werden. Die Treffer müssen nach Relevanz sortiert werden, um dem Benutzer möglichst die wichtigsten Dokumente zuerst anzuzeigen. Die Qualität der Dokumente in Bezug auf die Anfrage einzuschätzen ist eines der Hauptprobleme, mit denen sich Suchmaschinen auseinandersetzen müssen. Dieses sogenannte Ranking muß automatisch durch einen Algorithmus geleistet werden können und darf nicht zulange dauern.
Google verwendet zur Sortierung von Suchergebnissen unter anderem den sogenannten PageRank-Wert. Ermittelt wird der PageRank-Wert eines Dokuments rekursiv durch die Verweise auf dieses Dokument. Je mehr solche Verweise existieren, und je höher der PageRank-Wert der verweisenden Dokumente ist, desto höher fällt auch der Wert des Dokuments aus, auf das verwiesen wird. Den PageRank-Wert einer Seite kann man mit dem Browser-Plugin Google-Toolbar ermitteln.
Allerdings werden auch andere Faktoren als PageRank in die Sortierung einbezogen. So wird etwa das Auftreten der Suchbegriffe im Dokumententitel oder in Überschriften positiv gewertet. Ein häufiges Vorkommen der Suchbegriffe ist ebenfalls von Vorteil, ebenso wie die Verwendung der Begriffe als Ankertext in verweisenden Dokumenten. Letzteres wird bei Google-Bomben ausgenutzt.
Die exakte Funktionsweise der Seitensortierung ist Googles Betriebsgeheimnis, nicht zuletzt, um Manipulationen durch Website-Betreiber zu erschweren, die die eigene Site für gewisse Begriffe auf den Ergebnisseiten möglichst weit nach oben bringen möchten. Die Suchmaschinen-Optimierung beschäftigt sich mit Methoden, dies zu erreichen.
Werbung, Finanzierung
Geschäftszahlen [3] | |||
---|---|---|---|
Jahr | Umsatz in Mio. Dollar |
Gewinn in Mio. Dollar | |
1. Quartal 2006 | x.xxx | xxx,x | |
2005 | 6.139 | 1.465,4 | |
2004 | 3.200 | 399,1 | |
2003 | 961,9 | 105,6 | |
2002 | 347,8 | 99,7 | |
2001 | 86,4 | 7,0 | |
2000 | 19,1 | -14,7 |
Google Inc. ist ein kommerzielles Unternehmen mit Hauptsitz im kalifornischen Mountain View. Es beschäftigte Ende September 2005 rund 5.000 Mitarbeiter. Im Jahr 2004 vollzog Google seinen lange erwarteten Börsengang (IPO). Google hat einen marktbeherrschenden Anteil an allen Suchanfragen im Internet (Stand 2005).
AdWords
Google verkauft für beliebige Suchbegriffe einen „Platz an der Sonne“. Diese reine Text-Werbung – so genannte „AdWords“ – ist aber speziell hervorgehoben, so dass die eigentlichen Suchergebnisse nicht beeinflusst werden. Wird ein Suchbegriff eingegeben, der zum Angebot eines AdWords-Teilnehmers passt, wird dessen Werbung angezeigt.
AdSense
Zusätzlich entstehen Gewinne durch das Google „AdSense“- Partnerprogramm; dies ist kontextabhängige Werbung, welche Webmaster auf ihren Webseiten einbinden können. Hierüber können seit Mai 2004 auch grafische Werbebanner in vier Standardgrößen platziert werden. Seit Juni 2005 können die Kunden über das „Site Targeting“ außerdem gezielt auf bestimmten Seiten werben, statische und animierte Werbebanner einsetzen und diese über die Zahl der Abrufe bezahlen. Bislang war nur eine Bezahlung pro Klick möglich.
Suchdienstleistungen für Portale
Googles Suchtechnik wird auch an Internetportale lizenziert, um dort eine Websuche anbieten zu können, ohne dass Benutzer das Portal verlassen müssten.
Google Appliance
Mit der Google Appliance verkauft Google seine Suchtechnologie an Firmen, die sie im eigenen Intranet einsetzen möchten. Bei der Appliance handelt es sich um einen Server mit vorinstallierter Software, der im firmeneigenen Netz dieselbe Aufgabe übernimmt, die Google für das World Wide Web leistet. Dokumente werden im Index vorgehalten und Suchanfragen beantwortet.
Manipulation der Ergebnisse von Google
Aufgrund seiner bedeutenden Marktposition ist Google Hauptziel von Suchmaschinen-Spamming. Dabei wird versucht, gute Positionen bei möglichst vielen Suchbegriffen zu erzielen. Diese Suchbegriffe haben oft nichts mit dem eigentlichen Inhalt der Seite zu tun. Es werden Techniken wie Doorway-Seiten, Linkfarmen oder Page-Cloaking eingesetzt.
Erstmals im größeren Umfang öffentlich wahrgenommen wurde die Möglichkeit der Suchmaschinenmanipulation im Zusammenhang mit einer Google-Bombe, die sich auf den amerikanischen Präsidenten George W. Bush bezog. Der Suchbegriff „miserable failure“ (zu deutsch: „klägliches Scheitern“ oder „jämmerlicher Versager“) wurde von Bush-Gegnern mit seiner offiziellen Biografie verknüpft. Im Gegenzug versuchten Bush-Unterstützer dasselbe mit Michael Moore. Die Plätze wechseln seither gelegentlich.
Manipulationen, die zum Zweck haben, das Ranking von Websites speziell bei Google zu verbessern, werden auch als Google-Spamming bezeichnet.
Versuche, fremde Internetseiten aus den Google-Ergebnissen herauszukegeln, bezeichnet man als „Google Bowling“.
Google ändert seine Algorithmen zur Bestimmung des Rankings regelmäßig ab, um Missbrauch zu erschweren. Die Spammer ziehen stets nach und passen ihre Seiten entsprechend an.
Ausschluss von Suchergebnissen wegen unlauterer Suchmaschinen-Optimierung
Im Januar 2006 wurde bekannt, dass Google stärker gegen unseriöse Methoden bei der Optimierung von internationalen Webseiten vorgehen will. Als erste Konsequenz des von Google-Mitarbeiter Matt Cutts ([4]) angekündigten verschärften Kampfes gegen Spam in Deutschland und anderen nicht-angelsächsischen Ländern entfernte die Suchmaschine die Online-Fahrzeugbörse Automobile.de und den Fahrzeughersteller BMW aus ihrem Index.[5] Ihr wird vorgeworfen, durch massiven Einsatz von Keywords (Spam), Trichterseiten (Doorway-Pages) und Javascript-Weiterleitungen Suchergebnisse zum eigenen Vorteil unlauter optimiert zu haben. Die Seite von BMW wurde bereits nach wenigen Tagen wieder in den Index aufgenommen, nachdem der Betreiber die strittigen Doorway-Pages entfernt hatte.[6]
Ob die ungezählten Weiterleitungen und Doorways von diversen weltweit agierenden Buchhändlern und Auktionsplattformen ähnlich konsequent liquidiert werden, war Ende Januar 2006 noch nicht zu eruieren.
Google in der Kritik
Zensur
Google entfernt auf seinen Ergebnisseiten Einträge wegen gesetzlicher Auflagen. Da Google in verschiedenen Ländern Zweigstellen unterhält, variieren auch die Art und das Ausmaß der Entfernung von Ergebnissen.
Die erste Gruppe umfasst Websites, die Inhalte anbieten, obwohl sie nicht das Urheberrecht oder eine entsprechende Genehmigung dazu besitzen. Dazu gehörten anfangs vor allem Websites, die geschütztes Material der Church of Scientology anboten. Mittlerweile entfernt Google alle Inhalte, für die jemand bei Google eine infringement notification (etwa: Rechtsverletzungsbescheid) gemäß dem US-amerikanischen DMCA-Gesetz einreicht [7]. Wird auf einer bestimmten Google-Ergebnisseite ein Eintrag aus diesem Grund unterdrückt, blendet Google unten auf der Seite einen entsprechenden Hinweis ein (Beispiel: [8], funktionierend am 30. Januar 2006).
Kritik an Google wird vor allem wegen der zweiten Gruppe von Eingriffen in den eigenen automatisierten Ranking-Betrieb laut. Dabei werden Ergebnisse entfernt, weil die Verbreitung der Inhalte auf den Seiten, auf die verwiesen wird, in dem betreffenden Land verboten ist.
So werden auf Google.de und Google.fr (der deutschen bzw. französischsprachigen Domain der Suchmaschine) einige Seiten mit Inhalten entfernt, die strafbar sind, in Deutschland z. B. nach §130 StGB („Volksverhetzung“). Die Gesetzgebung in Frankreich und Deutschland verbietet das Anbieten solcher Inhalte. Neben der eigentlichen Zensur wird auch Kritik an Googles Informationspolitik geübt. Google beschränkt sich auf den eigenen Hilfeseiten auf einen allgemeinen Hinweis, dass nur aufgrund lokaler Vorschriften Ergebnisse entfernt werden, dies aber mit einer Einblendung gekennzeichnet wird. Tatsächlich findet eine solche Einblendung in manchen Fällen aber nach wie vor nicht statt (Stand Januar 2006).
Besonderes Aufsehen erlangte Googles am 25. Januar 2006 freigeschaltete chinesische Suchmaschine Google.cn (Meldung [9]). Wie bei der deutschen und französischen Ausgabe ist das Ausmaß der Filterungen von den Behörden vorgeschrieben. Im Falle Chinas ist wegen der spezifischen Gewichtung verbotener Texte, die Filterung entsprechend intensiver, gleichwohl aber in Uebereinstimung mit den Gesetzen. In der Ausschlussliste finden sich Begriffe wie 法轮功 (Falungong), 六四 (Aufstand vom 4. Juni, Tian'anmen-Massaker 1989) oder 台湾独立 (Unabhängigkeit für Taiwan). Seiten, die den chinesischen Behörden nicht gefallen, werden nicht aufgelistet und bei Eingabe der Begriffe sind nur noch Seiten zu finden, die einen regierungsfreundlichen Tenor aufweisen. Google weist Nutzer bei der Suche nach Begriffen, die auf der Zensurliste stehen, auf die Entfernungen hin.
Kritiker verurteilen das Vorgehen von Google Inc. als Anbiedern aus Profitgründen an die chinesische Regierung mit ihren immer noch praktizierten Menschenrechtsverletzungen (Beispiel [10]). Google entgegnet, dass man die aufgelegten Einschränkungen mißbilligt, aber davon überzeugt sei, dass die zensierten Google-Ergebnisse eine Verbesserung gegenüber dem Status Quo zuvor seien [11].
Googles selbstgewähltes Firmenmotto Do nothing evil (Tu nichts Böses), gegen das sie nun in der Wahrnehmung der Kritiker verstoßen, ist zusammen mit Googles hohem Marktanteil ein Grund dafür, dass der Protest gegen das China-Geschäft größer ist als bei den Konkurrenten Yahoo! und MSN Search, die bereits mit ähnlichen Filterungen auf dem chinesischen Markt vertreten sind.
Datenschutz
Die Geschäftsmethoden von Google geraten seit einigen Jahren unter Beschuss, weil unter die Weigerung der Firma, Interna preiszugeben, auch konkrete Aussagen zum von der Firma praktizierten Datenschutz fallen (bzw. ob dieser überhaupt existiert).
Erster Kritikpunkt war die Vergabe von individuellen Cookies durch die Suchmaschine an ihre Benutzer. Offiziell dienen diese Cookies nur dazu, Einstellungen zu speichern; warum dazu automatisch eine für jeden Browser eindeutige und über 30 Jahre gültige Nummer vergeben wird, und dies selbst, wenn keine Einstellungen vorgenommen wurden, will Google nicht klären. Technisch ist es unumstritten einfacher, anstatt der Identifikationsnummer die Einstellungen selbst im Cookie zu speichern. Interessant ist in diesem Zusammenhang, dass eine Möglichkeit, persönliche Einstellungen auch ohne Cookie zu nutzen, kurz nach ihrer Entdeckung durch Google Watch seitens Google wieder abgestellt wurde.
Es wird deshalb vermutet, dass diese Identifikationsnummer nicht nur den Einstellungen dient, sondern auch dazu, Suchanfragen jedes Benutzers zu protokollieren, zumindest um daraus Rückschlüsse auf Interessensgebiete zu ziehen.
Mit dem Webmaildienst GMail kam weitere Kritik auf. Google hatte angekündigt, die Inhalte der über GMail empfangenen E-Mails zu durchsuchen, in erster Linie um dazu passende Werbung einzublenden. Nachdem dieses Vorhaben sogar unter kalifornischen Abgeordneten auf Ablehnung stieß, rückte Google zumindest offiziell davon wieder ab.
Das soziale Netzwerk Orkut steht zu guter Letzt ebenfalls unter argwöhnischer Beobachtung, da jeder Teilnehmer vor Benutzung detaillierte Auskünfte über sich machen muss. Dies ist zwar prinzipbedingt, da andernfalls der Nutzen eines solchen Netzwerks eher gering ist, jedoch wäre Google mit Hilfe aller drei Dienste in der Lage, über einzelne Benutzer genaue Profile zu erstellen und sie somit zum „gläsernen Kunden“ zu machen.
Die Bürgerrechtsgruppe Public Information Research nominierte Google 2003 in den USA für den „Big Brother Award“ (vgl. zum Thema [12]).
Der Google Dienst 'Google Desktop' entwendet Dateien von Computern und speichert diese zentral auf Google-Servern [13].
Monopol
Bei Suchmaschinenanfragen im deutschen Internet besitzt Google bereits einen Marktanteil von über 80 Prozent [14]. Medienforscher sehen die Meinungsmacht von Google mittlerweile als problematisch an. [15]. Kritiker sprechen bereits von einer zukünftigen Google-Gesellschaft [16]. Der Leiter der Pariser Nationalbibliothek sieht mit Google die Hegemonie des Englischen voranschreiten und will, in der Tradition des Gaullismus, eine eigene europäische Suchmaschine Quaero unter staatlicher Kontrolle etablieren. Seine Forderung bezieht sich ausdrücklich nicht nur auf das Buch-Digitalisierungsprojekt Google Book Search, sondern auf das ganze Google-System. Nötig sei ein europäischer Algorithmus. Einer privatwirtschaftlichen Suchmaschine wie Google fehle es vor allem an Dauerhaftigkeit. Das Ranking-System belohne grundsätzlich den Stärkeren gegenüber dem Schwächeren.
Gebrauch
Einfache Benutzung
Neben der einfachen Suche steht noch eine weitere Suchmaske (erweiterte Suche) zur Verfügung, über welche bestimmte Filter angewendet werden können.
Die einfache Suche verwendet bei Eingaben standardmäßig den booleschen Operator UND beim Eintrag mehrerer Begriffe. Es wird dabei nach allen Dokumenten gesucht, in denen diese Begriffe vorkommen. Gewichtet wird, neben dem Page Rank, meist danach, wo die Begriffe stehen – ob im Titel einer Seite, dem Dokumenten-Namen oder Verzeichnis, einer Überschrift etc.
Neben der booleschen Standardverknüpfung UND kann auch ein boolesches ODER („OR“ wahlweise auch „|“) verwendet werden. Suchbeispiel: Strand OR Beach - eine sowohl-als-auch Anweisung. Google berücksichtigt dabei alle Wörter, die innerhalb einer OR-Kette vorkommen. Hat man mehr als zwei Wörter zur Auswahl, verknüpft man diese also zu Wort1 OR Wort2 OR Wort3 …. Kann man sich zwischen verschiedenen Wortkombinationen nicht entscheiden, lassen sich einzelne Kombinationen auch mit Klammern zusammenfassen, z. B. (auto fahren) OR (flugzeug fliegen).
Um die Suche weiter einzugrenzen, kann man nach exakten Phrasen suchen. Die Suchbegriffe tauchen dann nicht wahllos im Dokument auf, sondern müssen in einer bestimmten Anordnung vorhanden sein. Exakte Suchphrasen werden mit Anführungszeichen kenntlich gemacht. Suchbeispiel: „Bearbeiten von Google“. Es werden keine Dokumente gesucht, in denen irgendwo das Wort „Bearbeiten“ und irgendwo das Wort „Google“ steht, sondern nur solche, in denen die Wörter in dieser Reihenfolge vorkommen. Wahlweise kann auch für ein Wort ein Platzhalter, kenntlich gemacht durch ein Sternchen „*“, gesetzt werden.
Als weiteres Ausschlusskriterium kann ein Minuszeichen „-“ Verwendung finden. Suchbeispiel: Hannibal -Lecter. Sucht nach einem antiken Feldherrn und schließt aber Seiten aus, in denen der Name in Verbindung mit einer Filmfigur namens „Lecter“ steht.
Die oft übliche Suche mit Wildcards ist bei Google indes nicht möglich. So wird bei der Suche nach „Googl*“ nicht nach den Begriffen „Googlin“ oder „Googler“ gesucht, sondern nur nach „Googl“.
Die Suche erlaubt eine Abfrage mit bis zu 32 Suchbegriffen (auch als Phrase). Diese Option ist hilfreich für das Suchen nach Dubletten oder Zweitverwertungen eines Textes.
Hinweise:
- Anhand dieser Verknüpfungen (die kombiniert angewendet werden können), sind schon sehr präzise Abfragen möglich.
- Bei Eingabe einfacher mathematischer Schreibweisen wie z. B. 2+5(4/5)^8 gibt Google standardmäßig keine Seiten aus, in denen diese Formulierung vorkommt, sondern gibt das Ergebnis der Rechnung (= 2.8388608) zurück.
- Man kann auch Einheiten Umrechnen lassen: z. B. inch in cm
- Google hat einen sehr großen Wortschatz. Vor allem bei Eigennamen, Marken und speziellen Fachbegriffen etc. empfiehlt sich Google als Rechtschreibhilfe. Beispiel: Schreibt man „DaimlerChrysler“ zusammen, auseinander oder mit Bindestrich? Google fragt bei einer unbekannten oder untypischen Eingabe: „Meinten Sie …“
Erweiterte Benutzung
Es kann zusätzlich zu dieser einfachen Such-Syntax eine erweiterte Syntax in die Suchmaske eingegeben, bzw. größtenteils auch über die „erweiterte Suche“ zusammengeklickt werden. Folgende, teils undokumentierte Schlüsselbegriffe sind derzeit bekannt. Diese Schlüsselbegriffe werden durch einen Doppelpunkt „:“ gekennzeichnet.
- cache: – gibt nur die von Google gespeicherten Seiten aus. Ist vor allem praktisch, wenn bei Portalen die Inhalte oft wechseln. Der Link, den man bei Google findet, führt aktuell oftmals auf eine Seite, deren Inhalte sich inzwischen geändert haben oder gar gelöscht wurden. Die Inhalte sind aber über einen bestimmten Zeitraum noch bei Google gespeichert und können dort gelesen werden.
- daterange: – schränkt die Suche auf einen Datumsbereich ein, in dem die Seite von Google indexiert wurde. Als Zeitangaben müssen Zahlen bezogen auf das Julianische Datum eingegeben werden. Errechnet werden diese Zahlen aus der Anzahl der Tage, die seit dem 1. Januar 4713 v. Chr. vergangen sind. Beispiel: 30.06.2003-30.06.2004 = daterange:2452820-2453186 (Onlinehilfe). Vorteil für Computer: sie brauchen sich nicht um Formate oder Namen von Tag, Woche oder Jahr zu kümmern.
- define: – Durchsucht Internet-Enzyklopädien wie Wikipedia und andere nach einer Definition des Suchbegriffes.
- filetype: – Sucht nach Dokumenten, mit bestimmten Dateiendungen. Beispiel: geschäftsbericht filetype:xls . Möglich sind grundsätzlich alle Dateiendungen. Google kann derzeit aber nur in folgende Formate „reinschauen“: PS, PDF, AI, DOC, PPT, XLS, sowie alle textbasierten Dateien wie RTF, TXT, ASP, PHP, CGI, HTML, LOG, INI, JS usw.
- inanchor: – Sucht nach den Begriffen nur in Links. Oftmals führt ein Link mit einer bestimmten Bezeichnung präziser zu einem Ziel, als wenn die Bezeichnung irgendwo im Text vorkommt.
- inurl: – gibt Seiten zurück, bei denen der Suchbegriff in der URL auftaucht. Beispiel: "Karl Müller" inurl:impressum
- intitle: – Sucht nach Dokumenten, bei welchen der oder die Suchbegriffe nur im Titel der Datei vorkommen. Beispiel: intitle:"Bearbeiten von Google"
- link: – Gibt alle Seiten aus, die auf eine bestimmte Seite verlinken. Beispiel: link:wikipedia.org . Diese Ausgabe kann etwa wichtig sein, um den Page Rank zu optimieren oder verwandte Seiten zu finden.
- site: – mit diesem Schlüsselbegriff lässt sich die Suche auf eine bestimmte Domain eingrenzen. Praktisch vor allem dann, wenn eine Homepage keine eigene Suchfunktion hat (z. B. Desoxyribonukleinsäure site:de.wikipedia.org) oder zur schnellen Suche innerhalb einer Top Level Domain (z. B. Bundeskanzlerin site:com).
- related: – sucht nach ähnlichen Seiten (z. B. related:de.wikipedia.org)
Die angewendeten Suchformeln lassen sich auch in Form der URL, die Google bei einer Suche ausgibt, speichern bzw. wiederholen und verlinken.
Siehe auch
Literatur
- Jean-Noël Jeanneney: Googles Herausforderung. Für eine europäische Bibliothek. Berlin: Wagenbach, Februar 2006. - ISBN 3-80312-534-0 (Der Autor ist Präsident der Französischen Nationalbibliothek; vgl. [17], [18], [19], Europäische Digitale Bibliothek)
- David Vise, Mark Malseed: Die Google-Story. Hamburg: Murmann Verlag, 2006. - ISBN 3-938017-56-2; Originalausgabe: The Google Story, New York: Random House, 2005. - ISBN 0-55380-457-X (Auszüge: [20]; Website zum Buch: [21])
- Tara Calishain, Rael Dornfest: Google Hacks, Beijing (u.a.): O'Reilly Verlag, 2003. - ISBN 3-89721-362-1
- Johnny Long: Google Hacking. Bonn: Mitp, 2005. - ISBN 3-82661-578-6 (Webseite des Autors)
- Malte Herwig: Generation Google, in: Eliten in einer egalitären Welt, Berlin: wjs, 2005. - ISBN 3-93798-911-0 (Website zum Buch)
- Kai Lehmann, Michael Schetsche (Hrsg.): Die Google-Gesellschaft. Vom Digitalen Wandel des Wissens. Bielefeld: transcript, 2005. - ISBN 3-89942-305-4 (Website zum Buch)
- Ulrich Wimmeroth: Google Dirty Tricks, PC underground, Hacks, Insider-Tricks, versteckte Funktionen. Düsseldorf: Data Becker, 2003. - ISBN 3-81582-333-1
- Wolfram Gieseke: Google: bessere Suchergebnisse. Wo gibts die besten Schnäppchen? Düsseldorf: Data Becker, 2004. - ISBN 3-81582-429-X
- Tara Calishain, Rael Dornfest: Google pocket guide. - 1st ed. - Beijing (u.a.): O'Reilly, 2003. - ISBN 0-59600-550-4
- Brad Hill: Google for Dummies. Hoboken, NJ (USA): Wiley & Sons, 2003. - ISBN 0-76454-420-9
- Carsten Harnisch, Richard Jungkunz: 213 Hacks für Google, Amazon und eBay: die neuen APIs nutzen, mit .NET, PHP, Flash, JavaScript, AppleScript, XML, für Anwender, Programmierer und Verkaufsprofis. Bonn: Galileo Press, 2004. - ISBN 3-89842-477-4
Zitate
- Man kann ohne Angst vor Übertreibung von einer „Generation Google“ sprechen, deren Umgang mit Wissen und Information nachhaltig von der Suchmaschine beeinflußt wird... Für die heutigen Teenager sind die runden Lettern der Suchmaschine zur kulturellen Ikone geworden, ein digitales delphisches Orakel. Malte Herwig („Generation Google“, in: Eliten in einer egalitären Welt, Berlin 2005)
- Alle Google-Nutzer wissen, dass bei der ... Fülle von Ergebnissen die Hierarchisierung des Angebotes eine zentrale Rolle spielt. So zahlreich die gefundenen Seiten auch sein mögen, der Kunde sieht sich doch nur die an, die ganz oben auf der Trefferliste stehen. Nach demselben Prinzip arbeiten die großen Supermärkte bei der Präsentation ihrer Waren, beispielsweise in der Sichtzone des Regals... Ihre Position im Regal weist auf ihre relative Bedeutung hin. (aus: Jeanneney, siehe Literatur, frz. Ausg. Seite 12)
Weblinks
- Googles US-amerikanische Site – wird beim Aufruf von auf Deutsch als Standardsprache eingestellten Browsern auf Google.de umgeleitet
- Google Blogoscoped – Blog von Philipp Lenssen mit Neuigkeiten (englisch)
- GoogleWatchBlog – Blog, der aktuell über alle Google-spezifischen-Themen berichtet (deutsch)
- Slashdot Thema Google – Nachrichten und Diskussionen (englisch)
- Artikel zu Google bei Dr. Web
- Alles über Google – Gut sortierte und weiterführende Links rund um Google
- Die Google-Story (Aus de:Bug)
Presseberichte
- „Die Welt ist keineswegs alles, was Google auflistet“, Telepolis, 25. Oktober 2002
- „Peeking Into Google“, internetnews.com, 2. März 2005, Informationen zum technischen Aufbau der Suchmaschine (engl.)
- „Google: Der alleswissende Gigant“, Tagesschau.de, 26. Januar 2006
- „Google drückt sich vor Verantwortung“, Tagesschau.de, 1. Februar 2006, Interview mit Marcel Machill (siehe auch Gatekeeper)
- „Life in the Googleplex. Inside Google Headquarters“, Time, 16. Februar 2006, Photo-Essay
- „Das Imperium“, WirtschaftsWoche, 8. März 2006, Nr. 10, Titelstory