Zum Inhalt springen

PageRank

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 22. Oktober 2005 um 09:20 Uhr durch 84.190.44.118 (Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.

PageRank (nach einem seiner Erfinder, Lawrence Page und von engl. rank - Rang) ist das von der Internet-Suchmaschine Google genutzte System für die Bewertung der gelisteten Seiten. Es geht ursprünglich auf den von den Google-Gründern entwickelten PageRank-Algorithmus zurück.

Das Grundprinzip lautet: Je mehr Links auf eine Seite verweisen, um so wichtiger ist sie. Je wichtiger wiederum die verweisenden Seiten sind, um so größer der Effekt. Der von Google angezeigte PageRank liegt zwischen 0 und 10. Normale Webseiten haben einen Rank von 1-5. Wichtige oder speziell optimierte Seiten erreichen Werte von 5-7. Seiten mit einem PageRank von 8 und höher sind sehr selten, z.B. die des Weißen Hauses, die Firmenseite von Microsoft oder Wikipedia.

Früher hatte ein hoher PageRank eine deutlich gehobene Positionierung in den Suchergebnissen bei Google zur Folge. Nach dem Jahreswechsel 2003/2004 ist nach einigen Änderungen dieser Effekt nicht mehr so stark zu spüren. Es ist eher eine Stabilisierung der Position von hoch bewerteten Seiten in der Trefferliste zu vermerken. Dennoch bringt ein hoher PageRank Vorteile für eine Webseite. So spidert Google z.B. Webseiten mit einem hohen PageRank öfter und tiefer.

Der PageRank-Algorithmus

Das grundsätzliche Prinzip des ursprünglichen PageRank-Algorithmus ist, dass jede Seite ein Gewicht besitzt, das um so größer ist, je mehr Seiten mit einem hohen eigenen Gewicht auf diese Seite verweisen. Das PageRank-Gewicht einer Seite berechnet sich also aus den Gewichten der auf verlinkenden Seiten . Verlinkt auf insgesamt verschiedene Seiten, so wird das Gewicht von anteilig auf diese Seiten aufgeteilt. Durch wiederholtes Anwenden der folgenden Berechnungsvorschrift konvergieren die Gewichte der einzelnen Seiten zu einem stabilen Wert:

Dabei ist ein Dämpfungsfaktor zwischen 0 und 1, mit dem ein kleiner Anteil des Gewichts einer jeden Seite abgezogen und gleichmäßig auf alle Seiten verteilt wird. Dies ist notwendig, damit das Gewicht nicht zu Seiten „abfließt“, die auf keine andere Seite verweisen. Zusätzlich muss ein Link von jeder Seite zu sich selbst hinzugefügt werden.

Die Gewichte der einzelnen Seiten lassen sich unter Umständen auch mit einem linearen Gleichungssystem lösen, da eine stabile Lösung ein Eigenwertproblem darstellt (siehe Markow-Kette).

Dabei ergibt sich aus der Adjazenzmatrix mit .

Normiert man den PageRank auf 1 und interpretiert das Gewicht einer Seite als Wahrscheinlichkeit, so gibt es die Wahrscheinlichkeit an, dass ein zufälliger Surfer (siehe Zufallspfad) sich auf einer Seite befindet.

Der heute von Google verwendete PageRank hat sicher nicht mehr exakt diese Form, geht aber auf diese Formel zurück. Der von Google angezeigte PageRank einer Seite ergibt sich wahrscheinlich durch Logarithmierung des Seitengewichts. Ein alternativer Algorithmus ist das Verfahren der Hubs und Authorities von Jon Kleinberg.

Dieses Verfahren verstärkt nebenbei einen Effekt eines "skalenfreien Netzwerks", den "Matthäuseffekt" nach Albert-Laszlo Barabási. Dieser Effekt wird in der Netzwerktheorie beschrieben. Stark vereinfacht bedeutet er: "Wer hat, dem wird gegeben." Das heißt, dass neu hinzukommende Seiten vor allem auf bereits bekannte Seiten verweisen. Diese werden dadurch schneller bekannt und ziehen mehr Links an als unbekannte Seiten von gleicher Qualität.

Dieses sinnvolle System kann in der Praxis von Seach Engine Optimizers (SEO) durch Cloaking, Spamming, dem Betreiben einer Linkfarm und anderen unseriösen Methoden unterlaufen werden. Aufgrund der wirtschaftlichen Bedeutung ist der PageRank in letzter Zeit mehr und mehr das Ziel von Fälschern geworden.

Siehe auch: Sponsored Links, Natural Listings, Suchmaschinen-Optimierung, Search Engine Marketing, Click Popularity, HITS-Algorithmus

Intervalle

Der letzte Intervall betrug 97 Tage (14.07.05 - 20.10.05)

Davor 84 Tage (22.04.05 - 14.07.05)

Davor 111 Tage (01.01.05 - 22.04.05)

Davor 86 Tage (07.10.04 - 01.01.05)

Davor 106 Tage (23.06.04 - 07.10.04)

Quelle: http://www.keyword1-keyword2.de

Literatur