Zum Inhalt springen

„Elo-Zahl“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
BKL Rating aufgelöst
 
(900 dazwischenliegende Versionen von mehr als 100 Benutzern, die nicht angezeigt werden)
Zeile 1: Zeile 1:
[[Datei:ChessSet.jpg|mini|Schach]]
Das '''Elo-System''' ist ein objektives [[Wertungszahlen im Schach|Wertungssystem]], das es erlaubt, die Spielstärke von [[Go (Brettspiel)|Go]]- und [[Schach]]spielern durch eine Wertungszahl (kurz: '''Elo-Zahl''') zu beschreiben. Es wurde von [[Arpad Elo]] in den [[1960er|sechziger]] Jahren entwickelt und auf dem [[FIDE|FIDE]]-Kongress in Siegen 1970 eingeführt.
[[Datei:Go board.jpg|mini|Go|alt=Linsenförmige Spielsteine in Schwarz und Weiß liegen unregelmäßig auf einem Holzbrett verteilt, das horizontal und vertikal liniert ist.]]
Die '''Elo-Zahl''' (auch '''Elozahl''') ist eine [[Wertungszahl (Schach)|Wertungszahl]], welche die Spielstärke von [[Schach]]spielern beschreibt. Sie wurde nach ihrem Erfinder [[Arpad Elo]] benannt. Inzwischen wurde das Konzept auch für andere Spiele und Sportarten adaptiert ([[#Weitere Anwendung und Verbreitung|s. u.]]).


Ausgehend vom ''Bradley-Terry-Modell'' (benannt nach R. A. Bradley und M. E. Terry,<ref>''E. E. M. van Berkum: Bradley-Terry model'', Encyclopedia of Mathematics [http://www.encyclopediaofmath.org/index.php?title=Bradley-Terry_model&oldid=22181 Online, abgerufen am 18. November 2014].</ref> die es im Jahr 1952 präsentierten<ref>Ralph Allan Bradley, Milton E. Terry: ''Rank Analysis of Incomplete Block Designs: I. The Method of Paired Comparisons.'' Biometrika, Bd. 39, Nr. 3/4, S. 324, 1952 [https://www.jstor.org/stable/2334029?seq=1#page_scan_tab_contents JSTOR (abgerufen am 22. August 2018)].</ref>), das wiederum auf einer Arbeit von [[Ernst Zermelo]] aus den 1920er Jahren basiert,<ref name="hunter">David R. Hunter: ''MM algorithms for generalized Bradley–Terry models.'' The Annals of Statistics, Bd. 32, Nr. 1, 2004, S. 384–406 [http://projecteuclid.org/euclid.aos/1079120141 Online] [https://www.jstor.org/stable/3448514?seq=1#page_scan_tab_contents JSTOR (abgerufen am 22. August 2018)].</ref><ref>Ernst Zermelo: ''Die Berechnung der Turnier-Ergebnisse als ein Maximumproblem der Wahrscheinlichkeitsrechnung.'' [[Mathematische Zeitschrift]], Bd. 29, Nr. 1, 1929, S.&nbsp;436–460 [https://link.springer.com/article/10.1007%2FBF01180541 DOI (abgerufen am 22. August 2018)].</ref><ref>Heinz-Dieter Ebbinghaus: ''Ernst Zermelo: An Approach to His Life and Work''. Springer, Berlin 2007, ISBN 978-3-540-49553-6, S. 268–269.</ref> entwickelte Arpad Elo 1960 ein [[Objektivität|objektives]] [[Wertungszahl (Schach)|Wertungssystem]] für den US-amerikanischen Schachverband [[United States Chess Federation|USCF]]. Es wurde 1970 auf dem Kongress in [[Siegen]] vom Weltschachverband [[FIDE]] übernommen. Der Weltschachverband nennt sein System ''FIDE rating system''. Eine Wertungszahl heißt offiziell ''FIDE rating'', wird umgangssprachlich aber zumeist einfach als „Elo-Zahl“ bezeichnet. Neben dem internationalen Wertungssystem der FIDE existieren auch nationale Wertungssysteme mit unterschiedlichen Namen. In Deutschland heißt das nationale Wertungssystem ''[[Deutsche Wertungszahl|Deutsche Wertungszahl (DWZ)]]'', in Österreich werden ''(nationale) Elo-Zahlen'' berechnet, und in der Schweiz gibt es eine ''Führungsliste'' mit ''Führungszahlen''. Diese Systeme werten wesentlich mehr lokale Turniere aus, berechnen die Wertungszahlen aber ebenso nach den Methoden von Arpad Elo mit meist nur geringen Modifikationen und abweichenden Faktoren.
Neben der FIDE-Elo existieren auch noch nationale Wertungssysteme, mit unterschiedlichen Namen.

In Deutschland heißt das nationale Wertungssystem [[DWZ (Schach)|DWZ]], in Österreich und in der Schweiz heißt es ebenfalls ''Elo'', in der Berechnung unterscheiden sich diese Systeme aber meist nur durch verschiedene kleinere Faktoren.
== Grundprinzip ==
Jedem Spieler ist eine Elo-Zahl <math>R</math> (von englisch ''rating'') zugeordnet. Je stärker der Spieler, desto höher die Zahl. Treten mehrere Spieler gegeneinander an, so lässt sich aus den Elo-Zahlen der Spieler die erwartete Punktezahl der jeweiligen Spieler bestimmen.

Nach der Begegnung wird das Elo-Rating der Spieler ihren Ergebnissen angepasst. Je nach Differenz zwischen Erwartungswert und Ergebnis gewinnt ein Spieler Elo-Rating-Punkte hinzu oder verliert sie. Das System ist so konstruiert, dass Elo-Rating-Punkte im Regelfall<ref group="Anm" name="diff-k">Wenn Spieler unterschiedliche Entwicklungsfaktoren haben, kann sich ein Spielergebnis unterschiedlich stark auf deren Elo-Zahl auswirken, sodass keine reine Umverteilung von Punkten stattfindet. Ähnlich kann es sein, wenn einer der Spieler vorher noch keine Elo-Zahl hatte.</ref> unter den beteiligten Spielern umverteilt werden.


== Berechnung ==
== Berechnung ==
Jemand, der zum Beispiel gerade in den Schachklub eingetreten ist, hat noch keine Elo-Zahl. Nach einer Reihe von Partien gegen verschiedene Spieler wird seine Elo-Zahl zunächst eingeschätzt. Nach dieser Phase werden die tatsächlichen Ergebnisse der Partien für den Elo-Punktestand gewertet.


=== Erwartungswert ===
Für die jeweilige Berechnung des neuen Elo-Stands ist die ''erwartete Punktezahl'' wichtig, welche Spieler A gegen Spieler B erreicht, dabei gilt wie üblich ein Sieg einen Punkt, ein Unentschieden einen halben Punkt und eine Niederlage null Punkte.
Bei einer Begegnung zweier Spieler gibt es für einen Sieg einen, für ein Unentschieden einen halben und für eine Niederlage keinen Punkt. Die ''erwartete Punktezahl'' ''E'' (von englisch ''expected score'', [[Erwartungswert]]) ist somit die [[Wahrscheinlichkeit]], dass der Spieler gewinnt, multipliziert mit einem Punkt, plus die Wahrscheinlichkeit für ein [[Remis]] multipliziert mit einem halben Punkt. Der Erwartungswert liegt damit zwischen 0 und&nbsp;1.<ref group="Anm">Der Erwartungswert darf also nicht mit der Gewinnwahrscheinlichkeit verwechselt werden, weil er offen lässt, ob die Punkte durch Siege, Remis oder durch eine Kombination aus beiden erreicht werden. So hat ein Spieler beispielsweise einen Erwartungswert in einer Partie von 0,5, sowohl wenn er voraussichtlich alle Partien remisiert, als auch, wenn er je die Hälfte der Partien gewinnt und verliert. Im Bezug auf die Gewinnquote gibt der Erwartungswert also nur Auskunft darüber, wie viele Gewinnspiele ''maximal'' zu erwarten sind. Bei einem Erwartungswert von <math display="inline">E=x</math> sind das ''nicht mehr als'' <math display="inline">x*100</math> &nbsp;Prozent der Spiele.</ref>


Das Elo-System ist mathematisch so modelliert, dass sich bei der Begegnung zweier Spieler A und B der Erwartungswert ''E''<sub>A</sub> für den Spieler A aus den beiden Ratings ''R''<sub>A</sub> und ''R''<sub>B</sub> wie folgt berechnet:
Dazu eine Anmerkung: Gäbe es kein Remis, so wäre die erwartete Punktezahl gerade die Wahrscheinlichkeit, dass A gewinnt. Da eine Schachpartie auch unentschieden enden kann, ist der erwartete Punktestand gleich der Wahrscheinlichkeit zu gewinnen plus ein halb mal der Wahrscheinlichkeit zu remisieren. Die ''Wahrscheinlichkeiten'' für Sieg, Remis und Niederlage werden im Elo-System gar nicht benötigt, sondern nur die ''Erwartungswerte''.


{| class="wikitable float-right" style="text-align:center;"
:<math>E_A = \frac 1 {1 + 10^{\ ^{\frac{R_B - R_A}{400} }}}</math>
|-
! ''R''<sub>A</sub>−''R''<sub>B</sub>
! ''E''<sub>A</sub>
! ''E''<sub>B</sub>
|-
| {{0|00}}0
| 50,0 %
| 50,0 %
|-
| {{0}}50
| 57,1 %
| 42,9 %
|-
| 100
| 64,0 %
| 36,0 %
|-
| 200
| 76,0 %
| 24,0 %
|-
| 300
| 84,9 %
| 15,1 %
|-
| 400
| 90,9 %
| {{0}}9,1 %
|-
| 500
| 94,7 %
| {{0}}5,3 %
|}


:{|class="wikitable"
::''E<sub>A</sub>'': Erwarteter Punktestand für Spieler A. Bei einer Serie von 5 Spielen kann man auch ''E<sub>A</sub>'' mit 5 multiplizieren.
| style="padding-left:1em; padding-right:1em; padding-top:0.5em; padding-bottom:0.5em;" | <math>E_\mathrm A = \frac{ 10^{R_\mathrm A/400} }{ 10^{R_\mathrm A/400} + 10^{R_\mathrm B/400}} = \frac{1}{ 1 + 10^{ ( R_\mathrm B - R_\mathrm A )/400}} </math>
::''R<sub>A</sub>'': bisherige Elo-Zahl von Spieler A
|}
::''R<sub>B</sub>'': bisherige Elo-Zahl von Spieler B


Der Erwartungswert für A beträgt nun ''E<sub>A</sub>'' &middot; 100 %.
Entsprechend gilt für ''E''<sub>B</sub>, den erwarteten Punktestand von Spieler B:
:{|class="wikitable"
| style="padding-left:1em; padding-right:1em; padding-top:0.5em; padding-bottom:0.5em;" | <math>E_\mathrm B = \frac{ 10^{R_\mathrm B/400} }{ 10^{R_\mathrm A/400} + 10^{R_\mathrm B/400}} = \frac{1}{ 1 + 10^{ ( R_\mathrm A - R_\mathrm B )/400}} </math>
|}


Da genau ein Punkt auf beide Spieler verteilt wird, muss gelten:
:<math>R_A^\prime = R_A + k(S_A - E_A)</math>
:{|class="wikitable"
| style="padding-left:1em; padding-right:1em; padding-top:0.5em; padding-bottom:0.5em;" | <math>E_\mathrm A + E_\mathrm B = 1</math>
|}
Aus den Formeln für den Erwartungswert ergibt sich, dass diese Bedingung stets erfüllt ist.


Die in der Formel enthaltene, willkürlich festgelegte Zahl 400 legt die Abstufung der Elo-Skala fest: Bei einer Elo-Differenz von 400 wird der Spieler höchstwahrscheinlich gewinnen {{nowrap|1=(''E''<sub>A</sub> = 91 %).}} Die Zahl 400 wurde von Arpad Elo so gewählt, damit die Elo-Zahlen mit den Wertungszahlen des früher verwendeten Schach-Rating-Systems von [[Kenneth Harkness]] möglichst gut kompatibel sind.<ref group="Anm">Tatsächlich kann man das Harkness-System als eine stückweise lineare Approximation an das Elo-Modell auffassen.</ref> Im Schweizer Tischtennis wird z.&nbsp;B. 200 statt 400 verwendet, im deutschen 150, [[#Tischtennis|s.&nbsp;u.]]
::''k'': ist üblicherweise 15, bei Top-Spielern (Elo > 2400) 10, bei weniger als 30 gewerteten Partien 25
::''S<sub>A</sub>'': tatsächlich gespielter Punktestand (1 für jeden Sieg, 0,5 für jedes Unentschieden, 0 für jede Niederlage)
::''R'<sub>A</sub>'': Neue Elo-Zahl von Spieler A


Beträgt der Wertungsunterschied <math display="inline">|R_\mathrm B - R_\mathrm A|</math> mehr als 400 Punkte, so erlaubt die FIDE anstelle der tatsächlichen Differenz den Wert 400 bzw. −400 zu benutzen. Ab 2022 kann ein Spieler aber nur noch einmal pro Turnier von einer solchen Aufwertung profitieren, für die anderen eventuellen Gegner mit einem Wertungsunterschied > 400 wird dann mit dem tatsächlichen Wertungsunterschied gerechnet.<ref name="FIDE Rating Regulations"/>
=== Ein (erfundenes) Beispiel ===
Der Schachspieler [[Garri Kimowitsch Kasparow|Garri Kasparow]] (Elo: 2806) verliert gegen die Schachspielerin [[Zsuzsa Polgar]] (Elo: 2577). Gemäß der ersten Formel erwartet man, dass Kasparow (im Beispiel der Spieler A) gegen Polgar ''E<sub>A</sub>'' = 0,789 spielt:


{{Überarbeiten|1=[[Diskussion:Elo-Zahl#Mathematischer Hintergrund|Diskussion unter „Mathematischer Hintergrund“]]|2=Der folgende Absatz und die Abschnitte zur [[#Multiplikativität der Erwartungswerte|Multiplikativität der Erwartungswerte]] und [[#Intransitivität von Wahrscheinlichkeitsrelationen|Intransitivität von Wahrscheinlichkeitsrelationen]]|grund=|Plural=1}}
:<math>E_A = \frac 1 {1 + 10^{\ ^{\frac{2577 - 2806}{400}}}} = 0{,}789</math>
Die Gewinnerwartung eines Spielers als Funktion der Punktedifferenz folgt in Elos Modell einer [[logistische Funktion|logistischen Funktion]]. Das heißt jedoch ''nicht'', dass die Stärken der Spieler logistisch verteilt sind. Elo verzichtet auf eine solche Verteilungsannahme. Sein Modell fußt auf der charakteristischen Eigenschaft der ''Multiplikativität der Erwartungswerte''.


=== Multiplikativität der Erwartungswerte ===
Das heißt, Kasparow sollte 78,9% der erreichbaren Punkte gegen Polgar erzielen. Nun verliert Kasparow, ''S<sub>A</sub>'' ist also 0. Sein neuer Elo-Punktestand ist dann:
Die Erwartungswerte sind multiplikativ – mithilfe dieser Eigenschaft lässt sich Elos Modell definieren. Wenn etwa Spieler '''A''' gegenüber Spieler '''B''' ein <math>3:1</math>-Favorit ist (d.&nbsp;h., '''A''' erzielt in Partien gegen '''B''' 75 Prozent der Punkte) und '''B''' gegenüber '''C''' ein <math>2:1</math>-Favorit, so fordert bzw. folgt aus Elos Modell, dass '''A''' gegenüber '''C''' ein <math>6:1</math>-Favorit ist.


Oder allgemein ausgedrückt:
:<math>R_A^\prime = 2806 + 10(0 - 0{,}789) = 2798</math>
:Ist '''A''' ein <math>x:1</math>-Favorit gegenüber '''B''' und
:ist '''B''' ein <math>\;\!y:1</math>-Favorit gegenüber '''C''', so
:ist gemäß Elos Modell '''A''' ein <math>xy:1</math>-Favorit gegenüber '''C'''.


Dies kann man leicht nachrechnen. Die ''Multiplikativität'' ist aber ''keine'' Konsequenz aus einer [[Normalverteilung]], was man oft liest. Diese bezieht sich nur auf die Abweichung der tatsächlichen Spielergebnisse eines Spielers vom Erwartungswert ([[#Schwankungsbreite und Aussagekraft|s.&nbsp;u.]]) und nicht auf eine Normalverteilung der Stärken der Spieler. Die Forderung nach Multiplikativität stellt den besseren Ausgangspunkt für die Entwicklung des Modells dar – insbesondere für die Kalkulation der Spielstärken von Spielern früherer Epochen.
Kasparow hätte also 8 Elo-Punkte eingebüßt.

=== Anpassung der Elo-Zahl ===

Die Elo-Zahlen der Spieler werden regelmäßig aktualisiert. Erzielt ein Spieler in seinen Partien mehr Punkte, als von seiner aktuellen Elo-Zahl zu erwarten war, gewinnt er Elo-Punkte hinzu; erzielt er weniger, verliert er Elo-Punkte. Maßgeblich ist hierfür der so genannte ''k''-Faktor oder ''k''-Koeffizient. Er gibt an, wie viele Elo-Punkte ein Spieler bei einer Partie maximal hinzugewinnen kann (bei einem Sieg über einen viel stärker bewerteten Gegner) oder maximal verlieren kann (Niederlage gegen einen viel schwächer bewerteten Gegner). Wenn ein Spieler ''S'' Partiepunkte erzielt, der Erwartungswert aufgrund bestehender Elo-Zahlen aber ''E'' betrug, ändert sich seine Elo-Zahl um <math display="inline">k\cdot(S-E)</math>. Die neue Elo-Zahl <math display="inline">R^\prime</math> ist also
:{|class="wikitable"
| style="padding-left:1em; padding-right:1em; padding-top:0.7em; padding-bottom:0.7em;" | <math>R^\prime = R + {k} \cdot (S - E)</math>
|}

Der Faktor ''k'' ist durch das Elo-Modell nicht festgelegt. Wenn er sehr groß gewählt wird, wirken sich zufällige Einzelergebnisse stark aus: die Elo-Zahl ''R'' kann stark schwanken. Wenn er sehr klein gewählt wird, ist die Anpassung „träge“: ''R'' wird erst nach vielen Partien an eine reale Änderung der Spielstärke angepasst. Für Spitzenspieler mit eher konstanter Leistung ist ein kleinerer Faktor angebracht als für Anfänger, die schnell Fortschritte machen können. Der Koeffizient ''k'' wird daher dem „Entwicklungsstand“ eines Spielers angepasst.<ref group="Anm" name="diff-k" />

Im Schach hat ''k'' im Regelfall den Wert 40, 20 oder 10:<ref name="FIDE Rating Regulations">''[https://handbook.fide.com/chapter/B022022 FIDE Rating Regulations]'' In: ''handbook.fide.com'' Punkt 8.3 „Ermittlung der Elo-Anpassung von Ranglisten-Spielern“ mit Festlegungen für den k-Faktor (englisch)</ref>
* ''k'' = 40: für Spieler, die neu in der Ratingliste sind und weniger als dreißig gewertete Partien aufweisen;
* ''k'' = 40: für alle Spieler bis zum Ende des Kalenderjahres ihres 18. Geburtstags, solange ihre Bewertung <&nbsp;2300 bleibt;
* ''k'' = 20: für alle Spieler mit mindestens dreißig gewerteten Partien und einer maximalen Elo-Zahl <&nbsp;2400. Dieser k-Wert trifft für die meisten erwachsenen Spieler zu;
* ''k'' = 10: für alle Top-Spieler, die eine Elo-Zahl ≥&nbsp;2400 erreicht haben, selbst wenn die Elo-Zahl wieder unter diesen Wert fällt.
Ausnahmsweise kann ''k'' für einen Spieler in einer einzelnen Wertungsperiode einen abweichenden Wert annehmen, da das Produkt aus ''k'' und der Anzahl der für einen Spieler in einer Wertungsperiode ausgewerteten Partien (''n'') kleiner als 700 sein muss. In diesem Fall wird ''k'' auf die größte natürliche Zahl abgesenkt, für die <math>k\cdot n<700</math> gilt.

Im Schweizer Tischtennis gilt {{nowrap|1=''k'' = 15}} einheitlich für alle Spieler.

==== Anpassung nach einer Partie ====
Beispiel: Alfred (''R''<sub>A</sub>&nbsp;=&nbsp;2306) spielt gegen Berta (''R''<sub>B</sub>&nbsp;=&nbsp;2077). Das entspricht einem Wertungsunterschied <math>R_A - R_B= 229</math>. Zu erwarten ist, dass Alfred gegen Berta im Mittel 0,789 Punkte pro Spiel erzielt:

: <math>E_\mathrm A = \frac {1}{1 + 10^{(2077 - 2306) / 400} }= 0{,}789</math>.

Nach einer Partie gibt es drei Möglichkeiten (angenommen sei dabei <math>k=20</math> für beide Spieler):

'''a) Berta gewinnt''' – also ''S''<sub>A</sub>&nbsp;=&nbsp;0.<br />Die neuen Elo-Punktestände <math>R_A'</math> für Alfred und <math>R_B'</math> für Berta sind

: <math>R_A^\prime = 2306 + 20 \cdot (0 - 0{,}789) \approx 2290,
\qquad R_B^\prime = 2077 + 20 \cdot (1 - 0{,}211) \approx 2093.</math>
Alfred büßt 16 Elo-Punkte ein, während Berta 16 Elo-Punkte hinzugewinnt.

'''b) Alfred gewinnt''' – also ''S''<sub>A</sub>&nbsp;=&nbsp;1.

: <math>R_A^\prime = 2306 + 20 \cdot (1 - 0{,}789) \approx 2310,
\qquad R_B^\prime = 2077 + 20 \cdot (0 - 0{,}211) \approx 2073.</math>
Alfred erhält 4 Elo-Punkte, Berta verliert 4.

'''c) Unentschieden''' – also ''S''<sub>A</sub>&nbsp;=&nbsp;½.

: <math>R_A^\prime = 2306 + 20 \cdot (0{,}5 - 0{,}789) \approx 2300,
\qquad R_B^\prime = 2077 + 20 \cdot (0{,}5 - 0{,}211) \approx 2083.</math>
Alfred verliert 6 Elo-Punkte, Berta gewinnt 6.

==== Maximaler Punktgewinn durch eine Partie ====
Ab welchem Wertungsunterschied (Elo-Differenz zwischen den Spielern) ist bei einem Sieg der maximale Elo-Punktgewinn möglich?

Der maximal mögliche Elo-Punktgewinn/-verlust ist durch den ''k''-Faktor festgelegt. Da Elo-Punkte auf ganze Zahlen gerundet werden, muss der rechnerische Punktgewinn <math display="inline">k\cdot(S_\mathrm A-E_\mathrm A)</math> mindestens ''k''&nbsp;−&nbsp;0,5 betragen. Demnach muss gelten (wegen {{nowrap|1=''S''<sub>A</sub> = 1):}}
:<math>k \cdot (1 - E_\mathrm A) \ge k - 0{,}5\quad \rArr\quad E_\mathrm A \le \frac{1}{2k}</math>.

Mit der Formel<ref group="Anm">Aus der Modellierung der erwarteten Punktzahl als
<math display="inline">\;E_\mathrm A = 1 / ( 1 + 10^{ ( R_\mathrm B - R_\mathrm A )/400})\;</math>
folgt
<math display="inline">\;10^{(R_\mathrm B - R_\mathrm A)/400} = {1}/{E_\mathrm A} - 1\;</math>,
und daraus ergibt sich für die Elo-Differenz der Spieler
<math display="inline">\;R_\mathrm B - R_\mathrm A = 400 \cdot \log_{10} ({1}/{E_\mathrm A} - 1)\,</math>.
</ref>
:<math>R_\mathrm B - R_\mathrm A = 400\cdot\log_{10}\left(\tfrac{1}{E_\mathrm A} - 1\right) </math>
erhält man
:<math>R_\mathrm B - R_\mathrm A \ge 512\ ; 637 \ ; 760 </math>
für die ''k''-Werte 10, 20 bzw. 40. Ein Topspieler (''k''&nbsp;=&nbsp;10) kann mit einer Partie maximal 10 Elo-Punkte gewinnen und muss dafür einen Spieler mit einer um 512 höheren Elo-Zahl besiegen.

==== Spiel gegen einen gleichstarken Spieler ====
Sind beide Spieler gleich stark, also <math display="inline">R_\mathrm B - R_\mathrm A = 0</math>, ist <math display="inline">E_\mathrm A = 0{,}5</math>. Bei einem Sieg werden <math display="inline">k \cdot (1 - 0{,}5) =\tfrac{k}{2}</math> Elo-Punkte hinzugewonnen, bei einer Niederlage gehen <math display="inline">\tfrac k 2</math> Elo-Punkte verloren. Bei einem Remis bleiben die Elo-Zahlen unverändert.

=== Elo-Performance ===
Als ''Elo-Performance'' (auch ''Turnierleistung'' genannt) bezeichnet man die in Elo-Punkten ausgedrückte Leistung eines Spielers in einem einzelnen Turnier. Im Gegensatz zur normalen Elo-Berechnung geht die vorherige Elo-Zahl nicht in diese Wertung ein.

Die Elo-Performance ''P'' ist rechnerisch die Elo-Zahl, die ein Spieler haben müsste, damit das erzielte Ergebnis ''S'' gerade gleich dem Erwartungswert ''E'' ist. Eine Näherungsformel ist
:<math>P=R_\mathrm G + 800 \cdot \left ( \tfrac S N - 0{,}5 \right ),</math>
wobei ''R''<sub>G</sub> das mittlere Rating der Gegner ist und ''N'' die Zahl der gespielten Partien. Diese Näherung ist besonders gut, wenn ''S/N'' nahe bei 0,5 ist.

Die Elo-Performance wird neben ihrem rein sportlichen Aussagewert als Kriterium zur Vergabe von Sonderpreisen gewählt, wenn ein anderer direkter Leistungsvergleich der Spieler nicht möglich ist&nbsp;– z.&nbsp;B., um den besten Einzelspieler in einem Mannschaftsturnier zu bestimmen.

== Probleme und statistische Phänomene von Rating-Systemen {{Anker|Probleme von Rating-Systemen}} ==
=== Intransitivität von Wahrscheinlichkeitsrelationen ===
Ist Spieler A gegenüber Spieler B der Favorit und B gegenüber C, so besitzt A ein höheres Rating als B und B ein höheres als C. Damit besitzt A ein höheres Rating als C und ''müsste'' Favorit gegenüber C sein.

Diese Folgerung ist aber keineswegs zwingend, da Wahrscheinlichkeits- bzw. Präferenzrelationen nicht notwendigerweise [[Transitive Relation|transitiv]] sind. Dieses Problem ist keine Besonderheit des Elo-Systems, sondern ein prinzipielles Problem aller Rating-Systeme. (vgl. [[Condorcet-Paradoxon]], „Chinesische Würfel“ oder „[[Intransitive Würfel]]“)

Transitivität ist jedoch eine notwendige Voraussetzung für ein sinnvolles [[Beurteilung|Rating]]-System. Um diese Eigenschaft zu sichern, setzte Arpad Elo bei der Entwicklung seines Rating-Systems voraus, dass das zu erwartende Spielergebnis in Abhängigkeit der Spielstärken mithilfe der Formel <math>E_\mathrm A = 1 / ( 1 + 10^{(R_\mathrm B - R_\mathrm A) / 400} )</math> beschreibbar ist. Aus dieser Annahme folgt neben der Transitivität auch die oben dargestellte Multiplikativität der Erwartungswerte.

=== Deflation und Inflation ===
Will man mithilfe der Elo-Zahlen – oder anderer Ratings, dies betrifft nicht nur das Elo-System – die Stärken von Spielern aus unterschiedlichen Epochen vergleichen, so sollte ein Rating von z.&nbsp;B. 1600 aus dem Jahre 1970 gleichbedeutend mit einem Rating von 1600 aus dem Jahre 2000 sein. Insbesondere sollte, da sich infolge der Weiterentwicklung der Theorie die durchschnittliche Spielstärke im Laufe der Zeit zumindest nicht verschlechtert, sich die mittlere Ratingzahl nicht verringern.

Beim Elo-System gewinnt der Sieger einer Partie genau so viele Rating-Punkte hinzu, wie der Verlierer einbüßt (falls beide den gleichen k-Faktor zur Berechnung nutzen): die mittlere Spielstärke beider bleibt gleich. Umfasst der ''Rating-Pool'' (die Rangliste) nur starke Spieler, so ist folgendes Phänomen zu beobachten: Sooft ein Spieler neu in die Ratings aufgenommen wird, tritt er mit einer gewissen (niedrigen) Punktezahl ein. Im Laufe seiner Karriere verbessert er seine Stärke, gewinnt Punkte hinzu und scheidet später mit einer (hohen) Punktezahl aus – dadurch werden der Gesamtheit Punkte entzogen, und die mittlere Ratingzahl sinkt; d.&nbsp;h., das System ist deflationär.

Vergrößert man den Rating-Pool auch auf schwächere Spieler, so tritt der entgegengesetzte Effekt auf: Viele Spieler verlassen den Rating-Pool mit einem niedrigeren Rating, als ihnen bei Eintritt zugemessen wurde – das System wird nun inflationär.

Dies war insbesondere früher der Fall, als der Weltschachbund [[FIDE]] Schachspieler erst ab einer Wertungszahl von 2200 in die Rangliste aufnahm. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, zuletzt auf 1000.<ref>[chrome-extension://oemmndcbldboiebfnladdacbdfmadadm/https://www.fide.com/docs/regulations/FIDE%20Rating%20Regulations%202022.pdf FIDE Rating Regulations] (PDF), abgerufen am 4. März 2023.</ref> Dennoch lässt es sich nicht vermeiden, dass viele Spieler den Rating-Pool mit niedrigeren Wertungszahlen verlassen als sie bei Eintritt erhielten. Eine maßvolle Inflation ist jedoch durchaus erwünscht, diese sollte in ihrem Ausmaß der Weiterentwicklung der Spielstärken im Laufe der Zeit Rechnung tragen, allerdings ergibt sich hier zumeist das Problem einer zu großen Inflation.

So konnten die Elo-Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spielstärke absolut zu sein. Im Jahr 2000 gab es nur einen Spieler (Kasparow) mit einer Elo-Zahl größer 2800, elf Spieler größer 2700, und etwa 90 erreichten einen Wert über 2600.<ref name="FIDE Jul.2000">{{Internetquelle | url=https://ratings.fide.com/toparc.phtml?cod=1 | titel=Top 100 Players July 2000 - Archive | hrsg=fide.com | zugriff=2021-12-06}}</ref> Im Juli 2010 hatten bereits über 200 aktive Spieler eine Elo-Zahl größer 2600, davon 37 mindestens 2700; drei Spieler hatten sogar eine Elozahl von 2800 oder höher,<ref name="FIDE Jul.2010">{{Internetquelle | url=https://ratings.fide.com/toparc.phtml?cod=169 | titel=Top 100 Players July 2010 - Archive | hrsg=fide.com | zugriff=2021-12-06}}</ref> was 20 Jahre zuvor undenkbar schien.

Die durchschnittliche Elo-Zahl der ersten 100 Spieler der Weltrangliste stieg zwischen Juli 2000 und Juli 2012 von 2644 auf 2703 Punkte, also eine Steigerung um 59 Wertungspunkte. Seit 2012 liegt der Mittelwert zwischen 2700 und 2706 und ist damit recht konstant.<ref>http://ratings.fide.com/toplist.phtml?list=men</ref>

=== Das Tausend-Partien-Problem ===
Ein weiteres Phänomen ist das sogenannte ''Tausend-Partien-Problem''. Oft treffen Spieler der gleichen Spielstärke immer wieder aufeinander. Angenommen, zwei Spieler mit Elo 2000 spielen zehn Partien, bei denen der eine 80 % der Punkte erreicht. Nach der Berechnung der neuen Elo-Zahl ergeben sich die Werte 2080 für den Sieger und 1920 für den Verlierer. Tragen die beiden Spieler jedoch 1000 Partien mit gleichem Punkteverhältnis aus, ohne dass die Wertung aktualisiert wird, so ergibt sich für den Sieger eine neue Wertungszahl, die höher als die des aktuellen [[Schachweltmeister|Weltmeisters]] ist. Jedoch ist dieses Szenario nur theoretischer Natur. Nach dem [[Gesetz der großen Zahlen|Statistikgesetz der großen Zahl]] darf man erwarten, dass die beiden gleich starken Spieler (beide hatten Elo 2000) sich nach vielen Partien den zu erwartenden 50 % annähern. Zudem wird es in der Praxis nie 1000 Partien ohne Ratingaktualisierung geben.

Die Entwicklung der Wertzahlen wird auch von der Auswertungsperiode beeinflusst. Nach einer Testphase mit unregelmäßigen Veröffentlichungen wurde von 1975 bis 1980 einmal jährlich im Januar eine neue Liste veröffentlicht. Beginnend im Juli 1981 wurde auf halbjährliche Veröffentlichung umgestellt und dies bis Juli 2000 so beibehalten. Im Oktober 2000 wurde dann auf Veröffentlichung alle drei Monate umgestellt. Von Juli 2009 bis Juli 2012 wurde alle zwei Monate ausgewertet.<ref name="FIDE">''[http://www.fide.com/component/content/article/1-fide-news/4059-changes-to-title-and-rating-regulations-effective-from-july-1st-2009 Changes in the Rating Regulations from 1.7.2009]'' Auf: fide.com, 15. Juli 2009</ref> Seit August 2012 wird monatlich ausgewertet.<ref>[http://en.chessbase.com/post/fide-july-ratings-carlsen-at-a-record-2837 FIDE July ratings – Carlsen at a record 2837], chessbase.com (englisch)</ref> Die minimale Wertungszahl beträgt seitdem 1000 Punkte, zuvor lag sie bei 1200. Sinnvoll wäre prinzipiell eine Auswertung nach jedem Turnier, da so Formschwankungen von Spielern besser ausgeglichen werden können. Allerdings ist das derzeit nicht geplant.

=== Schwankungsbreite und Aussagekraft ===
Die Wertungszahlen eines einzelnen Spielers sind [[Intervallskala|intervallskaliert]] und annähernd [[Normalverteilung|normalverteilt]] und schwanken mit einer [[Standardabweichung (Wahrscheinlichkeitstheorie)|Standardabweichung]] von 200 um einen mittleren Wert. Es gibt viele Schachspieler mit Spielstärken unter 1200. Auf diesem Spielniveau ist das Elo-System in der Vorhersagesicherheit aber nur eingeschränkt anwendbar. Wichtig ist insbesondere auf Hobbyspielerniveau, dass ein Spieler seine Zahl auch gegen stärkere Gegner verteidigen kann, ohne sich auf besondere Eigenschaften wie unbewusste psychische Schwächen oder schlechtes Zeitmanagement von Neulingen konzentrieren zu müssen. Utopisch hohe Werte werden durch Niederlagen schnell, exakt und zuverlässig korrigiert. Die recht stabile Elo-Zahl wird mit verschiedenen Verfahren ermittelt. Manche gehen von wenigen Spielen aus oder von ähnlich starken [[Turnier]]teilnehmern. Nach vielen Partien erreichen aber alle sehr ähnliche Gleichgewichte. Bei Computern<!-- gegen Mensch? --> ist die Verteilung nicht nur per 200-Punkte-Definition gleich, sondern auch vom Kurvenverhalten her darüber hinaus sehr ähnlich, allerdings gibt es bei ähnlich starken Maschinen eine weitere Spielstärkenspreizung in den verschiedenen Partiephasen.


== Schach ==
== Schach ==
=== Einstufung der Spieler nach Elo-Zahl ===


Vor Einführung der Elo-Zahl stufte man die Spieler beim Schach in neun Klassen oder Kategorien ein. Ein Unterschied von einer Klasse bedeutete, dass der bessere Spieler als Ergebnis einer Partie 0,75 Punkte ''erwarten'' darf. Im Elo-System entspricht dieser Spielstärkeunterschied einer Differenz von etwa 200 Wertungspunkten (genauer: 191).<ref group="Anm">Mit <math display="inline">E_A = 0{,}75</math> ergibt sich eine Wertungsdifferenz von rund 191:
Nach der Wertungszahl kann man Schachspieler folgenden Kategorien zuordnen:
:<math display="inline">R_B - R_A = 400 \cdot \log_{10}\left(\frac{1}{0{,}75} - 1\right) \approx 190{,}85</math></ref> Eine Erweiterung stellt das [[Glicko-System]] dar.


{| class="wikitable"
{| {{Prettytable}}
|+ Zuordnung der Titel nach der Wertungszahl
|-
! Elo-Zahl
! Elo-Zahl
! Kategorie
! Offene Kategorie
! Kategorie Frauen
|-
|-
|ab 2.700 || [[Super-Großmeister]]
| ≥ 2500 || colspan="2" | [[Großmeister (Schach)|Großmeister (GM)]]

|-
|-
| 2400–2499 || colspan="2" | [[Internationaler Meister|Internationaler Meister (IM)]]
|2.500-2.699 || [[Großmeister (Schach)|Großmeister]]
|-
|-
| 2300–2399 || [[FIDE-Meister|FIDE-Meister (FM)]] || [[Großmeister (Schach)|Großmeister der Frauen (WGM)]]
|2.400-2.499 || [[Internationaler Meister |Internationale Meister]]
|-
|-
| 2200–2299 || [[Candidate Master|Candidate Master (CM)]] oder<br>[[Nationaler Meister (Schach)|Nationaler Meister]] || [[Internationaler Meister|Internationaler Meister der Frauen (WIM)]]
|2.300-2.399 || [[FIDE-Meister]]
|-
|-
| 2100–2199 || Meisteranwärter || [[FIDE-Meister|FIDE-Meister der Frauen (WFM)]]
|2.200-2.299 || Nationaler Meister
|-
|-
| 2000–2099 || Starker Amateur || [[Candidate Master|Candidate Master der Frauen (WCM)]]
|2.000-2.199 || Meisteranwärter, Experten
|-
|-
| < 2000 || colspan="2" | Amateur
|1.800-1.999 || Amateure, Klasse A, sehr gute Vereinsspieler
|-
|1.600-1.799 || Amateure, Klasse B, starke Freizeitspieler
|-
|1.400-1.599 || Amateure, Klasse C, überdurchschnittliche Spieler
|-
|1.200-1.399 || Amateure, Klasse D, 1250 durchschnittlicher Hobbyspieler
|-
|1.000-1.200 || unterdurchschnittlicher Hobbyspieler
|-
|unter 1.000 || Anfänger
|}
|}


Zu beachten ist dabei, dass man die verschiedenen Titel Großmeister (GM) und Internationaler Meister (IM) nicht nur auf Grund einer bestimmten Elo-Zahl erhält, sondern durch die Erfüllung von anderen festgelegten Normen. Um den Titel nach Erfüllung aller Normen zu erhalten, muss ein angehender GM allerdings eine Elo-Zahl von mindestens 2500, ein IM eine Zahl von mindestens 2400 einmal erreicht haben. Bei entsprechender Punktzahl wird der offene Großmeistertitel an Spieler aller Geschlechter vergeben, der Großmeistertitel der Frauen kann von diesen bereits ca. 200 Punkte vorher erreicht werden.<ref>{{Internetquelle |url=https://handbook.fide.com/chapter/B012022 |titel=B. Permanent Commissions / 01. International Title Regulations (Qualification Commission) / FIDE Title Regulations effective from 1 January 2022 / FIDE Handbook |sprache=en |abruf=2022-12-15}}</ref>
Zu beachten ist dabei, dass man die verschiedenen Meistertitel nicht auf Grund einer bestimmten ELO-Zahl erhält, sondern durch die Erfüllung von festgelegten Normen.


Unterhalb 2000 Elo-Punkten gibt es keine offiziellen Titel, weshalb eine objektive Benennung der Spielstärke schwierig ist. Zur groben Einschätzung kann in Deutschland der [[Deutsche Wertungszahl|DWZ]]-Schnitt der Amateurligen dienen (Die Deutsche Wertzahl DWZ ist zwar nicht dasselbe wie die international übliche ELO-Zahl, aber vergleichbar). Im Schachverband Württemberg liegt der DWZ-Schnitt in der Oberliga bei ca.&nbsp;2100, in den Verbandsligen bei ca.&nbsp;1900, in den Landesligen bei ca.&nbsp;1700, den Bezirksligen bei ca.&nbsp;1600 usw.<ref>[https://ergebnisse.svw.info/tools/dwz-schnitt.php DWZ-Schnitte der Ligen im SVW], abgerufen am 10.&nbsp;April 2022.</ref> Wie in anderen Sportarten auch erreichen Gelegenheitsspieler selten das Niveau der Bezirksliga.
Die typische ''Kaffeehausspielstärke'' liegt etwa zwischen 1.400 und 1.700, Spielstärken über 1.800 werden von Nicht-Vereinsspielern selten erreicht.


Nachdem im Jahr 1970 die Elo-Zahl als Wertungssystem eingeführt worden war, hatte zunächst [[Bobby Fischer]]s Bestmarke von 2785 Punkten vom Juli 1972 für viele Jahre Bestand. Im Jahre 1999 erreichte der damalige klassische<!-- link? --> Schachweltmeister [[Garri Kimowitsch Kasparow|Garri Kasparow]] die Elo-Zahl von 2851 Punkten, die erst im Januar 2013 von Magnus Carlsen mit 2861 Punkten übertroffen wurde. Inzwischen konnte Carlsen den Rekord auf 2882 erhöhen (Liste vom Mai 2014).
Der Umfang einer Klasse beträgt 200 Elo-Punkte. Das System ist so geeicht, dass ein Unterschied von 200 Punkten einer Gewinnerwartung des stärkeren Spielers von 75% entspricht, 400 Punkte entsprechen knapp 94% Gewinnerwartung. Der Vergleich beruht auf statistischen Verfahren. Schon bei 600 Punkten Unterschied gewinnt der stärkere Spieler praktisch-statistisch immer, und zwar obwohl die Spielstärke bei Menschen natürlich von der Tagesform und Motivation abhängt. Die Verteilung ist bei Computern nicht nur per 200-Punkte-Definition gleich, sondern auch vom Kurvenverhalten her darüberhinaus sehr ähnlich, allerdings gibt es bei ähnlichstarken Maschinen eine weitere Spielstärkenspreizung in den verschiedenen Partiephasen.


Spieler mit einer Elo-Zahl über 2600 gehören zum erweiterten Kreis der Weltspitze (etwa TOP 200), Spieler mit über 2700 zum engeren Kreis (etwa TOP 30). Aktuell (Stand: September 2024) erreichen nur zwei Spieler 2800: [[Hikaru Nakamura]] und [[Magnus Carlsen]].
Die Berechnung der Zahl Elo wird durchgeführt durch den Vergleich von Schachspielern, die gegeneinander spielen.


{{Siehe auch|Liste der Schachspieler mit einer besten Elo-Zahl von mindestens 2700}}
Das Elo-System teilt die Schachspieler mit Hilfe einer Wertungszahl in neun Klassen ein, wobei die untere Grenze der obersten Klasse bei 2.600 und die obere Grenze der untersten Klasse bei 1.200 liegt. Die Wertungszahlen eines einzelnen Spielers sind intervallskaliert und normalverteilt; sie schwanken mit einer Standardabweichung von 200 um einen mittleren Wert. Es gibt viele Spieler mit Spielstärken unter 1.200, das ELO-System ist auf diesem Spielniveau in der Vorhersagesicherheit aber nur eingeschränkt gültig. Wichtig ist insbesondere auf Hobbyspielerniveau, dass ein Spieler seine Zahl auch gegen stärkere Gegner verteidigen kann, sich also nicht auf besondere Eigenschaften wie unbewusste psychische Schwächen oder schlechtes Zeitmanagement von Neulingen konzentriert. Wenige Niederlagen des Spielers korrigieren Utopiewerte schnell, exakt und zuverlässig. Die recht stabile ELO-Zahl wird mit verschiedenen Verfahren ermittelt. Manche gehen von wenigen Spielen aus oder von ähnlich starken Turnierteilnehmern, nach vielen Partien erreichen alle sehr ähnliche Gleichgewichte.


Elo-Zahlen können auch für einzelne Turniere berechnet werden (''siehe oben: [[#Elo-Performance|Elo-Performance]]''). Hierbei gelang [[Fabiano Caruana]] im Jahr 2014 beim Turnier um den [[Sinquefield Cup 2014|Sinquefield Cup]] in St. Louis eine Elo-Leistung von 3103.<ref>{{Internetquelle|autor=[[Johannes Fischer (Journalist, 1963)|Johannes Fischer]]|hrsg=chessbase|titel=Sinquefield Cup: Drei Remis zum Schluss|url=http://de.chessbase.com/post/sinquefield-cup-drei-remis-zum-schluss |werk=Schach Nachrichten|datum=2014-09-07|zugriff=2014-09-08}}</ref> Die davor gültige höchste Turnier-Elo-Leistung war 3002, erzielt von Magnus Carlsen in Nanjing im Jahr 2010.<ref>Stefan Löffler: ''Wie eine Maschine. Der erst 22 Jahre alte Fabiano Caruana lehrt Schach-Weltmeister Carlsen das Fürchten''. In: Frankfurter Allgemeine Zeitung vom 8. September 2014, S. 32.</ref>
Grundlage der Berechnung ist die Hypothese, die Verteilung der Spielstärke in der Gesamtheit der Spieler entspreche mathematisch der [[Normalverteilung]] (Gaußsche Glockenkurve). Ausgehend von dieser Hypothese lässt sich für zwei Gegner statistisch voraussagen, mit welcher Wahrscheinlichkeit der eine Spieler gewinnen wird. Im Sonderfall der identischen Wertungszahl sind die Wahrscheinlichkeiten gleich hoch. Bei einem Turnier lässt sich anhand der Wertungszahl eines Spieler und des Durchschnitts der Wertungszahlen seiner Gegner voraussagen, welche Punktzahl er wahrscheinlich erzielen wird. Nach Abschluss des Turniers wird das tatsächliche Ergebnis mit dem statistisch vorausgesagten Ergebnis verglichen und aus der Abweichung die neue Wertungszahl des Spielers errechnet.


=== Historische Elo-Zahl im Schach ===
Der Weltschachbund [[FIDE]] nahm Schachspieler früher erst ab einer Wertungszahl von 2200 in die Rangliste auf. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, derzeit liegt sie bei 1400. Dieses Heruntersetzen macht rein mathematisch durchaus Sinn, denn das ELO-System leidet ein wenig an einem einfachen mathematischen Problem: Wird die untere Grenze per Definition nicht auf den Wet 0 gesetzt, dann kommt es im Laufe der Zeit praktisch zwangsläufig zu einer Inflation der Zahlen, denn Spieler, die eine Zahl < der definierten Einstiegszahl haben, werden trotzdem mit dem höheren Wert in die Berechnung einbezogen. So können die Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spieltstärke absolut zu sein. Schaut man ca. 20 Jahre zurück, so gab es z.B. nur zwei Spieler mit einer ELO >2700, nur ca. 10-20 Spieler erreichten einen Wert von >2600.
{{Hauptartikel|historische Elo-Zahl}}
Der Wachstumseffekt wird auch durch ein zweites Problem getrieben: Oft spielen Spieler der gleichen Spielstärke immer wieder gegeneinander. Das führt zu einem Problem, das auch das "1000 Partien Problem" genannt wird. Man kann es an einem einfachen Beispiel erläutern:
Für den Vergleich heutiger Spitzenspieler mit Großmeistern vor der Einführung der Elo-Zahl wird die sogenannte historische Elo-Zahl verwendet.
2 Spieler mit ELO 2000 spielen 10 Partien, bei denen der eine Spieler 80% der Punkte holt. Nach der Berechnung neunen ELO ergeben sich 2080 für den Sieger und 1020 für den Verleirer. Spielen die Spieler jedoch 1.000 Partien mit gleichem Punkteverhältnis, so ergibt sich für den Sieger eine neue Wertzehl, die höher als die des aktuellen Weltmeisters ist. Die heute üblichen Turniere gerade in der Weltspitze fördern also die Inflation der Zahlen.
Und noch ein Problem beeinflusst die Wertzahl-Entwicklung - die Auswertungsperiode. Wurde bis 2002 nur halbjährlich ausgewertet, so wurde die Periode jetzt auf 3 Monate verkürzt. Sinnvoll wäre prinzipiell eine Auswertung nach jedem Turnier, da so Formschwankungen von Spielern besser ausgeglichen werden können. Allerdings ist das derzeit nicht geplant.


=== Spielstärke der Schachprogramme {{Anker|Computerschach}} ===
=== Spielstärken ausgewählter Schachspieler ===
{{Hauptartikel|Schachprogramm#Elo-Zahlen|titel1=Rangliste ausgewählter Schachprogramme}}
Der ehemalige [[Schachweltmeister]] [[Garri Kimowitsch Kasparow|Garri Kasparow]] erreichte 1999 eine ELO-Zahl von 2.851 Punkten. Großmeister kommen normalerweise auf eine ELO-Zahl von mindestens 2.500, ab 2.600 Punkten kann man von der erweiterten Weltspitze sprechen. Dies waren nach FIDE-Auswertung die Top 20 (April 2006):
Die Elo-Zahlen der Schachcomputer bzw. Computerprogramme sind nicht ohne weiteres mit denen menschlicher Schachspieler zu vergleichen, da sie überwiegend durch Partien zwischen Computern ermittelt wurden und nicht durch Teilnahme an offiziellen Turnieren.


=== Turnierkategorien – Einteilung der Turniere nach Elo-Zahl {{Anker|Turnierkategorie}} ===
{| {{Prettytable}}
{| class="wikitable floatright" style="text-align:center"
!Rang
!Name
!Rating
!Land
|-
|-
! rowspan="2" | Turnier-<br>kategorie
! align="right" |1
! colspan="2" | Elo-Durchschnitt
|[[Wesselin Topalow]]
|2804
|[[Bild:Flag of Bulgaria.svg|30px|]] [[Bulgarien|BUL]]
|-
|-
! Von
! align="right" |2
! Bis
|[[Viswanathan Anand]]
|2803
|[[Bild:Flag of India.svg|30px]] [[Indien|IND]]
|-
|-
! 1
! align="right" |3
|2251 || 2275
|[[Lewon Aronjan]]
|2756
|[[Bild:Flag of Armenia.svg|30px|]] [[Armenien|ARM]]
|-
|-
! 2
! align="right" |4
|2276 || 2300
|[[Pjotr Naumowitsch Swidler|Pjotr Swidler]]
|2743
|[[Bild:Flag of Russia.svg|30px]] [[Russland|RUS]]
|-
|-
! 3
! align="right" |5
|'''2301''' || 2325
|[[Péter Lékó]]
|2738
|[[Bild:Flag of Hungary.svg|30px]] [[Ungarn|HUN]]
|-
|-
| colspan="3" style="font-size:25%" | '''. . .'''
! align="right" |
|[[Ruslan Ponomarjow]]
|2738
|[[Bild:Flag of Ukraine.svg|30px|]] [[Ukraine|UKR]]
|-
! align="right" |7
|[[Alexander Morosewitsch]]
|2730
|[[Bild:Flag of Russia.svg|30px]] [[Russland|RUS]]
|-
! align="right" |8
|[[Wladimir Kramnik]]
|2729
|[[Bild:Flag of Russia.svg|30px]] [[Russland|RUS]]
|-
|-
! 7
! align="right" |7
|'''2401''' || 2425
|[[Péter Lékó]]
|2740
|[[Bild:Flag of Hungary.svg|30px]] [[Ungarn|HUN]]
|-
|-
| colspan="3" style="font-size:25%" | '''. . .'''
! align="right" |9
|[[Boris Gelfand]]
|2727
|[[Bild:Flag of Israel.svg|30px|]] [[Israel|ISR]]
|-
|-
!11
! align="right" |10
|'''2501''' || 2525
|[[Wassyl Iwantschuk]]
|2723
|[[Bild:Flag of Ukraine.svg|30px|]] [[Ukraine|UKR]]
|-
|-
| colspan="3" style="font-size:25%" | '''. . .'''
! align="right" |11
|[[Michael Adams]]
|2720
|[[Bild:Flag of the United Kingdom.svg|30px]] [[Großbritannien|ENG]]
|-
! align="right" |12
|[[Alexander Grischtschuk]]
|2719
|[[Bild:Flag of Russia.svg|30px]] [[Russland|RUS]]
|-
|-
!15
! align="right" |13
|'''2601''' || 2625
|[[Teymur Rəcəbov]]
|2717
|[[Bild:Flag of Azerbaijan.svg|30px]] [[Aserbaidschan|AZE]]
|-
|-
| colspan="3" style="font-size:25%" | '''. . .'''
! align="right" |14
|[[Judit Polgár]]
|2711
|[[Bild:Flag of Hungary.svg|30px]] [[Ungarn|HUN]]
|-
|-
!19
! align="right" |15
|'''2701''' || 2725
|[[Etienne Bacrot]]
|2708
|[[Bild:Flag of France.svg|30px]] [[Frankreich|FRA]]
|-
|-
!20
|-
|2726 || 2750
! align="right" |16
|[[Wladimir Akopjan]]
|2706
|[[Bild:Flag of Armenia.svg|30px|]] [[Armenien|ARM]]
|-
! align="right" |17
|[[Jewgeni Barejew]]
|2701
|[[Bild:Flag of Russia.svg|30px]] [[Russland|RUS]]
|-
|-
!21
! align="right" |18
|2751 || 2775
|[[Alexei Schirow]]
|2699
|[[Bild:Flag of Spain.svg|30px|]] [[Spanien|ESP]]
|-
|-
!22
! align="right" |
|2776 || 2800
|[[Şəhriyar Məmmədyarov]]
|2699
|[[Bild:Flag of Azerbaijan.svg|30px]] [[Aserbaidschan|AZE]]
|-
|-
!23
! align="right" |20
|'''2801''' || 2825
|[[Liviu-Dieter Nisipeanu]]
|2695
|[[Bild:Flag of Romania.svg|30px]] [[Rumänien|ROM]]
|-
| colspan="4" | …
|-
! align="right" |41
|[[Arkadij Naiditsch]]
|2664
|[[Bild:Flag of Germany.svg|30px]] [[Bundesrepublik Deutschland|GER]]
|-
| colspan="4" | …
|-
! align="right" |89
|[[Vadim Milov]]
|2622
|[[Bild:Flag of Switzerland.svg|30px]] [[Schweiz|SUI]]
|-
| colspan="4" | …
|-
! align="right" |337
|[[Nikolaus Stanec]]
|2543
|[[Bild:Flag of Austria.svg|30px]] [[Österreich|AUT]]
|}
|}
Auch Rundenturniere werden nach der durchschnittlichen Elo-Zahl der Teilnehmer in [[Turnierkategorie (Schach)|Kategorien]] eingeteilt. Hierbei entspricht ein Unterschied um eine Kategorie 25 Elo-Punkten. Als Turnier der Kategorie 1 wird dabei ein Turnier eingestuft, dessen Teilnehmer im Durchschnitt 2251 bis 2275 Elo-Punkte haben. Die zurzeit stärksten Turniere erreichen die Kategorie 22, was einem Durchschnitt von 2776 bis 2800 Elo-Punkten entspricht. Bei der [[Zürich Chess Challenge]] 2014 wurde im Januar 2014 erstmals Kategorie 23 (mit einem Elo-Durchschnitt von 2801) erreicht.


== Weitere Anwendung und Verbreitung ==
=== Historische Elo-Zahl im Schach ===


=== Go ===
Hierzu ein eigenständiger Artikel: [[Historische Elo-Zahl]]
Bei [[Go (Spiel)|Go]] wird die Spielstärke traditionell in [[Kyū]]-Graden ([[Japanische Schrift|japanisch]] {{lang|ja|級}}) für Schüler und Dan-Graden ([[Japanische Schrift|jap.]] {{lang|ja|段}}) für Meister angegeben. Die Ermittlung dieser Spielstärke basiert innerhalb der ''European Go Federation'' und bei vielen Go-Servern im Internet auf einem von Elo abgeleiteten System, welches Kyū- und Dan-Grade wie folgt abbildet:


{| class="wikitable"
=== Computerschach ===
! kyu/dan
Eine Rangliste ausgewählter [[Schachprogramm]]e ist im selbigen Artikel zu finden.

Diese Elo-Zahlen sind nicht ohne weiteres mit denen menschlicher Schachspieler zu vergleichen, da sie überwiegend durch Partien zwischen Computern ermittelt wurden und nicht durch Teilnahme an offiziellen Turnieren.

== Go ==
Bei [[Go (Brettspiel)|Go]] wird die Spielstärke traditionell in [[Kyu]]- (Schüler) und Dan-Graden (Meister) angegeben.

Die Ermittlung dieser Spielstärke basiert innerhalb der European Go Federation und bei vielen Go-Servern im Internet auf einem von Elo abgeleiteten System, welches Kyu und Dan Grade wie folgt abbildet:

{| {{Prettytable}}
! kyu / dan
! Elo
! Elo
! Spielstärke und -erfahrung<ref>{{Internetquelle |url=https://www.remi-coulom.fr/WHR/ |titel=Whole-History Rating: A Bayesian Rating System for Players of Time-Varying Strength |autor=Rémi Coulom |werk=remi-coulom.fr |datum= |sprache=en |zugriff=2017-01-04}}</ref>
! Spielstärke und -erfahrung
|-
|-
| weltbeste 9p-[[Künstliche Intelligenz|KI]] || align="right" | 5185 || [[AlphaGo|AlphaGo Zero]] auf einem [[Tensor Processing Unit|TPU]]-v2-Modul mit 180 [[FLOPS|TFLOPS]]<ref name="NatureArticle">{{Literatur |Autor=David Silver, Julian Schrittwieser, Karen Simonyan |Titel=Mastering the game of Go without human knowledge |Sammelwerk=Nature |Band=550 |Seiten=354–359 |Datum=2017-10-19 |Sprache=en |Online=[http://www.nature.com/nature/journal/v550/n7676/full/nature24270.html Abstract]}}</ref>
| 30k || align="right" | &nbsp; || Regeln verstanden, aber noch keine Partie gespielt
|-
|-
| weltbester 9p-Spieler || align="right" | 3830 || [[Shin Jin-seo]], weltbester Gospieler (Stand: 2. Dezember 2021)<ref>{{Internetquelle |url=https://www.goratings.org/players/1313.html |titel=Shin Jin-seo |autor= |werk=goratings.org |sprache=en |datum= |zugriff=2021-12-02}}</ref>
| 29k - 28k || align="right" | &nbsp; || einige Partien gespielt
|-
|-
| 27k - 25k || align="right" | &nbsp; || einige Partien gegen Anfänger gewonnen
| '''1p''' 9p || align="right" | ab circa 2600 || professioneller Go-Spieler (aus Japan, Korea oder China), der stärker als ein Amateur-6dan spielt
|-
|-
| 24k - 22k || align="right" | &nbsp; || einige Partien gegen Nicht-Anfänger gewonnen
| 4d 7d || align="right" | ab 2350 || einer der besten Spieler seines Landes
|-
|-
| 21k - 18k || align="right" | 0 - 349 || Hobby-Spieler
| '''1d''' 3d || align="right" | 2050–2349 || sehr guter Club-Spieler
|-
|-
| 17k - 14k || align="right" | 350 - 749 || regelmäßiger Hobby-Spieler
| 4k '''1k''' || align="right" | 1650–2049 || guter Club-Spieler
|-
|-
| 13k - 10k || align="right" | 750 - 1149 || Club-Spieler
| 9k 5k || align="right" | 1150–1649 || regelmäßiger Club-Spieler
|-
|-
| 9k - 5k || align="right" | 1150 - 1649 || regelmäßiger Club-Spieler
| 13k 10k || align="right" | 750–1149 || Club-Spieler
|-
|-
| 4k - 1k || align="right" | 1650 - 2049 || guter Club-Spieler
| 17k 14k || align="right" | 350–749 || regelmäßiger Hobby-Spieler
|-
|-
| 1d - 3d || align="right" | 2050 - 2349 || sehr guter Club-Spieler
| 21k 18k || align="right" | 0–349 || Hobby-Spieler
|-
|-
| 4d - 6d || align="right" | 2350 - 2649 || einer der besten Spieler seines Landes
| 24k 22k || align="right" | &nbsp; || einige Partien gegen Nicht-Anfänger gewonnen
|-
|-
| 1p - 7p || align="right" | 2650 - 2999 || professioneller Go-Spieler (aus Japan, Korea oder China), der stärker als ein Amateur-6dan spielt
| 27k 25k || align="right" | &nbsp; || einige Partien gegen Anfänger gewonnen
|-
| 29k – 28k || align="right" | &nbsp; || einige Partien gespielt
|-
| 30k || align="right" | &nbsp; || Regeln verstanden, aber noch keine Partie gespielt
|}
|}


== Weblinks ==
=== Fußball ===
Die [[FIFA-Weltrangliste]] der Frauen wird seit 2003 offiziell mit einem adaptierten Elo-System ermittelt. Seit 2018 wird die FIFA-Weltrangliste für Männer auch auf ein adaptiertes Elo-System umgestellt.<ref>{{Webarchiv|url=https://resources.fifa.com/image/upload/revision-of-the-fifa-coca-cola-world-ranking.pdf?cloudid=akxuma7jhfjwlwfmfexz |wayback=20180612140112 |text=Überarbeitung der FIFA/Coca-Cola-Weltrangliste }}</ref>


Eine länger bestehende inoffizielle Adaption des Elo-Systems für Männernationalmannschaften im Fußball sind die [[World Football Elo Ratings]]. Inoffizielle Elo-Ratings werden auch für Fußball-Clubs vorgenommen.<ref>http://clubelo.com/</ref>
*[http://www.fide.com/ratings/top.phtml Top 100 Aktive Schachspieler]
*[http://www.schachcomputer.info/html/body_elo_script.html FIDE-Rating Berechnung]
*[http://www.benoni.de/schach/elo Eloabfrage mit historischen Zahlen bis 1990]
*[http://w1.859.telia.com/~u85924109/ssdf SSDF Computer-Rangliste]
*[http://www.eloratings.net Elo-Ratings im Fußball]
*[http://www.european-go.org/rating/gor.html EGF-Rangliste europäischer Go-Spieler]


=== Tischtennis ===
[[Kategorie:Schach]][[Kategorie:Go]]
==== In der Schweiz ====
[[Swiss Table Tennis]] nutzt seit der Saison 2010/2011 eine etwas modifizierte Elo-Formel zur Berechnung von Wertungspunkten<ref>[https://docs.google.com/viewer?a=v&pid=sites&srcid=ZGVmYXVsdGRvbWFpbnx0dGNicmlnZ2xpc3dlYnNpdGV8Z3g6MzU2MmExMjAxYjVjYTYy] (abgerufen am 20. Juli 2017).</ref>

:{|class="wikitable"
| style="padding-left:1em; padding-right:1em; padding-top:0.5em; padding-bottom:0.5em;" | <math>E_\mathrm A = \frac {1}{1 + 10^{(R_\mathrm B - R_\mathrm A) / {\color{RoyalPurple}200}} }</math>
|}

:: ''E<sub>A</sub>'': Erwarteter Punktestand für Spieler A.
:: ''R<sub>A</sub>'': bisherige Punkte-Zahl von Spieler A
:: ''R<sub>B</sub>'': bisherige Punkte-Zahl von Spieler B

Der Erwartungswert für A beträgt nun ''E<sub>A</sub>'' · 100 %. Die neue Punkte-Zahl von Spieler A ist

:{|class="wikitable"
| style="padding-left:1em; padding-right:1em; padding-top:0.5em; padding-bottom:0.5em;" | <math>R_\mathrm A^\prime = R_\mathrm A + {\color{OliveGreen}15} \cdot (S_\mathrm A - E_\mathrm A)</math>
|}

:: ''S<sub>A</sub>'': tatsächlich gespielter Punktestand (1 für jeden Sieg, 0 für jede Niederlage, Remis ist im Tischtennis nicht möglich)

==== In Deutschland: der TTR-Wert ====
In Deutschland wird nach einem analogen System für jeden Aktiven ein '''TTR-Wert''' errechnet.<ref name="tt-2020-11">Zeitschrift [[Tischtennis (Zeitschrift)|tischtennis]], 2020/11, Seite 32 f.</ref> Hier wird die Wertungsdifferenz durch 150 geteilt.<ref>[https://statistik-dresden.de/archives/11964#_ftn1 TTR – Die „Elo-Zahl“ des Tischtennis] In: ''statistik-dresden.de''</ref>
:{|class="wikitable"
| style="padding-left:1em; padding-right:1em; padding-top:0.5em; padding-bottom:0.5em;" | <math>E_\mathrm A = \frac {1}{1 + 10^{(R_\mathrm B - R_\mathrm A) / {\color{RoyalPurple}150}} }</math>
|}

=== Scrabble ===
Für weltweites [[Scrabble]] (Global Scrabble) wird eine Elo-Rangliste von der World English-language Scrabble Players’ Association (WESPA) geführt. Auf Rang 1 dieser Elo-Rangliste liegt der Neuseeländer [[Nigel Richards (Scrabblespieler)|Nigel Richards]] (2156 Elo-Punkte, Stand 17. Oktober 2020).<ref>{{cite web | url=https://www.wespa.org/aardvark/cgi-bin/rating.cgi | title=WESPA Ratings | date=2020-10-17 | accessdate=2021-04-04 | language=Englisch}}</ref>

Seit 2009 wird auch für das deutschsprachige Scrabble eine Elo-Rangliste geführt&nbsp;– basierend auf Turnieren ab dem Jahr 2005. Im Juni 2022 führte der Deutsche [[Timon Boerner]] mit 1718 Elo-Punkten die Liste an, in der 213 Personen aufgeführt sind.<ref>{{Internetquelle |url=https://scrabble-info.de/elo-rangliste/ |titel=Elo-Rangliste {{!}} Scrabble Info |sprache=de-DE |abruf=2022-08-01}}</ref>

=== League of Legends ===
Im [[Multiplayer Online Battle Arena|MOBA]] [[League of Legends]], einer Liga eines Computer-Strategiespiels, wurde ebenfalls das Elo-System bei gewerteten Spielen verwendet. Inzwischen wurde es durch das Ligasystem ersetzt, dem aber noch das Elo-System zu Grunde liegt.<ref>{{Webarchiv|url=http://forums.euw.leagueoflegends.com/board/showthread.php?t=1232907&page=1#post11986204 |wayback=20150625033020 |text=DER Informationsthread über Ligen, MMR und (Hidden-)Elo }}</ref>

Bei einem Sieg bekommt man ''League Points'' (LP), bei einer Niederlage werden LP abgezogen. Bis Ende 2020 musste man bei 100 LP ein [[Best-of-Modus|Best of three bzw. five]] gewinnen, um eine Liga aufzusteigen.

== Siehe auch ==
* [[Adaptives Testen]]

== Anmerkungen ==
<references group="Anm" />

== Weblinks ==
* [https://en.chessbase.com/post/arpad-elo-and-the-elo-rating-system Würdigung von Arpad Elo mit Foto und Erklärung seiner Formel.] In: ''chessbase.com'' (englisch)
;Schach
* [http://en.chessbase.com/post/rating-inflation-its-causes-and-poible-cures Analyse der Rating-Inflation von Jeff Sonas] In: ''chessbase.com'' (englisch)
* [http://www.fide.com/fide/handbook.html?id=172&view=article FIDE Rating Regulations] In: ''fide.com''
* [http://ratings.fide.com/top.phtml Top 100 Aktive Schachspieler] In: ''ratings.fide.com''
* [http://www.2700chess.com/ Elo Live-Liste der Schachspieler über 2700 (Frauen: 2500) Punkte] In: ''2700chess.com''
* [http://www.benoni.de/schach/elo Eloabfrage mit historischen Zahlen bis 1970] In: ''benoni.de''
* [http://www.chessgraphs.com/ Compare chess players' rating histories with FIDE data back to 1970] In: ''chessgraphs.com'' (englisch)
* [http://www.netschach.de/ELO-System/ELO-Rechner Elo Rechner Webanwendung] In: ''netschach.de''. mit Alfred (2806) vs. Berta (2577) als Rechenbeispiel (deutsch)
;Go
* [http://www.europeangodatabase.eu/EGD/ EGF-Rangliste europäischer Go-Spieler]
;Fußball
* [http://www.eloratings.net/ Elo-Ratings im Fußball&nbsp;– Nationalmannschaften]
* [http://clubelo.com/ Elo-Ratings im Fußball&nbsp;– europäische Vereine]


== Einzelnachweise ==
{{Wertungszahlen_im_Schach}}
<references responsive />


{{SORTIERUNG:Elozahl}}
[[el:Σύστημα αξιολόγησης ΕΛΟ]]
[[Kategorie:Wertung (Schach)]]
[[en:Elo rating system]]
[[Kategorie:Tischtennis]]
[[es:Sistema de puntuación Elo]]
[[Kategorie:Go]]
[[fr:Classement Elo]]
[[he:מד כושר (שחמט)]]
[[Kategorie:Rangliste (Sport)]]
[[it:ELO]]
[[nl:Elo-rating]]
[[pl:Ranking szachowy]]
[[ru:Рейтинг Эло]]
[[sk:ELO (rating)]]
[[sl:Rating ELO]]
[[sv:ELO-ranking]]
[[tr:ELO]]
[[vi:Hệ số ELO]]

Aktuelle Version vom 19. Juli 2025, 22:16 Uhr

Schach
Linsenförmige Spielsteine in Schwarz und Weiß liegen unregelmäßig auf einem Holzbrett verteilt, das horizontal und vertikal liniert ist.
Go

Die Elo-Zahl (auch Elozahl) ist eine Wertungszahl, welche die Spielstärke von Schachspielern beschreibt. Sie wurde nach ihrem Erfinder Arpad Elo benannt. Inzwischen wurde das Konzept auch für andere Spiele und Sportarten adaptiert (s. u.).

Ausgehend vom Bradley-Terry-Modell (benannt nach R. A. Bradley und M. E. Terry,[1] die es im Jahr 1952 präsentierten[2]), das wiederum auf einer Arbeit von Ernst Zermelo aus den 1920er Jahren basiert,[3][4][5] entwickelte Arpad Elo 1960 ein objektives Wertungssystem für den US-amerikanischen Schachverband USCF. Es wurde 1970 auf dem Kongress in Siegen vom Weltschachverband FIDE übernommen. Der Weltschachverband nennt sein System FIDE rating system. Eine Wertungszahl heißt offiziell FIDE rating, wird umgangssprachlich aber zumeist einfach als „Elo-Zahl“ bezeichnet. Neben dem internationalen Wertungssystem der FIDE existieren auch nationale Wertungssysteme mit unterschiedlichen Namen. In Deutschland heißt das nationale Wertungssystem Deutsche Wertungszahl (DWZ), in Österreich werden (nationale) Elo-Zahlen berechnet, und in der Schweiz gibt es eine Führungsliste mit Führungszahlen. Diese Systeme werten wesentlich mehr lokale Turniere aus, berechnen die Wertungszahlen aber ebenso nach den Methoden von Arpad Elo mit meist nur geringen Modifikationen und abweichenden Faktoren.

Jedem Spieler ist eine Elo-Zahl (von englisch rating) zugeordnet. Je stärker der Spieler, desto höher die Zahl. Treten mehrere Spieler gegeneinander an, so lässt sich aus den Elo-Zahlen der Spieler die erwartete Punktezahl der jeweiligen Spieler bestimmen.

Nach der Begegnung wird das Elo-Rating der Spieler ihren Ergebnissen angepasst. Je nach Differenz zwischen Erwartungswert und Ergebnis gewinnt ein Spieler Elo-Rating-Punkte hinzu oder verliert sie. Das System ist so konstruiert, dass Elo-Rating-Punkte im Regelfall[Anm 1] unter den beteiligten Spielern umverteilt werden.

Bei einer Begegnung zweier Spieler gibt es für einen Sieg einen, für ein Unentschieden einen halben und für eine Niederlage keinen Punkt. Die erwartete Punktezahl E (von englisch expected score, Erwartungswert) ist somit die Wahrscheinlichkeit, dass der Spieler gewinnt, multipliziert mit einem Punkt, plus die Wahrscheinlichkeit für ein Remis multipliziert mit einem halben Punkt. Der Erwartungswert liegt damit zwischen 0 und 1.[Anm 2]

Das Elo-System ist mathematisch so modelliert, dass sich bei der Begegnung zweier Spieler A und B der Erwartungswert EA für den Spieler A aus den beiden Ratings RA und RB wie folgt berechnet:

RARB EA EB
000 50,0 % 50,0 %
050 57,1 % 42,9 %
100 64,0 % 36,0 %
200 76,0 % 24,0 %
300 84,9 % 15,1 %
400 90,9 % 09,1 %
500 94,7 % 05,3 %

Entsprechend gilt für EB, den erwarteten Punktestand von Spieler B:

Da genau ein Punkt auf beide Spieler verteilt wird, muss gelten:

Aus den Formeln für den Erwartungswert ergibt sich, dass diese Bedingung stets erfüllt ist.

Die in der Formel enthaltene, willkürlich festgelegte Zahl 400 legt die Abstufung der Elo-Skala fest: Bei einer Elo-Differenz von 400 wird der Spieler höchstwahrscheinlich gewinnen (EA = 91 %). Die Zahl 400 wurde von Arpad Elo so gewählt, damit die Elo-Zahlen mit den Wertungszahlen des früher verwendeten Schach-Rating-Systems von Kenneth Harkness möglichst gut kompatibel sind.[Anm 3] Im Schweizer Tischtennis wird z. B. 200 statt 400 verwendet, im deutschen 150, s. u.

Beträgt der Wertungsunterschied mehr als 400 Punkte, so erlaubt die FIDE anstelle der tatsächlichen Differenz den Wert 400 bzw. −400 zu benutzen. Ab 2022 kann ein Spieler aber nur noch einmal pro Turnier von einer solchen Aufwertung profitieren, für die anderen eventuellen Gegner mit einem Wertungsunterschied > 400 wird dann mit dem tatsächlichen Wertungsunterschied gerechnet.[6]

Die Gewinnerwartung eines Spielers als Funktion der Punktedifferenz folgt in Elos Modell einer logistischen Funktion. Das heißt jedoch nicht, dass die Stärken der Spieler logistisch verteilt sind. Elo verzichtet auf eine solche Verteilungsannahme. Sein Modell fußt auf der charakteristischen Eigenschaft der Multiplikativität der Erwartungswerte.

Multiplikativität der Erwartungswerte

[Bearbeiten | Quelltext bearbeiten]

Die Erwartungswerte sind multiplikativ – mithilfe dieser Eigenschaft lässt sich Elos Modell definieren. Wenn etwa Spieler A gegenüber Spieler B ein -Favorit ist (d. h., A erzielt in Partien gegen B 75 Prozent der Punkte) und B gegenüber C ein -Favorit, so fordert bzw. folgt aus Elos Modell, dass A gegenüber C ein -Favorit ist.

Oder allgemein ausgedrückt:

Ist A ein -Favorit gegenüber B und
ist B ein -Favorit gegenüber C, so
ist gemäß Elos Modell A ein -Favorit gegenüber C.

Dies kann man leicht nachrechnen. Die Multiplikativität ist aber keine Konsequenz aus einer Normalverteilung, was man oft liest. Diese bezieht sich nur auf die Abweichung der tatsächlichen Spielergebnisse eines Spielers vom Erwartungswert (s. u.) und nicht auf eine Normalverteilung der Stärken der Spieler. Die Forderung nach Multiplikativität stellt den besseren Ausgangspunkt für die Entwicklung des Modells dar – insbesondere für die Kalkulation der Spielstärken von Spielern früherer Epochen.

Anpassung der Elo-Zahl

[Bearbeiten | Quelltext bearbeiten]

Die Elo-Zahlen der Spieler werden regelmäßig aktualisiert. Erzielt ein Spieler in seinen Partien mehr Punkte, als von seiner aktuellen Elo-Zahl zu erwarten war, gewinnt er Elo-Punkte hinzu; erzielt er weniger, verliert er Elo-Punkte. Maßgeblich ist hierfür der so genannte k-Faktor oder k-Koeffizient. Er gibt an, wie viele Elo-Punkte ein Spieler bei einer Partie maximal hinzugewinnen kann (bei einem Sieg über einen viel stärker bewerteten Gegner) oder maximal verlieren kann (Niederlage gegen einen viel schwächer bewerteten Gegner). Wenn ein Spieler S Partiepunkte erzielt, der Erwartungswert aufgrund bestehender Elo-Zahlen aber E betrug, ändert sich seine Elo-Zahl um . Die neue Elo-Zahl ist also

Der Faktor k ist durch das Elo-Modell nicht festgelegt. Wenn er sehr groß gewählt wird, wirken sich zufällige Einzelergebnisse stark aus: die Elo-Zahl R kann stark schwanken. Wenn er sehr klein gewählt wird, ist die Anpassung „träge“: R wird erst nach vielen Partien an eine reale Änderung der Spielstärke angepasst. Für Spitzenspieler mit eher konstanter Leistung ist ein kleinerer Faktor angebracht als für Anfänger, die schnell Fortschritte machen können. Der Koeffizient k wird daher dem „Entwicklungsstand“ eines Spielers angepasst.[Anm 1]

Im Schach hat k im Regelfall den Wert 40, 20 oder 10:[6]

  • k = 40: für Spieler, die neu in der Ratingliste sind und weniger als dreißig gewertete Partien aufweisen;
  • k = 40: für alle Spieler bis zum Ende des Kalenderjahres ihres 18. Geburtstags, solange ihre Bewertung < 2300 bleibt;
  • k = 20: für alle Spieler mit mindestens dreißig gewerteten Partien und einer maximalen Elo-Zahl < 2400. Dieser k-Wert trifft für die meisten erwachsenen Spieler zu;
  • k = 10: für alle Top-Spieler, die eine Elo-Zahl ≥ 2400 erreicht haben, selbst wenn die Elo-Zahl wieder unter diesen Wert fällt.

Ausnahmsweise kann k für einen Spieler in einer einzelnen Wertungsperiode einen abweichenden Wert annehmen, da das Produkt aus k und der Anzahl der für einen Spieler in einer Wertungsperiode ausgewerteten Partien (n) kleiner als 700 sein muss. In diesem Fall wird k auf die größte natürliche Zahl abgesenkt, für die gilt.

Im Schweizer Tischtennis gilt k = 15 einheitlich für alle Spieler.

Anpassung nach einer Partie

[Bearbeiten | Quelltext bearbeiten]

Beispiel: Alfred (RA = 2306) spielt gegen Berta (RB = 2077). Das entspricht einem Wertungsunterschied . Zu erwarten ist, dass Alfred gegen Berta im Mittel 0,789 Punkte pro Spiel erzielt:

.

Nach einer Partie gibt es drei Möglichkeiten (angenommen sei dabei für beide Spieler):

a) Berta gewinnt – also SA = 0.
Die neuen Elo-Punktestände für Alfred und für Berta sind

Alfred büßt 16 Elo-Punkte ein, während Berta 16 Elo-Punkte hinzugewinnt.

b) Alfred gewinnt – also SA = 1.

Alfred erhält 4 Elo-Punkte, Berta verliert 4.

c) Unentschieden – also SA = ½.

Alfred verliert 6 Elo-Punkte, Berta gewinnt 6.

Maximaler Punktgewinn durch eine Partie

[Bearbeiten | Quelltext bearbeiten]

Ab welchem Wertungsunterschied (Elo-Differenz zwischen den Spielern) ist bei einem Sieg der maximale Elo-Punktgewinn möglich?

Der maximal mögliche Elo-Punktgewinn/-verlust ist durch den k-Faktor festgelegt. Da Elo-Punkte auf ganze Zahlen gerundet werden, muss der rechnerische Punktgewinn mindestens k − 0,5 betragen. Demnach muss gelten (wegen SA = 1):

.

Mit der Formel[Anm 4]

erhält man

für die k-Werte 10, 20 bzw. 40. Ein Topspieler (k = 10) kann mit einer Partie maximal 10 Elo-Punkte gewinnen und muss dafür einen Spieler mit einer um 512 höheren Elo-Zahl besiegen.

Spiel gegen einen gleichstarken Spieler

[Bearbeiten | Quelltext bearbeiten]

Sind beide Spieler gleich stark, also , ist . Bei einem Sieg werden Elo-Punkte hinzugewonnen, bei einer Niederlage gehen Elo-Punkte verloren. Bei einem Remis bleiben die Elo-Zahlen unverändert.

Elo-Performance

[Bearbeiten | Quelltext bearbeiten]

Als Elo-Performance (auch Turnierleistung genannt) bezeichnet man die in Elo-Punkten ausgedrückte Leistung eines Spielers in einem einzelnen Turnier. Im Gegensatz zur normalen Elo-Berechnung geht die vorherige Elo-Zahl nicht in diese Wertung ein.

Die Elo-Performance P ist rechnerisch die Elo-Zahl, die ein Spieler haben müsste, damit das erzielte Ergebnis S gerade gleich dem Erwartungswert E ist. Eine Näherungsformel ist

wobei RG das mittlere Rating der Gegner ist und N die Zahl der gespielten Partien. Diese Näherung ist besonders gut, wenn S/N nahe bei 0,5 ist.

Die Elo-Performance wird neben ihrem rein sportlichen Aussagewert als Kriterium zur Vergabe von Sonderpreisen gewählt, wenn ein anderer direkter Leistungsvergleich der Spieler nicht möglich ist – z. B., um den besten Einzelspieler in einem Mannschaftsturnier zu bestimmen.

Probleme und statistische Phänomene von Rating-Systemen

[Bearbeiten | Quelltext bearbeiten]

Intransitivität von Wahrscheinlichkeitsrelationen

[Bearbeiten | Quelltext bearbeiten]

Ist Spieler A gegenüber Spieler B der Favorit und B gegenüber C, so besitzt A ein höheres Rating als B und B ein höheres als C. Damit besitzt A ein höheres Rating als C und müsste Favorit gegenüber C sein.

Diese Folgerung ist aber keineswegs zwingend, da Wahrscheinlichkeits- bzw. Präferenzrelationen nicht notwendigerweise transitiv sind. Dieses Problem ist keine Besonderheit des Elo-Systems, sondern ein prinzipielles Problem aller Rating-Systeme. (vgl. Condorcet-Paradoxon, „Chinesische Würfel“ oder „Intransitive Würfel“)

Transitivität ist jedoch eine notwendige Voraussetzung für ein sinnvolles Rating-System. Um diese Eigenschaft zu sichern, setzte Arpad Elo bei der Entwicklung seines Rating-Systems voraus, dass das zu erwartende Spielergebnis in Abhängigkeit der Spielstärken mithilfe der Formel beschreibbar ist. Aus dieser Annahme folgt neben der Transitivität auch die oben dargestellte Multiplikativität der Erwartungswerte.

Deflation und Inflation

[Bearbeiten | Quelltext bearbeiten]

Will man mithilfe der Elo-Zahlen – oder anderer Ratings, dies betrifft nicht nur das Elo-System – die Stärken von Spielern aus unterschiedlichen Epochen vergleichen, so sollte ein Rating von z. B. 1600 aus dem Jahre 1970 gleichbedeutend mit einem Rating von 1600 aus dem Jahre 2000 sein. Insbesondere sollte, da sich infolge der Weiterentwicklung der Theorie die durchschnittliche Spielstärke im Laufe der Zeit zumindest nicht verschlechtert, sich die mittlere Ratingzahl nicht verringern.

Beim Elo-System gewinnt der Sieger einer Partie genau so viele Rating-Punkte hinzu, wie der Verlierer einbüßt (falls beide den gleichen k-Faktor zur Berechnung nutzen): die mittlere Spielstärke beider bleibt gleich. Umfasst der Rating-Pool (die Rangliste) nur starke Spieler, so ist folgendes Phänomen zu beobachten: Sooft ein Spieler neu in die Ratings aufgenommen wird, tritt er mit einer gewissen (niedrigen) Punktezahl ein. Im Laufe seiner Karriere verbessert er seine Stärke, gewinnt Punkte hinzu und scheidet später mit einer (hohen) Punktezahl aus – dadurch werden der Gesamtheit Punkte entzogen, und die mittlere Ratingzahl sinkt; d. h., das System ist deflationär.

Vergrößert man den Rating-Pool auch auf schwächere Spieler, so tritt der entgegengesetzte Effekt auf: Viele Spieler verlassen den Rating-Pool mit einem niedrigeren Rating, als ihnen bei Eintritt zugemessen wurde – das System wird nun inflationär.

Dies war insbesondere früher der Fall, als der Weltschachbund FIDE Schachspieler erst ab einer Wertungszahl von 2200 in die Rangliste aufnahm. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, zuletzt auf 1000.[7] Dennoch lässt es sich nicht vermeiden, dass viele Spieler den Rating-Pool mit niedrigeren Wertungszahlen verlassen als sie bei Eintritt erhielten. Eine maßvolle Inflation ist jedoch durchaus erwünscht, diese sollte in ihrem Ausmaß der Weiterentwicklung der Spielstärken im Laufe der Zeit Rechnung tragen, allerdings ergibt sich hier zumeist das Problem einer zu großen Inflation.

So konnten die Elo-Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spielstärke absolut zu sein. Im Jahr 2000 gab es nur einen Spieler (Kasparow) mit einer Elo-Zahl größer 2800, elf Spieler größer 2700, und etwa 90 erreichten einen Wert über 2600.[8] Im Juli 2010 hatten bereits über 200 aktive Spieler eine Elo-Zahl größer 2600, davon 37 mindestens 2700; drei Spieler hatten sogar eine Elozahl von 2800 oder höher,[9] was 20 Jahre zuvor undenkbar schien.

Die durchschnittliche Elo-Zahl der ersten 100 Spieler der Weltrangliste stieg zwischen Juli 2000 und Juli 2012 von 2644 auf 2703 Punkte, also eine Steigerung um 59 Wertungspunkte. Seit 2012 liegt der Mittelwert zwischen 2700 und 2706 und ist damit recht konstant.[10]

Das Tausend-Partien-Problem

[Bearbeiten | Quelltext bearbeiten]

Ein weiteres Phänomen ist das sogenannte Tausend-Partien-Problem. Oft treffen Spieler der gleichen Spielstärke immer wieder aufeinander. Angenommen, zwei Spieler mit Elo 2000 spielen zehn Partien, bei denen der eine 80 % der Punkte erreicht. Nach der Berechnung der neuen Elo-Zahl ergeben sich die Werte 2080 für den Sieger und 1920 für den Verlierer. Tragen die beiden Spieler jedoch 1000 Partien mit gleichem Punkteverhältnis aus, ohne dass die Wertung aktualisiert wird, so ergibt sich für den Sieger eine neue Wertungszahl, die höher als die des aktuellen Weltmeisters ist. Jedoch ist dieses Szenario nur theoretischer Natur. Nach dem Statistikgesetz der großen Zahl darf man erwarten, dass die beiden gleich starken Spieler (beide hatten Elo 2000) sich nach vielen Partien den zu erwartenden 50 % annähern. Zudem wird es in der Praxis nie 1000 Partien ohne Ratingaktualisierung geben.

Die Entwicklung der Wertzahlen wird auch von der Auswertungsperiode beeinflusst. Nach einer Testphase mit unregelmäßigen Veröffentlichungen wurde von 1975 bis 1980 einmal jährlich im Januar eine neue Liste veröffentlicht. Beginnend im Juli 1981 wurde auf halbjährliche Veröffentlichung umgestellt und dies bis Juli 2000 so beibehalten. Im Oktober 2000 wurde dann auf Veröffentlichung alle drei Monate umgestellt. Von Juli 2009 bis Juli 2012 wurde alle zwei Monate ausgewertet.[11] Seit August 2012 wird monatlich ausgewertet.[12] Die minimale Wertungszahl beträgt seitdem 1000 Punkte, zuvor lag sie bei 1200. Sinnvoll wäre prinzipiell eine Auswertung nach jedem Turnier, da so Formschwankungen von Spielern besser ausgeglichen werden können. Allerdings ist das derzeit nicht geplant.

Schwankungsbreite und Aussagekraft

[Bearbeiten | Quelltext bearbeiten]

Die Wertungszahlen eines einzelnen Spielers sind intervallskaliert und annähernd normalverteilt und schwanken mit einer Standardabweichung von 200 um einen mittleren Wert. Es gibt viele Schachspieler mit Spielstärken unter 1200. Auf diesem Spielniveau ist das Elo-System in der Vorhersagesicherheit aber nur eingeschränkt anwendbar. Wichtig ist insbesondere auf Hobbyspielerniveau, dass ein Spieler seine Zahl auch gegen stärkere Gegner verteidigen kann, ohne sich auf besondere Eigenschaften wie unbewusste psychische Schwächen oder schlechtes Zeitmanagement von Neulingen konzentrieren zu müssen. Utopisch hohe Werte werden durch Niederlagen schnell, exakt und zuverlässig korrigiert. Die recht stabile Elo-Zahl wird mit verschiedenen Verfahren ermittelt. Manche gehen von wenigen Spielen aus oder von ähnlich starken Turnierteilnehmern. Nach vielen Partien erreichen aber alle sehr ähnliche Gleichgewichte. Bei Computern ist die Verteilung nicht nur per 200-Punkte-Definition gleich, sondern auch vom Kurvenverhalten her darüber hinaus sehr ähnlich, allerdings gibt es bei ähnlich starken Maschinen eine weitere Spielstärkenspreizung in den verschiedenen Partiephasen.

Einstufung der Spieler nach Elo-Zahl

[Bearbeiten | Quelltext bearbeiten]

Vor Einführung der Elo-Zahl stufte man die Spieler beim Schach in neun Klassen oder Kategorien ein. Ein Unterschied von einer Klasse bedeutete, dass der bessere Spieler als Ergebnis einer Partie 0,75 Punkte erwarten darf. Im Elo-System entspricht dieser Spielstärkeunterschied einer Differenz von etwa 200 Wertungspunkten (genauer: 191).[Anm 5] Eine Erweiterung stellt das Glicko-System dar.

Zuordnung der Titel nach der Wertungszahl
Elo-Zahl Offene Kategorie Kategorie Frauen
≥ 2500 Großmeister (GM)
2400–2499 Internationaler Meister (IM)
2300–2399 FIDE-Meister (FM) Großmeister der Frauen (WGM)
2200–2299 Candidate Master (CM) oder
Nationaler Meister
Internationaler Meister der Frauen (WIM)
2100–2199 Meisteranwärter FIDE-Meister der Frauen (WFM)
2000–2099 Starker Amateur Candidate Master der Frauen (WCM)
< 2000 Amateur

Zu beachten ist dabei, dass man die verschiedenen Titel Großmeister (GM) und Internationaler Meister (IM) nicht nur auf Grund einer bestimmten Elo-Zahl erhält, sondern durch die Erfüllung von anderen festgelegten Normen. Um den Titel nach Erfüllung aller Normen zu erhalten, muss ein angehender GM allerdings eine Elo-Zahl von mindestens 2500, ein IM eine Zahl von mindestens 2400 einmal erreicht haben. Bei entsprechender Punktzahl wird der offene Großmeistertitel an Spieler aller Geschlechter vergeben, der Großmeistertitel der Frauen kann von diesen bereits ca. 200 Punkte vorher erreicht werden.[13]

Unterhalb 2000 Elo-Punkten gibt es keine offiziellen Titel, weshalb eine objektive Benennung der Spielstärke schwierig ist. Zur groben Einschätzung kann in Deutschland der DWZ-Schnitt der Amateurligen dienen (Die Deutsche Wertzahl DWZ ist zwar nicht dasselbe wie die international übliche ELO-Zahl, aber vergleichbar). Im Schachverband Württemberg liegt der DWZ-Schnitt in der Oberliga bei ca. 2100, in den Verbandsligen bei ca. 1900, in den Landesligen bei ca. 1700, den Bezirksligen bei ca. 1600 usw.[14] Wie in anderen Sportarten auch erreichen Gelegenheitsspieler selten das Niveau der Bezirksliga.

Nachdem im Jahr 1970 die Elo-Zahl als Wertungssystem eingeführt worden war, hatte zunächst Bobby Fischers Bestmarke von 2785 Punkten vom Juli 1972 für viele Jahre Bestand. Im Jahre 1999 erreichte der damalige klassische Schachweltmeister Garri Kasparow die Elo-Zahl von 2851 Punkten, die erst im Januar 2013 von Magnus Carlsen mit 2861 Punkten übertroffen wurde. Inzwischen konnte Carlsen den Rekord auf 2882 erhöhen (Liste vom Mai 2014).

Spieler mit einer Elo-Zahl über 2600 gehören zum erweiterten Kreis der Weltspitze (etwa TOP 200), Spieler mit über 2700 zum engeren Kreis (etwa TOP 30). Aktuell (Stand: September 2024) erreichen nur zwei Spieler 2800: Hikaru Nakamura und Magnus Carlsen.

Elo-Zahlen können auch für einzelne Turniere berechnet werden (siehe oben: Elo-Performance). Hierbei gelang Fabiano Caruana im Jahr 2014 beim Turnier um den Sinquefield Cup in St. Louis eine Elo-Leistung von 3103.[15] Die davor gültige höchste Turnier-Elo-Leistung war 3002, erzielt von Magnus Carlsen in Nanjing im Jahr 2010.[16]

Historische Elo-Zahl im Schach

[Bearbeiten | Quelltext bearbeiten]

Für den Vergleich heutiger Spitzenspieler mit Großmeistern vor der Einführung der Elo-Zahl wird die sogenannte historische Elo-Zahl verwendet.

Spielstärke der Schachprogramme

[Bearbeiten | Quelltext bearbeiten]

Die Elo-Zahlen der Schachcomputer bzw. Computerprogramme sind nicht ohne weiteres mit denen menschlicher Schachspieler zu vergleichen, da sie überwiegend durch Partien zwischen Computern ermittelt wurden und nicht durch Teilnahme an offiziellen Turnieren.

Turnierkategorien – Einteilung der Turniere nach Elo-Zahl

[Bearbeiten | Quelltext bearbeiten]
Turnier-
kategorie
Elo-Durchschnitt
Von Bis
1 2251 2275
2 2276 2300
3 2301 2325
. . .
7 2401 2425
. . .
11 2501 2525
. . .
15 2601 2625
. . .
19 2701 2725
20 2726 2750
21 2751 2775
22 2776 2800
23 2801 2825

Auch Rundenturniere werden nach der durchschnittlichen Elo-Zahl der Teilnehmer in Kategorien eingeteilt. Hierbei entspricht ein Unterschied um eine Kategorie 25 Elo-Punkten. Als Turnier der Kategorie 1 wird dabei ein Turnier eingestuft, dessen Teilnehmer im Durchschnitt 2251 bis 2275 Elo-Punkte haben. Die zurzeit stärksten Turniere erreichen die Kategorie 22, was einem Durchschnitt von 2776 bis 2800 Elo-Punkten entspricht. Bei der Zürich Chess Challenge 2014 wurde im Januar 2014 erstmals Kategorie 23 (mit einem Elo-Durchschnitt von 2801) erreicht.

Weitere Anwendung und Verbreitung

[Bearbeiten | Quelltext bearbeiten]

Bei Go wird die Spielstärke traditionell in Kyū-Graden (japanisch ) für Schüler und Dan-Graden (jap. ) für Meister angegeben. Die Ermittlung dieser Spielstärke basiert innerhalb der European Go Federation und bei vielen Go-Servern im Internet auf einem von Elo abgeleiteten System, welches Kyū- und Dan-Grade wie folgt abbildet:

kyu/dan Elo Spielstärke und -erfahrung[17]
weltbeste 9p-KI 5185 AlphaGo Zero auf einem TPU-v2-Modul mit 180 TFLOPS[18]
weltbester 9p-Spieler 3830 Shin Jin-seo, weltbester Gospieler (Stand: 2. Dezember 2021)[19]
1p – 9p ab circa 2600 professioneller Go-Spieler (aus Japan, Korea oder China), der stärker als ein Amateur-6dan spielt
4d – 7d ab 2350 einer der besten Spieler seines Landes
1d – 3d 2050–2349 sehr guter Club-Spieler
4k – 1k 1650–2049 guter Club-Spieler
9k – 5k 1150–1649 regelmäßiger Club-Spieler
13k – 10k 750–1149 Club-Spieler
17k – 14k 350–749 regelmäßiger Hobby-Spieler
21k – 18k 0–349 Hobby-Spieler
24k – 22k   einige Partien gegen Nicht-Anfänger gewonnen
27k – 25k   einige Partien gegen Anfänger gewonnen
29k – 28k   einige Partien gespielt
30k   Regeln verstanden, aber noch keine Partie gespielt

Die FIFA-Weltrangliste der Frauen wird seit 2003 offiziell mit einem adaptierten Elo-System ermittelt. Seit 2018 wird die FIFA-Weltrangliste für Männer auch auf ein adaptiertes Elo-System umgestellt.[20]

Eine länger bestehende inoffizielle Adaption des Elo-Systems für Männernationalmannschaften im Fußball sind die World Football Elo Ratings. Inoffizielle Elo-Ratings werden auch für Fußball-Clubs vorgenommen.[21]

Swiss Table Tennis nutzt seit der Saison 2010/2011 eine etwas modifizierte Elo-Formel zur Berechnung von Wertungspunkten[22]

EA: Erwarteter Punktestand für Spieler A.
RA: bisherige Punkte-Zahl von Spieler A
RB: bisherige Punkte-Zahl von Spieler B

Der Erwartungswert für A beträgt nun EA · 100 %. Die neue Punkte-Zahl von Spieler A ist

SA: tatsächlich gespielter Punktestand (1 für jeden Sieg, 0 für jede Niederlage, Remis ist im Tischtennis nicht möglich)

In Deutschland: der TTR-Wert

[Bearbeiten | Quelltext bearbeiten]

In Deutschland wird nach einem analogen System für jeden Aktiven ein TTR-Wert errechnet.[23] Hier wird die Wertungsdifferenz durch 150 geteilt.[24]

Für weltweites Scrabble (Global Scrabble) wird eine Elo-Rangliste von der World English-language Scrabble Players’ Association (WESPA) geführt. Auf Rang 1 dieser Elo-Rangliste liegt der Neuseeländer Nigel Richards (2156 Elo-Punkte, Stand 17. Oktober 2020).[25]

Seit 2009 wird auch für das deutschsprachige Scrabble eine Elo-Rangliste geführt – basierend auf Turnieren ab dem Jahr 2005. Im Juni 2022 führte der Deutsche Timon Boerner mit 1718 Elo-Punkten die Liste an, in der 213 Personen aufgeführt sind.[26]

League of Legends

[Bearbeiten | Quelltext bearbeiten]

Im MOBA League of Legends, einer Liga eines Computer-Strategiespiels, wurde ebenfalls das Elo-System bei gewerteten Spielen verwendet. Inzwischen wurde es durch das Ligasystem ersetzt, dem aber noch das Elo-System zu Grunde liegt.[27]

Bei einem Sieg bekommt man League Points (LP), bei einer Niederlage werden LP abgezogen. Bis Ende 2020 musste man bei 100 LP ein Best of three bzw. five gewinnen, um eine Liga aufzusteigen.

  1. a b Wenn Spieler unterschiedliche Entwicklungsfaktoren haben, kann sich ein Spielergebnis unterschiedlich stark auf deren Elo-Zahl auswirken, sodass keine reine Umverteilung von Punkten stattfindet. Ähnlich kann es sein, wenn einer der Spieler vorher noch keine Elo-Zahl hatte.
  2. Der Erwartungswert darf also nicht mit der Gewinnwahrscheinlichkeit verwechselt werden, weil er offen lässt, ob die Punkte durch Siege, Remis oder durch eine Kombination aus beiden erreicht werden. So hat ein Spieler beispielsweise einen Erwartungswert in einer Partie von 0,5, sowohl wenn er voraussichtlich alle Partien remisiert, als auch, wenn er je die Hälfte der Partien gewinnt und verliert. Im Bezug auf die Gewinnquote gibt der Erwartungswert also nur Auskunft darüber, wie viele Gewinnspiele maximal zu erwarten sind. Bei einem Erwartungswert von sind das nicht mehr als  Prozent der Spiele.
  3. Tatsächlich kann man das Harkness-System als eine stückweise lineare Approximation an das Elo-Modell auffassen.
  4. Aus der Modellierung der erwarteten Punktzahl als folgt , und daraus ergibt sich für die Elo-Differenz der Spieler .
  5. Mit ergibt sich eine Wertungsdifferenz von rund 191:
Schach
Go
Fußball

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. E. E. M. van Berkum: Bradley-Terry model, Encyclopedia of Mathematics Online, abgerufen am 18. November 2014.
  2. Ralph Allan Bradley, Milton E. Terry: Rank Analysis of Incomplete Block Designs: I. The Method of Paired Comparisons. Biometrika, Bd. 39, Nr. 3/4, S. 324, 1952 JSTOR (abgerufen am 22. August 2018).
  3. David R. Hunter: MM algorithms for generalized Bradley–Terry models. The Annals of Statistics, Bd. 32, Nr. 1, 2004, S. 384–406 Online JSTOR (abgerufen am 22. August 2018).
  4. Ernst Zermelo: Die Berechnung der Turnier-Ergebnisse als ein Maximumproblem der Wahrscheinlichkeitsrechnung. Mathematische Zeitschrift, Bd. 29, Nr. 1, 1929, S. 436–460 DOI (abgerufen am 22. August 2018).
  5. Heinz-Dieter Ebbinghaus: Ernst Zermelo: An Approach to His Life and Work. Springer, Berlin 2007, ISBN 978-3-540-49553-6, S. 268–269.
  6. a b FIDE Rating Regulations In: handbook.fide.com Punkt 8.3 „Ermittlung der Elo-Anpassung von Ranglisten-Spielern“ mit Festlegungen für den k-Faktor (englisch)
  7. [chrome-extension://oemmndcbldboiebfnladdacbdfmadadm/https://www.fide.com/docs/regulations/FIDE%20Rating%20Regulations%202022.pdf FIDE Rating Regulations] (PDF), abgerufen am 4. März 2023.
  8. Top 100 Players July 2000 - Archive. fide.com, abgerufen am 6. Dezember 2021.
  9. Top 100 Players July 2010 - Archive. fide.com, abgerufen am 6. Dezember 2021.
  10. http://ratings.fide.com/toplist.phtml?list=men
  11. Changes in the Rating Regulations from 1.7.2009 Auf: fide.com, 15. Juli 2009
  12. FIDE July ratings – Carlsen at a record 2837, chessbase.com (englisch)
  13. B. Permanent Commissions / 01. International Title Regulations (Qualification Commission) / FIDE Title Regulations effective from 1 January 2022 / FIDE Handbook. Abgerufen am 15. Dezember 2022 (englisch).
  14. DWZ-Schnitte der Ligen im SVW, abgerufen am 10. April 2022.
  15. Johannes Fischer: Sinquefield Cup: Drei Remis zum Schluss. In: Schach Nachrichten. chessbase, 7. September 2014, abgerufen am 8. September 2014.
  16. Stefan Löffler: Wie eine Maschine. Der erst 22 Jahre alte Fabiano Caruana lehrt Schach-Weltmeister Carlsen das Fürchten. In: Frankfurter Allgemeine Zeitung vom 8. September 2014, S. 32.
  17. Rémi Coulom: Whole-History Rating: A Bayesian Rating System for Players of Time-Varying Strength. In: remi-coulom.fr. Abgerufen am 4. Januar 2017 (englisch).
  18. David Silver, Julian Schrittwieser, Karen Simonyan: Mastering the game of Go without human knowledge. In: Nature. Band 550, 19. Oktober 2017, S. 354–359 (englisch, Abstract).
  19. Shin Jin-seo. In: goratings.org. Abgerufen am 2. Dezember 2021 (englisch).
  20. Überarbeitung der FIFA/Coca-Cola-Weltrangliste (Memento vom 12. Juni 2018 im Internet Archive)
  21. http://clubelo.com/
  22. [1] (abgerufen am 20. Juli 2017).
  23. Zeitschrift tischtennis, 2020/11, Seite 32 f.
  24. TTR – Die „Elo-Zahl“ des Tischtennis In: statistik-dresden.de
  25. WESPA Ratings. 17. Oktober 2020, abgerufen am 4. April 2021 (englisch).
  26. Elo-Rangliste | Scrabble Info. Abgerufen am 1. August 2022 (deutsch).
  27. DER Informationsthread über Ligen, MMR und (Hidden-)Elo (Memento vom 25. Juni 2015 im Internet Archive)