glicko
+-------------------------------------------------------------+
| Explications de Vek sur le système
de classement "Glicko" |
+-------------------------------------------------------------+
Comme vous avez pu le constater, chaque joueur de FICS a maintenant un classement
et un RD.
RD est pour "ratings deviation" (Taux de variation).
POURQUOI UN NOUVEAU SYSTEME?
---------------------------------------------
Le nouveau système avec le RD surpasse la catégorisation binaire
qui était utilisée avant sur FICS et ailleurs, où un
pseudo avec moins de 20 parties étaient étiquetés "provisional"
(provisoire) et les autres "established" (établi). Au lieu d'avoir
deux formules de classements séparées pour les deux catégories,
il y a désormais une formule unique incorporant les deux classements
et les deux RD pour déterminer les changements de classements pour
vous et votre adversaire à l'issue de la partie.
QUE REPRESENTE LE RD?
-------------------------------
Le RD est utilisé pour mesurer à quel point le classement actuel
d'un pseudo peut être digne de confiance. Un haut RD signifie que le
joueur n’a pas beaucoup joué ou n’a pas joué fréquemment
(cela permet de représenter une inexpérience ou un manque de
réflexes). Au contraire un bas RD permet de confirmer le niveau du
joueur (les exploits comme les contre-performances se perdant dans la masse).
Ceci est décrit plus en détail en dessous dans la rubrique
"Interprétation du RD."
COMMENT LE RD AFFECTE LES CHANGEMENTS DE CLASSEMENT?
----------------------------------------------------------------------------------
En général, si votre RD est élevé, alors votre
classement changera beaucoup après chaque partie. Plus il deviendra
bas, plus les changements de classements entre chaque partie seront faibles.
Cependant, le RD de votre adversaire aura l'effet inverse : si son RD est
élevé, alors votre variation de classement sera plus faible
qu'elle l'aurait été sinon.
UNE AUTRE UTILISATION DU RD :
-----------------------------------------
Vek demanda à Mark Glickman la chose suivante :
> Attribuer au pseudo1 un classement r1 et une erreur s1
> Attribuer au pseudo2 un classement r2 et une erreur s2
> As-tu une formule pour la probabilité que le "vrai" classement
du pseudo1 est supérieur à celui du pseudo2?
Mark dit :
Oui - c'est :
1/(1 + 10^(-(r1-r2)f(sqrt(s1^2 + s2^2))/400) )
où f(s) est la fonction appliquée au RD dans l'étape
2 ci dessous.
COMMENT LE RD EST-IL MIS A JOUR?
----------------------------------------------
Dans ce système, le RD diminuera un peu chaque fois que vous jouerez
une partie car plus vous jouez de parties et plus votre classement sera considéré
comme fiable (représentant correctement votre niveau). Cependant,
si vous restez un long moment sans jouer aucune partie, votre RD augmentera
pour refléter le doute croissant de votre classement due au passage
du temps. Aussi, votre RD diminuera plus fortement si le classement de votre
adversaire est proche du votre et moins fortement si le classement de votre
adversaire est très différent.
POURQUOI LES CHANGEMENTS DE CLASSEMENTS NE SONT PAS EQUILIBRES?
------------------------------------------------------------------------------------------------
Dans l'autre système, sauf pour les parties avec classement provisoire,
les changements de classements sont équilibrés entre les deux
joueurs - Si A gagne 16 points, alors B perd 16 points. Ce n'est pas le cas
dans ce système. Voici l'explication que j'ai reçu de Mark
Glickman :
Le système ne conserve pas les points de classements
- et pour de bonnes raisons! Supposez deux joueurs ayant un classement de
1700, sauf qu'un n'a pas joué depuis un moment et l'autre joue constamment.
Pour le premier, le classement n'est pas digne de confiance alors que pour
le second le classement est sûr. Supposons que le joueur au classement
incertain bat le joueur au classement affirmé. Alors je vais prétendre
que le joueur au classement imprécis doit avoir son classement augmenté
de manière significative (car nous avons appris quelque chose d'instructif
en battant un joueur avec un classement certain) et le joueur avec un classement
certain aura son classement qui diminuera peu (car perdre contre un adversaire
au classement imprécis n'est pas assez instructif). C'est ce raisonnement
qui ma poussé à cette extension du système Elo.
En moyenne, le système reste relativement constant (par le
fait du nombre). En d'autres mots, le scénario ci-dessus peut se produire
aussi souvent que celui où le joueur au classement imprécis
perd.
INTERPRETATION MATHEMATIQUE DU RD
----------------------------------------------------
Directement de Mark Glickman:
Chaque joueur peut être caractérisé par un vrai (mais
inconnu) classement qui peut être vu comme une moyenne de ses capacités.
Nous ne pouvons jamais savoir quelle est cette valeur, en partie parce que
nous n'observons qu'un nombre fini de parties, mais aussi parce que ce vrai
classement change avec le temps comme changent les capacités du joueur.
Mais nous pouvons *estimer* le classement inconnu. Plutôt que de réduire
l'estimation à un vrai classement, nous pouvons considérer
l'estimation comme un *intervalle* de valeurs possibles. L'intervalle étant
plus large si nous sommes moins sur du classement du joueur, et l'intervalle
est plus petit quand nous sommes plus sur du classement actuel du joueur.
Le RD quantifie cette incertitude en terme de probabilité :
o L'intervalle formé par votre classement actuel +/- RD contient
votre vrai classement avec une probabilité de 0.67.
o L'intervalle formé par votre classement actuel +/- 2 * RD
contient votre vrai classement avec une probabilité de 0.95.
o L'intervalle formé par votre classement actuel +/-3
* RD contient votre vrai classement avec une probabilité de 0.997.
Pour ceux d'entre vous qui connaissez quelque chose à propos
des statistiques, ceci ne sont pas des intervalles de confiances, mais sont
appelés "central posterior intervals" parce que la dérivation
vient d'une analyse "Bayesian" du problème.
Ces nombres sont trouvés par la fonction cumulative de répartition
de la répartition normale ce qui signifie = classement actuel, et dérivation
normale = RD.
Par exemple : CDF[ N[1600,50], 1550 ] = .159 approximativement
(Ceci est une notation mathématique abrégée.)
LES FORMULES
-------------------
L'algorithme pour calculer les changements de classement pour une partie
contre un adversaire donné :
Etape 1. Avant une partie, calculez le classement initial et le RD pour
chaque joueur.
o Si pas encore de parties, le classement initial sera supposé
être de 1720.
Sinon, utilisez le classement existant.
(Le 1720 n'est pas affiché cependant.)
o Si pas encore de RD, le RD initial est supposé être
de 350 si vous n'avez pas encore de parties ou 70 si votre classement est
rapporté d'ICC.
Sinon, calculez le nouveau RD, basé
sur le RD obtenu après votre partie la plus récente que vous
ayez joué et le temps (t) passé depuis celle-ci, comme ceci
:
RD' = Sqrt(RD^2 + ct)
où c est une constante numérique
choisie par conséquence les prédictions faites sur les classements
par ce système sont approximativement optimales.
Etape 2. Calculez le "facteur atténuant" qui sera utilisé dans
les étapes suivantes.
Pour les parties normales
d'échecs, c'est donné par :
f = 1/Sqrt(1 + p RD^2)
Ici, RD est le RD
de votre adversaire, et p est la constante :
3 (ln 10)^2
p = -------------
Pi^2 400^2 .
Pour le bughouse,
nous utilisons :
f = 1/Sqrt(1 + p (RD1^2 + RD2^2 + RD3^2))
où
RD1, RD2 et RD3 sont les RD des trois autres joueurs engagés dans
ce bughouse, et p est donné par :
3 (ln 10)^2
p = -------------
Pi^2 800^2 .
Notez que c'est entre
0 et 1 - si le RD est très élevé, alors f sera proche
de 0.
Etape 3. r1 <- votre classement,
r2 <- le classement
de votre adversaire,
(pour le
bughouse, r1 est la moyenne de votre classement et de celui de votre partenaire,
et r2 est la moyenne des classements de vos adversaires)
1
E <- ----------------------
-(r1-r2)*f/400 <- c'est la fonction f(RD) ici!
1 + 10
Cette valeur E semble
être traitée comme une probabilité.
Etape 4. K =
q*f
--------------------------------------
1/(RD)^2 + q^2 * f^2 * E * (1-E)
où q est une
constante mathématique :
q = (ln 10)/400 (échecs normaux),
q = (ln 10)/800 (bughouse).
NOTE : si
K est inférieur à 16, nous utilisons alors 16.
Etape 5. C'est le facteur K pour la partie, alors
Votre nouveau classement
= (classement avant la partie) + K * (w - E)
où w est 1
pour un gain, 0.5 pour une nulle, et 0 pour une défaite.
Etape 6. votre nouveau RD est calculé ainsi :
RD' =
1
-------------------------------------------------
Sqrt( 1/(RD)^2 + q^2 * f^2 * E
* (1-E) ) .
Les mêmes étapes sont faites pour votre adversaire.
INFORMATIONS SUPPLEMENTAIRES
---------------------------------------------
Un fichier PostScript contenant les discussion de Mark Glickman au sujet
de son système de classement peut être obtenu par ftp. Le site
ftp est hustat.harvard.edu, le répertoire est /pub/glickman, et le
fichier s'appelle "glicko.ps". Il est disponible sur http://hustat.harvard.edu/pub/glickman/glicko.ps.
CREDITS
-----------
Le système de classement Glicko a été inventé
par Mark Glickman, Ph.D. qui est actuellement à l'Université
de Boston.
Vek et Hawk ont programmé et débugué le nouveau calcul
de classement (nous pouvons toujours le débugguer). Une assistance
a été donnée par Surf, et Shane a trouvé un bug
odieux que Vek avait inventé.
Vek a écrit ce fichier d'aide et Mark Glickman a fait certaines corrections
et ajouts essentiels.
VOIR AUSSI
---------------
ratings rd
AUTEURS
------------
[Création : 0 janvier 0000 -- vek/glickman
Dernière modification : 28 février 2008 -- mhill]
Traduction par Houarzhon le 4 juillet 2008
|