Salut,
Une étude très pointue de l'échelle de niveau européenne vient d'être faite par Dave de Vos sur http://goratings.eu/Home/About ,
Discussion en anglais ici (Le pseudo de Dave est Gennan) : https://lifein19x19.com/forum/viewtopic.php?f=10&t=14557
Il en résulte des conclusions très intéressantes.
Mais tout d'abord, quelques eplications sur le fonctionnement de l'échelle. Elle se base sur un système ELO modifié, comme on peut le voir fonctionner sur KGS : on gagne des points à chaque victoire, on en perd à chaque défaite.
Plus notre adversaire est fort, plus une victoire nous rapporte de points, et moins une défaite nous en fait perdre. Les handicaps sont pris en compte.
Le détail complet est donné ici pour l'échelle française : http://ffg.jeudego.org/echelle/echelle_algo.php
Et là pour l'échelle européenne : http://www.europeangodatabase.eu/EGD/EGF_rating_system.php
Les deux échelles sont indépendantes. Par exemple, je suis actuelleement 12 kyu à l'échelle française et 13 kyu à l'échelle européenne, mais avec le titre de 11 kyu (à l'échelle européenne, un titre en kyu ou en dan n'est pas révocable, si on baisse à l'échelle, on garde quand même le titre !)
En outre, le rang le plus bas à l'échelle européenne est 20 kyu, et 30 kyu pour l'échelle française. Par exemple, Lina El Ajoutti est 27 kyu à l'échelle française, et 20 kyu à l'échelle européenne.
Trois paramètres mathématiques viennent ajuster le fonctionnement de base de l'échelle. Ils sont identiques pour l'échelle française et l'échelle européenne.
Le paramètre "a" sert à régler la taille des kyu et des dan de sorte qu'un niveau d'écart = 1 pierre de handicap.
Le paramètre "con" donne des variations de niveau plus grandes pour les joueurs débutants. Ils bougent plus vite, vers le haut ou vers le bas, que les joueurs forts.
Le paramètre epsilon donne plus de points au vainqueur qu'on n'en enlève au perdant. Cela tire vers le haut le classement de chacun. Il sert à conpenser le fait que les joueurs progressent naturellement en niveau.
D'autres ajustements existent en plus des paramètres internes :
En France, si on gagne plus de 60 points (1 point = 1/100e de kyu) pendant un tournoi, notre niveau d'inscription est remonté d'autant, et ce de façon itérative. Cela donne des points en plus aux joueurs qui progressent rapidement sans que leur niveau officiel suive, et cela évite de pénaliser leurs adversaires.
En France, les parties à handicap sont moins comptabilisées que les autres, et si Blanc perd une partie à handicap, sa variation est encore plus faible. A l'échelle européenne, les parties à handicap comptent comme les autres (moyennant la prise en compte du handicap dans le calcul des points, ce qui est également fait à l'échelle française).
Tout cela étant dit, voici le résumé des conclusions obtenues par Dave de Vos sur l'échelle européenne, après avoir étudié statistiquement 900000 parties.
Le paramètre "a" est trop bas dans la région 1 dan.
http://goratings.eu/Probabilities/A_PredictedEGD
http://goratings.eu/Probabilities/A_ObservedEGD
Normalement, il va en résulter une contraction de l'échelle, un joueur 5 dan dont le niveau est stable va progressivement perdre des points, tandis qu'un 5 kyu dont le niveau est stable va en gagner. Ces effets peuvent toutefois être masqués par une inflation ou une déflation générale de l'échelle.
L'écart entre les rangs correspond plutôt bien au nombre de pierres de handicap. Y compris pour les joueurs en dan.
https://lifein19x19.com/viewtopic.php?p=223871#p223871
De plus, le système "1 rang = 1 pierre" est à peu près transitif. Les statistiques montrent que si un joueur A donne trois pierres à B, et que B donne trois pierres à C, alors on vérifie bien que A et C sont de niveau égal quand ils jouent à 6 pierres.
C'est un fait curieux, car si le "a" est trop bas, l'écart entre les rangs ne devraient plus correspondre avec les handicaps. Dave pense que cela vient de la "reset policy" utilisée en Europe : quand un joueur pense que son niveau réel s'écarte de plus de deux rangs de son niveau à l'échelle, il peut demander à être inscrit à un niveau différent. Il n'a pas à passer par une commission de réévaluation, comme en France.
D'autres études montrent que le niveau estimé par le joueur lui-même est généralement plus juste que le niveau donné par l'échelle (basé sur le handicap le plus juste que deux joueurs estiment devoir utiliser). Ce qui expliquerait que l'échelle reste bonne, les auto-évaluations corrigeant les erreurs au premier ordre, tandis que l'erreur sur le paramètre "a" provoque une dérive de second ordre.
Dave montre également que le paramètre "con" n'a pas l'effet désiré. Il est introduit pour stabiliser plus vite le niveau des joueurs débutants et qui progressent vite. Mais en réalité son effet est plutôt de rajouter du désordre dans le bas du classement, et de rendre la déflation de l'échelle plus difficile à détecter, et donc à corriger.
Dave propose un nouveau système de calcul, avec un paramètre "a" révisé, et un système d'auto-réévaluation, permissif pour les débutants, mais contraignant pour les joueurs forts. Ses simulations montrent qu'avec un tel système, il n'a plus besoin d'introduire un epsilon pour compenser la déflation de l'échelle.
Je trouve ça super intéressant. Déjà, j'ignorais que le plancher de l'échelle européenne était à 20 kyu.
Pour bien conprendre l'effet du plancher de l'échelle, il faut rappeler qu'un système ELO possède un nombre de points fixe. Si un joueur en gagne, automatiquement, d'autres en perdent un nombre égal.
Sachant que les joueurs sont le plus souvent inscrit à un niveau double kyu, et qu'ils progressent ensuite vers un niveau final single kyu, un tel système dérive complètement avec le temps : les nouveaux "bouffent" tous les points disponibles en progressant.
Cinq paramètres (dans l'échelle française) injectent des points et travaillent dans le sens inverse pour stabiliser l'échelle :
-Les ajustements quand les joueurs progressent de plus de 60 points par tournoi. Ils gagnent des points qu'aucun adversaire ne perd.
-Les parties à handicap perdues par Blanc : Noir gagne plus de points que Blanc n'en perd
-Le paramètre epsilon, qui donnent toujours un tout petit peu plus au gagnant qu'il n'en prend au vainqueur.
-la commission de réévaluation, généralement sollicitée pour monter le niveau d'un joueur plutôt que l'inverse
-le plancher de l'échelle. Si on est tout en bas et qu'on perd une partie, on ne descend pas.
Or, la tranche 30-20 kyu est très peu peuplée, et on a rarement des joueurs qui stagnent à 30 kyu. Ce serait beaucoup moins vrai si le placher était à 20 kyu.
En fait, cela donne l'impression que l'échelle française n'a "pas de fond".
Une étude très pointue de l'échelle de niveau européenne vient d'être faite par Dave de Vos sur http://goratings.eu/Home/About ,
Discussion en anglais ici (Le pseudo de Dave est Gennan) : https://lifein19x19.com/forum/viewtopic.php?f=10&t=14557
Il en résulte des conclusions très intéressantes.
Mais tout d'abord, quelques eplications sur le fonctionnement de l'échelle. Elle se base sur un système ELO modifié, comme on peut le voir fonctionner sur KGS : on gagne des points à chaque victoire, on en perd à chaque défaite.
Plus notre adversaire est fort, plus une victoire nous rapporte de points, et moins une défaite nous en fait perdre. Les handicaps sont pris en compte.
Le détail complet est donné ici pour l'échelle française : http://ffg.jeudego.org/echelle/echelle_algo.php
Et là pour l'échelle européenne : http://www.europeangodatabase.eu/EGD/EGF_rating_system.php
Les deux échelles sont indépendantes. Par exemple, je suis actuelleement 12 kyu à l'échelle française et 13 kyu à l'échelle européenne, mais avec le titre de 11 kyu (à l'échelle européenne, un titre en kyu ou en dan n'est pas révocable, si on baisse à l'échelle, on garde quand même le titre !)
En outre, le rang le plus bas à l'échelle européenne est 20 kyu, et 30 kyu pour l'échelle française. Par exemple, Lina El Ajoutti est 27 kyu à l'échelle française, et 20 kyu à l'échelle européenne.
Trois paramètres mathématiques viennent ajuster le fonctionnement de base de l'échelle. Ils sont identiques pour l'échelle française et l'échelle européenne.
Le paramètre "a" sert à régler la taille des kyu et des dan de sorte qu'un niveau d'écart = 1 pierre de handicap.
Le paramètre "con" donne des variations de niveau plus grandes pour les joueurs débutants. Ils bougent plus vite, vers le haut ou vers le bas, que les joueurs forts.
Le paramètre epsilon donne plus de points au vainqueur qu'on n'en enlève au perdant. Cela tire vers le haut le classement de chacun. Il sert à conpenser le fait que les joueurs progressent naturellement en niveau.
D'autres ajustements existent en plus des paramètres internes :
En France, si on gagne plus de 60 points (1 point = 1/100e de kyu) pendant un tournoi, notre niveau d'inscription est remonté d'autant, et ce de façon itérative. Cela donne des points en plus aux joueurs qui progressent rapidement sans que leur niveau officiel suive, et cela évite de pénaliser leurs adversaires.
En France, les parties à handicap sont moins comptabilisées que les autres, et si Blanc perd une partie à handicap, sa variation est encore plus faible. A l'échelle européenne, les parties à handicap comptent comme les autres (moyennant la prise en compte du handicap dans le calcul des points, ce qui est également fait à l'échelle française).
Tout cela étant dit, voici le résumé des conclusions obtenues par Dave de Vos sur l'échelle européenne, après avoir étudié statistiquement 900000 parties.
Le paramètre "a" est trop bas dans la région 1 dan.
http://goratings.eu/Probabilities/A_PredictedEGD
http://goratings.eu/Probabilities/A_ObservedEGD
Normalement, il va en résulter une contraction de l'échelle, un joueur 5 dan dont le niveau est stable va progressivement perdre des points, tandis qu'un 5 kyu dont le niveau est stable va en gagner. Ces effets peuvent toutefois être masqués par une inflation ou une déflation générale de l'échelle.
L'écart entre les rangs correspond plutôt bien au nombre de pierres de handicap. Y compris pour les joueurs en dan.
https://lifein19x19.com/viewtopic.php?p=223871#p223871
De plus, le système "1 rang = 1 pierre" est à peu près transitif. Les statistiques montrent que si un joueur A donne trois pierres à B, et que B donne trois pierres à C, alors on vérifie bien que A et C sont de niveau égal quand ils jouent à 6 pierres.
C'est un fait curieux, car si le "a" est trop bas, l'écart entre les rangs ne devraient plus correspondre avec les handicaps. Dave pense que cela vient de la "reset policy" utilisée en Europe : quand un joueur pense que son niveau réel s'écarte de plus de deux rangs de son niveau à l'échelle, il peut demander à être inscrit à un niveau différent. Il n'a pas à passer par une commission de réévaluation, comme en France.
D'autres études montrent que le niveau estimé par le joueur lui-même est généralement plus juste que le niveau donné par l'échelle (basé sur le handicap le plus juste que deux joueurs estiment devoir utiliser). Ce qui expliquerait que l'échelle reste bonne, les auto-évaluations corrigeant les erreurs au premier ordre, tandis que l'erreur sur le paramètre "a" provoque une dérive de second ordre.
Dave montre également que le paramètre "con" n'a pas l'effet désiré. Il est introduit pour stabiliser plus vite le niveau des joueurs débutants et qui progressent vite. Mais en réalité son effet est plutôt de rajouter du désordre dans le bas du classement, et de rendre la déflation de l'échelle plus difficile à détecter, et donc à corriger.
Dave propose un nouveau système de calcul, avec un paramètre "a" révisé, et un système d'auto-réévaluation, permissif pour les débutants, mais contraignant pour les joueurs forts. Ses simulations montrent qu'avec un tel système, il n'a plus besoin d'introduire un epsilon pour compenser la déflation de l'échelle.
Je trouve ça super intéressant. Déjà, j'ignorais que le plancher de l'échelle européenne était à 20 kyu.
Pour bien conprendre l'effet du plancher de l'échelle, il faut rappeler qu'un système ELO possède un nombre de points fixe. Si un joueur en gagne, automatiquement, d'autres en perdent un nombre égal.
Sachant que les joueurs sont le plus souvent inscrit à un niveau double kyu, et qu'ils progressent ensuite vers un niveau final single kyu, un tel système dérive complètement avec le temps : les nouveaux "bouffent" tous les points disponibles en progressant.
Cinq paramètres (dans l'échelle française) injectent des points et travaillent dans le sens inverse pour stabiliser l'échelle :
-Les ajustements quand les joueurs progressent de plus de 60 points par tournoi. Ils gagnent des points qu'aucun adversaire ne perd.
-Les parties à handicap perdues par Blanc : Noir gagne plus de points que Blanc n'en perd
-Le paramètre epsilon, qui donnent toujours un tout petit peu plus au gagnant qu'il n'en prend au vainqueur.
-la commission de réévaluation, généralement sollicitée pour monter le niveau d'un joueur plutôt que l'inverse
-le plancher de l'échelle. Si on est tout en bas et qu'on perd une partie, on ne descend pas.
Or, la tranche 30-20 kyu est très peu peuplée, et on a rarement des joueurs qui stagnent à 30 kyu. Ce serait beaucoup moins vrai si le placher était à 20 kyu.
En fait, cela donne l'impression que l'échelle française n'a "pas de fond".