« Méthode de Monte-Carlo » : différence entre les versions

Contenu supprimé Contenu ajouté
Nomen ad hoc (discuter | contributions)
mAucun résumé des modifications
Estimation de la valeur d'un coup au go : cf. AlphaGo et AlphaZero
Ligne 94 :
Aux échecs, comme dans beaucoup de jeux de plateau, il est possible de mesurer la valeur d'une position, et donc des coups y conduisant, en évaluant quantitativement la position obtenue : nombre de pièces sur l'échiquier, valeurs des pièces (1 point par pion, 5 par tour...), position relative des pièces entre elles, et en pondérant la valeur trouvée par les libertés, les protections des pièces, etc. Cette évaluation basée sur l'analyse et l'expertise est d'autant plus rapide à mesurer qu'on avance dans la partie, car le nombre de pièces diminue.
 
Dans le jeu de go, l'évaluation d'une position globale reste très difficile avec des méthodes d'analyses classiques du fait de l’enchevêtrement et de la complexité des positions locales et du nombre quasi infini de suites de coups possibles. En 2006, le mathématicien Rémi Coulom a fait progresser de manière très sensible cette fonction d'évaluation et l’efficience des logiciels de jeu de go en utilisant la méthode de Monte-Carlo : on joue ''"au hasard"'' un grand nombre de fins de parties réalistes à partir de la position "en cours d'évaluation" et on comptabilise la proportion de parties gagnantes/perdantes. Cette estimation statistique s'affine en biaisant le hasard par élimination de coups ''a priori'' stupides. Cette méthode s'avère très efficace<ref>{{Lien web|langue = |titre = le jeu de go, le seul jeu où l'ordinateur ne bat pas l'homme|url = http://www.slate.fr/life/86963/go-seul-jeu-ordinateur-pas-battre-homme|site = http://www.slate.fr|date = 5 mai 2014|consulté le = 15 septembre 2015}}</ref>{{,}}<ref>{{Lien web|langue = |titre = le jeu de go et la révolution de monte-carlo|url = https://interstices.info/jcms/c_43860/le-jeu-de-go-et-la-revolution-de-monte-carlo|site = https://interstices.info|date = 28 mai 2009|consulté le = 15 septembre 2015}}</ref>. Elle est utilisée en particulier par les programmes [[AlphaGo]] et [[AlphaZero]].
 
=== Estimation de la valeur d'un coup aux échecs ===