AlphaZeroのハンズオン01 はじめに
AlphaZeroの論文から実際にAlphaZero的なMLを開発をした方がいます。
実際にGitHubからソースコードをDLし、Anaconda+Keras環境で動かしてみたいと思います。
動かすまで色々とチューニングしたのでその備忘録的なものになります。
それにしても、シンプルなコード(Python)+モンテカルロツリー+Tensorflowで碁で人間を打ち負かすとは驚きです。
コードを読める方はぜひ読んでみてください。
理論的には、以下が役に立つと思います。
http://home.q00.itscom.net/otsuki/alphaZero.pdf