将棋のプロに初めて勝った2017年当時はポナンザの学習方法はロジスティック回帰だった。
強くなるアイディアを思い付いても打率は100本中、2か3くらいだと。
恐らくパラメータ自体を開発者が考えて勝率を高めていったと理解したが、
これは著者(開発者)が開発始めた当時、東大の将棋部でアマ五段のつよい人だったからこそできたのだろう。
当時はまだディープラーニングは将棋ソフト開発では流行っていなかったみたいなので恐らく今は状況が違うんじゃないかな。
ちょっと面白い記述だと思ったのがディープラーニングは(当時)画像認識に強いので
盤面を画像として学習させたら上手くいくんじゃないの、の部分。
続いて人間は画像認識が得意、それ以上の(次元)認識は苦手なので正に脳に近いので等書いているが、この辺は最新の研究だとどうなっているのかなと思った