将棋AIで学ぶディープラーニングを読む

7.5.1 棋譜のクリーニング

2015,2016,2017年の3年分の棋譜をDwonLoadしてクリーニングした
結構時間がかかった。

kifu count : 82882
rate mean : 3080.1035267006105
rate median : 3054.0
rate max : 9630.0
rate min : 2500.0
約3倍のデータが集まった。

7.5.2 訓練データとテストデータに分割

total kifu num = 82883
train kifu num = 74594(90%)
test kifu num = 8289(10%)
それぞれのファイルのリストは
myproject/dlshogi/python_dlshogi_master/utilsに書き込まれた