Minimal Green

はてなブログテーマ『Minimal Green』のデモブログ。はてなブログカスタマイズや、HTML、CSSなどについて書いています。

将棋ソフト不正使用疑惑問題と一致率の統計的有意性について

f:id:syofuso:20161025010212j:plain

将棋棋士三浦弘行九段のソフト使用疑惑が取り沙汰され、色々な人が色々意見を述べています。

http://gattolibero.hatenablog.com/entry/%E4%B8%89%E6%B5%A6%E4%B9%9D%E6%AE%B5%E3%81%AE%E3%82%BD%E3%83%95%E3%83%88%E4%B8%8D%E6%AD%A3%E7%96%91%E6%83%91%E3%81%A8%E5%B0%86%E6%A3%8B%E9%80%A3%E7%9B%9F%E3%81%AE%E5%AF%BE%E5%BF%9Cgattolibero.hatenablog.com
id:gattoliberoさん 自由ネコさんのブログは楽しい記事が多く、いつも面白く読ませていただいていますが、今回の記事には確証もなく三浦九段を黒と断定して中傷しており、疑問に感じました。

また、当然ながらこの記事の検証結果はそれによって「三浦九段が黒だとか白だとか」断定できる判断材料にはなり得ませんので、ご了承を。 

 

一連の経緯

shogi1.com

一連の問題の流れについては上記のブログが参考になると思います。

 私はプロ棋士の棋譜を読む力はありませんが、将棋棋士の読み物・エッセイが好きな、将棋棋士のファンです。(いわゆる観る将ですね)

今回の将棋連盟の処分・対応と三浦九段が黒確定ありきの報道(特にワイドショーなどの初期報道)には疑問に思っています。

プロ棋士が「怪しい!」と言っているんだからとおっしゃる意見もありますが、プロ棋士みんなが疑惑を報道前から知っていた訳でも、黒だと断定してる訳でもありません。
丸山忠久九段は「対局で不審に思うことはなかった」「連盟の対応は疑問だらけ」とおっしゃっていますし、上野裕和五段は以下のようなツイートをされています。

疑惑が生じ始めたのは7月以降とのことですので、ここではとりあえず、三浦九段の将棋ソフト技巧との一致率に、6月以前と7月以後で統計的に有意差があるかないか検定してみたいと思います。

対象とする標本

将棋専門の2chまとめブログの記事:

i2chmeijin.blog.fc2.com

2ちゃんねるの将棋板での検証より三浦九段の2016年の主な対局の、駒がぶつかってからの技巧との一致率を抽出しました。自分で棋譜を解析するべきでしょうが、私のPCが低スペなのと、一致率を調べるのに手間がかかる過ぎるため2chの検証スレからお借りしました。

ここでの一致率とはソフト最善手と棋譜と一致する割合(狭義の一致率)だと思われます。

Excelの分析ツールt検定による分析結果

 標本X: 6月以前の三浦九段の対局の技巧と一致率 (%)

標本Y:7月以降の三浦九段の対局の技巧との一致率 (%)

帰無仮説 H0:6月以前と7月以降で三浦九段の対局での技巧と一致率の平均に差が無い(標本Xと標本Yの平均に差が無い)

対立仮説 H1 :6月以前と7月以降で三浦九段の対局での技巧と一致率の平均に差が有る

(標本Xと標本Yの平均に差が有る)

表1 標本X:6月以前 標本Y:7月以降

標本X 標本Y
78.9 74.1
53.8 80.6
52.8 83.3
54.5 80.8
67.6 81.8
68.2 58.3
63 48.5
40 48.6
36

まず、2つの標本X,Yについて分散に差があるかどうか、有意水準5%でExcelの分析ツールのF検定を用いて調べた。

表2 変数1:標本Y 変数2:標本X (変数1の分散>変数2の分散とするため、入れ替え)

F-検定: 2 標本を使った分散の検定    
  変数 1 変数 2
平均 69.5 57.2
分散 231.0057143 189.6475
観測数 8 9
自由度 7 8
観測された分散比 1.218079407  
P(F<=f) 片側 0.390661423  
F 境界値 片側 3.500463855  

P(F<=f) 片側=0.390661423>0.05(片側)

よって標本X、Yの分散に有意差は無いといえる。

次にExcelの分析ツールの「t-検定: 等分散を仮定した2標本による検定」を用いて有意水準5%で2標本の平均差があるかどうか調べた。

表3 変数1:標本X 変数2:標本Y

 変数 1変数 2

t-検定: 等分散を仮定した2標本による検定    
平均 57.2 69.5
分散 189.6475 231.0057143
観測数 9 8
プールされた分散 208.948  
仮説平均との差異 0  
自由度 15  
t -1.751167908  
P(T<=t) 片側 0.050166525  
t 境界値 片側 1.753050325  
P(T<=t) 両側 0.10033305  
t 境界値 両側 2.131449536  

P(T<=t) 両側=0.10033305>0.05

よって帰無仮説H0は棄却できず、標本Xと標本Yの平均に有意差はないとみなせる。

三浦九段の6月以前の対局と7月以降の対局の技巧との一致率の平均に有意差はないとみなせる、ということになります。(このデータとt検定の結果では)

(有意水準1%としても成り立ちます。)

t検定の結果について

この分析結果はあくまで三浦九段の2016/2/18以降の勝局と敗局を含めた対局(2ch名人の記事から抽出した対局)を6月以前と7月以降に分けて比較したものです。

また、本来一致率を何手目から何手目までを対象とするべきかはわかりませんが、とりあえずここでは駒がぶつかり始めて以降の手を対象としています。

勝局のみを対象とした場合は有意水準5%では有意差があり、有意水準1%では有意差はないと言える結果でした。

三浦九段が黒だった場合、勝局のみソフトを使っていたのか、それとも全局使っていたのか、負けた対局でも使っていたのか、私には判断できません。

統計的有意性と言っても、検定よって有意差がある、無いと断定できるものではなく、ある水準での仮の判断に過ぎません。なので上記の結果も「みなせる」としか言っていません。

私はあえて有意差はないという結果を上記のように表をつかって説明しました。

このように恣意的な結果を誘導し個人ブログで主張することは簡単なのです。

何が言いたいのかと言うと、今の段階では三浦九段がソフト指しをしたかどうかはわからないのです。

渡辺明竜王が「三浦九段が勝った20局のうち4局で、定跡手順を外れて以降の「一致率」が90%を超えた」とおっしゃっているそうですが、恣意的なデータを抽出して結論を導き出しているように思えます。

渡辺明竜王は千田翔太五段が行ったソフトとの一致率分析により上記の主張をされているようですが、千田翔太五段のTwitterからリンクされているdropboxのデータでは統計的処理がなされておらず、失礼ですが千田五段には統計学の基礎素養が無いように見受けられます。

【追記】この件りは余計でした。千田五段はあえて棋譜が手に入る者なら誰でも出来るデータを出しただけだと思います。特に意図はないでしょう。

もっとも会合や連盟の説明会ではもう少しちゃんとした処理をして説明されたのかもしれませんね。

www.huffingtonpost.jp

勝った対局だけソフトを使ったとみなすことはできませんし、サンプル数も少ないし、私の出した上記の結果も意味のあるものだとは思えません。

調べるなら他の棋士の対局も含めて過去に遡って200局以上を対象に検証するべきでしょう。

参考:棋士別Bonanza一致率の計算

http://www.geocities.jp/shogi_depot/doc/Bonanza_m.pdf

数年前のデータですが、↑をみると三浦九段は元々ソフトとの一致率の一番高い棋士なんですね。

真っ当な検証を行うには将棋GUIをダウンロードして各種将棋ソフトをダウンロードして、棋士の棋譜をダウンロードして・・・とかなり膨大な数になり大変です。

将棋連盟も調査チームを作りきちんとした専門家を交えての調査を行うそうなのでそちらの結果を待ちですね。

【追記】12/27 第三者調査委員会と三浦弘行氏の会見を受けて記事を書きました。
三浦弘行九段の将棋ソフト使用疑惑は不正なしという調査結果を受けて - Minimal Green