『人工知能はどのようにして「名人」を超えたのか?』の著者・山本一成さん
ヒト・モノ・カネ、すべてにおいて最強だったはずのポナンザが……?
—— ポナンザは今年の電王戦で佐藤天彦名人に2連勝し、ついに名人との勝負で勝利をおさめた初めてのソフトになりました。おめでとうございます。
山本一成(以下、山本) ありがとうございます。いやあ、ようやくここまできました。
—— といいつつ、名人に勝ったのは昨年バージョンのポナンザなんですよね。今日は、ディープラーニングを導入した最新のポナンザの話を中心に聞いていきたいと思います。
山本 はい、5月の世界コンピュータ将棋選手権に出場した「Ponanza Chainer」のことですね。
—— 「Chainer」というのは、PFNという日本の人工知能研究の総本山みたいな企業が提供しているディープラーニングのフレームワークの名前です。今回PFNと山本さんが組んで、チームにはPFNに所属する、プログラミングコンテストで世界4位になったこともある天才プログラマの秋葉拓哉さんも参加していたとか。
山本 PFNさんには、自分から声をかけたんですよ。「ディープラーニング教えてください」って。そうして教えてもらううちに、向こうから「じゃあいっそ、一緒に開発しませんか」と言ってくださって、チームとしてやることになりました。
—— それはすごい。そしてチームのメンバーだけでなく、マシンのスペックもまたすごかったんですよね。
山本 さくらインターネットさんにご協力いただいて、CPU1029基とGPU128基を用意して挑みました。ここまでやれば、調子がいいときだと1秒に10億手くらいまで読めます。
—— 他のチームの総コア数がほぼ一桁、二桁台のなか、CPU1092基って、むちゃくちゃ多いじゃないですか。大人げないですよ。
山本 1092基のなかには、コア数が88コアとかのCPUもあるんですよ。
—— それとGPUですよね。これだって1基20万とかするのに、それを128基……! もう、資本の力でぶん殴ってくる感じの強さですね(笑)。それなのに!
山本 そう、今回の世界コンピュータ将棋選手権にはヒト・モノ・カネを総動員したんですけどね……。
—— はい(笑)。全勝優勝間違いないとだれもが思ったのに、「elmo(エルモ)」という新興ソフトに負け、準優勝という結果になりました。エルモには、二次予選と決勝と二度対戦して、どちらも破れてしまったんですよね。正直、びっくりしました。
山本 僕もです。大会後、エルモがオープンソースとして公開されたから、一応検証しておこうと思って、1手10秒の設定で最新ポナンザと対戦させて勝率を確認したんです。そうしたら、266 局やって、ポナンザが173勝、4引き分け、89敗でした。勝率が約65%ですね。まあ当日のマシンスペックとは違う条件でやっているので、厳密にあの時の勝率が65%だったわけではないんですけど。
—— あ、ポナンザのほうが勝率が高いんだ……!
山本 でも65%ってことは、だいたい3回やって2回勝つくらい。で、ポナンザがエルモに二回続けて負ける確率は、10分の1くらいの確率ということですね。起こりうる範囲の数字かなと。だからまあ、仕方ないのかもしれません。レーティング(強さを表す数値)でいうと、たった113しか上じゃないんですよ。他のソフトにこんなに追いつめられたのは、ここ数年で初めてです。
—— レーティング100くらいって、段位でいうと一段差くらいですよね。初段と二段の対局だったら初段が勝つことも、たしかにそこそこあるし、そう考えたらエルモが勝つことも不思議ではない。
で、決勝のポナンザ×エルモ戦で、終盤ポナンザが立て続けに攻めの手を指しましたよね。そのとき、ポナンザの評価では自分のほうが有利だと判断していたんですか?
山本 まあ、いけるんじゃないの、くらいの感じでしたね。
—— たしかに、自分だったらあの怒涛の攻めを受けきれる気はしません。
山本 と、ポナンザも思ってたんでしょうね。でも、それが間違っていたんだなあ。
—— いやあ、ポナンザも間違えるんですね。山本さんはあのとき、どういう心境だったんですか?