昨年初め、カーネギーメロン大学が開発したLibratusと名付けられたAIが、Non-Limit Texas hold’emというポーカーゲームのプロ4人とそれぞれサシで対戦し、4人とも打ち負かしたというニュースが飛び込んできて、AIはギャンブルでも人間以上の能力を持ちうるのかと話題になった。
今日紹介するカーネギーメロン大学からの論文はまさにこのLibratusをどのように設計したのか開示した論文で1月26日号のScienceに掲載された。タイトルは「Superhuman AI for heads-up no-limit poker: Libratus beats top professional(Heads-up no-limit pokerのための超人的AI: Libratus がトッププロを破った)」だ。
と始めたが、私自身の最も苦手な数理分野で、さらにこのポーカーのルールを全く知らないときているので、正しく伝えられるとは思えないことをまず断っておく。
読んでみるとこの遊びは自分の持ち札2枚だけを判断材料に、最初はオープンの札なしに、次に3枚、そして最後に1枚追加のオープンの札を合わせた時、ポーカーのどの組み合わせが出来るか判断し、それぞれの段階で賭けを行い、相手が下りればその時点で、降りなければ最後にコールして勝負を決める。ポーカーの中でも、相手の手を読む要素が多いようにできている。
基本が理解できているわけではないが、Libratusは、オープンの札のない時は確率論に従った大局的な判断で賭けを行い、オープン札が示される3ラウンド目からは相手の可能な手を予想しながら少しでも正しい判断をしようとする局面に対応したアルゴリズムにスイッチする。そして、相手の動きに合わせて、どの時点で確率に基づく大局的判断だけではうまくいかないかを学習することで、判断の精度を上げるようだ。実際には、最初の方のラウンドでの相手の賭け方がAIが学習する最も重要なポイントになっているようで、自分が悪い手の時、そのまま降りるのではなく、相手の手の強さをなんとか判断し、負けていても強気の手を打つことを可能にしている。
詳細を問われるとお手上げなのでこの程度で止めておくが、私の理解が正しければ、今回うまくいったとしても、今後も絶対に勝ち続けられるかちょっと疑問に思う。要するに、自分が悪い手の時に、強気に出る方法を学習しているように思えるので、次の対戦になると、プロも機械の癖を学習できるのではないだろうか。また、ポーカーはもともと一対一のゲームではない。多くの参加者がいる場合に通用するAIを開発して初めてAIギャンブラー開発と言えるだろう。
とはいえ、ギャンブルにまでAIを適用しようとする研究には脱帽だ。というのも、ギャンブルに対応するということは、不確定要素の多い状況での人間の判断について、AIがより的確な判断をするようになるということで、チェスや将棋とは異なり、知能とは異なる人間の精神活動がAIでカバーできることになる。その意味で、この研究は重要だ。ぜひ専門の誰かに、もう少しこの設計の詳細をわかりやすく解説てもらいたいものだ。
-
ピンバック: Web定点観測:2月第1週 (1/28-2/3) – Pre Clusters