１月３０日：AIギャンブラー（１月２６日号Science掲載論文）

2018年1月30日

SNSシェア

チェス、将棋、囲碁のように、ルールが明確で、一手一手について評価を下すことが可能な場合に、AIが機械学習を繰り返してプロを凌駕する力をつけてきたのは、数理の苦手な私にもある程度理解できる。しかし、ポーカーのような賭け事となると、何をdeep learningしたらいいのかなど、難しい問題が多いような気がする。もちろん確率のみで勝負したのでは話にならない。自分が悪い手の時、相手の賭け方や態度から手を推察して、必要なら悪い手でも勝負に出て勝つことができないとギャンブラーにはなれないはずだ。この相手の心の読みをAIで本当にできるのか？

昨年初め、カーネギーメロン大学が開発したLibratusと名付けられたAIが、Non-Limit Texas hold’emというポーカーゲームのプロ４人とそれぞれサシで対戦し、４人とも打ち負かしたというニュースが飛び込んできて、AIはギャンブルでも人間以上の能力を持ちうるのかと話題になった。

今日紹介するカーネギーメロン大学からの論文はまさにこのLibratusをどのように設計したのか開示した論文で１月２６日号のScienceに掲載された。タイトルは「Superhuman AI for heads-up no-limit poker: Libratus beats top professional（Heads-up no-limit pokerのための超人的AI: Libratus がトッププロを破った）」だ。

と始めたが、私自身の最も苦手な数理分野で、さらにこのポーカーのルールを全く知らないときているので、正しく伝えられるとは思えないことをまず断っておく。

読んでみるとこの遊びは自分の持ち札２枚だけを判断材料に、最初はオープンの札なしに、次に３枚、そして最後に１枚追加のオープンの札を合わせた時、ポーカーのどの組み合わせが出来るか判断し、それぞれの段階で賭けを行い、相手が下りればその時点で、降りなければ最後にコールして勝負を決める。ポーカーの中でも、相手の手を読む要素が多いようにできている。

基本が理解できているわけではないが、Libratusは、オープンの札のない時は確率論に従った大局的な判断で賭けを行い、オープン札が示される３ラウンド目からは相手の可能な手を予想しながら少しでも正しい判断をしようとする局面に対応したアルゴリズムにスイッチする。そして、相手の動きに合わせて、どの時点で確率に基づく大局的判断だけではうまくいかないかを学習することで、判断の精度を上げるようだ。実際には、最初の方のラウンドでの相手の賭け方がAIが学習する最も重要なポイントになっているようで、自分が悪い手の時、そのまま降りるのではなく、相手の手の強さをなんとか判断し、負けていても強気の手を打つことを可能にしている。

詳細を問われるとお手上げなのでこの程度で止めておくが、私の理解が正しければ、今回うまくいったとしても、今後も絶対に勝ち続けられるかちょっと疑問に思う。要するに、自分が悪い手の時に、強気に出る方法を学習しているように思えるので、次の対戦になると、プロも機械の癖を学習できるのではないだろうか。また、ポーカーはもともと一対一のゲームではない。多くの参加者がいる場合に通用するAIを開発して初めてAIギャンブラー開発と言えるだろう。

とはいえ、ギャンブルにまでAIを適用しようとする研究には脱帽だ。というのも、ギャンブルに対応するということは、不確定要素の多い状況での人間の判断について、AIがより的確な判断をするようになるということで、チェスや将棋とは異なり、知能とは異なる人間の精神活動がAIでカバーできることになる。その意味で、この研究は重要だ。ぜひ専門の誰かに、もう少しこの設計の詳細をわかりやすく解説てもらいたいものだ。

ピンバック: Web定点観測：2月第1週 (1/28-2/3) – Pre Clusters

コメントを残すコメントをキャンセル

<<戻る

１月３０日：AIギャンブラー（１月２６日号Science掲載論文）

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル