プルリブス勝利!対戦相手の経歴が凄い。AIが勝つために行った秘策とは?

プルリブス勝利!対戦相手が凄かった!勝つために行った秘策とは?

スポンサーリンク

ポーカーフェイスという言葉があるように、ポーカーでは自分の持ち札を相手に悟られないようにしなければなりません。これはポーカーが「不完全情報ゲーム」で、相手の様子を観察しながら持ち札を推測してゲームを進めて行くゲームだからです。これまでAIがプロのプレイヤーに勝っていたのは、相手の持ち駒が分かっている「完全情報ゲーム」のチェスや囲碁や将棋でした。「不完全情報ゲーム」のポーカーのトッププロ相手に、AIが勝利したのです。詳しく見ていきましょう。

このAIを開発したのはフェイスブック?

フェイスブックの人工知能開発チームと共同研究を行っている米カーネギーメロン大学ツオマス・サンドホルム教授の研究チームがこのAI「プルリブス」を開発しました。

実はこのチームは既に2017年に「リブラトゥス」というAIを開発し、プロ相手に勝利を収め、不完全情報ゲームであってもAIが高いスキルを持った人間相手に勝利できることを証明していました。

今回は何が違うの?

2017年に行われた対戦はAI人と人間が1対1で行ったゲームでした。当時、サンドホルム氏はプレイヤーが複数の場合駆け引きが複雑になるのでAIが勝利を収めるのは難しいと考えていました。

しかし、フェイスブックと協力してプルリブスを開発したサンドホルム氏は、改めてポーカープロを含めた6人での対戦に挑戦したのです。

プルリブスはまず自分自身のコピーと何度も対戦を繰り返す自己学習を8日間にわたって行いました。次に、「人間5人+プルリブス」のポーカープロを5人との6人対戦を12日間で1万戦も行いました。

人間側として選ばれたポーカープロは、過去のポーカートーナメントで少なくとも100万ドル以上もの賞金を獲得した経験のあるトッププロでした。トッププロ15人がシフトを組み、1戦ごとに報酬が支払われたほか、パフォーマンスを上げるために成果によって5万ドル(約540万円)が分配されるなどされましたが、1万戦を終えた結果はプルリブスの圧勝でした。

AIと対戦したプロのポーカープレイヤーは?

「人間1人+プルリブス5つ」というスタイルでの6人対戦も行われ、複数の優勝経験があるクリス・ファーガソン氏やダレン・エリアス氏らも含まれていました。

クリス・ファーガソン氏は、10歳からポーカーを始め、これまで8ミリオンドル(8億円)以上の賞金額を獲得しています。

またダレン・エリアス氏は、ワールドポーカーツアー(WPT)で4回もの優勝経験があるトッププロの中のさらにトップです。この「人間1人+プルリブス5つ」でも、やはりプルリブスが人間側に対して勝利を収めることに成功しています。

ファーガソン氏はプルリブスとの対戦について「プルリブスは非常に手強い相手でした」と話し、プルリブスの手札を推測するのが難しく、プルリブスは薄い利益を着実に獲得していたとの感想を述べました。

また、別のプレイヤー、エリアス氏は、プルリブスは「戦略をミックスする能力」だと指摘。があると話し、人間のようにその人独自の癖がないためプルリブスの次の手は推測しにくく、また人間には不可能なレベルで戦略をランダムに分散させていたそうです。

このようにプルリブスはAIならではの特性を生かして勝利を収めたのですね。

スポンサーリンク

カードだけ見て判断しているの?相手の表情の読み取りは?

「不完全情報ゲーム」といわれるポーカーで、AIはどんな情報をもとに戦略を決めているのでしょうか。

まずAIが勝利したプレイは、日本でよくある5枚の手札を山札と交換する5ドローポーカーではなく、世界で最もよく行われるテキサス・ホールデムというルールでした。

テキサス・ホールデムでは個々のプレイヤーだけが使用できる2枚の手札と、全てのプレイヤーが使用できる5枚の場札、計7枚のカードを組み合わせてポーカーの役を作ります。さらにプレイヤーはカードが配られるたびにアクションを行うので、他のプレーヤーの影響を強く受けます。日本で行われる5ドローポーカーより駆け引きが多いことが特徴です。

プルリブスはまず自分自身のコピーと何度も対戦を繰り返す自己学習を8日間にわたって行いました。自らのプログラム内で練習し、最も有利となるポーカーの手を徐々に自己学習をしたのです。

そうすることで、異なる戦術を同時に使えるようになりました。次に、「人間5人+プルリブス」のポーカープロを5人との6人対戦を12日間で1万戦も行いました。その中で人間を相手にする際の戦略も学んでいったのです。

これまでAIが勝った試合は?

1997年チェスでAIが人間に勝利したことは世界に衝撃を与えました。

将棋の世界ではAIが現役のタイトル保持者を打ち負かし無敗を誇り、既に人間がAIに勝つことが不可能と言われています。また囲碁はチェスや将棋に比べて有効な手が多いことから開発が難しいと言われていましたが2017年に世界最高峰の囲碁棋士にAIが勝利しました。

まとめ

プルリブスの共同開発者であるフェイスブックのノーム・ブラウン氏は、「これは2人対戦でもなく、ゼロサムゲームでもないゲームにおいての最初のベンチマークです」と述べています。

ゲームではなくリアルな世界で相手の何を考えているのかわからない状態での判断を迫られる状況は多々あります。外交、サイバーセキュリティ、金融取引、ビジネスの現場など、あらゆる分野の困難を乗り切るためにプルリブスのノウハウが生かされる可能性があるそうです。

困った時には、まずAIにお伺いして解決策を考える時代がもうすぐ来るのかもしれませんね!

スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です