Deep MindのAIがFPSで人類を圧倒 チームワークを学習
DeepMindの研究者たちはFPSチームとして働くために「お互いに教えあう」AIボットを作った。ボットは人間が発明した古典的な戦略を真似るだけでなく、バグを利用した独自戦略を発明することさえした。
昔からのゲーマーは、古典的なファースト・パーソン・シューター(FPS) ゲームである「Quake」がどれほど難しいかを知っています。迷路のようなフィールドで、他のプレイヤーと協力して、致命的な銃撃を避けながら、浮かんでいる目標を捕らえなければなりません。そして今、初めて人工知能(AI)がその複雑な一人称視点のビデオゲームでチームワークをマスターし、人間とコンピュータの両方のチームメイトと連携して行動を調整し、一貫して相手を打ち負かすことができるようになりました。
AIは車を運転したり、チェスや囲碁の世界最強のプレイヤーを1対1で簡単に打ち負かすことができるが、研究者たちはチームワークを習得させるのに苦労してきた。練習は私たちには直感的に見えるかもしれませんが、他の人がどのように行動するかを予測することは、チームで仕事をする上で重要な要素であり、AIに全く新しいレベルの複雑さと不確実性の克服を要求します。
新しい研究では、研究者たちは、チームとして働くために「お互いに教えあう」AIボットを手に入れた。彼らの訓練の場は、1999年のFPSゲーム『Quake III Arena』の簡略化されたバージョンだった。ゲームは、相手の基地から旗を取得し、自分の基地にそれを返すために3Dマップの周りを移動する2つのチームが含まれます。5分後に最も多くの旗を持っているチームが勝利します。また、プレイヤーはレーザーを発射して敵にタグを付け、敵を本拠地に送り返すことができます。とても乱暴な言い方をすると、『スプラトゥーン』の「旗版」がQuakeです。
45万回のゲームプレイの後、研究者たちは最高のボット「For The Win (FTW)」にたどり着きました。その後、FTWボット、ゲームに内蔵されているボット、そして人間を使って、様々な試合でテストを行いました。FTWボットのチームは一貫して他のすべてのグループを上回るパフォーマンスを示したが、FTWボットとペアになった人間は5%の時間で彼らを倒すことができた、とGoogle所有のDeepMindのAI研究者であるMax JaderbergらはScience誌に報告している。
FTWボットは人間や機械とシームレスにプレイすることを学び、人間が生み出した古典的な協力戦略さえも実践するようになった、とJaderbergらは記述する。これらの戦略には、後の銃撃戦で相手よりも数で勝るためにチームメイトを追いかけたり、チームメイトが旗を持っているときに敵の基地の近くでうろついたりして、旗が再び現れたときにすぐにそれを掴むというものが含まれる。あるテストでは、チームメイトが背中を撃つことでお互いにスピードを上げることができるバグを利用して、ボットは全く新しい戦略を発明しました。
このアプローチは、現実の世界で機能するにはまだ遠い道のりだと、Jaderberg氏は付け加えます。しかし、この進歩はコンピュータゲーム以上のものに役立つでしょう。AIがチームで作業することを学べるようになれば、お互いに協調して衝突を回避する自動運転車から、処置中に医師を助けるロボット手術補助員まで、あらゆることができるようになるだろう。
参照文献
- Max Jaderberg. Wojciech M. Czarnecki, Iain Dunning. Human-level performance in 3D multiplayer games with population-based learning. Science 31 May 2019:Vol. 364, Issue 6443, pp. 859-865
Image via DeepMind