Alpha Goが人の手を借りずに最強になったことの

AlphaGo Zeroは自己対局のみでスキルアップし、人間の手を借りていません。つまり、囲碁やそれに類する完全情報ゲームに関しては多量のトレーニングデータなしで優秀なモデルを作れることが明らかにされました。

Alpha Goが人の手を借りずに最強になったことの

最近、人工知能の開発ブレーンであるDeepMindは「AlphaGo Zero」が、データなしの学習で、AlphaGoの以前のバージョンよりも高いレーティングを達成したと発表しました。AlphaGo Zeroは自己対局のみでスキルアップし、人間の手を借りていません。つまり、囲碁やそれに類する完全情報ゲームに関しては多量のトレーニングデータなしで優秀なモデルを作れることが明らかにされました。

オセロ: (探索空間の大きさ: 10の60乗) チェス: (探索空間の大きさ:10の120乗) 将棋: (探索空間の大きさ:~10の220乗) 囲碁: (探索空間の大きさ:~10の360乗)

この常識を破ってしまったのがアルファ碁です。アルファ碁は世界で最も強い棋士の一人、韓国の李セドル九段や柯潔九段などに勝利しました。

アルファ碁同士の対局の棋譜が公開され、機械たちが人間の常識を打ち破るような手筋を打っていたことに注目が集まりました。アルファ碁は人間の棋譜をトレーニングデータとした後は、ニューラルネット同士の対局を繰り返すことで進化したのです。

アルファ碁同士の対局の棋譜が公開され、機械たちが人間の常識を打ち破るような手筋を打っていたことに注目が集まりました。アルファ碁は人間の棋譜をトレーニングデータとした後は、ニューラルネット同士の対局を繰り返すことで進化したのです。

20171019173953
fig01 by Takushi Yoshida

でも、今回のAlpha Goは最初の人間のトレーニングデータを利用していないのです。それにもかかわらず、李セドルに勝利したバージョンを超すのに、学習に要したのは3日です。それよりも格段に強いバージョンであるAlpha Go Masterに勝利するのにも21日のみです。

「有望さ」を足がかりにする探索

アルファ碁は一手指すために有望そうな手を中心に、複雑な方法をとりながら膨大なシミュレーションを進めていきます。アルファ碁の力がある地点を超えた後は、そのシミュレーションは人間が想定もしていない手を含んでおり、人間には奇妙に見えます。

20171019174336 (1)

完全情報ゲームと不完全情報ゲーム

アルファ碁のとった探索方法が他の分野、あるいは現実世界にどれだけ応用可能か、はとても興味深い問いです。この応用可能性を考える際に重要なのが完全情報ゲームと不完全情報ゲームというカテゴリの違いです。

完全情報ゲームはプレイヤーはゲームの情報のすべてを得ることができます。自分がしたことの影響や周辺要因のすべてが明らかなゲームです。オセロ、将棋、チェス、囲碁などがこれに当たります。

不完全情報ゲームはゲームの情報の一部分がプレイヤーから見えないようになっているものを指します。麻雀やポーカー、バカラのようなカードゲームがこれに類します。

不完全情報ゲームでは、実力だけでなく運も勝敗を左右します。プレイヤーが取得できる情報は限られており、限られた情報からリスクや成功可能性などを推測しないといけません。さまざまな不確実性に覆われています。プレイヤーは戦略の立て方がとてもむずかしいのです。

今後はAIが不完全情報ゲームでどれだけ人間にキャッチアップできるかが重要になるでしょう。極めて条件の限られたポーカーのゲームでは、AIが人間に勝つという事象が出てきています。この限定的なルールのもとでは、AIは人間よりもリスク算定に優れているようでした。ポーカーは投資のゲームと言われますが、AIは自分の優位を確信すると容赦なく他のプレイヤーにプレッシャーをかけます。今後はAIが人間に迫る時期が来るかもしれません。

Alpha Goの登場は何を意味しているのか?

  • 完全情報ゲームではAIは人間の知見を頼らずして人間を超えてしまう
  • 条件が限られたタスクに関しては機械が人間に勝るという未来は近い

AIが得意な仕事は、AIに取って代わられる日が来るでしょう。AIが得意な領域も拡大していくかもしれません。でも、それでいいのです。社会は生産性を劇的に向上させることができます。私たちは働かずして稼ぐことができるでしょう。

でも、人間社会の仕組みがそのままなら、大量の失業者が生まれ、所得格差が異常なレベルに達します。スラム街から英雄が現れ、コンピュータを破壊する宗教をはじめるかもしれません。

私たちの社会や考え方が、急激な生産性の向上や、さまざまなサービスに安価にアクセスできるというAI時代の利点を受け入れられるようにしないといけません。それはこの社会がどんなものであるべきかということを根本から考え直すことでしょう。

Alpah Go Zeroが人間のトレーニングデータを必要としなかったように、今後私たちは、バイアスにさらされる人間の頭脳ではたどり着かない手法や解決策を手に入れられるようになります。そのときに混乱せずに、新しいコンピューティングのちからを活かせる社会こそ、最も必要なものなのです。

eyecaytch image via DeepMind

Read more

コロナは世界の子どもたちにとって大失敗だった[英エコノミスト]

コロナは世界の子どもたちにとって大失敗だった[英エコノミスト]

過去20年間、主に富裕国で構成されるOECDのアナリストたちは、学校の質を比較するために、3年ごとに数十カ国の生徒たちに読解、数学、科学のテストを受けてもらってきた。パンデミックによる混乱が何年も続いた後、1年遅れで2022年に実施された最新の試験で、良いニュースがもたらされるとは誰も予想していなかった。12月5日に発表された結果は、やはり打撃となった。

By エコノミスト(英国)
中国は2024年に経済的苦境を脱するか?[英エコノミスト]

中国は2024年に経済的苦境を脱するか?[英エコノミスト]

2007年から2009年にかけての世界金融危機の後、エコノミストたちは世界経済が二度と同じようにはならないことをすぐに理解した。災難を乗り越えたとはいえ、危機以前の現状ではなく、「新常態」へと回復するだろう。数年後、この言葉は中国の指導者たちにも採用された。彼らはこの言葉を、猛烈な成長、安価な労働力、途方もない貿易黒字からの脱却を表現するために使った。これらの変化は中国経済にとって必要な進化であり、それを受け入れるべきであり、激しく抵抗すべきではないと彼らは主張した。 中国がコロナを封じ込めるための長いキャンペーンを展開し、今年その再開が失望を呼んだ後、このような感情が再び現れている。格付け会社のムーディーズが今週、中国の信用格付けを中期的に引き下げなければならないかもしれないと述べた理由のひとつである。何人かのエコノミストは、中国の手に負えない不動産市場の新常態を宣言している。最近の日米首脳会談を受けて、中国とアメリカの関係に新たな均衡が生まれることを期待する論者もいる。中国社会科学院の蔡昉は9月、中国の人口減少、消費者の高齢化、選り好みする雇用主の混在によってもたら

By エコノミスト(英国)
イーロン・マスクの「X」は広告主のボイコットにめっぽう弱い[英エコノミスト]

イーロン・マスクの「X」は広告主のボイコットにめっぽう弱い[英エコノミスト]

広告業界を軽蔑するイーロン・マスクは、バイラルなスローガンを得意とする。11月29日に開催されたニューヨーク・タイムズのイベントで、世界一の富豪は、昨年彼が買収したソーシャル・ネットワーク、Xがツイッターとして知られていた頃の広告を引き上げる企業についてどう思うかと質問された。「誰かが私を脅迫しようとしているのなら、『勝手にしろ』」と彼は答えた。 彼のアプローチは、億万長者にとっては自然なことかもしれない。しかし、昨年、収益の90%ほどを広告から得ていた企業にとっては大胆なことだ。Xから広告を撤退させた企業には、アップルやディズニーが含まれる。マスクは以前、Xがブランドにとって安全な空間である証拠として、彼らの存在を挙げていた。

By エコノミスト(英国)