Alpha Goが人の手を借りずに最強になったことの

AlphaGo Zeroは自己対局のみでスキルアップし、人間の手を借りていません。つまり、囲碁やそれに類する完全情報ゲームに関しては多量のトレーニングデータなしで優秀なモデルを作れることが明らかにされました。

Alpha Goが人の手を借りずに最強になったことの

最近、人工知能の開発ブレーンであるDeepMindは「AlphaGo Zero」が、データなしの学習で、AlphaGoの以前のバージョンよりも高いレーティングを達成したと発表しました。AlphaGo Zeroは自己対局のみでスキルアップし、人間の手を借りていません。つまり、囲碁やそれに類する完全情報ゲームに関しては多量のトレーニングデータなしで優秀なモデルを作れることが明らかにされました。

オセロ: (探索空間の大きさ: 10の60乗) チェス: (探索空間の大きさ:10の120乗) 将棋: (探索空間の大きさ:~10の220乗) 囲碁: (探索空間の大きさ:~10の360乗)

この常識を破ってしまったのがアルファ碁です。アルファ碁は世界で最も強い棋士の一人、韓国の李セドル九段や柯潔九段などに勝利しました。

アルファ碁同士の対局の棋譜が公開され、機械たちが人間の常識を打ち破るような手筋を打っていたことに注目が集まりました。アルファ碁は人間の棋譜をトレーニングデータとした後は、ニューラルネット同士の対局を繰り返すことで進化したのです。

アルファ碁同士の対局の棋譜が公開され、機械たちが人間の常識を打ち破るような手筋を打っていたことに注目が集まりました。アルファ碁は人間の棋譜をトレーニングデータとした後は、ニューラルネット同士の対局を繰り返すことで進化したのです。

20171019173953
fig01 by Takushi Yoshida

でも、今回のAlpha Goは最初の人間のトレーニングデータを利用していないのです。それにもかかわらず、李セドルに勝利したバージョンを超すのに、学習に要したのは3日です。それよりも格段に強いバージョンであるAlpha Go Masterに勝利するのにも21日のみです。

「有望さ」を足がかりにする探索

アルファ碁は一手指すために有望そうな手を中心に、複雑な方法をとりながら膨大なシミュレーションを進めていきます。アルファ碁の力がある地点を超えた後は、そのシミュレーションは人間が想定もしていない手を含んでおり、人間には奇妙に見えます。

20171019174336 (1)

完全情報ゲームと不完全情報ゲーム

アルファ碁のとった探索方法が他の分野、あるいは現実世界にどれだけ応用可能か、はとても興味深い問いです。この応用可能性を考える際に重要なのが完全情報ゲームと不完全情報ゲームというカテゴリの違いです。

完全情報ゲームはプレイヤーはゲームの情報のすべてを得ることができます。自分がしたことの影響や周辺要因のすべてが明らかなゲームです。オセロ、将棋、チェス、囲碁などがこれに当たります。

不完全情報ゲームはゲームの情報の一部分がプレイヤーから見えないようになっているものを指します。麻雀やポーカー、バカラのようなカードゲームがこれに類します。

不完全情報ゲームでは、実力だけでなく運も勝敗を左右します。プレイヤーが取得できる情報は限られており、限られた情報からリスクや成功可能性などを推測しないといけません。さまざまな不確実性に覆われています。プレイヤーは戦略の立て方がとてもむずかしいのです。

今後はAIが不完全情報ゲームでどれだけ人間にキャッチアップできるかが重要になるでしょう。極めて条件の限られたポーカーのゲームでは、AIが人間に勝つという事象が出てきています。この限定的なルールのもとでは、AIは人間よりもリスク算定に優れているようでした。ポーカーは投資のゲームと言われますが、AIは自分の優位を確信すると容赦なく他のプレイヤーにプレッシャーをかけます。今後はAIが人間に迫る時期が来るかもしれません。

Alpha Goの登場は何を意味しているのか?

  • 完全情報ゲームではAIは人間の知見を頼らずして人間を超えてしまう
  • 条件が限られたタスクに関しては機械が人間に勝るという未来は近い

AIが得意な仕事は、AIに取って代わられる日が来るでしょう。AIが得意な領域も拡大していくかもしれません。でも、それでいいのです。社会は生産性を劇的に向上させることができます。私たちは働かずして稼ぐことができるでしょう。

でも、人間社会の仕組みがそのままなら、大量の失業者が生まれ、所得格差が異常なレベルに達します。スラム街から英雄が現れ、コンピュータを破壊する宗教をはじめるかもしれません。

私たちの社会や考え方が、急激な生産性の向上や、さまざまなサービスに安価にアクセスできるというAI時代の利点を受け入れられるようにしないといけません。それはこの社会がどんなものであるべきかということを根本から考え直すことでしょう。

Alpah Go Zeroが人間のトレーニングデータを必要としなかったように、今後私たちは、バイアスにさらされる人間の頭脳ではたどり着かない手法や解決策を手に入れられるようになります。そのときに混乱せずに、新しいコンピューティングのちからを活かせる社会こそ、最も必要なものなのです。

eyecaytch image via DeepMind

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史
新たなスエズ危機に直面する米海軍[英エコノミスト]

新たなスエズ危機に直面する米海軍[英エコノミスト]

世界が繁栄するためには、船が港に到着しなければならない。マラッカ海峡やパナマ運河のような狭い航路を通過するとき、船舶は最も脆弱になる。そのため、スエズ運河への唯一の南側航路である紅海で最近急増している船舶への攻撃は、世界貿易にとって重大な脅威となっている。イランに支援されたイエメンの過激派フーシ派は、表向きはパレスチナ人を支援するために、35カ国以上につながる船舶に向けて100機以上の無人機やミサイルを発射した。彼らのキャンペーンは、黒海から南シナ海まですでに危険にさらされている航行の自由の原則に対する冒涜である。アメリカとその同盟国は、中東での紛争をエスカレートさせることなく、この問題にしっかりと対処しなければならない。 世界のコンテナ輸送量の20%、海上貿易の10%、海上ガスと石油の8~10%が紅海とスエズルートを通過している。数週間の騒乱の後、世界の5大コンテナ船会社のうち4社が紅海とスエズ航路の航海を停止し、BPは石油の出荷を一時停止した。十分な供給があるため、エネルギー価格への影響は軽微である。しかし、コンテナ会社の株価は、投資家が輸送能力の縮小を予想している

By エコノミスト(英国)