Google、選択的注意を模倣したAIエージェントを構築

Googleの研究者たちは「自己注意ボトルネック」を採用したAIソフトウェアエージェントの特性を調査した。研究者らは、これらのエージェントは、難解な視覚ベースのタスクを解くための適性を示すだけでなく、自分を混乱させる可能性のある詳細を無視し、タスクのわずかな変更に取り組むのが得意であると主張している。

Google、選択的注意を模倣したAIエージェントを構築

要点

Genetic and Evolutionary Computation Conference (GECCO) 2020に採択された研究では、Googleの研究者たちは「自己注意ボトルネック」(self-attention bottlenecks)を採用したAIソフトウェアエージェントの特性を調査した。研究者らは、これらのエージェントは、難解な視覚ベースのタスクを解くための適性を示すだけでなく、自分を混乱させる可能性のある詳細に対する不注意のために、タスクのわずかな変更に取り組むのが得意であると主張している。

選択的注意を再現する機械学習エージェント

非注意性盲目とは、人が目に見えるところにあるものを見落としてしまう現象である。これは「選択的注意」の結果であり、人間は意思決定に必要なコンパクトな形に情報を凝縮することができると考えられているメカニズムである。ヤン・ルカンのような著名な研究者は、これが生物の優雅さや効率性をより良く模倣したAIシステムの設計にインスピレーションを与えることができると主張している。

Googleの研究者が提案したエージェント「AttentionAgent」は、タスクに関連する要素に注意の大半を集中させることを目的としている。これを実現するために、このシステムは入力画像をパッチに分割し、自己注意アーキテクチャに依存してパッチに「投票」してサブセットを選択する。選出されたパッチがAttentionAgentの行動の指針となり、重要な要素が時間の経過とともにどのように進化していくかを追跡しながら、入力データの変化を把握していく。

実験では、AttentionAgentが画像内のさまざまな領域に注目することを学習することを示した。例えば、一人称視点シューティングゲーム「Doom」をベースに構築されたデジタル研究環境「VizDoom」内のレベルでは、これまで遭遇しなかった壁や床の質感、看板などの環境でも、AttentionAgentは生き残れるように訓練された。

DoomTakeCoverの一般化。AttentionAgentは、何も変更せずに環境の中で訓練されています(左)。高い壁(中央、左)、異なる床のテクスチャ(中央、右)、フローティングテキスト(右)など、環境の変化に適応することができます。

また、強化学習アルゴリズムの開発と比較のためのツールキットであるOpenAI's Gym内のCarRacingゲームでは、AttentionAgentは、晴れた日の運転を学習し、そのスキルを夜間、雨の日、別の車、明るい景色や暗い景色、視覚効果物の存在下での運転に応用することができました。おそらく、より印象的なことに、CarRacingでのトレーニングは、一般化に失敗する従来の方法に比べて、1,000倍少ないパラメータ(その予測を知らせるシステム内部の変数)を必要とするだけだった。

Attentionエージェントは、視覚入力の中でタスクの重要な領域に注意を払うことを学習した。車の運転タスク(CarRacing, 上段)では、主に道路の境界に注目しているが、方向転換する前のターンに注目している。火の玉避けゲーム(DoomTakeCover、下段)では、火の玉と敵のモンスターに注目している。Via Google AI Blog.

このような結果にもかかわらず、研究者たちはAttentionAgentには深刻な限界があると指摘している。例えば、「劇的な」背景の変化が関与している場合には一般化できません。例えば、緑の草の背景でCarRacingを訓練したエージェントは、背景を気が散るYouTubeの動画に置き換えたときに一般化できかった。背景を一様なノイズで置き換えると、エージェントはランダムなノイズのパッチに注意を払っていた。また、ノイズの多い背景で一から学習させたエージェントは、軌道を周回できるようになったが、その性能は平凡であった。

AttentionAgentは大幅に変更された環境への一般化に失敗します。(左)背景が突然猫になる(クリエイティブ・コモンズ動画)。(中央)背景が突然アーケードゲームになる(クリエイティブ・コモンズ動画)。(右)背景が突然アーケードゲームになる(クリエイティブ・コモンズ動画)。アテンションエージェントは、ノイズパッチを避けることで、純粋なノイズ背景での運転を学習した。

将来、選択的注意の改善された作業を動機づけるために、研究者たちは、環境の修正を伴うカーレースのタスクのセットを発表した。それは現在GitHub上のオープンソースで利用可能だ。

参考文献

Yujin Tang, Duong Nguyen. Neuroevolution of Self-Interpretable Agents. GECCO 2020.

Photo by Google Cloud

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史