スタンフォード大、進化生物学に着想を得た深層強化学習フレームワークを提案

スタンフォード大学の研究者らはこのほど、Deep Evolutionary Reinforcement Learning(DERL)と呼ばれる新しい計算フレームワークを発表した。

スタンフォード大、進化生物学に着想を得た深層強化学習フレームワークを提案

スタンフォード大学の研究者らはこのほど、Deep Evolutionary Reinforcement Learning(DERL)と呼ばれる新しい計算フレームワークを発表した。これにより、AIエージェントは、低レベルの自己中心的な感覚情報のみを用いて、複雑な環境下で形態を進化させ、難しい運動や操作のタスクを学習することができるようになる、とチームは主張している。

進化生物学では、ボールドウィン効果は、ある進化過程の古代の世代で生涯にわたって学習された行動が、徐々に本能的になり、遺伝的に後続の世代にも伝わる可能性があることを示唆した。

複雑な環境下での学習と進化の過程に関する研究では、進化した形態に深く具現化された動物の知性の多くの側面が認識されてきた。しかし、形態学的進化においてボールドウィン効果を実証することは、生物であれ、コンピュータモデリングやシミュレーションであれ、困難を極めている。

DERLは、形態学的学習を介してダーウィン的なボールドウィン効果を初めて実証したものだ。論文「Embodied Intelligence via Learning and Evolution」の共著者の一人であるFei-Fei Li・スタンフォード大学教授は、それが動物の進化のための自然の本質的なトリックであり、今ではAIエージェントで示されていると述べている。研究者たちは、AIの具現化エージェントを作成する際に直面した重要な課題として、組み合わせ可能な形態の数が非常に多いことと、生涯学習を介してフィットネスを評価するために必要な計算時間を挙げている。

これまでの研究では、限られた形態探索空間の中で進化したエージェントを特定することや、手で設計した固定の形態に基づいて最適なパラメータを見つけることに焦点が当てられていた。しかし、DERLでは、環境、形態学、制御という3つのタイプの複雑さにまたがって、具現化エージェントの作成を同時にスケールさせることができるようになった。研究チームは、これまでの形態素探索空間の表現力の限界を克服するためのデザイン空間であるUNIMAL(UNIversal aniMAL)を開発した。UNIMALは、エージェントに高度に表現可能で有用な制御可能な形態を可能にし、その結果として得られる身体化されたエージェントを、丘、段差、瓦礫の3つの環境で解析した。

図1:DERLの概要 DERL(a)は、2つの相互作用する適応プロセスを介して具現化されたエージェントを作るための一般的なフレームワークである。進化の外側のループは突然変異操作を介してエージェントの形態を最適化し、その一部は(b)に示され、内側の強化学習ループはニューラルコントローラのパラメータを最適化する(c)。このような地形の中での操作では、エージェントは初期位置(緑の球体)からスタートし、ゴール位置(赤の四角)まで箱を移動しなければならない。Source: Gupta et al. (2021)

DERLは大規模なシミュレーションを可能にし、学習、進化、環境の複雑さがどのように相互作用して知的形態を生成するのかを明らかにした。第一に、環境の複雑さが形態学的な知性の成長を促進することを明らかにしました。第二に、進化はより速く学習する形態学を急速に選択することを認識している。これにより、初期の祖先の一生のうちに遅れて学んだ行動が、子孫の一生のうちに早く発現することが可能になる。この結果は、複雑な環境で学習し進化する生物において、長い間想定されていた形態学的ボールドウィン効果の実証を確立するものである。

この研究は、ボールドウィン効果と形態学的知性が形態学的進化を経て出現するメカニズムの両方の基盤が、より物理的に安定でエネルギー効率の高いものであることを示唆している。また、効率的な学習と制御を促進することができる。

Gupta et al. (2021)

表現型から遺伝子型への知性の移入は、表現型学習資源を解放して、ヒトにおける言語の出現や模倣など、より複雑な動物の行動を学習することが想定されてきた。このことは、学習と進化の大規模なシミュレーションによって、形態知の出現によって強化学習がスピードアップすることを示唆している。同様に、研究者らは、他の文脈での学習と進化の大規模な探索が、RLエージェントにおける迅速に学習可能な知的行動と、それを機械にインスタンス化するためのユニークな工学的進歩をもたらす可能性があると考えている。

参考文献

Gupta, Agrim, S. Savarese, S. Ganguli and Li Fei-Fei. “Embodied Intelligence via Learning and Evolution.” ArXiv abs/2102.02202 (2021): n. pag.

Photo by Eugene Zhyvchik on Unsplash

700円/月の支援

Axionは吉田が2年無給で、1年が高校生アルバイトの賃金で進めている「慈善活動」です。有料購読型アプリへと成長するプランがあります。コーヒー代のご支援をお願いします。個人で投資を検討の方はTwitter(@taxiyoshida)までご連絡ください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。
Takushi Yoshida is creating writing/journalism | Patreon
Patreon is a membership platform that makes it easy for artists and creators to get paid. Join over 200,000 creators earning salaries from over 6 million monthly patrons.

投げ銭

投げ銭はこちらから。金額を入力してお好きな額をサポートしてください。

Pay Yoshida Takushi using PayPal.Me
Go to paypal.me/axionyoshi and type in the amount. Since it’s PayPal, it’s easy and secure. Don’t have a PayPal account? No worries.

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS, ikebukurou, 太郎, bantou, ysh_tmk.

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史
新たなスエズ危機に直面する米海軍[英エコノミスト]

新たなスエズ危機に直面する米海軍[英エコノミスト]

世界が繁栄するためには、船が港に到着しなければならない。マラッカ海峡やパナマ運河のような狭い航路を通過するとき、船舶は最も脆弱になる。そのため、スエズ運河への唯一の南側航路である紅海で最近急増している船舶への攻撃は、世界貿易にとって重大な脅威となっている。イランに支援されたイエメンの過激派フーシ派は、表向きはパレスチナ人を支援するために、35カ国以上につながる船舶に向けて100機以上の無人機やミサイルを発射した。彼らのキャンペーンは、黒海から南シナ海まですでに危険にさらされている航行の自由の原則に対する冒涜である。アメリカとその同盟国は、中東での紛争をエスカレートさせることなく、この問題にしっかりと対処しなければならない。 世界のコンテナ輸送量の20%、海上貿易の10%、海上ガスと石油の8~10%が紅海とスエズルートを通過している。数週間の騒乱の後、世界の5大コンテナ船会社のうち4社が紅海とスエズ航路の航海を停止し、BPは石油の出荷を一時停止した。十分な供給があるため、エネルギー価格への影響は軽微である。しかし、コンテナ会社の株価は、投資家が輸送能力の縮小を予想している

By エコノミスト(英国)