疎なデータから視覚的概念を素早く学習するのを助けるDNNの階層構造

ジョージタウン大学医療センターで神経科学の教授を務めるMaximilian RiesenhuberとUC バークレーの博士研究員Joshua Ruleは、ディープニューラルネットワークは、事前学習を応用した手法を利用すると、人間の知能のように疎なデータから学習することができる、と主張している。

吉田拓史

01 2月 2021 — 3 min read

ジョージタウン大学医療センターで神経科学の教授を務めるMaximilian RiesenhuberとUC バークレーの博士研究員Joshua Ruleは、コンピュータベースの人工知能は、新しいオブジェクトを学習するためのはるかに高速な技術を使用するようにプログラムされたときに人間の知能のように機能することができる、と主張している。

『Frontiers in Computational Neuroscience』に掲載された論文によると、Riesenhuberらは、ベンチマークのディープラーニングモデルを用いて、階層構造が学習速度を大幅に向上させるためにも活用できることを示した。具体的には、以前に学習したが広く調整された概念表現を用いて、わずか2つの正の例から視覚的概念を学習することができる、ということだ。

「これらの結果は、より効率的に学習するための技術を示唆しており、少ない例から新しい視覚的概念を学習する生物学的にもっともらしい方法を提供している」とRiesenhuberらは書いている。

2人が提案するモデルは、人工ニューラルネットワークが少数の例から新しい視覚的概念を学習するための生物学的に尤もらしい方法を提供するという。モデルは、脳がやっていることを反映していると考えられる方法で事前学習を活用することで、コンピュータに少ない例からより良い学習をさせることができる。

人間は、疎なデータから新しい視覚的概念を素早く正確に学習することができる。生後3～4ヶ月の赤ちゃんでも、シマウマを認識し、猫、馬、キリンと区別することを簡単に学ぶことができる。しかし、コンピュータは通常、同じオブジェクトが何であるかを知るために、多くの例を「見る」必要がある。

大きな変化が必要だったのは、形や色などの低レベルで中間的な情報だけを使ってオブジェクトを識別するというより標準的なアプローチではなく、視覚的なカテゴリ全体の関係を識別するソフトウェアを設計することだった、とRiesenhuberらは主張している。

脳の階層の計算能力は、以前に学習した表現を利用することで、学習を単純化できる可能性を秘めている。Riesenhuberらは事前学習で人間の脳が持つ驚異的な能力を模倣する事ができると仮定している。Riesenhuberらは、以前に学習した概念でオブジェクトを表現する人工ニューラルネットワークは、新しい視覚的な概念を有意に速く学習することを発見した。低次の視覚的特徴から高次の概念を学習するのではなく、Riesenhuberのアプローチでは、他の高レベルの概念から物体を説明している。

人間の視覚概念学習の基礎となる脳の構造は、物体認識に関わる神経回路網をベースにしている。脳の前側頭葉には、形を超えた「抽象的な」概念表現が含まれていると考えられている。視覚認識のためのこのような複雑な神経階層によって、人間は新しいタスクを学習し、重要なことに、事前学習を活用することができる。これらの概念を再利用することで、より簡単に新しい概念、そのようなシマウマが単に別の縞の馬であるという事実のような新しい意味を学ぶことができるという。

AIの進歩にもかかわらず、人間の視覚システムは、少ない例から一般化する能力、画像のバリエーションに頑健に対処する能力、シーンを理解する能力という点では、いまだに金字塔であると科学者たちは述べている。

「我々の発見は、コンピュータがより迅速かつ効率的に学習するのを助けることができる技術を示唆しているだけでなく、まだ十分に理解されていない人間の学習方法を理解することを目的とした改善された神経科学実験にもつながる可能性があります」とRiesenhuberらは結論づけている。

参考文献

Joshua S. Rule and Maximilian Riesenhuber. Leveraging Prior Concept Learning Improves Generalization From Few Examples in Computational Models of Human Object Recognition. Front. Comput. Neurosci., 2021 DOI: 10.3389/fncom.2020.586671

Photo: "The future of computer vision with the TensorFlow Object Detection API from Google. You won't have to describe any photo...." by ShashiBellamkonda is licensed under CC BY 2.0

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS.