疎なデータから視覚的概念を素早く学習するのを助けるDNNの階層構造

ジョージタウン大学医療センターで神経科学の教授を務めるMaximilian RiesenhuberとUC バークレーの博士研究員Joshua Ruleは、ディープニューラルネットワークは、事前学習を応用した手法を利用すると、人間の知能のように疎なデータから学習することができる、と主張している。

疎なデータから視覚的概念を素早く学習するのを助けるDNNの階層構造

ジョージタウン大学医療センターで神経科学の教授を務めるMaximilian RiesenhuberとUC バークレーの博士研究員Joshua Ruleは、コンピュータベースの人工知能は、新しいオブジェクトを学習するためのはるかに高速な技術を使用するようにプログラムされたときに人間の知能のように機能することができる、と主張している。

『Frontiers in Computational Neuroscience』に掲載された論文によると、Riesenhuberらは、ベンチマークのディープラーニングモデルを用いて、階層構造が学習速度を大幅に向上させるためにも活用できることを示した。具体的には、以前に学習したが広く調整された概念表現を用いて、わずか2つの正の例から視覚的概念を学習することができる、ということだ。

「これらの結果は、より効率的に学習するための技術を示唆しており、少ない例から新しい視覚的概念を学習する生物学的にもっともらしい方法を提供している」とRiesenhuberらは書いている。

2人が提案するモデルは、人工ニューラルネットワークが少数の例から新しい視覚的概念を学習するための生物学的に尤もらしい方法を提供するという。モデルは、脳がやっていることを反映していると考えられる方法で事前学習を活用することで、コンピュータに少ない例からより良い学習をさせることができる。

人間は、疎なデータから新しい視覚的概念を素早く正確に学習することができる。生後3~4ヶ月の赤ちゃんでも、シマウマを認識し、猫、馬、キリンと区別することを簡単に学ぶことができる。しかし、コンピュータは通常、同じオブジェクトが何であるかを知るために、多くの例を「見る」必要がある。

大きな変化が必要だったのは、形や色などの低レベルで中間的な情報だけを使ってオブジェクトを識別するというより標準的なアプローチではなく、視覚的なカテゴリ全体の関係を識別するソフトウェアを設計することだった、とRiesenhuberらは主張している。

脳の階層の計算能力は、以前に学習した表現を利用することで、学習を単純化できる可能性を秘めている。Riesenhuberらは事前学習で人間の脳が持つ驚異的な能力を模倣する事ができると仮定している。Riesenhuberらは、以前に学習した概念でオブジェクトを表現する人工ニューラルネットワークは、新しい視覚的な概念を有意に速く学習することを発見した。低次の視覚的特徴から高次の概念を学習するのではなく、Riesenhuberのアプローチでは、他の高レベルの概念から物体を説明している。

人間の視覚概念学習の基礎となる脳の構造は、物体認識に関わる神経回路網をベースにしている。脳の前側頭葉には、形を超えた「抽象的な」概念表現が含まれていると考えられている。視覚認識のためのこのような複雑な神経階層によって、人間は新しいタスクを学習し、重要なことに、事前学習を活用することができる。これらの概念を再利用することで、より簡単に新しい概念、そのようなシマウマが単に別の縞の馬であるという事実のような新しい意味を学ぶことができるという。

AIの進歩にもかかわらず、人間の視覚システムは、少ない例から一般化する能力、画像のバリエーションに頑健に対処する能力、シーンを理解する能力という点では、いまだに金字塔であると科学者たちは述べている。

「我々の発見は、コンピュータがより迅速かつ効率的に学習するのを助けることができる技術を示唆しているだけでなく、まだ十分に理解されていない人間の学習方法を理解することを目的とした改善された神経科学実験にもつながる可能性があります」とRiesenhuberらは結論づけている。

参考文献

Joshua S. Rule and Maximilian Riesenhuber. Leveraging Prior Concept Learning Improves Generalization From Few Examples in Computational Models of Human Object Recognition. Front. Comput. Neurosci., 2021 DOI: 10.3389/fncom.2020.586671

Photo: "The future of computer vision with the TensorFlow Object Detection API from Google. You won't have to describe any photo...." by ShashiBellamkonda is licensed under CC BY 2.0

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS.

コーヒー代支援 / サポーター加入

Axionは吉田が2年無給で、1年が高校生アルバイトの賃金で進めている「慈善活動」です。有料購読型アプリへと成長するプランがあります。コーヒー代のご支援をお願いします。個人で投資を検討の方はTwitter(@taxiyoshida)までご連絡ください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史