疎なデータから視覚的概念を素早く学習するのを助けるDNNの階層構造

ジョージタウン大学医療センターで神経科学の教授を務めるMaximilian RiesenhuberとUC バークレーの博士研究員Joshua Ruleは、ディープニューラルネットワークは、事前学習を応用した手法を利用すると、人間の知能のように疎なデータから学習することができる、と主張している。

疎なデータから視覚的概念を素早く学習するのを助けるDNNの階層構造

ジョージタウン大学医療センターで神経科学の教授を務めるMaximilian RiesenhuberとUC バークレーの博士研究員Joshua Ruleは、コンピュータベースの人工知能は、新しいオブジェクトを学習するためのはるかに高速な技術を使用するようにプログラムされたときに人間の知能のように機能することができる、と主張している。

『Frontiers in Computational Neuroscience』に掲載された論文によると、Riesenhuberらは、ベンチマークのディープラーニングモデルを用いて、階層構造が学習速度を大幅に向上させるためにも活用できることを示した。具体的には、以前に学習したが広く調整された概念表現を用いて、わずか2つの正の例から視覚的概念を学習することができる、ということだ。

「これらの結果は、より効率的に学習するための技術を示唆しており、少ない例から新しい視覚的概念を学習する生物学的にもっともらしい方法を提供している」とRiesenhuberらは書いている。

2人が提案するモデルは、人工ニューラルネットワークが少数の例から新しい視覚的概念を学習するための生物学的に尤もらしい方法を提供するという。モデルは、脳がやっていることを反映していると考えられる方法で事前学習を活用することで、コンピュータに少ない例からより良い学習をさせることができる。

人間は、疎なデータから新しい視覚的概念を素早く正確に学習することができる。生後3~4ヶ月の赤ちゃんでも、シマウマを認識し、猫、馬、キリンと区別することを簡単に学ぶことができる。しかし、コンピュータは通常、同じオブジェクトが何であるかを知るために、多くの例を「見る」必要がある。

大きな変化が必要だったのは、形や色などの低レベルで中間的な情報だけを使ってオブジェクトを識別するというより標準的なアプローチではなく、視覚的なカテゴリ全体の関係を識別するソフトウェアを設計することだった、とRiesenhuberらは主張している。

脳の階層の計算能力は、以前に学習した表現を利用することで、学習を単純化できる可能性を秘めている。Riesenhuberらは事前学習で人間の脳が持つ驚異的な能力を模倣する事ができると仮定している。Riesenhuberらは、以前に学習した概念でオブジェクトを表現する人工ニューラルネットワークは、新しい視覚的な概念を有意に速く学習することを発見した。低次の視覚的特徴から高次の概念を学習するのではなく、Riesenhuberのアプローチでは、他の高レベルの概念から物体を説明している。

人間の視覚概念学習の基礎となる脳の構造は、物体認識に関わる神経回路網をベースにしている。脳の前側頭葉には、形を超えた「抽象的な」概念表現が含まれていると考えられている。視覚認識のためのこのような複雑な神経階層によって、人間は新しいタスクを学習し、重要なことに、事前学習を活用することができる。これらの概念を再利用することで、より簡単に新しい概念、そのようなシマウマが単に別の縞の馬であるという事実のような新しい意味を学ぶことができるという。

AIの進歩にもかかわらず、人間の視覚システムは、少ない例から一般化する能力、画像のバリエーションに頑健に対処する能力、シーンを理解する能力という点では、いまだに金字塔であると科学者たちは述べている。

「我々の発見は、コンピュータがより迅速かつ効率的に学習するのを助けることができる技術を示唆しているだけでなく、まだ十分に理解されていない人間の学習方法を理解することを目的とした改善された神経科学実験にもつながる可能性があります」とRiesenhuberらは結論づけている。

参考文献

Joshua S. Rule and Maximilian Riesenhuber. Leveraging Prior Concept Learning Improves Generalization From Few Examples in Computational Models of Human Object Recognition. Front. Comput. Neurosci., 2021 DOI: 10.3389/fncom.2020.586671

Photo: "The future of computer vision with the TensorFlow Object Detection API from Google. You won't have to describe any photo...." by ShashiBellamkonda is licensed under CC BY 2.0

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS.

コーヒー代支援 / サポーター加入

Axionは吉田が2年無給で、1年が高校生アルバイトの賃金で進めている「慈善活動」です。有料購読型アプリへと成長するプランがあります。コーヒー代のご支援をお願いします。個人で投資を検討の方はTwitter(@taxiyoshida)までご連絡ください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。

Read more

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史
Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史