Covariant.aiは5月、Index Venturesが率いる4000万ドルのシリーズBを調達したと発表した。この資金調達により、創業3年のスタートアップの総資金調達額は6700万ドルに達した。カリフォルニア大学バークレー校のトップ教授ピーター・アビールが共同で設立した同社は、産業用ロボットの自律性を構築することに専念している。

Covariant.aiは強化学習という機械学習の手法で、自律的なロボットの開発を目指している。これは、動物が正と負のフィードバックで学習する方法に少し似ていて、アルゴリズムが試行錯誤しながら自分自身を訓練するプロセスだ。強化学習は、アルファベット社のAI子会社であるDeepMind社が開発した超人的なゲーム感覚のアルゴリズムなど、最近のAIの飛躍的な進歩を牽引してきた。このアプローチは、ロボットが異なる形状の物体に対してしか訓練されていない場合でも、映像から物体がどのような形状であるかを把握し、それをどこで把握すればよいかを把握するのに役立つ。しかし、強化学習は繊細で、多くのコンピュータパワーを必要とする。

Covariant.aiのアプローチはより複雑なところにある。同社のロボットは、特定のタスクを個別に習得するために学習するのではなく、堅牢な3D知覚、物体の物理的余裕、リアルタイムの動作計画などの一般的な能力を習得する。これにより、複雑なタスクをシンプルなステップに分解し、一般的なスキルを適用してタスクを完了させることで、人間と同じように新しいタスクに適応することができる、と同社は主張している。

このアプローチは階層型強化学習(HRL: Hierarchical reinforcement learnin)と呼ばれる。強化学習は、ブロック崩しや囲碁などのゲームで遊ぶことから、ロボットによる運動の自動化器用な操作、および知覚まで、さまざまな領域で大きな進歩を遂げている。それでも、人間は様々なタスクにわたってスキルをモジュール化して再利用することができるが、強化学習での作業のほとんどは、新しい問題に直面したときには、まだゼロから学習している。これは、複数の関連タスクに取り組む場合には非効率的である。

この限界を克服する有望な手法として、HRLがある。このパラダイムでは、ポリシー(⽅策)は抽象化されたいくつかのモジュールを持つので、モジュールのサブセットの再利用が容易になる。最も一般的なケースは、時間的抽象化からなり、高レベルのポリシー(マネージャー)がより低い頻度で行動を取り、その行動がいくつかの低レベルのスキルやサブポリシーの行動を条件とする。

新しいタスクに知識を移す場合、ほとんどの先行研究は、スキルを修正し、その上で新しいマネージャーを訓練する。新しいタスクでの学習をキックスタートさせるという明確な利点があるにもかかわらず、固定されたスキルを持つことは、新しいタスクでの最終的なパフォーマンスをかなり制限してしまう可能性がある。事前に訓練されたサブポリシーを新しいタスクに最適なものに適応させることについては、まだほとんど研究が行われていないという。

創業から3年間、この階層型強化学習の実装に取り組み、Covariant.aiは、カメラを装備した既製品のロボットアームで構成されたプラットフォームを開発した。システムは特殊なグリッパーを制御し、そして倉庫のビンに投げ込まれたオブジェクトを把握する方法を考え出すための多くの計算量を消費する。5月に6700万ドルの資金調達を実行した。ステルス状態から抜け出した同社は、ドイツの家電量販店「Obeta」のために箱や商品の袋をピッキングするAI搭載ロボットの初の商業導入を発表した(以下の動画を参照)。

Covariantは主に自動化率の高い倉庫にロボットを配備してきたが、今回の資金は、自動化率の低い倉庫環境や、今日のように作業がすべて人間の労働力で行われている場所など、同社のフットプリントを拡大するために使われる予定だ。

CovariantのCEOであるPeter Chenは、低自動化産業の例として、物流大手のUPSや米郵便公社のような企業による郵便物や小包の配達などがあると説明している。「握りしめることがロボット操作の最初のステップとなるような作業はたくさんありますが、私たちが取り組んでいる他のユースケースの多くのステップの一つであり、製造業、リサイクル業、農業などの物流サプライチェーン業界だけでなく、明らかにその先にあるものです。これらの業界では、人々は今でも非常に反復的な作業を行うために人の手を多用しています」。

同社は、カリフォルニア大学バークレー校の著名なAI教授であるピーター・アビールと彼の学生数人によって2017年に設立された。アビールは機械学習をロボット工学に応用した先駆者であり、2010年には(非常に遅いとはいえ)洗濯物を畳むことができるロボットを開発して学術界に名を轟かせた。Covariant.aiの投資家には、ジョシュア・ベンジオとともにチューリング賞したジェフリー・ヒントンとヤン・ルカンが含まれている。

Photo by Covariant.ai