LiDARとカメラによる自律走行車の知覚システム

自律走行は、過去数年の間に大きな進歩を遂げ、産業化の前段階に入っている。センサは最初に環境のデータを取得し、知覚アルゴリズムで処理して、自律走行車のナビゲーションに使用される車両の周辺環境を構築する。自律走行型ナビゲーションのための知覚システムは、カメラ、レーダー、LiDARなどの組み合わせで構成されている。

LiDARとカメラによる自律走行車の知覚システム

自律走行は、過去数年の間に大きな進歩を遂げ、産業化の前段階に入っている。センサは最初に環境のデータを取得し、それを知覚アルゴリズムで処理して、自律走行車のナビゲーションに使用される車両の周辺環境を構築する。自律走行型ナビゲーションのための知覚システムは、カメラ、レーダー、LiDAR(Light detection and ranging: 光による検知と測距)などのアクティブセンサとパッシブセンサの組み合わせで構成されている。

一般的なLiDARは、1本または複数のレーザービームで視野をスキャンすることで動作する。これは、繊細に設計されたビームステアリングシステムによって行われる。レーザービームは、近赤外波長で発光する振幅変調レーザーダイオードによって生成される。レーザービームは、スキャナに戻って環境によって反射される。戻ってきた信号は光検出器で受信される。高速電子機器は、信号をフィルタリングし、距離に比例して送信された信号と受信された信号の差を測定する。この差をもとにセンサモデルから距離が推定される。表面材料による反射エネルギーの変動や、送受信機間の環境の違いは、信号処理によって補正される。LiDARの出力は、スキャンされた環境に対応する3次元点群と、反射されたレーザーエネルギーに対応する強度の両方で構成されている。

LiDARシステムは、レーザレンジファインダとスキャニングシステムに分けることができる。レーザレンジファインダは、変調波を介してターゲットを照らすレーザ送信機、光学処理および光電変換後の反射光子から電子信号を生成する光検出器、放射されたレーザをコリメートして反射信号を光検出器に集光する光学系、あるいは、受信信号に基づいてレーザ光源と反射面との間の距離を推定するための信号処理エレクトロニクスから構成される。

カメラベースの知覚が大幅に進歩しているが、画像処理法は距離を推定しているに過ぎない。このアプローチでは、行き交う交通機関の距離を推定する場合、特に単眼ソリューションの場合には困難がある。

2007年のDARPAグランドチャレンジでは、自律走行のマイルストーンとして、LiDAR認識システムの可能性が実証された。上位3チームはすべて複数のLiDARを装備していた。64層のLiDAR - Velodyne HDL64は、チャンピオンチームと準優勝チームにとって中心的役割を果たした。現在、ほとんどの高レベルの自律走行車は、その高コストと可動部品にもかかわらず、認識システムの一部としてLiDARを使用している。現在では100社以上の企業が、ローレベルからハイエンドまで、一種の「ビッグバン」とも言える自律走行システム向けの特徴的なLiDARシステムを開発している。今後、どのタイプのLiDARが自律走行の主役になるのかは、まだ霧の中だ。

LiDARは唯一の自走検知技術ではなく、カメラが主要なライバルである。イーロン・マスクは、LiDARを「愚か者の使い走り」と「不要」と表現している。人間は周囲の可視光のみに基づいて運転しているので、ロボットも同じように運転できるはずだという主張だ。カメラはLiDARよりもはるかに小さく、安価であり(より多くのカメラが必要とされているが)、より良い解像度と色で見ることができるという利点があり、信号や標識を読み取ることができることを意味する。

しかし、カメラには様々な特性があり、一般的な運転状況での使用は難しいとされている。LiDARが近赤外光を使用するのに対し、カメラは可視光を使用するため、雨や霧、あるいは一部のテクスチャに直面した場合に問題が発生しやすくなる。さらに、LiDARは周囲の光に依存しない、独自の光パルスを生成するが、カメラは急激な光の変化や直射日光、雨粒にも敏感だ。

LiDARの利点はこれだけではない。3D点群データを作成することで、LiDARはカメラよりもはるかに優れた距離判定が可能であるだけでなく、反射性のある表面、テクスチャのある表面、テクスチャのない表面にも影響を受けない。カメラでは、異なるカメラのフィードや時間をかけた単一のフィードを集約して、物体間の距離を測定するために、複雑なニューラルネットワークなどの多大な計算能力が必要となる。また、2D画像はカメラを騙すことができるため、悪意のある攻撃を受けやすくなる。

色検出に関しては、LiDAR推進者は、コネクテッドでドライバーレスな世界では、信号機やその他のマーカーからのマシン・ツー・マシンの信号によって交通情報を提供できると主張しており、LiDARの重要な欠陥に対処している。

さらに、LiDARのコストも急落している。2012年にGoogleが最初に開発したドライバーレスカーのプロトタイプには、Velodyneの7万ドルのLiDARが使用されていた。2017年、Waymoのエンジニアはコストを90%下げたと宣言した。今日では、LuminarなどのトップLiDARメーカーの多くが、1,000ドル以下で自律走行グレードのLiDARを提供している。

自動走行車向けのLiDARの開拓者であり、高価なLiDARで知られたVelodyneでさえ、この低価格化の波に乗ろうとしている。2020年11月、新型のソリッドステート型LiDARのVelarray H800を発売する計画を明らかにし、目標価格は500ドル以下と述べた。

カメラの利点は、価格や色/文字認識の他に、より微妙なものがある。基本的には、LiDARは「近道」であり、実際に処理できるのは空間情報のみであり、高速道路の複雑な環境ではないという事実を中心にしている。歩行者が携帯電話を見下ろしていることをLiDARは認識しない。LiDARはビニール袋と障害物を区別しない。新しい車線に合流しようと肩越しに見ているサイクリストをLiDARで認識することはできない。カメラAVが完成すれば、LiDARは時代遅れになると彼らは主張している。これは、カメラと単純なレーダー(LiDARよりも画像の粒度は悪いが、安価で悪天候時の性能は良い)を組み合わせることで、悪条件での弱点に対処するために多くのことが行われるからである。

カメラが優位に立つための重要な障害は、データ量の多いフィードを読み取って解釈するAIであり、ミリ秒単位であらゆる状況を認識しなければならない。このことは、LiDARの優れたビジョンとカメラの色、物体、文字認識の両方を使用して、周囲の環境の明確な画像を取得するハイブリッドが最良の選択肢であるという現在の一般的な見解を説明するのに役立ちます。注目すべきは、このソリューションは計算量が多く、もちろん人間が書いたアルゴリズムに依存していることです。

その結果、LiDARのコストカーブとAIプログラマーの競争となっている。カメラが本当に使用可能で信頼性の高いものになるよりも早くLiDARが入手可能な価格に到達すれば、LiDARは、安価で信頼性が高く、非常に正確な距離センサーとして、少なくともカメラと組み合わせて、AVで普遍的なものになる可能性が高い。将来的にはLiDARは絶対に必要ではないかもしれないが、その信頼性、シンプルさ、普遍性は、レベル5の自律性への非常に魅力的な踏み台になる可能性がある。しかし、近い将来、テスラなどがカメラの画像情報を迅速かつ確実に処理できる複雑なニューラルネットワークの作成に成功した場合、LiDARは多くの大手メーカーにとって高価な余剰品になる可能性が高いだろう。

参考文献

  1. Jeff Hecht. Lidar for self-driving cars. Optics and Photonics News, 2018.
  2. You Li, Javier Ibanez-Guzman. Lidar for Autonomous Driving: The principles, challenges, and trends for automotive lidar and perception systems. arXiv:2004.08467.

Image via Velodyne.

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS, ikebukurou 太郎.

月額制サポーター

Axionは吉田が2年無給で、1年が高校生アルバイトの賃金で進めている「慈善活動」です。有料購読型アプリへと成長するプランがあります。コーヒー代のご支援をお願いします。個人で投資を検討の方はTwitter(@taxiyoshida)までご連絡ください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。

投げ銭

投げ銭はこちらから。金額を入力してお好きな額をサポートしてください。

https://paypal.me/axionyoshi?locale.x=ja_JP

Read more

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史
Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史