テスラの自律走行車はビジョンのみアプローチを継続するか?

LiDARはマスクが言うとおり松葉杖なのだろうか

テスラの自律走行車はビジョンのみアプローチを継続するか?

要点

テスラはカメラ映像のみの自律走行を目指しており、それが成就したときの報酬は大きい。しかし、同社は秘密裏にLiDAR有りのアプローチもテストをしており、Waymoのような多数派と歩を揃える可能性もある。


テスラの人工知能担当シニアディレクターであるAndrej Karpathyは6月21日に開催されたコンピュータビジョンのトップ会議であるComputer Vision and Pattern Recognition(CVPR)で、レーダーやLiDARのセンサーを捨てて、高品質の光学カメラによって自律走行を達成するビジョン(視覚)ベースのアプローチを紹介した。

テスラCEOのイーロン・マスクは以前、LiDARのことを「松葉杖」と呼び物議を醸したことがある。4月の第1四半期の発表資料では、テスラは「ビジョンのみのシステムは、究極的には完全な自律性に必要なものである」と記しており、その考えを改める兆候は見えない。

自律走行車開発者の多数派は、LiDARセンサーで環境を事前にマッピングし、高精細地図(HDマップ)を作成しているとされる。LiDARを利用した方法では、車線や信号機などもすべて地図に挿入し、テスト時にはその地図に車両の位置をマッピングして走行させているようだ。

自律走行車のセンサーは大量のデータを取得するが、それを基に運転を成立させるための短い時間で処理を行わないといけない。事前にHDマップを作成しておくと、この負荷を軽減することができる。一方、このアプローチはHDマップを作成していない場所では通用しないため、汎用的な自律走行を実現したことにはならない。だが、交通専門家の間には、より効率的な輸送を実現する公共交通機関を優先し、自律走行のロボタクシーをジオフェンス(仮想的な境界線で囲まれたエリア)の区域内に収めるべきとの考え方がある。このため、一定の区域内での自律走行の実現だけで、解くべき問題は解けているとも言える。

Waymoのような自律走行システムの会社と異なり、テスラは自動車会社であり、世界中に自律走行機能を持つ自動車を販売する必要がある。このため、どのような環境でも自律的に走ることできるビジョンベースの自律走行を追い求めているのかもしれない。イーロン・マスクは、自動車の私的所有と比べて少数の自動車で成立するロボットタクシー事業に言及しなくなっている印象がある。

視覚のみのアプローチは、世界中のあらゆる場所でHDマップを収集・構築・維持するよりも拡張性が高い一方で、物体検出や運転を担当するニューラルネットワークが、人間の奥行きや速度の認識能力に匹敵するスピードで膨大な量のデータを収集・処理できなければならないため、課題が多い。

テスラのビジョンシステムは、主に各車両に組み込まれた8台のカメラ(および12個の超音波センサー)がリアルタイムに生成するデータをニューラルネットワークで処理することに依存している。

Karpathyは「私たちのアプローチは主にビジョンベースで、車を囲む8台のカメラからの映像に基づいて、すべての出来事が車の中で初めて起こる(編注:事前に生成されたHDマップ等のデータに頼らず、その場ですべて判断しているの意)」と語っている。「例えば、初めての交差点では、車線がどこにあるのか、どのようにつながっているのか、信号機はどこにあるのか、どの信号機が関連しているのか、どの信号機がどの車線をコントロールしているのかなど、すべてのことが車の中で初めて起こる」。

「このインフラを常に最新の状態に保つのは非常にコストがかかる。もちろん、映像に基づいて信じられないほどよく機能するニューラルネットワークを実際に手に入れなければならないので、(競合他社のアプローチよりも)はるかに難しいことだ。しかし、一度うまくいけば、一般的なビジョンシステムとなり、原理的には地球上のどこにでも配備することができる。それが私たちが解決しようとしている問題だ」。

このようなLiDARで作成したHDマップを維持しないと、LiDARありの自律走行車は円滑に動作しない、とKarpathyは講演で説明した。via CVPR
HDマップを作成するために必要な多数のLidarとGPS一式の一例。これらすべてをテスラ車に搭載して出荷すると、一台数千万円してしまう。イーロン・マスクがLiDARを「松葉杖」と呼んだのは、実はコストの背景が大きかもしれない。 via Ilci V et al(2020).

ワークショップの中では、Karpathyは同社の新しいスーパーコンピューターについても触れている。このスパコンは、車両を取り囲む8台のカメラから毎秒36フレームの映像を収集しており、車両を取り巻く環境について非常に多くの情報を提供していると、Karpathyは説明している。

昨年、マスクは、膨大な量のビデオデータを処理するためのニューラルネットワークトレーニングコンピュータ「Dojo」を開発していることを発表したが、Karpathyは講演の中でDojoの前身となるものを紹介した。この無名のスーパーコンピューターは、「720のノードがあり、それぞれにNvidiaのA100 GPU(80GBモデル)が8個ずつ搭載されており、システム全体ではなんと5,760個のA100がある」という。

「テスラの最新世代スパコンは、10ペタバイトのNVMe(不揮発性メモリ・エクスプレス) SSDを搭載し、毎秒1.6テラバイトで動作する。1.8 EFLOPS(エクサフロップス、浮動小数点演算を1秒間に100京回行う)で、世界で5番目に強力なスーパーコンピュータになるかもしれない」とKarpathyは語った。

ニューラルネットワークトレーニングコンピュータ「Dojo」の前身モデル。1.8 EFLOPS(エクサフロップス、浮動小数点演算を1秒間に100京回行う)で、世界で5番目に強力なスーパーコンピュータに相当するという。via CVPR.

テスラはこの最新のスパコンを使って、1本10秒前後の動画を100万本蓄積し、60億個の物体に奥行き、速度、加速度のラベルを付けた。これらが、なんと1.5ペタバイトに達しているという。しかし、ビジョンシステムだけに頼る自動運転システムに求められる信頼性を実現するためには、さらに多くのことが必要だという。そのため、テスラはより高度なAIを追求するために、これまで以上に強力なスーパーコンピューターを開発し続ける必要があるようだ。

テスラのAIチームのゲームチェンジャーの一つは、自動ラベリングだったようだ。これは、テスラのカメラで車が撮影した何百万ものビデオから、道路の危険物などのオブジェクトを自動的にラベル付けするものだ。大規模なAIデータセットでは、多くの場合、手動でラベル付けを行う必要があるが、これには時間がかかる。特に、ニューラルネットワーク上の教師付き学習システムをうまく機能させるために必要な、きれいにラベル付けされたデータセットを得ようとする場合には、時間がかかってしまう。

与えられたビデオクリップ内の物体に対し、自動的にラベル付けするニューラルネットについて説明するKarpathy。via CVPR.

Karpathyは、長年の研究の結果、この課題を教師付き学習問題として扱うことで実現できると考えている、と語った。Karpathyによると、この技術をテストしたエンジニアたちは、人口の少ない地域では何の介入もなく運転できることがわかったが、サンフランシスコのような非常に困難な環境では、間違いなく多くの問題が発生するという。このシステムが本当にうまく機能し、HDマップや追加のセンサーなどの必要性を軽減するためには、人口密度の高い地域への対応をもっとうまく行う必要がある。

トレーニングしたビジョンシステムをデプロイする車載SoCのFSD Chip。チップ設計の天才、ジム・ケラーを中心としたチームが設計した。via CVPR.

レーダーはいらない、ではLiDARはどうか?

テスラは2021年5月の納入分から、北米市場向けのモデル3とモデルYには前方照射型レーダーセンサーを搭載することを中止した。レーダーは自ら電波を発射し、その反射波をとらえることにより、周囲の物体をとらえるものだ。

レーダーが橋を検知して、知覚システムが障害物の可能性を考慮して、ブレーキを踏んでしまう不名誉な現象があると説明するKarpathy。via CVPR.

Karpathyは「イーロン・マスクが言っているのは、基本的には、ビジョンが、例えばレーダーよりも100倍優れたセンサーになってきているということだ。もし、あるセンサーが他のセンサーを圧倒し、非常に優れているとしたら、他のセンサーは、前者のシステムに実際に貢献し始めていることになる。だから、私たちはビジョンのみのアプローチをさらに強化している」と主張している。

テスラは、「完全自動運転」ソフトウェアのベータテストにおいて、ビジョンベースのオートパイロットの開発を進めてきた。しかし、レーダーセンサーがなくてもオートパイロットが完全に機能するようにするようにはなっておらず、これらの車両のいくつかの機能を無期限に制限または無効にしている。オートステア(カーブでも車線の中央を走ることができるオートパイロット機能)は、時速75マイル以下でしか使用できない。また、「前走車との最小追従距離が長い場合にのみ使用可能となる」とされている

テスラは現在、高価なモデルであるセダンのModel SやSUVのModel Xからレーダーセンサーを取り除いていない。モデル3とモデルYの販売台数が圧倒的に多いため、まずはこの2つを専用のビジョンベースシステムに依存させることに注力しているという。「先にテスラビジョンに移行することで、大量の実世界のデータを短時間で分析することができ、結果的にテスラビジョンをベースにした機能の展開を早めることができる」と同社は記している。

他の自動車メーカーは、カメラ、レーダー、LiDAR(レーザー光を利用したレーダー)を組み合わせて、車の意思決定の判断材料となるデータを収集している。LiDARは高価なのであまり使われていないが、レーダーは安価なので広く使われている。

しかし、テスラはLiDARを搭載した手法を試しているようだ。5月、フロリダ州のパームビーチで、同地在住の自律走行車業界のコンサルタント、Grayson Brulteは、テスラのモデルYには、話題のセンサーメーカーLuminar社製のルーフトップライダセンサーが搭載されているのを撮影した。

ブルームバーグによると、Luminar社は、両社の契約の一環として、LiDARをテスラに販売した。また、モデルYには、カリフォルニア州でテスラに登録されているメーカーのナンバープレートが装着されていた。同じプレートは、サイバートラックの試作車を含む他のテスラ車でも目撃されている。

Eye Catch Image is courtesy of Tesla.

参考文献

  1. Ilci V, Toth C. High Definition 3D Map Creation Using GNSS/IMU/LiDAR Sensor Integration to Support Autonomous Vehicle Navigation. Sensors. 2020; 20(3):899. https://doi.org/10.3390/s20030899

📨ニュースレター登録とアカウント作成

ニュースレターの登録は記事の下部にある「Sign up for more like this」か右上の「Subscribe」ボタンからサインアップをお願いします。あるいはこちらから。

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Kinoco, Masatoshi Yokota,  Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS, ikebukurou 黒田太郎, bantou, shota0404, Sarah_investing, Sotaro Kimura, TAMAKI Yoshihito, kanikanaa, La2019, magnettyy, kttshnd, satoshihirose, Tale of orca.

寄付サブスク (吉田を助けろ)

吉田を助けろ(Save the Yoshi!)。運営者の吉田は2年間無休、現在も月8万円の報酬のみでAxionを運営しています。

月10ドル支援したいと考えた人は右上の「Subscribe」のボタンからMonthly 10ドルかYearly 100ドルご支援ください。あるいは、こちらからでも申し込めます。こちらは数量が99個まで設定できるので、大金を助けたい人におすすめです。

その他のサポート

こちらからコーヒー代の支援も可能です。推奨はこちらのStripe Linkです。こちらではない場合は以下からサポートください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。
Takushi Yoshida is creating writing/journalism | Patreon
Become a patron of Takushi Yoshida today: Get access to exclusive content and experiences on the world’s largest membership platform for artists and creators.

投げ銭

Betalen Yoshida Takushi met PayPal.Me
Ga naar paypal.me/axionyoshi en voer het bedrag in. En met PayPal weet je zeker dat het gemakkelijk en veiliger is. Heb je geen PayPal-rekening? Geen probleem.

Read more

米国のEV革命は失速?[英エコノミスト]

米国のEV革命は失速?[英エコノミスト]

米国人は自動車が大好きだ。バッテリーで走らない限りは。ピュー・リサーチ・センターが7月に発表した世論調査によると、電気自動車(EV)の購入を検討する米国人は5分の2以下だった。充電網が絶えず拡大し、選べるEVの車種がますます増えているにもかかわらず、このシェアは前年をわずかに下回っている。 この言葉は、相対的な無策に裏打ちされている。2023年第3四半期には、バッテリー電気自動車(BEV)は全自動車販売台数の8%を占めていた。今年これまでに米国で販売されたEV(ハイブリッド車を除く)は100万台に満たず、自動車大国でない欧州の半分強である(図表参照)。中国のドライバーはその4倍近くを購入している。

By エコノミスト(英国)
労働者の黄金時代:雇用はどう変化しているか[英エコノミスト]

労働者の黄金時代:雇用はどう変化しているか[英エコノミスト]

2010年代半ばは労働者にとって最悪の時代だったという点では、ほぼ誰もが同意している。ロンドン・スクール・オブ・エコノミクスの人類学者であるデイヴィッド・グレーバーは、「ブルシット・ジョブ(どうでもいい仕事)」という言葉を作り、無目的な仕事が蔓延していると主張した。2007年から2009年にかけての世界金融危機からの回復には時間がかかり、豊かな国々で構成されるOECDクラブでは、労働人口の約7%が完全に仕事を失っていた。賃金の伸びは弱く、所得格差はとどまるところを知らない。 状況はどう変わったか。富裕国の世界では今、労働者は黄金時代を迎えている。社会が高齢化するにつれて、労働はより希少になり、より良い報酬が得られるようになっている。政府は大きな支出を行い、経済を活性化させ、賃上げ要求を後押ししている。一方、人工知能(AI)は労働者、特に熟練度の低い労働者の生産性を向上させており、これも賃金上昇につながる可能性がある。例えば、労働力が不足しているところでは、先端技術の利用は賃金を上昇させる可能性が高い。その結果、労働市場の仕組みが一変する。 その理由を理解するために、暗

By エコノミスト(英国)
中国は地球を救うのか、それとも破壊するのか?[英エコノミスト]

中国は地球を救うのか、それとも破壊するのか?[英エコノミスト]

脳腫瘍で余命いくばくもないトゥー・チャンワンは、最後の言葉を残した。その中国の気象学者は、気候が温暖化していることに気づいていた。1961年、彼は共産党の機関紙『人民日報』で、人類の生命を維持するための条件が変化する可能性があると警告した。 しかし彼は、温暖化は太陽活動のサイクルの一部であり、いつかは逆転するだろうと考えていた。トゥーは、化石燃料の燃焼が大気中に炭素を排出し、気候変動を引き起こしているとは考えなかった。彼の論文の数ページ前の『人民日報』のその号には、ニヤリと笑う炭鉱労働者の写真が掲載されていた。中国は欧米に経済的に追いつくため、工業化を急いでいた。 今日、中国は工業大国であり、世界の製造業の4分の1以上を擁する。しかし、その進歩の代償として排出量が増加している。過去30年間、中国はどの国よりも多くの二酸化炭素を大気中に排出してきた(図表1参照)。調査会社のロディウム・グループによれば、中国は毎年世界の温室効果ガスの4分の1以上を排出している。これは、2位の米国の約2倍である(ただし、一人当たりで見ると米国の方がまだひどい)。

By エコノミスト(英国)