NVIDIAのデータセンター向けCPU「Grace」とは

包括的なデータセンター・ソリューションの野望

NVIDIAのデータセンター向けCPU「Grace」とは

要点

NVIDIAが発表した機械学習向けのデータセンター向けCPUは、NVIDIAのGPUとの相互接続性を確保する、パッケージ化を推し進める製品だ。データセンターの包括的なプラットフォーム提供者になろうとする野望が滲んでいる。


NVIDIAは12日から開催されているGTCで、初のデータセンター向けCPU「Grace」を発表した。

Graceは、1兆個以上のパラメータを持つ次世代自然言語処理(NLP)モデルのトレーニングなどを目的にした高度に特化したプロセッサ。2023年に市場投入される予定だ。Grace CPUベースのシステムは、NVIDIA GPUと緊密に結合することで、x86 CPUで動作する現在の最先端のNVIDIA DGXベースのシステムよりも10倍速いパフォーマンスを実現する、と同社はうたっている。

CPUは、初期設計のN1がすでに話題になっているArm社の次世代CPUコア「Neoverse」を採用するが、その性能については情報が少ない。

NVIDIAは、Intel XeonやAMD EPYCのサーバー市場を直接狙っているのではなく、GPUに直接接続し、補完するための独自のチップを構築し、膨大な1兆パラメータのAIモデルの処理を支援している。CPUとGPUの直接接続を実現するために、NVIDIAは、GPU間をシームレスに接続したマルチGPUシステムを作るための相互接続技術「NVLink」をCPUとGPUの通信に使用すると明らかにしている。最終的には、将来のNVIDIAサーバーGPUと連携して動作するように設計された、高性能かつ広帯域のCPUになるとのことだ。

近年の機械学習では、データ量とAIモデルのサイズが指数関数的に増加する傾向がある。典型的なのがNLP分野であり、2020年1月に発表されたOpen AIの研究者たちによる論文が「スケーリングの法則」を提唱すると、パラメータ数、データセットのサイズ、トレーニングに使用される計算量が膨れ上がり、人間のような文章を生成することで注目を集めたGPT-3のパラメータ数が1,750億に達したのもつかの間、最新のGoogle BrainのSwitch Transformerは、16兆個のパラメータに到達している。

これらをトレーニングするには、システムのボトルネックを解消するためにGPUと緊密に結合できる新しいCPUが必要だった、とNVIDIAは主張している。同社は、1兆個のパラメータを持つモデルの性能を10倍にすることを目指しており、NVIDIA謹製の64モジュールのGrace+A100システムの性能予測では、このようなモデルのトレーニングを1ヶ月から3日に短縮することができ、8モジュールのシステムで5,000億パラメータのモデルをリアルタイムで推論することも可能だ、と主張している。

スイス国立スーパーコンピューティングセンター(CSCS)とロスアラモス国立研究所は、Graceを搭載したヒューレット・パッカード社製のスーパーコンピュータを2023年に稼働させる計画だ。

声明の中のジェンスン・ファンCEOはこう語っている「NVIDIAは、ライセンスされたArmのIPを使用して、Graceを巨大スケールのAIおよびHPC専用のCPUとして設計した。GPUやDPUと組み合わせることで、Graceはコンピューティングのための第3の基盤技術を提供し、AIを進化させるためにデータセンターを再設計する能力を与えてくれる。NVIDIAは今や3チップ企業(編注:CPU、DPU、GPU)となった」。

これは同社が包括的なデータセンター・ソリューションを提供する野望を強調している。

包括的なデータセンター・ソリューションの野望

昨年、NVIDIAが400億ドルのArm買収を発表したことは、半導体市場に衝撃を与えた。買収の目的はいくつか推測されたが、有力なものは、同社のドル箱に育ったデータセンター事業の強化だった(詳しくはこちら)。

NVIDIAの主力事業は長らくゲーミングであり、他の事業部門を足し合わせてもゲーミング部門には敵わないという一本足の時期が創業からずっと続いてきた。しかし、近年はそのバランスが変化している。2016年7−9月期で2億700万ドルに過ぎなかったデータセンター事業の収益は、2020年10−12月期には19億300万ドルと9倍以上に成長した。2000年4−6月期にはゲーミング事業を一時的に追い抜いた。

これはGPUの機械学習利用が拡大していることを意味している。GPUを利用した訓練や推論の有効性が証明された2012年頃から機械学習向けの用途が急激に加速してきたが、近年はコンピュータ科学に軸足を持つ会社だけではなく、多種多様な企業が機械学習をビジネスに取り入れ始めたため、この分野への投資で突出してきたNVIDIAはその恩恵を一身に受けている。

NVIDIAはハードウェアベンダーのポジションに飽き足らず、包括的なシステムを提供するプラットフォームのポジションを模索している。データセンターにおいて機械学習やHPCを必要とする顧客はNVIDIAから一式を受注する用になることが目標だと考えられている。もしかしたら、サブスクリプションで経常収益を得るプランもあるかもしれない。

NVIDIAは、非常に優秀なフリーキャッシュフロー生成によって蓄積した豊富な現金を使い、現代的なデータセンターソリューションパッケージを作るための技術を買い漁るようになった。NVIDIAは2019年にイスラエルのネットワーク新興企業Mellanoxの買収を成功させ、2020年5月にはLinuxベースのネットワークオペレーティングシステムを提供するCumulus Networksを買収した。

買収を発表したMellanoxを同社のカンファレンスGTC2019に招いた、ジェン・スン・ファンCEO。"NVIDIA-Mellanox at GTC 2019"by NVIDIA Corporation is licensed under CC BY-NC-ND 2.0

NVIDIAはかつてGPUというカテゴリーを生み出したように、今度はDPU(データ処理装置)というカテゴリーを作ろうとしている。このチップはソフトウェア制御が進化している現代のデータセンターにおいてネットワーク・トラフィックの最適化を調整するものだ。MellanoxのSmartNICはネットワークインターフェイスカードにFPGAを追加することで、ネットワークのソフトウェア制御を可能にし、CPUがネットワーク機能を実行するから解放する(詳しくはこちらの記事)。

つまり、NVIDIAは、Nvidia GPU + Arm CPU + Mellanox DPUという組み合わせで、完全なデータセンター・サービスを構築する展望を持っている。この動きはAMDに波及した。AMDのXilinx買収はNVIDIAの構想を追走するものであり、AMD CPU + AMD GPU + Xilinx FPGA + Xilinx SmartNICという、HPCや機械学習ハードウェアのコンペでNVIDIAと競争するための技術スタックを構築するためのものだ。

Graceは、NVIDIAにとってデータセンター用CPU市場への2度目の本格的な挑戦となる。10年以上前に発表されたNVIDIAのProject Denverは、NVIDIAが期待していたような結果にはならなかったが、今回は機械学習に用途が限定されていることから勝算は高い。NVIDIAは、GAFAMのようなクラウドサービスプロバイダを通じてしか利用できないと見られていた技術スタックに手を伸ばす機会を世界中の企業に提供しようとしている。それは非常に貴重な機会ではあるが、決して安くはない。

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Kinoco, Masatoshi Yokota,  Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS, ikebukurou 黒田太郎, bantou, shota0404, Sarah_investing, Sotaro Kimura, TAMAKI Yoshihito, kanikanaa, La2019, magnettyy, kttshnd, satoshihirose, Tale of orca.

寄付サブスク (吉田を助けろ)

吉田を助けろ(Save the Yoshi!)。運営者の吉田は2年間無休、現在も月8万円の報酬のみでAxionを運営しています。

月10ドル支援したいと考えた人は右上の「Subscribe」のボタンからMonthly 10ドルかYearly 100ドルご支援ください。あるいは、こちらからでも申し込めます。こちらは数量が99個まで設定できるので、大金を助けたい人におすすめです。

その他のサポート

こちらからコーヒー代の支援も可能です。推奨はこちらのStripe Linkです。こちらではない場合は以下からサポートください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。
Takushi Yoshida is creating writing/journalism | Patreon
Become a patron of Takushi Yoshida today: Get access to exclusive content and experiences on the world’s largest membership platform for artists and creators.

投げ銭

Betalen Yoshida Takushi met PayPal.Me
Ga naar paypal.me/axionyoshi en voer het bedrag in. En met PayPal weet je zeker dat het gemakkelijk en veiliger is. Heb je geen PayPal-rekening? Geen probleem.

Read more

新たなスエズ危機に直面する米海軍[英エコノミスト]

新たなスエズ危機に直面する米海軍[英エコノミスト]

世界が繁栄するためには、船が港に到着しなければならない。マラッカ海峡やパナマ運河のような狭い航路を通過するとき、船舶は最も脆弱になる。そのため、スエズ運河への唯一の南側航路である紅海で最近急増している船舶への攻撃は、世界貿易にとって重大な脅威となっている。イランに支援されたイエメンの過激派フーシ派は、表向きはパレスチナ人を支援するために、35カ国以上につながる船舶に向けて100機以上の無人機やミサイルを発射した。彼らのキャンペーンは、黒海から南シナ海まですでに危険にさらされている航行の自由の原則に対する冒涜である。アメリカとその同盟国は、中東での紛争をエスカレートさせることなく、この問題にしっかりと対処しなければならない。 世界のコンテナ輸送量の20%、海上貿易の10%、海上ガスと石油の8~10%が紅海とスエズルートを通過している。数週間の騒乱の後、世界の5大コンテナ船会社のうち4社が紅海とスエズ航路の航海を停止し、BPは石油の出荷を一時停止した。十分な供給があるため、エネルギー価格への影響は軽微である。しかし、コンテナ会社の株価は、投資家が輸送能力の縮小を予想している

By エコノミスト(英国)
新型ジェットエンジンが超音速飛行を復活させる可能性[英エコノミスト]

新型ジェットエンジンが超音速飛行を復活させる可能性[英エコノミスト]

1960年代以来、世界中のエンジニアが回転デトネーションエンジン(RDE)と呼ばれる新しいタイプのジェット機を研究してきたが、実験段階を超えることはなかった。世界最大のジェットエンジン製造会社のひとつであるジー・エアロスペースは最近、実用版を開発中であると発表した。今年初め、米国の国防高等研究計画局は、同じく大手航空宇宙グループであるRTX傘下のレイセオンに対し、ガンビットと呼ばれるRDEを開発するために2900万ドルの契約を結んだ。 両エンジンはミサイルの推進に使用され、ロケットや既存のジェットエンジンなど、現在の推進システムの航続距離や速度の限界を克服する。しかし、もし両社が実用化に成功すれば、超音速飛行を復活させる可能性も含め、RDEは航空分野でより幅広い役割を果たすことになるかもしれない。 中央フロリダ大学の先端航空宇宙エンジンの専門家であるカリーム・アーメッドは、RDEとは「火を制御された爆発に置き換える」ものだと説明する。専門用語で言えば、ジェットエンジンは酸素と燃料の燃焼に依存しており、これは科学者が消炎と呼ぶ亜音速の反応だからだ。それに比べてデトネーシ

By エコノミスト(英国)
ビッグテックと地政学がインターネットを作り変える[英エコノミスト]

ビッグテックと地政学がインターネットを作り変える[英エコノミスト]

今月初め、イギリス、エストニア、フィンランドの海軍がバルト海で合同演習を行った際、その目的は戦闘技術を磨くことではなかった。その代わり、海底のガスやデータのパイプラインを妨害行為から守るための訓練が行われた。今回の訓練は、10月に同海域の海底ケーブルが破損した事件を受けたものだ。フィンランド大統領のサウリ・ニーニストは、このいたずらの原因とされた中国船が海底にいかりを引きずった事故について、「意図的なのか、それとも極めて稚拙な技術の結果なのか」と疑問を呈した。 海底ケーブルはかつて、インターネットの退屈な配管と見なされていた。現在、アマゾン、グーグル、メタ、マイクロソフトといったデータ経済の巨人たちは、中国と米国の緊張が世界のデジタルインフラを分断する危険性をはらんでいるにもかかわらず、データの流れをよりコントロールすることを主張している。その結果、海底ケーブルは貴重な経済的・戦略的資産へと変貌を遂げようとしている。 海底データパイプは、大陸間インターネットトラフィックのほぼ99%を運んでいる。調査会社TeleGeographyによると、現在550本の海底ケーブルが活動

By エコノミスト(英国)