半導体

AWS、Habana GaudiベースのEC2インスタンスを2021年に導入

Amazon Web Servicesは1日、Intelが提供する機械学習ワークロードのためのHabana Gaudi AIハードウェアをAmazon EC2インスタンスへ実装し、2021年に顧客向けに提供する予定であると発表した。

吉田拓史

03 12月 2020 — 2 min read

AWSの第9回年次教育・学習カンファレンス「re:Invent」でアンディ・ジャシーCEOが発表した。

他にも、AWSはクラウドトレーニングコストを削減するために構築されたカスタム設計のAWS Trainium MLトレーニングチップを発表。また、2021年には、Graviton2を搭載した新しいAWSインスタンス、新しいAWS GP3汎用データストレージボリューム、オンプレミスのECS Anywhere（Elastic Container Service）とEKS Anywhere（Elastic Kubernetes Service）の提供が予定されており、顧客は初めて自社のデータセンター内でAmazonサービスを実行することができる。その他、今後の製品やサービスのアップデートとしては、AWS Aurora Serverless v.2の導入や、新しいLambda Containersのサポートなどが予定されている。

Habana Gaudiベースの新しいAmazon EC2インスタンスは、2019年にHabana Labsを20億ドルで買収したAWSとIntelの提携により、2021年前半に提供されるとジャシーは述べた。AWSによると、Gaudiのアクセラレータは、現在の最高性能のGPUインスタンスよりも最大40%優れた価格性能を約束するという。

「TensorFlowだけでなく、主要な機械学習フレームワークであるPyTorchのすべてで動作する」とし、同社が価格性能の限界と機械学習トレーニングの進歩を押し続けるのに役立つだろう、とジャシーは述べた。Gaudiアクセラレータは、自然言語処理、物体検出、機械学習トレーニング、分類、レコメンデーション、パーソナライゼーションを含むワークロードのためのディープラーニングモデルをトレーニングするために設計されている。

最大8台のHabana Gaudiアクセラレータが各EC2 MLインスタンスに電力を供給し、フル装備のインスタンスは、Intelによると、TensorFlow上でResNet-50モデルをトレーニングする毎秒約12,000イメージを処理することができる。Gaudi ベースの EC2 インスタンスは、顧客にパフォーマンスの向上とコスト効率の向上を提供するように設計されており、開発者はグラフィックス処理装置から Gaudi アクセラレータに既存のトレーニングモデルを新しく構築したり、移植したりすることができる。

各Gaudiチップは、32GBpのHBM2メモリを提供し、標準的な100ギガビットイーサネットの10ポートを実装しています。ネイティブRDMA over Converged Ethernetは、サーバ内のチップを接続し、複数のGaudiサーバをAWS Elastic Fabric Adapter (EFA)技術を用いてクラスタ化することで、スケーラブルな分散トレーニングを可能にする。

現世代のGaudiチップはTSMCの16nmプロセスで製造されており、Habanaは、後続のGaudi2ではTSMCの7nmを使用する予定。また、IntelのHabana Labsは、Goyaと呼ばれる推論に特化したチップも製造している。

ArmベースのGraviton2チップ

AWSは、AmazonのArmベースのGraviton2チップを搭載した新しいC6gnインスタンスも数週間後に発表する予定だ。この新しいインスタンスには100ギガビット/秒のパフォーマンス機能が含まれており、高速化を実現しながら顧客のコスト削減を約束するとジャシーは述べている。

また、AWS Elastic Block Store（EBS）向けの新しいGP3ボリュームも間もなく登場する。GP3ボリュームは、2014年に導入された前世代のGP2ボリュームを進化させたものだ。

「ここ1、2年の間に顧客から得たフィードバックは、GP2を愛しているが、もし希望リストがあるとすれば、2、3つ欲しいものがあるということだ。1ギガバイトあたりのコストの低下や、ストレージをスケールしなくてもスループットやIOPS（1秒当たりにディスクが処理できるI/Oアクセスの数）をスケーリングできることなどだ」とジャシーは述べた。

AWSチームはこれらの要望に取り組んだ結果、ストレージとは別にIOPSやスループットをプロビジョニングできるようになり、ギガバイトあたりのコストが20%低くなった新しいGP3ボリュームが誕生したと、ジャシーは述べている。

「GP3ボリュームを使用した場合のベースラインのパフォーマンスは3,000 IOPSと125メガバイト/秒だが、これを改善しピーク時には1,000メガバイト/秒までスケールアップすることができ、これはGP2の4倍に相当する。そして、顧客はGP2で実行していたよりも多くの要求の高いワークロードをGP3で実行できるようになることがわかる」。

ぐるなび、バーティカルAIエージェントの新アプリ「UMAME!」β版をリリース

AIで企業の情報探索を効率化：Google Agentspaceの全貌

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

宮崎市が実践するゼロトラスト：Google Cloud 採用で災害対応を強化し、市民サービス向上へ

ArmベースのGraviton2チップ

Read more

ぐるなび、バーティカルAIエージェントの新アプリ「UMAME!」β版をリリース

AIで企業の情報探索を効率化：Google Agentspaceの全貌

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

宮崎市が実践するゼロトラスト：Google Cloud 採用で災害対応を強化し、市民サービス向上へ