AWS、Habana GaudiベースのEC2インスタンスを2021年に導入

Amazon Web Servicesは1日、Intelが提供する機械学習ワークロードのためのHabana Gaudi AIハードウェアをAmazon EC2インスタンスへ実装し、2021年に顧客向けに提供する予定であると発表した。

AWS、Habana GaudiベースのEC2インスタンスを2021年に導入

Amazon Web Servicesは1日、Intelが提供する機械学習ワークロードのためのHabana Gaudi AIハードウェアをAmazon EC2インスタンスへ実装し、2021年に顧客向けに提供する予定であると発表した。

AWSの第9回年次教育・学習カンファレンス「re:Invent」でアンディ・ジャシーCEOが発表した。

他にも、AWSはクラウドトレーニングコストを削減するために構築されたカスタム設計のAWS Trainium MLトレーニングチップを発表。また、2021年には、Graviton2を搭載した新しいAWSインスタンス、新しいAWS GP3汎用データストレージボリューム、オンプレミスのECS Anywhere(Elastic Container Service)とEKS Anywhere(Elastic Kubernetes Service)の提供が予定されており、顧客は初めて自社のデータセンター内でAmazonサービスを実行することができる。その他、今後の製品やサービスのアップデートとしては、AWS Aurora Serverless v.2の導入や、新しいLambda Containersのサポートなどが予定されている。

Habana Gaudiベースの新しいAmazon EC2インスタンスは、2019年にHabana Labsを20億ドルで買収したAWSとIntelの提携により、2021年前半に提供されるとジャシーは述べた。AWSによると、Gaudiのアクセラレータは、現在の最高性能のGPUインスタンスよりも最大40%優れた価格性能を約束するという。

「TensorFlowだけでなく、主要な機械学習フレームワークであるPyTorchのすべてで動作する」とし、同社が価格性能の限界と機械学習トレーニングの進歩を押し続けるのに役立つだろう、とジャシーは述べた。Gaudiアクセラレータは、自然言語処理、物体検出、機械学習トレーニング、分類、レコメンデーション、パーソナライゼーションを含むワークロードのためのディープラーニングモデルをトレーニングするために設計されている。

最大8台のHabana Gaudiアクセラレータが各EC2 MLインスタンスに電力を供給し、フル装備のインスタンスは、Intelによると、TensorFlow上でResNet-50モデルをトレーニングする毎秒約12,000イメージを処理することができる。Gaudi ベースの EC2 インスタンスは、顧客にパフォーマンスの向上とコスト効率の向上を提供するように設計されており、開発者はグラフィックス処理装置から Gaudi アクセラレータに既存のトレーニングモデルを新しく構築したり、移植したりすることができる。

各Gaudiチップは、32GBpのHBM2メモリを提供し、標準的な100ギガビットイーサネットの10ポートを実装しています。ネイティブRDMA over Converged Ethernetは、サーバ内のチップを接続し、複数のGaudiサーバをAWS Elastic Fabric Adapter (EFA)技術を用いてクラスタ化することで、スケーラブルな分散トレーニングを可能にする。

現世代のGaudiチップはTSMCの16nmプロセスで製造されており、Habanaは、後続のGaudi2ではTSMCの7nmを使用する予定。また、IntelのHabana Labsは、Goyaと呼ばれる推論に特化したチップも製造している。

ArmベースのGraviton2チップ

AWSは、AmazonのArmベースのGraviton2チップを搭載した新しいC6gnインスタンスも数週間後に発表する予定だ。この新しいインスタンスには100ギガビット/秒のパフォーマンス機能が含まれており、高速化を実現しながら顧客のコスト削減を約束するとジャシーは述べている。

また、AWS Elastic Block Store(EBS)向けの新しいGP3ボリュームも間もなく登場する。GP3ボリュームは、2014年に導入された前世代のGP2ボリュームを進化させたものだ。

「ここ1、2年の間に顧客から得たフィードバックは、GP2を愛しているが、もし希望リストがあるとすれば、2、3つ欲しいものがあるということだ。1ギガバイトあたりのコストの低下や、ストレージをスケールしなくてもスループットやIOPS(1秒当たりにディスクが処理できるI/Oアクセスの数)をスケーリングできることなどだ」とジャシーは述べた。

AWSチームはこれらの要望に取り組んだ結果、ストレージとは別にIOPSやスループットをプロビジョニングできるようになり、ギガバイトあたりのコストが20%低くなった新しいGP3ボリュームが誕生したと、ジャシーは述べている。

「GP3ボリュームを使用した場合のベースラインのパフォーマンスは3,000 IOPSと125メガバイト/秒だが、これを改善しピーク時には1,000メガバイト/秒までスケールアップすることができ、これはGP2の4倍に相当する。そして、顧客はGP2で実行していたよりも多くの要求の高いワークロードをGP3で実行できるようになることがわかる」。

Read more

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラスト セキュリティ 実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

By 吉田拓史
​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史
Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史