AWS Gravitonとは

AWS Gravitonはアマゾン ウェブ サービスにより64-bitの Arm Neoverseコアを使用してカスタム構成されたプロセッサ。「Amazon EC2 で実行するクラウドワークロードに、最良のパフォーマンスを提供するもの」とAWSは説明している。

AWS Gravitonとは

AWS Gravitonはアマゾン ウェブ サービスにより64-bitの Arm Neoverseコアを使用してカスタム構成されたプロセッサ。「Amazon EC2 で実行するクラウドワークロードに、最良のパフォーマンスを提供するもの」とAWSは説明している。

最新世代のGraviton2プロセッサは、Armの新しいNeoverse N1 CPUマイクロアーキテクチャとメッシュインターコネクトを実装したもので、1年ちょっと前に詳述した複合インフラ指向のプラットフォームだ。このプラットフォームは、これまでのArmベースのサーバの試みを大幅に上回るものであり、Amazonは競争上の優位性を目指している。

アマゾンのクラウドサービス用カスタムSoCの設計における努力は、同社がイザレルに本拠を置くAnnapurna Labsを買収した2015年にさかのぼって始まった。Annapurnaは以前、ネットワークに特化したArm SoCを手がけており、主にNASデバイスなどの製品で使用されていた。Amazonの下では、チームはカスタムArmサーバーグレードのチップを作ることを任されていたが、新しいGraviton2は、この努力において最初の本格的な試みである。

Graviton2とは何かというと、Armの新しいNeoverse N1コア(モバイルCortex-A76コアのマイクロアーキテクチャー誘導体)とArmのCMN-600メッシュインターコネクトを使用した64コアのモノリシックサーバチップのデザインだ。これは、同社が1年前に発表したArmの64コアのリファレンスN1プラットフォームと本質的にほぼ同じで、かなりストレートなデザインだ。Amazonは、Graviton2のCPUコアのクロックが2.5GHzと少し低めに設定されていることや、メッシュインターコネクトに64MBのL3キャッシュの代わりに32MBのみが含まれていることなど、少し変わった点がある。システムは、8チャンネルDDR-3200メモリコントローラによってバックアップされており、SoCは、I/O用に64のPCIe4レーンをサポートしている。これは、TSMCの7nmプロセスノードで製造されたN1プラットフォームの比較的教科書的なデザインの実装である。

Graviton2の性能は、もちろん新しいN1コアによって担保されている。N1マイクロアーキテクチャは、Armをモバイル空間で成功させた電力効率を維持しながら、さらに優れたパフォーマンスとサーバーグレードの機能をもたらすと期待されている。N1コアは、Graviton2のような1MBのL2キャッシュを実装するために~1.4mm²と非常にスリムで効率的であり、Amazonの新しいチップが到達する2.5GHzの周波数では、コアあたり~1Wと優れた電力効率を発揮します。

Neoverse N1プラットフォームとCPUは、Arm社初のサーバおよびインフラストラクチャ市場向けに設計された専用のコンピューティングIP。これは、コンシューマ製品と産業用ソリューションの両方に同じCPU IPを提供していた過去のIPとは大きく異なる。このIPファミリ間の新しい技術的な区別が、新しいインフラストラクチャをターゲットとした製品に新しいマーケティング名を採用することになり、Neoverseブランドが誕生し、コンシューマ向けのCortex CPUブランドとの差別化が図られた。

Image by Arm.

Graviton2の総消費電力は、Amazonが記事の文脈で開示したがらなかったもので、同社はまだデザインのいくつかの側面を胸に秘めている。チップのより保守的なクロックレート、Arm社の予測では64コア2.6GHz実装で105W前後、Ampere社の最近の発表では80コア3GHz N1サーバーチップが210Wであることから、Graviton2は80W前後から110W前後の悲観的な予測になると予想している。

基本的にはAmazonのデータセンターに仮想マシンをデプロイしている。このようなインスタンスの能力を決定する重要な指標は、そのタイプ(基本的には、どのようなCPUアーキテクチャやマイクロアーキテクチャを基盤とするハードウェアに電力を供給するかを決定する)と可能性のあるサブタイプだ。

インスタンスのスループットはvCPUで定義されているインスタンスの種類の他に、インスタンスの能力を定義する最も重要なメトリックは、そのvCPU数だ。"仮想CPU」とは、基本的には仮想マシンで利用可能な論理CPUコアを意味する。Amazonは、1 vCPUから最大128までのインスタンスを提供しており、最も人気のあるプラットフォームでは、2、4、8、16、32、48、64、96のサイズで提供されている。

Graviton2は、SMTなしのシングルソケット64コアプラットフォームであることは、最大利用可能なvCPUインスタンスサイズが64であることを意味する。

Graviton2には2つの主要な競争相手には、AMD EPYC 7571(Zen1)パワードm5aインスタンスとIntel Xeon Platinum 8259CL(Cascade Lake)パワードm5nインスタンスがある。

Photo: "AWS - Amazon Web Services Office in Houston, Texas"by Tony Webster is licensed under CC BY 2.0

Read more

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

Fastlyは、LLMのAPI応答をキャッシュすることで、コスト削減と高速化を実現する「Fastly AI Accelerator」の提供を開始した。キップ・コンプトン最高プロダクト責任者(CPO)は、類似した質問への応答を再利用し、効率的な処理を可能にすると説明した。さらに、コンプトンは、エッジコンピューティングの利点を活かしたパーソナライズや、エッジにおけるGPUの経済性、セキュリティへの取り組みなど、FastlyのAI戦略について語った。

By 吉田拓史
宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラスト セキュリティ 実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

By 吉田拓史
​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史
Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史