AWS、Habana GaudiベースのEC2インスタンスを2021年に導入

Amazon Web Servicesは1日、Intelが提供する機械学習ワークロードのためのHabana Gaudi AIハードウェアをAmazon EC2インスタンスへ実装し、2021年に顧客向けに提供する予定であると発表した。

AWS、Habana GaudiベースのEC2インスタンスを2021年に導入

Amazon Web Servicesは1日、Intelが提供する機械学習ワークロードのためのHabana Gaudi AIハードウェアをAmazon EC2インスタンスへ実装し、2021年に顧客向けに提供する予定であると発表した。

AWSの第9回年次教育・学習カンファレンス「re:Invent」でアンディ・ジャシーCEOが発表した。

他にも、AWSはクラウドトレーニングコストを削減するために構築されたカスタム設計のAWS Trainium MLトレーニングチップを発表。また、2021年には、Graviton2を搭載した新しいAWSインスタンス、新しいAWS GP3汎用データストレージボリューム、オンプレミスのECS Anywhere(Elastic Container Service)とEKS Anywhere(Elastic Kubernetes Service)の提供が予定されており、顧客は初めて自社のデータセンター内でAmazonサービスを実行することができる。その他、今後の製品やサービスのアップデートとしては、AWS Aurora Serverless v.2の導入や、新しいLambda Containersのサポートなどが予定されている。

Habana Gaudiベースの新しいAmazon EC2インスタンスは、2019年にHabana Labsを20億ドルで買収したAWSとIntelの提携により、2021年前半に提供されるとジャシーは述べた。AWSによると、Gaudiのアクセラレータは、現在の最高性能のGPUインスタンスよりも最大40%優れた価格性能を約束するという。

「TensorFlowだけでなく、主要な機械学習フレームワークであるPyTorchのすべてで動作する」とし、同社が価格性能の限界と機械学習トレーニングの進歩を押し続けるのに役立つだろう、とジャシーは述べた。Gaudiアクセラレータは、自然言語処理、物体検出、機械学習トレーニング、分類、レコメンデーション、パーソナライゼーションを含むワークロードのためのディープラーニングモデルをトレーニングするために設計されている。

最大8台のHabana Gaudiアクセラレータが各EC2 MLインスタンスに電力を供給し、フル装備のインスタンスは、Intelによると、TensorFlow上でResNet-50モデルをトレーニングする毎秒約12,000イメージを処理することができる。Gaudi ベースの EC2 インスタンスは、顧客にパフォーマンスの向上とコスト効率の向上を提供するように設計されており、開発者はグラフィックス処理装置から Gaudi アクセラレータに既存のトレーニングモデルを新しく構築したり、移植したりすることができる。

各Gaudiチップは、32GBpのHBM2メモリを提供し、標準的な100ギガビットイーサネットの10ポートを実装しています。ネイティブRDMA over Converged Ethernetは、サーバ内のチップを接続し、複数のGaudiサーバをAWS Elastic Fabric Adapter (EFA)技術を用いてクラスタ化することで、スケーラブルな分散トレーニングを可能にする。

現世代のGaudiチップはTSMCの16nmプロセスで製造されており、Habanaは、後続のGaudi2ではTSMCの7nmを使用する予定。また、IntelのHabana Labsは、Goyaと呼ばれる推論に特化したチップも製造している。

ArmベースのGraviton2チップ

AWSは、AmazonのArmベースのGraviton2チップを搭載した新しいC6gnインスタンスも数週間後に発表する予定だ。この新しいインスタンスには100ギガビット/秒のパフォーマンス機能が含まれており、高速化を実現しながら顧客のコスト削減を約束するとジャシーは述べている。

また、AWS Elastic Block Store(EBS)向けの新しいGP3ボリュームも間もなく登場する。GP3ボリュームは、2014年に導入された前世代のGP2ボリュームを進化させたものだ。

「ここ1、2年の間に顧客から得たフィードバックは、GP2を愛しているが、もし希望リストがあるとすれば、2、3つ欲しいものがあるということだ。1ギガバイトあたりのコストの低下や、ストレージをスケールしなくてもスループットやIOPS(1秒当たりにディスクが処理できるI/Oアクセスの数)をスケーリングできることなどだ」とジャシーは述べた。

AWSチームはこれらの要望に取り組んだ結果、ストレージとは別にIOPSやスループットをプロビジョニングできるようになり、ギガバイトあたりのコストが20%低くなった新しいGP3ボリュームが誕生したと、ジャシーは述べている。

「GP3ボリュームを使用した場合のベースラインのパフォーマンスは3,000 IOPSと125メガバイト/秒だが、これを改善しピーク時には1,000メガバイト/秒までスケールアップすることができ、これはGP2の4倍に相当する。そして、顧客はGP2で実行していたよりも多くの要求の高いワークロードをGP3で実行できるようになることがわかる」。

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史