NvidiaがMellanoxの買収を発表したとき、ジェン・スン・ファンCEOは、データセンターはいずれ高性能コンピュータ(HPC)のように構築されるだろうと指摘した。したがって、Nvidiaの2019年のネットワーキングスペシャリスト買収の最初の成果が、InfiniBandデータセンターのセキュリティと予測保守アプリケーションへのAI適用に焦点を当てていることは驚くに値しなかった。

7月に発表されたスーパーコンピュータデータセンターの「サイバーAIプラットフォーム」は、リアルタイムのネットワークテレメトリとAIを強化したセキュリティおよび予測分析を組み合わせたMellanox Unified Fiber Manager(UFM)を中心に構築されている。UFM Cyber-AIと呼ばれるこのプラットフォームは、サイバー脅威や運用上の問題を検知し、コストのかかるネットワーク障害を予測する分析機能を活用することで、スケールアウトしたInfiniBandデータセンターのダウンタイムを短縮することを目的としている。

このプラットフォームは、リアルタイムおよび過去の遠隔測定データとワークロードデータの両方を利用して、データセンターの「運用状況」とワークロードのパターンを学習すると、同社は6月22日に述べている。

ネットワーク・モニターはAI技術を適用してデータセンターの「バイタル・サイン」を判断し、それらのデータを使用してコンポーネントの故障を予測したり、サイバー攻撃を示す可能性のある不審な使用パターンを発見したりすると、Mellanoxネットワーキングのマーケティング担当上級副社長であるNvidiaのGilad Shainerは述べている。

Mellanoxのインターコネクト技術 Image Credit: Nvidia

ネットワーク・セキュリティ・プラットフォームは、ディープラーニングとネットワーク要素を組み合わせて、「スーパーコンピューティングにセキュリティを導入し、次に、IT マネージャが実際に障害が発生する前に障害を予測できるようにすることで、データセンターのダウンタイムを削減します」とShainerは付け加えている。このプラットフォームは、アダプタやスイッチのケーブルから可能な限りすべての遠隔測定情報を読み取り、その情報を保存し、作成されたデータベース上でディープラーニング・アルゴリズムを実行する。

ディープラーニング・アルゴリズムは、データセンター、特に高性能なインターコネクト(相互接続性)を備えたスーパーコンピュータとして動作するように構成されたデータセンターがどのように動作しているかを評価するために、これらの重要な兆候を収集する。これらの動作特性は、「スーパーコンピュータの心臓の鼓動であり、基本的には、その上で実行されているワークロードのネットワーク・スタンプを定義しています」とShainerはHPC Wireに述べている。

このプラットフォームは、スーパーコンピュータのデータセンターがダウンする前にアラートを生成し、IT管理者が予防的なメンテナンスのスケジュールを立てることを可能にする。

データセンターでは、高性能コンピューティングや相互接続に加えて、ソフトウェアコンテナを介した分散アプリケーションも展開されており、事実上の標準となっているKubernetesクラスタオーケストレータへの依存度が高まっている。ハッカーはマイクロサービスインフラストラクチャにコンテナイメージレジストリなどの脆弱性がないかどうかを探り、注目している。

UFMプラットフォームは、アプリケーションを追跡し、マルウェアを含む可能性のある不審なワークロードや不正なワークロードを検出するように設計されている。これにより、データセンターをダウンさせる前にワークロードを隔離することができる。

ケーブルからボード、アダプタに至るまでのネットワーク機器には、個々の署名がある。Shainerは、ディープラーニング・セキュリティ・アプローチは、ネットワーク構成の物理的な変化を検出して、潜在的な問題をオペレータに警告することもできると付け加えている。「誰かがポートからケーブルを抜こうとした場合、すぐにアラームが表示されます」。

NvidiaによるMellanoxの買収と、2020年5月のCumulus Networksの買収は、データセンター・ネットワーキングへの協調的な取り組みを強調している。Nvidiaには実証済みの実績と深い専門知識があり、それが現在では相互接続にも応用されている。

エンタープライズ・データセンターがHPCワークロードを処理するために増加するにつれ、自動化されたセキュリティ・ツールと運用監視の需要が増加すると考えられる。例えば、重要インフラを保護するための米国政府の支出に関する調査では、連邦政府のサイバー防衛予算は2021年までに188億ドル近くになると予測されている。支出額の上位には、米国のスーパーコンピュータセンターの多くを運営する米国エネルギー省が名を連ねている。

セキュリティツールベンダーのAtlasVPNが発表した調査によると、エネルギー省は来年1年間にサイバー防衛に6億6500万ドル以上を費やすと予測している。この合計は、予測に含まれている2ダースの連邦政府機関の中で2番目に速い成長率を示している。

参考文献

  1. Nvidia, Maximizing Data Center Productivity with Application

Photo: "NVIDIA-Mellanox at GTC 2019" by NVIDIA Corporation is licensed under CC BY-NC-ND 2.0