Google、AI Platform Predictionを一般提供開始

Googleは26日、開発者がクラウド上で機械学習モデルを事前準備、構築、実行、共有できるサービス「AI Platform Prediction」の一般提供を開始した。このサービスは、Google Kubernetes Engineバックエンドをベースにしており、高い信頼性、柔軟性、低いオーバーヘッドレイテンシーを考慮して設計されたアーキテクチャを特徴としている。

Google、AI Platform Predictionを一般提供開始

Googleは26日、開発者がクラウド上で機械学習モデルを事前準備、構築、実行、共有できるサービス「AI Platform Prediction」の一般提供を開始した。このサービスは、Google Kubernetes Engineバックエンドをベースにしており、高い信頼性、柔軟性、低いオーバーヘッドレイテンシーを考慮して設計されたアーキテクチャを特徴としている。

AI Platform Predictionは、互換性のあるクラウドハードウェア(AIアクセラレータチップなど)を自動的に選択するエンジンのおかげで、XGBoostやscikitのようなフレームワークを使って学習したモデルの展開を簡単にしてくれると、GoogleのStaff EnghineerのRobbie HaertelとSenior EngineerのBhupesh Chandraはブログ記事で説明している。サポートされている仮想マシンでは、グラフィックカード、プロセッサ、RAM、ネットワークの使用量、モデルのレプリカ数などのメトリクスが表示される。また、セキュリティ面では、AI Platform Predictionには、ユーザーがパラメータを定義し、定義されたネットワーク境界内のリソースやサービスにのみアクセスできるモデルを配備できるツールが同梱されている。

さらに、AI Platform Predictionは、モデルの予測に関する情報と、予測の解明に役立つ可視化ツールを提供する。さらに、モデルに送信されたリクエストのラベリングに基づいて、ライブモデルを継続的に評価し、再訓練によってパフォーマンスを向上させる機会を提供する。

AI Platform Predictionのすべての機能は、完全に管理されたクラスタレス環境で利用可能で、専用のエンタープライズサポートが提供される。Googleはオプションでクォータ管理を行い、クライアントがトラフィックを送りすぎた場合にモデルを過負荷から保護する。

他の顧客の中でも、Googleが所有するWazeは、通勤者向けのライドシェアサービスであるWaze CarpoolにAI Platform Predictionを使用している。WazeのシニアデータサイエンティストであるPhilippe Adjimanによると、わずか数週間でWazeは、同じ方向に向かうライダーとドライバーをマッチングさせるモデルを本番で展開することができたという。

「AI Platform Predictionの最近の汎用リリースでは、GPUと複数のハイメモリおよびハイコンピュートなインスタンスタイプをサポートしており、より高度なモデルをコスト効率の良い方法で簡単に展開できるようになる」という。Wazeの複数のデータサイエンスチームとプロジェクト(広告、未来のドライブ予測、ETAのモデリング)は、すでにAIプラットフォームの他の既存の(または今後の)コンポーネントを使用しているか、または探索を開始している。

IDCは、コグニティブおよびAIシステムへの世界的な支出は、昨年の240億ドルの収益から2022年には776億ドルに達すると予測している。ガートナーも同意している。世界中の何千もの企業からの幹部を対象とした最近の調査では、AIの導入が過去4年間で270%、過去1年間だけで37%と驚異的な成長を遂げたことがわかった。AI Platform Predictionにより、Googleは、Amazon、Microsoft、IBMなどの競合他社を打ち負かし、新たにマネージドAIサービスをポートフォリオに追加した。

Read more

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

Fastlyは、LLMのAPI応答をキャッシュすることで、コスト削減と高速化を実現する「Fastly AI Accelerator」の提供を開始した。キップ・コンプトン最高プロダクト責任者(CPO)は、類似した質問への応答を再利用し、効率的な処理を可能にすると説明した。さらに、コンプトンは、エッジコンピューティングの利点を活かしたパーソナライズや、エッジにおけるGPUの経済性、セキュリティへの取り組みなど、FastlyのAI戦略について語った。

By 吉田拓史
宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラスト セキュリティ 実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

By 吉田拓史
​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史
Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史