AIで企業の情報探索を効率化:Google Agentspaceの全貌

近年、AI技術の進化は目覚ましく、ビジネスの現場でも様々な形で活用が進んでいる。そのような中、Google Cloudが新たに発表したGoogle Agentspaceは、いま注目を集めるAIエージェントがエンタープライズITを大きく変革する予兆と言えるだろう。

AIで企業の情報探索を効率化:Google Agentspaceの全貌
UnsplashGoogle DeepMindが撮影した写真

要約

近年、AI技術の進化は目覚ましく、ビジネスの現場でも様々な形で活用が進んでいる。そのような中、Google Cloudが新たに発表したGoogle Agentspaceは、いま注目を集めるAIエージェントがエンタープライズITを大きく変革する予兆と言えるだろう。

モデルとインフラの急速な進化

グーグル・クラウド・ジャパン合同会社 執行役員 テクノロジー部門 兼 事業開発本部 寳野雄太は、12月17日に行われた記者説明会で、「Agent時代を支えるモデルとインフラストラクチャの進化」と題し、GoogleとGoogle Cloudが直近で行った生成AIに関連する発表について紹介した。Googleは12月に入って、大規模言語モデル(LLM)のGemini 2.0 Flash experimentalのほか、画像生成のImagen 3、動画生成のVeo 2と、生成AIに関する多くの発表を行っている。

Introducing Gemini 2.0: our new AI model for the agentic era
Today, we’re announcing Gemini 2.0, our most capable AI model yet.
Introducing Veo and Imagen 3 on Vertex AI | Google Cloud Blog
Announcing Veo and Imagen 3, our most capable video and image generation models to date.
State-of-the-art video and image generation with Veo 2 and Imagen 3
We’re rolling out a new, state-of-the-art video model, Veo 2, and updates to Imagen 3. Plus, check out our new experiment, Whisk.

Gemini 2.0 Flash experimental

Gemini 2.0 Flash experimentalは、大幅な速度と性能の向上に加え、複雑な指示への応答やGoogle検索などの様々なツールの活用といった機能を実現。機能面では、従来の画像、動画、音声といったマルチモーダル入力に加え、テキストとネイティブ生成画像を組み合わせた出力や、操作可能な多言語テキスト読み上げオーディオといったマルチモーダル出力にも対応。軽量版ながらGoogleが主張する性能は群を抜いており、推論のコストは極めて低い。Gemini 2.0 Flashは、カメラの映像をスキャンして常に周囲の状況を理解する知覚システムProject Astraや、使用中のブラウザでのタスクの自動化を可能にするProject Mariner、AIコーディングエージェントJulesのような同社Agent製品の基盤となっている。

Imagen 3

Imagen 3はGoogleの最も高度なテキストから画像生成モデルであり、シンプルなテキストプロンプトから非常にリアルで詳細な画像を生成するように設計されている。企業はImagen 3を活用することで、マーケティング、広告、製品デザインなど、さまざまな用途に合わせて、自社のブランドスタイルやロゴを組み込んだ高品質な画像をシームレスに作成できる。さらに、Imagen 3は編集とカスタマイズ機能を提供し、ユーザーはテキストプロンプトで画像を修正したり、マスクを使用して画像の一部のみを編集したり(製品の背景の更新など)、サイズ要件に合わせて画像を拡大したりできる。また、モデルを誘導して特定のブランド要素、スタイル、ロゴ、主題、または製品の特徴を持つ画像を生成することで、カスタマイズも可能だ。

Veo 2

Google DeepMindによって開発されたVeoは、現在Vertex AIで利用可能な、Googleの最も高性能な動画生成モデルである。テキストまたは画像のプロンプトから、幅広い映画的および視覚的なスタイルで、非常に高速に高品質・高解像度の動画を生成する。Veo 2は、自然言語と視覚的意味、および動画内の物理空間を高度に理解していると考えられる。Veoは、テキストから動画への生成と、画像から動画への生成の両方をサポートしており、ユーザーは既存の画像(Imagen 3で生成された画像を含む)またはテキスト記述から動画を作成できる。これにより、企業は動画制作を効率化し、コストを削減し、動画コンテンツのプロトタイプ作成と反復を迅速に行うことができる。

寳野は、このようなインフラ、モデル、プラットフォームが、ユーザー企業に対して「AIエージェント」として提供されるというビジョンに言及した。これは、8月の年次イベント「Google Cloud Next Tokyo '24」でも示された方向性でもある。「データエージェント」について発表したGoogle Cloud プラットフォーム & テクニカル インフラストラクチャ バイス プレジデント兼ジェネラル マネージャーのブラッド・カルダーとのインタビューは以下の通り。

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo ’24, VPカルダー氏インタビュー
Google Cloudは、年次イベント「Google Cloud Next Tokyo ’24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

LLMの発展が変曲点を迎えているか否かは重要な文脈だ。最近、LLMの性能改善における重要な要因であったスケーリング則の継続性について、懐疑的な見方が浮上している。先週開催された「NeurIPS」では、トップ研究者であるイリヤ・サツケバーが、主にデータの枯渇によってスケーリング則が限界に達したとの考えを示した。イリヤはAIの次の進歩の手段のヒントをいくつか提示したが、その中には複合的なシステムとしての進化である「エージェント」への言及もあった。

エンタープライズ向けエージェントがより具体化

寳野は、このエージェントのエンタープライズにおける具体的な応用例の一つとしてGoogle Agentspaceを紹介した。寳野によると、エンタープライズにおける生成AIの利用はコンシューマーユースケースよりも複雑であり、多くの企業では、情報が様々な場所に分散し、必要な時に必要な情報にアクセスするのが困難な状況、いわゆる「情報のサイロ化」が発生している。Googleの調査では、89%もの従業員が6つ以上の情報源から情報を検索しているとされる。

これでは、情報探索に多くの時間を費やし、業務効率の低下を招いてしまう、と寳野は説明した。Google Agentspaceは、このような課題を解決するために開発されており、企業全体の中央情報源として機能する、エンタープライズ向けのマルチモーダル検索エージェントだという。

Google Agentspaceの主な機能と特徴

Google Agentspaceは、Googleの高度な検索技術と最新のAIモデルを融合することで、以下のような強力な機能を提供する、と寳野は説明した。

  • マルチモーダル対応: Gemini、Imagen、Veoといった最先端のAIモデルを活用し、テキストだけでなく、画像、動画、音声など、様々な形式の情報を理解し、処理することができる。
  • 企業データへのシームレスなアクセス: ドキュメント、メール、スプレッドシートといった非構造化データはもちろん、表などの構造化データにも対応。翻訳機能も内蔵しており、多言語の情報もスムーズに活用できる。
  • 主要なアプリケーションとの連携: Confluence、Google Drive、Jira、Microsoft SharePoint、ServiceNowなど、最も一般的に使用されるサードパーティアプリケーション用のコネクタがあらかじめ組み込まれているため、従業員は関連するデータソースに簡単にアクセスしてクエリを実行し、より良い意思決定を行うことができる。
  • カスタムAIエージェントの構築: 状況に応じて生成AIを適用するカスタムAIエージェントの基盤として機能。ビジネスアナリスト、営業、マーケター、教育業界関係者など、様々な分野で従業員がより効率的に業務を遂行できるよう支援する。
  • Google品質の検索: データの保存場所に関わらず、関連性の高い情報を迅速に発見。Googleの高度な検索技術が、企業内の情報検索を強力にサポートする。
Google Cloud、Google Agentspace と NotebookLM Plus で企業の生産性向上を支援 | Google Cloud 公式ブログ
Google Cloud は本日、企業のお客様向けに 2 つの新ソリューションを発表しました。これらのソリューションは、Gemini の高度な推論、Google の検索機能および企業のデータを活用して、従業員が企業の専門知識にアクセスできるよう設計されています。

寳野は、複雑な情報を整理・分析するためのツールであるNotebookLMの企業向け強化版、NotebookLM Plusにも触れた。NotebookLMは、LLMを活用し、ユーザーがアップロードした文書に基づいて質問に答えたり、要約を作成したり、新しいアイデアを生成したりするAIツールである。複数の情報源から情報を統合し、複雑なトピックを理解するのに役立つ。主に研究者の間で人気が高まったが、利用者の裾野が急速に拡大しているようだ。また、調べた内容を対話形式のポッドキャストへと変換する機能は、高い関心を集めていた。

説明会で紹介されたGoogle Agentspaceのデモ動画では、マーケターがプレスリリースを出すタスクに取り組むうえで、様々な社内文書を参照し、プレスリリースに必要な要件を確認し、その後、さらに社内外の情報にあたってリサーチを行う様子が示された。

Read more

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

Fastlyは、LLMのAPI応答をキャッシュすることで、コスト削減と高速化を実現する「Fastly AI Accelerator」の提供を開始した。キップ・コンプトン最高プロダクト責任者(CPO)は、類似した質問への応答を再利用し、効率的な処理を可能にすると説明した。さらに、コンプトンは、エッジコンピューティングの利点を活かしたパーソナライズや、エッジにおけるGPUの経済性、セキュリティへの取り組みなど、FastlyのAI戦略について語った。

By 吉田拓史
宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラスト セキュリティ 実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

By 吉田拓史
​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史