Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー
Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。
要約:Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。
Google Cloudは1日と2日にパシフィコ横浜ノースで年次イベント「Google Cloud Next Tokyo '24」を開催した。Google Cloudは本イベントで、Geminiを製品群に惜しみなく応用し、人とシステムの間に立ち様々な仕事を代行する「AI エージェント」として紹介した。AI エージェントは最近、世界のAIコミュニティの中で重要なキーワード。エージェント自体は長い間研究され、近年の機械学習の進歩、特に大規模言語モデル(LLM)の登場によって製品化の時代を迎えている。
データアナリティクスとソフトウェア開発におけるAIエージェントはどのようなものか。Google Cloud プラットフォーム & テクニカル インフラストラクチャ バイス プレジデント兼ジェネラル マネージャーのブラッド・カルダーに話を聞いた。
以下は、2日にパシフィコ横浜ノースで行ったカルダーとのインタビューと31日に東京ミッドタウンで開かれた記者説明会の内容である。応答は読みやすくするために編集した。
エージェントの定義とその応用
最近、さまざまなAIエージェントの定義が浮上している。
カルダーは、AIエージェントの定義は、コーディングとアプリケーション開発の分野では比較的単純だ、と言った。カルダーの部門は、企業がコーディングやアプリケーション・エージェントを活用できるよう支援するプログラムを実施している。AIを使用することで、様々なタイプのアプリケーションを構築でき、例えばGeminiを使用してサポートチャット体験の提供や改善分析を行っているという。
Google Cloudは、顧客がエージェントを作成するためのプラットフォーム「Agent Builder」を提供している。「このプラットフォームはVertex AIと統合されており、BigQueryのデータを活用してデータ・エージェントを構築することができます。彼らは、エージェント構築のためのツールやサービスサポートを継続的に進化させており、ベクトル・インデックスなどの技術を用いてデータをAIで効果的に利用する方法を探っています」。
カルダーはエージェントが顧客のビジネスドメインの深い知識を反映している必要があるとし、一例として、ヘルスケア分野に言及した。「ヘルスケア分野などでは、症状から適切な医療へと顧客を導くヘルス・コンパニオンのようなエージェントが構築されています。これらのエージェントは、関連する全ての側面(医療的側面など)を理解し、適切なデータ空間を把握する必要があります。また、必要なモデルを理解し、それを専門化する方法を見出さなければなりません」。
Gemini in Looker
データアナリティクス分野のデータエージェントについても発表が相次いだ。Lookerでは自然言語でのデータ分析(会話分析)がフォーカスされた。
「SQLやLooker MLやPythonを書いて答えを得ることはできます。しかし、私たちは、質問して答えを得るための最初の自然言語を提供することに集中している。継続的に、あなたのデータを調べて、興味深いもの、洞察を探し、それを自動的にあなたに提示する」
2日の基調講演では、Google Cloudカスタマーエンジニアの高村哲貴は、小売企業のマーケティング担当者がLooker、Gemini、Vertex AIを利用したプロジェクトによって、マーケティング・事業戦略を立案するデモを披露した。
このデータエージェントは非常に多様な能力を持っているようだ。マーケティング担当者の役割を担った高村は、朝届いたエージェントからのメールによって、スニーカーの急速な販売増加を知り、Geminiを通じてBigQueryとインタラクトすることで地位別・顧客セグメント別のヒートマップを作成し、その後、相関性のあるデータ、トレンド、メトリックスを見つけ、「通常の機械学習」によって受注見込と在庫予測を行った。予想される在庫の逼迫に対して、BigQueryの中にあるスニーカーのマルチモーダルなデータ群を検索し、さらに口コミのデータ分析を行うことで、代替品を提案。マーケティングキャンペーンの素案をGeminiに依頼すると、Geminiはすぐさまそれを吐き出した。
カルダーは、このような顧客のビジネスドメイン特化型のエージェントとそれを構成するモデルについて言及した。カルダーによると、Gemini in Lookerは、顧客固有のデータを組み込むためのファインチューニングと検索拡張生成(RAG)の両方を模索している。ファインチューニングにおいては、「LoRA (Low Rank Adaptation)」のような安価な手法を使うことでドメイン固有のモデルを作っているという。
このようなモデルは顧客が次に取るべきアクションを予測できるのだろうか。RAGとLoRAのどちらが効果的でどちらが費用対効果に優れているのだろうか。「サプライチェーンの例では、特定の企業がどのようにサプライチェーンを運用しているかによって、LoRAがどの程度役立つかは異なります。私のチームは現在この問題に取り組んでいます。詳しく調査する必要があります。これは重要な質問ですが、まだ明確な答えを出すことはできません」
Code Assist
2日の基調講演では、カルダーはGemini Code Assistを紹介し、日本語対応を告げた。カルダーはGeminiの大きな特徴であるコンテクストウィンドウだけでなく、顧客のリポジトリを使用してRAGを実行し、関連情報を素早く特定し、コード生成、リファクタリング、テストケース作成に活用していることに触れた。
Geminiの他製品を大きく上回るコンテクストウィンドウは200万トークン(テキストをモデルが処理しやすい単位に分割した最小単位)を受け入れ、理論上は60,000行のコードを読み込める。コンテクストキャッシュという手法によって繰り返しの入力を避けることで、コンテクストウィンドウの有効活用が可能だ。
カルダーはコード生成AIが統合開発環境(IDE)に連結されていることの重要性を指摘した。IDEの中に統合されていれば、全てのファイルにアクセス可能なためだ。「テストにしろ、リファクタリングにしろ、何をするにしても、最も適切な情報を素早く特定することができる。RAGは実際に重要な情報を提供してくれる」
「GeminiやChatGPTにアクセスして、関数について教えてくれ、と言う人もいるでしょう。それは、あなたが使っているすべてのファイル、すべての情報、すべてのRAGにアクセスできるわけではありません。だからIDEでこれをやるのはとても重要です」
最近では、ソフトウェアエンジニアリングの全側面を機械が担うことになる、という予測も存在する。それは未達成だが、将来的に実現する可能性がある、とカルダーは言う。
「私たちは、設計開発、デプロイ、テスト、コードレビューなど、このライフサイクルのあらゆる側面においてGeminiのトレーニングに注力しています。ライフサイクルのあらゆる側面において、Geminiをどのように改善できるかを検討しています」「Code Assistは、Apigee API Managementのほか、私たちのクラウド全体に統合されています。データベースやデータ分析のためのSQL生成も可能です」
Cloud Assist
カルダーは、Google Cloud 環境に統合された AI であるCloud Assistが開発ライフサイクル全体、すべての製品開発をサポートできるようにしている、と言った。「開発ライフサイクルには3つの柱があり、1つはアプリケーションの設計です。2つ目はサポートにおけるトラブルシューティング、3つ目は運用と最適化です」
その中心にあるのがApp Hubだ、と彼は言う。AIを活用してアプリケーションモデルを提供し、ネットワーク問題などのトラブルシューティングや、コスト最適化が効率的に行える。App Hubは、アプリケーションのコストやエラー、設計の接続性を追跡・モデル化し、ソフトウェアエンジニア、プロダクトマネージャーだけでなく、ソリューションオーナー、財務担当者など、様々な役割の人々をサポートする。
Gemini in BigQuery
カルダーはGoogle Cloud Next Tokyo '24に先立つ31日に東京ミッドタウンで開かれた記者説明会で、「私たちは、BigQueryにおけるGeminiの活用を検討しています。Geminiは、ダークデータを構造化された形式に変換し、多角的な分析を可能にする機能を提供します。現在、一部の機能はプレビュー版で利用できますが、今後、包括的に展開していく予定です」と話した。
カルダーはGeminiは構造化された問題に対して非常にうまく機能するとし、企業の中にはうまく利用されていない「ダークデータ」が大量に存在することに言及した。2日のインタビューでは「多くのデータがいかにダークであるか。見向きもされず、利用もされていない。非構造化データであり、管理されていないデータです」「データをBigQueryに取り込み、Geminiを活用して欠損値を補い、BigQueryで使用できる形式に変換することができます(プレビューと発表された『Data Preparation for Gemini in BigQuery』)」と語った。
これら以外にも、Gemini in BigQueryにはコード生成、補完と説明 (SQL、Python)、データ インサイト、データ キャンバス、データの準備、パーティション分割とクラスタリングの推奨事項などが含まれる。