LLMが次世代のコンピュータインターフェイスになる

人々がAIやソフトウェアを使う上で、大規模言語モデル(LLM)が自然言語に対応する窓口になるという、昨年のChatGPTの登場以来現実性を増したアイデアがある。各プレイヤーの競争の焦点の一つだ。

LLMが次世代のコンピュータインターフェイスになる
UnsplashCash Macanayaが撮影した写真

人々がAIやソフトウェアを使う上で、大規模言語モデル(LLM)が自然言語に対応する窓口になるという、昨年のChatGPTの登場以来現実性を増したアイデアがある。各プレイヤーの競争の焦点の一つだ。


Google DeepMindのCEO、デミス・ハサビスは、米メディアThe Vergeのインタビューでこう話している。「チャットボットやその種のシステムの場合、最終的には、日常生活全般にわたって本当に便利で役立つことをするために、1日のうちに何度も使うような、素晴らしいユニバーサル・パーソナル・アシスタントになるでしょう」。

ChatGPT gets the headlines, but scientific research like AlphaFold is also the future of AI, says Google DeepMind CEO Demis Hassabis
The buzz around AI has moved from science research to chatbots, but Google DeepMind’s CEO says it’s all relevant to progress.

ハサビスは、大規模なAIシステムやコンピュータをモジュール化されたシステムとして捉えていると説明した。携帯電話を例に挙げて、スクリーン、チップ、アンテナなど、様々な部品が合わさって一つの機能を成し遂げる様子を示している。同様に、大規模な言語モデル(LLM)はユーザーとのインターフェースとして機能し、その背後で特定の専門タスク(例えば、タンパク質の折り畳み)を行うためには、別の専門的なAIモジュール(例えば、AlphaFold)を呼び出すという概念を説明している。

彼はツールユース(Tooluse)という研究分野に言及した。ツールユース機能の下では、中央システムはユーザーのプロンプトに効果的に応え、その質問や問い合わせを適切なツールにルーティングする。そして、その結果をユーザーに対して理解しやすい形で返する。これら全てのプロセスは、自然言語という最高のインターフェイスを通じて行われる。

「つまり、ユーザーにとっては、多くの能力を持つ1つの大きなAIシステムのように見えるだけで、その裏側では、AIシステムは専門化された小さなAIシステムに分解されている可能性がある」とハサビスは言う。

「そして、おそらくそれが次の時代になると思います…中央システムは、あなたが言語で効果的にプロンプトを出す、ほとんどスイッチステートメントのようなものだと考えることができ、あなたのクエリや質問、あるいはあなたが尋ねていることが何であれ、あなたのためにその質問を解決したり、あなたのために解決策を提供したりする適切なツールにルーティングします。そして、それを非常に理解しやすい方法で送り返す。ここでもまた、自然言語という最高のインターフェイスを使っている」。

ハサビスとともにDeepMindの共同設立者であり、Googleを離れInflection AIを創業したムスタファ・スレイマンも似たような考え方をしている。彼は、米メディアCNBCとのインタビューで、買い物や交渉などあらゆることを代行してくれるパーソナルアシスタントがAIの未来だと語った。彼は、これらのAIシステムは私たちの働き方や生活を劇的に変化させ、最終的には検索エンジンに取って代わるだろうと述べた。生成AIチャットボット「Pi」が、ユーザーの日常的なタスク管理を支援する機能を獲得することが、Inflection AIの目的だという。

OpenAIはChatGPT PluginでTooluseのインターフェイスの地位を狙ったが、サム・アルトマンはユーザーの反応が悪いと考えているようだ。

Tooluseの課題としては、LLMが通常は法外な計算コストと一般にアクセスできないデータセットに依存していることだ。GPUの供給不足もボトルネックになっている。ただ、LLaMAやOPTのようなオープンソースのLLMを使うことで、GoogleやMicrosoft、OpenAIのようなプレイヤーでなくともこのゲームに参入できる余地はある、と上海交通大学准教授のRui Yangはみている。

参考文献

  1. Run Yang et al. GPT4Tools: Teaching Large Language Model to Use Tools via Self-instruction. arXiv:2305.18752 (cs.CV) https://arxiv.org/abs/2305.18752

Read more

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

Fastlyは、LLMのAPI応答をキャッシュすることで、コスト削減と高速化を実現する「Fastly AI Accelerator」の提供を開始した。キップ・コンプトン最高プロダクト責任者(CPO)は、類似した質問への応答を再利用し、効率的な処理を可能にすると説明した。さらに、コンプトンは、エッジコンピューティングの利点を活かしたパーソナライズや、エッジにおけるGPUの経済性、セキュリティへの取り組みなど、FastlyのAI戦略について語った。

By 吉田拓史
宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラスト セキュリティ 実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

By 吉田拓史
​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史
Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史