Metaは一撃で生成AIをコモディティ化した?

Metaは、複合的な生成AIのMeta AIを世界の数十億台のモバイル端末に送り出そうとしている。チップ企業とタッグを組み、オンデバイスでのAIの実行にも精力的に取り組んでいる。Metaの大胆な戦略は、生成AIを急速に浸透させ、コモディティに変えてしまうかもしれない。

Metaは一撃で生成AIをコモディティ化した?
Photo by Solen Feyissa on Unsplash

Metaは、複合的な生成AIのMeta AIを世界の数十億台のモバイル端末に送り出そうとしている。チップ企業とタッグを組み、オンデバイスでのAIの実行にも精力的に取り組んでいる。Metaの大胆な戦略は、生成AIを急速に浸透させ、コモディティに変えてしまうかもしれない。


Metaはスマートフォンでの生成AI利用に活路を見出しているようだ。先月中旬、Metaが次世代の大規模言語モデル(LLM)である「Llama 3」をオープンソースで公開した(*1)。同社はLlama 3で構築された「Meta AI」をFacebook、Instagram、WhatsApp、Messengerで利用可能にした。Meta AIは、ユーザーの日常生活やタスクをサポートするAIアシスタントだ。レストランの推薦、コンサートの検索、勉強の助けなど、様々な場面で活用できる。また、ウェブサイトでも利用可能で、数学の問題や仕事のメールの添削などに役立つ。

Meta AIはFacebook、Instagram、WhatsApp、Messengerに検索機能をシームレスに統合しており、ユーザーはアプリを切り替えることなくウェブ上のリアルタイム情報にアクセスできる。例えば、Messengerのグループチャットでスキー旅行の計画を立てる際、ニューヨーク市からコロラド州へのフライトをMeta AIで即座に検索できる。この強力な検索機能は、旧Facebook AI Research(現Meta AI)の研究者らが提唱した「RAG(Retrieval-Augmented Generation:検索拡張生成)」を採用している。長らく検索を軽視してきたMetaだが、生成AIの台頭により一転して参入してきた。OpenAIも検索機能を発表するとのリークがあり、生成AIの登場が多くのプレイヤーに検索の再定義を迫っているようだ。

さらに、Meta AIの「Imagine」機能により、テキストから画像をリアルタイムで生成できる。この機能は、WhatsAppとMeta AIで米国向けにベータ版の提供が開始されている。タイピングに合わせて画像が変化するので、Meta AIがユーザーのビジョンを実現する様子を見ることができる。

英語版のMeta AIは米国以外の十数カ国で展開され始めたという。現在、豪州、カナダ、ガーナ、ジャマイカ、マラウイ、ニュージーランド、ナイジェリア、パキスタン、シンガポール、南アフリカ、ウガンダ、ザンビア、ジンバブエの人々がMeta AIにアクセスできる。

モバイル端末上で生成AIの革命が起こる可能性が示唆されている。Metaは2010年代のモバイル化の波で勝者となり、その主要製品であるFacebook、Instagram、WhatsApp、Messengerの利用のほとんどがモバイルで行われている。重複を除外しなけらば、これらは30億人以上のユーザーに利用されていると推定される。

つまり、生成AIが膨大なユーザーの手のひらに届こうとしているのだ。これまで、ビジネス界隈のセンセーションにもかかわらず、1億人程度が生成AIの世界的なユーザー層だったと考えられるが、これからこの数字は爆発的な伸びを示すだろう。Meta以外のプレイヤーもLlamaを消費者向け製品に載せることが予見される。

Meta AIで採用されている「Llama 3 70B」(700億パラメーターモデル)は、より大規模かつ高性能なモデルと比べると機能面で劣る可能性がある。しかし、特にモバイルファーストの新興国市場においては、モバイル端末を主に利用するユーザー層のニーズに適合した最適なモデルとなり得る。Metaは、綿密な財務計算に基づいてこの戦略を採用したか、あるいは消費者向けAI分野で優位性を確立するために多額の投資を厭わないのかのどちらかだろう。

おそらく後者だ。Metaのマーク・ザッカーバーグCEOは「短期的な損失」を厭わないようだ。ザッカーバーグCEOは1月、2024年末までに34万個以上のNVIDIA製グラフィック・プロセッサ・ユニット(GPU)を確保する計画を明らかにした。同社は最近の決算報告で、2024年に350億ドルから400億ドルをAIに費やす予定を示した。Llama 3の発表は、OpenAIのChatGPTやAnthropicのClaudeのようなサブスクリプション型のチャットボットに大きな圧力をかけている。これらの企業は、より安定した法人向け市場への多様化によって、Metaが切り開く「安いLLM」に対する耐性を模索している。

オンデバイスAI

この革命にはもう一つの側面がある。デバイス上でのLLM実行だ。

Llama 3の発表と同時期にスマートフォン向け半導体最大手のQualcomm(クアルコム)とMetaは、同時期にMetaのLlama 3をスマートフォン、PC、VR/ARヘッドセット、自動車などのデバイス上で直接実行できるように最適化するための提携を発表した。

この提携で重要なのが、「オンデバイスでの生成AIの実行」を目標としていることだ。通常の生成AIは、ユーザーのクエリをデータセンターに送り、サーバー側で「生成」を実行している。しかし、オンデバイスLLMの場合、多くの計算がデバイス上で行われ、サーバーの関与がなくなる。LLMの背後で検索やその他の様々なファンクションを呼び起こしたときに始めて、通常のアプリと同様のサーバーへのコンタクトが行われるのだ。

この仕組みの重要な要件は、モデルの軽量化と、チップの最適化だ。MetaはスマホアプリとVR/ARヘッドセットのトップ企業であり、10億台をゆうに超えるデバイスで、オンデバイスAIが射程に入ったことを意味する。これは控えめに言っても画期的だ。

チップ企業もフロンティアをめぐる戦いを始める

すでにQualcommとスマホ向け半導体市場のライバルであるMediaTekは、スマホやその他のデバイス向けに生成型AIの開発競争を繰り広げている。Qualcommは言語、音声、画像、動画など複数のモダリティを扱える大規模マルチモーダルモデル(LMM)の開発に取り組む一方、MediaTekはスマートフォン市場に注力している。両社は、業界カンファレンスの「モバイルワールドコングレス」で端末上のAI機能を披露した。

生成AIは幅広い産業に影響を及ぼし、巨額の経済効果を生み出すと予想されている。当面はハイエンド端末向けの開発が中心となるが、数年以内にミッドレンジ端末にもAI機能が搭載されるようになるだろう。Qualcommは引き続きハイエンド市場をリードするものの、MediaTekも中国メーカーでの採用拡大により存在感を高めていくと見られる。

LLMをモバイル向けに軽量化するという試みは、すでに実現されている。Metaが昨年2月にLlamaの最初のバージョンを発表すると、スタンフォード大学のコンピュータ科学者のグループがすぐさま微調整したモデル「Alpaca」を発表した。構築費用は「600ドル以下」だとされた。これをさらにマサチューセッツ工科大学(MIT)の3年生、Kevin Kwokが、iPhone 14でローカルで動作させることに成功した。Llamaの発表からたったの5ヵ月に過ぎなかった。

進歩速すぎ…スマホだけで動く軽量LLMがたった3週間で爆誕
ある大規模言語モデル(LLM)がオープンソースで公開されると、すぐさま微調整が進み、スマートフォンやタブレットでの動作が確認された。界隈の課題とされたオンデバイスの軽量AIがたった3週間で生まれてしまった。

考察

Metaの戦略は生成AIを世界中の人々に急速に広め、コモディティ化させる可能性がある。ミドルエンドの生成AIの居場所が失われ、ローエンドとハイエンドに二極化するのかもしれない。

脚注

*1:Llama 3は、AWS、Google Cloud、Microsoft Azureなど多くのクラウドプラットフォームで利用可能になる予定。

Read more

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史