Google、25製品にAI投入でMicrosoftとOpenAIに反攻

「検索の牙城においてOpenAIとMicrosoftの連合に侵略をされている」というのが最近のGoogleの評判である。同社のアンサーは、年次開発者会議での25製品のAI化宣言だった。熾烈なAI戦争は新たな一幕を迎えようとしている。

Google、25製品にAI投入でMicrosoftとOpenAIに反攻
2023年5月10日(水)、米カリフォルニア州マウンテンビューで開催されたGoogle I/O Developers Conferenceで講演するAlphabet Inc.の最高経営責任者であるSundar Pichai。Photographer: David Paul Morris/Bloomberg

「検索の牙城においてOpenAIとMicrosoftの連合に侵略をされている」というのが最近のGoogleの評判である。同社のアンサーは、年次開発者会議での25製品のAI化宣言だった。熾烈なAI戦争は新たな一幕を迎えようとしている。


「AIファーストの企業として歩み始めて7年、我々はエキサイティングな変曲点にいる」と、Googleの最高経営責任者(CEO)であるスンダー・ピチャイは10日に開催された年次カンファレンスGoogle I/Oのキーノート講演で述べた。「生成AIで、私たちは次のステップに進み、大胆かつ責任あるアプローチで、私たちのすべての製品を再構築している」

GoogleのAIに関する発表の中で中核的だったのが、新型の大規模言語モデル(LLM)、「PaLM 2」である。このLLMの登場は昨今のAI戦争の文脈において、「Googleの反攻」のような意味合いを持つだろう。

PaLM 2では、データセットが改善された。事前学習済み言語モデルは、通常、英語テキストに支配されたデータセットを使用していたが、Googleはより多言語かつ多様な事前トレーニングデータセットを設計し、それは数百の言語とドメイン(例えば、プログラミング言語、数学、並列多言語文書)にまたがるものだという。

Googleはモデルサイズとアーキテクチャの詳細については、外部への公開を控えている。

PaLM 2のモデル群の中で最大のモデルであるPaLM 2-Lは、最大のPaLMモデルより大幅に小さいが、より多くのトレーニング計算を要するという。評価結果は、自然言語生成、翻訳、推論を含む様々なタスクにおいて、PaLM 2モデルがPaLMを大幅に上回ることを示したという(図表参照)。

日本語を含む様々な言語で前世代モデルのパフォーマンスを大幅に上回っていると主張するチャート。出典:Google、PaLM 2 Technical Report
日本語を含む様々な言語で前世代モデルのパフォーマンスを大幅に上回っていると主張するチャート。出典:Google、PaLM 2 Technical Report

Googleが公開したTechnical Reportでは、「小さくても高品質なモデルは、推論効率を大幅に向上させ、サービスコストを削減し、より多くのアプリケーションやユーザーに対してモデルのダウンストリーム適用を可能にする」と記述されている。

「これらの結果は、モデルのスケーリングだけが性能を向上させる唯一の方法ではないことを示唆している。むしろ、綿密なデータ選択と効率的なアーキテクチャによって、性能を引き出すことができる」

GoogleはPaLM 2を様々なユースケースに対応させるため、幅広いサイズにまたがった4つのバージョン、Gecko、Otter、Bison、Unicornを作った。例えば、軽量型のGeckoは、モバイルデバイスでも動作するほど軽く、オフライン時でもデバイス上で優れたアプリケーションの動作を実現するのに十分だと説明された。

これは、Metaがオープンソース化したLLaMAを微調整したAlpacaと競合するだろう。Alpacaはスタンフォードの研究者が発表するやいなやソフトウェアエンジニアのコミュニティで開発が進み、たった3週間でiPhone用の動作が確認されるに至った。このAlpacaよりも性能が上と主張される、別のLLaMAの亜種であるVicunaも競争に火を注いでいる。

Google社内ではこのようなオープンソースに脅かされていると主張する人もいて、その人の書いた文書が流出した。

オープンソースのゲリラ勢がAI開発競争でGoogleとOpenAIを圧倒する?
コンサルティング会社SemiAnalysisが手に入れたGoogleの社内文書が波紋を広げている。文書は、GoogleとOpenAI/Microsoftの双方が、オープンソース陣営の「ゲリラ兵」に圧倒される可能性を示唆している。

同社はドメイン特化のPaLM 2のユースケースもも紹介した。ヘルス・リサーチ・チームによって訓練されたMed-PaLM 2は、さまざまな医学的文章から質問に答えたり、知見を要約したりすることができる。

Med-PaLM 2は、米国医師免許試験(USMLE)形式の問題からなるMedQAデータセットにおいて、受験者レベルの「エキスパート」性能を発揮した最初のLLMであり、85%以上の精度を達成し、インドのAIIMSおよびNEET医学試験問題からなるMedMCQAデータセットでは72.3%をスコアして合格点に達した最初のAIシステムであるという。

25製品にPaLM 2を搭載予定

GoogleはこのPaLM 2を搭載する予定である25以上の製品および機能を発表した。

検索エンジンもその1つだ。ChatGPTのようなチャットボットが提供するような、クエリに対するAIが生成した要約をユーザーに提供するようになる。Googleの検索担当バイスプレジデントであるLiz Reidは、いわゆる幻覚や捏造された情報に対処するため、AIによる回答には、回答の元となったウェブソースへのリンクが含まれる。広告も以前通り挿し込まれる。検索広告はGoogleのビジネスの柱であり、外し難いのだろう。

GoogleはChatGPTに対抗するために「金のなる木」の検索を殺せるか?
ChatGPTが検索を脅かしていると言われるが、Googleには強力な対抗馬が2つもある。しかし、上場企業のGoogleは毎年数兆円を稼ぐ「金のなる木」を失うリスクを許容できるだろうか。イノベーションのジレンマは「検索の20年選手」にも当てはまるのかもしれない。

Googleは、ChatGPT対抗ともいえるAIチャットボット「Bard」の日本語対応を発表したが、大元のPaLM 2の多言語での性能向上によってもたらされたものだろう。Bardが利用できる国が180カ国になった。

Googleは、Google Docs、Sheets、SlidesといったWorkspaceアプリにもAIを導入している最中だ。生成AIを使って、仕事の説明文を作成したり、クリエイティブなストーリーを書いたり、情報を追跡するためのスプレッドシートを自動生成したりすることができるようだ。また、プレゼンテーション全体を構築し、スライド用のテキストを提案したり、写真などのカスタムビジュアル要素を即座に生成したりすることもできる。

これは、Microsoftの365 Copilotに対するGoogleの対抗製品と考えていいだろう。Googleの無料ウェブベースのソフトウェア群に対するAIアップデートは、まもなく消費者に提供される予定だという。

AndroidでもAI化を深める

Googleはモバイルオペレーティングシステム(OS)にさらに多くのAI機能を搭載している。プライバシー保護の強化も発表されたが、写真加工技術はより一層進化したようだ。アートスタイルを変更したり、写真や絵文字から動く背景を作成したりすることができる。

この夏、Googleのメッセージアプリに「Magic Compose」機能が移植される。Bardチャットボットの生成機能をAndroidメッセージングに直接導入する。この機能は、生成AIを使って、もらったメッセージの文脈に基づいた返答を提案するほか、直接質問したり、メッセージの構文を調整して異なる文体に変えたりする設定が追加された。すでに多くのメッセージアプリが、次に使いたい単語を予測する機能を実現しているが、このMagic Composeは文章全体を生成する。

”汎用AI”の存在をほのめかす

Googleはマルチモーダルな(テキストや画像、音声、動画などの複数の種類の情報を一度に処理することが可能な)機械学習モデルであるGeminiを開発中であることをほのめかした。このマルチモーダルなモデルはいま話題を独占するLLMより、汎用人工知能(AGI)に近いと主張するグループもある(LLMがAGIの始まりとするグループもいる)。

3月に米テクノロジー誌The Informationが報じたところによると、AI研究部門Google Brainと傘下の英AI研究所DeepMindは「長年の激しい対立」を鞘に収め、Geminiを共同で構築し始めたとされる。4月には両者は合併している。Open AIの脅威が効いたようだ。

「Geminiは、ツールやAPIの統合が非常に効率的であること、記憶や計画といった将来のイノベーションを可能にするために一から作られた。まだ初期の段階だが、すでに以前のモデルにはなかった印象的なマルチモーダル機能を目にすることができる」とGoogleの公式ブログは書いている。

Geminiは、PaLM 2のように、さまざまなサイズと機能を提供する予定というが、詳細は明らかにされていない。

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史