Google、GPT-4対抗馬Geminiをリリース間近:より万能なAIの可能性を開拓か

Googleが近く市場投入しようとしているAIは、様々な情報を使い、様々な判断を下せる、マルチモーダルAIであるとされる。OpenAIがリードしてきたChatGPTのセンセーションを大幅に上回る新手が登場しようとしているのかもしれない。

Google、GPT-4対抗馬Geminiをリリース間近:より万能なAIの可能性を開拓か
2023年6月15日木曜日、フランス・パリで開催されたビバテック・フェアでのGoogleの看板。写真家 ネイサン・レイン/ブルームバーグ

Googleが近く市場投入しようとしているAIは、様々な情報を使い、様々な判断を下せる、マルチモーダルAIであるとされる。OpenAIがリードしてきたChatGPTのセンセーションを大幅に上回る新手が登場しようとしているのかもしれない。


Googleは、Microsoft Azureを通じて利用可能なOpenAIのGPT-4と競合するとされる最新AIの「Gemini」について、少人数のグループにアクセス権を与え、間もなく公開することを示唆したと報じられた。

米メディアThe Informationが9月中旬に報じたところによると、Googleは近く、Geminiを「Google Cloud Vertex」のAIサービスを通して、企業向けに提供する予定だ。同社はGeminiをすでに自社のコンシューマー向けサービスに組み込み、Google Cloudを通じて企業向けに販売する方針という。

Geminiは、GoogleのAI部門Google DeepMindの研究者が取り組んでいる次世代のマルチモーダルAIモデルだ。マルチモーダルAIは、テキスト、音声、画像、動画などの複数のデータ形式を統合し、高度な判断や理解を実現するAI技術を指す。従来のAIは主に単一のデータ形式に焦点を当てていたが、マルチモーダルAIはこれらを融合させることで、より複雑な認識を行う。現実世界の多様な問題に対応するこの技術は、医療診断から広告・マーケティングまで、さまざまな分野での利用が期待されており、多くの研究者がその応用研究に取り組んでいる。

Googleには十分なデータセットがあったようだ。8月中旬のThe Informationの記事によると、Googleは、YouTube動画のトランスクリプトの大規模データでGeminiをトレーニングしているという。YouTubeは地球上のほぼすべての言語の動画、音声、テキストデータをカバー。OpenAIもYouTube動画から文字起こしを行い、GPTシリーズをトレーニングしたと噂されている。

調査会社SemiAnalysisのDylan PatelとDaniel Nishballは最近、Googleのサプライヤーから得たデータを元に、Geminiは、OpenAIのGPT-4を打ち負かす可能性が高いと書いた。Patelらの分析では、Googleはより多くのAIトレーニング用チップを利用でき、主要な性能指標でGPT-4を凌駕できるという。

Google Gemini Eats The World – Gemini Smashes GPT-4 By 5X, The GPU-Poors
Compute Resources That Make Everyone Look GPU-Poor

これに対し、OpenAIのサム・アルトマンCEOは、SemiAnalysisの主張に反論した。「信じられないことに、Googleはセミアナライシス社に社内の情報を公開させた(笑)」とアルトマンはX(旧Twitter)の投稿に書き、Google内部からGeminiのパフォーマンスに関する資料が与えられれば、当然、お世辞を書くとほのめかした。

手がかり

GeminiがどのようなマルチモーダルAIになるかは、情報が欠けている。ヒントとしては、7月に公開された米メディアThe VergeとGoogle DeepMind CEOのデミス・ハサビスのインタビューが挙げられる。

ChatGPT gets the headlines, but scientific research like AlphaFold is also the future of AI, says Google DeepMind CEO Demis Hassabis
The buzz around AI has moved from science research to chatbots, but Google DeepMind’s CEO says it’s all relevant to progress.

ハサビスは、大規模な言語モデル(LLM)はユーザーとのインターフェースとして機能し、その背後で特定の専門タスクを行うためには、別の専門的なAIモジュール(例えば、AlphaFold)を呼び出す手法に言及している。ツールユース(Tooluse)だ。

ツールユース機能の下では、中央システムはユーザーのプロンプトに効果的に応え、その質問や問い合わせを適切なツールにルーティングする。その結果をユーザーに対して理解しやすい形で返す。これら全てのプロセスは、自然言語を通じて行われるという。

「つまり、ユーザーにとっては、多くの能力を持つ1つの大きなAIシステムのように見えるだけで、その裏側では、AIシステムは専門化された小さなAIシステムに分解されている可能性がある」とハサビスはThe Vergeに対して言った。

おそらく、Geminiは複数のモデルで構成されており、少なくとも強化学習モデルとLLMの2つが含まれているはずだ。最近公開された、米メディアWiredによるインタビューでは、ハサビスは、「高いレベルでは、GeminiはAlpha Goタイプのシステムの長所のいくつかと、大型モデルの驚くべき言語能力を組み合わせたものだと考えることができます」とハサビスは。「また、かなり面白くなりそうな新機軸もいくつかあります」。ちなみに、Geminiはラテン語で「双子」の意である。

また、ハサビスのかつての盟友もGoogleの外で似たような道を歩んでいる。Google DeepMindの共同創業者であるムスタファ・スレイマンは「生成AIは単なる最初のフェーズに過ぎない。次に来るのは対話型AIで、他のソフトウェアや他の人々に呼びかけて、設定したタスクを遂行できるボットだ。彼はまた、強固な規制の必要性を訴えており、その実現は難しいとは考えていない」と言った

関連記事

AlphaGoのチームがChatGPTを本気で倒しに来た[吉田拓史]
Google傘下のAI研究所であるDeepMindは、次の大規模言語モデル(LLM)はOpenAIのものを超えると主張している。同社の得意なAI技術が組み合わさることでより汎用性の高い人間のパートナーが生まれるか?
ロボットが研究するとき|AIはいかに科学に革命をもたらすか[英エコノミスト]
人工知能(AI)に関する議論は、アルゴリズムによる偏見や差別、雇用の大量破壊、さらには人類滅亡など、その潜在的な危険性に焦点が当てられがちだ。しかし、このようなディストピア的なシナリオを心配する観測筋がいる一方で、潜在的な報酬に注目する向きもある。特に医学、気候科学、グリーンテクノロジーなどの分野で、科学的発見のペースを根本的に加速させることによってである。Google DeepMind CEOのデミス・ハサビスやMetaのAI研究責任者であるヤン・ルカンといったこの分野の著名人は、AIが科学の進歩を加速させ、発見の黄金時代をもたらすと信じている。彼らは正しいのだろうか? このような主張は…

Read more

新たなスエズ危機に直面する米海軍[英エコノミスト]

新たなスエズ危機に直面する米海軍[英エコノミスト]

世界が繁栄するためには、船が港に到着しなければならない。マラッカ海峡やパナマ運河のような狭い航路を通過するとき、船舶は最も脆弱になる。そのため、スエズ運河への唯一の南側航路である紅海で最近急増している船舶への攻撃は、世界貿易にとって重大な脅威となっている。イランに支援されたイエメンの過激派フーシ派は、表向きはパレスチナ人を支援するために、35カ国以上につながる船舶に向けて100機以上の無人機やミサイルを発射した。彼らのキャンペーンは、黒海から南シナ海まですでに危険にさらされている航行の自由の原則に対する冒涜である。アメリカとその同盟国は、中東での紛争をエスカレートさせることなく、この問題にしっかりと対処しなければならない。 世界のコンテナ輸送量の20%、海上貿易の10%、海上ガスと石油の8~10%が紅海とスエズルートを通過している。数週間の騒乱の後、世界の5大コンテナ船会社のうち4社が紅海とスエズ航路の航海を停止し、BPは石油の出荷を一時停止した。十分な供給があるため、エネルギー価格への影響は軽微である。しかし、コンテナ会社の株価は、投資家が輸送能力の縮小を予想している

By エコノミスト(英国)
新型ジェットエンジンが超音速飛行を復活させる可能性[英エコノミスト]

新型ジェットエンジンが超音速飛行を復活させる可能性[英エコノミスト]

1960年代以来、世界中のエンジニアが回転デトネーションエンジン(RDE)と呼ばれる新しいタイプのジェット機を研究してきたが、実験段階を超えることはなかった。世界最大のジェットエンジン製造会社のひとつであるジー・エアロスペースは最近、実用版を開発中であると発表した。今年初め、米国の国防高等研究計画局は、同じく大手航空宇宙グループであるRTX傘下のレイセオンに対し、ガンビットと呼ばれるRDEを開発するために2900万ドルの契約を結んだ。 両エンジンはミサイルの推進に使用され、ロケットや既存のジェットエンジンなど、現在の推進システムの航続距離や速度の限界を克服する。しかし、もし両社が実用化に成功すれば、超音速飛行を復活させる可能性も含め、RDEは航空分野でより幅広い役割を果たすことになるかもしれない。 中央フロリダ大学の先端航空宇宙エンジンの専門家であるカリーム・アーメッドは、RDEとは「火を制御された爆発に置き換える」ものだと説明する。専門用語で言えば、ジェットエンジンは酸素と燃料の燃焼に依存しており、これは科学者が消炎と呼ぶ亜音速の反応だからだ。それに比べてデトネーシ

By エコノミスト(英国)
ビッグテックと地政学がインターネットを作り変える[英エコノミスト]

ビッグテックと地政学がインターネットを作り変える[英エコノミスト]

今月初め、イギリス、エストニア、フィンランドの海軍がバルト海で合同演習を行った際、その目的は戦闘技術を磨くことではなかった。その代わり、海底のガスやデータのパイプラインを妨害行為から守るための訓練が行われた。今回の訓練は、10月に同海域の海底ケーブルが破損した事件を受けたものだ。フィンランド大統領のサウリ・ニーニストは、このいたずらの原因とされた中国船が海底にいかりを引きずった事故について、「意図的なのか、それとも極めて稚拙な技術の結果なのか」と疑問を呈した。 海底ケーブルはかつて、インターネットの退屈な配管と見なされていた。現在、アマゾン、グーグル、メタ、マイクロソフトといったデータ経済の巨人たちは、中国と米国の緊張が世界のデジタルインフラを分断する危険性をはらんでいるにもかかわらず、データの流れをよりコントロールすることを主張している。その結果、海底ケーブルは貴重な経済的・戦略的資産へと変貌を遂げようとしている。 海底データパイプは、大陸間インターネットトラフィックのほぼ99%を運んでいる。調査会社TeleGeographyによると、現在550本の海底ケーブルが活動

By エコノミスト(英国)