AlphaGoのチームがChatGPTを本気で倒しに来た[吉田拓史]
Google傘下のAI研究所であるDeepMindは、次の大規模言語モデル(LLM)はOpenAIのものを超えると主張している。同社の得意なAI技術が組み合わさることでより汎用性の高い人間のパートナーが生まれるか?
Google傘下のAI研究所であるDeepMindは、次の大規模言語モデル(LLM)はOpenAIのものを超えると主張している。同社の得意なAI技術が組み合わさることでより汎用性の高い人間のパートナーが生まれるか?
テクノロジー誌Wiredの記事によると、 Google傘下のAI研究所であるGoogle DeepMindは、 ChatGPTに匹敵する、あるいはそれを凌ぐと主張するGeminiと呼ばれる新しいチャットボットを開発している。Geminiは、囲碁で人間のプロ棋士を破ったGoogle DeepMindのAIシステムAlphaGoの技術(深層強化学習)を使い、テキストの分析だけでなく、問題の計画や解決も行う。
Google DeepMindのデミス・ハサビス最高経営責任者(CEO)はWiredのウィル・ナイトに対し次のように語った。「Geminiは、AlphaGoタイプのシステムの長所と、大型言語モデル(LLM)の驚くべき言語能力を組み合わせたものだと、高いレベルで考えることができます。また、かなり面白くなりそうな新機軸もいくつかあります」
強化学習について
旧DeepMindと旧Google BrainのAI開発の指揮権を握ったハサビスが、統合後の研究所でDeepMindの既定路線を推し進めているように見える。それは強化学習である。同社のこの技術を用いた実績は群を抜いている。
- AlphaGo:2016年、AlphaGoは史上初めてプロ棋士イ・セドルに勝利した。囲碁は戦略と戦術を深く理解する必要がある複雑なゲームであるため、これは人工知能の分野における大きなブレークスルーとなった。
- AlphaZero:2017年、AlphaZeroは世界最高のチェス、将棋、囲碁プログラムを1日で破った。これはAlphaGoの偉業よりもさらに印象的なことで、AlphaZeroははるかに少ないデータセットで訓練された。
- AlphaFold:2020年、タンパク質の構造を予測する人工知能 (AI) システムであるAlphaFold は、従来のタンパク質構造予測ツールよりも精度が向上しており、生命科学の研究に革命をもたらす可能性を示唆。
また、1つのモデルによって、あらゆるタスクをこなすことのできる「マルチモーダル深層学習」と呼ばれる要素も、Geminiに組み込まれるかもしれない。DeepMindは2022年5月に、 604個ものタスクを単一のモデルで解けるようにしたマルチタスクのGatoを発表した。このモデルはAtariのゲームを操作する能力、画像に対するキャプションを生成する能力、テキストを用いた対話能力、そして実際のロボットアームを使ってブロックを積み上げる能力を同時に有している。
GeminiはDeepMindにとって言語モデルへの最初の進出ではない。昨年、同社はSparrowというチャットボットを発表したが、このチャットボットは他の言語モデルよりも、質問に対して「安全でない」あるいは「不適切な」回答をする可能性が低いと主張している。ハサビスは1月にTime誌に対し、DeepMindは今年中にSparrowをプライベートベータ版としてリリースすることを検討していると語ったが、その計画が現在も進行中かどうかは不明だ。
OpenAIの脅威がGoogleのAI研究部門を変えたか
Geminiは、Google DeepMindが最もリソースを割いているプロジェクトのようだ。The Informationが3月に報じたところによると、Gemini への投資は、Googleのチャットボット・プロジェクトであるBardがChatGPTに追いつくことに失敗したと考えられたことで、拍車がかかった。
元々Alphabetの傘下にあったDeepMindは、4月にGoogle Brainと統合された。拠点が英国と米国で分かれる両者は、同じグループにあるもの積極的な協力関係にはなかったが、ChatGPTのセンセーションで危機感を感じた経営陣が統合を促したとされている。旧DeepMind出身のハサビスが、統合後のGoogle Deep Mindの指揮を取ることになった。この統合に付随して、チーフ・サイエンティストの役職を得たジェフ・ディーンも、Geminiのプロジェクトに関与しているとされる。