
Google、GPT-4対抗馬Geminiをリリース間近:より万能なAIの可能性を開拓か
Googleが近く市場投入しようとしているAIは、様々な情報を使い、様々な判断を下せる、マルチモーダルAIであるとされる。OpenAIがリードしてきたChatGPTのセンセーションを大幅に上回る新手が登場しようとしているのかもしれない。
Googleが近く市場投入しようとしているAIは、様々な情報を使い、様々な判断を下せる、マルチモーダルAIであるとされる。OpenAIがリードしてきたChatGPTのセンセーションを大幅に上回る新手が登場しようとしているのかもしれない。
Googleは、Microsoft Azureを通じて利用可能なOpenAIのGPT-4と競合するとされる最新AIの「Gemini」について、少人数のグループにアクセス権を与え、間もなく公開することを示唆したと報じられた。
米メディアThe Informationが9月中旬に報じたところによると、Googleは近く、Geminiを「Google Cloud Vertex」のAIサービスを通して、企業向けに提供する予定だ。同社はGeminiをすでに自社のコンシューマー向けサービスに組み込み、Google Cloudを通じて企業向けに販売する方針という。
Geminiは、GoogleのAI部門Google DeepMindの研究者が取り組んでいる次世代のマルチモーダルAIモデルだ。マルチモーダルAIは、テキスト、音声、画像、動画などの複数のデータ形式を統合し、高度な判断や理解を実現するAI技術を指す。従来のAIは主に単一のデータ形式に焦点を当てていたが、マルチモーダルAIはこれらを融合させることで、より複雑な認識を行う。現実世界の多様な問題に対応するこの技術は、医療診断から広告・マーケティングまで、さまざまな分野での利用が期待されており、多くの研究者がその応用研究に取り組んでいる。
Googleには十分なデータセットがあったようだ。8月中旬のThe Informationの記事によると、Googleは、YouTube動画のトランスクリプトの大規模データでGeminiをトレーニングしているという。YouTubeは地球上のほぼすべての言語の動画、音声、テキストデータをカバー。OpenAIもYouTube動画から文字起こしを行い、GPTシリーズをトレーニングしたと噂されている。