
革命ではなく進化:GPT-4は注目されるが、画期的ではない理由
GPT-4では、前モデルからさまざまな改良が加えられています。より創造的で、より高度な推論、多言語対応、視覚入力への対応、より多くのテキストを扱う能力などです。大人気のChatGPTよりもさらに強力なGPT-4は、その機能を深く探求し、生成AIの採用をさらに加速させるに違いありません。
ChatGPTやDALL-E 2のアートジェネレーターを開発した人工知能(AI)研究会社であるOpenAIは、待望のGPT-4モデルを発表しました。エキサイティングなことに、同社はこれを有料サービスを通じてすぐに一般に公開することも可能にしました。
GPT-4は、大量のデータで学習させたニューラルネットワークで、テキストを理解し生成する大規模言語モデル(LLM)です。ChatGPTを支えるモデルであるGPT-3.5の後継にあたります。
GPT-4では、前モデルからさまざまな改良が加えられています。より創造的で、より高度な推論、多言語対応、視覚入力への対応、より多くのテキストを扱う能力などです。
大人気のChatGPTよりもさらに強力なGPT-4は、その機能を深く探求し、生成AIの採用をさらに加速させるに違いありません。
進化した機能
OpenAIが紹介した多くの成果の中で、ひときわ目を引くのは、さまざまな標準的なテストでのGPT-4の成績です。例えば、米国の司法試験の模擬試験では、GPT-4は上位10%、GPT-3.5は下位10%のスコアを記録しています。

また、GPT-4は、ライティング、推論、コーディングの様々なタスクでGPT-3.5を上回った。以下の例は、GPT-4がGPT-3.5よりも信頼性の高い常識的な推論を示すことを示すものである。

世界を見るAIモデル
また、GPT-4は従来のGPTと異なり、マルチモーダルであることも大きな特徴です。つまり、テキストと画像の両方の入力を受け入れることができるのです。
OpenAIが提供したサンプルによると、GPT-4は画像の解釈、視覚的ユーモアの説明、視覚的入力に基づく推論が可能であることがわかりました。このようなスキルは、これまでのモデルの範囲を超えています。

この「見る」能力は、人間が観察によって知識を得るのと同じように、GPT-4が世界の仕組みについてより包括的に理解できるようになる可能性があります。これは、現在のモデルと人間レベルの知能とのギャップを埋める、高度なAIを開発するための重要な要素になると考えられています。
実は、このような機能を持つ言語モデルはGPT-4が初めてではありません。数週間前、マイクロソフトはGPT-4と同じように視覚入力を受け付ける言語モデル「Kosmos-1」を発表しました。Googleも最近、PaLM言語モデルを拡張し、画像データやロボットから収集したセンサーデータを取り込むことができるようになりました。マルチモーダリティは、AI研究のトレンドの一つです。
長い文章
GPT-4は、ChatGPTの3,000ワード程度を大きく上回る、25,000ワードまでの文章を取り込み、生成することができます。
より複雑で詳細なプロンプトを処理し、より広範な文章を生成することができます。これにより、より豊かなストーリーテリング、より深い分析、長い文章の要約、より深い会話のやりとりが可能になります。
下の例では、新しいChatGPT(GPT-4を使用)に人工知能に関するWikipediaの記事全体を与え、特定の質問をしたところ、正確に答えてくれました。

GPT-4の技術報告書には、開発経緯の詳細が記載されていないのが気になりますが、基本的にはGPT-3.5をスケールアップし、安全性を向上させたものであることは間違いないでしょう。つまり、AI研究に新たなパラダイムをもたらすものではありません。
OpenAI自身も、GPT-4は推論ミスやバイアスに陥りやすく、誤った情報を作り上げるなど、これまでの言語モデルと同じ制約を受けると述べています。
しかし、OpenAIのGPT-4に関する結果は、少なくともこれまでのGPTモデルよりも信頼性が高いことを示唆しています。
OpenAIは、GPT-4をより有用で問題の少ない出力が得られるよう、人間のフィードバックを使って微調整を行いました。GPT-4は、ChatGPTの初期リリースと比較すると、不適切なリクエストを拒否し、有害なコンテンツを回避するのに非常に優れています。
このGPT-4の登場により、評論家たちの間で重要な議論が続くことになります。それは、真実性と信頼性の問題を根本的に解決するためには、別のアプローチが必要なのか、それとも言語モデルに多くのデータとリソースを投入すれば、最終的に解決するのか、ということです。
GPT-4は、多くの実用的なシナリオにおいて、前任者よりも漸進的に改善されたに過ぎないという意見もあります。GPT-4の出力は、GPT-3.5の最新版よりも61%程度しか好まれないという結果が出ています。
また、英語試験や美術史試験など、いくつかの試験でGPT-4はGPT-3.5よりも向上していないことが判明しました。
Bing AI
GPT-4の発表後すぐに、Microsoftは、大きな議論を呼んだBingチャットボットが、ずっとGPT-4で動作していたことを明らかにしました。この発表は、ChatGPTよりも強力であることに気づいたコメンテーターによる憶測を裏付けるものでした。
つまり、Bingは単なるチャットボットではなく、検索エンジンであるため、GPT-4を活用する別の方法を提供することになります。
しかし、AIのニュースに詳しい人なら誰でも知っているように、Bingは少しおかしくなり始めました。しかし、新しいChatGPTは、人間のフィードバックを使ってかなり細かく調整されているようなので、それに従うとは思えません。
OpenAIのテクニカルレポートでは、GPT-4が、人間のフィードバックによるトレーニングを受けないと、実際に完全に暴走してしまうことが示されています。
商用アプリケーション
GPT-4のリリースで注目すべき点は、Bingに加え、Duolingo、Khan Academy、Morgan Stanley、Stripe、アイスランド政府などの企業や組織が、新しいサービスやツールの構築に既に利用していることです。
その商業的な展開は、主要なAIラボ間の競争をさらに過熱させ、投資家の生成技術への意欲をかき立てるだろう。
Original Article

Authors
Marcel Scharth、Lecturer in Business Analytics, University of Sydney
情報開示
著者は、この論文から利益を得るような企業や組織のために働いたり、相談役になったり、株式を所有したり、資金提供を受けているわけではなく、また、学術的な任命以外の関連する所属を開示していません。
© 2010-2023, The Conversation.
※アクシオンはCreative Commonsライセンスに基づいて、The Conversationの記事を再出版しています。
翻訳:吉田拓史、株式会社アクシオンテクノロジーズ