Open AI、新モデルで再び競合を突き放す
OpenAIが今週発表した大規模言語モデル(LLM)のGPT-4 Turboは、主張されている性能が確かならば、競合に対して優位性を見せつけた格好だ。同社はコスト効率と入力拡大で顕著な改善があったと主張した。
OpenAIが今週発表した大規模言語モデル(LLM)のGPT-4 Turboは、主張されている性能が確かならば、競合に対して優位性を見せつけた格好だ。同社はコスト効率と入力拡大で顕著な改善があったと主張した。
OpenAIは今週、同社初の開発者会議において、同社の主力製品であるテキスト生成AIモデルGPT-4の改良版であるGPT-4 Turboを発表した。
GPT-4 Turboには2つのバージョンがあり、1つはテキスト分析、もう1つはテキストと画像の両方の文脈を理解するものだ。テキスト分析モデルはAPI経由で限定的な利用者に開放されており、OpenAIによれば「今後数週間のうちに」一般的に利用できるようにする予定だという。
コンテクストウィンドウの拡大
GPT-4 Turboの大きなアップグレードのひとつは、コンテクストウィンドウが大きくなったことだ。コンテクストウィンドウとは、AIが一度に処理できるテキストの量を指す。GPT-4 Turboは最大12万8,000トークン(*1)を処理でき、これは約300ページのテキストに相当する。これは現在の大規模言語モデル(LLM)の中でも最大級だ。前世代のGPT-4は8,000トークンまたは24ページと控えめだった。
この大きなコンテクスト・ウィンドウによって、GPT-4 Turboはより多くの情報を深く理解し、より広い文書間のつながりを作ることができる。より多くの文脈を理解することで、AIは最後に読んだ数センテンスにとどまらず、より賢く、よりニュアンスのある応答を提供することができる。拡大された知識は、より首尾一貫した会話と思慮深い分析につながる。
新興AI企業Mirageは、Amanは論文のPDFを入力し、要約を要求すると、すぐさまGPT-4 Turboが要約を出力し始める様子をXに投稿した。
Time to go implement some papers with gpt-4-turbo's 128k context length and ChatGPT's built-in code interpreter! pic.twitter.com/XJ3sHJkvyS
— Aman (@amankishore) November 6, 2023
コスパ良くなる
OpenAIによると、GPT-4 Turboは開発者が使用するコストも安い(*2)。「GPT-4 Turboは、GPT-4と比較して、入力トークン(*3)は3倍安く、出力トークンは2倍安く提供することができる」とサム・アルトマンCEOは言った。
速度検証
初期ユーザーによるGPT-4 TurboとGPT-3.5 Turboの応答速度の検証では、前世代に比べ、かなり改善しているようだ。ただし、Turboは利用者が少ないため、今後一般開放され、負荷が上がった際に速度が低下するかを注視する必要がある。
昨晩発表されたGPT-4 Turbo (1106-preview)とGPT-3.5 Turbo (1106)の速度検証。ツールは自作のプレイグラウンド環境でChat Completion。
— usagimaru ⌘ (@usagimaruma) November 7, 2023
左からGPT-3.5 Turbo / 3.5 Turbo (1106) / 4 / 4 Turbo (1106-preview)。
GPT-4は明らかに高速化され実用的になり、3.5 Turboも亜光速の領域に達しつつある。 pic.twitter.com/jgIFG1CeRo
知識のアップデート
GPT-4 Turboのもう一つの利点は、その知識が2023年4月まで更新されていることだ。より最新の情報によって、モデルは最新の出来事、研究、事実を議論し理解することができる。最新の状態を維持することは、AIアシスタントにとって極めて重要だ。古い知識は、間違った、あるいは無知な返答につながる。
脚注
*1:「トークン」は生のテキストのビットを表す。例えば、「fantastic」という単語は「fan」、「tas」、「tic」に分割される
*2:価格は、1,000入力トークン(~750ワード)あたり0.01ドル、1,000出力トークンあたり0.03ドル。画像処理GPT-4 Turboの価格は画像サイズによって異なる。例えば、1080×1080ピクセルの画像をGPT-4 Turboに渡すと、0.00765ドルかかるとOpenAIは言う。
*3:入力トークンはモデルに入力されるトークン、出力トークンは入力トークンに基づいてモデルが生成するトークン