Open AI、新モデルで再び競合を突き放す

OpenAIが今週発表した大規模言語モデル(LLM)のGPT-4 Turboは、主張されている性能が確かならば、競合に対して優位性を見せつけた格好だ。同社はコスト効率と入力拡大で顕著な改善があったと主張した。

Open AI、新モデルで再び競合を突き放す
出典:OpenAI

OpenAIが今週発表した大規模言語モデル(LLM)のGPT-4 Turboは、主張されている性能が確かならば、競合に対して優位性を見せつけた格好だ。同社はコスト効率と入力拡大で顕著な改善があったと主張した。


OpenAIは今週、同社初の開発者会議において、同社の主力製品であるテキスト生成AIモデルGPT-4の改良版であるGPT-4 Turboを発表した。

GPT-4 Turboには2つのバージョンがあり、1つはテキスト分析、もう1つはテキストと画像の両方の文脈を理解するものだ。テキスト分析モデルはAPI経由で限定的な利用者に開放されており、OpenAIによれば「今後数週間のうちに」一般的に利用できるようにする予定だという。

New models and developer products announced at DevDay
GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more.

コンテクストウィンドウの拡大

GPT-4 Turboの大きなアップグレードのひとつは、コンテクストウィンドウが大きくなったことだ。コンテクストウィンドウとは、AIが一度に処理できるテキストの量を指す。GPT-4 Turboは最大12万8,000トークン(*1)を処理でき、これは約300ページのテキストに相当する。これは現在の大規模言語モデル(LLM)の中でも最大級だ。前世代のGPT-4は8,000トークンまたは24ページと控えめだった。

この大きなコンテクスト・ウィンドウによって、GPT-4 Turboはより多くの情報を深く理解し、より広い文書間のつながりを作ることができる。より多くの文脈を理解することで、AIは最後に読んだ数センテンスにとどまらず、より賢く、よりニュアンスのある応答を提供することができる。拡大された知識は、より首尾一貫した会話と思慮深い分析につながる。

新興AI企業Mirageは、Amanは論文のPDFを入力し、要約を要求すると、すぐさまGPT-4 Turboが要約を出力し始める様子をXに投稿した。

コスパ良くなる

OpenAIによると、GPT-4 Turboは開発者が使用するコストも安い(*2)。「GPT-4 Turboは、GPT-4と比較して、入力トークン(*3)は3倍安く、出力トークンは2倍安く提供することができる」とサム・アルトマンCEOは言った。

速度検証

初期ユーザーによるGPT-4 TurboとGPT-3.5 Turboの応答速度の検証では、前世代に比べ、かなり改善しているようだ。ただし、Turboは利用者が少ないため、今後一般開放され、負荷が上がった際に速度が低下するかを注視する必要がある。

知識のアップデート

GPT-4 Turboのもう一つの利点は、その知識が2023年4月まで更新されていることだ。より最新の情報によって、モデルは最新の出来事、研究、事実を議論し理解することができる。最新の状態を維持することは、AIアシスタントにとって極めて重要だ。古い知識は、間違った、あるいは無知な返答につながる。

脚注

*1:「トークン」は生のテキストのビットを表す。例えば、「fantastic」という単語は「fan」、「tas」、「tic」に分割される

*2:価格は、1,000入力トークン(~750ワード)あたり0.01ドル、1,000出力トークンあたり0.03ドル。画像処理GPT-4 Turboの価格は画像サイズによって異なる。例えば、1080×1080ピクセルの画像をGPT-4 Turboに渡すと、0.00765ドルかかるとOpenAIは言う。

*3:入力トークンはモデルに入力されるトークン、出力トークンは入力トークンに基づいてモデルが生成するトークン

Read more

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

Fastlyは、LLMのAPI応答をキャッシュすることで、コスト削減と高速化を実現する「Fastly AI Accelerator」の提供を開始した。キップ・コンプトン最高プロダクト責任者(CPO)は、類似した質問への応答を再利用し、効率的な処理を可能にすると説明した。さらに、コンプトンは、エッジコンピューティングの利点を活かしたパーソナライズや、エッジにおけるGPUの経済性、セキュリティへの取り組みなど、FastlyのAI戦略について語った。

By 吉田拓史
宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラスト セキュリティ 実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

By 吉田拓史
​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史