GPT-4、5年分の日本の医師の国家試験に合格

ワシントン大・札幌心臓血管クリニック・東北大・イェール大学の研究者グループによる未査読論文では、過去5年間にわたる試験で複数の大規模言語モデル（LLM）をテストしたところ、GPT-4は5年分全てに合格した。

編集部

04 4月 2023 — 1 min read

東北大の坂口慶祐准教授、ワシントン大の博士候補生Jungo Kasaiらの研究では、LLMのAPI（ChatGPT、GPT-3、GPT-4）を過去5年間の日本の医師免許試験で評価。坂口らは「GPT-4がChatGPTとGPT-3を上回り、5年分の試験すべてに合格したことが示され、英語とは類型的に離れた言語におけるLLMの可能性が強調された」と書いている。

研究は、今後LLMの改良が進むにつれて、医療支援、教育、評価における非英語AIアプリケーションの可能性を示唆。しかし、坂口らは「日本語（および同様に英語から遠い言語）には、トークン化および国特有のカスタマイズの欠如によるAPIコストの増加およびウィンドウサイズの縮小という大きな制限がある」と課題も指摘している。

合格はしたものの、GPT-4は医学部受験生の多数決の成績を大きく下回っているという。LLMは、安楽死を示唆するなど、日本の医療現場では厳禁とされる選択肢を選ぶことも観測された。

ぐるなび、バーティカルAIエージェントの新アプリ「UMAME!」β版をリリース

飲食店情報サービス大手のぐるなび（本社・東京）は1月20日、次世代飲食ビジネスの基盤構築をめざす「ぐるなびNextプロジェクト」の初成果として、新たな飲食店探索アプリ「UMAME!（うまみー！）」のβ版を公開した。

AIで企業の情報探索を効率化：Google Agentspaceの全貌

近年、AI技術の進化は目覚ましく、ビジネスの現場でも様々な形で活用が進んでいる。そのような中、Google Cloudが新たに発表したGoogle Agentspaceは、いま注目を集めるAIエージェントがエンタープライズITを大きく変革する予兆と言えるだろう。

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

Fastlyは、LLMのAPI応答をキャッシュすることで、コスト削減と高速化を実現する「Fastly AI Accelerator」の提供を開始した。キップ・コンプトン最高プロダクト責任者（CPO）は、類似した質問への応答を再利用し、効率的な処理を可能にすると説明した。さらに、コンプトンは、エッジコンピューティングの利点を活かしたパーソナライズや、エッジにおけるGPUの経済性、セキュリティへの取り組みなど、FastlyのAI戦略について語った。

宮崎市が実践するゼロトラスト：Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラストセキュリティ実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

Read more

ぐるなび、バーティカルAIエージェントの新アプリ「UMAME!」β版をリリース

AIで企業の情報探索を効率化：Google Agentspaceの全貌

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

宮崎市が実践するゼロトラスト：Google Cloud 採用で災害対応を強化し、市民サービス向上へ