GPT-4、5年分の日本の医師の国家試験に合格

ワシントン大・札幌心臓血管クリニック・東北大・イェール大学の研究者グループによる未査読論文では、過去5年間にわたる試験で複数の大規模言語モデル(LLM)をテストしたところ、GPT-4は5年分全てに合格した。

GPT-4、5年分の日本の医師の国家試験に合格
Photo by ilgmyzin on Unsplash

ワシントン大・札幌心臓血管クリニック・東北大・イェール大学の研究者グループによる未査読論文では、過去5年間にわたる試験で複数の大規模言語モデル(LLM)をテストしたところ、GPT-4は5年分全てに合格した。

東北大の坂口慶祐准教授、ワシントン大の博士候補生Jungo Kasaiらの研究では、LLMのAPI(ChatGPT、GPT-3、GPT-4)を過去5年間の日本の医師免許試験で評価。坂口らは「GPT-4がChatGPTとGPT-3を上回り、5年分の試験すべてに合格したことが示され、英語とは類型的に離れた言語におけるLLMの可能性が強調された」と書いている。

研究は、今後LLMの改良が進むにつれて、医療支援、教育、評価における非英語AIアプリケーションの可能性を示唆。しかし、坂口らは「日本語(および同様に英語から遠い言語)には、トークン化および国特有のカスタマイズの欠如によるAPIコストの増加およびウィンドウサイズの縮小という大きな制限がある」と課題も指摘している。

合格はしたものの、GPT-4は医学部受験生の多数決の成績を大きく下回っているという。LLMは、安楽死を示唆するなど、日本の医療現場では厳禁とされる選択肢を選ぶことも観測された。

Read more

再生可能エネルギー事業が正念場を迎える[英エコノミスト]

再生可能エネルギー事業が正念場を迎える[英エコノミスト]

数年前、自然エネルギーは太陽(と風)と共にある瞬間を迎えていた。低金利がクリーン電力のコストを引き下げたのだ。クリーン電力は導入コストが高いが、太陽と風によって無料で発電することができる。ソーラーパネルや風力タービンの価格は、技術が成熟し、メーカーが規模を拡大するにつれて下落した。こうした進展により、2010年から2020年の間に、太陽光発電、陸上風力発電、洋上風力発電の単位エネルギーあたりの資本支出と運転コストを考慮した平準化電力コスト(LCOE)は、それぞれ87%、64%、55%低下した(図表1参照)。クリーンエネルギーは汚れた代替エネルギーと競争力を持ち、大企業の電力需要家が開発業者から直接買い取ったのである。 ブルックフィールドやマッコーリーなどのインフラ投資家は、自然エネルギーに大きな賭けをした。BPなどの化石燃料企業も同様だ。欧州ではEDPやイベルドローラ、米国ではAESやネクステラ・エナジーといった公益事業者がプロジェクトに資金を投入した。デベロッパーが投下した資本に対する平均リターンは、2015年の3%から2019年には6%に上昇した。業界の見通しは非常

By エコノミスト(英国)
最強の会社は1on1ミーティングをやらない:エヌビディアの経営術

最強の会社は1on1ミーティングをやらない:エヌビディアの経営術

AIブームをものにし、時価総額1兆ドル超えを達成したNVIDIA(エヌビディア)。創業者でCEOのジェンスン・フアンの経営手法は、1on1ミーティングをやらない、フラットな組織構造、毎日数百通の電子メールを送る、というユニークなものだ。 AIチップで知名度を上げたエヌビディアは、世界で6番目の時価総額を誇り、グローバルで2万6,000人以上の従業員を抱えている。それにもかかわらず、フアンの主なコミュニケーション手段は、毎日数百通の電子メールだと言われている。 米メディアThe New Yorkerによると、その電子メールの文章は非常に短いものという。彼の電子メールを「日本の俳句」に例える幹部もいれば、「身代金要求書」に例える幹部もいる。 「フアンは、固定された部門やヒエラルキーのない、アジャイルな企業構造を好む。社員は毎週、取り組んでいることの中で最も重要な5つのリストを提出する。フアンは夜遅くまでこれらの電子メールを精査しているため、メールの文面が簡潔であることが奨励されている」とThe NewyorkerのStephen Wittは書いた。「フアンはエヌビディアの巨大なキャン

By 吉田拓史