生成AIは希少疾患の研究を加速させる

希少疾患を専門とする医師は、多様な医療データの欠如に苦しんでいる。しかし、昨年ブームとなった「テキストから画像を生成するAI」は、医療でも革命を起こすかもしれない。

生成AIは希少疾患の研究を加速させる
スタンフォード大学の人間中心型人工知能研究所(HAI)。

希少疾患を専門とする医師は、多様な医療データの欠如に苦しんでいる。しかし、昨年ブームとなった「テキストから画像を生成するAI」は、医療でも革命を起こすかもしれない。


胸部放射線科医であり、スタンフォード大学医学・イメージングAIセンター(AIMI)のポスドク研究員で、過去7年間希少な肺疾患を研究してきたChristian Bluethgenは、スタンフォード大学工学部の計算数理工学研究所(ICME)の大学院生でAIMIの機械学習(ML)研究者であるPierre Chambonとチームを組み、最も一般的な医療画像である胸部X線の生成にStable Diffusionの能力を拡張しようとする研究を設計した。

Stable DiffusionはStability AIが昨年8月に公表したテキスト画像生成モデルであり、Midjourneyとともに拡散モデルへの世間の注目を引き上げた。このモデルは通常、一般の人が芸術作品を作るために使用するもので、医療をサポートするものではなかった。しかし、今回の「生成画像」は十分に高品質であるため、画像データセットが貧弱で臨床研究を推進できない場合に、この技術を代用することができるかもしれない。

Bluethgenらは、彼らの最高性能のモデルが実物そっくりの肺の「異常」を生成し、そのような所見の検出で95%の精度を達成したと述べている。生成された画像の有効性の評価は、定量的な画質評価指標と、条件付きテキストプロンプトの臨床的内容を正確に表現する放射線科医主導の定性的評価を用いて行われた。

この研究は、過去の研究に基づいているが、胸部画像の潜在的な拡散モデルを検討した最初の研究であり、医療画像を生成するための新しいStable Diffusionを検討した最初の研究でもある。より広範な研究、希少疾病の理解、さらには新しい治療法の開発につながる有望なブレークスルーかもしれない。

図1:放射線画像におけるオリジナルの安定拡散モデルと研究チームが微調整したモデルによる生成画像。プロンプトは、特に所見のない標準的な放射線画像と、頻繁に遭遇する所見である「胸水」(赤矢印)を挿入して比較するように設計されている。
図1:放射線画像におけるオリジナルの安定拡散モデルと研究チームが微調整したモデルによる生成画像。プロンプトは、特に所見のない標準的な放射線画像と、頻繁に遭遇する所見である「胸水」(赤矢印)を挿入して比較するように設計されている。
 図2:モデルの微調整に用いたオリジナルのCXR(左)と、U-netで微調整したStable Diffusionパイプラインのテキストコンディショニングにより生成された合成CXR(右)。
図2:モデルの微調整に用いたオリジナルのCXR(左)と、U-netで微調整したStable Diffusionパイプラインのテキストコンディショニングにより生成された合成CXR(右)。

Bluethgenらは、論文で「大規模な事前学習済み基礎モデルの表現能力を医療概念に拡張すること、特に拡散モデルを活用して医療画像で見られるドメイン固有の画像を生成すること」が研究の目的だとしている。

「胸部X線のモデルを学習させたのは私たちが初めてではありませんが、以前は専用のデータセットを使って、非常に高い計算能力を必要としました」とChambonは スタンフォード大学の人間中心型人工知能研究所(HAI)の取材に対して説明した。「このような障壁が、多くの重要な研究を妨げているのです。私たちは、このアプローチをブートストラップして、既存のオープンソースの基礎モデルをわずかな調整で使用できるかどうかを確かめたかったのです」

参考文献

  1. Pierre Chambon, Christian Bluethgen, Curtis Langlotz, Akshay Chaudhari, “Adapting Pretrained Vision-Language Foundational Models to Medical Imaging Domains.” arXiv, Oct. 9, 2022. DOI: https://doi.org/10.48550/arXiv.2210.04133

Read more

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史