「ジェネラリストな医療AI」という夢のような提案

科学誌『Nature』で非常に広範な医療タスクを行えるジェネラリストな人工知能(AI)が提案された。患者とのやり取りによる情報収集から、医師の臨床での意思決定支援まで、広範に渡る応用を行うAIだ。AlphaFoldによるタンパク質の立体構造予測以来、医学界はAI応用の激流の中にいる。

「ジェネラリストな医療AI」という夢のような提案
Photo by ZHENYU LUO on Unsplash

科学誌『Nature』で非常に広範な医療タスクを行えるジェネラリストな人工知能(AI)が提案された。患者とのやり取りによる情報収集から、医師の臨床での意思決定支援まで、広範に渡る応用を行うAIだ。AlphaFoldによるタンパク質の立体構造予測以来、医学界はAI応用の激流の中にいる。


スタンフォード、ハーバードなどの研究者らは、『Nature』誌の4月12日号で、医療用AIの新しいパラダイムである「ジェネラリスト医療人工知能(Generalist medical artificial intelligence: GMAI)」を提案した[1][2]。

これは、多くの医療アプリケーションとデータタイプにわたって知識豊富で柔軟で再利用可能な、新しい種類の医療AIモデルであるという。

研究者らは、GMAIモデルは、タスク固有のラベル付けされたデータをほとんど、あるいは全く使わずに、多様なタスクを実行することができるようになる、と予想。GMAIは、大規模で多様なデータセットを自己監視することによって構築され、画像、電子カルテ、検査結果、ゲノム、グラフ、医療テキストなどのデータを含む、医療モダリティのさまざまな組み合わせを柔軟に解釈することができると想定している。

GMAIが画像、電子カルテ、検査結果、ゲノム、医療テキストなどのさまざまなデータの組み合わせで、ChatGPTのようなモデルの能力をはるかに超えて解釈できるようになると論文は主張した。これらのGMAIモデルは、音声による説明、推奨事項の提示、スケッチの描画、画像の注釈を行う予定だ。

そして、そのモデルは、フリーテキストによる説明、音声による推奨、画像注釈など、高度な医療推論能力を示す表現豊かなアウトプットを生成すると研究者らは考えている。

a) GMAIモデルは、自己教師付き学習などの手法により、複数の医療データモダリティで学習される。柔軟なインタラクションを可能にするために、画像やEHRからのデータなどのデータ様式は、テキストや音声データのいずれかの形で言語とペアリングすることができる。次に、GMAIモデルは、様々な医療知識のソースにアクセスして医療推論タスクを実行し、下流のアプリケーションで使用できる豊富な能力を引き出す必要がある。こうして出来上がったGMAIモデルは、ユーザーが指定したタスクをリアルタイムで実行する。このとき、GMAIモデルはナレッジグラフやデータベースなどのソースからコンテキスト情報を取得し、正式な医学知識を活用して、以前は見られなかったタスクを推論することができる。 b) GMAIモデルは、臨床分野にわたる多くのアプリケーションの基礎を築くが、それぞれ慎重に検証し規制上の評価を必要とする。
a) GMAIモデルは、自己教師付き学習などの手法により、複数の医療データモダリティで学習される。柔軟なインタラクションを可能にするために、画像やEHRからのデータなどのデータ様式は、テキストや音声データのいずれかの形で言語とペアリングすることができる。次に、GMAIモデルは、様々な医療知識のソースにアクセスして医療推論タスクを実行し、下流のアプリケーションで使用できる豊富な能力を引き出す必要がある。こうして出来上がったGMAIモデルは、ユーザーが指定したタスクをリアルタイムで実行する。このとき、GMAIモデルはナレッジグラフやデータベースなどのソースからコンテキスト情報を取得し、正式な医学知識を活用して、以前は見られなかったタスクを推論することができる。 b) GMAIモデルは、臨床分野にわたる多くのアプリケーションの基礎を築くが、それぞれ慎重に検証し規制上の評価を必要とする。

これは、機械学習(ML)の医療における応用範囲が医療画像だけの制約されたフェーズが終わることを意味するという。電子カルテ、センサー、画像、ラボ、ゲノム、生物学的レイヤーのデータ、そしてあらゆる形態のテキストや音声からなる全幅のデータへと拡張される。知識のドメインには、出版物、書籍、文献のコーパス、エンティティのネットワーク関係(知識グラフ)などがある。

「これまでのヘルスケアにおけるAIは、狭く、単一モダルで、単一タスクであった。500以上のFDAが認可または承認したAIアルゴリズムについては、ほぼすべてが1またはせいぜい2タスクのためのものだった」と著者の一人である心臓病学者のEric Topolは書いている。

「それを超えるためには…マルチモーダルなデータを取り込むことができるモデルが必要だった。Transformerモデルアーキテクチャ、GPU、教師あり学習、大規模なマルチモーダルデータの入力など、これらの構成要素が最終的に今日の状況につながっている。GPT-4は最も先進的な大規模言語モデル(LLM)であり、私たちはまだ初期段階にいる」

a) GMAIは多用途な臨床での意思決定支援を可能にする。 b)根拠となる放射線診断報告書には、各所見を可視化するためのクリック可能なリンクが備わっている。 c) GMAIはモデル開発中にこれまで遭遇しなかった現象を分類する可能性がある。拡張された手順では、医療分野の知識と形状的な文脈を活用することで、稀な異常所見を段階的な推論で説明することができる。 出典:Moor et al(2023). CC BY 3.0.
a) GMAIは多用途な臨床での意思決定支援を可能にする。 b)根拠となる放射線診断報告書には、各所見を可視化するためのクリック可能なリンクが備わっている。 c) GMAIはモデル開発中にこれまで遭遇しなかった現象を分類する可能性がある。拡張された手順では、医療分野の知識と形状的な文脈を活用することで、稀な異常所見を段階的な推論で説明することができる。 出典:Moor et al(2023). CC BY 3.0.

論文は、患者とのやり取りによる情報収集から、医師の臨床での意思決定支援まで、GMAIで様々なユースケースに取り組むことができると説明している。

放射線科では、患者の病歴を考慮しながら、異常箇所を視覚的に指摘する放射線診断書を作成することができる。放射線科医は、GMAIモデルとチャットすることで、症例に対する理解を深めることができる。「前の画像にはなかった新しい多発性硬化症の病変を強調できますか?」というふうに。

論文の中で科学者たちは、GMAIを信頼できる技術に発展させるために必要な追加の要件と機能を説明した。このモデルは、個人的な医療データや過去の医療知識をすべて収集し、その利用を許可したユーザーと対話するときにのみ、それらを参照できるようにする必要があると指摘している。そして、看護師や医師のように患者と会話し、新たな証拠やデータを収集したり、さまざまな治療計画を提案したりできる必要がある。

今後の開発への懸念

共著者らは研究論文の中で、1,000の医療課題をこなすモデルが、さらに多くのことを学習する可能性があることの意味を取り上げている。「医療におけるジェネラリストモデルの最大の問題は、検証だと考えています。そのモデルが正しいこと、そして単なる作り話でないことをどうやって確認するのでしょうか?」とLeskovecはスタンフォード・ニュースに対して言っている。

彼らは、ChatGPT言語モデルの欠陥がすでに発見されていることを指摘している。「しかし、AIシステムが生死を左右するような重大なシナリオがある場合、検証は本当に重要になります」とMoorは言う。

注釈

[1]Moor, M., Banerjee, O., Abad, Z.S.H. et al. Foundation models for generalist medical artificial intelligence. Nature 616, 259–265 (2023). https://doi.org/10.1038/s41586-023-05881-4

[2]スタンフォード大学工学部のコンピュータサイエンス教授であるJure Leskovec、同工学部の博士研究員であるマイケル・ムーア、ハーバード大学のOishi BanerjeeとPranav Rajpurkar、イェール大学のHarlan Krumholz、トロント大学のZahra Shakeri Hossein Abad、Scripps Research Translational InstituteのEric Topolらの研究

Read more

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

Fastlyは、LLMのAPI応答をキャッシュすることで、コスト削減と高速化を実現する「Fastly AI Accelerator」の提供を開始した。キップ・コンプトン最高プロダクト責任者(CPO)は、類似した質問への応答を再利用し、効率的な処理を可能にすると説明した。さらに、コンプトンは、エッジコンピューティングの利点を活かしたパーソナライズや、エッジにおけるGPUの経済性、セキュリティへの取り組みなど、FastlyのAI戦略について語った。

By 吉田拓史
宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

宮崎市が実践するゼロトラスト:Google Cloud 採用で災害対応を強化し、市民サービス向上へ

Google Cloudは10月8日、「自治体におけるゼロトラスト セキュリティ 実現に向けて」と題した記者説明会を開催し、自治体向けにゼロトラストセキュリティ導入を支援するプログラムを発表した。宮崎市の事例では、Google WorkspaceやChrome Enterprise Premiumなどを導入し、災害時の情報共有の効率化などに成功したようだ。

By 吉田拓史
​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

​​イオンリテール、Cloud Runでデータ分析基盤内製化 - 顧客LTV向上と従業員主導の分析体制へ

Google Cloudが9月25日に開催した記者説明会では、イオンリテール株式会社がCloud Runを活用し顧客生涯価値(LTV)向上を目指したデータ分析基盤を内製化した事例を紹介。従業員1,000人以上がデータ分析を行う体制を目指し、BIツールによる販促効果分析、生成AIによる会話分析、リテールメディア活用などの取り組みを進めている。

By 吉田拓史
Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Geminiが切り拓くAIエージェントの新時代:Google Cloud Next Tokyo '24, VPカルダー氏インタビュー

Google Cloudは、年次イベント「Google Cloud Next Tokyo '24」で、大規模言語モデル「Gemini」を活用したAIエージェントの取り組みを多数発表した。Geminiは、コーディング支援、データ分析、アプリケーション開発など、様々な分野で活用され、業務効率化や新たな価値創出に貢献することが期待されている。

By 吉田拓史