MITコンピュータサイエンス・人工知能研究室(CSAIL)のチームは、ある種の心不全を予測するためにX線を分析できるAIシステムを開発したと主張している。肺水腫として知られる肺の過剰な水分の兆候を検出することで、心不全の重症度を4段階の尺度で半分以上の時間で正確に定量化できると研究者らは言う。

米国疾病対策予防センターによると、米国では毎年、死亡者の約12.5%が心不全が原因であるという。急性心不全の最も一般的な警告サインの1つは浮腫である。しかし、これらの判断は難しく、臨床医はX線の微妙な特徴に頼らなければならず、診断や治療計画に矛盾が生じることもある。

この課題を克服するために、CSAILチームは、大量の胸部X線写真とそれに関連する放射線検査報告書から、限られた数の浮腫の重症度ラベルと報告書の「感想」「所見」「結論」「勧告」「最終報告」の各セクションのテキストを共同学習するAIモデル開発した(重症度ラベルの範囲は0~3で、3は最も重篤な状態を示す)。推論時には、モデルは入力画像を与えられた浮腫の重症度を計算し、報告書自体からの予測も行う。

AIシステムのアーキテクチャを示す図。 Image Credit: MIT CSAIL

このシステムは、放射線科医のユニークな書き方を考慮して、さまざまなトーンとさまざまな専門用語に対応できるように設計されなければならなかった。これを実現するために、研究者らは一連の言語的規則と代用法を開発し、浮腫の重症度のラベルがない報告書であっても、データが報告書間で一貫した状態で分析できるようにした。

モデルのトレーニングでは、オープンソースのMIMIC-CXRデータセットからデータを取得した。このデータセットには、227,835件の放射線検査報告書に関連する377,110件以上の胸部X線写真が含まれている。関連ファイルから重症度ラベルを抽出し、他の疾患プロセスのキーワードをフィルタリングし、ラベル抽出をうっ血性心不全患者に限定した後、247,425組の画像とテキストのペアからなるトレーニングデータセットが得られた。

モデルを評価するために、研究者たちは数百組の画像とテキストのペアをランダムに選択し、理事会認定の放射線科医と領域の専門家にレポートのラベルをレビューして修正してもらった。画像とテキストの両方でトレーニングを行ったところ、レベル3の肺水腫を分類する際に90%の精度を達成し、レベル1とレベル2の水腫を分類する際にはそれぞれ82%と81%の精度を達成した。

ベス・イスラエル・ディーコネス・メディカル・センター(BIDMC)と医療機器メーカー・フィリップスとの共同研究で、チームは今秋、BIDMCの救急室のワークフローにシステムを統合する予定だ。4人の放射線科医のチームによって合意された重症度ラベルのアノテーションが、将来の機械学習開発のベンチマークとなる普遍的な基準となることを期待している。

「私たちのモデルは、画像とテキストの両方をコンパクトな数値抽象化し、そこから解釈を導き出すことができる」と、博士課程の学生で共著者のGeeticka Chauhan氏は述べている。「私たちは、X線画像の表現と放射線検査報告書のテキストの差を最小にするように訓練し、報告書を画像の解釈を改善するために使用した...これらの相関関係は、大規模なX線画像と報告書のデータベースからの検索を改善し、回顧的な分析をより効果的にするために価値があるでしょう」。

さらに、チームのシステムは、レポートのどの部分とX線画像のどの領域がモデル予測に対応しているかを示すことで、自分自身を「説明」することもできた。Chauhan氏は、この分野での将来の研究により、より詳細な下位レベルの画像とテキストの相関関係が提供され、臨床医が画像、レポート、疾患ラベル、関連する相関領域の分類法を構築できるようになることを期待している。

本研究は、MIT Deshpande Center for Technological Innovation、MIT Lincoln Lab、National Institutes of Health、Philips、武田薬品、Wistron Corporationの支援を受けている。

Photo by Jonathan Borba on Unsplash