ファイザーとIBMの研究者たちは、アルツハイマー病の症状が出る何年も前に予測できる機械学習技術を開発したと主張している。臨床的な音声テストから得られた小さなサンプルの言語データを分析することで、認知的に健康な人たちを対象にテストを行ったところ、71%の精度を達成したという。

IBMリサーチとファイザーが開発した新しいAIモデルは、短い標準化された音声テストを用いて、健康な人の中でアルツハイマー病の最終的な発症を0.7の精度と0.74のAUC(曲線下面積)で予測することに成功した、と主張している。

このモデルは、自然言語処理を使用して、臨床的に投与された短時間の認知テストからの1~2分の音声サンプルを分析する。これらの短いサンプルの言語データは、1948年以来、5,000人以上の人々とその家族の健康の様々な側面を追跡してきた長期的な研究であるFramingham Heart Studyから提供されたものだ。

IBMは以前、AIを使って、アルツハイマー病に関連した記憶障害が明らかになる前に変化するペプチドであるアミロイドβの濃度を予測できるタンパク質を特定する研究を行っていた。

また、IBM以外にも、アルツハイマー病や認知症の特徴を見抜くAIの能力を調査している企業もある。例えば、臨床研究のためのソフトウェア・ツールを設計する新興企業であるUnlearn.AIの研究者は最近、患者が経験するであろう症状を予測し、病気の進行を予測することができるシステムをまとめた論文を発表した。カリフォルニア大学バークレー校の研究者が共著した別の論文では、臨床診断の6年前までの脳スキャンから表向きはアルツハイマー病を予測できるAIシステムについて説明している。

しかし、IBMとファイザーは、この最新の研究は、これまでの研究や、アルツハイマー病の予測を助けるためのAIの応用とは「大きく異なる」と主張している。認知機能障害の兆候を示す被験者に焦点を当てて発症を予測する研究とは対照的に、研究者たちは、被験者が最初の認知機能障害の兆候を経験する前に採取したサンプルを用いて研究を行った。また、高リスク群や遺伝的素因を持つ人々だけに焦点を当てるのではなく、一般集団におけるアルツハイマー病のリスクを評価することにも焦点を当てている。アルツハイマー病は、家族歴のない人や他の危険因子を持つ人も含め、幅広い層に影響を及ぼす可能性があるため、このような幅広い研究が重要であると考えたという。

この研究には270人の参加者から703人のサンプルが含まれており、そのうち半数は85歳以前にアルツハイマー病の症状を発症していた(軽度のアルツハイマー病と診断されるまでの平均期間は約7年半であった)。言語の観点から、研究者たちはスペルミス、句読点の使用、大文字小文字の区別、動詞、語彙の豊富さ、反復性を含む87以上の変数を考慮した。さらに、年齢、性別、学歴、視覚空間的推論および実行推論、物体の命名、記憶、注意力、抽象化、モントリオール認知評価検査(MOCA)のテスト結果を調べた。

IBMとファイザーのチームは、参加者のサンプルの書き起こしを自然言語処理で分析し、AIを活用して、他の方法では見逃してしまうかもしれない言説の機微や変化を拾い上げることができた。そして、ボストン大学の機関審査委員会から同意と承認を得た後、彼らは、心血管疾患の疫学とリスクを調査するために米国公衆衛生局によって監督されている人口ベースの研究であるフラミンガム心臓研究の元の被験者(およびその子孫と配偶者)からのデータを使用した。フラミンガム研究では、登録された人々は、4年ごとに2分間のMini-Mental State Examinationの音声テストで評価され、家族から認知機能の低下の可能性が報告された場合には、毎年神経心理学的検査が行われている。

これらのステップにより、他の研究で使用されたものよりも大規模なデータセットが得られ、実生活の結果を用いて予測を検証することが可能となった。例えば、IBMとファイザーの共著者が開発したモデルが、65歳のフラミンガムの被験者が85歳までにアルツハイマー病を発症すると予測した場合、その被験者の記録を調べて、その被験者がアルツハイマー病と診断されたかどうかと、その診断がいつ行われたかを調べることができた。

研究では、病気を診断するためのアルゴリズムを訓練するために使用されるデータの多くが不平等を永続させる可能性があることが示されている。最近、英国の科学者チームは、ほとんどすべての目の病気のデータセットが北米、ヨーロッパ、中国の患者から得られたものであることを発見した。別の研究では、スタンフォード大学の研究者は、AIの医療利用に関わる研究のための米国のデータのほとんどは、カリフォルニア州、ニューヨーク州、マサチューセッツ州のデータであると主張している。

実際、研究者たちは自分たちのモデルの中にバイアスがかかっている証拠を発見し、大学の学位を持っている人よりも大学の学位を持っていない人の方がアルツハイマーの発症を正確に予測した(76%対70%)。また、男性よりも女性の方が精度が高く(83%対64%)、男性よりも女性の方が平均2.61倍優れていた。

「最終的には、この研究が、臨床家が個人のアルツハイマー病のリスクを評価し、早期介入につなげるための、シンプルでわかりやすく、利用しやすい指標の開発につながることを願っている」とIBM ResearchのPrincipal Research Staff MemberのGuillermo Cecchi声明の中で書いている。

IBMとファイザーの研究者は、このことを認識しており、研究を継続していく中で、対象者の地理的、社会経済的、人種的多様性を拡大したデータセットを使用する予定であると述べている。「このような幅広いデータは、病気の予測という点では非常に難しいことが多く、それにアクセスすることで、これらのモデルを正確に訓練することができた」と、彼らはブログの投稿で書いている。私たちは、プライバシー、透明性、同意というコアとなる原則を常に尊重しながら、アルゴリズムのトレーニングを続けていく」。

チームは、『The Lancet eClinicalMedicine』誌に掲載された彼らの研究が最終的に本番システムに到達した場合、医師がより複雑で要求の厳しい精神医学的評価、検査、モニタリングの必要性を判断するのに役立つと考えている。また、病気を発症する可能性が高いと判断されたものは、予防治療のための試験に入ることができるため、より成功した臨床試験への扉を開く可能性がある、と主張している。