英国に本拠地を置くデジタル・ヘルスケア・プロバイダーであるバビロン・ヘルスの研究者Anish Dhir とCiarán Lee は、異なるデータ・セット間の因果関係を見つけるための手法を考え出した。これにより、手つかずの医療データの大規模なデータベースを原因と効果を掘り起こすことが可能になり、新たな因果関係の発見が可能になるかもしれない。

バビロン・ヘルスは、チャットボットをベースにしたアプリを提供しており、暫定的な診断と治療に関するアドバイスを回答する前に、症状をリストアップするように求めている。その目的は、実際に医師の診察を必要としない人々をフィルタリングすることだ。原則として、このサービスは患者の時間と医師の時間の両方を節約し、過労な医療専門家が最も必要としている人を助けることを可能にする。

しかし、このアプリは批判の的になっている。例えば、重篤な病気の兆候を見逃してしまうことがあると医師たちは警告している。他にもAdaやYour.MDなどいくつかの企業がチャットボットによる診断を提供しているが、バビロン・ヘルスはその主張が誇張されているため、一部では批判の対象となっている。例えば、2018年に同社は、AIが人間の医師よりも優れた病状を診断できると発表した。数カ月後の『The Lancet』誌に掲載された研究では、これは真実ではないというだけでなく、「著しく悪いパフォーマンスを発揮するかもしれない」と結論づけられた。

それでも、Dhir と Lee の因果関係のリンクの新しい仕事は真剣に取られるに値する。この研究は査読を経て、今週ニューヨークで開催される人工知能学会で発表される予定である。原理的には、この技術は、バビロン・ヘルスが提供するサービスを強化する可能性がある。

医療データの因果関係を特定する能力は、そのチャットボットの背後にある診断AIを向上させるだろう。隠れた相関関係ではなく、根本的な原因と効果を指摘することで回答を正当化することで、アプリへの信頼感を高めることができるはずだと、ロンドン大学のユニバーシティ・カレッジで機械学習と量子コンピューティングに取り組んでいる Lee はいう。「ヘルスケアはリスクの高い分野です。ブラックボックスを展開したくはありません」。

2人はすぐに、ゼロから始めなければならないことに気付きました。"調べてみると、誰もこの問題を本当に解決していないことがわかりました」と Lee は言います。課題は、共通の変数を共有する複数のデータセットを融合させ、結合されたデータから原因と結果に関する情報をできるだけ多く抽出することだ。

この方法は機械学習を使わず、代わりに量子暗号にヒントを得たもので、数式を使って誰も会話を盗み聞きしていないことを証明することができる。Dhir と Lee は、データセットを会話として扱い、それらのデータセットに因果関係のある方法で影響を与える変数を盗聴者として扱う。量子暗号の数学を使って、彼らのアルゴリズムは、これらの影響が存在するかどうかを特定することができる。

彼らは、乳房腫瘍の大きさと質感を測定する2つのセットなど、因果関係がすでに知られているデータセットでシステムをテストした。AIは、サイズとテクスチャーは互いに因果関係を持たないが、両方とも腫瘍が悪性か良性かによって決定されることを正しく発見した。

生データが利用可能であれば、臨床研究と同様に、彼らのアルゴリズムは変数間の因果関係を特定することができると2人は主張している。新たに無作為化比較試験を実施して原因を探すのではなく、既存のデータを用いて原因を特定することができるかもしれない。

Lee は、人々を説得する必要があることを認め、アルゴリズムが少なくとも最初は臨床試験を補完するために使用され、おそらく研究のために潜在的な因果関係を強調することによって、研究のために使用されることを期待している。しかし、米国食品医薬品局のような公的機関は、すでに相関関係のみを示す試験に基づいて新薬を承認している。「薬物が無作為化比較試験を通過する方法は、これらのアルゴリズムを使用するよりも説得力がない」。

Photo by Fredy Jacob on Unsplash