ケンブリッジ大学とアラン・チューリング研究所の研究者は、28万時間以上の手首の加速度計とウェアラブル心電図(ECG)データを用いた研究で、デバイス利用者の行動についてどの程度の情報を把握できるかを調査した。彼らは、個人の健康、体力、人口統計学的特徴に関連する変数を含む、パーソナライズされた情報を70%以上のAUCで取得するために、データセット上で分類器を訓練することに成功したと主張している。

Apple Watchのようなウェアラブル端末のおかげで、人々は目立たずに活動を追跡することができるようになった。しかし、ウェアラブル・センサーは、不整脈、感染症、肥満の発症などの高レベルのイベントではなく、加速度などの低レベルの信号を測定することが多いため、デバイスが記録したデータから意味を抽出することは困難である。機械学習は、ウェアラブル・センサー・データを使用した人間の活動認識タスクにおいて大きな可能性を示しているが、研究のほとんどは、コンパイルや注釈にコストがかかるラベル付きデータセットに依存している。

主著者のケンブリッジ大学の博士候補Dimitris Spathisと教授Cecilia Mascoloらは、Step2Heartと呼ばれるAIシステムを開発した。このシステムは、ウェアラブルデバイスデータのための汎用的な自己監視型特徴抽出器であり、人物固有のプロファイルを生成する(「自己管理型」とは、一般的に行われているような人間の注釈に頼るのではなく、システムがデータにラベルを付けることを意味する)。Step2Heartは、このプロファイルを用いて、伝達学習を用いて健康関連の転帰を分類器で予測する。

このデータセットは、肥満、2型糖尿病、および関連する代謝障害を決定する際の環境要因と遺伝的要因の相互作用を調査するFenland Studyの一環として、35~65歳の男女2,100人から得られたものである。参加者は、心拍数と運動を組み合わせた胸部センサーと手首の加速度計を1週間装着するように求められた。実験室の訪問時には、参加者はトレッドミルテストを行い、最大酸素消費量を測定した。安静時の心拍数も胸部心電図を用いて記録された。

前処理後、Step2Heartが訓練されたデータセットは、センサーと実験室の訪問データの両方を持つ1,506人の参加者にまたがっていた。実験では、血中酸素消費率、身長、体重、性別、年齢、BMI、安静時心拍数、身体活動エネルギー消費量(PAEE)などの様々な要因を予測しようとした。

報告書の共著者は、Step2Heartが性別を0.93のAUC、身長を0.82、PAEEを0.80、体重を0.77で分類することができたと主張している。彼らは、BMI、血中酸素、年齢のようなより困難なメトリクスを0.70前後のAUCで処理したと述べている。しかし、彼らの研究は、データセットの不均衡の潜在的な影響を考慮していないことは注目に値します。研究では、健康アプリケーションのアルゴリズムを訓練するために使用されるデータの多くが、人種、民族、地理的、性別の線に沿った不平等を永続させる可能性があることが示されている。

それにもかかわらず、研究者らは、ラベル付けされていないウェアラブルデータは、根拠となる真実を収集することが不可能な状況で一般化するプロファイルを学習するために使用できることを示していると主張している。「このようなシナリオはモバイルヘルスにおいて非常に重要であり、広く採用されているデバイスで臨床レベルの健康推論を達成できる可能性があります」と共著者は書いている。「私たちの研究は、健康のための機械学習において最も重要なものの一つである伝達学習とパーソナライズされた表現の分野で貢献している」。

参考文献

Cecilia Mascolo et al. Learning Generalizable Physiological Representations from Large-scale Wearable Data. arXiv: 2011.04601.

Photo by Luke Chesser on Unsplash