AIによる音声解析は精神疾患の特定に役立つのか？

AIによる音声解析は精神疾患の特定に役立つか。初期のテストは有望だったが、バイアス、プライバシー、ブラックボックス化したアルゴリズムへの不信感などの問題があり、これが落とし穴になる可能性がある。

吉田拓史

12 4月 2022 — 6 min read

人工知能の研究者の中には、現在、あなたの声の音があなたの精神状態を理解する鍵になるかもしれないと考えている人もいます。初期のテストは有望でしたが、偏見、プライバシー、「ブラックボックス」アルゴリズムへの不信感などの問題が落とし穴になる可能性があります。(Juan Carlos Pagan/The New York Times)

［著者：Ingrid K. Williams］体温や血圧を測るのと同じくらい素早く簡単に、不安障害を確実に特定し、差し迫ったうつ病の再発を予測できる検査を想像してみてください。

医療従事者には、患者の身体的状態を測定するための多くのツールがあるが、精神的な健康を評価するための信頼できるバイオマーカー（患者の外から観察される医学的状態の客観的指標）はない。

しかし、人工知能の研究者の中には、「あなたの声こそが、あなたの精神状態を理解する鍵になるかもしれない」と考える人もいる。その結果、あなたの精神状態を追跡するために設計された一連のアプリやオンラインツール、そして遠隔医療やコールセンターのプロバイダーにリアルタイムのメンタルヘルス評価を提供するプログラムなどが生まれた。

心理学者は、ある種の精神衛生上の問題は、人が何を言うのかだけでなく、どのように言うのかを聞くことによって検出できることを長い間知っていた、とシンシナティ大学医学部の心理学者で助教授のMaria Espinolaは述べている。

うつ病患者の場合、「彼らの話し方は一般的に単調で、より平坦で、よりソフトだ」とEspinolaは述べている。また、音域が狭くなり、音量も小さくなる。より多くのポーズを取る。立ち止まることが多くなる」

不安を抱えた患者さんは、体に緊張を感じるので、声の響きも変わってくるそうだ。「早口になる傾向がある。呼吸がしづらくなる」。

今日、この種の声の特徴は、機械学習研究者によって、うつ病や不安症、さらには統合失調症や心的外傷後ストレス障害といった他の精神疾患の予測に活用されている。ディープラーニング・アルゴリズムを用いると、短い音声記録から、訓練を受けた専門家でも気付かないようなパターンや特徴を発見することができるのだ。

ハーバード大学医学部の助教授で、マサチューセッツ総合病院の臨床心理士であるケイト・ベントレー氏は、「現在使用している技術では、人間の耳でさえ拾い上げることができない、意味のある特徴を抽出することができる」と述べている。

「臨床医が評価する面接や自己報告書のような、従来から用いられている主観的な評価方法を超えて、精神科の診断に関する生物学的あるいはより客観的な指標を見つけることに大きな興奮を覚えている」と彼女は述べている。研究者が追跡している他の手がかりとしては、活動レベルの変化、睡眠パターン、ソーシャルメディアのデータなどがある。

マクマスター大学のニューロフィット・ラボのディレクター、ジェニファー・ハイズ氏（2022年3月12日、カナダ・オンタリオ州ハミルトンの同校で）。ハイツは新著の中で、運動がいかに心の健康を向上させるかについて、個人の体験と最新の科学を融合させている。(Narisa Ladak/The New York Times)

このような技術の進歩は、メンタルヘルスケアの必要性が特に高まっている時期に来ている。全米精神疾患同盟の報告書によると、2020年には米国の成人の5人に1人が精神疾患を経験したという。そして、その数は増え続けている。

この新しい技術を試すために、私はまず、健康技術企業であるSonde HealthのMental Fitnessアプリをダウンロードし、私の倦怠感が何か深刻な兆候なのか、それとも単にぐったりしているだけなのかを確認することから始めた。この無料アプリは、「音声によるメンタルフィットネスの記録と日記を書く製品」と説明されており、最初のチェックインを記録するよう私に促した。30秒間の口頭による日記で、私の心の健康を1から100のスケールでランク付けするものである。

1分後、私は自分のスコアを手に入れた。アプリは「注意してください」と警告した。

アプリは、私の声で検出された活気のレベルが著しく低いことをフラグを立てた。私は静かに話すことを心がけていたので、単調に聞こえたのだろうか？散歩や断捨離で精神的な体力をつけようという提案に耳を傾けるべきだろうか。(このような疑問は、アプリの欠点といえるかもしれない。消費者としては、自分の声のレベルがなぜ変動しているのかを知ることは難しいかもしれない)。

その後、インタビューの間に緊張を感じたので、別の音声分析プログラムをテストした。これは、不安レベルの検出に焦点を当てたものだ。ストレスウェーブテスト（StressWaves Test）は、ヘルスケアと保険の複合企業であるCignaが、AIの専門家であるEllipsis Healthと共同で開発した無料のオンラインツールで、録音した音声の60秒サンプルを使ってストレスレベルを評価するものだ。

「夜、眠れないのはなぜですか？」というのが、このサイトの決まり文句である。私が1分ほどかけてしつこい悩みを打ち明けると、プログラムは私の録音を採点し、メールでお知らせしてくれたのだ。「あなたのストレスレベルは中程度だ」。Sondeのアプリとは異なり、シグナのメールには自己改善のためのヒントが何も書かれていなかった。

カリフォルニア州バークレーに本社を置くKintsugiは、最近シリーズA資金として2,000万ドルを調達した。Kintsugi（金継ぎ）は、壊れた陶器を金脈で補修する日本の習慣にちなんで名づけられた。

ニューヨークのハドソンリバーパークウェイ沿いで運動する人々（2021年12月22日撮影）。ジェニファー・ハイズは新著の中で、運動がいかに心の健康を向上させるかについて、個人の経験と最新の科学を融合させている。(Gabriela Bhaskar/The New York Times)

Kintsugiは、過去にメンタルヘルスケアにアクセスするのに苦労したという共通の経験で意気投合したGrace ChangとRima Seiilova-Olsonによって設立され、テレヘルスやコールセンターのプロバイダー向けに、さらなる支援が必要な患者を特定するための技術を開発している。

金継ぎの音声分析プログラムを使えば、例えば、看護師が、疝痛持ちの乳児を抱える親に、自分の健康状態について尋ねる時間を余分に取るように促されるかもしれない。

このような機械学習技術の開発で懸念されるのは、年齢、性別、民族、国籍などの属性にかかわらず、すべての患者に対して公平にプログラムが機能するかというバイアス（偏り）の問題である。

「機械学習モデルがうまく機能するためには、非常に大規模で多様かつ堅牢なデータセットが必要だ」とチャンは述べ、特にこの問題を防ぐために、金継ぎでは世界中のさまざまな言語で録音された音声を使用したと指摘した。

この新しい分野でのもうひとつの大きな懸念は、プライバシーだ。特に、音声データは個人を特定するために使われる可能性がある、とベントレーは言う。

また、患者が録音に同意した場合でも、同意の問題は二重になっていることがある。音声分析プログラムによっては、患者の精神状態を評価するだけでなく、録音したデータを使って独自のアルゴリズムを開発し、改良することもあるのだ。

もうひとつの課題は、機械学習やいわゆるブラックボックス化したアルゴリズムに対する消費者の潜在的な不信感だ。

UCLAのセメル神経科学・人間行動研究所の臨時所長で精神科医のアレクサンダー・ヤング博士は、AIや機械学習に対して多くの研究者が抱いている懸念、つまりプログラムのトレーニング段階で人間の監視がほとんど行われていないことを繰り返した。

AIによる音声解析は精神疾患の特定に役立つのか？

吉田拓史

Read more

ぐるなび、バーティカルAIエージェントの新アプリ「UMAME!」β版をリリース

AIで企業の情報探索を効率化：Google Agentspaceの全貌

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

宮崎市が実践するゼロトラスト：Google Cloud 採用で災害対応を強化し、市民サービス向上へ