Nvidia、AIを搭載した遠隔医療用音声転写システムを発表

14日に開催された「Machine Intelligence in Medical Imaging 2020」のカンファレンスで、Nvidiaの研究者は、臨床患者の音声をキャプチャして書き写すAIシステムを説明する論文を発表した。このシステムは、臨床用語を識別し、標準化された健康データベース内の用語をマッピングする。

Nvidia、AIを搭載した遠隔医療用音声転写システムを発表

14日に開催された「Machine Intelligence in Medical Imaging 2020」のカンファレンスで、Nvidiaの研究者は、臨床患者の音声をキャプチャして書き写すAIシステムを説明する論文を発表した。このシステムは、臨床用語を識別し、標準化された健康データベース内の用語をマッピングする。

共著者たちは、コロナウイルスのパンデミックの間に前例のない需要を示してきた分野であるこのシステムの潜在的な使用法の一つとして遠隔医療を提案している。フロスト&サリバンの調査によると、3月には、仮想健康相談は50%増加し、一般的なオンライン医療訪問は今年2億件を突破するコースにあるという。

現在の研究は遠隔医療のための転写に焦点を当てているが、将来的には、この技術の他の医療分野への応用も考えられる。

NVIDIAの研究者であるHoo-Chang ShinはMobiHealthNewsに「この特定の技術は、大規模なバイオメディカルテキストを対象に訓練されたが、放射線科医のレポートのような大量の臨床ノートがあれば、それらを対象に訓練された言語処理は、放射線科医のレポートを認識する上で非常に優れたものになるだろう」と語っている。「放射線科医の報告書を書き写すのに非常に優れており、名前のついた実体や病名、あるいは予定されている治療法などをさらに認識することができる」。

NVIDIAの研究者は、患者がより多くの情報とメモを持って遠隔医療の診察を終えるのを助ける方法として、これを売り込んでいる。

このプロジェクトの主任研究員を務めたShinは、3歳の娘が潜在的に危険な虫刺されになったときに遠隔医療を利用した例を挙げた。

「医者はウェブ上で娘の足を見せろと言ってきた。私は片手でウェブカメラを持ち、もう片方の手で娘の腫れた足を持っていました」とShinはカンファレンスの発表で語った。「彼は娘の足を見ながら、どんな虫に刺されたのか、感染した部分にどんな薬を塗るべきか、これ以上腫れないようにするにはどんな薬を飲むべきかなど、起こりうることを話していた。あっという間でした。私の両手はウェブカメラと娘の足で縛られていたので、メモすることはできなかった」。

Shinは技術に精通した背景から来ているが、モナ・フローレス博士、NVIDIAの医療AIのグローバルヘッドは、このツールは、技術的な背景の少ない患者にとって最も効果的である可能性があると主張した。

「あなたは、80歳の老人が同じことをしようとしていて、彼らが必要とするすべてのものを収集し、文書化し、何が起こったかを覚えていて、行って質問をしたり、愛する人や家族と医師から学んだことを共有したりするのがどれほど難しいかを想像することができる」と彼女はMobiHealthNewsに語った。「このようなプラットフォームは、技術的に困難であればあるほど、非常に有用であることをイメージすることができる... あなたはメモを取ることを心配する必要はない。あなたが医師であろうと、あるいは患者であろうと、起こったことの忠実な書き起こしに戻ってくることができ、自分のペースでそれを摂取することができる」。

自己教師あり学習の採用

研究者のシステムの中核をなすのは、テキストデータセット上で自己教師あり学習の方法で事前に訓練されたBERTベースの言語モデルである(自己教師あり学習とは、ラベルデータを提供せずにタスクを実行するモデルを訓練する手段である)。3億4,500万個のパラメータ(モデル内部の構成変数)を持つモデルBio-Megatronは、生命科学トピックの抄録検索エンジンPubMedから抽出された61億語からパターンを摂取して学習した。

このモデルは、事前訓練の後、旧国立衛生研究所(NIH)の資金提供を受けた国立生物医学計算センターとの契約により作成された臨床自然言語処理データセット上で微調整された。このデータセットは、NIHの国立医学図書館が開発したオントロジーであるUnified Medical Language System(UMLS)の概念と単語を照合し、単語の識別を行う自動音声認識コンポーネントに組み込まれた。

Nvidia V100およびT4グラフィックスカード上での実験では、精度とリコールを考慮した場合、Bio-Megatronは1ミリ秒の処理で92.05%の精度を達成したと研究者らは報告している。「これは、患者、臨床医、研究者への対応が最重要視されるシステムにおいて、重要な新機能を開くものだ...臨床会話から重要な臨床概念を抽出し、関連付けることができる自動音声認識モデルは非常に有用だ。私たちの貢献が、より迅速で優れた患者対応を実現し、最終的には患者ケアの改善につながることを期待している」。

Nvidiaの研究コミュニティへの貢献は、Microsoftの共同研究者が「最先端」の生物医学言語モデル「PubMedBERT」を提案した後のことだ。彼らは、名前付き実体認識、エビデンスに基づく医療情報抽出、文書分類などのタスクで業界をリードする結果を管理していると主張している。

NVIDIAの医療、ゲノミクスへの展開

これは、NVIDIAがヘルスケア分野に進出して初めてのことではない。その取り組みの多くは、放射線科を中心に行われてきた。2018年には、AIを利用した仮想医用画像処理プラットフォーム「Clara」と呼ばれるAIプラットフォームを発表した。そして2019年には、放射線科医向けのAIツールキット「Clara」を発表し、13種類の分類に加え、セグメンテーションAIやソフトウェアツールも提供している。

また、ゲノミクス分野にも飛び込んでいる。2018年10月には Scripps Research Translational Institute と提携し、ゲノムやデジタルヘルスセンサーデータの分析に役立つAIとディープラーニングツールを開発した。

マイクロソフト、「最先端」の生物医学的NLPモデルを提案
マイクロソフトの研究者たちは、「生物医学自然言語処理(NLP)のためのドメイン固有の言語モデル事前学習」というAI技術を提案。データセットから「包括的な」生物医学NLPベンチマークをコンパイルすることで、名前付き実体認識、エビデンスに基づく医療情報抽出、文書分類などのタスクで最先端の結果を得たと主張した。

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史