ゲノミクス

DNAシーケンシングの高速化で解析期間を数週間から8時間に短縮

スタンフォード大学医学部の科学者とその共同研究者が開発した新しい超高速ゲノム配列決定法を用いて、希少な遺伝性疾患を平均8時間で診断することに成功した。

吉田拓史

10 2月 2022 — 5 min read

"Flu Genome Data Visualizer" by blprnt_van is licensed under CC BY

チームは、ニューイングランド・ジャーナル・オブ・メディシン誌に、12人の重篤な患者のDNA配列を調べ、そのうち5人（クンツマンを含む）の診断に成功したことを報告した。5人ともその情報が患者の治療方法の具体的な変更につながった。

論文によると、診断に要する時間は、通常8時間程度、短いものでは7時間18分と、現在の記録の半分以下だった。研究者たちは、この記録をさらに半分にすることができると確信している。

スタンフォード大学の循環器内科医で本研究の上級著者であるユアン・アシュリーは「（この研究で用いられた手法は）治療をより良いものにし、患者をより助けることができるだけでなく、より安く、お金を節約し、システムのコストを削減することができる。これは、すべての面で有利なことだ」と語っている。ポスドクのJohn Gorzynskiが主著者。

身長や目の色、特定の病気になりやすいかどうかなど、あらゆることに影響を与える遺伝子コードを調べることで、多くのことを知ることができる。医師にとっては、患者の症状が特定のDNA変異に関連しているかどうか、また関連しているとすればどの変異かを知ることで、どのような治療法や外科的処置を試すべきか、どのような処置を避けるべきかを判断するのに役立つ。

しかし、シーケンシングの結果を調べ、処理し、解釈するには、通常、数週間かかる。患者の中にはそのような時間の余裕がない患者もいる。また、原因不明の病気の解明のために入院すると、数万ドルの費用がかかることもある。

チームは、2020年12月から2021年5月にかけて、カリフォルニア州スタンフォードにある2つの病院に入院している重篤な患者12人を登録し、それぞれから小さじ半分ほどの血液を採取して遺伝子配列を調べた。そのうち5人の患者は、オフィスで1日を終える程度の時間で配列情報から遺伝子診断を受けた。参加者の年齢は3カ月から57歳までで、発作から心停止までさまざまな症状があった。

2020年12月に開始された6カ月間の研究期間中、研究者たちは、病院から研究室までサンプルを運ぶ人を配置したり、DNAの前処理に必要な時間を短縮したりするなど、遺伝子配列決定のプロセスのほぼすべての段階に手を加えた。

しかし、これらのデータを迅速に処理することは、研究者にとって新たな課題となった。研究者たちは、クラウドコンピューティングを利用して生のシーケンスデータを分析し、A、T、G、Cの認識可能な文字列を作成した。次に、コンピュータツールを使って、患者の症状を説明する遺伝子の変異をスキャンし、約20〜30個の候補遺伝子のリストを作成して、3人のゲノミクスの専門家チームに検討を依頼した。採血から診断までにかかる時間は、通常8時間程度である。

チームが考案したメガシークエンス法で時間の節約になったのは、1人の患者から最大48個のDNAサンプルを同時に配列決定したことで、2時間以内に200ギガベースのデータを生成することができた。

ただし、超高速シークエンスを実現するためには、新しいハードウェアが必要だった。そこでアシュリーは、フローセルと呼ばれる48個のシーケンスユニットで構成されたマシンを開発したオックスフォード・ナノポア・テクノロジー社の同僚に連絡を取った。このメガマシンは成功したが、成功しすぎてしまった。ゲノムデータは研究室の計算システムを圧倒した。

アシュリーはデータの処理速度が十分ではなかった。データパイプラインとストレージシステムを全面的に見直し、再構築しなければならなかった。大学院生のSneha Goenkaは、データをクラウドベースのストレージシステムに直接転送する方法を見つけた。その後、アルゴリズムが、入力された遺伝子コードに病気の原因となるエラーがないかを独自にスキャンし、最終的には、患者の遺伝子変異を、病気の原因となることが知られている一般的な変異と比較した。

研究者たちは、サンプルを歩いて研究室に運び、同時にゲノム配列を決定するために新しい機械を導入し、膨大なデータを効率的に処理するためにコンピューティングパワーを増強した。現在、研究チームは、さらに時間を短縮するために、システムの最適化を進めている。所要時間をさらに半分にできる見通しだという。

疑わしいDNAの断片をすばやく見つけ出す分類法の最大の特徴は、ロングリードシークエンスと呼ばれる手法を用いていることだ。従来のゲノム配列解析では、ゲノムを細かく分割し、それぞれのDNA塩基対の正確な順序を記し、標準的なヒトゲノムを基準にして全体をつなぎ合わせていた。しかし、この方法ではゲノムの全体像を把握することができず、また、診断のポイントとなる遺伝子の変異を見逃してしまうこともある。ロングリードシーケンスでは、何万もの塩基対で構成される長いDNAが保存されているため、同様の精度が得られるだけでなく、配列の誤りを探す科学者にとっても詳細な情報が得られる。

企業や研究者が長文読取法の精度を高め、診断に利用できるようになったのはごく最近のことである。このことと、かつての高額な価格が下がったことが、スタンフォード大学のチームにチャンスをもたらした。アシュリーの知る限りでは、今回の研究は、この種の長波長配列が診断医療の定番として実現可能であることを示した初めての研究である。

一例では、患者のゲノム配列を決定するのに要した時間は5時間2分と短く、DNA配列決定技術の最速記録として初めてギネス・ワールド・レコーズに認定された。この記録は、国立科学技術研究所の「Genome in a Bottle」グループによって認定され、ギネス・ワールド・レコーズに記録されている。

今回の研究で報告されたシーケンシングとデータ処理のコストは、1サンプルあたり約5,000ドルから7,300ドルであり、イルミナ社の技術を使用したRadyのアプローチよりも高いと指摘した。また、エラー率を調べる標準的な方法である、すでに配列が判明しているサンプルを用いて、著者らの手法の正確性を検証することができればよかったと述べている。

今後、スタンフォード大学のチームは、収集する必要のあるシーケンスデータの総量を減らすことに取り組んでおり、これによりプロセスがさらに高速化される。また、近々、スタンフォード大学のより多くのICU患者に迅速な全ゲノム配列決定を提供し、10時間以内に診断を下すことを計画している。

DNAシーケンシングの高速化で解析期間を数週間から8時間に短縮

吉田拓史

Read more

ぐるなび、バーティカルAIエージェントの新アプリ「UMAME!」β版をリリース

AIで企業の情報探索を効率化：Google Agentspaceの全貌

AI時代のエッジ戦略 - Fastly プロダクト責任者コンプトンが展望を語る

宮崎市が実践するゼロトラスト：Google Cloud 採用で災害対応を強化し、市民サービス向上へ