JP6560465B1 - 無細胞核酸の多重解像度分析のための方法 - Google Patents

無細胞核酸の多重解像度分析のための方法 Download PDF

Info

Publication number
JP6560465B1
JP6560465B1 JP2018568202A JP2018568202A JP6560465B1 JP 6560465 B1 JP6560465 B1 JP 6560465B1 JP 2018568202 A JP2018568202 A JP 2018568202A JP 2018568202 A JP2018568202 A JP 2018568202A JP 6560465 B1 JP6560465 B1 JP 6560465B1
Authority
JP
Japan
Prior art keywords
bait
concentration
genomic
nucleic acid
bait set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018568202A
Other languages
English (en)
Other versions
JP2019531048A (ja
Inventor
ダーリヤ チュドヴァ,
ダーリヤ チュドヴァ,
ヘルミー エルトーキー,
ヘルミー エルトーキー,
ステファニー アン ウォード モーティマー,
ステファニー アン ウォード モーティマー,
ダイアナ アブドゥエヴァ,
ダイアナ アブドゥエヴァ,
マーシン シコラ,
マーシン シコラ,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=61760169&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6560465(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ガーダント ヘルス, インコーポレイテッド, ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Application granted granted Critical
Publication of JP6560465B1 publication Critical patent/JP6560465B1/ja
Publication of JP2019531048A publication Critical patent/JP2019531048A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions

Abstract

本開示は、核酸試料のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットと、核酸試料のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットとを使用する複数のゲノム領域について富化するための方法を提供する。これらのベイトセットパネルは、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化することができ、ヌクレオソーム関連領域は、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。

Description

相互参照
本出願は、2016年9月30日に出願された米国仮出願番号第62/402,940号、2017年3月7日に出願された米国仮出願番号第62/468,201号、および2017年4月24日に出願された米国仮出願番号第62/489,391号に基づく優先権を主張しており、これら出願の各々は、全体が参考として本明細書中に援用される。
配列表
本出願は、ASCII形式で電子的に提出された配列表を含み、この配列表は、その全体が参照によって本明細書に組み込まれる。前記ASCIIコピーは、2017年9月27日に作成され、42534−733_601_SL.txtという名称であり、サイズが2,938バイトである。
背景
腫瘍由来遺伝的バリアントのための無細胞核酸(例えば、デオキシリボ核酸またはリボ核酸)の分析は、がん検出、評価、およびモニタリング用途のための典型的な分析パイプラインにおける重要なステップである。無細胞核酸のがん診断アッセイの最新方法は、腫瘍関連体細胞バリアント、例えば、一塩基バリアント(SNV)、コピー数多型(CNV)、融合、および挿入/欠失(インデル)の検出に焦点を当てており、それらは全て液体生検の主流の標的である。典型的な分析アプローチは、ゲノムの標的領域についての核酸試料の富化、次いで、富化された核酸のシーケンシング、および目的の遺伝的バリアントについての配列リードデータの分析を含み得る。これらの核酸は、それぞれの目的のゲノム領域に関連する制限されたシーケンシングロードおよび有用性を含むアッセイ制約に従った、特定のアッセイのために選択されたベイト混合物を使用して、富化することができる。
ある態様では、本開示は、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化する1つまたは複数のベイトセットを含むベイトセットパネルを提供し、ヌクレオソーム関連領域は、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。
一部の実施形態では、ベイトセットパネルの1つまたは複数のヌクレオソーム関連領域はそれぞれ、(i)ヌクレオソームポジショニングの多型を含む顕著な構造多型であり、挿入、欠失、転位、遺伝子再編成、メチル化状態、マイクロサテライト、コピー数多型、コピー数関連構造多型、または区別を示す任意の他の多型からなる群から選択される構造多型、および(ii)ゲノム中のヌクレオソームマップ破損の1つまたは複数の位置を示すゲノムパーティションマップにおける1つまたは複数の顕著な変動またはピークを含む不安定性の少なくとも1つを含む。
一部の実施形態では、ベイトセットパネルの1つまたは複数のベイトセットは、(i)1つもしくは複数の疾患状態および1つもしくは複数の非疾患状態に関連する、(ii)公知の体細胞変異、例えばSNV、CNV、インデルもしくは再編成に関連する、ならびに/または(iii)差異のある発現パターンに関連する複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成される。一実施形態では、ベイトセットパネルの1つまたは複数のベイトセットは、無細胞デオキシリボ核酸(cfDNA)試料における1つまたは複数のヌクレオソーム関連領域について選択的に富化する。
別の態様では、本開示は、ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法であって、(a)核酸試料をベイトセットパネルに接触させるステップであって、前記ベイトセットパネルがゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化する1つまたは複数のベイトセットを含む、ステップと、(b)ゲノムの1つまたは複数のヌクレオソーム関連領域について核酸試料を富化するステップとを含む、方法を提供する。
一部の実施形態では、ベイトセットパネルにおける1つまたは複数のベイトセットは、1つもしくは複数の疾患状態および1つもしくは複数の非疾患状態に関連する、複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成される。一実施形態では、ベイトセットパネルにおける1つまたは複数のベイトセットは、cfDNA試料における1つまたは複数のヌクレオソーム関連領域について選択的に富化する。一実施形態では、ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法は、ゲノムのヌクレオソーム関連領域の配列リードを生ずるために、富化された核酸をシーケンシングするステップをさらに含む。
別の態様では、本開示は、ベイトセットを生成するための方法であって、(a)ゲノムの1つまたは複数の領域を同定するステップであって、前記領域がヌクレオソームプロファイルに関連する、ステップと、(b)前記領域を選択的に捕捉するようにベイトセットを選択するステップとを含む。一実施形態では、ベイトセットパネルにおけるベイトセットは、無細胞デオキシリボ核酸試料における1つまたは複数のヌクレオソーム関連領域について選択的に富化する。
別の態様では、本開示は、所定量のDNAを含む核酸試料のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、第1のベイトセットの飽和点未満である第1の濃度比で提供される、第1のベイトセットと、核酸試料のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、第2のベイトセットの飽和点に関連する第2の濃度比で提供される、第2のベイトセットとを含む、ベイトパネルを提供する。一実施形態では、ゲノム領域の第1のセットは、1つまたは複数のバックボーンゲノム領域を含み、ゲノム領域の第2のセットは、1つまたは複数のホットスポットゲノム領域を含む。
別の態様では、本開示は、複数のゲノム領域について富化するための方法であって、所定量の核酸試料を、(i)核酸試料のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、第1のベイトセットの飽和点未満である第1の濃度比で提供される第1のベイトセットと、(ii)核酸試料のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、第2のベイトセットの飽和点と関連する第2の濃度比で提供される第2のベイトセットとを含むベイトパネルと接触させるステップと、ゲノム領域の第1のセットおよびゲノム領域の第2のセットについて核酸試料を富化するステップとを含む、方法を提供する。
一部の実施形態では、方法は、ゲノム領域の第1のセットおよびゲノム領域の第2のセットの配列リードを生ずるように富化された核酸をシーケンシングするステップをさらに含む。
一部の実施形態では、ベイトセットの飽和点は、(a)ベイトセットのベイトのそれぞれについて、(i)ベイトの捕捉効率をベイトの濃度の関数として測定すること、および(ii)滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定することを含む滴定曲線を生成すること、ならびに(b)ベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を選択することであって、それによりベイトセットの飽和点を決定することによって決定される。
一部の実施形態では、ベイトの捕捉効率は、(a)コホートにおける複数の対象から得られた複数の核酸試料を提供すること、(b)ベイトの複数の濃度のそれぞれで、ベイトを核酸試料のそれぞれとハイブリダイズさせること、(c)ベイトの複数の濃度のそれぞれで、ベイトを用いて核酸試料の複数のゲノム領域を富化すること、および(d)ベイトの複数の濃度のそれぞれで捕捉効率を表す、元の二本鎖核酸分子の両方の鎖を表す特有の核酸分子または核酸分子の数を測定することによって決定される。
一部の実施形態では、変曲点は、観測された捕捉効率が、第1の濃度より大きいベイトの濃度で有意に増加しないような、ベイトの第1の濃度である。変曲点は、(1)第1の濃度の2倍のベイト濃度での捕捉効率を(2)第1のベイト濃度での捕捉効率と比較して観測される増加が、約1%未満、約2%未満、約3%未満、約4%未満、約5%未満、約6%未満、約7%未満、約8%未満、約9%未満、約10%未満、約12%未満、約14%未満、約16%未満、約18%未満または約20%未満であるような、ベイトの第1の濃度であり得る。
一部の実施形態では、核酸試料は、無細胞核酸試料を含む。一実施形態では、複数のゲノム領域を富化するための方法は、複数の配列リードを生ずるために、富化された核酸試料をシーケンシングするステップをさらに含む。一実施形態では、複数のゲノム領域を富化するための方法は、核酸試料を表す核酸配列を含む出力を生じるステップをさらに含む。
別の態様では、本開示は、ゲノムのバックボーン領域を選択的に捕捉する第1のセットであって、前記バックボーン領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各バックボーン領域の順位付け関数が、所定の閾値未満の値を有する、第1のセットと、ゲノムのホットスポット領域を選択的に捕捉する第2のベイトセットであって、前記ホットスポット領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各ホットスポット領域の順位付け関数が所定の閾値より大きいまたはそれと等しい値を有する、第2のベイトセットとを含む、ベイトパネルを提供する。
一部の実施形態では、ホットスポット領域は、1つまたは複数のヌクレオソーム情報領域を含み、前記ヌクレオソーム情報領域は、最大ヌクレオソーム鑑別の領域を含む。一実施形態では、ベイトパネルは、疾患情報領域を選択的に捕捉する第2のベイトセットをさらに含む。一実施形態では、第1のベイトセットのベイトは、ベイトパネルに対する第1の相対濃度でのベイトであり、第2のベイトセットのベイトは、ベイトパネルに対する第2の相対濃度でのベイトである。
別の態様では、本開示は、1つまたは複数の目的のバックボーンゲノム領域を同定するステップであって、1つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、1つまたは複数の目的のホットスポットゲノム領域を同定するステップと、目的のバックボーンゲノム領域を選択的に捕捉する第1のベイトセットを創製するステップと、目的のホット−スポットゲノム領域を選択的に捕捉する第2のベイトセットを創製するステップであって、第2のベイトセットが、第1のベイトセットより高い捕捉効率を有するステップとを含む、ベイトセットを生成するための方法を提供する。
一部の実施形態では、1つまたは複数のホットスポットは、次の:(i)前記ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、(ii)所定の1つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、(iii)関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに(iv)経験的に同定されたがんドライバー変異の1つまたは複数を使用して選択される。
一部の実施形態では、目的の1つまたは複数のホットスポットを同定するステップは、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためのプログラムされたコンピュータプロセッサを使用することを含む。一部の実施形態では、目的の1つまたは複数のバックボーンゲノム領域を同定するステップは、目的のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすることを含む。一部の実施形態では、目的の1つまたは複数のホットスポットゲノム領域を同定するステップは、試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度(MAF)値またはそのMAFによって測定されたバリアントのクローン性のセットを利用することを含む。
一部の実施形態では、ゲノム領域のシーケンシングロードは、(i)塩基対におけるゲノム領域のサイズ、(ii)ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、(iii)ゲノム領域の配列バイアスの結果としての相対カバレッジ、(iv)ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および(v)ゲノム領域の捕捉バイアスの結果としての相対カバレッジの1つまたは複数を一緒に乗算することによって計算される。
一部の実施形態では、ゲノム領域の有用性は、(i)ゲノム領域における1つまたは複数の行動指針を与え得る変異の頻度、(ii)ゲノム領域の平均を上回るマイナーアレル頻度(MAF)に関連する1つまたは複数の変異の頻度、(iii)ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、(iv)コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの合計、および(v)(1)コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの(2)コホートにおける所与の患者についての最大MAFに対する比率の1つまたは複数を一緒に乗算することによって計算される。
一部の実施形態では、行動指針を与え得る変異は、(i)投薬標的化可能な変異、(ii)治療モニタリングのための変異、(iii)疾患特異的変異、(iv)組織特異的変異、(v)細胞型特異的変異、(vi)耐性変異、および(vii)診断上の変異の1つまたは複数を含む。一実施形態では、より高いマイナーアレル頻度に関連する変異は、1つもしくは複数のドライバー変異を含むか、または外部データもしくは注釈ソースから公知である。
別の態様では、本開示は、複数のベイトセットを含むベイトパネルであって、各ベイトセットが、(i)複数のベイトにわたって同じ分位数の有用性で1つまたは複数のゲノム領域を選択的に捕捉する1つまたは複数のベイトを含み、(ii)複数のベイトにわたって異なる分位数の有用性で他のベイトセットのそれぞれと異なる相対濃度を有する、ベイトパネルを提供する。
別の態様では、本開示は、(a)各パネルブロックについて、(i)パネルブロックの有用性を計算し、(ii)パネルブロックのシーケンシングロードを計算し、(iii)パネルブロックの順位付け関数を計算するステップと、(b)最適化プロセスを実行して、選択されたパネルブロックの合計順位付け関数値を最大化するパネルブロックのセットを選択するステップとを含むパネルブロックのセットを選択する方法を提供する。
一部の実施形態では、パネルブロックの順位付け関数は、パネルブロックのシーケンシングロードで割ったパネルブロックの有用性として計算される。一部の実施形態では、コンビナトリアル最適化プロセスは、グリーディアルゴリズムを含む。
別の態様では、本開示は、(a)複数のベイト混合物を提供するステップであって、各ベイト混合物が、ゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットと、ゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットとを含み、ベイト混合物が、第1のベイトセットを異なる濃度で、第2のベイトセットを同じ濃度で含む、ステップと、(b)各ベイト混合物を核酸試料と接触させるステップであって、ベイトセットを用いて試料から核酸を捕捉するステップであって、核酸試料が第2のベイトセットの飽和点付近の核酸濃度を有するステップと、(c)配列リードのセットを生ずるために、各ベイト混合物を用いて捕捉された核酸をシーケンシングするステップと、(d)各ベイト混合物について、ゲノム領域の第1のセットに対する配列リードおよびゲノム領域の第2のセットに対する配列リードの相対数を決定するステップと、(e)ゲノム領域の第2のセット、および任意選択でゲノム領域の第1のセットについて、所定の量で、リード深度を提供する少なくとも1つのベイト混合物を同定するステップとを含む、方法を提供する。
別の態様では、本開示は、対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成され、(a)無細胞DNA分子に関連する複数の配列リードのそれぞれについて、複数の配列リードの1つまたは複数の配列リードで検出されるインデルの所定の期待値と、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが無細胞DNA分子の所与の無細胞DNA分子に存在する真のインデルである、所定の期待値と、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値とを提供するステップと、(b)核酸シーケンシングによって生成される配列リードに特徴的な1つまたは複数のモデルパラメータの定量的尺度を提供するステップと、(c)無細胞DNA分子に関連する複数の配列リードにおける1つまたは複数の候補インデルを検出するステップと、(d)各候補インデルについて、モデルパラメータの1つまたは複数を使用して仮説検定を行うステップであって、候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップとを含む、方法を提供する。
別の態様では、本開示は、(a)所定量のDNAを含む試料と、(b)(i)所定量のDNAを含む核酸試料のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、第1のベイトセットの飽和点未満である第1の濃度比で提供される、第1のベイトセット、および(ii)核酸試料のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、第2のベイトセットの飽和点に関連する第2の濃度比で提供される、第2のベイトセットを含むベイトセットパネルとを含む、キットを提供する。
一部の実施形態では、対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法は、ステップ(a)の前に身体試料における無細胞DNAから1つまたは複数の遺伝子座を富化し、それにより、富化されたポリヌクレオチドを生ずるステップをさらに含む。
一部の実施形態では、方法は、アンプリコンのファミリーを生ずるために、富化されたポリヌクレオチドを増幅するステップであって、各ファミリーは無細胞DNA分子の一本鎖に由来するアンプリコンを含む、ステップをさらに含む。一部の実施形態では、非生物学的エラーは、複数のゲノム塩基位置でのシーケンシングにおけるエラーを含む。一部の実施形態では、非生物学的エラーは、複数のゲノム塩基位置での増幅におけるエラーを含む。
一部の実施形態では、モデルパラメータは、(i)1つまたは複数のバリアントアレルのそれぞれについて、前記バリアントアレルの頻度(α)および前記バリアントアレル以外の非参照アレルの頻度(α’)、(ii)鎖のファミリーの全フォワード鎖におけるインデルエラーの頻度(β)であって、ファミリーが、無細胞DNA分子の一本鎖に由来するアンプリコンのコレクションを含む、頻度、(iii)鎖のファミリーの全リバース鎖におけるインデルエラーの頻度(β)、ならびに(iv)配列リードにおけるインデルエラーの頻度(γ)の1つまたは複数(例えば、このうちの1つまたはそれより多く、2つまたはそれより多く、3つまたはそれより多く、あるいは4つ)を含む。
一部の実施形態では、仮説検定を行うステップは、マルチパラメータ最大化アルゴリズムを実行するステップを含む。一部の実施形態では、マルチパラメータ最大化アルゴリズムは、Nelder−Meadアルゴリズムを含む。ある実施形態では、候補インデルを真のインデルまたは導入されたインデルとして分類することは、(a)マルチパラメータ尤度関数を最大化することと、(b)最大尤度関数値が所定の閾値より大きい場合に候補インデルを真のインデルとして分類することと、(c)最大尤度関数値が所定の閾値未満またはそれと等しい場合に候補インデルを導入されたインデルとして分類することとを含む。
別の態様では、本開示は、1つまたは複数のコンピュータプロセッサによって実行すると、1つまたは複数の目的のバックボーンゲノム領域を同定するステップであって、1つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、1つまたは複数の目的のホットスポットゲノム領域を同定するステップと、目的のバックボーンゲノム領域を選択的に捕捉する第1のベイトセットを創製するステップと、目的のホット−スポットゲノム領域を選択的に捕捉する第2のベイトセットを創製するステップであって、第2のベイトセットが、第1のベイトセットより高い捕捉効率を有するステップとを含む、ベイトセットを生成するための方法を実装する、機械により実行可能なコードを含む、非一過性コンピュータ可読媒体を提供する。
別の態様では、本開示は、1つまたは複数のコンピュータプロセッサによって実行すると、(a)各パネルブロックについて、(i)パネルブロックの有用性を計算し、(ii)パネルブロックのシーケンシングロードを計算し、(iii)パネルブロックの順位付け関数を計算するステップと、(b)最適化プロセスを実行して、選択されたパネルブロックの合計順位付け関数値を最大化するパネルブロックのセットを選択するステップとを含むパネルブロックのセットを選択する方法を実装する、機械により実行可能なコードを含む、非一過性コンピュータ可読媒体を提供する。
別の態様では、本開示は、機械により実行可能なコードを含む非一過性コンピュータ可読媒体であって、1つまたは複数のコンピュータプロセッサによって実行すると、対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成され、(a)無細胞DNA分子に関連する複数の配列リードのそれぞれについて、複数の配列リードの1つまたは複数の配列リードで検出されるインデルの所定の期待値と、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが無細胞DNA分子の所与の無細胞DNA分子に存在する真のインデルである、所定の期待値と、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値とを提供するステップと、(b)核酸シーケンシングによって生成される配列リードに特徴的な1つまたは複数のモデルパラメータの定量的尺度を提供するステップと、(c)無細胞DNA分子に関連する複数の配列リードにおける1つまたは複数の候補インデルを検出するステップと、(d)各候補インデルについて、モデルパラメータの1つまたは複数を使用して仮説検定を行うステップであって、候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップとを含む、方法を実装する非一過性コンピュータ可読媒体を提供する。
別の態様では、本開示は、複数のゲノム領域について富化するための方法であって、(a)所定量の試料由来の核酸を、(i)試料由来の核酸のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、第1のベイトセットの飽和点未満である第1の濃度で提供される第1のベイトセットと、(ii)核酸試料のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、第2のベイトセットの飽和点と関連する第2の濃度で提供される第2のベイトセットとを含むベイト混合物と接触させるステップと、(b)ゲノム領域の第1のセットおよびゲノム領域の第2のセットについて核酸試料を富化するステップとを含む、方法を提供する。
一部の実施形態では、第2のベイトセットは、第2のベイトセットのベイトを、(i)第2のベイトセットのベイトの捕捉効率を、ベイトの濃度の関数として測定すること、および(ii)滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定して生成される滴定曲線に供するとき、第2のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する。一部の実施形態では、飽和点は、観測される捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の20%未満で増加するように選択される。
一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の10%未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の5%未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の2%未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の1%未満で増加するように選択される。
一部の実施形態では、第1のベイトセットまたは第2のベイトセットは、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、核酸試料は、無細胞核酸試料を含む。一部の実施形態では、方法は、(c)複数の配列リードを生ずるために、富化された核酸試料をシーケンシングするステップをさらに含む。一部の実施形態では、方法は、(d)核酸試料を表す核酸配列を含む出力を生じるステップをさらに含む。
別の態様では、本開示は、ベイトセットを生成するための方法であって、(a)所定の1つまたは複数のバックボーンゲノム領域を同定するステップであって、1つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、(b)所定の1つまたは複数のホットスポットゲノム領域を同定するステップであって、1つまたは複数のホットスポットが、次の:(i)ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、(ii)所定の1つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、(iii)関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに(iv)経験的に同定されたがんドライバー変異の1つまたは複数を使用して選択されるステップと、(c)所定のバックボーンゲノム領域を選択的に捕捉する第1のベイトセットを創製するステップと、(d)所定のホットスポットゲノム領域を選択的に捕捉する第2のベイトセットを創製するステップであって、第2のベイトセットが、第1のベイトセットより高い捕捉効率を有するステップとを含む、方法を提供する。一部の実施形態では、所定の領域(例えば、所定のバックボーン領域または所定のホットスポット領域)は、目的の領域(例えば、それぞれ目的のバックボーン領域または目的のホットスポット領域)である。
一部の実施形態では、所定の1つまたは複数のホットスポットを同定するステップは、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためのプログラムされたコンピュータプロセッサを使用することを含む。一部の実施形態では、所定の1つまたは複数のバックボーンゲノム領域を同定するステップは、(i)所定のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすること、(ii)試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度(MAF)値またはそのMAFによって測定されたバリアントのクローン性のセットを利用すること、または(iii)(i)と(ii)との組合せを含む。
一部の実施形態では、ゲノム領域のシーケンシングロードは、(i)塩基対におけるゲノム領域のサイズ、(ii)ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、(iii)ゲノム領域の配列バイアスの結果としての相対カバレッジ、(iv)ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および(v)ゲノム領域の捕捉バイアスの結果としての相対カバレッジの1つまたは複数を一緒に乗算することによって計算される。一部の実施形態では、ゲノム領域の有用性は、(i)ゲノム領域における1つまたは複数の行動指針を与え得る変異の頻度、(ii)ゲノム領域の平均を上回るマイナーアレル頻度(MAF)に関連する1つまたは複数の変異の頻度、(iii)ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、(iv)コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの合計、および(v)(1)コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの(2)コホートにおける所与の患者についての最大MAFに対する比率の1つまたは複数を一緒に乗算することによって計算される。
一部の実施形態では、行動指針を与え得る変異は、(i)投薬標的化可能な変異、(ii)治療モニタリングのための変異、(iii)疾患特異的変異、(iv)組織特異的変異、(v)細胞型特異的変異、(vi)耐性変異、および(vii)診断上の変異の1つまたは複数を含む。一部の実施形態では、より高いマイナーアレル頻度に関連する変異は、1つもしくは複数のドライバー変異を含むか、または外部データもしくは注釈ソースから公知である。
別の態様では、本開示は、(a)複数のベイト混合物を提供するステップであって、複数のベイト混合物のそれぞれがゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットと、ゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットを含み、ベイト混合物は、異なる濃度の第1のベイトセットおよび同じ濃度の第2のベイトセットを含む、ステップと、(b)ベイト混合物のそれぞれを核酸試料と接触させるステップであって、ベイトセットを用いて試料から核酸を捕捉するステップであって、各混合物における第2のベイトセットが、第2のベイトセットの飽和点か、またはそれより高い濃度で提供され、試料由来の核酸が、ベイトセットによって捕捉される、ステップと、(c)各ベイト混合物を用いて捕捉された核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、(d)各ベイト混合物について第1のベイトセットおよび第2のベイトセットについての配列リードのリード深度を決定するステップと、(e)ゲノム領域の第2のセットについてのリード深度を提供する少なくとも1つのベイト混合物を同定するステップとを含み、ゲノム領域の第2のセットについてのリード深度が、少なくとも0.0001%を検出する感度を提供する、方法を提供する。
一部の実施形態では、第2のベイトセットは、滴定に供するときに飽和点を有し、滴定は、(i)第2のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および(ii)滴定曲線内の変曲点を同定することであって、それにより、第2のベイトセットに関連する飽和点を同定することを含む滴定曲線を生成することを含む。
一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の20%未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の10%未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の5%未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の2%未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の1%未満で増加するように選択される。
一部の実施形態では、第1のベイトセットまたは第2のベイトセットは、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、ゲノム領域の第1のセットまたは第2のゲノム領域は、1つまたは複数の行動指針を与え得る変異を含み、1つまたは複数の行動指針を与え得る変異は、(i)投薬標的化可能な変異、(ii)治療モニタリングのための変異、(iii)疾患特異的変異、(iv)組織特異的変異、(v)細胞型特異的変異、(vi)耐性変異、および(vii)診断上の変異の1つまたは複数を含む。
一部の実施形態では、第1および第2のゲノム領域は、表3から選択される少なくとも5つの遺伝子のそれぞれの少なくとも1部を含む。一部の実施形態では、第1および第2のゲノム領域が、約25キロベース〜1,000キロベースのサイズおよび1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する。
一態様では、本開示は、複数のゲノム領域を富化するための方法であって、(a)所定量の試料由来の核酸を、(i)試料由来の核酸のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、第1のベイトセットの飽和点未満である第1の濃度で提供される第1のベイトセットと、(ii)試料由来の核酸のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、第2のベイトセットの飽和点か、またはそれより高い第2の濃度で提供される第2のベイトセットとを含むベイト混合物と接触させるステップと、(b)ゲノム領域の第1のセットおよびゲノム領域の第2のセットについて飼料由来の核酸を富化するステップであって、それにより、富化された核酸を生ずるステップとを含む、方法を提供する。
一部の実施形態では、第2のベイトセットは、第2のベイトセットのベイトを、(i)第2のベイトセットのベイトの捕捉効率を、ベイトの濃度の関数として測定すること、および(ii)滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定して生成される滴定曲線に供するとき、第2のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する。一部の実施形態では、第1のベイトセットの飽和点は、観測される捕捉効率が、第1の濃度の2倍のベイトの濃度で10%未満で第1の濃度の捕捉効率について増加するように選択される。一部の実施形態では、第1のベイトセットまたは第2のベイトセットは、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、方法は、(c)複数の配列リードを生ずるために、富化された核酸をシーケンシングするステップをさらに含む。一部の実施形態では、方法は、(d)試料由来の核酸を表す核酸配列を含む出力を生じるステップをさらに含む。
ある態様では、本開示は、(a)複数のベイト混合物を提供するステップであって、複数のベイト混合物のそれぞれがゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットと、ゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットを含み、第1のベイトセットは複数のベイト混合物にわたって異なる濃度であり、第2のベイトセットは複数のベイト混合物にわたって同じ濃度である、ステップと、(b)複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、第1のベイトセットおよび第2のベイトセットを用いて核酸試料から核酸を捕捉するステップであって、各ベイト混合物における第2のベイトセットが、第2のベイトセットの飽和点か、またはそれより高い第1の濃度で提供され、核酸試料由来の核酸が、第1のベイトセットおよび第2のベイトセットによって捕捉される、ステップと、(c)各ベイト混合物を用いて捕捉された核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、(d)各ベイト混合物について第1のベイトセットおよび第2のベイトセットについての配列リードのリード深度を決定するステップと、(e)ゲノム領域の第2のセットについてのリード深度を提供する少なくとも1つのベイト混合物を同定するステップとを含み、ゲノム領域の第2のセットについてのリード深度が、少なくとも0.0001%のマイナーアレル頻度(MAF)の遺伝的バリアントを検出する感度を提供する、方法を提供する。一部の実施形態では、ステップ(d)および/または(e)は任意選択である。
一部の実施形態では、第2のベイトセットは、滴定に供するときに飽和点を有し、滴定は、(i)第2のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および(ii)滴定曲線内の変曲点を同定することであって、それにより、第2のベイトセットに関連する飽和点を同定することを含む滴定曲線を生成することを含む。一部の実施形態では、飽和点は、観測される捕捉効率が、第1の濃度の2倍のベイトセットの濃度で10%未満で第1の濃度の捕捉効率について増加するように選択される。一部の実施形態では、第1のベイトセットまたは第2のベイトセットは、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、ゲノム領域の第1のセットは、1つまたは複数の行動指針を与え得る変異を含み、1つまたは複数の行動指針を与え得る変異は、(i)投薬標的化可能な変異、(ii)治療モニタリングのための変異、(iii)疾患特異的変異、(iv)組織特異的変異、(v)細胞型特異的変異、(vi)耐性変異、および(vii)診断上の変異の1つまたは複数を含む。一部の実施形態では、第1のゲノム領域は、表1から選択される少なくとも5つの遺伝子のそれぞれの少なくとも一部分を含む。一部の実施形態では、第1のゲノム領域は、約25キロベース〜1,000キロベースのサイズおよび1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する。一部の実施形態では、第2のベイトセットの飽和点は、観測された捕捉効率が第2の濃度の2倍のベイトの濃度で第2の濃度の捕捉効率の10%未満で増加するように選択される。一部の実施形態では、ゲノム領域の第2のセットは、1つまたは複数の行動指針を与え得る変異を含み、1つまたは複数の行動指針を与え得る変異は、(i)投薬標的化可能な変異、(ii)治療モニタリングのための変異、(iii)疾患特異的変異、(iv)組織特異的変異、(v)細胞型特異的変異、(vi)耐性変異、および(vii)診断上の変異の1つまたは複数を含む。一部の実施形態では、第2のゲノム領域は、表1から選択される少なくとも5つの遺伝子のそれぞれの少なくとも一部分を含む。一部の実施形態では、第2のゲノム領域が、約25キロベース〜1,000キロベースのサイズおよび1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する。
本開示のさらなる態様および利点は、以下の詳細な説明から当業者には容易に明らかとなるが、そこには、本開示の例証的な実施形態のみが示され、記載されている。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、すべてが本開示から逸脱することなく、様々な自明の事項における修正が可能である。したがって、図面および説明は、制限的ではなく、例証的な性質と解釈されるものである。
参照による組込み
本明細書において言及されているあらゆる刊行物、特許および特許出願は、あたかも個々の刊行物、特許または特許出願が、参照により組み込まれていると特にかつ個々に示されているのと同じ程度まで、参照により本明細書に組み込まれている。参照によって組み込まれる文献および特許または特許出願が本明細書に含まれる開示と矛盾する範囲で、本明細書は、そのような矛盾する事柄に優先するおよび/または取って代わることが意図されている。
本開示の新規特色は、添付の特許請求の範囲において詳細に明記されている。本開示の特色および利点のより十分な理解は、本開示の原理が利用される説明的実施形態を明記する次の詳細な説明および添付の図面(また、本明細書における「図(Figure)」および「図(FIG.)」)を参照することにより得られる。
本発明の実施形態において、例えば以下の項目が提供される。
(項目1)
複数のゲノム領域を富化するための方法であって、
(a)所定量の試料由来の核酸を、
(i)前記試料由来の核酸のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、前記第1のベイトセットの飽和点未満である第1の濃度で提供される第1のベイトセットと、
(ii)前記試料由来の核酸のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、前記第2のベイトセットの飽和点か、またはそれより高い第2の濃度で提供される第2のベイトセットと
を含むベイト混合物と接触させるステップと、
(b)前記ゲノム領域の第1のセットおよび前記ゲノム領域の第2のセットについて前記試料由来の核酸を富化するステップであって、それにより、富化された核酸を生ずるステップと
を含む、方法。
(項目2)
前記第2のベイトセットが、第2のベイトセットのベイトを、
(i)前記第2のベイトセットのベイトの捕捉効率を、前記ベイトの濃度の関数として測定すること、および
(ii)滴定曲線内の変曲点を同定し、それにより、前記ベイトに関連する飽和点を同定すること
によって生成される前記滴定曲線に供するとき、前記第2のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する、項目1に記載の方法。
(項目3)
前記第1のベイトセットの前記飽和点が、観測された捕捉効率が第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の10%未満で増加するように選択される、項目1に記載の方法。
(項目4)
前記第1のベイトセットまたは前記第2のベイトセットが、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、項目1に記載の方法。
(項目5)
(c)複数の配列リードを生ずるために、前記富化された核酸をシーケンシングするステップをさらに含む、項目1に記載の方法。
(項目6)
(d)前記試料由来の核酸を表す核酸配列を含む出力を生じるステップをさらに含む、項目5に記載の方法。
(項目7)
ベイトセットを生成するための方法であって、
(a)所定の1つまたは複数のバックボーンゲノム領域を同定するステップであって、前記1つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、
(b)所定の1つまたは複数のホットスポットゲノム領域を同定するステップであって、前記1つまたは複数のホットスポットが、次の:
(i)前記ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、
(ii)所定の1つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、
(iii)関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに
(iv)経験的に同定されたがんドライバー変異
の1つまたは複数を使用して選択されるステップと、
(c)前記所定のバックボーンゲノム領域を選択的に捕捉する第1のベイトセットを創製するステップと、
(d)前記所定のホットスポットゲノム領域を選択的に捕捉する第2のベイトセットを創製するステップであって、前記第2のベイトセットが、前記第1のベイトセットより高い捕捉効率を有するステップと
を含む、方法。
(項目8)
前記所定の1つまたは複数のホットスポットを同定するステップが、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためのプログラムされたコンピュータプロセッサを使用することを含む、項目7に記載の方法。
(項目9)
前記所定の1つまたは複数のバックボーンゲノム領域を同定するステップが、
(i)前記所定のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすること、
(ii)試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度(MAF)値またはそのMAFによって測定されたバリアントのクローン性のセットを利用すること、または
(iii)(i)と(ii)との組合せ
を含む、項目7に記載の方法。
(項目10)
ゲノム領域の前記シーケンシングロードが、
(i)塩基対における前記ゲノム領域のサイズ、
(ii)前記ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、
(iii)前記ゲノム領域の配列バイアスの結果としての相対カバレッジ、
(iv)前記ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および
(v)前記ゲノム領域の捕捉バイアスの結果としての相対カバレッジ
の1つまたは複数を一緒に乗算することによって計算される、項目7に記載の方法。
(項目11)
前記ゲノム領域の有用性が、
(i)前記ゲノム領域における1つまたは複数の行動指針を与え得る変異の頻度、
(ii)前記ゲノム領域の平均を上回るマイナーアレル頻度(MAF)に関連する1つまたは複数の変異の頻度、
(iii)前記ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、
(iv)コホートにおける前記ゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの合計、および
(v)(1)コホートにおける前記ゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの(2)前記コホートにおける所与の患者についての最大MAFに対する比率
の1つまたは複数を一緒に乗算することによって計算される、項目7に記載の方法。
(項目12)
前記1つまたは複数の行動指針を与え得る変異が、
(i)投薬標的化可能な変異、
(ii)治療モニタリングのための変異、
(iii)疾患特異的変異、
(iv)組織特異的変異、
(v)細胞型特異的変異、
(vi)耐性変異、および
(vii)診断上の変異
の1つまたは複数を含む、項目11に記載の方法。
(項目13)
より高いマイナーアレル頻度に関連する前記変異が、1つまたは複数のドライバー変異を含むか、または外部データもしくは注釈ソースから公知である、項目11に記載の方法。
(項目14)
(a)複数のベイト混合物を提供するステップであって、前記複数のベイト混合物のそれぞれがゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットと、ゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットを含み、前記第1のベイトセットが前記複数のベイト混合物にわたって異なる濃度であり、前記第2のベイトセットが前記複数のベイト混合物にわたって同じ濃度である、ステップと、
(b)前記複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、前記第1のベイトセットおよび前記第2のベイトセットを用いて前記核酸試料から核酸を捕捉するステップであって、各ベイト混合物における前記第2のベイトセットが、前記第2のベイトセットの飽和点か、またはそれより高い第1の濃度で提供され、前記核酸試料由来の核酸が、前記第1のベイトセットおよび前記第2のベイトセットによって捕捉される、ステップと、
(c)各ベイト混合物を用いて捕捉された前記核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、
(d)各ベイト混合物について前記第1のベイトセットおよび前記第2のベイトセットについての前記配列リードのリード深度を決定するステップと、
(e)前記ゲノム領域の第2のセットについてのリード深度を提供する少なくとも1つのベイト混合物を同定するステップと
を含み、前記ゲノム領域の第2のセットについてのリード深度が、少なくとも0.0001%のマイナーアレル頻度(MAF)の遺伝的バリアントを検出する感度を提供する、方法。
(項目15)
前記第2のベイトセットが、滴定に供するときに飽和点を有し、滴定が、
(i)前記第2のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および
(ii)前記滴定曲線内の変曲点を同定することであって、それにより、前記第2のベイトセットに関連する飽和点を同定すること
を含む滴定曲線を生成することを含む、項目14に記載の方法。
(項目16)
前記飽和点が、観測された捕捉効率が第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の10%未満で増加するように選択される、項目15に記載の方法。
(項目17)
前記第1のベイトセットまたは前記第2のベイトセットが、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、項目14に記載の方法。
(項目18)
前記ゲノム領域の第1のセットが、1つまたは複数の行動指針を与え得る変異を含み、前記1つまたは複数の行動指針を与え得る変異が、
(i)投薬標的化可能な変異、
(ii)治療モニタリングのための変異、
(iii)疾患特異的変異、
(iv)組織特異的変異、
(v)細胞型特異的変異、
(vi)耐性変異、および
(vii)診断上の変異
の1つまたは複数を含む、項目14に記載の方法。
(項目19)
前記第1のゲノム領域が、表3または表4から選択される少なくとも5つの遺伝子のそれぞれの少なくとも一部分を含む、項目14に記載の方法。
(項目20)
第1のゲノム領域が25キロベース〜1,000キロベースのサイズおよび1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する、項目14に記載の方法。
(項目21)
前記第2のベイトセットの飽和点が、観測された捕捉効率が第2の濃度の2倍のベイトの濃度で第2の濃度の捕捉効率の10%未満で増加するように選択される、項目1に記載の方法。
(項目22)
前記ゲノム領域の第2のセットが、1つまたは複数の行動指針を与え得る変異を含み、前記1つまたは複数の行動指針を与え得る変異が、
(i)投薬標的化可能な変異、
(ii)治療モニタリングのための変異、
(iii)疾患特異的変異、
(iv)組織特異的変異、
(v)細胞型特異的変異、
(vi)耐性変異、および
(vii)診断上の変異
の1つまたは複数を含む、項目14に記載の方法。
(項目23)
前記第2のゲノム領域が、表3または表4から選択される少なくとも5つの遺伝子のそれぞれの少なくとも一部分を含む、項目14に記載の方法。
(項目24)
前記第2のゲノム領域が、約25キロベース〜1,000キロベースのサイズおよび1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する、項目14に記載の方法。
(項目25)
対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法であって、前記複数の配列リードが、核酸シーケンシングによって生成され、
(a)無細胞DNA分子に関連する複数の配列リードのそれぞれについて、
前記複数の配列リードの1つまたは複数の配列リードで検出されるインデルの所定の期待値と、
インデルが前記配列リードの1つまたは複数で検出されたとすると、検出されたインデルが前記無細胞DNA分子の所与の無細胞DNA分子に存在する真のインデルである、所定の期待値と、
インデルが前記配列リードの1つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値と
を提供するステップと、
(b)核酸シーケンシングによって生成される配列リードに特徴的な1つまたは複数のモデルパラメータの定量的尺度を提供するステップと、
(c)前記無細胞DNA分子に関連する前記複数の配列リードにおける1つまたは複数の候補インデルを検出するステップと、
(d)各候補インデルについて、前記モデルパラメータの1つまたは複数を使用して仮説検定を行うステップであって、前記候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップと
を含む、方法。
(項目26)
ステップ(a)(i)の前に前記身体試料における前記無細胞DNAから1つまたは複数の遺伝子座を富化するステップであって、それにより、富化されたポリヌクレオチドを生ずるステップをさらに含む、項目25に記載の方法。
(項目27)
アンプリコンのファミリーを生ずるために、前記富化されたポリヌクレオチドを増幅するステップであって、各ファミリーが前記無細胞DNA分子の一本鎖に由来するアンプリコンを含むステップをさらに含む、項目26に記載の方法。
(項目28)
前記非生物学的エラーが、複数のゲノム塩基位置でのシーケンシングにおけるエラーを含む、項目25に記載の方法。
(項目29)
前記非生物学的エラーが、複数のゲノム塩基位置での増幅におけるエラーを含む、項目25に記載の方法。
(項目30)
前記モデルパラメータが、
(i)1つまたは複数のバリアントアレルのそれぞれについて、前記バリアントアレルの頻度(α)および前記バリアントアレル以外の非参照アレルの頻度(α’)、
(ii)鎖のファミリーの全フォワード鎖におけるインデルエラーの頻度(β )であって、ファミリーが、無細胞DNA分子の一本鎖に由来するアンプリコンのコレクションを含む、頻度、
(iii)鎖のファミリーの全リバース鎖におけるインデルエラーの頻度(β )、ならびに
(iv)配列リードにおけるインデルエラーの頻度(γ)
の1つまたは複数を含む、項目25に記載の方法。
(項目31)
仮説検定を行うステップが、マルチパラメータ最大化アルゴリズムを実行することを含む、項目25に記載の方法。
(項目32)
前記マルチパラメータ最大化アルゴリズムが、Nelder−Meadアルゴリズムを含む、項目31に記載の方法。
(項目33)
前記(d)の分類するステップが、
(a)マルチパラメータ尤度関数を最大化することと、
(b)最大尤度関数値が所定の閾値より大きい場合に候補インデルを真のインデルとして分類することと、
(c)前記最大尤度関数値が所定の閾値未満またはそれと等しい場合に候補インデルを導入されたインデルとして分類することと
を含む、項目25に記載の方法。

図1は、どのように複数のリードが無細胞核酸試料から富化される各遺伝子座について生成され得るかを図解する。
図2は、大規模なファミリーによって支持される挿入の一例を図解する。 図3は、リードの小規模なファミリー(実際のバリアントについて証拠を提供するようであり得る)およびリードの大規模なファミリー(PCRまたはシーケンシングに起因する可能性が高いランダムエラーを示し得る)の一例を図解する。
図4は、仮説検定で使用し得る様々なパラメータならびにどのように各パラメータが特定の確率、例えば、参照にマッチングするファミリーのリードの確率、参照にマッチングする鎖のリードの確率、および参照にマッチングするリードの確率に関連し得るかを図解する。 図5は、本開示の方法を実装するようにプログラムされ得るか、または別様に構成され得るコンピュータシステムの一例を示す。
図6は、x軸のインプットcfDNA量の関数としての、y軸の特有の分子のカウントを示す例示的飽和曲線を図解する。
本発明の様々な実施形態を本明細書において示し、記載してきたが、当業者には、かかる実施形態が単なる一例として提供されていることが明らかである。当業者であれば、本発明から逸脱することなく多数のバリエーション、変化および置換を思いつくことができる。本明細書に記載されている本発明の実施形態の様々な代替を用いることができることを理解されたい。
定義
用語「遺伝的バリアント」は、本明細書において、被験体の核酸試料またはゲノムにおける変更、バリアントまたは多型を一般に指す。かかる変更、バリアントまたは多型は、被験体または他の個体の参照ゲノムであり得る参照ゲノムに関するものであり得る。一塩基多型(SNP)は、多型の一形態である。一部の例では、1個または複数の多型は、1個または複数の一塩基変異(SNV)、挿入、欠失、反復、小規模な挿入、小規模な欠失、小規模な反復、構造的バリアント接合部、可変長タンデム反復および/または隣接配列を含む。コピー数変異(CNV)、トランスバージョンおよび他の再編成も、遺伝的変異の形態である。ゲノム変更は、塩基変化、挿入、欠失、反復、コピー数変異またはトランスバージョンであり得る。
用語「ポリヌクレオチド」または「ポリ核酸」は、本明細書において、1個または複数の核酸サブユニット(「核酸分子」)を含む分子を一般に指す。ポリヌクレオチドは、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)またはこれらのバリアントから選択される1個または複数のサブユニットを含むことができる。ヌクレオチドは、A、C、G、TもしくはUまたはこれらのバリアントを含むことができる。ヌクレオチドは、伸びている核酸鎖に取り込まれ得るいずれかのサブユニットを含むことができる。かかるサブユニットは、A、C、G、TまたはU、あるいは1個もしくは複数の相補的A、C、G、TもしくはUに特異的な、またはプリン(すなわち、AもしくはGまたはこれらのバリアント)もしくはピリミジン(すなわち、C、TもしくはUまたはこれらのバリアント)に相補的な、他のいずれかのサブユニットであり得る。サブユニットの識別は、個々の核酸塩基または塩基群(例えば、AA、TA、AT、GC、CG、CT、TC、GT、TG、AC、CAまたはそれらのウラシル対応物)を分解することを可能にすることができる。一部の例では、ポリヌクレオチドは、デオキシリボ核酸(DNA)もしくはリボ核酸(RNA)またはこれらの誘導体である。ポリヌクレオチドは、一本鎖または二本鎖であり得る。
ポリヌクレオチドは、DNAおよび/またはRNA等、いずれの種類の核酸を含んでもよい。例えば、ポリヌクレオチドがDNAである場合、これは、ゲノムDNA、相補的DNA(cDNA)または他のいずれかのデオキシリボ核酸であってもよい。ポリヌクレオチドは、無細胞核酸であり得る。本明細書において使用されるとき、無細胞核酸および細胞外核酸という用語は、互換的に使用することができる。ポリヌクレオチドは、無細胞DNA(cfDNA)であってもよい。例えば、ポリヌクレオチドは、循環DNAであり得る。循環DNAは、循環腫瘍DNA(ctDNA)を含むことができる。無細胞または細胞外核酸は、全血、血小板、血清、血漿、滑液、リンパ液、腹水、間質もしくは細胞外液、細胞間間隙の液、歯肉溝滲出液、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿、子宮頸部液もしくは洗浄液、膣液もしくは洗浄液、乳腺もしくは洗浄液、および/またはそれらの任意の組合せを含むがこれらに限定されない、任意の体液から誘導され得る。一部の実施形態では、無細胞または細胞外核酸は、血漿から誘導することができる。一部の実施形態では、細胞を含む体液は、無細胞または細胞外核酸を精製および/または抽出するために細胞を取り出すように処理することができる。ポリヌクレオチドは、二本鎖または一本鎖であり得る。あるいは、ポリヌクレオチドは、二本鎖部分および一本鎖部分の組合せを含むことができる。
ポリヌクレオチドは、無細胞である必要はない。一部の事例において、ポリヌクレオチドは、試料から単離することができる。試料は、分析物を含む組成物であり得る。例えば、試料は、対象から単離された任意の生物学的試料であり得、例えば、体液、全血、血小板、血清、血漿、糞便、赤血球細胞、白血球細胞もしくは白血球、内皮細胞、組織生検、滑液、リンパ液、腹水、間質もしくは細胞外液、歯肉溝滲出液を含む細胞間間隙の液、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿または他のいずれかの体液、および/またはこれらの任意の組み合わせが挙げられるが、これらに限定されない。体液は、唾液、血液または血清を含むことができる。例えば、ポリヌクレオチドは、体液、例えば、血液または血清から単離された無細胞DNAであり得る。試料は、静脈穿刺、排泄、射精、マッサージ、生検、針穿刺吸引、洗浄、擦過、外科的切開もしくは介入または他のアプローチ等が挙げられるがこれらに限定されない、様々なアプローチによって対象から得ることができる腫瘍試料であってもよい。一部の実施形態では、試料は、核酸試料、例えば、精製された核酸試料である。一部の実施形態では、核酸試料は、無細胞DNA(cfDNA)を含む。試料中の分析物は、様々な精製段階であり得る。例えば、生の試料が、未精製の状態で分析物を含み得る対象から直接採取されてもよい。試料は、分析物について富化されてもよい。また分析物は、単離されたまたは実質的に単離された形態で試料中に存在してもよい。
ポリヌクレオチドは、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、副腎皮質癌、カポジ肉腫、肛門癌、基底細胞癌、胆管癌、膀胱癌、骨癌、骨肉腫、悪性線維性組織球腫、脳幹神経膠腫、脳癌、頭蓋咽頭腫、上衣芽細胞腫、上衣腫、髄芽腫、髄上皮腫(medulloeptithelioma)、松果体実質細胞腫瘍、乳癌、気管支腫瘍、バーキットリンパ腫、非ホジキンリンパ腫、カルチノイド腫瘍、子宮頸部癌、脊索腫、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、結腸癌、結腸直腸癌、皮膚T細胞リンパ腫、乳管内上皮内癌、子宮内膜癌、食道癌、ユーイング肉腫、眼癌、眼球内メラノーマ、網膜芽細胞腫、線維性組織球腫、胆嚢癌、胃癌、神経膠腫、ヘアリー細胞白血病、頭頸部癌、心臓癌、肝細胞(肝臓)癌、ホジキンリンパ腫、下咽頭癌、腎臓癌、喉頭癌、口唇癌、口腔癌、肺癌、非小細胞癌、小細胞癌、メラノーマ、口内(mouth)癌、骨髄異形成症候群、多発性骨髄腫、髄芽腫、鼻腔癌、副鼻腔癌、神経芽細胞腫、鼻咽頭癌、口腔内(oral)癌、中咽頭癌、骨肉腫、卵巣癌、膵臓癌、乳頭腫、傍神経節腫、副甲状腺癌、陰茎癌、咽頭癌、下垂体腫瘍、形質細胞新生物、前立腺癌、直腸癌、腎細胞癌、横紋筋肉腫、唾液腺癌、セザリー症候群、皮膚癌、非メラノーマ、小腸癌、軟部組織肉腫、扁平上皮癌、精巣癌、咽喉癌、胸腺腫、甲状腺癌、尿道癌、子宮癌、子宮肉腫、腟癌、外陰部癌、ワルデンシュトレームマクログロブリン血症および/またはウィルムス腫瘍などのがんに関連した配列を含み得る。
試料は、ゲノム当量を含む核酸の様々な量を含むことができる。例えば、約30ngのDNAの試料は、約10,000(10)の一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約2千億(2×1011)個の個々のポリヌクレオチド分子を含有することができる。同様に、約100ngのDNAの試料は、約30,000の一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約6千億個の個々の分子を含有することができる。
試料は、異なる供給源由来の核酸を含むことができる。例えば、試料は、生殖系列DNAまたは体細胞DNAを含むことができる。試料は、変異を保有する核酸を含むことができる。例えば、試料は、生殖系列変異および/または体細胞変異を保有するDNAを含むことができる。試料は、がん関連変異(例えば、がん関連体細胞変異)を保有するDNAを含むこともできる。
用語「被験体」は、本明細書において、哺乳動物種(例えば、ヒト)もしくは鳥類(例えば、トリ)種等の動物、または植物等の他の生物を一般に指す。より具体的には、被験体は、脊椎動物、哺乳動物、マウス、霊長類、サルまたはヒトであり得る。動物として、家畜、競技用動物(sport animal)およびペットが挙げられるがこれらに限定されない。被験体は、健康個体、疾患もしくは疾患素因を有するもしくはこれを有すると疑われる個体、または治療を必要とするもしくは治療を必要とすると疑われる個体であり得る。被験体は、患者であり得る。
用語「ゲノム」は、本明細書において、生物の遺伝情報の全体を一般に指す。ゲノムは、DNAまたはRNAのいずれかにおいてコードされ得る。ゲノムは、タンパク質をコードするコード領域と共に非コード領域を含むことができる。ゲノムは、生物における全染色体の配列を一体に含むことができる。例えば、ヒトゲノムは、総計46本の染色体を有する。これら全ての配列が一体に、ヒトゲノムを構成し得る。ゲノムは、二倍体または一倍体ゲノムを含み得る。
「ベイト」という用語は、本明細書において使用されるとき、目的の特定のゲノム領域(例えば、標的、または所定の目的のゲノム領域)を捕捉するように設計され、使用される標的特異的オリゴヌクレオチド(例えば、捕捉プローブ)を一般的に指す。ベイトは、相補的な核酸に選択的にハイブリダイズすることによってその意図する標的を捕捉し得る。
「ベイトパネル」または「ベイトセットパネル」という用語は、本明細書において使用されるとき、目的のゲノム領域の選択されたセットを標的としたベイトのセットを一般的に指す。ベイトパネルまたはベイトセットパネルは、ベイト混合物として参照される場合がある。ベイトパネルは、単一の選択的ハイブリダイゼーションステップでその意図する標的を捕捉し得る。
本明細書において使用されるとき、遺伝的バリアント(例えば、インデル)を検出する「精度」という用語は、一般に、生物学的起源に起因する(例えば、シーケンシングまたは増幅エラーから生じる導入されたエラーに起因しない)真の遺伝的バリアントとして同定される1つまたは複数の配列リードの分析を通して検出される候補(例えば、検出された)遺伝的バリアントの百分率を指す。本明細書において使用されるとき、遺伝的バリアント(例えば、インデル)を検出する「エラー率」という用語は、一般に、非生物学的起源(例えば、シーケンシングまたは増幅エラー)に起因する導入された遺伝的バリアントとして同定される1つまたは複数の配列リードの分析を通して検出される候補(例えば、検出された)遺伝的バリアントの百分率を指す。例えば、1つまたは複数の配列リードの分析が100の候補遺伝的バリアントを同定し、そのうち90が生物学的起源に起因し、10が非生物学的起源に起因するとき、この分析は、90%の遺伝的バリアント検出精度および10%のエラー率を有する。
参照数値に関する用語「約」およびその文法上の等価物は、該値から最大プラスまたはマイナス10%の値の範囲を含むことができる。例えば、「約10」の量は、9〜11の量を含むことができる。他の実施形態では、参照数値に関する用語「約」は、該値からプラスまたはマイナス10%、9%、8%、7%、6%、5%、4%、3%、2%または1%の値の範囲を含むことができる。
参照数値に関する用語「少なくとも」およびその文法上の等価物は、参照数値および該値を超えるものを含むことができる。例えば、「少なくとも10」の量は、10の値、ならびに11、100および1,000等、10を上回るいずれかの数値を含むことができる。
参照数値に関する用語「多くても」およびその文法上の等価物は、参照数値および該値に満たないものを含むことができる。例えば、「多くても10」の量は、10の値、ならびに9、8、5、1、0.5および0.1等、10を下回るいずれかの数値を含むことができる。
「処理すること」、「計算すること」および「比較すること」という用語は、互換的に使用することができる。これらの用語は、差異、例えば、数または配列の差異を決定することを指すことができる。例えば、遺伝子発現、コピー数多型(CNV)、インデル、および/または一塩基バリアント(SNV)値もしくは配列を処理することができる。
本開示は、無細胞核酸(例えば、デオキシリボ核酸(DNA))の多重解像度分析のための方法およびシステムであって、目的の標的ゲノム領域は、差次的タイリングおよび捕捉スキームを使用して1つまたは複数のベイトセットパネルについて選択された捕捉プローブ(「ベイト」)を用いて富化され得る、方法およびシステムを提供する。差次的タイリングおよび捕捉スキームは、異なる相対濃度のベイトセットを使用して、ベイトに関連するゲノム領域にわたって差次的に(例えば、異なる「解像度」で)タイルし、制約のセット(例えば、各ベイトのシーケンシングロード、有用性などのシーケンサー制約)にかけ、下流のシーケンシングについて所望のレベルで、目的の標的ゲノム領域を捕捉する。これらの目的の標的ゲノム領域は、一塩基バリアント(SNV)およびインデル(つまり、挿入または欠失)を含むことができる。目的の標的ゲノム領域は、目的のバックボーンゲノム領域(「バックボーン領域」)または目的のホット−スポットゲノム領域(「ホット−スポット領域」または「ホットスポット領域」または「ホット−スポット」または「ホットスポット」)を含み得る。「ホットスポット」が、配列バリアントに関連する特定の遺伝子座を指すことができる一方で、「バックボーン」領域は、それぞれが1つまたは複数の可能性のある配列バリアントを有し得る、より大きなゲノム領域を指すことができる。例えば、バックボーン領域は、1つまたは複数のがん関連変異を含む領域であり得、一方でホットスポットは、再発がんに関連する特定の変異を有する遺伝子座であり得る。目的のバックボーンおよびホットスポットゲノム領域の両方が、液体生検アッセイに通常含まれ、がんを有する対象においてその1つまたは複数のバリアントが見られると予測され得る、腫瘍関連マーカー遺伝子(例えば、BRAF、BRCA、EGFR、KRAS、PIK3CA、ROS1、TP53、および他のマーカー)を含み得る。
ベイトセットパネルに包含するために選択され得る腫瘍関連マーカー遺伝子のセットの中で、目的のホットスポットゲノム領域は、実験プロトコールにおける目的のバックボーンゲノム領域と比較して高い割合の配列リードによって表されるように選択され得る。この実験プロトコールは、単離、増幅、捕捉、シーケンシングおよびデータ分析などのステップを含み得る。ホットスポット領域またはバックボーン領域としての領域の選択は、それぞれの領域に関連する捕捉効率、シーケンシングロードおよび/または有用性、およびそれらに対応するベイトなどの考慮事項によって駆動され得る。有用性は、液体生検アッセイに向けた目的のゲノムマーカー(例えば、腫瘍マーカー)の臨床的意義(例えば、「臨床的価値」)、例えば、所定のがんドライバー変異、関連する患者コホートにわたって有病率を有するゲノム領域、経験的に同定されたがんドライバー変異、またはヌクレオソーム関連ゲノム領域などによって評価され得る。例えば、有用性は、試料の起源の組織もしくは疾患状態の決定に向けた検出または寄与における実用的および/または疾患関連遺伝的バリアントの予測される収率を表す測定基準によって測定することができる。有用性は、臨床的価値の単調増加関数であり得る。
無細胞核酸の所与の試料の各シーケンシングのランが、ある特定のリードの総数によって典型的には制限されることを考慮すると、バックボーン領域と比較して「ホット−スポット領域」について優先的に富化するベイトセットパネルを生成する多重解像度分析アプローチは、ホットスポット領域についてバックボーン領域に対するより高いリード深度でシーケンシングに焦点を当てることによって、がんの検出および評価の用途のための遺伝的バリアント検出のためのシーケンシングリードの効率的な使用を可能にする。このアプローチを使用することは、制限されたまたは制約のあるシーケンシングロード(例えば、アッセイされる試料当たりのシーケンシングされるリードの数)である場合、試料アッセイの改善を可能にし、最適化されていない試料アッセイと比較して、より大きな数の臨床的に行動指針を与え得る遺伝的バリアントを試料アッセイごとに検出し得る。
本開示は、対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成される方法を提供する。cfDNA分子に関連する複数の配列リードのそれぞれについて、候補インデルが同定され得る。次に、(i)複数の配列リードの1つまたは複数の配列リードで検出されるインデルの、(ii)インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが無細胞DNA分子の所与のcfDNA分子に存在する真のインデルである、および/または(iii)、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値の組み合わせを、1つまたは複数のモデルパラメータと併せて使用して、仮説検定を行い、各候補インデルは、真のインデルまたは導入されたインデルのいずれかとして分類され得る。このアプローチは、エラーを減少させ、配列リードデータからインデルを検出する精度を改善し得る。
序論
多重解像度分析の一実施形態は、以下のとおり進行する。ゲノムの複数の領域が、シーケンシングのために選択される。これらの領域は、パネルまたはパネルブロックとして集約的に参照され得る。パネルは、ゲノム領域の第1のセットとゲノム領域の第2のセットとに分割される。ゲノム領域の第1のセットは、バックボーン領域として参照され得、一方で、第2のセットは、ホットスポット領域として参照され得る。これらの領域は、実施者によって所望されるように、遺伝子間で、遺伝子内で、または遺伝子外で分割することができる。例えば、遺伝子のエクソンは、ホットスポット領域に割り当てられた部分とバックボーン領域に割り当てられた部分とに分割することができる。
第1のゲノム領域および第2のゲノム領域にそれぞれ選択的にハイブリダイズする第1のベイトセットおよび第2のベイトセットが調製される。本明細書に記載される方法、例えば、滴定曲線の調製を使用して、所定量のDNAを有する試験試料について、飽和点で(ホットスポット領域に向けたベイトセットのため)および飽和点未満で(バックボーン領域に向けたベイトセットのため)、試料中のDNAを捕捉する複数のベイトセット濃度が決定される。飽和点で試料からDNA分子を捕捉することは、分子遺伝的バリアントがより捕捉されやすいので、最高レベルの感度で遺伝的バリアントを検出することに寄与する。
試料から得ることができるシーケンシングデータの量は有限であり、核酸鋳型の質、標的配列の数、特異的配列の希少性、シーケンシング技術の制限、ならびに時間および費用などの実際的考慮事項のような因子によって制約される。そのように「リードバジェット」は、試料から抽出することができる遺伝子情報の量を概念化する一つの方法である。シーケンシング実験において所定量のDNAを含む試験試料に割り当てられる塩基リードの総数を同定する、試料ごとのリードバジェットも選択し得る。リードバジェットは、例えば、増幅を通して生成される冗長なリードを含む、得られる総リードに基づくものでもよい。代替的に、リードバジェットは、試料で検出される特有の分子の数に基づくものでもよい。ある特定の実施形態では、リードバジェットは、遺伝子座でのコールのための二本鎖支持体の量を反映することができる。つまり、DNA分子の両方の鎖からそのリードについての遺伝子座の百分率が検出される。
リードバジェットの因子は、リード深度およびパネル長を含む。例えば、3,000,000,000リードのリードバジェットは、20,000リード/塩基の平均リード深度で150,000塩基として割り当てることができる。リード深度は、遺伝子座でリードを生じる分子の数を指すことができる。本開示では、各塩基でのリードは、第1の平均リード深度でのパネルのバックボーン領域の塩基と、より深いリード深度でのパネルのホットスポット領域の塩基との間に割り当てることができる。
非限定的な例として、リードバジェットが所与の試料について100,000のリードのカウントからなる場合、これらの100,000のリードカウントは、バックボーン領域のリードとホットスポット領域のリードとに分割される。これらのリードの大多数(例えば、90,000リード)をバックボーン領域に割り当てると、リードの少数(例えば、残りの10,000リード)がホットスポット領域に割り当てられることになる。逆に、リードの大多数(例えば、90,000リード)をホットスポット領域に割り当てると、リードの少数(例えば、残りの10,000リード)がバックボーン領域に割り当てられることになる。そのように、熟練した作業者は、所望のレベルの感度および特異性を提供するように、リードバジェットを割り当てることができる。ある特定の実施形態では、リードバジェットは、例えば20,000塩基〜100,000塩基にわたって、100,000,000リード〜100,000,000,000リード、例えば500,000,000リード〜50,000,000,000リード、または1,000,000,000リード〜5,000,000,000リードであり得る。
第1および第2の感度レベルは、それぞれ、バックボーンおよびホットスポット領域における遺伝的バリアントの検出のために選択される。感度は、本明細書において使用されるとき、試料における頻度の関数としての遺伝的バリアントの検出限界を指す。例えば、感度は、少なくとも1%、少なくとも0.1%、少なくとも0.01%、少なくとも0.001%、少なくとも0.0001%、または少なくとも0.00001%であり得、それぞれ、所与の配列が、少なくとも1%、少なくとも0.1%、少なくとも0.01%、少なくとも0.001%、少なくとも0.0001%、または少なくとも0.00001%の頻度で試料中で検出することができることを意味する。つまり、レベルで試料に存在する遺伝的バリアントは、シーケンシングによって検出可能である。典型的には、ホットスポット領域について選択される感度は、バックボーン領域について選択される感度よりも高い。例えば、ホットスポット領域の感度レベルは少なくとも0.001%で選択することができ、一方でバックグラウンド領域の感度レベルは少なくとも0.1%または少なくとも1%であり得る。
バックグラウンド領域およびホットスポット領域に向けたベイトセットの相対濃度は、選択された試料のバックボーンおよびホットスポット領域について選択されたリードバジェットおよび選択された感度について、シーケンシング実験におけるリードを最適化するように選択することができる。そのように、例えば、所定量のDNAを含む試験試料と、飽和でホットスポット領域についてのDNAを捕捉するホットスポットベイトセットとがあると、試料について飽和未満であるバックボーンベイトセットの量が、選択されたリードバジェット内でリードを生じるシーケンシング実験において、得られるリードセットが、予め選択された感度レベルで、ホットスポット領域およびバックボーン領域にある遺伝的バリアントを検出するように選択される。
ベイトセットの相対量は、いくつかの因子の関数である。これらの因子の1つは、ホットスポット領域およびバックボーン領域にそれぞれ割り当てられたパネルの相対的な割合である。パネルにおけるホットスポット領域の相対百分率が大きくなるほど、バックボーン領域に割り当てることができるリードおよびバジェットの数は少なくなる。別の因子は、ホットスポット領域について選択される検出感度である。所与の試料について、ホットスポット領域のために必要な感度が高くなるほど、バックボーン領域のための感度は低くなる。別の因子は、リードバジェットである。ホットスポット領域のための感度について、リードバジェットが小規模になるほど、バックボーン領域のための可能な感度は低くなる。別の因子は、パネル全体のサイズである。任意の所与のリードバジェットについて、パネルが大規模になるほど、バックボーン領域のさらなる感度を、ホットスポット領域で所望の感度を達成するために犠牲にしなければならない。
任意の所与のリードバジェットについて、バックボーン領域へ割り当てられるリードの百分率を増加させることが、ホットスポット領域での検出感度を低下させることは、明らかである。逆に、ホットスポット領域に割り当てられるリードバジェットの量を増加させることによって、ホットスポット領域での検出感度を増加させることは、バックボーン領域の検出を低下させる。したがって、ホットスポット領域の相対感度レベルは標的検出レベルを達成するために十分に高くし得るが、バックボーン領域の感度レベルは、遺伝的バリアントの有意なレベルが見逃されるほど低くない。これらの相対レベルは、所望の結果が達成されるように、実施者によって選択される。一部の実施形態では、熟練した作業者は、捕捉される領域のリード深度が所望のホットスポット感度およびバックボーン感度を提供するように、試料中のホットスポット領域の全て(または実質的に全て)およびバックボーン領域の一部を捕捉するように計算されたベイト混合物を使用する。
ヌクレオソーム関連ゲノム領域
一態様では、ベイトセットパネルは、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化する1つまたは複数のベイトセットを含み得る。ヌクレオソーム関連領域は、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み得る。差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴であり得る。差異のあるヌクレオソーム占有の分析は、所与の細胞または組織型の1つまたは複数のヌクレオソーム占有プロファイルを使用して行われ得る。ヌクレオソーム占有プロファイリング技術の例としては、参照によって本明細書に組み込まれる、Stathamら、Genomics Data、第3巻、2015年3月、94〜96頁(2015年)が挙げられる。対象から取得された試料における無細胞核酸は、細胞、組織および器官におけるアポトーシスおよび壊死プロセスの組合せを介して主に流出され得る。ゲノムのある特定の位置における可変のヌクレオソーム占有およびDNA切断に対する保護の結果として、アポトーシスプロセスおよび壊死プロセスに関連するヌクレオソームパターンまたはプロファイルは、ゲノムのヌクレオソーム関連領域について無細胞核酸断片を分析することから明らかになり得る。
そのようなヌクレオソーム関連パターンの検出は、独立して、または検出された体細胞バリアントと組み合わせて、対象における状態をモニタリングするために使用することができる。例えば、腫瘍が拡大するとき、腫瘍微小環境における壊死対アポトーシスの比率は変化し得る。壊死および/またはアポトーシスのそのような変化は、1つまたは複数のヌクレオソーム関連領域について無細胞核酸試料を選択的に富化することによって検出することができる。別の例として、断片の長さの分布が、異なる細胞の種類にわたるまたは腫瘍対非腫瘍細胞にわたる差異のあるヌクレオソームの保護により観察され得る。断片の長さの分布についてのヌクレオソーム関連領域の分析は、がんの検出および評価の用途について臨床的に関連し得る。この分析は、ヌクレオソーム関連領域について選択的に富化すること、次いで核酸試料を表す複数の配列リードを生ずるために、富化された領域をシーケンシングすること、および目的の遺伝的バリアントおよびヌクレオソームプロファイルについて配列リードを分析することを含み得る。
ヌクレオソーム関連領域が同定されると、それをモジュラパネルの設計のために使用することができる。下記を参照されたい。そのようなモジュラパネルの設計は、ヌクレオソームプロファイリングに関連するゲノムの領域を選択的に富化するプローブまたはベイトのセットの設計を可能にし得る。この「ヌクレオソームアウェアネス」を組み込むことによって、多くの個体からの配列データを収集して、パネルの設計の手順、例えば、標的とするゲノム位置の決定およびこれらのゲノム位置のためのプローブの最適濃度を最適化することができる。
体細胞多型および構造多型の両方ならびに不安定性の知識を組み込むことによって、プローブ、ベイトまたはプライマーのパネルを、構造多型または不安定性の公知のパターンまたはクラスターを有するゲノムの特定の部分(「ホットスポット」)を標的とするように設計することができる。例えば、配列データの統計学的分析により、一連の蓄積された体細胞事象および構造多型が明らかになり、それにより、クローン進化の研究が可能になる。データ分析は、コホートにわたる差異のあるカバレッジ、腫瘍のある特定のサブセットの存在を示すパターン、高い体細胞変異負荷を有する試料の外来構造的事象、および血液細胞と腫瘍細胞との対比から生じる差異のあるカバレッジを含む重要な生物学的洞察を明らかにする。
局在化ゲノム領域は、およそまたは2〜200塩基対、2〜190塩基対、2〜180塩基対、2〜170塩基対、2〜160塩基対、2〜150塩基対、2〜140塩基対、2〜130塩基対、2〜120塩基対、2〜110塩基対、2〜100塩基対、2〜90塩基対、2〜80塩基対、2〜70塩基対、2〜60塩基対、2〜50塩基対、2〜40塩基対、2〜30塩基対、2〜20塩基対、2〜10塩基対、および/または2〜5塩基対の長さの範囲であり得るゲノムの短い領域を指す。各局在化ゲノム領域は、有意な構造多型または不安定性のパターンまたはクラスターを含み得る。ゲノムパーティションマップが、関連する局在化ゲノム領域を同定するために提供され得る。局在化ゲノム領域は、有意な構造多型または構造不安定性のパターンまたはクラスターを含み得る。クラスターは、局在化ゲノム領域内のホットスポット領域であり得る。ホットスポット領域は、1つまたは複数の有意な変動またはピークを含み得る。構造多型は、挿入、欠失、転位、遺伝子再編成、メチル化状態、マイクロサテライト、コピー数多型、コピー数関連構造多型、または鑑別を示す任意の他の多型からなる群から選択され得る。構造多型は、ヌクレオソームポジショニングに多型を生じ得る。
ゲノムパーティションマップは、(a)コホートにおける2つまたはそれより多い対象由来の無細胞DNAまたはRNAを提供すること、(b)無細胞DNAまたはRNAの試料のそれぞれから複数の配列リードを取得すること、および(c)複数の配列リードを分析することであって、それぞれ有意な構造多型または不安定性のパターンまたはクラスターを含む1つまたは複数の局在化ゲノム領域を同定することによって得ることができる。配列情報に統計学的分析を行って、配列リードのセットを、別個のコホート(例えば、疾患状態または非疾患状態などの共通の特徴を有する対象の一群)を表す1つまたは複数のヌクレオソーム占有プロファイルと関連づけてもよい。
統計学的分析は、さらなる分析のために、目的の遺伝子を表す関連ゲノム区間を列挙する1つまたは複数のゲノムパーティションマップを含んでもよい。統計学的分析は、ゲノムパーティションマップに基づいて、セットの1つまたは複数の局在化ゲノム領域を選択することをさらに含んでもよい。統計学的分析は、1つまたは複数のヌクレオソームマップ破損のセットを取得するために、1つまたは複数の局在化ゲノム領域のセットを分析することをさらに含んでもよい。統計学的分析は、1つまたは複数の(例えば、1つまたは複数、2つまたはそれより多い、または3つの)パターン認識、深層学習、および教師なし学習を含んでもよい。
ヌクレオソームマップ破損は、生物学的に関連する情報に関して、所与の局在化ゲノム領域を特徴づける測定値である。ヌクレオソームマップ破損は、野生型、体細胞バリアント、生殖細胞系列バリアント、およびDNAのメチル化からなる群から選択されるドライバー変異に関連し得る。
1つまたは複数のヌクレオソームマップ破損を使用して、配列リードのセットを、別個のコホートを表す1つまたは複数のヌクレオソーム占有プロファイルに関連するとして分類してもよい。これらのヌクレオソーム占有プロファイルは、1つまたは複数の評価を伴い得る。評価は、治療介入(例えば、処置オプション、処置の選択、生検および/またはイメージングによるさらなる評価)の一部として考慮され得る。
評価は、適応症、腫瘍の種類、腫瘍の重症度、腫瘍の侵襲性、処置に対する腫瘍の耐性、および腫瘍クローン性からなる群から選択され得る。腫瘍クローン性の評価は、試料中の無細胞DNA分子にわたるヌクレオソームマップ破損の不均一性の観察から決定され得る。2つまたはそれより多いクローンのそれぞれの相対的寄与の評価が決定される。
ベイトセットパネルの1つまたは複数のヌクレオソーム関連領域はそれぞれ、(i)ヌクレオソームポジショニングの多型を含む顕著な構造多型であり、挿入、欠失、転位、遺伝子再編成、メチル化状態、マイクロサテライト、コピー数多型、コピー数関連構造多型、または区別を示す任意の他の多型からなる群から選択される構造多型、および(ii)ゲノム中のヌクレオソームマップ破損の1つまたは複数の位置を示すゲノムパーティションマップにおける1つまたは複数の顕著な変動またはピークを含む不安定性の少なくとも1つを含み得る。ベイトセットパネルの1つまたは複数のベイトセットは、1つもしくは複数の疾患状態および1つもしくは複数の非疾患状態に関連する複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成され得る。
ベイトセットパネルの1つまたは複数のベイトセットは、無細胞デオキシリボ核酸(cfDNA)試料における1つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。例えば、ベイトセットは、核酸試料(nucleic sample)をベイトセットに接触させること、およびベイトセットをベイトセットに関連するヌクレオソーム関連ゲノム領域のセットに選択的にハイブリダイズさせることによって、1つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。
ある態様では、ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法は、(a)核酸試料をベイトセットパネルに接触させるステップであって、前記ベイトセットパネルがゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化する1つまたは複数のベイトセットを含む、ステップと、(b)ゲノムの1つまたは複数のヌクレオソーム関連領域について核酸試料を富化するステップとを含み得る。ベイトセットパネルにおける1つまたは複数のベイトセットは、1つもしくは複数の疾患状態および1つもしくは複数の非疾患状態に関連する複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成され得る。複数の参照ヌクレオソーム占有プロファイルは、その分析によってヌクレオソーム関連バリアント検出の捕捉のための標的であり得るゲノム領域および/または位置のパターンもしくはクラスターを示し得る「マップ」として機能し得る。
ベイトセットパネルにおける1つまたは複数のベイトセットは、無細胞デオキシリボ核酸(cfDNA)試料における1つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法は、ゲノムのヌクレオソーム関連領域の配列リードを生ずるために、富化された核酸をシーケンシングするステップをさらに含み得る。これらの配列リードを、参照ゲノムに整列させて、ヌクレオソーム関連および/または遺伝的バリアント(例えば、SNVおよび/またはインデル)について分析してもよい。
一態様では、ベイトセットを生成するための方法は、(a)ヌクレオソームプロファイルに関連する1つまたは複数のゲノム領域を同定するステップと、(b)前記領域を選択的に捕捉するベイトセットを選択するステップとを含み得る。ベイトセットパネルにおけるベイトセットは、無細胞デオキシリボ核酸(cfDNA)試料における1つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。例えば、ベイトセットは、核酸試料をベイトセットに接触させること、およびベイトセットをベイトセットに関連するヌクレオソーム関連ゲノム領域のセットと選択的にハイブリダイズさせることによって、1つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。
複数のゲノム領域の富化のためのベイトパネル
ある態様では、ベイトパネルは、所定量のDNAを含む核酸試料のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、第1のベイトセットの飽和点未満である第1の濃度比で提供され得る、第1のベイトセットと、核酸試料のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、第2のベイトセットの飽和点に関連する第2の濃度比で提供され得る、第2のベイトセットとを含み得る。本明細書において使用されるとき、飽和点に関連する濃度は、飽和点か、またはそれより高い濃度であり得る。一部の実施形態では、飽和点に関連する濃度は、飽和点を10%下回る点か、またはそれより高い濃度である。ゲノム領域の第1のセットは、1つまたは複数のバックボーンゲノム領域を含み得る。ゲノム領域の第2のセットは、1つまたは複数のホットスポットゲノム領域を含み得る。DNAの所定量は、約200ng、約150ng、約125ng、約100ng、約75ng、約50ng、約25ng、約10ng、約5ng、および/または約1ngであり得る。
ある態様では、複数のゲノム領域について富化するための方法は、所定量の核酸試料を、(i)核酸試料のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、第1のベイトセットの飽和点未満である第1の濃度比で提供され得る第1のベイトセットと、(ii)核酸試料のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、第2のベイトセットの飽和点と関連する第2の濃度比で提供され得る第2のベイトセットとを含むベイトパネルと接触させるステップと、ゲノム領域の第1のセットおよびゲノム領域の第2のセットについて核酸試料を富化するステップとを含み得る。
富化は、次の:(a)試料核酸をベイトセットに接触させるステップと、(b)核酸をベイトセットにおけるプローブとハイブリダイズさせることによって試料から核酸を捕捉するステップと、(c)捕捉された核酸と捕捉されていない核酸とを分離するステップとを含むことができる。
このアプローチを使用してゲノム領域の第2のセットをそのベイトセットの飽和点で捕捉することは、ゲノム領域の第2のセット(例えば、ホットスポット領域)のバリアントを高感度に検出し得、一方で、ゲノム領域の第1のセットをそのベイトセットの飽和点未満で捕捉することは、ゲノム領域の第1のセット(例えば、バックボーン領域)について望ましい場合がある。異なるベイトセットの捕捉をそれらの飽和レベルまたはそれより低いレベルで調節するこの方法の柔軟性は、シーケンシングロードおよび有用性などのそれぞれのゲノム領域の特徴がある場合、ホットスポットまたはバックボーンベイトセットパネルについて目的のゲノム領域を戦略的に選択することに生かされ得る。
方法は、ゲノム領域の第1のセットおよびゲノム領域の第2のセットの複数の配列リードを生ずるように富化された核酸をシーケンシングするステップをさらに含んでもよい。これらの配列リードは、がんの検出および評価の用途のためにがん関連遺伝的バリアント(例えば、SNVおよびインデル)について分析し得る。
熟練した作業者は、飽和点が、結合動態の飽和を指すことを認識する。本質的に、ベイト(またはベイトのセット)の濃度が増加するとき、ベイト(またはベイトのセット)に結合する標的の量も増加する。しかしながら、所与の試料における標的の量は固定されており、したがって、ある特定の点で、試料中の標的の実質的に全てがベイト(またはベイトのセット)に結合する。したがって、ベイト濃度がこの点を超えて増加すると、結合標的の量は、系が結合平衡に近づく(ベイト分子が標的分子に結合し、それを放出する速度が収束し始める)ので、実質的に増加しない。
飽和点は、その点での濃度または量の増加が、試料から捕捉される標的物質の量を実質的に増加させない点でのベイトの濃度または量を指し、例えばベイトの濃度の増加が、捕捉された標的物質の総量の増加を次第に大きく減少させる点である。一部の実施形態では、ベイトの濃度または量の増加が、試料から捕捉される標的物質の量を実質的に増加させない点は、その点でのベイトの濃度または量の増加が、試料から捕捉される標的の量の増加を生じない点である。飽和点は、捕捉される標的核酸の量をベイトセットの濃度を増加させながら測定する飽和曲線の変曲点であり得る。例えば、飽和点は、ベイト濃度の100%の増大(例えば、2Xまたは2倍の濃度)が、捕捉される標的の量を、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、または1%未満のいずれかだけ増大させる点であり得る。一部の実施形態では、ベイト濃度の50%の増大(例えば、1.5Xまたは1.5倍の濃度)は、捕捉される標的の量を、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、または1%未満のいずれかだけ増大させる。一部の実施形態では、ベイト濃度(例えば、1.2X)の20%の増大は、捕捉される標的の量を、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、または1%未満のいずれかだけ増大させる。一部の実施形態では、ベイト濃度の10%の増大(例えば、1.1X)は、捕捉される標的の量を、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、または1%未満のいずれかだけ増大させる。
別の例として、飽和点は、ベイト濃度の100%の増大(例えば、2Xまたは2倍の濃度)が、捕捉される標的の量を多くとも20%だけ増大させる点であり得る。飽和点は、ベイト濃度の50%の増大(例えば、1.5Xまたは2倍の濃度)が、捕捉される標的の量を多くとも20%だけ増大させる点であり得る。飽和点は、ベイト濃度の20%の増大(例えば、1.2Xまたは2倍の濃度)が、捕捉される標的の量を多くとも20%だけ増大させる点であり得る。飽和点は、ベイト濃度の10%の増大(例えば、1.1Xまたは2倍の濃度)が、捕捉される標的の量を多くとも20%だけ増大させる点であり得る。
飽和曲線は、例えば、異なる量の標的核酸を、固定量または変動量のベイト(例えば、マイクロアレイに固定されたベイト)について滴定して、ベイトに結合された標的核酸の量(例えば、特有の分子の数を含む)を測定することによって生成することができる。また飽和曲線は、例えば、異なる量のベイトを、標的核酸の固定量または変動量について滴定して、ベイトに結合された標的核酸の量(例えば、特有の分子の数を含む)を測定することによって生成することができる。一部の実施形態では、飽和曲線は、捕捉された標的核酸(例えば、特有の分子のカウント)の指標として配列リードのサブセットを使用して生成することができる。例えば、配列リードは、一本鎖支持体を有するもの(特有のリードの群内の全てのリードが、DNAなどの二本鎖核酸の同じ元の核酸鎖に由来するとき)か、または二本鎖支持体を有するもの(特有のリードの群内のリードが、DNAなどの二本鎖核酸の元の核酸鎖の両方に由来するとき)として分類することができる。二本鎖支持体について選択する実施形態では、熟練した作業者は、両方の鎖が観測される、捕捉された特有の分子のみをカウントすることを理解する。二本鎖支持体は、例えば、核酸の2つの異なる鎖のそれぞれが、それぞれの鎖についてのリードが別個にカウントされ得るように差次的にタグ付けすることによって決定することができる。一部の実施形態では、二本鎖支持体を有する標的核酸は、一本鎖支持体を有するベイトについて必要とされるであろうよりも、その標的について飽和に達するために、より多量のベイトを必要とする。
図6は、x軸のインプットベイト量の関数としてのy軸の特有の分子のカウントを示す例示的飽和曲線を示す。各インプット量(ベイト溶液の一連の体積として示される)で、ベイトパネルの量を滴定して曲線を生成した。例示的実験滴定曲線設計を、下記表1および表2に示す。特有の配列リードの数とインプットベイト量との対比を使用して、図6に示すような滴定曲線を生成することができる。
図6のような滴定曲線を使用して、当業者は、飽和点を計算することができる。例えば、体積0.8Xを見るに、特有の分子のカウントは、およそ2700である。2Xベイトの量(体積1.6X)で、特有の分子のカウントは、およそ3200であり、差異は500である。このように、ベイトの量の倍加は、約18.5%の捕捉の増加をもたらす。対照的に、体積2Xでは、特有の分子のカウントは、およそ3250であり、1μlで、特有の分子のカウントはおよそ3500であり、差異は250である。ベイトの量の倍加は、ここでは、約7.7%の捕捉の増加しかもたらさない。したがって、ベイト濃度での100%の増加が8%未満だけ捕捉された標的の量を増加させる飽和点の使用を期待する当業者は、飽和点として体積2Xのベイトを使用し得る。
飽和点において、ベイトセットは、試料中の標的配列のうちの少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、および/または少なくとも99%のいずれかを捕捉し得る。飽和点は、その用語が使用される文脈に応じて、ベイトセットの飽和点または特定のベイトの飽和点を指すことができる。
ベイトセットの飽和点は、以下の方法:(a)ベイトセットのベイトのそれぞれについて、(i)所与の量のインプット試料(例えば、試験試料)上のベイトの捕捉効率をベイトの濃度の関数として測定すること、および(ii)滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定することを含む滴定曲線を生成すること、ならびに(b)ベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を選択することであって、それによりベイトセットの飽和点を決定することによって決定され得る。飽和点の選択は、ベイトの捕捉効率および関連するコストによって影響を受ける場合があり、飽和点での濃度は、所望の捕捉効率を達成するために十分高くあり得るが、一方で確実に合理的なアッセイ試薬の費用とするために依然として低いものであり得る。
ベイトの捕捉効率は、(a)コホートにおける複数の対象から得られた複数の核酸試料を提供すること、(b)ベイトの複数の濃度のそれぞれで、ベイトを核酸試料のそれぞれとハイブリダイズさせること、(c)ベイトの複数の濃度のそれぞれで、ベイトを用いて核酸試料の複数のゲノム領域を富化すること、および(d)ベイトの複数の濃度のそれぞれで捕捉効率を表す、元の二本鎖核酸分子の両方の鎖を表す特有の核酸分子または核酸分子の数を測定することによって決定され得る。典型的には、ベイトの捕捉効率(例えば、捕捉されるベイトの標的ゲノム領域を含む分子の、そのような分子を含む試料からの百分率)は、変曲点に達するまで濃度に伴って急激に増加し、その後は、捕捉された分子の百分率は、かなりゆっくりと増加する。
変曲点は、観測された捕捉効率が、第1の濃度より大きいベイトの濃度で有意に増加しないような、ベイトの第1の濃度であり得る。変曲点は、(1)第1の濃度の2倍のベイト濃度での捕捉効率を(2)第1のベイト濃度での捕捉効率と比較して観測される増加が、約1%未満、約2%未満、約3%未満、約4%未満、約5%未満、約6%未満、約7%未満、約8%未満、約9%未満、約10%未満、約12%未満、約14%未満、約16%未満、約18%未満、約20%未満、約30%未満、約40%未満、または約50%未満であるような、ベイトの第1の濃度であり得る。そのような同定された変曲点は、ベイトに関連する飽和点と考えることができる。ベイトは、アッセイにおける飽和点の濃度で使用して標的ゲノム領域の最適な捕捉を可能にし、したがって標的ゲノム領域の遺伝的バリアントを検出する感度を最適にすることができる。一部の実施形態では、ベイトセットに関連する飽和点は、ベイトセットにおける最も弱いベイトの飽和点である。例えば、ベイトセットは、ベイトセットのベイトを、(i)ベイトセットのベイトの捕捉効率を、ベイトの濃度の関数として測定すること、および(ii)滴定曲線内の変曲点を同定し、それにより、ベイトに関連する飽和点を同定することによって生成される滴定曲線に供するとき、そのベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する。ベイトセットにおける各ベイトが少なくともその飽和点である第1の濃度である場合、ベイトセットは、標的配列の観測された捕捉効率が第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の20%未満で増加するように標的配列を捕捉している。
核酸試料は、無細胞核酸試料(例えば、cfDNA)であり得る。一実施形態では、複数のゲノム領域を富化するための方法は、複数の配列リードを生ずるために、富化された核酸試料をシーケンシングするステップをさらに含み得る。複数のゲノム領域を富化するための方法は、核酸試料を表す核酸配列を含む出力を生じるステップをさらに含み得る。この核酸配列は、次いで参照ゲノムについて整列され、バイオインフォマティクスアプローチを通じて、がん関連遺伝的バリアントについて分析され得る。
元の分子は、例えば、アンプリコンの増幅およびシーケンシング後、または同じ分子の反復シーケンシングによって、冗長配列リードを生ずる場合がある。元の分子由来の冗長配列リードは、元の分子の配列を表すコンセンサス配列(例えば、「特有の配列」)へと崩壊させることができる。これは、分子の一部についてまたは分子の単一ヌクレオチド位置(コンセンサスヌクレオチド)で、完全な分子に対するコンセンサス配列を生成することによって行うことができる。本明細書において使用されるとき、「シーケンシングを行ったポリヌクレオチド」は、元の分子のアンプリコンから生成された配列リードまたはそのようなアンプリコンから誘導された元の分子のコンセンサス配列のいずれかを指す。特有のリードは、他の全てのリードと異なるリードである。リードは、元の分子の配列に基づいて、または元の分子の配列プラス元の分子に付着した1つまたは複数のバーコード配列に基づいて特有であり得る。例えば、2つの同一の元の分子は、バーコードが異なっている場合、特有のリードを生じることができる。同様に、2つの異なる元の分子は、たとえそれらのバーコードが同じであっても、特有のリードを生じる。コンセンサス配列は、特有のリードを群分けすることによって生成されるとき、特有の配列であり得る。
ある態様では、ベイトパネルは、ゲノムのバックボーン領域を選択的に捕捉する第1のセットであって、前記バックボーン領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各バックボーン領域の順位付け関数が、所定の閾値未満の値を有する、第1のセットと、ゲノムのホットスポット領域を選択的に捕捉する第2のベイトセットであって、前記ホットスポット領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各ホットスポット領域の順位付け関数が所定の閾値より大きいまたはそれと等しい値を有する、第2のベイトセットとを含み得る。このアプローチは、バックボーン領域およびホットスポット領域に対応する少なくとも2つのベイトセットを使用し得る。
ホットスポット領域は、相対的に高い有用性および/または相対的に低いシーケンシングロードに起因して、所与の無細胞核酸試料において捕捉および分析することが、バックボーン領域よりも相対的により重要であり得る。ホットスポット領域またはバックボーン領域としての所与の領域の選択は、シーケンシングロードおよび有用性の関数として計算されるその順位付け関数値に依存する。順位付け関数値は、ゲノム領域のシーケンシングロードで割ったゲノム領域の有用性として計算し得る。
バックボーン領域またはホットスポット領域は、1つまたは複数のヌクレオソーム情報領域を含み得る。ヌクレオソーム情報領域は、最大ヌクレオソーム鑑別の領域を含み得る。ベイトパネルは、疾患情報領域を選択的に捕捉する第2のベイトセットをさらに含み得る。第1のベイトセットのベイトは、第1の濃度(例えば、ベイトパネルに対する第1の濃度)であり得、第2のベイトセットのベイトは、第2の濃度(例えば、ベイトパネルに対する第2の濃度)であり得る。
一態様では、ベイトセットを生成するための方法は、1つまたは複数の目的のバックボーンゲノム領域を同定するステップであって、1つまたは複数の目的のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含み得る、ステップと、1つまたは複数の目的のホットスポットゲノム領域を同定するステップと、目的のバックボーンゲノム領域を選択的に捕捉する第1のベイトセットを創製するステップと、目的のホットスポットゲノム領域を選択的に捕捉する第2のベイトセットを創製するステップとを含み得る。第2のベイトセットは、第1のベイトセットより高い捕捉効率を有し得る。
1つまたは複数のホットスポットは、次の:(i)前記ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、(ii)所定の1つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、(iii)関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに(iv)経験的に同定されたがんドライバー変異の1つまたは複数(例えば、このうちの1つまたはそれより多く、2つまたはそれより多く、3つまたはそれより多く、あるいは4つ)を使用して選択され得る。
1つまたは複数の目的のホットスポットを同定するステップは、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためにプログラムされたコンピュータプロセッサを使用することを含み得る。1つまたは複数の目的のバックボーンゲノム領域を同定するステップは、目的のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすることを含み得る。1つまたは複数の目的のホットスポットゲノム領域を同定するステップは、目的のコホートにおける1つまたは複数の対象から取得される試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度(MAF)値またはそのMAFによって測定されたバリアントのクローン性のセットを利用することを含み得る。目的のコホートにおける相対的に高いMAF値を有するゲノム領域は、検出、細胞の種類もしくは組織もしくは起源、腫瘍負荷および/または処置の有効性などのがん関連評価を示し得るので、適切なホットスポットであり得る。
ゲノム領域のシーケンシングロードは、(i)塩基対におけるゲノム領域のサイズ、(ii)ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、(iii)ゲノム領域の配列バイアスの結果としての相対カバレッジ、(iv)ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および(v)ゲノム領域の捕捉バイアスの結果としての相対カバレッジの1つまたは複数(例えば、このうちの1つまたはそれより多く、2つまたはそれより多く、3つまたはそれより多く、4つまたはそれより多く、あるいは5つ)を一緒に乗算することによって計算され得る。この指標を、ベイトパネルセットにおける各ゲノム領域について計算して、核酸試料由来のゲノム領域に関連する配列リードの生成に伴う「コスト」を同定し得る。
ゲノム領域のシーケンシングロードは、塩基対におけるゲノム領域のサイズに正比例する。ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率は、ゲノム領域のシーケンシングロードにも影響を与えるが、その理由は、一部のゲノム領域が、確実なシーケンシングを行うことが格別に困難な場合があり(例えば、高いGC含量または高度に反復した配列の存在)、したがってベイトの所望の解像度で分析するために、より高いシーケンシング深度を必要とし得るためである。同様に、ゲノム領域の配列バイアス、増幅バイアスおよび/または捕捉バイアスの結果としての相対カバレッジは、ゲノム領域のシーケンシングロードにも影響を与え得る。次いで、所与のアッセイのシーケンシングランの全シーケンシングロードは、アッセイの選択されたベイトパネルセットにおけるベイトの全てのシーケンシングロード(ホットスポット領域およびバックボーン領域を含む)を加算することによって計算し得る。
一部の例では、ゲノム領域の有用性は、次の有用な因子:(i)ゲノム領域における1つまたは複数の行動指針を与え得る変異の存在、(ii)ゲノム領域における1つまたは複数の行動指針を与え得る変異の頻度、(iii)ゲノム領域の平均を上回るマイナーアレル頻度(MAF)に関連する1つまたは複数の変異の存在、(iv)ゲノム領域の平均を上回るMAFに関連する1つまたは複数の変異の頻度、(v)ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、(vi)コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの合計、ならびに(vii)(1)コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのMAFの(2)コホートにおける所与の患者についての最大MAFに対する比率、の1つまたは複数(例えば、1つまたは複数、2つまたはそれより多く、3つまたはそれより多く、4つまたはそれより多く、5つまたはそれより多く、6つまたはそれより多く、あるいは7つ)を一緒に乗算することによって計算し得る。
ゲノム領域の有用性を計算する目標は、ベイトセットパネルに包含するためのその相対的重要性の評価を支援することであり得る。例えば、高頻度の変異を含むゲノム領域は、がんを含む疾患状態の良好なマーカー(例えば、指標)であるので、ゲノム領域における1つまたは複数の行動指針を与え得る(actionable)変異の存在および/または頻度は、ベイトセットパネルに包含するためのゲノム領域の有用性に影響を与える。同様に、平均を上回るMAFに関連する変異の存在および/または頻度を有するゲノム領域の選択は、液体生検アッセイにおけるこれらの変異の高感度検出を可能にする。
ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率は、コホートの疾患(例えば、乳、結腸直腸、膵臓、前立腺、黒色腫、肺、または肝臓)についてのマーカーとして適切なドライバー変異を示し得る。最高MAFまたはドライバーバリアントを検出する機会を最大化するために、コホートにおけるゲノム領域内に体細胞変異を抱える患者のバリアントについてのMAFの合計を、有用な因子として使用し得る。ドライバー変異に最大の重みを与えるために、(1)コホートにおけるゲノム領域内に体細胞変異を抱える患者のバリアントについてのMAFの(2)コホートにおける所与の患者についての最大MAFに対する比率を、有用な因子として使用し得る。より高いマイナーアレル頻度に関連する変異は、1つまたは複数のドライバー変異を含み得るかまたは外部データもしくは注釈ソースから公知である。
行動指針を与え得る(actionable)変異は、その検出された存在が、臨床判断(例えば、診断、がんモニタリング、治療モニタリング、治療有効性の評価)に影響を与え得るか、またはそれを決定し得る変異を含み得る。行動指針を与え得る変異は、(i)投薬標的化可能な変異、(ii)治療モニタリングのための変異、(iii)疾患特異的変異、(iv)組織特異的変異、(v)細胞型特異的変異、(vi)耐性変異、および(vii)診断上の変異の1つまたは複数(例えば、1つもしくは複数、2つもしくはそれより多く、3つもしくはそれより多く、4つもしくはそれより多く、5つもしくはそれより多く、6つもしくはそれより多く、または7つ)を含み得る。
投薬標的化可能な(druggable)変異には、対象由来の核酸試料におけるその検出された存在が、その対象が変異に関連する特定の薬物を用いた処置に適した候補であることを示す変異が含まれ得る(例えば、EGFR L858R変異の検出は、チロシンキナーゼ阻害剤(TKI)処置を用いて処置する必要性を示し得る)。治療モニタリングのための変異には、対象由来の核酸試料におけるその検出された存在またはレベル増加が、処置過程にその対象のがんが応答していることを示し得る変異が含まれる。耐性変異には、対象由来の核酸試料における検出された存在またはレベル増加が、処置過程にその対象のがんが耐性になっていることを示し得る変異が含まれる(例えば、EGFR T790M変異の出現は、耐性の発生を示し得る)。変異は、疾患(例えば、腫瘍の種類)、組織型または細胞の種類に特異的であってもよく、その検出は、特定の器官、組織または細胞の種類におけるがん、炎症、または他の疾患状態を示し得る。
目的のゲノム位置の例示的列挙は、表3および表4に見出すことができる。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表3の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、少なくとも85、少なくとも90、少なくとも95、または97のうちの少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表3のSNVのうちの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表3のCNVのうちの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、または18を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表3の融合物のうちの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、または6を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表3のインデルの少なくとも1、少なくとも2、または3のうちの少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表4の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、少なくとも85、少なくとも90、少なくとも95、少なくとも100、少なくとも105、少なくとも110、または115のうちの少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表4のSNVのうちの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表4のCNVのうちの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、または18を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表4の融合物のうちの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、または6を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表4のインデルの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、または18のうちの少なくとも一部分を含む。これらの目的のゲノム位置のそれぞれは、所与のベイトセットパネルについてのバックボーン領域またはホットスポット領域として同定され得る。目的のホットスポットゲノム位置の例示的列挙は、表5に見出すことができる。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表5の遺伝子の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、または少なくとも20のうちの少なくとも一部分を含む。各ホットスポットゲノム領域は、関連遺伝子、その領域が存在する染色体、遺伝子座を表すゲノムの開始および停止位置、塩基対における遺伝子座の長さ、遺伝子によって網羅されるエクソン、および所与の目的のゲノム領域の捕捉しようとする重要な特長(例えば変異の種類)を含むいくつかの特徴を伴って列挙されている。
ある態様では、複数のベイトセットを含むベイトパネルは、各ベイトセットが、(i)複数のベイトにわたって同じ分位数の有用性で1つまたは複数のゲノム領域を選択的に捕捉する1つまたは複数のベイトを含んでもよく、(ii)複数のベイトにわたって異なる分位数の有用性で他のベイトセットのそれぞれと異なる相対濃度を有する。分位数は、例えば、二等分、三等分、四等分などであり得る。例えば、ベイトパネルは、各ベイトセットが複数のベイトにわたって有用値の上三分の一、中三分の一、または下三分の一に有用性を有するゲノム領域を選択的に捕捉し、それぞれ異なる相対濃度を有する、3つのベイトセットを含んでもよい。
ベイトパネルは、各ベイトセットが(i)複数のベイトにわたって同じ分位数のシーケンシングロードで1つまたは複数のゲノム領域を選択的に捕捉する1つまたは複数のベイトを含み、(ii)複数のベイトにわたって異なる分位数のシーケンシングロードで他のベイトセットのそれぞれと異なる相対濃度を有する、複数のベイトセットを含んでもよい。ベイトパネルは、複数のベイトセットを含んでもよく、各ベイトセットは(i)複数のベイトにわたって同じ分位数の順位付け関数値(例えばシーケンシングロードで割った有用性)で1つまたは複数のゲノム領域を選択的に捕捉する1つまたは複数のベイトを含み、(ii)複数のベイトにわたって異なる分位数の順位付け関数値で他のベイトセットのそれぞれと異なる相対濃度を有する。
ある態様では、パネルブロックのセットを選択する方法は、(a)各パネルブロックについて、(i)パネルブロックの有用性を計算し、(ii)パネルブロックのシーケンシングロードを計算し、(iii)パネルブロックの順位付け関数を計算するステップと、(b)最適化プロセスを実行して、選択されたパネルブロックの合計順位付け関数値を最大化するパネルブロックのセットを選択するステップとを含み得る。パネルブロックの順位付け関数は、パネルブロックのシーケンシングロードで割ったパネルブロックの有用性として計算され得る。コンビナトリアル最適化プロセスは、単一のアッセイにおけるパネルブロックのセットについて選択された全てのパネルブロックの順位付け関数値の総和を最適化し得る。このアプローチは、配列ロードおよび有用性に制約がある場合、最適なパネル選択を可能にし得る。コンビナトリアル最適化プロセスは、グリーディアルゴリズムであり得る。ある態様では、方法は、(a)複数のベイト混合物を提供するステップであって、複数のベイト混合物のそれぞれがゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットと、ゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットを含み、第1のベイトセットが複数のベイト混合物にわたって異なる濃度であり、第2のベイトセットが複数のベイト混合物にわたって同じ濃度である、ステップと、(b)複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、第1のベイトセットおよび第2のベイトセットを用いて核酸試料から核酸を捕捉するステップであって、核酸試料由来の核酸が、第1のベイトセットおよび第2のベイトセットによって捕捉される、ステップと、(c)各ベイト混合物を用いて捕捉された核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、(d)各ベイト混合物について第1のベイトセットおよび第2のベイトセットについてのリード深度を決定するステップと、(e)所定の量で、ゲノム領域の第2のセット、および、任意選択で、ゲノム領域の第1のセットについてのリード深度を提供する少なくとも1つのベイト混合物を同定するステップとを含むことができる。一部の実施形態では、前記ゲノム領域の第2のセットについてのリード深度が、少なくとも0.0001%のMAFの遺伝的バリアントを検出する感度を提供する。一部の実施形態では、ゲノム領域の第1のセットおよび/または領域の第2のセットは、25キロベース〜1,000キロベースのサイズを有する。一部の実施形態では、ゲノム領域の第1のセットおよび/または領域の第2のセットは1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する。
インデル検出の改善された精度
対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成される方法が開示される。cfDNA分子に関連する複数の配列リードのそれぞれについて、候補インデルが同定され得る。次に、(i)複数の配列リードの1つまたは複数の配列リードで検出されるインデルの、(ii)インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが無細胞DNA分子の所与の無細胞DNA分子に存在する真のインデルである、および/または(iii)、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値の組み合わせを、1つまたは複数のモデルパラメータと併せて使用して、仮説検定を行い、各候補インデルは、真のインデルまたは導入されたインデルのいずれかとして分類され得る。このアプローチは、エラーを減少させ、配列リードデータからインデルを検出する精度を改善し得る。
図1は、どのように複数のリードが無細胞核酸試料から富化される各遺伝子座について生成され得るかを図解する。それぞれの富化された核酸分子(例えば、DNA分子)は、アンプリコンのファミリーを生ずるために増幅される。これらのアンプリコンを、次いで、フォワード鎖およびリバース鎖の両方についてシーケンシングを行って、複数の配列リードデータを生じさせてもよい。複数の配列リードデータから、候補インデルが検出され、真のインデルまたは導入された(例えば、非生物学的)インデルのいずれかとして分類され得る。
このアルゴリズムは、その複数の配列リードがインデルを含むバリアントについて分析される任意の所与のDNA分子について、元の分子に存在するか(例えば「真の」生物学的インデル)または配列リードのセットが最高に達するプロトコールのある点で導入されたインデル(例えば、増幅またはシーケンシングエラーを含むエラーに起因する導入された非生物学的インデル)が所定の期待値(例えば、確率)で存在すると推定する。モデルは、特定の塩基位置へのリードマッピングのパターン(例えば、リードのいずれかの塩基位置を網羅する)が与えられると、その観測されたパターンが、プロトコールの開始時に存在する配列中のインデル(例えば、真の生物学的インデル)を最も指し示すか、またはプロトコール中に導入されたインデル(非生物学的インデル)を最も指し示すかを尋ねる仮説検定を行うことを目的とし得る。
ある態様では、対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法は、複数の配列リードが、核酸シーケンシングによって生成され、(a)無細胞DNA分子に関連する複数の配列リードのそれぞれについて、複数の配列リードの1つまたは複数の配列リードで検出されるインデルの所定の期待値と、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが無細胞DNA分子の所与の無細胞DNA分子に存在する真のインデルである、所定の期待値と、インデルが配列リードの1つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値とを提供するステップと、(b)核酸シーケンシングによって生成される配列リードに特徴的な1つまたは複数のモデルパラメータの定量的尺度を提供するステップと、(c)無細胞DNA分子に関連する複数の配列リードにおける1つまたは複数の候補インデルを検出するステップと、(d)各候補インデルについて、モデルパラメータの1つまたは複数を使用して仮説検定を行うステップであって、候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップとを含み得る。
対象の身体試料における無細胞デオキシリボ核酸(cfDNA)分子から誘導された複数の配列リードから挿入または欠失(インデル)を検出する精度を改善するための方法は、ステップ(a)の前に身体試料における無細胞DNAから1つまたは複数の遺伝子座を富化するステップであって、それにより、富化されたポリヌクレオチドを生ずるステップをさらに含んでもよい。
方法は、アンプリコンのファミリーを生ずるために、富化されたポリヌクレオチドを増幅してステップであって、各ファミリーが無細胞DNA分子の一本鎖に由来するアンプリコンを含むステップをさらに含む。非生物学的エラーは、複数のゲノム塩基位置でのシーケンシングにおけるエラーを含み得る。非生物学的エラーは、複数のゲノム塩基位置での増幅におけるエラーを含み得る。
図2は、リードの小規模なファミリー(真のインデルバリアントのための証拠を提供するように見え得る)およびリードの大規模なファミリー(PCRまたはシーケンシングに起因する可能性が高い導入されたエラーを示し得る)の一例を図解する。一般に、真のインデルは、生物学的に多数のDNA分子に影響を与えることが予測されないので、リードの小規模なファミリーとして検出されるか、または測定されると予測され得る。対照的に、導入されたインデルは、PCRまたはシーケンシングの間に導入されたエラーを示し得、リードのより大規模なファミリーとして検出されるか、または測定されると予測され得る。一部のトリミングされていないか、または誤ったリードは、インデル(例えば、挿入または欠失)を生物学的ではなく導入されたものとして分類する仮説検定に基づいて、アルゴリズムに、ファミリーを不適格にさせ得る。
図3は、参照ゲノムに対して複数の配列リードを整列させ、比較する際に、大規模なファミリーによって支持される挿入の一例を図解する。図3の場合と同様に、一部のトリミングされていないか、または誤ったリードは、インデル(例えば、挿入または欠失)を生物学的ではなく導入されたものとして分類する仮説検定に基づいて、アルゴリズムに、ファミリーを不適格にさせ得る。
モデルパラメータは、(i)1つまたは複数のバリアントアレルのそれぞれについて、前記バリアントアレルの頻度(α)および前記バリアントアレル以外の非参照アレルの頻度(α’)、(ii)鎖のファミリーの全フォワード鎖におけるインデルエラーの頻度(β)であって、ファミリーが、無細胞DNA分子の一本鎖に由来するアンプリコンのコレクションを含む、頻度、(iii)鎖のファミリーの全リバース鎖におけるインデルエラーの頻度(β)、ならびに(iv)配列リードにおけるインデルエラーの頻度(γ)の1つまたは複数(例えば、このうちの1つまたはそれより多く、2つまたはそれより多く、3つまたはそれより多く、あるいは4つ)を含み得る。
図4は、仮説検定で使用し得る様々なパラメータならびにどのように各パラメータが特定の確率、例えば、参照にマッチングするファミリーのリードの確率、参照にマッチングする鎖のリードの確率および参照にマッチングするリードの確率に関連し得るかを図解する。図2はまた、どのように最大尤度関数を含むパラメータ試験が実行され得るかを図解する。パラメータ試験が、候補インデルに実行されるとき、所定の閾値よりも大きい場合、候補は、真のインデルとして分類され得る。パラメータ試験が、候補インデルに実行されるとき、所定の閾値未満またはそれと等しいとき、候補は、導入された(例えば、非生物学的)インデルとして分類され得る。
仮説検定を行うステップは、マルチパラメータ最大化アルゴリズムを実行するステップを含み得る。マルチパラメータ最大化アルゴリズムは、Nelder−Meadアルゴリズムを含み得る。候補インデルを真のインデルまたは導入されたインデルとして分類することは、(a)マルチパラメータ尤度関数を最大化することと、(b)最大尤度関数値が所定の閾値より大きい場合に候補インデルを真のインデルとして分類することと、(c)最大尤度関数値が所定の閾値未満またはそれと等しい場合に候補インデルを導入されたインデルとして分類することとを含み得る。マルチパラメータ尤度関数は、
のように与えられ得る。
マルチパラメータ尤度関数Pr{リード|α、α’、β、β、γ}は、図4に図解される(および段落[0112]に記載される)モデルに従って観測されたリードの構成の確率を表し得る。モデルの一つの仮定は、ある特定のパラメータの値(例えば、α、α’、β、β、およびγ)が与えられると、ファミリー内の観測されたリードの構成は、他の全てのファミリー内の観測されたリードの構成と統計学的に独立しているというものである。したがって、確率Pr{リード|α、α’、β、β、γ}は、全てのファミリーにわたるPr{ファミリーfのリード|α、α’、β、β、γ}の積として表すことができる。このファミリーごとの確率自体は、少なくとも3つの成分の加重和を含む場合があり、各成分は、可能性のあるファミリーの種類:a)バリアントアレルを有する(重みαを有する)もの、b)他の非参照バリアントアレルを有する(重みα’を有する)もの、またはc)参照アレルを有する(重み1−α−α’を有する)ものに対応する。加算されるこれらの成分は、それぞれのファミリー種について観測されたリード構成の確率Pr{ファミリーfのリード|α、α’、β、β、γ、およびバリアントアレルを有するファミリーf}、Pr{ファミリーfのリード|α、α’、β、β、γ、および他の非参照バリアントアレルを有するファミリーf}、ならびにPr{ファミリーfのリード|α、α’、β、β、γ、および参照アレルを有するファミリーf}であり得る。
モデルは、ファミリー内で各鎖が他の鎖とは独立してインデルエラーによって影響され得ると仮定しているので、バリアントアレルを有するファミリーについて観測されたリード構成の確率Pr{ファミリーfのリード|α、α’、β、β、γおよびバリアントアレルを有するファミリーf}はそれ自体、フォワード鎖由来のリードの観測された構成の確率とリバース鎖由来のリードの観測された構成の確率との積であり得る。これらの確率の各々はそれ自体、少なくとも2つの成分の加重和で有り得、各成分が、可能性のある結果に対応している:X)鎖特異的インデルエラーは、(重みβまたはβ)を有するファミリー鎖に影響を与え、Y)鎖特異的インデルエラーは、(重み1−βまたは1−β)ファミリー鎖に影響しなかった。
最後に、想定される種類a)、b)もしくはc)のファミリー内および/または想定される種類の鎖X)もしくはY)内で、特定のリード構成についての確率は、個々のリードについての確率の積であり得、その理由は、これらのリードが、3つのカテゴリー:i)バリアントアレルを支持するリード、ii)他の非参照バリアントアレルを支持するリード、またはiii)参照アレルを支持するリードの1つに当てはまる、統計学的に独立した確率を有するとモデルによって仮定されているからである。これらの確率を、下記表6に列挙する。
本発明の好ましい実施形態が本明細書において示され、説明されているが、そのような実施形態が単なる例示として提供されていることは、当業者には明らかである。本発明が本明細書内に提供されている特定の実施例によって制限されることは、意図されない。本発明は、前述の明細書への参照とともに記載されているが、本明細書における実施形態の説明および例証は、制限する意味で解釈されるものではない。当業者であれば、本発明から逸脱することなく、多数の変化形、変更、および置換を想起し得る。さらに、本発明のすべての態様は、本明細書において記載されている特定の表現、構成、または相対的比率に制限されず、それらは、様々な条件および変数に依存することを理解すべきである。本明細書において記載される本発明の実施形態に対する様々な代替形態を、本発明の実践に用いることができることを理解されたい。したがって、本発明は、あらゆるそのような代替形、修正形、変化形、または均等物も網羅すべきであることが企図される。以下の特許請求の範囲が本発明の範囲を定めること、ならびにこれらの特許請求の範囲内の方法と構造、およびそれらの均等物が、それによって網羅されることが意図される。
コンピュータ制御システム
本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システムを提供する。一態様では、本開示は、プロセッサおよびコンピュータメモリを含むコンピュータを含むシステムであって、コンピュータは、通信ネットワークと通信し、コンピュータメモリは、プロセッサによって実行されたとき、(1)通信ネットワークからコンピュータメモリへと配列データを受け取り、(2)配列データにおける遺伝的バリアントが変異体を表すかどうかを決定し、(3)決定を通信ネットワーク上で報告するコードを含む、システムを提供する。
通信ネットワークは、インターネットに接続する任意の利用可能なネットワークであり得る。通信ネットワークは、例えば、Broadband over Powerlines(BPL)、Cable Modem、Digital Subscriber Line(DSL)、Fiber、Satellite and Wirelessを含むが、これらに限定されない高速伝送ネットワークを利用することができる。
別の態様では、本明細書は、ローカルエリアネットワーク;ローカルエリアネットワークに接続されたDNA配列データを保存するように構成されたコンピュータメモリを含む1つまたは複数のDNAシーケンサー;コンピュータメモリおよびプロセッサを含み、ローカルエリアネットワークに接続されているバイオインフォマティクスコンピュータを含むシステムであって、コンピュータが、実行されたとき、DNAシーケンサーに保存されたDNA配列データをコピーし、コピーされたデータをバイオインフォマティクスコンピュータにおけるメモリに書き込み、本明細書に記載されるステップを実行するコードをさらに含む、システムを提供する。
図5は、ベイトセットを生成するための、パネルブロックのセットを選択するための、またはcfDNA分子から誘導された複数の配列リードからインデルを検出する精度を改善するための方法を実装するようにプログラムされたまたは他の仕方で構成されたコンピュータシステム501を示す。コンピュータシステム501は、例えば、ベイトセットを生成するための、パネルブロックのセットを選択するための、またはcfDNA分子から誘導された複数の配列リードからインデルを検出する精度を改善するための方法などの本開示の様々な態様を調整することができる。コンピュータシステム501は、ユーザーまたはコンピュータシステムが電子デバイスについて遠隔位置にある、電子デバイスであり得る。電子デバイスは、モバイル電子デバイスであり得る。
コンピュータシステム501は、中央処理ユニット(CPU、本明細書において「プロセッサ」および「コンピュータプロセッサ」とも)505を含み、これは、シングルコアもしくはマルチコアプロセッサであり得るか、または並列処理のための複数のプロセッサであり得る。コンピュータシステム501はまた、メモリまたはメモリ位置510(例えば、ランダムアクセスメモリ、読出し専用メモリ、フラッシュメモリ)、電子記憶ユニット515(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース520(例えば、ネットワークアダプター)、ならびに周辺デバイス525、例えば、キャッシュ、他のメモリ、データ記憶ユニット、および/もしくは電子ディスプレイアダプターも含む。メモリ510、記憶ユニット515、インターフェース520、および周辺デバイス525は、通信バス(実線)、例えば、マザーボードを通じて、CPU505と通信状態にある。記憶ユニット515は、データを記憶するためのデータ記憶ユニット(またはデータリポジトリ)であり得る。コンピュータシステム501は、通信インターフェース520を活用して、コンピュータネットワーク(「ネットワーク」)530に作動可能に連結され得る。ネットワーク530は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信するイントラネットおよび/もしくはエクストラネットであり得る。一部の事例では、ネットワーク530は、遠距離通信および/またはデータネットワークである。ネットワーク530は、クラウドコンピューティングなどの分散型コンピューティングを可能にすることができる、1つまたは複数のコンピュータサーバを含み得る。ネットワーク530は、一部の事例では、コンピュータシステム501を活用して、コンピュータシステム501に連結されたデバイスが、クライアントまたはサーバとして挙動することを可能にし得る、ピアトゥピアネットワークを実装することができる。
CPU505は、プログラムまたはソフトウェアで具現化され得る、一連の機械可読命令を実行することができる。命令は、メモリ510などのメモリ位置に記憶され得る。命令は、CPU505へと指示され得、これが、続いて、本開示の方法を実装するように、CPU505をプログラミングするか、またはそうでなければそのように構成し得る。CPU505によって実施される動作の例としては、フェッチ、復号、実行、およびライトバックを挙げることができる。
CPU505は、集積回路など、回路の一部であり得る。システム501の1つまたは複数の他の構成要素が、回路に含まれ得る。一部の事例では、回路は、特定用途向け集積回路(ASIC)である。
記憶ユニット515は、ドライバ、ライブラリー、および保存されたプログラムなど、ファイルを記憶することができる。記憶ユニット515は、ユーザデータ、例えば、ユーザの選好およびユーザプログラムを記憶することができる。コンピュータシステム501は、一部の事例では、コンピュータシステム501に対して外部にある、例えば、イントラネットまたはインターネットを通じてコンピュータシステム501と通信するリモートサーバに位置する、1つまたは複数の追加のデータ記憶ユニットを含み得る。
コンピュータシステム501は、ネットワーク530を通じて、1つまたは複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム501は、ユーザのリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルPC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)のiPad(登録商標)、Samsung(登録商標)のGalaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)のiPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザは、ネットワーク530を介して、コンピュータシステム501にアクセスすることができる。
本明細書において記載される方法は、コンピュータシステム501の電子記憶位置、例えば、メモリ510または電子記憶ユニット515上などに記憶された、機械(例えば、コンピュータプロセッサ)により実行可能なコードを用いて実装され得る。機械により実行可能なコードまたは機械により読取り可能なコードは、ソフトウェアの形態で提供され得る。使用の際、コードが、プロセッサ505によって実行され得る。一部の事例では、コードは、記憶ユニット515から取り出され、プロセッサ505による即時アクセスのために、メモリ510に記憶され得る。一部の状況では、電子記憶ユニット515は、除外され得、機械により実行可能な命令は、メモリ510に記憶される。
コードは、コードを実行するように適合されたプロセッサを有する機械で使用するために、プリコンパイルされている、およびそのように構成され得るか、または実行時にコンパイルされてもよい。コードは、コードがプリコンパイルまたは即時コンパイルの様式で実行されるのを可能にするように選択され得る、プログラミング言語で供給され得る。
コンピュータシステム501など、本明細書において提供されるシステムおよび方法の態様は、プログラミングで具現化され得る。この技術の様々な態様は、典型的には、機械(またはプロセッサ)により実行可能なコードおよび/または機械可読媒体の一種で運搬もしくは具現化される関連データの形態をした、「製品」または「製造品」であると考えることができる。機械により実行可能なコードは、メモリ(例えば、読出し専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)、またはハードディスクなど、電子記憶ユニットに記憶され得る。「記憶」型の媒体としては、コンピュータ、プロセッサなどのありとあらゆる有形メモリ、またはそれらの関連モジュール、例えば、様々な半導体メモリ、テープドライブ、ディスクドライブなどが含まれ得る。これらは、ソフトウェアプログラミングの任意の時点において、非一過的記憶ユニットを提供し得る。ソフトウェアのすべてまたは一部分は、時折、インターネットまたは様々な他の電気通信網を通じて通信され得る。そのような通信は、例えば、ソフトウェアを1つのコンピュータまたはプロセッサから別のものへ、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへ、ロードすることを可能にし得る。したがって、ソフトウェアエレメントを保持し得る別の種類の媒体としては、光波、電波、および電磁波、例えば、ローカルデバイス間の物理的インターフェースを通じて、有線および光学の地上ネットワークを通じて、ならびに様々なエアリンク上で、使用されるものが挙げられる。そのような波を有する物理的エレメント、例えば、有線または無線リンク、光リンクなどはまた、ソフトウェアを保持する媒体と考えることができる。本明細書において使用されるとき、非一過的有形「記憶」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のために命令をプロセッサに提供することに関与する任意の媒体を指す。
したがって、コンピュータにより実行可能なコードなど、機械可読媒体は、有形記憶媒体、搬送波媒体、または物理的伝送媒体を含むがこれらに限定されない、多数の形態を取り得る。不揮発性記憶媒体としては、例えば、光ディスクまたは磁気ディスク、例えば、任意のコンピュータなどにおける記憶デバイスのうちのいずれか、例えば、図面に示されているデータベースなどを実装するために使用することができるものが挙げられる。揮発性記憶媒体としては、動的メモリ、例えば、そのようなコンピュータプラットフォームの主メモリが挙げられる。有形伝送媒体としては、同軸ケーブル、銅線、および光ファイバ、例えば、コンピュータシステム内のバスを含む電線が挙げられる。搬送波伝送媒体は、電気信号もしくは電磁信号または音波もしくは光波、例えば、無線(RF)および赤外線(IR)データ通信の際に生成されるものの形態を取り得る。したがって、コンピュータ可読媒体の一般的な形態としては、例えば、次のものが挙げられる:フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD−ROM、DVDもしくはDVD−ROM、任意の他の光学媒体、パンチカード紙テープ、任意の他の、孔のパターンによる物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH−EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を伝送する搬送波、そのような搬送波を伝送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取ることができる任意の他の媒体。これらのコンピュータ可読媒体の形態の多くは、実行のために1つまたは複数の命令の1つまたは複数のシーケンスをプロセッサに搬送することに関与し得る。
コンピュータシステム501は、例えば、ベイトセットを生成するための、パネルブロックのセットを選択するための、またはcfDNAから誘導された複数の配列リードからインデルを検出する精度を改善するための方法のためのインプットパラメータを提供するためのユーザーインターフェース(UI)540を含む電子ディスプレイ535を含むことができるか、またはそれと通信することができる。UIの例としては、グラフィカルユーザインターフェース(GUI)およびウェブベースユーザインターフェースが挙げられるが、これらに限定されない。
本開示の方法およびシステムは、1つまたは複数のアルゴリズムを用いて実装することができる。アルゴリズムは、中央処理ユニット505により実行すると、ソフトウェアによって実装され得る。アルゴリズムは、例えば、ベイトセットを生成することができ、パネルブロックのセットを選択することができ、またはcfDNA分子から誘導された複数の配列リードからインデルを検出する精度を改善することができる。
(実施例1)
分析性能評価
分析感度(検出限界によっておよび陽性%一致によって定義される)および正確性を、直交的に特性決定された算段材料および患者試料の多回連続希釈試験を介した報告可能アレル分率およびコピー数の範囲を通じて評価した。分析特異性は、低い報告可能範囲から下って検出限界未満のアレル分率にわたる、段階希釈した予め特性決定した健常ドナー試料混合物において、偽陽性率を計算することによって評価した。陽性的中率(PPV)を、予め特性決定した臨床患者試料由来のアレル分率/コピー数および2,585の連続的臨床試料のコホートを使用して調節された有病率の関数として見積った。直交性の定性的および定量的確認を、ddPCRを使用して実行した。
分析性能を下記表7にまとめる。分析特異性は、25個の定義された試料にわたって、一塩基バリアント(SNV)、融合およびコピー数変更(CNA)について100%、ならびにインデルについて96%(24/25)であった。他の方法と比較して、このアッセイは、配列内容に応じて、融合分子回復の20%〜50%の増加を実証した。2,585の連続的臨床試料の遡及的in silico分析は、行動指針を与え得る融合検出の>15%の相対的増加、行動指針を与え得るインデル検出の6%〜15%の増加(新たな報告可能インデルを除く)、および行動指針を与え得るSNV検出の3%〜6%の増加を実証した。
表7:標準cfDNAインプット(30ng)に基づく分析性能特徴。検出推定値の分析感度/限界は、臨床的に行動指針を与え得るバリアントを提供し、配列内容およびcfDNAインプットによって変動し得る。陽性的中率が、全報告可能パネルスペースにわたって推定される(PPVは、臨床的に行動指針を与え得るバリアントについて100%であった)。
まとめると、アッセイは、成体固形腫瘍ガイドライン推奨の体細胞ゲノムバリアントの全てを、高い感度、精度および特異性で包括的に検出した。
(実施例2)
ホットスポットおよびバックボーン滴定
この実験では、適切なプローブ複製および各パネルについての飽和点を決定した。ホットスポットおよびバックボーンパネルを、デフォルトプローブ複製および最適化プローブ複製の両方について設計した。ホットスポットパネルは、およそ12kbであり、薬物応答、疾患状態(例えば、がん)、および/または全米総合がん情報ネットワーク(National Comprehensive Cancer Network、「NCCN」)ガイドライン下に列挙されたゲノム標的の指標であり得る、ゲノム標的の領域を標的とする。バックボーンパネルはおよそ140kbであり、パネルコンテンツの残りを網羅する。ホットスポットおよびバックボーンパネルは、表3における任意の遺伝子位置を含み得る。表1に示される5ng、15ngおよび30ngのcfDNAで、4つのパネルそれぞれについて、パネルインプット量について滴定実験を行った。図6は、一般的なパネルについて、インプット量と特有の分子のカウントとの対比を示す。特有の分子のカウントはバックボーンベイトについて約体積3X、ホットスポットベイトについて約体積1.2Xで飽和し(データ示さず)、最適化されたバックボーンパネルがデフォルトパネルと比較して変動が少ないことを示唆した。
(実施例3)
ホットスポット領域の選択的捕捉
実施例2のそれぞれのパネルの飽和点に基づいて、バックボーンベイトの濃度およびホットスポットベイトの濃度を決定した。バックボーンベイト(例えば、体積A)とホットスポットベイト(例えば、体積B)との混合物を生成し、ホットスポット/バックボーンベイトの混合物についての分子のカウントを、一般的なパネルについての分子のカウントと比較した。ホットスポットパネル由来の分子のカウントは、バックボーンパネルより高かった。差異は高いcfDNAインプット量でより顕著になり、バックボーンベイトは、ホットスポットベイトと比較して、例えば、より低いインプット量で、より速く飽和した。同様の傾向が二本鎖カウントで見られた(データ示さず)。またファミリーサイズは、ホットスポットパネルの方が、バックボーンパネルより高かった(データ示さず)。ファミリーサイズの差異は、効果が分子のカウントでマスクされていたにもかかわらず、ホットスポットパネルが、バックボーンパネルより多く捕捉していることを示し得る。例えば、5ngの大規模のファミリーサイズでは、特有の分子のほとんどが捕捉され、したがってホットスポットとバックボーンパネルとの間に明らかな差異が認められなかった可能性が高い。ファミリーサイズの違いで、バックボーンパネルよりもホットスポットパネルで、より多くのPCR重複が捕捉されていた可能性が高い。
まとめると、この実験は、ホットスポット領域が、増加したホットスポットパネル量で、選択的に捕捉され得ることを実証している。

Claims (17)

  1. 複数のゲノム領域について富化するための方法であって、
    (a)所定量の試料由来の核酸を、
    (i)前記試料由来の核酸のゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットであって、前記第1のベイトセットの飽和点未満である第1の濃度で提供される第1のベイトセットと、
    (ii)前記試料由来の核酸のゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットであって、前記第2のベイトセットの飽和点か、またはそれより高い第2の濃度で提供される第2のベイトセットと
    を含むベイト混合物と接触させるステップと、
    (b)前記ゲノム領域の第1のセットおよび前記ゲノム領域の第2のセットについて前記試料由来の核酸を富化するステップであって、それにより、富化された核酸を生ずるステップと
    を含む、方法。
  2. 前記第2のベイトセットが、第2のベイトセットのベイトを、
    (i)前記第2のベイトセットのベイトの捕捉効率を、前記ベイトの濃度の関数として測定すること、および
    (ii)滴定曲線内の変曲点を同定し、それにより、前記ベイトに関連する飽和点を同定すること
    によって生成される前記滴定曲線に供するとき、前記第2のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する、請求項1に記載の方法。
  3. 前記第1のベイトセットの前記飽和点が、観測された捕捉効率が第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の10%未満で増加するように選択される、請求項1に記載の方法。
  4. 前記第1のベイトセットまたは前記第2のベイトセットが、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、請求項1に記載の方法。
  5. (c)複数の配列リードを生ずるために、前記富化された核酸をシーケンシングするステップをさらに含む、請求項1に記載の方法。
  6. (d)前記試料由来の核酸を表す核酸配列を含む出力を生じるステップをさらに含む、請求項5に記載の方法。
  7. (a)複数のベイト混合物を提供するステップであって、前記複数のベイト混合物のそれぞれがゲノム領域の第1のセットに選択的にハイブリダイズする第1のベイトセットと、ゲノム領域の第2のセットに選択的にハイブリダイズする第2のベイトセットを含み、前記第1のベイトセットが前記複数のベイト混合物にわたって異なる濃度であり、前記第2のベイトセットが前記複数のベイト混合物にわたって同じ濃度である、ステップと、
    (b)前記複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、前記第1のベイトセットおよび前記第2のベイトセットを用いて前記核酸試料から核酸を捕捉するステップであって、各ベイト混合物における前記第2のベイトセットが、前記第2のベイトセットの飽和点か、またはそれより高い第1の濃度で提供され、前記核酸試料由来の核酸が、前記第1のベイトセットおよび前記第2のベイトセットによって捕捉される、ステップと、
    (c)各ベイト混合物を用いて捕捉された前記核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、
    (d)各ベイト混合物について前記第1のベイトセットおよび前記第2のベイトセットについての前記配列リードのリード深度を決定するステップと、
    (e)前記ゲノム領域の第2のセットについてのリード深度を提供する少なくとも1つのベイト混合物を同定するステップと
    を含み、前記ゲノム領域の第2のセットについてのリード深度が、少なくとも0.0001%のマイナーアレル頻度(MAF)の遺伝的バリアントを検出する感度を提供する、方法。
  8. 前記第2のベイトセットが、滴定に供するときに飽和点を有し、滴定が、
    (i)前記第2のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および
    (ii)前記滴定曲線内の変曲点を同定することであって、それにより、前記第2のベイトセットに関連する飽和点を同定すること
    を含む滴定曲線を生成することを含む、請求項に記載の方法。
  9. 前記飽和点が、観測された捕捉効率が第1の濃度の2倍のベイトの濃度で第1の濃度の捕捉効率の10%未満で増加するように選択される、請求項に記載の方法。
  10. 前記第1のベイトセットまたは前記第2のベイトセットが、ゲノムの1つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う1つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、請求項に記載の方法。
  11. 前記ゲノム領域の第1のセットが、1つまたは複数の行動指針を与え得る変異を含み、前記1つまたは複数の行動指針を与え得る変異が、
    (i)投薬標的化可能な変異、
    (ii)治療モニタリングのための変異、
    (iii)疾患特異的変異、
    (iv)組織特異的変異、
    (v)細胞型特異的変異、
    (vi)耐性変異、および
    (vii)診断上の変異
    の1つまたは複数を含む、請求項に記載の方法。
  12. 前記第1のゲノム領域が、表から選択される少なくとも5つの遺伝子のそれぞれの少なくとも一部分を含む、請求項に記載の方法。
  13. 第1および第2のゲノム領域が25キロベース〜1,000キロベースのサイズおよび1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する、請求項に記載の方法。
  14. 前記第2のベイトセットの飽和点が、観測された捕捉効率が第2の濃度の2倍のベイトの濃度で第2の濃度の捕捉効率の10%未満で増加するように選択される、請求項1に記載の方法。
  15. 前記ゲノム領域の第2のセットが、1つまたは複数の行動指針を与え得る変異を含み、前記1つまたは複数の行動指針を与え得る変異が、
    (i)投薬標的化可能な変異、
    (ii)治療モニタリングのための変異、
    (iii)疾患特異的変異、
    (iv)組織特異的変異、
    (v)細胞型特異的変異、
    (vi)耐性変異、および
    (vii)診断上の変異
    の1つまたは複数を含む、請求項に記載の方法。
  16. 前記第2のゲノム領域が、表から選択される少なくとも5つの遺伝子のそれぞれの少なくとも一部分を含む、請求項に記載の方法。
  17. 前記第2のゲノム領域が、約25キロベース〜1,000キロベースのサイズおよび1,000カウント/塩基〜50,000カウント/塩基のリード深度を有する、請求項に記載の方法。
JP2018568202A 2016-09-30 2017-09-29 無細胞核酸の多重解像度分析のための方法 Active JP6560465B1 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201662402940P 2016-09-30 2016-09-30
US62/402,940 2016-09-30
US201762468201P 2017-03-07 2017-03-07
US62/468,201 2017-03-07
US201762489391P 2017-04-24 2017-04-24
US62/489,391 2017-04-24
PCT/US2017/054607 WO2018064629A1 (en) 2016-09-30 2017-09-29 Methods for multi-resolution analysis of cell-free nucleic acids

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019132431A Division JP6806854B2 (ja) 2016-09-30 2019-07-18 無細胞核酸の多重解像度分析のための方法

Publications (2)

Publication Number Publication Date
JP6560465B1 true JP6560465B1 (ja) 2019-08-21
JP2019531048A JP2019531048A (ja) 2019-10-31

Family

ID=61760169

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2018568202A Active JP6560465B1 (ja) 2016-09-30 2017-09-29 無細胞核酸の多重解像度分析のための方法
JP2019132431A Active JP6806854B2 (ja) 2016-09-30 2019-07-18 無細胞核酸の多重解像度分析のための方法
JP2020201573A Active JP7022188B2 (ja) 2016-09-30 2020-12-04 無細胞核酸の多重解像度分析のための方法
JP2022016332A Active JP7385686B2 (ja) 2016-09-30 2022-02-04 無細胞核酸の多重解像度分析のための方法
JP2023192159A Pending JP2024012567A (ja) 2016-09-30 2023-11-10 無細胞核酸の多重解像度分析のための方法

Family Applications After (4)

Application Number Title Priority Date Filing Date
JP2019132431A Active JP6806854B2 (ja) 2016-09-30 2019-07-18 無細胞核酸の多重解像度分析のための方法
JP2020201573A Active JP7022188B2 (ja) 2016-09-30 2020-12-04 無細胞核酸の多重解像度分析のための方法
JP2022016332A Active JP7385686B2 (ja) 2016-09-30 2022-02-04 無細胞核酸の多重解像度分析のための方法
JP2023192159A Pending JP2024012567A (ja) 2016-09-30 2023-11-10 無細胞核酸の多重解像度分析のための方法

Country Status (10)

Country Link
US (7) US20200013482A1 (ja)
EP (2) EP3792922A1 (ja)
JP (5) JP6560465B1 (ja)
KR (2) KR102344635B1 (ja)
CN (1) CN109642250A (ja)
AU (2) AU2017336153B2 (ja)
CA (2) CA3027919C (ja)
ES (1) ES2840003T3 (ja)
SG (1) SG11201811159SA (ja)
WO (1) WO2018064629A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3246416A1 (en) 2011-04-15 2017-11-22 The Johns Hopkins University Safe sequencing system
EP2912468B1 (en) 2012-10-29 2018-09-12 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
JP6913089B2 (ja) 2015-11-11 2021-08-04 レゾリューション バイオサイエンス, インコーポレイテッド Dnaライブラリーの高効率構築
WO2017181146A1 (en) 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
US20190287645A1 (en) * 2016-07-06 2019-09-19 Guardant Health, Inc. Methods for fragmentome profiling of cell-free nucleic acids
RU2019108294A (ru) 2016-08-25 2020-09-25 Резолюшн Байосайенс, Инк. Способы обнаружения изменений количества геномных копий в образцах днк
CA3027919C (en) 2016-09-30 2023-02-28 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
AU2018342007A1 (en) 2017-08-07 2020-02-27 Board Of Regents, The University Of Texas Systems Methods and materials for assessing and treating cancer
EP3781713A4 (en) * 2018-04-16 2022-01-12 Memorial Sloan-Kettering Cancer Center SYSTEMS AND METHODS FOR DETECTING CANCER THROUGH CFDNA SCREENING
WO2023282916A1 (en) 2021-07-09 2023-01-12 Guardant Health, Inc. Methods of detecting genomic rearrangements using cell free nucleic acids
WO2022046947A1 (en) 2020-08-25 2022-03-03 Guardant Health, Inc. Methods and systems for predicting an origin of a variant

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH686982A5 (fr) 1993-12-16 1996-08-15 Maurice Stroun Méthode pour le diagnostic de cancers.
US5648245A (en) 1995-05-09 1997-07-15 Carnegie Institution Of Washington Method for constructing an oligonucleotide concatamer library by rolling circle replication
CA2248981C (en) 1996-03-15 2009-11-24 The Penn State Research Foundation Detection of extracellular tumor-associated nucleic acid in blood plasma or serum using nucleic acid amplification assays
PT938320E (pt) 1996-03-26 2010-09-22 Michael S Kopreski Método que permite a utilização de arn extracelular extraído de plasma ou de soro para detectar, monitorizar ou avaliar o cancro
US6232066B1 (en) * 1997-12-19 2001-05-15 Neogen, Inc. High throughput assay system
EP1165839A2 (en) 1999-03-26 2002-01-02 Whitehead Institute For Biomedical Research Universal arrays
EP1169479B1 (en) 1999-04-09 2006-06-28 EXACT Sciences Corporation Methods for detecting nucleic acids indicative of cancer
DE60045059D1 (de) 1999-04-20 2010-11-18 Nat Inst Of Advanced Ind Scien Verfahren und Sonden zur Bestimmung der Konzentration von Nukleinsäure-Molekülen und Verfahren zur Analyse der gewonnenen Daten
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
US6586177B1 (en) 1999-09-08 2003-07-01 Exact Sciences Corporation Methods for disease detection
US6849403B1 (en) 1999-09-08 2005-02-01 Exact Sciences Corporation Apparatus and method for drug screening
ATE458831T1 (de) 1999-12-07 2010-03-15 Exact Sciences Corp Verfahren zum nachweis von lungenneoplasmen in fäkalen proben
US20020072058A1 (en) 2000-03-24 2002-06-13 Voelker Leroy L. Method for amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof
EP1158055A1 (fr) 2000-05-26 2001-11-28 Xu Qi University of Teaxs Laboratoire de Leucémie Chen Méthode pour le diagnostic de cancers
ATE380883T1 (de) 2000-10-24 2007-12-15 Univ Leland Stanford Junior Direkte multiplex charakterisierung von genomischer dna
ES2253461T3 (es) 2002-03-05 2006-06-01 Epigenomics Ag Procedimiento y dispositivo para la determinacion de la especificidad del tejido y del adn que flota libre en tejidos corporales.
US7727720B2 (en) 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US7635564B2 (en) * 2002-10-25 2009-12-22 Agilent Technologies, Inc. Biopolymeric arrays having replicate elements
US10229244B2 (en) 2002-11-11 2019-03-12 Affymetrix, Inc. Methods for identifying DNA copy number changes using hidden markov model based estimations
WO2005010145A2 (en) 2003-07-05 2005-02-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
DE10348407A1 (de) 2003-10-17 2005-05-19 Widschwendter, Martin, Prof. Prognostische und diagnostische Marker für Zell-proliferative Erkrankungen von Brustgeweben
AU2004286252A1 (en) * 2003-10-28 2005-05-12 Bioarray Solutions Ltd. Optimization of gene expression analysis using immobilized capture probes
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US7937225B2 (en) 2004-09-03 2011-05-03 New York University Systems, methods and software arrangements for detection of genome copy number variation
US20060073506A1 (en) 2004-09-17 2006-04-06 Affymetrix, Inc. Methods for identifying biological samples
WO2006047787A2 (en) 2004-10-27 2006-05-04 Exact Sciences Corporation Method for monitoring disease progression or recurrence
US7424371B2 (en) 2004-12-21 2008-09-09 Helicos Biosciences Corporation Nucleic acid analysis
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
ITRM20050068A1 (it) 2005-02-17 2006-08-18 Istituto Naz Per Le Malattie I Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine.
ES2313143T3 (es) 2005-04-06 2009-03-01 Maurice Stroun Metodo para el diagnostico de cancer mediante la deteccion de adn y arn circulantes.
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
CA2910861C (en) 2005-09-29 2018-08-07 Michael Josephus Theresia Van Eijk High throughput screening of mutagenized populations
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US8383338B2 (en) 2006-04-24 2013-02-26 Roche Nimblegen, Inc. Methods and systems for uniform enrichment of genomic regions
IL282783B2 (en) 2006-05-18 2023-09-01 Caris Mpi Inc A system and method for determining a personalized medical intervention for a disease stage
WO2008111990A1 (en) 2006-06-14 2008-09-18 Cellpoint Diagnostics, Inc. Rare cell analysis using sample splitting and dna tags
CA2958994C (en) 2006-11-15 2019-05-07 Biospherex Llc Kit for multiplex sequencing and ecogenomics analysis
US20080131887A1 (en) 2006-11-30 2008-06-05 Stephan Dietrich A Genetic Analysis Systems and Methods
WO2008148072A2 (en) 2007-05-24 2008-12-04 The Brigham And Women's Hospital, Inc. Disease-associated genetic variations and methods for obtaining and using same
WO2008150432A1 (en) 2007-06-01 2008-12-11 454 Life Sciences Corporation System and meth0d for identification of individual samples from a multiplex mixture
PT2557517T (pt) 2007-07-23 2023-01-04 Univ Hong Kong Chinese Determinação de um desequilíbrio de sequências de ácido nucleico
US8338838B2 (en) 2007-12-28 2012-12-25 3M Innovative Properties Company Down-converted light source with uniform wavelength emission
WO2009099602A1 (en) 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
CN101999003A (zh) 2008-02-12 2011-03-30 诺瓦蒂斯公司 分离无细胞凋亡或胎儿核酸的方法
CA2991818C (en) 2008-03-28 2022-10-11 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US20090318305A1 (en) 2008-06-18 2009-12-24 Xi Erick Lin Methods for selectively capturing and amplifying exons or targeted genomic regions from biological samples
US20100069250A1 (en) 2008-08-16 2010-03-18 The Board Of Trustees Of The Leland Stanford Junior University Digital PCR Calibration for High Throughput Sequencing
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
WO2010127186A1 (en) 2009-04-30 2010-11-04 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
EP2366031B1 (en) 2010-01-19 2015-01-21 Verinata Health, Inc Sequencing methods in prenatal diagnoses
WO2011091046A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US20120046877A1 (en) 2010-07-06 2012-02-23 Life Technologies Corporation Systems and methods to detect copy number variation
SG187646A1 (en) 2010-07-29 2013-03-28 Toto Ltd Photocatalyst coated body and photocatalyst coating liquid
DK2623613T3 (en) 2010-09-21 2016-10-03 Population Genetics Tech Ltd Increasing the reliability of the allele-indications by molecular counting
US8725422B2 (en) 2010-10-13 2014-05-13 Complete Genomics, Inc. Methods for estimating genome-wide copy number variations
EP3461914A1 (en) 2010-10-22 2019-04-03 Cold Spring Harbor Laboratory Varietal counting of nucleic acids for obtaining genomic copy number information
AU2011352070A1 (en) 2010-12-30 2013-07-18 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
AU2011358564B9 (en) * 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
EP3246416A1 (en) 2011-04-15 2017-11-22 The Johns Hopkins University Safe sequencing system
EP3789498A1 (en) 2011-04-25 2021-03-10 Bio-rad Laboratories, Inc. Methods for nucleic acid analysis
SG10201605049QA (en) 2011-05-20 2016-07-28 Fluidigm Corp Nucleic acid encoding reactions
US9340826B2 (en) 2011-08-01 2016-05-17 Celemics, Inc. Method of preparing nucleic acid molecules
PL2768985T3 (pl) 2011-10-21 2019-10-31 Chronix Biomedical Biomarkery będące krążącymi kwasami nukleinowymi związane z rakiem jelita grubego
WO2013060762A1 (en) 2011-10-25 2013-05-02 Roche Diagnostics Gmbh Method for diagnosing a disease based on plasma-dna distribution
DK3363901T3 (da) 2012-02-17 2021-02-22 Hutchinson Fred Cancer Res Sammensætninger og fremgangsmåder til præcis identificering af mutationer
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
KR102028375B1 (ko) 2012-09-04 2019-10-04 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20140066317A1 (en) 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
WO2014149134A2 (en) 2013-03-15 2014-09-25 Guardant Health Inc. Systems and methods to detect rare mutations and copy number variation
WO2014160352A1 (en) * 2013-03-13 2014-10-02 Abbott Molecular Inc. Target sequence enrichment
ES2946689T3 (es) 2013-03-15 2023-07-24 Univ Leland Stanford Junior Identificación y uso de marcadores tumorales de ácido nucleico circulante
JP6618894B2 (ja) 2013-05-23 2019-12-11 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 個別的エピゲノミクスのための天然クロマチンへの転移
AU2014369841B2 (en) * 2013-12-28 2019-01-24 Guardant Health, Inc. Methods and systems for detecting genetic variants
CN113774132A (zh) 2014-04-21 2021-12-10 纳特拉公司 检测染色体片段中的突变和倍性
ES2844229T3 (es) 2014-05-13 2021-07-21 Univ Texas Mutaciones génicas y alteraciones en el número de copias de EGFR, KRAS y MET
WO2016015058A2 (en) 2014-07-25 2016-01-28 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
US20180082012A1 (en) 2014-07-25 2018-03-22 Bgi Genomics Co., Ltd. Method and device for determining fraction of cell-free nucleic acids in biological sample and use thereof
US20160053301A1 (en) 2014-08-22 2016-02-25 Clearfork Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
ES2925014T3 (es) 2014-09-12 2022-10-13 Univ Leland Stanford Junior Identificación y uso de ácidos nucleicos circulantes
CA2964472A1 (en) * 2014-10-29 2016-05-06 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequencing
EP3766986B1 (en) 2014-12-31 2022-06-01 Guardant Health, Inc. Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
PT3256605T (pt) 2015-02-10 2022-03-17 Univ Hong Kong Chinese Deteção de mutações para rastreio de cancro e análise fetal
US20160281166A1 (en) * 2015-03-23 2016-09-29 Parabase Genomics, Inc. Methods and systems for screening diseases in subjects
JP6995625B2 (ja) 2015-05-01 2022-01-14 ガーダント ヘルス, インコーポレイテッド 診断方法
CA2993019A1 (en) 2015-07-21 2017-01-26 Guardant Health, Inc. Locked nucleic acids for capturing fusion genes
TWI730973B (zh) 2015-07-23 2021-06-21 香港中文大學 游離dna(cell-free dna)之片段化模式分析
US20170058332A1 (en) 2015-09-02 2017-03-02 Guardant Health, Inc. Identification of somatic mutations versus germline variants for cell-free dna variant calling applications
US11302416B2 (en) 2015-09-02 2022-04-12 Guardant Health Machine learning for somatic single nucleotide variant detection in cell-free tumor nucleic acid sequencing applications
CN108474040B (zh) 2015-10-09 2023-05-16 夸登特健康公司 使用无细胞dna的基于群体的治疗推荐
EP3359695B1 (en) 2015-10-10 2020-04-15 Guardant Health, Inc. Methods and applications of gene fusion detection in cell-free dna analysis
SG11201805119QA (en) 2015-12-17 2018-07-30 Guardant Health Inc Methods to determine tumor gene copy number by analysis of cell-free dna
CN109072309B (zh) 2016-02-02 2023-05-16 夸登特健康公司 癌症进化检测和诊断
US9850523B1 (en) * 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
CA3027919C (en) 2016-09-30 2023-02-28 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids

Also Published As

Publication number Publication date
CN109642250A (zh) 2019-04-16
WO2018064629A1 (en) 2018-04-05
KR102344635B1 (ko) 2021-12-31
AU2023204088A1 (en) 2023-08-17
CA3126055A1 (en) 2018-04-05
US20240087681A1 (en) 2024-03-14
US20210358567A1 (en) 2021-11-18
ES2840003T3 (es) 2021-07-06
US20240087680A1 (en) 2024-03-14
AU2017336153B2 (en) 2023-07-13
JP2019531048A (ja) 2019-10-31
JP6806854B2 (ja) 2021-01-06
US11817179B2 (en) 2023-11-14
CA3027919C (en) 2023-02-28
AU2017336153A1 (en) 2019-01-17
US11817177B2 (en) 2023-11-14
EP3461274B1 (en) 2020-11-04
JP7385686B2 (ja) 2023-11-22
JP2021040655A (ja) 2021-03-18
US20230253071A1 (en) 2023-08-10
US20200013482A1 (en) 2020-01-09
CA3027919A1 (en) 2018-04-05
US20230260596A1 (en) 2023-08-17
JP2024012567A (ja) 2024-01-30
EP3792922A1 (en) 2021-03-17
JP7022188B2 (ja) 2022-02-17
KR20210158870A (ko) 2021-12-31
SG11201811159SA (en) 2019-01-30
KR20190053818A (ko) 2019-05-20
US20200185060A1 (en) 2020-06-11
JP2022058904A (ja) 2022-04-12
US11062791B2 (en) 2021-07-13
EP3461274A1 (en) 2019-04-03
EP3461274A4 (en) 2019-05-22
JP2019170401A (ja) 2019-10-10

Similar Documents

Publication Publication Date Title
JP6560465B1 (ja) 無細胞核酸の多重解像度分析のための方法
US9850523B1 (en) Methods for multi-resolution analysis of cell-free nucleic acids
TWI814753B (zh) 用於標靶定序之模型
JP2022050571A (ja) 発現レベルおよび配列変種情報を用いて疾患の発症または再発のリスクを評価するための方法
TW202039860A (zh) 游離dna末端特徵
CN112534506A (zh) 组织特异性的甲基化标志物
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
JP2023540257A (ja) がんを分類するためのサンプルの検証
US20210358569A1 (en) Methods and systems for assessing microsatellite instability
WO2021041968A1 (en) Systems and methods for predicting and monitoring treatment response from cell-free nucleic acids
US20240136014A1 (en) Methods for multi-resolution analysis of cell-free nucleic acids

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190122

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190124

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190122

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190122

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190718

R150 Certificate of patent or registration of utility model

Ref document number: 6560465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R157 Certificate of patent or utility model (correction)

Free format text: JAPANESE INTERMEDIATE CODE: R157

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250