JP2021516962A

JP2021516962A - バリアント検出の改善

Info

Publication number: JP2021516962A
Application number: JP2020546469A
Authority: JP
Inventors: フィッシャー，エイアル; ハイダー，カトリン; マッシー，チャールズ; ムリエール，フローレント; ローゼンフェルド，ニツァン; スミス，クリストファー・ジー; ワン，ジョナサン・シー・エム
Original assignee: Cancer Research Technology Ltd
Current assignee: Cancer Research Technology Ltd
Priority date: 2018-03-06
Filing date: 2019-03-06
Publication date: 2021-07-15
Anticipated expiration: 2039-03-06
Also published as: JP7523353B2; AU2019229606A1; EP3762512A1; US20200402613A1; CA3093092A1; CN112020563A; WO2019170773A1

Abstract

本発明は、患者から取得したＤＮＡ含有試料における循環腫瘍ＤＮＡ等の無細胞ＤＮＡ（ｃｆＤＮＡ）を検出するためのコンピュータ実装方法であって、（ａ）患者の腫瘍を表す少なくとも２つの変異含有座位（「患者特異的座位」）を含む目的の座位を用意するステップ、（ｂ）患者由来のＤＮＡ含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを用意するステップであり、前記配列リードがステップ（ａ）の前記少なくとも２つの変異含有座位にまたがる、ステップ、（ｃ）任意選択で、リードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、（ｄ）前記少なくとも２つの患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で変異アレル割合が変異リードおよび総リードを集計することによって算出される、ステップ、（ｅ）試料を、算出した変異アレル割合に基づいて、標的ｃｆＤＮＡを含有するまたは含有しないと分類するステップを含む、コンピュータ実装方法を提供する。関連する方法およびシステムもまた提供される。【選択図】図２５−１

Description

本出願は、内容および要素があらゆる目的のために参照によって本明細書に組み込まれる、２０１８年３月６日に出願された英国特許出願第１８０３５９６．４号および２０１８年１１月２３日に出願された英国特許出願第１８１９１３４．６号に基づく優先権を主張する。

本発明は、部分的には、例えば血液血漿等の無細胞ＤＮＡ（ｃｆＤＮＡ）源からの循環腫瘍ＤＮＡ（ｃｔＤＮＡ）等のバリアントＤＮＡの存在を検出するための、または法科学的用途、病原体同定、種の汚染の農業的および環境的モニタリングにおいてバリアントＤＮＡを検出するための方法に関する。特に、本発明の方法は、癌の診断、処置、およびとりわけモニタリング、例えば腫瘍切除後に行われるモニタリング、における使用を見出す。

本発明に至る研究は、助成契約番号３３７９０５の下、欧州連合第７次枠組み計画（ＦＰ７／２００７〜２０１３）からの資金提供を受けた。

循環腫瘍ＤＮＡ（ｃｔＤＮＡ）等の無細胞ＤＮＡ（ｃｆＤＮＡ）は、疾患負荷、処置に対する応答、および再燃のリスクをモニタリングするための非侵襲性ツールとしてますます使用されている^１、２。処置後、患者は低いｃｔＤＮＡレベルを有する場合があり、進行した疾患においてさえ、濃度は試料容量当たり数コピー未満であり得る^３。そのような場合、個々の試料は、所与の変異の検出可能なコピーをサンプリング統計量のために１コピー未満含有する場合があり、結果として平均濃度が０ではない場合であっても未検出のｃｔＤＮＡ、すなわちｃｔＤＮＡレベルに関して偽陰性という過小評価をもたらす^{１、３、４}。

次世代配列決定（ＮＧＳ）は、単回の反応で血漿における数多くの変異を分析する可能性を提供する。このことは、標準化されたパネル^５、９または各患者に特異的な領域を包含する特注のパネル^５〜７のいずれかを使用する、標的化配列決定^７〜９のための、増幅産物に基づく方法^５、６およびハイブリッド捕捉法によって実証されている。これらの手法は通例、個々の変異をスクリーニングまたはモニタリングするために適用される。近年の研究は、約２０の患者特異的座位を標的としたにもかかわらず、早期ＮＳＣＬＣを有する患者の５０％未満においてｃｔＤＮＡを検出し、後に再燃した大半の患者において外科的処置直後にｃｔＤＮＡを検出しなかった^６。このことは、この重要な臨床目標を効果的に達成するためにはより高い感度が必要とされ得ることを示唆する。数千の変異を包含する高度に多重化された捕捉パネルの使用が示唆されているが^１、７、これはｃｔＤＮＡの分析に関して今までのところ実証されていない。ｃｔＤＮＡ分析のためのこれらの手法は、可変サイズのパネルにわたる個々の変異の同定に依存していた。

個々の変異の検出は、サンプリングエラーと配列決定バックグラウンドノイズの両方によって限定される。シグナルが変異呼び出しのための事前に指定された閾値に達しない場合、これらのシグナルにおける情報は失われる。

Ｐｅｃｕｃｈｅｔら、Ｃｌｉｎ．Ｃｈｅｍ．（臨床化学）、２０１６年、６２巻、１１号、１４９２〜１５０３ページは、循環ＤＮＡにおける腫瘍変異を検出するための次世代配列決定の塩基位置エラー率の分析を記載している。国際公開第２０１６／００９２２４号は遺伝子バリアントを検出するための方法を記載している。国際公開第２０１５／１６４４３２号は染色体セグメントにおける変異および倍数性を検出するための方法を記載している。国際公開第２０１３／１３８５１０号は高多重化エラー抑制ディープ配列決定を使用した核酸バリアントの測定を記載している。Ａｈｎら、ＳｃｉｅｎｔｉｆｉｃＲｅｐｏｒｔｓ（サイエンティフィックリポーツ）、２０１７年、７：４６６７８｜ＤＯＩ：１０．１０３８／ｓｒｅｐ４６６７８は、循環腫瘍ＤＮＡにおけるまれな変異を検出するための、非対称バーコードアダプターに支援された重複リードの回収およびエラー補正戦略を記載している。Ｋｏｃｋａｎら、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ（バイオインフォマティクス）、２０１７年、３３巻、１号、２６〜３４ページは、循環腫瘍ＤＮＡにおける一塩基バリアントおよび挿入欠失の超高感度検出を記載している。国際公開第２０１４／０３９５５６号はまれな変異およびコピー数多型を検出するシステムおよび方法を記載している。これらの参考文献は全体として、例えば固有分子識別子（ＵＭＩ）の使用によって配列決定のバックグラウンドノイズ率を低下させるための方法に関する。

Ｎｅｗｍａｎら、２０１６年は、統合デジタルエラー抑制が用いられる、ｃｔＤＮＡを検出するためのＣＡＰＰ−Ｓｅｑ法（ｉＤＥＳＣＡＰＰ−Ｓｅｑ）の改善を記載している^７。しかしながら、ｉＤＥＳＣＡＰＰ−Ｓｅｑ法は、エラー補正のために位置特異的エラー率の使用を伴う。これは各座位のエラー率の決定を必要とし、この決定は探査される全ての座位において少なくとも１／（位置特異的エラー率）個の分子が標的とされることを必要とする。分析されるために必要とされる試料の数を減少させてエラー抑制を実行するｃｔＤＮＡ検出の方法に関する満たされていない必要性が依然として存在する。

ｃｔＤＮＡの検出は癌治療の分野における期待を示すが、低いｃｔＤＮＡ割合のコンテキストにおいてシグナル対ノイズ比を最大化する方法およびシステムに関する満たされていない必要性が依然として存在する。本発明は、これらの必要性に対する解決策を提供することに努め、さらなる関連する利点を提供する。

本発明者らは、数多くの変異座位にわたるシグナルを組み込むことによって、サンプリングノイズの効果を軽減し、ｃｔＤＮＡが非常に低い濃度で存在する場合であってもｃｔＤＮＡレベルのより高感度かつ正確な推定を取得することが可能となるだろうと仮説を立てた（図１ａ）。

ｃｔＤＮＡ情報をより効率的に使用するために、本発明者らは、個々の変異の「呼び出し」を避け、腫瘍により変異した複数の、例えば全ての座位にわたる変異リードからの情報を組み合わせることを目的とした。本発明者らは、患者の腫瘍において変異している複数の座位を包含する血漿ＤＮＡから数多くの配列決定リードを生成して組み合わせることによって、以前の方法の感度を上回る検出を達成することが可能となることを見出した。本発明者らは、数百または数千の変異座位にわたる変異シグナルを集計する、ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓ（ＩＮＶＡＲ）と称されるアルゴリズムを開発して、ゲノム全域に及ぶシグナルがバックグラウンドよりも有意に高いかまたはバックグラウンドと識別不能かを評価した（図１ｂ）。各患者に関して腫瘍により変異した座位を包含する約１０^６個のリードを配列決定効率的に生成するために、本発明者らはテイラードパネル配列決定（ＴＡＰＡＳ：ＴＡｉｌｏｒｅｄＰＡｎｅｌＳｅｑｕｅｎｃｉｎｇ；図１ｃ）を用いた。本発明者らは最初に、全身抗癌療法を受け取っている１０名のステージＩＶの黒色腫患者に関して、腫瘍組織配列決定から変異を同定した。これらの変異は、患者当たり中央値で６７３（四分位範囲「ＩＱＲ」２５０〜１，２０９）の変異を標的とするハイブリダイゼーション捕捉ベイトのパネルを設計するために使用され、このパネルは経時的血漿試料に適用された。本明細書に詳述されるように、本発明者らは、ＴＡＰＡＳデータおよびＩＮＶＡＲ分析を使用して、最小で個々の百万分率単位以下のレベルまで残存ｃｔＤＮＡを検出することができた。

ＩＮＶＡＲ手法のさらなる最適化では、統合は残存疾患シグナルの統合に焦点を当てるように標的化され得る。特に、本明細書に記載される焦点化ＩＮＶＡＲ手法は、最大２個の変異分子のみを有する座位からのシグナルを選択することによって微小残存病変（ＭＲＤ）に関する「ＭＲＤ様シグナル」を集計する。第２に、順方向および逆方向（Ｆ＋Ｒ）リードによって支持される変異を有する分子のみがシグナルに寄与するために検討され、このことはエラー抑制ステップとサイズ選択ステップの両方を構成する。第３に、座位当たりの変異リードがその腫瘍アレル割合に基づいて加重され、腫瘍においてより広く存在する変異を上向き加重する。第４に、シグナルは次いで、場合によってはトリヌクレオチドコンテキストごとに集計される。第５に、Ｐ値が、好適な方法（例えばフィッシャーの方法またはブラウンの方法）を使用して、ただしＭＲＤ様シグナルに焦点を当てるために上位Ｎ個のクラスのみにわたって統合される。最終の結果は、残存疾患の検出に関して最適化される焦点化ＩＮＶＡＲアルゴリズムである。

したがって、第１の態様では、本発明は、患者から取得したＤＮＡ含有試料における、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）等の無細胞ＤＮＡ（ｃｆＤＮＡ）を検出および／または定量するための方法（任意選択でコンピュータ実装方法）であって、
（ａ）患者の腫瘍を表す少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の変異含有座位（「患者特異的座位」）を含む目的の座位を用意するステップ、
（ｂ）患者由来のＤＮＡ含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを取得するステップであり、前記配列リードがステップ（ａ）の前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の変異含有座位にまたがる、ステップ、
（ｃ）任意選択で、配列決定ノイズ低減を実施する、例えばリードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
（ｄ）前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の患者特異的座位の一部または全てにわたる変異アレル割合を、任意選択で変異リードおよび総リードを集計することによって算出するステップ、
を含む方法、を提供する。特に、変異アレル割合を算出するステップは、式：

に従って変異リードおよび総リードを集計することを含み得る。ある特定の場合では、変異アレル割合を算出するステップは、患者特異的座位のそれぞれにおけるアレル割合の加重平均を算出することを含み得る。ある特定の場合では、変異アレル割合を算出するステップは、変異リードの数を数えること、およびこれを所定の閾値と比べることを含み得る。所定の閾値は、場合によっては配列決定深度の関数であり得るが、単純な合計である必要はない。特に、変異リードの数に関する閾値モデルが適用され得る。

ステップ（ｃ）は、その機能が、ある特定の場合には必要ではないことがあるノイズを低減することであるため、任意選択と考えられ得る。一部の実施形態では、ノイズ低減ステップが用いられてもよく、このステップは例えばリードコラプシングを含み得る。ある特定の実施形態では、ノイズ低減ステップは省略されてもよい。特に、他の機構（例えば複製、クラスの使用等）から、または将来的に生じ得る配列決定品質の改善の結果として信頼性が生じる場合。特に、ステップ（ｃ）が実施される場合、リードコラプシングは本明細書においてさらに定義されるようなものであり得る。本明細書で使用する場合、「リードコラプシング」および「リードのコラプシング」というこれらの用語は交換可能であることが意図される。

ステップ（ｄ）は、任意選択と考えられ得る、および／または異なる実施形態では異なる手段で実行され得る。特に、一部の実施形態では、ステップ（ｄ）は変異割合をバックグラウンドと比べるために実施される。これは総リードの合計で割られる変異体の合計を算出するステップを含む必要はない。その算出を使用せず、代わりに変異リードの数および総リードの数のみを、それらを割らずに使用する一部の不可欠な統計的検定。一部の実施形態では、方法は、各変異リードにおける個体の探査を含み、個体のバックグラウンド率を評価して変異リードと比較する。この実施形態では、全ての座位にわたる変異リードの合計を算出する必要はない。

一部の実施形態では、方法は、
（ｅ）試料を
（ｉ）変異アレル割合が所定の閾値（例えばバックグラウンド配列決定エラー率）よりも大きいと見出される場合、ｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有する、または
（ｉｉ）変異アレル割合が所定の閾値（例えばバックグラウンド配列決定エラー率）よりも大きいと見出されず、統計的に有意に大きいとも見出されない場合、ｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有してもなく、未知のｃｆＤＮＡ（例えばｃｔＤＮＡ）のステータスを有してもいない
と分類するステップ
をさらに含む。

一部の実施形態では、方法は、患者から取得した試料におけるｃｆＤＮＡ（例えばｃｔＤＮＡ）の濃度または量を定量するステップを含み、ｃｆＤＮＡ（例えばｃｔＤＮＡ）の濃度または量を定量するステップは、ステップ（ｄ）において算出した変異アレル割合からバックグラウンド配列決定エラー率を減算することを含む。一部の実施形態では、フィッシャーの正確確率検定の算出は前記ステップ（ｄ）と独立であり得る。

本明細書に記載されるように、変異のクラス当たりのバックグラウンド配列決定エラー率において差が観察された、すなわち、別々の一塩基置換のエラー率は異なる（例えばＴ＞ＧよりもＧ＞Ａに関してより高いエラー率を示す図２ｂを参照のこと）。実際、「ノイズが最も大きい」（最大エラー）変異クラスと「ノイズ」が最も小さい（最小エラー）変異クラスとの間のエラー率においてほぼ４０倍の差が見られた。本発明者らは、依然としてクラスにおける全てのバリアントリードにわたって統合を行う一方で、変異をクラスごとに分割すること（これは変異をクラスごとのグループに分割またはグループ化することと考えてもよい）を検討して、技術的ノイズ、すなわちエラーを克服し、低いレベルのｃｆＤＮＡ（例えばｃｔＤＮＡ）に関する感度を改善することが可能であるだろうということを認識した（特に、変異クラスに「データを分割すること」（すなわち変異クラスに基づいて変異をグループにグループ化すること）が、最低検出アレル割合において０．３ｐｐｍまで、１０倍前後の改善をもたらした図３ａおよび３ｂを参照のこと）。したがって、一部の実施形態では、変異アレル割合は、変異の各クラスに関するバックグラウンド配列決定エラー率を考慮に入れて、変異のクラス当たりで決定される。

一部の実施形態では、バックグラウンド配列決定エラー率は、前記少なくとも２、３、４、５、６、７、８、９、または１０以上の患者特異的座位において表される変異の各クラス（例えば塩基置換の各クラス）（「変異クラス」）に関して決定されるかまたは決定されており、ステップ（ｄ）における変異アレル割合算出は各変異クラスに関して、その変異クラスのバックグラウンド配列決定エラー率を考慮に入れて実施され、各クラスの変異アレル割合は組み合わされて、試料の全体変異アレル割合の尺度を得る。特に、全体変異アレル割合は、そのクラスにおいて観察されたリードファミリーの総数によって加重された、クラス当たりの個々のバックグラウンド減算変異アレル割合の全ての平均として算出され得る。ある特定の実施形態では、特に、変異および非変異リードの数が、変異アレル割合を決定せずにｃｆＤＮＡの存在を決定するために使用される場合、算出ステップ（ｄ）は省略してもよい。

一部の実施形態では、方法は、バックグラウンド配列決定エラー率を考慮に入れて、統計的有意性またはそうでない場合は算出した変異アレル割合の決定を行うステップを含む。変異アレル割合が変異クラス当たりで算出され、次いで組み合わされて全体変異アレル割合となる場合、算出した全体変異アレル割合の統計的有意性の決定は、各変異クラスの変異アレル割合の個々の統計的有意性を決定し、次いで個々の統計的有意性決定を組み合わせて、全体変異アレル割合に関する全体統計的有意性決定とすることを含み得る。様々な統計的方法は、変異アレル割合の統計的有意性の決定に好適であり得る。特定の場合では、変異アレル割合の統計的有意性の決定は、試料からの変異リードの数、試料からのリードの総数、およびバックグラウンド配列決定エラー率から予期された変異リードの数を含む分割表を考慮して、フィッシャーの片側正確確率検定を実行することを含み得る。変異アレル割合が変異クラス当たりを基準として算出されるある特定の実施形態では、変異アレル統計的有意性の決定は、フィッシャーの片側正確確率検定を複数回実行して、観察された変異リードの数の統計的有意性を、その変異クラスに関するバックグラウンド配列決定エラー率を考慮して決定し、それにより各変異クラスに関してｐ値を生成し、経験的なブラウンの方法を使用してｐ値を組み合わせて、試料の変異アレル割合に関する統計的有意性の全体的尺度を得ることを含み得る。

変異アレル割合が変異クラス当たりを基準として算出される場合、変異クラスの数は全体として、患者の腫瘍を表す少なくとも２、３、４、５、６、７、８、９、１０、１００、１０００、または少なくとも５０００の変異含有座位（「患者特異的座位」）に存在すると見出される変異によって左右され得る。多くの場合、変異クラスは、以下の変異クラス：Ｃ＞Ｇ、Ｇ＞Ｃ、Ｔ＞Ｇ、Ａ＞Ｃ、Ｃ＞Ａ、Ｇ＞Ｔ、Ｔ＞Ｃ、Ａ＞Ｇ、Ｔ＞Ａ、Ａ＞Ｔ、Ｃ＞Ｔ、およびＴ＞Ｃのうちの少なくとも２、３、４、５、６、７、８、９、１０、１１、または１２個全てを含み得る。好ましくは、患者特異的座位における腫瘍特異的変異は、少なくとも２、３、４、５、６、７、８、９、１０、１１、または１２の異なる変異クラスに属する変異を含む。さらなる変異クラスが本明細書において企図される。例えば、変異はより大きな数の配列サブセットに基づいて、例えばジヌクレオチドコンテキスト、トリヌクレオチドコンテキスト、または個々の座位ごとに分割されてもよく、このことはエラー率の分解能をさらに改善し得る。

本明細書に記載されるように（実施例８ならびに図１１および１３を参照のこと）、場合によっては、変異クラス当たりのエラー率は、トリヌクレオチドコンテキストごとに評価された。トリヌクレオチドコンテキストは、以下のトリヌクレオチドコンテキスト：ＣＧＣ、ＧＧＣ、ＴＣＧ、ＡＣＧ、ＧＣＧ、ＴＧＣ、ＣＣＧ、ＧＣＡ、ＣＧＡ、ＧＣＣ、ＣＧＧ、ＣＧＴ、ＡＧＣ、ＧＣＴ、ＴＣＡ、ＴＧＡ、ＡＧＴ、ＡＣＣ、ＣＣＣ、ＣＣＡ、ＣＴＴ、ＧＧＧ、ＣＣＴ、ＧＡＧ、ＣＴＧ、ＡＧＧ、ＣＡＧ、ＣＴＣ、ＡＧＡ、ＴＣＣ、ＧＧＴ、ＴＧＧ、ＣＴＡ、ＡＣＡ、ＴＣＴ、ＴＡＧ、ＡＡＧ、ＴＧＴ、ＡＣＴ、ＧＴＣ、ＧＧＡ、ＴＡＣ、ＴＴＧ、ＣＡＡ、ＴＴＣ、ＴＴＡ、ＡＴＣ、ＡＴＧ、ＴＡＡ、ＴＡＴ、ＣＡＴ、ＧＴＴ、ＡＴＴ、ＡＴＡ、ＧＡＡ、ＧＡＣ、ＧＡＴ、ＣＡＣ、ＧＴＧ、ＴＴＴ、ＧＴＡ、ＡＡＴ、ＡＡＡ、およびＡＡＣのうちの１つまたは複数（例えば全て）であり得る。変異クラスは、以下の変異クラス：Ｃ＞Ｇ、Ｇ＞Ｃ、Ｔ＞Ｇ、Ａ＞Ｃ、Ｃ＞Ａ、Ｇ＞Ｔ、Ｔ＞Ｃ、Ａ＞Ｇ、Ｔ＞Ａ、Ａ＞Ｔ、Ｃ＞Ｔ、およびＴ＞Ｃのうちの少なくとも２、３、４、５、６、７、８、９、１０、１１、または１２個全てを含み得る。特に、方法は、総変異クラスおよび／またはトリヌクレオチドコンテキストのサブセットのみを用い得る。例えば、方法は、試料当たり２、３、４、５、６、７、８、１０、または１２の最も有意なトリヌクレオチドコンテキストからのＰ値を組み合わせるステップを含み得る。特定の場合では、本発明の方法は、試料当たり６つの最も有意なトリヌクレオチドコンテキストを組み合わせるステップを含み得る。ある特定の場合では、トリヌクレオチドコンテキスト当たりのｐ値は、トリヌクレオチドコンテキストに関する変異リードの数を、そのコンテキストに関するバックグラウンドエラー率を考慮して比較するフィッシャーの検定を使用して決定され得る。各変異クラスおよびトリヌクレオチドコンテキストに関するバックグラウンドエラー率は、標的塩基の１０ｂ．ｐ．以内であるが、標的化された塩基を含まない、配列決定データの使用によって決定され得る。本発明者らは、シグナルは任意の１つの試料からの少数のコンテキストにおいてのみ予期され得ると考えられるため、変異クラスごとのエラー補正をトリヌクレオチドコンテキストから実施する場合、あらゆるトリヌクレオチドコンテキストが使用されるわけではないということが好ましい、ということを見出した。微小残存病変（ＭＲＤ）のコンテキストでは、予期は、ｃｔＤＮＡレベルは低いだろうというものであり、したがって、真のシグナルを示すトリヌクレオチドコンテキストはほとんどないということが予期される。したがって、分析中、分析をより少数のトリヌクレオチドコンテキスト（例えば上で定義された２、３、４、５、６、７、８、１０、または１２の最も有意なトリヌクレオチドコンテキスト）に制限することが正当化され得る。例えば対照試料が高いレベルのシグナルを無秩序に示す場合、そのような結果はＭＲＤと一致しないと考えられるため、このことはバックグラウンドノイズを低減することに関する有用性を有し得る。

一部の実施形態では、ステップ（ｂ）において取得される配列リードを含む配列データは、テイラードパネル配列決定（ＴＡＰＡＳ）配列リード、焦点化エクソーム配列リード、全エクソーム配列リード、または全ゲノム配列リードを表す。配列リードの選択は、とりわけ、研究されている癌の変異率を反映し得る。腫瘍由来変異は、本明細書において実証されるようにエクソーム配列決定を使用して同定することができるが、より小さな焦点化パネルまたはより大きな規模、例えば全ゲノムにわたって同定することもできる。患者が黒色腫を有する、本明細書に記載される例では、エクソーム配列決定は患者当たり数百から数千の変異を同定するのに十分であった。癌の種類の既知の変異率に基づくと、エクソーム配列決定はまた、比較的高い変異率を有する多くの癌の種類、例えば肺、膀胱、食道、または結腸直腸癌に関しても十分であり得る。メガベース当たり約１以下の変異率を有する癌の場合、変異解析のための腫瘍の全ゲノム配列決定が望ましいことがある。卵巣および脳癌の場合、これは結果として患者当たり数千の同定された変異をもたらすと考えられる。さらに、配列リードを含む配列データは、少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の変異含有座位を同定するのに十分な、配列腫瘍のエクソームまたはゲノムの部分を包含し得る。付加的にまたは代替的に、配列リードを含む配列データは、患者特異的座位における腫瘍特異的変異が少なくとも２、３、４、５、６、７、８、９、１０、１１、または１２の異なる変異クラスに属する変異を含むことを保証するのに十分な、配列腫瘍のエクソームまたはゲノムの部分を包含し得る。付加的にまたは代替的に、配列リードを含む配列データは、患者特異的座位における腫瘍特異的変異が少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、または少なくとも６４のトリヌクレオチドコンテキスト、特に、ＣＧＣ、ＧＧＣ、ＴＣＧ、ＡＣＧ、ＧＣＧ、ＴＧＣ、ＣＣＧ、ＧＣＡ、ＣＧＡ、ＧＣＣ、ＣＧＧ、ＣＧＴ、ＡＧＣ、ＧＣＴ、ＴＣＡ、ＴＧＡ、ＡＧＴ、ＡＣＣ、ＣＣＣ、ＣＣＡ、ＣＴＴ、ＧＧＧ、ＣＣＴ、ＧＡＧ、ＣＴＧ、ＡＧＧ、ＣＡＧ、ＣＴＣ、ＡＧＡ、ＴＣＣ、ＧＧＴ、ＴＧＧ、ＣＴＡ、ＡＣＡ、ＴＣＴ、ＴＡＧ、ＡＡＧ、ＴＧＴ、ＡＣＴ、ＧＴＣ、ＧＧＡ、ＴＡＣ、ＴＴＧ、ＣＡＡ、ＴＴＣ、ＴＴＡ、ＡＴＣ、ＡＴＧ、ＴＡＡ、ＴＡＴ、ＣＡＴ、ＧＴＴ、ＡＴＴ、ＡＴＡ、ＧＡＡ、ＧＡＣ、ＧＡＴ、ＣＡＣ、ＧＴＧ、ＴＴＴ、ＧＴＡ、ＡＡＴ、ＡＡＡ、およびＡＡＣからなる群から選択されるトリヌクレオチドコンテキストを含むことを保証するのに十分な、腫瘍のエクソームまたはゲノムの部分を包含し得る。

一部の実施形態では、患者の腫瘍を表す２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の変異含有座位は、患者由来の腫瘍試料から直接取得したＤＮＡを配列決定するか、または高腫瘍疾患負荷時（例えば治療的処置の開始前もしくは外科的切除前）の患者由来の血漿試料から取得したＤＮＡを配列決定することによって取得される。このように、腫瘍配列、例えば腫瘍エクソームもしくはその部分または腫瘍ゲノムもしくはその部分の決定は、腫瘍由来ＤＮＡの比較的豊富な供給源を使用して行うことができ、次いで座位が腫瘍特異的変異を含有するという情報（ステップ（ａ））は、配列リード（腫瘍由来ＤＮＡがより欠乏している時（例えば患者が少なくとも１コースの処置を受け取った後および／または外科的腫瘍切除後）に取得したステップ（ｂ））に対して実施される本発明の方法において用いることができる。例えば、方法は、低いレベルのｃｔＤＮＡを検出することによって腫瘍の再発をモニタリングするために使用され得る。患者の腫瘍を表す２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の変異含有座位を含む目的の座位の決定は全体として、どの座位が腫瘍に特異的な変異を含有するかを患者の生殖細胞系列ゲノム配列に関してまたはそれと比較して同定するために、患者の生殖細胞系列ＤＮＡ配列決定との比較を必要とし得る。例えば、バフィーコートまたは生殖細胞系列ＤＮＡの任意の他の好適な供給源（例えば唾液、毛包、皮膚、頬スワブ、白血球）から抽出されるＤＮＡ。

一部の実施形態では、目的の座位は、一塩基多型（ＳＮＰ）であることが既知の座位を取り除くことによって、例えば共通のＳＮＰデータベース（例えば１０００ＧｅｎｏｍｅｓＡＬＬまたはＥＵＲ）において見出される位置を取り除くことによってフィルタリングされる。このフィルタリングは、ＳＮＰであり得る座位を排除することによって、シグナル、すなわち腫瘍により変異した座位に焦点を当てる（本明細書における実施例１０を参照のこと）。

一部の実施形態では、ステップ（ｂ）において用意される配列リードを含む配列データは、患者由来の実質的に無細胞の血漿試料からの複数のＤＮＡ断片の配列リードを表す。一部の実施形態では、ステップ（ｂ）において用意される配列リードを含む配列データは、本明細書において定義される任意の試料種からの複数のＤＮＡ断片の配列リードを表す。試料源としての無細胞ＤＮＡ（ｃｆＤＮＡ）の使用は、試料を取得するための比較的非侵襲性の方法（いわゆる「液体生検」）を提供する。ｃｆＤＮＡから取得した配列リードは、患者の１つまたは複数の腫瘍に起源を有する循環ＤＮＡ断片の分画（ｃｔＤＮＡ分画）と、存在する場合は、非腫瘍組織または細胞に起源を有する循環ＤＮＡ断片の分画の両方の配列リードを含み得る。

一部の実施形態では、ステップ（ｂ）において取得される配列リードを含む配列データは、患者が腫瘍の１コースの処置を開始した後および／または患者が腫瘍の外科的切除を行った後に患者から取得した試料からの複数のポリヌクレオチド断片の配列リードを表し、方法は、腫瘍の存在、成長、処置応答、または再発をモニタリングするためのものである。特定の実施形態では、方法は、微小残存病変（ＭＲＤ）の存在および／または再発をモニタリングするためのものである。

本発明のこの態様および他の態様においては、患者は、黒色腫、肺癌、膀胱癌、食道癌、結腸直腸癌、卵巣癌脳癌、および／または乳癌から選択される癌を有するかまたは有していたことがある患者であり得る。特に、患者は、転移を伴うかまたは伴わない進行したおよび／または侵襲性黒色腫を含む黒色腫を有すると診断されていてもよい。

一部の実施形態では、リードコラプシングステップ（ｃ）は、断片開始および終了位置、ならびに個々の出発ｃｆＤＮＡ分子を固有に標識する少なくとも１つの分子バーコードに基づいた、重複配列決定リードのリードファミリーへのグループ化を含む。本明細書においてさらに定義されるように、「バーコード」または「分子バーコード」とは、本明細書で使用する場合、通例２０未満、例えば１０ｂｐ未満の長さの、ライブラリ調製中の第１のステップとしてＤＮＡ分子にライゲートされ得る塩基の固有の文字列を意味する。結果として、リードファミリーはただ１つに同定され、したがってその出発分子に連結され得る。このことは、「リードコラプシング」を介したエラー抑制を可能にする。したがって、同じ開始および終了位置ならびに分子バーコードを有する重複リードは、同じ出発ｃｆＤＮＡ分子を起源としているとコンピュータにより同定することができ、「リードファミリー」と称される。特に、リードがリードファミリーに含まれるためには、最低でも６０％、７０％、７５％、８０％、８５％、９０％、またはさらには９５％のコンセンサス（「コンセンサス閾値」）が全てのファミリーメンバー間で必要とされ得る。したがって、例えば、リードファミリーに３個のリードが存在し、所与のヌクレオチド位置につき、それらのリードのうちの２個はコンセンサスを示すが、１個は例えば代替塩基を示す場合、リードファミリーは結果として２／３または６６％のコンセンサスを有すると考えられる。変異が存在するが、変異塩基がリードファミリーに含めるためのコンセンサス閾値より大きいかまたは等しいコンセンサスによって支持されない場合、リードファミリーは廃棄され得る（すなわち分析においてさらには使用されない）。特定の場合では、２、３、４、または５個のリードの最小ファミリーサイズが必要とされ得る。場合によっては、この最小ファミリーサイズを満たさないリードファミリーは分析において対象から外され得る。ファミリーサイズが大きくなるほど、リードファミリーにわたるコンセンサスがより多い数の独立したリードによって支持されるため、エラー抑制の程度は大きくなる。したがって、エラー抑制ステップに関する限界を設定するために、特定の最小ファミリーサイズ閾値を指定することは好都合であり得る。

本明細書に記載されるように、本発明者らは、ｉｎｓｉｌｉｃｏサイズ選択は、緩やかな設定であっても、まれな変異アレルの喪失を最小限にしつつ変異シグナル（すなわちｃｔＤＮＡ）をエンリッチすることができることを見出した。エンリッチメントは、場合によってはより小さい初期アレル割合の場合により大きかった（図４ｃを参照のこと）。したがって、一部の実施形態では、配列リードは、非変異リードに比して、変異リードに好都合となるかまたは変異リードをエンリッチするようにサイズ選択され得る。ある特定の実施形態では、配列リードは、１１５〜１６０ｂｐ、１１５〜１９０ｂｐ、２５０〜４００ｂｐ、および／または４４０〜４６０ｂｐのサイズ範囲内のリードにｉｎｓｉｌｉｃｏでサイズ選択され、ｃｔＤＮＡを表すリードをエンリッチする。全般的に、ｃｔＤＮＡがエンリッチされ、枯渇しないサイズ範囲を使用することは好都合である。これらのサイズ範囲は癌の種類およびステージによって変動し得る。

非腫瘍ＤＮＡは１６６ｂｐでピークに達することが観察されており、したがって一部の態様では、サイズ選択窓はこの最大値の近位の長さの非腫瘍ＤＮＡを排除するかまたは最小限にするように調整され得る。より大きなエンリッチメントを結果としてもたらすと予期され得る、サイズ選択に関する１つまたは複数のより狭いサイズ窓もまた本明細書において企図される。例えば、１２０〜１５５ｂｐ、１２０〜１８０ｂｐ、２６０〜３９０ｂｐ、および／または４４５〜４５５のサイズ範囲が用いられ得る。あるいは、サイズ選択は、１１０〜２００ｂｐ、２４０〜４１０ｂｐ、および／または４３０〜４７０ｂｐ等のより広いサイズ選択窓ではより厳密でなくなり得る。一部の実施形態では、ｉｎｓｉｌｉｃｏサイズ選択は、当該試料におけるｃｔＤＮＡをエンリッチする実験的に決定したサイズ窓に基づいてあらかじめ決定された１つまたは複数（例えば２つまたは３つ）のサイズ窓に対してサイズ選択し得る。例えば、１つまたは複数の試料からの配列リードが組み合わされ、断片のサイズ分布が決定され、変異リードの割り前と野生型（すなわち生殖細胞系列配列）リードの割り前との比が決定され得る。本発明の方法のためのサイズ窓は、変異リードの野生型リードに対する比率におけるエンリッチメントを表示するサイズ窓であり得る。

ある特定の実施形態では、１つまたは複数のフィルターは、腫瘍由来である可能性のより高いファミリーに焦点を当てるために、リードファミリーに適用される。場合によっては、１つまたは複数のフィルターは、微小残存病変（ＭＲＤ）フィルター、例えば本明細書において実施例１０に記載されるフィルターであり得る。特に、フィルタリングステップは２個超の変異分子を有する座位を排除することを含み得る。代替的にまたは付加的に、フィルタリングステップは順（Ｆ）方向と逆（Ｒ）方向の両方において配列決定された断片のみを選択すること（すなわち含めること）を含み得る。実施例１０に記載されるように、少なくとも１個のＦリードと少なくとも１個のＲリードとが座位において存在する場合にのみ変異リードは座位におけるシグナルに寄与すると考えられるという要件は、配列決定アーチファクトを抑制すること、およびｃｔＤＮＡにおいてわずかにエンリッチする（図４（ａ））短いｃｆＤＮＡ断片からの変異リード（両方向のリードによって支持される）を選択することという２つの目的に役立つ。ＭＲＤフィルター、例えば２個超の変異分子を有する座位の排除、および少なくとも１個のＦリードと少なくとも１個のＲリードとを座位に有するリードのみの選択のうちの一方または両方を適用し、その結果生じたフィルタリングされた座位は、「ＭＲＤ様座位」と称される場合がある。

ある特定の実施形態では、腫瘍アレル割合加重は、腫瘍においてより広く存在する変異から適用されたシグナルの加重を増加させる（上向き加重する）ために適用される。本明細書において実施例１１に記載されるように、本発明者らは、血漿からのｃｆＤＮＡにおいて所与の変異を観察する尤度は腫瘍における所与の変異に関する腫瘍アレル割合に比例することを見出した（図１６を参照のこと）。したがって、本発明者らは、患者特異的腫瘍配列決定が、変異コンテキストごとのシグナルの集計前に腫瘍アレル割合によって座位当たりのシグナルを好都合に加重する機会を提供すると推論した。一部の実施形態では、座位当たりの変異アレル割合は腫瘍アレル割合によって加重される。一部の実施形態では、座位当たりの変異アレルの数は腫瘍割合によって加重される。好ましくは、腫瘍アレル割合加重は、座位を含む変異リードファミリーの数を（１マイナスその座位における腫瘍アレル割合）で割ることによって、および座位を含むリードファミリーの総数をまた（１マイナスその座位における腫瘍アレル割合）で割ることによって座位当たりに適用される。これは式：

を使用して表現され得、
式中、
ＡＦ_{コンテキスト}は所与の（例えばトリヌクレオチド）コンテキストのアレル頻度であり、腫瘍ＡＦは腫瘍の分析によって（例えば腫瘍から直接取得したＤＮＡを配列決定することによって）決定される座位のアレル頻度であり、ＭＲＤ様座位は、患者の腫瘍から決定され、微小残存病変シグナルを選択するためにフィルタリングされた変異含有座位である。腫瘍アレル割合による加重の効果は、特に図１５および１８を比較する実施例１１に見ることができる。図１８においては行われたが図１５においては行われなかった、上記式に従った腫瘍アレル割合による加重は、結果として変異シグナルの示差的エンリッチメントを生じる。

ある特定の実施形態では、各トリヌクレオチドコンテキストに関するｐ値は、試料をバックグラウンドエラー率に対して比較することによって決定される。次いで、トリヌクレオチドコンテキストからの上位（すなわち最も有意な）ｎ個のｐ値は、好適な技法、例えばフィッシャーの方法またはブラウンの方法を使用して組み合わされる。場合によっては、ｎは２、３、４、５、６、７、８、１０、または１２以上であり得る。例えば、ｎ＝６である場合、上位６つのトリヌクレオチドコンテキストからのｐ値が式：

に従って組み合わされ得る。

ある特定の実施形態では、全体アレル割合ＡＦ_全体は、全てのコンテキストにおける全てのシグナルに基づいて、バックグラウンドエラーＥを考慮に入れて算出される。好ましくは、ＡＦ_全体は式：

に従って決定される。

第２の態様では、本発明は、患者における癌の存在、成長、予後、退縮、処置応答、または再発をモニタリングするための方法であって、
（ｉ）患者から取得したポリヌクレオチド含有試料を配列決定して、試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを取得するステップであり、前記配列リードが、患者の癌細胞における変異保有座位であると決定された少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の座位にまたがる、ステップ、
（ｉｉ）本発明の第１の態様の方法を、ステップ（ｉ）において取得した配列データを使用して実行するステップ、
（ｉｉｉ）患者における癌の存在、成長、予後、退縮、処置応答、または再発を、少なくとも、試料を、ｃｔＤＮＡを含有する、ｃｔＤＮＡを含有しないと分類することに基づいて、またはバックグラウンドエラーを考慮に入れて算出したアレル割合に基づいて決定するステップ
を含み、任意選択で腫瘍切除後の癌の再発をモニタリングするためのものである、方法を提供する。

場合によっては、配列決定ステップ（ｉ）は、Ｉｌｌｕｍｉｎａ（登録商標）配列決定を含む次世代配列決定（ＮＧＳ）、またはサンガー配列決定を含み得る。ＮＧＳは、全ゲノム配列決定（ＷＧＳ）により、または全エクソーム配列決定（ＷＥＳ）もしくは標的化遺伝子配列決定を使用して特異的領域もしくは遺伝子に焦点を当てることによって、変異を検出するために必要とされる速度および確度を提供する。ＮＧＳ技法の例としては、合成による配列決定、ハイブリダイゼーションによる配列決定、ライゲーションによる配列決定、パイロシーケンシング、ナノポア配列決定、または電気化学的配列決定を用いる方法が挙げられる。

場合によっては、本発明のこの態様の方法は、配列決定前に、患者または２名以上の患者から取得した試料（例えば血漿試料）からＤＮＡライブラリを調製するステップをさらに含む。任意選択で、ライブラリはバーコード化されていてもよい。

場合によっては、本発明のこの態様の方法は、配列決定前に、患者から試料を取得するステップをさらに含む。例えば、血液試料は、癌を有するかまたは有する可能性が高いと診断された患者から収集され得る。試料は、実質的に無細胞のＤＮＡ源を取得する（例えば血漿試料を取得する）ために１つまたは複数の抽出または精製ステップ、例えば遠心分離に供されてもよい。方法は、試料のｃｆＤＮＡ濃度を決定するステップをさらに含み得る。試料が輸送および／または保管され得る（任意選択で凍結後）ことは具体的に企図される。試料収集は配列決定の場所から離れた場所で行われ得る、ならびに／またはコンピュータ実装方法ステップは試料収集の場所から離れたおよび／もしくは配列決定の場所から離れた場所で行われ得る（例えばコンピュータ実装方法ステップは、ネットワーク接続したコンピュータによって、例えば「クラウド」プロバイダによって実施され得る）。にもかかわらず、方法全体は、場合によっては単一の場所で実施されてもよく、これは癌の「現場」決定またはモニタリングに好都合であり得る。

場合によっては、本発明のこの態様の方法は、腫瘍撮像データを取得するステップ、および／または癌の存在、成長、処置応答、もしくは再発の決定を支援する１種もしくは複数種の腫瘍バイオマーカーを測定もしくは検出するステップをさらに含み得る。特に、腫瘍撮像データは、例えば腫瘍体積を測定するためのコンピュータ断層撮影（ＣＴ）データを含み得る。特定の場合では、バイオマーカーは乳酸脱水素酵素（ＬＤＨ）濃度を含み得る。そのような追加の腫瘍検出および／または定量の手段は、本発明の方法によってなされた決定を確証し得る、および／または不明瞭な決定を解決することを支援し得る。

場合によっては、この態様の方法は、患者を後続もしくは継続処置を含む抗癌処置に推奨するかまたは患者をそのような抗癌処置のために選択するステップをさらに含み得る。例えば、試料がｃｔＤＮＡを含有すると決定される場合（例えば変異アレル割合がバックグラウンド配列決定エラー率よりも大きい、例えば統計的に有意に大きいと見出される場合）、患者は、化学療法、免疫療法、放射線療法、外科的処置、もしくはそれらの組合せを含む抗癌処置から恩恵を受け得る癌を有するかまたはそのような癌の再発を有すると決定され得る。同様に、試料がｃｔＤＮＡを含有しないかまたは本発明の方法の検出の限界未満のｃｔＤＮＡレベルを有すると決定される場合（例えば変異アレル割合がバックグラウンド配列決定エラー率より大きくもなく、統計的に有意に大きくもないと見出される場合）、患者は癌を有しないかまたは癌から寛解していると決定され得る。したがって、患者は、望まない副作用と関連し得る不必要な抗癌処置の回避から恩恵を受け得る。

第３の態様では、本発明は、癌を有するかまたは有していたことがある患者の処置の方法であって、
ａ）本発明の第１または第２の態様の方法を実行するステップ、および
ｂ）（ｉ）試料がｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有すると決定される場合（例えば変異アレル割合がバックグラウンド配列決定エラー率よりも大きい、例えば統計的に有意に大きいと見出される場合）、抗癌処置を患者に投与するステップ、または
（ｉｉ）試料がｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有しないかもしくは本発明の方法の検出の限界未満のｃｆＤＮＡ（例えばｃｔＤＮＡ）レベルを有すると決定される場合（例えば変異アレル割合がバックグラウンド配列決定エラー率より大きくもなく、統計的に有意に大きくもないと見出される場合）、患者が癌を有しないかもしくは癌から寛解していると決定され得、抗癌療法が短縮され得ること
を含む、方法を提供する。

場合によっては、抗癌処置は、化学療法、免疫療法、放射線療法、および外科的処置から選択され得る。特に、抗癌処置は、ベムラフェニブ、イピリムマブ、パゾパニブ、ダブラフェニブ、およびトラメチニブのうちの１つまたは複数を含み得る。特に、患者が黒色腫を有するかまたは有していたことがあり、試料がｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有すると決定される場合、前述の抗癌処置は好適であり得る。

いかなる特定の理論にも拘束されることを望むものではないが、本発明者らは、本発明の方法は癌モニタリングおよびｃｆＤＮＡ、例えばｃｔＤＮＡ検出の分野を越えた適用を見出し得ると考える。特に、ＩＮＶＡＲアルゴリズムは、法科学（例えば微量の加害者（または被害者）のものと疑われるＤＮＡを、被害者（または文脈が指示する場合、加害者）と疑われる人物等の別の人物のより大きな割合のＤＮＡを含有する試料において検出すること、農業および食料（例えば汚染を検出すること）、細胞系譜追跡、臨床遺伝学、ならびに移植医療における使用を見出し得る。多くの、例えば全ての変異リードにわたって集計すること、および任意選択で変異クラスごとに分割すること（さらに分析すること）によってシグナル対ノイズ比を改善するＩＮＶＡＲ法の能力は、この方法を、いくつかの座位においてＤＮＡまたはその断片等の他のポリヌクレオチド（例えばＲＮＡ）と配列が異なり得る少ない割合の標的ＤＮＡまたはその断片等の他のポリヌクレオチド（例えばＲＮＡ）を試料が含有すると疑われる場合の適用において魅力的なものにし、より大きな割合の試料を作製する。

したがって、第４の態様において、本発明は、試料における総ポリヌクレオチドの少ない割合である、試料における標的ポリヌクレオチドを検出するための方法であって、標的ポリヌクレオチドおよび非標的ポリヌクレオチドは、複数の座位における配列が異なり、方法が、
（ａ）少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の座位であり、それぞれにおける少なくとも１つの塩基が標的ポリヌクレオチド配列と非標的ポリヌクレオチド配列との間で異なる、座位（「標的特異的座位」）を含む配列情報を取得するステップ、
（ｂ）試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを取得するステップであり、前記配列リードが、ステップ（ａ）の前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の標的特異的座位にまたがる、ステップ、
（ｃ）任意選択で、リードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
（ｄ）前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００以上の標的特異的座位の一部または全てにわたる標的ポリヌクレオチド割合を算出するステップであり、任意選択で標的ポリヌクレオチド割合が式：

に従って変異リードおよび総リードを集計することによって算出される、ステップ、
（ｅ）試料を
（ｉ）標的ポリヌクレオチド割合がバックグラウンド配列決定エラー率に基づいて予期され得る割合よりも統計的に有意に大きいと見出される場合、標的ポリヌクレオチドを含有する、または
（ｉｉ）標的ポリヌクレオチド割合がバックグラウンド配列決定エラー率に基づいて予期され得る割合よりも統計的に有意に大きいと見出されない場合、標的ポリヌクレオチドを含有してもなく、未知の標的ポリヌクレオチドのステータスを有してもいない
と分類するステップ
を含む、方法を提供する。

場合によっては、バックグラウンド配列決定エラー率は、前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の座位において表される塩基置換の各クラスに関して決定されるかまたは決定されており、ステップ（ｄ）における標的ポリヌクレオチド割合算出は各塩基置換クラスに関して実施され、
標的ポリヌクレオチド割合統計的有意性決定は、各塩基置換クラスに関する統計的有意性を、その塩基置換クラスのバックグラウンド配列決定エラー率を考慮に入れて計算すること、および計算した各塩基置換クラスの統計的有意性を組み合わせて、試料の全体標的ポリヌクレオチド割合に関する統計的有意性の尺度を得ることを含む。

標的ポリヌクレオチドはＤＮＡであってもＲＮＡであってもよい。
本発明の任意の態様においては、患者は哺乳動物、好ましくはヒトである。患者は癌を有すると診断されていてもよい。場合によっては、患者は、癌のための１コースの処置を経験した場合がある、および／または癌を切り取る外科的処置を経験した場合がある。

本発明の任意の態様においては、方法は、複数（例えば２、３、４、５、または６つ以上）の複製物における所与の試料を分析するステップ、および複製物におけるシグナルを使用して、試料におけるｃｆＤＮＡの存在または非存在の決定における信頼性を改善するステップを含み得る。そのような場合、本発明の方法の他の制約を緩和することが可能である。例えば、試料複製物を使用することによって、リードコラプシングステップを省略することが可能であり得る。にもかかわらず、試料複製物の使用およびリードコラプシングは相互に排他的ではなく、したがって試料複製物とリードコラプシングの両方は、ある特定の実施形態では、本発明の方法において共に用いられ得る。

本発明の任意の態様においては、一部の実施形態では、試料の分析は異なる断片サイズのＤＮＡを分けるサイズ選択ステップを含む。

一部の実施形態では、患者から取得した試料は、１つ未満の腫瘍由来一倍体ゲノムを含む有限容量試料である。一部の実施形態では、試料からの配列決定データは、１、２、３、４、１０、または１２未満の一倍体ゲノムの配列決定カバレッジまたは深度を表す。

一部の実施形態では、患者から取得した試料は、
（ｉ）５００μｌ未満、４００未満、２００未満、１００μｌ未満、または７５μｌ未満の血液、血清、または血漿試料（例えば約５０μｌの血液または血漿試料）、
（ｉｉ）穿刺吸引（ＦＮＡ）、
（ｉｉｉ）リンパ節生検、
（ｉｖ）尿、脳脊髄液、喀痰、気管支洗浄、子宮頸部スメア、または細胞学的試料、
（ｖ）患者からの収集時から１年、２年、３年、５年、または１０年超保管された試料、および
（ｖｉ）以前に処理されており、ＤＮＡもしくは配列決定品質に関する品質測定基準を満たしていない試料、または１組の試料に属する試料であり、１組の試料からの他の試料が、以前に処理されており、ＤＮＡもしくは配列決定品質に関する品質測定基準を満たしていない、試料
からなる群から選択される有限容量試料である。

一部の実施形態では、患者から取得した試料は、
乾燥血斑試料、
穿刺血液試料、
患者からの収集後１日超（例えば少なくとも１か月）、または少なくとも１年間、または少なくとも１０年間保管された、５００μｌ未満である保存血液、血清、または血漿試料
である。

一部の実施形態では、患者は健康であるかもしくは疾患（例えば癌）を有する、および／または患者はヒトもしくは非ヒト動物（例えばげっ歯類）である。

一部の実施形態では、動物は異種移植または異種間移植されたヒト腫瘍組織を有する。

一部の実施形態では、分析される試料（例えば患者から取得した試料）は、２００ｂｐ超、３００ｂｐ超、５００ｂｐ超、７００ｂｐ超、１０００ｂｐ超、１２００ｂｐ超、１５００ｂｐ超、または２０００ｂｐ超のゲノムＤＮＡ（ｇＤＮＡ）断片が分析前、例えばＤＮＡ配列決定前に試料からフィルター除去されるか、枯渇されるか、または取り除かれるサイズ選択ステップに供されて、サイズ選択された試料を生成する。

一部の実施形態では、サイズ選択ステップは配列決定ライブラリ調製前または配列決定ライブラリ調製後に実行される。

一部の実施形態では、サイズ選択ステップは、ｇＤＮＡ断片のビーズに基づいた捕捉を用いる右側サイズ選択である。

一部の実施形態では、方法は、その試料における患者特異的変異シグナルの残りの分布と一致しない、座位における外れ値ノイズを抑制する（「外れ値抑制」）ステップを含む。

一部の実施形態では、試料におけるｃｔＤＮＡ存在の尤度は、一般化尤度比：

によって決定され、一般化尤度比という用語は、実施例１４の補足的方法に定義されているようなものである。

第５の態様では、本発明は、患者から取得した試料におけるバリアント無細胞ＤＮＡ（ｃｆＤＮＡ）を検出するための方法であって、試料の分析が異なる断片サイズのＤＮＡを分けるサイズ選択ステップを含む、方法を提供する。

一部の実施形態では、取得される試料は、
（ｉ）５００μｌ未満、４００未満、２００未満、１００μｌ未満、または７５μｌ未満の血液、血清、または血漿試料（例えば約５０μｌの血液または血漿試料）、
（ｉｉ）穿刺吸引（ＦＮＡ）、
（ｉｉｉ）リンパ節生検、
（ｉｖ）尿、脳脊髄液、喀痰、気管支洗浄、子宮頸部スメア、または細胞学的試料、
（ｖ）患者からの収集時から１年、２年、３年、５年、または１０年超保管された試料、および
（ｖｉ）以前に処理されており、ＤＮＡもしくは配列決定品質に関する品質測定基準を満たしていない試料、または１組の試料に属する試料であり、１組の試料からの他の試料が、以前に処理されており、ＤＮＡもしくは配列決定品質に関する品質測定基準を満たしていない、試料
からなる群から選択される有限容量試料である。

一部の実施形態では、前記サイズ選択ステップは、２００ｂｐ超、３００ｂｐ超、５００ｂｐ超、７００ｂｐ超、１０００ｂｐ超、１２００ｂｐ超、１５００ｂｐ超、または２０００ｂｐ超のゲノムＤＮＡ（ｇＤＮＡ）断片を、分析前、例えばＤＮＡ配列決定前にフィルター除去するか、枯渇させるか、または取り除くことを含む。

一部の実施形態では、方法は、
（ｉ）サイズ選択された試料もしくはサイズ選択された試料から生成されたライブラリをＤＮＡ配列決定して複数の配列リードを生成し、配列リードを分析してｃｔＤＮＡの存在を検出するステップ、または
（ｉｉ）メチル化等のＤＮＡ修飾を分析するステップ
を含む。

一部の実施形態では、患者から取得した試料は、
乾燥血斑試料、
穿刺血液試料、
患者からの収集後１日超（例えば少なくとも１か月）、少なくとも１年間、または少なくとも１０年間保管された、５００μｌ未満である保存血液、血清、または血漿試料
である。

一部の実施形態では、動物モデルは異種移植または異種間移植されたヒト腫瘍組織を有する。

一部の実施形態では、前記分析は、サイズ選択された試料またはサイズ選択された試料から生成されたライブラリの次世代配列決定（ＮＧＳ）を含む。

一部の実施形態では、前記分析は、サイズ選択された試料またはサイズ選択された試料から生成されたライブラリを配列決定して配列リードを生成することを含み、
本発明の第１から第４の態様のいずれかの方法を実施すること、
コピー数分析を実施すること、
配列リードを処理して、コピー数中立からのトリミングされた中央絶対偏差（ｔ−ＭＡＤ）スコアもしくはｉｃｈｏｒＣＮＡスコアを決定すること、ならびに／または
配列リードを少なくとも２種の異なる参照ゲノム、例えばヒト参照ゲノムおよびげっ歯類参照ゲノムに対してアラインメントすること
から選択される配列リードの分析をさらに含む。

一部の実施形態では、ｔ−ＭＡＤスコアは、健康な対象に由来する全ゲノムデータセットにおいて高コピー数変動を呈するゲノムの領域をトリミングし、次いでゲノムのトリミングされなかった領域の、ｌｏｇ_２Ｒ＝０からの中央絶対偏差を算出することによって決定される。

一部の実施形態では、サイズ選択ステップは配列決定ライブラリ調製ステップの前または後に実行される。

一部の実施形態では、バリアント無細胞ＤＮＡは循環腫瘍ＤＮＡ（ｃｔＤＮＡ）である。

一部の実施形態では、方法は、癌の早期検出、癌処置のモニタリング、残存疾患の検出のためのものであり、処置決定を導くため、すなわち患者における癌の状況におけるステータス、または癌の進行、または処置に対する癌の応答、または患者のためのさらなる処置の必要性もしくは種類を評価するために使用される。

一部の実施形態では、患者はヒトまたは癌の動物モデル（例えばげっ歯類）である。

一部の実施形態では、バリアント無細胞ＤＮＡは、
患者に移植されたドナー組織もしくは器官からのｃｆＤＮＡ、
患者の妊娠中の胎児からの胎児ｃｆＤＮＡ、または
異常にメチル化したｃｆＤＮＡ
を含む。

一部の実施形態では、方法は、医療処置、食事の変更、もしくは身体運動を導く情報を提供するために使用されるか、または法科学的分析のため、もしくは生物学的材料が試料に存在する固体を同定するため、もしくは生物学的材料が試料に存在する生物を同定するために使用される。

一部の実施形態では、患者は、小児癌を有するかまたは有すると疑われるヒト小児である。小児癌は多くの場合、例えば患者の年齢のために試料収集における困難と関連し、試料は少ない容量であり得る、および／または低いレベルのｃｔＤＮＡを含有し得る。小児癌としては、様々な脳腫瘍、リンパ腫、白血病、神経芽腫、ウィルムス腫瘍、非ホジキンリンパ腫、小児横紋筋肉腫、網膜芽腫、骨肉腫、ユーイング肉腫、胚細胞腫瘍、胸膜肺芽腫、肝芽腫、および肝細胞癌腫が挙げられる。

第６の態様では、本発明は、患者から取得したＤＮＡ含有試料における標的無細胞ＤＮＡ（ｃｆＤＮＡ）を検出するためのシステムであって、
少なくとも１つのプロセッサ、ならびに
少なくとも１つのプロセッサによって実行される場合、少なくとも１つのプロセッサに、
（ａ）患者由来のＤＮＡ含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを受け取るステップであり、前記配列リードが少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の変異含有座位にまたがる、ステップ、
（ｂ）任意選択で、配列決定ノイズ低減を実施する、例えばリードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
（ｃ）前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で変異アレル割合が式：

に従って変異リードおよび総リードを集計することによって算出される、ステップ、
（ｄ）試料を、算出した変異アレル割合に基づいて、標的ｃｆＤＮＡを含有するまたは含有しないと分類するステップ
を含む操作を実施させる命令を含有する少なくとも１つの非一時的コンピュータ可読媒体
を含む、システムを提供する。

一部の実施形態では、システムは本発明の方法における使用のためのものである。

第７の態様では、本発明は、患者から取得したＤＮＡ含有試料における標的無細胞ＤＮＡ（ｃｆＤＮＡ）を検出するための非一時的コンピュータ可読媒体であって、少なくとも１つのプロセッサによって実行される場合、少なくとも１つのプロセッサに、
（ａ）患者由来のＤＮＡ含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを受け取るステップであり、前記配列リードが前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の変異含有座位にまたがる、ステップ、
（ｂ）任意選択で、配列決定ノイズ低減を実施する、例えばリードコラプシングを実施して配列リードをリードファミリーにグループ化するステップ、
（ｃ）前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で変異アレル割合が式：

に従って変異リードおよび総リードを集計することによって算出される、ステップ、
（ｄ）試料を、算出した変異アレル割合に基づいて、標的ｃｆＤＮＡを含有するまたは含有しないと分類するステップ
を含む操作を実施させる命令を含む、非一時的コンピュータ可読媒体を提供する。

一部の実施形態では、媒体は本発明の方法における使用のためのものである。

次に、本発明の実施形態が、添付の図面を参照して例として、ただしそれによって限定されずに説明される。しかしながら、本発明の様々なさらなる態様および実施形態は、本開示を考慮して当業者に明らかとなるだろう。

本発明は、記載される態様および好ましい特徴の組合せが明確に容認できないかまたは明白に回避されるべきであると述べられている場合を除き、そのような組合せを含む。本発明のこれらのおよびさらなる態様および実施形態は、添付の実施例および図面を参照して下にさらに詳細に記載される。

ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓおよびテイラードパネル配列決定の原理的説明および概略を示す図である。完全な分析性能を有するとしても、単一座位アッセイは、無作為なサンプリングのために低いｃｔＤＮＡレベルを検出することができない可能性がある。このことは、同じ試料に関して多重アッセイを使用することによって克服され得る。表は、多様なレベルの入力材料および標的化された変異に関して探査される断片の数を示し、１，０００の入力ゲノムにおいて探査される１，０００の変異座位は、サンプリングされる１０^６個の分子をもたらす。ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓおよびテイラードパネル配列決定の原理的説明および概略を示す図である。サンプリングエラーを克服するために、数百から数千の変異にわたるシグナルを統合し、試料（変異ではない）を、ｃｔＤＮＡに関して有意に陽性または検出されないと分類する。既知の腫瘍遺伝子型同定された座位と重なる血漿における配列決定リードは「患者特異的」リードと称され、隣接する座位、および他の患者において評価された同じ座位は、バックグラウンドノイズ率を推定するために使用することができる。ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓおよびテイラードパネル配列決定の原理的説明および概略を示す図である。本明細書に記載されるように、腫瘍配列決定を最初に実行し、患者特異的ハイブリッド捕捉ベイトの設計を可能にした。患者特異的ハイブリッド捕捉ベイトは、無細胞ＤＮＡを捕捉し、血漿における中央値で６７３の座位（９０〜５，３１２の範囲）を配列決定するために使用され、各試料においてＳＮＶ座位当たり１，３６７ｘの品質フィルター処理深度中央値（ＩＱＲ７６１〜１，８８６ｘ）を達成した。エラー抑制後に観察されたエラー率を示すグラフである。１から５の間のリードファミリーの最小ファミリーサイズ要件を有する、リードをコラプシングするリードファミリーによるエラー抑制後に残留する分子の比率を示す箱ひげ図（上側のパネル）。各ファミリーサイズ閾値に関して、リードファミリー当たりのエラー率を示す（下側のパネル）。標的化バリアントの両側１０ｂｐの標的外（ただしベイト適合）配列決定リードは、エラー率を決定するために使用した。エラー抑制後に観察されたエラー率を示すグラフである。５の最小ファミリーサイズを用いた、１２の変異クラスに分割された配列変化に関するエラー抑制されていない（青；上側）およびエラー抑制された（赤；下側）エラー率。示された中央値前後のデータの広がりを特性解析するために、データをリサンプリング、または「ブートストラップ」し、それによって複数の試料をデータから反復して取り出し、広がりを特性解析する。この場合、データは１００回ブートストラップされ、９５％信頼区間が示される。図３ａはＩＮＶＡＲとクラスごとの検出との感度の分析を示す図である。データを変異クラスに分割していない、エラー抑制を用いた添加希釈実験（ｓｐｉｋｅ−ｉｎｄｉｌｕｔｉｏｎｅｘｐｅｒｉｍｅｎｔ）（５０ｎｇの入力）に関する予期されたアレル割合対観察されたアレル割合のプロット。塗りつぶされた丸は、ＩＮＶＡＲを使用したｃｔＤＮＡの有意な検出を示す。エラー抑制されたデータに関する全体のバックグラウンドエラー率を示す（赤の横破線）。図３ｂはＩＮＶＡＲとクラスごとの検出との感度の分析を示す図である。ＩＮＶＡＲを使用し、かつデータを変異クラスごとに分割した検出を用いた同じ添加希釈を示す。全体のバックグラウンドエラー率およびノイズが最も小さい変異クラスのエラー率を示す（赤の横破線）。バックグラウンド減算をクラスごとに実施した。有意な検出は０．３ｐｐｍまで達成された。図３ｃはＩＮＶＡＲとクラスごとの検出との感度の分析を示す図である。分析する座位の数をｉｎｓｉｌｉｃｏでダウンサンプリングし、５０から５，０００の間の変異を試験した（方法）。感度は、変異ＤＮＡが異なるレベル（示されている）に希釈された試料に関して示す。２，５００の変異に関して、希釈ｃｔＤＮＡは０．３ｐｐｍにおいて約５０％の感度で検出された。図３ｄはＩＮＶＡＲとクラスごとの検出との感度の分析を示す図である。特異度を、非患者特異的データを使用して異なる数の変異に関して評価して、偽陽性検出率を評価した。２，５００の変異に関して、偽陽性率は２００分の１未満であった。血漿における腫瘍由来および野生型ＤＮＡ断片のサイズプロファイルを示すグラフである。患者特異的座位におけるエラー抑制されたリードファミリーを変異および野生型ファミリーに分割した。５ｂｐの区間における変異リードの比率を赤で示し、野生型リードを青で示す。血漿における腫瘍由来および野生型ＤＮＡ断片のサイズプロファイルを示すグラフである。各区間に関して、正規化した変異リードと野生型リードとの比をエンリッチメント比として決定した。エンリッチメント最大値は、リンカーＤＮＡの長さを引いたヌクレオソームＤＮＡに概ね対応する約１４０ｂｐおよび約３００ｂｐで観察された、エンリッチされた区間を青で着色する。血漿における腫瘍由来および野生型ＤＮＡ断片のサイズプロファイルを示すグラフである。（ｂ）におけるエンリッチ区間に基づいてｉｎｓｉｌｉｃｏでサイズ選択された各試料に関して、変異アレル割合のエンリッチメント百分率を示す。エンリッチされた試料を青で着色する。指数曲線はデータに適合した。ＩＮＶＡＲ−ＴＡＰＡＳの臨床適用を示すグラフである。ｃｔＤＮＡ変異アレル割合を、濃く塗られた異なる四角によって示される複数の療法を連続して受けた１名の患者（ＭＲ１００４）に関して時間の経過と共にプロットする。塗りつぶされた丸は、ｃｔＤＮＡの有意な検出を示す。検出されなかった時点は、達成された総深度に基づいて、考えられる最大のアレル割合でプロットする。第４の時点の検出はサイズ選択後に達成され、追加の丸によって示す。ＩＮＶＡＲ−ＴＡＰＡＳの臨床適用を示すグラフである。同じ患者に関する、時間の経過を伴う総腫瘍体積を示す。ＩＮＶＡＲ−ＴＡＰＡＳの臨床適用を示すグラフである。この患者によって時間の経過と共に受け取られた全身療法およびＲＥＣＩＳＴ応答データを示す。ＰＤ＝進行性疾患。ＩＮＶＡＲ−ＴＡＰＡＳの臨床適用を示すグラフである。ＣＴ撮像からの腫瘍体積を、全ての患者に関してｃｔＤＮＡ変異アレル割合に対してプロットする。０．６７のピアソン相関が観察された（Ｐ＝０．０００２）。ＩＮＶＡＲ−ＴＡＰＡＳの臨床適用を示すグラフである。ｃｔＤＮＡレベルが処置開始後に１０ｐｐｍ未満に低減した患者（ｎ＝１０）（赤）は、ｃｔＤＮＡレベルがいずれの時点でもこの閾値未満に一度も低下しなかった患者（淡青）よりも２４か月長い全生存期間を有した（ログランク検定、Ｐ＝０．００９）。ＩＮＶＡＲ−ＴＡＰＡＳの臨床適用を示すグラフである。変異ＤＮＡの有意な検出を有する各ライブラリ（方法）に関して、ライブラリ調製に対するＤＮＡ入力質量を、ＩＮＶＡＲによって決定された試料における変異ＤＮＡ割合に対してプロットする。青線は、単一座位に関するアッセイが、その座位において少なくとも１個の変異分子をサンプリングする確率に基づいて９５％の感度を有し得る位置を示す。耐性変異の新たな検出を示す図である。患者ＭＲ１０２２に関して、ＣＯＳＭＩＣにおいて以前に同定された個々の変異を、処置中の時間の経過と共にプロットする。ＮＲＡＳＱ６１Ｋ変異が３つの経時的血漿時点において新たに同定された。この変異は患者の腫瘍において以前には同定されなかった。耐性変異の新たな検出を示す図である。時間の経過を伴う複数の腫瘍病変の体積を同じ患者に関して示し、総体積を太線で示す。耐性変異の新たな検出を示す図である。患者ＭＲ１０２２に関する病変位置を示すＣＴ撮像。複数の変異にわたるシグナルの統合を示すグラフである。患者当たりのエクソーム当たりの同定された変異の数を示す。複数の変異にわたるシグナルの統合を示すグラフである。高いレベルのｃｔＤＮＡを有する血漿試料の一例として、各患者特異的座位のアレル割合を示す。ｙ軸は１００までに限定されている。変異リードを全ての座位にわたって集計して、深度加重平均変異アレル割合を得ることができる。この統合された変異アレル割合を赤の縦破線で示す（「平均」と称する）。データを変異クラスに分割していない、エラー抑制を用いた経験的添加希釈実験（３．７ｎｇの入力）に関する予期されたアレル割合対観察されたアレル割合のプロットを示すグラフである。塗りつぶされた丸は、ＩＮＶＡＲを使用したｃｔＤＮＡの有意な検出を示す。エラー抑制されたデータに関する全体のバックグラウンドエラー率を示す（赤の横破線）。患者当たりのｃｔＤＮＡのエンリッチメント比を示すグラフである。各患者に関して、変異および野生型リードを、エラー抑制されたデータからの患者の全ての血漿試料にわたって集計した。各５ｂｐの空間に関して、変異断片の割り前対野生型断片の割り前の比を示す。１超のエンリッチメント比を有する区間を青で着色する。血漿ｃｔＤＮＡと臨床パラメータとの関係を示すグラフである。血漿ｃｔＤＮＡ変異アレル割合を、適合した時点における乳酸脱水素酵素（ＬＤＨ）濃度に対してプロットする。塗りつぶされた丸はｃｔＤＮＡの有意な検出を示す。ＬＤＨの正常の上限である２４５Ｕ／Ｌを赤の破線で示す。血漿ｃｔＤＮＡと臨床パラメータとの関係を示すグラフである。ベースラインｃｔＤＮＡ濃度は全生存期間と負に相関する（ピアソンｒ＝−０．６１；Ｐ＝０．０４）。トリヌクレオチドコンテキストおよび変異クラスごとに分割された変異計数を示すグラフである。ステージＩＶの黒色腫を有する１０名の患者からの新鮮凍結腫瘍生検を配列決定した。腫瘍変異アレル割合のヒストグラムを示す図である。ステージＩＶの黒色腫を有する１０名の患者からの新鮮凍結腫瘍生検を配列決定した。腫瘍変異アレル割合中央値は約２５％であると推定された。トリヌクレオチドコンテキストおよび変異クラスごとのバックグラウンドエラー率のプロットを示すグラフである。エラー率は、コンテキストにおいて非参照である総リードファミリーの比率として決定した。配列決定は、健康な個体からの血漿に関するＴＡＰＡＳを使用して実施し、２の最小ファミリーサイズ閾値を用いてエラー抑制した。シグナルは、ＦリードとＲリードの両方において検討するために必要とされた。添加希釈実験に関する変異アレル割合のヒストグラムを示す図である。添加実験の希釈レベルごとの、座位当たりの変異リードの数のプロットを示すグラフである。各点は１つの座位を表す。変異リードを有しない点は示していない。配列決定がＰＥ１５０を用いて実施され、かつｃｆＤＮＡ分子が約１６０ｂｐである場合、ＦリードとＲリードの両方においてＴＡＰＡＳを用いて配列決定された個々の変異は、その座位に２個の変異リードを有し得る。腫瘍エクソームアレル割合対血漿ＴＡＰＡＳアレル割合のプロットを示すグラフである。高いレベルのｃｔＤＮＡを有する患者からの血漿試料を、変異出現のこの分析のために使用した。血漿における１％未満の変異アレル割合の座位の比率対腫瘍アレル割合のプロットを示すグラフである。変異アレル割合が１％未満である座位の比率は、低い変異アレル割合を有する腫瘍変異座位において最大であった。腫瘍アレル割合によって加重された（１−腫瘍ＡＦ）、座位当たりの添加希釈実験変異リードファミリーを示すグラフである。図１５と同じ希釈実験を使用した。試験および対照試料に関する腫瘍ＡＦ加重前および後の変異の合計を示すグラフである。変異の合計が４以下の座位のみを示す。試験試料からの変異リードを青で示し、対照を赤で示す。試験および対照に関する変異リードの絶対数を、このプロットに関して等しくなるようにダウンサンプリングした。破線は、参照用のｙ＝ｘおよびｙ＝２ｘの線を表す。エクソーム配列決定を使用した試験および対照試料に関する腫瘍ＡＦ加重前および後の変異の合計を示すグラフである。変異の合計が４以下の座位のみを示す。試験試料からの変異リードを青で示し、対照を赤で示す。リードファミリーのダウンサンプリングは実施しなかった。破線は、参照用のｙ＝ｘおよびｙ＝２ｘの線を表す。分子バーコードを用いない、血漿エクソーム配列決定を使用した５×１０^−５の変異アレル割合の検出を示すグラフである。試験および対照試料に関するＰ値を示し、ＩＮＶＡＲからのそれらの全体アレル割合に対してプロットする。各点は１つの試料を表す。検出された試料を青で示し、検出されなかった試料を赤で示す。Ｐ値の閾値は、９７．５％の特異度を有する対照試料を使用して経験的に設定した。ＴＡＰＡＳデータに対する非標的化ＩＮＶＡＲの適用を示すグラフである。この添加希釈実験の予期されたアレル割合（ＡＦ）を、ＩＮＶＡＲによって決定された全体アレル割合（ＡＦ）に対してプロットする。試験試料を青で示し、対照を赤で示す。図２３ａはＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓの研究概略および原理的説明を示す図である。高いレベルのｃｔＤＮＡを有する試料（青で示す、上段のパネル）では、変異（橙色）を保有する複数のＤＮＡ断片は、血漿において、ホットスポットアッセイまたは限定された遺伝子パネル（ピンク色の陰）によって包含された座位にわたって見出され得る。これらは、種々のアッセイを使用して、健康な細胞からのバックグラウンド非変異リード（灰色）と区別することができる。非常に低い存在量のｃｔＤＮＡを有する試料（下段のパネル）では、限定されたカバレッジの範囲を有するアッセイはいかなる変異断片も検出しない場合があるが、変異断片は、腫瘍において変異している数多くの座位（緑の縦点線）にまたがることによって検出される可能性がより高くなる。散発性変異もまた低い比率で生じ得るが、本図では表さなかった。図２３ｂはＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓの研究概略および原理的説明を示す図である。分析された一倍体ゲノム対変異の数をプロットする、ＩＮＶＡＲを使用したｃｔＤＮＡ分析に関する考えられる機能点の範囲の図。斜めの線は、同数の有益なリード（ＩＲ、ｈＧＡ×標的化座位と等価）を生成する複数の手段を示す。現行の方法は多くの場合、患者当たり１〜３０の変異にわたる、約１０ｎｇのＤＮＡ（ゲノムの３００〜１０，０００の一倍体コピー）の分析に焦点を当てる。これは典型的には、結果として約１０，０００個のＩＲを生じ、頻繁に直面する０．０１％〜０．１％の検出限界に至る^６、１０。本研究において、本発明者らは、より多い数の標的化変異からの情報を利用するＩＮＶＡＲという分析枠組み（図２４）を開発した。患者特異的ハイブリッド捕捉パネルを使用して、大半の試料に関して１０^４〜１０^６個のＩＲを取得した（図２５および図２６を参照のこと）。ＩＮＶＡＲと調和するようにｃｆＤＮＡのＷＥＳおよびＷＧＳを使用して、限定された入力からｃｔＤＮＡを検出した（図２７および図２８）。ｎｇ、ナノグラム；ｍＬ、ミリリットル。図２３ｃはＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓの研究概略および原理的説明を示す図である。ＩＮＶＡＲ法による配列決定データの使用法の概要。個々の変異リストを、患者の腫瘍試料および非癌性物質の分析によって各患者に関して生成する。本研究では、ＷＥＳを使用して腫瘍およびバフィーコートＤＮＡを分析した。データを、適合した患者（着色した四角で示す）、および腫瘍またはバフィーコート分析においてこの座位が変異していると見出されなかった同じコホートからの追加の患者（灰色の四角によって示す）における目的の座位それぞれに関して収集する。そのようなデータは、標準化された配列決定パネル（例えばＷＥＳ／ＷＧＳ）を全ての試料に適用することによって（図２７および図２８）、または複数の患者特異的変異リストを組み合わせて複数の患者にわたって配列決定されるカスタムパネルとすることによって（図２５および図２６）生成することができる。各患者に関して、ＩＮＶＡＲは、患者特異的変異リストの座位にわたる配列決定情報を集計する。それらの座位における他の患者からのデータ（「非適合変異」）は、バックグラウンド変異率およびｃｔＤＮＡ検出カットオフを決定するために使用される。図２３ｄはＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓの研究概略および原理的説明を示す図である。大きな患者特異的変異リストにわたる配列決定データを高深度で生成するために、腫瘍遺伝子型同定によって生成された患者特異的変異リストを使用して、血漿試料から抽出したＤＮＡに適用されるハイブリッド捕捉パネルを定義した。図２４ａはＩＮＶＡＲ法の開発および分析性能を示す図である。ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓ。サンプリングエラーを克服するために、シグナルを数百から数千の変異にわたって集計した。ここで、本発明者らは、試料（個々の変異ではない）を、ｃｔＤＮＡを有意に含有するまたは不検出と分類する。「有益なリード」（ＩＲ、青で示す）は、患者の試料から生成された、同じ患者の変異リストにおける座位と重なり合うリードである。これらのうちの一部は目的の座位において変異を保有し得る（橙色で示す）。同じ座位における他の患者の血漿試料からのリード（「非患者特異的」）は、配列決定エラー、ＰＣＲアーチファクト、または生物学的バックグラウンドシグナルに起因して生じ得るバックグラウンドエラー率（紫で示す）の率を算出するための対照データとして使用する。ＩＮＶＡＲは、断片長および腫瘍アレルの割合に関する追加の配列決定情報を統合して検出を増強する。図２４ｂはＩＮＶＡＲ法の開発および分析性能を示す図である。異なるエラー抑制設定（補足的方法）後のエラー率の低下。図２４ｃはＩＮＶＡＲ法の開発および分析性能を示す図である。データフィルタリング後のトリヌクレオチドコンテキストおよび変異クラスごとのエラー率。エラー率は同じ変異クラス内で１００倍以上変動する可能性があり、それらのトリヌクレオチドコンテキストに関する座位を評価する必要性を強調する。図２４ｄはＩＮＶＡＲ法の開発および分析性能を示す図である。患者の３つの異なるコホートからの変異断片のＬｏｇ_２エンリッチメント比。ｃｔＤＮＡに関してエンリッチされたサイズ範囲は、ＩＮＶＡＲアルゴリズムによってより大きな重みが割り当てられる。図２４ｅはＩＮＶＡＲ法の開発および分析性能を示す図である。ＩＮＶＡＲの感度を評価するための添加希釈実験。エラー抑制されたデータをＩＮＶＡＲに対して使用した場合、ｃｔＤＮＡは、３．６ｐｐｍまでは全ての希釈液の複製物において、３．６×１０^−７の予期されたｃｔＤＮＡアレル割合では３つの複製物のうちの２つにおいて検出された（補足的方法）。癌患者からの添加されたＤＮＡを含まない、同じ健康な個体からの１１の複製物のエラー抑制されたデータを使用した場合、変異リードは、患者特異的変異リストにわたって集計された６．３×１０^６個の有益なリードにおいて観察されなかった。図２４ｆはＩＮＶＡＲ法の開発および分析性能を示す図である。添加希釈系列における感度は、分析された座位の数を１から５，０００の間の変異にｉｎｓｉｌｉｃｏでダウンサンプリングした後に評価した（補足的方法）。図２５ａは患者特異的捕捉パネルにわたるＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓを示す図である。３つのコホートにわたる６６名の癌患者からの１４４の血漿試料における、分析された一倍体ゲノム（ｈＧＡ）の数（固有のリードの平均深度として算出）および標的化された変異の数。これらを、患者特異的変異リストを包含するカスタムハイブリッド捕捉パネル（図２３ｄ）を使用して配列決定して、中央値で６２８の変異した座位にわたって、１８５の、リードのコラプシング後の固有深度中央値（ｈＧＡ）（方法）を達成した。各ハイブリッド捕捉パネルは、同じコホート由来の複数の患者からの変異リストを組み合わせ、複数の患者からの血漿試料に適用されて、患者適合リードと対照データの両方を生成した（図２３ｃ）。斜めの破線は、示されたＩＲを生じる標的化座位ｈＧＡの数を示す。図２５ｂは患者特異的捕捉パネルにわたるＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓを示す図である。これらの３つのコホートの症例にわたる、異なる数の分析された変異を用いて取得可能であり得る有益なリードの数。感度の増加はＩＲに直接相関し、検出される最小ｃｔＤＮＡ割合はＩＮＶＡＲの現行の実装（方法）では２／ＩＲである。赤線は、腫瘍ＷＥＳによって同定された全ての変異を包含するカスタムパネルを用いて取得したＩＲの分布を示す。淡い／濃い緑線は、１または２０の変異を各試料に関して分析した場合に生成されたＩＲを示す（座位当たりの平均ＩＲに基づいて算出）。ＩＲは、カスタムパネルの設計を導く全ゲノム配列決定（ＷＧＳ）を使用することによってさらに増加し得る（橙色の曲線、本発明者らのＷＥＳにおいて観察された変異率に基づいて外挿）。ＷＥＳからの変異リストを使用した場合、１０^６個のＩＲを超える試料には橙色で陰を付け、２×１０^４個未満のＩＲを有する試料には青で陰を付ける。図２５ｃは患者特異的捕捉パネルにわたるＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓを示す図である。設計プロセス、分析、および考えられる成果：ｃｔＤＮＡが検出され得る、高いＩＲにもかかわらず未検出、または場合によっては数個の変異もしくは配列決定の低い固有深度に起因して低いＩＲが取得される、を示す概略図。この最後の場合は、分析感度が限定されるため、技術的失敗と定義すべきである。慣例的な実装では、そのような場合は、深度を増加する追加の配列決定を用いて、追加の材料の分析を用いて、または改訂捕捉パネルを設計するために使用することができる腫瘍のより広範な配列決定を使用して（例えばＷＧＳによって）拡張した変異リストを生成することによって、再分析することができる。図２５ｄは患者特異的捕捉パネルにわたるＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓを示す図である。各試料のＩＲに対してプロットした、検出されたｃｔＤＮＡ分画の二次元表示。ｃｔＤＮＡは、その分画濃度（ＩＭＡＦ）が２／ＩＲよりも高い（１／ＩＲでプロットされる破線よりも上に置かれる）場合に検出することができた。一部の試料では、１０^６個超のＩＲが取得され、ｃｔＤＮＡは、数ｐｐｍ（橙色で陰を付けた領域）の割合まで検出された。一部の試料では、ＩＲはほとんど取得されず、結果として限定された感度となった。本発明者らの研究では、２０，０００というＩＲの閾値を使用し（最も左の点線）、その結果、２０，０００個未満のＩＲを有する、未検出ｃｔＤＮＡを有する試料は、技術的不成功として排除した（１４４の試料のうち総計で６；濃青で陰を付けた領域）。この領域外の試料は、検出されたｃｔＤＮＡを有したか、または０．０１％未満の推定ｃｔＤＮＡレベル（２０，０００個超のＩＲで未検出；この値の信頼性範囲は、各試料に関してＩＲに応じて変動する）を有した。それらの試料を技術的失敗として排除した場合、ｃｔＤＮＡにわたる全体の検出率は、組み合わせた３つのコホートに関して７３．６％から７６．２％に増加した。代替的な閾値、例えば６６，６６６個のＩＲが使用され得、結果として０．００３％または３０ｐｐｍの検出レベル（第２の点線および淡青で陰を付けた領域によって示す）をもたらす。０．００３％の検出感度に達しなかった試料（１１の試料）を排除した場合、コホートにわたるｃｔＤＮＡ検出率は８２．６％に増加した。図２５ｅは患者特異的捕捉パネルにわたるＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓを示す図である。ｃｔＤＮＡＩＭＡＦおよび腫瘍体積を、いくつかの処置方針（陰を付けた四角によって示す）の過程にわたって、転移性黒色腫を有する１名の患者に関して時間の経過と共にプロットする。ｃｔＤＮＡは、疾患体積がおよそ１．３ｃｍ^３であった場合、抗ＢＲＡＦ標的化療法を用いた処置中２．５ｐｐｍまで検出された。図２６ａは早期および進行した疾患におけるＩＮＶＡＲによるｃｔＤＮＡ検出を示すグラフである。３つのコホートのそれぞれに関して昇順で示される、本研究における試料において検出されたｃｔＤＮＡ分画レベル（ＩＭＡＦ）。塗りつぶされた丸は、測定されたＩＭＡＦを考慮して、分析された一倍体ゲノムの数が完全な単一座位アッセイに関する９５％の検出の限界未満に低下し得る試料を示す（補足的方法）。白抜きの丸は技術的失敗、すなわちｃｔＤＮＡがＩＲ＜２０，０００で検出されなかった（ＮＤ）試料を示す。図２６ｂは早期および進行した疾患におけるＩＮＶＡＲによるｃｔＤＮＡ検出を示すグラフである。照会された座位の数で割った変異断片の数として算出した、上記のパート（ａ）におけるのと同じ順番の試料のそれぞれに関して検出された癌ゲノムのコピーの数。図２６ｃは早期および進行した疾患におけるＩＮＶＡＲによるｃｔＤＮＡ検出を示すグラフである。健康なボランティアからの試料と比べた、ステージＩ〜ＩＩＩＡのＮＳＣＬＣ患者の診断時の血漿におけるｃｔＤＮＡの検出に関するＲＯＣ分析。９７．４％の特異度で、ｃｔＤＮＡはステージＩの患者の５０％において検出された（ステージＩＡでは５例のうちの２０％、およびステージＩＢでは５例のうちの８０％；１０例のうちの９例が腺癌腫であった）。図２６ｄは早期および進行した疾患におけるＩＮＶＡＲによるｃｔＤＮＡ検出を示すグラフである。ｃｔＤＮＡが外科的処置後の初めの６か月において検出された試料（青線）または検出されなかった試料（赤線）に関する、ステージＩＩ〜ＩＩＩの黒色腫を有する患者における外科的切除後の無疾患個体の比率。無疾患期間は、ｃｔＤＮＡが外科的処置後６か月以内に検出された患者において有意に劣っており（Ｐ＝０．００７）、これらの患者には５年の期間以内に再発した患者のうちの半分が含まれた。図２６ｅは早期および進行した疾患におけるＩＮＶＡＲによるｃｔＤＮＡ検出を示すグラフである。異なる数の配列決定されたＩＲに関するｃｔＤＮＡの検出率を推定した。ステージＩＶの黒色腫コホートのベースライン試料（青）において、ＩＲと検出との間に線形関係が存在した（Ｒ^２＝０．９５）。診断時のステージＩ〜ＩＩＩＡのＮＳＣＬＣ（緑）および外科的処置後のステージＩＩ〜ＩＩＩの黒色腫（赤）において、線形関係がＩＲと検出率との間で観察され、ｃｔＤＮＡの予測された検出の率を外挿した。ＮＤ、不検出。ＩＮＶＡＲを使用したＷＥＳ／ＷＧＳデータからのｃｔＤＮＡの高感度検出を示す図である。（ａ）一般化したＩＮＶＡＲ手法の概略図。腫瘍（およびバフィーコート）、ならびに血漿試料は、全エクソームまたはゲノム配列決定を使用して並行して配列決定され、ＩＮＶＡＲは、腫瘍（およびバフィーコート）配列決定から推測された変異リストを使用して血漿ＷＥＳ／ＷＧＳデータに適用することができる。（ｂ）ＩＮＶＡＲを、２３８ｘの平均配列決定深度（リードのコラプシング前）を有する２１の血漿試料からのＷＥＳデータ、および０．６ｘの平均配列決定深度（リードのコラプシングの前）を有する３３の血漿試料からのＷＧＳデータに適用した。ＩＭＡＦ値を、あらゆる試料に関する固有のＩＲの数と対照してプロットする。この深度におけるＷＥＳはカスタム捕捉パネルと比べて低いＩＲを生じたが、場合によっては、ＩＲは１０^５を超えた。低深度におけるＷＧＳは、変異リストがこれらの症例に関する腫瘍配列決定の程度に基づいてエクソームにまたがるのみであるため、１０，０００個未満のＩＲを生じた。縦点線は２０，０００のＩＲ閾値を示し、斜めの破線は１／ＩＲを示す。（ｃ）低から高へ並べられた、ＷＥＳを用いて分析した２１の試料に関して観察されたＩＭＡＦ。ＮＤ、不検出。（ｄ）患者特異的変異リスト（ＷＥＳ腫瘍解析に基づく、各患者に関して５００超の変異を含む）と共にＩＮＶＡＲを使用して分析した、０．６ｘの平均深度を有するｓＷＧＳデータを使用した、ステージＩＶの黒色腫を有する６名の患者の血漿におけるｃｔＤＮＡレベルの経時的モニタリング。塗りつぶされた丸は、ＩＮＶＡＲ尤度のＲＯＣ分析による、０．９９超の特異度レベルでの検出を示す（方法、図３６）。他の試料の場合、ｃｔＤＮＡレベルの９５％信頼区間を、各試料に関する有益なリードの数に基づいて示す（白丸および棒）。ＮＤ、不検出。図２８ａは個々の血滴におけるｃｔＤＮＡの検出を示す図である。ＤＮＡ抽出、それに続くサイズ選択および低深度ＷＧＳによる乾燥血斑の分析に関する概要。リードは、ＩＮＶＡＲを適用する前かまたはコピー数異常の分析前に固有分子識別子（ＵＭＩ）を使用してコラプシングする。右側のプロット図はゲノムにわたるリード密度を示す。図２８ｂは個々の血滴におけるｃｔＤＮＡの検出を示す図である。癌患者から収集した乾燥血斑から抽出したＤＮＡの配列決定からの、腫瘍により変異したアレル（淡青）および参照アレル（濃青）を保有するリードの断片長。図２８ｃは個々の血滴におけるｃｔＤＮＡの検出を示す図である。卵巣癌の異種移植モデル（左側のパネルに例示）から収集した血斑から抽出したＤＮＡを、浅い全ゲノム配列決定によって分析した。ヒトゲノムに対してアラインメントしたリードの断片長（赤）は、マウスゲノムに対してアラインメントしたもの（青）より短かった。図２８ｄは個々の血滴におけるｃｔＤＮＡの検出を示す図である。全血斑（赤菱形）から、または０．６倍のｈＧＡと等価である０．６ｘの平均深度のＷＧＳで配列決定したライブラリ（黒丸、図２７ｄに示すデータ）からの、ＷＧＳによって分析された試料に関して分析したｈＧＡおよび変異の数。濃青で陰を付けた四角は、１〜２滴の血液からのＷＧＳデータを使用した場合に達成される機能点を示し、約１０^５個のＩＲおよび１０^−４未満の感度に達することができる。淡青で陰を付けた四角は、ｓＷＧＳデータを使用した場合の機能点を示す。図２８ｅは個々の血滴におけるｃｔＤＮＡの検出を示す図である。平均で０．１×または１０×のカバレッジ（０．１および１０のｈＧＡと等価）を使用した、異なる癌の種類を有する患者における乾燥血斑のＷＧＳ分析に関する予測感度。異なる癌の種類に関するゲノムのＭｂｐ当たりの既知の変異率に基づいて^２４、液滴当たりの取得可能な有益なリードの数が推定され得る。コピー数変化に基づくｃｔＤＮＡに関する検出の限界を、３％の目印として示す^２８。患者特異的分析が従来の限定された入力シナリオにおけるサンプリングエラーを克服することを示す図である。高いレベルのｃｔＤＮＡが存在する場合、遺伝子パネルおよびホットスポット分析はｃｔＤＮＡを検出するのに十分である。しかしながら、ｃｔＤＮＡ濃度が低い（患者における低いｃｔＤＮＡ濃度、または限定された材料アベイラビリティに起因する）場合、これらの一般的なアッセイは、サンプリングノイズに起因する偽陰性結果のリスクが高い。広範囲にわたる患者特異的変異のリストを利用することは、複数の座位における変異リードのサンプリングを可能にし、極端に低いｃｔＤＮＡレベルまたは限定された出発物質のいずれかのために変異リードがほとんど存在しない場合にｃｔＤＮＡの検出を可能にする。ＩＮＶＡＲアルゴリズムの概要を示す図である。（ａ）ＩＮＶＡＲは、患者を活用して互いに照合し、別個の健康な対照を使用する。本研究において、個々の変異リストは腫瘍およびバフィーコート配列決定から生成される。目的の各座位は、適合した患者において、およびこの座位が腫瘍分析においてもバフィーコート分析においても変異していると見出されなかった同じコホートからの追加の患者において配列決定される。これは、一般的なパネルを全ての試料に適用することによって（例えばＷＥＳ／ＷＧＳ、図２７）、または複数の患者特異的変異リストを組み合わせて複数の患者にわたって配列決定される組み合わせたカスタムパネルとすることによって（図２５および図２６）行うことができる。各患者に関して、ＩＮＶＡＲは、患者特異的変異リストの座位にわたる配列決定情報を集計する。それらの座位における他の患者からのデータ（「非適合変異」）は、バックグラウンド変異率および検出カットオフを決定するために使用される（補足的方法）。健康な個体からの追加の試料は同じパネルによって分析され、このデータはＩＮＶＡＲアルゴリズムにおいて、患者試料におけるｃｔＤＮＡの検出を決定するためには使用せず、健康な個体における偽陽性率を評価するために使用した。（ｂ）ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓのワークフロー。ＩＮＶＡＲは、血漿配列決定データを利用し、腫瘍または血漿配列決定に由来し得る患者特異的変異のリストを必要とする。フィルターを配列決定データに適用し、次いでデータを、患者特異的（その患者に属する座位）、非患者特異的（その患者に属しない座位）、および標的付近（全ての患者特異的座位の１０ｂｐ以内の塩基）に分割する。患者特異的および非患者特異的データに、実際の変異を観察する確率に影響を及ぼす特徴を注釈付けする。外れ値抑制を適用して、患者特異的シグナルの全体のレベルと一致しない変異シグナルを同定する。次に、注釈付けした特徴を考慮に入れて、シグナルを全ての座位にわたって集計して、試料当たりのＩＮＶＡＲスコアを生成する。非患者特異的試料に基づいて、ＩＮＶＡＲスコア閾値を、各コホートに関するＲＯＣ分析を使用して決定する。健康な対照試料は、同じステップを別個に受けて、各コホートに関する特異度の値を確立する。図３１ａはＩＮＶＡＲに関する腫瘍変異リスト特性解析を示すグラフである。癌の種類およびコホートごとに並べられた患者当たりの体細胞変異の数。図３１ｂはＩＮＶＡＲに関する腫瘍変異リスト特性解析を示すグラフである。各パネル設計に含まれる各変異クラスの頻度。図３１ｃはＩＮＶＡＲに関する腫瘍変異リスト特性解析を示すグラフである。変異クラスごとに着色した、トリヌクレオチドコンテキストごとの変異計数。図３１ｄはＩＮＶＡＲに関する腫瘍変異リスト特性解析を示すグラフである。変異クラスごとに着色した、癌の種類当たりの腫瘍試料における腫瘍変異アレル割合の分布。バックグラウンドエラー率の特性解析を示すグラフである。（ａ）特注のＩＮＶＡＲフィルターを用いたおよび用いていない、エラー抑制された（ファミリーサイズ２）およびエラー抑制されていないバックグラウンドエラー率。バックグラウンドエラー率は、検討される全ての塩基にわたる全ての非参照塩基を集計することによって算出した。バックグラウンドエラー率を評価するために、患者特異的座位の両側１０ｂｐを使用して、患者特異的座位それ自体を排除した（「標的付近」、補足的方法）。（ｂ）異なる最小ファミリーサイズ要件の結果として生じる全体のバックグラウンドエラー率、および各設定と共に保持されるリードファミリーの比率。（ｃ）バックグラウンドエラー率は、グループ当たりのリードファミリーの数を均等にした後、健康な対照個体（青）および患者試料（赤）に関して変異クラスごとに算出した。相補的な変異クラスを組み合わせ。ｔ検定を健康な試料と患者試料との間で実施した。ＮＳ、非有意。図３３ａはエラー率フィルターおよび座位ノイズフィルターの適用を示すグラフである。ＩＮＶＡＲデータのために開発した異なるフィルター（補足的方法）を用いたクラスごとのエラー率の要約。図３３ｂはエラー率フィルターおよび座位ノイズフィルターの適用を示すグラフである。座位において順方向および逆方向リードを必要とすることの効果。このフィルターの場合、中央値で８４．０％の野生型リードおよび中央値で９２．４％の変異リードが保持された。図３３ｃはエラー率フィルターおよび座位ノイズフィルターの適用を示すグラフである。各トリヌクレオチドコンテキストに関して、バックグラウンドエラー率（トリヌクレオチド当たり）を、各バックグラウンドエラーフィルター前および後にプロットし、エラーフィルターそれぞれの付加的な利益を強調する。図３３ｄはエラー率フィルターおよび座位ノイズフィルターの適用を示すグラフである。バックグラウンドエラー率を、対照試料から生成されコホートごとに分割した全てのリードに基づいて座位当たりで特性解析した。座位ノイズフィルターを通過した座位を青で示し、フィルターを通過しなかった座位を赤で示す。このフィルターによってブラックリストに登録された座位の比率を右上に示す。図３３ｅはエラー率フィルターおよび座位ノイズフィルターの適用を示すグラフである。各座位当たりの重複排除固有深度のヒストグラム（３つのコホートに分離）。この深度は、１０^３〜１０^４の範囲にあり、定量を限定し得るかまたは個々の座位それぞれに関するバックグラウンドエラー率を０．１％〜０．０１％に限定し得る。より大きい深度を用いてバックグラウンドノイズ率を推定するために、座位をトリヌクレオチドコンテキストに従ってグループ化した（図２４ｃ）。図３４ａは患者特異的外れ値抑制フィルターを示すグラフである。その患者の残りの座位よりも有意に大きなシグナルを有すると観察された座位は、その座位におけるノイズ、汚染、または誤って遺伝子型同定されたＳＮＰ座位に起因する場合がある（赤、方法を参照のこと）。図３４ｂは患者特異的外れ値抑制フィルターを示すグラフである。全てのコホートに対する外れ値抑制の効果の要約。変異シグナルは、対照試料では３分の１に減少したが、患者試料では９６．１％の変異シグナルを保持した。図３４ｃは患者特異的外れ値抑制フィルターを示すグラフである。外れ値抑制されたデータ点を赤で示す、全てのコホートに関する生データ点（患者および対照試料）。図３５ａは腫瘍アレルの割合情報および血漿ＤＮＡ断片長を利用してｃｔＤＮＡシグナルを増強することを示すグラフである。腫瘍アレル割合を、血漿における検出されたシグナルを有する座位と有しない座位との間で比較した。血漿におけるシグナルを有する座位は、患者試料において有意に高い腫瘍アレル割合を有した。この分析を非患者特異的試料に関して実施した場合、腫瘍アレル割合の有意な増加は存在しなかった（スチューデントのｔ検定、ＮＳ、非有意；＊＊＊＝Ｐ＜０．０００１）。図３５ｂは腫瘍アレルの割合情報および血漿ＤＮＡ断片長を利用してｃｔＤＮＡシグナルを増強することを示すグラフである。腫瘍変異アレル割合と血漿変異アレル割合との比較。エラー抑制されたデータを使用して、腫瘍座位を０．０１の変異アレル割合の区間にグループ化し、血漿において観察された座位の比率を、異なるレベルの希釈系列に関して決定した。添加希釈系列の希釈レベルを、各色によって示す。各希釈レベルにおいて、腫瘍アレル割合と血漿において観察された座位の比率との間に正の相関が存在する。図３５ｃは腫瘍アレルの割合情報および血漿ＤＮＡ断片長を利用してｃｔＤＮＡシグナルを増強することを示すグラフである。各コホートに関して、変異および野生型断片のサイズプロファイルを生成した。図３５ｄは腫瘍アレルの割合情報および血漿ＤＮＡ断片長を利用してｃｔＤＮＡシグナルを増強することを示すグラフである。変異断片分布のコホート間での比較。これらは、変異リードの数をダウンサンプリングして全てのコホートに関して適合させた後、両側ウィルコクソン順位検定を使用して比較した。図３５ｅは腫瘍アレルの割合情報および血漿ＤＮＡ断片長を利用してｃｔＤＮＡシグナルを増強することを示すグラフである。加重を断片サイズに割り当てるために使用した、異なるレベルの平滑化に関する断片サイズの分布（補足的方法）。全てのコホートおよびデータの種類に関するＲＯＣ曲線および特異度を示す図である。特異度は、分析的特異度（他の患者からの対照データに基づく；黒線）と臨床的特異度（健康な個体のデータに基づく；赤線）の両方として決定した。ステージＩＩ〜ＩＩＩの黒色腫（外科的処置後）コホートの場合、分析は、成果について盲検化され、５年以内に再燃しなかった患者もまたＲＯＣ分析に含めた。したがって、このコホートに関する考えられる最大の「感度」（定義されている）は、再燃する患者の割合（１８／３３＝５４．５％）であった。ＩＮＶＡＲは、再燃した１８名の患者うち９名を検出した（９／３３＝２７．３％の感度を示すＲＯＣ）。健康な対照は、このパネルに関して実行されなかった。表は選択されたしきい値での特異度を示す。図３７ａは進行した黒色腫におけるｃｔＤＮＡレベルの特性解析を示すグラフである。入力質量と観察されたＩＭＡＦとの比較。検出されたｃｔＤＮＡを有する各ライブラリに関して、ライブラリ調製のためのＤＮＡ入力質量を、ＩＮＶＡＲによって決定されたＩＭＡＦに対してプロットする。黒線は、試料における変異コピーの予期された数を考慮した場合に変異コピーがサンプリングされない尤度に基づく、下回った場合に完全な単一座位アッセイが９５％未満の感度を有し得る閾値を示す。本研究では、４８％の試料は、使用した血漿ＤＮＡ入力量での完全な単一座位アッセイを使用して検出可能ではない可能性がある。図３７ｂは進行した黒色腫におけるｃｔＤＮＡレベルの特性解析を示すグラフである。本発明者らの研究における（ピアソンのｒ＝０．６７、Ｐ＝０．０００２）、ならびにＣＡＰＰ−Ｓｅｑ^６を使用して、およびＴＲＡＣＥＲｘコホートにおける多重ＰＣＲ^７を使用してＮＳＣＬＣの患者当たりの複数の変異を測定する以前の刊行物における、ｃｔＤＮＡと腫瘍体積との間の比較。腫瘍体積とｃｔＤＮＡレベルとの関係は、以前の分析におけるよりも本研究において急勾配であった。これは、他のアッセイによって見落とされたかまたは過剰評価された場合があるより低い濃度のｃｔＤＮＡの、ＩＮＶＡＲを使用した検出に起因すると考えられる。図３７ｃは進行した黒色腫におけるｃｔＤＮＡレベルの特性解析を示すグラフである。進行期黒色腫患者における血清乳酸脱水素酵素とＩＭＡＦとの関係。０．４６のピアソン相関スコアが観察された（Ｐ＝０．００５８）。破線は、ＬＤＨの正常の上限である２５０ＩＵ／Ｌで引かれている。図３７ｄは進行した黒色腫におけるｃｔＤＮＡレベルの特性解析を示すグラフである。進行した黒色腫患者に関する経時的ｃｔＤＮＡプロファイル。ＩＭＡＦ値を、エラー抑制された個別的配列決定データを使用して、患者当たりで時間の経過と共にプロットする。縦破線は放射線学的進行に関する時間を示す。初期コホートにおけるＩＭＡＦ値の特性解析を示す図である。（ａ）初期ＮＳＣＬＣコホートにおけるＩＭＡＦ値。試料病態およびステージを各試料に関して示す。低感度試料（ＬＳ）は、２０，０００個未満の固有分子（ＩＲ）が分析された試料を示す。（ｂ）初期ＮＳＣＬＣコホートに関する検出結果要約。患者をステージおよびｃｔＤＮＡ検出結果ごとにグループ化する。感度を、２０，０００個超のＩＲを有する試料にわたって算出する。（ｃ）ステージＩＩ〜ＩＩＩの切除黒色腫コホートに関する患者特性の要約表（ｎ＝３８）。（ｄ）ステージＩＩ〜ＩＩＩの切除黒色腫コホートにおいて、検出されたｃｔＤＮＡを有する患者は、有意に劣った全生存期間を有した（Ｐ＝０．０２、コックス比例ハザードモデル）。検出されたｃｔＤＮＡを有する患者の生存期間中央値は２．６年であった（９５％ＣＩ１．１〜５．３）のに対し、他方は中央値に達しなかった（９５％ＣＩ３．１〜中央値未到達）。（ｅ）異なるレベルのＩＲに関するｃｔＤＮＡの検出率を推定した（補足的方法）。ステージＩＶの黒色腫コホートのベースライン試料（青）において、ＩＲの数と検出率との間に線形関係を観察する（Ｒ^２＝０．９５）。ｃｔＤＮＡは、１０^５個のＩＲを有するベースライン試料の１００％において検出されたが、処置の開始後は、１０^６〜１０^７個のＩＲが全ての経時的試料を検出するために必要であり、より低いレベルのｃｔＤＮＡを反映する。全エクソーム配列決定データへのＩＮＶＡＲの適用を示すグラフである。（ａ）血漿ＷＥＳから取得したＩＭＡＦを、適合試料のカスタム捕捉手法から取得したＩＭＡＦと比べたところ、０．９５の相関を示した。（ｂ）血漿ＷＥＳによる、ｈＧＡの数（リードのコラプシング後の固有カバレッジの深度を示す）および標的化された変異。カスタム捕捉手法と比べて、ＷＥＳ試料は、より少ないｈＧＡを有し、二次元空間においてさらに左側に空間を占めており、ＩＮＶＡＲが限定されたデータ、およびライブラリにおいて配列決定された数個のゲノムコピーからｃｔＤＮＡを検出することができることを示す。図４０ａは乾燥血斑からのｃｔＤＮＡ検出を示すグラフである。ｃｆＤＮＡを単離するために右側ビーズ選択を必要とする、高いレベルのゲノムＤＮＡ汚染を示す５０μＬのヒト乾燥血斑溶出液のバイオアナライザによるトレース。５０〜３００ｂｐの間の短い断片はこの段階では示されない。図４０ｂは乾燥血斑からのｃｔＤＮＡ検出を示すグラフである。サイズ選択された血斑ＤＮＡから生成されたライブラリのサイズプロファイル。全体のサイズプロファイルはｃｆＤＮＡのサイズプロファイルに匹敵し、約１６６ｂｐにピークを有する。図４０ｃは乾燥血斑からのｃｔＤＮＡ検出を示すグラフである。多様性推定のための統計的方法^８を使用した、５０μＬの乾燥血斑からのｃｆＤＮＡゲノムコピーの数の推定。図４０ｄは乾燥血斑からのｃｔＤＮＡ検出を示すグラフである。血斑から、および同じ個体由来の適合血漿試料から生成されたライブラリのｓＷＧＳからのコピー数プロファイル。図４０ｅは乾燥血斑からのｃｔＤＮＡ検出を示すグラフである。マウス卵巣異種移植モデル（方法）由来の５０μＬの乾燥血斑からのコピー数プロファイル。ＲＥＭＡＲＫ流れ図である。本研究において分析された患者の数を示す。患者は、ｃｔＤＮＡの検出、およびそれぞれに関して生成された有益なリード（ＩＲ）の数に基づいて類別する。全てのコホート（外科的処置後のステージＩＩ〜ＩＩＩの黒色腫、ステージＩ〜ＩＩＩＡのＮＳＣＬＣ、およびステージＩＶの黒色腫）をこの流れ図に組み合わせた。統合変異アレル割合（ＩＭＡＦ）（ｙ軸）を全てのコホートにおける各試料（Ｘ軸）に関してプロットする。左から右に向かって、コホートは肺癌（血漿）および乳癌（血漿）である。統合変異アレル割合（ＩＭＡＦ）（ｙ軸）を全てのコホートにおける各試料（Ｘ軸）に関してプロットする。左から右に向かって、コホートは膠芽腫（ＣＳＦ）、膠芽腫（血漿）、腎臓癌（血漿）、および腎臓癌（尿）である。ＩＮＶＡＲスコア（ｙ軸）を、評価可能と分類された各試料に関してプロットする。左から右に向かって、コホートは肺癌（血漿）および乳癌（血漿）である。ＩＮＶＡＲスコア（ｙ軸）を、評価可能と分類された各試料に関してプロットする。左から右に向かって、コホートは膠芽腫（ＣＳＦ）、膠芽腫（血漿）、腎臓癌（血漿）、および腎臓癌（尿）である。

本発明を説明する際、以下の用語が用いられ、また下記に示されるように定義されることが意図される。

「および／または」とは、本明細書において使用する場合、２つの指定された特徴または構成要素のそれぞれの、他方を伴うかまたは伴わない具体的な開示として理解されるべきである。例えば「Ａおよび／またはＢ」は、それぞれが本明細書において個別的に述べられるように、（ｉ）Ａ、（ｉｉ）Ｂ、ならびに（ｉｉｉ）ＡおよびＢのそれぞれの具体的な開示として理解されるべきである。

「コンピュータ実装方法」とは、本明細書において使用する場合、実行がコンピュータ、コンピュータネットワーク、または他のプログラム可能な装置の使用を伴う方法であって、方法の１つまたは複数の特徴が全体的にまたは部分的にコンピュータプログラムによって実現される、方法を意味すると理解されるべきである。

「患者」とは、本発明の任意の態様に従って本明細書で使用する場合、「対象（サブジェクト）」と等価であることが意図され、具体的には健康な個体と疾患または障害（例えば癌等の増殖性障害）を有する個体の両方が挙げられる。患者は、ヒト、伴侶動物（例えばイヌまたはネコ）、実験動物（例えばマウス、ラット、ウサギ、ブタ、または非ヒト霊長類）、異種移植または異種間移植された腫瘍または腫瘍組織（例えばヒト腫瘍からの）を有する動物、飼育または家畜動物（例えばブタ、ウシ、ウマ、またはヒツジ）であり得る。好ましくは、患者はヒト患者である。場合によっては、患者は、癌と診断されたか、癌を有すると疑われるか、または癌を発症するリスクがあると分類されたヒト患者である。

「試料」とは、本明細書で使用する場合、生体試料、例えば無細胞ＤＮＡ試料、細胞（循環腫瘍細胞を含む）または組織試料（例えば生検）、生体液、抽出物（例えば対象から取得したタンパク質またはＤＮＡ抽出物）であり得る。特に、試料は腫瘍試料、ＤＮＡを含有する生体液試料、血液試料（血漿もしくは血清試料を含む）、尿試料、子宮頸部スメア、脳脊髄液（ＣＳＦ）試料、または非腫瘍組織試料であり得る。尿および子宮頸部スメアは細胞を含有し、したがって本発明に従った使用に好適な試料を提供し得ることが見出されている。本発明に従った使用に好適な他の試料種としては、穿刺吸引、リンパ節、外科的縁、骨髄、または微小量の腫瘍ＤＮＡが見出され得るかもしくは見出されると予期され得る腫瘍微小環境からの他の組織が挙げられる。試料は、対象から新しく取得した試料（例えば採血）であっても、計測を行う前に処理および／または保管された（例えば凍結されたか、固定されたか、または遠心分離を含む１つもしくは複数の精製、濃縮、もしくは抽出ステップに供された）試料であってもよい。試料は、濃縮または増幅のプロセスを介した上記生体試料のうちの１つまたは複数に由来してもよい。例えば、試料は生体試料から生成されたＤＮＡライブラリを含んでもよく、任意選択で、バーコードＤＮＡライブラリまたはそうでなければタグ付きＤＮＡライブラリであってもよい。複数の試料は単一の患者から、例えば一連の処置中に連続的に採取されてもよい。さらに、複数の試料は複数の患者から採取されてもよい。試料調製は、本明細書において材料および方法の節に記載されるようなものであり得る。さらに、本発明の方法は、尿試料における腫瘍由来変異ＤＮＡを検出することが実証されている（データは示していない）。したがって、検出される変異腫瘍ＤＮＡを潜在的に含有する患者ＤＮＡの供給源としての血液または尿試料の使用は、本明細書において具体的に企図される。法科学的用途の場合、試料は、混合ＤＮＡまたはＲＮＡ（例えば標的およびバックグラウンド、例えば加害者ＤＮＡまたはＲＮＡおよび被害者ＤＮＡまたはＲＮＡ）を有するかまたは有すると疑われる、任意の流体または組織または物品であり得る。汚染の分析の場合、試料は、混合ＤＮＡまたはＲＮＡ（例えば標的およびバックグラウンド、例えば汚染源（例えば病原体）ＤＮＡまたはＲＮＡおよび非汚染源ＤＮＡまたはＲＮＡ）を有するかまたは有すると疑われる、任意の流体、生物、物品、食品、または植物であり得る。

「右側サイズ選択」とは、本明細書で使用する場合、一部の実施形態ではｈｔｔｐｓ：／／ｒｅｓｅａｒｃｈ．ｆｈｃｒｃ．ｏｒｇ／ｃｏｎｔｅｎｔ／ｄａｍ／ｓｔｒｉｐｅ／ｈａｈｎ／ｍｅｔｈｏｄｓ／ｍｏｌ＿ｂｉｏｌ／ＳＰＲＩｓｅｌｅｃｔ％２０Ｕｓｅｒ％２０Ｇｕｉｄｅ．ｐｄｆ（その内容全体は参照によって本明細書に組み込まれる）に記載されているＡＭＰｕｒｅビーズを用いる。特に、一部の実施形態で使用される１倍選択ステップは、１．２倍の曲線と０．９５倍の曲線との間のカットオフを暗示し、それゆえ２００〜３００ｂｐ前後に推定される。

「血斑」とは、本明細書で使用する場合、一部の実施形態では乾燥血斑試料であり得る。典型的には、血液試料は濾紙に吸着され、乾燥される。乾燥血斑標本は、手指、かかと、または足指からランセットによって採取した１滴または数滴の血液（例えば５０μｌ前後）を特別に製造された吸収濾紙に加えることによって収集し得る。血液は濾紙に徹底的に含ませてもよく、典型的には数時間風乾され得る。標本は、湿度を低下させるために乾燥材が添加された低ガス透過性プラスチックバッグに保管されてもよく、周囲温度で維持されてもよい。

患者特異的座位の決定
本発明の一部の実施形態においては、患者の腫瘍に特異的な変異を保有する座位が同定され得る。場合によっては、腫瘍ＤＮＡは、平均で８０％の塩基対が２０個超のリードによって包含される、試料当たり平均８Ｇｂのマッピングされた固有のリードを得るように配列決定される。場合によっては、一塩基バリアント（ＳＮＶ）（例えばバフィーコート試料からの生殖細胞系列配列に対する）は、腫瘍試料から取得した配列データから選択され得る。場合によっては、患者特異的座位は、腫瘍配列決定から決定される、１個以上の変異リードと１０個以上の総リードとに関するＳＮＶを表示する座位である。場合によっては、座位は、生殖細胞系列配列（例えばバフィーコート試料）において（リード重複排除後に）１個の順方向（Ｆ）非参照リードと１個の逆方向（Ｒ）非参照リードとを示す場合、排除され得る。任意選択で、座位は、共通のＳＮＰデータベース、例えば１０００Ｇｅｎｏｍｅｓデータベースにおいて同定されたＳＮＰである場合、排除され得る。

配列リードを用意するステップ
配列リードデータは、例えば、ｃｆＤＮＡ試料もしくはライブラリを配列決定することによって、または既に生成されている配列決定データを取得するかもしくは用意する、例えば配列リードデータを不揮発性もしくは揮発性コンピュータメモリ、データストア、もしくはネットワークの場所から回収することによって、直接用意または取得され得る。配列リードが試料を配列決定することによって取得される場合、入力ＤＮＡの質量中央値は、場合によっては１〜１００ｎｇ、例えば２〜５０ｎｇまたは３〜１０ｎｇの範囲であり得る。ＤＮＡは、例えば１００〜１０００ｎｇのＤＮＡを有するライブラリを取得するために増幅され得る。各患者特異的座位における配列リード（例えば品質フィルター処理された配列リード）の配列決定深度中央値は、５００ｘ〜２０００ｘ、例えば７５０ｘ〜１５００ｘまたはさらには１２００ｘ〜１４００ｘの範囲であり得る。配列リードはＦＡＳＴＱ等の好適なデータ形式であり得る。

配列データ処理およびエラー抑制
配列リードデータ、例えばＦＡＳＴＱファイルは、リードファミリーへのリードコラプシングのステップの前にまたはそのステップの一部として、１つまたは複数の処理または整理ステップに供され得る。例えば、配列データファイルは、ＦａｓｔＱＣｖ０．１１．５の場合、アダプター配列を取り除くツール（例えばｃｕｔａｄａｐｔｖ１．９．１）から選択される１つまたは複数のツールを使用して処理され得る。配列リード（例えばトリミングした配列リード）は適切な参照ゲノム、例えば、ヒトゲノムｈｇ１９に対してアラインメントされ得る。

本明細書で使用する場合、「リード」または「配列決定リード」とは、１個の分子およびリードから一度読み取られた配列を意味すると理解することができる。各分子は、実施される配列決定に応じて、任意の回数読み取ることができる。

本明細書で使用する場合、「リードファミリー」とは、同じ分子から生じる複数の配列決定リード（したがって複製物）を意味すると理解することができる。これらは同じ出発分子由来であるため、各リードは、そのリードのアラインメント後、ヒトゲノムにおいて同じ開始および終了位置を有することができる。加えて、分子バーコードがＰＣＲおよび配列決定の前に出発分子にライゲートされる場合、各リードファミリーは同じ分子バーコードを有することもできる。分子バーコードによるエラー抑制のプロセスは以下のＵＲＬ：ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｕｍｉｃｈ−ｂｒｃｆ−ｂｉｏｉｎｆ／Ｃｏｎｎｏｒ／ｂｌｏｂ／ｍａｓｔｅｒ／ｄｏｃ／ＭＥＴＨＯＤＳ．ｒｓｔ（２０１８年３月５日に示されるその内容は参照によって本明細書に明白に組み込まれる）に記載されている。

本明細書で使用する場合。「コラプシング」または「リードコラプシング」とは、リードファミリー（複製リードの組）を考慮した場合に、ＰＣＲおよび配列決定エラーのエラー抑制が、そのファミリーにわたるコンセンサス配列をあらゆる塩基位置に関して生成することによって実施され得ることを意味すると理解することができる。したがって、Ｎ個（の数）のリードのファミリーは１個のリードのコンセンサス配列に「コラプシング」され、そのコンセンサス配列はより少ないエラーを含有すると予期することができる。

リードコラプシングは、断片開始および終了位置ならびにカスタムインラインバーコードに基づいて実施され得る。好適なツールは、ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｕｍｉｃｈ−ｂｒｃｆ−ｂｉｏｉｎｆ／Ｃｏｎｎｏｒ／ｂｌｏｂ／ｍａｓｔｅｒ／ｄｏｃ／ＭＥＴＨＯＤＳ．ｒｓｔ（２０１８年３月５日に示されるその内容全体は参照によって本明細書に明白に組み込まれる）に記載されているＣＯＮＮＯＲである。ＣＯＮＮＯＲは、８．８、０．８５、０．９、または０．９５に設定されるコンセンサス頻度閾値−ｆで使用され得る。ＣＯＮＮＯＲは、２、３、４、５、６、７、８、９、または１０として設定される最小ファミリーサイズ閾値−ｓで使用され得る。好ましくは、コンセンサス頻度閾値は０．９であり、最小ファミリーサイズ閾値は５である。

品質フィルターは、本明細書において材料および方法の節に記載されるように、変異および野生型リード／リードファミリーの数を決定するプロセスにおいて適用され得る。

場合によっては、１つまたは複数のＭＲＤフィルターが、腫瘍由来ＭＲＤリードファミリーに焦点を当てるために適用され得る。特に、ＭＲＤフィルタリングステップは、
（ｉ）２個超の変異分子を有する座位を排除すること、および
（ｉｉ）順（Ｆ）方向と逆（Ｒ）方向の両方において配列決定された断片のみを選択すること（すなわち含めること）
のうちの一方または両方を含み得る。

本明細書で使用する場合、「バーコード」または「分子バーコード」とは、必ずというわけではないが通例１０ｂｐ未満の長さ、例えば本発明によって用いられる分子バーコードは６、７、８、９、または１０ｂｐ長であり得る）の、ライブラリ調製中の第１のステップとして１個または複数個のＤＮＡ分子にライゲートされ得る塩基の固有の文字列を意味すると理解することができる。結果として、リードファミリー（上記からの）はただ１つに同定され、したがってその出発分子に連結され得る。このことは、上に記載したように、「リードコラプシング」を介したエラー抑制を可能にする。

バックグラウンド配列決定エラー率を決定するステップ
場合によっては、各患者特異的座位の両側（例えば両側の２０、１５、１０、または５ｂｐ）の領域は、各変異クラスに関するエラー率を決定するために用いられ得る。場合によっては、非参照塩基は、順方向Ｆリードと逆方向Ｒリードの両方に存在すると見出される場合にのみ受容される。場合によっては、座位が３つ以上の別個のライブラリにおいてエラー抑制された変異ファミリーを表示する場合、その座位は、より高い座位特異的エラー率を有することを根拠にフィルター除去（「ブラックリストに登録」）され得る。

配列決定エラー分析は、変異クラスと無関係なバックグラウンドエラー率を決定するために、データを変異クラスごとに分離することによって実行され得る。エラー率は、クラスにおける変異リードの合計とクラスにおけるリードの総数との比を取ることによって決定され得る。場合によっては、この比データは、エラー率の９５％信頼区間を取得するために復元抽出を用いて１００回リサンプリングされ得る。

ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓ（ＩＮＶＡＲ）
本発明の一部の実施形態においては、特定の患者特異的座位に関するバリアントリードは、観察されたバリアント（例えばＳＮＶ）がその座位の腫瘍配列において決定された変異と合致する場合にのみ受容され得る。例えば、Ｃ＞Ｔ変異が腫瘍配列決定／遺伝子型同定に基づいて予期されたが、Ｃ＞Ａが変異リードにおいて観察される場合、変異リードは対象から外され得、患者特異的シグナルから排除され得る。代替的にまたは付加的に、座位は、少なくとも１つ以上のＦリードファミリーと少なくとも１つ以上のＲリードファミリーとがその位置に存在する場合にのみシグナルに寄与すると考えられ得る。このことは２つの利点：配列決定からの一本鎖アーチファクトを低減すること、およびある特定の配列決定プラットフォーム、例えばＰＥ１５０配列決定においてＦリードとＲリードとの間により大きな重なりを有する短い断片に検出を偏らせることを有する。

各試料に関して、変異アレル割合は全ての患者特異的座位にわたって以下：

のように算出され得る。

ある特定の場合では、変異アレル割合はトリヌクレオチドコンテキストごとに算出され得る。コンテキストごとの変異アレル割合は、式：

に従って腫瘍加重したリードファミリーに基づき得、
式中、
ＡＦ_{コンテキスト}は所与の（例えばトリヌクレオチド）コンテキストのアレル頻度であり、腫瘍ＡＦは腫瘍から直接取得したＤＮＡを配列決定することによって決定される座位のアレル頻度であり、ＭＲＤ様座位は、患者の腫瘍から決定され、微小残存病変シグナルを選択するためにフィルタリングされた変異含有座位である。

観察された変異リードの数の有意性は、どちらも目的の試料に関する変異リードと総リードとの数、およびバックグラウンドエラー率からの変異リードの数を含む分割表を考慮して、フィッシャーの片側正確確率検定を使用して決定され得る。

変異クラスごとに分割した変異アレル割合決定
本発明の一部の実施形態では、各試料は、その座位において腫瘍配列決定から予期された変異クラスに基づいて複数の変異クラス（例えば以下のＳＮＶクラス：Ｃ＞Ｇ、Ｇ＞Ｃ、Ｔ＞Ｇ、Ａ＞Ｃ、Ｃ＞Ａ、Ｇ＞Ｔ、Ｔ＞Ｃ、Ａ＞Ｇ、Ｔ＞Ａ、Ａ＞Ｔ、Ｃ＞Ｔ、およびＴ＞Ｃのうちの２、３、４、５、６、７、８、９、１０、１１、または１２個全て）に分割され得る。バリアントリードは上記のように各クラスに関して統合され得る。複数回のフィッシャーの片側正確確率検定は、観察された変異リードファミリーの数の有意性を、その変異クラスに関するバックグラウンドエラー率を考慮して決定するために使用され得る。この方法は、試料当たり１２個のＰ値を生成することができ、これらのＰ値は次いで経験的なブラウンの方法を使用して組み合わされ得る。試料がクラスにおけるデータを有しなかった場合、そのクラスは０個の変異リード、したがって１のＰ値を有すると扱われ得る。

特異度をさらに改善するために、一部の実施形態では、本発明の方法は２つ以上の別個のクラスにおいて変異リードを有する試料を必要とし得る。このことは、検出が異なる種類のエラープロセスの対象となる複数の座位に存在するシグナルに基づくことを保証する。

統計的有意性決定
ＩＮＶＡＲによって取得した組み合わせたＰ値に関する有意性閾値は、場合によっては、患者特異的（試験）および非患者特異的（対照）試料に関する受信者操作特性分析を使用して決定され得る。例えば、分析は、分類確度を最大化する「ＭａｘＥｆｆｉｃｉｅｎｃｙ」法を有するＲでのＯｐｔｉｍａｌＣｕｔｐｏｉｎｔｓパッケージを用いてもよい。

バックグラウンド減算
場合によっては、バックグラウンドエラー率は観察されたアレル割合から減算され得る。このことは、クラスごとのエラー率の差を考慮に入れて実施することも、考慮に入れずに実施することもできる。観察された変異アレル割合がバックグラウンドエラー率よりも小さい場合、バックグラウンド減算アレル割合は０に設定され得る。試料に関する変異クラスごとのバックグラウンド減算の場合、クラスのそれぞれのエラー率は、そのクラスの変異アレル割合から減算され得る。次いで平均アレル割合が、そのクラスにおいて観察されたリードファミリーの総数によって加重された、個々のバックグラウンド減算アレル割合のそれぞれから算出され得る。

以下は例として提示され、特許請求の範囲に対する限定として解釈されるべきではない。
［実施例］
材料および方法
試料およびデータ収集

ＭｅｌＲｅｓｉｓｔ（ＲＥＣ番号１１／ＮＥ／０３１２）は、ＢＲＡＦ標的化療法および免疫療法を含む黒色腫の全身療法に対する応答および耐性機構の橋渡し研究である。このコホートにおける各患者に関して、新鮮凍結転移性腫瘍生検および血漿試料を処置の開始前に収集し、血漿を処置中の多様な時点で収集した。患者は、複数の方針の処置を時間の経過と共に受け取っていてもよい。患者背景および臨床成績を前向きに収集する。研究はＣａｍｂｒｉｄｇｅＣａｎｃｅｒＴｒｉａｌｓＵｎｉｔ−ＣａｎｃｅｒＴｈｅｍｅによって統括された。

末梢血試料を各来院時にＳ−Ｍｏｎｏｖｅｔｔｅ９ｍＬＥＤＴＡチューブにおいて経時的に収集した。この研究に関して、患者当たり最大８つの試料を、連続的に収集した試料から分析した。ベースライン時の全血の１つのアリコートを生殖細胞系列ＤＮＡのために−８０℃で保管した。血漿収集に関して、試料を採血の１時間以内に１６００ｇで１０分間遠心分離して、次いで２０，０００ｇで１０分間の追加の遠心分離を実行した。血漿アリコートを−８０℃で保管した。

新鮮凍結組織および血漿からのＤＮＡの抽出
最大３０ｍｇの各新鮮凍結組織生検試料を６００μＬのＲＬＴ緩衝液（ＱＩＡＧＥＮ）と組み合わせ、次いでＰｒｅｃｅｌｌｙｓＣＤ１４チューブ（ＢｅｒｔｉｎＴｅｃｈｎｏｌｏｇｉｅｓ）に入れ、５秒で区切られた２回の２０秒のバーストの間６，５００ｒｐｍで均質化した。次いでＤＮＡを、ＡｌｌＰｒｅｐ抽出キット（Ｑｉａｇｅｎ）を製造業者のプロトコルに従って使用して抽出した。

ゲノムＤＮＡを１０ｍＬの全血から、ＧｅｎｔｒａＰｕｒｅｇｅｎｅＢｌｏｏｄＫｉｔ（Ｑｉａｇｅｎ）を製造業者のプロトコルに従って使用して抽出した。溶出ＤＮＡ濃度を、Ｑｕｂｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して定量した。

血漿試料を、２ｍＬＱＩＡａｍｐプロトコルを使用するＱＩＡｓｙｍｐｈｏｎｙ機器（Ｑｉａｇｅｎ）を使用して抽出した。各ＱＩＡｓｙｍｐｈｏｎｙバッチに関して、健康な個体の対照試料（Ｓｅｒａｌａｂ）を含む２４の試料を抽出した。血漿試料を９０μＬの水に溶出し、−８０℃で保管した。

撮像
ＣＴ撮像を標準治療の一部として各患者に関して獲得し、後ろ向きに検査した。スライス厚は全ての症例において５ｍｍであった。約５ｍｍを超える非常に大きな直径を有する全ての病変は、熟練した操作者によって、放射線科医の指導の下、ＭＡＴＬＡＢ（登録商標）（Ｍａｔｈｗｏｒｋｓ、Ｎａｔｉｃｋ、ＭＡ）で書かれたカスタムソフトウェアを使用してＣＴ画像上でスライスごとに輪郭抽出された。その後、輪郭を処理のためにＮｉｆＴＩ形式でＬＩＦＥｘソフトウェアアプリケーション^２５にインポートした。次いで腫瘍体積をＬＩＦＥｘによって、テクスチャに基づく処理モジュールからの出力パラメータとして報告した。

無細胞ＤＮＡ定量
各試料のｃｆＤＮＡ濃度を定量するために、デジタルＰＣＲを、それぞれＲＯＸおよびＦＡＭで標識した、ハウスキーピング遺伝子ＲＰＰ３０（ＳｉｇｍａＡｌｄｒｉｃｈ）および固有のＸｅｎＴ座位に関するＴａｑ−ｍａｎプローブを使用するＢｉｏｍａｒｋＨＤ（Ｆｌｕｉｄｉｇｍ）を使用して実行した。５５のＰＣＲサイクルを使用した。ＲＰＰ３０アッセイは６５ｂｐ長であった。溶出液１μＬ当たりの推定された数のＲＰＰ３０ＤＮＡコピーを使用して、元の試料におけるｃｆＤＮＡ濃度を決定した。

エクソームおよび標的化配列決定
腫瘍およびバフィーコート（生殖細胞系列）ライブラリ調製、配列決定、ならびにバリアント呼び出しを、ＳｕｒｅＳｅｌｅｃｔＸＴＨｕｍａｎＡｌｌＥｘｏｎ５０Ｍｂ（Ａｇｉｌｅｎｔ）ベイトセットまたはカスタム標的化配列決定ベイトセットを使用して、Ｖａｒｅｌａら^２６によって記載されているように実施した。プール当たり８つの試料を多重化し、各プールをＨｉＳｅｑ２０００（Ｉｌｌｕｍｉｎａ）の２つのレーンに装填し、平均で８０％の塩基対が２０個超のリードによって包含されている、試料当たり平均８Ｇｂのマッピングされた固有のリードを得た。標的化配列決定を、癌に関連する３６５の遺伝子に関するＳａｎｇｅｒＣＧＰＣａｎｃｅｒＧｅｎｅｓＶ３パネルを使用して、これまでに記載されているように^２７実行した。この探索的分析に関して、腫瘍配列決定からの全ての変異コールをＴＡＰＡＳパネル設計に含めた（結果を参照のこと）。座位は、バフィーコート試料において（リード重複排除後に）１個の順方向（Ｆ）非参照リードと１個の逆方向（Ｒ）非参照リードとを示した場合、排除した。

テイラードパネル配列決定ライブラリ調製
１０名の患者からのＴＡＰＡＳライブラリを、ＲｕｂｉｃｏｎＴｈｒｕＰＬＥＸＴａｇ−ｓｅｑキットを使用して２連で調製した。血漿ＤＮＡライブラリに関する入力質量中央値は４．４ｎｇであった（ＩＱＲ３．２〜１０．０ｎｇ）。分子バーコード化されたライブラリと分子バーコード化されていないライブラリとの間でエラー率を比較するために、追加の血漿ライブラリを、ＲｕｂｉｃｏｎＴｈｒｕＰＬＥＸＰｌａｓｍａ−ｓｅｑキットを使用して調製した。必要な場合、ｃｆＤＮＡ試料を、ライブラリ調製前にＳｐｅｅｄＶａｃ（ＴｈｅｍｏＦｉｓｈｅｒ）を使用して３０℃で真空濃縮した。

各試料におけるＤＮＡの開始濃度に基づいて、ＴｈｒｕＰＬＥＸプロトコル中のＰＣＲ増幅サイクルの数を、製造業者によって推奨されるように^２８、７〜１５サイクルの間で変動させた。増幅および試料バーコード化後、ライブラリを、ＡｍｐｕｒｅＸＴビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を１：１の比で使用して精製した。ライブラリ濃度を、Ｉｌｌｕｍｉｎａ／ＲＯＸ低ライブラリ定量キット（Ｒｏｃｈｅ）を２つの試料希釈液に関して使用して、３連で決定した。１：１０に希釈したライブラリをＢｉｏａｎａｌｙｚｅｒＨＳチップ（Ａｇｉｌｅｎｔ）において泳動し、ライブラリ断片サイズを決定した。

３３３〜７５０ｎｇの各ライブラリを、製造業者によって推奨されるように^２９、ｉ５およびｉ７ブロッキングオリゴ（ＩＤＴ）の添加を含むＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔＸＴプロトコルを使用して捕捉した。ライブラリを、捕捉のために１から３重の間のプールに、１０００ｎｇの最大捕捉入力までプールした。１３サイクルを捕捉後増幅のために使用した。捕捉後ライブラリを、ＡｍｐｕｒｅＸＴビーズを１：１．８の比で用いて精製し、次いで定量し、ライブラリ断片サイズを上述の通りに決定した。ＨｉＳｅｑ４０００のレーン当たり中央値で９つのＴＡＰＡＳライブラリをプールした。

配列データ処理およびエラー抑制
ＦａｓｔＱＣｖ０．１１．５を全てのＦＡＳＴＱファイルに関して実行し、次いでｃｕｔａｄａｐｔｖ１．９．１を使用して、アダプター配列の別個のＦＡＳＴＡにおいて指定された既知の５’および３’アダプター配列を取り除いた。トリミングしたＦＡＳＴＱファイルを、１９のシード長を用いるＢＷＡ−ｍｅｍｖ０．７．１３を使用してｈｇ１９ゲノムに対してアラインメントした。重複を、Ｐｉｃａｒｄｔｏｏｌｓｖ２．２．４ＭａｒｋＤｕｐｌｉｃａｔｅｓを使用してマーキングした。ＢＡＭファイルのインデックスを、Ｓａｍｔｏｏｌｓｖ１．３．１を使用して作成した。既知の挿入欠失に関する局所再アラインメント、および塩基品質再較正を、ＧＡＴＫｖ３．７を使用して実行した。次に、ＥＮＣＯＤＥコンソーシアムによって同定された、高いレベルの配列決定ノイズを有することを根拠に対象から外される領域（「ブラックリスト登録領域」としても公知）をＢＡＭファイルから取り除いた。

エラー抑制
エラー抑制を、ＴｈｒｕＰＬＥＸＴａｇ−ｓｅｑライブラリＢＡＭファイルに関して、断片開始および終了位置、ならびにカスタムインライン分子バーコードに基づいて複製配列決定リード間のコンセンサス配列を生成するＣｏｎｎｏｒ^３０を使用して実行した。エラー率対保持されたデータの比率に関する分析後、コンセンサス頻度閾値−ｆを０．９として設定し、最小ファミリーサイズ閾値−ｓを５として設定し、これらの閾値未満のリードファミリーを廃棄した。ＴｈｒｕＰＬＥＸＰｌａｓｍａ−ｓｅｑライブラリもまた、同じ設定を有するＣｏｎｎｏｒに関する、カスタムシェルスクリプトを使用した入力として使用した。このスクリプトは偽のバーコードおよびステムを各リードの適切な末端に付加し、ＣＩＧＡＲ文字列を修飾する。

品質フィルター
Ｓａｍｔｏｏｌｓｍｐｉｌｅｕｐｖ１．３．１を患者特異的座位において使用して、生データおよびエラー抑制されたデータに関する変異および野生型リード／リードファミリーの数を決定した。以下の設定を使用した：−ｄ１００００（最大深度閾値）、−−ｆｆＵＮＭＡＰ（マッピングされないリードを排除）、−ｑ１３（最小Ｐｈｒｅｄマッピング品質スコア）、−Ｑ１３（最小Ｐｈｒｅｄ塩基品質スコア）、−ｘ（重なりを無視する）、−ｆｕｃｓｃ．ｈｇ１９．ｆａｓｔａ。ＶＣＦＰａｒｓｅｒ^３１ｖ１．６ −−ｓｐｌｉｔを使用して複アレルコールを分離し、ＳｎｐＳｉｆｔｅｘｔｒａｃｔＦｉｅｌｄｓを使用して目的のカラムを抽出した。エラー抑制されていないＴＡＰＡＳデータの分析に関して、最小で５個のリードが座位において必要とされ、エラー抑制されたデータに関する閾値は最小で１リードファミリー（５つのメンバーからなる）であった。個々のデータ点（すなわち単一試料における単一座位）は、Ｓａｍｔｏｏｌｓｍｐｉｌｅｕｐによって決定されるその座位におけるマッピング品質／ストランドバイアス（ＭＱＳＢ）が０．０１未満であった場合、フィルタリングした。

ＴＡＰＡＳベースライン血漿変異呼び出し
ＴＡＰＡＳを患者の第１の血漿時点に適用して、全体がタイリングされた目的の遺伝子における、または腫瘍エクソーム配列決定単独から見落とされた場合がある患者特異的バリアントの両側のベイト領域におけるバリアントを呼び出した。Ｍｕｔｅｃｔ２（ＧＡＴＫ）を初回変異呼び出しのために使用し、ｈｇ１９ＣＯＳＭＩＣデータベースＶＣＦ、ｄｂＳＮＰデータベースＶＣＦ、ベイトセットＢＥＤファイル（耐性座位および目的の遺伝子を含む）に対して実行した。適合バフィーコートエクソームＢＡＭを生殖細胞系列試料として使用した。

バックグラウンドエラー率の決定
バックグラウンドエラー率を求めるために、ＴＡＰＡＳデータからの標的外塩基を使用した。生殖細胞系列事象はバフィーコートのエクソーム配列決定に基づいて取り除くことができ、既知の腫瘍座位は排除することができるため、患者からの配列決定データをこの目的のために使用した。したがって、各患者特異的バリアントの両側１０ｂｐを使用して、ＳＮＶの各クラスに関するエラー率を決定した。本発明者らは、非参照塩基はＦリードとＲリードの両方に存在しなければならないと規定した。考えられるエラー率の生物学的汚染を回避するために、ＣＯＳＭＩＣにおいて１個以上の重なり合う変異を有した場合、座位を排除した。加えて、エラー抑制後、各座位を、同じ患者に属する全ての試料において個々に評価し、座位が３つ以上の別個のライブラリにおいてエラー抑制された変異ファミリーを示した場合、さらなる分析の対象から外した。リードファミリー当たりのバックグラウンドエラー率が約６×１０^−５であると仮定すると、座位当たり平均で２００のリードファミリーに関して、同じ個体からの３つ以上の試料（患者当たり中央値で６つの試料のうち）の単一座位において変異リードファミリーを偶然に観察する確率は、約１×１０^−１２の二項確率となる。

この分析は、変異クラスと無関係なバックグラウンドエラー率を決定するために、またデータを変異クラスごとに分離することによって、実行した。エラー率は、クラスにおける変異リードの合計とクラスにおけるリードの総数との比を考慮に入れることによって決定した。このデータを、復元抽出を用いて１００回リサンプリングし、エラー率の９５％信頼区間を取得した。

ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓ
ｃｔＤＮＡの検出を、患者特異的座位のみに関して実行した、すなわち、Ｃ＞Ｔ変異が腫瘍遺伝子型同定に基づいて予期されたが、Ｃ＞Ａが観察された場合、変異リードは無視され、患者特異的シグナルに寄与しなかった。さらに、座位は、少なくとも１つ以上のＦリードファミリーと少なくとも１つ以上のＲリードファミリーとがその位置に存在する場合にのみシグナルに寄与すると考えられた。このことは２つの利点：配列決定からの一本鎖アーチファクトを低減すること、およびＰＥ１５０配列決定を使用してＦリードとＲリードとの間により大きな重なりを有する短い断片に検出を偏らせることを有する。

各試料に関して、変異アレル割合を全ての患者特異的座位にわたって以下：

のように算出した。観察された変異リードの数の有意性を、どちらも目的の試料に関する変異リードと総リードとの数、およびバックグラウンドエラー率からの変異リードの数を含む分割表を考慮して、フィッシャーの片側正確確率検定を使用して決定した。

クラスごとの検出
エラー率の差がＳＮＶクラス間で観察されたため、各試料を、その座位において腫瘍配列決定から予期された変異クラスに基づいて１２に分割した。バリアントリードを上記のように各クラスに関して統合した。フィッシャーの片側正確確率検定を複数回使用して、観察された変異リードファミリーの数の有意性を、その変異クラスに関するバックグラウンドエラー率を考慮して決定した。これは、試料当たり１２個のＰ値を生成し、これらのＰ値を次いで、フィッシャーの方法の延長であり、従属的なＰ値を組み合わせるために使用することができる^１６、経験的なブラウンの方法を使用して組み合わせた。試料がクラスにおけるデータを有しなかった場合、そのクラスは０個の変異リード、したがって１のＰ値を有すると扱った。この手法の特異度をさらに改善するために、２つ以上の別個のクラスにおいて変異リードを有する試料を必要とした。このことは、検出が異なる種類のエラープロセスの対象となる複数の座位に存在するシグナルに基づくことを保証するためのものであった。

有意性閾値決定
全ての患者を、同じ配列決定パネルを用いて配列決定し、９９．９％のバリアントが各患者個人のもの（すなわちその個体のみに固有のもの）であったため、他の全ての患者を使用してｃｔＤＮＡ検出に関する偽陽性を決定し、したがってコホートに関するＰ値閾値を設定することができた。この手法は、実施された冗長配列決定（ｒｅｄｕｎｄａｎｔｓｅｑｕｅｎｃｉｎｇ）を活用し、各個体からの配列決定された複数の試料を利用して生殖細胞系列バリアントを排除する。したがって、ＴＡＰＡＳデータを、各座位が患者の腫瘍において変異しているか否かに基づいて、患者特異的および非患者特異的に分割した。非患者特異的データは、有意性閾値を決定するために使用した。

患者を対照として使用するために、技術的ノイズは、血漿において検出され得るが腫瘍において見落とされた任意の真の生物学的シグナルから分離すべきである。したがって、エラー抑制された非患者特異的データを使用して、座位が、これらの座位を無視することを正当化するのに十分なほど観察される可能性が低いと本発明者らが算出した（Ｐ＝１×１０^−１２、バックグラウンドエラー率の決定を参照のこと）変異リードファミリーを、同じ個体からの３つ以上の別個のライブラリにおいて含有した場合、その座位をさらなる分析の対象から外した（「ブラックリストに登録した」）。結果として、１２，５５８のうち４４の座位（０．３５％）をさらなる分析の対象から外した（「ブラックリストに登録した」）。患者の不完全な腫瘍およびバフィーコート遺伝子型同定は結果として対照試料において残存生物学的シグナルを生じ得るが、このことは、同じパネルを用いて多くの対照試料を配列決定し、非患者特異的データを廃棄することに関する費用よりも好ましかった。

ＩＮＶＡＲによって取得した組み合わせたＰ値に関する有意性閾値を、分類確度を最大化する「ＭａｘＥｆｆｉｃｉｅｎｃｙ」法を有するＲでのＯｐｔｉｍａｌＣｕｔｐｏｉｎｔｓパッケージを使用する、患者特異的（試験）および非患者特異的（対照）試料に関する受信者操作特性分析を使用して決定した。

感度に関する実験的添加希釈
３．７ｎｇの添加希釈実験
血漿ｃｆＤＮＡを１名の健康な個体から取得し（Ｓｅｒａｌａｂ）、変異ｃｆＤＮＡを高腫瘍負荷時点の１名の患者（ＭＲ１００４；２，７４６の患者特異的変異）から取得した。溶出液のｃｆＤＮＡ濃度を、水を使用して均等にし、次いで患者の試料を健康なｃｆＤＮＡによって１：５の比で段階希釈して、元のｃｆＤＮＡ溶出液の１５，６２５倍最終希釈液を得た。ライブラリ調製を、全てのライブラリに関して３．７ｎｇの入力でＴｈｒｕＰＬＥＸＰｌａｓｍａ−ｓｅｑキットを使用して２連で実行した。

５０ｎｇの添加希釈実験
６名の患者からの等質量の血漿ｃｆＤＮＡをプールして、総計９，６３６の患者特異的バリアントを有する仮想患者を作出した。血漿ｃｆＤＮＡのプールを１１名の健康な個体から生成した（Ｓｅｒａｌａｂ）。患者試料プールおよび健康なプールのｃｆＤＮＡ濃度を、水を使用して均等にし、次いで患者試料を健康なｃｆＤＮＡによって１：１０の比で段階希釈して、元の１倍プール試料の１００，０００倍希釈液を得た。ライブラリ調製を、ライブラリ当たり最大５０ｎｇの入力量でＴｈｒｕＰＬＥＸＴａｇ−ｓｅｑキットを用いて２連で実行した。エラー抑制を伴わないＴＡＰＡＳの検出の限界よりも大きい、予期されたアレル割合を有するライブラリの場合、ライブラリ調製への入力材料を減少させ、検出されることが確実である患者血漿ＤＮＡを節約した。

変異のｉｎｓｉｌｉｃｏでのダウンサンプリング
多様な数の変異を用いてＩＮＶＡＲ−ＴＡＰＡＳの検出の限界を試験するために、患者特異的混合物実験と全ての非患者特異的データの両方を５０〜５，０００の間の変異にダウンサンプリングした。ＢＲＡＦを、サンプリングした変異の各セットに常に含め、ＢＲＡＦ^ｍｕｔ患者に関するパネル設計を模擬した。変異を１００回繰り返しサンプリングし、ｃｔＤＮＡの検出を、ＩＮＶＡＲを使用して試験した。

ｃｔＤＮＡ定量のためのバックグラウンド減算
変異アレル割合を百万分率まで正確に決定するために、バックグラウンドエラー率を観察されたアレル割合から減算した。これは、クラスごとのエラー率の差を考慮に入れて実施することも、考慮に入れずに実施することもできる。観察された変異アレル割合がバックグラウンドエラー率未満であった場合、バックグラウンド減算アレル割合は０に設定した。

試料に関する変異クラスごとのバックグラウンド減算の場合、１２のクラスのそれぞれのエラー率を、そのクラスの変異アレル割合から減算した。次いで平均アレル割合を、そのクラスにおいて観察されたリードファミリーの総数によって加重された個々のバックグラウンド減算アレル割合のそれぞれから算出した。

新たな変異検出
ブラックリストに登録することによって取り除かれる（すなわち、上に記載したようにより高い座位特異的エラー率を有することを根拠にフィルター除去される）バリアントは、生物学的シグナルであることに関する証拠を示すことを根拠に以前に排除した。既知の変異であったバリアントに関して、このブラックリストから変異を呼び出すことを試みた。したがって、データを、既知のドライバー変異に関するＣＯＳＭＩＣデータベースと交差させた（重なり合う変異の数≧５）。各変異座位に関して、その座位に関するバックグラウンドエラー率を、非患者特異的データ（すなわち腫瘍がその変異に関して陰性と遺伝子型同定された患者）を使用して決定した。フィッシャーの片側正確検定を使用して、試料における変異リードの数の有意性を、その試料における総深度、ならびにバックグラウンドにおける変異リードおよび総深度を考慮して検定した。Ｐ値閾値を０．０５として設定し、ボンフェローニ法によって複数の仮説に関して補正した。個々の変異コールを、複数の一時的に分離した試料にわたって変異リードを集計することによって確認した。

［実施例１］
腫瘍および血漿からの患者特異的変異の同定
患者の腫瘍において変異している定義された座位において高い配列決定深度を達成するために、テイラードハイブリッド捕捉配列決定パネルを、腫瘍生検の配列決定において同定された一塩基バリアント（ＳＮＶ）に基づいて設計した。１個以上の変異リードおよび１０個以上の総リードを有するＳＮＶを、ベースライン転移生検のエクソーム配列決定（９名の患者）または標的化配列決定（１名の患者）から選択した。患者当たりの同定されたＳＮＶの数の中央値は６７３であった（ＩＱＲ２５０〜１，２０９；図７ａ）。患者特異的バリアントを決定した（示していない）。加えて、血漿における変異の新たな同定を可能にするために、以下の遺伝子のコード配列および非翻訳領域をパネル設計に含めた：ＡＲＩＤ２、ＢＲＡＦ、ＣＤＫＮ２Ａ、ＮＦ１、ＰＴＥＮ、およびＴＰ５３、ならびに黒色腫において一般的に変異している３７の追加の遺伝子におけるホットスポット座位（示していない）。最終パネル設計は１．５２７Ｍｂｐを包含した。

完成されたベイトセットを、２年にわたって収集した、連続的に収集した血漿ｃｆＤＮＡ試料（患者当たり最大８つの試料）から２連で生成されたライブラリに適用した。ＤＮＡを２ｍＬの血漿から抽出し、血漿ＤＮＡライブラリに関する入力質量中央値は４．４ｎｇであった（ＩＱＲ３．２〜１０．０ｎｇ）。ＨｉＳｅｑ４０００（ＰＥ１５０）のレーン当たり中央値で９つのＴＡＰＡＳライブラリ（ＩＱＲ８〜１２）をプールした。患者特異的座位のそれぞれに関して、品質フィルター処理リードの深度中央値（方法）は各試料に関して１，３６７ｘであった（ＩＱＲ７６１〜１，８８６ｘ）。

腫瘍配列決定によって見落とされた場合がある、パネルによって包含された追加の変異を同定するために、ｃｔＤＮＡレベルがより高いと予期された場合、追加の変異呼び出しステップを、薬物処置の開始前または開始時の第１の血漿時点において実施した。血漿変異呼び出しは、その後の分析に関して患者当たり中央値で１９のＳＮＶ変異を付加し（ＩＱＲ９〜２２；示していない）、コホートにわたって総計１２，５５８の患者特異的ＳＮＶを得た。本発明者らのコホートにおけるＳＮＶの新たな同定の観察率は、以前に報告された^１０、黒色腫におけるＭｂ当たり１４．４のコード変異という推定値と一致した（ＩＱＲ＝８．０〜２４．９）。ＢＲＡＦＶ６００Ｅ変異は１０名の患者のうち９名に見出され、さらなる１８の変異は任意の２名の患者の間で共有された。全体としては、９９．９％の変異した標的化座位は個々の患者に固有であった。

［実施例２］
バックグラウンドエラー率の特性解析
ＴＡＰＡＳ配列決定データにおいてエラー抑制を伴うおよび伴わないバックグラウンドエラー率（すなわち予期されなかった変異塩基を観察する率）を求めることを試みた。患者特異的バリアントの両側の塩基は、患者特異的バリアントに匹敵する配列決定深度を有し、同じ技術的な偏りの対象となり得るため、これらを研究した。患者試料のこの標的外配列決定を活用するために、生殖細胞系列事象および潜在的な生物学的シグナルは、同じ個体からの試料において複数回生じた場合、排除し（方法）、これらの座位は、その後の新たな変異呼び出しのために一時的に除いた。

エラー抑制は、リードファミリーにわたるコンセンサス配列を、リードのコラプシングを使用して決定することによって達成することができる。これを達成するために、重複リードを、以前に「内在性バーコード」と称された^{１１、１２}開始および終了断片位置と、分子バーコードの両方に基づいて、「リードファミリー」にグループ化した。リードファミリーをコラプシングし、塩基が呼び出されるための最低限の要件を全てのファミリーメンバー間で９０％以上のコンセンサスと設定した。エラー抑制を伴わない場合、平均バックグラウンドエラー率は２×１０^−４であった。エラー抑制を適用する前に、リードファミリー当たりの重複の最適な最小数（「ファミリーサイズ」）を決定した。１、２、３、および５の最小ファミリーサイズ要件を有するデータに関する、保持されたリードファミリーの比率および対応するエラー率を図２ａに示す。１超のサイズのリードコラプシングされたファミリーと、コラプシングされなかった１のサイズのファミリーとを含有する、１の最小ファミリーサイズ閾値は、エラー率を２．３×１０^−５まで低下させた。５の最小ファミリーサイズ要件を選択し、これは４２％のリードファミリーを保持する一方でバックグラウンドエラー率を５．９×１０^−６までさらに低下させた。ファミリーサイズに関するより厳密でない規準はより多くのリードを保持し得るが、増加した配列決定ノイズを伴う。

［実施例３］
ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓ（ＩＮＶＡＲ）
厳密なレベルのエラー抑制（５の最小ファミリーサイズで、９０％のファミリーメンバーにおいて必要とされるコンセンサス）を使用して、中央値で４．４ｎｇの入力に関して、それぞれがその患者の癌において変異している座位を包含する、中央値で３．２×１０^５のリードファミリーを各時点において取得した（ＩＱＲ８．７×１０^４〜６．２×１０^５）。したがって、そのようなリードファミリーのそれぞれが単一の分子に対応するという仮定に基づくと、出発物質がわずか約１３００コピーのゲノムを含有する場合であっても各試料に関して数十万の標的分子を調べることができたことになる。

ｃｔＤＮＡレベルが低い場合、多くの患者特異的座位はその位置に変異ＤＮＡ断片を有することができない（図７ｂ）。したがって、サンプリングエラーを克服するために、全ての患者特異的リードファミリーを、ＩＮＶＡＲを使用して集計し、同時に分析した（図１ｂ）。各試料に関して、「全体」変異アレル割合を全ての患者特異的座位にわたって以下：

のように算出した。観察された変異リードの数の有意性を、どちらも目的の試料に関する変異リードと総リードとの数、およびバックグラウンドエラー率からの変異リードの数を含む分割表を考慮して、フィッシャーの片側正確確率検定を使用して決定した。ＰＥ１５０配列決定データからの少なくとも１個の順方向（Ｆ）リードと少なくとも１個の逆方向（Ｒ）リードとが存在した場合にのみ、座位において、変異リードはシグナルに寄与すると考えた。このことは、配列決定アーチファクト、およびｃｔＤＮＡにおいてエンリッチする短いｃｆＤＮＡ断片（両方向のリードによって包含される）からのデータへの偏りを抑制し得る^{１３〜１５}。

ハイブリッド捕捉配列決定における塩基置換間のエラー率の公知の差に基づいて^７、ＴＡＰＡＳデータにおける変異クラスごとのエラー率を、ＩＮＶＡＲを使用して評価した。データを１２のクラス（Ｃ＞Ｇ、Ｇ＞Ｃ、Ｔ＞Ｇ、Ａ＞Ｃ、Ｃ＞Ａ、Ｇ＞Ｔ、Ｔ＞Ｃ、Ａ＞Ｇ、Ｔ＞Ａ、Ａ＞Ｔ、Ｃ＞Ｔ、Ｔ＞Ｃ）に分割し、エラー抑制前と後の両方でクラスごとのエラー率の差を示した（図２ｂ）。ノイズが最も大きいクラスとノイズが最も小さいクラスとの間のエラー率においてほぼ４０倍の差を同定した。これらのデータは、低エラー率変異クラスを利用することの、技術的ノイズを克服し、低いレベルのｃｔＤＮＡに関する感度を改善する可能性を示唆した。

本発明者らは、各試料からのリードファミリーを１２のクラスに分割することに基づいてｃｔＤＮＡを検出するアルゴリズムを開発した。Ｐ値を、フィッシャーの正確確率検定を使用して各エラークラスに関して別個に導き、Ｐ値を、フィッシャーの方法の延長であり、従属的なＰ値を組み合わせるために使用することができる^１６、経験的なブラウンの方法を使用して組み合わせた（方法）。この手法の特異度をさらに増加させるために、本発明者らは、変異シグナルは少なくとも２つの変異クラスに存在しなければならず、それにより個々のノイズを含む座位またはクラスへの検出の依存を低減すると規定した。

全ての患者を、同じ配列決定パネルを用いて配列決定し、９９．９％のバリアントが各患者に固有のものであったため、他の全ての患者を使用してｃｔＤＮＡ検出に関する偽陽性を決定し、したがって各検出アルゴリズムのためのコホートに関するＰ値閾値を設定することができた。この手法は、他の場合では廃棄され得る実施された冗長配列決定を活用し、各個体からの配列決定された複数の試料を利用して、生殖細胞系列バリアントを排除する（方法）。したがって、配列決定データを、座位が患者の腫瘍において変異しているか否かに基づいて、「患者特異的」および「非患者特異的」に分割した。検出に関する有意性閾値を、分類確度を最大化するＲでのＯｐｔｉｍａｌＣｕｔｐｏｉｎｔｓパッケージを使用する、患者特異的（試験）および非患者特異的（対照）試料に関する受信者操作特性（ＲＯＣ）分析を使用して、経験的に決定した。本発明においては、ＲＯＣ分析を使用して、感度と特異度の両方を最大化することに基づいて最適な閾値を同定することも、特異度をある特定のレベル、例えば９９．５％で固定して、感度を探査することもできる。

［実施例４］
ＩＮＶＡＲ−ＴＡＰＡＳの感度分析
ＩＮＶＡＲ−ＴＡＰＡＳの感度を評価するために、２，７４３の変異がＴＡＰＡＳパネルに包含される患者からの血漿ＤＮＡを使用して、ライブラリ当たり３．７ｎｇでの添加希釈実験を２連で生成した。内在性バーコードを用いたエラー抑制を使用して、最初にリードを変異クラスに分割せずにＩＮＶＡＲを適用し、１．９×１０^−６の予期された変異アレル割合を有する試料を検出した（図８）。したがって、百万分率単位（ｐｐｍ）の検出を達成した。この同じ入力（およそ１，１００の一倍体ゲノム）での完全な単一座位アッセイは、１０００倍以上高い２．７×１０^−３の変異アレル割合の検出の限界（９５％の感度）を有し得る。１．９ｐｐｍの予期された変異アレル割合を有した検出された試料は、２７ｐｐｍの観察された変異アレル割合を有した。観察されたアレル割合はバックグラウンドエラー率（６ｐｐｍ）と真のシグナルとから構成されるため、バックグラウンドエラー率を観察されたアレル割合から減算し、予期された変異アレル割合よりもおよそ１０倍大きい２２ｐｐｍの「バックグラウンド減算」アレル割合を得た。低いレベルの入力において、配列決定ノイズとサンプリングエラーの両方は正確な定量を依然として妨げ得る。

次に、最大５０ｎｇの入力ｃｆＤＮＡでの第２の添加希釈実験を２連で行い、分子バーコードを使用した。この実験に関して、６名の患者からのＤＮＡをプールし、健康な個体のＤＮＡに段階希釈した（方法）。患者のｃｆＤＮＡプールは、総計９，６３６の患者特異的変異を含んだ。５０ｎｇの入力ＤＮＡは、このコホートからの３．０ｍＬの血漿におけるｃｆＤＮＡに対応する（ｃｆＤＮＡ濃度中央値は５，１６０コピー／ｍＬ）。クラスごとの分析をせずにＩＮＶＡＲを使用して、３ｐｐｍの予期された変異アレル割合の添加試料を、９ｐｐｍの観察されたアレル割合において検出した（図３ａ）。上述の通りのバックグラウンド減算後、試料は３．３ｐｐｍの観察された変異アレル割合を有した（３．０ｐｐｍの予期された変異アレル割合）。このことは、バックグラウンドエラー率に接近しているアレル割合の定量の場合、バックグラウンドはシグナルの増加する比率を含み得るため、バックグラウンドエラーを減算することがますます重要となることを強調する。

次いで、ＩＮＶＡＲを、上に記載したように試料を１２の変異クラスに分割することによって適用した。変異クラス間のエラー率の差を活用することによって、有意な検出を０．３ｐｐｍまで達成した（図３ｂ）。この検出限界は、以前の捕捉配列決定方法^１の１００分の１以下であり、また同じライブラリ入力質量（５０ｎｇ、１５，０００ゲノムコピーと等価）での完全な単一座位アッセイに関する検出の限界（９５％の感度）の１００分の１〜１０００分の１以下である。減算をクラスごとに実行し、次いで深度加重平均を取ることによって組み合わせたことを除いて、上述の通り、バックグラウンド減算を実施した。０．３ｐｐｍの予期された添加希釈液に関して０．４ｐｐｍのバックグラウンド減算アレル割合を観察し、百万分率までのｃｔＤＮＡ定量に関して高い程度の線形性を実証した。

この手法の感度を、より小さなパネル設計を用いて試験するために、５０から５，０００の間の変異のサブセットを、ＢＲＡＦＶ６００座位の近傍でｉｎｓｉｌｉｃｏで無作為にサンプリングし、ＩＮＶＡＲを変異クラスごとに使用したｃｔＤＮＡの検出を繰り返し反復した（方法）。ＢＲＡＦＶ６００をサンプリングした各パネルに含め、ＢＲＡＦ^ｍｕｔ患者に関するパネル設計を模擬した。各数の変異に関して達成した感度を図３ｃに示し、２５００の変異について、０．３ｐｐｍをほぼ５０％の感度で検出することができた。２，５００の変異に関して、この手法の特異度を９９．６％と経験的に決定した（図３ｄ）。

［実施例５］
Ｉｎｓｉｌｉｃｏサイズ選択
リードの開始および終了位置を使用して断片サイズ分布を決定した。全ての血漿試料からのエラー抑制されたデータを組み合わせ、断片の分布を算出した（図４ａ）。各５ｂｐのサイズ区間に関して、変異の割り前と野生型の割り前との比を決定した（図４ｂ）。ｃｔＤＮＡに関するエンリッチメントを、ヌクレオソームＤＮＡサイズ（１６６ｂｐの倍数）よりも約２０〜３０ｂｐ短い断片において観察した。エンリッチメントの大きさは、モノヌクレオソームピークよりもジヌクレオソームピークにおいて大きかった。１名の患者は変異トリヌクレオソームＤＮＡに関する証拠を示した（図９）。以前のデータは、変異断片が野生型断片よりも短いことを実証しているが^{１３、１４、１７}、これらのデータは、変異ＤＮＡがモノ、ジ、およびトリヌクレオソームＤＮＡよりも一貫して短いことを示す。

これらの所見を考慮して、本発明者らは、ｉｎｓｉｌｉｃｏサイズ選択により変異シグナルをエンリッチすることを目的とした。ｃｔＤＮＡのエンリッチメントを示したサイズ範囲に基づいて、データを、１１５〜１９０ｂｐ、２５０〜４００ｂｐ、および４４０〜４６０ｂｐのサイズ範囲内のリードにｉｎｓｉｌｉｃｏでサイズ選択した。変異および野生型断片のサイズ分布は大半の場合重なり合っていたため、これらの比較的広い範囲を選択して、まれな変異アレルの喪失を最小限にした。過度に厳密なサイズ選択は、結果としてまれな変異分子の脱落を生じる場合があり、これはｃｔＤＮＡレベルが百万分率に近づくにつれてますます問題となる。原則として、より多くの入力ＤＮＡおよびさらなる配列決定を用いる場合、より狭いフィルターを適用してより強力なエンリッチメント因子を生成することができる。血漿試料および添加希釈液に適用された場合、サイズ選択は、９３．７％の変異リードを保持する一方で、野生型に対してｃｔＤＮＡにおいて６．３％のエンリッチメント中央値を生じた。サイズ選択後のエンリッチメントの程度は、試料の開始変異アレル割合に関係し、減少する変異アレル割合との指数関係に従った（図４ｃ）。最低変異アレル割合（１ｐｐｍ未満）を有する５０ｎｇの添加実験からの試料は、おそらくは最も高いレベルの汚染野生型リードを有したため、最も大きい程度のエンリッチメントを示した。１名の患者（ＭＲ１００４）では、サイズ選択は以前に検出されなかった変異シグナルの検出を可能にし、９．１ｐｐｍの変異アレル割合であった（図５ａ）。これは、患者が体積測定ＣＴ分析によって決定された総計１．３ｃｍ^３の疾患を有した時点で観察された（図５ａ、ｂ）。サイズ選択は、患者ＭＲ１００４のベムラフェニブ標的化療法中の第２の時点に関して、０の変異リードファミリーが存在したため、利益をもたらさなかった（図５ａ、ｃ）。

［実施例６］
残存腫瘍体積の検出
コホートにわたって、ｃｔＤＮＡ変異アレル割合を体積測定ＣＴ撮像データに対して比較し、これは０．６７のピアソン相関を示し（Ｐ＝０．０００２；図５ｄ）、以前に公開された研究に一致した^６、８。１名の患者（ＭＲ１０１４）は、国際ＲＥＣＩＳＴ規準^１８によって測定不能であった低体積皮下転移を有したため、この比較から排除したが、依然としてｃｔＤＮＡに寄与し得る。患者ＭＲ１００４の検出されなかった時点（図５ａ）に関する考えられる最大の変異アレル割合は、ポアソン分布および完全なアッセイに基づいて１個の変異分子をサンプリングする９５％の確率を得るように調整された、その試料におけるリードファミリーの数の逆数を取ることによって、３．４ｐｐｍと推測した。

全ての時点にわたって、ｃｔＤＮＡと、黒色腫患者に関して使用される予後マーカーである血清乳酸脱水素酵素との間に０．８６のピアソン相関が存在した（Ｐ＝２．２×１０^−１５；図１０ａ）。４３％の時点において、患者は検出されたｃｔＤＮＡと正常なＬＤＨとを有し、タンパク質マーカーと比べて低いｃｔＤＮＡの生理学的バックグラウンドを反映した。同時に、これらのデータは、ｃｔＤＮＡが、ＬＤＨに類似しかつ残存疾患に関する増強した感度を有する予後的役割を果たし得ることを示す。

全身療法の開始後、１０名のうち３名の患者のｃｔＤＮＡが１０ｐｐｍ未満のレベルに下がった。本発明者らは、ｃｔＤＮＡが１０ｐｐｍ未満まで落ちた患者はより高いレベルの残存ｃｔＤＮＡを有する患者と比べて２４か月長い全生存期間を有したことを見出した（中央値９５４対２２９日；ログランク検定Ｐ＝０．００９；図５ｅ）。また、ベースラインｃｔＤＮＡレベルは全生存期間との逆相関を示した（ピアソンｒ＝−０．６１、Ｐ＝０．０４；図１０ｂ）。このコホートにわたって、ｃｔＤＮＡの最初の上昇は、放射線学的進行より中央値で５４日先に生じた（ＩＱＲ０〜１１２日）。リードタイム（ｌｅａｄｔｉｍｅ）を、上昇が明らかとなった時点から算出した。これは、５５日という分析された試料間の時間の中央値（ＩＱＲ２８〜７３．５）よりも頻繁な血漿サンプリングによりさらに改善し得る。

ライブラリ調製のために使用した限定されたＤＮＡ入力質量にもかかわらず（ライブラリ当たりの中央値４．４ｎｇ、１３２０の一倍体ゲノム）、４０％の血漿試料は、完全な単一座位アッセイを使用した理論的な検出の限界（９５％の感度）未満であった、有意に検出されたアレル割合を有した図５ｆ）。注目すべきことに、本発明者らは、ｃｆＤＮＡ濃度とｃｔＤＮＡ変異アレル割合との間に０．２７のピアソン相関を観察し、これは、低い総ｃｆＤＮＡレベルが低いｃｔＤＮＡレベルを伴う可能性があり、低いレベルのｃｔＤＮＡの検出を、個々の変異座位に依存するアッセイに関してより一層困難を伴うものにすることを示した。

［実施例７］
新たな変異検出
ｃｔＤＮＡレベルが十分に高い場合、耐性変異は新たに同定され得、クローン進化は変異のアレル割合の変化を通してモニタリングされ得る^９。１名の患者（ＭＲ１０２２）からの一例を図６に示し、これは、ＣＯＳＭＩＣデータベース^１９において５つ以上の発生を有した個々の変異に関するアレル割合（図６ａ）を、個々の腫瘍病変体積（図６ｂ）および腫瘍病変位置（図６ｃ）と共に示す。ホットスポット変異座位を試験することによって（方法）、上昇するＮＲＡＳＱ６１Ｋ変異は、総計２名の患者からの血漿試料において新たに有意に検出され、これらの変異は、これらの患者のベースライン腫瘍生検において同定されなかった。個々の変異呼び出しに関して、検出を、試料当たりを基準として実行した。低いレベルのシグナルおよび入力材料のコンテキストでは、一連の試料からのバリアントリードを統合することは、各試料が収集および配列決定されるにつれて、閾値未満のｃｔＤＮＡレベルを有する複数の試料を集計することを可能にすることによって、感度を増強し得る。

考察
数千の腫瘍由来変異の多重化ディープ配列決定とＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓとの組合せは、０．３ｐｐｍまでのｃｔＤＮＡを検出することを可能にした。ｃｆＤＮＡ配列決定データからのエラー率および断片化パターンの特性解析を通して、本発明者らはｃｆＤＮＡのハイブリッド捕捉配列決定に関するワークフローを最適化した。本研究では、各患者に関する数多くの変異を、ベースライン腫瘍生検のエクソームまたは標的化配列決定によって同定された全ての変異を使用することによって分析した。このことは、他の高感度増幅産物およびハイブリッド捕捉法^６、８のために使用された入力量のおよそ１０分の１の、ライブラリ調製への限定されたＤＮＡ入力量にもかかわらず、高感度分析を可能にした。エラー抑制を使用してバックグラウンド配列決定エラーを低減し、ｉｎｓｉｌｉｃｏサイズ選択を使用して変異シグナルを増強した。各患者に関する既知の腫瘍変異と重なる大量の患者特異的リードを生成することによって、ＴＡＰＡＳは、少ない入力量と、エラー抑制およびサイズ選択によって引き起こされたデータ喪失とを補償する一方で、非常に高感度な検出に十分な変異リードを依然として保持する。結果として、高い感度（百万分率未満）と高い特異度（９９．５％超）の両方を達成した。

ＩＮＶＡＲ−ＴＡＰＡＳは、変異クラス間のエラー率の差を活用して、利用可能なデータを効率的に使用する一方でまれな変異アレルを検出する。変異クラスごとの検出と、それに続く各検定統計量の組合せは、各クラスがクラスのバックグラウンドエラー率に基づいて全体のシグナルに寄与することを可能にした。変異クラス間の従属関係を考慮する、相関するデータセットに関するＰ値を組み合わせるための方法^１６を使用した。ここで、１２の変異クラスによる分析を使用し、より大きなデータセットは、トリヌクレオチドコンテキストごとまたは個々の座位ごと等のより大きい数の配列サブセットに基づく分析を可能にし、このことはエラー率に対する分解能をさらに一層改善し得る。

エラー抑制されたデータを使用して、ＰＣＲおよび／または配列決定からの最小の交絡的エラーを有する変異リードと野生型リードの両方に関するサイズプロファイルを視覚化した。本発明者らは、ｃｔＤＮＡが短い血漿ｃｆＤＮＡ断片においてエンリッチし、ジヌクレオソームＤＮＡにおける変異ＤＮＡのエンリッチメントに関する証拠を提供し、これが癌患者の血漿におけるより長い変異ＤＮＡに関する以前の所見^{２０、２１}に寄与した可能性があることを確認する。サイズ選択を、非侵襲性出生前検査^２２（ここで胎児ＤＮＡ断片は母体断片よりも短い^２３）の分野において最初に実証され、癌患者試料に関して実験的に使用され始めている^１７本発明者らのデータに適用した。Ｆａｎら^２２はサイズ選択を用いて変異分子を保持することの困難を強調するが、本発明者らは、これは大部分、変異および野生型断片の高度に重なり合うサイズ分布に起因することを確認する。現行の研究では、本発明者らは緩やかなサイズ選択を選択して大きな割合の出発変異分子を保持し、緩やかなカットオフは、特に変異割合が非常に低い（１ｐｐｍ以下の変異アレル割合の範囲）場合に利益をもたらすことができることを実証した。より大きい配列決定深度およびＤＮＡ入力を用いる場合、より厳密なフィルタリングはさらなるエンリッチメントを提供することができる。

ＩＮＶＡＲ−ＴＡＰＡＳは腫瘍由来変異の知識を活用するが、これは高い腫瘍含量を有する初期試料の分析を必要とする。この方法は、処置後、特に腫瘍組織ＤＮＡが配列決定のために取得され得る外科的処置後の疾患再発をモニタリングすることに関して潜在的有用性を有する。本発明者らは、この方法が９．１ｐｐｍのｃｔＤＮＡを用いて１．３ｃｍ^３という小さい残存疾患を検出した一例において、この観察された変異アレル割合は、以前に記載されたモデル^６からの所与の腫瘍体積に関して予測されたアレル割合と一致し、ＩＮＶＡＲ−ＴＡＰＡＳがＣＴ検出に関する検出の限界において病変を理論的に同定し得ることを示す、ということを示した。高感度手法を用いた再燃または疾患進行のより早期の検出は、アジュバント療法または療法の変更のより早期の開始を容易にし得る。その後の療法を導くことに関して、本発明者らは、変異は新たに同定され得るが、この感度はその座位において分析される、感度を限定している可能性のある分子の数に直接比例することを実証する。シグナルは、限定された入力ＤＮＡのコンテキストにおける同定を増強するために、複数の経時的試料にわたってさらに統合され得る。本発明の手法の１つの利点は、以前の試料における低いレベルのシグナルが、後の試料における変異検出を支持する証拠を提供することができることである。したがって、各経時的試料は別の試料を支持する。

このテイラード手法は、血漿からの異なる種類の入力データ、および分析結果を通知する異なる変異のリストを使用して実行され得る。腫瘍由来変異は、ここで実証されるようにエクソーム配列決定を使用して同定することができるが、より小さな焦点化パネルまたはより大きな規模、例えば全ゲノムにわたって同定することもできる。１０名の黒色腫患者のこのコホートでは、エクソーム配列決定は患者当たり数百から数千の変異を同定するのに十分であった。癌の種類の既知の変異率^２４に基づくと、エクソーム配列決定はまた、比較的高い変異率を有する多くの癌の種類、例えば肺、膀胱、食道、または結腸直腸癌に関しても十分であり得る。メガベース当たり約１以下の変異率を有する癌の場合^２４、変異解析のための腫瘍の全ゲノム配列決定が望ましいことがある。卵巣および脳癌の場合、これは結果として患者当たり数千の同定された変異をもたらすと考えられる。

ＩＮＶＡＲのためのデータを生成するために、数多くの変異のディープ配列決定を提供するが、患者特異的配列決定パネルの開発を必要とする、患者特異的パネルを用いる標的化配列決定（例えばＴＡＰＡＳ）を使用した。これは、ＩＮＶＡＲのためのデータを、同じＴＡＰＡＳパネルを用いて分析することができる経時的試料から生成するために費用効果が高い。異なる実装形態では、患者特異的パネルの設計を伴わない全エクソームまたは全ゲノム配列決定は、ＩＮＶＡＲに好適な類似したデータを生じ得る。この手法を用いる場合、ワークフローの複雑性を低減するが、配列決定データの多くは腫瘍により変異した座位を包含し得ず（したがってＩＮＶＡＲに関して有益となり得ず）、結果として、より多くの配列決定が実施されない限り、より少ない、ＩＮＶＡＲに利用可能な患者特異的リードファミリーをもたらし得る。配列決定費用が減少し、かつ腫瘍配列決定が個別化腫瘍学の到来と共により頻繁になる場合、血漿ｃｆＤＮＡのエラー抑制された配列決定からのＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓは、処置モニタリング、疾患監視、および残存疾患の検出の非常に高感度な手段を提供し得る。

［実施例８］
トリヌクレオチドコンテキストの使用
腫瘍配列決定
患者の腫瘍において変異している定義された座位において高い配列決定深度を達成するために、テイラード配列決定パネルを、ステージＩＩ〜ＩＶの黒色腫を有する４８名の患者からの新鮮凍結またはＦＦＰＥ腫瘍生検の配列決定において同定された一塩基バリアント（ＳＮＶ）に基づいて設計した。変異呼び出しを全ての腫瘍生検に関して実施し、バリアントコールをフィルタリングして、患者の適合生殖細胞系列ＤＮＡにおける、共通のＳＮＰ部位、反復領域、およびシグナルを有する座位を排除した（方法）。

変異プロファイルを、新鮮凍結腫瘍生検配列決定（図１１および１２）、ならびにＦＦＰＥ生検配列決定（データは示していない）において評価した。大多数の変異はＣ＞Ｔであり、ＧＧＡおよびＴＣＣコンテキストが最も広く存在し、ＵＶシグネチャの優勢を反映した（図１１）。腫瘍変異の変異アレル割合中央値は約０．２５と推定された。

血漿配列決定
本発明者らは、２の最小ファミリーサイズ閾値を有するエラー抑制されたデータを使用して、ハイブリッド捕捉配列決定からの血漿におけるバックグラウンドエラー率がトリヌクレオチドコンテキスト間で変動することを見出した（図１３）。トリヌクレオチドコンテキストの使用は、コンテキストにわたるリードファミリーの集計により、１０００万分の１までのバックグラウンドエラー率の決定を可能にするが、座位当たりのレベルに関する同じ確度のバックグラウンドエラー推定を達成することは、莫大な数の試料が配列決定されることを必要とし得る。トリヌクレオチドコンテキストの使用は、エラー抑制後のリードファミリーの最大限の保持を可能にするが（図２ａ）、１００倍以上にまたがる広範囲のエラー率を有する。

コンテキストを取り扱うためのＩＮＶＡＲの修正
ｃｔＤＮＡレベルが低い場合、多くの患者特異的座位はその位置に変異ＤＮＡ断片を有することができない。したがって、サンプリングエラーを克服するために、全ての患者特異的リードファミリーを、ＩＮＶＡＲを使用して集計し、同時に分析した。各試料に関して、変異リードファミリーおよび総リードファミリーをトリヌクレオチドコンテキストごとに集計し、比率：

を決定した。観察された変異リードの数の有意性を、各コンテキストに関してフィッシャーの片側正確確率検定を使用して決定し、各試料に関するＰ値のベクトルを生成した。各患者において表されるコンテキストの数はその患者の変異プロファイルに基づいて異なるため、各Ｐ値ベクトルの長さは試料間で変動した。このことを考慮するために、および微小残存病変（ＭＲＤ）環境において少数の分子のみが存在し得ることを考慮に入れるために、試料当たり６つの最も有意なトリヌクレオチドコンテキストからのＰ値を組み合わせた。これを試験試料と対照試料の両方に関して実施し、対照を使用して、９７．５％の特異度でＰ値カットオフを決定した。

［実施例９］
黒色腫に関するＵＶ由来ジヌクレオチド変異の活用
皮膚黒色腫における高い変異率はほとんど完全に、ＵＶ誘導変異の特性であるシチジンからチミジンへの（Ｃ＞Ｔ）転位の存在量を原因とすることができる（Ｈｏｄｉｓら、２０１２年）。本発明者らは、この変異シグネチャを本発明者らのデータにおいて確認する（図１１）。Ｃ＞Ｔ転位に関して、１０の変異のうちの１つはＣＣ＞ＴＴであり（Ｂｒａｓｈ、２０１５年）、これは本発明者らのデータにおいてＣＣまたはＧＧを含有するコンテキストにおける変異の存在量と一致する（図１１）。

黒色腫において、ＣＣ＞ＴＴ変異は、任意の確率論的なＰＣＲ／配列決定エラーが連続して２回生じなければならないと考えられるため、極端に低いエラー率を達成する機会を提供する。ＣＣ＞ＴＴ変異は、独自の変異クラスとして集計することができるが、個々の挿入欠失それぞれは、別個のエラープロファイルを有し得る。したがって、ＣＣ＞ＴＴ変異は、低ノイズプロファイルを利用するのに十分な数の分子の探査を可能にするほど、データに十分広く存在し得る。本発明者らは現在、２の最小ファミリーサイズを用いてエラー抑制されたデータから隣接する塩基においてＣＣ＞ＴＴを有する変異リードを同定するためのスクリプトを生成している。これらの変異は、ＩＮＶＡＲに関する独自のエラープロファイルを有する別個のクラスとして扱うことができる。

［実施例１０］
ＩＮＶＡＲ−微小残存病変（ＭＲＤ）シグナルの統合
残存疾患の検出のためにＩＮＶＡＲを最適化するために、添加希釈系列を、患者のｃｆＤＮＡと健康な個体のｃｆＤＮＡとの混合物を使用して生成し、最低希釈倍率において生じるシグナルを特性解析した。この実験に関して、６名の患者からのｃｆＤＮＡをプールして、総計９，６３６の患者特異的変異を有する理論的患者を創出した。次いで、このプールを健康な個体のＤＮＡに段階希釈した（方法）。

希釈実験に関する個々の患者特異的変異の変異アレル割合のヒストグラムを図１４に示す。試料をさらに希釈するにつれて、次第に増加する比率の座位がサンプリングされなくなるため、変異アレル割合のヒストグラムは左にシフトする。これにもかかわらず、低いレベルのｃｔＤＮＡにおいて、観察される座位は、低い変異アレル割合（０．０３未満）で見られる。このシグナルは、図１５に示す標的化された患者特異的座位にわたって無作為に分布した変異分子の確率論的なサンプリングを表す。

最低レベルの残存疾患において、ｃｔＤＮＡは個々の座位における個々の変異分子に見出され得る。多くの変異分子が１つの座位に完全に集中し、他の座位が表されない可能性は非常に低いと考えられ、このことは本発明者らのデータによって支持される（図１４および１５）。残りの座位に比して予期せぬほど高いレベルのシグナルを有する座位は、ＳＮＰまたはノイズを含む塩基であり得る。したがって、この特性解析に基づいて、本発明者らは、４個以下の変異リード（最大２個の分子が座位に存在することを可能にする、リードはＦリードとＲリードの両方）、および０．０３未満の変異アレル割合（このシグナルがＳＮＰ由来ではないことを確信的とするために十分に多くの総リードファミリーを必要とする）を有する座位を起源とするシグナルに計画的に焦点を当てるＭＲＤフィルターを提唱する。

この手法を使用する場合、５０個の総分子のうち２個以下の分子を有する座位に焦点を当てることによってＳＮＰと誤って遺伝子型同定する確率（予期されたＡＦ＝５０％）は、１×１０^−１２である（５０回のうち２回以下の成功；ｐ＝０．５）。これは、座位が共通のＳＮＰデータベース（すなわち１０００ＧｅｎｏｍｅｓＡＬＬ、ＥＵＲ）に基づいてフィルタリングされる、腫瘍配列決定段階において実行される事前のＳＮＰフィルタリングによってさらに低下する。

加えて、座位当たりの変異リードの数に関する下限も設けた。変異リードは、少なくとも１個のＦリードと少なくとも１個のＲリードとが座位において存在する場合にのみ、座位におけるシグナルに寄与すると考えられた。ＰＥ１５０を用いて配列決定したことを考慮すると、重なり合うＦ変異リードおよびＲ変異リードの支持を必要とすることは、配列決定アーチファクトを抑制することという２つの目的に役立ち、ｃｔＤＮＡに関してわずかにエンリッチする（図４）短いｃｆＤＮＡ断片からの変異リード（両方向のリードによって支持される）を選択した。

同時に、これらの上記パラメータは、ＩＮＶＡＲアルゴリズムの焦点を、ＭＲＤのコンテキストにおいて無作為にサンプリングされた腫瘍を起源とする可能性が最も高い変異分子からのシグナルを集計することに当てる。

［実施例１１］
ＩＮＶＡＲ腫瘍アレル割合加重
ｃｔＤＮＡが高い時点の血漿における変異の出現を評価した。腫瘍エクソームＡＦと血漿ＡＦとの間に相関を見出した（図１６）。したがって、血漿において所与の変異を観察する尤度は腫瘍ＡＦに比例する。このことは、Ｊａｍａｌ−Ｈａｎｊａｎｉら（２０１６年）によって実行された研究と一致する。

患者特異的配列決定は、そのような腫瘍事前情報を活用する機会を提供する。したがって、座位当たりのＩＮＶＡＲシグナルを腫瘍ＡＦによって加重した後で、シグナルの変異コンテキストごとの集計を行った。これは、その座位における変異リードファミリーの数と総リードファミリーの数の両方を１−腫瘍アレル割合で割ることによって実施した。これは、血漿における真のシグナルを含有する可能性のより高い座位により大きい重みを付与する。

座位当たりの変異ファミリーの生の数を図１５に示す。図１８は腫瘍加重後の同じデータを示す。加重前および後の座位当たりの変異の合計を、試験と対照との間で同じ数の変異リードとなるようにダウンサンプリングした、希釈実験および７名の健康な対照試料に関する図１９に示す。これは、加重に起因する試験試料と対照試料との間の変異シグナルの示差的エンリッチメントを示す。

［実施例１２］
エクソーム配列決定データへのＩＮＶＡＲの適用
次に、ＩＮＶＡＲをエクソーム配列決定データに適用して、非個別的配列決定データへのＩＮＶＡＲの一般化可能性を実証した。血漿エクソーム配列決定を、ステージＩＶの疾患を有する患者からの試料のサブセットに関して実行した。

エクソーム配列決定データに関しては、分子バーコードの使用が比較的頻繁ではない既存のエクソームデータにＩＮＶＡＲが適用され得るかを実証するために、分子バーコードを使用しなかった。ＩＮＶＡＲが多くの座位を標的とすることを考慮すると、目的のファミリーは複数のゲノム領域にわたって広がっており、したがって対立する内在性バーコードの尤度は低下する。この確率は、エクソーム配列決定によって取得された、座位当たりの減少した数のファミリーによってさらに低下する。ＨｉＳｅｑ４０００のレーン当たり３〜６つのエクソームライブラリをプールした（試料当たり６０〜１００Ｍ個のリード）。

腫瘍加重前および後のＭＲＤフィルタリングされた座位における変異リードの数を、２個の変異リード（１Ｆおよび１Ｒ）を必要とすることの有用性と、試験および対照試料からの変異リードファミリー間の加重の程度との両方を強調して図２０に示す。検出を腫瘍特異的加重後の全ての血漿試料において達成し、１名の患者において約５×１０^−５までのＡＦのｃｔＤＮＡの定量を可能にした（図２１）。したがって、ＩＮＶＡＲは、個別的配列決定パネルの事前の設計を伴わずに配列決定データに適用することができる。

［実施例１３］
非標的化ＩＮＶＡＲ
個々の座位を呼び出すことと対照的なトリヌクレオチドコンテキストにわたるシグナルの集計は、ＩＮＶＡＲがアプリオリな腫瘍知識を伴わない血漿配列決定データに潜在的に一般化されることを可能にする。このことは、腫瘍配列決定が利用可能でない患者における適用可能性を有し得るが、その代価は、真の変異シグナルに決して寄与し得ない座位の存在量に起因する、より低い感度、およびｃｔＤＮＡレベルを定量する低下した能力であると予期され得る。

初めに、上述の通り、ＴＡＰＡＳデータを使用し、２の最小ファミリーサイズを用いてエラー抑制を適用した。次に、データにおいて５０以上のリードファミリーを有する全ての塩基を同定し、それぞれにおける変異シグナルを各位置で決定した。

ｃｔＤＮＡのみから生じる変異シグナルに焦点を当てるために、公開エクソームにおける上位１００の頻繁に変異している遺伝子は、Ｓｈｙｒら（２０１４年；補足的方法）から同定された遺伝子のミトコンドリア染色体および反復変異ファミリーであったため、排除した（Ｓｈｙｒら、２０１４年）。

ＩＮＶＡＲを、十分なファミリーを有する全ての塩基にわたって添加希釈実験時に実行した。座位のブラックリストへの登録（すなわち、より高い座位特異的エラー率を有することを根拠としたある特定の座位のフィルター除去）後、およびＭＲＤフィルター（１Ｆ＋１ＲＭＲＤシグナルのみに関する）を適用した後、非標的化された方法におけるＩＮＶＡＲの使用に関する予備的証拠を示す（図２２）。

［実施例１４］
数千の変異した座位にわたるＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓによる、低負荷癌におけるｃｔＤＮＡの百万分率までのモニタリング

材料および方法
患者コホート。試料を、ＭｅｌＲｅｓｉｓｔ（ＲＥＣ１１／ＮＥ／０３１２）、ＡＶＡＳＴ−Ｍ（ＲＥＣ０７／Ｑ１６０６／１５、ＩＳＲＣＴＮ８１２６１３０６）^３０、およびＬＵＣＩＤ（ＲＥＣ１４／ＷＭ／１０７２）研究に登録された患者から収集した。研究に参加することへの同意は、調査に関して十分に訓練を受けたリサーチナース／専門看護師または臨床医によって得られた。ＭｅｌＲｅｓｉｓｔは、ステージＩＶの黒色腫を有する患者におけるＢＲＡＦ標的化療法および免疫療法を含む黒色腫の全身療法に対する応答および耐性機構の橋渡し研究である。ＡＶＡＳＴ−Ｍは、外科的処置後の再燃のリスクがあるステージＩＩＢ〜ＩＩＩの黒色腫を有する患者におけるベバシズマブの有効性を評価した無作為化対照臨床試験であり、観察群からの患者のみをこの分析のために選択した。ＬＵＣＩＤは、治癒的目的で根治処置（外科的処置または放射線療法＋／−化学療法）を受けることを予定しているステージＩ〜ＩＩＩＢの非小細胞肺癌患者（ＮＳＣＬＣ）の前向きおよび観察研究である。ＣａｍｂｒｉｄｇｅＣａｎｃｅｒＴｒｉａｌｓＵｎｉｔ−ＣａｎｃｅｒＴｈｅｍｅが全ての研究を統括し、患者背景および臨床成績を前向きに収集した。図４１はこの研究を経験する患者の流れをＲＥＭＡＲＫ図として示す。

試料収集および処理。処置前の新鮮凍結腫瘍生検を、ステージＩＶの皮膚黒色腫を有する患者から収集した。ホルマリン固定パラフィン包埋（ＦＦＰＥ）腫瘍組織を、ＡＶＡＳＴ−ＭおよびＬＵＣＩＤ（外科的処置から）臨床試験のために取得した。ＡＶＡＳＴ−Ｍ研究の患者に関して、血漿試料を腫瘍切除の１２週間以内に収集し、入手可能な場合は３か月後のその後の試料も収集した。ＬＵＣＩＤ研究の患者は、１つの血漿および適合バフィーコート試料を外科的処置前に採取された。経時的試料を、ステージＩＶの黒色腫を有する患者の処置中にＭｅｌＲｅｓｉｓｔ研究の一部として収集した。末梢血試料を各来院時にＳ−Ｍｏｎｏｖｅｔｔｅ９ｍＬＥＤＴＡチューブにおいて収集した。血漿収集に関して、試料を採血の１時間以内に１６００ｇで１０分間遠心分離して、次いで２０，０００ｇで１０分間の追加の遠心分離を実行した。全てのアリコートを−８０℃で保管した。

組織および血漿抽出および定量。ＦＦＰＥ試料を最大８μｍの切片に切断し、Ｈ＆Ｅ染色スライドを１つ生成し、病理組織学者によって腫瘍領域に関して輪郭抽出した。マーキングした腫瘍領域のマクロダイセクションを行い、ＤＮＡ抽出を、ヒートブロック上における５６℃での一晩のインキュベーションおよび５００ｒｐｍでの撹拌を除いては標準的なプロトコルを使用するＱＩＡａｍｐＤＮＡＦＦＰＥＴｉｓｓｕｅＫｉｔを使用して実施した。ＤＮＡを、各回２０μＬのＡＴＥ緩衝液を使用して最高速度の遠心分離で２回溶出した。抽出後、ＤＮＡ修復を、ＮＥＢＮｅｘｔ（登録商標）ＦＦＰＥＤＮＡＲｅｐａｉｒＭｉｘを製造業者のプロトコルに従って使用して実施した。新鮮凍結組織生検を最初に均質化した後で、ＤＮＡ抽出を以下のように実施した：最大３０ｍｇの各新鮮凍結組織生検試料を６００μＬのＲＬＴ緩衝液と組み合わせ、次いでＰｒｅｃｅｌｌｙｓＣＤ１４チューブ（ＢｅｒｔｉｎＴｅｃｈｎｏｌｏｇｉｅｓ）に入れ、５秒で区切られた２回の２０秒のバーストの間６，５００ｒｐｍで均質化した。その後、製造業者のプロトコルに従ったＱｉａｇｅｎＡｌｌＰｒｅｐ抽出キット。

ゲノムＤＮＡを最大１ｍＬの全血またはバフィーコートから、ＧｅｎｔｒａＰｕｒｅｇｅｎｅＢｌｏｏｄＫｉｔ（Ｑｉａｇｅｎ）を製造業者のプロトコルに従って使用して抽出した。試料を２ラウンドの７０μＬの緩衝液ＡＥに溶出し、３分間インキュベートした後に遠心分離した。最大４ｍＬの血漿を、ＱＩＡｓｙｍｐｈｏｎｙ（Ｑｉａｇｅｎ）をＱＩＡａｍｐプロトコルと共に使用して抽出した。ＤＮＡを９０μＬの溶出緩衝液に溶出し、−８０℃で保管した。血漿試料を、２〜４ｍＬＱＩＡａｍｐプロトコルを使用するＱＩＡｓｙｍｐｈｏｎｙ機器（Ｑｉａｇｅｎ）を使用して抽出した。各ＱＩＡｓｙｍｐｈｏｎｙバッチに関して、陽性および陰性対照を含む２４の試料を抽出した。

新鮮凍結ＦＦＰＥおよびゲノムＤＮＡの抽出後、溶出ＤＮＡ濃度を、ｄｓＤＮＡ広範囲アッセイに関してＱｕｂｉｔ蛍光光度計（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して定量した。血漿ＤＮＡ溶出液の無細胞ＤＮＡ濃度を定量するために、デジタルＰＣＲを、ハウスキーピング遺伝子ＲＰＰ３０（ＳｉｇｍａＡｌｄｒｉｃｈ）に関するＴａｑ−ｍａｎプローブを用いるＢｉｏｍａｒｋＨＤ（Ｆｌｕｉｄｉｇｍ）を使用して実行した。５５のＰＣＲサイクルを使用した。ＲＰＰ３０アッセイは６５ｂｐ長であった。溶出液１μＬ当たりの推定された数のＲＰＰ３０ＤＮＡコピーを使用して、元の試料における無細胞ＤＮＡ濃度を決定した。

腫瘍ライブラリ調製。ＦＦＰＥ腫瘍組織ＤＮＡ試料（最大１５０ｎｇ）およびバフィーコートＤＮＡ試料（７５ｎｇ）を、ＣｏｖａｒｉｓＬＥ２２０（Ｃｏｖａｒｉｓ、Ｍａｓｓａｃｈｕｓｅｔｔｓ、ＵＳＡ）を使用して１５０ｂｐの長さに剪断した。８ｍｉｃｒｏＴＵＢＥ−１５ＡＦＡＢｅａｄｓＳｔｒｉｐＶ２を使用する、１５０ｂｐの最終断片長および１５μｌの入力容量に関する標準的なＣｏｖａｒｉｓプロトコルを使用した。剪断後、断片化パターンを、バイオアナライザ（Ａｇｉｌｅｎｔ）を使用して検証した。

配列決定ライブラリを、ＴｈｒｕＰＬＥＸＤＮＡ−ｓｅｑキット（Ｒｕｂｉｃｏｎ）を使用して調製した。それぞれ１００ｎｇおよび５０ｎｇの剪断された腫瘍およびバフィーコートＤＮＡを使用して、プロトコルを製造業者の説明書に従って実行した。ライブラリ調製中の増幅サイクルの数を、製造業者の推奨に従って変動させた。ライブラリ濃度を、Ｉｌｌｕｍｉｎａ／ＲＯＸ低ライブラリ定量キット（Ｒｏｃｈｅ）を用いるｑＰＣＲを使用して決定した。ライブラリ断片サイズを、バイオアナライザ（Ａｇｉｌｅｎｔ）を使用して決定した。ライブラリ調製後、エクソーム捕捉を、ＴｒｕＳｅｑＥｘｏｍｅＬｉｂｒａｒｙＫｉｔ（Ｉｌｌｕｍｉｎａ）を用いて、４５Ｍｂｐエクソームベイトセットを使用して実施した。３つのライブラリを１回の捕捉反応において多重化し、２５０ｎｇの各ライブラリを入力として使用した。ＴｈｒｕＰＬＥＸライブラリとの適合性のために、プロトコルを、１μｌのｉ５およびｉ７ＴｒｕＳｅｑＨＴｘＧｅｎ汎用ブロッキングオリゴ（ＩＤＴ）を各ハイブリダイゼーションステップ中に添加することによって変更した。増加したハイブリダイゼーション容量を補償するために、ＣＴ３緩衝液の容量を５１μＬに調整した。２ラウンドのハイブリダイゼーションを実行し、それぞれ２４時間続いた。ライブラリＱＣを、上記のようにｑＰＣＲおよびバイオアナライザを使用して実施した。試料を多重化し、ＨｉＳｅｑ４０００（Ｉｌｌｕｍｉｎａ）を用いて配列決定した。新鮮凍結腫瘍生検および適合バフィーコートライブラリ調製を、ＳｕｒｅＳｅｌｅｃｔＸＴＨｕｍａｎＡｌｌＥｘｏｎ５０Ｍｂ（Ａｇｉｌｅｎｔ）ベイトセットを使用して、Ｖａｒｅｌａら^３１によって記載されているように実施した。試料を多重化し、ＨｉＳｅｑ２０００（Ｉｌｌｕｍｉｎａ）を用いて配列決定した。

腫瘍変異呼び出し。新鮮凍結腫瘍生検に関して、変異呼び出しをＶａｒｅｌａら^３１によって記載されているように実施した。ＦＦＰＥ腫瘍生検に関して、変異呼び出しを、Ｍｕｔｅｃｔ２を初期設定で用いて実施した：−−ｃｏｓｍｉｃｖ７７／ｃｏｓｍｉｃ．ｖｃｆおよび−−ｄｂｓｎｐｖ１４７／ｄｂｓｎｐ．ｖｃｆ。保持された変異の数を最大化するために、Ｍｕｔｅｃｔ２の通過（ＬＵＣＩＤおよびＡＶＡＳＴ−Ｍ試料）または腫瘍ＬＯＤ＞５．３を達成したバリアントを保持した（ＡＶＡＳＴ−Ｍ試料）。変異コールを以下のようにフィルタリングした：
１．バフィーコート変異アレル割合が０に等しい
２．変異が相同領域に存在しない
３．変異が複アレル座位に存在しない
４．１０００ＧｅｎｏｍｅｓＡＬＬおよびＥＵＲ頻度が０に等しい
５．最小固有腫瘍深度が５。
加えて、黒色腫コホートにおけるＦＦＰＥデータに関して、Ｃｏｓｔｅｌｌｏら^３２によって提唱されたＣ／Ａエラーに関するフィルターを適用してＣ／Ａアーチファクトを抑制した。結果として、ステージＩＩ〜ＩＶの黒色腫およびステージＩ〜ＩＩＩＡの肺癌を有する６４名の患者に関する患者特異的変異リストを生成した。黒色腫および肺癌を有する患者当たりそれぞれ中央値で６２５（ＩＱＲ４１１〜１０７６）および３８８（ＩＱＲ２３０〜６００）の患者特異的変異を同定した（図３１）。これらの変異リストは、カスタム捕捉配列決定パネルを設計するためにも、ＩＮＶＡＲ方法に関する入力としても使用した。

血漿ライブラリ調製。必要な場合、無細胞ＤＮＡ試料を、ライブラリ調製前にＳｐｅｅｄＶａｃ（ＴｈｅｍｏＦｉｓｈｅｒ）を使用して３０℃で真空濃縮した。ライブラリへの入力中央値は１６５２の一倍体ゲノムであった（ＩＱＲ９００〜３０１３）。血漿無細胞ＤＮＡに関する全ゲノムライブラリ調製を、ＲｕｂｉｃｏｎＴｈｒｕＰＬＥＸＴａｇ−Ｓｅｑキットを使用して実施した。ＴｈｒｕＰＬＥＸプロトコル中のＰＣＲ増幅サイクルの数を、製造業者によって推奨されるように、７〜１５サイクルの間で変動させた。増幅および試料バーコード化後、ライブラリを、ＡＭＰｕｒｅＸＰビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を１：１の比で使用して精製した。ライブラリ濃度を、Ｉｌｌｕｍｉｎａ／ＲＯＸ低ライブラリ定量キット（Ｒｏｃｈｅ）を使用して決定した。ライブラリ断片サイズを、バイオアナライザ（Ａｇｉｌｅｎｔ）を使用して決定した。

ステージＩＶの黒色腫コホートに関して、ライブラリ調製および配列決定を２連で実行して、コンピュータによる実験的方法の技術的再現性を評価し、ＩＮＶＡＲパイプラインによって生成されたＩＭＡＦ値間で０．９７の相関を示した（ピアソンのｒ、ｐ値＜２．２×１０^−１６）。初期コホートに関して、入力無細胞ＤＮＡ材料を分割せず、代わりに時点当たりの単一試料として調製および配列決定した。

カスタムハイブリッド捕捉パネル設計および血漿配列決定。変異呼び出し後、カスタムハイブリッド捕捉配列決定パネルを、ＡｇｉｌｅｎｔＳｕｒｅＤｅｓｉｇｎソフトウェアを使用して設計した。５から２０名の間の患者を、この実装形態においてパネル当たりでまとめてグループ化した。ベイトを、黒色腫患者に関しては４〜５ｘの密度およびバランス調整したブースティング、肺癌患者に関しては１ｘの密度およびバランス調整したブースティングで設計した。９５．５％のバリアントは成功裏に設計されたベイトを有し、ベイト設計は失敗した座位に関して再びは試みられなかった。カスタムパネルは、１．２６〜２．１４Ｍｂの間のサイズの範囲であり、１２０ｂｐのＲＮＡベイトを有した。各パネルに関して、変異クラスおよび腫瘍アレル割合を図３１に示す。

ライブラリを、ＴｈｒｕＰＬＥＸライブラリとの適合性のために製造業者によって推奨されるように^３３、ｉ５およびｉ７ブロッキングオリゴ（ＩＤＴ）の添加を含むＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔＸＴプロトコルを使用して、単一または３重のいずれかにおいて（総計１０００ｎｇの捕捉入力まで）捕捉した。カスタムＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔＸＴベイトを、１３サイクルの捕捉後増幅に関して使用した。捕捉後ライブラリを、ＡＭＰｕｒｅＸＰビーズを１：１．８の比で用いて精製し、次いで定量し、ライブラリ断片サイズを、バイオアナライザ（Ａｇｉｌｅｎｔ）を使用して決定した。

血漿のエクソーム捕捉配列決定。血漿のエクソーム配列決定に関して、ＩｌｌｕｍｉｎａＴｒｕＳｅｑＥｘｏｍｅ捕捉プロトコルに従った。ＲｕｂｉｃｏｎＴｈｒｕＰＬＥＸプロトコルを使用して（上記のように）生成されたライブラリを、各ライブラリに関して２５０ｎｇの入力で３重にプールした。ライブラリは、ＴｈｒｕＰＬＥＸライブラリとの適合性のために製造業者によって推奨されるように、ｉ５およびｉ７ブロッキングオリゴ（ＩＤＴ）の添加を含むプロトコルに従って、２ラウンドのハイブリダイゼーションおよび捕捉を受けた。標的エンリッチメント後、産物を、８ラウンドのＰＣＲを用いて増幅し、ＡＭＰｕｒｅＸＰビーズを使用して精製した後にＱＣを行った。

血漿配列決定データ処理。Ｃｕｔａｄａｐｔｖ１．９．１を使用して、アダプター配列の別個のＦＡＳＴＡにおいて指定された既知の５’および３’アダプター配列を取り除いた。トリミングしたＦＡＳＴＱファイルを、１９のシード長を用いるＢＷＡ−ｍｅｍｖ０．７．１３を使用してＵＣＳＣｈｇ１９ゲノムに対してアラインメントした。エラー抑制を、ＴｈｒｕＰＬＥＸＴａｇ−ｓｅｑライブラリＢＡＭファイルに関して、ＣＯＮＮＯＲ^３４を使用して実行した。コンセンサス頻度閾値−ｆを０．９（９０％）として設定し、最小ファミリーサイズ閾値−ｓをエラー率の特性解析のために２から５の間で変動させた。カスタム捕捉およびエクソーム配列決定データに関しては、２の最小ファミリーサイズを使用した。ｓＷＧＳおよび血斑分析に関しては、１の最小ファミリーサイズを使用した。

複数の時点にわたるシグナルを活用するために、エラー抑制されたＢＡＭファイルを、「ｓａｍｔｏｏｌｓｖｉｅｗ −ｕｂＳ−｜ｓａｍｔｏｏｌｓｓｏｒｔ−」を使用して組み合わせた後にさらなるデータ処理を行うことができる。試料が外科的処置後３か月時点と６か月時点の両方で入手可能であった初期黒色腫コホート（ＡＶＡＳＴ−Ｍ）では、ＢＡＭファイルを結合した後に分析を行った。

血漿の低深度全ゲノム配列決定。ＷＧＳに関して、ＨｉＳｅｑ４０００のレーン当たり３０のライブラリを配列決定して、試料当たり中央値で０．６×の重複排除カバレッジを達成した。これらのライブラリに関して、有益なリード（ＩＲ）の数は、バックグラウンドエラーが限定するようになり得る前に感度を限定し得るため、この特定の環境に関して１のファミリーサイズを用いるエラー抑制を使用した。トリヌクレオチド当たりのエラー率を、１のファミリーサイズに関するＷＧＳデータとカスタムハイブリッド捕捉配列決定データとの間で比較し、０．９１のピアソンｒを示した。ＷＧＳデータは、座位における最小深度を１に設定したこと、およびシグナルを有する座位対シグナルを有しない座位は０または１のアレル割合をもたらし得るのみであるため、０．６ｘの深度を考慮して患者特異的外れ値抑制（補足的方法）を使用しなかったことを除いて、データ処理（補足的方法）を受けた。

乾燥血斑からの無細胞ＤＮＡ抽出。５０μｌの新鮮（または解凍した凍結）全血をＭｅｌＲｅｓｉｓｔ研究の患者から、Ｗｈａｔｍａｎ（商標）ＦＴＡ（商標）クラシックカード上に収集し、風乾させた。５０μｌの新鮮全血を、屠殺直後の卵巣癌異種移植マウスモデルから取得し、Ｗｈａｔｍａｎ（商標）ＦＴＡ（商標）クラシックカードを同様に適用し、風乾させた。血斑カード試料を、再密封可能なプラスチックバッグ内に室温で保管した。ＤＮＡを、新生児における遺伝性の遺伝子状態に関するｇＤＮＡからの評価のために従来使用される、ＦＴＡおよびＧｕｔｈｒｉｅカードに関する製造業者の推奨される抽出プロトコルを使用するＱＩＡａｍｐＤＮＡＩｎｖｅｓｔｉｇａｔｏｒキットを使用して、カードから抽出した。３つの３ｍｍのパンチ穴を血斑から作製し、キャリアＲＮＡを製造業者の推奨に従って緩衝液ＡＬに添加した。血斑ＤＮＡ（無細胞ＤＮＡとｇＤＮＡの両方を含有すると仮説を立てた）を２５μｌの水に溶出し、膜に再適用し、再溶出した。

血斑無細胞ＤＮＡのサイズ選択およびライブラリ調製。血斑ＤＮＡ溶出液は、広いバックグラウンドのｇＤＮＡにおいて低い濃度の無細胞ＤＮＡを含有する（図４０ａ）。多量の長い断片は、任意の無細胞ＤＮＡ断片がアダプター分子で成功裏にライゲートされ、増幅する尤度を低下させるため、無細胞ＤＮＡライブラリ調製は、そのような試料から効果的に実施することができない。１〜１０ｋｂ超のｇＤＮＡ長に関する本発明者らの特性解析（図４０ａ）、および無細胞ＤＮＡが約１６６ｂｐである^３５という事実に基づいて、サイズ選択を実施して汚染ｇＤＮＡ断片を取り除くことを選択した。

右側サイズ選択を、ライブラリ調製前のＤＮＡ溶出液に関して、ＡＭＰｕｒｅＸＰビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を使用して実施し、長いｇＤＮＡ断片を取り除いた。この目的のために、次世代配列決定前のＤＮＡライブラリサイズ選択のために従来使用される、右側サイズ選択に関する公開されているプロトコル^３６を改変した。無細胞ＤＮＡ断片サイズに関するビーズ：試料比の最適化後、１：１のビーズ：試料比を使用して、汚染ｇＤＮＡを取り除いた。上清を右側選択プロトコルの一部として保持した。第２のサイズ選択ステップは、３：１のビーズ：試料比を使用して残りの全ての断片を捕捉し、サイズ選択されたＤＮＡを２０μｌの水に溶出した。血斑溶出液を、真空濃縮装置（ＳｐｅｅｄＶａｃ）を使用して１０ｕｌ容量に濃縮した。次に、ＲｕｂｉｃｏｎＴａｇ−Ｓｅｑライブラリ調製を実行し、ライブラリはバイオアナライザ（Ａｇｉｌｅｎｔ）およびｑＰＣＲ（上に記載したように）を使用したＱＣを受けた。ライブラリに対してＨｉＳｅｑ４０００（Ｉｌｌｕｍｉｎａ）で全ゲノム配列決定を行い、ＩＮＶＡＲ分析パイプラインを使用した（補足的方法）。

切除されたステージＩＩ〜ＩＩＩの黒色腫のコホートに関する生存分析。ＡＶＡＳＴ−Ｍ臨床試験の無作為化の日から最初の再発の日まで、または死亡日までの無疾患期間（ＤＦＩ）および全生存期間をそれぞれ算出した^９。カプラン・マイヤー分析を使用して、検出されたｃｔＤＮＡレベルを有する患者対検出されなかったｃｔＤＮＡレベルを有する患者におけるＤＦＩとＯＳとの間の差に関する生存曲線を生成し、コックス比例ハザードモデルを使用して比較して、ハザード比および９５％ＣＩを取得した。

撮像。ＣＴ撮像を標準治療の一部としてステージＩＶの黒色腫コホートの各患者から獲得し、後ろ向きに検査した。スライス厚は全ての症例において５ｍｍであった。約５ｍｍを超える非常に大きな直径を有する全ての病変は、熟練した操作者によって、放射線科医の指導の下、ＭＡＴＬＡＢ（Ｍａｔｈｗｏｒｋｓ、Ｎａｔｉｃｋ、ＭＡ）で書かれたカスタムソフトウェアを使用してＣＴ画像上でスライスごとに輪郭抽出された。その後、輪郭を処理のためにＮｉｆＴＩ形式でＬＩＦＥｘソフトウェア^３７にインポートした。次いで腫瘍体積をＬＩＦＥｘによって、テクスチャに基づく処理モジュールからの出力パラメータとして報告した。

結果
循環腫瘍ＤＮＡ（ｃｔＤＮＡ）は、複数のコピーが存在する場合は血漿において堅牢に検出することができるが、試料が数コピーの腫瘍ＤＮＡを有する場合は、個々の変異座位の分析が、アッセイが完全な分析性能を有する場合であっても、サンプリングノイズのために結果として偽陰性となる可能性がある（図２３ａ）。血漿における低量のｃｔＤＮＡは、サンプリングの限定のために入力材料がほとんど存在しない場合、または初期癌を有する患者^１、もしくは処置を受けている全てのステージの患者^１、２等、より大量の血漿が存在するが、血漿において非常に低い腫瘍負荷が存在する場合に生じ得る（図２９）。配列決定エラーは検出をさらに限定し得る。感度を改善するために、複数の研究は、複数の血液チューブからのより大容量の血漿を分析した^３、４、および／または１８〜５０７の遺伝子（２ｋｂ〜２Ｍｂのゲノム）を包含する配列決定パネルを使用した。最大３２の患者特異的変異（組織分析を介して予め同定された）の血漿における分析は、非小細胞肺癌（ＮＳＣＬＣ）を有する患者において２５，０００コピー当たり１個の変異分子のレベルまでの検出を達成した^５。ｃｔＤＮＡは、ステージＩのＮＳＣＬＣを有する患者の５０％未満において^６、７、および肺腺癌腫症例のわずか１９％において^６検出された。外科的処置を受けて後に再燃した初期患者では、ｃｔＤＮＡは、およそ５０％の乳癌または結腸直腸癌患者^４、８、ただしわずか１５％の黒色腫患者^９において外科的処置後に検出された。しかしながら、感度は原則として、より低量のｃｔＤＮＡを検出するために、分析される変異の数を増加させることによってさらに増加させることができる。

ｃｔＤＮＡの検出は、本発明者らが分析された一倍体ゲノム（ｈＧＡ）の数として定量するＤＮＡの量によって限定される。配列決定データの観点から見れば、ｈＧＡは平均固有配列決定カバレッジと等価である。浅い全ゲノム配列決定（ｓＷＧＳ）等の方法では、多くの場合ＤＮＡの１未満のｈＧＡが分析され（１×未満のカバレッジ）、これは多くの場合ナノグラム（ｎｇ）量のＤＮＡから生成されるが、原則としてはピコグラムのＤＮＡから生成することができる。他の方法は、ＤＮＡ入力が数ｎｇ以下である場合に同じ分子の重複リードを表し得る何千倍もの配列決定深度を生成する。分析感度の別の決定因子は、腫瘍により変異した分析される座位の数である^{２、５〜７}。ｃｔＤＮＡを検出することに関する感度は、本発明者らが患者特異的変異を有する座位を包含する全てのリードの合計として定義する「有益なリード」（ＩＲ）の総数によって限定される。これは、変異の数と平均固有深度（変異した座位にわたる）との積と等価である。したがって、これら２つの変数を二次元空間にプロットする（図２３ｂ）。同じＩＲは、二次元の異なる組合せから生成してもよい。例えば、１０^５個のＩＲは１０，０００のｈＧＡおよび１０の変異した座位（患者当たり数個の腫瘍変異を包含するパネルのディープ配列決定）から取得しても、１０のｈＧＡにおいて分析される１０，０００の座位（限定された入力または配列決定深度）から取得してもよい。これらの変異の一部はサブクローン事象またはパッセンジャー事象である可能性が高いが、本発明者らは、数多くの変異を分析することによって、これは個々の変異シグナルの喪失を補償し得ると仮説を立てた。１０^−５のｃｔＤＮＡ割合を有する試料において、１０^５個のＩＲにわたって単一の変異リードを観察することは、二項統計量に基づいて０．６３の確率を有し得るが、これは５×１０^５個のＩＲを用いて０．９９まで増加し、サンプリングされる分子と達成可能な最大感度との間の関係を強調する。

患者当たりの数多くの変異から情報を取得するために、血漿ＤＮＡを、カスタム捕捉パネル、全エクソーム配列決定（ＷＥＳ）、または全ゲノム配列決定（ＷＧＳ）を使用して配列決定した。配列決定データを分析することにおいて、ｃｔＤＮＡ検出アルゴリズムはこれまで、限定された情報を非効率的に使用する、すなわち、変異呼び出し閾値を超えない任意のシグナルが廃棄され失われる、個々の変異の同定に依存していた^{３、６、１０}。複数の研究は、移植された器官^１１または希釈された腫瘍ＤＮＡ^５からのＤＮＡを検出するために複数の座位にわたってシグナルを集計することの潜在的利点を強調している。癌モニタリングにおいて、患者当たり複数の変異がこれまでに分析されているが^{３、５、６、１２、１３}、検出は各変異に関して別個に実施された。血漿からの配列決定情報を効率的に使用するために、本発明者らはＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓ（ＩＮＶＡＲ）を開発した。ＩＮＶＡＲは、腫瘍配列決定からの事前情報を使用して、分析を導き、患者の癌における１０^２〜１０^４の変異した座位にわたってシグナルを集計する（図２３ｃ）。変異リストは患者特異的であり、したがって、他の患者からの試料は、その患者の腫瘍配列決定データにおいて見出されないことを各変異に関して確認した後でバックグラウンドシグナル率を算出するために使用する（図２３ｄ）。健康な個体からの追加の試料を対照として使用して特異度を評価した（図３０ａ）。ＩＮＶＡＲは、患者の腫瘍におけるトリヌクレオチドエラー率、ｃｔＤＮＡ断片長パターン、および各変異のアレル割合を含む、ｃｔＤＮＡ配列決定の生物学的および技術的特徴を検討する（図３０ｂにおける流れ図）。ｃｔＤＮＡは、各座位における変異を呼び出すことを試みるのではなく集計で検出されるため、ＩＮＶＡＲはまた、低い配列決定深度（１×未満の固有カバレッジ）を有するデータ、および入力材料が限定される場合のデータからのｃｔＤＮＡを検出することもできる。

患者特異的変異を同定するために、ステージＩＩ〜ＩＶの黒色腫を有する４５名の患者およびステージＩ〜ＩＩＩＡのＮＳＣＬＣを有する１９名の患者の腫瘍配列決定を実施した。腫瘍変異を同定した後（方法）、黒色腫を有する患者当たり中央値で６２５の変異（ＩＱＲ４１１〜１０７６）、およびステージＩ〜ＩＩＩＡのＮＳＣＬＣを有する患者当たり中央値で３８８の変異（ＩＱＲ２３０〜６００）からなる患者特異的変異リストを生成した（図３１）。これらのリストをＩＮＶＡＲに関する入力として使用して、カスタム捕捉配列決定パネル（２，３０１ｘの平均生深度）、ＷＥＳ（２３８ｘの深度）およびｓＷＧＳ（０．６ｘの深度）を使用して生成された血漿配列決定データに適用した。

１４．１バックグラウンドノイズ低減およびシグナル統合
入力（ｈＧＡ）または分析される変異のいずれかを増加させることによって有益なリードの数を増加することは、サンプリングエラーを解決する。高いＩＲにおける偽陽性検出の尤度を低下させるために、バックグラウンドエラーはＩＲの逆数未満でなければならない。ＩＮＶＡＲワークフロー（図２４ａ）の一部として、内在性または外在性固有分子識別子^１４（ＵＭＩ）に基づいてリードコラプシングすること、順方向リードと逆方向リードの両方によって支持されないシグナルを排除すること、異なる変異コンテキストに関するエラー率を評価する特注のエラーモデルを使用すること、その試料における残りの患者特異的変異シグナルの分布と一致しない座位における外れ値ノイズを抑制すること、すなわち「外れ値抑制」によって、バックグラウンドエラー率を低下させた（図３２〜３４、補足的方法）。このことは、結果として異なるトリヌクレオチドコンテキストにわたって平均して１３１分の１に低下したバックグラウンドエラー率をもたらした（図２４ｂ、図２４ｃ）。

以前の研究は、腫瘍アレル割合と血漿アレル割合との間の関係を示しているだけでなく^{１３、１５}、変異無細胞ＤＮＡ断片と野生型無細胞ＤＮＡ断片との間のサイズ差も示している^{１６〜１８}。配列決定情報を効果的に使用するために、ＩＮＶＡＲは、ｃｔＤＮＡ断片サイズおよび各変異座位の腫瘍アレル割合に基づいて加重する確率によりｃｔＤＮＡシグナルをエンリッチする（図２４ｄ、図３５、方法）。このことは、患者特異的変異リストにおける座位のそれぞれに関する有意水準を生成し、有意水準は組み合わされて集計尤度関数となる。非適合変異リストを使用した患者の血漿ＤＮＡからの配列決定データ（図２３ｃ）は、各コホートのｃｔＤＮＡ検出に関する尤度閾値を選択するための受信者操作特性（ＲＯＣ）曲線分析のための陰性対照として使用する（方法、図３６）。健康な個体からの配列決定データは、この閾値における偽陽性検出を評価するために使用する（図３０ａ）。統合変異アレル割合（ＩＭＡＦ）は、その試料における患者特異的座位にわたるバックグラウンド減算深度加重平均アレル割合を取ることによって決定する（補足的方法）。

１４．２陽性および陰性対照における分析性能
ＩＮＶＡＲの分析性能を、２名の健康な対照ボランティアからの血漿に、３．６×１０^−７と低い予期されたＩＭＡＦまで希釈され、２連で分析された、エクソーム配列決定によって５，０７３の変異を同定した（補足的方法）１名の黒色腫患者（ステージＩＶ）からの血漿の希釈系列において、カスタム捕捉パネルからの配列決定の分析によって評価した。エラー抑制を用いない場合、０．８５超の分析的特異度で検出された最低希釈倍率（方法）は、３．６×１０^−５の予期されたｃｔＤＮＡ濃度を有した。この濃度において、２／２の複製物は４．７×１０^−５の平均ＩＭＡＦで検出された（図２４ｅ）。エラー抑制およびサイズ加重後、１つを除く全ての試料は０．９５超の分析的特異度で検出された。３．６×１０^−６（３．６百万分率、ｐｐｍ）の予期されたＩＭＡＦまで希釈された両方の複製物は、４．３および５．２ｐｐｍのＩＭＡＦ値で検出された。予期された３．６×１０^−７まで希釈された３つの複製物のうち、２つは３．９ｐｐｍおよび１．３ｐｐｍの測定されたＩＭＡＦ値で検出された（それぞれ３．１６×１０^６および２．４４×１０^６個のＩＲを有した）。第３の試料は低いＩＲ（３７０，３８１）を有し、変異リードは観察されず、多くのＩＲが低いｃｔＤＮＡ濃度を検出するために必要であることを強調した。対照的に、検出の限界の近くに数個の変異リードで検出されたｃｔＤＮＡ（例えば上記の例）は、成功バイアスに起因して人工的に増大されたＩＭＡＦを示す場合がある。

ＩＭＡＦと予期された変異割合との間の相関は０．９８であった（ピアソンのｒ、ｐ＜２．２×１０^−１６、図２４ｅ）。癌患者からの添加ＤＮＡを含まない場合、変異リードは、総計６，３２８，４１０個のＩＲにおける、これらの健康な個体からのＤＮＡの１１の複製物にわたって観察されなかった（図２４ｅ）。エラー抑制およびサイズ加重を用いずに分析された同じ配列決定データでは、ｃｔＤＮＡの偽陽性検出が、添加ＤＮＡを含まない３つの試料において観察された（図２４ｅ）。配列決定データを、患者特異的変異リストのサブセットのみを含むようにｉｎｓｉｌｉｃｏでダウンサンプリングして、より多くの変異は結果としてより多いＩＲ、およびそれに応じてより高いｃｔＤＮＡ検出率をもたらすことを確認した（図２４ｆ、補足的方法）。

患者の血漿ＤＮＡからの配列決定データを使用した分析的特異度を、非適合変異リストを使用して定義した（図２３ｃ）。これは９８．０％の特異度中央値をもたらした（図３６）。このことを確認するために、患者特異的変異リストのそれぞれを使用して、健康な個体からの試料に関するカスタム捕捉配列決定およびＩＮＶＡＲ分析を実行した（図３０ａ）。２６名の健康な個体からの血漿ＤＮＡの４つの分析結果にわたって、９７．０５％という特異度の値の中央値が取得され、これは予期された分析的特異度と適合した（図３６）。

１４．３癌患者の血漿においてｃｔＤＮＡを検出するためのＩＮＶＡＲの適用
ＩＮＶＡＲを、４７名のステージＩＩ〜ＩＶの黒色腫患者由来の１２５の血漿試料、および１９名のステージＩ〜ＩＩＩＡのＮＳＣＬＣ患者由来の１９の血漿試料からカスタム捕捉パネルを使用して生成された配列決定データに適用した。黒色腫を有する患者当たり中央値で６２５の変異、およびステージＩ〜ＩＩＩＡのＮＳＣＬＣを有する患者当たり中央値で３８８の変異を分析し、結果として試料当たり最大２．９×１０^６個のＩＲ（中央値１．７×１０^５個のＩＲ）を生じ、したがって個々のまたはより少ない座位を分析する方法と比べて桁違いに多い無細胞ＤＮＡ断片を分析した（図２５ａ）。同じ入力ＤＮＡおよび配列決定データを使用した場合、最も高い深度を有する２０の変異座位の分析は、結果としてほぼ全ての試料に関して２０，０００個未満のＩＲを生じ得たが、大きな変異リストの使用は大半の試料に関して２０，０００から１０^６個のＩＲを生成した（図２５ｂ）。

少数の試料は、２０，０００個未満のＩＲを有し、したがってＩＮＶＡＲが原則として生じることができる高い感度を達成しなかった。将来の診療においてＩＮＶＡＲを実装する場合、本発明者らは、ｃｔＤＮＡが低いＩＲで検出されないような症例は、技術的不成功と定義され、より大きなＤＮＡ入力／より多くの配列決定を用いて、またはＷＧＳ等のより広い規模の配列決定によるその患者からの腫瘍および正常ＤＮＡの再分析によって反復され得ることを示唆する（図２５ｃ）。本発明者らの研究では、１４４の試料のうち６つは、ｃｔＤＮＡが２０，０００個未満のＩＲで検出されず（図２５ｄ）、下に記載される検出統計量において技術的失敗として示される。より大きい感度が所望される場合、ＩＲに関するより高い閾値が選択されてもよく、さらなる１１の試料は、ｃｔＤＮＡが６６，６６６個未満のＩＲで検出されなかった（図２５ｄ）。ＩＮＶＡＲの現行の実装では、陽性検出は少なくとも２個の変異リード（全てのＩＲにわたって）を必要とし、したがって、９５．８％の試料は、ｃｔＤＮＡが検出されたか、または０．０１％未満（２０，０００個超のＩＲにわたって２個未満の変異リード）であると決定された。８８．２％は、ｃｔＤＮＡが検出されたか、または０．００３％未満（６６，６６６個超のＩＲにわたって２個未満の変異リード）であると決定された。

対照的に、少数の症例は１０^６個超のＩＲを達成し、比類のない感度ならびに２．９および６．５ｐｐｍのレベルにおけるｃｔＤＮＡの検出をもたらした（図２５ｄ）。患者特異的変異リストが各患者からの腫瘍および正常ＤＮＡ試料のＷＥＳではなくＷＧＳによって生成され得る場合、本発明者らは、このレベルの感度は黒色腫またはＮＳＣＬＣのこれらの症例の大多数に関して到達され得ると予期する（図２５ｂ）。

１４．４百万分率までのｃｔＤＮＡモニタリングおよび細胞のゲノムの割合
ｃｔＤＮＡを検出し、ＩＭＡＦ値によって示されるそのレベルを定量したところ、２．５×１０^−６〜０．２５の範囲であった（図２５ｄおよび２５ｅ）。これは１０万倍の動的範囲、およびゲノムの１６３８コピーの入力材料中央値（５．４６ｎｇのＤＮＡ）からの、癌患者由来の血漿試料における微小レベルのｃｔＤＮＡの数ｐｐｍ範囲までの検出を確認した（図２６ａ）。１４４の分析された血漿試料のうち総計１７において、ｃｔＤＮＡは、その患者の腫瘍のために変異していることが既知である座位の１％未満においてシグナルと共に検出され、これらの試料が単一の腫瘍細胞のごく小さな割合のゲノムを含有することを示した（図２６ｂ）。検出された変異の最低割合は１／７１４であり、５フェムトグラム未満の腫瘍ＤＮＡと等価であった。限定された入力であることを考慮すると、検出された低いｃｔＤＮＡレベルは、４８％の症例において完全な単一座位アッセイに関する９５％の検出の限界未満であり得る（図２６ｂ、図３７ａ）。

転移性黒色腫を有する患者において、ＩＭＡＦは、撮像と０．８の相関（ピアソンのｒ、Ｐ＝６．７×１０^−１０、図３７ｂ）、および血清乳酸脱水素酵素（ＬＤＨ）と０．５３の相関（ピアソンのｒ、Ｐ＝２．８×１０^−４、図３７ｃ）を示した。ＩＮＶＡＲ分析を使用して、処置に対する応答におけるｃｔＤＮＡ動力学をモニタリングした（図３７ｄ）。黒色腫に関する標的化療法および免疫療法を用いて連続的に処置された１名の患者において、ｃｔＤＮＡは２．５ｐｐｍのＩＭＡＦで検出され、腫瘍体積はその時点で１．３ｃｍ^３であった（図２５ｅ）。他の研究^６、１９と比べて、ＩＮＶＡＲは腫瘍体積とＩＭＡＦとの間により急な勾配を示し、この勾配はＩＮＶＡＲを用いて検出可能なより低いＩＭＡＦを反映し得る（図３７ｂ）。

１４．５初期ＮＳＣＬＣにおけるｃｔＤＮＡ検出
新しく診断されたステージＩ〜ＩＩＩＡのＮＳＣＬＣを有する１９名の患者（ステージＩ／ＩＩ／ＩＩＩＡを有するそれぞれ１１名、６名、および２名の患者からなる）から処置前に収集した血漿試料において、ＩＮＶＡＲによるｃｔＤＮＡ検出を試験した。２つの試料では、ｃｔＤＮＡは検出されなかったが、適合組織のＷＥＳにおいて同定された少数の変異（各症例において５９および９３）のため、２０，０００個未満のＩＲを分析した（図２５ｄ）。これらの２名の患者を排除した場合（図２５ｃを参照のこと）、有益なリードの数の中央値は７．２×１０^４であった（ＩＱＲ３．９〜１０．３×１０^４）。ｃｔＤＮＡは、１７名の患者のうち１２名において検出され（０．９８超の分析的特異度、図３６）（図２６ａ、図２６ｃ）、１／５名のステージＩＡを有する患者、４／５名のステージＩＢを有する患者、５／５名のステージＩＩを有する患者、および２／２名のステージＩＩＩ疾患を有する患者を含んだ（図３８ａおよび３８ｂ）。１０名のステージＩＡおよびＩＢ患者のうちの９名は腺癌腫の組織学的亜型を有し、これは他の方法を使用して検出することがこれまで困難であった^６。コホートにわたって、ＲＯＣ分析を、ＩＮＶＡＲによって生成された尤度比に適用し（補足的方法）、ステージＩのみ、ステージＩ〜ＩＩＩＡ、およびステージＩＩ〜ＩＩＩＡのみに関してそれぞれ０．７３、０．８２、および０．９３の曲線下面積（ＡＵＣ）値を得た（図２６ｄ）。０．００３％の感度に達しなかった患者を排除した場合（６６，６６６個未満のＩＲ、図２５ｄ）、ｃｔＤＮＡは、１４の試料のうち１２において検出され、１／２名のステージＩＡを有する患者、４／５名のステージＩＢを有する患者、５／５名のステージＩＩを有する患者、および２／２名のステージＩＩＩ疾患を有する患者を含んだ。

１４．６ＩＮＶＡＲによる微小残存病変の検出
ＩＮＶＡＲを残存疾患環境において試験するために、治癒的目的の外科的処置の最大６か月後に収集した、ＵＫＡＶＡＳＴ−Ｍ臨床試験において募集された切除されたステージＩＩ〜ＩＩＩの黒色腫を有する３８名の患者からの試料を分析した（図３８ｃ）。中央値で３．６×１０^５個のＩＲ（ＩＱＲ０．６４×１０^５〜４．０３×１０^５）を探査し、ｃｔＤＮＡを２．８５ｐｐｍの最小ＩＭＡＦまで検出した（０．９８超の分析的特異度、図３６）。５名の患者は未検出のｃｔＤＮＡおよび２０，０００個未満のＩＲを有し、排除した（図２５ｄ）。３３名の評価可能な患者のうち、ｃｔＤＮＡは、５０％の後に再発した患者において検出され、有意により短い無疾患期間（４．５か月対５年の追跡期間で中央値未到達；ハザード比（ＨＲ）＝３．６９；９５％ＣＩ１．４４〜９．４６、Ｐ＝０．００７；図２６ｄ）および全生存期間（２．６年対中央値未到達、図３８ｄ）と関連した。同じ臨床試験からの切除されたＢＲＡＦまたはＮＲＡＳ変異黒色腫を有する１６１名の患者からの血漿ＤＮＡの単一座位デジタルＰＣＲアッセイを使用する以前の分析では、ｃｔＤＮＡは１５．６％の後に再燃した患者のみにおいて検出された^９。

１４．７多様なＩＲを用いた検出率の評価
臨床試料からのＩＭＡＦ値を使用して、限定された数のＩＲを有する患者の異なるコホートに関する予期された検出率を推定し、線形モデルを適合させて（Ｒ^２＝０．９５）、異なる検出率を達成するために必要とされ得るＩＲを予測した。ベースライン時点におけるステージＩＶの黒色腫患者では、ｃｔＤＮＡは１０^５個のＩＲを使用して、１００％の症例において検出された（図２６ｅ）。ｃｔＤＮＡレベルがより低い、処置を受けているステージＩＶの黒色腫を有する患者では、線形適合からの外挿は、１０^６〜１０^７個のＩＲがほぼ全ての試料においてｃｔＤＮＡの検出を可能にし得ることを予測した（図３８ｅ）。初期ＮＳＣＬＣを有する患者では、本発明者らは、１０^７個のＩＲを各試料に関して配列決定した場合、ほぼ全ての患者においてｃｔＤＮＡを検出することが可能であり得ることを示唆する。試料当たり１０^７個超のＩＲに到達することは、配列決定費用、必要とされる入力ＤＮＡの量、および標的化される必要がある変異の数の全ての点で限定的となる。外科的処置を受けたステージＩＩ〜ＩＩＩの黒色腫患者に関して、本発明者らのデータは結果として、１０^７個のＩＲの分析でさえも、６６．７％の再燃し得る患者のみにおいて外科的処置の６か月以内のｃｔＤＮＡの検出を生じ得ることを示唆する（図２６ｅ）。

１４．８ＷＥＳおよびＷＧＳからのｃｔＤＮＡの高感度検出
患者特異的捕捉パネルは、より低い配列決定費用で患者特異的変異リストのディープ配列決定を可能にするが、時間のかかるステップを追加する。本発明者らは、ＩＮＶＡＲは、全エクソームまたはゲノム配列決定等の標準化されたワークフローに適用された場合であっても、有益なリードを集計することによって増加した感度を達成するために活用することができると仮説を立てた。これは、腫瘍−正常材料の配列決定を血漿配列決定に並行して生じさせることができ、結果として生じる腫瘍−正常データは、血漿無細胞ＤＮＡから生成された配列決定データに関するＩＮＶＡＲ分析のために使用することができる（図２７ａ）。

ＩＮＶＡＲの一般化可能性を試験するために、市販のエクソーム捕捉キットを利用して、ｃｔＤＮＡが４．５×１０^−５〜０．１６のＩＭＡＦの範囲にまたがる患者特異的捕捉パネルによって検出された試料のサブセットにおける血漿ＤＮＡを配列決定した（深度中央値２３８ｘ）（図３９ａ）。各症例に関する、腫瘍エクソームにおいて検出された変異の数および配列決定の深度に応じて、商業的なプラットフォームを使用した配列決定の中程度の深度にもかかわらず、１，５６５から４７３，３００個のＩＲを取得した（図２７ｂ）。２１の試料のうち２１において、４．３４×１０^−５のＩＭＡＦまでｃｔＤＮＡを検出し（図２７ｃ）、ｃｔＤＮＡが、カスタム配列決定パネルを設計することに関する必要性を有しない患者特異的変異リストを使用して、ＩＮＶＡＲによって高い感度で検出することができることを実証した。これらのＩＭＡＦ値は、同じ試料に関するカスタム捕捉データと０．９６の相関を示した（ピアソンのｒ、Ｐ＝８．５×１０^−１２、図３９ａ）。血漿ＤＮＡのディープ配列決定を可能にし、１０^２〜１０^３のｈＧＡの等価物から情報を生成したカスタム捕捉パネルとの比較において（図２５ａ）、エクソーム配列決定によって取得したより低い深度は、数ダースのみのｈＧＡからのデータを生じた（図３９ｂ）。

本発明者らは、ｃｔＤＮＡは、より少量の入力データからであってもＩＮＶＡＲを用いて検出および定量することができると仮説を立てた。ステージＩＶの黒色腫を有する６名の患者のサブセットからの経時的血漿試料由来の無細胞ＤＮＡからのライブラリに関して全ゲノム配列決定を実施して、０．６ｘの平均深度を得た（図２７ｄ）。各患者の腫瘍および正常ＤＮＡからＷＥＳによって生成した患者特異的変異リストを使用して、患者のそれぞれに関して５００超の患者特異的変異を生成した。このことは、結果として試料当たり２２６から７，６９６個のＩＲをもたらした（中央値８６１、ＩＱＲ４７１〜１，５５９；図２７ｂ）。このデータをＩＮＶＡＲによって分析して、一部の試料では１．１×１０^−３と低い分画レベルのｃｔＤＮＡを検出した。ｃｔＤＮＡが検出されなかった試料では、９５％の信頼性を有する、その試料の考えられる最大のｃｔＤＮＡ割合を、サンプリングされたＩＲの数に基づいて算出した（図２７ｄ、方法）。

これらの結果は、１未満のｈＧＡを有する非標的化配列決定データからのｃｔＤＮＡの検出を実証し、十分に多い数の腫瘍特異的変異を用いる場合、ＩＮＶＡＲは、ごくわずかな量のＤＮＡ入力であってもｃｔＤＮＡ検出に関する高い感度を生じ得ることを示唆する。

１４．９乾燥血斑からのｃｔＤＮＡの検出
次に本発明者らは、ゲノムにわたって変異リードを統合することによって、ｃｔＤＮＡが、乾燥血斑（５０μＬの容量を有する、血液の単一の液滴）から抽出した数コピーのゲノムから生成された限定された配列決定データから検出することができると仮説を立てた。リアルタイムＰＣＲはこれまで、母体乾燥血斑を使用して胎児ＲＨＤ遺伝子型同定およびＨＩＶ検出を実行するために使用されてきたが^{２０、２１}、血斑からの無細胞ＤＮＡのＮＧＳはこれまで記載されていない。無細胞ＤＮＡ配列決定ライブラリを血斑から生成することは、存在する少ない数の無細胞ＤＮＡコピーのため、および血液細胞によって放出された多量の長いゲノムＤＮＡ（ｇＤＮＡ）断片のために困難を伴う（図４０ａ）。ｃｔＤＮＡが血斑から検出することができるか否かを決定するために、存在する限定された無細胞ＤＮＡ分子から配列決定ライブラリを生成するワークフローを開発した（方法）。汚染ｇＤＮＡ断片を取り除くために、黒色腫を有する患者から収集した乾燥血斑から抽出したＤＮＡにサイズ選択を適用した。次に、このサイズ選択されたＤＮＡから配列決定ライブラリを生成し、ｓＷＧＳを使用して複数のコピー数変化を明らかにし（図２８ａ）、このコピー数変化は伝統的な方法によって単離された同じ患者からの適合血漿試料において見出されたコピー数変化と一致した（図４０ｂ）。ＩＮＶＡＲをこのデータに適用した場合、ｃｔＤＮＡは、配列決定データの６つのｈＧＡから０．０３９のＩＭＡＦで検出された。統計的方法であるＳＰＥＣＩＥＳ^２２を使用して、配列決定ライブラリにおける一倍体ゲノムの総数を１０ｈＧＡと推定し（図４０ｃ、補足的方法）、これはこのライブラリからより大きい配列決定深度で到達し得る。したがって、これは、乾燥血斑における小部分の癌細胞の単一ゲノムと等価のｃｔＤＮＡの検出を実証した。

血斑から配列決定されたＤＮＡ断片のサイズ分布は、血漿試料の無細胞ＤＮＡから取得したものと類似した^{２、１６、１８}（図４０ｄ）。断片サイズは、患者特異的変異リストの座位において参照配列または腫瘍特異的変異のいずれかを有したリードに関して別個に評価した。これは、腫瘍由来断片はより短く、１４５ｂｐ前後にピークを有し、変異していないリードは１６６ｂｐ前後にピークを有したことを示し（図２８ｂ）、癌患者からの血漿試料の分析によって近年観察された結果を再現する^{２、１６、１８}。

ヒトにおける臨床的有用性以外に、ごくわずかな量の血液の分析は、げっ歯類等の他の生物またはモデルからの経時的ｃｔＤＮＡモニタリングを容易にし得る^２３。同所異種移植卵巣腫瘍マウスモデルを使用して、５０μＬの全血を、乾燥血斑カードを使用してサンプリングし、配列決定ライブラリを調製し、ｓＷＧＳを用いて配列決定した（方法）。配列決定リードのアラインメント時、ヒトゲノム（腫瘍由来）リードとマウスゲノム（野生型）リードの両方を、変異および野生型無細胞ＤＮＡの特性ある断片化パターンに関して観察した（図２８ｃ）。複数のコピー数多型がヒト配列において観察された（図４０ｅ）。

本発明者らは、異なる癌の種類に関する既知の変異率^２４を使用して、乾燥血斑（５０μＬの容量）におけるｃｔＤＮＡの潜在的な感度を推定する。患者特異的変異リストを各患者由来の腫瘍および正常ＤＮＡのＷＧＳから生成する場合（本研究において使用したＷＥＳではない）、あらゆる患者に関するより大きな変異リストを生成し得る。このことは、血斑からのＷＧＳデータが、試料当たり１０〜１００倍以上大きいＩＲ、およびそれに応じて、本発明者らが観察した検出限界と比べてより低いｃｔＤＮＡ検出に関する限界（図２８ｅ）を生成することを可能にし得る。黒色腫では、例えば０．１×のＷＧＳカバレッジの場合、ｃｔＤＮＡに関する検出限界は、中央値で０．００７（四分位範囲、４．４×１０^−４〜１．５×１０^−３）を有すると予測される。１０×のＷＧＳカバレッジの場合、異なる癌の種類に関する予測される検出限界は、高い変異率を有する一部の癌に関する１ｐｐｍ未満から、乳癌および前立腺癌等の低い変異率を有する癌に関するおよそ１０^−４までの範囲である。

実施例１４の考察
ＩＮｔｅｇｒａｔｉｏｎｏｆＶＡｒｉａｎｔＲｅａｄｓは、サンプリングノイズの内在する限定を克服して、患者の腫瘍において同定された複数の変異にわたってシグナルを組み合わせることによって、１コピーよりはるかに少ない癌ゲノムを含有する試料におけるｃｔＤＮＡを検出する方法を提供する（図２３）。本発明者らは、１０^２〜１０^４の変異した座位にわたってシグナルを集計することによって、０．０１コピー未満の癌ゲノムが、以前の研究^３、５よりも１０〜１００倍以上少ない、血漿における数百万分率の無細胞ＤＮＡを表す場合であっても、これを検出することができることを示した。このレベルの感度は、数多くの変異を標的として有益なリード（ＩＲ）の数を最大化することによってのみ達成することができるが、入力質量をこの程度まで増加することは、実際には実行可能ではないと考えられる（図２３ｂ）。腫瘍配列決定から取得される変異の数は、癌の種類および配列決定の範囲に依存する。この方法のこの第１の適用において、本発明者らは、エクソーム配列決定を使用して癌変異を同定し、いくつかの症例では、少ない有益なリードのために試料を分析から排除しなければならなかった。試料を少なくとも０．０１％の感度で評価することによって、６７％の外科的処置前のステージＩ〜ＩＩのＮＳＣＬＣ患者においてｃｔＤＮＡを検出した。これは、より厳密なＩＲ閾値を使用した場合、８３％まで増加し、事実上、０．００３％（３０ｐｐｍ）の最小感度を必要とした。外科的処置後、ｃｔＤＮＡは、５０％の後に再燃したステージＩＩ〜ＩＩＩの黒色腫を有する患者において６か月以内に検出された。この所見は、患者が初回の処置の何年も後に再燃し得る臨床環境^２５における、外科的処置後のｃｔＤＮＡの検出に関する課題を反映する。追加の変異および入力材料によるＩＲのさらなる増加は、微小残存病変の検出に関するｃｔＤＮＡの感度をさらに押し上げ得る（図２７ｅ）。

上咽頭癌の早期検出に関する近年の臨床試験は、各癌性細胞における複数のコピーのエプスタイン−バーウイルス（ＥＢＶ）を活用して、無症候性個体からの血液試料において癌の存在を検出した^２６。著者らは、これは各癌細胞がおよそ５００コピーの、アッセイが標的としたウイルスＤＮＡ配列を含有したために可能であったと推定し、約５００の標的の多重分析は他の癌における早期検出を可能にし得ると示唆した^２６。ＩＮＶＡＲ法は、現行の実装において、腫瘍変異の事前知識を必要とし、したがって、癌の早期検出のためのスクリーニングアッセイとして適用することはできないが、高多重分析の原理を活用して、初期癌を有する患者の大多数におけるｃｔＤＮＡを検出することができる（図２６）。ＩＮＶＡＲは、特異的な配列変化以外の無細胞ＤＮＡの特徴、例えば断片サイズおよび各変異の腫瘍アレル割合を活用し、将来的に、追加の非変異特徴、例えば断片末端^２７が、より大きい重みを癌由来断片に帰属させるために組み込まれ得る。

本発明者らは、ＩＮＶＡＲが患者特異的捕捉パネル（図２６）、商業的なエクソーム配列決定パネル、またはＷＧＳ（図２７）を使用して生成されたＮＧＳデータに柔軟に適用することができることを示した。これらの最後の方法は、より少ないＩＲを生成したが、限定された配列決定入力は、ＷＥＳでは５０ｐｐｍ未満のｃｔＤＮＡ分画レベル、およびｓＷＧＳでは約０．１％（ＷＧＳからのコピー数分析に基づく以前に記載された方法^{２８、２９}の１００分の１以下）での検出を可能にした。これらの所見に基づいて、次いでＩＮＶＡＲを活用して、限定されたＤＮＡ入力から、例えば癌患者から収集した乾燥血斑からｃｔＤＮＡを検出した。本発明者らは、ゲノム全体にわたって生成された変異リストを用いるＩＮＶＡＲの将来的実装が、５０μＬの乾燥血斑における無細胞ＤＮＡからｃｔＤＮＡの１〜１００ｐｐｍのレベルまでの検出を可能にし得る方法を記載する。これは、乾燥血斑を用いる自己サンプリングに基づく、残存疾患または疾患再燃に関する癌モニタリングのための将来的試験の可能性を創出する。

実施例１４に関する参考文献
1. Bettegowda, C. et al. Detection of circulating tumor DNA in early- and late-stage human malignancies. Sci. Transl. Med. 6, 224ra24 (2014).
2. Wan, J. C. M. et al. Liquid biopsies come of age: towards implementation of circulating tumour DNA. Nat Rev Cancer 17, 223−238 (2017).
3. Cohen, J. D. et al. Detection and localization of surgically resectable cancers with a multi-analyte blood test. Science (80-.). (2018).
4. Tie, J. et al. Circulating tumor DNA analysis detects minimal residual disease and predicts recurrence in patients with stage II colon cancer. Sci. Transl. Med. 8, 346ra92 (2016).
5. Newman, A. M. et al. Integrated digital error suppression for improved detection of circulating tumor DNA. Nat Biotechnol 34, 547−55 (2016).
6. Abbosh, C. et al. Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature 545, 446−451 (2017).
7. Abbosh, C., Birkbak, N. J. & Swanton, C. Early stage NSCLC − challenges to implementing ctDNA-based screening and MRD detection. Nature Reviews Clinical Oncology 1−10 (2018). doi:10.1038/s41571-018-0058-3
8. Garcia-Murillas, I. et al. Mutation tracking in circulating tumor DNA predicts relapse in early breast cancer. Sci. Transl. Med. 7, (2015).
9. Lee, R. J. et al. Circulating tumor DNA predicts survival in patients with resected high risk stage II/III melanoma. (2017). doi:10.1093/annonc/mdx717/4589598
10. Phallen, J. et al. Direct detection of early-stage cancers using circulating tumor DNA. Sci. Transl. Med. 9, (2017).
11. De Vlaminck, I. et al. Circulating cell-free DNA enables noninvasive diagnosis of heart transplant rejection. Sci. Transl. Med. 6, 241ra77 (2014).
12. Forshew, T. et al. Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA. Sci. Transl. Med. 4, 136ra68-136ra68 (2012).
13. Murtaza, M. et al. Multifocal clonal evolution characterized using circulating tumour DNA in a case of metastatic breast cancer. Nat. Commun. 6, 8760 (2015).
14. Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W. & Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proc. Natl. Acad. Sci. U. S. A. 108, 9530−5 (2011).
15. Jamal-Hanjani, M. et al. Detection of ubiquitous and heterogeneous mutations in cell-free DNA from patients with early-stage non-small-cell lung cancer. Ann. Oncol. 27, 862−867 (2016).
16. Mouliere, F. et al. High Fragmentation Characterizes Tumour-Derived Circulating DNA. PLoS One 6, e23418 (2011).
17. Underhill, H. R. et al. Fragment Length of Circulating Tumor DNA. PLoS Genet. 12, 426−37 (2016).
18. Mouliere, F. et al. Enhanced detection of circulating tumor DNA by fragment size analysis. Sci. Transl. Med. 4921, 1−14 (2018).
19. Newman, A. M. et al. An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat. Med. 20, 548−54 (2014).
20. Xiong, Y., Jeronis, S., Hoffman, B., Liebermann, D. A. & Geifman-Holtzman, O. First trimester noninvasive fetal RHD genotyping using maternal dried blood spots. Prenat. Diagn. 37, 311−317 (2017).
21. Luo, W., Yang, H., Rathbun, K., Pau, C. P. & Ou, C. Y. Detection of human immunodeficiency virus type 1 DNA in dried blood spots by a duplex real-time PCR assay. J. Clin. Microbiol. 43, 1851−1857 (2005).
22. Wang, J.-P. SPECIES: An R Package for Species Richness Estimation. J. Stat. Softw. 40, 1−15 (2011).
23. Rago, C. et al. Serial Assessment of Human Tumor Burdens in Mice by the Analysis of Circulating DNA. Cancer Res. 67, 9364−9370 (2007).
24. Lawrence, M. S. et al. Mutational heterogeneity in cancer and the search for new cancer-associated genes. Nature 499, 214−218 (2013).
25. Corrie, P. G. et al. Adjuvant bevacizumab for melanoma patients at high risk of recurrence: survival analysis of the AVAST-M trial. Ann. Oncol. 29, 1843−1852 (2018).
26. Chan, K. C. A. et al. Analysis of Plasma Epstein−Barr Virus DNA to Screen for Nasopharyngeal Cancer. N. Engl. J. Med. 377, 513−522 (2017).
27. Jiang, P. et al. Preferred end coordinates and somatic variants as signatures of circulating tumor DNA associated with hepatocellular carcinoma. Proc. Natl. Acad. Sci. U. S. A. 201814616 (2018). doi:10.1073/pnas.1814616115
28. Adalsteinsson, V. A. et al. Scalable whole-exome sequencing of cell-free DNA reveals high concordance with metastatic tumors. Nat. Commun. 8, 1324 (2017).
29. Belic, J. et al. Rapid Identification of Plasma DNA Samples with Increased ctDNA Levels by a Modified FAST-SeqS Approach. Clin. Chem. 61, 838−849 (2015).
30. Corrie, P. G. et al. Adjuvant bevacizumab in patients with melanoma at high risk of recurrence (AVAST-M): Preplanned interim results from a multicentre, open-label, randomised controlled phase 3 study. Lancet Oncol. 15, 620-630 (2014).
31. Varela, I. et al. Exome sequencing identifies frequent mutation of the SWI / SNF complex gene PBRM1 in renal carcinoma. Nature 469, 539−542 (2011).
32. Costello, M. et al. Discovery and characterization of artifactual mutations in deep coverage targeted capture sequencing data due to oxidative DNA damage during sample preparation. Nucleic Acids Res. 41, 1−12 (2013).
33. Rubicon Genomics. Targeted Capture of ThruPLEX(登録商標) Libraries with Agilent SureSelect(登録商標)XT Target Enrichment System. at <rubicongenomics.com/wp-content/uploads/2016/11/RDM-152-002-SureSelectXT.pdf>
34. University of Michigan. Connor - METHODS. (2016). at <https://github.com/umich-brcf-bioinf/Connor/blob/master/doc/METHODS.rst>
35. Schwarzenbach, H., Hoon, D. S. B. & Pantel, K. Cell-free nucleic acids as biomarkers in cancer patients. Nat. Rev. Cancer 11, 426−437 (2011).
36. Beckman Coulter. SPRIselect User Guide. Beckman 1−30 (2012).
37. Nioche, C. et al. A freeware for tumor heterogeneity characterization in PET, SPECT, CT, MRI and US to accelerate advances in radiomics. J. Nucl. Med. 58, 1316 (2017).

実施例１４に関する補足的方法
ＩＮＶＡＲパイプラインの概要
ＩＮＶＡＲパイプラインは、エラー抑制されたＢＡＭファイル、患者特異的座位に関するＢＥＤファイル、ならびに各変異の腫瘍アレル割合およびその変異がどの患者に属するかを示すＣＳＶファイルを得る。ＩＮＶＡＲパイプラインはクラスタを実行するＳｌｕｒｍに関して最適化される。ワークフローを図３０に示す。簡潔に述べると、パイプラインは、野生型および変異リードを全ての試料の患者特異的座位において評価し、このデータに、トリヌクレオチドエラー率、座位エラー率、変異がどの患者に属するか、腫瘍アレル割合、断片サイズ、ＦリードとＲリードの両方における存在、およびその座位におけるシグナルがその試料における他の全ての患者特異的座位に比して外れ値であるか否か、を注釈付けする。データ注釈付け後、シグナルをその試料における全ての患者特異的座位にわたって集計して、尤度比を生成し、さらにそれを使用して特異度を定義する。統合変異アレル割合（ＩＭＡＦ）は別個に算出する。

ＩＮＶＡＲデータ処理
ＳＡＭｔｏｏｌｓｍｐｉｌｅｕｐ１．３．１を、変異に関するＢＥＤファイルに基づいて患者特異的座位に、以下の設定：−−ｆｆＵＮＭＡＰ、−ｑ４０（マッピング品質）、−Ｑ２０（塩基品質）、−ｘ、−−ｄ１０，０００で使用し、次いで複アレルコールを、ＢＣＦｔｏｏｌｓ１．３．１を使用して分割した。次に、全てのＴＳＶファイルに、１，０００ＧｅｎｏｍｅｓＳＮＰデータ、ＣＯＳＭＩＣデータ、およびトリヌクレオチドコンテキストを、カスタムＰｙｔｈｏｎスクリプトを使用して注釈付けした。次いで、出力ファイルを連結し、圧縮し、Ｒに読み込んだ。最初に、腫瘍配列決定データからの事前知識に基づいて、患者当たりの全ての座位に、患者特異的（患者の腫瘍に存在）または非患者特異的（患者の腫瘍に存在しないか、もしくは個体が癌を有しない）のいずれかであるかを注釈付けした。各非患者特異的試料は複数の患者からの座位を含有するため、あらゆる非患者特異的試料は、同じ配列決定パネルまたは方法（個体間で共有される座位を排除する）を用いて分析される他の全ての患者と照合することができる。

ＩＮＶＡＲデータフィルターＩ
以下のフィルターを、座位あたりを基準としてＩＮＶＡＲデータに適用した：
１．ＭＱＳＢ＜０．０１（マッピング品質／ストランドバイアス）の場合、座位を排除した。
２．複アレル座位を同定し、３つの異なる代替アレルがエラー抑制されたリードファミリーを有するデータセットにおいて観察された場合、ブラックリストに登録した。データセットにおいて観察された２つの別個の代替アレルを有する座位は、重要でない代替アレルのエラー抑制されたリードが３個以上存在する場合にのみ排除した。
３．１０％超の非患者特異的（患者対照）試料において変異シグナルを示した、または１％超の座位当たり平均変異アレル割合を示した座位をブラックリストに登録した。このフィルターを用いてブラックリストに登録された座位の比率は０．２１％〜３．５３％の範囲であった（図３３）。９９．８％の変異が各患者個人のものであったため、患者試料を使用して、座位当たりのノイズ（患者試料に所属しなかった座位における）を特性解析することができる。
４．変異シグナルは、そのリード対のＦリードとＲリードの両方において表されなければならなかった（図３３）。このことは、配列決定エラーを低減することに役立ち、断片に関するサイズ選択を引き起こして、ＰＥ１５０配列決定を実施した場合に３００ｂｐ未満の断片を保持する（ＦリードおよびＲリードの重なり合う領域における変異シグナルのみが保持され得る）。結果として生じるエラー抑制は、ペアエンドリードを結合するツール^１と同様である。

ＩＮＶＡＲデータ注釈付け
データフィルタリング後、データに座位ノイズフィルターとトリヌクレオチドエラー率の両方を注釈付けした。座位ノイズフィルターはその座位における対照試料およびｃｆＤＮＡ分子の数によって限定されるため、トリヌクレオチドエラー率も評価した。トリヌクレオチドエラー率は、あらゆる患者特異的座位の両側最大１０ｂｐの領域（患者特異的座位それ自体を排除する）から決定し、データはトリヌクレオチドコンテキストごとにプールした。この方法においてデータをプールした後、トリヌクレオチドコンテキスト当たり中央値で３．０×１０^８個の有益なリード（または重複排除リード）を分析した。トリヌクレオチドエラー率を、各特異的変異コンテキストに関する非適合率として算出した。トリヌクレオチドコンテキストが変異重複排除リードを有しなかった場合、エラー率はそのコンテキストにおけるＩＲ／重複排除リードの数の逆数に設定した。

加えて、各データ点にそのリードのｃｆＤＮＡ断片サイズを、カスタムＰｙｔｈｏｎスクリプトを使用して注釈付けした。次いで、その患者の残りの座位と一致しなかった外れ値シグナルを除外するために、患者特異的外れ値抑制を実施した（図３４）。次に、データをエラー抑制し（リードコラプシングと患者特異的配列決定データのための特注の方法との両方によって）、データに、シグナルエンリッチメントのために必要とされるパラメータ（ｃｔＤＮＡ配列決定の特徴による）を、ＩＮＶＡＲ法のために注釈付けする。

ＩＮＶＡＲデータフィルターＩＩ−患者特異的外れ値抑制
患者特異的配列決定データは、複数の既知の患者特異的座位における有益なリードからなり、エラー抑制の手段として座位にわたる変異アレル割合を比較する機会を提供する。座位にわたるシグナルの分布は、全体のシグナル分布と一致しないノイズを含む座位の同定を潜在的に可能にする。各座位を、全ての座位にわたる平均シグナルを考慮した、観察された変異リードを有する確率に関して試験した（図３４）。残りの座位よりも有意に大きなシグナルを有すると観察された座位は、その座位におけるノイズ、汚染、または誤って遺伝子型同定されたＳＮＰ座位に起因すると考えられ得る。誤って遺伝子型同定されたＳＮＰの可能性は、数多くの変異座位がＩＮＶＡＲによって標的化される場合ますます高くなる。各試料に関して、ＩＭＡＦを、ＩＮＶＡＲ前データ処理フィルターを通過した、その座位において０．２５未満の変異アレル割合を有する全ての座位にわたって決定した。０．２５超の変異アレル割合のシグナルを有する座位は、（ｉ）残存疾患環境において、座位はそのような高い変異アレル割合を有すると予期され得ない（誤って遺伝子型同定されたＳＮＰでない限り）ため、および（ｉｉ）試料の真のＩＭＡＦが０．２５超である場合に数多くの座位が試験される場合、座位は、シグナルを有する多くの低アレル割合座位を有することによって検出が支持されるようなアレル割合の分布を示すことができるため、算出に含めなかった。

試料のｃｔＤＮＡレベルに基づいて、その試料のＩＭＡＦを考慮した個々の各座位を観察する二項確率を算出した。０．０５未満のボンフェローニ補正されたＰ値を有する座位（探査された座位の数に関して補正）をその試料において排除し、それにより外れ値を抑制した。外れ値抑制の結果として、バックグラウンドノイズは、３３％の対照試料に低減したが、患者試料では９６．１％のシグナルを保持した（図３４）。試験した座位の数に関するＰ値閾値を補正することによって、このフィルターは、患者当たりの可変数の標的化された変異を有するデータに適用することができ、高い変異率と低い変異率の両方の癌の種類を有する患者からの試料の分析を可能にする。

ＩＮＶＡＲのための統計的検出方法
本発明者らは、複数の患者特異的座位における変異リードの数をモデル化する統計的方法であって、患者特異的配列決定から入手可能な事前情報、例えばトリヌクレオチドコンテキストのバックグラウンドエラー、座位における腫瘍アレル割合、および断片長を組み込む、統計的方法を開発した。この手法は、エラー抑制後の複数の患者特異的変異にわたってシグナルを集計する。各座位に関して、そのコンテキストのトリヌクレオチドエラー率を考慮して変異リードの数の有意性を検定する。トリヌクレオチドエラー率を、座位特異的エラー率の代わりに使用して、バックグラウンドエラー率のより正確な推定を１０^−７まで決定した（図２４ｃ）。

腫瘍アレル割合およびトリヌクレオチドエラー率を以下のように検討した：ＡＦ_ｉを座位ｉにおける腫瘍変異アレル割合として表し、ｅ_ｉを座位ｉのコンテキストにおけるバックグラウンドエラーとして表し、ｐをＩＮＶＡＲアルゴリズムのためのその試料におけるｃｔＤＮＡ含量の推定値とする。座位ｉにおける無作為なリードは、変異分子または不正確に配列決定された野生型ＤＮＡ分子から生じた場合、変異と観察され得る。これは確率ｑ_ｉ：
ｑ_ｉ＝ＡＦ_ｉ・（１−ｅ_ｉ）・ｐ＋（１−ＡＦ_ｉ）・ｅ_ｉ・ｐ＋ｅ_ｉ・（１−ｐ）（１）
で生じる。ここで、ｃｔＤＮＡの存在を検定することは、統計的仮説Ｈ_０：ｐ＝０を検定することと等価である。観察された変異リードの数は座位間で独立であると仮定して、以下の尤度関数：

を作成することができ、式中、Ｍ_ｉｊは座位ｉのリードｊにおける変異に関する指示記号であり、Ｒ_ｉは座位ｉにおけるリードの数である。上記の方法は腫瘍アレル割合によるシグナルの加重を可能にし、本発明者らはこの腫瘍アレル割合が初期および進行した疾患を有する患者試料における（図３５ａ）、ならびに１名の患者からの添加希釈系列における（図３５ｂ）血漿変異出現に影響を及ぼすと確認する。

各配列決定リードは断片サイズ情報を提供し（図３５ｃ）、この情報は変異分子を野生型分子から分離してｃｔＤＮＡにおけるエンリッチメントをもたらすために使用され得る（図２４ｄ）。確率加重は、非侵襲性出生前試験環境において、Ｆａｎら^２によって示唆されている極端に低いアレル割合におけるアレルの喪失を回避するためのサイズ選択よりも好ましかった。したがって、リード長情報もまた尤度に組み込むことができる。変異および野生型断片のリード長分布推定のための方法は、ＩＮＶＡＲのためのリード長分布の推定の節で述べる。この手法はサイズ選択と対照的であり、上で実施した腫瘍ＡＦ加重と共にサイズ加重ステップと考えられ得る。各配列決定リードに関する断片サイズはＩＮＶＡＲ法に組み込むことができる。そうするために、Ｌ_ｊｉを座位ｉにおけるリードｊの長さとする。尤度は：

と書くことができる。リードの供給源（変異または野生型ＤＮＡ）を考慮してリード長と変異状況とは独立であると仮定して、尤度を以下：

のように因数分解することができ、式中、ｚ_ｉｊは座位ｉのリードｊがｃｔＤＮＡ由来であったという指示記号であり、ｐ^ｋ（ｌ_ｉｊ）＝Ｐ（ｌ_ｉｊ│ｚ_ｉｊ＝ｋ）であり、およびｇ_ｉ＝ＡＦ_ｉ・（１−ｅ_ｉ）＋（１−ＡＦ_ｉ）・ｅ_ｉである。上記方法は、変異リードと野生型リードの両方の断片長に基づいてシグナルを加重するが、ＩＮＶＡＲのこの実装では、全ての野生型サイズ区間の重みは等しいと設定し、それにより野生型リードからのサイズ情報を考慮しない。

最後に、スコアを、その試料における全ての患者特異的座位にわたるシグナルの集計により、一般化尤度比検定（ＧＬＲＴ）を使用して各試料に関して生成する。ＧＬＲＴは、帰無仮説の下での尤度を、ｐの最尤推定の下での尤度に対して直接比較する：

尤度比の値が高くなるほど、試料におけるｃｔＤＮＡ存在に関するより大きな証拠となる。試料の分類を、患者試料と対照試料との間の尤度比の比較に基づいて実施した。

尤度比閾値決定
他の患者を使用して、非共有座位において互いに照合した（図２３ｃ）。同じ配列決定パネル（すなわち同じカスタム配列決定パネル設計）に関して、同じエラー抑制設定を用いて実行され、同じ変異リストを標的とする試料のみを使用して互いに照合した。

尤度比（ＬＲ）に関する閾値を対照に基づいて正確に決定するために、各対照試料からのリードを、復元抽出を用いて１０回繰り返しリサンプリングし、ＧＬＲＴスクリプトを実行した。非患者特異的対照座位におけるシグナルの任意の患者特異的汚染のリスク（患者特異的部位と重なり合う新たな変異による）を最小限にするために、１％未満の患者特異的ＩＭＡＦを有する試料のみを、カットポイントの決定のための対照として使用した。患者対照および患者試料におけるＬＲ分布に基づいて、ＬＲに関するカットオフを各コホートに関してＲでの「ＯｐｔｉｍａｌＣｕｔｐｏｉｎｔｓ」パッケージ^３を使用して決定し、感度および特異度を、「ＭａｘＳｎＳｐ」設定を使用して最大化した。コホート当たりのＬＲに基づいて、分析的特異度を各コホートに関して決定した（図３６）。

健康な個体における特異度の評価
２６名の健康な個体の血漿からのｃｆＤＮＡを、ステージＩＶの黒色腫カスタム捕捉パネルおよびステージＩ〜ＩＩＩＡのＮＳＣＬＣカスタム捕捉パネルを使用して分析した。これらの試料は、「患者」試料として扱い、したがってパイプラインにおけるフィルターに対する影響を有せず、ＬＲ閾値の決定に関して使用しなかった。ＬＲ閾値の決定（上に記載したように）後、健康な個体の試料からのＬＲをｃｔＤＮＡの偽陽性検出に関して評価した。これらのコホートのそれぞれに関して、健康な個体における臨床的特異度の値を決定した（図３６）。

尤度比決定のための試料当たりのｃｔＤＮＡ含量の推定
この節では、期待値最大化（ＥＭ）アルゴリズムを導いて、ＩＮＶＡＲ法の一部としてのｐを推定する。起源の腫瘍ｚ_ｉｊを潜在変数として扱い、それが既知であると仮定する場合、Ｚ、Ｍ（ｍ_ｉｊは座位ｉのリードｊにおける変異に関する指示記号である）、Ｌ（ｌｉｊは座位ｊのリードｉの長さである）、ＡＦ（ＡＦ_ｉは座位ｉにおける腫瘍アレル割合である）、ｅ（ｅ_ｉは座位ｉのコンテキストにおけるバックグラウンドエラーである）の結合尤度は：

と書くことができ、式中、ｇ_ｉ＝ＡＦ_ｉ・（１−ｅ_ｉ）＋（１−ＡＦ_ｉ）・ｅ_ｉである。対数尤度はｚ_ｉｊにおいて線形であり、それゆえ尤度の期待値を取ることは、単にｚ_ｉｊをステージｌにおける期待値、

と置き換えることに等しく、式中、ｐ_ｌは繰り返しｌにおけるｐの最良推定値である。したがって、ＥＭを使用して、ｐに関する尤度を繰り返し最大化し、ｚ_ｉｊに関する尤度の期待値を取ることによってｐの最尤推定値を見出すことができる。ｐ_ｌの推定値は、ｐ_ｌに関する導関数を取り、それを０に等しくすることによって取得される：

上記は単に、ステージｌにおけるｃｔＤＮＡからのリードの予期された比率である。ベイズの定理は、

：

を計算するために使用することができる。それぞれの確率を代入することによって：

を取得する。アルゴリズムは、ｐの最大化、およびｚ_ｉｊの期待値を交互に行うことによって進行する。

ＩＮＶＡＲのためのリード長分布の推定
ＩＮＶＡＲを用いたサイズ加重は、加重を実施するための変異および野生型リードのサイズの既知の分布を最初に有することに依存する。リード長分布を最大の確度で推定するために、そのコホートにおける全ての試料からの全ての野生型および変異リードを使用し、試験された１つの試料を省き、カーネル密度推定を使用してそれぞれの確率を平滑化した。

研究したコホートのそれぞれからのサイズ分布を図３５に示し、各サイズ範囲のエンリッチメント比を図２４ｄに示す。初期コホートはサイズプロファイルの点で有意には異ならないが、進行した黒色腫コホートは、同程度の数のリードへのデータのダウンサンプリングにもかかわらず、ジヌクレオソーム断片の有意に大きい比率を有したことを実証した（図３５ｄ）。したがって、両方の初期コホートからのデータをプールして、変異および野生型断片のサイズの事前分布を生成し、データを０．２５の初期設定でガウシアンカーネルを用いて平滑化した（図３５ｅ）。

野生型の起源の細胞の場合にリードが長さｌである確率Ｐ（Ｌ＝ｌ│ｚ＝０）を推定するために、プールした各データセットからの全ての野生型リードを使用した。両方のデータセットに関して、ガウシアンカーネルと共にＲ関数「ｄｅｎｓｉｔｙ」を使用して、推定された確率を平滑化し、密度推定値

を取得した。最終的に、Ｐ（Ｌ＝ｌ│ｚ＝ｚ）を推定するために、それぞれの密度を積分した：

サイズ分布推定値を平滑化することは、データがまばらであるデータセットにおいて、あまりにも大きな重みを任意の所与の変異断片に割り当てることを回避するために重要である。

有益なリード（ＩＲ）の算出
試料に関する有益なリード（ＩＲ）の数は、標的化された変異の数（すなわち変異リストの長さ）と配列決定によって分析された一倍体ゲノム（ｈＧＡ）の数（リードコラプシング後の重複排除カバレッジと等価）との積である。したがって、あらゆる試料に関する検出の限界は、１／ＩＲに基づいて（二項確率に基づいた、変異分子をサンプリングすることに関する調整を含む）算出することができる。検出されなかった試料の場合、１／ＩＲの値はその試料におけるｃｔＤＮＡの上限の推定値を提供し、これは、変異分子が存在しない場合であっても試料の定量を可能にし、図２７ｄにおいて、ｓＷＧＳデータを使用して約１０^−４までの上側信頼限界を定義するために利用される。また、限定された感度を有する試料は、ＩＮＶＡＲ法がＩＲの数によって限定される「低感度」または「非評価可能」群として同定および分類することができる（図２５）。本研究では、他の方法よりも大きい感度でｃｔＤＮＡを定量することを目的とし、２０，０００個未満のＩＲを有する、検出されなかったｃｔＤＮＡを有する試料を低感度、したがって非評価可能と分類した。本研究におけるコホートにわたって、６名の患者がこれらの規準で非評価可能であった。

統合変異アレル割合（ＩＭＡＦ）の算出
複数の変異座位にわたってｃｔＤＮＡを定量するために、「統合変異アレル割合」を以下のように算出した：
ａ）試料における各トリヌクレオチドコンテキストに関して、全ての患者特異的座位にわたる重複排除深度加重平均アレル割合を算出した
ｂ）対照データにおけるトリヌクレオチドコンテキスト当たりのバックグラウンドエラー率を、（ａ）において算出した平均アレル割合から減算した。減算後に負の変異アレル割合を有するトリヌクレオチドコンテキストは０に設定した。
（ｃ）各トリヌクレオチドコンテキストにおける重複排除深度によって加重された、トリヌクレオチドコンテキストにわたる平均バックグラウンド減算アレル割合を取った。

実験的添加希釈系列
総計５，０７３の患者特異的バリアントを有する１名の患者からの血漿ＤＮＡを、１１名の健康な個体からの血漿ｃｆＤＮＡ（Ｓｅｒａｌａｂ）のプールに各ステップ１０倍で段階希釈して、１〜１００，０００倍にまたがる希釈系列を得た。ライブラリ調製を、方法に記載されているように、希釈液当たり５０ｎｇの入力を用いて実施した。希釈系列における、感度を評価するのに十分に多い数の分子を探査するために、最低希釈倍率（１００，０００倍）を３連で生成した。健康対照ｃｆＤＮＡプールを、座位エラー率の決定のための対照試料として含め、潜在的ＳＮＰ座位を同定および排除した（図２４ｅ）。腫瘍アレル割合と血漿変異出現との関係を考慮すると（図３５ｂ）、ＩＮＶＡＲのための任意のより小さなパネルは、最も高い優先度を有するクローン変異に基づき、より低いアレル割合は、血漿配列決定データが十分に広範である場合にのみ含めるべきである。したがって、希釈系列配列決定ライブラリのそれぞれから復元抽出を用いてデータを繰り返しサンプリングし（５０回の繰り返し）、次いで上位Ｎ個の変異（１から５，０００の変異にまたがる）を選択した。最も高い変異アレル割合を有する座位はＢＲＡＦＶ６００Ｅ変異であった。座位の数をダウンサンプリングした後、外れ値抑制を、単一ＢＲＡＦＶ６００Ｅ座位データを除くすべての試料に関して反復した。

より少ない有益なリードを用いた推定検出率
検出された試料のＩＭＡＦに基づいて、より少ないＩＲが完全に高感度なアッセイを用いて達成された場合の検出率を推定することができる。所与の数のＩＲ（ｒ）に関して、ｃｔＤＮＡに関する９５％の検出の限界（ｐ）は以下：

のように決定することができる。したがって、ＩＲ値のベクトルにおける各入力事項（１０^２、１０^３・・・１０^７）に関して、癌に関する検出率をコホート当たりで算出し、図２６ｅにプロットする。ＩＲ値のベクトルの最大値を、そのコホートにおける試料当たりのＩＲの最大数より大きくなるように設定し、最も近い桁に丸めた。ステージＩＩ〜ＩＩＩの黒色腫患者に関して、検出を５年以内に再燃した患者に関する感度と定義した。線形回帰を使用して各コホートに関するＲ^２値を算出した。

実施例１４に対する補足的方法の参考文献
1. Zhang, J., Kobert, K., Flouri, T. & Stamatakis, A. PEAR: A fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics 30, 614−620 (2014).
2. Fan, H. C., Blumenfeld, Y. J., Chitkara, U., Hudgins, L. & Quake, S. R. Analysis of the size distributions of fetal and maternal cell-free DNA by paired-end sequencing. Clin. Chem. 56, 1279−1286 (2010).
3. Lopez-Raton, M., Rodriguez-Alvarez, M. X., Suarez, C. C. & Sampedro, F. G. OptimalCutpoints: An R Package for Selecting Optimal Cutpoints in Diagnostic Tests. J. Stat. Softw. 61, 1−36 (2014).
4. University of Michigan. Connor - METHODS. (2016). at <https://github.com/umich-brcf-bioinf/Connor/blob/master/doc/METHODS.rst>
5. Forshew, T. et al. Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA. Sci. Transl. Med. 4, 136ra68-136ra68 (2012).
6. Newman, A. M. et al. An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat. Med. 20, 548−54 (2014).
7. Abbosh, C. et al. Phylogenetic ctDNA analysis depicts early stage lung cancer evolution. Nature 22364, 1−25 (2017).
8. Wang, J.-P. SPECIES: An R Package for Species Richness Estimation. J. Stat. Softw. 40, 1−15 (2011).

［実施例１５］
さらなる癌の種類へのＩＮＶＡＲの適用
下記に概略を述べる全てのコホートに関して、ｃｔＤＮＡ検出のために０．１のＩＮＶＡＲスコア閾値を適用した。その閾値未満の試料は不検出（ＮＤ）として示す。０．１未満のＩＮＶＡＲスコアおよび２０，０００個未満の総ＩＲを有する試料は評価不能と分類した（プロットに示していない）。

肺癌
総計９０の試料を、ＩＮＶＡＲを用いて分析した。４例は、十分な有益なリードを生じなかったため、「評価不能」と分類した（示していない）。残りの８６の試料のうち、６０の試料においてｃｔＤＮＡが検出され、７０％の総検出率を得た。現在、本発明者らはこれらの患者のステージについて依然として盲検化されているが、コホートは６０％がステージＩの患者である初期患者（３３％がステージＩＡ、および２７％がステージＩＢ）に大いに偏る。

腎臓癌
ＩＮＶＡＲを３９の血漿試料に適用し、そのうちの７つは評価不能であった（示していない）。残りの３２の試料のうち、２２は０．１超のＩＮＶＡＲスコアに達した（６９％）。ＩＮＶＡＲを尿試料にも適用した。分析した２３の試料のうち、６つは評価不能であった（示していない）。残りの１７の試料のうち、６つは０．１超のＩＮＶＡＲスコアに達した（３５％）。試料は異なる疾患亜型から由来する。

尿試料調製：
尿試料を外科的処置前に収集した（平均８．６、外科的処置の０〜３５日前の範囲）。同じ尿試料から、下に記載するように、尿上清（ＵＳＮ）と尿細胞ペレット（ＵＣＰ）の両方を単離した。

３０〜５０ｍｌの尿を５０ｍｌファルコンチューブに収集し、０．５ＭＥＤＴＡを収集の１時間以内に添加した（ｐＨ８．０；３０ｍｌに対し６００μｌ、最終濃度１０ｍＭ。より多い容量の尿の場合、ＥＤＴＡの容量を適宜調整した）。穏やかな反転後、試料を２，４００ｇで１０分間遠心した。その後、上清の約３．６ｍｌのアリコートを別個のクライオチューブに移した。追加の１ｍｌの上清を、別個のマイクロ遠心チューブに移し、次いで尿細胞ペレット（ＵＣＰ）を含有する元のファルコンチューブに戻した。チューブを撹拌し、残りの液体を２ｍｌの滅菌マイクロ遠心チューブに移して、１３，３００ｒｐｍで１０分間遠心し、上清を廃棄して乾燥ＵＣＰを保管のために残した。

尿試料を、ＱＩＡｓｙｍｐｈｏｎｙプラットフォーム（Ｑｉａｇｅｎ、Ｇｅｒｍａｎｙ）を使用して抽出した。最大４ｍｌの尿を抽出し、６０ｕＬに溶出した。

膠芽腫
膠芽腫患者における血漿および脳脊髄液（ＣＳＦ）のＩＮＶＡＲを使用した検出。ＣＳＦ試料において、２つの試料は、不十分な数の有益なリードのため分析から排除した（示していない）。残りの６つ全ての試料は、０．１超のＩＮＶＡＲスコアで検出された。血漿において、１２の試料のうち１１はこのＩＮＶＡＲ閾値に達した（９２％）。

ＣＳＦ試料調製：
腰椎穿刺を、腫瘍減量のための開頭術の直前に実施した。滅菌野調製後、硬膜嚢に、０．６１ｍｍゲージの腰椎穿刺針を使用してＬ３とＬ５の間の椎間空間でカニューレを挿入し、１０ｍｌのＣＳＦを採った。収集後、ＣＳＦ試料を直ちに氷上に置き、次いで処理のために事前に冷却した遠心分離機に急速に移した。試料を１５００ｇ、４Ｃで１０分間遠心分離し、上清を取り除き、２０，０００ｇで１０分間さらに遠心分離し、−８０Ｃでの保管のために２ｍＬマイクロチューブ（Ｓａｒｓｔｅｄｔ、Ｇｅｒｍａｎｙ）に等分した。

流体を、ＱＩＡｓｙｍｐｈｏｎｙプラットフォーム（Ｑｉａｇｅｎ、Ｇｅｒｍａｎｙ）を使用して抽出した。最大８ｍＬのＣＳＦを抽出のために使用した。ＣＳＦ試料からのＤＮＡを９０ｕＬに溶出し、Ｓｐｅｅｄ−Ｖａｃ濃縮装置（Ｅｐｐｅｎｄｏｒｆ）を使用して３０ｕＬまでさらに濃縮した。次いで、試料は、血漿試料に関しても使用した通常のライブラリ調製プロトコルに従った。

乳癌
ＩＮＶＡＲを乳癌試料に適用した。３５の試料のうち３４は０．１以上のＩＮＶＡＲスコアに達し、検出と分類した（９７％）。本研究における腫瘍変異をエクソン領域のみではなくゲノム全体にわたって同定した。試料を７名の患者から経時的に採取し、時間経過にわたるｃｔＤＮＡ濃度の増減は処置に対する応答を表す可能性が高い。

結果を図４２〜４５に示す。図４２および４３では、統合変異アレル割合（ＩＭＡＦ）（ｙ軸）を全てのコホート（試料、Ｘ軸）に関して示す。

図４４および４５は、評価可能と分類された全ての試料のＩＮＶＡＲスコアを示す。

参考文献
1. Wan JCM, Massie C, Garcia-Corbacho J, et al. Liquid biopsies come of age: towards implementation of circulating tumour DNA. Nat Rev Cancer 2017;17:223−38.
2. Siravegna G, Marsoni S, Siena S, Bardelli A. Integrating liquid biopsies into the management of cancer. Nat Rev Clin Oncol 2017;
3. Bettegowda C, Sausen M, Leary RJ, et al. Detection of circulating tumor DNA in early- and late-stage human malignancies. Sci Transl Med 2014;6(224):224ra24.
4. Diehl F, Li M, Dressman D, et al. Detection and quantification of mutations in the plasma of patients with colorectal tumors. Proc Natl Acad Sci U S A 2005;102(45):16368−73.
5. Forshew T, Murtaza M, Parkinson C, et al. Noninvasive Identification and Monitoring of Cancer Mutations by Targeted Deep Sequencing of Plasma DNA. Sci Transl Med 2012;4(136):136ra68-136ra68.
6. Abbosh C, Birkbak NJ, Wilson GA, et al. Phylogenetic ctDNA analysis depicts early stage lung cancer evolution. Nature 2017;22364:1−25.
7. Newman AM, Lovejoy AF, Klass DM, et al. Integrated digital error suppression for improved detection of circulating tumor DNA. Nat Biotechnol 2016;34(5):547−55.
8. Newman AM, Bratman S V, To J, et al. An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat Med 2014;20(5):548−54.
9. Murtaza M, Dawson S-J, Tsui DWY, et al. Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA. Nature 2013;497(7447):108−12.
10. Hodis E, Watson IR, Kryukov G V., et al. A Landscape of Driver Mutations in Melanoma. Cell 2013;150(2):251−63.
11. Kinde I, Wu J, Papadopoulos N, Kinzler KW, Vogelstein B. Detection and quantification of rare mutations with massively parallel sequencing. Proc Natl Acad Sci 2011;108(23):9530−5.
12. Hoang ML, Kinde I, Tomasetti C, et al. Genome-wide quantification of rare somatic mutations in normal human tissues using massively parallel sequencing. Proc Natl Acad Sci 2016;113(35):9846−51.
13. Underhill HR, Kitzman JO, Hellwig S, et al. Fragment Length of Circulating Tumor DNA. PLOS Genet 2016;12(7):426−37.
14. Mouliere F, Rosenfeld N. Circulating tumor-derived DNA is shorter than somatic DNA in plasma. Proc Natl Acad Sci 2015;112(11):201501321.
15. Thierry AR, Mouliere F, Gongora C, et al. Origin and quantification of circulating DNA in mice with human colorectal cancer xenografts. Nucleic Acids Res 2010;38(18):6159−75.
16. Poole W, Gibbs DL, Shmulevich I, Bernard B, Knijnenburg TA. Combining dependent P-values with an empirical adaptation of Brown’s method. Bioinformatics 2016;32(17):i430−6.
17. Mouliere F, Piskorz AM, Chandrananda D, et al. Selecting Short DNA Fragments In Plasma Improves Detection Of Circulating Tumour DNA. bioRxiv 2017;
18. Eisenhauer EA, Therasse P, Bogaerts J, et al. New response evaluation criteria in solid tumours: Revised RECIST guideline (version 1.1). Eur J Cancer 2009;45(2):228−47.
19. Forbes SA, Beare D, Gunasekaran P, et al. COSMIC: Exploring the world’s knowledge of somatic mutations in human cancer. Nucleic Acids Res 2015;43(D1):D805−11.
20. Jiang P, Chan CWM, Chan KCA, et al. Lengthening and shortening of plasma DNA in hepatocellular carcinoma patients. Proc Natl Acad Sci 2015;112(11):E1317-25.
21. Jiang P, Lo YMD. The Long and Short of Circulating Cell-Free DNA and the Ins and Outs of Molecular Diagnostics. Trends Genet 2016;32(6):360−71.
22. Fan HC, Blumenfeld YJ, Chitkara U, Hudgins L, Quake SR. Analysis of the size distributions of fetal and maternal cell-free DNA by paired-end sequencing. Clin Chem 2010;56(8):1279−86.
23. Chan KCA, Zhang J, Hui ABY, et al. Size Distributions of Maternal and Fetal DNA in Maternal Plasma. Clin Chem 2004;50(1):88−92.
24. Alexandrov LB, Jones PH, Wedge DC, Sale JE, Peter J. Clock-like mutational processes in human somatic cells. Nat Publ Gr 2015;47(12):1402−7.
25. Nioche C, Orlhac F, Boughdad S, et al. A freeware for tumor heterogeneity characterization in PET, SPECT, CT, MRI and US to accelerate advances in radiomics. J Nucl Med 2017;58(supplement 1):1316.
26. Varela I, Tarpey P, Raine K, et al. Exome sequencing identifies frequent mutation of the SWI / SNF complex gene PBRM1 in renal carcinoma. Nature 2011;469(7331):539−42.
27. Manson-Bahr D, Ball R, Gundem G, et al. Mutation detection in formalin-fixed prostate cancer biopsies taken at the time of diagnosis using next-generation DNA sequencing. J Clin Pathol 2015;68(3):212−7.
28. Rubicon Genomics. ThruPLEX(登録商標) Tag-seq Kit Instruction Manual [インターネット]. 2016;Available from: http://rubicongenomics.com/wp-content/uploads/2016/08/QAM-328-001-ThruPLEX-Tag-seq-Kit-Instruction-Manual.pdf
29. Rubicon Genomics. Targeted Capture of ThruPLEX(登録商標) Libraries with Agilent SureSelect(登録商標)XT Target Enrichment System [インターネット]. Available from: rubicongenomics.com/wp-content/uploads/2016/11/RDM-152-002-SureSelectXT.pdf
30. University of Michigan. Connor - METHODS [インターネット]. 2016 [2017 Mar 27引用];Available from: https://github.com/umich-brcf-bioinf/Connor/blob/master/doc/METHODS.rst
31. moonso. VCF Parser [インターネット]. [2016 2017 May 8,引用];Available from: https://github.com/moonso/vcf_parser
Brash DE. UV Signature Mutations. Photochemistry and photobiology. 2015;91(1):15−26. doi:10.1111/php.12377.
Hodis E, Watson IR, Kryukov GV, et al. A Landscape of Driver Mutations in Melanoma. Cell. 2012;150(2):251-263. doi:10.1016/j.cell.2012.06.024.
Jamal-Hanjani GA et al. Detection of ubiquitous and heterogeneous mutations in cell-free DNA from patients with early-stage non-small-cell lung cancer, Annals of Oncology, Volume 27, Issue 5, 1 May 2016, Pages 862−867, https://doi.org/10.1093/annonc/mdw037
Shyr C, Tarailo-Graovac M, Gottlieb M, Lee JJ, van Karnebeek C, Wasserman WW. FLAGS, frequently mutated genes in public exomes. BMC Medical Genomics. 2014;7:64. doi:10.1186/s12920-014-0064-y.

本明細書において引用された全ての参考文献は、個々の各刊行物または特許または特許出願の全体が参照によって組み込まれることが具体的かつ個別的に示される場合と同じ程度に、その全体があらゆる目的のために参照によって本明細書に組み込まれる。

本明細書に記載される具体的な実施形態は、限定としてではなく例として提供される。本明細書におけるいずれの小見出しも説明の便宜のためにのみ含まれ、いかなる点でも本開示を限定するものとして解釈されるべきではない。

Claims

患者から取得したＤＮＡ含有試料における、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）等の無細胞ＤＮＡ（ｃｆＤＮＡ）を検出するためのコンピュータ実装方法であって、
（ａ）前記患者の腫瘍を表す少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の変異含有座位（「患者特異的座位」）を含む目的の座位を用意するステップと、
（ｂ）前記患者由来のＤＮＡ含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを用意するステップであり、前記配列リードが前記ステップ（ａ）の前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の変異含有座位にまたがる、ステップと、
（ｃ）任意選択で、リードコラプシングを実施して前記配列リードをリードファミリーにグループ化するステップと、
（ｄ）前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で前記変異アレル割合が式：

に従って変異リードおよび総リードを集計することによって算出される、ステップと、
（ｅ）前記試料を
（ｉ）前記変異アレル割合がバックグラウンド配列決定エラー率よりも大きいか、もしくは統計的に有意に大きいと見出される場合、ｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有する、または
（ｉｉ）前記変異アレル割合が前記バックグラウンド配列決定エラー率よりも大きいと見出されず、統計的に有意に大きいとも見出されない場合、ｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有してもなく、未知のｃｆＤＮＡ（例えばｃｔＤＮＡ）のステータスを有してもいない
と分類するステップと
を含む、コンピュータ実装方法。
前記変異アレル割合に関する統計的有意性の計算が、前記試料からの変異リードの数、前記試料からのリードの総数、および前記バックグラウンド配列決定エラー率から予期された変異リードの数を含む分割表を考慮して、フィッシャーの片側正確確率検定を実行することを含む、請求項１に記載の方法。
前記バックグラウンド配列決定エラー率が、前記少なくとも２、３、４、５、６、７、８、９、または１０の患者特異的座位において表される塩基置換の各クラス（「変異クラス」）に関して、任意選択でトリヌクレオチドコンテキストごとに決定されており、
前記ステップ（ｄ）における前記変異アレル割合算出が各変異クラスに関して実施され、
前記変異アレル統計的有意性計算が、各変異クラスに関する統計的有意性を、該変異クラスの前記バックグラウンド配列決定エラー率を考慮に入れて計算すること、および計算した各変異クラスの前記統計的有意性を組み合わせて、前記試料の全体変異アレル割合に関する統計的有意性の尺度を得ることを含む、
請求項１または２に記載の方法。
前記変異アレル統計的有意性計算が、フィッシャーの片側正確確率検定を複数回実行して、観察された変異リードの数の統計的有意性を、該変異クラスに関するバックグラウンド配列決定エラー率を考慮して決定し、それにより各変異クラスに関してｐ値を生成し、経験的なブラウンの方法を使用して前記ｐ値を組み合わせて、前記試料の前記変異アレル割合に関する統計的有意性の全体的尺度を得ることを含む、請求項３に記載の方法。
前記変異クラスが、以下の変異クラス：Ｃ＞Ｇ、Ｇ＞Ｃ、Ｔ＞Ｇ、Ａ＞Ｃ、Ｃ＞Ａ、Ｇ＞Ｔ、Ｔ＞Ｃ、Ａ＞Ｇ、Ｔ＞Ａ、Ａ＞Ｔ、Ｃ＞Ｔ、およびＴ＞Ｃのうちの少なくとも５、６、７、８、９、１０、１１、または１２個全てを含む、請求項３または４に記載の方法。
前記ステップ（ｂ）において取得される配列リードを含む前記配列データが、テイラードパネル配列決定（ＴＡＰＡＳ）配列リード、焦点化エクソーム配列リード、全エクソーム配列リード、または全ゲノム配列リードを表す、請求項１から５のいずれか一項に記載の方法。
前記ステップ（ｂ）において用意される配列リードを含む前記配列データが、前記患者由来の実質的に無細胞の液体試料からの複数のＤＮＡ断片の配列リードを表す、請求項１から６のいずれか一項に記載の方法。
前記患者の腫瘍を表す前記少なくとも２、３、４、５、６、７、８、９、または１０の変異含有座位が、前記患者由来の腫瘍試料から直接取得したＤＮＡを配列決定するか、または液体、例えば高腫瘍疾患負荷時の前記患者由来の血漿試料から取得したＤＮＡを配列決定することによって取得されている、請求項１から７のいずれか一項に記載の方法。
前記ステップ（ｂ）において取得される配列リードを含む前記配列データが、前記患者が前記腫瘍の一連の処置を開始した後および／または前記患者が前記腫瘍の外科的切除を行った後に前記患者から取得した試料からの複数のポリヌクレオチド断片の配列リードを表し、
前記方法が、前記腫瘍の存在、成長、予後、退縮、処置応答、または再発をモニタリングするためのものである、
請求項１から８のいずれか一項に記載の方法。
前記患者が、黒色腫、肺癌、膀胱癌、食道癌、結腸直腸癌、卵巣癌、脳癌、および／または乳癌を有するかまたは有していたことがある、請求項１から９のいずれか一項に記載の方法。
前記リードコラプシングの前記ステップ（ｃ）が、断片開始および終了位置、ならびに少なくとも１つの分子バーコードに基づいて、リードをリードファミリーにグループ化することを含み、
全てのファミリーメンバー間で最低でも６０％、７０％、８０％、または９０％のコンセンサスが必要とされ、
２、３、４、または５の最小ファミリーサイズが必要とされる、
請求項１から１０のいずれか一項に記載の方法。
前記配列リードが、１１５〜１６０ｂｐ、１１５〜１９０ｂｐ、２５０〜４００ｂｐ、および４４０〜４６０ｂｐのサイズ範囲内のリードにｉｎｓｉｌｉｃｏでサイズ選択され、ｃｔＤＮＡを表すリードをエンリッチする、請求項１から１１のいずれか一項に記載の方法。
リードコラプシングを実施する前記ステップが、
（ｉ）２個より多い変異分子を有する座位を排除すること、および
（ｉｉ）順（Ｆ）方向と逆（Ｒ）方向との両方において配列決定された断片のみを選択すること
からなる群から選択される少なくとも１つの微小残存病変（ＭＲＤ）フィルターを適用することをさらに含む、請求項１から１２のいずれか一項に記載の方法。
座位当たりの前記変異アレル割合が腫瘍アレル割合によって加重される、または座位当たりの変異アレルの数が腫瘍割合によって加重される、請求項１３に記載の方法。
座位当たりの前記変異アレル割合が、式：

に従って腫瘍アレル割合によって加重され、
式中、
ＡＦ_{コンテキスト}は所与のコンテキストのアレル頻度であり、腫瘍ＡＦは前記腫瘍から直接取得したＤＮＡを配列決定することによって決定される前記座位のアレル頻度であり、ＭＲＤ様座位は、前記患者の前記腫瘍から決定され、その後前記ＭＲＤフィルターが適用された前記変異含有座位である、
請求項１３または１４に記載の方法。
前記コンテキストがトリヌクレオチドコンテキストであり、任意選択で、最も有意なｐ値を有する６つのトリヌクレオチドコンテキストのみが組み合わされる、請求項１５に記載の方法。
ｎ個の最も有意なトリヌクレオチドコンテキストｐ値が、式：

に従って組み合わされ、
式中、ｎ＝１、２、３、４、５、６、８、１０、または１２である、
請求項１６に記載の方法。
全体アレル割合が、式：

に従って決定される、請求項１４から１７のいずれか一項に記載の方法。
患者における癌の存在、成長、予後、退縮、処置応答、または再発をモニタリングするための方法であって、
（ｉ）前記患者から取得したポリヌクレオチド含有試料を配列決定して、前記試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを取得するステップであり、前記配列リードが、前記患者の癌細胞における変異保有座位であると決定された少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の座位にまたがる、ステップと、
（ｉｉ）請求項１から１８のいずれか一項に記載の方法を、ステップ（ｉ）において取得した前記配列リードを使用して実行するステップと、
（ｉｉｉ）前記患者における前記癌の存在、成長、予後、退縮、処置応答、または再発を、少なくとも、前記試料を、ｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有する、ｃｆＤＮＡ（例えばｃｔＤＮＡ）を含有しないと分類することに基づいて、または算出した全体変異アレル割合に基づいて決定するステップと、
を含み、任意選択で腫瘍切除後の癌の再発をモニタリングするためのものである、方法。
試料における総ポリヌクレオチドの少ない割合である、前記試料における標的ポリヌクレオチドを検出するためのコンピュータ実装方法であって、前記標的ポリヌクレオチドおよび非標的ポリヌクレオチドは、複数の座位における配列が異なり、前記方法が、
（ａ）少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または少なくとも５０００の座位であり、それぞれにおける少なくとも１つの塩基が標的ポリヌクレオチド配列と非標的ポリヌクレオチド配列との間で異なる、座位（「標的特異的座位」）を用意するステップと、
（ｂ）前記試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを用意するステップであり、前記配列リードが前記ステップ（ａ）の前記少なくとも２、３、４、５、６、７、８、９、または１０の標的特異的座位にまたがる、ステップと、
（ｃ）任意選択で、リードコラプシングを実施して前記配列リードをリードファミリーにグループ化するステップと、
（ｄ）前記少なくとも２、３、４、５、６、７、８、９、または１０の標的特異的座位の全てにわたる標的ポリヌクレオチド割合を算出するステップであり、任意選択で前記標的ポリヌクレオチド割合が式：

に従って変異リードおよび総リードを集計することによって算出される、ステップと、
（ｅ）前記試料を
（ｉ）前記標的ポリヌクレオチド割合がバックグラウンド配列決定エラー率に基づいて予期され得る割合よりも統計的に有意に大きいと見出される場合、前記標的ポリヌクレオチドを含有する、または
（ｉｉ）前記標的ポリヌクレオチド割合が前記バックグラウンド配列決定エラー率に基づいて予期され得る前記割合よりも統計的に有意に大きいと見出されない場合、前記標的ポリヌクレオチドを含有してもなく、未知の標的ポリヌクレオチドのステータスを有してもいない
と分類するステップと
を含む、コンピュータ実装方法。
前記バックグラウンド配列決定エラー率が、前記少なくとも２、３、４、５、６、７、８、９、または１０の座位において表される塩基置換の各クラスに関して、任意選択でトリヌクレオチドコンテキストごとに決定されるかまたは決定されており、
前記ステップ（ｄ）における前記標的ポリヌクレオチド割合算出が各塩基置換クラスに関して実施され、
標的ポリヌクレオチド割合統計的有意性決定が、各塩基置換クラスに関する統計的有意性を、該塩基置換クラスの前記バックグラウンド配列決定エラー率を考慮に入れて計算すること、および計算した各塩基置換クラスの前記統計的有意性を組み合わせて、前記試料の全体標的ポリヌクレオチド割合に関する統計的有意性の尺度を得ることを含む、
請求項２０に記載の方法。
前記試料の分析が、異なる断片サイズのＤＮＡを分けるサイズ選択ステップを含む、請求項１から２１のいずれか一項に記載の方法。
前記患者から取得した前記試料が、１つ未満の腫瘍由来一倍体ゲノムを含む有限容量試料である、または前記試料からの配列決定データが、１、２、３、４、１０、もしくは２０未満の一倍体ゲノムの配列決定カバレッジもしくは深度を表す、請求項１から２２のいずれか一項に記載の方法。
前記患者から取得した前記試料が、
（ｉ）５００μｌ未満、４００未満、２００未満、１００μｌ未満、または７５μｌ未満の血液、血清、または血漿試料（例えば約５０μｌの血液または血漿試料）、
（ｉｉ）穿刺吸引（ＦＮＡ）、
（ｉｉｉ）リンパ節生検、
（ｉｖ）尿、脳脊髄液、喀痰、気管支洗浄、子宮頸部スメア、または細胞学的試料、
（ｖ）前記患者からの収集時から１年、２年、３年、５年、または１０年超保管された試料、および
（ｖｉ）以前に処理されており、ＤＮＡもしくは配列決定品質に関する品質測定基準を満たしていない試料、または１組の試料に属する試料であり、前記１組の試料からの他の試料が、以前に処理されており、ＤＮＡもしくは配列決定品質に関する品質測定基準を満たしていない、試料、
からなる群から選択される有限容量試料である、請求項１から２３のいずれか一項に記載の方法。
前記患者から取得した前記試料が、
乾燥血斑試料、
穿刺血液試料、
前記患者からの収集後１日超（例えば少なくとも１か月）、または少なくとも１年間、または少なくとも１０年間保管された、５００μｌ未満である保存血液、血清、または血漿試料
である、請求項１から２４のいずれか一項に記載の方法。
前記患者が健康であるかもしくは疾患（例えば癌）を有する、および／または前記患者がヒトもしくは非ヒト動物（例えばげっ歯類）である、請求項１から２５のいずれか一項に記載の方法。
前記動物が異種移植または異種間移植されたヒト腫瘍組織を有する、請求項２６に記載の方法。
分析される前記試料が、２００ｂｐ超、３００ｂｐ超、５００ｂｐ超、７００ｂｐ超、１０００ｂｐ超、１２００ｂｐ超、１５００ｂｐ超、または２０００ｂｐ超のゲノムＤＮＡ（ｇＤＮＡ）断片が分析前、例えばＤＮＡ配列決定前にフィルター除去されるか、枯渇されるか、または取り除かれるサイズ選択ステップに供されて、サイズ選択された試料を生成する、請求項１から２７のいずれか一項に記載の方法。
前記サイズ選択ステップが配列決定ライブラリ調製前または配列決定ライブラリ調製後に実行される、請求項２２から２８のいずれか一項に記載の方法。
前記サイズ選択ステップが、ｇＤＮＡ断片のビーズに基づいた捕捉を用いる右側サイズ選択である、請求項２８または２９に記載の方法。
該試料における患者特異的変異シグナルの残りの分布と一致しない、座位における外れ値ノイズを抑制するステップを含む、請求項１から３０のいずれか一項に記載の方法。
前記試料におけるｃｔＤＮＡ存在の尤度が、一般化尤度比：

によって決定され、一般化尤度比という用語が、実施例１４に定義されているようなものである、請求項１から３１のいずれか一項に記載の方法。
患者から取得したＤＮＡ含有試料における標的無細胞ＤＮＡ（ｃｆＤＮＡ）を検出するためのシステムであって、
少なくとも１つのプロセッサ、ならびに
前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサに、
（ａ）前記患者由来のＤＮＡ含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを受け取るステップであり、前記配列リードが少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の変異含有座位にまたがる、ステップと、
（ｂ）任意選択で、リードコラプシングを実施して前記配列リードをリードファミリーにグループ化するステップと、
（ｃ）前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で前記変異アレル割合が式：

に従って変異リードおよび総リードを集計することによって算出される、ステップと、
（ｄ）前記試料を、算出した前記変異アレル割合に基づいて、前記標的ｃｆＤＮＡを含有するまたは含有しないと分類するステップと
を含む操作を実施させる命令を含有する少なくとも１つの非一時的コンピュータ可読媒体
を含む、システム。
請求項１から３２のいずれか一項に記載の方法における使用のための、請求項３３に記載のシステム。
患者から取得したＤＮＡ含有試料における標的無細胞ＤＮＡ（ｃｆＤＮＡ）を検出するための非一時的コンピュータ可読媒体であって、少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサに、
（ａ）前記患者由来のＤＮＡ含有試料からの複数のポリヌクレオチド断片の配列リードを含む配列データを受け取るステップであり、前記配列リードが前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の変異含有座位にまたがる、ステップと、
（ｂ）任意選択で、リードコラプシングを実施して前記配列リードをリードファミリーにグループ化するステップと、
（ｃ）前記少なくとも２、３、４、５、６、７、８、９、１０、５０、１００、５００、１０００、２５００、または５０００の患者特異的座位の一部または全てにわたる変異アレル割合を算出するステップであり、任意選択で前記変異アレル割合が式：

に従って変異リードおよび総リードを集計することによって算出される、ステップと、
（ｄ）前記試料を、算出した前記変異アレル割合に基づいて、前記標的ｃｆＤＮＡを含有するまたは含有しないと分類するステップと
を含む操作を実施させる命令を含む、非一時的コンピュータ可読媒体。
請求項１から３２のいずれか一項に記載の方法における使用のための、請求項３５に記載の媒体。