JP6560465B1

JP6560465B1 - 無細胞核酸の多重解像度分析のための方法

Info

Publication number: JP6560465B1
Application number: JP2018568202A
Authority: JP
Inventors: ダーリヤチュドヴァ，; ヘルミーエルトーキー，; ステファニーアンウォードモーティマー，; ダイアナアブドゥエヴァ，; マーシンシコラ，
Original assignee: ガーダントヘルス，インコーポレイテッド
Priority date: 2016-09-30
Filing date: 2017-09-29
Publication date: 2019-08-21
Anticipated expiration: 2037-09-29
Also published as: CN109642250A; WO2018064629A1; KR102344635B1; AU2023204088A1; CA3126055A1; US20240087681A1; US20210358567A1; ES2840003T3; US20240087680A1; AU2017336153B2; JP2019531048A; JP6806854B2; US11817179B2; CA3027919C; AU2017336153A1; US11817177B2; EP3461274B1; JP7385686B2; JP2021040655A; US20230253071A1

Abstract

本開示は、核酸試料のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットと、核酸試料のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットとを使用する複数のゲノム領域について富化するための方法を提供する。これらのベイトセットパネルは、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化することができ、ヌクレオソーム関連領域は、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。

Description

相互参照
本出願は、２０１６年９月３０日に出願された米国仮出願番号第６２／４０２，９４０号、２０１７年３月７日に出願された米国仮出願番号第６２／４６８，２０１号、および２０１７年４月２４日に出願された米国仮出願番号第６２／４８９，３９１号に基づく優先権を主張しており、これら出願の各々は、全体が参考として本明細書中に援用される。

配列表
本出願は、ＡＳＣＩＩ形式で電子的に提出された配列表を含み、この配列表は、その全体が参照によって本明細書に組み込まれる。前記ＡＳＣＩＩコピーは、２０１７年９月２７日に作成され、４２５３４−７３３＿６０１＿ＳＬ．ｔｘｔという名称であり、サイズが２，９３８バイトである。

背景
腫瘍由来遺伝的バリアントのための無細胞核酸（例えば、デオキシリボ核酸またはリボ核酸）の分析は、がん検出、評価、およびモニタリング用途のための典型的な分析パイプラインにおける重要なステップである。無細胞核酸のがん診断アッセイの最新方法は、腫瘍関連体細胞バリアント、例えば、一塩基バリアント（ＳＮＶ）、コピー数多型（ＣＮＶ）、融合、および挿入／欠失（インデル）の検出に焦点を当てており、それらは全て液体生検の主流の標的である。典型的な分析アプローチは、ゲノムの標的領域についての核酸試料の富化、次いで、富化された核酸のシーケンシング、および目的の遺伝的バリアントについての配列リードデータの分析を含み得る。これらの核酸は、それぞれの目的のゲノム領域に関連する制限されたシーケンシングロードおよび有用性を含むアッセイ制約に従った、特定のアッセイのために選択されたベイト混合物を使用して、富化することができる。

ある態様では、本開示は、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化する１つまたは複数のベイトセットを含むベイトセットパネルを提供し、ヌクレオソーム関連領域は、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。

一部の実施形態では、ベイトセットパネルの１つまたは複数のヌクレオソーム関連領域はそれぞれ、（ｉ）ヌクレオソームポジショニングの多型を含む顕著な構造多型であり、挿入、欠失、転位、遺伝子再編成、メチル化状態、マイクロサテライト、コピー数多型、コピー数関連構造多型、または区別を示す任意の他の多型からなる群から選択される構造多型、および（ｉｉ）ゲノム中のヌクレオソームマップ破損の１つまたは複数の位置を示すゲノムパーティションマップにおける１つまたは複数の顕著な変動またはピークを含む不安定性の少なくとも１つを含む。

一部の実施形態では、ベイトセットパネルの１つまたは複数のベイトセットは、（ｉ）１つもしくは複数の疾患状態および１つもしくは複数の非疾患状態に関連する、（ｉｉ）公知の体細胞変異、例えばＳＮＶ、ＣＮＶ、インデルもしくは再編成に関連する、ならびに／または（ｉｉｉ）差異のある発現パターンに関連する複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成される。一実施形態では、ベイトセットパネルの１つまたは複数のベイトセットは、無細胞デオキシリボ核酸（ｃｆＤＮＡ）試料における１つまたは複数のヌクレオソーム関連領域について選択的に富化する。

別の態様では、本開示は、ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法であって、（ａ）核酸試料をベイトセットパネルに接触させるステップであって、前記ベイトセットパネルがゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化する１つまたは複数のベイトセットを含む、ステップと、（ｂ）ゲノムの１つまたは複数のヌクレオソーム関連領域について核酸試料を富化するステップとを含む、方法を提供する。

一部の実施形態では、ベイトセットパネルにおける１つまたは複数のベイトセットは、１つもしくは複数の疾患状態および１つもしくは複数の非疾患状態に関連する、複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成される。一実施形態では、ベイトセットパネルにおける１つまたは複数のベイトセットは、ｃｆＤＮＡ試料における１つまたは複数のヌクレオソーム関連領域について選択的に富化する。一実施形態では、ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法は、ゲノムのヌクレオソーム関連領域の配列リードを生ずるために、富化された核酸をシーケンシングするステップをさらに含む。

別の態様では、本開示は、ベイトセットを生成するための方法であって、（ａ）ゲノムの１つまたは複数の領域を同定するステップであって、前記領域がヌクレオソームプロファイルに関連する、ステップと、（ｂ）前記領域を選択的に捕捉するようにベイトセットを選択するステップとを含む。一実施形態では、ベイトセットパネルにおけるベイトセットは、無細胞デオキシリボ核酸試料における１つまたは複数のヌクレオソーム関連領域について選択的に富化する。

別の態様では、本開示は、所定量のＤＮＡを含む核酸試料のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、第１のベイトセットの飽和点未満である第１の濃度比で提供される、第１のベイトセットと、核酸試料のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、第２のベイトセットの飽和点に関連する第２の濃度比で提供される、第２のベイトセットとを含む、ベイトパネルを提供する。一実施形態では、ゲノム領域の第１のセットは、１つまたは複数のバックボーンゲノム領域を含み、ゲノム領域の第２のセットは、１つまたは複数のホットスポットゲノム領域を含む。

別の態様では、本開示は、複数のゲノム領域について富化するための方法であって、所定量の核酸試料を、（ｉ）核酸試料のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、第１のベイトセットの飽和点未満である第１の濃度比で提供される第１のベイトセットと、（ｉｉ）核酸試料のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、第２のベイトセットの飽和点と関連する第２の濃度比で提供される第２のベイトセットとを含むベイトパネルと接触させるステップと、ゲノム領域の第１のセットおよびゲノム領域の第２のセットについて核酸試料を富化するステップとを含む、方法を提供する。

一部の実施形態では、方法は、ゲノム領域の第１のセットおよびゲノム領域の第２のセットの配列リードを生ずるように富化された核酸をシーケンシングするステップをさらに含む。

一部の実施形態では、ベイトセットの飽和点は、（ａ）ベイトセットのベイトのそれぞれについて、（ｉ）ベイトの捕捉効率をベイトの濃度の関数として測定すること、および（ｉｉ）滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定することを含む滴定曲線を生成すること、ならびに（ｂ）ベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を選択することであって、それによりベイトセットの飽和点を決定することによって決定される。

一部の実施形態では、ベイトの捕捉効率は、（ａ）コホートにおける複数の対象から得られた複数の核酸試料を提供すること、（ｂ）ベイトの複数の濃度のそれぞれで、ベイトを核酸試料のそれぞれとハイブリダイズさせること、（ｃ）ベイトの複数の濃度のそれぞれで、ベイトを用いて核酸試料の複数のゲノム領域を富化すること、および（ｄ）ベイトの複数の濃度のそれぞれで捕捉効率を表す、元の二本鎖核酸分子の両方の鎖を表す特有の核酸分子または核酸分子の数を測定することによって決定される。

一部の実施形態では、変曲点は、観測された捕捉効率が、第１の濃度より大きいベイトの濃度で有意に増加しないような、ベイトの第１の濃度である。変曲点は、（１）第１の濃度の２倍のベイト濃度での捕捉効率を（２）第１のベイト濃度での捕捉効率と比較して観測される増加が、約１％未満、約２％未満、約３％未満、約４％未満、約５％未満、約６％未満、約７％未満、約８％未満、約９％未満、約１０％未満、約１２％未満、約１４％未満、約１６％未満、約１８％未満または約２０％未満であるような、ベイトの第１の濃度であり得る。

一部の実施形態では、核酸試料は、無細胞核酸試料を含む。一実施形態では、複数のゲノム領域を富化するための方法は、複数の配列リードを生ずるために、富化された核酸試料をシーケンシングするステップをさらに含む。一実施形態では、複数のゲノム領域を富化するための方法は、核酸試料を表す核酸配列を含む出力を生じるステップをさらに含む。

別の態様では、本開示は、ゲノムのバックボーン領域を選択的に捕捉する第１のセットであって、前記バックボーン領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各バックボーン領域の順位付け関数が、所定の閾値未満の値を有する、第１のセットと、ゲノムのホットスポット領域を選択的に捕捉する第２のベイトセットであって、前記ホットスポット領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各ホットスポット領域の順位付け関数が所定の閾値より大きいまたはそれと等しい値を有する、第２のベイトセットとを含む、ベイトパネルを提供する。

一部の実施形態では、ホットスポット領域は、１つまたは複数のヌクレオソーム情報領域を含み、前記ヌクレオソーム情報領域は、最大ヌクレオソーム鑑別の領域を含む。一実施形態では、ベイトパネルは、疾患情報領域を選択的に捕捉する第２のベイトセットをさらに含む。一実施形態では、第１のベイトセットのベイトは、ベイトパネルに対する第１の相対濃度でのベイトであり、第２のベイトセットのベイトは、ベイトパネルに対する第２の相対濃度でのベイトである。

別の態様では、本開示は、１つまたは複数の目的のバックボーンゲノム領域を同定するステップであって、１つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、１つまたは複数の目的のホットスポットゲノム領域を同定するステップと、目的のバックボーンゲノム領域を選択的に捕捉する第１のベイトセットを創製するステップと、目的のホット−スポットゲノム領域を選択的に捕捉する第２のベイトセットを創製するステップであって、第２のベイトセットが、第１のベイトセットより高い捕捉効率を有するステップとを含む、ベイトセットを生成するための方法を提供する。

一部の実施形態では、１つまたは複数のホットスポットは、次の：（ｉ）前記ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、（ｉｉ）所定の１つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、（ｉｉｉ）関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに（ｉｖ）経験的に同定されたがんドライバー変異の１つまたは複数を使用して選択される。

一部の実施形態では、目的の１つまたは複数のホットスポットを同定するステップは、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためのプログラムされたコンピュータプロセッサを使用することを含む。一部の実施形態では、目的の１つまたは複数のバックボーンゲノム領域を同定するステップは、目的のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすることを含む。一部の実施形態では、目的の１つまたは複数のホットスポットゲノム領域を同定するステップは、試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度（ＭＡＦ）値またはそのＭＡＦによって測定されたバリアントのクローン性のセットを利用することを含む。

一部の実施形態では、ゲノム領域のシーケンシングロードは、（ｉ）塩基対におけるゲノム領域のサイズ、（ｉｉ）ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、（ｉｉｉ）ゲノム領域の配列バイアスの結果としての相対カバレッジ、（ｉｖ）ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および（ｖ）ゲノム領域の捕捉バイアスの結果としての相対カバレッジの１つまたは複数を一緒に乗算することによって計算される。

一部の実施形態では、ゲノム領域の有用性は、（ｉ）ゲノム領域における１つまたは複数の行動指針を与え得る変異の頻度、（ｉｉ）ゲノム領域の平均を上回るマイナーアレル頻度（ＭＡＦ）に関連する１つまたは複数の変異の頻度、（ｉｉｉ）ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、（ｉｖ）コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの合計、および（ｖ）（１）コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの（２）コホートにおける所与の患者についての最大ＭＡＦに対する比率の１つまたは複数を一緒に乗算することによって計算される。

一部の実施形態では、行動指針を与え得る変異は、（ｉ）投薬標的化可能な変異、（ｉｉ）治療モニタリングのための変異、（ｉｉｉ）疾患特異的変異、（ｉｖ）組織特異的変異、（ｖ）細胞型特異的変異、（ｖｉ）耐性変異、および（ｖｉｉ）診断上の変異の１つまたは複数を含む。一実施形態では、より高いマイナーアレル頻度に関連する変異は、１つもしくは複数のドライバー変異を含むか、または外部データもしくは注釈ソースから公知である。

別の態様では、本開示は、複数のベイトセットを含むベイトパネルであって、各ベイトセットが、（ｉ）複数のベイトにわたって同じ分位数の有用性で１つまたは複数のゲノム領域を選択的に捕捉する１つまたは複数のベイトを含み、（ｉｉ）複数のベイトにわたって異なる分位数の有用性で他のベイトセットのそれぞれと異なる相対濃度を有する、ベイトパネルを提供する。

別の態様では、本開示は、（ａ）各パネルブロックについて、（ｉ）パネルブロックの有用性を計算し、（ｉｉ）パネルブロックのシーケンシングロードを計算し、（ｉｉｉ）パネルブロックの順位付け関数を計算するステップと、（ｂ）最適化プロセスを実行して、選択されたパネルブロックの合計順位付け関数値を最大化するパネルブロックのセットを選択するステップとを含むパネルブロックのセットを選択する方法を提供する。

一部の実施形態では、パネルブロックの順位付け関数は、パネルブロックのシーケンシングロードで割ったパネルブロックの有用性として計算される。一部の実施形態では、コンビナトリアル最適化プロセスは、グリーディアルゴリズムを含む。

別の態様では、本開示は、（ａ）複数のベイト混合物を提供するステップであって、各ベイト混合物が、ゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットと、ゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットとを含み、ベイト混合物が、第１のベイトセットを異なる濃度で、第２のベイトセットを同じ濃度で含む、ステップと、（ｂ）各ベイト混合物を核酸試料と接触させるステップであって、ベイトセットを用いて試料から核酸を捕捉するステップであって、核酸試料が第２のベイトセットの飽和点付近の核酸濃度を有するステップと、（ｃ）配列リードのセットを生ずるために、各ベイト混合物を用いて捕捉された核酸をシーケンシングするステップと、（ｄ）各ベイト混合物について、ゲノム領域の第１のセットに対する配列リードおよびゲノム領域の第２のセットに対する配列リードの相対数を決定するステップと、（ｅ）ゲノム領域の第２のセット、および任意選択でゲノム領域の第１のセットについて、所定の量で、リード深度を提供する少なくとも１つのベイト混合物を同定するステップとを含む、方法を提供する。

別の態様では、本開示は、対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成され、（ａ）無細胞ＤＮＡ分子に関連する複数の配列リードのそれぞれについて、複数の配列リードの１つまたは複数の配列リードで検出されるインデルの所定の期待値と、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが無細胞ＤＮＡ分子の所与の無細胞ＤＮＡ分子に存在する真のインデルである、所定の期待値と、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値とを提供するステップと、（ｂ）核酸シーケンシングによって生成される配列リードに特徴的な１つまたは複数のモデルパラメータの定量的尺度を提供するステップと、（ｃ）無細胞ＤＮＡ分子に関連する複数の配列リードにおける１つまたは複数の候補インデルを検出するステップと、（ｄ）各候補インデルについて、モデルパラメータの１つまたは複数を使用して仮説検定を行うステップであって、候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップとを含む、方法を提供する。

別の態様では、本開示は、（ａ）所定量のＤＮＡを含む試料と、（ｂ）（ｉ）所定量のＤＮＡを含む核酸試料のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、第１のベイトセットの飽和点未満である第１の濃度比で提供される、第１のベイトセット、および（ｉｉ）核酸試料のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、第２のベイトセットの飽和点に関連する第２の濃度比で提供される、第２のベイトセットを含むベイトセットパネルとを含む、キットを提供する。

一部の実施形態では、対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法は、ステップ（ａ）の前に身体試料における無細胞ＤＮＡから１つまたは複数の遺伝子座を富化し、それにより、富化されたポリヌクレオチドを生ずるステップをさらに含む。

一部の実施形態では、方法は、アンプリコンのファミリーを生ずるために、富化されたポリヌクレオチドを増幅するステップであって、各ファミリーは無細胞ＤＮＡ分子の一本鎖に由来するアンプリコンを含む、ステップをさらに含む。一部の実施形態では、非生物学的エラーは、複数のゲノム塩基位置でのシーケンシングにおけるエラーを含む。一部の実施形態では、非生物学的エラーは、複数のゲノム塩基位置での増幅におけるエラーを含む。

一部の実施形態では、モデルパラメータは、（ｉ）１つまたは複数のバリアントアレルのそれぞれについて、前記バリアントアレルの頻度（α）および前記バリアントアレル以外の非参照アレルの頻度（α’）、（ｉｉ）鎖のファミリーの全フォワード鎖におけるインデルエラーの頻度（β_１）であって、ファミリーが、無細胞ＤＮＡ分子の一本鎖に由来するアンプリコンのコレクションを含む、頻度、（ｉｉｉ）鎖のファミリーの全リバース鎖におけるインデルエラーの頻度（β_２）、ならびに（ｉｖ）配列リードにおけるインデルエラーの頻度（γ）の１つまたは複数（例えば、このうちの１つまたはそれより多く、２つまたはそれより多く、３つまたはそれより多く、あるいは４つ）を含む。

一部の実施形態では、仮説検定を行うステップは、マルチパラメータ最大化アルゴリズムを実行するステップを含む。一部の実施形態では、マルチパラメータ最大化アルゴリズムは、Ｎｅｌｄｅｒ−Ｍｅａｄアルゴリズムを含む。ある実施形態では、候補インデルを真のインデルまたは導入されたインデルとして分類することは、（ａ）マルチパラメータ尤度関数を最大化することと、（ｂ）最大尤度関数値が所定の閾値より大きい場合に候補インデルを真のインデルとして分類することと、（ｃ）最大尤度関数値が所定の閾値未満またはそれと等しい場合に候補インデルを導入されたインデルとして分類することとを含む。

別の態様では、本開示は、１つまたは複数のコンピュータプロセッサによって実行すると、１つまたは複数の目的のバックボーンゲノム領域を同定するステップであって、１つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、１つまたは複数の目的のホットスポットゲノム領域を同定するステップと、目的のバックボーンゲノム領域を選択的に捕捉する第１のベイトセットを創製するステップと、目的のホット−スポットゲノム領域を選択的に捕捉する第２のベイトセットを創製するステップであって、第２のベイトセットが、第１のベイトセットより高い捕捉効率を有するステップとを含む、ベイトセットを生成するための方法を実装する、機械により実行可能なコードを含む、非一過性コンピュータ可読媒体を提供する。

別の態様では、本開示は、１つまたは複数のコンピュータプロセッサによって実行すると、（ａ）各パネルブロックについて、（ｉ）パネルブロックの有用性を計算し、（ｉｉ）パネルブロックのシーケンシングロードを計算し、（ｉｉｉ）パネルブロックの順位付け関数を計算するステップと、（ｂ）最適化プロセスを実行して、選択されたパネルブロックの合計順位付け関数値を最大化するパネルブロックのセットを選択するステップとを含むパネルブロックのセットを選択する方法を実装する、機械により実行可能なコードを含む、非一過性コンピュータ可読媒体を提供する。

別の態様では、本開示は、機械により実行可能なコードを含む非一過性コンピュータ可読媒体であって、１つまたは複数のコンピュータプロセッサによって実行すると、対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成され、（ａ）無細胞ＤＮＡ分子に関連する複数の配列リードのそれぞれについて、複数の配列リードの１つまたは複数の配列リードで検出されるインデルの所定の期待値と、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが無細胞ＤＮＡ分子の所与の無細胞ＤＮＡ分子に存在する真のインデルである、所定の期待値と、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値とを提供するステップと、（ｂ）核酸シーケンシングによって生成される配列リードに特徴的な１つまたは複数のモデルパラメータの定量的尺度を提供するステップと、（ｃ）無細胞ＤＮＡ分子に関連する複数の配列リードにおける１つまたは複数の候補インデルを検出するステップと、（ｄ）各候補インデルについて、モデルパラメータの１つまたは複数を使用して仮説検定を行うステップであって、候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップとを含む、方法を実装する非一過性コンピュータ可読媒体を提供する。

別の態様では、本開示は、複数のゲノム領域について富化するための方法であって、（ａ）所定量の試料由来の核酸を、（ｉ）試料由来の核酸のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、第１のベイトセットの飽和点未満である第１の濃度で提供される第１のベイトセットと、（ｉｉ）核酸試料のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、第２のベイトセットの飽和点と関連する第２の濃度で提供される第２のベイトセットとを含むベイト混合物と接触させるステップと、（ｂ）ゲノム領域の第１のセットおよびゲノム領域の第２のセットについて核酸試料を富化するステップとを含む、方法を提供する。

一部の実施形態では、第２のベイトセットは、第２のベイトセットのベイトを、（ｉ）第２のベイトセットのベイトの捕捉効率を、ベイトの濃度の関数として測定すること、および（ｉｉ）滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定して生成される滴定曲線に供するとき、第２のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する。一部の実施形態では、飽和点は、観測される捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の２０％未満で増加するように選択される。

一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１０％未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の５％未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の２％未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１％未満で増加するように選択される。

一部の実施形態では、第１のベイトセットまたは第２のベイトセットは、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、核酸試料は、無細胞核酸試料を含む。一部の実施形態では、方法は、（ｃ）複数の配列リードを生ずるために、富化された核酸試料をシーケンシングするステップをさらに含む。一部の実施形態では、方法は、（ｄ）核酸試料を表す核酸配列を含む出力を生じるステップをさらに含む。

別の態様では、本開示は、ベイトセットを生成するための方法であって、（ａ）所定の１つまたは複数のバックボーンゲノム領域を同定するステップであって、１つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、（ｂ）所定の１つまたは複数のホットスポットゲノム領域を同定するステップであって、１つまたは複数のホットスポットが、次の：（ｉ）ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、（ｉｉ）所定の１つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、（ｉｉｉ）関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに（ｉｖ）経験的に同定されたがんドライバー変異の１つまたは複数を使用して選択されるステップと、（ｃ）所定のバックボーンゲノム領域を選択的に捕捉する第１のベイトセットを創製するステップと、（ｄ）所定のホットスポットゲノム領域を選択的に捕捉する第２のベイトセットを創製するステップであって、第２のベイトセットが、第１のベイトセットより高い捕捉効率を有するステップとを含む、方法を提供する。一部の実施形態では、所定の領域（例えば、所定のバックボーン領域または所定のホットスポット領域）は、目的の領域（例えば、それぞれ目的のバックボーン領域または目的のホットスポット領域）である。

一部の実施形態では、所定の１つまたは複数のホットスポットを同定するステップは、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためのプログラムされたコンピュータプロセッサを使用することを含む。一部の実施形態では、所定の１つまたは複数のバックボーンゲノム領域を同定するステップは、（ｉ）所定のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすること、（ｉｉ）試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度（ＭＡＦ）値またはそのＭＡＦによって測定されたバリアントのクローン性のセットを利用すること、または（ｉｉｉ）（ｉ）と（ｉｉ）との組合せを含む。

一部の実施形態では、ゲノム領域のシーケンシングロードは、（ｉ）塩基対におけるゲノム領域のサイズ、（ｉｉ）ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、（ｉｉｉ）ゲノム領域の配列バイアスの結果としての相対カバレッジ、（ｉｖ）ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および（ｖ）ゲノム領域の捕捉バイアスの結果としての相対カバレッジの１つまたは複数を一緒に乗算することによって計算される。一部の実施形態では、ゲノム領域の有用性は、（ｉ）ゲノム領域における１つまたは複数の行動指針を与え得る変異の頻度、（ｉｉ）ゲノム領域の平均を上回るマイナーアレル頻度（ＭＡＦ）に関連する１つまたは複数の変異の頻度、（ｉｉｉ）ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、（ｉｖ）コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの合計、および（ｖ）（１）コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの（２）コホートにおける所与の患者についての最大ＭＡＦに対する比率の１つまたは複数を一緒に乗算することによって計算される。

一部の実施形態では、行動指針を与え得る変異は、（ｉ）投薬標的化可能な変異、（ｉｉ）治療モニタリングのための変異、（ｉｉｉ）疾患特異的変異、（ｉｖ）組織特異的変異、（ｖ）細胞型特異的変異、（ｖｉ）耐性変異、および（ｖｉｉ）診断上の変異の１つまたは複数を含む。一部の実施形態では、より高いマイナーアレル頻度に関連する変異は、１つもしくは複数のドライバー変異を含むか、または外部データもしくは注釈ソースから公知である。

別の態様では、本開示は、（ａ）複数のベイト混合物を提供するステップであって、複数のベイト混合物のそれぞれがゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットと、ゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットを含み、ベイト混合物は、異なる濃度の第１のベイトセットおよび同じ濃度の第２のベイトセットを含む、ステップと、（ｂ）ベイト混合物のそれぞれを核酸試料と接触させるステップであって、ベイトセットを用いて試料から核酸を捕捉するステップであって、各混合物における第２のベイトセットが、第２のベイトセットの飽和点か、またはそれより高い濃度で提供され、試料由来の核酸が、ベイトセットによって捕捉される、ステップと、（ｃ）各ベイト混合物を用いて捕捉された核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、（ｄ）各ベイト混合物について第１のベイトセットおよび第２のベイトセットについての配列リードのリード深度を決定するステップと、（ｅ）ゲノム領域の第２のセットについてのリード深度を提供する少なくとも１つのベイト混合物を同定するステップとを含み、ゲノム領域の第２のセットについてのリード深度が、少なくとも０．０００１％を検出する感度を提供する、方法を提供する。

一部の実施形態では、第２のベイトセットは、滴定に供するときに飽和点を有し、滴定は、（ｉ）第２のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および（ｉｉ）滴定曲線内の変曲点を同定することであって、それにより、第２のベイトセットに関連する飽和点を同定することを含む滴定曲線を生成することを含む。

一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の２０％未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１０％未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の５％未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の２％未満で増加するように選択される。一部の実施形態では、飽和点は、観測された捕捉効率が、第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１％未満で増加するように選択される。

一部の実施形態では、第１のベイトセットまたは第２のベイトセットは、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、ゲノム領域の第１のセットまたは第２のゲノム領域は、１つまたは複数の行動指針を与え得る変異を含み、１つまたは複数の行動指針を与え得る変異は、（ｉ）投薬標的化可能な変異、（ｉｉ）治療モニタリングのための変異、（ｉｉｉ）疾患特異的変異、（ｉｖ）組織特異的変異、（ｖ）細胞型特異的変異、（ｖｉ）耐性変異、および（ｖｉｉ）診断上の変異の１つまたは複数を含む。

一部の実施形態では、第１および第２のゲノム領域は、表３から選択される少なくとも５つの遺伝子のそれぞれの少なくとも１部を含む。一部の実施形態では、第１および第２のゲノム領域が、約２５キロベース〜１，０００キロベースのサイズおよび１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する。

一態様では、本開示は、複数のゲノム領域を富化するための方法であって、（ａ）所定量の試料由来の核酸を、（ｉ）試料由来の核酸のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、第１のベイトセットの飽和点未満である第１の濃度で提供される第１のベイトセットと、（ｉｉ）試料由来の核酸のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、第２のベイトセットの飽和点か、またはそれより高い第２の濃度で提供される第２のベイトセットとを含むベイト混合物と接触させるステップと、（ｂ）ゲノム領域の第１のセットおよびゲノム領域の第２のセットについて飼料由来の核酸を富化するステップであって、それにより、富化された核酸を生ずるステップとを含む、方法を提供する。

一部の実施形態では、第２のベイトセットは、第２のベイトセットのベイトを、（ｉ）第２のベイトセットのベイトの捕捉効率を、ベイトの濃度の関数として測定すること、および（ｉｉ）滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定して生成される滴定曲線に供するとき、第２のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する。一部の実施形態では、第１のベイトセットの飽和点は、観測される捕捉効率が、第１の濃度の２倍のベイトの濃度で１０％未満で第１の濃度の捕捉効率について増加するように選択される。一部の実施形態では、第１のベイトセットまたは第２のベイトセットは、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、方法は、（ｃ）複数の配列リードを生ずるために、富化された核酸をシーケンシングするステップをさらに含む。一部の実施形態では、方法は、（ｄ）試料由来の核酸を表す核酸配列を含む出力を生じるステップをさらに含む。

ある態様では、本開示は、（ａ）複数のベイト混合物を提供するステップであって、複数のベイト混合物のそれぞれがゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットと、ゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットを含み、第１のベイトセットは複数のベイト混合物にわたって異なる濃度であり、第２のベイトセットは複数のベイト混合物にわたって同じ濃度である、ステップと、（ｂ）複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、第１のベイトセットおよび第２のベイトセットを用いて核酸試料から核酸を捕捉するステップであって、各ベイト混合物における第２のベイトセットが、第２のベイトセットの飽和点か、またはそれより高い第１の濃度で提供され、核酸試料由来の核酸が、第１のベイトセットおよび第２のベイトセットによって捕捉される、ステップと、（ｃ）各ベイト混合物を用いて捕捉された核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、（ｄ）各ベイト混合物について第１のベイトセットおよび第２のベイトセットについての配列リードのリード深度を決定するステップと、（ｅ）ゲノム領域の第２のセットについてのリード深度を提供する少なくとも１つのベイト混合物を同定するステップとを含み、ゲノム領域の第２のセットについてのリード深度が、少なくとも０．０００１％のマイナーアレル頻度（ＭＡＦ）の遺伝的バリアントを検出する感度を提供する、方法を提供する。一部の実施形態では、ステップ（ｄ）および／または（ｅ）は任意選択である。

一部の実施形態では、第２のベイトセットは、滴定に供するときに飽和点を有し、滴定は、（ｉ）第２のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および（ｉｉ）滴定曲線内の変曲点を同定することであって、それにより、第２のベイトセットに関連する飽和点を同定することを含む滴定曲線を生成することを含む。一部の実施形態では、飽和点は、観測される捕捉効率が、第１の濃度の２倍のベイトセットの濃度で１０％未満で第１の濃度の捕捉効率について増加するように選択される。一部の実施形態では、第１のベイトセットまたは第２のベイトセットは、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴である。一部の実施形態では、ゲノム領域の第１のセットは、１つまたは複数の行動指針を与え得る変異を含み、１つまたは複数の行動指針を与え得る変異は、（ｉ）投薬標的化可能な変異、（ｉｉ）治療モニタリングのための変異、（ｉｉｉ）疾患特異的変異、（ｉｖ）組織特異的変異、（ｖ）細胞型特異的変異、（ｖｉ）耐性変異、および（ｖｉｉ）診断上の変異の１つまたは複数を含む。一部の実施形態では、第１のゲノム領域は、表１から選択される少なくとも５つの遺伝子のそれぞれの少なくとも一部分を含む。一部の実施形態では、第１のゲノム領域は、約２５キロベース〜１，０００キロベースのサイズおよび１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する。一部の実施形態では、第２のベイトセットの飽和点は、観測された捕捉効率が第２の濃度の２倍のベイトの濃度で第２の濃度の捕捉効率の１０％未満で増加するように選択される。一部の実施形態では、ゲノム領域の第２のセットは、１つまたは複数の行動指針を与え得る変異を含み、１つまたは複数の行動指針を与え得る変異は、（ｉ）投薬標的化可能な変異、（ｉｉ）治療モニタリングのための変異、（ｉｉｉ）疾患特異的変異、（ｉｖ）組織特異的変異、（ｖ）細胞型特異的変異、（ｖｉ）耐性変異、および（ｖｉｉ）診断上の変異の１つまたは複数を含む。一部の実施形態では、第２のゲノム領域は、表１から選択される少なくとも５つの遺伝子のそれぞれの少なくとも一部分を含む。一部の実施形態では、第２のゲノム領域が、約２５キロベース〜１，０００キロベースのサイズおよび１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する。

本開示のさらなる態様および利点は、以下の詳細な説明から当業者には容易に明らかとなるが、そこには、本開示の例証的な実施形態のみが示され、記載されている。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、すべてが本開示から逸脱することなく、様々な自明の事項における修正が可能である。したがって、図面および説明は、制限的ではなく、例証的な性質と解釈されるものである。

参照による組込み
本明細書において言及されているあらゆる刊行物、特許および特許出願は、あたかも個々の刊行物、特許または特許出願が、参照により組み込まれていると特にかつ個々に示されているのと同じ程度まで、参照により本明細書に組み込まれている。参照によって組み込まれる文献および特許または特許出願が本明細書に含まれる開示と矛盾する範囲で、本明細書は、そのような矛盾する事柄に優先するおよび／または取って代わることが意図されている。

本開示の新規特色は、添付の特許請求の範囲において詳細に明記されている。本開示の特色および利点のより十分な理解は、本開示の原理が利用される説明的実施形態を明記する次の詳細な説明および添付の図面（また、本明細書における「図（Ｆｉｇｕｒｅ）」および「図（ＦＩＧ．）」）を参照することにより得られる。
本発明の実施形態において、例えば以下の項目が提供される。
（項目１）
複数のゲノム領域を富化するための方法であって、
（ａ）所定量の試料由来の核酸を、
（ｉ）前記試料由来の核酸のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、前記第１のベイトセットの飽和点未満である第１の濃度で提供される第１のベイトセットと、
（ｉｉ）前記試料由来の核酸のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、前記第２のベイトセットの飽和点か、またはそれより高い第２の濃度で提供される第２のベイトセットと
を含むベイト混合物と接触させるステップと、
（ｂ）前記ゲノム領域の第１のセットおよび前記ゲノム領域の第２のセットについて前記試料由来の核酸を富化するステップであって、それにより、富化された核酸を生ずるステップと
を含む、方法。
（項目２）
前記第２のベイトセットが、第２のベイトセットのベイトを、
（ｉ）前記第２のベイトセットのベイトの捕捉効率を、前記ベイトの濃度の関数として測定すること、および
（ｉｉ）滴定曲線内の変曲点を同定し、それにより、前記ベイトに関連する飽和点を同定すること
によって生成される前記滴定曲線に供するとき、前記第２のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する、項目１に記載の方法。
（項目３）
前記第１のベイトセットの前記飽和点が、観測された捕捉効率が第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１０％未満で増加するように選択される、項目１に記載の方法。
（項目４）
前記第１のベイトセットまたは前記第２のベイトセットが、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、項目１に記載の方法。
（項目５）
（ｃ）複数の配列リードを生ずるために、前記富化された核酸をシーケンシングするステップをさらに含む、項目１に記載の方法。
（項目６）
（ｄ）前記試料由来の核酸を表す核酸配列を含む出力を生じるステップをさらに含む、項目５に記載の方法。
（項目７）
ベイトセットを生成するための方法であって、
（ａ）所定の１つまたは複数のバックボーンゲノム領域を同定するステップであって、前記１つまたは複数のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含む、ステップと、
（ｂ）所定の１つまたは複数のホットスポットゲノム領域を同定するステップであって、前記１つまたは複数のホットスポットが、次の：
（ｉ）前記ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、
（ｉｉ）所定の１つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、
（ｉｉｉ）関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに
（ｉｖ）経験的に同定されたがんドライバー変異
の１つまたは複数を使用して選択されるステップと、
（ｃ）前記所定のバックボーンゲノム領域を選択的に捕捉する第１のベイトセットを創製するステップと、
（ｄ）前記所定のホットスポットゲノム領域を選択的に捕捉する第２のベイトセットを創製するステップであって、前記第２のベイトセットが、前記第１のベイトセットより高い捕捉効率を有するステップと
を含む、方法。
（項目８）
前記所定の１つまたは複数のホットスポットを同定するステップが、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためのプログラムされたコンピュータプロセッサを使用することを含む、項目７に記載の方法。
（項目９）
前記所定の１つまたは複数のバックボーンゲノム領域を同定するステップが、
（ｉ）前記所定のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすること、
（ｉｉ）試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度（ＭＡＦ）値またはそのＭＡＦによって測定されたバリアントのクローン性のセットを利用すること、または
（ｉｉｉ）（ｉ）と（ｉｉ）との組合せ
を含む、項目７に記載の方法。
（項目１０）
ゲノム領域の前記シーケンシングロードが、
（ｉ）塩基対における前記ゲノム領域のサイズ、
（ｉｉ）前記ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、
（ｉｉｉ）前記ゲノム領域の配列バイアスの結果としての相対カバレッジ、
（ｉｖ）前記ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および
（ｖ）前記ゲノム領域の捕捉バイアスの結果としての相対カバレッジ
の１つまたは複数を一緒に乗算することによって計算される、項目７に記載の方法。
（項目１１）
前記ゲノム領域の有用性が、
（ｉ）前記ゲノム領域における１つまたは複数の行動指針を与え得る変異の頻度、
（ｉｉ）前記ゲノム領域の平均を上回るマイナーアレル頻度（ＭＡＦ）に関連する１つまたは複数の変異の頻度、
（ｉｉｉ）前記ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、
（ｉｖ）コホートにおける前記ゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの合計、および
（ｖ）（１）コホートにおける前記ゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの（２）前記コホートにおける所与の患者についての最大ＭＡＦに対する比率
の１つまたは複数を一緒に乗算することによって計算される、項目７に記載の方法。
（項目１２）
前記１つまたは複数の行動指針を与え得る変異が、
（ｉ）投薬標的化可能な変異、
（ｉｉ）治療モニタリングのための変異、
（ｉｉｉ）疾患特異的変異、
（ｉｖ）組織特異的変異、
（ｖ）細胞型特異的変異、
（ｖｉ）耐性変異、および
（ｖｉｉ）診断上の変異
の１つまたは複数を含む、項目１１に記載の方法。
（項目１３）
より高いマイナーアレル頻度に関連する前記変異が、１つまたは複数のドライバー変異を含むか、または外部データもしくは注釈ソースから公知である、項目１１に記載の方法。
（項目１４）
（ａ）複数のベイト混合物を提供するステップであって、前記複数のベイト混合物のそれぞれがゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットと、ゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットを含み、前記第１のベイトセットが前記複数のベイト混合物にわたって異なる濃度であり、前記第２のベイトセットが前記複数のベイト混合物にわたって同じ濃度である、ステップと、
（ｂ）前記複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、前記第１のベイトセットおよび前記第２のベイトセットを用いて前記核酸試料から核酸を捕捉するステップであって、各ベイト混合物における前記第２のベイトセットが、前記第２のベイトセットの飽和点か、またはそれより高い第１の濃度で提供され、前記核酸試料由来の核酸が、前記第１のベイトセットおよび前記第２のベイトセットによって捕捉される、ステップと、
（ｃ）各ベイト混合物を用いて捕捉された前記核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、
（ｄ）各ベイト混合物について前記第１のベイトセットおよび前記第２のベイトセットについての前記配列リードのリード深度を決定するステップと、
（ｅ）前記ゲノム領域の第２のセットについてのリード深度を提供する少なくとも１つのベイト混合物を同定するステップと
を含み、前記ゲノム領域の第２のセットについてのリード深度が、少なくとも０．０００１％のマイナーアレル頻度（ＭＡＦ）の遺伝的バリアントを検出する感度を提供する、方法。
（項目１５）
前記第２のベイトセットが、滴定に供するときに飽和点を有し、滴定が、
（ｉ）前記第２のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および
（ｉｉ）前記滴定曲線内の変曲点を同定することであって、それにより、前記第２のベイトセットに関連する飽和点を同定すること
を含む滴定曲線を生成することを含む、項目１４に記載の方法。
（項目１６）
前記飽和点が、観測された捕捉効率が第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１０％未満で増加するように選択される、項目１５に記載の方法。
（項目１７）
前記第１のベイトセットまたは前記第２のベイトセットが、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、項目１４に記載の方法。
（項目１８）
前記ゲノム領域の第１のセットが、１つまたは複数の行動指針を与え得る変異を含み、前記１つまたは複数の行動指針を与え得る変異が、
（ｉ）投薬標的化可能な変異、
（ｉｉ）治療モニタリングのための変異、
（ｉｉｉ）疾患特異的変異、
（ｉｖ）組織特異的変異、
（ｖ）細胞型特異的変異、
（ｖｉ）耐性変異、および
（ｖｉｉ）診断上の変異
の１つまたは複数を含む、項目１４に記載の方法。
（項目１９）
前記第１のゲノム領域が、表３または表４から選択される少なくとも５つの遺伝子のそれぞれの少なくとも一部分を含む、項目１４に記載の方法。
（項目２０）
第１のゲノム領域が２５キロベース〜１，０００キロベースのサイズおよび１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する、項目１４に記載の方法。
（項目２１）
前記第２のベイトセットの飽和点が、観測された捕捉効率が第２の濃度の２倍のベイトの濃度で第２の濃度の捕捉効率の１０％未満で増加するように選択される、項目１に記載の方法。
（項目２２）
前記ゲノム領域の第２のセットが、１つまたは複数の行動指針を与え得る変異を含み、前記１つまたは複数の行動指針を与え得る変異が、
（ｉ）投薬標的化可能な変異、
（ｉｉ）治療モニタリングのための変異、
（ｉｉｉ）疾患特異的変異、
（ｉｖ）組織特異的変異、
（ｖ）細胞型特異的変異、
（ｖｉ）耐性変異、および
（ｖｉｉ）診断上の変異
の１つまたは複数を含む、項目１４に記載の方法。
（項目２３）
前記第２のゲノム領域が、表３または表４から選択される少なくとも５つの遺伝子のそれぞれの少なくとも一部分を含む、項目１４に記載の方法。
（項目２４）
前記第２のゲノム領域が、約２５キロベース〜１，０００キロベースのサイズおよび１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する、項目１４に記載の方法。
（項目２５）
対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法であって、前記複数の配列リードが、核酸シーケンシングによって生成され、
（ａ）無細胞ＤＮＡ分子に関連する複数の配列リードのそれぞれについて、
前記複数の配列リードの１つまたは複数の配列リードで検出されるインデルの所定の期待値と、
インデルが前記配列リードの１つまたは複数で検出されたとすると、検出されたインデルが前記無細胞ＤＮＡ分子の所与の無細胞ＤＮＡ分子に存在する真のインデルである、所定の期待値と、
インデルが前記配列リードの１つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値と
を提供するステップと、
（ｂ）核酸シーケンシングによって生成される配列リードに特徴的な１つまたは複数のモデルパラメータの定量的尺度を提供するステップと、
（ｃ）前記無細胞ＤＮＡ分子に関連する前記複数の配列リードにおける１つまたは複数の候補インデルを検出するステップと、
（ｄ）各候補インデルについて、前記モデルパラメータの１つまたは複数を使用して仮説検定を行うステップであって、前記候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップと
を含む、方法。
（項目２６）
ステップ（ａ）（ｉ）の前に前記身体試料における前記無細胞ＤＮＡから１つまたは複数の遺伝子座を富化するステップであって、それにより、富化されたポリヌクレオチドを生ずるステップをさらに含む、項目２５に記載の方法。
（項目２７）
アンプリコンのファミリーを生ずるために、前記富化されたポリヌクレオチドを増幅するステップであって、各ファミリーが前記無細胞ＤＮＡ分子の一本鎖に由来するアンプリコンを含むステップをさらに含む、項目２６に記載の方法。
（項目２８）
前記非生物学的エラーが、複数のゲノム塩基位置でのシーケンシングにおけるエラーを含む、項目２５に記載の方法。
（項目２９）
前記非生物学的エラーが、複数のゲノム塩基位置での増幅におけるエラーを含む、項目２５に記載の方法。
（項目３０）
前記モデルパラメータが、
（ｉ）１つまたは複数のバリアントアレルのそれぞれについて、前記バリアントアレルの頻度（α）および前記バリアントアレル以外の非参照アレルの頻度（α’）、
（ｉｉ）鎖のファミリーの全フォワード鎖におけるインデルエラーの頻度（β _１）であって、ファミリーが、無細胞ＤＮＡ分子の一本鎖に由来するアンプリコンのコレクションを含む、頻度、
（ｉｉｉ）鎖のファミリーの全リバース鎖におけるインデルエラーの頻度（β _２）、ならびに
（ｉｖ）配列リードにおけるインデルエラーの頻度（γ）
の１つまたは複数を含む、項目２５に記載の方法。
（項目３１）
仮説検定を行うステップが、マルチパラメータ最大化アルゴリズムを実行することを含む、項目２５に記載の方法。
（項目３２）
前記マルチパラメータ最大化アルゴリズムが、Ｎｅｌｄｅｒ−Ｍｅａｄアルゴリズムを含む、項目３１に記載の方法。
（項目３３）
前記（ｄ）の分類するステップが、
（ａ）マルチパラメータ尤度関数を最大化することと、
（ｂ）最大尤度関数値が所定の閾値より大きい場合に候補インデルを真のインデルとして分類することと、
（ｃ）前記最大尤度関数値が所定の閾値未満またはそれと等しい場合に候補インデルを導入されたインデルとして分類することと
を含む、項目２５に記載の方法。

図１は、どのように複数のリードが無細胞核酸試料から富化される各遺伝子座について生成され得るかを図解する。

図２は、大規模なファミリーによって支持される挿入の一例を図解する。図３は、リードの小規模なファミリー（実際のバリアントについて証拠を提供するようであり得る）およびリードの大規模なファミリー（ＰＣＲまたはシーケンシングに起因する可能性が高いランダムエラーを示し得る）の一例を図解する。

図４は、仮説検定で使用し得る様々なパラメータならびにどのように各パラメータが特定の確率、例えば、参照にマッチングするファミリーのリードの確率、参照にマッチングする鎖のリードの確率、および参照にマッチングするリードの確率に関連し得るかを図解する。図５は、本開示の方法を実装するようにプログラムされ得るか、または別様に構成され得るコンピュータシステムの一例を示す。

図６は、ｘ軸のインプットｃｆＤＮＡ量の関数としての、ｙ軸の特有の分子のカウントを示す例示的飽和曲線を図解する。

本発明の様々な実施形態を本明細書において示し、記載してきたが、当業者には、かかる実施形態が単なる一例として提供されていることが明らかである。当業者であれば、本発明から逸脱することなく多数のバリエーション、変化および置換を思いつくことができる。本明細書に記載されている本発明の実施形態の様々な代替を用いることができることを理解されたい。

定義
用語「遺伝的バリアント」は、本明細書において、被験体の核酸試料またはゲノムにおける変更、バリアントまたは多型を一般に指す。かかる変更、バリアントまたは多型は、被験体または他の個体の参照ゲノムであり得る参照ゲノムに関するものであり得る。一塩基多型（ＳＮＰ）は、多型の一形態である。一部の例では、１個または複数の多型は、１個または複数の一塩基変異（ＳＮＶ）、挿入、欠失、反復、小規模な挿入、小規模な欠失、小規模な反復、構造的バリアント接合部、可変長タンデム反復および／または隣接配列を含む。コピー数変異（ＣＮＶ）、トランスバージョンおよび他の再編成も、遺伝的変異の形態である。ゲノム変更は、塩基変化、挿入、欠失、反復、コピー数変異またはトランスバージョンであり得る。

用語「ポリヌクレオチド」または「ポリ核酸」は、本明細書において、１個または複数の核酸サブユニット（「核酸分子」）を含む分子を一般に指す。ポリヌクレオチドは、アデノシン（Ａ）、シトシン（Ｃ）、グアニン（Ｇ）、チミン（Ｔ）およびウラシル（Ｕ）またはこれらのバリアントから選択される１個または複数のサブユニットを含むことができる。ヌクレオチドは、Ａ、Ｃ、Ｇ、ＴもしくはＵまたはこれらのバリアントを含むことができる。ヌクレオチドは、伸びている核酸鎖に取り込まれ得るいずれかのサブユニットを含むことができる。かかるサブユニットは、Ａ、Ｃ、Ｇ、ＴまたはＵ、あるいは１個もしくは複数の相補的Ａ、Ｃ、Ｇ、ＴもしくはＵに特異的な、またはプリン（すなわち、ＡもしくはＧまたはこれらのバリアント）もしくはピリミジン（すなわち、Ｃ、ＴもしくはＵまたはこれらのバリアント）に相補的な、他のいずれかのサブユニットであり得る。サブユニットの識別は、個々の核酸塩基または塩基群（例えば、ＡＡ、ＴＡ、ＡＴ、ＧＣ、ＣＧ、ＣＴ、ＴＣ、ＧＴ、ＴＧ、ＡＣ、ＣＡまたはそれらのウラシル対応物）を分解することを可能にすることができる。一部の例では、ポリヌクレオチドは、デオキシリボ核酸（ＤＮＡ）もしくはリボ核酸（ＲＮＡ）またはこれらの誘導体である。ポリヌクレオチドは、一本鎖または二本鎖であり得る。

ポリヌクレオチドは、ＤＮＡおよび／またはＲＮＡ等、いずれの種類の核酸を含んでもよい。例えば、ポリヌクレオチドがＤＮＡである場合、これは、ゲノムＤＮＡ、相補的ＤＮＡ（ｃＤＮＡ）または他のいずれかのデオキシリボ核酸であってもよい。ポリヌクレオチドは、無細胞核酸であり得る。本明細書において使用されるとき、無細胞核酸および細胞外核酸という用語は、互換的に使用することができる。ポリヌクレオチドは、無細胞ＤＮＡ（ｃｆＤＮＡ）であってもよい。例えば、ポリヌクレオチドは、循環ＤＮＡであり得る。循環ＤＮＡは、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含むことができる。無細胞または細胞外核酸は、全血、血小板、血清、血漿、滑液、リンパ液、腹水、間質もしくは細胞外液、細胞間間隙の液、歯肉溝滲出液、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿、子宮頸部液もしくは洗浄液、膣液もしくは洗浄液、乳腺もしくは洗浄液、および／またはそれらの任意の組合せを含むがこれらに限定されない、任意の体液から誘導され得る。一部の実施形態では、無細胞または細胞外核酸は、血漿から誘導することができる。一部の実施形態では、細胞を含む体液は、無細胞または細胞外核酸を精製および／または抽出するために細胞を取り出すように処理することができる。ポリヌクレオチドは、二本鎖または一本鎖であり得る。あるいは、ポリヌクレオチドは、二本鎖部分および一本鎖部分の組合せを含むことができる。

ポリヌクレオチドは、無細胞である必要はない。一部の事例において、ポリヌクレオチドは、試料から単離することができる。試料は、分析物を含む組成物であり得る。例えば、試料は、対象から単離された任意の生物学的試料であり得、例えば、体液、全血、血小板、血清、血漿、糞便、赤血球細胞、白血球細胞もしくは白血球、内皮細胞、組織生検、滑液、リンパ液、腹水、間質もしくは細胞外液、歯肉溝滲出液を含む細胞間間隙の液、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿または他のいずれかの体液、および／またはこれらの任意の組み合わせが挙げられるが、これらに限定されない。体液は、唾液、血液または血清を含むことができる。例えば、ポリヌクレオチドは、体液、例えば、血液または血清から単離された無細胞ＤＮＡであり得る。試料は、静脈穿刺、排泄、射精、マッサージ、生検、針穿刺吸引、洗浄、擦過、外科的切開もしくは介入または他のアプローチ等が挙げられるがこれらに限定されない、様々なアプローチによって対象から得ることができる腫瘍試料であってもよい。一部の実施形態では、試料は、核酸試料、例えば、精製された核酸試料である。一部の実施形態では、核酸試料は、無細胞ＤＮＡ（ｃｆＤＮＡ）を含む。試料中の分析物は、様々な精製段階であり得る。例えば、生の試料が、未精製の状態で分析物を含み得る対象から直接採取されてもよい。試料は、分析物について富化されてもよい。また分析物は、単離されたまたは実質的に単離された形態で試料中に存在してもよい。

ポリヌクレオチドは、急性リンパ芽球性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、副腎皮質癌、カポジ肉腫、肛門癌、基底細胞癌、胆管癌、膀胱癌、骨癌、骨肉腫、悪性線維性組織球腫、脳幹神経膠腫、脳癌、頭蓋咽頭腫、上衣芽細胞腫、上衣腫、髄芽腫、髄上皮腫（ｍｅｄｕｌｌｏｅｐｔｉｔｈｅｌｉｏｍａ）、松果体実質細胞腫瘍、乳癌、気管支腫瘍、バーキットリンパ腫、非ホジキンリンパ腫、カルチノイド腫瘍、子宮頸部癌、脊索腫、慢性リンパ球性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、結腸癌、結腸直腸癌、皮膚Ｔ細胞リンパ腫、乳管内上皮内癌、子宮内膜癌、食道癌、ユーイング肉腫、眼癌、眼球内メラノーマ、網膜芽細胞腫、線維性組織球腫、胆嚢癌、胃癌、神経膠腫、ヘアリー細胞白血病、頭頸部癌、心臓癌、肝細胞（肝臓）癌、ホジキンリンパ腫、下咽頭癌、腎臓癌、喉頭癌、口唇癌、口腔癌、肺癌、非小細胞癌、小細胞癌、メラノーマ、口内（ｍｏｕｔｈ）癌、骨髄異形成症候群、多発性骨髄腫、髄芽腫、鼻腔癌、副鼻腔癌、神経芽細胞腫、鼻咽頭癌、口腔内（ｏｒａｌ）癌、中咽頭癌、骨肉腫、卵巣癌、膵臓癌、乳頭腫、傍神経節腫、副甲状腺癌、陰茎癌、咽頭癌、下垂体腫瘍、形質細胞新生物、前立腺癌、直腸癌、腎細胞癌、横紋筋肉腫、唾液腺癌、セザリー症候群、皮膚癌、非メラノーマ、小腸癌、軟部組織肉腫、扁平上皮癌、精巣癌、咽喉癌、胸腺腫、甲状腺癌、尿道癌、子宮癌、子宮肉腫、腟癌、外陰部癌、ワルデンシュトレームマクログロブリン血症および／またはウィルムス腫瘍などのがんに関連した配列を含み得る。

試料は、ゲノム当量を含む核酸の様々な量を含むことができる。例えば、約３０ｎｇのＤＮＡの試料は、約１０，０００（１０^４）の一倍体ヒトゲノム当量を含有することができ、ｃｆＤＮＡの場合、約２千億（２×１０^１１）個の個々のポリヌクレオチド分子を含有することができる。同様に、約１００ｎｇのＤＮＡの試料は、約３０，０００の一倍体ヒトゲノム当量を含有することができ、ｃｆＤＮＡの場合、約６千億個の個々の分子を含有することができる。

試料は、異なる供給源由来の核酸を含むことができる。例えば、試料は、生殖系列ＤＮＡまたは体細胞ＤＮＡを含むことができる。試料は、変異を保有する核酸を含むことができる。例えば、試料は、生殖系列変異および／または体細胞変異を保有するＤＮＡを含むことができる。試料は、がん関連変異（例えば、がん関連体細胞変異）を保有するＤＮＡを含むこともできる。

用語「被験体」は、本明細書において、哺乳動物種（例えば、ヒト）もしくは鳥類（例えば、トリ）種等の動物、または植物等の他の生物を一般に指す。より具体的には、被験体は、脊椎動物、哺乳動物、マウス、霊長類、サルまたはヒトであり得る。動物として、家畜、競技用動物（ｓｐｏｒｔａｎｉｍａｌ）およびペットが挙げられるがこれらに限定されない。被験体は、健康個体、疾患もしくは疾患素因を有するもしくはこれを有すると疑われる個体、または治療を必要とするもしくは治療を必要とすると疑われる個体であり得る。被験体は、患者であり得る。

用語「ゲノム」は、本明細書において、生物の遺伝情報の全体を一般に指す。ゲノムは、ＤＮＡまたはＲＮＡのいずれかにおいてコードされ得る。ゲノムは、タンパク質をコードするコード領域と共に非コード領域を含むことができる。ゲノムは、生物における全染色体の配列を一体に含むことができる。例えば、ヒトゲノムは、総計４６本の染色体を有する。これら全ての配列が一体に、ヒトゲノムを構成し得る。ゲノムは、二倍体または一倍体ゲノムを含み得る。

「ベイト」という用語は、本明細書において使用されるとき、目的の特定のゲノム領域（例えば、標的、または所定の目的のゲノム領域）を捕捉するように設計され、使用される標的特異的オリゴヌクレオチド（例えば、捕捉プローブ）を一般的に指す。ベイトは、相補的な核酸に選択的にハイブリダイズすることによってその意図する標的を捕捉し得る。

「ベイトパネル」または「ベイトセットパネル」という用語は、本明細書において使用されるとき、目的のゲノム領域の選択されたセットを標的としたベイトのセットを一般的に指す。ベイトパネルまたはベイトセットパネルは、ベイト混合物として参照される場合がある。ベイトパネルは、単一の選択的ハイブリダイゼーションステップでその意図する標的を捕捉し得る。

本明細書において使用されるとき、遺伝的バリアント（例えば、インデル）を検出する「精度」という用語は、一般に、生物学的起源に起因する（例えば、シーケンシングまたは増幅エラーから生じる導入されたエラーに起因しない）真の遺伝的バリアントとして同定される１つまたは複数の配列リードの分析を通して検出される候補（例えば、検出された）遺伝的バリアントの百分率を指す。本明細書において使用されるとき、遺伝的バリアント（例えば、インデル）を検出する「エラー率」という用語は、一般に、非生物学的起源（例えば、シーケンシングまたは増幅エラー）に起因する導入された遺伝的バリアントとして同定される１つまたは複数の配列リードの分析を通して検出される候補（例えば、検出された）遺伝的バリアントの百分率を指す。例えば、１つまたは複数の配列リードの分析が１００の候補遺伝的バリアントを同定し、そのうち９０が生物学的起源に起因し、１０が非生物学的起源に起因するとき、この分析は、９０％の遺伝的バリアント検出精度および１０％のエラー率を有する。

参照数値に関する用語「約」およびその文法上の等価物は、該値から最大プラスまたはマイナス１０％の値の範囲を含むことができる。例えば、「約１０」の量は、９〜１１の量を含むことができる。他の実施形態では、参照数値に関する用語「約」は、該値からプラスまたはマイナス１０％、９％、８％、７％、６％、５％、４％、３％、２％または１％の値の範囲を含むことができる。

参照数値に関する用語「少なくとも」およびその文法上の等価物は、参照数値および該値を超えるものを含むことができる。例えば、「少なくとも１０」の量は、１０の値、ならびに１１、１００および１，０００等、１０を上回るいずれかの数値を含むことができる。

参照数値に関する用語「多くても」およびその文法上の等価物は、参照数値および該値に満たないものを含むことができる。例えば、「多くても１０」の量は、１０の値、ならびに９、８、５、１、０．５および０．１等、１０を下回るいずれかの数値を含むことができる。

「処理すること」、「計算すること」および「比較すること」という用語は、互換的に使用することができる。これらの用語は、差異、例えば、数または配列の差異を決定することを指すことができる。例えば、遺伝子発現、コピー数多型（ＣＮＶ）、インデル、および／または一塩基バリアント（ＳＮＶ）値もしくは配列を処理することができる。

本開示は、無細胞核酸（例えば、デオキシリボ核酸（ＤＮＡ））の多重解像度分析のための方法およびシステムであって、目的の標的ゲノム領域は、差次的タイリングおよび捕捉スキームを使用して１つまたは複数のベイトセットパネルについて選択された捕捉プローブ（「ベイト」）を用いて富化され得る、方法およびシステムを提供する。差次的タイリングおよび捕捉スキームは、異なる相対濃度のベイトセットを使用して、ベイトに関連するゲノム領域にわたって差次的に（例えば、異なる「解像度」で）タイルし、制約のセット（例えば、各ベイトのシーケンシングロード、有用性などのシーケンサー制約）にかけ、下流のシーケンシングについて所望のレベルで、目的の標的ゲノム領域を捕捉する。これらの目的の標的ゲノム領域は、一塩基バリアント（ＳＮＶ）およびインデル（つまり、挿入または欠失）を含むことができる。目的の標的ゲノム領域は、目的のバックボーンゲノム領域（「バックボーン領域」）または目的のホット−スポットゲノム領域（「ホット−スポット領域」または「ホットスポット領域」または「ホット−スポット」または「ホットスポット」）を含み得る。「ホットスポット」が、配列バリアントに関連する特定の遺伝子座を指すことができる一方で、「バックボーン」領域は、それぞれが１つまたは複数の可能性のある配列バリアントを有し得る、より大きなゲノム領域を指すことができる。例えば、バックボーン領域は、１つまたは複数のがん関連変異を含む領域であり得、一方でホットスポットは、再発がんに関連する特定の変異を有する遺伝子座であり得る。目的のバックボーンおよびホットスポットゲノム領域の両方が、液体生検アッセイに通常含まれ、がんを有する対象においてその１つまたは複数のバリアントが見られると予測され得る、腫瘍関連マーカー遺伝子（例えば、ＢＲＡＦ、ＢＲＣＡ、ＥＧＦＲ、ＫＲＡＳ、ＰＩＫ３ＣＡ、ＲＯＳ１、ＴＰ５３、および他のマーカー）を含み得る。

ベイトセットパネルに包含するために選択され得る腫瘍関連マーカー遺伝子のセットの中で、目的のホットスポットゲノム領域は、実験プロトコールにおける目的のバックボーンゲノム領域と比較して高い割合の配列リードによって表されるように選択され得る。この実験プロトコールは、単離、増幅、捕捉、シーケンシングおよびデータ分析などのステップを含み得る。ホットスポット領域またはバックボーン領域としての領域の選択は、それぞれの領域に関連する捕捉効率、シーケンシングロードおよび／または有用性、およびそれらに対応するベイトなどの考慮事項によって駆動され得る。有用性は、液体生検アッセイに向けた目的のゲノムマーカー（例えば、腫瘍マーカー）の臨床的意義（例えば、「臨床的価値」）、例えば、所定のがんドライバー変異、関連する患者コホートにわたって有病率を有するゲノム領域、経験的に同定されたがんドライバー変異、またはヌクレオソーム関連ゲノム領域などによって評価され得る。例えば、有用性は、試料の起源の組織もしくは疾患状態の決定に向けた検出または寄与における実用的および／または疾患関連遺伝的バリアントの予測される収率を表す測定基準によって測定することができる。有用性は、臨床的価値の単調増加関数であり得る。

無細胞核酸の所与の試料の各シーケンシングのランが、ある特定のリードの総数によって典型的には制限されることを考慮すると、バックボーン領域と比較して「ホット−スポット領域」について優先的に富化するベイトセットパネルを生成する多重解像度分析アプローチは、ホットスポット領域についてバックボーン領域に対するより高いリード深度でシーケンシングに焦点を当てることによって、がんの検出および評価の用途のための遺伝的バリアント検出のためのシーケンシングリードの効率的な使用を可能にする。このアプローチを使用することは、制限されたまたは制約のあるシーケンシングロード（例えば、アッセイされる試料当たりのシーケンシングされるリードの数）である場合、試料アッセイの改善を可能にし、最適化されていない試料アッセイと比較して、より大きな数の臨床的に行動指針を与え得る遺伝的バリアントを試料アッセイごとに検出し得る。

本開示は、対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成される方法を提供する。ｃｆＤＮＡ分子に関連する複数の配列リードのそれぞれについて、候補インデルが同定され得る。次に、（ｉ）複数の配列リードの１つまたは複数の配列リードで検出されるインデルの、（ｉｉ）インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが無細胞ＤＮＡ分子の所与のｃｆＤＮＡ分子に存在する真のインデルである、および／または（ｉｉｉ）、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値の組み合わせを、１つまたは複数のモデルパラメータと併せて使用して、仮説検定を行い、各候補インデルは、真のインデルまたは導入されたインデルのいずれかとして分類され得る。このアプローチは、エラーを減少させ、配列リードデータからインデルを検出する精度を改善し得る。
序論

多重解像度分析の一実施形態は、以下のとおり進行する。ゲノムの複数の領域が、シーケンシングのために選択される。これらの領域は、パネルまたはパネルブロックとして集約的に参照され得る。パネルは、ゲノム領域の第１のセットとゲノム領域の第２のセットとに分割される。ゲノム領域の第１のセットは、バックボーン領域として参照され得、一方で、第２のセットは、ホットスポット領域として参照され得る。これらの領域は、実施者によって所望されるように、遺伝子間で、遺伝子内で、または遺伝子外で分割することができる。例えば、遺伝子のエクソンは、ホットスポット領域に割り当てられた部分とバックボーン領域に割り当てられた部分とに分割することができる。

第１のゲノム領域および第２のゲノム領域にそれぞれ選択的にハイブリダイズする第１のベイトセットおよび第２のベイトセットが調製される。本明細書に記載される方法、例えば、滴定曲線の調製を使用して、所定量のＤＮＡを有する試験試料について、飽和点で（ホットスポット領域に向けたベイトセットのため）および飽和点未満で（バックボーン領域に向けたベイトセットのため）、試料中のＤＮＡを捕捉する複数のベイトセット濃度が決定される。飽和点で試料からＤＮＡ分子を捕捉することは、分子遺伝的バリアントがより捕捉されやすいので、最高レベルの感度で遺伝的バリアントを検出することに寄与する。

試料から得ることができるシーケンシングデータの量は有限であり、核酸鋳型の質、標的配列の数、特異的配列の希少性、シーケンシング技術の制限、ならびに時間および費用などの実際的考慮事項のような因子によって制約される。そのように「リードバジェット」は、試料から抽出することができる遺伝子情報の量を概念化する一つの方法である。シーケンシング実験において所定量のＤＮＡを含む試験試料に割り当てられる塩基リードの総数を同定する、試料ごとのリードバジェットも選択し得る。リードバジェットは、例えば、増幅を通して生成される冗長なリードを含む、得られる総リードに基づくものでもよい。代替的に、リードバジェットは、試料で検出される特有の分子の数に基づくものでもよい。ある特定の実施形態では、リードバジェットは、遺伝子座でのコールのための二本鎖支持体の量を反映することができる。つまり、ＤＮＡ分子の両方の鎖からそのリードについての遺伝子座の百分率が検出される。

リードバジェットの因子は、リード深度およびパネル長を含む。例えば、３，０００，０００，０００リードのリードバジェットは、２０，０００リード／塩基の平均リード深度で１５０，０００塩基として割り当てることができる。リード深度は、遺伝子座でリードを生じる分子の数を指すことができる。本開示では、各塩基でのリードは、第１の平均リード深度でのパネルのバックボーン領域の塩基と、より深いリード深度でのパネルのホットスポット領域の塩基との間に割り当てることができる。

非限定的な例として、リードバジェットが所与の試料について１００，０００のリードのカウントからなる場合、これらの１００，０００のリードカウントは、バックボーン領域のリードとホットスポット領域のリードとに分割される。これらのリードの大多数（例えば、９０，０００リード）をバックボーン領域に割り当てると、リードの少数（例えば、残りの１０，０００リード）がホットスポット領域に割り当てられることになる。逆に、リードの大多数（例えば、９０，０００リード）をホットスポット領域に割り当てると、リードの少数（例えば、残りの１０，０００リード）がバックボーン領域に割り当てられることになる。そのように、熟練した作業者は、所望のレベルの感度および特異性を提供するように、リードバジェットを割り当てることができる。ある特定の実施形態では、リードバジェットは、例えば２０，０００塩基〜１００，０００塩基にわたって、１００，０００，０００リード〜１００，０００，０００，０００リード、例えば５００，０００，０００リード〜５０，０００，０００，０００リード、または１，０００，０００，０００リード〜５，０００，０００，０００リードであり得る。

第１および第２の感度レベルは、それぞれ、バックボーンおよびホットスポット領域における遺伝的バリアントの検出のために選択される。感度は、本明細書において使用されるとき、試料における頻度の関数としての遺伝的バリアントの検出限界を指す。例えば、感度は、少なくとも１％、少なくとも０．１％、少なくとも０．０１％、少なくとも０．００１％、少なくとも０．０００１％、または少なくとも０．００００１％であり得、それぞれ、所与の配列が、少なくとも１％、少なくとも０．１％、少なくとも０．０１％、少なくとも０．００１％、少なくとも０．０００１％、または少なくとも０．００００１％の頻度で試料中で検出することができることを意味する。つまり、レベルで試料に存在する遺伝的バリアントは、シーケンシングによって検出可能である。典型的には、ホットスポット領域について選択される感度は、バックボーン領域について選択される感度よりも高い。例えば、ホットスポット領域の感度レベルは少なくとも０．００１％で選択することができ、一方でバックグラウンド領域の感度レベルは少なくとも０．１％または少なくとも１％であり得る。

バックグラウンド領域およびホットスポット領域に向けたベイトセットの相対濃度は、選択された試料のバックボーンおよびホットスポット領域について選択されたリードバジェットおよび選択された感度について、シーケンシング実験におけるリードを最適化するように選択することができる。そのように、例えば、所定量のＤＮＡを含む試験試料と、飽和でホットスポット領域についてのＤＮＡを捕捉するホットスポットベイトセットとがあると、試料について飽和未満であるバックボーンベイトセットの量が、選択されたリードバジェット内でリードを生じるシーケンシング実験において、得られるリードセットが、予め選択された感度レベルで、ホットスポット領域およびバックボーン領域にある遺伝的バリアントを検出するように選択される。

ベイトセットの相対量は、いくつかの因子の関数である。これらの因子の１つは、ホットスポット領域およびバックボーン領域にそれぞれ割り当てられたパネルの相対的な割合である。パネルにおけるホットスポット領域の相対百分率が大きくなるほど、バックボーン領域に割り当てることができるリードおよびバジェットの数は少なくなる。別の因子は、ホットスポット領域について選択される検出感度である。所与の試料について、ホットスポット領域のために必要な感度が高くなるほど、バックボーン領域のための感度は低くなる。別の因子は、リードバジェットである。ホットスポット領域のための感度について、リードバジェットが小規模になるほど、バックボーン領域のための可能な感度は低くなる。別の因子は、パネル全体のサイズである。任意の所与のリードバジェットについて、パネルが大規模になるほど、バックボーン領域のさらなる感度を、ホットスポット領域で所望の感度を達成するために犠牲にしなければならない。

任意の所与のリードバジェットについて、バックボーン領域へ割り当てられるリードの百分率を増加させることが、ホットスポット領域での検出感度を低下させることは、明らかである。逆に、ホットスポット領域に割り当てられるリードバジェットの量を増加させることによって、ホットスポット領域での検出感度を増加させることは、バックボーン領域の検出を低下させる。したがって、ホットスポット領域の相対感度レベルは標的検出レベルを達成するために十分に高くし得るが、バックボーン領域の感度レベルは、遺伝的バリアントの有意なレベルが見逃されるほど低くない。これらの相対レベルは、所望の結果が達成されるように、実施者によって選択される。一部の実施形態では、熟練した作業者は、捕捉される領域のリード深度が所望のホットスポット感度およびバックボーン感度を提供するように、試料中のホットスポット領域の全て（または実質的に全て）およびバックボーン領域の一部を捕捉するように計算されたベイト混合物を使用する。
ヌクレオソーム関連ゲノム領域

一態様では、ベイトセットパネルは、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化する１つまたは複数のベイトセットを含み得る。ヌクレオソーム関連領域は、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み得る。差異のあるヌクレオソーム占有は、起源の細胞もしくは組織型または疾患状態の特徴であり得る。差異のあるヌクレオソーム占有の分析は、所与の細胞または組織型の１つまたは複数のヌクレオソーム占有プロファイルを使用して行われ得る。ヌクレオソーム占有プロファイリング技術の例としては、参照によって本明細書に組み込まれる、Ｓｔａｔｈａｍら、ＧｅｎｏｍｉｃｓＤａｔａ、第３巻、２０１５年３月、９４〜９６頁（２０１５年）が挙げられる。対象から取得された試料における無細胞核酸は、細胞、組織および器官におけるアポトーシスおよび壊死プロセスの組合せを介して主に流出され得る。ゲノムのある特定の位置における可変のヌクレオソーム占有およびＤＮＡ切断に対する保護の結果として、アポトーシスプロセスおよび壊死プロセスに関連するヌクレオソームパターンまたはプロファイルは、ゲノムのヌクレオソーム関連領域について無細胞核酸断片を分析することから明らかになり得る。

そのようなヌクレオソーム関連パターンの検出は、独立して、または検出された体細胞バリアントと組み合わせて、対象における状態をモニタリングするために使用することができる。例えば、腫瘍が拡大するとき、腫瘍微小環境における壊死対アポトーシスの比率は変化し得る。壊死および／またはアポトーシスのそのような変化は、１つまたは複数のヌクレオソーム関連領域について無細胞核酸試料を選択的に富化することによって検出することができる。別の例として、断片の長さの分布が、異なる細胞の種類にわたるまたは腫瘍対非腫瘍細胞にわたる差異のあるヌクレオソームの保護により観察され得る。断片の長さの分布についてのヌクレオソーム関連領域の分析は、がんの検出および評価の用途について臨床的に関連し得る。この分析は、ヌクレオソーム関連領域について選択的に富化すること、次いで核酸試料を表す複数の配列リードを生ずるために、富化された領域をシーケンシングすること、および目的の遺伝的バリアントおよびヌクレオソームプロファイルについて配列リードを分析することを含み得る。

ヌクレオソーム関連領域が同定されると、それをモジュラパネルの設計のために使用することができる。下記を参照されたい。そのようなモジュラパネルの設計は、ヌクレオソームプロファイリングに関連するゲノムの領域を選択的に富化するプローブまたはベイトのセットの設計を可能にし得る。この「ヌクレオソームアウェアネス」を組み込むことによって、多くの個体からの配列データを収集して、パネルの設計の手順、例えば、標的とするゲノム位置の決定およびこれらのゲノム位置のためのプローブの最適濃度を最適化することができる。

体細胞多型および構造多型の両方ならびに不安定性の知識を組み込むことによって、プローブ、ベイトまたはプライマーのパネルを、構造多型または不安定性の公知のパターンまたはクラスターを有するゲノムの特定の部分（「ホットスポット」）を標的とするように設計することができる。例えば、配列データの統計学的分析により、一連の蓄積された体細胞事象および構造多型が明らかになり、それにより、クローン進化の研究が可能になる。データ分析は、コホートにわたる差異のあるカバレッジ、腫瘍のある特定のサブセットの存在を示すパターン、高い体細胞変異負荷を有する試料の外来構造的事象、および血液細胞と腫瘍細胞との対比から生じる差異のあるカバレッジを含む重要な生物学的洞察を明らかにする。

局在化ゲノム領域は、およそまたは２〜２００塩基対、２〜１９０塩基対、２〜１８０塩基対、２〜１７０塩基対、２〜１６０塩基対、２〜１５０塩基対、２〜１４０塩基対、２〜１３０塩基対、２〜１２０塩基対、２〜１１０塩基対、２〜１００塩基対、２〜９０塩基対、２〜８０塩基対、２〜７０塩基対、２〜６０塩基対、２〜５０塩基対、２〜４０塩基対、２〜３０塩基対、２〜２０塩基対、２〜１０塩基対、および／または２〜５塩基対の長さの範囲であり得るゲノムの短い領域を指す。各局在化ゲノム領域は、有意な構造多型または不安定性のパターンまたはクラスターを含み得る。ゲノムパーティションマップが、関連する局在化ゲノム領域を同定するために提供され得る。局在化ゲノム領域は、有意な構造多型または構造不安定性のパターンまたはクラスターを含み得る。クラスターは、局在化ゲノム領域内のホットスポット領域であり得る。ホットスポット領域は、１つまたは複数の有意な変動またはピークを含み得る。構造多型は、挿入、欠失、転位、遺伝子再編成、メチル化状態、マイクロサテライト、コピー数多型、コピー数関連構造多型、または鑑別を示す任意の他の多型からなる群から選択され得る。構造多型は、ヌクレオソームポジショニングに多型を生じ得る。

ゲノムパーティションマップは、（ａ）コホートにおける２つまたはそれより多い対象由来の無細胞ＤＮＡまたはＲＮＡを提供すること、（ｂ）無細胞ＤＮＡまたはＲＮＡの試料のそれぞれから複数の配列リードを取得すること、および（ｃ）複数の配列リードを分析することであって、それぞれ有意な構造多型または不安定性のパターンまたはクラスターを含む１つまたは複数の局在化ゲノム領域を同定することによって得ることができる。配列情報に統計学的分析を行って、配列リードのセットを、別個のコホート（例えば、疾患状態または非疾患状態などの共通の特徴を有する対象の一群）を表す１つまたは複数のヌクレオソーム占有プロファイルと関連づけてもよい。

統計学的分析は、さらなる分析のために、目的の遺伝子を表す関連ゲノム区間を列挙する１つまたは複数のゲノムパーティションマップを含んでもよい。統計学的分析は、ゲノムパーティションマップに基づいて、セットの１つまたは複数の局在化ゲノム領域を選択することをさらに含んでもよい。統計学的分析は、１つまたは複数のヌクレオソームマップ破損のセットを取得するために、１つまたは複数の局在化ゲノム領域のセットを分析することをさらに含んでもよい。統計学的分析は、１つまたは複数の（例えば、１つまたは複数、２つまたはそれより多い、または３つの）パターン認識、深層学習、および教師なし学習を含んでもよい。

ヌクレオソームマップ破損は、生物学的に関連する情報に関して、所与の局在化ゲノム領域を特徴づける測定値である。ヌクレオソームマップ破損は、野生型、体細胞バリアント、生殖細胞系列バリアント、およびＤＮＡのメチル化からなる群から選択されるドライバー変異に関連し得る。

１つまたは複数のヌクレオソームマップ破損を使用して、配列リードのセットを、別個のコホートを表す１つまたは複数のヌクレオソーム占有プロファイルに関連するとして分類してもよい。これらのヌクレオソーム占有プロファイルは、１つまたは複数の評価を伴い得る。評価は、治療介入（例えば、処置オプション、処置の選択、生検および／またはイメージングによるさらなる評価）の一部として考慮され得る。

評価は、適応症、腫瘍の種類、腫瘍の重症度、腫瘍の侵襲性、処置に対する腫瘍の耐性、および腫瘍クローン性からなる群から選択され得る。腫瘍クローン性の評価は、試料中の無細胞ＤＮＡ分子にわたるヌクレオソームマップ破損の不均一性の観察から決定され得る。２つまたはそれより多いクローンのそれぞれの相対的寄与の評価が決定される。

ベイトセットパネルの１つまたは複数のヌクレオソーム関連領域はそれぞれ、（ｉ）ヌクレオソームポジショニングの多型を含む顕著な構造多型であり、挿入、欠失、転位、遺伝子再編成、メチル化状態、マイクロサテライト、コピー数多型、コピー数関連構造多型、または区別を示す任意の他の多型からなる群から選択される構造多型、および（ｉｉ）ゲノム中のヌクレオソームマップ破損の１つまたは複数の位置を示すゲノムパーティションマップにおける１つまたは複数の顕著な変動またはピークを含む不安定性の少なくとも１つを含み得る。ベイトセットパネルの１つまたは複数のベイトセットは、１つもしくは複数の疾患状態および１つもしくは複数の非疾患状態に関連する複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成され得る。

ベイトセットパネルの１つまたは複数のベイトセットは、無細胞デオキシリボ核酸（ｃｆＤＮＡ）試料における１つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。例えば、ベイトセットは、核酸試料（ｎｕｃｌｅｉｃｓａｍｐｌｅ）をベイトセットに接触させること、およびベイトセットをベイトセットに関連するヌクレオソーム関連ゲノム領域のセットに選択的にハイブリダイズさせることによって、１つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。

ある態様では、ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法は、（ａ）核酸試料をベイトセットパネルに接触させるステップであって、前記ベイトセットパネルがゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化する１つまたは複数のベイトセットを含む、ステップと、（ｂ）ゲノムの１つまたは複数のヌクレオソーム関連領域について核酸試料を富化するステップとを含み得る。ベイトセットパネルにおける１つまたは複数のベイトセットは、１つもしくは複数の疾患状態および１つもしくは複数の非疾患状態に関連する複数の参照ヌクレオソーム占有プロファイルの関数に基づいて、ゲノムのヌクレオソーム関連領域を捕捉するように構成され得る。複数の参照ヌクレオソーム占有プロファイルは、その分析によってヌクレオソーム関連バリアント検出の捕捉のための標的であり得るゲノム領域および／または位置のパターンもしくはクラスターを示し得る「マップ」として機能し得る。

ベイトセットパネルにおける１つまたは複数のベイトセットは、無細胞デオキシリボ核酸（ｃｆＤＮＡ）試料における１つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。ゲノムのヌクレオソーム関連領域について核酸試料を富化するための方法は、ゲノムのヌクレオソーム関連領域の配列リードを生ずるために、富化された核酸をシーケンシングするステップをさらに含み得る。これらの配列リードを、参照ゲノムに整列させて、ヌクレオソーム関連および／または遺伝的バリアント（例えば、ＳＮＶおよび／またはインデル）について分析してもよい。

一態様では、ベイトセットを生成するための方法は、（ａ）ヌクレオソームプロファイルに関連する１つまたは複数のゲノム領域を同定するステップと、（ｂ）前記領域を選択的に捕捉するベイトセットを選択するステップとを含み得る。ベイトセットパネルにおけるベイトセットは、無細胞デオキシリボ核酸（ｃｆＤＮＡ）試料における１つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。例えば、ベイトセットは、核酸試料をベイトセットに接触させること、およびベイトセットをベイトセットに関連するヌクレオソーム関連ゲノム領域のセットと選択的にハイブリダイズさせることによって、１つまたは複数のヌクレオソーム関連領域について選択的に富化し得る。
複数のゲノム領域の富化のためのベイトパネル

ある態様では、ベイトパネルは、所定量のＤＮＡを含む核酸試料のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、第１のベイトセットの飽和点未満である第１の濃度比で提供され得る、第１のベイトセットと、核酸試料のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、第２のベイトセットの飽和点に関連する第２の濃度比で提供され得る、第２のベイトセットとを含み得る。本明細書において使用されるとき、飽和点に関連する濃度は、飽和点か、またはそれより高い濃度であり得る。一部の実施形態では、飽和点に関連する濃度は、飽和点を１０％下回る点か、またはそれより高い濃度である。ゲノム領域の第１のセットは、１つまたは複数のバックボーンゲノム領域を含み得る。ゲノム領域の第２のセットは、１つまたは複数のホットスポットゲノム領域を含み得る。ＤＮＡの所定量は、約２００ｎｇ、約１５０ｎｇ、約１２５ｎｇ、約１００ｎｇ、約７５ｎｇ、約５０ｎｇ、約２５ｎｇ、約１０ｎｇ、約５ｎｇ、および／または約１ｎｇであり得る。

ある態様では、複数のゲノム領域について富化するための方法は、所定量の核酸試料を、（ｉ）核酸試料のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、第１のベイトセットの飽和点未満である第１の濃度比で提供され得る第１のベイトセットと、（ｉｉ）核酸試料のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、第２のベイトセットの飽和点と関連する第２の濃度比で提供され得る第２のベイトセットとを含むベイトパネルと接触させるステップと、ゲノム領域の第１のセットおよびゲノム領域の第２のセットについて核酸試料を富化するステップとを含み得る。

富化は、次の：（ａ）試料核酸をベイトセットに接触させるステップと、（ｂ）核酸をベイトセットにおけるプローブとハイブリダイズさせることによって試料から核酸を捕捉するステップと、（ｃ）捕捉された核酸と捕捉されていない核酸とを分離するステップとを含むことができる。

このアプローチを使用してゲノム領域の第２のセットをそのベイトセットの飽和点で捕捉することは、ゲノム領域の第２のセット（例えば、ホットスポット領域）のバリアントを高感度に検出し得、一方で、ゲノム領域の第１のセットをそのベイトセットの飽和点未満で捕捉することは、ゲノム領域の第１のセット（例えば、バックボーン領域）について望ましい場合がある。異なるベイトセットの捕捉をそれらの飽和レベルまたはそれより低いレベルで調節するこの方法の柔軟性は、シーケンシングロードおよび有用性などのそれぞれのゲノム領域の特徴がある場合、ホットスポットまたはバックボーンベイトセットパネルについて目的のゲノム領域を戦略的に選択することに生かされ得る。

方法は、ゲノム領域の第１のセットおよびゲノム領域の第２のセットの複数の配列リードを生ずるように富化された核酸をシーケンシングするステップをさらに含んでもよい。これらの配列リードは、がんの検出および評価の用途のためにがん関連遺伝的バリアント（例えば、ＳＮＶおよびインデル）について分析し得る。

熟練した作業者は、飽和点が、結合動態の飽和を指すことを認識する。本質的に、ベイト（またはベイトのセット）の濃度が増加するとき、ベイト（またはベイトのセット）に結合する標的の量も増加する。しかしながら、所与の試料における標的の量は固定されており、したがって、ある特定の点で、試料中の標的の実質的に全てがベイト（またはベイトのセット）に結合する。したがって、ベイト濃度がこの点を超えて増加すると、結合標的の量は、系が結合平衡に近づく（ベイト分子が標的分子に結合し、それを放出する速度が収束し始める）ので、実質的に増加しない。

飽和点は、その点での濃度または量の増加が、試料から捕捉される標的物質の量を実質的に増加させない点でのベイトの濃度または量を指し、例えばベイトの濃度の増加が、捕捉された標的物質の総量の増加を次第に大きく減少させる点である。一部の実施形態では、ベイトの濃度または量の増加が、試料から捕捉される標的物質の量を実質的に増加させない点は、その点でのベイトの濃度または量の増加が、試料から捕捉される標的の量の増加を生じない点である。飽和点は、捕捉される標的核酸の量をベイトセットの濃度を増加させながら測定する飽和曲線の変曲点であり得る。例えば、飽和点は、ベイト濃度の１００％の増大（例えば、２Ｘまたは２倍の濃度）が、捕捉される標的の量を、２０％未満、１９％未満、１８％未満、１７％未満、１６％未満、１５％未満、１４％未満、１３％未満、１２％未満、１１％未満、１０％未満、９％未満、８％未満、７％未満、６％未満、５％未満、４％未満、３％未満、２％未満、または１％未満のいずれかだけ増大させる点であり得る。一部の実施形態では、ベイト濃度の５０％の増大（例えば、１．５Ｘまたは１．５倍の濃度）は、捕捉される標的の量を、２０％未満、１９％未満、１８％未満、１７％未満、１６％未満、１５％未満、１４％未満、１３％未満、１２％未満、１１％未満、１０％未満、９％未満、８％未満、７％未満、６％未満、５％未満、４％未満、３％未満、２％未満、または１％未満のいずれかだけ増大させる。一部の実施形態では、ベイト濃度（例えば、１．２Ｘ）の２０％の増大は、捕捉される標的の量を、２０％未満、１９％未満、１８％未満、１７％未満、１６％未満、１５％未満、１４％未満、１３％未満、１２％未満、１１％未満、１０％未満、９％未満、８％未満、７％未満、６％未満、５％未満、４％未満、３％未満、２％未満、または１％未満のいずれかだけ増大させる。一部の実施形態では、ベイト濃度の１０％の増大（例えば、１．１Ｘ）は、捕捉される標的の量を、２０％未満、１９％未満、１８％未満、１７％未満、１６％未満、１５％未満、１４％未満、１３％未満、１２％未満、１１％未満、１０％未満、９％未満、８％未満、７％未満、６％未満、５％未満、４％未満、３％未満、２％未満、または１％未満のいずれかだけ増大させる。

別の例として、飽和点は、ベイト濃度の１００％の増大（例えば、２Ｘまたは２倍の濃度）が、捕捉される標的の量を多くとも２０％だけ増大させる点であり得る。飽和点は、ベイト濃度の５０％の増大（例えば、１．５Ｘまたは２倍の濃度）が、捕捉される標的の量を多くとも２０％だけ増大させる点であり得る。飽和点は、ベイト濃度の２０％の増大（例えば、１．２Ｘまたは２倍の濃度）が、捕捉される標的の量を多くとも２０％だけ増大させる点であり得る。飽和点は、ベイト濃度の１０％の増大（例えば、１．１Ｘまたは２倍の濃度）が、捕捉される標的の量を多くとも２０％だけ増大させる点であり得る。

飽和曲線は、例えば、異なる量の標的核酸を、固定量または変動量のベイト（例えば、マイクロアレイに固定されたベイト）について滴定して、ベイトに結合された標的核酸の量（例えば、特有の分子の数を含む）を測定することによって生成することができる。また飽和曲線は、例えば、異なる量のベイトを、標的核酸の固定量または変動量について滴定して、ベイトに結合された標的核酸の量（例えば、特有の分子の数を含む）を測定することによって生成することができる。一部の実施形態では、飽和曲線は、捕捉された標的核酸（例えば、特有の分子のカウント）の指標として配列リードのサブセットを使用して生成することができる。例えば、配列リードは、一本鎖支持体を有するもの（特有のリードの群内の全てのリードが、ＤＮＡなどの二本鎖核酸の同じ元の核酸鎖に由来するとき）か、または二本鎖支持体を有するもの（特有のリードの群内のリードが、ＤＮＡなどの二本鎖核酸の元の核酸鎖の両方に由来するとき）として分類することができる。二本鎖支持体について選択する実施形態では、熟練した作業者は、両方の鎖が観測される、捕捉された特有の分子のみをカウントすることを理解する。二本鎖支持体は、例えば、核酸の２つの異なる鎖のそれぞれが、それぞれの鎖についてのリードが別個にカウントされ得るように差次的にタグ付けすることによって決定することができる。一部の実施形態では、二本鎖支持体を有する標的核酸は、一本鎖支持体を有するベイトについて必要とされるであろうよりも、その標的について飽和に達するために、より多量のベイトを必要とする。

図６は、ｘ軸のインプットベイト量の関数としてのｙ軸の特有の分子のカウントを示す例示的飽和曲線を示す。各インプット量（ベイト溶液の一連の体積として示される）で、ベイトパネルの量を滴定して曲線を生成した。例示的実験滴定曲線設計を、下記表１および表２に示す。特有の配列リードの数とインプットベイト量との対比を使用して、図６に示すような滴定曲線を生成することができる。

図６のような滴定曲線を使用して、当業者は、飽和点を計算することができる。例えば、体積０．８Ｘを見るに、特有の分子のカウントは、およそ２７００である。２Ｘベイトの量（体積１．６Ｘ）で、特有の分子のカウントは、およそ３２００であり、差異は５００である。このように、ベイトの量の倍加は、約１８．５％の捕捉の増加をもたらす。対照的に、体積２Ｘでは、特有の分子のカウントは、およそ３２５０であり、１μｌで、特有の分子のカウントはおよそ３５００であり、差異は２５０である。ベイトの量の倍加は、ここでは、約７．７％の捕捉の増加しかもたらさない。したがって、ベイト濃度での１００％の増加が８％未満だけ捕捉された標的の量を増加させる飽和点の使用を期待する当業者は、飽和点として体積２Ｘのベイトを使用し得る。

飽和点において、ベイトセットは、試料中の標的配列のうちの少なくとも４０％、少なくとも５０％、少なくとも６０％、少なくとも７０％、少なくとも８０％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、および／または少なくとも９９％のいずれかを捕捉し得る。飽和点は、その用語が使用される文脈に応じて、ベイトセットの飽和点または特定のベイトの飽和点を指すことができる。

ベイトセットの飽和点は、以下の方法：（ａ）ベイトセットのベイトのそれぞれについて、（ｉ）所与の量のインプット試料（例えば、試験試料）上のベイトの捕捉効率をベイトの濃度の関数として測定すること、および（ｉｉ）滴定曲線内の変曲点を同定することであって、それにより、ベイトに関連する飽和点を同定することを含む滴定曲線を生成すること、ならびに（ｂ）ベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を選択することであって、それによりベイトセットの飽和点を決定することによって決定され得る。飽和点の選択は、ベイトの捕捉効率および関連するコストによって影響を受ける場合があり、飽和点での濃度は、所望の捕捉効率を達成するために十分高くあり得るが、一方で確実に合理的なアッセイ試薬の費用とするために依然として低いものであり得る。

ベイトの捕捉効率は、（ａ）コホートにおける複数の対象から得られた複数の核酸試料を提供すること、（ｂ）ベイトの複数の濃度のそれぞれで、ベイトを核酸試料のそれぞれとハイブリダイズさせること、（ｃ）ベイトの複数の濃度のそれぞれで、ベイトを用いて核酸試料の複数のゲノム領域を富化すること、および（ｄ）ベイトの複数の濃度のそれぞれで捕捉効率を表す、元の二本鎖核酸分子の両方の鎖を表す特有の核酸分子または核酸分子の数を測定することによって決定され得る。典型的には、ベイトの捕捉効率（例えば、捕捉されるベイトの標的ゲノム領域を含む分子の、そのような分子を含む試料からの百分率）は、変曲点に達するまで濃度に伴って急激に増加し、その後は、捕捉された分子の百分率は、かなりゆっくりと増加する。

変曲点は、観測された捕捉効率が、第１の濃度より大きいベイトの濃度で有意に増加しないような、ベイトの第１の濃度であり得る。変曲点は、（１）第１の濃度の２倍のベイト濃度での捕捉効率を（２）第１のベイト濃度での捕捉効率と比較して観測される増加が、約１％未満、約２％未満、約３％未満、約４％未満、約５％未満、約６％未満、約７％未満、約８％未満、約９％未満、約１０％未満、約１２％未満、約１４％未満、約１６％未満、約１８％未満、約２０％未満、約３０％未満、約４０％未満、または約５０％未満であるような、ベイトの第１の濃度であり得る。そのような同定された変曲点は、ベイトに関連する飽和点と考えることができる。ベイトは、アッセイにおける飽和点の濃度で使用して標的ゲノム領域の最適な捕捉を可能にし、したがって標的ゲノム領域の遺伝的バリアントを検出する感度を最適にすることができる。一部の実施形態では、ベイトセットに関連する飽和点は、ベイトセットにおける最も弱いベイトの飽和点である。例えば、ベイトセットは、ベイトセットのベイトを、（ｉ）ベイトセットのベイトの捕捉効率を、ベイトの濃度の関数として測定すること、および（ｉｉ）滴定曲線内の変曲点を同定し、それにより、ベイトに関連する飽和点を同定することによって生成される滴定曲線に供するとき、そのベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する。ベイトセットにおける各ベイトが少なくともその飽和点である第１の濃度である場合、ベイトセットは、標的配列の観測された捕捉効率が第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の２０％未満で増加するように標的配列を捕捉している。

核酸試料は、無細胞核酸試料（例えば、ｃｆＤＮＡ）であり得る。一実施形態では、複数のゲノム領域を富化するための方法は、複数の配列リードを生ずるために、富化された核酸試料をシーケンシングするステップをさらに含み得る。複数のゲノム領域を富化するための方法は、核酸試料を表す核酸配列を含む出力を生じるステップをさらに含み得る。この核酸配列は、次いで参照ゲノムについて整列され、バイオインフォマティクスアプローチを通じて、がん関連遺伝的バリアントについて分析され得る。

元の分子は、例えば、アンプリコンの増幅およびシーケンシング後、または同じ分子の反復シーケンシングによって、冗長配列リードを生ずる場合がある。元の分子由来の冗長配列リードは、元の分子の配列を表すコンセンサス配列（例えば、「特有の配列」）へと崩壊させることができる。これは、分子の一部についてまたは分子の単一ヌクレオチド位置（コンセンサスヌクレオチド）で、完全な分子に対するコンセンサス配列を生成することによって行うことができる。本明細書において使用されるとき、「シーケンシングを行ったポリヌクレオチド」は、元の分子のアンプリコンから生成された配列リードまたはそのようなアンプリコンから誘導された元の分子のコンセンサス配列のいずれかを指す。特有のリードは、他の全てのリードと異なるリードである。リードは、元の分子の配列に基づいて、または元の分子の配列プラス元の分子に付着した１つまたは複数のバーコード配列に基づいて特有であり得る。例えば、２つの同一の元の分子は、バーコードが異なっている場合、特有のリードを生じることができる。同様に、２つの異なる元の分子は、たとえそれらのバーコードが同じであっても、特有のリードを生じる。コンセンサス配列は、特有のリードを群分けすることによって生成されるとき、特有の配列であり得る。

ある態様では、ベイトパネルは、ゲノムのバックボーン領域を選択的に捕捉する第１のセットであって、前記バックボーン領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各バックボーン領域の順位付け関数が、所定の閾値未満の値を有する、第１のセットと、ゲノムのホットスポット領域を選択的に捕捉する第２のベイトセットであって、前記ホットスポット領域がシーケンシングロードおよび有用性の順位付け関数と関連しており、各ホットスポット領域の順位付け関数が所定の閾値より大きいまたはそれと等しい値を有する、第２のベイトセットとを含み得る。このアプローチは、バックボーン領域およびホットスポット領域に対応する少なくとも２つのベイトセットを使用し得る。

ホットスポット領域は、相対的に高い有用性および／または相対的に低いシーケンシングロードに起因して、所与の無細胞核酸試料において捕捉および分析することが、バックボーン領域よりも相対的により重要であり得る。ホットスポット領域またはバックボーン領域としての所与の領域の選択は、シーケンシングロードおよび有用性の関数として計算されるその順位付け関数値に依存する。順位付け関数値は、ゲノム領域のシーケンシングロードで割ったゲノム領域の有用性として計算し得る。

バックボーン領域またはホットスポット領域は、１つまたは複数のヌクレオソーム情報領域を含み得る。ヌクレオソーム情報領域は、最大ヌクレオソーム鑑別の領域を含み得る。ベイトパネルは、疾患情報領域を選択的に捕捉する第２のベイトセットをさらに含み得る。第１のベイトセットのベイトは、第１の濃度（例えば、ベイトパネルに対する第１の濃度）であり得、第２のベイトセットのベイトは、第２の濃度（例えば、ベイトパネルに対する第２の濃度）であり得る。

一態様では、ベイトセットを生成するための方法は、１つまたは複数の目的のバックボーンゲノム領域を同定するステップであって、１つまたは複数の目的のバックボーンゲノム領域を同定するステップが、バックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化することを含み得る、ステップと、１つまたは複数の目的のホットスポットゲノム領域を同定するステップと、目的のバックボーンゲノム領域を選択的に捕捉する第１のベイトセットを創製するステップと、目的のホットスポットゲノム領域を選択的に捕捉する第２のベイトセットを創製するステップとを含み得る。第２のベイトセットは、第１のベイトセットより高い捕捉効率を有し得る。

１つまたは複数のホットスポットは、次の：（ｉ）前記ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数を最大化すること、（ｉｉ）所定の１つまたは複数のゲノム領域にわたるヌクレオソームプロファイリング、（ｉｉｉ）関連する患者コホートにわたる所定のがんドライバー変異または有病率、ならびに（ｉｖ）経験的に同定されたがんドライバー変異の１つまたは複数（例えば、このうちの１つまたはそれより多く、２つまたはそれより多く、３つまたはそれより多く、あるいは４つ）を使用して選択され得る。

１つまたは複数の目的のホットスポットを同定するステップは、ホットスポットゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてホットスポットゲノム領域のセットを順位付けするためにプログラムされたコンピュータプロセッサを使用することを含み得る。１つまたは複数の目的のバックボーンゲノム領域を同定するステップは、目的のバックボーンゲノム領域のそれぞれに関連するシーケンシングロードおよび有用性の順位付け関数に基づいてバックボーンゲノム領域のセットを順位付けすることを含み得る。１つまたは複数の目的のホットスポットゲノム領域を同定するステップは、目的のコホートにおける１つまたは複数の対象から取得される試料における最高推定ドライバーもしくはクローン変異との関係において経験的に決定されたマイナーアレル頻度（ＭＡＦ）値またはそのＭＡＦによって測定されたバリアントのクローン性のセットを利用することを含み得る。目的のコホートにおける相対的に高いＭＡＦ値を有するゲノム領域は、検出、細胞の種類もしくは組織もしくは起源、腫瘍負荷および／または処置の有効性などのがん関連評価を示し得るので、適切なホットスポットであり得る。

ゲノム領域のシーケンシングロードは、（ｉ）塩基対におけるゲノム領域のサイズ、（ｉｉ）ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率、（ｉｉｉ）ゲノム領域の配列バイアスの結果としての相対カバレッジ、（ｉｖ）ゲノム領域の増幅バイアスの結果としての相対カバレッジ、および（ｖ）ゲノム領域の捕捉バイアスの結果としての相対カバレッジの１つまたは複数（例えば、このうちの１つまたはそれより多く、２つまたはそれより多く、３つまたはそれより多く、４つまたはそれより多く、あるいは５つ）を一緒に乗算することによって計算され得る。この指標を、ベイトパネルセットにおける各ゲノム領域について計算して、核酸試料由来のゲノム領域に関連する配列リードの生成に伴う「コスト」を同定し得る。

ゲノム領域のシーケンシングロードは、塩基対におけるゲノム領域のサイズに正比例する。ゲノム領域へのシーケンシング断片マッピングに費やされるリードの相対分率は、ゲノム領域のシーケンシングロードにも影響を与えるが、その理由は、一部のゲノム領域が、確実なシーケンシングを行うことが格別に困難な場合があり（例えば、高いＧＣ含量または高度に反復した配列の存在）、したがってベイトの所望の解像度で分析するために、より高いシーケンシング深度を必要とし得るためである。同様に、ゲノム領域の配列バイアス、増幅バイアスおよび／または捕捉バイアスの結果としての相対カバレッジは、ゲノム領域のシーケンシングロードにも影響を与え得る。次いで、所与のアッセイのシーケンシングランの全シーケンシングロードは、アッセイの選択されたベイトパネルセットにおけるベイトの全てのシーケンシングロード（ホットスポット領域およびバックボーン領域を含む）を加算することによって計算し得る。

一部の例では、ゲノム領域の有用性は、次の有用な因子：（ｉ）ゲノム領域における１つまたは複数の行動指針を与え得る変異の存在、（ｉｉ）ゲノム領域における１つまたは複数の行動指針を与え得る変異の頻度、（ｉｉｉ）ゲノム領域の平均を上回るマイナーアレル頻度（ＭＡＦ）に関連する１つまたは複数の変異の存在、（ｉｖ）ゲノム領域の平均を上回るＭＡＦに関連する１つまたは複数の変異の頻度、（ｖ）ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率、（ｖｉ）コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの合計、ならびに（ｖｉｉ）（１）コホートにおけるゲノム領域内に体細胞変異を抱える患者におけるバリアントについてのＭＡＦの（２）コホートにおける所与の患者についての最大ＭＡＦに対する比率、の１つまたは複数（例えば、１つまたは複数、２つまたはそれより多く、３つまたはそれより多く、４つまたはそれより多く、５つまたはそれより多く、６つまたはそれより多く、あるいは７つ）を一緒に乗算することによって計算し得る。

ゲノム領域の有用性を計算する目標は、ベイトセットパネルに包含するためのその相対的重要性の評価を支援することであり得る。例えば、高頻度の変異を含むゲノム領域は、がんを含む疾患状態の良好なマーカー（例えば、指標）であるので、ゲノム領域における１つまたは複数の行動指針を与え得る（ａｃｔｉｏｎａｂｌｅ）変異の存在および／または頻度は、ベイトセットパネルに包含するためのゲノム領域の有用性に影響を与える。同様に、平均を上回るＭＡＦに関連する変異の存在および／または頻度を有するゲノム領域の選択は、液体生検アッセイにおけるこれらの変異の高感度検出を可能にする。

ゲノム領域内に体細胞変異を抱えるコホートにおける患者の分率は、コホートの疾患（例えば、乳、結腸直腸、膵臓、前立腺、黒色腫、肺、または肝臓）についてのマーカーとして適切なドライバー変異を示し得る。最高ＭＡＦまたはドライバーバリアントを検出する機会を最大化するために、コホートにおけるゲノム領域内に体細胞変異を抱える患者のバリアントについてのＭＡＦの合計を、有用な因子として使用し得る。ドライバー変異に最大の重みを与えるために、（１）コホートにおけるゲノム領域内に体細胞変異を抱える患者のバリアントについてのＭＡＦの（２）コホートにおける所与の患者についての最大ＭＡＦに対する比率を、有用な因子として使用し得る。より高いマイナーアレル頻度に関連する変異は、１つまたは複数のドライバー変異を含み得るかまたは外部データもしくは注釈ソースから公知である。

行動指針を与え得る（ａｃｔｉｏｎａｂｌｅ）変異は、その検出された存在が、臨床判断（例えば、診断、がんモニタリング、治療モニタリング、治療有効性の評価）に影響を与え得るか、またはそれを決定し得る変異を含み得る。行動指針を与え得る変異は、（ｉ）投薬標的化可能な変異、（ｉｉ）治療モニタリングのための変異、（ｉｉｉ）疾患特異的変異、（ｉｖ）組織特異的変異、（ｖ）細胞型特異的変異、（ｖｉ）耐性変異、および（ｖｉｉ）診断上の変異の１つまたは複数（例えば、１つもしくは複数、２つもしくはそれより多く、３つもしくはそれより多く、４つもしくはそれより多く、５つもしくはそれより多く、６つもしくはそれより多く、または７つ）を含み得る。

投薬標的化可能な（ｄｒｕｇｇａｂｌｅ）変異には、対象由来の核酸試料におけるその検出された存在が、その対象が変異に関連する特定の薬物を用いた処置に適した候補であることを示す変異が含まれ得る（例えば、ＥＧＦＲＬ８５８Ｒ変異の検出は、チロシンキナーゼ阻害剤（ＴＫＩ）処置を用いて処置する必要性を示し得る）。治療モニタリングのための変異には、対象由来の核酸試料におけるその検出された存在またはレベル増加が、処置過程にその対象のがんが応答していることを示し得る変異が含まれる。耐性変異には、対象由来の核酸試料における検出された存在またはレベル増加が、処置過程にその対象のがんが耐性になっていることを示し得る変異が含まれる（例えば、ＥＧＦＲＴ７９０Ｍ変異の出現は、耐性の発生を示し得る）。変異は、疾患（例えば、腫瘍の種類）、組織型または細胞の種類に特異的であってもよく、その検出は、特定の器官、組織または細胞の種類におけるがん、炎症、または他の疾患状態を示し得る。

目的のゲノム位置の例示的列挙は、表３および表４に見出すことができる。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表３の遺伝子の少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０、少なくとも７５、少なくとも８０、少なくとも８５、少なくとも９０、少なくとも９５、または９７のうちの少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表３のＳＮＶのうちの少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、または７０を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表３のＣＮＶのうちの少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、または１８を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表３の融合物のうちの少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、または６を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表３のインデルの少なくとも１、少なくとも２、または３のうちの少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表４の遺伝子の少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０、少なくとも７５、少なくとも８０、少なくとも８５、少なくとも９０、少なくとも９５、少なくとも１００、少なくとも１０５、少なくとも１１０、または１１５のうちの少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表４のＳＮＶのうちの少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０、または７３を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表４のＣＮＶのうちの少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、または１８を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表４の融合物のうちの少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、または６を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表４のインデルの少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、または１８のうちの少なくとも一部分を含む。これらの目的のゲノム位置のそれぞれは、所与のベイトセットパネルについてのバックボーン領域またはホットスポット領域として同定され得る。目的のホットスポットゲノム位置の例示的列挙は、表５に見出すことができる。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表５の遺伝子の少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、少なくとも１８、少なくとも１９、または少なくとも２０のうちの少なくとも一部分を含む。各ホットスポットゲノム領域は、関連遺伝子、その領域が存在する染色体、遺伝子座を表すゲノムの開始および停止位置、塩基対における遺伝子座の長さ、遺伝子によって網羅されるエクソン、および所与の目的のゲノム領域の捕捉しようとする重要な特長（例えば変異の種類）を含むいくつかの特徴を伴って列挙されている。

ある態様では、複数のベイトセットを含むベイトパネルは、各ベイトセットが、（ｉ）複数のベイトにわたって同じ分位数の有用性で１つまたは複数のゲノム領域を選択的に捕捉する１つまたは複数のベイトを含んでもよく、（ｉｉ）複数のベイトにわたって異なる分位数の有用性で他のベイトセットのそれぞれと異なる相対濃度を有する。分位数は、例えば、二等分、三等分、四等分などであり得る。例えば、ベイトパネルは、各ベイトセットが複数のベイトにわたって有用値の上三分の一、中三分の一、または下三分の一に有用性を有するゲノム領域を選択的に捕捉し、それぞれ異なる相対濃度を有する、３つのベイトセットを含んでもよい。

ベイトパネルは、各ベイトセットが（ｉ）複数のベイトにわたって同じ分位数のシーケンシングロードで１つまたは複数のゲノム領域を選択的に捕捉する１つまたは複数のベイトを含み、（ｉｉ）複数のベイトにわたって異なる分位数のシーケンシングロードで他のベイトセットのそれぞれと異なる相対濃度を有する、複数のベイトセットを含んでもよい。ベイトパネルは、複数のベイトセットを含んでもよく、各ベイトセットは（ｉ）複数のベイトにわたって同じ分位数の順位付け関数値（例えばシーケンシングロードで割った有用性）で１つまたは複数のゲノム領域を選択的に捕捉する１つまたは複数のベイトを含み、（ｉｉ）複数のベイトにわたって異なる分位数の順位付け関数値で他のベイトセットのそれぞれと異なる相対濃度を有する。

ある態様では、パネルブロックのセットを選択する方法は、（ａ）各パネルブロックについて、（ｉ）パネルブロックの有用性を計算し、（ｉｉ）パネルブロックのシーケンシングロードを計算し、（ｉｉｉ）パネルブロックの順位付け関数を計算するステップと、（ｂ）最適化プロセスを実行して、選択されたパネルブロックの合計順位付け関数値を最大化するパネルブロックのセットを選択するステップとを含み得る。パネルブロックの順位付け関数は、パネルブロックのシーケンシングロードで割ったパネルブロックの有用性として計算され得る。コンビナトリアル最適化プロセスは、単一のアッセイにおけるパネルブロックのセットについて選択された全てのパネルブロックの順位付け関数値の総和を最適化し得る。このアプローチは、配列ロードおよび有用性に制約がある場合、最適なパネル選択を可能にし得る。コンビナトリアル最適化プロセスは、グリーディアルゴリズムであり得る。ある態様では、方法は、（ａ）複数のベイト混合物を提供するステップであって、複数のベイト混合物のそれぞれがゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットと、ゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットを含み、第１のベイトセットが複数のベイト混合物にわたって異なる濃度であり、第２のベイトセットが複数のベイト混合物にわたって同じ濃度である、ステップと、（ｂ）複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、第１のベイトセットおよび第２のベイトセットを用いて核酸試料から核酸を捕捉するステップであって、核酸試料由来の核酸が、第１のベイトセットおよび第２のベイトセットによって捕捉される、ステップと、（ｃ）各ベイト混合物を用いて捕捉された核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、（ｄ）各ベイト混合物について第１のベイトセットおよび第２のベイトセットについてのリード深度を決定するステップと、（ｅ）所定の量で、ゲノム領域の第２のセット、および、任意選択で、ゲノム領域の第１のセットについてのリード深度を提供する少なくとも１つのベイト混合物を同定するステップとを含むことができる。一部の実施形態では、前記ゲノム領域の第２のセットについてのリード深度が、少なくとも０．０００１％のＭＡＦの遺伝的バリアントを検出する感度を提供する。一部の実施形態では、ゲノム領域の第１のセットおよび／または領域の第２のセットは、２５キロベース〜１，０００キロベースのサイズを有する。一部の実施形態では、ゲノム領域の第１のセットおよび／または領域の第２のセットは１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する。
インデル検出の改善された精度

対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法であって、複数の配列リードが、核酸シーケンシングによって生成される方法が開示される。ｃｆＤＮＡ分子に関連する複数の配列リードのそれぞれについて、候補インデルが同定され得る。次に、（ｉ）複数の配列リードの１つまたは複数の配列リードで検出されるインデルの、（ｉｉ）インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが無細胞ＤＮＡ分子の所与の無細胞ＤＮＡ分子に存在する真のインデルである、および／または（ｉｉｉ）、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値の組み合わせを、１つまたは複数のモデルパラメータと併せて使用して、仮説検定を行い、各候補インデルは、真のインデルまたは導入されたインデルのいずれかとして分類され得る。このアプローチは、エラーを減少させ、配列リードデータからインデルを検出する精度を改善し得る。

図１は、どのように複数のリードが無細胞核酸試料から富化される各遺伝子座について生成され得るかを図解する。それぞれの富化された核酸分子（例えば、ＤＮＡ分子）は、アンプリコンのファミリーを生ずるために増幅される。これらのアンプリコンを、次いで、フォワード鎖およびリバース鎖の両方についてシーケンシングを行って、複数の配列リードデータを生じさせてもよい。複数の配列リードデータから、候補インデルが検出され、真のインデルまたは導入された（例えば、非生物学的）インデルのいずれかとして分類され得る。

このアルゴリズムは、その複数の配列リードがインデルを含むバリアントについて分析される任意の所与のＤＮＡ分子について、元の分子に存在するか（例えば「真の」生物学的インデル）または配列リードのセットが最高に達するプロトコールのある点で導入されたインデル（例えば、増幅またはシーケンシングエラーを含むエラーに起因する導入された非生物学的インデル）が所定の期待値（例えば、確率）で存在すると推定する。モデルは、特定の塩基位置へのリードマッピングのパターン（例えば、リードのいずれかの塩基位置を網羅する）が与えられると、その観測されたパターンが、プロトコールの開始時に存在する配列中のインデル（例えば、真の生物学的インデル）を最も指し示すか、またはプロトコール中に導入されたインデル（非生物学的インデル）を最も指し示すかを尋ねる仮説検定を行うことを目的とし得る。

ある態様では、対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法は、複数の配列リードが、核酸シーケンシングによって生成され、（ａ）無細胞ＤＮＡ分子に関連する複数の配列リードのそれぞれについて、複数の配列リードの１つまたは複数の配列リードで検出されるインデルの所定の期待値と、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが無細胞ＤＮＡ分子の所与の無細胞ＤＮＡ分子に存在する真のインデルである、所定の期待値と、インデルが配列リードの１つまたは複数で検出されたとすると、検出されたインデルが非生物学的エラーによって導入されたものである、所定の期待値とを提供するステップと、（ｂ）核酸シーケンシングによって生成される配列リードに特徴的な１つまたは複数のモデルパラメータの定量的尺度を提供するステップと、（ｃ）無細胞ＤＮＡ分子に関連する複数の配列リードにおける１つまたは複数の候補インデルを検出するステップと、（ｄ）各候補インデルについて、モデルパラメータの１つまたは複数を使用して仮説検定を行うステップであって、候補インデルを真のインデルまたは導入されたインデルとして分類し、それにより、インデルを検出する精度を改善するステップとを含み得る。

対象の身体試料における無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子から誘導された複数の配列リードから挿入または欠失（インデル）を検出する精度を改善するための方法は、ステップ（ａ）の前に身体試料における無細胞ＤＮＡから１つまたは複数の遺伝子座を富化するステップであって、それにより、富化されたポリヌクレオチドを生ずるステップをさらに含んでもよい。

方法は、アンプリコンのファミリーを生ずるために、富化されたポリヌクレオチドを増幅してステップであって、各ファミリーが無細胞ＤＮＡ分子の一本鎖に由来するアンプリコンを含むステップをさらに含む。非生物学的エラーは、複数のゲノム塩基位置でのシーケンシングにおけるエラーを含み得る。非生物学的エラーは、複数のゲノム塩基位置での増幅におけるエラーを含み得る。

図２は、リードの小規模なファミリー（真のインデルバリアントのための証拠を提供するように見え得る）およびリードの大規模なファミリー（ＰＣＲまたはシーケンシングに起因する可能性が高い導入されたエラーを示し得る）の一例を図解する。一般に、真のインデルは、生物学的に多数のＤＮＡ分子に影響を与えることが予測されないので、リードの小規模なファミリーとして検出されるか、または測定されると予測され得る。対照的に、導入されたインデルは、ＰＣＲまたはシーケンシングの間に導入されたエラーを示し得、リードのより大規模なファミリーとして検出されるか、または測定されると予測され得る。一部のトリミングされていないか、または誤ったリードは、インデル（例えば、挿入または欠失）を生物学的ではなく導入されたものとして分類する仮説検定に基づいて、アルゴリズムに、ファミリーを不適格にさせ得る。

図３は、参照ゲノムに対して複数の配列リードを整列させ、比較する際に、大規模なファミリーによって支持される挿入の一例を図解する。図３の場合と同様に、一部のトリミングされていないか、または誤ったリードは、インデル（例えば、挿入または欠失）を生物学的ではなく導入されたものとして分類する仮説検定に基づいて、アルゴリズムに、ファミリーを不適格にさせ得る。

モデルパラメータは、（ｉ）１つまたは複数のバリアントアレルのそれぞれについて、前記バリアントアレルの頻度（α）および前記バリアントアレル以外の非参照アレルの頻度（α’）、（ｉｉ）鎖のファミリーの全フォワード鎖におけるインデルエラーの頻度（β_１）であって、ファミリーが、無細胞ＤＮＡ分子の一本鎖に由来するアンプリコンのコレクションを含む、頻度、（ｉｉｉ）鎖のファミリーの全リバース鎖におけるインデルエラーの頻度（β_２）、ならびに（ｉｖ）配列リードにおけるインデルエラーの頻度（γ）の１つまたは複数（例えば、このうちの１つまたはそれより多く、２つまたはそれより多く、３つまたはそれより多く、あるいは４つ）を含み得る。

図４は、仮説検定で使用し得る様々なパラメータならびにどのように各パラメータが特定の確率、例えば、参照にマッチングするファミリーのリードの確率、参照にマッチングする鎖のリードの確率および参照にマッチングするリードの確率に関連し得るかを図解する。図２はまた、どのように最大尤度関数を含むパラメータ試験が実行され得るかを図解する。パラメータ試験が、候補インデルに実行されるとき、所定の閾値よりも大きい場合、候補は、真のインデルとして分類され得る。パラメータ試験が、候補インデルに実行されるとき、所定の閾値未満またはそれと等しいとき、候補は、導入された（例えば、非生物学的）インデルとして分類され得る。

仮説検定を行うステップは、マルチパラメータ最大化アルゴリズムを実行するステップを含み得る。マルチパラメータ最大化アルゴリズムは、Ｎｅｌｄｅｒ−Ｍｅａｄアルゴリズムを含み得る。候補インデルを真のインデルまたは導入されたインデルとして分類することは、（ａ）マルチパラメータ尤度関数を最大化することと、（ｂ）最大尤度関数値が所定の閾値より大きい場合に候補インデルを真のインデルとして分類することと、（ｃ）最大尤度関数値が所定の閾値未満またはそれと等しい場合に候補インデルを導入されたインデルとして分類することとを含み得る。マルチパラメータ尤度関数は、
のように与えられ得る。

マルチパラメータ尤度関数Ｐｒ｛リード｜α、α’、β_１、β_２、γ｝は、図４に図解される（および段落［０１１２］に記載される）モデルに従って観測されたリードの構成の確率を表し得る。モデルの一つの仮定は、ある特定のパラメータの値（例えば、α、α’、β_１、β_２、およびγ）が与えられると、ファミリー内の観測されたリードの構成は、他の全てのファミリー内の観測されたリードの構成と統計学的に独立しているというものである。したがって、確率Ｐｒ｛リード｜α、α’、β_１、β_２、γ｝は、全てのファミリーにわたるＰｒ｛ファミリーｆのリード｜α、α’、β_１、β_２、γ｝の積として表すことができる。このファミリーごとの確率自体は、少なくとも３つの成分の加重和を含む場合があり、各成分は、可能性のあるファミリーの種類：ａ）バリアントアレルを有する（重みαを有する）もの、ｂ）他の非参照バリアントアレルを有する（重みα’を有する）もの、またはｃ）参照アレルを有する（重み１−α−α’を有する）ものに対応する。加算されるこれらの成分は、それぞれのファミリー種について観測されたリード構成の確率Ｐｒ｛ファミリーｆのリード｜α、α’、β_１、β_２、γ、およびバリアントアレルを有するファミリーｆ｝、Ｐｒ｛ファミリーｆのリード｜α、α’、β_１、β_２、γ、および他の非参照バリアントアレルを有するファミリーｆ｝、ならびにＰｒ｛ファミリーｆのリード｜α、α’、β_１、β_２、γ、および参照アレルを有するファミリーｆ｝であり得る。

モデルは、ファミリー内で各鎖が他の鎖とは独立してインデルエラーによって影響され得ると仮定しているので、バリアントアレルを有するファミリーについて観測されたリード構成の確率Ｐｒ｛ファミリーｆのリード｜α、α’、β_１、β_２、γおよびバリアントアレルを有するファミリーｆ｝はそれ自体、フォワード鎖由来のリードの観測された構成の確率とリバース鎖由来のリードの観測された構成の確率との積であり得る。これらの確率の各々はそれ自体、少なくとも２つの成分の加重和で有り得、各成分が、可能性のある結果に対応している：Ｘ）鎖特異的インデルエラーは、（重みβ_１またはβ_２）を有するファミリー鎖に影響を与え、Ｙ）鎖特異的インデルエラーは、（重み１−β_１または１−β_２）ファミリー鎖に影響しなかった。

最後に、想定される種類ａ）、ｂ）もしくはｃ）のファミリー内および／または想定される種類の鎖Ｘ）もしくはＹ）内で、特定のリード構成についての確率は、個々のリードについての確率の積であり得、その理由は、これらのリードが、３つのカテゴリー：ｉ）バリアントアレルを支持するリード、ｉｉ）他の非参照バリアントアレルを支持するリード、またはｉｉｉ）参照アレルを支持するリードの１つに当てはまる、統計学的に独立した確率を有するとモデルによって仮定されているからである。これらの確率を、下記表６に列挙する。

本発明の好ましい実施形態が本明細書において示され、説明されているが、そのような実施形態が単なる例示として提供されていることは、当業者には明らかである。本発明が本明細書内に提供されている特定の実施例によって制限されることは、意図されない。本発明は、前述の明細書への参照とともに記載されているが、本明細書における実施形態の説明および例証は、制限する意味で解釈されるものではない。当業者であれば、本発明から逸脱することなく、多数の変化形、変更、および置換を想起し得る。さらに、本発明のすべての態様は、本明細書において記載されている特定の表現、構成、または相対的比率に制限されず、それらは、様々な条件および変数に依存することを理解すべきである。本明細書において記載される本発明の実施形態に対する様々な代替形態を、本発明の実践に用いることができることを理解されたい。したがって、本発明は、あらゆるそのような代替形、修正形、変化形、または均等物も網羅すべきであることが企図される。以下の特許請求の範囲が本発明の範囲を定めること、ならびにこれらの特許請求の範囲内の方法と構造、およびそれらの均等物が、それによって網羅されることが意図される。
コンピュータ制御システム

本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システムを提供する。一態様では、本開示は、プロセッサおよびコンピュータメモリを含むコンピュータを含むシステムであって、コンピュータは、通信ネットワークと通信し、コンピュータメモリは、プロセッサによって実行されたとき、（１）通信ネットワークからコンピュータメモリへと配列データを受け取り、（２）配列データにおける遺伝的バリアントが変異体を表すかどうかを決定し、（３）決定を通信ネットワーク上で報告するコードを含む、システムを提供する。

通信ネットワークは、インターネットに接続する任意の利用可能なネットワークであり得る。通信ネットワークは、例えば、ＢｒｏａｄｂａｎｄｏｖｅｒＰｏｗｅｒｌｉｎｅｓ（ＢＰＬ）、ＣａｂｌｅＭｏｄｅｍ、ＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ（ＤＳＬ）、Ｆｉｂｅｒ、ＳａｔｅｌｌｉｔｅａｎｄＷｉｒｅｌｅｓｓを含むが、これらに限定されない高速伝送ネットワークを利用することができる。

別の態様では、本明細書は、ローカルエリアネットワーク；ローカルエリアネットワークに接続されたＤＮＡ配列データを保存するように構成されたコンピュータメモリを含む１つまたは複数のＤＮＡシーケンサー；コンピュータメモリおよびプロセッサを含み、ローカルエリアネットワークに接続されているバイオインフォマティクスコンピュータを含むシステムであって、コンピュータが、実行されたとき、ＤＮＡシーケンサーに保存されたＤＮＡ配列データをコピーし、コピーされたデータをバイオインフォマティクスコンピュータにおけるメモリに書き込み、本明細書に記載されるステップを実行するコードをさらに含む、システムを提供する。

図５は、ベイトセットを生成するための、パネルブロックのセットを選択するための、またはｃｆＤＮＡ分子から誘導された複数の配列リードからインデルを検出する精度を改善するための方法を実装するようにプログラムされたまたは他の仕方で構成されたコンピュータシステム５０１を示す。コンピュータシステム５０１は、例えば、ベイトセットを生成するための、パネルブロックのセットを選択するための、またはｃｆＤＮＡ分子から誘導された複数の配列リードからインデルを検出する精度を改善するための方法などの本開示の様々な態様を調整することができる。コンピュータシステム５０１は、ユーザーまたはコンピュータシステムが電子デバイスについて遠隔位置にある、電子デバイスであり得る。電子デバイスは、モバイル電子デバイスであり得る。

コンピュータシステム５０１は、中央処理ユニット（ＣＰＵ、本明細書において「プロセッサ」および「コンピュータプロセッサ」とも）５０５を含み、これは、シングルコアもしくはマルチコアプロセッサであり得るか、または並列処理のための複数のプロセッサであり得る。コンピュータシステム５０１はまた、メモリまたはメモリ位置５１０（例えば、ランダムアクセスメモリ、読出し専用メモリ、フラッシュメモリ）、電子記憶ユニット５１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース５２０（例えば、ネットワークアダプター）、ならびに周辺デバイス５２５、例えば、キャッシュ、他のメモリ、データ記憶ユニット、および／もしくは電子ディスプレイアダプターも含む。メモリ５１０、記憶ユニット５１５、インターフェース５２０、および周辺デバイス５２５は、通信バス（実線）、例えば、マザーボードを通じて、ＣＰＵ５０５と通信状態にある。記憶ユニット５１５は、データを記憶するためのデータ記憶ユニット（またはデータリポジトリ）であり得る。コンピュータシステム５０１は、通信インターフェース５２０を活用して、コンピュータネットワーク（「ネットワーク」）５３０に作動可能に連結され得る。ネットワーク５３０は、インターネット、インターネットおよび／もしくはエクストラネット、またはインターネットと通信するイントラネットおよび／もしくはエクストラネットであり得る。一部の事例では、ネットワーク５３０は、遠距離通信および／またはデータネットワークである。ネットワーク５３０は、クラウドコンピューティングなどの分散型コンピューティングを可能にすることができる、１つまたは複数のコンピュータサーバを含み得る。ネットワーク５３０は、一部の事例では、コンピュータシステム５０１を活用して、コンピュータシステム５０１に連結されたデバイスが、クライアントまたはサーバとして挙動することを可能にし得る、ピアトゥピアネットワークを実装することができる。

ＣＰＵ５０５は、プログラムまたはソフトウェアで具現化され得る、一連の機械可読命令を実行することができる。命令は、メモリ５１０などのメモリ位置に記憶され得る。命令は、ＣＰＵ５０５へと指示され得、これが、続いて、本開示の方法を実装するように、ＣＰＵ５０５をプログラミングするか、またはそうでなければそのように構成し得る。ＣＰＵ５０５によって実施される動作の例としては、フェッチ、復号、実行、およびライトバックを挙げることができる。

ＣＰＵ５０５は、集積回路など、回路の一部であり得る。システム５０１の１つまたは複数の他の構成要素が、回路に含まれ得る。一部の事例では、回路は、特定用途向け集積回路（ＡＳＩＣ）である。

記憶ユニット５１５は、ドライバ、ライブラリー、および保存されたプログラムなど、ファイルを記憶することができる。記憶ユニット５１５は、ユーザデータ、例えば、ユーザの選好およびユーザプログラムを記憶することができる。コンピュータシステム５０１は、一部の事例では、コンピュータシステム５０１に対して外部にある、例えば、イントラネットまたはインターネットを通じてコンピュータシステム５０１と通信するリモートサーバに位置する、１つまたは複数の追加のデータ記憶ユニットを含み得る。

コンピュータシステム５０１は、ネットワーク５３０を通じて、１つまたは複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム５０１は、ユーザのリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例としては、パーソナルコンピュータ（例えば、ポータブルＰＣ）、スレートもしくはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）のｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）のＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）のｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ対応デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、または携帯情報端末が挙げられる。ユーザは、ネットワーク５３０を介して、コンピュータシステム５０１にアクセスすることができる。

本明細書において記載される方法は、コンピュータシステム５０１の電子記憶位置、例えば、メモリ５１０または電子記憶ユニット５１５上などに記憶された、機械（例えば、コンピュータプロセッサ）により実行可能なコードを用いて実装され得る。機械により実行可能なコードまたは機械により読取り可能なコードは、ソフトウェアの形態で提供され得る。使用の際、コードが、プロセッサ５０５によって実行され得る。一部の事例では、コードは、記憶ユニット５１５から取り出され、プロセッサ５０５による即時アクセスのために、メモリ５１０に記憶され得る。一部の状況では、電子記憶ユニット５１５は、除外され得、機械により実行可能な命令は、メモリ５１０に記憶される。

コードは、コードを実行するように適合されたプロセッサを有する機械で使用するために、プリコンパイルされている、およびそのように構成され得るか、または実行時にコンパイルされてもよい。コードは、コードがプリコンパイルまたは即時コンパイルの様式で実行されるのを可能にするように選択され得る、プログラミング言語で供給され得る。

コンピュータシステム５０１など、本明細書において提供されるシステムおよび方法の態様は、プログラミングで具現化され得る。この技術の様々な態様は、典型的には、機械（またはプロセッサ）により実行可能なコードおよび／または機械可読媒体の一種で運搬もしくは具現化される関連データの形態をした、「製品」または「製造品」であると考えることができる。機械により実行可能なコードは、メモリ（例えば、読出し専用メモリ、ランダムアクセスメモリ、フラッシュメモリ）、またはハードディスクなど、電子記憶ユニットに記憶され得る。「記憶」型の媒体としては、コンピュータ、プロセッサなどのありとあらゆる有形メモリ、またはそれらの関連モジュール、例えば、様々な半導体メモリ、テープドライブ、ディスクドライブなどが含まれ得る。これらは、ソフトウェアプログラミングの任意の時点において、非一過的記憶ユニットを提供し得る。ソフトウェアのすべてまたは一部分は、時折、インターネットまたは様々な他の電気通信網を通じて通信され得る。そのような通信は、例えば、ソフトウェアを１つのコンピュータまたはプロセッサから別のものへ、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへ、ロードすることを可能にし得る。したがって、ソフトウェアエレメントを保持し得る別の種類の媒体としては、光波、電波、および電磁波、例えば、ローカルデバイス間の物理的インターフェースを通じて、有線および光学の地上ネットワークを通じて、ならびに様々なエアリンク上で、使用されるものが挙げられる。そのような波を有する物理的エレメント、例えば、有線または無線リンク、光リンクなどはまた、ソフトウェアを保持する媒体と考えることができる。本明細書において使用されるとき、非一過的有形「記憶」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のために命令をプロセッサに提供することに関与する任意の媒体を指す。

したがって、コンピュータにより実行可能なコードなど、機械可読媒体は、有形記憶媒体、搬送波媒体、または物理的伝送媒体を含むがこれらに限定されない、多数の形態を取り得る。不揮発性記憶媒体としては、例えば、光ディスクまたは磁気ディスク、例えば、任意のコンピュータなどにおける記憶デバイスのうちのいずれか、例えば、図面に示されているデータベースなどを実装するために使用することができるものが挙げられる。揮発性記憶媒体としては、動的メモリ、例えば、そのようなコンピュータプラットフォームの主メモリが挙げられる。有形伝送媒体としては、同軸ケーブル、銅線、および光ファイバ、例えば、コンピュータシステム内のバスを含む電線が挙げられる。搬送波伝送媒体は、電気信号もしくは電磁信号または音波もしくは光波、例えば、無線（ＲＦ）および赤外線（ＩＲ）データ通信の際に生成されるものの形態を取り得る。したがって、コンピュータ可読媒体の一般的な形態としては、例えば、次のものが挙げられる：フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤもしくはＤＶＤ−ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、任意の他の、孔のパターンによる物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ−ＥＰＲＯＭ、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を伝送する搬送波、そのような搬送波を伝送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび／もしくはデータを読み取ることができる任意の他の媒体。これらのコンピュータ可読媒体の形態の多くは、実行のために１つまたは複数の命令の１つまたは複数のシーケンスをプロセッサに搬送することに関与し得る。

コンピュータシステム５０１は、例えば、ベイトセットを生成するための、パネルブロックのセットを選択するための、またはｃｆＤＮＡから誘導された複数の配列リードからインデルを検出する精度を改善するための方法のためのインプットパラメータを提供するためのユーザーインターフェース（ＵＩ）５４０を含む電子ディスプレイ５３５を含むことができるか、またはそれと通信することができる。ＵＩの例としては、グラフィカルユーザインターフェース（ＧＵＩ）およびウェブベースユーザインターフェースが挙げられるが、これらに限定されない。

本開示の方法およびシステムは、１つまたは複数のアルゴリズムを用いて実装することができる。アルゴリズムは、中央処理ユニット５０５により実行すると、ソフトウェアによって実装され得る。アルゴリズムは、例えば、ベイトセットを生成することができ、パネルブロックのセットを選択することができ、またはｃｆＤＮＡ分子から誘導された複数の配列リードからインデルを検出する精度を改善することができる。

（実施例１）
分析性能評価
分析感度（検出限界によっておよび陽性％一致によって定義される）および正確性を、直交的に特性決定された算段材料および患者試料の多回連続希釈試験を介した報告可能アレル分率およびコピー数の範囲を通じて評価した。分析特異性は、低い報告可能範囲から下って検出限界未満のアレル分率にわたる、段階希釈した予め特性決定した健常ドナー試料混合物において、偽陽性率を計算することによって評価した。陽性的中率（ＰＰＶ）を、予め特性決定した臨床患者試料由来のアレル分率／コピー数および２，５８５の連続的臨床試料のコホートを使用して調節された有病率の関数として見積った。直交性の定性的および定量的確認を、ｄｄＰＣＲを使用して実行した。

分析性能を下記表７にまとめる。分析特異性は、２５個の定義された試料にわたって、一塩基バリアント（ＳＮＶ）、融合およびコピー数変更（ＣＮＡ）について１００％、ならびにインデルについて９６％（２４／２５）であった。他の方法と比較して、このアッセイは、配列内容に応じて、融合分子回復の２０％〜５０％の増加を実証した。２，５８５の連続的臨床試料の遡及的ｉｎｓｉｌｉｃｏ分析は、行動指針を与え得る融合検出の＞１５％の相対的増加、行動指針を与え得るインデル検出の６％〜１５％の増加（新たな報告可能インデルを除く）、および行動指針を与え得るＳＮＶ検出の３％〜６％の増加を実証した。

表７：標準ｃｆＤＮＡインプット（３０ｎｇ）に基づく分析性能特徴。検出推定値の分析感度／限界は、臨床的に行動指針を与え得るバリアントを提供し、配列内容およびｃｆＤＮＡインプットによって変動し得る。陽性的中率が、全報告可能パネルスペースにわたって推定される（ＰＰＶは、臨床的に行動指針を与え得るバリアントについて１００％であった）。

まとめると、アッセイは、成体固形腫瘍ガイドライン推奨の体細胞ゲノムバリアントの全てを、高い感度、精度および特異性で包括的に検出した。
（実施例２）
ホットスポットおよびバックボーン滴定

この実験では、適切なプローブ複製および各パネルについての飽和点を決定した。ホットスポットおよびバックボーンパネルを、デフォルトプローブ複製および最適化プローブ複製の両方について設計した。ホットスポットパネルは、およそ１２ｋｂであり、薬物応答、疾患状態（例えば、がん）、および／または全米総合がん情報ネットワーク（ＮａｔｉｏｎａｌＣｏｍｐｒｅｈｅｎｓｉｖｅＣａｎｃｅｒＮｅｔｗｏｒｋ、「ＮＣＣＮ」）ガイドライン下に列挙されたゲノム標的の指標であり得る、ゲノム標的の領域を標的とする。バックボーンパネルはおよそ１４０ｋｂであり、パネルコンテンツの残りを網羅する。ホットスポットおよびバックボーンパネルは、表３における任意の遺伝子位置を含み得る。表１に示される５ｎｇ、１５ｎｇおよび３０ｎｇのｃｆＤＮＡで、４つのパネルそれぞれについて、パネルインプット量について滴定実験を行った。図６は、一般的なパネルについて、インプット量と特有の分子のカウントとの対比を示す。特有の分子のカウントはバックボーンベイトについて約体積３Ｘ、ホットスポットベイトについて約体積１．２Ｘで飽和し（データ示さず）、最適化されたバックボーンパネルがデフォルトパネルと比較して変動が少ないことを示唆した。
（実施例３）
ホットスポット領域の選択的捕捉

実施例２のそれぞれのパネルの飽和点に基づいて、バックボーンベイトの濃度およびホットスポットベイトの濃度を決定した。バックボーンベイト（例えば、体積Ａ）とホットスポットベイト（例えば、体積Ｂ）との混合物を生成し、ホットスポット／バックボーンベイトの混合物についての分子のカウントを、一般的なパネルについての分子のカウントと比較した。ホットスポットパネル由来の分子のカウントは、バックボーンパネルより高かった。差異は高いｃｆＤＮＡインプット量でより顕著になり、バックボーンベイトは、ホットスポットベイトと比較して、例えば、より低いインプット量で、より速く飽和した。同様の傾向が二本鎖カウントで見られた（データ示さず）。またファミリーサイズは、ホットスポットパネルの方が、バックボーンパネルより高かった（データ示さず）。ファミリーサイズの差異は、効果が分子のカウントでマスクされていたにもかかわらず、ホットスポットパネルが、バックボーンパネルより多く捕捉していることを示し得る。例えば、５ｎｇの大規模のファミリーサイズでは、特有の分子のほとんどが捕捉され、したがってホットスポットとバックボーンパネルとの間に明らかな差異が認められなかった可能性が高い。ファミリーサイズの違いで、バックボーンパネルよりもホットスポットパネルで、より多くのＰＣＲ重複が捕捉されていた可能性が高い。

まとめると、この実験は、ホットスポット領域が、増加したホットスポットパネル量で、選択的に捕捉され得ることを実証している。

Claims

複数のゲノム領域について富化するための方法であって、
（ａ）所定量の試料由来の核酸を、
（ｉ）前記試料由来の核酸のゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットであって、前記第１のベイトセットの飽和点未満である第１の濃度で提供される第１のベイトセットと、
（ｉｉ）前記試料由来の核酸のゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットであって、前記第２のベイトセットの飽和点か、またはそれより高い第２の濃度で提供される第２のベイトセットと
を含むベイト混合物と接触させるステップと、
（ｂ）前記ゲノム領域の第１のセットおよび前記ゲノム領域の第２のセットについて前記試料由来の核酸を富化するステップであって、それにより、富化された核酸を生ずるステップと
を含む、方法。
前記第２のベイトセットが、第２のベイトセットのベイトを、
（ｉ）前記第２のベイトセットのベイトの捕捉効率を、前記ベイトの濃度の関数として測定すること、および
（ｉｉ）滴定曲線内の変曲点を同定し、それにより、前記ベイトに関連する飽和点を同定すること
によって生成される前記滴定曲線に供するとき、前記第２のベイトセットのベイトに関連する実質的に全ての飽和点より大きい飽和点を有する、請求項１に記載の方法。
前記第１のベイトセットの前記飽和点が、観測された捕捉効率が第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１０％未満で増加するように選択される、請求項１に記載の方法。
前記第１のベイトセットまたは前記第２のベイトセットが、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、請求項１に記載の方法。
（ｃ）複数の配列リードを生ずるために、前記富化された核酸をシーケンシングするステップをさらに含む、請求項１に記載の方法。
（ｄ）前記試料由来の核酸を表す核酸配列を含む出力を生じるステップをさらに含む、請求項５に記載の方法。
（ａ）複数のベイト混合物を提供するステップであって、前記複数のベイト混合物のそれぞれがゲノム領域の第１のセットに選択的にハイブリダイズする第１のベイトセットと、ゲノム領域の第２のセットに選択的にハイブリダイズする第２のベイトセットを含み、前記第１のベイトセットが前記複数のベイト混合物にわたって異なる濃度であり、前記第２のベイトセットが前記複数のベイト混合物にわたって同じ濃度である、ステップと、
（ｂ）前記複数のベイト混合物のそれぞれを核酸試料と接触させるステップであって、前記第１のベイトセットおよび前記第２のベイトセットを用いて前記核酸試料から核酸を捕捉するステップであって、各ベイト混合物における前記第２のベイトセットが、前記第２のベイトセットの飽和点か、またはそれより高い第１の濃度で提供され、前記核酸試料由来の核酸が、前記第１のベイトセットおよび前記第２のベイトセットによって捕捉される、ステップと、
（ｃ）各ベイト混合物を用いて捕捉された前記核酸の一部分をシーケンシングするステップであって、配列リードの割り当てられた数内の配列リードのセットを生ずるステップと、
（ｄ）各ベイト混合物について前記第１のベイトセットおよび前記第２のベイトセットについての前記配列リードのリード深度を決定するステップと、
（ｅ）前記ゲノム領域の第２のセットについてのリード深度を提供する少なくとも１つのベイト混合物を同定するステップと
を含み、前記ゲノム領域の第２のセットについてのリード深度が、少なくとも０．０００１％のマイナーアレル頻度（ＭＡＦ）の遺伝的バリアントを検出する感度を提供する、方法。
前記第２のベイトセットが、滴定に供するときに飽和点を有し、滴定が、
（ｉ）前記第２のベイトセットの捕捉効率を、ベイトの濃度の関数として測定すること、および
（ｉｉ）前記滴定曲線内の変曲点を同定することであって、それにより、前記第２のベイトセットに関連する飽和点を同定すること
を含む滴定曲線を生成することを含む、請求項７に記載の方法。
前記飽和点が、観測された捕捉効率が第１の濃度の２倍のベイトの濃度で第１の濃度の捕捉効率の１０％未満で増加するように選択される、請求項８に記載の方法。
前記第１のベイトセットまたは前記第２のベイトセットが、ゲノムの１つまたは複数のヌクレオソーム関連領域について選択的に富化し、前記ヌクレオソーム関連領域が、差異のあるヌクレオソーム占有を伴う１つまたは複数のゲノム塩基位置を有するゲノム領域を含み、前記差異のあるヌクレオソーム占有が、起源の細胞もしくは組織型または疾患状態の特徴である、請求項７に記載の方法。
前記ゲノム領域の第１のセットが、１つまたは複数の行動指針を与え得る変異を含み、前記１つまたは複数の行動指針を与え得る変異が、
（ｉ）投薬標的化可能な変異、
（ｉｉ）治療モニタリングのための変異、
（ｉｉｉ）疾患特異的変異、
（ｉｖ）組織特異的変異、
（ｖ）細胞型特異的変異、
（ｖｉ）耐性変異、および
（ｖｉｉ）診断上の変異
の１つまたは複数を含む、請求項７に記載の方法。
前記第１のゲノム領域が、表１から選択される少なくとも５つの遺伝子のそれぞれの少なくとも一部分を含む、請求項７に記載の方法。
第１および第２のゲノム領域が約２５キロベース〜１，０００キロベースのサイズおよび１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する、請求項７に記載の方法。
前記第２のベイトセットの飽和点が、観測された捕捉効率が第２の濃度の２倍のベイトの濃度で第２の濃度の捕捉効率の１０％未満で増加するように選択される、請求項１に記載の方法。
前記ゲノム領域の第２のセットが、１つまたは複数の行動指針を与え得る変異を含み、前記１つまたは複数の行動指針を与え得る変異が、
（ｉ）投薬標的化可能な変異、
（ｉｉ）治療モニタリングのための変異、
（ｉｉｉ）疾患特異的変異、
（ｉｖ）組織特異的変異、
（ｖ）細胞型特異的変異、
（ｖｉ）耐性変異、および
（ｖｉｉ）診断上の変異
の１つまたは複数を含む、請求項７に記載の方法。
前記第２のゲノム領域が、表１から選択される少なくとも５つの遺伝子のそれぞれの少なくとも一部分を含む、請求項７に記載の方法。
前記第２のゲノム領域が、約２５キロベース〜１，０００キロベースのサイズおよび１，０００カウント／塩基〜５０，０００カウント／塩基のリード深度を有する、請求項７に記載の方法。