JP2023526252A

JP2023526252A - 相同組換え修復欠損の検出

Info

Publication number: JP2023526252A
Application number: JP2022568800A
Authority: JP
Inventors: ジェニファーイェン，; エレナヘルマン，; アリエルヤブロノビッチ，
Original assignee: ガーダントヘルス，インコーポレイテッド
Priority date: 2020-05-14
Filing date: 2021-05-14
Publication date: 2023-06-21
Also published as: US20220025468A1; US20230107807A1; WO2021231921A1; EP4150113A1

Abstract

相同組換え欠損（ＨＲＤ）スコアを生成する方法、参照ＨＲＤスコアを決定する方法、１つもしくは複数のがん型を有する試験対象のＨＲＤステータスを決定する方法、および／またはＨＲＤステータスに基づいて疾患を処置する方法が、本明細書で提供される。追加の方法、ならびに関連システム、装置、およびコンピュータ可読媒体も、提供される。本開示は、相同組換え修復欠損（ＨＲＤ）スコアを生成する方法、および状態（例えば、がん）を有する試験対象のＨＲＤステータスを決定する方法を提供する。

Description

関連特許出願の相互参照
本願は２０２０年６月１９日に出願した米国仮特許出願第６３／０４１，７２１号および２０２０年５月１４日に出願した米国仮特許出願第６３／０２５，１２６号に基づく優先権を主張するものであり、前記仮出願は、それらの全体が参照により本書に組み入れられる。

背景
ゲノムの安定性を維持するためにＤＮＡ損傷を修復するように機能する分子経路の複雑なネットワークがある。例えば、相同組換えＤＮＡ修復（ＨＲＲ）は、細胞周期のＳおよびＧ２期にＤＮＡの二本鎖切断を修正するための経路として動作する［Lupo et al., "Inhibition of poly(ADP-ribosyl)ation in cancer: old and new paradigms revisited," Biochim Biophys Acta, 1846:201-15 (2014)；Moschetta et al., "BRCA somatic mutations and epigenetic BRCA modifications in serous ovarian cancer," Ann Oncol.,27:1449-55 (2016)］。ＨＲＲ欠損（ＨＲＤ）と呼ばれる、ＨＲＲ経路の障害は、ゲノムのヘテロ接合性消失（ＬＯＨ）として公知の、染色体領域の喪失または重複をもたらし、腫瘍変異数およびネオアンチゲン率を増加させると考えられる［Solinas et al., "BRCA gene mutations do not shape the extent and organization of tumor infiltrating lymphocytes in triple negative breast cancer," Cancer Lett, 450:88-97 (2019)］。細胞がＨＲＤを有する場合、非相同末端結合（ＮＨＥＪ）などの他の修復経路が、損傷したＤＮＡを修復するために使用され得る［Wang et al., "PARP-1 and Ku compete for repair of DNA double strand breaks by distinct NHEJ pathways," Nucleic Acids Res, 34:6170-82 (2006)］。ＮＨＥＪは、ＨＲＲより誤りがちであり、多くの場合、さらなる変異の蓄積および染色体不安定性をもたらし、それによって腫瘍形成の尤度が高まる［Hoeijmakers, "Genome maintenance mechanisms for preventing cancer," Nature, 411:366-74 (2001)］。生殖細胞系列または体細胞ＨＲＤを有する患者は、ＤＮＡ損傷応答（ＤＤＲ）阻害剤、例えば、ポリ（ＡＤＰ－リボース）ポリメラーゼ（ＰＡＲＰ）阻害剤（ＰＡＲＰｉ）を含む、標的療法の候補者であり得る［Fong et al., "Poly(ADP)-ribose polymerase inhibition: frequent durable responses in BRCA carrier ovarian cancer correlating with platinum-free interval," J Clin Oncol, 28:2512-9 (2010)；Audeh et al., "Oral poly(ADP-ribose) polymerase inhibitor olaparib in patients with BRCA1 or BRCA2 mutations and recurrent ovarian cancer: a proof-of-concept trial," Lancet, 376:245-51 (2010)］。
したがって、がんなどの疾患を診断するおよび／または疾患の処置の指針を得るために、特に無細胞核酸（ｃｆＤＮＡ）試料から、患者におけるＨＲＤを検出するまたは患者のＨＲＤステータスを分類する必要がある。

Lupo et al., "Inhibition of poly(ADP-ribosyl)ation in cancer: old and new paradigms revisited," Biochim Biophys Acta, 1846:201-15 (2014) Moschetta et al., "BRCA somatic mutations and epigenetic BRCA modifications in serous ovarian cancer," Ann Oncol.,27:1449-55 (2016) Solinas et al., "BRCA gene mutations do not shape the extent and organization of tumor infiltrating lymphocytes in triple negative breast cancer," Cancer Lett, 450:88-97 (2019) Wang et al., "PARP-1 and Ku compete for repair of DNA double strand breaks by distinct NHEJ pathways," Nucleic Acids Res, 34:6170-82 (2006) Hoeijmakers, "Genome maintenance mechanisms for preventing cancer," Nature, 411:366-74 (2001) Fong et al., "Poly(ADP)-ribose polymerase inhibition: frequent durable responses in BRCA carrier ovarian cancer correlating with platinum-free interval," J Clin Oncol, 28:2512-9 (2010) Audeh et al., "Oral poly(ADP-ribose) polymerase inhibitor olaparib in patients with BRCA1 or BRCA2 mutations and recurrent ovarian cancer: a proof-of-concept trial," Lancet, 376:245-51 (2010)

要旨
本開示は、相同組換え修復欠損（ＨＲＤ）スコアを生成する方法、および状態（例えば、がん）を有する試験対象のＨＲＤステータスを決定する方法を提供する。開示される方法は、がん検出アッセイの感度および特異度を向上させ、ポリ（ＡＤＰ－リボース）ポリメラーゼ（ＰＡＲＰ）療法から恩恵を受ける可能性がある患者を同定する感度および特異度を向上させる。開示される方法は、処置戦略の指針を得るために使用することができる。追加の方法、ならびに関連システムおよびコンピュータ可読媒体も、提供される。

ある実施形態では、少なくとも部分的にコンピュータを使用して相同組換え修復欠損（ＨＲＤ）スコアを生成する方法であって、１つまたは複数のがん型を有する１または複数の参照対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からの相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子についての参照ＨＲＤスコアをコンピュータにより生成して、参照ＨＲＤスコアのセットを生じさせるステップであって、所与の参照ＨＲＤスコアが、所与のＨＲＤ核酸バリアントの保有率を含む、ステップ；および参照ＨＲＤスコアのセットから参照ＨＲＤスコアを生成するステップを含む方法が、提供される。

ある実施形態では、コンピュータを少なくとも部分的に使用して１つまたは複数のがん型を有する試験対象の相同組換え修復欠損（ＨＲＤ）ステータスを決定する方法であって、試験対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からの相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子についての試験ＨＲＤスコアを生成して、試験ＨＲＤスコアのセットを生じさせるステップであって、所与の試験ＨＲＤスコアが、所与のＨＲＤ核酸バリアントの保有率を含む、ステップ；試験ＨＲＤスコアのセットから試験ＨＲＤスコアを生成するステップ；および試験ＨＲＤスコアを参照ＨＲＤスコアと比較するステップであって、参照ＨＲＤスコアより上である試験ＨＲＤスコアが、それらの試験ＨＲＤスコアがＨＲＤを有する試験対象からのものであることを示し、参照ＨＲＤスコアであるかまたはそれ未満である試験ＨＲＤスコアが、それらの試験ＨＲＤスコアがＨＲＤを欠いている試験対象からのものであることを示し、それによって、１つまたは複数のがん型を有する試験対象のＨＲＤステータスを決定する、ステップを含む方法が、提供される。

ある実施形態では、コンピュータを少なくとも部分的に使用して対象における相同組換え修復欠損（ＨＲＤ）の存在または非存在を検出する方法であって、対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子に関連する配列情報における少なくとも１つのＨＲＤ核酸バリアントの存在または非存在を、（ｉ）配列情報が第１の状態を含む第１の確率、および配列情報が第２の状態を含む第２の確率であって、第１または第２の状態が少なくとも第１のＨＲＤ核酸バリアントを含む、第１の確率および第２の確率、ならびに／または（ｉｉ）配列情報から生成された１つまたは複数のアラインされた連続する配列（コンティグ）であって、少なくとも第２のＨＲＤ核酸バリアントを含むアラインされたコンティグを使用して、コンピュータにより決定することによって、対象におけるＨＲＤを検出するステップを含む方法が、提供される。

ある実施形態では、疾患を処置する方法であって、疾患、および疾患に関連する相同組換え修復欠損（ＨＲＤ）を有する対象に、１つまたは複数の療法を投与するステップを含み、対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子に関連する配列情報における少なくとも１つのＨＲＤ核酸バリアントの存在または非存在を、（ｉ）配列情報が第１の状態を含む第１の確率、および配列情報が第２の状態を含む第２の確率であって、第１または第２の状態が少なくとも第１のＨＲＤ核酸バリアントを含む、第１の確率および第２の確率、ならびに／または（ｉｉ）配列情報から生成された１つまたは複数のアラインされた連続する配列（コンティグ）であって、少なくとも第２のＨＲＤ核酸バリアントを含むアラインされたコンティグを使用して決定することにより、そのＨＲＤが検出され、それによって疾患を処置する方法が、提供される。

ある実施形態では、生体試料についての配列データを決定するステップを含む方法が、提供される。生体試料は、無細胞ＤＮＡ（ｃｆＤＮＡ）を含み得る。方法は、配列データに基づいて、カバレッジデータを決定するステップを含み得る。方法は、カバレッジデータに基づいて、１つまたは複数の融合事象に関連する１つまたは複数の切断点を決定するステップを含み得る。方法は、カバレッジデータに基づいて、１つまたは複数の遺伝子に関連する１つまたは複数の欠失を決定するステップを含み得る。方法は、１つまたは複数の切断点および１つまたは複数の欠失に基づいて、相同組換え欠損（ＨＲＤ）スコアを決定するステップを含み得る。方法は、ＨＲＤスコアに基づいて、生体試料をＨＲＤ陽性として分類するステップを含み得る。

ある実施形態では、生体試料についての配列データを決定するステップを含む方法が、提供される。生体試料は、無細胞ＤＮＡ（ｃｆＤＮＡ）を含み得る。方法は、配列データに基づいて、カバレッジデータを決定するステップを含み得る。方法は、カバレッジデータに基づいて、１つまたは複数の融合事象に関連する１つまたは複数の切断点を決定するステップを含み得る。方法は、カバレッジデータに基づいて、１つまたは複数の遺伝子に関連する１つまたは複数の欠失を決定するステップを含み得る。方法は、１つまたは複数の切断点および１つまたは複数の欠失に基づいて、相同組換え欠損（ＨＲＤ）スコアを決定するステップを含み得る。方法は、ＨＲＤスコアに基づいて、生体試料をＨＲＤ陰性として分類するステップを含み得る。

一部の実施形態では、開示される方法のいずれかにより決定されるようなＨＲＤを有する対象に、標的療法が投与され得る。標的療法は、ＰＡＲＰ阻害剤を含み得る。投与され得るＰＡＲＰ阻害剤の例としては、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、ＣＥＰ９７２２（Ｃｅｐｈａｌｏｎ）、Ｅ７０１６（Ｅｉｓａｉ）、Ｅ７４４９（Ｅｉｓａｉ、ＰＡＲＰ１／２およびタンキラーゼ１／２阻害剤）、または３－アミノベンズアミドのうちの１つまたは複数が挙げられる。一部の実施形態では、標的療法は、少なくとも１つの塩基除去修復（ＢＥＲ）阻害剤を含み得る。例えば、オラパリブは、ＢＥＲを阻害し得る。ある特定の実施形態では、標的療法は、ＰＡＲＰ阻害剤と放射線療法の組合せを含み得る。ある実施形態では、ＰＡＲＰ阻害剤と放射線療法の組合せによって、ＰＡＲＰ阻害剤が、腫瘍組織（例えば、ＢＲＣＡ１／ＢＲＣＡ２変異を有する組織）において放射線療法により生成される一本鎖切断からの二本鎖切断の形成をもたらすことが可能になる。この組合せは、１放射線線量あたりのより強力な療法を提供することができる。

一部の実施形態では、本明細書で開示されるシステムおよび方法の結果は、レポートを生成するための入力データとして使用される。レポートは、紙または電子形式のものであり得る。例えば、対象がＨＲＤスコアに従ってＨＲＤを有するか否かの決定を、本明細書で開示される方法またはシステムによって決定された場合、そのようなレポートで直接表示することができる。

本明細書で開示される方法の様々なステップ、または本明細書で開示されるシステムにより実行されるステップは、同じもしくは異なる時点で、同じもしくは異なる地理的位置、例えば国において、および／または同じもしくは異なる人物により、実行され得る。

本出願に組み込まれ、その一部を構成する添付の図面は、ある特定の実施形態を例示し、本明細書の記載と共に、本明細書で開示される方法、コンピュータ可読媒体、およびシステムのある特定の原理を説明するように機能する。本明細書で提供される記載は、限定としてではなく例として含められる添付の図面と併せて読むと、より良く理解される。文脈が他を示さない限り、同様の参照数字は、これらの図面を通じて同様の構成要素を特定すると理解される。また、図面の一部または全ては、例示を目的とした概略表示であり得、示された要素の実際の相対的なサイズまたは位置を必ずしも示さないことが理解される。

図１（パネルＡおよびＢ）は、相同組換え修復（ＨＲＲ）経路中に欠損を有する細胞が、増加したＤＮＡ損傷に対して脆弱であり、ＤＮＡ損傷修復阻害剤（例えば、ＰＡＲＰ阻害剤など）および／または他の療法に対する増加した感度を有することを概略的に示す図（Peng et al. Exploiting the homologous recombination DNA repair network for targeted cancer therapy. World J Clin Oncol 2011; 2(2): 73-79 [PMID: 21603316]から改変した）である。

図２は、本開示のある実施形態に従うＨＲＤスコアリングモジュールを含むシステムの一例を示す。

図３は、本開示のある実施形態に従うＨＲＤスコアリングモジュールの概略図を示す。

図４は、本開示のある実施形態に従う融合コーラーの概略図を示す。

図５は、本開示のある実施形態に従う欠失コーラーの概略図を示す。

図６は、本開示のある実施形態に従う注釈モジュールの概略図を示す。

図７は、本開示のある実施形態に従う復帰を決定するための方法の概略図を示す。

図８は、本開示のある実施形態に従うＨＲＤスコアリングのための方法の概略図を示す。

図９は、がん型にわたる例となるＨＲＤスコアのヒストグラムを示す。

図１０は、一部の実施形態に従う、相同組換えＤＮＡ修復欠損（ＨＲＤ）スコアを生成する、および試験対象におけるＨＲＤを検出する、例示的な方法ステップを概略的に示すフローチャートである。

図１１は、一部の実施形態に従う、所与のがん型を有する試験対象の相同組換えＤＮＡ修復欠損（ＨＲＤ）ステータスを決定する例示的な方法ステップを概略的に示すフローチャートである。

図１２は、一部の実施形態に従う、対象における相同組換えＤＮＡ修復欠損（ＨＲＤ）を検出する例示的な方法ステップを概略的に示すフローチャートである。

図１３は、一部の実施形態に従う、対象における疾患を処置する例示的な方法ステップを概略的に示すフローチャートである。

図１４は、一部の実施形態に従う、対象におけるＤＮＡ損傷修復欠損（ＤＤＲＤ）を検出する例示的な方法ステップを概略的に示すフローチャートである。

図１５（パネルＡ～Ｃ）は、ＨＲＲ欠失および融合についてのＧｕａｒｄａｎｔＯＭＮＩ（登録商標）ＲＵＯの検出限界（ＬｏＤ）を示すデータのプロットである。パネルＡは、ホモ接合型ＢＲＣＡ２欠失についてのＬｏＤを示し、パネルＢは、ＬＯＨについてのＬｏＤ２を示し、パネルＣは、長いＢＲＣＡ１欠失についてのＬｏＤを示し、図中、ｙ軸は、検出の確率をプロットし、ｘ軸は、腫瘍割合（ＴＦ）をプロットする。

図１６は、前立腺がんコホートにおけるＨＲＲ変異のオンコプリント（ｏｎｃｏｐｒｉｎｔ）である。

図１７（パネルＡ～Ｃ）は、前立腺コホートにおいて検出されたバリアントクラスごとのＨＲＲ変異の保有率のプロットである。

定義
本開示をより容易に理解することができるように、ある特定の用語が最初に下で定義される。以下の用語および他の用語についてのさらなる定義は、本明細書を通じて示され得る。下で示される用語の定義が、参照により組み込まれる特許出願または交付済み特許における定義と矛盾する場合には、本願で示される定義を、用語の意味を理解するために使用されたい。

本明細書および添付の特許請求の範囲で使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」および「その（ｔｈｅ）」は、文脈による別段の明白な指図がない限り、複数の言及対象を含む。したがって、例えば、「方法（ａｍｅｔｈｏｄ）」への言及は、本明細書に記載されるタイプの、および／または本開示などを読むことで当業者には明らかになるタイプの、１つまたは複数の方法および／またはステップを含む。本明細で論じられる温度、濃度、時間、塩基または塩基対の数、カバレッジなどの前に暗黙の「約」があり、したがって、ほんのわずかな、非実質的な同等のものは、本開示の範囲内であることも、理解されるであろう。本願では、単数形の使用は、別段の具体的な記述がない限り複数形を含む。また、「含む（ｃｏｍｐｒｉｓｅ）」、「含む（ｃｏｍｐｒｉｓｅｓ）」、「含むこと（ｃｏｍｐｒｉｓｉｎｇ）」、「含有する（ｃｏｎｔａｉｎ）」、「含有する（ｃｏｎｔａｉｎｓ）」、「含有すること（ｃｏｎｔａｉｎｉｎｇ）」、「含む（ｉｎｃｌｕｄｅ）」、「含む（ｉｎｃｌｕｄｅｓ）」、および「含むこと（ｉｎｃｌｕｄｉｎｇ）」は、制限となるように意図されたものではない。

本明細書において使用される用語法が特定の実施形態の説明を目的にしたものに過ぎず、限定となるように意図されたものでないことも、理解されたい。さらに、別段の定義がない限り、本明細書で使用される全ての専門および科学用語は、本開示が属する技術分野の当業者によって一般に理解されているのと同じ意味を有する。方法、コンピュータ可読媒体、およびシステムについての記述、および特許請求の範囲への記載には、以下の用語法、およびその文法上の異表記が、下で示される定義に従って使用されることになる。

約：本明細書で使用される場合、目的の１つまたは複数の値または要素に適用される場合の「約」または「おおよそ」は、述べられている参照値または要素と同様である値または要素を指す。ある特定の実施形態では、用語「約」または「おおよそ」は、別段の記述がない限り、または文脈からそうでないことが明らかでない限り、述べられている参照値または要素の（それを超えるまたはそれに満たない）両方向に２５％、２０％、１９％、１８％、１７％、１６％、１５％、１４％、１３％、１２％、１１％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％、またはそれ未満の％内に入る、値または要素の範囲を指す（ただし、そのような数が可能な値または要素の１００％を超える場合を除く）。

アダプター：本明細書で使用される場合、「アダプター」は、通常は少なくとも部分的に二本鎖であり、かつ所与の試料核酸分子のどちらかまたは両方の末端に連結させるために使用される、短い核酸（例えば、長さ約５００ヌクレオチド未満、約１００ヌクレオチド未満、または約５０ヌクレオチド未満）を指す。アダプターは、両末端がアダプターと隣接している核酸分子の増幅を可能にするための核酸プライマー結合部位、および／または様々な次世代シークエンシング（ＮＧＳ）応用などのシークエンシング応用のためのプライマー結合部位をはじめとするシークエンシングプライマー結合部位を含み得る。アダプターは、フローセル支持体またはこれに類するものに結合されたオリゴヌクレオチドなどの、捕捉用プローブのための結合部位も含み得る。アダプターは、本明細書に記載の核酸タグも含み得る。核酸タグは、核酸タグが所与の核酸分子のアンプリコンおよびシークエンシングリードに含まれるように、増幅プライマーおよびシークエンシングプライマー結合部位に対して通常は位置する。同じまたは異なる配列のアダプターを、核酸分子のそれぞれの末端に連結させることができる。ある特定の実施形態では、核酸タグがその配列の点で異なることを除いて、同じアダプターが、核酸分子のそれぞれの末端に連結される。一部の実施形態では、アダプターは、一方の末端が本明細書に記載されるように平滑末端化されているかまたは尾部を有するＹ型アダプターであって、同じく平滑末端化されている核酸分子に、または１つもしくは複数の相補的ヌクレオチドを伴う尾部を有する核酸分子に結合させるための、Ｙ型アダプターである。さらに他の例示的な実施形態では、アダプターは、分析されることになる核酸に結合させるための平滑末端または尾部を有する末端を含む、釣り鐘型アダプターである。他の例示的なアダプターとしては、Ｔを尾部に有するアダプターおよびＣを尾部に有するアダプターが挙げられる。

投与する：本明細書で使用される場合、治療剤（例えば、免疫学的治療剤、ＤＮＡ損傷応答（ＤＤＲ）阻害剤（例えば、ポリ（ＡＤＰ－リボース）ポリメラーゼ（ＰＡＲＰ）阻害剤（ＰＡＲＰｉ））など）を対象に「投与する」または「投与すること」は、組成物を対象に与えること、適用すること、または対象と接触させることを意味する。投与は、例えば、局所、経口、皮下、筋肉内、腹腔内、静脈内、髄腔内および皮内経路をはじめとする、いくつかの経路のいずれかによって遂行され得る。

アラインする：本明細書で使用される場合、核酸の文脈での「アラインする」、「アラインメント」、および「アラインすること」は、類似性の領域を同定するためにＤＮＡまたはＲＮＡの配列を並べることを指す。類似性は、配列間の機能的、構造的および／または進化的関係に関するものであり得る。ＤＮＡ配列のアラインメントは、１つの配列のゲノムＤＮＡと少なくとも１つの他の配列のゲノムＤＮＡのアラインメントを含む。そのようなアラインメントは、非ゲノムＤＮＡ、例えば、分子バーコード、パディング塩基、およびこれらに類するものを除外し得る。例えば、配列リードのゲノムＤＮＡは、配列リードに結合され得るあらゆる分子タグを除外して、参照ＤＮＡ配列のゲノムＤＮＡにアラインされ得る。

アレル：本明細書で使用される場合、「アレル」または「アレルバリアント」は、定義された遺伝子位置またはゲノム座位における特定の遺伝的バリアントを指す。アレルバリアントは、通常、アレルがヘテロ接合性であるのか、ホモ接合性であるのかに依存して５０％（０．５）または１００％の頻度で示される。例えば、生殖細胞系バリアントは遺伝され、通常、０．５または１の頻度を有する。しかし、体細胞バリアントは、後天的バリアントであり、通常は、＜０．５の頻度を有する。遺伝子座位のメジャーおよびマイナーアレルは、参照配列のヌクレオチドおよび参照配列とは異なるバリアントヌクレオチドによってそれぞれ占められている座位を持つ核酸を指す。遺伝子座位における測定値は、アレルが試料中に見られる頻度の測度となるアレル割合（ＡＦ）の形をとり得る。

増幅する：本明細書で使用される場合、核酸の文脈での「増幅する」または「増幅」は、少量のポリヌクレオチド（例えば、単一ポリヌクレオチド分子）から通常は始まる、ポリヌクレオチドの、またはポリヌクレオチドの一部分の、複数のコピーの産生を指し、増幅産物またはアンプリコンは、一般に検出可能である。ポリヌクレオチドの増幅は、様々な化学的および酵素的プロセスを包含する。

バーコード：本明細書で使用される場合、核酸の文脈での「バーコード」は、分子識別子としての機能を果たすことができる配列を有する核酸分子を指す。例えば、個々の「バーコード」配列は、通常は、最終データ分析の前に各リードを識別および選別することができるように、次世代シークエンシング（ＮＧＳ）ライブラリー調製中にＤＮＡ断片に付加される。

塩基除去修復阻害剤：本明細書で使用される場合、「塩基除去修復阻害剤」または「ＢＥＲ阻害剤」は、塩基除去修復（ＢＥＲ）経路、機構またはプロセスを阻害する、治療剤を指す。

切断点：本明細書で使用される場合、核酸融合分子または対応するシークエンシングリードの文脈での「切断点」は、核酸融合体の融合した部分配列間の接合部における末端ヌクレオチド位置、または対応するシークエンシングリードで表される末端ヌクレオチド位置を指す。例えば、所与の分割配列リードは、その分割配列リードにおける第２の部分配列と連続しており、かつ第２の部分配列の５’側にある、第１の部分配列を含み、この第１の部分配列は、参照配列における第１の遺伝子座位に位置し、この第１の遺伝子座位は、第２の部分配列が位置するその参照配列内の第２の遺伝子座位と不連続である。この例では、分割配列リードの第１の部分配列は、３’末端ヌクレオチドに切断点を含むが、分割配列リードの第２の部分配列は、５’末端ヌクレオチドに切断点を含む。ある特定の応用では、切断点、例えばこれらの切断点は、「切断点対」と呼ばれる。

がん型：本明細書で使用される場合、「がん」、「がん型」または「腫瘍型」は、例えば病理組織診断により定義される、がんのタイプまたはサブタイプを指す。がん型は、任意の従来の基準により、例えば、所与の組織における存在（例えば、血液がん、中枢神経系（ＣＮＳ）、脳がん、肺がん（小細胞および非小細胞）、皮膚がん、鼻のがん、咽頭がん、肝臓がん、骨がん、リンパ腫、膵臓がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、乳がん、前立腺がん、卵巣がん、肺がん、腸管がん、軟部組織がん、神経内分泌がん、胃食道がん、頭頸部がん、婦人科がん、大腸がん、尿路上皮がん、固体がん、異種がん、同種がん）、原因不明、およびこれらに類するものに、ならびに／または同じ細胞系列（例えば、癌腫、肉腫、リンパ腫、胆管癌、白血病、中皮腫、黒色腫、もしくは膠芽細胞腫）に、ならびに／またはがんマーカー、例えば、Ｈｅｒ２、ＣＡ１５－３、ＣＡ１９－９、ＣＡ－１２５、ＣＥＡ、ＡＦＰ、ＰＳＡ、ＨＣＧ、ＫＲＡＳ、ＢＲＡＦ、ＮＲＡＳ、ホルモン受容体およびＮＭＰ－２２、を提示するがんに基づいて、定義され得る。がんはまた、ステージ（例えば、ステージ１、２、３または４）によって、および一次性であるのか、二次性であるのかによって、分類され得る。

無細胞核酸：本明細書で使用される場合、「無細胞核酸」は、細胞内に含有されておらず、別様に細胞に結合してもいない、核酸を指す。一部の実施形態では、「無細胞核酸」は、対象からの単離の時点で、細胞内に含有されておらず、別様に細胞に結合してもいない、核酸を指す。無細胞核酸は、例えば、対象からの体液（例えば、血液、血漿、血清、尿、脳脊髄液（ＣＳＦ）など）から供給される全ての非カプセル化核酸を含み得る。無細胞核酸は、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、循環ＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉ結合ＲＮＡ（ｐｉＲＮＡ）、長鎖ノンコーディングＲＮＡ（長鎖ｎｃＲＮＡ）、および／またはこれらのいずれかの断片を含む、ＤＮＡ（ｃｆＤＮＡ）、ＲＮＡ（ｃｆＲＮＡ）およびこれらのハイブリッドを含む。無細胞核酸は、二本鎖のもの、一本鎖のもの、またはこれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死、アポトーシス、またはそれに類するプロセスによって、体液に放出され得る。がん細胞から体液に放出される無細胞核酸、例えば、循環腫瘍ＤＮＡ、（ｃｔＤＮＡ）もある。健康な細胞から放出されるものもある。ｃｔＤＮＡは、非カプセル化腫瘍由来断片化ＤＮＡであり得る。無細胞核酸の別の例は、母体血流中を自由に循環している胎児ＤＮＡであり、これは、無細胞胎児ＤＮＡ（ｃｆｆＤＮＡ）とも呼ばれる。無細胞核酸は、１つまたは複数のエピジェネティック改変を有することがあり、例えば、無細胞核酸は、アセチル化、５－メチル化、ユビキチン化、リン酸化、ＳＵＭＯ化、リボシル化および／またはシトルリン化されていることがある。

分類器：本明細書で使用される場合、「分類器」は、試験データを入力データとして受信し、１つまたは別のクラス（例えば、ＤＮＡ損傷修復欠損（ＤＤＲＤ）を有するまたはＤＤＲＤを有さない、腫瘍ＤＮＡまたは非腫瘍ＤＮＡ）に属するものとしての入力データの分類を出力データとして生じさせる、アルゴリズムコンピュータコードを一般に指す。

連続する配列：本明細書で使用される場合、「連続する配列」または「コンティグ」は、核酸のコンセンサス領域を一緒に表す、オーバーラップ核酸セグメントのセットを指す。

コピー数バリアント：本明細書で使用される場合、「コピー数バリアント」、「ＣＮＶ」、または「コピー数多様性」は、ゲノムの区画が反復されてゲノム内のリピート数が考慮中の集団内の個体間で異なる現象を指す。

カバレッジ：本明細書で使用される場合、「カバレッジ」は、特定の塩基位置を表す核酸分子の数を指す。

デノボ融合コーラー：本明細書で使用される場合、「デノボ融合コーラー」、「融合コーラー」、または「デノボ法」は、デノボで、すなわち、既知の遺伝子融合事象のデータベースから得ることができるものなどの過去の知識なしで、融合事象を識別する、ＤＮＡ融合コーラーまたはＲＮＡ融合コーラーのどちらかの、融合コーラーを指す。

デオキシリボ核酸またはリボ核酸：本明細書で使用される場合、「デオキシリボ核酸」または「ＤＮＡ」は、糖部分の２’位に水素基を有する、天然または改変ヌクレオチドを指す。典型的に、ＤＮＡは、４つのタイプの核酸塩基、すなわち、アデニン（Ａ）、チミン（Ｔ）、シトシン（Ｃ）およびグアニン（Ｇ）、のうちの１つを含むデオキシリボヌクレオシドを含むヌクレオチド鎖を指す。本明細書で使用される場合、「リボ核酸」または「ＲＮＡ」は、糖部分の２’位にヒドロキシル基を有する、天然または改変ヌクレオチドを指す。典型的に、ＲＮＡは、４つのタイプの核酸塩基、すなわち、Ａ、ウラシル（Ｕ）、ＧおよびＣ、のうちの１つを含むリボヌクレオシドを含むヌクレオチド鎖を指す。本明細書で使用される場合、用語「ヌクレオチド」は、天然ヌクレオチドまたは改変ヌクレオチドを指す。ある特定のヌクレオチド対は、相補的な形で互いに特異的に結合する（これは、相補的塩基対合と呼ばれる）。ＤＮＡでは、アデニン（Ａ）は、チミン（Ｔ）と対合し、シトシン（Ｃ）は、グアニン（Ｇ）と対合する。ＲＮＡでは、アデニン（Ａ）は、ウラシル（Ｕ）と対合し、シトシン（Ｃ）は、グアニン（Ｇ）と対合する。第１の核酸鎖が、第１の鎖内のものと相補的であるヌクレオチドで構成されている第２の核酸鎖に結合する場合、これら２本の鎖は、二重鎖を形成するように結合する。本明細書で使用される場合、「核酸シークエンシングデータ」、「核酸シークエンシング情報」、「配列情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」、または「断片配列」、または「核酸シークエンシングリード」は、ＤＮＡまたはＲＮＡなどの核酸の分子（例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、または断片）中のヌクレオチド塩基（例えば、アデニン、グアニン、シトシン、およびチミンまたはウラシル）の順序および同一性を示す任意の情報またはデータを意味する。本教示が、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接または間接的ヌクレオチド同定システム、パイロシークエンシング、イオンまたはｐＨに基づく検出ステム、および電子署名に基づくシステムを含むがこれらに限定されない、あらゆる利用可能な種類の技法、プラットフォームまたは技術を使用して得られる配列情報を企図していることを、理解されたい。

検出する：本明細書で使用される場合、「検出する」、「検出すること」、または「検出」は、試料中の１つまたは複数の標的核酸（例えば、標的変異または他のマーカーを有する核酸）の存在（ｅｘｉｓｔｅｎｃｅ）または存在（ｐｒｅｓｅｎｃｅ）を決定する行為を指す。

ＤＮＡ損傷修復：本明細書で使用される場合、「ＤＮＡ損傷修復」または「ＤＤＲ」は、細胞周期中にＤＮＡ損傷を修復する生化学的経路、機構またはプロセスを指す。方向反転ＤＮＡ損傷修復機構は、基礎をなす損傷が、影響を受けたＤＮＡ中のホスホジエステル骨格の切断を含まないので、鋳型を含まない。他のＤＮＡ損傷修復経路、機構またはプロセスは、鋳型を含む。これらは、所与の二重らせんの２本の鎖の一方のみが損傷したときにＤＮＡを修復するように作用する一本鎖損傷修復機構、例えば、塩基除去修復（ＢＥＲ）、ヌクレオチド除去修復（ＮＥＲ）、およびミスマッチ修復（ＭＭＲ）を含む。鋳型依存性ＤＮＡ修復プロセスは、所与の二重らせんの両方の鎖が損傷した（例えば、切断された）ときにＤＮＡを修復するように作用する二本鎖損傷修復機構、例えば、相同組換え（ＨＲ）、マイクロホモロジー媒介末端結合（ＭＭＥＪ）および非相同末端結合（ＮＨＥＪ）も含む。

ＤＮＡ損傷修復欠損：本明細書で使用される場合、「ＤＮＡ損傷修復欠損」または「ＤＤＲＤ」は、ＤＮＡ損傷修復経路、機構またはプロセスを部分的にまたは完全に破壊する、変異、または変異のセットを指す。

ＤＮＡ損傷修復遺伝子：本明細書で使用される場合、「ＤＮＡ損傷修復遺伝子」または「ＤＤＲ遺伝子」は、ＤＮＡ損傷修復経路、機構またはプロセスに関与するポリペプチドをコードする遺伝子を指す。

融合事象：本明細書で使用される場合、「融合事象」は、特定の位置における少なくとも２つの別々の遺伝子間の融合を指す。融合事象の原因例としては、転座、中間部欠失、または染色体逆位事象が挙げられる。

遺伝子：本明細書で使用される場合、「遺伝子」は、生物学的機能に関連するＤＮＡの任意のセグメントを指す。したがって、遺伝子は、コード配列、および必要に応じて、それらの発現に必要な調節配列を含む。遺伝子はまた、必要に応じて、例えば他のタンパク質の認識配列を形成する、非発現ＤＮＡセグメントを含む。

相同組換え修復欠損のスコア：本明細書で使用される場合、「相同組換え修復欠損スコア」または「ＨＲＤスコア」は、所与の対象の１つもしくは複数のゲノム領域にもしくは所与の対象集団における１つもしくは複数のゲノム領域に見られる、またはそこに存在することが別様に公知である、相同組換え修復欠損（ＨＲＤ）などのＤＮＡ損傷修復欠損（ＤＤＲＤ）に関連する変異または変異のセットの数または他の測度を表す値を指す。

生殖細胞系変異：本明細書で使用される場合、「生殖細胞系変異」は、生殖細胞における変異、したがって、子孫に継代され得る変異を意味する。

相同組換え修復：本明細書で使用される場合、「相同組換え修復」または「ＨＲＲ」は、ＤＮＡ複製中に起こる鋳型依存性ＤＮＡ修復プロセスを指す。典型的に、姉妹染色分体上の相同領域は、損傷したＤＮＡ鎖を修復するためのプロセスの一部として、鋳型として機能する。

相同組換え修復欠損：本明細書で使用される場合、「相同組換え修復欠損」または「ＨＲＤ」は、相同組換え修復経路、機構またはプロセスを部分的にまたは完全に破壊する、変異、または変異のセットを指す。

相同組換え修復遺伝子：本明細書で使用される場合、「相同組換え修復遺伝子」または「ＨＲＲ遺伝子」は、相同組換え修復経路、機構またはプロセスに関与するポリペプチドをコードする遺伝子を指す。

ホモ接合型欠失：本明細書で使用される場合、「ホモ接合型欠失」または「両アレル性不活性化」は、所与の遺伝子の両方のアレルの喪失をもたらす、変異または核酸バリアントを指す。

半接合型欠失：本明細書で使用される場合、「半接合型欠失」または「片アレル性不活性化」は、所与の遺伝子の２つのアレルの一方の喪失をもたらす、変異または核酸バリアントを指す。「ヘテロ接合型欠失」は、所与の遺伝子の本来のまたは初期の２つのアレルが互いに異なる、半接合型欠失である。

インデル：本明細書で使用される場合、「インデル」は、対象のゲノムにおけるヌクレオチド位置の挿入または欠失を含む変異を指す。

機能喪失：本明細書で使用される場合、生化学的経路、機構またはプロセスの文脈での「機能喪失」または「ＬｏＦ」は、生化学的経路、機構またはプロセスを非機能性にする、変異または変異のセット（例えば、所与の試料中の）を指す。例えば、機能喪失（ＬｏＦ）ＤＮＡ損傷修復欠損（ＤＤＲＤ）は、所与のＤＮＡ損傷修復（ＤＤＲ）経路、機構またはプロセス（例えば、塩基除去修復（ＢＥＲ）経路、機構もしくはプロセス、ヌクレオチド除去修復（ＮＥＲ）経路、機構もしくはプロセス、ミスマッチ修復（ＭＭＲ）経路、機構もしくはプロセス、相同組換え修復（ＨＲＲ）経路、機構もしくはプロセス、非相同末端結合（ＮＨＥＪ）経路、機構もしくはプロセス、および／またはこれらに類するもの）を非機能性にする、変異または変異のセットである。

ヘテロ接合性消失：本明細書で使用される場合、「ヘテロ接合性消失」または「ＬＯＨ」は、所与の細胞または所与の細胞クローン群（例えば、遺伝子全体および周囲の染色体領域）への一方の親の寄与の喪失をもたらす変異事象を指す。ＬＯＨは、例えば、遺伝子変換、直接欠失、有糸分裂組換え、バランスの悪い編成に起因する欠失、または染色体の喪失（モノソミー）によって引き起こされ得る。

マイナーアレル頻度：本明細書で使用される場合、「マイナーアレル頻度」は、マイナーアレル（例えば、最も頻度の高いアレルではない）が、対象から得られた試料などの所与の核酸集団に存在する頻度を指す。低いマイナーアレル頻度の遺伝的バリアントは、通常は、試料中の存在頻度が相対的に低い。

変異型アレル割合：本明細書で使用される場合、「変異型アレル割合」または「ＭＡＦ」は、所与の試料中の所与のゲノム位置における参照に対してアレル変更または変異を内部に持つ核酸分子の割合を指す。ＭＡＦは、一般に、割合またはパーセンテージとして表される。例えば、ＭＡＦは、通常は、所与の座位に存在する全ての体細胞バリアントまたはアレルの約０．５、０．１、０．０５、または０．０１未満（すなわち、約５０％、１０％、５％、または１％未満）である。

最大変異型アレル割合：本明細書で使用される場合、「最大変異型アレル割合」、「最大ＭＡＦ」、または「ＭＡＸＭＡＦ」は、所与の試料に存在するまたは見られる全ての体細胞バリアントの最大または最も大きいＭＡＦを指す。

変異：本明細書で使用される場合、「変異」、「核酸バリアント」、「バリアント」、または「遺伝子異常」は、既知の参照配列からの変動を指し、例えば、一塩基バリアント（ＳＮＶ）、コピー数バリアントまたは多様性（ＣＮＶ）／異常、挿入または欠失（インデル）、短縮化、遺伝子融合、トランスバージョン、転座、フレームシフト、重複、リピート伸長、およびエピジェネティックバリアントなどの、変異を含む。変異は、生殖細胞系または体細胞変異であり得る。一部の実施形態では、比較目的の参照配列は、試験試料を提供する対象の種の野生型ゲノム配列、通常はヒトゲノムである。ある特定の場合には、変異またはバリアントは、腫瘍形成を引き起こす、または腫瘍形成に少なくとも寄与する、「腫瘍関連遺伝的バリアント」である。

次世代シークエンシング：本明細書で使用される場合、「次世代シークエンシング」または「ＮＧＳ」は、旧来のサンガーおよびキャピラリー電気泳動に基づく手法と比較してスループットが増大した、例えば、何十万もの比較的短い配列リードを同時に生成する能力がある、シークエンシング技術を指す。次世代シークエンシング技法の一部の例としては、一塩基合成法、ライゲーションによるシークエンシング、およびハイブリダイゼーションによるシークエンシングが挙げられるが、これらに限定されない。

核酸タグ：本明細書で使用される場合、「核酸タグ」は、短い核酸（例えば、長さ約５００、約１００、約５０または約１０ヌクレオチド未満）であって、異なるタイプの、もしくは異なる処理を経た、異なる試料からの核酸を区別するために核酸分子を標識するために使用される核酸（例えば、試料インデックスを表す）、または異なるタイプの、もしくは異なる処理を経た、同じ試料中の異なる核酸分子を区別するために核酸分子を標識するために使用される核酸（例えば、分子タグを表す）を指す。核酸タグは、一本鎖状、二本鎖状、または少なくとも部分的に二本鎖状であることがある。核酸タグは、必要に応じて、同じ長さまたは多様な長さを有する。核酸タグは、１つもしくは複数の平滑末端を有する二本鎖分子を含むこともあり、５’もしくは３’一本鎖領域（例えば、オーバーハング）を含むこともあり、および／または１つもしくは複数の他の一本鎖領域を所与の分子内の他の位置に含むこともある。核酸タグを、他の核酸（例えば、増幅および／またはシークエンシングされることになる試料核酸）の一方の末端または両末端に結合させることができる。核酸タグを解読して、所与の核酸の起源試料、形態または処理などの情報を明らかにすることができる。核酸タグを使用して、異なる核酸タグおよび／または試料インデックスを有する核酸を含む複数の試料のプールおよび／または並行処理を可能にすることもでき、これらの核酸は、その後、核酸タグを読み取ることによりデコンボリューションされる。核酸タグは、分子識別子もしくはタグ、試料識別子、インデックスタグ、および／またはバーコードと呼ばれることもある。加えてまたは代替的に、核酸タグを使用して同じ試料中の異なる分子を区別することができる。これは、例えば、所与の試料中の異なる核酸分子に一意的にタグ付けすること、またはそのような分子に非一意的にタグ付けすることを含む。非一意なタグ付け応用の場合には、限定数の異なる配列を有するタグを使用して、核酸分子にタグ付けすることができ、したがって、異なる分子を、例えば、それらが少なくとも１つの核酸タグとの組合せで選択された参照ゲノムに位置する開始および／または停止位置に基づいて、区別することできる。通常は、異なる核酸タグの十分な数が使用され、したがって、任意の２つの分子が、同じ開始／停止位置を有することになり、かつ同じ核酸タグも有することになる確率は低い（例えば、約１０％未満、約５％未満、約１％未満、または約０．１％未満の機会）。一部の核酸タグは、試料、試料の中の核酸分子の形態、ならびに同じ開始および停止位置を有する形態の中の核酸分子を標識するために、複数の分子識別子を含む。大文字の文字が、試料タイプを示し、アラビア数字が、試料の中の分子の形態を示し、小文字のローマ数字が、ある形態の中の分子を示す、例示的な形態「Ａ１ｉ」を使用して、そのような核酸タグを参照することができる。

ポリＡＤＰリボースポリメラーゼ阻害剤：本明細書で使用される場合、「ポリＡＤＰリボースポリメラーゼ阻害剤」、「ＰＡＲＰ阻害剤」、または「ＰＡＲＰｉ」は、酵素ポリＡＤＰリボースポリメラーゼ（ＰＡＲＰ）の作用を阻害する治療剤を指す。

ポリヌクレオチド：本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」、または「オリゴヌクレオチド」は、ヌクレオシド間連結により結合されたヌクレオシドの直鎖状ポリマー（デオキシリボヌクレオシド、リボヌクレオシド、またはこれらのアナログ）を指す。通常は、ポリヌクレオチドは、少なくとも３つのヌクレオシドを含む。オリゴヌクレオチドは、多くの場合、少数のモノマー単位、例えば３～４から、数百のモノマー単位まで、サイズに幅がある。ポリヌクレオチドが、「ＡＴＧＣＣＴＧ」などの文字の配列によって表される場合は常に、別段の断り書きがない限り、ヌクレオチドが左から右へ５’→３’の順序であること、およびＤＮＡの場合、「Ａ」がデオキシアデノシンを示し、「Ｃ」がデオキシシチジンを示し、「Ｇ」がデオキシグアノシンを示し、「Ｔ」がデオキシチミジンを示すことは、理解されるであろう。文字Ａ、Ｃ、ＧおよびＴは、当技術分野では一般的であるように、塩基自体を指すために使用されることもあり、ヌクレオシドを指すために使用されることもあり、または塩基を含むヌクレオチドを指すために使用されることもある。

保有率(ｐｒｅｖａｌｅｎｃｅ)：本明細書で使用される場合、核酸バリアントの文脈での「保有率」は、所与の核酸バリアントが、所与の試料（例えば、所与の体液試料、所与の非体液試料など）または他の集団（例えば、体液試料の所与の集団、非体液試料の所与の集団、など）に見られるまたは見られた程度、広汎性、または頻度を指す。

参照試料：本明細書で使用される場合、「参照試料」または「参照ｃｆＤＮＡ試料」は、分析手順の精度を評価するために試験試料と一緒に分析されるまたは試験試料と比較される、既知組成の、および／または特定の特性（例えば、既知核酸バリアント、既知細胞起源、既知腫瘍割合、既知カバレッジ、および／またはこれらに類すること）を有する、または有することもしくは欠いていることが分かっている、試料を指す。参照試料データセットは、通常は、少なくとも約２５～少なくとも約３０，０００またはそれより多くの参照試料を含む。一部の実施形態では、参照試料データセットは、約５０、７５、１００、１５０、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，５００、５，０００、７，５００、１０，０００、１５，０００、２０，０００、２５，０００、５０，０００、１００，０００、１，０００，０００、またはそれより多くの参照試料を含む。

参照配列：本明細書で使用される場合、「参照配列」または「参照ゲノム」は、実験的に決定された配列と比較する目的で使用される既知配列を指す。例えば、既知配列は、全ゲノム、染色体、またはこれらの任意のセグメントであり得る。参照配列は、通常は、少なくとも約２０、少なくとも約５０、少なくとも約１００、少なくとも約２００、少なくとも約２５０、少なくとも約３００、少なくとも約３５０、少なくとも約４００、少なくとも約４５０、少なくとも約５００、少なくとも約１０００、少なくとも約１０，０００、少なくとも約１００，０００、少なくとも約１，０００，０００、少なくとも約１０，０００，０００、少なくとも約１００，０００，０００、少なくとも約１，０００，０００，０００、またはそれより多くのヌクレオチドを含む。参照配列をゲノムもしくは染色体の単一の連続する配列とアラインすることができ、または参照配列は、ゲノムもしくは染色体の異なる領域とアラインする不連続なセグメントを含み得る。例示的な参照配列としては、例えば、ヒトゲノム、例えば、ｈＧ１９およびｈＧ３８が挙げられる。

試料：本明細書で使用される場合、「試料」は、本明細書で開示される方法および／またはシステムにより分析することができる任意の生体試料を意味する。本開示のある特定の態様では、試料は、体液試料、例えば、無細胞（細胞内に含有されても、別様に細胞に結合されてもいない、循環）核酸が供給される体液のタイプの中でも特に、全血もしくはその画分、リンパ液、尿、および／または脳脊髄液である。ある特定のインプリメンテーションでは、体液試料は、血漿試料であり、これは、赤血球および白血球などの細胞を除く、全血の流体部分である。一部のインプリメンテーションでは、体液試料は、血清試料、すなわち、フィブリノゲンを欠いている血漿である。本開示の一部の態様では、試料は、「非体液試料」または「非血漿試料」、すなわち、「体液試料」以外の生体試料、例えば、無細胞核酸以外の核酸が供給される細胞および／または組織試料のような生体試料である。

感度：本明細書で使用される場合、所与のアッセイまたは方法の文脈での「感度」は、標的（例えば、核酸バリアント）分析物および非標的分析物を検出するならびにこれらを区別する、アッセイまたは方法の能力を指す。

シークエンシング：本明細書で使用される場合、「シークエンシング」は、生体分子、例えば、ＤＮＡまたはＲＮＡなどの核酸、の配列（例えば、同一性、およびモノマー単位の順序）を決定するために使用されるいくつかの技術のいずれかを指す。例示的なシークエンシング方法としては、標的シークエンシング、単一分子リアルタイムシークエンシング、エクソンまたはエクソームシークエンシング、イントロンシークエンシング、電子顕微鏡法に基づくシークエンシング、パネルシークエンシング、トランジスタ媒介シークエンシング、ダイレクトシークエンシング、ランダムショットガンシークエンシング、サンガージデオキシターミネーションシークエンシング、全ゲノムシークエンシング、ハイブリダイゼーションによるシークエンシング、パイロシークエンシング、キャピラリー電気泳動、デュプレックスシークエンシング、サイクルシークエンシング、一塩基伸長シークエンシング、固相シークエンシング、ハイスループットシークエンシング、大規模並列シグネチャーシークエンシング、エマルジョンＰＣＲ、より低い変性温度での共増幅－ＰＣＲ（ＣＯＬＤ－ＰＣＲ）、マルチプレックスＰＣＲ、可逆的ダイターミネーターによるシークエンシング、ペアエンドシークエンシング、ニアタームシークエンシング、エクソヌクレアーゼシークエンシング、ライゲーションによるシークエンシング、ショートリードシークエンシング、単一分子シークエンシング、一塩基合成法、リアルタイムシークエンシング、リバースターミネーターシークエンシング、ナノポアシークエンシング、４５４シークエンシング、ＳｏｌｅｘａＧｅｎｏｍｅＡｎａｌｙｚｅｒシークエンシング、ＳＯＬｉＤ（商標）シークエンシング、ＭＳ－ＰＥＴシークエンシング、およびこれらの組合せが挙げられるが、それらに限定されない。一部の実施形態では、シークエンシングは、例えば、数ある中でも特に、Ｉｌｌｕｍｉｎａ，Ｉｎｃ．、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ，Ｉｎｃ．、またはＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ／ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃから市販されている遺伝子分析装置などの、遺伝子分析装置により行うことができる。

配列情報：本明細書で使用される場合、核酸ポリマーの文脈での「配列情報」は、そのポリマー中のモノマー単位（例えば、ヌクレオチドなど）の順序および／または同一性を意味する。

一塩基バリアント：本明細書で使用される場合、「一塩基バリアント」または「ＳＮＶ」は、ゲノム内の特定の位置に存在する単一ヌクレオチドの変異または多様性を意味する。

体細胞変異：本明細書で使用される場合、「体細胞変異」は、受胎後に起こる所与のゲノムの変異を意味する。体細胞変異は、生殖細胞を除く身体のあらゆる細胞で起こるものであり得、したがって、子孫に継代されない。

特異度：本明細書で使用される場合、診断分析またはアッセイの文脈での「特異度」は、分析またはアッセイが所与の試料の他の成分を除外して意図された標的分析物を検出する程度を指す。

ステータス：本明細書で使用される場合、対象についての文脈での「ステータス」は、所与の対象の１つまたは複数のステータス、例えば、対象がＤＮＡ損傷修復欠損（ＤＤＲＤ）（例えば、相同組換え修復欠損（ＨＲＤ）および／またはこれに類するもの）を有するか否かを指す。

対象：本明細書で使用される場合、「対象」または「試験対象」は、動物、例えば、哺乳類種（例えば、ヒト）またはトリ（例えば、鳥）種、または他の生物、例えば植物を指す。より具体的には、対象は、脊椎動物、例えば、哺乳動物、例えばマウス、霊長類、サルまたはヒトであり得る。動物は、家畜（例えば、生産牛、乳牛、家禽、馬、豚、およびこれらに類するもの）、競技動物、および伴侶動物（例えば、ペットまたは支援動物）を含む。対象は、健康な個体、疾患もしくは疾患素因がある、もしくはある疑いがある個体、または療法を必要としている、もしくは療法を必要とする疑いがある個体であり得る。用語「個体」または「患者」は、「対象」と同義であるように意図されている。一部の実施形態では、対象は、がんを有する、または有する疑いがある、ヒトである。例えば、対象は、がんを有すると診断された個体、がん療法を受けることになる個体、および／または少なくとも１つのがん療法を受けたことがある個体であり得る。対象は、がんの寛解期にあることもある。別の例として、対象は、自己免疫疾患を有すると診断される個体であり得る。別の例では、対象は、疾患、例えば、がん、自己免疫疾患を有すると、もしくは有する疑いがあると診断されたことがあり得る妊娠している女性個体、または妊娠を計画している女性個体であり得る。「参照対象」は、特定の特性（例えば、既知ＤＤＲＤもしくはＨＲＤステータス、既知核酸バリアント、既知細胞起源、既知腫瘍割合、既知カバレッジ、および／またはこれらに類すること）を有することまたは欠いていることが分かっている対象を指す。

閾値：本明細書で使用される場合、「閾値（ｔｈｒｅｓｈｏｌｄ）」は、実験的に決定された値を特徴付けるまたは分類するために使用される、別々に決定された値を指す。ある特定の実施形態では、例えば、「閾値（ｔｈｒｅｓｈｏｌｄｖａｌｕｅ）」は、所与の標的核酸バリアントが所与の遺伝子座位に非存在であることを決定するために定量値が比較される、選択された値を指す。

腫瘍割合：本明細書で使用される場合、「腫瘍割合」は、所与の試料中の腫瘍に由来する核酸分子の割合の推定値を指す。例えば、試料の腫瘍割合は、試料の最大変異型アレル頻度（ＭＡＸＭＡＦ）、または試料のカバレッジ、または試料中のｃｆＤＮＡ断片の長さ、エピジェネティック状態、もしくは他の特性、または試料の任意の他の選択された特徴から導出される測度であり得る。用語「ＭＡＸＭＡＦ」は、所与の試料中に存在する全ての体細胞バリアントの最大または最も大きいＭＡＦを指す。一部の実施形態では、試料の腫瘍割合は、試料のＭＡＸＭＡＦに等しい。

値：本明細書で使用される場合、「値」または「スコア」は、一般に、値が指す特徴を特徴付けるあらゆるものであり得るデータセット内の登録事項を指す。これは、数、語または句、記号（例えば、＋もしくは－）または程度を含むが、これらに限定されない。
詳細な説明

序論

ＤＮＡ損傷修復（ＤＤＲ）は、ゲノムの完全性または安定性を維持する機能を果たす細胞プロセスである。所与のＤＤＲ機構の欠陥または欠損は、腫瘍形成または他の疾患につながることがあり、これらの欠陥または欠損を使用して、所与の標的療法からの恩恵を受ける可能性がある試験対象または患者を同定することができる。例えば、相同組換え修復欠損（ＨＲＤ）は、患者をＰＡＲＰ阻害剤などの治療剤の投与の候補者にし得る細胞表現型である。例を挙げて説明すると、図１（パネルＡおよびＢ）は、相同組換え修復（ＨＲＲ）経路の欠損を有する細胞が、ＤＮＡ損傷増加を起こしやすく、ＤＮＡ損傷修復阻害剤（例えば、ＰＡＲＰ阻害剤など）および／または他の療法に対する感受性が上昇していることを模式的に示す図である。示されているように、ＤＮＡ損傷を有する正常な細胞（パネルＡ）は、たとえＰＡＲＰ阻害剤が患者に投与されても、ＰＡＲＰ阻害剤が一本鎖切断（ＳＳＢ）のＰＡＲＰ媒介修復しか阻害しないので、多くの場合、生き残ることになる。ＤＮＡ複製中に、ＤＮＡらせんが巻き戻ると、これらのＳＳＢは結果として二本鎖切断（ＤＳＢ）になる。これらの正常な細胞の場合、このＤＮＡ損傷は、ＤＳＢを修復する相同組換え（ＨＲ）媒介修復経路によって修復され得、したがって、正常な細胞は、生き残ることになる。対照的に、例えば、ＨＲ欠損がん細胞（パネルＢ）の場合、ＨＲ媒介修復経路は機能せず、したがって、投与されたＰＡＲＰ阻害剤は、がん細胞の死につながる残存するＰＡＲＰ媒介修復経路を阻害することになる。

ＨＲＤを不活性化する変更または変異の様々なクラスがある。これらの一部としては、数ある変更の中でも特に、ＨＲＲ遺伝子のＳＮＶおよび／またはインデル、ホモ接合型欠失、遺伝子特異的ＬＯＨ、コピー数変化を伴わないＬＯＨ、ゲノムワイドなＬＯＨ、短縮再編成、ならびにマルチエクソン（長い）欠失が挙げられる。本明細書で開示されるある特定の実施形態では、ＳＮＶおよびインデルは、病原性の注釈技法を使用して同定され、ホモ接合型欠失、遺伝子特異的ＬＯＨ、コピー数変化を伴わないＬＯＨ、およびゲノムワイドなＬＯＨは、ホモ接合型欠失／ＬＯＨＣＮＶコーラーを使用して同定され、ならびに短縮再編成、およびマルチエクソン欠失は、再編成またはデノボ融合コーラーを使用して同定される。

一部の実施形態では、本明細書で開示される方法および関連態様は、卵巣がん、前立腺がん、乳がん、または他のがん患者におけるＰＡＲＰ阻害剤処置の指針を得るためのＨＲＲ経路の欠損の同定に使用される。これらの実施形態のいくつかでは、ＨＲＤワークフローは、ＨＲＤを有する試料を同定するための、ひいては、ＰＡＲＰ阻害剤を含む標的療法の候補者を同定するための、ＨＲＲ遺伝子に関するコピー数減少、再編成ならびに病原性ＳＮＶおよびインデルについての情報を提供する。これらのうちの一部の実施形態では、これは、ＳＮＶ／インデル、融合、およびＣＮＶコーラーなどの、システムモジュールによって達成される。一部の実施形態では、これらのプロセスの出力データとして生成されるレポートが、関連ＨＲＲ遺伝子の機能喪失（ＬｏＦ）を示すバリアント型についての値を明らかにする。

本質的に任意のＤＤＲ（例えばＨＲＲ）遺伝子またはバイオマーカーを、所与の試料において、対応するＤＤＲ（例えば、ＨＲＲ）経路を正常に機能しない状態または非機能性にする関連変異について、評価することができる。この情報を、患者への標的療法（例えば、ＰＡＲＰ阻害剤、ＢＥＲ阻害剤など）の投与の選択基準として使用することができる。ある特定の実施形態では、標的療法は、ＰＡＲＰ阻害剤を含み得る。投与され得るＰＡＲＰ阻害剤の例としては、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、ＣＥＰ９７２２（Ｃｅｐｈａｌｏｎ）、Ｅ７０１６（Ｅｉｓａｉ）、Ｅ７４４９（Ｅｉｓａｉ、ＰＡＲＰ１／２およびタンキラーゼ１／２阻害剤）、または３－アミノベンズアミドのうちの１つまたは複数が挙げられる。一部の実施形態では、標的療法は、少なくとも１つの塩基除去修復（ＢＥＲ）阻害剤を含み得る。例えば、オラパリブは、ＢＩＲを阻害し得る。ある特定の実施形態では、標的療法は、ＰＡＲＰ阻害剤と放射線療法の組合せを含み得る。ある実施形態では、ＰＡＲＰ阻害剤と放射線療法の組合せによって、ＰＡＲＰ阻害剤が、腫瘍組織（例えば、ＢＲＣＡ１／ＢＲＣＡ２変異を有する組織）において放射線療法により生成される一本鎖切断からの二本鎖切断の形成をもたらすことが可能になる。この組合せは、１放射線線量あたりのより強力な療法を提供することができる。本開示の方法および関連態様を使用して、本質的に任意の数の遺伝子が必要に応じて評価される。一部の実施形態では、例えば、本明細書に記載の分析の対象となるＤＤＲ遺伝子（例えばＨＲＲ遺伝子）のセットは、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、４０、５０、１００、１，０００、１０，０００、またはそれより多くの遺伝子を含む。ＨＲＲ遺伝子の非網羅的リストが表１で提供され、必要に応じて、これらのＨＲＲ遺伝子のうちの１つまたは複数が、本明細書で開示される方法および関連態様を使用する評価に選択される。

特定の標的療法の候補者である患者を同定するために本明細書に記載されるように評価することができるＨＲＲ遺伝子の例示的なセットが、表２に収載される。

例示的なシステムおよび方法

図２は、本開示の実施形態に従って、試験対象１１１のＤＮＡ損傷修復欠損（ＤＤＲＤ）ステータス（例えば、ＨＲＤステータスまたはこれに類するもの）を決定するためのシステム１００の例を図示する。システム１００は、対象１１１からの１つまたは複数の試料１０１を処理して、バリアント検出およびＤＤＲＤステータス決定のための配列リードを生成することができる。システム１００は、研究室システム１０２、コンピュータシステム１１０、および／または他の構成要素を含み得る。研究室システム１０２およびコンピュータシステム１１０が、互いに遠く離れたところにあり得、コンピュータネットワーク（図示されていない）によって互いに接続され得ることに留意されたい。研究所システム１０２は、試料収集および調製パイプライン１０３、シークエンシングパイプライン１０５、配列リードデータストア１０９、および／または他の構成要素を含み得る。シークエンシングパイプライン１０５は、１つまたは複数のシークエンシングデバイス１０７（図２にシークエンシングデバイス１０７ａ．．．ｎとして図示されている）を含み得る。

本開示の方法は、無細胞核酸の操作、調製、同定、定量化および／または分析において多種多様に使用することができる。図２に示されているように、試料収集および調製パイプライン１０３は、１または複数の参照対象からｃｆＤＮＡ参照試料１０１を、および試験対象からｃｆＤＮＡ試験試料１１１を得ることを含む。本明細書に記載されるように、ポリヌクレオチドは、ＤＮＡおよび／またはＲＮＡなどの、任意のタイプの核酸を含み得る。例えば、ポリヌクレオチドがＤＮＡである場合、それは、ゲノムＤＮＡ、相補的ＤＮＡ（ｃＤＮＡ）、または任意の他のデオキシリボ核酸であり得る。ポリヌクレオチドはまた、無細胞核酸、例えば、無細胞ＤＮＡ（ｃｆＤＮＡ）であり得る。例えば、ポリヌクレオチドは、循環ｃｆＤＮＡであり得る。循環ｃｆＤＮＡは、アポトーシスまたは壊死によって体の細胞から排出されるＤＮＡを含み得る。アポトーシスまたは壊死によって排出されるｃｆＤＮＡは、正常な（例えば、健康な）体の細胞が起源であり得る。異常な組織増殖、例えば、がんのための異常な組織増殖がある場合、腫瘍ＤＮＡが排出され得る。循環ｃｆＤＮＡは、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含み得る。
ｉ．試料

様々な技法を使用して試料を収集することによって、無細胞ポリヌクレオチドの単離および抽出を行うことができる。試料は、対象から単離された任意の生体試料であり得る。試料は、体内組織、全血、血小板、血清、血漿、糞便、赤血球、白血球またはロイコサイト、内皮細胞、組織生検材料（例えば、既知のまたは疑わしい固形腫瘍からの生検材料）、脳脊髄液、滑液、リンパ液、腹水、間質または細胞外液（例えば、間質腔からの流体）、歯肉滲出液、歯肉溝滲出液、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿を含み得る。試料は、好ましくは、体液、特に、血液およびその画分ならびに尿である。そのような試料は、腫瘍から排出された核酸を含む。核酸は、ＤＮＡおよびＲＮＡを含み得、二本鎖形態または一本鎖形態であり得る。試料は、対象から最初に単離された形態であることもあり、あるいは細胞などの成分を除去もしくは追加するための、ある成分を別の成分と比べて濃縮するための、または核酸のある形態を別の形態に、例えば、ＲＮＡをＤＮＡに、もしくは一本鎖核酸を二本鎖核酸に、変換するための、さらなる処理に付されたものであることもある。したがって、例えば、分析のための体液試料は、無細胞核酸、例えば無細胞ＤＮＡ（ｃｆＤＮＡ）、を含有する血漿または血清である。

一部の実施形態では、対象から採取される体液の試料体積は、シークエンシングされる領域についての所望の読み取り深度に依存する。例示的な体積は、約０．４～４０ｍｌ、約５～２０ｍｌ、約１０～２０ｍｌである。例えば、体積は、約０．５ｍｌ、約１ｍｌ、約５ｍｌ、約１０ｍｌ、約２０ｍｌ、約３０ｍｌ、約４０ｍｌ、またはそれを超えるミリリットルである。試料採取される血漿の体積は、通常は、約５ｍｌ～約２０ｍｌの間である。

試料は、様々な量の核酸を含み得る。通常は、所与の試料中の核酸の量は、複数のゲノム等価物と同等とみなされる。例えば、約３０ｎｇのＤＮＡの試料は、約１０，０００（１０^４）半数体ヒトゲノム等価物、およびｃｆＤＮＡの場合は約２００，０００，０００，０００（２×１０^１１）の個々のポリヌクレオチド分子を含有し得る。同様に、約１００ｎｇのＤＮＡの試料は、約３０，０００の半数体ヒトゲノム等価物、およびｃｆＤＮＡの場合は約６００，０００，０００，０００の個々の分子を含有し得る。

一部の実施形態では、試料は、異なる供給源からの、例えば、細胞からの、および無細胞源（例えば、血液試料など）からの、核酸を含む。通常は、試料は、変異を保有する核酸を含む。例えば、試料は、必要に応じて、生殖細胞系変異および／または体細胞変異を保有するＤＮＡを含む。通常は、試料は、がん関連変異（例えば、がん関連体細胞変異）を保有するＤＮＡを含む。本開示の一部の実施形態では、対象における無細胞核酸は、腫瘍に由来し得る。例えば、試料から単離された無細胞ＤＮＡは、ｃｔＤＮＡを含み得る。

増幅前の試料中の無細胞核酸の例示的な量は、通常は、約１フェムトグラム（ｆｇ）～約１マイクログラム（μｇ）、例えば、約１ピコグラム（ｐｇ）～約２００ナノグラム（ｎｇ）、約１ｎｇ～約１００ｎｇ、約１０ｎｇ～約１０００ｎｇの範囲である。一部の実施形態では、試料は、約６００ｎｇ以下、約５００ｎｇ以下、約４００ｎｇ以下、約３００ｎｇ以下、約２００ｎｇ以下、約１００ｎｇ以下、約５０ｎｇ以下、または約２０ｎｇ以下の無細胞核酸分子を含む。必要に応じて、量は、無細胞核酸分子少なくとも約１ｆｇ、少なくとも約１０ｆｇ、少なくとも約１００ｆｇ、少なくとも約１ｐｇ、少なくとも約１０ｐｇ、少なくとも約１００ｐｇ、少なくとも約１ｎｇ、少なくとも約１０ｎｇ、少なくとも約１００ｎｇ、少なくとも約１５０ｎｇ、または少なくとも約２００ｎｇである。ある特定の実施形態では、量は、無細胞核酸分子約１ｆｇ、約１０ｆｇ、約１００ｆｇ、約１ｐｇ、約１０ｐｇ、約１００ｐｇ、約１ｎｇ、約１０ｎｇ、約１００ｎｇ、約１５０ｎｇ、または約２００ｎｇ以下である。一部の実施形態では、方法は、試料から約１ｆｇ～約２００ｎｇの無細胞核酸分子を得るステップを含む。

無細胞核酸は、通常は、長さ約１００ヌクレオチド～長さ約５００ヌクレオチドの間のサイズ分布を有し、長さ約１１０ヌクレオチド～長さ約２３０ヌクレオチドの分子が試料中の分子の約９０％に相当し、最頻値は、約１６８ヌクレオチド長であり、第二の微小ピークが、長さ約２４０～約４４０ヌクレオチドの間の範囲にある。ある特定の実施形態では、無細胞核酸は、長さ約１６０～約１８０ヌクレオチド、または長さ約３２０～約３６０ヌクレオチド、または長さ約４４０～約４８０ヌクレオチドである。

一部の実施形態では、無細胞核酸は、分別ステップによって体液から単離され、このステップで、溶液中に見られる場合の無細胞核酸は、無傷細胞、および体液中の他の不溶性成分から分離される。これらのうちの一部の実施形態では、分別は、遠心分離または濾過などの技法を含む。あるいは、体液中の細胞は溶解され、無細胞核酸と細胞核酸が一緒に処理される。一般に、緩衝剤の添加および洗浄ステップ後、無細胞核酸は、例えばアルコールで、沈殿される。ある特定の実施形態では、夾雑物または塩を除去するためのシリカに基づくカラムなどの、追加の清浄化ステップが、使用される。例えば、非特異的バルク担体核酸が、収率などの例示的な手順のある特定の態様を最適化するために、反応を通じて、必要に応じて、添加される。そのような処理後、試料は、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび／または一本鎖ＲＮＡをはじめとする、様々な形態の核酸を典型的に含む。必要に応じて、一本鎖ＤＮＡおよび／または一本鎖ＲＮＡは、後続の処理および分析ステップにそれらを含めるために、二本鎖形態に変換される。ｃｆＤＮＡ分別、および本明細書で開示される方法を行う際の使用に必要に応じて適応されるエピジェネティック改変の関連分析に関するさらなる詳細は、例えば、２０１７年１２月２２日に出願されたＷＯ２０１８／１１９４５２に記載されており、この参考特許文献は、参照により本明細書に組み込まれる。
ｉｉ．核酸タグ

ある特定の実施形態では、分子識別子またはバーコードを提供するタグは、試料収集および調製パイプライン１０３の一部として、数ある方法の中でも特に、化学合成、ライゲーション、またはオーバーラップ伸長ＰＣＲによって、アダプターに組み込まれるかまたは別様に結合される。一部の実施形態では、反応における一意もしくは非一意の識別子、または分子バーコードの割り当ては、例えば、各々が参照により本明細書に組み込まれる、米国特許出願公開第２００１００５３５１９号、同第２００３０１５２４９０号、同第２０１１０１６００７８号、ならびに米国特許第６，５８２，９０８号、同第７，５３７，８９８号および同第９，５９８，７３１号に記載されている方法に従い、これらに記載されているシステムを利用する。

タグは、無作為にまたは作為的に試料核酸に連結される。一部の実施形態では、タグは、期待される識別子（例えば、一意および／または非一意のバーコードの組合せ）比でマイクロウェルに導入される。例えば、約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００より多くの識別子がゲノム試料ごとに負荷されるように、識別子を負荷することができる。一部の実施形態では、識別子は、約２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００未満の識別子がゲノム試料ごとに負荷されるように、負荷される。ある特定の実施形態では、試料ゲノムあたりの負荷される識別子の平均数は、ゲノム試料あたり識別子約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００もしくは１，０００，０００，０００未満であるか、またはそれを超える。識別子は、一般に、一意および／または非一意である。

１つの例示的な形式は、標的核酸分子の両末端にライゲーションされた約２～約１，０００，０００の異なるタグ、または約５～約１５０の異なるタグ、または約２０～約５０の異なるタグを使用する。２０～５０×２０～５０のタグの場合、合計４００～２５００のタグが作出される。通常は、そのようなタグ数は、同じ開始点および停止点を有する異なる分子が、タグの異なる組合せを受け取る確率が高くなる（例えば、少なくとも９４％、９９．５％、９９．９９％、９９．９９９％）のに十分な数である。

一部の実施形態では、識別子は、所定、無作為または半無作為の配列のオリゴヌクレオチドである。他の実施形態では、複数のバーコード中のバーコードが互いに必ずしも一意でないような複数のバーコードが使用され得る。これらの実施形態では、バーコードは、一般に、個々の分子に（例えば、ライゲーションまたはＰＣＲ増幅により）結合され、その結果、バーコードとそれに結合され得る配列の組合せによって、個々に追跡することができる一意の配列が作出される。本明細書に記載されるように、配列リードの開始（出発）および終了（停止）部分の配列データと組み合わせて、非一意的にタグ付けされたバーコードを検出することにより、通常は、特定の分子に一意の同一性を割り当てることが可能になる。個々の配列リードの長さまたは塩基対の数も、必要に応じて、所与の分子に一意の同一性を割り当てるために使用される。本明細書に記載するように、それによって、一意の同一性が割り当てられた核酸の一本鎖からの断片により、親鎖および／または相補鎖からの断片のその後の同定が可能になり得る。
ｉｉｉ．核酸増幅

アダプターと隣接している試料核酸は、通常は、試料収集および調製パイプライン１０３の一部として、増幅されることになるＤＮＡ分子に隣接しているアダプターの中のプライマー結合部位への核酸プライマーの結合を使用して、ＰＣＲおよび他の増幅方法により増幅される。一部の実施形態では、増幅方法は、熱循環の結果として生じる伸長、変性およびアニーリングのサイクルを含み、または例えば、転写媒介増幅の場合のように、等温性であることもある。必要に応じて利用される他の例示的な増幅方法としては、数ある手法の中でも特に、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベース増幅、および自家持続配列ベース複製が挙げられる。

従来の核酸増幅法を使用して核酸分子に分子タグおよび／または試料インデックス／タグを導入するために、１または複数ラウンドの増幅サイクルが一般に適用される。増幅は、通常は、１つまたは複数の反応混合物で行われる。分子タグおよび試料インデックス／タグは、必要に応じて、同時にまたは任意の順序で導入される。一部の実施形態では、分子タグおよび試料インデックス／タグは、配列捕捉ステップが行われる前におよび／または後に導入される。一部の実施形態では、分子タグのみがプローブ捕捉の前に導入され、試料インデックス／タグは、配列捕捉ステップが行われた後に導入される。ある特定の実施形態では、分子タグと試料インデックス／タグの両方が、プローブに基づく捕捉ステップを行う前に導入される。一部の実施形態では、試料インデックス／タグは、配列捕捉ステップが行われた後に導入される。通常は、配列捕捉プロトコールは、標的核酸配列、例えば、ゲノム領域のコード配列、およびがん型に関連するそのような領域の変異のコード配列、に相補的な一本鎖核酸分子を導入することを含む。通常は、増幅反応は、約２００ヌクレオチド（ｎｔ）～約７００ｎｔ、２５０ｎｔ～約３５０ｎｔ、または約３２０ｎｔ～約５５０ｎｔの範囲のサイズの、分子タグおよび試料インデックス／タグで非一意的にまたは一意的にタグ付けされた複数の核酸アンプリコンを生成する。一部の実施形態では、アンプリコンは、約３００ｎｔのサイズを有する。一部の実施形態では、アンプリコンは、約５００ｎｔのサイズを有する。
ｉｖ．核酸濃縮

一部の実施形態では、配列は、試料収集および調製パイプライン１０３の一部として、核酸をシークエンシングする前に濃縮される。濃縮は、必要に応じて、特定の標的領域に行われるか、または非特異的に（「標的配列」に）行われる。一部の実施形態では、目的の標的領域を、差次的タイリングおよび捕捉スキームを使用して１つまたは複数のベイトセットパネルに選択された核酸捕捉用プローブ（「ベイト」）を用いて濃縮することができる。差次的タイリングおよび捕捉スキームは、一般に、異なる相対濃度のベイトセットを使用して、ベイトに関連するゲノム領域にわたって差次的に（例えば、異なる「解像度」で）タイリングし、一連の制約（例えば、シーケンサーの制約、例えば、シークエンシング負荷、各ベイトの利用、など）をかけ、下流のシーケンシングに所望されるレベルで標的核酸を捕捉する。目的のこれらの標的ゲノム領域は、必要に応じて、核酸構築物の天然または合成ヌクレオチド配列を含む。一部の実施形態では、目的の１つまたは複数の区画にプローブを有するビオチン標識ビーズを使用して、標的配列を捕捉することができ、必要に応じて、続いてそれらの区画の増幅を行って、目的領域について濃縮することができる。

配列捕捉は、通常は、標的核酸配列にハイブリダイズするオリゴヌクレオチドプローブの使用を含む。ある特定の実施形態では、プローブセット戦略は、目的の区画にわたってプローブをタイリングすることを含む。そのようなプローブは、例えば、長さ約６０～約１２０ヌクレオチドであり得る。このセットは、約２倍、３倍、４倍、５倍、６倍、８倍、９倍、１０倍、１５倍、２０倍、５０倍またはそれを超える深度を有し得る。一般に、配列捕捉の有効性は、一部は、プローブの配列と相補的（またはほぼ相補的）である標的分子内の配列の長さに依存する。
ｂ．核酸シークエンシング

図２に示されているように、試料収集および調製パイプライン１０３による試料からのｃｆＤＮＡの抽出および単離の後、１つまたは複数のシークエンシングデバイス１０７を含むシークエンシングパイプライン１０５によって、ｃｆＤＮＡをシークエンシングすることができる。事前に増幅されたまたはされていない、必要に応じてアダプターと隣接している、試料核酸が、一般に、シークエンシングに付される。必要に応じて利用されるシークエンシング方法または市販の形式としては、例えば、サンガーシークエンシング、ハイスループットシークエンシング、バイサルファイトシークエンシング、パイロシークエンシング、一塩基合成法、単一分子シークエンシング、ナノポアベースのシークエンシング、半導体シークエンシング、ライゲーションによるシークエンシング、ハイブリダイゼーションによるシークエンシング、ＲＮＡ－Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、ＤｉｇｉｔａｌＧｅｎｅＥｘｐｒｅｓｓｉｏｎ（Ｈｅｌｉｃｏｓ）、次世代シークエンシング（ＮＧＳ）、ＳｉｎｇｌｅＭｏｌｅｃｕｌｅＳｅｑｕｅｎｃｉｎｇｂｙＳｙｎｔｈｅｓｉｓ（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、大規模並列シークエンシング、ＣｌｏｎａｌＳｉｎｇｌｅＭｏｌｅｃｕｌｅＡｒｒａｙ（Ｓｏｌｅｘａ）、ショットガンシークエンシング、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、Ｍａｘｉｍ－Ｇｉｌｂｅｒｔシークエンシング、プライマーウォーキング；ＰａｃＢｉｏ、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔまたはナノポアプラットフォームを使用するシークエンシングが、挙げられる。複数のレーン、複数のチャネル、複数のウェル、または実質的に同時に複数の試料セットを処理する他の手段を含み得る、様々な試料処理ユニットで、シークエンシング反応を行うことができる。試料処理ユニットは、複数の実行を同時に処理することを可能にするための複数の試料チャンバーも含み得る。

シークエンシング反応を、がんのまたは他の疾患のマーカーを含有することが分かっている１つまたは複数の核酸断片型または区画に関して行うことができる。シークエンシング反応を、試料中に存在する任意の核酸断片に関して行うこともできる。シークエンシング反応は、ゲノムの少なくとも約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％である、ゲノムの配列カバレッジを提供することができる。他の場合には、ゲノムの配列カバレッジは、ゲノムの約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％未満であり得る。

マルチプレックスシークエンシング技法を使用して、同時シークエンシング反応を行うことができる。一部の実施形態では、無細胞ポリヌクレオチドは、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００のシークエンシング反応でシークエンシングされる。他の実施形態では、無細胞ポリヌクレオチドは、約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００未満のシークエンシング反応でシークエンシングされる。シークエンシング反応は、通常は、逐次的にまたは同時に行われる。後続のデータ分析は、一般に、シークエンシング反応の全てまたは一部に関して行われる。一部の実施形態では、データ分析は、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００のシークエンシング反応に関して行われる。他の実施形態では、データ分析は、約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００未満のシークエンシング反応に関して行われ得る。例示的な読み取り深度は、１座位（塩基位置）あたり約１０００～約５００００リードである。

一部の実施形態では、核酸集団は、シークエンシングのために、一方または両方の末端に一本鎖オーバーハングを有する二本鎖核酸に平滑末端を酵素的に形成することにより調製される。これらの実施形態では、集団は、ヌクレオチド（例えば、Ａ、Ｃ、ＧおよびＴまたはＵ）の存在下で、５’－３’ＤＮＡポリメラーゼ活性および３’－５’エキソヌクレアーゼ活性を有する酵素で通常は処理される。必要に応じて使用される例示的な酵素またはその触媒性断片としては、クレノウ大断片およびＴ４ポリメラーゼが挙げられる。５’オーバーハングでは、通常は、酵素は、反対の鎖上の陥凹３’末端を、その３’末端が５’末端とぴったり重なって平滑末端を生成するまで伸長する。３’オーバーハングでは、酵素は、反対の鎖の３’末端から５’末端までを一般に消化し、５’末端を超えて消化することもある。この消化が、反対の鎖の５’末端を超えて進行した場合、５’オーバーハングに使用されるのと同じポリメラーゼ活性を有する酵素が、そのギャップを埋めることができる。二本鎖核酸上の平滑末端の形成は、例えば、アダプターの結合およびその後の増幅を助長する。

一部の実施形態では、核酸集団は、追加の処理、例えば、一本鎖核酸の二本鎖核酸への変換、および／またはＲＮＡのＤＮＡへの変換に付される。核酸のこれらの形態も、必要に応じて、アダプターに連結され、増幅される。

事前に増幅されたまたはされていない、上記の平滑末端形成プロセスに付される核酸、および必要に応じて試料中の他の核酸をシークエンシングして、シークエンシングされた核酸を生じさせることができる。シークエンシングされた核酸は、核酸の配列（すなわち、配列情報）を指すこともあり、または配列が決定された核酸を指すこともある。シークエンシングを行って、試料中の個々の核酸分子の配列データを、試料中の個々の核酸分子の増幅産物のコンセンサス配列から、直接または間接的に得ることができる。

一部の実施形態では、試料中の一本鎖オーバーハングを有する二本鎖核酸は、平滑末端形成後、両末端が、バーコードを含むアダプターに連結され、シークエンシングによって、核酸配列はもちろん、アダプターにより誘導されたインラインバーコードも決定される。平滑末端ＤＮＡ分子は、少なくとも部分的に二本鎖のアダプター（例えば、Ｙ型または釣り鐘型）の平滑末端に、必要に応じてライゲーションされる。あるいは、試料核酸およびアダプターの平滑末端に、ライゲーション（例えば、付着末端ライゲーション）を助長するために相補的ヌクレオチドの尾部をつけることができる。

通常は、核酸試料を十分な数のアダプターと接触させ、したがって、同じ核酸の任意の２つのコピーが、両末端に連結されたアダプターからアダプターバーコードの同じ組合せを受け取る確率は低い（例えば、＜１または０．１％）。このようにアダプターを使用することよって、参照核酸上の同じ開始および停止点を有し、かつバーコードの同じ組合せに連結されている、核酸配列のファミリーの同定が可能になる。そのようなファミリーは、増幅前の試料中の核酸の増幅産物の配列を示す。平滑末端形成およびアダプター結合により改変された場合、ファミリーメンバーの配列をコンパイルして、元の試料中の核酸分子のコンセンサスヌクレオチドまたは完全コンセンサス配列を導出することができる。言い換えると、試料中の核酸の特定位置を占めるヌクレオチドは、ファミリーメンバー配列中の対応する位置を占めるヌクレオチドのコンセンサスであると判定される。ファミリーは、二本鎖核酸の一方または両方の鎖の配列を含み得る。ファミリーのメンバーが、二本鎖核酸からの両方の鎖の配列を含む場合、一方の鎖の配列は、コンセンサスヌクレオチドまたは配列を導出するために全ての配列をコンパイルすることを目的として、それらの相補鎖に変換される。一部のファミリーは、単一のメンバー配列のみを含む。この場合、この配列を増幅前の試料中の核酸の配列と考えることができる。あるいは、単一のメンバー配列のみを有するファミリーを後続の分析から除外することができる。

本明細書に記載される形式および応用を含む、核酸シークエンシングに関する追加の詳細は、例えば、Levy et al., Annual Review of Genomics and Human Genetics, 17: 95-115 (2016)、Liu et al., J. of Biomedicine and Biotechnology, Volume 2012, Article ID 251364:1-11 (2012)、Voelkerding et al., Clinical Chem., 55: 641-658 (2009)、MacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009)、Astier et al., J Am Chem Soc., 128(5):1705-10 (2006)、米国特許第６，２１０，８９１号、米国特許第６，２５８，５６８号、米国特許第６，８３３，２４６号、米国特許第７，１１５，４００号、米国特許第６，９６９，４８８号、米国特許第５，９１２，１４８号、米国特許第６，１３０，０７３号、米国特許第７，１６９，５６０号、米国特許第７，２８２，３３７号、米国特許第７，４８２，１２０号、米国特許第７，５０１，２４５号、米国特許第６，８１８，３９５号、米国特許第６，９１１，３４５号、米国特許第７，５０１，２４５号、米国特許第７，３２９，４９２号、米国特許第７，１７０，０５０号、米国特許第７，３０２，１４６号、米国特許第７，３１３，３０８号、および米国特許第７，４７６，５０３号においても提供されており、これらの参考文献は、各々、それら全体が参照により本明細書に組み込まれる。
ｉ．シークエンシングパネル

目的のゲノム領域を検出する尤度、および必要に応じて、変異を示す腫瘍を検出する尤度を高めるために、シークエンシングされるＤＮＡの区画は、既知のゲノム領域を含む遺伝子またはゲノム区画のパネルを含み得る。限られた区画（例えば、限られたパネル）をシークエンシングに選択することによって、必要とされる全シークエンシング（例えば、シークエンシングされるヌクレオチドの総量）は低減され得る。シークエンシングパネルは、複数の異なる遺伝子または領域を、例えば、単一のがん、がんのセット、または全てのがんを検出するための標的とすることができる。あるいは、全ゲノムシークエンシング（ＷＧＳ）、または他の不偏の（ｕｎｂｉａｓｅｄ）シークエンシング方法によって、シークエンシングパネルを使用せずにＤＮＡをシークエンシングすることができる。好適なパネルおよびパネルにおける使用のための標的の例は、２０２０年１月３１日に出願された国際出願ＷＯ２０２０１６０４１４に記載されているエピジェネティック標的において見つけることができ、前記参考特許文献は、その全体が参照により本明細書に組み込まれる。

一部の態様では、複数の異なる遺伝子またはゲノム領域（例えば、転写因子結合領域、遠位調節エレメント（ＤＲＥ）、反復エレメント、イントロン－エクソン連結部、転写開始部位（ＴＳＳ）、および／またはこれらに類するもの）を標的とするパネルが、がんを有する対象の所定の比率がパネル内の１つまたは複数の遺伝子において遺伝的バリアントまたは腫瘍マーカーを示すように選択される。パネルは、シークエンシングする領域を固定数の塩基対に限定するように選択され得る。パネルは、ＤＮＡの所望の量をシークエンシングするように選択され得る。パネルは、さらに、所望の配列読み取り深度を達成するように選択され得る。パネルは、シークエンシングされる塩基対の量について所望される配列読み取り深度または配列読み取りカバレッジを達成するように選択され得る。パネルは、試料中の１つまたは複数の遺伝的バリアントの検出についての理論感度、理論特異度、および／または理論精度を達成するように選択され得る。

このパネルに含まれるＨＲＲ遺伝子は、ＡＴＭ、ＡＴＲ、ＢＡＰ１、ＢＡＲＤ１、ＢＲＣＡ１、ＢＲＣＡ２、ＢＲＩＰ１、ＣＤＫ１２、ＣＨＥＫ１、ＣＨＥＫ２、ＦＡＮＣＡ、ＦＡＮＣＬ、ＨＤＡＣ２、ＭＲＥ１１、ＮＢＮ、ＰＡＬＢ２、ＲＡＤ５０、ＲＡＤ５１、ＲＡＤ５１Ｂ、ＲＡＤ５１Ｃ、ＲＡＤ５１Ｄ、ＲＡＤ５４Ｌ、ＸＲＣＣ２、ＸＲＣＣ３のうちの１つまたは複数を含み得る。

領域のパネルを検出するためのプローブは、目的のゲノム領域（ホットスポット領域）を検出するためのものはもちろん、ヌクレオソーム認識プローブ（例えば、ＫＲＡＳコドン１２および１３）も含むことができ、そのようなプローブを、ヌクレオソーム結合パターンおよびＧＣ配列組成による影響を受けるｃｆＤＮＡカバレッジおよび断片サイズの変動についての分析に基づいて捕捉を最適化するように設計することができる。この場合に使用される領域は、ヌクレオソーム位置およびＧＣモデルに基づいて最適化された非ホットスポット領域も含み得る。パネルは、原発組織を同定するためのサブパネル（例えば、組織にわたって最も多様な転写プロファイルを有する遺伝子（必ずしもプロモーターとは限らない）を代表する５０～１００のベイトを定義するための公開文献の使用）、全ゲノム足場を同定するためのサブパネル（例えば、超保存的ゲノムコンテンツを同定し、コピー数ベースライニングを目的として少数のプローブを用いて染色体全体にわたって疎にタイリングするための）、転写開始部位（ＴＳＳ）／ＣｐＧアイランドを同定するためのサブパネル（例えば、差次的なメチル化領域（例えば、可変メチル化領域（ＤＭＲ））を、例えば、腫瘍抑制遺伝子（例えば、大腸がんにおけるＳＥＰＴ９／ＶＩＭ）のプロモーターにおいて、捕捉するための）をはじめとする、複数のサブパネルを含み得る。一部の実施形態では、原発組織のためのマーカーは、組織特異的な後成的マーカーである。

一部の実施形態では、パネル内の１つまたは複数の領域は、外科手術後の残存がんを検出するために１つまたは複数の遺伝子からの１つまたは複数の座位を含む。この検出は、既存のがん検出方法が可能であるものより早期であり得る。一部の実施形態では、パネル内の１つまたは複数の遺伝子位置は、高リスク患者集団においてがんを検出するために１つまたは複数の遺伝子からの１つまたは複数の座位を含む。例えば、喫煙者は、一般集団よりはるかに高い肺がん率を有する。さらに、喫煙者は、肺における不規則な小結節の発症などの、がんの検出をより困難にする他の肺の状態を発症し得る。一部の実施形態では、本明細書に記載される方法は、高リスク患者におけるがんを、既存のがん検出方法が可能であるものより早期に検出することができる。

シークエンシングパネルに含めるための遺伝子位置を、腫瘍マーカーがその遺伝子または領域にあるがんを有する対象の数に基づいて選択することができる。シークエンシングパネルに含めるための遺伝子位置を、がんおよび腫瘍マーカーがその遺伝子に存在するがんを有する対象の有病率に基づいて選択することができる。領域内の腫瘍マーカーの存在は、がんを有する対象を示し得る。

一部の事例では、１つまたは複数のデータベースからの情報を使用して、パネルを選択することができる。がんに関する情報は、がん腫瘍生検またはｃｆＤＮＡアッセイから導出され得る。データベースは、シークエンシングされた腫瘍試料の集団を記述する情報を含み得る。データベースは、腫瘍試料におけるｍＲＮＡ発現についての情報を含み得る。データベースは、腫瘍試料における調節エレメントまたはゲノム領域についての情報を含み得る。シークエンシングされた腫瘍試料に関する情報は、様々な遺伝的バリアントの頻度を含み得、遺伝的バリアントが存在する遺伝子または領域を記述するものであり得る。遺伝的バリアントは、腫瘍マーカーであり得る。そのようなデータベースの非限定的な例は、ＣＯＳＭＩＣである。ＣＯＳＭＩＣは、様々ながんに見られる体細胞変異のカタログである。特定のがんについて、ＣＯＳＭＩＣは、変異の頻度に基づいて遺伝子をランク付けしている。所与の遺伝子の中での変異頻度が高いことから、パネルに含めるための遺伝子を選択することができる。例えば、ＣＯＳＭＩＣは、シークエンシングされた乳がん試料の集団の３３％がＴＰ５３の変異を有し、試料採取された乳がんの集団の２２％がＫＲＡＳの変異を有することを示す。ＡＰＣをはじめとする、他のランク付けされた遺伝子は、シークエンシングされた乳がん試料の集団の約４％にしか見られない変異を有する。ＴＰ５３およびＫＲＡＳを、試料採取された乳がんの中で（例えば、約４％の頻度で存在するＡＰＣと比較して）頻度が相対的に高いことに基づいてシークエンシングパネルに含めることができる。ＣＯＳＭＩＣを非限定的な例として提供するが、がんを遺伝子または遺伝領域に位置する腫瘍マーカーと関連付ける任意のデータベースまたは情報セットを使用することができる。別の例では、ＣＯＳＭＩＣにより提供されているように、１１５６の胆道がん試料のうちの３８０の試料（３３％）は、ＴＰ５３の変異を保有する。ＡＰＣなどの、いくつかの他の遺伝子は、全試料の４～８％に変異を有する。したがって、ＴＰ５３を、胆道がん試料の集団における相対的に高い頻度に基づいてパネルに含めるために選択することができる。

遺伝子またはゲノム区画は、腫瘍マーカーの頻度が、試料採取された腫瘍組織または循環腫瘍ＤＮＡにおいて所与のバックグラウンド集団に見られる頻度より有意に高い場合、パネルに選択することができる。がんを有する対象の少なくとも大多数が、パネル内の遺伝子位置または遺伝子の少なくとも１つに存在する腫瘍マーカーまたはゲノム領域を有するような、遺伝子位置の組合せを、パネルに含めるために選択することができる。特定のがんまたはがんのセットについて、対象の大多数が、選択された領域の１つまたは複数に１つまたは複数の腫瘍マーカーを有することを示すデータに基づいて、遺伝子位置の組合せを選択することができる。例えば、がん１を検出するために、がん１を有する対象の９０％がパネルの領域Ａ、Ｂ、Ｃおよび／またはＤに腫瘍マーカーを有することを示すデータに基づいて、領域Ａ、Ｂ、Ｃおよび／またはＤを含むパネルを選択することができる。あるいは、腫瘍マーカーは、がんを有する対象の２つまたはそれより多くの領域に独立して存在することが示されることがあり、したがって、併せると、２つまたはそれより多くの領域における腫瘍マーカーが、がんを有する対象の集団の大部分に存在する。例えば、がん２を検出するために、対象の９０％が１つまたは複数の領域に腫瘍マーカーを有すること、ならびにそのような対象の３０％では、腫瘍マーカーが領域Ｘにおいてのみ検出されるが、腫瘍マーカーが検出された対象の残部については腫瘍マーカーが領域Ｙおよび／またはＺにおいてのみ検出されることを示すデータに基づいて、領域Ｘ、ＹおよびＺを含むパネルを選択することができる。１つまたは複数のがんに関連することが以前に証明された１つまたは複数の遺伝子位置に存在する腫瘍マーカーは、腫瘍マーカーがそのときの５０％またはそれより多くの領域の１つまたは複数で検出された場合、対象ががんを有することを示すことまたは予測することができる。１つまたは複数の領域内の腫瘍マーカーのセットについてのがんの頻度から判断してがんを検出する条件付き確率を利用するモデルなどの、計算論的手法を使用して、どの領域が、単独でまたは組合せで、がんを予測し得るのかを予測することができる。パネル選択のための他の手法は、大パネルでの腫瘍の包括的ゲノムプロファイリングおよび／または全ゲノムシークエンシング（ＷＧＳ、ＲＮＡ－ｓｅｑ、Ｃｈｉｐ－ｓｅｑ、バイサルファイトシークエンシング、ＡＴＡＣ－ｓｅｑなど）を用いる研究からの情報を記述するデータベースの使用を含む。文献から集められた情報には、ある特定のがんの場合に一般に影響を受け、変異する経路も、記述されていることがある。遺伝子情報を記述するオントロジーの使用によって、パネル選択のさらなる情報を得ることができる。

シークエンシングのためのパネルに含まれる遺伝子は、完全転写領域、プロモーター領域、エンハンサー領域、調節エレメント、および／または下流の配列を含み得る。変異を示す腫瘍を検出する尤度をさらに高めるために、エクソンのみをパネルに含めることができる。パネルは、選択された遺伝子の全てのエクソンを含むこともあり、または選択された遺伝子のエクソンのうちの１つだけもしくは複数を含むこともある。パネルは、複数の異なる遺伝子の各々からのエクソンを含むことがある。パネルは、複数の異なる遺伝子の各々からの少なくとも１つのエクソンを含むこともある。

一部の態様では、複数の異なる遺伝子の各々からのエクソンのパネルは、がんを有する対象の所定の比率が、エクソンのパネル内の少なくとも１つのエクソンにおける遺伝的バリアントを示すように選択される。

遺伝子のパネル内の異なる遺伝子各々からの少なくとも１つの全エクソンをシークエンシングすることができる。シークエンシングされるパネルは、複数の遺伝子からのエクソンを含み得る。パネルは、２～１００の異なる遺伝子、２～７０の遺伝子、２～５０の遺伝子、２～３０の遺伝子、２～１５の遺伝子、または２～１０の遺伝子からのエクソンを含み得る。

選択されるパネルは、様々な数のエクソンを含み得る。パネルは、２～３０００のエクソンを含み得る。パネルは、２～１０００のエクソンを含み得る。パネルは、２～５００のエクソンを含み得る。パネルは、２～１００のエクソンを含み得る。パネルは、２～５０のエクソンを含み得る。パネルは、３００以下のエクソンを含み得る。パネルは、２００以下のエクソンを含み得る。パネルは、１００以下のエクソンを含み得る。パネルは、５０以下のエクソンを含み得る。パネルは、４０以下のエクソンを含み得る。パネルは、３０以下のエクソンを含み得る。パネルは、２５以下のエクソンを含み得る。パネルは、２０以下のエクソンを含み得る。パネルは、１５以下のエクソンを含み得る。パネルは、１０以下のエクソンを含み得る。パネルは、９以下のエクソンを含み得る。パネルは、８以下のエクソンを含み得る。パネルは、７以下のエクソンを含み得る。

パネルは、複数の異なる遺伝子からの１つまたは複数のエクソンを含み得る。パネルは、複数の異なる遺伝子のある比率の各々からの１つまたは複数のエクソンを含み得る。パネルは、異なる遺伝子の少なくとも２５％、５０％、７５％または９０％の各々からの少なくとも２つのエクソンを含み得る。パネルは、異なる遺伝子の少なくとも２５％、５０％、７５％または９０％の各々からの少なくとも３つのエクソンを含み得る。パネルは、異なる遺伝子の少なくとも２５％、５０％、７５％または９０％の各々からの少なくとも４つのエクソンを含み得る。

シークエンシングパネルのサイズは、様々であり得る。例えば、シークエンシングされるヌクレオチドの総量、またはパネル内の特定の領域についてシークエンシングされる一意の分子の数を含む、いくつかの因子に依存して、シークエンシングパネルを（ヌクレオチドサイズに関して）より大きくまたはより小さくすることができる。シークエンシングパネルを５ｋｂ～５０ｋｂサイズにすることができる。シークエンシングパネルを１０ｋｂ～３０ｋｂサイズにすることができる。シークエンシングパネルを１２ｋｂ～２０ｋｂサイズにすることができる。シークエンシングパネルを１２ｋｂ～６０ｋｂサイズにすることができる。シークエンシングパネルは、少なくとも１０ｋｂ、１２ｋｂ、１５ｋｂ、２０ｋｂ、２５ｋｂ、３０ｋｂ、３５ｋｂ、４０ｋｂ、４５ｋｂ、５０ｋｂ、６０ｋｂ、７０ｋｂ、８０ｋｂ、９０ｋｂ、１００ｋｂ、１１０ｋｂ、１２０ｋｂ、１３０ｋｂ、１４０ｋｂ、または１５０ｋｂのサイズであり得る。シークエンシングパネルは、１００ｋｂ、９０ｋｂ、８０ｋｂ、７０ｋｂ、６０ｋｂ、または５０ｋｂ未満のサイズであり得る。

シークエンシングに選択されるパネルは、少なくとも１、５、１０、１５、２０、２５、３０、４０、５０、６０、８０、または１００の遺伝子位置（例えば、各々が目的のゲノム領域を含む）を含み得る。一部の場合には、位置のサイズが相対的に小さい、パネル内の遺伝子位置が、選択される。一部の場合には、パネル内の領域は、約１０ｋｂもしくはそれ未満、約８ｋｂもしくはそれ未満、約６ｋｂもしくはそれ未満、約５ｋｂもしくはそれ未満、約４ｋｂもしくはそれ未満、約３ｋｂもしくはそれ未満、約２．５ｋｂもしくはそれ未満、約２ｋｂもしくはそれ未満、約１．５ｋｂもしくはそれ未満、または約１ｋｂもしくはそれ未満またはそれ未満のサイズを有する。一部の場合には、パネル内の遺伝子位置は、約０．５ｋｂ～約１０ｋｂ、約０．５ｋｂ～約６ｋｂ、約１ｋｂ～約１１ｋｂ、約１ｋｂ～約１５ｋｂ、約１ｋｂ～約２０ｋｂ、約０．１ｋｂ～約１０ｋｂ、または約０．２ｋｂ～約１ｋｂのサイズを有する。例えば、パネル内の領域は、約０．１ｋｂ～約５ｋｂのサイズを有し得る。

本明細書で選択されるパネルは、低頻度の遺伝的バリアント（例えば、試料から得られた無細胞核酸分子中の）を検出するのに十分である深いシークエンシングを可能にし得る。試料中の遺伝的バリアントの量は、所与の遺伝的バリアントについてのマイナーアレル頻度の点から言及されることがある。マイナーアレル頻度は、マイナーアレル（例えば、最も頻度の高いアレルではない）が、試料などの所与の核酸集団に存在する頻度を指し得る。低いマイナーアレル頻度の遺伝的バリアントは、試料中の存在頻度が相対的に低いものであり得る。一部の場合には、パネルは、少なくとも０．０００１％、０．００１％、０．００５％、０．０１％、０．０５％、０．１％、または０．５％のマイナーアレル頻度の遺伝的バリアントの検出を可能にする。パネルは、０．００１％またはそれより大きいマイナーアレル頻度の遺伝的バリアントの検出を可能にし得る。パネルは、０．０１％またはそれより大きいマイナーアレル頻度の遺伝的バリアントの検出を可能にし得る。パネルは、０．０００１％、０．００１％、０．００５％、０．０１％、０．０２５％、０．０５％、０．０７５％、０．１％、０．２５％、０．５％、０．７５％、または１．０％ほども低い頻度で試料中に存在する遺伝的バリアントの検出を可能にする。パネルは、少なくとも０．０００１％、０．００１％、０．００５％、０．０１％、０．０２５％、０．０５％、０．０７５％、０．１％、０．２５％、０．５％、０．７５％、または１．０％の頻度で試料中に存在する腫瘍マーカーの検出を可能にする。パネルは、試料中の１．０％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．７５％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．５％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．２５％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．１％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．０７５％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．０５％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．０２５％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．０１％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．００５％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．００１％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．０００１％ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の１．０％～０．０００１％ほども低い頻度のシークエンシングされたｃｆＤＮＡ中の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の０．０１％～０．０００１％ほども低い頻度のシークエンシングされたｃｆＤＮＡ中の腫瘍マーカーの検出を可能にし得る。

遺伝的バリアントを、疾患（例えば、がん）を有する対象の集団のパーセンテージで示すことができる。一部の場合には、がんを有する集団の少なくとも１％、２％、３％、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、または９９％は、パネル内の領域のうちの少なくとも１つの領域における１つまたは複数の遺伝的バリアントを示す。例えば、がんを有する集団の少なくとも８０％は、パネル内のゲノム位置のうちの少なくとも１つのゲノム位置における１つまたは複数の遺伝的バリアントを示し得る。

パネルは、１つまたは複数の遺伝子の各々からの目的のゲノム領域を含む１つまたは複数の位置を含み得る。一部の場合には、パネルは、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、または８０の遺伝子の各々からの目的のゲノム領域を含む１つまたは複数の位置を含み得る。一部の場合には、パネルは、多くても１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、または８０の遺伝子の各々からの目的のゲノム領域を含む１つまたは複数の位置を含み得る。一部の場合には、パネルは、約１～約８０、１～約５０、約３～約４０、５～約３０、１０～約２０の異なる遺伝子の各々からの目的のゲノム領域を含む１つまたは複数の位置を含み得る。

１つまたは複数のエピジェネティックに改変された領域が検出されるように、パネル内のゲノム領域を含む位置を選択することができる。１つまたは複数のエピジェネティックに改変された領域は、アセチル化、メチル化、ユビキチン化、リン酸化、ＳＵＭＯ化、リボシル化、および／またはシトルリン化されていることがある。例えば、１つまたは複数のメチル化領域が検出されるように、パネル内の領域を選択することができる。

パネル内の領域を、それらが１つまたは複数の組織にわたって差次的に転写された配列を含むように選択することができる。一部の場合には、ゲノム領域を含む位置は、ある特定の組織に他の組織と比較して高いレベルで転写された配列を含み得る。例えば、ゲノム領域を含む位置は、転写された配列をある特定の組織に含み得るが、他の組織には含み得ない。

パネル内の遺伝子位置は、コードおよび／または非コード配列を含み得る。例えば、パネル内の遺伝子位置は、エクソン、イントロン、３’非翻訳領域、５’非翻訳領域、調節エレメント、転写開始部位、および／またはスプライス部位における１つまたは複数の配列を含み得る。一部の場合には、パネル内の領域は、偽遺伝子、反復配列、トランスポゾン、ウイルスエレメント、およびテロメアをはじめとする、他の非コード配列を含み得る。一部の場合には、パネル内の遺伝子位置は、非コードＲＮＡ、例えば、リボソームＲＮＡ、トランスファーＲＮＡ、Ｐｉｗｉ結合ＲＮＡ、およびマイクロＲＮＡ内の配列を含み得る。

パネル内の遺伝子位置を、所望の感度レベルで（例えば、１つまたは複数の遺伝的バリアントの検出によって）がんを検出（診断）するように選択することができる。例えば、パネル内の領域を、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の感度で（例えば、１つまたは複数の遺伝的バリアントの検出によって）がんを検出するように選択することができる。パネル内の遺伝子位置を、１００％の感度でがんを検出するように選択することができる。

パネル内の遺伝子位置を、所望の特異度レベルで（例えば、１つまたは複数の遺伝的バリアントの検出によって）がんを検出（診断）するように選択することができる。例えば、パネル内の遺伝子位置を、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の特異度で（例えば、１つまたは複数の遺伝的バリアントの検出によって）がんを検出するように選択することができる。パネル内の遺伝子位置を、１００％の特異度で１つまたは複数の遺伝的バリアントを検出するように選択することができる。

パネル内の遺伝子位置を、所望の陽性予測値でがんを検出（診断）するように選択することができる。感度（実際の陽性が検出される機会）および／または特異度（実際の陰性を陽性と間違えない機会）を高めることによって、陽性予測値を上昇させることができる。非限定的な例として、パネル内の遺伝子位置を、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の陽性予測値で１つまたは複数の遺伝的バリアントを検出するように選択することができる。パネル内の領域を、１００％の陽性予測値を有する１つまたは複数の遺伝的バリアントを検出するように選択することができる。

パネル内の遺伝子位置を、所望の精度でがんを検出（診断）するように選択することができる。本明細書で使用される場合、用語「精度」は、疾患状態（例えば、がん）と健康な状態とを弁別する試験の能力を指す。精度は、感度および特異度、予測値、尤度比、ＲＯＣ曲線下面積、ヨーデン指標および／または診断オッズ比などの尺度を使用して定量化することができる。

精度は、パーセンテージとして提示することができ、このパーセンテージは、正しい結果を与える試験の数と行われた試験の総数との比を指す。パネル内の領域を、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の精度でがんを検出するように選択することができる。パネル内の遺伝子位置を、１００％の精度でがんを検出するように選択することができる。

高感度になるように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。例えば、試料中に０．０１％、０．０５％、または０．００１％ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の感度で検出することができるように、パネルを選択することができる。パネル内の遺伝子位置を、試料中に１％またはそれ未満の頻度で存在する腫瘍マーカーを７０％またはそれより高い感度で検出するように選択することができる。試料中の０．１％ほども低い頻度の腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の感度で検出するように、パネルを選択することができる。試料中の０．０１％ほども低い頻度の腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の感度で検出するように、パネルを選択することができる。試料中の０．００１％ほども低い頻度の腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の感度で検出するように、パネルを選択することができる。

高い特異度になるように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。例えば、試料中に０．０１％、０．０５％、または０．００１％ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の特異度で検出することができるように、パネルを選択することができる。パネル内の遺伝子位置を、試料中に１％またはそれ未満の頻度で存在する腫瘍マーカーを７０％またはそれより高い特異度で検出するように選択することができる。試料中の０．１％ほども低い頻度の腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の特異度で検出するように、パネルを選択することができる。試料中の０．０１％ほども低い頻度の腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の特異度で検出するように、パネルを選択することができる。試料中の０．００１％ほども低い頻度の腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の特異度で検出するように、パネルを選択することができる。

高精度になるように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。試料中に０．０１％、０．０５％、または０．００１％ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の精度で検出することができるように、パネルを選択することができる。パネル内の遺伝子位置を、試料中に１％またはそれ未満の頻度で存在する腫瘍マーカーを７０％またはそれより高い精度で検出するように選択することができる。試料中の０．１％ほども低い頻度の腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の精度で検出するように、パネルを選択することができる。試料中の０．０１％ほども低い頻度の腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の精度で検出するように、パネルを選択することができる。試料中の０．００１％ほども低い頻度の腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の精度で検出するように、パネルを選択することができる。

高度に予測するように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。試料中に０．０１％、０．０５％、または０．００１％ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーが少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％の陽性予測値を有することができるように、パネルを選択することができる。

パネルに使用されるプローブまたはベイトの濃度を、試料中のより多くの核酸分子を捕捉するために（２から６ｎｇ／μＬに）上昇させることができる。パネルに使用されるプローブまたはベイトの濃度は、少なくとも２ｎｇ／μＬ、３ｎｇ／μＬ、４ｎｇ／μＬ、５ｎｇ／μＬ、６ｎｇ／μＬ、またはそれより高い濃度であり得る。プローブの濃度は、約２ｎｇ／μＬ～約３ｎｇ／μＬ、約２ｎｇ／μＬ～約４ｎｇ／μＬ、約２ｎｇ／μＬ～約５ｎｇ／μＬ、約２ｎｇ／μＬ～約６ｎｇ／μＬであり得る。パネルに使用されるプローブまたはベイトの濃度は、２ｎｇ／μＬまたはそれより高い濃度～６ｎｇ／μＬまたはそれ未満の濃度であり得る。一部の事例では、これは、生物製剤中のより多くの分子を分析することを可能にし、それによって、より低頻度のアレルを検出することが可能になる。

ある実施形態では、シークエンシング後、配列リードを配列リードデータストア１０９に記憶させることができる。配列リードを任意の形式で記憶させることができる。配列リードストア１０９は、シークエンシングが行われる位置に対してローカルおよび／または遠隔にあり得る。

図２に示されているように、記憶された配列リードは、配列分析パイプライン１１２に供され得る。配列分析パイプライン１１２は、研究室システム１０２からの配列リードをフィルタリングすることができる配列品質管理（ＱＣ）構成要素１１３を含み得る。配列品質管理（ＱＣ）構成要素１１３は、１つまたは複数の配列リードに品質スコアを割り当てることができる。品質スコアは、配列リードの表示であって、それらの配列リードが閾値に基づいて後続の分析に有用であり得るかどうかを示す表示であり得る。一部の場合には、一部の配列リードは、後続のマッピングステップを行うのに十分な品質のものでも長さのものでもない。品質スコア少なくとも９０％、９５％、９９％、９９．９％、９９．９９％または９９．９９９％を有する配列リードをフィルタリングして配列リードのデータセットから除去することができる。他の場合には、品質スコア少なくとも９０％、９５％、９９％、９９．９％、９９．９９％または９９．９９９％が割り当てられた配列リードをフィルタリングしてデータセットから除去することができる。

特定品質スコア閾値を満たす配列リードをコピー数モジュール１１５により参照ゲノムにマッピングすることができる。マッピングアラインメント後、配列リードにマッピングスコアを割り当てることができる。マッピングスコアは、各位置が一意的にマッピング可能であるか否かを示す、参照配列にマッピングし直された配列リードの表示であり得る。マッピングスコア少なくとも９０％、９５％、９９％、９９．９％、９９．９９％または９９．９９９％を有する配列リードをフィルタリングしてデータセットから除去することができる。他の場合には、９０％、９５％、９９％、９９．９％、９９．９９％または９９．９９９％未満のマッピングスコアが割り当てられた配列リードをフィルタリングして配列リードのデータセットから除去することができる。

フィルタリング後、複数の配列リードは、染色体のカバレッジ領域を生成する。コピー数モジュール１１５は、その染色体領域を可変長のウインドウまたはビンに分割することができる。ウインドウまたはビンは、少なくとも５ｋｂ、１０、ｋｂ、２５ｋｂ、３０ｋｂ、３５、ｋｂ、４０ｋｂ、５０ｋｂ、６０ｋｂ、７５ｋｂ、１００ｋｂ、１５０ｋｂ、２００ｋｂ、５００ｋｂ、または１０００ｋｂであり得る。ウインドウまたはビンはまた、５ｋｂ、１０、ｋｂ、２５ｋｂ、３０ｋｂ、３５、ｋｂ、４０ｋｂ、５０ｋｂ、６０ｋｂ、７５ｋｂ、１００ｋｂ、１５０ｋｂ、２００ｋｂ、５００ｋｂ、または１０００ｋｂ以下の塩基を有し得る。ウインドウまたはビンはまた、約５ｋｂ、１０、ｋｂ、２５ｋｂ、３０ｋｂ、３５、ｋｂ、４０ｋｂ、５０ｋｂ、６０ｋｂ、７５ｋｂ、１００ｋｂ、１５０ｋｂ、２００ｋｂ、５００ｋｂ、または１０００ｋｂであり得る。

コピー数モジュール１１５は、ウインドウまたはビンにほぼ同数のマッピング可能な塩基を含有させることにより、カバレッジを正規化することができる。一部の場合には、染色体領域内の各ウインドウまたはビンは、ちょうど同数のマッピング可能な塩基を含有することがある。他の場合には、各ウインドウまたはビンは、異なる数のマッピング可能な塩基を含有することもある。加えて、各ウインドウまたはビンは、隣接するウインドウともビンともオーバーラップしていないことがある。他の場合には、ウインドウまたはビンは、別の隣接するウインドウまたはビンとオーバーラップしていることもある。一部の場合には、ウインドウまたはビンは、少なくとも１ｂｐ、２、ｂｐ、３ｂｐ、４ｂｐ、５、ｂｐ、１０ｂｐ、２０ｂｐ、２５ｂｐ、５０ｂｐ、１００ｂｐ、２００ｂｐ、２５０ｂｐ、５００ｂｐ、または１０００ｂｐオーバーラップしていることがある。他の場合には、ウインドウまたはビンは、１ｂｐ、２、ｂｐ、３ｂｐ、４ｂｐ、５、ｂｐ、１０ｂｐ、２０ｂｐ、２５ｂｐ、５０ｂｐ、１００ｂｐ、２００ｂｐ、２５０ｂｐ、５００．ｂｐ、または１０００ｂｐ以下オーバーラップしていることがある。一部の場合には、ウインドウまたはビンは、約１ｂｐ、２、ｂｐ、３ｂｐ、４ｂｐ、５、ｂｐ、１０ｂｐ、２０ｂｐ、２５ｂｐ、５０ｂｐ、１００ｂｐ、２００ｂｐ、２５０ｂｐ、５００ｂｐ、または１０００ｂｐオーバーラップしていることがある。

一部の場合には、ウインドウ領域の各々は、指定されたサイズを有することができ、そのため、それらは、ほぼ同数の一意的にマッピング可能な塩基を含有する。ウインドウ領域を構成する各塩基のマッピング可能性が決定され、マッピング可能性ファイルを生成するために使用され、このマッピング可能性ファイルは、各ファイルの参照にマッピングし直される参照からのリードの表示を含有する。マッピング可能性ファイルは、位置ごとに一行を含有し、これによって各位置が一意にマッピング可能であるか否かが示される。

加えて、ゲノム全体にわたってシークエンシングが困難であることまたはかなり高いＧＣバイアスを含有することが分かっている、事前に定義されたウインドウを、データセットからフィルタリングすることができる。例えば、染色体のセントロメア（すなわち、セントロメアＤＮＡ）付近にあることが分かっている領域は、偽陽性結果を生じさせ得る高反復配列を含有することが分かっている。これらの領域をフィルタリングして除去することができる。ゲノムの他の領域、例えば、マイクロサテライトＤＮＡなどの異常に高濃度の他の高反復配列を含有する領域を、データセットからフィルタリングすることができる。

分析されるウインドウの数も、様々であり得る。一部の場合には、少なくとも１０、２０、３０、４０、５０、１００、２００、５００、１０００、２０００、５，０００、１０，０００、２０，０００、５０，０００または１００，０００のウインドウが分析される。他の場合には、分析されるウインドウの数は、１０、２０、３０、４０、５０、１００、２００、５００、１０００、２０００、５，０００、１０，０００、２０，０００、５０，０００または１００，０００以下であり、これらのウインドウが分析される。

コピー数モジュール１１５は、ウインドウ／ビン領域ごとにリードカバレッジを決定することができる。この決定を、バーコードを伴うリードまたはバーコードを伴わないリードのどちらかを使用して行うことができる。バーコードを伴わない場合、前のマッピングステップは、異なる塩基位置のカバレッジを提供することになる。十分なマッピングおよび品質スコアを有する配列リードであって、フィルタリングされない染色体ウインドウ内に入る配列リードが、計数され得る。カバレッジリードの数に、各マッピング可能な位置ごとにスコアが割り当てられる。

ある実施形態では、シークエンシングリードカバレッジに関する定量的測度は、遺伝子座位に対応するＤＮＡ分子に由来するリード（例えば、参照ゲノムからの特定の位置、塩基、領域、遺伝子または染色体）の数を示す測度である。リードを遺伝子座位と関連付けるために、リードを参照にマッピングまたはアラインすることができる。マッピングまたはアライニングを行うためのソフトウェア（例えば、Ｂｏｗｔｉｅ、ＢＷＡ、ｍｒｓＦＡＳＴ、ＢＬＡＳＴ、ＢＬＡＴ）は、シークエンシングリードを遺伝子座位と関連付けることができる。マッピングプロセス中に、特定のパラメーターを最適化することができる。マッピング処理の最適化の非限定的な例としては、反復領域のマスキング；マッピング品質（例えば、ＭＡＰＱ）スコアカットオフの利用；アラインメントを生成するための異なるシード長の使用；およびゲノム位置間の編集距離の制限を挙げることができる。

シークエンシングリードカバレッジに関連する定量的測度は、遺伝子座位に関連付けられたリードの計数値を含み得る。一部の場合には、これらの計数値は、異なるシークエンシング深度、ライブラリーの複雑度、または遺伝子座位のサイズの効果を和らげるために、新たなメトリクスに変換される。例示的なメトリクスは、１００万リードあたりのキロベースあたりのリード（ＲＰＫＭ：ＲｅａｄＰｅｒＫｉｌｏｂａｓｅｐｅｒＭｉｌｌｉｏｎ）、１００万断片あたりのキロベースあたりの断片（ＦＰＫＭ：ＦｒａｇｍｅｎｔｓＰｅｒＫｉｌｏｂａｓｅｐｅｒＭｉｌｌｉｏｎ）、ｍ値のトリム平均（ＴＭＭ：ＴｒｉｍｍｅｄＭｅａｎｏｆＭｖａｌｕｅｓ）、分散安定化された生の計数値、およびｌｏｇ変換された生の計数値である。他の変換も、当業者には公知であり、それらを特定の応用に使用することができる。

リードファミリーまたは折り畳まれたリードの各々が初期鋳型ＤＮＡ分子に対応する、リードファミリーまたは折り畳まれたリードの数を使用して、定量的測度を決定することができる。リードファミリーを折り畳むためのおよび定量化するための方法は、ＰＣＴ／ＵＳ２０１３／０５８０６１およびＰＣＴ／ＵＳ２０１４／００００４８において見つけることができ、これらの参考特許文献の各々は、その全体が参照により本明細書に組み込まれる。特に、参照配列にマッピングされたときに各ファミリーがバーコード配列とシークエンシングリード配列および／または同じゲノム座標の少なくとも一部分とを共有するように、シークエンシングリードからのバーコードおよび配列情報を使用してリードをファミリーに選別する、リードファミリーの定量化および／または折り畳み方法を、用いることができる。したがって、ファミリーの大部分について、各ファミリーは、単一の初期鋳型ＤＮＡ分子に由来する。ファミリーからの配列のマッピングから導出される計数値を、「一意の分子計数値」（ＵＭＣ）と呼ぶことができる。一部の場合には、シークエンシングリードカバレッジに関連する定量的測度を決定することは、ライブラリーサイズに関連するメトリクスによりＵＭＣを正規化して、正規化されたＵＭＣ（「正規化ＵＭＣ」）を得ることを含む。例示的な方法は、遺伝子座位のＵＭＣを全てのＵＭＣの合計で割ること；遺伝子座位のＵＭＣを全ての常染色体ＵＭＣの合計で割ることである。複数のシークエンシングリードデータセットを比較する場合、ＵＭＣを、例えば、２つのシークエンシングリードデータセットの遺伝子座位のＵＭＣ中央値によって正規化することができる。一部の場合には、シークエンシングリードカバレッジに関連する定量的測度は、以下のようにさらに正規化される、正規化ＵＭＣであり得る：（ｉ）訓練試料から導出されたシークエンシングリードからの対応する遺伝子座位について、正規化ＵＭＣを決定する；（ｉｉ）各遺伝子座位について、試料の正規化ＵＭＣを対応する座位における訓練試料の正規化ＵＭＣの中央値により正規化し、それによって、遺伝子座位の相対存在量（ＲＡ）を得る。

コンセンサス配列を、それらの配列に基づいて、例えば、最初の５、１０、１５、２０または２５塩基の中の同一配列に基づいてシークエンシングリードを折り畳むことにより、同定することができる。一部の場合には、折り畳みは、他の点では同一であるリードにおける１つの差異、２つの差異、３つの差異、４つの差異、または５つの差異を許容する。一部の場合には、折り畳みは、リードのマッピング位置、例えば、シークエンシングリードの初期の塩基のマッピング位置を使用する。一部の場合には、折り畳みは、バーコードを使用し、バーコード配列を共有するシークエンシングリードがコンセンサス配列に折り畳まれる。一部の場合には、折り畳みは、バーコードと初期鋳型分子の配列との両方を使用する。例えば、バーコードを共有し、参照ゲノム内の同じ位置にマッピングされる全てのリードを、折り畳むことができる。別の例では、バーコードと初期鋳型分子の配列（または初期鋳型分子の配列に対する同一性パーセンテージ）とを共有する全てのリードを折り畳むことができる。

一部の場合には、シークエンシングリードカバレッジの定量的測度は、ゲノムの特定の小領域について決定される。領域は、ビン、目的の遺伝子、エクソン、配列プローブに対応する領域、プライマー増幅産物に対応する領域、またはプライマー結合部位に対応する領域であり得る。一部の場合には、ゲノム小領域は、配列捕捉用プローブに対応する領域である。リードは、リードの少なくとも一部分が、配列捕捉用プローブに対応する領域の少なくとも一部分をマッピングする場合、配列捕捉用プローブに対応する領域に位置し得る。リードは、リードの少なくとも一部分が、配列捕捉用プローブに対応する領域の大部分に位置する場合、配列捕捉用プローブに対応する領域に位置し得る。リードは、リードの少なくとも一部分が、配列捕捉用プローブに対応する領域の中心点を横断して位置する場合、配列捕捉用プローブに対応する領域に位置し得る。

バーコードを含む別の実施形態では、同じバーコード、物理的特性、またはこれら２つの組合せを有する全ての配列を、それらが試料親分子に由来する場合、１つのリードに折り畳んで、増幅中に導入された可能性があるバイアスを低減させることができる。例えば、ある分子は１０回増幅されるが、別の分子は１０００回増幅される場合、各分子折り畳み後に１回だけ提示されることによって、不均一な増幅の効果が打ち消される。一意のバーコードを有するリードのみが、マッピング可能な位置ごとに計数され得、割り当てられるスコアに影響を与え得る。

コンセンサス配列を、配列リードのファミリーから当技術分野において公知の任意の方法により生成することができる。そのような方法としては、例えば、デジタル通信理論、情報理論、またはバイオインフォマティクスから導出された、コンセンサス配列の線形または非線形構築方法（例えば、投票、平均化、統計的、最大事後もしくは最大尤度検出、ダイナミックプログラミング、ベイジアン、隠れマルコフまたはサポートベクターマシン方法など）が挙げられる。

配列リードカバレッジを決定した後、確率論的モデリングアルゴリズムを適用して、各ウインドウ／ビン領域についての正規化核酸配列リードカバレッジを別々のコピー数状態に変換することができる。一部の場合には、このアルゴリズムは、次のうちの１つまたは複数を含み得る：隠れマルコフモデル、ダイナミックプログラミング、サポートベクターマシン、ベイジアンネットワーク、トレリス復号、ビタビ復号、期待値最大化、カルマンフィルタリング方法論およびニューラルネットワーク。各ウインドウ領域の別々のコピー数状態を利用して、染色体領域におけるコピー数多様性を同定することができる。一部の場合には、同じコピー数を有する全ての隣接ウインドウ／ビン領域をマージしてセグメントにして、コピー数多様性状態の存在または非存在を報告することができる。一部の場合には、様々なウインドウ／ビンを、それらを他のセグメントとマージする前にフィルタリングすることができる。

配列分析パイプライン１１２により分析および／または出力されたデータを、分析データストア１１７に記憶させることができる。

バリアント検出パイプライン１３０は、分析データストア１１７からデータを取り込む／受信することができる。例えば、バリアント検出パイプライン１３０は、複数の配列リードを表すデータを取り込む／受信することができる。複数の配列リードを、コピー数モジュール１１５および／またはＨＲＤモジュール３００によって分析して１つまたは複数のバリアントを決定することができる。バリアントは、例えば、一塩基バリアント（ＳＮＶ）、インデル、融合、およびコピー数多様性を含み得る。バリアントコーリングのための任意の公知の技法を使用することができる。ある実施形態では、シークエンシングされた核酸におけるヌクレオチドの多様性を、シークエンシングされた核酸を参照配列と比較することにより決定することができる。参照配列は、多くの場合、既知の配列、例えば、対象からの既知の全または部分ゲノム配列（例えば、ヒト対象からの全ゲノム配列）である。参照配列は、例えば、ｈＧ１９またはｈＧ３８であり得る。シークエンシングされた核酸は、上で説明されたとおり、試料中の核酸について直接決定された配列を表すこともあり、またはそのような核酸の増幅産物の配列のコンセンサスであることもある。参照配列上の１つまたは複数の指定位置で比較を行うことができる。それぞれの配列を最大限にアラインしたときに参照配列の指定に対応する位置を含む、シークエンシングされた核酸配列のサブセットを同定することができる。そのようなサブセットの中で、もしあれば、シークエンシングされたどの核酸が、指定位置にヌクレオチドの多様性を含むのか；その終点（すなわち、その５’および３’末端ヌクレオチド）が参照配列に位置する場合、ｃｆＤＮＡ断片内のゲノム領域の中点からの所与のｃｆＤＮＡ断片の中点のオフセットに基づいて、所与のｃｆＤＮＡ断片の長さ；および必要に応じて、もしあれば、どれが、参照ヌクレオチド（すなわち、参照配列内のものと同じもの）を含むのかを、決定することができる。ヌクレオチドバリアントを含むサブセット中のシークエンシングされた核酸の数が、選択された閾値を超えると、バリアントヌクレオチドは、指定位置でコールされ得る。閾値は、ヌクレオチドバリアントを含むサブセット内のシークエンシングされた核酸の少なくとも１、２、３、４、５、６、７、９もしくは１０などの単純な数であり得、または閾値は、数ある可能性の中でも特に、ヌクレオチドバリアントを含むサブセット内のシークエンシングされた核酸の少なくとも０．５、１、２、３、４、５、１０、１５もしくは２０などの比であり得る。参照配列中の目的の任意の指定位置について比較を繰り返すことができる。ときには、参照配列上の少なくとも約２０、１００、２００または３００の連続する位置、例えば、約２０～５００、約５０～３００の連続する位置、を占める指定位置について、比較を行うことができる。

一般的に言えば、プロセッサー１２０は、バリアント検出パイプライン１３０の様々な構成要素、例えば、コピー数モジュール１１５、ＨＲＤモジュール３００、および／または他の構成要素を実装し得る（そのような要素によってプログラムされ得る）。あるいは、バリアント検出パイプライン１３０のこれらの構成要素は、ハードウェアモジュールを含み得ることに留意されたい。便宜上、別々に図示されているが、コピー数モジュール１１５およびＨＲＤモジュール３００などの、様々な構成要素または命令の１つまたは複数を互いに統合することができる。いずれにせよ、バリアント検出パイプライン１３０は、コンピュータシステム１１０に、バリアント、バリアントからの疾患（正確な診断）、ＨＲＤ、および／または処置レジメンを特定させることができる。正確な診断および処置レジメンを、臨床結果ストア１６０または診断結果ストア１５０などのレポジトリに記憶させることができる。

ＨＲＤモジュール３００を、配列分析パイプライン１１２からの出力データを分析するように構成することができる。ＨＲＤモジュール３００を、デノボ融合再編成コール、欠失コール、ＳＮＶ／インデル病原性の注釈、および／またはＨＲＤスコアのうちの１つまたは複数を生じさせるように構成することができる。ＨＲＤモジュール３００は、試料レベルＨＲＤステータスの要約を生成するように構成されたＨＲＤアグリゲーターを含み得る。

図３に示されているように、ＨＲＤモジュール３００を、融合コーラー３０１、欠失コーラー３０２、注釈モジュール３０３、ＨＲＤスコアリングモジュール３０４、アグリゲーター３０５、および／または出力モジュール３０６のうちの１つまたは複数を実行するように構成することができる。

融合コーラー３０１を、配列分析パイプライン１１２から受信したデータを分析することにより１つまたは複数の候補融合コールを生成するように構成することができる。融合コーラー３０１を、候補融合リードをｄｅＢｒｕｉｊｎグラフでアセンブルし、候補融合事象をコールし、候補融合コールをフィルタリングし、技術上の偽陽性を除去するように、構成することができる。融合コーラー３０１を、融合候補リードを選択し、融合候補リードをパケットにクラスター化し、クラスター化された融合候補リードをアセンブルしてｄｅＢｒｕｉｊｎグラフアセンブリを生成するように、構成することができる。融合コーラー３０１を、ｄｅＢｒｕｉｊｎグラフアセンブリを展開して融合候補コンティグにし、デコイを有する参照に融合候補コンティグをアラインし、候補融合コールを生成するように、構成することができる。

ある実施形態では、融合コーラー３０１を、候補融合リードを選択し、一貫した切断点を有するリードを結合することによりリードの無向グラフＧを作り、出力データをパケットとしてファイルに保存するように、構成することができる。融合コーラー３０１を、リードをハイブリッド化し、それらをアセンブルしてｄｅＢｒｕｉｊｎグラフアセンブリを生成するように、構成することができる。融合コーラー３０１を、アセンブリを展開して線状コンティグにするように構成することができる。融合コーラー３０１を、デコイを有する参照上のコンティグをアラインし、推定融合をコールするように、構成することができる。

融合コーラー３０１を、１つまたは複数の基準に基づいて候補融合コールをフィルタリングするように構成することができる。１つまたは複数の基準は、候補融合を、その切断点がいずれもプローブセット内のプローブの１つから３５０塩基またはそれより大きく離れている場合、フィルタリングすることを含み得る。１つまたは複数の基準は、候補融合を、その切断点がいずれも遺伝子リスト内の遺伝子のうちの１つに属さない場合、フィルタリングすることを含み得る。１つまたは複数の基準は、候補融合を、互いに４８塩基またはそれ未満離れている２つの欠失（９６塩基またはそれ未満）からそれがなる場合、フィルタリングすることを含み得る。１つまたは複数の基準は、候補融合を、それが厳密に６０塩基未満の欠失である場合、フィルタリングすることを含み得る。１つまたは複数の基準は、候補融合を、それが少なくとも１つの二本鎖分子支持体を有さず、その平均ファミリーサイズが＜１／０．９（約１．１０）である場合、フィルタリングすることを含み得る。平均ファミリーサイズは、支持分子の数で割った支持リードの数と定義され得る。１つまたは複数の基準は、第１の切断点に中心がある参照の１２０塩基セグメントと、第２の切断点に中心がある参照の１２０塩基セグメントとのアラインメントが、５０またはそれより大きいアラインメントスコアを有する場合、候補融合をフィルタリングすることを含み得る。１つまたは複数の基準は、第１の切断点から長さ３６離れているセグメントの、第２の切断点から長さ３６離れているセグメントに対するアラインメントが、２０またはそれより大きいアラインメントスコアを有する場合、候補融合をフィルタリングすることを含み得る。１つまたは複数の基準は、候補融合を、それがロバストな支持体を有さない場合、フィルタリングすることを含み得る。分子は、その分子が２またはそれより大きいファミリーサイズを有する場合（ここでのファミリーサイズは、その分子を支持するリードの数を指す）、ロバストとみなされ得る。

候補融合が、１つの、および１つだけの他の候補融合と相互的なのものである場合、および他の候補融合が、いずれの他の基準によるフィルタリングによっても除去されていない場合、その候補融合を合格に格上げするように、融合コーラー３０１を構成することができる。候補融合の切断点の１つまたは複数が、増幅された領域にある場合、候補融合にタグ付けするように、融合コーラー３０１を構成することができる。

融合コーラー３０１を、フィルタリングされた融合コールを含む融合データを出力するように構成することができる。融合データは、融合事象の深度分析のための補助データを含み得る。融合コーラー３０１により出力されたデータは、注釈モジュール３０３および／またはアグリゲーター３０５により読み取られ得る。

図４は、本開示の実施形態に従ってデノボ融合コーラー（例えば、図３で参照される融合（再編成）コーラー３０１）の模式図を示す。示されている実施形態では、融合コーラーは、共有切断点を調べること（ステップ１）、位置が特定されたバグをアセンブルすること（ステップ２）、位置が特定されたバグを線形化してコンティグにすること（ステップ３）、およびコンティグを参照配列にアラインすること（ステップ４）によって、リードの位置を特定して、所与の試料がＨＲＤ核酸バリアントを含むかどうかを決定する。一部の実施形態では、デノボ融合コーラーは、複数の配列リードを参照配列にアラインするように構成された命令、複数の配列リードの少なくとも１つの配列リードの参照配列へのアラインメントの切断点を決定するように構成された命令、アラインメントで切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定するように構成された命令、および１つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定するように構成された命令を含む。これらの実施形態は、通常は、１つまたは複数の共通の切断点に基づいて候補融合配列リードを群別化することも含み得る。ある実施形態では、リードを、ヌクレオチドの閾値ウインドウ内に切断点を有することに基づいて群別化（例えば、クラスター化）することができる。さらに、命令を、群内の候補融合配列リードをアセンブルして１つまたは複数のコンティグを生成するように、群からのコンティグを参照配列にアラインするように、群からのコンティグのアラインメントに基づいて１つまたは複数の候補融合事象を決定するように、１つまたは複数の候補融合事象に１つまたは複数の基準を適用するように、および１つまたは複数の候補融合事象への１つまたは複数の基準の適用に基づいて、第２のＬｏＦＨＲＤ核酸バリアントを含む１つまたは複数の融合事象を決定するように、構成することができる。ある特定の実施形態では、基準は、フィルタリング基準、例えば、プローブ付近の切断点の非存在、報告すべき遺伝子における切断点の非存在、小さいインデルおよびイントロン事象の排除、「ｐｃ＿ｍｏｌｅｃｕｌｅｓ」テスト（（ｐｃ＿ｍｏｌｅｃｕｌｅｓ＝ｎ＿ｍｏｌｅｃｕｌｅｓ／ｎ＿ｒｅａｄｓ）の実行、および一部の実施形態では１．７未満である平均ファミリーサイズを有する融合の破棄、アドレススイッチに関連することが公知のアーチファクト、事象が「鋳型乗り換え」であり得る場合のそれらの排除、最小ロバスト分子検定の適用、ならびに／またはこれらに類するものを含む。本開示の方法および関連態様を行う際の使用に必要に応じて適応されるデノボ融合コーラーに関するさらなる詳細は、例えば、２０２０年２月２７日に出願された米国特許出願第１６／８０３，６８０号に記載されており、この参考特許文献は、その全体が参照により本明細書に組み込まれる。

図３に戻って、欠失コーラー３０２を、配列分析パイプライン１１２から受信したデータ（例えば、コピー数データ）を分析することによって遺伝子およびゲノムワイドなレベルでホモ接合型欠失およびヘテロ接合性消失（ＬＯＨ）を決定するように構成することができる。欠失コーラー３０２を、目的の領域のカバレッジと欠失を有さないがん試料から生成された参照プロファイルとを比較することによって欠失を検出するように構成することができる。

ある実施形態では、欠失コーラー３０２は、セグメント化アルゴリズム（例えば、循環バイナリセグメンテーション（ＣＢＳ）アルゴリズム）を利用して、コピー数データをセグメント化し、異常なコピー数を有するゲノム領域を同定することができる。セグメンテーションアルゴリズムは、最大ｔ統計量に基づいて２つのサブセグメントまたは３つのサブセグメントのどちらかに染色体を再帰的に分割することによって、コピー数データを推定同コピー数領域にセグメント化することができる。分割するか否かを決めるために使用する参照分布を、順列により推定することができる。かくて、セグメンテーションアルゴリズムは、コピー数データにおける変化点を見つけることができる。変化点は、（ｌｏｇ）試験対参照比が位置を変えた後の点を指し得る。それ故、変化点は、基礎となるＤＮＡコピー数が変化した位置に対応する。したがって、変化点を使用して、コピー数獲得および喪失領域を同定することができる。セグメンテーションアルゴリズムの出力データは、行が、試料、染色体、開始および終了マップ位置、マーカー数、各セグメントの平均値を示す、表を含み得る。セグメンテーションアルゴリズムに関するさらなる詳細は、例えば、Olshen, A. B., Venkatraman, E. S., Lucito, R., Wigler, M. (2004). Circular binary segmentation for the analysis of array-based DNA copy number data. Biostatistics 5: 557-572、およびVenkatraman, E. S., Olshen, A. B. (2007) A faster circular binary segmentation algorithm for the analysis of array CGH data. Bioinformatics 23: 657-63に記載されており、各々の内容は、それら全体が参照により本明細書に組み込まれる。

欠失が検出されると、その欠失をラベルするように、欠失コーラー３０２を構成することができる。例えば、欠失コーラー３０２を、欠失に「ｃｏｖ＿ｄｅｌ」、「ｌｏｈ」、「ｌｏｈ＿ｃｎ＿ｎｅｕｔｒａｌ」、または「ｈｏｍｄｅｌ」とラベルするように構成することができる。欠失コーラー３０２は、生殖細胞系ＳＮＰの事前に定義されたリストの変異型アレル割合（ＭＡＦ）を利用して、がん細胞が目的の領域の単一のコピーを有する（「ＬＯＨ」とラベルする）かどうか、または両方のコピーが欠失されている（「ｈｏｍｄｅｌ」とラベルする）かどうかを決定することができる。これら２つの場合の弁別子は、腫瘍細胞における単一コピーがヘテロ接合型ＳＮＰＭＡＦのアレル不均衡を生じさせるという観察の中に存在する。決定規則は、２つのタイプの欠失を表す２つのモデルの尤度比が、「検出されない標的」（ＴＮＤ）試料の訓練セットから推定される閾値と比較される、尤度比検定に基づき得る。尤度モデルは、３つの可能なＳＮＰ遺伝子型全てについてのヘテロ接合型ＳＮＰの訓練されたＭＡＦ分布に基づき得る。ヘテロ接合型ＳＮＰが観察されない欠失の場合に使用される出力ラベルは、「ｃｏｖ＿ｄｅｌ」であり得、予測される欠失を表す第３のラベルを表す。

図５に示されている、ある実施形態では、検出コーラー３０２は、目的の領域のカバレッジと５０１で欠失を有さないがん試料から生成された参照プロファイルとを比較することに基づいて欠失が観察されるかどうかを決定することにより、欠失コールを生成し得る。欠失が５０１で観察された場合、ベースラインＭＡＦにより調整された遺伝子カバレッジおよびｚスコアを、５０２で分析して体細胞が遺伝子欠失を有するかどうかを決定することができる。欠失が５０２で報告されなかった場合、結果として生じるコールは、欠失なしまたは増幅なし、５０３での「ｃｎｖなし」、であり得る。欠失が５０２で報告された場合、遺伝子をオーバーラップさせるヘテロ接合型ＳＮＰを５０４で同定することができる。遺伝子をオーバーラップさせるヘテロ接合型ＳＮＰが５０４で観察されなかった場合、遺伝子は、たとえ欠失があった、５０５で「ｃｏｖ＿ｄｅｌ」であった、としても差別化を図るためにヘテロ接合型ＳＮＰなしとコールされ得る。遺伝子をオーバーラップさせるヘテロ接合型ＳＮＰが５０４で観察された場合、アレル不均衡を示すヘテロ接合型ＳＮＰを５０６で決定することができる。５０６で、アレル不均衡を示すヘテロ接合型ＳＮＰが決定されなかった場合、遺伝子は、ホモ接合型欠失、「ｈｏｍｄｅｌ」、と５０７でコールされ得る。５０６で、アレル不均衡を示すヘテロ接合型ＳＮＰが１つのコピーに関して決定された場合、遺伝子は、ヘテロ接合性消失、「ＬＯＨ」、と５０８でコールされ得る。５０６で、アレル不均衡を示すヘテロ接合型ＳＮＰが、２つのコピーに関して決定された場合、遺伝子は、コピー数の変化を伴わないヘテロ接合性消失、「ＬＯＨＣＮＮＥＵＴＲＡＬ」、と５０９でコールされ得る。

欠失コーラー３０２を、報告すべき遺伝子および／または有効遺伝子を決定するように構成することができる。有効遺伝子を最終欠失コール出力表に含めることができる。有効遺伝子は、次の基準を満たす遺伝子であり得る：良好なプローブの数が＞３０である、およびＬＯＨの９５％検出限界（ＬｏＤ）が＜０．３である（生物学的に重要な遺伝子について可能なこの閾値を満たすという例外）。報告すべきＬＯＨまたはホモ接合型欠失遺伝子は、ヘテロ接合型ＳＮＰの検出確率＞５０％を伴う遺伝子であり得る。ヘテロ接合型ＳＮＰの検出確率が５０％未満またはそれにに等しい場合、遺伝子は、カバレッジに基づく検出（「ｃｏｖ＿ｄｅｌ」）として報告され得る。

ある特定の実施形態では、ホモ接合型欠失／ＬＯＨ融合（ＣＮＶ）コーラー（例えば、欠失コーラー３０２）は、遺伝子レベルのＬＯＨを検出し、ホモ接合型欠失を検出し、および／または所与の試料中のゲノムワイドなＬＯＨレベルを推定する。これらのインプリメンテーションの一部では、ホモ接合型欠失／ＬＯＨ融合（ＣＮＶ）コーラーは、通常は、ＨＲＲ遺伝子欠失の検出について約５％検出限界（ＬＯＤ）および９９％より高い特異度を達成する。一部の実施形態では、ＣＮＶコーラーは、分子カバレッジに基づくものであり、ＳＮＰ情報を使用してＬＯＨ（アレル不均衡）とホモ接合型欠失（ＳＮＰについての５０％ＭＡＦ）とを区別する。ある特定の実施形態では、ＣＮＶコーラーは、断片サイズ情報に基づくものである。これらのインプリメンテーションは、遺伝子またはゲノム領域および関連欠失の検出感度／特異度を向上させることができる、断片サイズ分布の使用を含む。

さらに例を挙げて説明すると、一部の実施形態では、ＣＮＶコーラーは、考慮中の配列情報が第１の状態を含む第１の確率、および配列情報が第２の状態を含む第２の確率であって、第１または第２の状態がＬｏＦＨＲＤ核酸バリアントを含む、第１の確率および第２の確率の使用を含む。通常は、これらの実施形態は、配列情報が第１の状態を含む第１の確率を生成すること、配列情報が第２の状態を含む第２の確率を生成すること、第１の確率と第２の確率を比較すること、および比較するステップに基づいて、配列情報が第１の状態を含むのか、または第２の状態を含むのかの予測を生成することを含む。これらの実施形態の一部では、ＣＮＶコーラーは、配列情報における少なくとも１つの遺伝子座位に関連する１つまたは複数の生殖細胞系一塩基多型（ＳＮＰ）位置に基づくアレル計数値の第１のモデルを、第１の確率分布によって生成することを含む。第１のモデルは、通常は、少なくとも１つの体細胞ホモ接合型欠失を表す。これらの実施形態は、配列情報における遺伝子座位に関連する１つまたは複数の生殖細胞系ＳＮＰ位置に基づくアレル計数値の第２のモデルを、第２の確率分布によって生成することも含む。第２のモデルは、一般に、少なくとも１つの体細胞ヘテロ接合型欠失を表す。これらのインプリメンテーションは、第１のモデルの第１の出力データと第２のモデルの第２の出力データを比較すること、および比較に基づいて、遺伝子座位についての体細胞ホモ接合型欠失が配列情報に存在するという予測を生成することも含む。ある特定の実施形態では、ＣＮＶコーラーは、考慮中の配列情報が体細胞ホモ接合型欠失を含む第１の確率、および配列情報が体細胞ヘテロ接合型欠失を含む第２の確率を生成し、第１の確率と第２の確率を比較し、比較に基づいて、配列情報が体細胞ホモ接合型欠失を含むのか、または体細胞ヘテロ接合型欠失を含むのかの予測を生成する。本開示の方法および関連態様を行う際の使用に必要に応じて適応されるＣＮＶコーラーに関するさらなる詳細は、例えば、２０２０年２月２７日に出願された通常の米国特許出願第１６／８０３，６８０号に記載されており、この参考特許文献は、その全体が参照により本明細書に組み込まれる。

欠失コーラー３０２を、欠失コールデータを出力するように構成することができる。欠失コールデータは、例えば、ラベル（例えば、ｎｏ＿ｃｎｖ、ｃｏｖ＿ｄｅｌ、ｌｏｈ、ｌｏｈ＿ｃｎ＿ｎｅｕｔｒａｌ、ｈｏｍｄｅｌ、ｎｏ＿ｃａｌｌ、およびこれらに類するもの）を示し得る。欠失コールデータは、例えば、ｌｏｈ／ｈｏｍｄｅｌが報告された遺伝子、および予測が単一ヘテロ接合型ＳＮＰに基づくときを示し得る。欠失コールデータは、例えば、異なる染色体上の複数の遺伝子が「ｈｏｍｄｅｌ」とラベルされたとき（例えば、報告すべき遺伝子に限定されない、潜在的ベースラインＭＡＦエラー）を示し得る。欠失コールデータは、例えば、体細胞ＳＮＶ／インデルを有する遺伝子を示し得、「ｈｏｍｄｅｌ」とラベルされる（例えば、潜在的ラベルエラー）。欠失コールデータは、パネル上の全ての遺伝子についての全てのＣＮＶコール（増幅、局所性、欠失、異数性など）を含み得る。欠失コールデータは、次の状態：ホモ接合型欠失、ＬＯＨ、カバレッジに基づく欠失、コピー数変化を伴わないＬＯＨ、またはコールなし、のうちの１つを有する、パネル上の全ての遺伝子を含み得る。欠失コールデータは、次の状態：ホモ接合型欠失、ＬＯＨ、カバレッジに基づく欠失、コピー数変化を伴わないＬＯＨ、またはコールなし、のうちの１つを有する、全ての報告すべき遺伝子を含み得る。欠失コーラー３０２を、カバレッジおよびＳＮＰを含む遺伝子レベルのＬＯＨまたは欠失を要約するための１つまたは複数のプロットを決定し、出力するように、構成することができる。プロットは、プローブがＨＲＲ遺伝子によって、およびＨＲＲ遺伝子が、ｃｏｖ＿ｄｅｌ、ｈｏｍｄｅｌ、ｌｏｈ欠失と報告されるかどうかによって強調表示されている、ゲノムワイドな（連結された全ての領域）および染色体レベルのＣＮＶプロットを含み得る。欠失コールデータは、ＬＯＨまたは欠失を有するセグメントのパーセントを含み得る。欠失コールデータは、欠失コーリングに使用されるセグメントを含み得る。欠失コーラー３０２により出力されたデータは、ＨＲＤスコアリングモジュール３０４および／またはアグリゲーター３０５により読み取られ得る。

図３に戻って、注釈モジュール３０３を、バリアントおよび表現型同士の関係（例えば、ＣｌｉｎＶａｒデータ）などの、臨床的有意性を示すデータを提供するように構成することができる。注釈モジュール３０３を、一部のまたは全てのＳＮＶ／インデルについての機能的影響の注釈を提供するように構成することができる。注釈モジュール３０３を、体細胞コール（例えば、体細胞または生殖細胞系のもの）を示すように、および／またはコールされる融合についての機能的影響（例えば、ＧＨまたは復帰変異による有害なものとみなされるもの）を示すように構成することができる。

注釈モジュール３０３は、配列分析パイプライン１１２から受信したデータ、および／または融合コーラー３０１から受信した融合データを分析することができる。注釈モジュール３０３は、図６に示されている注釈方法６００を実行することができる。

注釈モジュール３０３は、６０１で臨床的有意性を示すデータを決定することができる。注釈モジュール３０３は、試料中のバリアントに関連するデータをデータソースから取り込むことにより臨床的有意性を示すデータを決定することができる。例えば、臨床的有意性を示すデータは、遠隔またはローカルデータソースから取り込まれるＣｌｉｎＶａｒデータであり得る。例えば、ＣｌｉｎＶａｒＶＣＦファイル中のそのバリアントについての「ＣＬＮＳＩＧ」フィールドからのデータを、染色体（「ｃｈｒｏｍ」）、位置（「ｐｏｓ」）、変異型ヌクレオチド（「ｍｕｔ＿ｎｔ」）、および遺伝子名（「ｇｅｎｅ」）に関するマッチングによって決定することができる。臨床的有意性を示すデータをバリアントに関連付けることができる。臨床的有意性を示すデータは、例えば、良性、良性の可能性が高い、不確実な陽性、病原性の可能性が高い、病原性、薬物応答、関連、リスク因子、保護的、情動、提出者からの矛盾するデータ、その他であることもあり、および／または提供されないこともある。臨床的有意性を示すデータは、データの正確さを示す審査ステータスに関することもあり、例えば、断定なし、提供された断定基準なし、個々のバリアントについての断定なし、提供された基準（単一の提出者）、提供された基準（矛盾する解釈）、提供された基準（複数の提出者、矛盾なし）、専門家パネルにより審査された、および／または診療ガイドラインであることもある。

注釈モジュール３０３を、６０２で一部のまたは全てのＳＮＶ／インデルについての分子的帰結を決定するように構成することができる。試料中の一部または全てのバリアントに、一連の規則の適用に基づいて分子的帰結を割り当てることができる。規則が当てはまらない場合、分子的帰結は、「ＮＵＬＬ」であり得る。これらの規則を、優先順位によって、すなわち、最上位から始めることによって適用することができ、１つの規則が当てはまった場合には残りの規則を無視することができる。分子的帰結は、例えば、ナンセンス、フレームシフト、ストップ喪失、スタート喪失、インフレーム挿入、インフレーム欠失、インフレーム重複、ミスセンス、スプライスアクセプター、スプライスドナー、同義、非コード、ｕｔｒ、プロモーター、スプライス領域、スプライス事象、およびこれらに類するものであり得る。

注釈モジュール３０３を、６０３で一部のまたは全てのＳＮＶ／インデルについての機能的影響の注釈を決定するように構成することができる。試料におけるバリアント（ＳＮＶ／インデル）は、「有害」または「ＮＵＬＬ」と注釈され得る。例として、変異が、原因となり得る、もしくは疾患に強く関連し得る（例えば、「病原性」または「病原性の可能性が高い」）、および／または療法に対する応答に強く関連し得る（例えば、「薬物応答」）ことを示す臨床的有意性を示すデータに関連する任意の遺伝子におけるＳＮＶ／インデル。既知ＨＲＲ遺伝子におけるＳＮＶ／インデル、またはナンセンス、フレームシフト、スプライスアクセプター、スプライスドナーのいずれかであり、一般的でなく（例えば、＜０．００１の集団アレル頻度）、３３２６より多いコドン数を有するＢＲＣＡ２にはない、既知腫瘍抑制遺伝子におけるＳＮＶ／インデルは、有害と注釈され得る。いずれの残りのバリアントも、「ＮＵＬＬ」と注釈され得る。

注釈モジュール３０３を、６０４で復帰変異バリアント（例えば、小さいバリアント）を決定するように構成することができる。復帰変異バリアントは、病原性アレルにより破壊された遺伝子の機能を修復することができる。一般に、復帰変異バリアントは、以下の基準のいずれかが満たされた場合、決定される：
・有害なＳＮＶと同じコドン内にあるＳＮＶであって、コドンを有害でない状態に復帰させるＳＮＶ
・有害なＳＮＶ／インデルの位置全体に及ぶインフレームインデル
・フレームシフトインデルと共に距離閾値内にあるインデルであって、タンパク質をフレーム内に戻すインデル
・フレームシフトインデルから遠く離れているインデルであって、タンパク質を、それらがシスまたは有害なトランスと確認された場合、フレーム内に戻すインデル
・体細胞性である長い欠失であって、同じ遺伝子内の別の有害なＳＮＶまたはインデルに及ぶ長い欠失。

図７は、復帰バリアントを決定するための例となる方法７００を示す。方法７００に従って、生殖系列として分類されるが、復帰の要件を満たすＳＮＶおよび小さいインデルについて、バリアントは、手動による再検討のためにフラグ付けされ得る。

別のフレームシフトインデルの上流または下流にあり、タンパク質をインフレームに戻す（挿入または欠失されたヌクレオチドの合計が３の倍数になる）インデルは、そのインデルが、第２のフレームシフトインデルとシスである（同じ分子を共有する）と確認できる場合、「ｒｅｖｅｒｓｉｏｎ＿ｃｉｓ」と呼ばれる。バリアントがトランスである（異なる分子上にある）と確認される場合、注釈は、「ｄｅｌｅｔｅｒｉｏｕｓ＿ｔｒａｎｓ」と呼ばれる。支持分子が、シス／トランス注釈を決定するように両方のインデルにわたることがなく、タンパク質がインフレームに戻る場合、注釈は、単に「復帰」である。

有害なＳＮＶ（例えば、ナンセンス、病原性ミスセンス）と同じコドン中にあり、コドンを非有害に（例えば、ナンセンスをミスセンスに、病原性ミスセンスを同義に）復帰させるＳＮＶは、復帰と標識され得る。ＳＮＶが有害なＳＮＶと同じゲノム位置にあるかどうかの決定がなされ得、ＳＮＶが有害なＳＮＶと同じゲノム位置にあり、非有害の結果（例えば、「同義」）のものである場合、そのＳＮＶは、復帰と標識され得る。

インフレームであり、別の有害なＳＮＶまたはインデルにわたるインデルは、復帰と標識され得る。

注釈モジュール３０３は、６０４において復帰バリアント（例えば、長い欠失バリアント）を決定するようにも構成され得る。融合コーラー３０１から受け取った融合データからの融合および長い欠失は、体細胞コールおよび機能的影響を注釈するために使用され得る。長い欠失は、同じ遺伝子内のＤＮＡ配列の喪失を生じる大きいゲノム再編成として定義され得る。長い欠失についての体細胞分類は、注釈モジュール３０３によって行われ得る。融合および長い欠失は、バリアントパーセンテージが構成可能な閾値未満である（例えば、＜１５％）場合、体細胞と注釈され得、バリアントパーセンテージが構成可能な閾値より上である場合、生殖系列と注釈され得る。復帰の要件を満たす長い欠失は、バリアントパーセンテージにかかわらず、「体細胞」の体細胞コールを有し得る。長い欠失は、長い欠失が体細胞であり、同じ遺伝子中の別の有害なＳＮＶまたはインデルにわたる場合、「復帰」の機能的影響を有し得る。

復帰の要件を満たす、構成可能な閾値より上の（例えば、≧１５％）バリアントパーセンテージを有する長い欠失は、「復帰」の機能的影響および「体細胞」の体細胞コールを有し得る。この体細胞ステータスは、構成可能な閾値によって決定された元の生殖系列コールを上書きする。ある実施形態では、全ての長い欠失は、その長い欠失が復帰とみなされない限り、「有害」の機能的影響の注釈を有し得る。ある実施形態では、少なくとも２つの異なる遺伝子間で生じる全ての融合は、「有害」の機能的影響の注釈を有し得る。

注釈モジュール３０３は、注釈データを出力するように構成され得る。注釈データは、例えば、体細胞コールおよび機能的影響を示す融合表を含み得る。注釈データは、例えば、臨床的有意性データ、有害の注釈、および／または復帰の注釈を有する、コピー数モジュール１１５からの一部もしくは全てのＳＮＶ結果および／または一部もしくは全てのインデル結果を含むＳＮＶコールデータを含み得る。注釈データは、例えば、臨床的有意性の注釈、分子的帰結、および／または機能的影響を有する、ＳＮＶ／インデルコールに関連付けられたデータを含み得る。注釈モジュール３０３によるデータ出力は、ＨＲＤスコアリングモジュール３０４および／またはアグリゲーター３０５によって読み取られ得る。

図３に戻ると、ＨＲＤスコアリングモジュール３０４は、ＨＲＤスコア（例えば、ＨＲＤの尺度の測定基準）を生成するために、融合コーラー３０１、欠失コーラー３０２および／または注釈モジュール３０３からのデータを分析および／または要約するように構成され得る。ＨＲＤスコアリングモジュール３０４は、最大体細胞アレル割合（ｍｓａｆ）を計算するために、配列分析パイプライン１１２および／またはバリアント検出パイプライン１３０からの一部または全ての体細胞バリアント出力からのデータを分析するように構成され得る。

ＨＲＤスコアリングモジュール３０４は、少なくとも一部において、融合コーラー３０１によって決定された、再編成の数および／もしくは性質ならびに／または再編成の切断点の周囲の配列コンテキストを利用することによって、ＨＲＤスコアを生成するように構成され得る。

ＨＲＤスコアリングモジュール３０４は、少なくとも一部において、欠失コーラー３０２によって決定された、試料１つ当たりの切断点および／または欠失を有するセグメントの数を要約することによって、ＨＲＤスコアを生成するように構成され得る。セグメントは、ゲノム中の異なるコピー数状態、より多くのコピー数状態、より多くのゲノム不安定性を示し得、潜在的に、基礎ＨＲＲ欠損を示す。一般に、ＨＲＤスコアリングモジュール３０４は、以下のために構成され得る：
・セグメント平均の１．５標準偏差以内にあるセグメント間の３ＭＢ未満の長さのセグメントをスムージングする
・染色体の長さの９０％であるセグメントを除去する
・非ＨＲＤ機構の産物であり得るセグメントを排除するための構成可能な長さ閾値（１０Ｍｂ）未満であるセグメントをフィルタリングして除く
・隣接しているセグメント間の切断点の数を計数する
・正常または腫瘍が検出されない試料において見出される反復するセグメント（情報にならない場合がある）に関して、欠失コーラーからセグメントをフィルタリングする
・欠失（ｌｏｈ、ｈｏｍｄｅｌ、またはカバレッジベースの欠失）を有するセグメントの数を計数する
・切断点および欠失セグメントの数を加算する

ある実施形態では、ＨＲＤスコアの決定は、ＨＲＤステータスと相関する１つまたは複数の測定基準に基づき得る。例えば、１つまたは複数の測定基準は、ヘテロ接合性消失（ＬＯＨ）、テロメアアレルインバランス（ＴｅｌｏｍｅｒｅＡｌｌｅｌｅＩｍｂａｌａｎｃｅ）（ＴＡＩ）、大規模遷移（ＬａｒｇｅＳｃａｌｅＴｒａｎｓｉｔｉｏｎｓ）（ＬＳＴ）、それらの組合せなどのうち１つまたは複数を含み得る。

ＬＳＴは、３ＭＢの領域をフィルタリングした後の、少なくとも１０Ｍｂの隣接している領域間の切断点を指し得る。ＬＳＴの数は、隣接している切断点の数および遺伝子変異ステータスと相関する。３ＭＢのカットオフは、大抵は染色体間転座を示す大規模な多様性から、ＨＲＤとは無関係な小規模な多様性を除去するために使用され得る。

ある実施形態では、ＨＲＤスコアリングモジュール３０４は、図８に示される方法８００に従ってＨＲＤスコアを決定するように構成され得る。ＨＲＤスコアリングモジュール３０４は、欠失コーリングのために使用されるセグメントを含む欠失コールデータにアクセスし得る。染色体の長さ（＞９０％）にわたるセグメントは、８０１において除去され得る。これらのセグメントは、ＨＲＤではなく染色体不分離から生じている可能性が高い。３ＭＢ未満の長さのセグメントは、８０２においてスムージングされ得る。セグメントをスムージングすることは、３ＭＢ以上離れていないセグメントを組み合わせることを含み得、第２のセグメントは、以前のセグメントの１．５標準偏差以内のセグメント平均（例えば、セグメント中の正規化されたカバレッジ）を有する。セグメントは、８０３においてサイズに基づいてフィルタリングされ得る。例えば、１０Ｍｂ未満のセグメントが除去され得る。小規模な多様性のセグメントは、典型的には、大抵は染色体間転座を示すＬＳＴと対比して、ＨＲＤとは無関係の染色体内再編成に対応する。技術的アーチファクトを示す可能性が高い、試料（患者試料、腫瘍が検出されない試料および健康な正常試料を含む）の大きいコホート中の反復する（例えば、＞１０回）ビン中のセグメントは、８０４において除去され得る。ビンサイズは、例えば、セグメントの開始点／終点のいずれかから５００ｂｐであり得る。ある特定のｂｐ距離内の隣接しているセグメント間の切断点の数は、８０５において決定され得る。ＬＯＨ、Ｈｏｍｄｅｌ、および／または欠失の標識を有するセグメントの数は、８０６において決定され得る。切断点の数およびセグメントの数は、８０７においてＨＲＤスコアを決定するために合計され得る。

ＨＲＤスコアリングモジュール３０４は、例えば、最大体細胞アレル割合（ＭＳＡＦ）を使用して、試料から腫瘍割合を決定するように構成され得る。ＭＳＡＦは、割合として表される、クローン性造血起源と注釈されない任意の体細胞バリアントであって、融合または非同義ＳＮＶまたはインデルである任意の体細胞バリアントを含む、試料中のバリアントの最大パーセンテージを含み得る。ＳＮＶにもインデルにも融合にもデノボ融合出力にも体細胞バリアントが存在しない場合、ＭＳＡＦは０であり得る。雄性試料におけるＸ染色体上の増幅された遺伝子上に存在するバリアントについて、パーセンテージは、以下のように、一倍体染色体を説明するために調整され得る：
調整済みパーセンテージ＝バリアントパーセンテージ／ｌｏｇ２（遺伝子ＣＮ^＊２）、ここで、性別は、配列分析パイプライン１１２によって予測され得る。増幅された遺伝子上に存在する全ての他のバリアントについて、パーセンテージは、以下のように調整され得る：
調整済みパーセンテージ＝バリアントパーセンテージ／ｌｏｇ２（遺伝子ＣＮ）。腫瘍割合は、低い腫瘍シェディングを有する試料に関して、ＨＲＤスコアの調整済み推定値を得るために、ＨＲＤスコアリングモジュール３０４において使用され得る。

図９は、がん型にわたる例となるＨＲＤスコアのヒストグラムを示す。ＯＭＮＩ２．１２パネルからの臨床的患者試料を、ＨＲＤスコアについて評価した（卵巣および皮膚を除く全てのがん型についてｎ＝２００であり、卵巣および皮膚については、それぞれｎ＝１３９およびｎ＝１１３である）。ＨＲＤスコアにおけるより長いテイル（＞１００）が、乳房および泌尿生殖器がん型において観察された。

ＨＲＤスコアモジュール３０５は、ＨＲＤスコアデータを出力するように構成され得る。ＨＲＤスコアデータは、例えば、ＨＲＤスコアおよび／またはＭＳＡＦを含み得る。ある実施形態では、ＭＳＡＦは、スコアの情報を与え得る（例えば、低い腫瘍割合および低いスコアは、ある特定の条件下では閾値を越え得るが、高い腫瘍割合および低いスコアはそうではない場合がある）。

ＨＲＤスコアは、閾値と比較され得る。試料のＨＲＤスコアが閾値を超える場合、その試料は、ＨＲＤ陽性として決定され得る。閾値は、特定の機能喪失型ゲノムバイオマーカー（例えば、ＢＲＣＡ１／２両アレル性不活性化）の存在によってＨＲＤ＋ｖｅおよびＨＲＤ－ｖｅとみなされた腫瘍型ごとの集団の分析を介して、またはＰＡＲＰ阻害剤に対して臨床的に応答したもしくはしなかった腫瘍型ごとの集団に基づいて（応答者は、高いＨＲＤスコアを有する可能性が高いはずである）、経験的に決定され得る。

図３に戻ると、アグリゲーター３０５は、他のＨＲＤモジュール（融合コーラー３０１、欠失コーラー３０２、注釈３０３、および／またはＨＲＤスコアリングモジュール３０４）から試料－レベルサマリーを提供するように、および／または試料中の両アレル性不活性化を有するＨＲＲ遺伝子を決定するように構成され得る。アグリゲーター３０５は、融合コーラー３０１からのデータ、欠失コーラー３０２からのデータ（例えば、欠失コールデータ）、注釈モジュール３０３からのデータ（例えば、注釈データ）、および／またはＨＲＤスコアリングモジュール３０４からのデータ（例えば、ＨＲＤスコアデータ）を分析するように構成され得る。

ある実施形態では、アグリゲーター３０５は、機能的影響を有するデノボ融合コールと体細胞コールとを含む注釈データ；臨床的有意性の注釈、有害の注釈、および／もしくは復帰の注釈を有する、コピー数モジュール１１５からの一部もしくは全てのＳＮＶ結果を含むＳＮＶコール；ならびに／または臨床的有意性の注釈、分子的帰結、および機能的影響を有する、ＳＮＶ／インデルコールを含むデータを受け取る／検索することができる。ある実施形態では、アグリゲーター３０５は、以下の状態のうち１つを有する一部または全ての報告可能な遺伝子を含む欠失コールデータを受け取る／検索することができる：ホモ接合型欠失、ＬＯＨ、カバレッジベースの欠失、コピー数変化を伴わないＬＯＨ、もしくはコールなし；および／またはセグメントに基づくゲノムワイドなＬＯＨのコールを含むゲノムワイドなＬＯＨコールデータ。ある実施形態では、アグリゲーター３０５は、ＨＲＤスコアおよび／または最大体細胞アレル割合を含むＨＲＤスコアデータを受け取る／検索することができる。ある実施形態では、アグリゲーター３０５は、融合コーラー３０１によって検出された一部または全ての融合を含む融合データ、ならびに融合事象の深度分析のための補助データを受け取る／検索することができる。

一実施形態では、アグリゲーター３０５は、例として、ＢＲＣＡ１／２機能の喪失にしばしば帰せられる、試料中の再編成の総数、またはＨＲＤの特色／シグネチャー特徴、例えば、タンデム重複もしくは欠失、クラスタリングされた欠失およびクラスタリングされていない欠失（＞１００ｋｂ）、逆位ならびに染色体間転座を有するこれらの再編成のサブセットを決定し得る。別の実施形態では、アグリゲーター３０５は、これもまたＢＲＣＡ１／２機能の喪失に先に帰せられた、試料中のインデルの総数、または基礎ＨＲＤを示すマイクロホモロジーを有する隣接する配列コンテキストを有するこれらのインデルのサブセットを決定し得る。

両アレル性不活性化は、遺伝子の両方のコピーが機能喪失を示す場合に生じる；これは、遺伝子の両方のアレルにおける病原性バリアント、欠失、または再編成の存在を介して生じ得る。両アレル性不活性化を有する患者は、１つのアレルだけが不活性化された患者と比較して、より強いＨＲＤ表現型を有することが示されており、ＰＡＲＰで処置した場合、片アレル性不活性化と比較して、改善された臨床的利益を示し得る。アグリゲーター３０５は、試料中の遺伝子が両アレル性不活性化に関連するかどうかを決定するように構成され得、遺伝子がＨＲＲ遺伝子である場合には、以下のうち少なくとも１つが真である：
・遺伝子は、少なくとも２つの異なる有害なＳＮＶまたはインデルを有する
・遺伝子は、少なくとも１つの融合／再編成状態にあり、少なくとも１つの有害なＳＮＶまたはインデルを有する
・遺伝子は、少なくとも１つの有害なＳＮＶまたはインデルを有し、ＬＯＨまたはカバレッジベースの欠失を有する
・遺伝子は、少なくとも１つの融合／再編成状態にあり、ＬＯＨまたはカバレッジベースの欠失を有する
・遺伝子は、２つの異なる融合／再編成状態にある（相互（ｒｅｃｉｐｒｏｃａｌ）融合も異なる切断点を有する同じ融合遺伝子対も含まない）
・遺伝子は、ホモ接合型欠失を有する

アグリゲーター３０５は、ＨＲＲ遺伝子リストを決定する／検索する／受け取るように構成され得る。アグリゲーター３０５は、同じＨＲＲ遺伝子において検出されたホモ接合型欠失および融合を有する試料をフラグ付けするように構成され得る。

アグリゲーター３０５は、両アレル性変異の数、ＨＲＤスコアおよび最大体細胞アレル割合（ＭＳＡＦ）が含まれる（がこれらに限定されない）試料－レベルＨＲＤ情報を要約するデータを生成するように構成され得る。

出力モジュール３０６は、手動による再検討を目的とした、コピー数モジュール１１５およびＨＲＤモジュール３００によってコールされた一部または全てのバリアントのユーザーフレンドリーなサマリーを出力するように構成され得る。出力モジュール３０６は、コピー数モジュール１１５およびＨＲＤモジュール３００の両方の出力からの測定基準を含む試料－レベルデータを生成するように構成され得る。出力モジュール３０６は、ＨＲＤモジュール３００からもたらされた手動による再検討のフラグを要約する報告を生成するように構成され得る。報告は、手動による再検討を要求する試料およびバリアントを示し得る。出力モジュール３０６は、試料レベルおよびバリアントレベルのＱＣ測定基準を含む報告を生成するように構成され得る。出力モジュール３０６は、報告を生成するために試料およびバリアントレベルのＱＣ測定基準を得るように構成され得る。出力モジュール３０６は、コピー数モジュール１１５およびＨＲＤモジュール３００の両方からのバリアントコールおよび手動による再検討のコメントを要約する報告を生成するように構成され得る。出力モジュール３０６は、欠失コール、および対応するカットオフ閾値の表を生成するように構成され得る。

図１０は、一部の実施形態に従う、１つまたは複数のＨＲＤスコアを生成する（例えば、システム１００のＨＲＤモジュール３００を使用する）、および試験対象におけるＨＲＤを検出する、例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法１０００は、所与のがん型を有する参照対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からのＨＲＲ遺伝子（例えば、相同組換え修復（ＨＲＲ）遺伝子）のセットの中の遺伝子についての参照ＨＲＤスコアを生成して、参照ＨＲＤスコアのセットを生じさせるステップ（ステップ１００１）を含む。一部の実施形態では、ＨＲＲ遺伝子のセットは、表１に列挙されるものから選択される。所与の参照ＨＲＤスコアは、典型的には、所与のＨＲＤ核酸バリアントの保有率を含む。参照ＨＲＤスコアは、参照ＨＲＤスコアのセットに基づいて生成され得る（ステップ１００２）。次いで、参照ＨＲＤスコアは、試験対象におけるＨＲＤを検出するために使用され得る。方法１０００に示されるように、これは、一般に、所与のがん型を有する試験対象から得られたｃｆＤＮＡに由来する配列情報からのＨＲＲ遺伝子のセットの中の遺伝子についての試験ＨＲＤスコアを生成して、試験ＨＲＤスコアのセットを生じさせるステップ（ステップ１００３）を含む。所与の試験ＨＲＤスコアは、典型的には、所与のＨＲＤ核酸バリアントの保有率を含む。一部の実施形態では、所与のＨＲＤ核酸バリアントは、対応するＨＲＲ遺伝子の片アレル性不活性化または両アレル性不活性化を生じさせる。試験対象におけるＨＲＤを検出するために、方法１０００は、試験ＨＲＤスコアのセットから試験ＨＲＤスコアを生成するステップ（ステップ１００４）および試験ＨＲＤスコアが参照ＨＲＤスコアを超える場合、試験対象におけるＨＲＤを検出するステップ（ステップ９０５）もまた含む。

図１１は、一部の実施形態に従う、所与のがん型を有する試験対象のＨＲＤステータスを決定する（例えば、システム１００のＨＲＤモジュール３００を使用する）例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法１１００は、試験対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からのＨＲＲ遺伝子（例えば、相同組換え修復（ＨＲＲ）遺伝子）のセットの中の遺伝子についての試験ＨＲＤスコアを生成して、試験ＨＲＤスコアのセットを生じさせるステップ（ステップ１１０１）を含む。所与の試験ＨＲＤスコアは、一般に、所与のＨＲＤ核酸バリアントの保有率を含む。一部の実施形態では、ＨＲＲ遺伝子のセットは、表１に列挙されるものから選択される。方法１１００は、試験ＨＲＤスコアのセットから試験ＨＲＤスコアを生成するステップ（ステップ１１０２）もまた含む。さらに、方法１１００は、試験ＨＲＤスコアを参照ＨＲＤスコアと比較するステップであって、参照ＨＲＤスコアより上である試験ＨＲＤスコアが、それらの試験ＨＲＤスコアがＨＲＤを有する試験対象からのものであることを示し、参照ＨＲＤスコアであるかまたはそれ未満である試験ＨＲＤスコアが、それらの試験ＨＲＤスコアがＨＲＤを欠いている試験対象からのものであることを示し、それによって、所与のがん型を有する試験対象のＨＲＤステータスを決定する、ステップ（ステップ１１０３）もまた含む。

方法１１００は、１つまたは複数のがん型を有する１または複数の参照対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からの相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子についての参照ＨＲＤスコアを生成して、参照ＨＲＤスコアのセットを生じさせるステップであって、所与の参照ＨＲＤスコアが、所与のＨＲＤ核酸バリアントの保有率を含む、ステップ、および参照ＨＲＤスコアのセットから参照ＨＲＤスコアを生成するステップをさらに含み得る。

さらに説明するために、図１２は、一部の実施形態に従う、対象におけるＨＲＤを検出する（例えば、システム１００のＨＲＤモジュール３００を使用する）例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法１２００は、対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報における少なくとも１つのＨＲＤ核酸バリアントの存在または非存在を、（ｉ）配列情報が第１の状態を含む第１の確率、および配列情報が第２の状態を含む第２の確率であって、第１または第２の状態が少なくとも第１のＨＲＤ核酸バリアントを含む、第１の確率および第２の確率（例えば、本明細書に記載されるＣＮＶコーラーを使用する）、および／または（ｉｉ）配列情報から生成された１つまたは複数のアラインされた連続する配列（コンティグ）であって、少なくとも第２のＨＲＤ核酸バリアントを含むアラインされたコンティグ（例えば、本明細書に記載されるデノボ融合コーラーを使用する）、を使用して決定することにより、対象におけるＨＲＤを検出するステップ（ステップ１２０１）を含む。方法１２００の一部の実施形態は、ステップ（ｉ）～（ｉｉ）のうち１つだけを使用することを含むが、他の実施形態は、ステップ（ｉ）～（ｉｉ）の各々を使用することを含む。

図１３は、一部の実施形態に従う、対象における疾患を処置する例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法１３００は、疾患（例えば、所与のがん型）、および疾患に関連するＤＮＡ損傷修復欠損（ＤＤＲＤ）（例えば、ＨＲＤ）を有する対象に、１つまたは複数の療法（例えば、ＰＡＲＰ阻害剤、ＢＥＲ阻害剤など）を投与するステップを含み、このＤＤＲＤは、対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報における少なくとも１つのＨＲＤ核酸バリアントの存在を、（ｉ）配列情報が第１の状態を含む第１の確率、および配列情報が第２の状態を含む第２の確率であって、第１または第２の状態が少なくとも第１のＨＲＤ核酸バリアントを含む、第１の確率および第２の確率（例えば、本明細書に記載されるＣＮＶコーラーを使用する）、および／または（ｉｉ）配列情報から生成された１つまたは複数のアラインされた連続する配列（コンティグ）であって、少なくとも第２のＨＲＤ核酸バリアントを含むアラインされたコンティグ（例えば、本明細書に記載されるデノボ融合コーラーを使用する）、を使用して決定することにより、対象におけるＨＲＤを検出するステップ（ステップ１３０１）によって検出される。方法１３００の一部の実施形態は、ステップ（ｉ）～（ｉｉ）のうち１つだけを使用することを含むが、他の実施形態は、ステップ（ｉ）～（ｉｉ）の各々を使用することを含む。

一部の実施形態では、第１のＨＲＤ核酸バリアントは、ホモ接合型欠失、ヘテロ接合性消失（ＬＯＨ）バリアント（例えば、遺伝子特異的ＬＯＨバリアント、コピー数変化を伴わないＬＯＨバリアント、および／またはゲノムワイドなＬＯＨバリアント）、コピー数多様性（ＣＮＶ）などを含む。ある特定の実施形態では、第２のＨＲＤ核酸バリアントは、構造的再編成（例えば、短縮再編成、マルチエクソン欠失など）を含む。一部の実施形態では、第１および／または第２のＨＲＤ核酸バリアントは、一塩基多様性（ＳＮＶ）、インデルなどを含む。

これらの方法におけるステップ（ｉ）および／または（ｉｉ）の技法は、配列情報のセグメントを少なくとも１つの参照配列にアラインすることを少なくとも含み得る。これらの方法は、ステップ（ｉ）～（ｉｉ）のうち１つだけを使用することを含み得る。これらの方法は、ステップ（ｉ）～（ｉｉ）の各々を使用することを含み得る。

これらの方法における少なくとも１つの相同組換え修復（ＨＲＲ）遺伝子は、ＨＲＤ核酸バリアントを含み得る。これらの方法におけるＨＲＲ遺伝子は、ＡＴＭ、ＡＴＲ、ＢＡＲＤ１、ＢＲＣＡ１、ＢＲＣＡ２、ＢＲＩＰ１、ＣＤＫ１２、ＣＨＥＫ１、ＣＨＥＫ２、ＦＡＮＣＡ、ＦＡＮＣＬ、ＮＢＮ、ＰＡＬＢ２、ＲＡＤ５１、ＲＡＤ５１Ｂ、ＲＡＤ５１Ｃ、ＲＡＤ５１Ｄ、ＲＡＤ５４Ｌ、ＨＤＡＣ２、ＭＲＥ１１、ＰＰＰ２Ｒ２Ａ、ＸＲＣＣ５、ＷＲＮ、ＭＬＨ１、ＦＡＮＣＣ、ＢＡＰ１、ＸＲＣＣ２、ＸＲＣＣ３、およびＲＡＤ５０からなる群から選択され得る。ＨＲＲ遺伝子のセットは、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、またはそれより多くの遺伝子を含み得る。

これらの方法におけるＨＲＤ核酸バリアントの１つまたは複数は、所与のＨＲＲ遺伝子の両アレル性不活性化を生じさせ得る。これらの方法におけるＨＲＤ核酸バリアントの１つまたは複数は、所与のＨＲＲ遺伝子の片アレル性不活性化を生じさせ得る。これらの方法におけるＨＲＤ核酸バリアントは、疾患を有する対象と相関し得る。対象は、疾患を有するかどうかがわかっていない場合がある。対象は、疾患を有することがわかっている場合がある。疾患は、がんであり得る。

これらの方法は、疾患を処置するために対象に１つまたは複数の療法を投与するステップを含み得る。療法は、少なくとも１つのポリＡＤＰリボースポリメラーゼ（ＰＡＲＰ）阻害剤を含み得る。療法は、少なくとも１つの塩基除去修復（ＢＥＲ）阻害剤を含み得る。

これらの方法のステップ（ｉ）は、配列情報が第１の状態を含む第１の確率を生成すること、配列情報が第２の状態を含む第２の確率を生成すること；第１の確率と第２の確率を比較すること、および比較に基づいて、配列情報が、第１の状態を含むのか、または第２の状態を含むのかについての予測を生成することを含み得る。

これらの方法のステップ（ｉ）は、配列情報における少なくとも１つの遺伝子座位に関連する１つまたは複数の生殖細胞系列一塩基多型（ＳＮＰ）位置に基づくアレル計数値の第１のモデルであって、少なくとも１つの体細胞ホモ接合型欠失を表す第１のモデルを、第１の確率分布によって生成すること、配列情報における遺伝子座位に関連する１つまたは複数の生殖細胞系列ＳＮＰ位置に基づくアレル計数値の第２のモデルであって、少なくとも１つの体細胞ヘテロ接合型欠失を表す第２のモデルを、第２の確率分布によって生成すること、第１のモデルの第１の出力物と第２のモデルの第２の出力物を比較すること、および比較に基づいて、遺伝子座位についての体細胞ヘテロ接合型欠失が配列情報に存在するという予測を生成することを含み得る。

これらの方法のステップ（ｉ）は、配列情報が体細胞ホモ接合型欠失を含む第１の確率を生成すること、配列情報が体細胞ヘテロ接合型欠失を含む第２の確率を生成すること、第１の確率と第２の確率を比較すること、および比較に基づいて、配列情報が、体細胞ホモ接合型欠失を含むのか、または体細胞ヘテロ接合型欠失を含むのかについての予測を生成することを含み得る。

これらの方法のステップ（ｉｉ）は、複数の配列リードを参照配列にアラインすること、複数の配列リードの少なくとも１つの配列リードの参照配列へのアラインメントで１つまたは複数の切断点を決定すること、アラインメントで１つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること、１つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること、１つまたは複数の共通の切断点に基づいて候補融合配列リードを群別化すること、各群内の候補融合配列リードをアセンブルして１つまたは複数のコンティグを生成すること、各群からのコンティグを参照配列にアラインすること、各群からのコンティグのアラインメントに基づいて、１つまたは複数の候補融合事象を決定すること、１つまたは複数の候補融合事象に１つまたは複数の基準を適用すること、および１つまたは複数の候補融合事象への１つまたは複数の基準の適用に基づいて、第２のＨＲＤ核酸バリアントを含む１つまたは複数の融合事象を決定することを含み得る。

これらの方法は、ＣＮＶおよび／またはデノボ融合コーラーを使用してＨＲＤ、または対象におけるＨＲＤを検出するステップを含み得る。遺伝子は、ＨＲＤ核酸バリアントを含み得る。

ある実施形態では、図１４に示されるように、ＨＲＤステータスを決定するための方法１４００が開示される。ある実施形態では、配列ＱＣ構成要素１１３、コピー数モジュール１１５、および／またはＨＲＤモジュール３００は、単独で、および／またはそれらの組合せで、配列リードデータストア１５０および／または分析データストア１１７にアクセスし、方法１４００を全体においておよび／または一部において行うように構成され得る。方法１４００は、単一のコンピュータデバイス、複数のコンピュータデバイスなどによって、全体においてまたは一部において行われ得る。方法１４００は、ステップ１４０１において、生体試料の配列データを決定するステップを含み得る。生体試料は、無細胞ＤＮＡ（ｃｆＤＮＡ）を含み得る。方法１４００は、ステップ１４０２において、配列データに基づいて、カバレッジデータを決定するステップを含み得る。方法１４００は、ステップ１４０３において、カバレッジデータに基づいて、１つまたは複数の融合事象に関連する１つまたは複数の切断点を決定するステップを含み得る。方法１４００は、ステップ１４０４において、カバレッジデータに基づいて、１つまたは複数の遺伝子に関連する１つまたは複数の欠失を決定するステップを含み得る。方法１４００は、ステップ１４０５において、１つまたは複数の切断点および１つまたは複数の欠失に基づいて、相同組換え欠損（ＨＲＤ）スコアを決定するステップを含み得る。方法１４００は、ステップ１４０６において、ＨＲＤスコアに基づいて、生体試料を分類するステップを含み得る。方法１４００は、ステップ１４０６において、ＨＲＤスコアに基づいて、生体試料をＨＲＤ陽性として分類するステップを含み得る。方法１４００は、ステップ１４０６において、ＨＲＤスコアに基づいて、生体試料をＨＲＤ陰性として分類するステップを含み得る。

生体試料の配列データを決定するステップは、１つまたは複数のＨＲＲ遺伝子のパネルをシークエンシングすることを含み得る。１つまたは複数のＨＲＲ遺伝子は、ＡＴＭ、ＡＴＲ、ＢＡＲＤ１、ＢＲＣＡ１、ＢＲＣＡ２、ＢＲＩＰ１、ＣＤＫ１２、ＣＨＥＫ１、ＣＨＥＫ２、ＦＡＮＣＡ、ＦＡＮＣＬ、ＮＢＮ、ＰＡＬＢ２、ＲＡＤ５１、ＲＡＤ５１Ｂ、ＲＡＤ５１Ｃ、ＲＡＤ５１Ｄ、ＲＡＤ５４Ｌ、ＨＤＡＣ２、ＭＲＥ１１、ＰＰＰ２Ｒ２Ａ、ＸＲＣＣ５、ＷＲＮ、ＭＬＨ１、ＦＡＮＣＣ、ＢＡＰ１、ＸＲＣＣ２、ＸＲＣＣ３、およびＲＡＤ５０からなる群から選択され得る。

生体試料は、疾患を有する対象に関連付けられ得る。疾患は、がんであり得る。カバレッジデータは、複数のビンに関連付けられ得る。複数のビンは、染色体の領域を示し得る。

カバレッジデータに基づいて、１つまたは複数の融合事象に関連する１つまたは複数の切断点を決定するステップは、配列データからの複数の配列リードを参照配列にアラインすること、複数の配列リードについての複数の配列リードの参照配列へのアラインメントで１つまたは複数の切断点を決定すること、アラインメントで１つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること、１つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること、１つまたは複数の共通の切断点に基づいて候補融合配列リードを群別化すること、群内の候補融合配列リードをアセンブルして１つまたは複数のコンティグを生成すること、複数の群のうちの群からのコンティグを参照配列にアラインすること、群からのコンティグのアラインメントに基づいて、１つまたは複数の候補融合事象を決定すること、１つまたは複数の候補融合事象に１つまたは複数の基準を適用すること、および１つまたは複数の候補融合事象への１つまたは複数の基準の適用に基づいて、１つまたは複数の融合事象を決定することを含み得る。

カバレッジデータに基づいて、１つまたは複数の遺伝子に関連する１つまたは複数の欠失を決定するステップは、カバレッジデータに基づいて、複数のセグメントを決定することを含み得、複数のセグメントは、変化点により分離されている。複数のセグメントを決定することは、セグメンテーションアルゴリズムを適用することを含み得る。セグメンテーションアルゴリズムは、循環バイナリセグメンテーションアルゴリズムを含み得る。変化点は、基礎ＤＮＡコピー数が変化したことをカバレッジデータが示す位置に対応し得る。１つまたは複数の欠失は、ホモ接合型欠失またはヘテロ接合性消失（ＬＯＨ）欠失の１つまたは複数を含み得る。

方法１４００は、複数のセグメントを参照配列と比較して、少なくとも１つの欠失を含む複数のセグメントのサブセットを同定するステップ、複数のセグメントのサブセットから、染色体の長さにわたる任意のセグメントを除去するステップ、複数のセグメントのサブセットの中の、閾値距離以上離れていない任意のセグメントを組み合わせるステップ、複数のセグメントのサブセットから、閾値長未満の長さを有する任意のセグメントを除去するステップ、および複数のセグメントのサブセットから、技術的アーチファクトに関連する任意のセグメントを除去するステップをさらに含み得る。方法１４００は、複数のセグメントのサブセットの中の１つまたは複数の残存セグメントに基づいて、および１つまたは複数の融合事象に関連する１つまたは複数の切断点に基づいて、閾値内の隣接しているセグメント間の切断点の数を決定するステップをさらに含み得る。

方法１４００は、複数のセグメントのサブセットの中の１つまたは複数の残存セグメントに基づいて、目的の領域の単一のコピーに関連する、または欠失される目的の領域の両方のコピーに関連する、セグメントの数を決定するステップをさらに含み得る。

１つまたは複数の切断点および１つまたは複数の欠失に基づいて、ＨＲＤスコアを決定するステップは、切断点の数およびセグメントの数を合計することを含み得る。

方法１４００は、シークエンシングデータに基づいて、１つまたは複数のゲノム再編成の存在を決定するステップをさらに含み得る。ＨＲＤスコアを決定するステップは、１つまたは複数のゲノム再編成にさらに基づき得る。ＨＲＤスコアを決定するステップは、切断点の数、セグメントの数、およびゲノム再編成の数を合計することを含み得る。

方法１４００は、最大体細胞アレル割合（ＭＳＡＦ）を決定するステップをさらに含み得る。ＭＳＡＦを決定するステップは、クローン性造血起源と注釈されない任意の体細胞バリアントであって、融合または非同義ＳＮＶまたはインデルである任意の体細胞バリアントを含む、生体試料中のバリアントの最大パーセンテージを、配列データに基づいて決定することをさらに含み得る。

方法１４００は、配列データに含有されている１つまたは複数のバリアントを注釈するステップをさらに含み得る。配列データに含有されている１つまたは複数のバリアントを注釈するステップは、ヒトの健康への１つまたは複数のバリアントの影響に関連する臨床的有意性の注釈を決定することを含み得る。

方法１４００は、配列データ、カバレッジデータ、１つまたは複数の切断点、１つまたは複数の欠失、およびＨＲＤスコアを集約するステップをさらに含み得る。方法１４００は、集約された配列データ、カバレッジデータ、１つまたは複数の切断点、１つまたは複数の欠失、およびＨＲＤスコアを出力するステップをさらに含み得る。

ＨＲＤスコアに基づいて、生体試料をＨＲＤ陽性として分類するステップは、ＨＲＤスコアが閾値を超えると決定することを含み得る。ＨＲＤスコアに基づいて、生体試料をＨＲＤ陰性として分類するステップは、ＨＲＤスコアが閾値を超えないと決定することを含み得る。方法１４００は、１つまたは複数の参照ＨＲＤスコアに基づいて閾値を決定することをさらに含み得る。閾値は、参照ＨＲＤスコアを含み得る。１または複数の参照対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報は、参照ＨＲＤスコアのセットを生じさせるために使用され得る。参照対象は、生体試料がそれから採取された対象と同じ状態を有し得る。例えば、参照対象および生体試料がそれから採取された対象は、同じ疾患（例えば、がんおよび／またはがん型）を有し得る。参照ＨＲＤスコアは、例えば、参照ＨＲＤスコアのセットの平均（または他の統計的分析）を取ることによって、参照ＨＲＤスコアのセットから生成され得る。

方法１４００は、生体試料をＨＲＤ陽性として分類するステップに基づいて、療法を投与するステップをさらに含み得る。療法は、ポリＡＤＰリボースポリメラーゼ（ＰＡＲＰ）阻害剤または塩基除去修復（ＢＥＲ）阻害剤であり得る。ＰＡＲＰ阻害剤は、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、ＣＥＰ９７２２、Ｅ７０１６、Ｅ７４４９、または３－アミノベンズアミドのうちの少なくとも１つであり得る。療法は、ＰＡＲＰ阻害剤と放射線療法の組合せであり得る。

図面に示される種々の処理操作および／または方法は、本明細書に詳細に記載されるシステム構成要素の一部または全てを使用して達成され得、一部のインプリメンテーションでは、種々の操作は異なるシーケンスで行われ得、種々の操作は割愛され得る。さらなる操作が、示されたフローダイヤグラム中に示される操作の一部または全てと共に行われ得る。１つまたは複数の操作は、同時に行われ得る。したがって、例示される（本明細書にさらに詳細に記載される）操作は、例として提供されており、したがって、限定とみなすべきではない。

コンピュータインプリメンテーション

湿式化学ステップ以外の、本明細書および添付の特許請求の範囲に記載された任意のまたは全ての操作が、適切なプログラミングされたコンピュータで行われ得るように、本発明の方法は、コンピュータで実施され得る。コンピュータは、メインフレーム、パーソナルコンピュータ、タブレット、スマートフォン、クラウド、オンラインデータストレージ、リモートデータストレージなどであり得る。コンピュータは、１つまたは複数の場所で操作され得る。

本発明の方法の種々の操作は、コンピュータ可読媒体（例えば、ハードドライブ、補助メモリ、外部メモリ、サーバー；データベース、ポータブルメモリデバイス（例えば、ＣＤ－Ｒ、ＤＶＤ、ＺＩＰディスク、フラッシュメモリカード）など上に記憶された情報および／またはプログラムを利用でき、および／または結果を生成することができる。

本開示は、実行された場合に本発明の方法のステップを実施する１つまたは複数のプログラムを含有する機械可読媒体を含む、核酸集団を分析するための製造品もまた含む。

本開示は、ハードウェアおよび／またはソフトウェアにおいて実施され得る。例えば、本開示の異なる態様は、クライアント側の論理回路またはサーバー側の論理回路のいずれかにおいて実施され得る。本開示またはその構成要素は、適切に構成されたコンピュータデバイス中にロードされた場合に、そのデバイスに本開示に従って遂行させる論理命令および／またはデータを含有する固定媒体プログラム構成要素で具体化され得る。論理命令を含有する固定媒体は、視聴者のコンピュータ中に物理的にロードするための固定媒体上で視聴者に届けられ得、または論理命令を含有する固定媒体は、プログラム構成要素をダウンロードするために通信媒体を介して視聴者がアクセスするリモートサーバー上に存在し得る。

本開示は、本開示の方法を実施するようにプログラミングされるコンピュータ制御システムを提供する。図１に戻ると、プロセッサー１２０には、シングルコアもしくはマルチコアプロセッサー、または平行処理のための複数のプロセッサーが含まれ得る。ストレージデバイス１２２には、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ、ハードディスク、および／または他の型のストレージが含まれ得る。コンピュータシステム１１０は、１つまたは複数の他のシステム、および周辺デバイス、例えば、キャッシュ、他のメモリ、データストレージおよび／または電子ディスプレイアダプターと通信するための通信インターフェース（例えば、ネットワークアダプター）を含み得る。コンピュータシステム１１０の構成要素は、内部通信バス、例えば、マザーボードを介して、互いに通信し得る。ストレージデバイス１２２は、データを記憶するためのデータストレージユニット（またはデータリポジトリ）であり得る。コンピュータシステム１１０は、通信インターフェースの助けにより、コンピュータネットワーク（「ネットワーク」）に動作可能に連結され得る。ネットワークは、インターネット、インターネットおよび／またはエクストラネット、またはインターネットを介して通信したイントラネットおよび／もしくはエクストラネットであり得る。ネットワークは、一部の場合には、遠隔通信および／またはデータネットワークである。ネットワークには、ローカルエリアネットワークが含まれ得る。ネットワークは、分散コンピューティング、例えば、クラウドコンピューティングを可能にすることができる１つまたは複数のコンピュータサーバーを含み得る。ネットワークは、一部の場合には、コンピュータシステム１１０の助けにより、コンピュータシステム１２０に連結されたデバイスがクライアントまたはサーバーとして挙動するのを可能にし得るピアツーピアネットワークを実施し得る。

プロセッサー１２０は、プログラムまたはソフトウェアで具体化され得る機械可読命令のシーケンスを実行し得る。命令は、メモリ場所、例えば、ストレージデバイス１２２中に記憶され得る。命令は、プロセッサー１２０に向けられ得、これにより、本開示の方法を実施するようにプロセッサー１２０を引き続いてプログラミングまたは他の方法で構成することができる。プロセッサー１２０によって行われる操作の例には、フェッチ、デコード、実行、およびライトバックが含まれ得る。

プロセッサー１２０は、回路、例えば集積回路の一部であり得る。システム１００の１つまたは複数の他の構成要素が、回路中に含められ得る。一部の場合には、回路には、アプリケーション特異的集積回路（ＡＳＩＣ）が含まれ得る。

ストレージデバイス１２２は、ファイル、例えば、ドライバー、ライブラリーおよび保存されたプログラムを記憶し得る。ストレージデバイス１２２は、ユーザーデータ、例えば、ユーザー選好およびユーザープログラムを記憶することができる。コンピュータシステム１１０は、一部の場合には、コンピュータシステム１１０に対して外部の、例えば、イントラネットまたはインターネットを介してコンピュータシステム１１０と通信するリモートサーバー上に位置する、１つまたは複数のさらなるデータストレージユニットを含み得る。

コンピュータシステム１１０は、ネットワークを介して１つまたは複数のリモートコンピュータシステムと通信できる。例えば、コンピュータシステム１１０は、ユーザーのリモートコンピュータシステムと通信できる。リモートコンピュータシステムの例には、パーソナルコンピュータ（例えば、ポータブルＰＣ）、スレートもしくはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ（登録商標）使用可能デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、またはパーソナルデジタルアシスタントが含まれる。ユーザーは、ネットワークを介してコンピュータシステム１１０にアクセスできる。

本明細書に記載される方法は、コンピュータシステム１１０の電子ストレージ場所、例えば、ストレージデバイス１２２などの上に記憶された機械（例えば、コンピュータプロセッサー）実行可能コードによって実施され得る。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る（例えば、コンピュータ可読媒体）。使用の間に、コードは、プロセッサー１２０によって実行され得る。一部の場合には、コードは、プロセッサー１２０による即座のアクセスのために、ストレージデバイス１２２から検索され得、ストレージデバイス１２２上に記憶され得る。

コードは、コードを実行するように適合されたプロセッサーを有する機械との使用のために、プリコンパイルおよび構成され得、またはランタイムの間にコンパイルされ得る。コードは、プリコンパイルまたはアズコンパイルされた（ａｓ－ｃｏｍｐｉｌｅｄ）様式でのコードの実行を可能にするために選択され得るプログラミング言語で供給され得る。

本明細書で提供されるシステムおよび方法の態様、例えば、コンピュータシステム１１０は、プログラミングで具体化され得る。技術の種々の態様は、典型的には、ある型の機械可読媒体上で運搬されるまたはある型の機械可読媒体で具体化される機械（またはプロセッサー）実行可能コードおよび／または関連データの形態の、「製品」または「製造品」と考えられ得る。機械実行可能コードは、電子ストレージユニット、例えば、メモリ（例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスク上に記憶され得る。

「ストレージ」型媒体は、ソフトウェアプログラミングのための非一時的なストレージをいつでも提供し得る、任意のまたは全ての、コンピュータの有形メモリ、プロセッサーなど、またはその関連のモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどを含み得る。ソフトウェアの全てまたは部分は、インターネットまたは種々の他の遠隔通信ネットワークを介して、折に触れ通信され得る。かかる通信は、例えば、１つのコンピュータまたはプロセッサーから別のコンピュータまたはプロセッサーへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへの、ソフトウェアのローディングを可能にし得る。したがって、ソフトウェアエレメントを保有し得る別の型の媒体には、ローカルデバイス間の物理的インターフェースを横断して、有線のおよび光学的固定電話回線ネットワークを介して、および種々のエアリンク（ａｉｒ－ｌｉｎｋ）を通じて使用されるものなどの、光波、電波および電磁波が含まれる。かかる波を搬送する物理的エレメント、例えば、有線または無線リンク、光学リンクなどもまた、ソフトウェアを保有する媒体とみなされ得る。本明細書で使用される場合、非一時的な有形ストレージ媒体に限定されない限り、「媒体」は、他の型の（無形）媒体を含み得る。

「ストレージ」媒体、コンピュータまたは機械「可読媒体」などの用語は、実行のために命令をプロセッサーに提供することに関与する任意の有形の（例えば、物理的な）非一時的な媒体を指す。

したがって、機械可読媒体、例えば、コンピュータ実行可能コードは、有形ストレージ媒体、搬送波媒体または物理的伝送媒体が含まれるがこれらに限定されない多くの形態を取り得る。非揮発性ストレージ媒体には、例えば、光学または磁気ディスク、例えば、図面中に示されるデータベースなどを実施するために使用され得るものなどの、任意のコンピュータ中のストレージデバイスのいずれかなどが含まれる。揮発性ストレージ媒体には、ダイナミックメモリ、例えば、かかるコンピュータプラットフォームのメインメモリが含まれる。有形伝送媒体には、同軸ケーブル；コンピュータシステム内のバスを含むワイヤを含む銅ワイヤおよび光ファイバーが含まれる。搬送波伝送媒体は、無線周波数（ＲＦ）および赤外線（ＩＲ）データ通信の間に生成されるものなどの、電気的もしくは電磁気信号、または音波もしくは光波の形態を取り得る。したがって、コンピュータ可読媒体の一般的な形態には、例えば、以下が含まれる：フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的ストレージ媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を輸送する搬送波、かかる搬送波を輸送するケーブルもしくはリンク、またはコンピュータがそこからプログラミングコードおよび／もしくはデータを読み取り得る任意の他の媒体。これらの形態のコンピュータ可読媒体の多くは、１つまたは複数の命令の１つまたは複数のシーケンスを実行のためにプロセッサーに搬送することに関与し得る。

コンピュータシステム１１０は、例えば、報告を提供するためのユーザーインターフェース（ＵＩ）を含む電子ディスプレイ９３５を含み得るかまたはそれと通信し得る。ＵＩの例には、グラフィカルユーザーインターフェース（ＧＵＩ）およびウェブベースのユーザーインターフェースが含まれるがこれらに限定されない。

本開示の方法およびシステムは、１つまたは複数のアルゴリズムによって実施され得る。アルゴリズムは、プロセッサー１２０による実行の際にソフトウェアによって実施され得る。

本発明の方法は、対象における状態、特にがんの存在または非存在を診断するため、状態を特徴付けるため（例えば、がんをステージ分類するためまたはがんの不均一性を決定するため）、状態のための処置を選択するため、状態の処置に対する応答をモニタリングするため、状態または状態の引き続く過程を発症する予後リスクを生じさせるために使用され得る。

種々のがんが本発明の方法を使用して検出され得る。がん細胞は、ほとんどの細胞と同様、古い細胞が死に、新しい細胞によって置き換えられるターンオーバーの速度によって特徴付けられ得る。一般に、所与の対象における脈管構造と接触している死細胞は、ＤＮＡまたはＤＮＡの断片を血流中に放出し得る。これは、種々のステージの疾患の間のがん細胞についても当てはまる。がん細胞は、疾患のステージに依存して、種々の遺伝子異常、例えば、コピー数多様性ならびに稀な変異によっても特徴付けられ得る。この現象は、本明細書に記載される方法およびシステムを使用して個体におけるがんの存在または非存在を検出するために使用され得る。

ある特定の実施形態では、本明細書で開示される方法および態様は、患者における所与の疾患、障害または状態を診断するために使用される。典型的には、考慮される疾患は、ある型のがんである。かかるがんの非限定的な例には、胆道がん、膀胱がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳房癌、化生性癌、子宮頸部がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍（ＧＩＳＴ）、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、淡明細胞型腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ球性（ＣＬＬ）、慢性骨髄性（ＣＭＬ）、慢性骨髄単球性（ＣＭＭＬ）、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺がん、非小細胞肺がん（ＮＳＣＬＣ）、中皮腫、Ｂ細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、Ｔ細胞リンパ腫、非ホジキンリンパ腫、前駆Ｔリンパ芽球性リンパ腫／白血病、末梢性Ｔ細胞リンパ腫、多発性骨髄腫、鼻咽頭癌（ＮＰＣ）、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍（ＧＩＳＴ）、子宮がん、または子宮肉腫が含まれる。

本明細書で開示される方法およびシステムを使用して評価され得る他の遺伝子ベースの疾患、障害、または状態の非限定的な例には、ＤＮＡ損傷修復欠損、軟骨無形成症、アルファ－１アンチトリプシン欠損症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー・マリー・トゥース（ＣＭＴ）、ネコ鳴き、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第Ｖ因子ライデン血栓性素因、家族性高コレステロール血症、家族性地中海熱、脆弱Ｘ症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド症候群、ポルフィリン症、早老症、網膜色素変性症、重症複合免疫不全症（ｓｃｉｄ）、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、ＷＡＧＲ症候群、ウィルソン病などが含まれる。

がんは、変異、稀な変異、インデル、コピー数多様性、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変更、遺伝子融合、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体病変、ＤＮＡ病変、核酸の化学的改変における異常な変化、エピジェネティックパターンにおける異常な変化が含まれる遺伝的多様性から検出され得る。

遺伝子データは、特定の型のがんを特徴付けるためにも使用され得る。がんは、組成およびステージ分類の両方において不均一である場合が多い。遺伝子プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得るがんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、対象または実務者に、特定の型のがんの予後に関する手がかりを提供し得、対象または実務者のいずれかに、疾患の進行に合わせて処置選択肢を適合させ得る。一部のがんは、進行すると、より高悪性度かつ遺伝的に不安定になる。他のがんは、良性、不活性または休止状態のままであり得る。本開示のシステムおよび方法は、疾患進行を決定する際に有用であり得る。

本発明の分析は、特定の処置選択肢の有効性を決定する際にも有用である。処置が首尾よい場合には、より多くのがんが死んでＤＮＡをシェディングし得るので、首尾よい処置選択肢は、対象の血液において検出されるコピー数多様性または稀な変異の量を増加させ得る。他の例では、これは起こらない場合がある。別の例では、おそらくは、ある特定の処置選択肢は、がんの遺伝子プロファイルと経時的に相関し得る。この相関は、療法を選択する際に有用であり得る。さらに、がんが処置後に寛解状態にあることが観察される場合、本発明の方法は、残存疾患または疾患の再発をモニタリングするために使用され得る。

本発明の方法は、がん以外の状態における遺伝的多様性を検出するためにも使用され得る。免疫細胞、例えば、Ｂ細胞は、ある特定の疾患の存在に際して、迅速なクローン性拡大増殖を受け得る。クローン性拡大増殖は、コピー数多様性検出を使用してモニタリングされ得、ある特定の免疫状態がモニタリングされ得る。この例では、コピー数多様性分析は、特定の疾患がどのように進行している可能性があるかのプロファイルを生じさせるために経時的に行われ得る。

さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得、この方法は、対象における細胞外ポリヌクレオチドの遺伝子プロファイルを生成するステップを含み、この遺伝子プロファイルは、コピー数多様性および稀な変異の分析から得られた複数のデータを含む。一部の場合には、がんが含まれるがこれに限定されない疾患は、不均一であり得る。疾患細胞は、同一でない場合がある。がんの例では、一部の腫瘍は、異なる型の腫瘍細胞を含むことが公知であり、一部の細胞は、がんの異なるステージにあることが公知である。他の例では、不均一性は、疾患の複数の病巣を含み得る。重ねて、がんの例では、複数の腫瘍病巣が存在し得、おそらくは、このとき、１つまたは複数の病巣は、原発部位から広がった転移の結果である。

本発明の方法は、不均一な疾患における異なる細胞に由来する遺伝子情報の概要であるフィンガープリントまたはデータのセットを生成またはプロファイリングするために使用され得る。データのこのセットは、コピー数多様性および稀な変異の分析を単独でまたは組み合わせて含み得る。

例示的な精密処置

改善されたコンピュータシステム１１０によって提供される精密診断法は、精密処置計画を生じ得、これは、コンピュータシステム１１０によって同定され得る（および／または医療専門家によってキュレートされ得る）。例えば、精密診断および処置の１つの型は、相同組換え修復（ＨＲＲ）経路中の遺伝子に関連し得る。

相同組換えは、ヌクレオチド配列がＤＮＡの２つの類似または同一の分子間で交換される遺伝子組換えの型である。これは、二本鎖切断（ＤＳＢ）として公知の、ＤＮＡの両方の鎖上で生じる有害な切断を正確に修復するために、細胞によって最も広く使用されている。ＨＲＲは、細胞分裂が生じる前に染色体切断を取り除くために、複製されたＤＮＡ（Ｓ期およびＧ２期）中に存在する損傷をエラーなしに除去するための機構を提供する。相同組換えがＤＮＡ中の二本鎖切断をどのように修復するかについての当初のモデルは、二本鎖切断修復（ＤＳＢＲ）経路および合成依存的鎖アニーリング（ＳＤＳＡ）経路を媒介する相同組換え修復経路である。相同組換え遺伝子における生殖系列および体細胞欠損は、乳房、卵巣および前立腺がんと強く関連付けられてきた。

試料中のバリアントヌクレオチドの数および型は、処置、即ち、治療介入に対する、試料を提供する対象の従順さの指標を提供し得る。例えば、種々のポリＡＤＰリボースポリメラーゼ（ＰＡＲＰ）阻害剤は、ＢＲＣＡ１またはＢＲＣＡ２遺伝子における遺伝性変異によって引き起こされる乳房、卵巣および前立腺がんからの腫瘍の成長を停止させることが示されている。これらの治療剤の一部は、塩基除去修復（ＢＥＲ）を阻害し得、これが、ＨＲＲの欠損を相殺し得る。

他方、ある特定のＢＲＣＡおよびＨＲＲ野生型患者は、ＰＡＲＰ阻害剤による処置から臨床的利益を得ない場合がある。さらに、ＢＲＣＡ変異を有する全ての卵巣がん患者がＰＡＲＰ阻害剤に対して応答するわけではない。さらに、異なる型の変異は、異なる療法を示し得る。例えば、ＨＲＲ遺伝子中の体細胞ヘテロ接合型欠失は、体細胞ホモ接合型欠失とは異なる療法を示し得る。したがって、遺伝子材料の状態は、療法に影響し得る。一例では、ＰＡＲＰ阻害剤は、ＨＲＲ遺伝子中に体細胞ホモ接合型欠失を有する個体に投与され得るが、ＨＲＲ遺伝子中に野生型アレルまたは体細胞ヘテロ接合型欠失を有する個体には投与されない。

シークエンシングされた核酸におけるヌクレオチド多様性は、シークエンシングされた核酸を参照配列と比較することによって決定され得る。参照配列は、既知の配列、例えば、対象由来の既知の全体的または部分的ゲノム配列、ヒト対象の全ゲノム配列である場合が多い。参照配列は、ｈＧ１９であり得る。シークエンシングされた核酸は、上記のように、試料中の核酸について直接決定された配列、またはかかる核酸の増幅産物の配列のコンセンサスを示し得る。比較は、参照配列上の１つまたは複数の指定された位置において行われ得る。それぞれの配列が最大限にアラインされる場合、参照配列の指定された位置と対応する位置を含むシークエンシングされた核酸のサブセットが同定され得る。かかるサブセット内で、存在する場合、シークエンシングされた核酸が、指定された位置においてヌクレオチド多様性を含むこと、および必要に応じて、存在する場合、参照ヌクレオチド（即ち、参照配列中と同じヌクレオチド）を含むことが決定され得る。ヌクレオチドバリアントを含むサブセット中のシークエンシングされた核酸の数が閾値を超える場合、バリアントヌクレオチドは、指定された位置においてコールされ得る。閾値は、他の可能性のうちでも、ヌクレオチドバリアントを含むサブセット内の単純な数、例えば、少なくとも１、２、３、４、５、６、７、８、９、もしくは１０個のシークエンシングされた核酸であり得、またはヌクレオチドバリアントを含むサブセット内のシークエンシングされた核酸の比率、例えば、少なくとも０．５、１、２、３、４、５、１０、１５、もしくは２０であり得る。比較は、参照配列中の目的の任意の指定された位置について反復され得る。ときどき、比較は、参照配列上の少なくとも２０、１００、２００、または３００連続する位置、例えば、２０～５００、または５０～３００連続する位置を占有する指定された位置について行われ得る。

（実施例１）
ｃｔＤＮＡ次世代シークエンシングによってプロファイリングされた前立腺がんにおける相同組換え修復（ＨＲＲ）変異の状況

背景

ＰＡＲＰ阻害は、ＨＲＲ遺伝子の分子プロファイリングを介して検出され得るＨＲＲ欠損（ＨＲＤ）を有する患者において、合成致死性および増加した治療感度を引き起こし得る。例えば、ＦＤＡは、ＨＲＲ遺伝子中に変異を有する転移性去勢抵抗性前立腺がん（ｍＣＲＰＣ）患者におけるＰＡＲＰ阻害剤オラパリブ（de Bono et al., "Olaparib for Metastatic Castration-Resistant Prostate Cancer," N Engl J Med., 382(22):2091-2102 (2020)）およびルカパリブ（Abida et al., "Non-BRCA DNA Damage Repair Gene Alterations and Response to the PARP Inhibitor Rucaparib in Metastatic Castration-Resistant Prostate Cancer: Analysis From the Phase II TRITON2 Study," Clin Cancer Res., 10.1158/1078-0432.CCR-20-0394 (2020)）の使用を最近承認した。前立腺がんは、男性において最も一般的な悪性疾患であり（Siegel et al., "Cancer statistics, 2020," CA Cancer J Clin, 70(1):7-30 (2020)）、進行型前立腺がんを有する男性においてＨＲＤの高い保有率（２０～３０％、Athie et al., "Targeting DNA Repair Defects for Precision Medicine in Prostate Cancer" Curr Oncol Rep, 21(5):42 (2019)；Mateo et al., "Olaparib in patients with metastatic castration-resistant prostate cancer with DNA repair gene aberrations (TOPARP-B): a multicentre, open-label, randomised, phase 2 trial," Lancet Oncol., 21(1):162-174 (2020)；Robinson et al., "Integrative clinical genomics of advanced prostate cancer" [published correction appears in Cell. 2015 Jul 16;162(2):454]. Cell, 161(5):1215-1228 (2015)）を有する。転移性前立腺がん患者における組織生検の高い失敗率（２５～７５％、またはさらにより高い（例えば、≧９０％））（Ross et al., "Predictors of prostate cancer tissue acquisition by an undirected core bone marrow biopsy in metastatic castration-resistant prostate cancer--a Cancer and Leukemia Group B study," Clin Cancer Res, 11(22):8109-13 (2005)；Spritzer et al., "Bone marrow biopsy: RNA isolation with expression profiling in men with metastatic castration-resistant prostate cancer--factors affecting diagnostic success," Radiology, 269(3):816-23 (2013)；Sailer et al., "Bone biopsy protocol for advanced prostate cancer in the era of precision medicine," Cancer, 124(5):1008-1015 (2018)）は、ＨＲＤプロファイリングの課題になっており、非侵襲性のｃｔＤＮＡ代替法の必要性を強調している。ｃｔＤＮＡでは、ＨＲＤの高頻度の原因であるコピー数喪失の検出は、無細胞白血球性ＤＮＡによるシグナル希釈に起因して、コールするのがさらに困難である（Barbacioru et al., "Abstract 435: Cell-free circulating tumor DNA (ctDNA) detects somatic copy number loss in homologous recombination repair genes," Proceedings: AACR Annual Meeting 2019; March 29-April 3, 2019; Atlanta, GA）。したがって、機能喪失型ＳＮＶ／インデル、構造的再編成、および遺伝子欠失を検出して、５００遺伝子液体生検パネルであるＧｕａｒｄａｎｔＯＭＮＩ上でＨＲＤを同定するパイプラインを開発した。この実施例は、６５０を超える前立腺がんＧｕａｒｄａｎｔＯＭＮＩ試料にわたるその性能を示している。

方法

６８７人の前立腺がん患者由来の試料を、ＧｕａｒｄａｎｔＯＭＮＩＲＵＯ上で処理し（表３は、産物特色の一部を示す）、およそ４６００分子の独自のカバレッジの中央値を、２０，０００×の読み取り深度までシークエンシングした。体細胞および生殖系列のＳＮＶおよび小さいインデルを、Ｇｕａｒｄａｎｔバイオインフォマティクスパイプラインを使用してコールした（Helman et al., "Cell-Free DNA Next-Generation Sequencing Prediction of Response and Resistance to Third-Generation EGFR Inhibitor," Clin Lung Cancer, 19(6):518-530 (2018)）。新規ＨＲＤモジュールを開発して、病原性ＳＮＶ／インデルを注釈し、新規ＣＮＶ（Barbacioru et al., "Abstract 435: Cell-free circulating tumor DNA (ctDNA) detects somatic copy number loss in homologous recombination repair genes," Proceedings: AACR Annual Meeting 2019; March 29-April 3, 2019; Atlanta, GA）およびデノボ融合コーラー（Yablonovitch et al., "Identification of FGFR2/3 fusions from clinical cfDNA NGS using a de novo fusion caller," 2020 May. ASCO Poster）から構成される、構造的再編成、遺伝子－レベルホモ接合型欠失、ヘテロ接合性消失（ＬＯＨ）およびゲノムワイドなＬＯＨを同定した。ＬＯＨ欠失を、野生型アレルの喪失を考慮して予想されたアレル頻度に基づいて決定した（Barbacioru et al., "Abstract 435: Cell-free circulating tumor DNA (ctDNA) detects somatic copy number loss in homologous recombination repair genes," Proceedings: AACR Annual Meeting 2019; March 29-April 3, 2019; Atlanta, GA)。機能喪失型バリアントを、２４のＨＲＲ遺伝子：ＡＴＭ、ＡＴＲ、ＢＡＰ１、ＢＡＲＤ１、ＢＲＣＡ１、ＢＲＣＡ２、ＢＲＩＰ１、ＣＤＫ１２、ＣＨＥＫ１、ＣＨＥＫ２、ＦＡＮＣＡ、ＦＡＮＣＬ、ＨＤＡＣ２、ＭＲＥ１１、ＮＢＮ、ＰＡＬＢ２、ＲＡＤ５１、ＲＡＤ５０、ＲＡＤ５１Ｂ、ＲＡＤ５１Ｃ、ＲＡＤ５１Ｄ、ＲＡＤ５４Ｌ、ＸＲＣＣ２、ＸＲＣＣ３において分析した。

結果

ＨＲＲ遺伝子中の病原性変更が、ｃｔＤＮＡが検出された３００／６８７（４３．６％）の前立腺がん試料においてコールされた：全ての試料の２３％は、病原性体細胞または生殖系列のＳＮＶ／インデルを有し、７．８％は、ホモ接合型欠失を有し、３．０％は、ＨＲＲ遺伝子が関連する再編成を有した。ＳＮＶ／インデルの大多数は、組織と同様に、ＢＲＣＡ２（１５９全ての有害なＳＮＶ／インデルの３２％）およびＡＴＭ（３５％）中に存在したが（Dhawan et al., "DNA Repair Deficiency Is Common in Advanced Prostate Cancer: New Therapeutic Opportunities," Oncologist, 21(8):940-5 (2016)）、変異は、ＣＤＫ１２（１３％）、ＣＨＥＫ２（８％）およびＮＢＮ（６％）を含む、２１のさらなる遺伝子にわたっても存在した。生殖系列ＢＲＣＡ１／２ＳＮＶ／インデル、およびＬＯＨ検出に十分な腫瘍シェディング（最大ＭＡＦ＞２０％）を有する前立腺患者のうち、組織における８６％と比較して、６／１２（５０％）は、ＬＯＨもまた有した（Jonsson et al., "Tumour lineage shapes BRCA-mediated phenotypes," Nature, 571(7766):576-579 (2019)）。ホモ接合型欠失は、ＢＲＣＡ２（全ての試料の１２％）、ＡＴＭ（６％）およびＦＡＮＣＡ（５％）において富化された。融合およびマルチエクソン欠失を含む再編成は、検出された不活性化ＨＲＤ変異の６．５％を占めた。合計で、前立腺試料の６．８％が、ＳＮＶ、インデルまたは欠失が関与する両アレル性不活性化を有した。

表４は、ＧｕａｒｄａｎｔＯＭＮＩＲＵＯ性能測定基準をさらに要約する。特に、９５％ＬｏＤについて列挙された範囲（^＊で示される）は、それぞれ、臨床的にアクショナブルなバリアントおよび臨床的にアクショナブルでないバリアントを含む。９５％ＬｏＤについて列挙された範囲（^＊＊で示される）は、それぞれホモ接合型欠失およびヘテロ接合型欠失についてである。全ての測定基準は、以下でさらに議論されるｉｎ－ｓｉｌｉｃｏシミュレーションに基づいたＨＲＲ欠失を除いて、ｃｆＤＮＡの臨床試料を使用して３０ｎｇの投入物に基づいた。特異性は、正常試料の大きいコホートにわたる偽陰性バリアント検出に基づく。

図１５（パネルＡ～Ｃ）は、ＨＲＲ欠失および融合についてのＧｕａｒｄａｎｔＯＭＮＩＲＵＯの検出限界（ＬｏＤ）を示すデータのプロットである。より具体的には、ｉｎ－ｓｉｌｉｃｏシミュレーションにより、試料についてＢＲＣＡ２欠失を検出する際の９５％の感度が、ホモ接合型欠失について１２．５％の腫瘍割合（ＴＦ）（パネルＡ）、ＬＯＨについて２５％の腫瘍割合（ＴＦ）（パネルＢ）を示すことが実証された。欠失についてのＬｏＤは、接合性が確定的（ＤＥＴ）かつ不確定（ＩＮＤＥＴ）である場所に示される。既知の融合および長い欠失を含有する臨床的ｃｆＤＮＡを使用する実験を、プロビットモデルを使用して評価して、ＭＡＦ０．１５％の９５％ＬｏＤを決定した（パネルＣ）。

表５は、ＧｕａｒｄａｎｔＯＭＮＩＲＵＯ血漿を用いた組織中のＨＲＲ遺伝子変異保有率の比較を示す。示されるように、ＦＦＰＥ組織と比較して大きい割合の試料が、ＧｕａｒｄａｎｔＯＭＮＩＲＵＯにおいて報告可能な結果を有した（PROFOUND - FoundationOne (de Bono et al., "Olaparib for Metastatic Castration-Resistant Prostate Cancer," N Engl J Med., 382(22):2091-2102 (2020)）、ＴＯＰＡＲＰ－ＩｎｓｔｉｔｕｔｅｏｆＣａｎｃｅｒＲｅｓｅａｒｃｈ（Mateo et al., "Olaparib in patients with metastatic castration-resistant prostate cancer with DNA repair gene aberrations (TOPARP-B): a multicenter, open-label, randomized, phase 2 trial," Lancet Oncol., 21(1):162-174 (2020))）。^＊ＧｕａｒｄａｎｔＯＭＮＩＲＵＯアッセイへの投入物が、変動する投入体積（平均＝２．７８ｍＬ）を有する血漿であったことに留意されたい。より高い成功率が、１０ｍＬの全血の要件を考慮して、実験室診断試験（ＬａｂｏｒａｔｏｒｙＤｉａｇｎｏｓｔｉｃＴｅｓｔ）（ＬＤＴ）について予想された。ＦＡＣＦおよびＲＡＮＣＭ（^＊＊）を除き、強調された遺伝子は、ＧｕａｒｄａｎｔＯＭＮＩＲＵＯＨＲＲ遺伝子リスト（欠失および融合出力なし）上に現在存在しないが、ＯＭＮＩパネル上ではカバーされている遺伝子を示す。ＭＳＫＣＣ比較研究は、Jonsson et al., "Tumour lineage shapes BRCA-mediated phenotypes," Nature, 571(7766):576-579 (2019)に記載されている。

図１６は、前立腺がんコホートにおけるＨＲＲ変異のオンコプリントである。ホモ接合型遺伝子コピー数欠失のみが示される。

図１７（パネルＡ～Ｃ）は、前立腺コホートにおいて検出されたバリアントクラスごとのＨＲＲ変異の保有率のプロットである。パネルＡは、ＨＲＲ変異をバリアント型ごとに示し、図中、「欠失」は、接合性を決定するのに不十分なアレル情報を有する欠失を示す。パネルＢの左は、遺伝子および体細胞ステータスごとの有害なＳＮＶ／インデルを示す。臨床的前立腺コホートにおける低い保有率（３／１０００の試料）と一致して、復帰はこのコホートでは検出されなかった（データ示さず）。右は、融合および長い欠失を遺伝子ごとに示す。ＨＲＲの融合および長い欠失は、試料の３．２％（２１／６５４）において見出され、有害なＨＲＲＳＮＶ／インデルを有したものは存在しなかった。パネルＣは、エクソン２４～２６のＢＲＣＡ２欠失の例を示す。中央の黒い線は、不連続な軸を示し、下は、検出されたマルチエクソンの距離の表示を示す。

結論

この実施例は、前立腺がんコホートにおいて、ＧｕａｒｄａｎｔＯＭＮＩｃｔＤＮＡプロファイリングが、ＨＲＤに寄与する全てのクラスの変異をコールし、変更の相対的保有率が、組織におけるものと一致していることを実証している。ｃｆＤＮＡは、小さいバリアントを使用した２８％から完全なＨＲＤバイオマーカーセットを用いた４２％まで保有率を引き上げる、ＰＡＲＰまたはシスプラチン／白金療法から利益を得る可能性がある患者を同定するための代替法を提示する。

上または下で引用された全ての特許出願、ウェブサイト、他の刊行物、受託番号などは、各個々の項目がそのように参照により組み込まれると具体的かつ個々に示されるのと同程度まで、全ての目的のためにそれらの全体が参照により組み込まれる。異なる時点において異なるバージョンの配列が受託番号に関連付けられている場合、本出願の有効出願日の時点でその受託番号に関連付けられたバージョンを意味する。有効出願日とは、該当する場合、実際の出願日またはその受託番号に言及する優先出願の出願日のいずれか早い方を意味する。同様に、異なる時点において異なるバージョンの刊行物、ウェブサイトなどが公開されている場合、他が示されない限り、本出願の有効出願日の時点で一番最近公開されたバージョンを意味する。本開示の任意の特色、ステップ、要素、実施形態、または態様は、具体的に他が示されない限り、任意の他の特色、ステップ、要素、実施形態、または態様と組み合わせて使用され得る。本開示は、明確さおよび理解を目的として、例示および例を目的としていくらか詳細に記載されてきたが、ある特定の変化および改変が添付の特許請求の範囲内で実施され得ることは明らかである。

Claims

生体試料の配列データを決定するステップであって、前記生体試料が無細胞ＤＮＡ（ｃｆＤＮＡ）を含む、ステップ；
前記配列データに基づいて、カバレッジデータを決定するステップ；
前記カバレッジデータに基づいて、１つまたは複数の融合事象に関連する１つまたは複数の切断点を決定するステップ；
前記カバレッジデータに基づいて、１つまたは複数の遺伝子に関連する１つまたは複数の欠失を決定するステップ；
前記１つまたは複数の切断点および前記１つまたは複数の欠失に基づいて、相同組換え欠損（ＨＲＤ）スコアを決定するステップ；および
前記ＨＲＤスコアに基づいて、前記生体試料をＨＲＤ陽性として分類するステップ
を含む方法。
前記生体試料の配列データを決定するステップが、１つまたは複数のＨＲＲ遺伝子のパネルをシークエンシングすることを含む、請求項１に記載の方法。
前記１つまたは複数のＨＲＲ遺伝子が、ＡＴＭ、ＡＴＲ、ＢＡＲＤ１、ＢＲＣＡ１、ＢＲＣＡ２、ＢＲＩＰ１、ＣＤＫ１２、ＣＨＥＫ１、ＣＨＥＫ２、ＦＡＮＣＡ、ＦＡＮＣＬ、ＮＢＮ、ＰＡＬＢ２、ＲＡＤ５１、ＲＡＤ５１Ｂ、ＲＡＤ５１Ｃ、ＲＡＤ５１Ｄ、ＲＡＤ５４Ｌ、ＨＤＡＣ２、ＭＲＥ１１、ＰＰＰ２Ｒ２Ａ、ＸＲＣＣ５、ＷＲＮ、ＭＬＨ１、ＦＡＮＣＣ、ＢＡＰ１、ＸＲＣＣ２、ＸＲＣＣ３、およびＲＡＤ５０からなる群から選択される、請求項２に記載の方法。
前記生体試料が、疾患を有する対象に関連付けられる、前記請求項いずれか一項に記載の方法。
前記疾患が、がんである、請求項４に記載の方法。
前記カバレッジデータが、複数のビンに関連付けられ、前記複数のビンが、染色体の領域を表す、前記請求項いずれか一項に記載の方法。
前記カバレッジデータに基づいて、１つまたは複数の融合事象に関連する１つまたは複数の切断点を決定するステップが、
前記配列データからの複数の配列リードを参照配列にアラインすること；
複数の配列リードについての前記複数の配列リードの前記参照配列へのアラインメントで１つまたは複数の切断点を決定すること；
前記アラインメントで前記１つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること；
１つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること；
１つまたは複数の共通の切断点に基づいて前記候補融合配列リードを群別化すること；
群内の前記候補融合配列リードをアセンブルして１つまたは複数のコンティグを生成すること；
複数の群のうちの前記群からの前記コンティグを前記参照配列にアラインすること；
前記群からの前記コンティグの前記アラインメントに基づいて、１つまたは複数の候補融合事象を決定すること；
前記１つまたは複数の候補融合事象に１つまたは複数の基準を適用すること；および
前記１つまたは複数の候補融合事象への前記１つまたは複数の基準の適用に基づいて、１つまたは複数の融合事象を決定すること
を含む、前記請求項いずれか一項に記載の方法。
前記カバレッジデータに基づいて、１つまたは複数の遺伝子に関連する前記１つまたは複数の欠失を決定するステップが、前記カバレッジデータに基づいて、複数のセグメントを決定することを含み、前記複数のセグメントが、変化点により分離されている、前記請求項いずれか一項に記載の方法。
前記複数のセグメントを決定することが、セグメンテーションアルゴリズムを適用することを含む、請求項８に記載の方法。
前記セグメンテーションアルゴリズムが、循環バイナリセグメンテーションアルゴリズムを含む、請求項９に記載の方法。
前記変化点が、基礎ＤＮＡコピー数が変化したことを前記カバレッジデータが示す位置に対応する、請求項８に記載の方法。
前記１つまたは複数の欠失が、ホモ接合型欠失またはヘテロ接合性消失（ＬＯＨ）欠失の１つまたは複数を含む、前記請求項いずれか一項に記載の方法。
前記複数のセグメントを参照配列と比較して、少なくとも１つの欠失を含む前記複数のセグメントのサブセットを同定するステップ；
前記複数のセグメントの前記サブセットから、染色体の長さにわたる任意のセグメントを除去するステップ；
前記複数のセグメントの前記サブセットの中の、閾値距離以上離れていない任意のセグメントを組み合わせるステップ；
前記複数のセグメントの前記サブセットから、閾値長未満の長さを有する任意のセグメントを除去するステップ；および
前記複数のセグメントの前記サブセットから、技術的アーチファクトに関連する任意のセグメントを除去するステップ
をさらに含む、請求項８に記載の方法。
前記複数のセグメントの前記サブセットの中の１つまたは複数の残存セグメントに基づいて、および前記１つまたは複数の融合事象に関連する前記１つまたは複数の切断点に基づいて、閾値内の隣接しているセグメント間の切断点の数を決定するステップをさらに含む、請求項１３に記載の方法。
前記複数のセグメントの前記サブセットの中の１つまたは複数の残存セグメントに基づいて、欠失される目的の領域の単一のコピーに関連する、または目的の領域の両方のコピーに関連する、セグメントの数を決定するステップをさらに含む、請求項１３に記載の方法。
前記１つまたは複数の切断点および前記１つまたは複数の欠失に基づいて、前記ＨＲＤスコアを決定するステップが、切断点の数およびセグメントの数を合計することを含む、請求項８に記載の方法。
前記シークエンシングデータに基づいて、１つまたは複数のゲノム再編成の存在を決定するステップをさらに含む、前記請求項いずれか一項に記載の方法。
前記ＨＲＤスコアを決定するステップが、前記１つまたは複数のゲノム再編成にさらに基づく、請求項１７に記載の方法。
前記ＨＲＤスコアを決定するステップが、切断点の数、セグメントの数、およびゲノム再編成の数を合計することを含む、請求項１７に記載の方法。
最大体細胞アレル割合（ＭＳＡＦ）を決定するステップをさらに含む、前記請求項いずれか一項に記載の方法。
前記ＭＳＡＦを決定するステップが、クローン性造血起源と注釈されない任意の体細胞バリアントであって、融合または非同義ＳＮＶまたはインデルである任意の体細胞バリアントを含む、前記生体試料中のバリアントの最大パーセンテージを、前記配列データに基づいて決定することをさらに含む、請求項２０に記載の方法。
前記配列データに含有されている１つまたは複数のバリアントを注釈するステップをさらに含む、前記請求項いずれか一項に記載の方法。
前記配列データに含有されている１つまたは複数のバリアントを注釈するステップが、ヒトの健康への前記１つまたは複数のバリアントの影響に関連する臨床的有意性の注釈を決定することを含む、請求項２２に記載の方法。
前記配列データ、前記カバレッジデータ、前記１つまたは複数の切断点、前記１つまたは複数の欠失、および前記ＨＲＤスコアを集約するステップをさらに含む、前記請求項いずれか一項に記載の方法。
集約された配列データ、カバレッジデータ、１つまたは複数の切断点、１つまたは複数の欠失、およびＨＲＤスコアを出力するステップをさらに含む、請求項２４に記載の方法。
前記ＨＲＤスコアに基づいて、前記生体試料をＨＲＤ陽性として分類するステップが、前記ＨＲＤスコアが閾値を超えると決定することを含む、前記請求項いずれか一項に記載の方法。
１つまたは複数の参照ＨＲＤスコアに基づいて前記閾値を決定することをさらに含む、請求項２６に記載の方法。
前記生体試料をＨＲＤ陽性として分類するステップに基づいて、療法を投与するステップをさらに含む、前記請求項いずれか一項に記載の方法。
前記療法が、ポリＡＤＰリボースポリメラーゼ（ＰＡＲＰ）阻害剤または塩基除去修復（ＢＥＲ）阻害剤である、請求項２８に記載の方法。
前記ＰＡＲＰ阻害剤が、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、ＣＥＰ９７２２、Ｅ７０１６、Ｅ７４４９、または３－アミノベンズアミドのうちの少なくとも１つである、請求項２９に記載の方法。
前記療法が、ＰＡＲＰ阻害剤と放射線療法の組合せである、請求項２８に記載の方法。
コンピュータを少なくとも部分的に使用して相同組換え修復欠損（ＨＲＤ）スコアを生成する方法であって、
１つまたは複数のがん型を有する１または複数の参照対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からの相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子についての参照ＨＲＤスコアを前記コンピュータにより生成して、参照ＨＲＤスコアのセットを生じさせるステップであって、所与の参照ＨＲＤスコアが、所与のＨＲＤ核酸バリアントの保有率を含む、ステップ；および
参照ＨＲＤスコアの前記セットから参照ＨＲＤスコアを生成するステップ
を含む方法。
前記１つまたは複数のがん型を有する試験対象から得られたｃｆＤＮＡに由来する配列情報からのＨＲＲ遺伝子の前記セットの中の前記１つまたは複数の遺伝子についての試験ＨＲＤスコアを生成して、試験ＨＲＤスコアのセットを生じさせるステップであって、所与の試験ＨＲＤスコアが、前記所与のＨＲＤ核酸バリアントの保有率を含む、ステップ；
試験ＨＲＤスコアの前記セットから試験ＨＲＤスコアを生成するステップ；および
前記試験ＨＲＤスコアが前記参照ＨＲＤスコアを超えた場合に前記試験対象におけるＨＲＤを検出するステップ
をさらに含む、請求項３２に記載の方法。
コンピュータを少なくとも部分的に使用して１つまたは複数のがん型を有する試験対象の相同組換え修復欠損（ＨＲＤ）ステータスを決定する方法であって、
前記試験対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からの相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子についての試験ＨＲＤスコアを生成して、試験ＨＲＤスコアのセットを生じさせるステップであって、所与の試験ＨＲＤスコアが、所与のＨＲＤ核酸バリアントの保有率を含む、ステップ；
試験ＨＲＤスコアの前記セットから試験ＨＲＤスコアを生成するステップ；および
前記試験ＨＲＤスコアを参照ＨＲＤスコアと比較するステップであって、前記参照ＨＲＤスコアより上である試験ＨＲＤスコアが、それらの試験ＨＲＤスコアがＨＲＤを有する試験対象からのものであることを示し、前記参照ＨＲＤスコアであるかまたはそれ未満である試験ＨＲＤスコアが、それらの試験ＨＲＤスコアがＨＲＤを欠いている試験対象からのものであることを示し、それによって、前記１つまたは複数のがん型を有する前記試験対象の前記ＨＲＤステータスを決定する、ステップ
を含む方法。
１つまたは複数のがん型を有する１または複数の参照対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する配列情報からの相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子についての参照ＨＲＤスコアを前記コンピュータにより生成して、参照ＨＲＤスコアのセットを生じさせるステップであって、所与の参照ＨＲＤスコアが、所与のＨＲＤ核酸バリアントの保有率を含む、ステップ；および
参照ＨＲＤスコアの前記セットから参照ＨＲＤスコアを生成するステップ
をさらに含む、請求項３４に記載の方法。
コンピュータを少なくとも部分的に使用して対象における相同組換え修復欠損（ＨＲＤ）の存在または非存在を検出する方法であって、前記対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子に関連する配列情報における少なくとも１つのＨＲＤ核酸バリアントの存在または非存在を、（ｉ）前記配列情報が第１の状態を含む第１の確率、および前記配列情報が第２の状態を含む第２の確率であって、前記第１または第２の状態が少なくとも第１のＨＲＤ核酸バリアントを含む、第１の確率および第２の確率、ならびに／または（ｉｉ）前記配列情報から生成された１つまたは複数のアラインされた連続する配列（コンティグ）であって、少なくとも第２のＨＲＤ核酸バリアントを含む前記アラインされたコンティグを使用して、前記コンピュータにより決定することによって、前記対象における前記ＨＲＤを検出するステップを含む、方法。
疾患を処置する方法であって、前記疾患、および前記疾患に関連する相同組換え修復欠損（ＨＲＤ）を有する対象に、１つまたは複数の療法を投与するステップを含み、前記対象から得られた無細胞核酸（ｃｆＤＮＡ）に由来する相同組換え修復（ＨＲＲ）遺伝子のセットの中の１つまたは複数の遺伝子に関連する配列情報における少なくとも１つのＨＲＤ核酸バリアントの存在または非存在を、（ｉ）前記配列情報が第１の状態を含む第１の確率、および前記配列情報が第２の状態を含む第２の確率であって、前記第１または第２の状態が少なくとも第１のＨＲＤ核酸バリアントを含む、第１の確率および第２の確率、ならびに／または（ｉｉ）前記配列情報から生成された１つまたは複数のアラインされた連続する配列（コンティグ）であって、少なくとも第２のＨＲＤ核酸バリアントを含む前記アラインされたコンティグを使用して決定することにより、ＨＲＤが検出され、それによって前記疾患を処置する方法。
前記第１のＨＲＤ核酸バリアントが、少なくとも１つのホモ接合型欠失、少なくとも１つのヘテロ接合性消失（ＬＯＨ）バリアントおよび／または少なくとも１つのコピー数多様性（ＣＮＶ）を含む、前記請求項いずれか一項に記載の方法。
前記ＬＯＨバリアントが、少なくとも１つの遺伝子特異的ＬＯＨバリアント、コピー数変化を伴わない少なくとも１つのＬＯＨバリアント、および／または少なくとも１つのＬＯＨバリアントを含む、請求項３８に記載の方法。
前記第２のＨＲＤ核酸バリアントが、少なくとも１つの構造的再編成を含む、前記請求項いずれか一項に記載の方法。
前記構造的再編成が、少なくとも１つの短縮再編成および／または少なくとも１つのマルチエクソン欠失を含む、請求項４０に記載の方法。
前記第１および／または第２のＨＲＤ核酸バリアントが、少なくとも１つの一塩基多様性（ＳＮＶ）および／または少なくとも１つのインデルを含む、前記請求項いずれか一項に記載の方法。
ステップ（ｉ）および／または（ｉｉ）の技法が、前記配列情報のセグメントを少なくとも１つの参照配列にアラインすることを少なくとも含む、前記請求項いずれか一項に記載の方法。
ステップ（ｉ）～（ｉｉ）の１つだけを使用することを含む、前記請求項いずれか一項に記載の方法。
ステップ（ｉ）～（ｉｉ）の各々を使用することを含む、前記請求項いずれか一項に記載の方法。
少なくとも１つの相同組換え修復（ＨＲＲ）遺伝子が、前記ＨＲＤ核酸バリアントを含む、前記請求項いずれか一項に記載の方法。
前記ＨＲＲ遺伝子が、ＡＴＭ、ＡＴＲ、ＢＡＲＤ１、ＢＲＣＡ１、ＢＲＣＡ２、ＢＲＩＰ１、ＣＤＫ１２、ＣＨＥＫ１、ＣＨＥＫ２、ＦＡＮＣＡ、ＦＡＮＣＬ、ＮＢＮ、ＰＡＬＢ２、ＲＡＤ５１、ＲＡＤ５１Ｂ、ＲＡＤ５１Ｃ、ＲＡＤ５１Ｄ、ＲＡＤ５４Ｌ、ＨＤＡＣ２、ＭＲＥ１１、ＰＰＰ２Ｒ２Ａ、ＸＲＣＣ５、ＷＲＮ、ＭＬＨ１、ＦＡＮＣＣ、ＢＡＰ１、ＸＲＣＣ２、ＸＲＣＣ３、およびＲＡＤ５０からなる群から選択される、請求項４６に記載の方法。
ＨＲＲ遺伝子の前記セットが、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、またはそれより多くの遺伝子を含む、前記請求項いずれか一項に記載の方法。
前記ＨＲＤ核酸バリアントの１つまたは複数が、所与のＨＲＲ遺伝子の両アレル性不活性化を生じさせる、前記請求項いずれか一項に記載の方法。
前記ＨＲＤ核酸バリアントの１つまたは複数が、所与のＨＲＲ遺伝子の片アレル性不活性化を生じさせる、前記請求項いずれか一項に記載の方法。
前記ＨＲＤ核酸バリアントが、疾患を有する前記対象と相関する、前記請求項いずれか一項に記載の方法。
前記対象が、疾患を有することが分かっていない、前記請求項いずれか一項に記載の方法。
前記対象が、疾患を有することが分かっている、前記請求項いずれか一項に記載の方法。
前記疾患が、がんである、前記請求項いずれか一項に記載の方法。
前記疾患を処置するために前記対象に１つまたは複数の療法を投与するステップを含む、前記請求項いずれか一項に記載の方法。
前記療法が、少なくとも１つのポリＡＤＰリボースポリメラーゼ（ＰＡＲＰ）阻害剤を含む、前記請求項いずれか一項に記載の方法。
前記療法が、少なくとも１つの塩基除去修復（ＢＥＲ）阻害剤を含む、前記請求項いずれか一項に記載の方法。
ステップ（ｉ）が、
前記配列情報が前記第１の状態を含む前記第１の確率を生成すること；
前記配列情報が前記第２の状態を含む前記第２の確率を生成すること；
前記第１の確率と前記第２の確率を比較すること；および
前記比較に基づいて、前記配列情報が、前記第１の状態を含むのか、または前記第２の状態を含むのかについての予測を生成すること
を含む、前記請求項いずれか一項に記載の方法。
ステップ（ｉ）が、
前記配列情報における少なくとも１つの遺伝子座位に関連する１つまたは複数の生殖細胞系列一塩基多型（ＳＮＰ）位置に基づくアレル計数値の第１のモデルであって、少なくとも１つの体細胞ホモ接合型欠失を表す第１のモデルを、第１の確率分布によって生成すること；
前記配列情報における前記遺伝子座位に関連する前記１つまたは複数の生殖細胞系列ＳＮＰ位置に基づくアレル計数値の第２のモデルであって、少なくとも１つの体細胞ヘテロ接合型欠失を表す第２のモデルを、第２の確率分布によって生成すること；
前記第１のモデルの第１の出力データと前記第２のモデルの第２の出力データを比較すること；および
前記比較に基づいて、前記遺伝子座位についての前記体細胞ホモ接合型欠失が前記配列情報に存在するという予測を生成すること
を含む、前記請求項いずれか一項に記載の方法。
ステップ（ｉ）が、
前記配列情報が体細胞ホモ接合型欠失を含む前記第１の確率を生成すること；
前記配列情報が体細胞ヘテロ接合型欠失を含む前記第２の確率を生成すること；
前記第１の確率と前記第２の確率を比較すること；および
前記比較に基づいて、前記配列情報が、前記体細胞ホモ接合型欠失を含むのか、または前記体細胞ヘテロ接合型欠失を含むのかについての予測を生成すること
を含む、前記請求項いずれか一項に記載の方法。
ステップ（ｉｉ）が、
複数の配列リードを参照配列にアラインすること；
前記複数の配列リードの少なくとも１つの配列リードの前記参照配列へアラインメントで１つまたは複数の切断点を決定すること；
前記アラインメントで前記１つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること；
１つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること；
１つまたは複数の共通の切断点に基づいて前記候補融合配列リードを群別化すること；
各群内の前記候補融合配列リードをアセンブルして１つまたは複数のコンティグを生成すること；
各群からの前記コンティグを参照配列にアラインすること；
各群からの前記コンティグの前記アラインメントに基づいて、１つまたは複数の候補融合事象を決定すること；
前記１つまたは複数の候補融合事象に１つまたは複数の基準を適用すること；および
前記１つまたは複数の候補融合事象への前記１つまたは複数の基準の適用に基づいて、前記第２のＨＲＤ核酸バリアントを含む１つまたは複数の融合事象を決定すること
を含む、前記請求項いずれか一項に記載の方法。
ＣＮＶおよび／またはデノボ融合コーラーを使用して前記ＨＲＤ、または前記対象における前記ＨＲＤを検出するステップを含む、前記請求項いずれか一項に記載の方法。
遺伝子が、前記ＨＲＤ核酸バリアントを含む、前記請求項いずれか一項に記載の方法。
プロセッサーによる実行時に請求項１から３１のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、１つまたは複数の非一時的なコンピュータ可読媒体。
請求項１から３１のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記ＨＲＤスコアを出力するように構成された出力デバイスと
を含むシステム。
１または複数台のプロセッサーと、
前記１または複数台のプロセッサーによる実行時に請求項１から３１のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。
プロセッサーによる実行時に請求項３２から３３または３８から６３のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、１つまたは複数の非一時的なコンピュータ可読媒体。
請求項３２から３３または３８から６３のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記参照ＨＲＤスコアを出力するように構成された出力デバイスと
を含むシステム。
１または複数台のプロセッサーと、
前記１または複数台のプロセッサーによる実行時に請求項３２から３３または３８から６３のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。
プロセッサーによる実行時に請求項３４から３５または３８から６３のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、１つまたは複数の非一時的なコンピュータ可読媒体。
請求項３４から３５または３８から６３のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記試験対象の前記ＨＲＤステータスを出力するように構成された出力デバイスと
を含むシステム。
１または複数台のプロセッサーと、
前記１または複数台のプロセッサーによる実行時に請求項３４から３５または３８から６３のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。
プロセッサーによる実行時に請求項３６または３８から６３のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、１つまたは複数の非一時的なコンピュータ可読媒体。
請求項３６または３８から６３のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記対象におけるＨＲＤの存在または非存在についての表示を出力するように構成された出力デバイスと
を含むシステム。
１または複数台のプロセッサーと、
前記１または複数台のプロセッサーによる実行時に請求項３６または３８から６３のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。