JP2024015059A

JP2024015059A - セルフリー核酸の細胞起源を決定するための方法およびシステム

Info

Publication number: JP2024015059A
Application number: JP2023199814A
Authority: JP
Inventors: ジャイモビッチアリエル; Jaimovich Ariel; ケネディアンドリュー; Kennedy Andrew; アイ．オーデガードジャスティン; I Odegaard Justin
Original assignee: Guardant Health Inc
Current assignee: Guardant Health Inc
Priority date: 2018-06-04
Filing date: 2023-11-27
Publication date: 2024-02-01
Also published as: EP3802878A1; US20190385700A1; JP2021526791A; WO2019236478A1

Abstract

【課題】液体の生検サンプルなどのセルフリー核酸（ｃｆＮＡ）サンプル由来のｃｆＮＡフラグメントの細胞起源を決定する際に有用な方法を提供すること。【解決手段】本明細書中に開示される方法は、通常、ある特定の実施形態において造血幹細胞などの非標的細胞によって生成されるバリアントアレルを識別することによってｃｆＮＡサンプル中の罹患細胞核酸（例えば、癌細胞ＤＮＡ）を検出するためのアッセイの特異度および／または感度を改善する。なおも他の態様は、とりわけ、関連するシステムおよびコンピュータ可読媒体を含む。【選択図】なし

Description

背景
ポリヌクレオチドの検出および定量は、分子生物学、および診断法などの医学的応用にとって重要である。遺伝子検査は、いくつかの診断方法にとって特に有用である。例えば、稀な遺伝子変化（ｇｅｎｅｔｉｃａｌｔｅｒａｔｉｏｎｓ）（例えば、配列バリアント）またはエピジェネティックマーカーの変化（ｃｈａｎｇｅｓ）（例えば、癌および部分異数性または完全異数性）が原因の障害は、ＤＮＡ配列情報によって検出され得るか、またはＤＮＡ配列情報によってより正確に特徴付けられ得る。

癌などの遺伝性疾患の早期の検出およびモニタリングは、処置の成功または疾患の管理に必要であることが多い。アプローチの１つとしては、種々のタイプの体液中に見られ得るポリヌクレオチド集団であるセルフリー核酸に由来するサンプルをモニタリングすることが挙げられ得る。いくつかの場合において、疾患は、遺伝子異常（例えば、１つまたはそれを超える核酸配列のコピー数バリエーションおよび／または配列バリエーション）の検出または他の遺伝子変化の発生の検出に基づいて特徴付けられ得るか、または検出され得る。セルフリーＤＮＡ（ｃｆＤＮＡ）は、特定の疾患に関連する遺伝子異常を含み得る。
しかしながら、血液中に存在するＣｆＤＮＡは、いくつかの細胞起源、癌性細胞と非癌性細胞の両方を起源とし得る。問題になり得るセルフリーＤＮＡの起源の１つは、造血幹細胞であり、この細胞における変異は、血液細胞のクローン集団を拡大させ得る。他の血液悪性腫瘍の徴候無くクローン性増殖を推進するそのような体細胞変異の獲得は、「未確定の潜在能をもつクローン性造血（ＣＨＩＰ）」に由来する細胞と称される。Ｓｔｅｅｎｓｍａら、Ｂｌｏｏｄ，１２６：９－１６（２０１５）を参照のこと。７０歳を超える高齢者集団の少なくとも１０％が、変異した造血幹細胞のオリゴクローン性増殖に起因するＣＨＩＰを有する。Ｊａｉｓｗａｌら、Ｎ．Ｅｎｇｌ．Ｊ．Ｍｅｄ．，３７１（２６）：２４８８－２４９８（２０１４）を参照のこと。造血幹細胞は、その造血幹細胞が非癌性であったとしても、癌に関連するゲノム領域に遺伝的バリアントを含み得る。したがって、造血幹細胞において優勢に存在するが癌細胞には存在しない、サンプリングされたｃｆＤＮＡ集団に寄与するアレルを識別することは興味深い。

Ｓｔｅｅｎｓｍａら、Ｂｌｏｏｄ，１２６：９－１６（２０１５）Ｊａｉｓｗａｌら、Ｎ．Ｅｎｇｌ．Ｊ．Ｍｅｄ．，３７１（２６）：２４８８－２４９８（２０１４）

要旨
本開示は、液体生検サンプルなどのセルフリー核酸（ｃｆＮＡ）サンプル由来のｃｆＮＡフラグメントの細胞起源を決定することにおいて有用な方法、コンピュータ可読媒体およびシステムを提供する。これらの態様は、ある特定の実施形態では、造血幹細胞などの非標的細胞によって生成されたバリアントアレルを識別することによって、通常、ｃｆＮＡサンプル中の罹患細胞核酸（例えば、癌細胞ＤＮＡ）を検出するためのアッセイの特異度および／または感度を改善する。さらに、本明細書中に開示される方法は、初期癌の腫瘍由来核酸の場合など、ｃｆＮＡサンプル中に非常に少量で存在することが多い核酸の細胞起源の識別を容易にする。したがって、本明細書中に開示される方法および関連する態様は、他の数多くの用途のなかでも、疾患の早期の検出を促す。

１つの態様において、本開示は、少なくとも部分的にコンピュータを使用して、被験体内の標的細胞を起源とする核酸分子を検出する方法を提供する。この方法は、（ａ）被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報をコンピュータによって受信する工程を含む。この方法は、（ｂ）標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが試験配列情報に存在することを識別する工程も含む。その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それによって、その被験体内の標的細胞を起源とする核酸分子を検出する。いくつかの実施形態において、例えば、（ｂ）は、試験配列情報における少なくとも１つのアレルバリアントを識別すること；そのアレルバリアントを標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルにマッピングすること；その分類アレルのサブクローナリティスコアを識別すること；およびそのサブクローナリティスコアを少なくとも１つの選択されたカットオフ閾値と比較することを含み、ここで、そのサブクローナリティスコアが、選択されたカットオフ閾値未満であるとき、それは、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示す。

１つの態様において、本開示は、少なくとも部分的にコンピュータを使用して、被験体内の腫瘍細胞を起源とする核酸分子を検出する方法を提供する。その方法は、（ａ）被験体から得られた試験サンプル中のセルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントから得られた配列リードを含む試験配列情報をコンピュータによって受信する工程を含む。その方法は、（ｂ）コンピュータによって、被験体の造血幹細胞を起源とする１つまたはそれを超える上記配列リード（例えば、分類アレルの少なくとも一部を含む）を試験配列情報から除去（例えば、削除、非表示、無視など）して、フィルターされた試験配列情報を生成する工程も含む。さらに、その方法は、（ｃ）１またはそれを超える参照被験体から得られた参照配列情報と実質的にアラインメントする上記フィルターされた試験配列情報に１つまたはそれを超える上記配列リードが存在することをコンピュータによって識別する工程であって、その参照配列情報は、参照被験体内の１つまたはそれを超える腫瘍細胞を起源とし、それによって、その被験体内の腫瘍細胞を起源とする核酸分子を検出する、工程も含む。

１つの態様において、本開示は、被験体における疾患を処置する方法を提供する。その方法は、（ａ）被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信する工程を含む。その方法は、（ｂ）標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが試験配列情報に存在することを識別する工程も含む。その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、その分類アレルが、罹患細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それによって、その被験体の疾患が診断される。さらに、その方法は、（ｃ）被験体に１つまたはそれを超える療法を施し、それによって、その被験体の疾患を処置する工程も含む。

別の態様において、本開示は、少なくとも部分的にコンピュータを使用して、分類器またはその少なくとも一部を生成する方法を提供する。その方法は、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアを、コンピュータによって生成する工程を含み、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む。その方法は、（ｂ）上記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値をコンピュータによって比較する工程であっ、ここで、その選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられ、それによって、分類器を生成する工程も含む。

別の態様において、本開示は、少なくとも部分的にコンピュータを使用して、分類器またはその少なくとも一部を生成する方法を提供する。その方法は、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットをコンピュータによって識別する工程を含み、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む。その方法は、（ｂ）上記配列情報から、参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値をコンピュータによって決定する工程、および（ｃ）参照サンプルの各々に対して最大マイナーアレル頻度（ｍａｘＭＡＦ）の値をコンピュータによって決定する工程も含む。その方法は、（ｄ）所与の参照サンプルにおいて観察された各分類アレルについて、参照サンプルの少なくとも一部に対するｍａｘＭＡＦの値に対する上記ＭＡＦの値の比をコンピュータによって計算して、比の値を生成する工程も含む。その方法は、（ｅ）参照サンプルの少なくとも一部における所与の分類アレルが、参照サンプルの少なくとも一部に出現したその所与の分類アレルの回数の合計数に対する、なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、前記分類アレルの各々について、コンピュータによって計算して、参照サンプルの少なくとも一部における前記分類アレルの各々に対するサブクローナリティスコアを生成する工程も含む。さらに、その方法は、（ｆ）上記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値をコンピュータによって比較する工程であって、ここで、その選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられ、それによって、分類器を生成する工程も含む。

別の態様において、本開示は、被験体から得られた試験サンプル中のセルフリー核酸（ｃｆＮＡ）フラグメントの細胞起源を分類する際に使用するサブクローナリティスコアのデータベースを作成する方法を提供する。その方法は、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットをコンピュータによって識別する工程を含み、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む。その方法は、（ｂ）上記配列情報から、参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値をコンピュータによって決定する工程、ｃ）参照サンプルの各々について、最大マイナーアレル頻度（ｍａｘＭＡＦ）の値をコンピュータによって決定する工程、および（ｄ）所与の参照サンプルにおいて観察された各分類アレルについて、参照サンプルの少なくとも一部に対するｍａｘＭＡＦの値に対する上記ＭＡＦの値の比をコンピュータによって計算して、比の値を生成する工程も含む。その方法は、（ｅ）参照サンプルの少なくとも一部における所与の分類アレルが、参照サンプルの少なくとも一部に出現したその所与の分類アレルの回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、上記分類アレルの各々について、コンピュータによって計算して、参照サンプルの少なくとも一部における上記分類アレルの各々に対するサブクローナリティスコアを生成する工程も含む。さらに、その方法は、（ｆ）対応する分類アレルにインデックスされたサブクローナリティスコアをデータベースシステムに非一時的に保存し、それによって、被験体から得られた試験サンプル中のｃｆＮＡフラグメントの細胞起源を分類する際に使用するサブクローナリティスコアのデータベースを作成する工程も含む。

いくつかの実施形態において、本明細書中に開示される方法は、上記分類アレルセットを識別する工程を含み、その工程は、参照サンプルから得られた配列情報から、潜在的に臨床的に有意な標的ゲノム遺伝子座セット内の各遺伝子座における各体細胞性核酸バリアントに対するＭＡＦの値を決定する工程であって、ここで、その標的ゲノム遺伝子座セットは、各参照サンプルにおいて同一である工程、および参照サンプルの各々についてｍａｘＭＡＦの値を決定してアレル情報を生成する工程を含む。ある特定の実施形態において、各分類アレルに対するＭＡＦは、約２％未満である。いくつかの実施形態において、各分類アレルに対するＭＡＦは、約１％未満である。

ある特定の実施形態において、本明細書中に開示される方法は、参照サンプルにインデックスされた臨床情報を用いて、分類器を生成する工程を含む。いくつかの実施形態において、本明細書中に開示される方法は、試験サンプルにインデックスされた臨床情報を用いて、被験体内の標的細胞を起源とする核酸分子を検出する工程を含む。ある特定の実施形態において、その臨床情報は、年齢、性別、人種、体重、ボディマス指数（ＢＭＩ）、病歴、喫煙、飲酒などからなる群より選択される。他の例示的な実施形態では、サンプルの種々のサブセットに対して、例えば最小ｍａｘＭＡＦに基づいて、サブクローナルリスト（例えば、標的核酸バリアントフィルターリストまたは非標的核酸バリアントフィルターリスト）が生成され、公知のドライバー変異などに基づいて、ｍａｘＭＡＦがコールされる。いくつかの実施形態では、特定の指摘（例えば、所与の癌のタイプ（例えば、肺、結腸直腸など））に基づいて、サブクローナルリストが生成される。ある特定の実施形態において、機械学習分類器は、変異アレル頻度、サブクローン比、遺伝子のタイプ、血液悪性腫瘍に関連するバリアント、患者の年齢、他のＣＨＩＰバリアントの観察結果、癌のタイプなどを含む１つまたはそれを超える特徴量に基づいて訓練される。

いくつかの実施形態において、本明細書中に開示される方法は、上記分類アレルの各々に対する各ＭＡＦ／ｍａｘＭＡＦ値の頻度を用いて、サブクローナリティスコアを決定する工程を含む。ある特定の実施形態において、選択されたクローナリティ境界値は、約１％～約９９％の範囲内である。これらの実施形態のうちのいくつかにおいて、例えば、選択されたクローナリティ境界値は、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％または約９０％である。いくつかの実施形態において、選択されたカットオフ閾値は、約１％～約９９％の範囲内である。これらの実施形態のうちのいくつかにおいて、例えば、選択されたカットオフ閾値は、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％または約９０％である。

ある特定の実施形態において、本明細書中に開示される方法は、上記サブクローナリティスコアを複数の選択されたカットオフ閾値と比較する工程を含む。これらの実施形態のうちのいくつかにおいて、例えば、複数の選択されたカットオフ閾値は、第１のカットオフ閾値および第２のカットオフ閾値を含み、その第１のカットオフ閾値は、第２のカットオフ閾値より大きく、第１のカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または第２のカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる。

いくつかの実施形態において、本明細書中に開示される方法は、非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、試験配列情報におけるアレルバリアントが、約１％を超えるＭＡＦを含むとき、そのアレルバリアントを、標的細胞を起源とすると分類する工程を含む。ある特定の実施形態において、本明細書中に開示される方法は、非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、試験配列情報におけるアレルバリアントが、トランケーション、インデルおよび／またはスプライス部位バリアントを含むとき、そのアレルバリアントを、標的細胞を起源とすると分類する工程を含む。

ある特定の実施形態において、本明細書中に開示される方法は、参照サンプルの少なくとも一部における所与の分類アレルに対する各比の値の頻度を決定する工程を含む。いくつかの実施形態において、本明細書中に開示される方法は、上記分類器を用いて、被験体から得られた試験サンプルが、前記標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定する工程を含む。ある特定の実施形態において、本明細書中に開示される方法は、上記分類器を用いて、被験体から得られた試験サンプルが、非標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定する工程を含む。いくつかの実施形態において、データベースは、標的核酸バリアントフィルターリストおよび／または非標的核酸バリアントフィルターリストを含む。

ある特定の実施形態において、非標的細胞は、非罹患細胞を含む。いくつかの実施形態において、非標的細胞は、造血幹細胞を含む。ある特定の実施形態において、非標的細胞は、非腫瘍細胞を含む。いくつかの実施形態において、非標的細胞は、母体細胞を含む。ある特定の実施形態において、非標的細胞は、移植レシピエント細胞を含む。

ある特定の実施形態において、標的細胞は、罹患細胞を含む。いくつかの実施形態において、標的細胞は、腫瘍細胞を含む。いくつかの実施形態において、標的細胞は、胎児細胞を含む。ある特定の実施形態において、標的細胞は、移植ドナー細胞を含む。

ある特定の実施形態において、本明細書中に開示される方法は、疾患を処置する工程を含む。これらの実施形態のうちのいくつかにおいて、例えば、その疾患は、癌を含み、その療法は、少なくとも１つの免疫療法を含む。通常、被験体は、哺乳動物被験体（例えば、ヒト被験体）である。

いくつかの実施形態において、本明細書中に開示される方法は、被験体から試験サンプルを得る工程をさらに含む。その試験サンプルは、通常、血液、血漿、血清、痰、尿、精液、膣液、便、滑液、髄液、唾液などからなる群より選択される。いくつかの実施形態において、本明細書中に開示される方法は、上記試験サンプル中のｃｆＮＡフラグメントから試験配列情報を生成する工程をさらに含む。いくつかの実施形態において、本明細書中に開示される方法は、標的ゲノム遺伝子座を含むｃｆＮＡフラグメントのセグメントを増幅して、増幅核酸を生成する工程をさらに含む。ある特定の実施形態において、本明細書中に開示される方法は、上記試験サンプル中のｃｆＮＡフラグメントをシーケンシングして、試験配列情報を生成する工程をさらに含む。これらの実施形態のうちのいくつかにおいて、その試験配列情報は、試験サンプル中のｃｆＮＡフラグメントの標的化セグメントから得られ、その標的化セグメントは、シーケンシングの前に、試験サンプル中のｃｆＮＡフラグメントから１つまたはそれを超える領域を選択的に濃縮することによって得られる。ある特定の実施形態において、本明細書中に開示される方法は、シーケンシングの前に、得られた標的化セグメントを増幅する工程をさらに含む。ある特定の実施形態において、本明細書中に開示される方法は、シーケンシングの前に、バーコードを含む１つまたはそれを超えるアダプターをｃｆＮＡフラグメントおよび／または増幅された標的化セグメントに付着させる工程をさらに含む。ある特定の実施形態において、そのシーケンシングは、ターゲットシーケンシング、バイサルファイトシーケンシング、イントロンシーケンシング、エクソームシーケンシングおよびホールゲノムシーケンシングからなる群より選択される。

なおも別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたはそのコンピュータ可読媒体にアクセスできるコントローラを備えるシステムを提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること、および（ｂ）標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントがその試験配列情報に存在することを識別することであって、その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメントに由来することを示し、それによって、その試験配列情報におけるアレルバリアントが、被験体内の標的細胞を起源とすることを示すことを行う。いくつかの実施形態において、例えば、（ｂ）は、上記試験配列情報における少なくとも１つのアレルバリアントを識別すること；そのアレルバリアントを標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルにマッピングすること；その分類アレルのサブクローナリティスコアを識別すること；およびそのサブクローナリティスコアを少なくとも１つの選択されたカットオフ閾値と比較することを含み、ここで、そのサブクローナリティスコアが、選択されたカットオフ閾値未満であるとき、それは、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示唆する。

なおも別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたはそのコンピュータ可読媒体にアクセスできるコントローラを備えるシステムを提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）被験体から得られた試験サンプル中のセルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること、（ｂ）被験体の造血幹細胞を起源とする１つまたはそれを超える上記配列リード（例えば、分類アレルの少なくとも一部を含む）をその試験配列情報から除去（例えば、削除、非表示、無視など）して、フィルターされた試験配列情報を生成すること、および（ｃ）１またはそれを超える参照被験体から得られた参照配列情報と実質的にアラインメントする上記１つまたはそれを超える配列リードが、フィルターされた試験配列情報に存在することを識別することであって、その参照配列情報は、参照被験体内の腫瘍細胞を起源とし、それによって、その試験サンプルが、被験体内の腫瘍細胞を起源とする１つまたはそれを超えるｃｆＤＮＡフラグメントを含むことを示すことを行う。

なおも別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたはそのコンピュータ可読媒体にアクセスできるコントローラを備えるシステムを提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアを生成することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含むこと、および（ｂ）上記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較することを行い、ここで、その選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる。

なおも別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたはそのコンピュータ可読媒体にアクセスできるコントローラを備えるシステムを提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットを識別することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む、こと、（ｂ）上記配列情報から参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値を決定すること、（ｃ）参照サンプルの各々について、最大マイナーアレル頻度（ｍａｘＭＡＦ）の値を決定すること、（ｄ）所与の参照サンプルにおいて観察された各分類アレルについて、参照サンプルの少なくとも一部に対するｍａｘＭＡＦの値に対する上記ＭＡＦの値の比を計算して、比の値を生成すること、（ｅ）参照サンプルの少なくとも一部における所与の分類アレルが、参照サンプルの少なくとも一部に出現したその所与の分類アレルの回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、上記分類アレルの各々について計算して、参照サンプルの少なくとも一部における上記分類アレルの各々に対するサブクローナリティスコアを生成すること、および（ｆ）上記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較することを行い、ここで、その選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる。

いくつかの実施形態において、本明細書中に開示されるシステムは、コントローラと作動可能に接続された核酸配列決定装置を備え、その核酸配列決定装置は、試験サンプル中および／または参照サンプル中のｃｆＮＡフラグメントから配列情報を提供するように構成されている。これらの実施形態のうちのある特定の実施形態において、その核酸配列決定装置は、上記核酸に対してパイロシーケンシング、バイサルファイトシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシングまたはハイブリダイゼーションによるシーケンシングを行って、シーケンシングリードを生成するように構成されている。

いくつかの実施形態において、本明細書中に開示されるシステムは、コントローラに作動可能に接続されたサンプル調製コンポーネントを備え、そのサンプル調製コンポーネントは、核酸配列決定装置によってシーケンシングされるｃｆＮＡフラグメントを調製するように構成されている。これらの実施形態のうちのいくつかにおいて、そのサンプル調製コンポーネントは、試験サンプル中および／または参照サンプル中のｃｆＮＡフラグメントからの領域を選択的に濃縮するように構成されている。ある特定の実施形態において、サンプル調製コンポーネントは、バーコードを含む１つまたは複数のアダプターをｃｆＮＡフラグメントに付着させるように構成されている。

ある特定の実施形態において、本明細書中に開示されるシステムは、コントローラに作動可能に接続された核酸増幅コンポーネントを備え、その核酸増幅コンポーネントは、試験サンプル中および／または参照サンプル中のｃｆＮＡフラグメントを増幅するように構成されている。これらの実施形態のうちのいくつかにおいて、その核酸増幅コンポーネントは、試験サンプル中および／または参照サンプル中のｃｆＮＡフラグメントから、選択的に濃縮された領域を増幅するように構成されている。いくつかの実施形態において、本明細書中に開示されるシステムは、コントローラに作動可能に接続された材料移動コンポーネントを備え、その材料移動コンポーネントは、１つまたはそれを超える材料を、核酸配列決定装置、核酸増幅コンポーネントおよび／またはサンプル調製コンポーネントの間を移動させるように構成されている。ある特定の実施形態において、本明細書中に開示されるシステムは、コントローラに作動可能に接続されたデータベースを備え、そのデータベースは、非標的核酸バリアントフィルターリストおよび／または標的核酸バリアントフィルターリストを含む。

なおも別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること、および（ｂ）標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが試験配列情報に存在することを識別することを行い、その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメントに由来することを示し、それによって、その試験配列情報におけるアレルバリアントが、被験体内の標的細胞を起源とすることを示す。いくつかの実施形態において、例えば、（ｂ）は、試験配列情報における少なくとも１つのアレルバリアントを識別すること；そのアレルバリアントを標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルにマッピングすること；その分類アレルのサブクローナリティスコアを識別すること；およびそのサブクローナリティスコアを少なくとも１つの選択されたカットオフ閾値と比較することを含み、ここで、そのサブクローナリティスコアが、選択されたカットオフ閾値未満であるとき、それは、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示す。

別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）被験体から得られた試験サンプル中のセルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること、（ｂ）被験体の造血幹細胞を起源とする１つまたはそれを超える上記配列リード（例えば、分類アレルの少なくとも一部を含む）をその試験配列情報から除去（例えば、削除、非表示、無視など）して、フィルターされた試験配列情報を生成すること、および（ｃ）１またはそれを超える参照被験体から得られた参照配列情報と実質的にアラインメントする上記１つまたはそれを超える配列リードが、フィルターされた試験配列情報に存在することを識別することであって、その参照配列情報は、参照被験体内の腫瘍細胞を起源とし、それによって、その試験サンプルが、被験体内の腫瘍細胞を起源とする１つまたはそれを超えるｃｆＤＮＡフラグメントを含むことを示すことを行う。

別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアを生成することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含むこと、および（ｂ）上記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較することを行い、ここで、その選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる。

別の態様において、本開示は、コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を提供し、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットを識別することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む、こと、（ｂ）上記配列情報から参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値を決定すること、（ｃ）参照サンプルの各々について、最大マイナーアレル頻度（ｍａｘＭＡＦ）の値を決定すること、（ｄ）所与の参照サンプルにおいて観察された各分類アレルについて、参照サンプルの少なくとも一部に対するｍａｘＭＡＦの値に対する上記ＭＡＦの値の比を計算して、比の値を生成すること、（ｅ）参照サンプルの少なくとも一部における所与の分類アレルが、参照サンプルの少なくとも一部に出現したその所与の分類アレルの回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、上記分類アレルの各々について計算して、参照サンプルの少なくとも一部における上記分類アレルの各々に対するサブクローナリティスコアを生成すること、および（ｆ）上記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較することを行い、ここで、その選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる。

本明細書中に開示されるシステムまたはコンピュータ可読媒体のいくつかの実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、参照サンプルから得られた配列情報から、潜在的に臨床的に有意な、標的ゲノム遺伝子座セット内の各遺伝子座における各体細胞性核酸バリアントに対するＭＡＦの値を決定することであって、ここで、その標的ゲノム遺伝子座セットは、各参照サンプルにおいて同一であること、および参照サンプルの各々についてｍａｘＭＡＦの値を決定してアレル情報を生成することを少なくともさらに行う。

本明細書中に開示されるシステムまたはコンピュータ可読媒体のある特定の実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、参照サンプルにインデックスされた臨床情報を用いて、非標的核酸バリアントフィルターリストおよび／または標的核酸バリアントフィルターリストを生成することを少なくともさらに行う。本明細書中に開示されるシステムまたはコンピュータ可読媒体のある特定の実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、試験サンプルにインデックスされた臨床情報を用いて、被験体内の標的細胞を起源とするｃｆＮＡフラグメントを検出することを少なくともさらに行う。本明細書中に開示されるシステムまたはコンピュータ可読媒体のある特定の実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、分類アレルの各々に対する各ＭＡＦ／ｍａｘ－ＭＡＦ値の頻度を用いて、サブクローナリティスコアを決定することを少なくともさらに行う。

本明細書中に開示されるシステムまたはコンピュータ可読媒体のある特定の実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、サブクローナリティスコアを複数の選択されたカットオフ閾値と比較することであって、ここで、その複数の選択されたカットオフ閾値は、第１のカットオフ閾値および第２のカットオフ閾値を含み、第１のカットオフ閾値は、第２のカットオフ閾値より大きく、第１のカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または第２のカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられることを少なくともさらに行う。本明細書中に開示されるシステムまたはコンピュータ可読媒体のある特定の実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、試験配列情報におけるアレルバリアントが、約１％を超えるＭＡＦを含むとき、そのアレルバリアントを、標的細胞を起源とすると分類することを少なくともさらに行う。本明細書中に開示されるシステムまたはコンピュータ可読媒体のいくつかの実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、試験配列情報におけるアレルバリアントが、トランケーション、インデルおよび／またはスプライス部位バリアントを含むとき、そのアレルバリアントを、標的細胞を起源とすると分類することを少なくともさらに行う。

本明細書中に開示されるシステムまたはコンピュータ可読媒体のいくつかの実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、参照サンプルの少なくとも一部における所与の分類アレルに対する各比の値の頻度を決定することを少なくともさらに行う。本明細書中に開示されるシステムまたはコンピュータ可読媒体のある特定の実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、標的核酸バリアントフィルターリストを用いて、被験体から得られた試験サンプルが、標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定することを少なくともさらに行う。本明細書中に開示されるシステムまたはコンピュータ可読媒体のいくつかの実施形態において、そのコンピュータ可読媒体は、コンピュータが実行可能な非一時的な命令を含み、その命令は、少なくとも１つの電子プロセッサーによって実行されたとき、非標的核酸バリアントフィルターリストを用いて、被験体から得られた試験サンプルが、非標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定することを少なくともさらに行う。

本明細書に組み込まれ、本明細書の一部を成す、添付の図面（本明細書中では「図（Ｆｉｇｕｒｅ）」および「図（ＦＩＧ）」とも）は、ある特定の実施形態を例証し、本明細書とともに、本明細書中に開示される方法、コンピュータ可読媒体およびシステムのある特定の原理を説明する働きをする。本明細書中に提供される説明は、例として含められるのであって決して限定の意図で含められるのではない添付の図面と併せて読むとより良く理解される。文脈がそうでないことを示さない限り、図面全体にわたって同様の参照数字は、同様の構成要素を識別していることが理解されるだろう。また、図面の一部または全部は、説明目的の模式図であり得、必ずしも示されているエレメントの実際の相対的なサイズまたは位置を示しているわけではないことも理解されるだろう。

図１Ａおよび１Ｂは、５０％の閾値に設定されたクローナリティ境界値に基づいて推定されたサブクローナリティスコアによって識別される、２つのアレル（図１Ａは、分類アレル１を示しており、図１Ｂは、分類アレル２を示している）のヒストグラムである。本発明のいくつかの実施形態によると、アレル１は、陰性である（すなわち、癌細胞起源を示さない（おそらく造血幹細胞））のに対して、アレル２は、参照サンプルデータベースにおける被験体の５０％超に存在するので、陽性である（すなわち、癌細胞起源を示す）。図１Ａおよび１Ｂの各々において、Ｙ軸は、記録の数を示し、Ｘ軸は、ＭＡＦ／ｍａｘＭＡＦ比の分布を示す。

図２は、本発明のいくつかの実施形態に係る、被験体内の標的細胞を起源とする核酸分子を検出する例示的な方法工程を模式的に表しているフローチャートである。

図３は、本発明のいくつかの実施形態に係る、被験体内の腫瘍細胞を起源とする核酸分子を検出する例示的な方法工程を模式的に表しているフローチャートである。

図４は、本発明のいくつかの実施形態に係る、被験体における疾患を処置する例示的な方法工程を模式的に表しているフローチャートである。

図５は、本発明のいくつかの実施形態に係る、分類器を生成する例示的な方法工程を模式的に表しているフローチャートである。

図６は、本発明のいくつかの実施形態に係る、分類器を生成する例示的な方法工程を模式的に表しているフローチャートである。

図７は、本発明のある特定の実施形態との使用に適した例示的なシステムの模式図である。

図８Ａ～Ｃは、フィルターを用いなかったとき（図８Ａ）、組織フィルタリングを用いたとき（図８Ｂ）、および分類器フィルタリングを用いたとき（図８Ｃ；すなわち、サブクローナリティスコアの使用）の、患者データに対するカプラン・マイヤープロットを示している。図８Ａ～Ｃに示されている各プロットにおいて、検出されなかった曲線は、上の曲線であり、検出された曲線は、下の曲線である。

図９は、図８Ａ～Ｃに示された異なるフィルターシナリオに対して観察されたバリアントの数（ｙ軸）に対するアレル頻度の範囲（ｘ軸）のプロットを示している。

定義
本開示をより容易に理解するために、まず、ある特定の用語を下記に定義する。以下の用語および他の用語に対するさらなる定義は、本明細書全体に示され得る。下記に示される用語の定義が、参照により援用される特許出願または発行された特許における定義と矛盾する場合、本願に示される定義が、その用語の意味を理解するために使用されるべきである。

本明細書および添付の請求項において使用されるとき、単数形「ａ」、「ａｎ」および「ｔｈｅ」は、文脈が明らかに他のことを指示しない限り、複数の対象を含む。したがって、例えば、「方法（ａｍｅｔｈｏｄ）」という言及には、１つまたはそれを超える方法、ならびに／または本明細書中に記載されるタイプの工程および／もしくは本開示を読めば当業者には明らかになるタイプの工程などが含まれる。また、本開示で議論される温度、濃度、時間、塩基または塩基対の数、カバレッジ（ｃｏｖｅｒａｇｅ）などの前には暗黙の「約」が存在し、わずかで実体のない等価物も本開示の範囲内であることが認識されるだろう。本願において、単数形の使用は、具体的に別段述べられていない限り、複数形を含む。また、「含む（ｃｏｍｐｒｉｓｅ）」、「含む（ｃｏｍｐｒｉｓｅｓ）」、「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「含む（ｃｏｎｔａｉｎ）」、「含む（ｃｏｎｔａｉｎｓ）」、「含む（ｃｏｎｔａｉｎｉｎｇ）」、「含む（ｉｎｃｌｕｄｅ）」、「含む（ｉｎｃｌｕｄｅｓ）」および「含む（ｉｎｃｌｕｄｉｎｇ）」の使用は、限定を意図していない。

本明細書中で使用される術語は、特定の実施形態を説明する目的のみであって、限定を意図していないことも理解されるべきである。さらに、別段定義されない限り、本明細書中で使用されるすべての専門用語および科学用語は、本開示が属する分野の当業者が通常理解する意味と同じ意味を有する。方法、コンピュータ可読媒体およびシステムを説明し、特許請求する際、以下の術語およびその文法上の変化形は、下記に示される定義に従って使用される。

約：本明細書中で使用されるとき、「約」または「およそ」は、１つまたはそれを超える目的の値またはエレメントに対して適用されるとき、記載の参照値または参照エレメントと類似の値またはエレメントのことを指す。ある特定の実施形態において、用語「約」または「およそ」とは、別途記載されていないかまたは文脈から明らかでない限り、記載の参照値または参照エレメントの２５％、２０％、１９％、１８％、１７％、１６％、１５％、１４％、１３％、１２％、１１％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％またはそれ未満の、どちらかの方向（それらを超えるまたは低い）の範囲に収まる値またはエレメントの範囲のことを指す（そのような数値が、考えられる値またはエレメントの１００％を超える場合を除く）。

アダプター：本明細書中で使用されるとき、「アダプター」とは、通常、少なくとも部分的に二本鎖であり、かつ所与のサンプル核酸分子の片端または両端に連結するように使用される、短い核酸（例えば、約５００ヌクレオチド長未満、約１００ヌクレオチド長未満または約５０ヌクレオチド長未満）のことを指す。アダプターは、両端でアダプターに隣接する核酸分子の増幅を可能にする核酸プライマー結合部位を含み得、かつ／または様々な次世代シーケンシング（ＮＧＳ）用途などのシーケンシング用途のプライマー結合部位を含むシーケンシングプライマー結合部位を含み得る。アダプターは、捕捉プローブ（例えば、フローセル支持体などに付着させたオリゴヌクレオチド）に対する結合部位も含み得る。アダプターは、本明細書中に記載されるような核酸タグも含み得る。核酸タグは、通常、核酸タグが所与の核酸分子のアンプリコンおよびシーケンシングリードの中に含まれるように、増幅プライマー結合部位およびシーケンシングプライマー結合部位に対して配置される。ある核酸分子のそれぞれの末端に、同じまたは異なるアダプターが連結され得る。ある特定の実施形態において、核酸タグが異なることを除いては、同じアダプターが、核酸分子のそれぞれの末端に連結される。いくつかの実施形態において、アダプターは、Ｙ形のアダプターであり、その１つの末端は、平滑末端化されているか、またはある核酸分子に結合するために本明細書中に記載されるようにテイル化されており、その核酸分子もまた、平滑末端化されているか、または１つもしくはそれを超える相補的なヌクレオチドでテイル化されている。なおも他の例示的な実施形態では、アダプターは、平滑末端、または解析される核酸分子に結合するためのテイル化末端を含むベル形のアダプターである。他の例示的なアダプターとしては、Ｔテイル化アダプターおよびＣテイル化アダプターが挙げられる。

投与する：本明細書中で使用されるとき、療法薬（例えば、免疫学的療法薬）を被験体に「投与する（ａｄｍｉｎｉｓｔｅｒ）」または「投与する（ａｄｍｉｎｉｓｔｅｒｉｎｇ）」は、組成物を被験体に与える、適用する、または接触させることを意味する。投与は、いくつかの経路（例えば、局所的、経口、皮下、筋肉内、腹腔内、静脈内、髄腔内および皮内を含む）のうちのいずれかによって達成され得る。

アレル：本明細書中で使用されるとき、「アレル」または「アレルバリアント」とは、規定されたゲノム位置または遺伝子座における特定の遺伝的バリアントのことを指す。アレルバリアントは、通常、そのアレルがヘテロ接合性であるかホモ接合性であるかに応じて、５０％（０．５）または１００％の頻度で示される。例えば、生殖細胞系列バリアントは、遺伝し、通常、０．５または１の頻度を有する。しかしながら、体細胞性バリアントは、後天的なバリアントであり、通常、＜０．５の頻度を有する。ある遺伝子座のメジャーアレルおよびマイナーアレルとは、その遺伝子座が、それぞれ参照配列のヌクレオチド、および参照配列とは異なるバリアントヌクレオチドによって占有されている、その遺伝子座を保持している核酸のことを指す。ある遺伝子座における測定値は、サンプル中でアレルが観察される頻度であるアレル率（ａｌｌｅｌｉｃｆｒａｃｔｉｏｎ）（ＡＦ）の形を取り得る。

増幅する：本明細書中で使用されるとき、核酸の文脈における「増幅する」または「増幅」とは、通常、少量のポリヌクレオチド（例えば、単一ポリヌクレオチド分子）から開始する、複数コピーのポリヌクレオチドまたはそのポリヌクレオチドの一部の生成のことを指し、その増幅産物またはアンプリコンは、通常、検出可能である。ポリヌクレオチドの増幅は、種々の化学的および酵素的プロセスを含む。

バーコード：本明細書中で使用されるとき、核酸の文脈における「バーコード」とは、分子識別子として役立ち得る配列を含む核酸分子のことを指す。例えば、個々の「バーコード」配列は、最終的なデータ解析の前に各リードを識別し、ソーティングできるように、通常、次世代シーケンシング（ＮＧＳ）ライブラリーの調製中に各ＤＮＡフラグメントに付加される。

癌のタイプ：本明細書中で使用されるとき、「癌」、「癌のタイプ」または「腫瘍タイプ」とは、例えば組織病理学によって定義される、癌のタイプまたはサブタイプのことを指す。癌のタイプは、任意の従来の基準によって、例えば、所与の組織における出現（例えば、血液癌、中枢神経系（ＣＮＳ）、脳腫瘍、肺癌（小細胞および非小細胞）、皮膚癌、鼻癌、咽喉癌、肝臓癌、骨癌、リンパ腫、膵癌、腸（ｂｏｗｅｌ）癌、直腸癌、甲状腺癌、膀胱癌、腎臓癌、口腔癌、胃癌、乳癌、前立腺癌、卵巣癌、肺癌、腸（ｉｎｔｅｓｔｉｎａｌ）癌、軟部組織癌、神経内分泌癌、胃食道癌、頭頸部癌、婦人科癌、結腸直腸癌、尿路上皮癌、固形の癌、不均一な癌、均一な癌）、原発源が不明であることなど、ならびに／または細胞系譜が同じであること（例えば、癌腫、肉腫、リンパ腫、胆管癌、白血病、中皮腫、メラノーマまたは神経膠芽腫）、および／もしくは癌マーカー（例えば、Ｈｅｒ２、ＣＡ１５－３、ＣＡ１９－９、ＣＡ－１２５、ＣＥＡ、ＡＦＰ、ＰＳＡ、ＨＣＧ、ホルモンレセプターおよびＮＭＰ－２２）を示す癌に基づいて定義され得る。癌は、ステージ（例えば、ステージ１、２、３または４）によって、および原発源であるか二次源であるかによっても分類され得る。

セルフリー核酸：本明細書中で使用されるとき、「セルフリー核酸」とは、細胞内に含まれていない核酸もしくは細胞に結合していない核酸、またはいくつかの実施形態では、インタクトな細胞を除去した後のサンプル中に残存している核酸のことを指す。セルフリー核酸には、例えば、被験体由来の体液（例えば、血液、血漿、血清、尿、脳脊髄液（ＣＳＦ）など）を起源とする被包されていないあらゆる核酸が含まれ得る。セルフリー核酸としては、ＤＮＡ（ｃｆＤＮＡ）、ＲＮＡ（ｃｆＲＮＡ）およびそれらのハイブリッドが挙げられ、それらには、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、循環ＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、低分子ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉと相互作用するＲＮＡ（ｐｉＲＮＡ）、長い非コードＲＮＡ（長いｎｃＲＮＡ）および／またはこれらのいずれかのフラグメントが含まれる。セルフリー核酸は、二本鎖、一本鎖またはそれらのハイブリッドであり得る。セルフリー核酸は、分泌または細胞死のプロセス、例えば、細胞壊死、アポトーシスなどによって、体液中に放出され得る。セルフリー核酸は、エフェロソーム（ｅｆｆｅｒｏｓｏｍｅ）またはエキソソームに見られ得る。いくつかのセルフリー核酸は、癌細胞から体液中に放出される（例えば、循環腫瘍ＤＮＡ（ｃｔＤＮＡ））。他のセルフリー核酸は、健康な細胞から放出される。ＣｔＤＮＡは、腫瘍由来の被包されていない断片化されたＤＮＡであり得る。セルフリー核酸の別の例は、母体血流中を自由に循環している胎児ＤＮＡであり、セルフリー胎児ＤＮＡ（ｃｆｆＤＮＡ）とも呼ばれる。セルフリー核酸は、１つまたはそれを超えるエピジェネティック修飾を有し得、例えば、セルフリー核酸は、アセチル化、５－メチル化、ユビキチン化、リン酸化、ＳＵＭＯ化、リボシル化、および／またはシトルリン化され得る。

細胞起源：本明細書中で使用されるとき、セルフリー核酸の文脈における「細胞起源」は、所与のセルフリー核酸分子が由来するまたは起源とする（例えば、アポトーシスプロセス、ネクローシスプロセスなどを介して）細胞型を意味する。ある特定の実施形態において、例えば、所与のセルフリー核酸分子は、腫瘍細胞（例えば、癌性肺細胞など）または非腫瘍細胞もしくは正常細胞（例えば、非癌性肺細胞、造血幹細胞など）を起源とし得る。

分類アレル：本明細書中で使用されるとき、「分類アレル」とは、所与の核酸分子にそれが存在することが、その核酸分子の起源（例えば、細胞起源）を識別する、アレルバリアントのことを指す。ある特定の実施形態では、例えば、ある核酸分子に所与の分類アレルが存在することによって、その核酸分子が、特定の用途に応じて標的細胞（例えば、罹患細胞、腫瘍細胞、胎児細胞、移植ドナー細胞など）または非標的細胞（例えば、非罹患細胞、造血幹細胞、母体細胞、移植レシピエント細胞など）を起源とすると識別され得る。通常、所与の分類アレルを標的核酸バリアントフィルターリストまたは非標的核酸バリアントフィルターリストに割り当てるために使用され得るサブクローナリティスコアが、所与の用途において使用される選択されたカットオフ閾値未満のか、その閾値であるか、その閾値を超えるかに応じて、そのサブクローナリティスコアと分類アレルが関連付けられる。

分類器：本明細書中で使用されるとき、「分類器」とは、一般に、試験データを入力として受け取り、その入力データをあるクラスまたは別のクラス（例えば、腫瘍ＤＮＡまたは非腫瘍ＤＮＡ）に属すると分類することを出力として生成するアルゴリズム計算機コードのことを指す。

臨床情報：本明細書中で使用されるとき、「臨床情報」とは、被験体に対する健康管理の決定を知らせ得る任意の情報のことを指す。臨床情報の例としては、とりわけ、ゲノム情報、年齢、性別、人種、体重、ボディマス指数（ＢＭＩ）、病歴、薬物使用、喫煙および飲酒が挙げられるが、これらに限定されない。

クローン性造血由来の変異：本明細書中で使用されるとき、「クローン性造血由来の変異」とは、クローン性増殖に至る、造血性幹細胞および／または造血性前駆細胞におけるゲノム変異の体細胞性獲得のことを指す。

未確定の潜在能をもつクローン性造血：本明細書中で使用されるとき、「未確定の潜在能をもつクローン性造血」または「ＣＨＩＰ」とは、造血幹細胞の拡大を意味する、個体における造血のことを指し、その造血幹細胞は、１つまたはそれを超える体細胞変異（例えば、血液悪性腫瘍に関連する変異および／またはそうでない変異）を含むが、血液悪性腫瘍に対する診断基準（例えば、異形成の決定的な形態的エビデンス）を有しない。ＣＨＩＰは、造血幹細胞が、遺伝的に異なる血液細胞の部分集団の形成に寄与する、ありふれた加齢性の現象である。

クローナリティ境界値：本明細書中で使用されるとき、「クローナリティ境界値」とは、所与のサブクローナリティスコアの計算において用いられる、選択された値のことを指す。

比較対照結果：本明細書中で使用されるとき、「比較対照結果」または「参照結果」は、所与の試験サンプルまたは試験結果の１つまたはそれを超える有望な特性を識別するため、ならびに／あるいは試験サンプルを採取したもしくは得た被験体に対する１つもしくはそれを超える考えられる予後の結果および／または１つもしくはそれを超えるカスタマイズされた療法を識別するためにその試験サンプルまたは試験結果と比較され得る、１つの結果または結果のセットを意味する。比較対照結果は、通常、参照サンプルのセット（例えば、試験被験体と同じ疾患もしくは癌のタイプを有する被験体、および／または試験被験体と同じ療法を受けているもしくは受けた被験体）から得られる。

コントロールサンプル：本明細書中で使用されるとき、「コントロールサンプル」または「コントロールＤＮＡサンプル」とは、解析手順の精度を評価するために、試験サンプルとともにまたは試験サンプルと比較して解析される、組成が既知のサンプルならびに／または特性が既知および／もしくはパラメータが既知（例えば、細胞起源が既知、腫瘍フラクションが既知、カバレッジが既知など）のサンプルのことを指す。コントロールサンプルのデータセットは、通常、少なくとも約２５個～少なくとも約３０，０００個またはそれを超えるコントロールサンプルを含む。いくつかの実施形態において、コントロールサンプルのデータセットは、約５０、７５、１００、１５０、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，５００、５，０００、７，５００、１０，０００、１５，０００、２０，０００、２５，０００、５０，０００、１００，０００、１，０００，０００個またはそれを超えるコントロールサンプルを含む。

カバレッジ：本明細書中で使用されるとき、「カバレッジ」とは、特定の塩基位置を占める核酸分子の数のことを指す。

カットオフ閾値：本明細書中で使用されるとき、「カットオフ閾値」とは、サブクローナリティスコアを有する分類アレルを標的核酸バリアントフィルターリストまたは非標的核酸バリアントフィルターリストに割り当てるために、そのサブクローナリティスコアと比較される選択された値のことを指す。

デオキシリボ核酸またはリボ核酸：本明細書中で使用されるとき、「デオキシリボ核酸」または「ＤＮＡ」とは、糖部分の２’位に水素基を有する天然のヌクレオチドまたは修飾ヌクレオチドのことを指す。ＤＮＡは、通常、デオキシリボヌクレオシドを含むヌクレオチドの鎖を含み、その各デオキシリボヌクレオシドは、４つのタイプの核酸塩基、すなわち、アデニン（Ａ）、チミン（Ｔ）、シトシン（Ｃ）およびグアニン（Ｇ）のうちの１つを含む。本明細書中で使用されるとき、「リボ核酸」または「ＲＮＡ」とは、糖部分の２’位にヒドロキシル基を有する天然のヌクレオチドまたは修飾ヌクレオチドのことを指す。ＲＮＡは、通常、リボヌクレオシドを含むヌクレオチドの鎖を含み、その各リボヌクレオシドは、４つのタイプの核酸塩基、すなわち、Ａ、ウラシル（Ｕ）、ＧおよびＣのうちの１つを含む。本明細書中で使用されるとき、用語「ヌクレオチド」とは、天然のヌクレオチドまたは修飾ヌクレオチドのことを指す。ある特定のヌクレオチド対は、相補的な形式（相補的な塩基対形成と呼ばれる）で互いに特異的に結合する。ＤＮＡの場合、アデニン（Ａ）は、チミン（Ｔ）と対形成し、シトシン（Ｃ）は、グアニン（Ｇ）と対形成する。ＲＮＡの場合、アデニン（Ａ）は、ウラシル（Ｕ）と対形成し、シトシン（Ｃ）は、グアニン（Ｇ）と対形成する。第１の核酸鎖が、その第１の鎖におけるヌクレオチドと相補的なヌクレオチドで構成されている第２の核酸鎖に結合すると、それらの２本の鎖は、結合して二本鎖を形成する。本明細書中で使用されるとき、「核酸シーケンシングデータ」、「核酸シーケンシング情報」、「配列情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」または「フラグメント配列」または「核酸シーケンシングリード」は、ＤＮＡまたはＲＮＡなどの核酸の分子（例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチドまたはフラグメント）におけるヌクレオチド塩基（例えば、アデニン、グアニン、シトシンおよびチミンまたはウラシル）の順序および同一性を示す任意の情報またはデータを表す。本教示は、利用可能なあらゆる手法、プラットフォームまたは技術（キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接または間接的なヌクレオチド識別システム、パイロシーケンシング、イオンまたはｐＨに基づく検出システム、および電子的シグネチャに基づくシステムを含むがこれらに限定されない）を用いて得られる配列情報を企図することが理解されるべきである。

フラグメント：本明細書中で使用されるとき、セルフリー核酸の文脈における「フラグメント」とは、被験体の身体（または被験体から得られたサンプル）に天然に存在する核酸分子のことを指し、断片化工程をインビトロで行う必要があると解釈されるべきでない。

造血幹細胞：本明細書中で使用されるとき、「造血幹細胞」または「ＨＳＣ」は、造血プロセスによって他の血液細胞を発生させる幹細胞である。

免疫療法：本明細書中で使用されるとき、「免疫療法」とは、癌細胞を殺滅するようにまたは癌細胞の成長を少なくとも阻害するように、好ましくは、癌のさらなる成長を抑えるように、癌のサイズを縮小するように、および／または癌を排除するように、免疫系を刺激するように作用する１つまたはそれを超える作用物質による処置のことを指す。そのような作用物質のいくつかは、癌細胞上に存在する標的に結合し；いくつかは、免疫細胞上に存在するが癌細胞上に存在しない標的に結合し；いくつかは、癌細胞上と免疫細胞上の両方に存在する標的に結合する。そのような作用物質としては、チェックポイント阻害剤および／または抗体が挙げられるが、これらに限定されない。チェックポイント阻害剤は、自己寛容を維持し、末梢組織における生理学的免疫応答の持続時間および振幅を調節して付随的な組織損傷を最小限に抑える、免疫系の経路の阻害剤である（例えば、Ｐａｒｄｏｌｌ，ＮａｔｕｒｅＲｅｖｉｅｗｓＣａｎｃｅｒ１２，２５２－２６４（２０１２）を参照のこと）。例示的な作用物質としては、ＰＤ－１、ＰＤ－２、ＰＤ－Ｌ１、ＰＤ－Ｌ２、ＣＴＬＡ－４０、ＯＸ４０、Ｂ７．１、Ｂ７Ｈｅ、ＬＡＧ３、ＣＤ１３７、ＫＩＲ、ＣＣＲ５、ＣＤ２７またはＣＤ４０のいずれかに対する抗体が挙げられる。他の例示的な作用物質としては、炎症促進性サイトカイン、例えば、ＩＬ－１β、ＩＬ－６およびＴＮＦ－αが挙げられる。他の例示的な作用物質は、腫瘍に対して活性化されたＴ細胞、例えば、そのＴ細胞によって認識される腫瘍抗原を標的化するキメラ抗原を発現することによって活性化されたＴ細胞である。

インデル：本明細書中で使用されるとき、「インデル」とは、被験体のゲノムにおけるヌクレオチド位置の挿入または欠失を含む変異のことを指す。

インデックスされた：本明細書中で使用されるとき、「インデックスされた」とは、第１のエレメント（例えば、臨床情報）が第２のエレメント（例えば、所与のサンプル）に結び付けられることを指す。

最大マイナーアレル頻度：本明細書中で使用されるとき、「最大マイナーアレル頻度」、「最大ＭＡＦ」または「ｍａｘＭＡＦ」とは、所与のサンプル中に存在するまたは所与のサンプルにおいて観察されるすべての体細胞性バリアントのうち最大または最高のＭＡＦのことを指す。

マイナーアレル頻度：本明細書中で使用されるとき、「マイナーアレル頻度」または「ＭＡＦ」とは、マイナーアレル（例えば、最も一般的でないアレル）が、所与の核酸集団（例えば、被験体から得られたサンプル）に存在する頻度のことを指す。換言すれば、「マイナーアレル頻度」は、所与のサンプル中の所与の遺伝子座において観察される最も優勢なアレルではない、そのサンプル中のその遺伝子座において観察されるアレルの頻度を意味する。ＭＡＦは、一般に、割合またはパーセンテージとして表現される。例えば、ＭＡＦは、通常、所与の遺伝子座に存在するすべての体細胞性バリアントまたは全アレルの約０．５、０．１、０．０５または０．０１未満（すなわち、約５０％、１０％、５％または１％未満）である。

変異：本明細書中で使用されるとき、「変異」または「遺伝子異常」とは、公知の参照配列からのバリエーションのことを指し、それには、変異、例えば、単一ヌクレオチドバリアント（ＳＮＶ）、コピー数バリアントもしくはコピー数バリエーション（ＣＮＶ）／コピー数異常、挿入または欠失（インデル）、トランケーション、遺伝子融合、トランスバージョン、転座、フレームシフト、重複、反復増殖およびエピジェネティックバリアントが含まれる。変異は、生殖細胞系列変異または体細胞変異であり得る。いくつかの実施形態において、比較目的の参照配列は、試験サンプルを提供する被験体の種の野生型ゲノム配列、通常、ヒトゲノムである。

新生物：本明細書中で使用されるとき、用語「新生物」と「腫瘍」は、交換可能に使用される。それらは、被験体における細胞の異常な成長のことを指す。新生物または腫瘍は、良性、潜在的に悪性または悪性であり得る。悪性腫瘍は、癌または癌性腫瘍と称される。

次世代シーケンシング：本明細書中で使用されるとき、「次世代シーケンシング」または「ＮＧＳ」とは、従来のＳａｎｇｅｒ法に基づくアプローチおよびキャピラリー電気泳動に基づくアプローチと比べて高スループットである、例えば、数十万個の比較的小さい配列リードを一度に生成できる、シーケンシング技術のことを指す。次世代シーケンシング法のいくつかの例としては、合成によるシーケンシング、ライゲーションによるシーケンシングおよびハイブリダイゼーションによるシーケンシングが挙げられるが、これらに限定されない。

核酸タグ：本明細書中で使用されるとき、「核酸タグ」とは、異なるサンプル由来の核酸を区別するために核酸分子をラベルするため（例えば、サンプルインデックスに相当する）、または異なるタイプのもしくは異なる処理を経た、同じサンプル中の異なる核酸分子を区別するために核酸分子をラベルするため（例えば、分子タグに相当する）に使用される短い核酸（例えば、約５００、約１００、約５０または約１０ヌクレオチド長未満）のことを指す。核酸タグは、一本鎖、二本鎖または少なくとも部分的に二本鎖であり得る。核酸タグは、必要に応じて、同じ長さまたは様々な長さを有する。核酸タグはまた、１つもしくはそれを超える平滑末端を有する二本鎖分子を含み得、５’もしくは３’の一本鎖領域（例えば、オーバーハング）を含み得、かつ／または所与の分子内の他の位置に１つもしくはそれを超える他の一本鎖領域を含み得る。核酸タグは、他の核酸（例えば、増幅および／またはシーケンシングされるサンプル核酸）の片端または両端に付着され得る。核酸タグをデコードすることにより、サンプル起源、所与の核酸の形態または処理などの情報を明らかにすることができる。核酸タグを用いることにより、種々の核酸タグおよび／またはサンプルインデックスを有する核酸を含む複数のサンプルのプーリングおよび／または並列処理も可能にすることができ、それらの核酸は、その後、核酸タグを読み出すことによってデコンボリュートされる。核酸タグは、分子識別子もしくは分子タグ、サンプル識別子、インデックスタグおよび／またはバーコードとも称され得る。追加的または選択的に、核酸タグを用いることにより、同じサンプル中の異なる分子を区別することができる。これには、例えば、所与のサンプル中の異なる各核酸分子をユニークにタグ化すること、またはそのような分子を非ユニークにタグ化することが含まれる。非ユニークにタグ化する用途の場合、異なる分子が、例えば、少なくとも１つの核酸タグとともに、選択された参照ゲノムに位置する開始／終止位置に基づいて区別され得るように、限られた数のタグを用いて各核酸分子をタグ化し得る。任意の２つの分子が、同じ開始／終止位置を有し、かつ同じ核酸タグを有する確率が低くなる（例えば、約１０％未満、約５％未満、約１％未満または約０．１％未満の確率）ように、通常、十分な数の異なる核酸タグが使用される。いくつかの核酸タグは、サンプル、サンプル内の核酸分子の形、ならびに同じ開始位置および終止位置を有する形の中の核酸分子をラベルする複数の分子識別子を含む。そのような核酸タグは、例示的な形「Ａ１ｉ」を用いて言及され得、ここで、大文字は、サンプルタイプを示し、アラビア数字は、サンプル内の分子の形を示し、小文字のローマ数字は、ある形の中の分子を示す。

ポリヌクレオチド：本明細書中で使用されるとき、「ポリヌクレオチド」、「核酸」、「核酸分子」または「オリゴヌクレオチド」とは、ヌクレオシド間結合によってつながったヌクレオシド（デオキシリボヌクレオシド、リボヌクレオシドまたはそれらのアナログを含む）の直鎖状ポリマーのことを指す。通常、ポリヌクレオチドは、少なくとも３つのヌクレオシドを含む。オリゴヌクレオチドは、数モノマー単位、例えば、３～４個から、数百モノマー単位の範囲のサイズであることが多い。ポリヌクレオチドが、「ＡＴＧＣＣＴＧ」などの文字の配列によって表されるときは常に、それらのヌクレオチドは、左から右に向かって５’→３’の順序であること、およびＤＮＡの場合、別段述べられない限り、「Ａ」は、デオキシアデノシンを表し、「Ｃ」は、デオキシシチジンを表し、「Ｇ」は、デオキシグアノシンを表し、「Ｔ」は、デオキシチミジンを表すことが理解される。Ａ、Ｃ、ＧおよびＴといった文字は、当該分野において標準的であるように、塩基自体、ヌクレオシド、または塩基を含むヌクレオチドのことを指すために使用され得る。

潜在的な臨床的有意性：本明細書中で使用されるとき、アレルバリアントの文脈における「潜在的な臨床的有意性」とは、あるアレルが被験体由来の所与の核酸分子に存在することが、その被験体に対する健康管理の決定に影響を与え得ることを指す。

参照配列：本明細書中で使用されるとき、「参照配列」または「参照ゲノム」とは、実験によって決定された配列との比較目的で使用される公知の配列のことを指す。例えば、公知の配列は、全ゲノム、染色体またはその任意のセグメントであり得る。参照配列は、通常、少なくとも約２０、少なくとも約５０、少なくとも約１００、少なくとも約２００、少なくとも約２５０、少なくとも約３００、少なくとも約３５０、少なくとも約４００、少なくとも約４５０、少なくとも約５００、少なくとも約１０００ヌクレオチドまたはそれを超えるヌクレオチドを含む。参照配列は、ゲノムもしくは染色体の単一の連続配列とアラインメントし得るか、またはゲノムもしくは染色体の種々の領域とアラインメントする連続していないセグメントを含み得る。例示的な参照配列としては、例えば、ヒトゲノム、例えば、ｈＧ１９およびｈＧ３８が挙げられる。

サンプル：本明細書中で使用されるとき、「サンプル」は、本明細書中に開示される方法および／またはシステムによって解析されることが可能なものを意味する。

感度：本明細書中で使用されるとき、所与のアッセイまたは方法の文脈における「感度」とは、そのアッセイまたは方法が、標的の被検体（例えば、腫瘍細胞を起源とするｃｆＤＮＡフラグメント）および標的でない被検体（例えば、非腫瘍細胞を起源とするｃｆＤＮＡフラグメント）を検出および区別する能力のことを指す。

シーケンシング：本明細書中で使用されるとき、「シーケンシング」とは、生体分子、例えば、ＤＮＡまたはＲＮＡなどの核酸の配列（例えば、モノマー単位の同一性および順序）を決定するために用いられるいくつかの技術のうちのいずれかのことを指す。例示的なシーケンシング法としては、ターゲットシーケンシング、一分子リアルタイムシーケンシング、エキソンシーケンシングまたはエクソームシーケンシング、イントロンシーケンシング、電子顕微鏡法に基づくシーケンシング、パネルシーケンシング、トランジスタ媒介性シーケンシング、ダイレクトシーケンシング、ランダムショットガンシーケンシング、Ｓａｎｇｅｒジデオキシ終結シーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションによるシーケンシング、パイロシーケンシング、キャピラリー電気泳動、ゲル電気泳動、二重鎖シーケンシング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、ハイスループットシーケンシング、大規模並列処理シグネチャシーケンシング、エマルジョンＰＣＲ、低変性温度ＰＣＲでの共増幅（ｃｏ－ａｍｐｌｉｆｉｃａｔｉｏｎａｔｌｏｗｅｒｄｅｎａｔｕｒａｔｉｏｎｔｅｍｐｅｒａｔｕｒｅ－ＰＣＲ）（ＣＯＬＤ－ＰＣＲ）、マルチプレックスＰＣＲ、リバーシブルダイターミネーターによるシーケンシング、ペアードエンドシーケンシング、短期（ｎｅａｒ－ｔｅｒｍ）シーケンシング、エキソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、ショートリードシーケンシング、一分子シーケンシング、合成によるシーケンシング、リアルタイムシーケンシング、リバースターミネーターシーケンシング、ナノポアシーケンシング、４５４シーケンシング、ＳｏｌｅｘａＧｅｎｏｍｅＡｎａｌｙｚｅｒシーケンシング、ＳＯＬｉＤ^ＴＭシーケンシング、ＭＳ－ＰＥＴシーケンシングおよびそれらの組み合わせが挙げられるが、これらに限定されない。いくつかの実施形態において、シーケンシングは、遺伝子アナライザー、例えば、とりわけ、Ｉｌｌｕｍｉｎａ，Ｉｎｃ．、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ，Ｉｎｃ．またはＡｐｐｌｉｅｄ
Ｂｉｏｓｙｓｔｅｍｓ／ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃから商業的に入手可能な遺伝子アナライザーによって行われ（ｐｅｒｆｏｒｍｅｒ）得る。

配列情報：本明細書中で使用されるとき、核酸ポリマーの文脈における「配列情報」は、そのポリマーにおけるモノマー単位（例えば、ヌクレオチドなど）の順序および同一性を意味する。

体細胞変異：本明細書中で使用されるとき、「体細胞変異」は、受胎後に生じる、ゲノムにおける変異を意味する。体細胞変異は、生殖細胞を除く身体の任意の細胞において生じ得るので、子孫には受け継がれない。

スプライス部位バリアント：本明細書中で使用されるとき、核酸変異の文脈における「スプライス部位バリアント」とは、エキソンとイントロンの境界線（スプライス部位）において生じる、所与のＤＮＡ配列における遺伝子変化のことを指す。この変化は、ＲＮＡスプライシングを妨害して、エキソンの喪失またはイントロンの包含およびタンパク質コード配列の変化をもたらし得る。

特異度：本明細書中で使用されるとき、診断解析または診断アッセイの文脈における「特異度」とは、その解析またはアッセイが、所与のサンプルの他の構成要素を排除するまで、意図した標的被検体を検出する程度のことを指す。

サブクローナリティスコア：本明細書中で使用されるとき、「サブクローナリティスコア」は、所与のアレルが、あるサンプルセットにおいて観察されたまたは出現した回数の合計数に対する（すなわち、その合計数で除算した）、その所与のアレルが、そのサンプルセットにおいてクローナリティ境界値未満のＭＡＦ／ｍａｘＭＡＦ比の値を有すると観察された回数の比である。

被験体：本明細書中で使用されるとき、「被験体」または「試験被験体」とは、動物、例えば、哺乳動物種（例えば、ヒト）もしくは鳥類（例えば、トリ）の種、または植物などの他の生物のことを指す。より詳細には、被験体は、脊椎動物、例えば、哺乳動物、例えば、マウス、霊長類、サルまたはヒトであり得る。動物には、家畜（例えば、生産用のウシ、乳牛、家禽、ウマ、ブタなど）、競技用動物および伴侶動物（例えば、ペットまたは補助用動物）が含まれる。被験体は、健康な個体、疾患もしくは疾患の素因を有するかもしくは有すると疑われる個体、または療法を必要とするかもしくはまたは療法を必要とすると疑われる個体であり得る。用語「個体」または「患者」は、「被験体」と相互交換可能であると意図される。いくつかの実施形態において、被験体は、癌を有するまたは癌を有すると疑われるヒトである。例えば、被験体は、癌を有すると診断された個体、癌療法を受けることになっている個体、および／または少なくとも１つの癌療法を受けた個体であり得る。被験体は、癌の緩解状態にあり得る。別の例として、被験体は、自己免疫疾患を有すると診断されている個体であり得る。別の例として、被験体は、疾患、例えば、癌、自己免疫疾患を有すると診断されたかもしれないまたは有すると疑われたかもしれない、妊娠中または妊娠を計画中の女性個体であり得る。

実質的なマッチ：本明細書中で使用されるとき、「実質的なマッチ」は、少なくとも１つの第１の値またはエレメントが、少なくとも１つの第２の値またはエレメントと少なくともほぼ等しいことを意味する。ある特定の実施形態において、例えば、ｃｆＤＮＡサンプルの所与のアレルバリアントの細胞起源は、そのアレルバリアントと参照サンプルまたは分類アレルとの間に少なくとも１つの実質的なマッチまたはおおよそのマッチ（例えば、配列アラインメントおよび／または他の臨床情報もしくは特性）があるとき、判定される。

実質的にアラインメントする：本明細書中で使用されるとき、核酸配列のアラインメントの文脈における句「実質的にアラインメントする」は、第１の核酸配列が、第２の核酸配列の少なくとも１つの部分配列と少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％またはさらには１００％の配列同一性を有することを意味する。いくつかの実施形態において、例えば、所与の配列リードが、参照配列の少なくとも１つの部分配列もしくは領域または全体と９５％、９６％、９７％、９８％、９９％または１００％の配列同一性を有するとき、その所与の配列リードは、その参照配列と実質的にアラインメントする。

閾値：本明細書中で使用されるとき、「閾値」とは、実験によって測定された値を特徴付けるまたは分類するために用いられる別々に決定された値のことを指す。

トランケーション：本明細書中で使用されるとき、核酸変異の文脈における「トランケーション」とは、発現されたとき所与のＤＮＡ配列によってコードされるポリペプチド（例えば、タンパク質）を切断または短縮し得る、そのＤＮＡ配列において観察される配列バリエーションのことを指す。

腫瘍フラクション：本明細書中で使用されるとき、「腫瘍フラクション」とは、所与のサンプル中の、腫瘍に由来する核酸分子の割合の推定値のことを指す。例えば、サンプルの腫瘍フラクションは、そのサンプルの最大マイナーアレル頻度（ｍａｘＭＡＦ）もしくはそのサンプルのカバレッジ、あるいはそのサンプル中のｃｆＤＮＡフラグメントの長さ、エピジェネティック状況もしくは他の特性またはそのサンプルの他の任意の選択された特徴から導かれる尺度であり得る。用語「ｍａｘＭＡＦ」とは、所与のサンプル中に存在するすべての体細胞性バリアントのうち最大または最高のＭＡＦのことを指す。いくつかの実施形態において、あるサンプルの腫瘍フラクションは、そのサンプルのｍａｘＭＡＦと等しい。

値：本明細書中で使用されるとき、「値」とは、一般に、その値が言及している特徴を特徴付けるものであり得る、データセットへの登録のことを指す。これには、数字、単語または句、符号（例えば、＋または－）または程度が含まれるが、これらに限定されない。
詳細な説明

緒言

患者から得られたサンプル中に存在するセルフリー核酸（ｃｆＮＡ）における癌細胞ＤＮＡまたは他の標的核酸の検出の改善された感度および／または特異度をもたらすための方法、コンピュータ可読媒体およびシステムが、本明細書中に提供される。その主題の方法、コンピュータ可読媒体およびシステムは、腫瘍のｃｆＤＮＡ解析および他の標的ｃｆＮＡ（例えば、米国特許第９９２０３６６（Ｂ２）号、米国特許第９８４０７４３（Ｂ２）号およびＰＣＴ公開特許出願ＷＯ２０１７／１８１１４６（Ａ１）（これらの各々は、参照により援用される）に記載されている手法）に容易に適用され得る。いくつかの実施形態において、アレルが癌細胞を起源とするかそれとも造血幹細胞を起源とするかを決定するために用いられ得る、それらのアレルを識別する方法が本明細書中に提供される。そのような情報価値のあるアレルは、いったん識別されたら、ある特定の例示的な実施形態において、そのアレルを用いることにより、サンプルを、腫瘍細胞ＤＮＡを含むまたは腫瘍細胞ＤＮＡを含まないと分類することができる。

ＣＦＮＡの細胞起源を決定する方法および関連する態様

本願は、セルフリー核酸（ｃｆＮＡ）サンプルが、所与の細胞タイプまたは組織タイプを起源とする核酸分子またはフラグメントを含むか否かを決定することに関連する様々な方法を開示する。いくつかの例示的な実施形態において、それらの方法は、ｃｆＮＡサンプルが、罹患細胞（例えば、腫瘍細胞など）、胎児細胞、移植ドナー細胞などを起源とする核酸分子（例えば、セルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントおよび／またはセルフリーリボ核酸（ｃｆＲＮＡ）フラグメント）を含むか否かを決定するために用いられる。しばしば、これらのタイプの核酸分子は、所与のｃｆＮＡサンプル中に存在する全核酸分子のほんの一部しか占めず、そのｃｆＮＡサンプルは一般に、例えば、非罹患細胞、正常細胞または健康細胞（例えば、造血幹細胞または他の非腫瘍細胞）、母体細胞、移植レシピエント細胞などを起源とする核酸分子の大きなバックグラウンドを含む。多くの既存の分析技術は、ｃｆＮＡサンプル中にそのような少数で存在する核酸分子を確実に検出し、特徴付けるのに十分な感度を有しない。本明細書中に開示される方法から得られる情報は、通常、ｃｆＮＡサンプルを得た被験体が所与の疾患、障害または症状を有するか否かを診断するために用いられる。ある特定の実施形態において、それらの方法は、被験体に療法を施す工程、または診断された疾患、障害もしくは症状を処置する工程を含む。本願は、例えば、分類器を生成する関連する方法、ならびに試験サンプル中のｃｆＮＡフラグメントの細胞起源を分類する際に有用なサブクローナリティスコアのデータベースを作成する方法も開示する。

主題の方法の様々な実施形態において、複数の遺伝子座のアレルバリアントおよびそれらの各遺伝子座におけるアレル頻度を検出するために、それらの遺伝子座がシーケンシングされる。上記ＤＮＡは、種々の細胞起源（各々がセルフリーＤＮＡを生成する）に由来し得、それによって、同じ遺伝子座について異なるゲノム起源に由来するセルフリーＤＮＡの混合物が生成される。そのＤＮＡ起源は、腫瘍細胞（同じ被験体に存在するいくつかのクローン的に異なる腫瘍細胞バリアントを含む）および非腫瘍細胞（特に、血液細胞）であり得る。いくつかの実施形態では、シーケンシングのためにゲノム領域が標的化される（ホールゲノムシーケンシングとは対照的に）。同じ遺伝子座の複数のアレルを検出するため、およびその遺伝子座におけるアレル頻度を提供するために、ハイスループットＤＮＡ配列決定装置を用いることによって、サンプル由来のｃｆＤＮＡの複数のフラグメントが同時にシーケンシングされ得る。未確定の潜在能をもつクローン性造血（ＣＨＩＰ）は、造血幹細胞が、遺伝的に異なる血液細胞の部分集団の形成に寄与する、ありふれた加齢性の現象である。これらの造血幹細胞は、癌性細胞において生成されたアレルバリアントと混同され得るセルフリーＤＮＡのアレル情報を生成し得る。

参照被験体由来のアレル情報のデータベースを用いることにより、セルフリーＤＮＡサンプルを、腫瘍細胞ＤＮＡを含むまたは含まないと分類するために用いることができるアレルが発見され得る。それらのデータベースは、通常、癌を有すると疑われる任意の被験体由来のセルフリーＤＮＡ配列情報を含む。一般に、データベースが大きいほど、そのデータベースは、セルフリーＤＮＡ内の腫瘍細胞ＤＮＡの有無を示すアレルバリアントを発見するために用いることができるアレルバリアントの特定にとって有用である。データベースでは、各患者に対して、潜在的に臨床的に有意な複数の遺伝子座がシーケンシングされており、シーケンシングされた各遺伝子座について、その遺伝子座における各アレルの頻度を決定する。各遺伝子座に対するマイナーアレル頻度（ＭＡＦ）も決定する。所与のｃｆＤＮＡサンプルにおける遺伝的不均一性のせいで、各ＭＡＦは、遺伝子座によって大きく異なり得る。例えば、ある遺伝子座におけるドライバー変異は、腫瘍の進展中に後のクローンにおいて獲得されるパッセンジャー変異よりも高いＭＡＦを有する可能性が高い。所与の患者について、解析されるアレルセットの中で最大ＭＡＦ（ｍａｘＭＡＦ）を有するアレルが明らかにされ、ｍａｘＭＡＦに対するＭＡＦの値も明らかにされる。データベースは、各患者に対する他の臨床情報も含み得、その他の臨床情報は、各患者の遺伝情報と互いに関係づけられ得る。そのような臨床情報の例としては、腫瘍の検出、患者の生存時間、患者の年齢などが挙げられる。

次いで、ｃｆＤＮＡサンプルを、臨床的に有意な腫瘍ＤＮＡを含むまたは臨床的に有意な腫瘍ＤＮＡを含まないと分類するために用いることができるアレルについて、データベース内のアレル情報をスクリーニングし得る。試験サンプル中の潜在的に臨床的に有意な所与の各アレルバリアントについて、マイナーアレル頻度（ＭＡＦ）とｍａｘＭＡＦとの比を決定する。次いで、目的のアレルに対するＭＡＦ／ｍａｘＭＡＦ比の計算値を、通常、データベース内の多くのサンプルに対して生成する。次いで、データベース（またはデータベースの一部）内の所与のアレルに対する各ＭＡＦ／ｍａｘＭＡＦ値の頻度を求め得る。例えば、ＭＡＦ／ｍａｘＭＡＦ値のヒストグラムをプロットし得る。次いで、サブクローナリティスコアを算出するためにクローナリティ境界値を設定し得る。そのサブクローナリティスコアは、データベースに集められたサンプルに所与のアレルが観察された場合の総数に対する、データベース内の所与のアレルがクローナリティ境界未満のＭＡＦ／ｍａｘＭＡＦ値を有する場合の数の比である。次いで、所与のアレルが腫瘍ＤＮＡの存在を示すか否かを決定するようにカットオフ閾値を設定し得る。その閾値を超えるサブクローナリティスコアを有するアレルを用いることにより、非腫瘍ＤＮＡに由来するアレルを識別することができる。逆に、その閾値未満のサブクローナリティスコアを有するアレルを用いることにより、腫瘍ＤＮＡに由来するアレルを識別することができる。

例えば、５０％のクローナリティ境界値は、例えば図１ＡおよびＢに示されるように設定され得る。示されているように、アレル１は、５０％に設定されたクローナリティ境界値に基づいて推定された高サブクローナリティスコアを有し、アレル２は、低サブクローナリティスコアを有する。したがって、アレルは、いくつかの実施形態において、非腫瘍ＤＮＡを示す（陰性、例えば、図１Ａにおけるアレル１）または腫瘍ＤＮＡを示す（陽性、例えば、図１Ｂにおけるアレル２）、２つのカテゴリーのうちの１つに該当し得る。図１ＡおよびＢに提供される例において、アレル１およびアレル２は、異なる遺伝子に存在し、すなわち、同じ遺伝子座のバリアントアレルではない。この解析は、データベース内の試験された複数のアレルに適用され得、所与のアレルを陽性カテゴリーまたは陰性カテゴリーのいずれかに入れることによって、陽性および陰性のアレルのセットが生成される。必要に応じて、いずれかのカテゴリーからアレルを除外するために、よりストリンジェントな選択閾値を適用してもよく、従って、それらの除外されたアレルは、所与のサンプルに対して分類決定を行うために用いられない。例えば、２５％未満のサブクローナリティスコアを有するアレルは、陽性であり得、７５％を超えるサブクローナリティスコアを有するアレルは、陰性であり得、除外された範囲内（すなわち、２５％～７５％）のアレルは、サンプルを、腫瘍ＤＮＡを含むまたは含まないと分類するために用いられない。類別されたアレルを用いることにより、被験体から得られた所与の試験サンプルを分類するためのアレルのリストを生成することができる。そのようなリストは、その用語の使用の文脈に応じて、「腫瘍バリアントフィルターリスト」または「非腫瘍バリアントフィルターリスト」と称される。また、図１ＡおよびＢは、ＭＡＦ／ｍａｘＭＡＦ分布に対するクローナリティ境界値が、データベースに集められたサンプルに対して５０％に設定されている例を提供している。

低サブクローナリティスコアは、通常、観察されたアレルが、腫瘍ＤＮＡの存在を示すことを示唆する。例えば、スコアがゼロであることは、アレルが観察されたデータベースに集められたどのサンプルにおいても、ＭＡＦ／ｍａｘＭＡＦが、クローナリティ境界値を超えることを示唆し得、それは、そのアレルが、データベース内の各サンプルにおける優勢なマイナーアレルであったことを示唆し得る。

サンプル中の陽性（すなわち、腫瘍起源）および陰性（すなわち、非腫瘍起源）のアレルの有無についての試験に加えて、他の分類基準も、必要に応じて用いられる。臨床的に有意な変異をコールするために、ＭＡＦ／ｍａｘＭＡＦ比から発見された陽性および陰性のアレルセット内の情報を使用することは、一般に、低ＭＡＦを有するアレルにとって最も有用である。いくつかの実施形態において、例えば、所与のバリアントアレルが、１％を超えるＭＡＦを有すると見出され、そのアレルが、陰性アレルである場合、そのアレルが陰性アレルリストに掲載されていたとしても、そのサンプルは、なおも腫瘍ＤＮＡを含むと分類される。別の例において、あるバリアントアレルが、２％を超えるＭＡＦを有すると見出される場合、ある特定の実施形態において、そのアレルが陰性アレルリストに掲載されていたとしても、そのサンプルは、腫瘍ＤＮＡを含むと分類される。他の実施形態では、を超えるＭＡＦ閾値が用いられ得る。

別の例示的な分類基準は、観察されるアレルバリアントのタイプである。いくつかの実施形態において、例えば、アレルバリアントが、サブクローナリティスコアによって陰性と分類され、ＭＡＦが、選択された値より低かったとしても（例えば、いくつかの実施形態では２％未満、他の実施形態では１％未満）、そのバリアントは、臨床的有意性を有するとコールされる。トランケーション、インデルまたはスプライス部位バリアントなどのアレルバリアントは、癌を示し、通常、造血幹細胞には存在しない。

いくつかの実施形態において、患者由来のｃｆＤＮＡサンプルは、以下の基準：（１）トランケーション、インデルまたはスプライス部位バリアントであるアレルバリアントを有する、（２）サブクローナリティスコア陽性アレルを有する、または（３）１％を超えるＭＡＦを有するサブクローナリティスコア陰性アレルを有する、のうちのいずれか１つを満たす場合、癌細胞由来のＤＮＡを含むと特徴付けられ得る。いくつかの実施形態において、患者由来のｃｆＤＮＡサンプルは、以下の基準：（１）トランケーション、インデルまたはスプライス部位バリアントであるアレルバリアントを有する、（２）サブクローナリティスコア陽性アレルを有する、または（３）２％を超えるＭＡＦを有するサブクローナリティスコア陰性アレルを有する、のうちのいずれか１つを満たす場合、癌細胞由来のＤＮＡを含むと特徴付けられ得る。

ＣＨＩＰ変異の頻度は、通常、患者の年齢とともに上昇するので、ある特定の実施形態において、セルフリーＤＮＡサンプルが腫瘍ＤＮＡを含むか否かを決定するために、分類において、患者の年齢および／または他の患者データが利用され得る。他の例示的な実施形態では、例えば、最小ｍａｘＭＡＦに基づいて、サブクローナルリスト（例えば、標的核酸バリアントフィルターリストまたは非標的核酸バリアントフィルターリスト）が、種々のサンプルサブセットにわたって生成され、公知のドライバー変異に基づいてｍａｘＭＡＦなどをコールする。いくつかの実施形態では、特定の指摘（例えば、所与の癌のタイプ（例えば、肺、結腸直腸など））に基づいて、サブクローナルリストが生成される。ある特定の実施形態では、変異アレル頻度、サブクローン比、遺伝子のタイプ、血液悪性腫瘍に関連するバリアント、患者の年齢、他のＣＨＩＰバリアントの観察結果、癌のタイプなどを含む１つまたはそれを超える特徴量に基づいて、機械学習分類器が訓練される。

本明細書中に開示される方法の態様をさらに例証するために、図２は、少なくとも部分的にコンピュータを使用して、被験体内の標的細胞（例えば、腫瘍細胞など）を起源とする核酸分子を検出するための例示的な方法工程を模式的に表しているフローチャートを提供している。示されているように、方法２００は、被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報をコンピュータによって受信する工程を工程２０２に含む。方法２００はまた、標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが試験配列情報に存在することを識別する工程であって、その分類アレルは、少なくとも１つの選択されたカットオフ閾値（例えば、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％、約９０％または別の値）未満のサブクローナリティスコアを含み、それによって、その分類アレルは、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それによって、その被験体内の標的細胞を起源とする核酸分子を検出する、工程を工程２０４に含む。いくつかの実施形態において、例えば、工程２０４は、試験配列情報における少なくとも１つのアレルバリアントを識別する工程；そのアレルバリアントを標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルにマッピングする工程；その分類アレルのサブクローナリティスコアを識別する工程；およびそのサブクローナリティスコアを少なくとも１つの選択されたカットオフ閾値と比較する工程を含み、ここで、そのサブクローナリティスコアが、選択されたカットオフ閾値未満であるとき、それは、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示す。コンピュータおよびコンピュータ可読媒体を含む関連するシステムが、さらに本明細書中に記載される。

図３は、いくつかの実施形態に係る、少なくとも部分的にコンピュータを使用して、被験体内の腫瘍細胞を起源とする核酸分子を検出するための例示的な方法工程を模式的に表しているフローチャートを提供している。示されているように、方法３００は、被験体から得られた試験サンプル中のセルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントから得られた配列リードを含む試験配列情報をコンピュータによって受信する工程を工程３０２に含む。方法３００はまた、コンピュータによって、被験体の造血幹細胞を起源とする１つまたはそれを超える配列リード（例えば、分類アレルの少なくとも一部を含む）を試験配列情報から除去（例えば、削除、非表示、無視など）して、フィルターされた試験配列情報を生成する工程を工程３０４に含む。方法３００はさらに、１またはそれを超える参照被験体から得られた参照配列情報と実質的にアラインメントする１つまたはそれを超える上記配列リードが上記フィルターされた試験配列情報に存在することをコンピュータによって識別する工程であって、その参照配列情報は、参照被験体内の１つまたはそれを超える腫瘍細胞を起源とし、それによって、被験体内の腫瘍細胞を起源とする核酸分子を検出する、工程を工程３０６に含む。

図４は、被験体における疾患を処置する例示的な方法工程を模式的に表しているフローチャートを提供している。示されているように、方法４００は、被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信する工程を工程４０２に含む。方法４００はさらに、標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが試験配列情報に存在することを識別する工程であって、その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、その分類アレルが、罹患細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それによって、その被験体における疾患を診断する、工程を工程４０４に含む。さらに、方法４００はまた、被験体に１つまたはそれを超える療法を施し、それによって、被験体における疾患を処置する工程を工程４０６に含む。例示的な療法は、本明細書中にさらに記載される。

図５は、少なくとも部分的にコンピュータを使用して分類器を生成する例示的な方法工程を模式的に表しているフローチャートを提供している。示されているように、方法５００は、１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアをコンピュータによって生成する工程を工程５０２に含み、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む。方法５００はまた、それらのサブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値（例えば、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％、約９０％または別の値）をコンピュータによって比較し、ここで、選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、その分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、その分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられ、それによって、分類器を生成する工程を工程５０４に含む。

図６は、少なくとも部分的にコンピュータを使用して分類器を生成する例示的な方法工程を模式的に表しているフローチャートを提供している。示されているように、方法６００は、１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットをコンピュータによって識別する工程であって、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む、工程を工程６０２に含む。方法６００はまた、その配列情報から、各参照サンプルにおける各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値をコンピュータによって決定する工程を工程６０４に含み、各参照サンプルに対する最大マイナーアレル頻度（ｍａｘＭＡＦ）の値をコンピュータによって決定する工程を工程６０６に含む。方法６００はまた、所与の参照サンプルにおいて観察された各分類アレルについて、参照サンプルの少なくとも一部に対するｍａｘＭＡＦの値に対するＭＡＦの値の比をコンピュータによって計算して、比の値を生成する工程を工程６０８に含む。方法６００はまた、参照サンプルの少なくとも一部における所与の分類アレルが、参照サンプルの少なくとも一部に出現したその所与の分類アレルの回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値（例えば、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％、約９０％または別の値）未満の比の値を有した回数の比を、各分類アレルについて、コンピュータによって計算して、参照サンプルの少なくとも一部における各分類アレルに対するサブクローナリティスコアを生成する工程を工程６１０に含む。さらに、方法６００は、それらのサブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値（例えば、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％、約９０％または別の値）をコンピュータによって比較し、ここで、選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられ、それによって、分類器を生成する工程を工程６１２に含む。

いくつかの実施形態において、上記方法は、被験体からｃｆＤＮＡサンプルを得る工程を含む。本質的に任意のサンプルタイプが、必要に応じて利用される。ある特定の実施形態において、例えば、ｃｆＤＮＡサンプルは、血液、血漿、血清、痰、尿、精液、膣液、便、滑液、髄液、唾液などである。必要に応じて利用されるさらなる例示的なサンプルタイプは、本明細書中にさらに記載される。通常、被験体は、哺乳動物被験体（例えば、ヒト被験体）である。本質的に任意のタイプの核酸（例えば、ＤＮＡおよび／またはＲＮＡ）が、本願に開示されている方法に従って評価され得る。いくつかの例としては、セルフリー核酸（例えば、腫瘍起源、胎児起源、母体起源などのｃｆＤＮＡ）、細胞性核酸（循環腫瘍細胞（例えば、サンプル中のインタクトな細胞を溶解することによって得られる）を含む）、循環腫瘍核酸などが挙げられる。

本願に開示される方法は、一般に、被験体から採取されたサンプル中の核酸から配列情報を得る工程を含む。ある特定の実施形態において、その配列情報は、核酸の標的化セグメントから得られる。本質的に任意の数のゲノム領域が、必要に応じて標的化される。標的化セグメントは、少なくとも１０、少なくとも５０、少なくとも１００、少なくとも５００、少なくとも１０００、少なくとも２０００、少なくとも５０００、少なくとも１０，０００、少なくとも２０，０００または少なくとも５０、０００（例えば、２５、５０、７５、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２５，０００、３０，０００、３５，０００、４０，０００、４５，０００）個の異なるおよび／または重複したゲノム領域を含み得る。

これらの実施形態において、上記方法は、通常、シーケンシング用の核酸を調製するための様々なサンプル調製工程またはライブラリー調製工程も含む。多くの異なるサンプル調製法が、当業者に周知である。それらの手法のうち本質的に任意のものが、本明細書中に記載される方法を行う際に使用されるか、または使用するために適合される。例えば、所与のサンプル中の他の構成要素から核酸を単離するための様々な精製工程に加えて、シーケンシング用の核酸を調製するための代表的な工程としては、核酸を分子識別子またはバーコードでタグ化すること、アダプター（例えば、バーコードを含み得る）を付加すること、核酸を１回またはそれを超える回数、増幅すること、核酸の標的化セグメントを濃縮すること（例えば、様々な標的捕捉ストラテジーなどを用いて）などが挙げられる。例示的なライブラリー調製プロセスは、本明細書中にさらに記載される。核酸サンプル／ライブラリーの調製に関するさらなる詳細は、例えば、ｖａｎＤｉｊｋら、Ｌｉｂｒａｒｙｐｒｅｐａｒａｔｉｏｎｍｅｔｈｏｄｓｆｏｒｎｅｘｔ－ｇｅｎｅｒａｔｉｏｎｓｅｑｕｅｎｃｉｎｇ：Ｔｏｎｅｄｏｗｎｔｈｅｂｉａｓ，ＥｘｐｅｒｉｍｅｎｔａｌＣｅｌｌＲｅｓｅａｒｃｈ，３２２（１）：１２－２０（２０１４）、Ｍｉｃｉｃ（Ｅｄ．），ＳａｍｐｌｅＰｒｅｐａｒａｔｉｏｎＴｅｃｈｎｉｑｕｅｓｆｏｒＳｏｉｌ，Ｐｌａｎｔ，ａｎｄＡｎｉｍａｌＳａｍｐｌｅｓ（ＳｐｒｉｎｇｅｒＰｒｏｔｏｃｏｌｓＨａｎｄｂｏｏｋｓ），１^ｓｔＥｄ．，ＨｕｍａｎａＰｒｅｓｓ（２０１６）およびＣｈｉｕ，Ｎｅｘｔ－ＧｅｎｅｒａｔｉｏｎＳｅｑｕｅｎｃｉｎｇａｎｄＳｅｑｕｅｎｃｅＤａｔａＡｎａｌｙｓｉｓ，ＢｅｎｔｈａｍＳｃｉｅｎｃｅＰｕｂｌｉｓｈｅｒｓ（２０１８）（これらの各々は、その全体が参照により援用される）にも記載されている。

本明細書中に開示される方法は、通常、疾患、障害もしくは症状、特に癌が被験体に存在すると診断するため、そのような疾患、障害もしくは症状を特徴付けるため（例えば、所与の癌をステージ分類するため、癌の不均一性を明らかにするためなど）、処置に対する応答をモニターするため、所与の疾患、障害もしくは症状を発症する潜在的リスクを評価するため、および／またはその疾患、障害もしくは症状の予後を評価するために、用いられる。本明細書中に開示される方法は、必要に応じて、特定の形態の癌を特徴付けるためにも用いられる。癌は、組成とステージ分類の両方が不均一であることが多いので、本明細書中に開示される方法を用いて生成されるデータは、癌の特定のサブタイプの特徴付けを可能にし、それによって、診断および処置の選択を支援し得る。この情報はまた、特定のタイプの癌の予後に関する手がかりを被験体または医療関係者に提供し得、被験体および／または医療関係者が疾患の進行に従って処置の選択肢を適応させることを可能にし得る。一部の癌は、進行するにつれて、侵襲的になり、遺伝的に不安定になる。他の腫瘍は、良性、不活性または休止状態のままである。

サンプル

サンプルは、被験体から単離された任意の生物学的サンプルであり得る。サンプルには、体組織、全血、血小板、血清、血漿、便、赤血球、白血球細胞または白血球、内皮細胞、組織生検材料（例えば、既知のまたは疑いのある固形腫瘍由来の生検材料）、脳脊髄液、滑液、リンパ液、腹水、間質液または細胞外液（例えば、細胞間隙由来の体液）、歯肉滲出液、歯肉溝液、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿が含まれ得る。サンプルは、好ましくは、体液、特に、血液およびその画分ならびに尿である。そのようなサンプルは、腫瘍から脱落した核酸を含む。それらの核酸は、ＤＮＡおよびＲＮＡを含み得、二本鎖および一本鎖の形態であり得る。サンプルは、被験体から単離されたままの形態であり得るか、あるいは細胞などの構成要素を除去もしくは添加する、１つの構成要素を別の構成要素に対して濃縮する、または１つの形態の核酸を別の形態に（例えば、ＲＮＡをＤＮＡに、または一本鎖核酸を二本鎖に）変換するさらなる処理に供されたものであり得る。したがって、例えば、解析用の体液サンプルは、セルフリー核酸、例えば、セルフリーＤＮＡ（ｃｆＤＮＡ）を含む血漿または血清である。

いくつかの実施形態において、被験体から採取される体液サンプルの体積は、シーケンシングされる領域に対する所望のリードデプスに依存する。例示的な体積は、約０．４～４０ｍｌ、約５～２０ｍｌ、約１０～２０ｍｌである。例えば、その体積は、約０．５ｍｌ、約１ｍｌ、約５ｍｌ、約１０ｍｌ、約２０ｍｌ、約３０ｍｌ、約４０ｍｌまたはそれを超えるミリリットルであり得る。サンプリングされる血漿の体積は、通常、約５ｍｌ～約２０ｍｌである。

サンプルは、様々な量の核酸を含み得る。通常、所与のサンプル中の核酸の量は、複数のゲノム当量（ｇｅｎｏｍｅｅｑｕｉｖａｌｅｎｔｓ）と同等と見なされる。例えば、約３０ｎｇのＤＮＡのサンプルは、約１０，０００（１０^４）半数体ヒトゲノム当量、ｃｆＤＮＡの場合は、約２０００億（２×１０^１１）個の個々のポリヌクレオチド分子を含み得る。同様に、約１００ｎｇのＤＮＡのサンプルは、約３０，０００半数体ヒトゲノム当量、ｃｆＤＮＡの場合は、約６０００億個の個々の分子を含み得る。

いくつかの実施形態において、サンプルは、種々の起源、例えば、細胞およびセルフリー起源（例えば、血液サンプルなど）に由来する核酸を含む。通常、サンプルは、変異を有する核酸を含む。例えば、サンプルは、必要に応じて、生殖細胞系列変異および／または体細胞変異を有するＤＮＡを含む。通常、サンプルは、癌に関連する変異（例えば、癌に関連する体細胞変異）を有するＤＮＡを含む。

増幅前のサンプル中のセルフリー核酸の例示的な量は、通常、約１フェムトグラム（ｆｇ）～約１マイクログラム（μｇ）、例えば、約１ピコグラム（ｐｇ）～約２００ナノグラム（ｎｇ）、約１ｎｇ～約１００ｎｇ、約１０ｎｇ～約１０００ｎｇの範囲である。いくつかの実施形態において、サンプルは、最大約６００ｎｇ、最大約５００ｎｇ、最大約４００ｎｇ、最大約３００ｎｇ、最大約２００ｎｇ、最大約１００ｎｇ、最大約５０ｎｇまたは最大約２０ｎｇのセルフリー核酸分子を含む。必要に応じて、その量は、少なくとも約１ｆｇ、少なくとも約１０ｆｇ、少なくとも約１００ｆｇ、少なくとも約１ｐｇ、少なくとも約１０ｐｇ、少なくとも約１００ｐｇ、少なくとも約１ｎｇ、少なくとも約１０ｎｇ、少なくとも約１００ｎｇ、少なくとも約１５０ｎｇまたは少なくとも約２００ｎｇのセルフリー核酸分子である。ある特定の実施形態において、その量は、最大約１ｆｇ、約１０ｆｇ、約１００ｆｇ、約１ｐｇ、約１０ｐｇ、約１００ｐｇ、約１ｎｇ、約１０ｎｇ、約１００ｎｇ、約１５０ｎｇまたは約２００ｎｇのセルフリー核酸分子である。いくつかの実施形態において、方法は、約１ｆｇ～約２００ｎｇのセルフリー核酸分子をサンプルから得る工程を含む。

セルフリー核酸は、通常、約１００ヌクレオチド長～約５００ヌクレオチド長のサイズ分布を有し、約１１０ヌクレオチド長～約２３０ヌクレオチド長の分子が、サンプル中の分子の約９０％を占め、約１６８ヌクレオチド長という最頻値、および約２４０～約４４０ヌクレオチド長の範囲に第２の小さなピークを有する。ある特定の実施形態において、セルフリー核酸は、約１６０～約１８０ヌクレオチド長または約３２０～約３６０ヌクレオチド長または約４４０～約４８０ヌクレオチド長である。

いくつかの実施形態において、セルフリー核酸は、溶液中に見られるセルフリー核酸をインタクトな細胞および体液の他の不溶性の構成要素から分離する分割工程によって体液から単離される。これらの実施形態のうちのいくつかにおいて、分割は、遠心分離または濾過などの手法を含む。あるいは、体液中の細胞を溶解し、セルフリー核酸および細胞性核酸を共に処理する。一般に、緩衝液の添加および洗浄工程の後、例えばアルコールを用いて、セルフリー核酸を沈殿させる。ある特定の実施形態では、シリカベースのカラムなどのさらなるクリーンアップ工程を用いて、夾雑物または塩を除去する。その反応全体にわたって、例えば、非特異的なバルクのキャリア核酸を必要に応じて加えることにより、その例示的な手順のある特定の面（例えば、収率）が最適化される。そのような処理の後、サンプルは、通常、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび／または一本鎖ＲＮＡをはじめとした様々な形態の核酸を含む。必要に応じて、一本鎖ＤＮＡおよび／または一本鎖ＲＮＡを二本鎖の形態に変換し、それをその後の処理工程および解析工程に含める。

核酸タグ

ある特定の実施形態において、分子識別子またはバーコードを提供するタグが、とりわけ、化学合成、ライゲーションまたはオーバーラップ伸長ＰＣＲによって、アダプターに組み込まれるか、またはその他の方法で結合される。いくつかの実施形態において、反応におけるユニークなもしくはユニークでない識別子、または分子バーコードの割り当ては、例えば、米国特許出願第２００１００５３５１９号、同第２００３０１５２４９０号、同第２０１１０１６００７８号ならびに米国特許第６，５８２，９０８号、同第７，５３７，８９８号および同第９，５９８，７３１号（これらの各々が参照により援用される）に記載されている方法に従い、それらに記載されているシステムを利用する。

タグは、ランダムにまたは非ランダムにサンプル核酸に連結される。いくつかの実施形態において、タグは、予想される、識別子（例えば、ユニークなバーコードおよび／またはユニークでないバーコードの組み合わせ）とマイクロウェルとの比で導入される。例えば、ゲノムサンプル１つあたり約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００個を超える識別子がロードされるように、識別子はロードされ得る。いくつかの実施形態では、ゲノムサンプル１つあたり約２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００個未満の識別子がロードされるように、識別子はロードされる。ある特定の実施形態において、ゲノムサンプル１つあたりにロードされる識別子の平均数は、ゲノムサンプル１つあたり約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００もしくは１，０００，０００，０００個未満、または約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００もしくは１，０００，０００，０００個を超える識別子である。それらの識別子は、一般に、ユニークおよび／または非ユニークである。

例示的な形式の１つは、標的核酸分子の両端にライゲートされた、約２～約１，０００，０００個の異なるタグまたは約５～約１５０個の異なるタグまたは約２０～約５０個の異なるタグを使用する。２０～５０×２０～５０個のタグの場合、合計４００～２５００個のタグが生成される。そのような数のタグは、通常、同じ開始点および終止点を有する異なる分子が、異なるタグの組み合わせを受け取る確率が高確率（例えば、少なくとも９４％、９９．５％、９９．９９％、９９．９９９％）となるのに十分である。

いくつかの実施形態において、識別子は、所定の、ランダムな、またはセミランダムな、配列オリゴヌクレオチドである。他の実施形態では、複数のバーコードがその複数の中で互いに必ずしもユニークでないように、複数のバーコードが用いられ得る。これらの実施形態では、バーコードは、そのバーコードとそれが付着し得る配列との組み合わせが、個別に追跡され得るユニークな配列を生成するように、一般に、個々の分子に付着される（例えば、ライゲーションまたはＰＣＲ増幅によって）。本明細書中に記載されるように、配列リードの始め（開始）および終わり（終止）の部分の配列データとともに、非ユニークにタグ化されたバーコードを検出することによって、通常、ユニークな同一性を特定の分子に割り当てることが可能になる。個々の配列リードの長さ、すなわち塩基対の数を必要に応じて用いることによっても、ユニークな同一性が所与の分子に割り当てられる。本明細書中に記載されるように、それによって、ユニークな同一性を割り当てられた一本鎖の核酸由来のフラグメントが、その後の、親鎖由来のフラグメントおよび／または相補鎖の特定を可能にし得る。

核酸増幅

アダプターと隣接しているサンプル核酸は、通常、増幅されるＤＮＡ分子に隣接するアダプター内のプライマー結合部位に結合する核酸プライマーを用いて、ＰＣＲおよび他の増幅方法によって増幅される。いくつかの実施形態において、増幅方法は、サーモサイクリングによってもたらされる、伸長、変性およびアニーリングのサイクルを含むか、または例えば、転写媒介増幅におけるような等温性であり得る。必要に応じて利用される他の例示的な増幅方法としては、とりわけ、リガーゼ連鎖反応、鎖置換増幅、核酸配列に基づく増幅および自家持続配列に基づく複製が挙げられる。

従来の核酸増幅方法を用いて核酸分子に分子タグおよび／またはサンプルインデックス／タグを導入するためには、通常、１回またはそれを超える回数の増幅サイクルが適用される。それらの増幅は、通常、１つまたはそれを超える反応混合物において行われる。分子タグおよびサンプルインデックス／タグは、必要に応じて、同時にまたは任意の連続した順序で導入される。いくつかの実施形態において、分子タグおよびサンプルインデックス／タグは、配列捕捉工程が行われる前および／または後に導入される。いくつかの実施形態では、分子タグだけが、プローブ捕捉の前に導入され、配列捕捉工程を行った後に、サンプルインデックス／タグが導入される。ある特定の実施形態では、分子タグとサンプルインデックス／タグの両方が、プローブに基づく捕捉工程を行う前に導入される。いくつかの実施形態において、サンプルインデックス／タグは、配列捕捉工程を行った後に導入される。通常、配列捕捉プロトコルは、標的化された核酸配列、例えば、あるゲノム領域のコード配列、およびある癌のタイプに関連するそのような領域の変異に相補的な一本鎖核酸分子を導入する工程を含む。通常、増幅反応は、約２００ヌクレオチド（ｎｔ）～約７００ｎｔ、２５０ｎｔ～約３５０ｎｔまたは約３２０ｎｔ～約５５０ｎｔの範囲のサイズの分子タグおよびサンプルインデックス／タグを有する、非ユニークにまたはユニークにタグ化された複数の核酸アンプリコンを生成する。いくつかの実施形態において、それらのアンプリコンは、約３００ｎｔのサイズを有する。いくつかの実施形態において、それらのアンプリコンは、約５００ｎｔのサイズを有する。

核酸濃縮

いくつかの実施形態において、核酸をシーケンシングする前に、配列が濃縮される。濃縮は、必要に応じて、特定の標的領域に対して行われるかまたは非特異的に行われる（「標的配列」）。いくつかの実施形において、標的化された目的の領域は、差次的なタイリングおよび捕捉スキームを用いて、１つまたはそれを超えるベイトセットパネルに対して選択された核酸捕捉プローブ（「ベイト」）を用いて濃縮され得る。差次的なタイリングおよび捕捉スキームは、一般に、異なる相対的濃度のベイトセットを用いて、それらのベイトに関連するゲノム区画にわたって差次的に（例えば、異なる「解像度」で）タイリングし、制約セット（例えば、シーケンシングロード、各ベイトの有用性などの配列分析装置の制約）にかけ、下流のシーケンシングにとって所望のレベルで標的化核酸を捕捉する。これらの標的化された目的のゲノム区画は、必要に応じて、核酸構築物の天然または合成のヌクレオチド配列を含む。いくつかの実施形態において、１つまたはそれを超える目的の区画に対するプローブを有するビオチン標識ビーズを用いることにより、標的配列を捕捉し、必要に応じてその後、それらの区画を増幅して、目的の領域を濃縮することができる

配列捕捉は、通常、標的核酸配列にハイブリダイズするオリゴヌクレオチドプローブの使用を必要とする。ある特定の実施形態において、プローブセットストラテジーは、目的の区画にわたってプローブをタイリングすることを含む。そのようなプローブは、例えば、約６０～約１２０ヌクレオチド長であり得る。そのセットは、約２ｘ、３ｘ、４ｘ、５ｘ、６ｘ、８ｘ、９ｘ、ｌ０ｘ、１５ｘ、２０ｘ、５０ｘまたはそれを超える深さを有し得る。配列捕捉の有効性は、一般に、プローブの配列と相補的な（またはほぼ相補的な）、標的分子における配列の長さに部分的に依存する。

核酸シーケンシング

必要に応じてアダプターと隣接している、サンプル核酸は一般に、事前増幅ありまたはなしで、シーケンシングに供される。必要に応じて利用されるシーケンシングの方法または商業的に利用可能な形式としては、例えば、Ｓａｎｇｅｒシーケンシング、ハイスループットシーケンシング、バイサルファイトシーケンシング、パイロシーケンシング、合成によるシーケンシング、一分子シーケンシング、ナノポアに基づくシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ＲＮＡ－Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、ＤｉｇｉｔａｌＧｅｎｅＥｘｐｒｅｓｓｉｏｎ（Ｈｅｌｉｃｏｓ）、次世代シーケンシング（ＮＧＳ）、ＳｉｎｇｌｅＭｏｌｅｃｕｌｅＳｅｑｕｅｎｃｉｎｇｂｙＳｙｎｔｈｅｓｉｓ（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、超並列シーケンシング、ＣｌｏｎａｌＳｉｎｇｌｅＭｏｌｅｃｕｌｅＡｒｒａｙ（Ｓｏｌｅｘａ）、ショットガンシーケンシング、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、マクサム・ギルバートシーケンシング、プライマーウォーキング、ＰａｃＢｉｏを用いたシーケンシング、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔまたはナノポアプラットフォームが挙げられる。シーケンシング反応は、複数のレーン、複数のチャネル、複数のウェル、または複数のサンプルセットを実質的に同時に処理する他の手段を備え得る種々のサンプル処理装置において行われ得る。サンプル処理装置は、複数のランの処理を同時に可能にする複数のサンプルチャンバーも備え得る。

シーケンシング反応は、癌または他の疾患のマーカーを含むと知られている１つまたはそれを超える（ｏｎｅｍｏｒｅ）核酸フラグメントタイプまたは区画に対して行われ得る。シーケンシング反応は、サンプル中に存在する任意の核酸フラグメントに対しても行われ得る。シーケンシング反応（ｓｅｑｕｅｎｃｅｒｅａｃｔｉｏｎｓ）は、ゲノムの少なくとも約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％というゲノムの配列カバレッジを提供し得る。他の場合では、ゲノムの配列カバレッジは、ゲノムの約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％未満であり得る。

同時のシーケンシング反応が、マルチプレックスシーケンシング法を用いて行われ得る。いくつかの実施形態において、セルフリーポリヌクレオチドは、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００シーケンシング反応によってシーケンシングされる。他の実施形態において、セルフリーポリヌクレオチドは、約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００未満のシーケンシング反応によってシーケンシングされる。シーケンシング反応は、通常、連続的にまたは同時に行われる。その後のデータ解析は、一般に、シーケンシング反応の全部または一部に対して行われる。いくつかの実施形態において、データ解析は、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００シーケンシング反応に対して行われる。他の実施形態において、データ解析は、約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００または１００，０００未満のシーケンシング反応に対して行われ得る。例示的なリードデプスは、１遺伝子座（塩基位置）あたり約１０００～約５００００リードである。

いくつかの実施形態において、片端または両端に一本鎖オーバーハングを有する二本鎖核酸に平滑末端を酵素的に形成することによって、シーケンシング用の核酸集団が調製される。これらの実施形態において、その集団は、通常、ヌクレオチド（例えば、Ａ、Ｃ、ＧおよびＴまたはＵ）の存在下において、５’－３’ＤＮＡポリメラーゼ活性および３’－５’エキソヌクレアーゼ活性を有する酵素で処理される。例示的な酵素または必要に応じて使用されるその触媒フラグメントとしては、クレノウラージフラグメントおよびＴ４ポリメラーゼが挙げられる。５’オーバーハングでは、上記酵素は、通常、反対鎖の陥凹３’末端を５’末端と揃うまで伸長して、平滑末端を生成する。３’オーバーハングでは、上記酵素は一般に、その３’末端から反対鎖の５’末端まで、時折、反対鎖の５’末端を越えて消化する。この消化が、反対鎖の５’末端を越えて進む場合、５’オーバーハングに対して用いられる同じポリメラーゼ活性を有する酵素によって、ギャップが満たされ得る。二本鎖核酸に対する平滑末端の形成によって、例えば、アダプターの付着およびその後の増幅が容易になる。

いくつかの実施形態において、核酸集団は、さらなる処理（例えば、一本鎖核酸から二本鎖への変換および／またはＲＮＡからＤＮＡへの変換）に供される。これらの形態の核酸はまた、必要に応じて、アダプターに連結され、増幅される。

事前の増幅ありまたはなしで、上に記載された平滑末端を形成するプロセスに供された核酸、および必要に応じてサンプル中の他の核酸をシーケンシングして、シーケンシングされた核酸が生成され得る。シーケンシングされた核酸は、核酸の配列（すなわち、配列情報）または配列が決定された核酸のいずれかのことを指すことができる。シーケンシングは、サンプル中の個々の核酸分子の増幅産物のコンセンサス配列から、サンプル中の個々の核酸分子の配列データを直接または間接的に提供するために行われ得る。

いくつかの実施形態において、平滑末端形成の後、サンプル中の一本鎖オーバーハングを有する二本鎖核酸は、両端において、バーコードを含むアダプターに連結され、シーケンシングによって、核酸配列、ならびにアダプターによって導入されたインラインバーコードが決定される。それらの平滑末端ＤＮＡ分子は、必要に応じて、少なくとも部分的に二本鎖のアダプター（例えば、Ｙ形またはベル形のアダプター）の平滑末端にライゲートされる。あるいは、サンプル核酸およびアダプターの平滑末端は、相補的なヌクレオチドでテイル化されて、ライゲーション（例えば、粘着末端ライゲーション）を容易にし得る。

核酸サンプルは、通常、同じ核酸の任意の２コピーが、両端において連結されたアダプターから同じ組み合わせのアダプターバーコードを受け取る確率が低確率（例えば、＜１または０．１％）になるように、十分な数のアダプターと接触される。このようにアダプターを使用することにより、参照核酸上に同じ開始点および終止点を有する核酸配列のファミリーの特定、および同じ組み合わせのバーコードに連結された核酸配列のファミリーの特定が可能となる。そのようなファミリーは、増幅前のサンプル中の核酸の増幅産物の配列に相当する。それらのファミリーメンバーの配列は、平滑末端形成およびアダプター付着によって修飾された、元のサンプル中の核酸分子に対するコンセンサスヌクレオチドまたは完全なコンセンサス配列を導き出すためにコンパイルされ得る。換言すれば、そのサンプル中のある核酸の特定の位置を占めるヌクレオチドは、ファミリーメンバー配列内のその対応する位置を占めるヌクレオチドのコンセンサスであると判断される。ファミリーは、二本鎖核酸の一方または両方の鎖の配列を含み得る。あるファミリーのメンバーが、二本鎖核酸の両方の鎖の配列を含む場合、一方の鎖の配列は、コンセンサスヌクレオチドまたはコンセンサス配列を導き出すためにすべての配列をコンパイルする目的で、それらの相補鎖に変換される。いくつかのファミリーは、ただ１つのメンバー配列だけを含む。この場合、この配列は、増幅前のサンプル中の核酸の配列とみなされ得る。あるいは、ただ１つのメンバー配列だけを含むファミリーは、その後の解析から除外され得る。

シーケンシングされた核酸におけるヌクレオチドバリエーションは、シーケンシングされた核酸を参照配列と比較することによって明らかにされ得る。参照配列は、既知の配列、例えば、被験体の既知のホールゲノム配列または部分ゲノム配列（例えば、ヒト被験体のホールゲノム配列）であることが多い。参照配列は、例えば、ｈＧ１９またはｈＧ３８であり得る。シーケンシングされた核酸は、上に記載されたような、サンプル中の核酸に対して直接決定された配列またはそのような核酸の増幅産物の配列のコンセンサスに相当し得る。比較は、参照配列上の１つまたはそれを超える指定の位置において行われ得る。参照配列の指定の位置と対応する位置を含むシーケンシングされた核酸のサブセットは、それぞれの配列が最大限にアラインメントされたとき、識別され得る。そのようなサブセット内において、どのシーケンシングされた核酸が、指定の位置にヌクレオチドバリエーションを含むのか（もしあれば）、その終点（すなわち、５’および３’末端のヌクレオチド）が参照配列にマッピングされる場所に基づく所与のｃｆＤＮＡフラグメントの長さ、所与のｃｆＤＮＡフラグメントにおけるゲノム領域の中間点からのそのｃｆＤＮＡフラグメントの中間点のオフセット、および必要に応じて、どれが参照ヌクレオチド（すなわち、参照配列中のものと同じヌクレオチド）を含むのか（もしあれば）を明らかにすることができる。ヌクレオチドバリアントを含むサブセット内のシーケンシングされた核酸の数が、選択された閾値を超える場合、指定の位置においてバリアントヌクレオチドがコールされ得る。その閾値は、単純な数（例えば、ヌクレオチドバリアントを含むサブセット内の少なくとも１、２、３、４、５、６、７、９または１０個のシーケンシングされた核酸）であり得るか、または比（例えば、とりわけ、ヌクレオチドバリアントを含むサブセット内のシーケンシングされた核酸に対する少なくとも（ａｌｅａｓｔ）０．５、１、２、３、４、５、１０、１５または２０）であり得る。比較は、参照配列における任意の目的の指定の位置に対して反復され得る。時折、参照配列上の少なくとも約２０、１００、２００または３００個連続した位置、例えば、約２０～５００または約５０～３００個連続した位置を占める指定の位置に対して、比較が行われ得る。

本明細書中に記載される形式および用途を含む核酸シーケンシングに関するさらなる詳細は、例えば、Ｌｅｖｙら、ＡｎｎｕａｌＲｅｖｉｅｗｏｆＧｅｎｏｍｉｃｓａｎｄＨｕｍａｎＧｅｎｅｔｉｃｓ，１７：９５－１１５（２０１６）、Ｌｉｕら、Ｊ．ｏｆＢｉｏｍｅｄｉｃｉｎｅａｎｄＢｉｏｔｅｃｈｎｏｌｏｇｙ，Ｖｏｌｕｍｅ２０１２，ＡｒｔｉｃｌｅＩＤ２５１３６４：１－１１（２０１２）、Ｖｏｅｌｋｅｒｄｉｎｇら、ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８（２００９）、ＭａｃＬｅａｎら、ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６（２００９）、Ａｓｔｉｅｒら、ＪＡｍＣｈｅｍＳｏｃ．，１２８（５）：１７０５－１０（２００６）、米国特許第６，２１０，８９１号、米国特許第６，２５８，５６８号、米国特許第６，８３３，２４６号、米国特許第７，１１５，４００号、米国特許第６，９６９，４８８号、米国特許第５，９１２，１４８号、米国特許第６，１３０，０７３号、米国特許第７，１６９，５６０号、米国特許第７，２８２，３３７号、米国特許第７，４８２，１２０号、米国特許第７，５０１，２４５号、米国特許第６，８１８，３９５号、米国特許第６，９１１，３４５号、米国特許第７，５０１，２４５号、米国特許第７，３２９，４９２号、米国特許第７，１７０，０５０号、米国特許第７，３０２，１４６号、米国特許第７，３１３，３０８号および米国特許第７，４７６，５０３号（これらの各々は、その全体が参照により援用される）にも提供されている。

データ解析

いくつかの実施形態において、シーケンシングの生データは、様々なファイル形式（例えば、ＦＡＳＴＱ、ＶＣＦ、ＣＲＡＭまたはＢＡＭ）で提供され得る配列リードセットを含み得る。シーケンシングの生データを含むファイルは、ペアードエンドリードにおけるように、一方の鎖または両方の鎖に対する配列データを含み得る。一例において、シーケンシングの生データは、両方の鎖、すなわち、ペアードエンドシーケンシング手順から生成されたセンス鎖およびアンチセンス鎖に対するＦＡＳＴＱファイルとして提供される。それらのファイルは、リードの品質に関する情報を提供するさらなる符号を含み得、品質スコアも提供し得る。各ポリヌクレオチド分子のシーケンシングの生データは、ローカルドライブ、クラウドまたはサーバーに保存され得る。

いくつかの場合では、シーケンシング反応によって生成された配列リードは、バイオインフォマティクス解析を行うために、参照配列とアラインメントされ得るか、または参照配列にマッピングされ得る。参照配列は、既知の配列、例えば、ある対象の既知のホールゲノム配列または部分ゲノム配列、ヒト被験体のホールゲノム配列であることが多い。参照配列は、ｈＧ１９であり得る。シーケンシングされた核酸は、上に記載されたように、サンプル中の核酸に対して直接決定された配列またはそのような核酸の増幅産物の配列のコンセンサスに相当し得る。比較は、参照配列上の１つまたはそれを超える指定の位置において行われ得る。

配列リードは、マッピングツールを用いて参照配列とアラインメントされ得、そのマッピングツールの非限定的な例としては、Ｂｕｒｒｏｗ’ｓＷｈｅｅｌｅｒＴｒａｎｓｆｏｒｍ（ＢＷＡ）、ＮｏｖｏａｌｉｇｎおよびＢｏｗｔｉｅが挙げられ得る。それらのマッピングツールは、使用されるアラインメントパラメータ、参照配列に対する配列リードの位置（例えば、座標）およびマッピングの品質スコアを記述しているアラインメントファイルを生成する。それらのアラインメントパラメータ（例えば、シーケンシングリードと参照配列との間で許容される差異の数、許容されるギャップの数、およびギャップオープニングペナルティ（ｇａｐｏｐｅｎｉｎｇｐｅｎａｌｔｙ）、ギャップ伸長の数など）は、ユーザーによって定義され得る。ある場合では、デフォルトのアラインメントパラメータを用いるＢＷＡマッピングツールを使用することにより、ｈｇ１９などのヒト参照ゲノムとリードがアラインメントされる。ＢＷＡツールは、アラインメントの統計情報を含むＢＡＭファイルである出力ファイルを提供する。アラインメントの統計情報には、処理されたリードがアラインメントされた参照配列の座標が含まれ得る。アラインメントの統計情報は、参照配列にマッピングされたときのリードのユニークさを知らせるＭａｐＱスコアも提供し得る。次いで、処理されたリードは、分子バーコードおよび参照配列上の座標を用いて、ソーティングされ得る。

参照配列の指定の位置と対応する位置を含むシーケンシングされた核酸のサブセットは、それぞれの配列が最大限にアラインメントされたとき、識別され得る。そのようなサブセット内において、どのシーケンシングされた核酸が、指定の位置にヌクレオチドバリエーションを含むのか（もしあれば）、および必要に応じて、どれが参照ヌクレオチド（すなわち、参照配列中のものと同じヌクレオチド）を含むのか（もしあれば）を明らかにすることができる。比較は、参照配列における任意の目的の指定の位置に対して反復され得る。時折、参照配列上の少なくとも２０、１００、２００または３００個連続した位置、例えば、２０～５００または５０～３００個連続した位置を占める指定の位置に対して、比較が行われ得る。

サンプルは、同じ核酸の任意の２コピーが、片端または両端において連結されたアダプターから、分子バーコードを含む同じ組み合わせのアダプターを受け取る確率が低確率（例えば、＜１または０．１％）になるように、十分な数の異なる分子バーコードと接触され得る。このようにアダプターを使用することにより、参照核酸とアラインメントされた（またはマッピングされた）同じ開始点および終止点を有する配列リード、ならびに同じ組み合わせの分子バーコードに連結された配列リードを、同じ元の分子から生成されたリードのファミリーにグループ分けすることが可能となり得る。そのようなファミリーは、増幅前のサンプル中の核酸の増幅産物の配列に相当し得る。

ファミリーメンバーの配列は、平滑末端化およびアダプター付着によって修飾された、元のサンプル中の核酸分子に対するコンセンサスヌクレオチドまたは完全なコンセンサス配列を導き出すためにコンパイルされ得る。換言すれば、そのサンプル中のある核酸の特定の位置を占めるヌクレオチドは、ファミリーメンバー配列内のその対応する位置を占めるヌクレオチドのコンセンサスであると判断され得る。コンセンサスヌクレオチドは、２つの非限定的な例示的方法を挙げるとすると投票または信頼スコアなどの方法によって決定され得る。ファミリーは、二本鎖核酸の一方または両方の鎖の配列を含み得る。あるファミリーのメンバーが、二本鎖核酸の両方の鎖の配列を含む場合、一方の鎖の配列は、コンセンサスヌクレオチドまたはコンセンサス配列を導き出すためにすべての配列をコンパイルする目的で、それらの相補鎖に変換される。いくつかのファミリーは、ただ１つのメンバー配列だけを含み得る。この場合、この配列は、増幅前のサンプル中の核酸の配列とみなされ得る。あるいは、ただ１つのメンバー配列だけを含むファミリーは、その後の解析から除外され得る。

いくつかの実施形態において、本明細書中に開示されるシステムおよび方法の結果は、レポートを生成するための入力として用いられる。そのレポートは、紙の形式であり得る。例えば、レポートは、生物学的サンプル中の療法的な核酸構築物の有無を指摘し得る。いくつかの実施形態において、そのレポートは、生物学的サンプル中の療法的な核酸構築物のレベルの指摘を含み得る。

本明細書中に開示される方法の様々な工程、または本明細書中に開示されるシステムによって行われる工程は、同時にもしくは異なる時点において、同じもしくは異なる地理的位置、例えば、同じ国もしくは異なる国において、および／または同じもしくは異なる人々によって、行われ得る。

シーケンシングパネル

変異を示す腫瘍を検出する可能性を改善するために、シーケンシングされるＤＮＡの領域は、遺伝子またはゲノム領域のパネルを含み得る。シーケンシングのために、限られた領域（例えば、限られたパネル）を選択することにより、必要な総シーケンシング（例えば、シーケンシングされるヌクレオチドの総量）を減少させることができる。シーケンシングパネルが、複数の異なる遺伝子または領域を標的化することにより、単一の癌、一連の癌またはすべての癌を検出することができる。あるいは、ホールゲノムシーケンシング（ＷＧＳ）によって、またはシーケンシングパネルを用いない他の偏りのないシーケンシング方法によって、ＤＮＡがシーケンシングされ得る。

いくつかの態様において、複数の異なる遺伝子またはゲノム領域を標的化するパネルは、所定の比率の、癌を有する被験体が、そのパネル内の１つまたはそれを超える異なる遺伝子において遺伝的バリアントまたは腫瘍マーカーを示すように、選択される。そのパネルは、シーケンシング用の領域を固定数の塩基対に限定するように選択され得る。そのパネルは、所望の量のＤＮＡをシーケンシングするように選択され得る。そのパネルは、所望の配列リードデプスを達成するように、さらに選択され得る。そのパネルは、ある量のシーケンシングされた塩基対に対して所望の配列リードデプスまたは配列リードカバレッジを達成するように、選択され得る。そのパネルは、サンプル中の１つまたはそれを超える遺伝的バリアントを検出するための理論的感度、理論的特異度および／または理論的精度を達成するように、選択され得る。

領域のパネルを検出するためのプローブには、目的のゲノム領域（ホットスポット領域）を検出するためのプローブ、ならびにヌクレオソーム認識プローブ（例えば、ＫＲＡＳコドン１２および１３）が含まれ得、それらのプローブは、ヌクレオソーム結合パターンおよびＧＣ配列組成によって影響されるｃｆＤＮＡカバレッジおよびフラグメントサイズバリエーションの解析に基づいて捕捉を最適化するようにデザインされ得る。本明細書中で使用される領域は、ヌクレオソーム位置およびＧＣモデルに基づいて最適化された非ホットスポット領域も含み得る。そのパネルは、複数のサブパネル（起源組織を識別するためのサブパネル（例えば、組織にわたって最も多様な転写プロファイルを有する遺伝子（必ずしもプロモーターではない）に相当する５０～１００個のベイトを定義するために既刊の刊行物を使用すること）、ホールゲノムスキャフォールドを識別するためのサブパネル（例えば、超保存的なゲノム含有量を識別するため、およびコピー数塩基をライニングする目的のために、染色体にわたってほんの一握りのプローブで低密度にタイリングするため）、例えば癌抑制遺伝子（例えば、結腸直腸癌におけるＳＥＰＴ９／ＶＩＭ）のプロモーターにおける、転写開始部位（ＴＳＳ）／ＣｐＧアイランド（例えば、差次的にメチル化された領域（例えば、差次的メチル化領域（ＤＭＲ））を捕捉するため）を識別するためのサブパネルを含む）を含み得る。いくつかの実施形態において、起始組織についてのマーカーは、組織特異的エピジェネティックマーカーである。

目的のゲノム位置の一覧のいくつかの例が表１および表２に見られ得る。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０、少なくとも７５、少なくとも８０、少なくとも８５、少なくとも９０、少なくとも９５または９７個の、表１の遺伝子の少なくとも一部を含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５または７０個の、表１のＳＮＶを含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７または１８個の、表１のＣＮＶを含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５または６つの、表１の融合物を含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも１つ、少なくとも２つまたは３つの、表１のインデルの少なくとも一部を含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０、少なくとも７５、少なくとも８０、少なくとも８５、少なくとも９０、少なくとも９５、少なくとも１００、少なくとも１０５、少なくとも１１０または１１５個の、表２の遺伝子の少なくとも一部を含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０または７３個の、表２のＳＮＶを含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７または１８個の、表２のＣＮＶを含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５つまたは６つの、表２の融合物を含む。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７または１８個の、表２のインデルの少なくとも一部を含む。これらの目的のゲノム位置の各々は、所与のベイトセットパネルに対する骨格領域またはホットスポット領域と識別され得る。目的のホットスポットゲノム位置の一覧の例は、表３に見られ得る。いくつかの実施形態において、本開示の方法において用いられるゲノム位置は、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、少なくとも１８、少なくとも１９または少なくとも２０個の、表３の遺伝子の少なくとも一部を含む。各ホットスポットゲノム位置は、関連する遺伝子、それが存在する染色体、その遺伝子の遺伝子座に相当するゲノムの開始位置および終止位置、塩基対を単位とするその遺伝子の遺伝子座の長さ、その遺伝子によってカバーされるエキソン、および目的の所与のゲノム位置が捕捉しようとし得る重要な特徴（例えば、変異のタイプ）をはじめとしたいくつかの特色とともに列挙される。

いくつかの実施形態において、上記パネル内の１つまたはそれを超える領域は、手術後に残留している癌を検出するための、１つまたは複数の遺伝子の１つまたはそれを超える遺伝子座を含む。この検出は、既存の癌検出方法よりも早く検出できる。いくつかの実施形態において、上記パネル内の１つまたはそれを超えるゲノム位置は、高リスク患者集団において癌を検出するための、１つまたは複数の遺伝子の１つまたはそれを超える遺伝子座を含む。例えば、喫煙者は、一般集団よりもかなり高い肺癌の割合を有する。さらに、喫煙者は、癌検出を難しくする他の肺の症状（例えば、肺における不規則小結節の発症）を発症し得る。いくつかの実施形態において、本明細書中に記載される方法は、既存の癌検出方法より早く、高リスク患者において癌を検出する。

遺伝子または領域に腫瘍マーカーを有する癌を有するいくつかの被験体に基づいて、あるゲノム位置が、シーケンシングパネルに含めるために選択され得る。癌を有する被験体の有病率およびその遺伝子に存在する腫瘍マーカーに基づいて、あるゲノム位置が、シーケンシングパネルに含めるために選択され得る。ある領域に腫瘍マーカーが存在することは、被験体が癌を有することを示し得る。

いくつかの場合では、上記パネルは、１つまたはそれを超えるデータベースからの情報を用いて選択され得る。癌に関する情報は、癌腫瘍生検またはｃｆＤＮＡアッセイから得られ得る。データベースは、シーケンシングされた腫瘍サンプルの集団を説明する情報を含み得る。データベースは、腫瘍サンプルにおけるｍＲＮＡ発現に関する情報を含み得る。データベース（ｄａｔａｂａｓｅｄ）は、腫瘍サンプルにおける調節エレメントまたはゲノム領域に関する情報を含み得る。シーケンシングされた腫瘍サンプルに関係する情報は、様々な遺伝的バリアントの頻度を含み得、それらの遺伝的バリアントが存在する遺伝子または領域を説明し得る。それらの遺伝的バリアントは、腫瘍マーカーであり得る。そのようなデータベースの非限定的な例は、ＣＯＳＭＩＣである。ＣＯＳＭＩＣは、様々な癌に見られる体細胞変異のカタログである。特定の癌について、ＣＯＳＭＩＣは、変異の頻度に基づいて遺伝子を格付けしている。ある遺伝子が、所与の遺伝子内に高頻度の変異を有することによって、パネルに含めるために選択され得る。例えば、ＣＯＳＭＩＣは、シーケンシングされた乳癌サンプルの集団の３３％が、ＴＰ５３に変異を有し、サンプリングされた乳癌の集団の２２％が、ＫＲＡＳに変異を有することを示唆している。ＡＰＣをはじめとした他の格付けされた遺伝子は、シーケンシングされた乳癌サンプルの集団の約４％にしか見られない変異を有する。ＴＰ５３およびＫＲＡＳは、サンプリングされた乳癌のうち比較的高頻度（例えば約４％の頻度で存在するＡＰＣと比べて）を有することに基づいて、シーケンシングパネルに含められ得る。ＣＯＳＭＩＣを、非限定的な例として提供するが、しかしながら、ある遺伝子または遺伝子領域に位置する腫瘍マーカーと癌を関連付ける任意のデータベースまたは情報セットを使用してもよい。別の例では、ＣＯＳＭＩＣが提供するように、１１５６個の胆管癌サンプルのうち、３８０個のサンプル（３３％）が、ＴＰ５３に変異を有した。いくつかの他の遺伝子（例えば、ＡＰＣ）が、全サンプルの４～８％に変異を有する。したがって、ＴＰ５３は、胆管癌サンプルの集団における比較的高頻度に基づいて、パネルに含めるために選択され得る。

サンプリングされた腫瘍組織または循環腫瘍ＤＮＡにおける腫瘍マーカーの頻度が、所与のバックグラウンド集団で見られる頻度よりも有意に高い場合、あるパネルのために、ある遺伝子またはゲノム区画が選択され得る。癌を有する被験体の少なくとも大部分が、パネル内のゲノム位置または遺伝子の少なくとも１つに存在する腫瘍マーカーまたはゲノム領域を有し得るように、あるゲノム位置の組み合わせが、あるパネルに含めるために選択され得る。そのゲノム位置の組み合わせは、特定の癌または癌のセットについて、被験体の大部分が、１つまたはそれを超えるその選択された領域に１つまたはそれを超える腫瘍マーカーを有することを示すデータに基づいて選択され得る。例えば、癌１を検出するために、癌１を有する被験体の９０％が、パネルの領域Ａ、Ｂ、Ｃおよび／またはＤに腫瘍マーカーを有することを示すデータに基づいて、領域Ａ、Ｂ、Ｃおよび／またはＤを含むパネルが選択され得る。あるいは、腫瘍マーカーは、癌を有する被験体における２つまたはそれを超える領域に独立して存在すると示され得、それらの２つまたはそれを超える領域における腫瘍マーカーは、合わせると、癌を有する被験体集団の大部分に存在する。例えば、癌２を検出するために、被験体の９０％が、１つまたはそれを超える領域に腫瘍マーカーを有し、そのような被験体の３０％において、腫瘍マーカーが領域Ｘでのみ検出されるが、腫瘍マーカーが検出された残りの被験体では、腫瘍マーカーは領域Ｙおよび／またはＺでのみ検出されることを示すデータに基づいて、領域Ｘ、ＹおよびＺを含むパネルが選択され得る。１つまたはそれを超える癌と関連すると以前に示された１つまたはそれを超えるゲノム位置に存在する腫瘍マーカーは、１つまたはそれを超えるそれらの領域において、ある腫瘍マーカーが、５０％またはそれを超えて検出された場合、被験体が癌を有することを示し得るかまたは予測し得る。コンピュータによるアプローチ（例えば、１つまたはそれを超える領域内の腫瘍マーカーセットに対する癌頻度が与えられた場合に癌を検出する条件付き確率を用いるモデル）を用いることにより、どの領域が、単独でまたは組み合わされて、癌を予測し得るかが予測され得る。パネル選択のための他のアプローチは、大きなパネルを用いた腫瘍の網羅的なゲノムプロファイリングおよび／またはホールゲノムシーケンシング（ＷＧＳ、ＲＮＡ－ｓｅｑ、Ｃｈｉｐ－ｓｅｑ、バイサルフェート（ｂｉｓｕｌｆａｔｅ）シーケンシング、ＡＴＡＣ－ｓｅｑなど）を用いた研究からの情報を説明するデータベースの使用を含む。文献から収集された情報も、ある特定の癌においてよく影響を受けるおよびよく変異する経路を説明し得る。パネルの選択は、遺伝情報を説明するオントロジーを使用することによって、さらに特徴付けられ得る。

シーケンシングのために上記パネルに含められる遺伝子は、完全に転写される領域、プロモーター領域、エンハンサー領域、調節エレメントおよび／または下流の配列を含み得る。変異を示す腫瘍を検出する可能性をさらに高めるために、エキソンだけが、上記パネルに含められ得る。上記パネルは、選択された遺伝子の全エキソン、または選択された遺伝子のエキソンのうちのただ１つもしくはそれを超えるエキソンを含み得る。上記パネルは、複数の異なる各遺伝子のエキソンを含み得る。上記パネルは、複数の異なる各遺伝子の少なくとも１つのエキソンを含み得る。

いくつかの態様において、複数の異なる各遺伝子のエキソンのパネルは、所定の比率の、癌を有する被験体が、エキソンのパネル内の少なくとも１つのエキソンに遺伝的バリアントを示すように選択される。

遺伝子のパネル内の異なる各遺伝子の少なくとも１つの完全長エキソンが、シーケンシングされ得る。シーケンシングされたパネルは、複数の遺伝子のエキソンを含み得る。そのパネルは、２～１００個の異なる遺伝子、２～７０個の遺伝子、２～５０個の遺伝子、２～３０個の遺伝子、２～１５個の遺伝子または２～１０個の遺伝子のエキソンを含み得る。

選択されたパネルは、様々な数のエキソンを含み得る。そのパネルは、２～３０００個のエキソンを含み得る。そのパネルは、２～１０００個のエキソンを含み得る。そのパネルは、２～５００個のエキソンを含み得る。そのパネルは、２～１００個のエキソンを含み得る。そのパネルは、２～５０個のエキソンを含み得る。そのパネルは、３００個以下のエキソンを含み得る。そのパネルは、２００個以下のエキソンを含み得る。そのパネルは、１００個以下のエキソンを含み得る。そのパネルは、５０個以下のエキソンを含み得る。そのパネルは、４０個以下のエキソンを含み得る。そのパネルは、３０個以下のエキソンを含み得る。そのパネルは、２５個以下のエキソンを含み得る。そのパネルは、２０個以下のエキソンを含み得る。そのパネルは、１５個以下のエキソンを含み得る。そのパネルは、１０個以下のエキソンを含み得る。そのパネルは、９個以下のエキソンを含み得る。そのパネルは、８個以下のエキソンを含み得る。そのパネルは、７個以下のエキソンを含み得る。

上記パネルは、複数の異なる遺伝子の１つまたはそれを超えるエキソンを含み得る。上記パネルは、ある割合のその複数の異なる遺伝子の各々の１つまたはそれを超えるエキソンを含み得る。上記パネルは、それらの異なる遺伝子の少なくとも２５％、５０％、７５％または９０％の各々の少なくとも２つのエキソンを含み得る。上記パネルは、それらの異なる遺伝子の少なくとも２５％、５０％、７５％または９０％の各々の少なくとも３つのエキソンを含み得る。上記パネルは、それらの異なる遺伝子の少なくとも２５％、５０％、７５％または９０％の各々の少なくとも４つのエキソンを含み得る。

シーケンシングパネルのサイズは、様々であり得る。シーケンシングパネルは、いくつかの因子（例えばシーケンシングされたヌクレオチドの総量またはパネル内の特定の領域についてシーケンシングされたユニークな分子の数）に応じて、（ヌクレオチドのサイズに関して）大きくまたは小さくしてよい。シーケンシングパネルは、５ｋｂ～５０ｋｂのサイズにされ得る。シーケンシングパネルは、１０ｋｂ～３０ｋｂのサイズであり得る。シーケンシングパネルは、１２ｋｂ～２０ｋｂのサイズであり得る。シーケンシングパネルは、１２ｋｂ～６０ｋｂのサイズであり得る。シーケンシングパネルは、少なくとも１０ｋｂ、１２ｋｂ、１５ｋｂ、２０ｋｂ、２５ｋｂ、３０ｋｂ、３５ｋｂ、４０ｋｂ、４５ｋｂ、５０ｋｂ、６０ｋｂ、７０ｋｂ、８０ｋｂ、９０ｋｂ、１００ｋｂ、１１０ｋｂ、１２０ｋｂ、１３０ｋｂ、１４０ｋｂまたは１５０ｋｂのサイズであり得る。シーケンシングパネルは、１００ｋｂ、９０ｋｂ、８０ｋｂ、７０ｋｂ、６０ｋｂまたは５０ｋｂ未満のサイズであり得る。

シーケンシングのために選択されたパネルは、少なくとも１、５、１０、１５、２０、２５、３０、４０、５０、６０、８０または１００個のゲノム位置（例えば、各々が目的のゲノム領域を含む）を含み得る。いくつかの場合では、パネル内のゲノム位置は、それらの位置のサイズが比較的小さくなるように選択される。いくつかの場合では、パネル内の領域は、約１０ｋｂもしくはそれ未満、約８ｋｂもしくはそれ未満、約６ｋｂもしくはそれ未満、約５ｋｂもしくはそれ未満、約４ｋｂもしくはそれ未満、約３ｋｂもしくはそれ未満、約２．５ｋｂもしくはそれ未満、約２ｋｂもしくはそれ未満、約１．５ｋｂもしくはそれ未満または約１ｋｂもしくはそれ未満もしくはそれ未満のサイズを有する。いくつかの場合では、パネル内のゲノム位置は、約０．５ｋｂ～約１０ｋｂ、約０．５ｋｂ～約６ｋｂ、約１ｋｂ～約１１ｋｂ、約１ｋｂ～約１５ｋｂ、約１ｋｂ～約２０ｋｂ、約０．１ｋｂ～約１０ｋｂまたは約０．２ｋｂ～約１ｋｂのサイズを有する。例えば、パネル内の領域は、約０．１ｋｂ～約５ｋｂのサイズを有し得る。

本明細書中で選択されるパネルは、低頻度遺伝的バリアントを検出する（例えば、サンプルから得られたセルフリー核酸分子において）のに十分なディープシーケンシングを可能にし得る。サンプル中の遺伝的バリアントの量は、所与の遺伝的バリアントに対するマイナーアレル頻度に関して言及され得る。マイナーアレル頻度とは、マイナーアレル（例えば、最も一般的でないアレル）が所与の核酸集団（例えば、サンプル）中に存在する頻度のことを指し得る。低マイナーアレル頻度の遺伝的バリアントは、サンプル中において比較的低い存在頻度を有し得る。いくつかの場合では、上記パネルは、少なくとも０．０００１％、０．００１％、０．００５％、０．０１％、０．０５％、０．１％または０．５％のマイナーアレル頻度の遺伝的バリアントの検出を可能にする。上記パネルは、０．００１％またはそれを超えるマイナーアレル頻度の遺伝的バリアントの検出を可能にし得る。上記パネルは、０．０１％またはそれを超えるマイナーアレル頻度の遺伝的バリアントの検出を可能にし得る。上記パネルは、０．０００１％、０．００１％、０．００５％、０．０１％、０．０２５％、０．０５％、０．０７５％、０．１％、０．２５％、０．５％、０．７５％または１．０％もの低い頻度でサンプル中に存在する遺伝的バリアントの検出を可能にし得る。上記パネルは、少なくとも０．０００１％、０．００１％、０．００５％、０．０１％、０．０２５％、０．０５％、０．０７５％、０．１％、０．２５％、０．５％、０．７５％または１．０％の頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、１．０％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．７５％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．５％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．２５％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．１％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．０７５％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．０５％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．０２５％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．０１％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．００５％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．００１％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、０．０００１％もの低い頻度でサンプル中に存在する腫瘍マーカーの検出を可能にし得る。上記パネルは、１．０％～０．０００１％もの低い頻度でサンプル中に存在する、シーケンシングされたｃｆＤＮＡにおける腫瘍マーカーの検出を可能にし得る。上記パネルは、０．０１％～０．０００１％もの低い頻度でサンプル中に存在する、シーケンシングされたｃｆＤＮＡにおける腫瘍マーカーの検出を可能にし得る。

遺伝的バリアントは、疾患（例えば、癌）を有する被験体集団のパーセンテージを単位として提示され得る。いくつかの場合では、癌を有する集団の少なくとも１％、２％、３％、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％または９９％が、上記パネル内の領域のうちの少なくとも１つにおいて１つまたはそれを超える遺伝的バリアントを示す。例えば、癌を有する集団の少なくとも８０％が、上記パネル内のゲノム位置のうちの少なくとも１つにおいて１つまたはそれを超える遺伝的バリアントを示し得る。

上記パネルは、１つまたはそれを超える各遺伝子由来の目的のゲノム領域を含む１つまたはそれを超える位置を含み得る。いくつかの場合では、上記パネルは、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０または８０個の各遺伝子由来の目的のゲノム領域を含む１つまたはそれを超える位置を含み得る。いくつかの場合では、上記パネルは、多くとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０または８０個の各遺伝子由来の目的のゲノム領域を含む１つまたはそれを超える位置を含み得る。いくつかの場合では、上記パネルは、約１～約８０、１～約５０、約３～約４０、５～約３０、１０～約２０個の異なる各遺伝子由来の目的のゲノム領域を含む１つまたはそれを超える位置を含み得る。

上記パネル内の領域は、それらが、１つまたはそれを超える組織にわたって差次的に転写される配列を含むように選択され得る。いくつかの場合では、ゲノム領域を含む位置は、他の組織よりも高いレベルである特定の組織において転写される配列を含み得る。例えば、ゲノム領域を含む位置は、ある特定の組織では転写されるが他の組織では転写されない配列を含み得る。

上記パネル内のゲノム位置は、コード配列および／または非コード配列を含み得る。例えば、上記パネル内のゲノム位置は、エキソン、イントロン、プロモーター、３’非翻訳領域、５’非翻訳領域、調節エレメント、転写開始部位および／またはスプライス部位における１つまたはそれを超える配列を含み得る。いくつかの場合では、上記パネル内の領域は、偽遺伝子、反復配列、トランスポゾン、ウイルスエレメントおよびテロメアをはじめとした他の非コード配列を含み得る。いくつかの場合では、上記パネル内のゲノム位置は、非コードＲＮＡ、例えば、リボソームＲＮＡ、転移ＲＮＡ、Ｐｉｗｉと相互作用するＲＮＡおよびマイクロＲＮＡにおける配列を含み得る。

上記パネル内のゲノム位置は、所望の感度レベルで（例えば、１つまたはそれを超える遺伝的バリアントの検出によって）癌を検出（診断）するように、選択され得る。例えば、上記パネル内の領域は、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の感度で癌を検出する（例えば、１つまたはそれを超える遺伝的バリアントの検出によって）ように選択され得る。上記パネル内のゲノム位置は、１００％の感度で癌を検出するように選択され得る。

上記パネル内のゲノム位置は、所望の特異度レベルで（例えば、１つまたはそれを超える遺伝的バリアントの検出によって）癌を検出（診断）するように、選択され得る。例えば、上記パネル内のゲノム位置は、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の特異度で癌を検出する（例えば、１つまたはそれを超える遺伝的バリアントの検出によって）ように選択され得る。上記パネル内のゲノム位置は、１００％の特異度で１つまたはそれを超える遺伝的バリアントを検出するように選択され得る。

上記パネル内のゲノム位置は、所望の陽性予測値で癌を検出（診断）するように、選択され得る。陽性予測値は、感度（例えば、実際の陽性が検出される確率）および／または特異度（例えば、実際の陰性を陽性と間違えない確率）を高めることによって上昇し得る。非限定的な例として、上記パネル内のゲノム位置は、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の陽性予測値で１つまたはそれを超える遺伝的バリアントを検出するように、選択され得る。上記パネル内の領域は、１００％の陽性予測値で１つまたはそれを超える遺伝的バリアントを検出するように、選択され得る。

上記パネル内のゲノム位置は、所望の精度で癌を検出（診断）するように選択され得る。本明細書中で使用されるとき、用語「精度」とは、試験が疾患症状（例えば、癌）と健康症状とを判別する能力のことを指し得る。精度は、尺度（例えば、感度および特異度、予測値、尤度比、ＲＯＣ曲線下面積、Ｙｏｕｄｅｎ指数ならびに／または診断オッズ比）を用いて定量され得るされ得る。

精度は、正しい結果を与えた試験の数と行われた試験の総数との比のことを指すパーセンテージとして提示され得る。上記パネル内の領域は、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の精度で癌を検出するように選択され得る。上記パネル内のゲノム位置は、１００％の精度で癌を検出するように選択され得る。

パネルは、高感度であるように、かつ低頻度の遺伝的バリアントを検出するように、選択され得る。例えば、パネルは、０．０１％、０．０５％または０．００１％もの低い頻度でサンプル中に存在する遺伝的バリアントまたは腫瘍マーカーが、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の感度で検出され得るように、選択され得る。上記パネル内のゲノム位置は、サンプル中に１％またはそれ未満の頻度で存在する腫瘍マーカーを７０％またはそれを超える感度で検出するように選択され得る。パネルは、サンプル中に０．１％もの低い頻度で存在する腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の感度で検出するように選択され得る。パネルは、サンプル中に０．０１％もの低い頻度で存在する腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の感度で検出するように選択され得る。パネルは、サンプル中に０．００１％もの低い頻度で存在する腫瘍マーカーを少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の感度で検出するように、選択され得る。

パネルは、高度に特異的であるように、かつ低頻度の遺伝的バリアントを検出するように、選択され得る。例えば、パネルは、０．０１％、０．０５％または０．００１％もの低い頻度でサンプル中に存在する遺伝的バリアントまたは腫瘍マーカーが、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の特異度で検出され得るように、選択され得る。上記パネル内のゲノム位置は、サンプル中に１％またはそれ未満の頻度で存在する腫瘍マーカーを７０％またはそれを超える特異度で検出するように選択され得る。パネルは、サンプル中に０．１％もの低い頻度で存在する腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の特異度で検出するように選択され得る。パネルは、サンプル中に０．０１％もの低い頻度で存在する腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の特異度で検出するように選択され得る。パネルは、サンプル中に０．００１％もの低い頻度で存在する腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の特異度で検出するように選択され得る。

パネルは、高精度であるように、かつ低頻度の遺伝的バリアントを検出するように、選択され得る。パネルは、０．０１％、０．０５％または０．００１％もの低い頻度でサンプル中に存在する遺伝的バリアントまたは腫瘍マーカーが、少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の精度で検出され得るように、選択され得る。上記パネル内のゲノム位置は、サンプル中に１％またはそれ未満の頻度で存在する腫瘍マーカーを７０％またはそれを超える精度で検出するように選択され得る。パネルは、サンプル中に０．１％もの低い頻度で存在する腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の精度で検出するように選択され得る。パネルは、サンプル中に０．０１％もの低い頻度で存在する腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の精度で検出するように選択され得る。パネルは、サンプル中に０．００１％もの低い頻度で存在する腫瘍マーカーを少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の精度で検出するように選択され得る。

パネルは、高度に予測的であるように、かつ低頻度の遺伝的バリアントを検出するように、選択され得る。パネルは、０．０１％、０．０５％または０．００１％もの低い頻度でサンプル中に存在する遺伝的バリアントまたは腫瘍マーカーが、少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．５％または９９．９％の陽性予測値を有し得るように、選択され得る。

上記パネルにおいて使用されるプローブまたはベイトの濃度は、サンプル内のより多くの核酸分子を捕捉するために、高められ得る（２～６ｎｇ／μＬ）。上記パネルにおいて使用されるプローブまたはベイトの濃度は、少なくとも２ｎｇ／μＬ、３ｎｇ／μＬ、４ｎｇ／μＬ、５ｎｇ／μＬ、６ｎｇ／μＬまたはそれを超える濃度であり得る。プローブの濃度は、約２ｎｇ／μＬ～約３ｎｇ／μＬ、約２ｎｇ／μＬ～約４ｎｇ／μＬ、約２ｎｇ／μＬ～約５ｎｇ／μＬ、約２ｎｇ／μＬ～約６ｎｇ／μＬであり得る。上記パネルにおいて使用されるプローブまたはベイトの濃度は、２ｎｇ／μＬまたはそれを超える濃度から６ｎｇ／μＬまたはそれ未満の濃度までであり得る。いくつかの場合では、これによって、生物製剤内のより多くの分子が解析されることが可能となり、それによって、低頻度のアレルを検出することが可能になり得る。

癌および他の疾患

ある特定の実施形態において、本明細書中に開示される方法および態様は、患者における所与の疾患、障害または症状を診断するために用いられる。通常、検討中の疾患は、あるタイプの癌である。そのような癌の非限定的な例としては、胆管癌、膀胱癌、移行上皮癌腫、尿路上皮癌腫、脳腫瘍、グリオーマ、星状細胞腫、乳癌腫、化生性癌腫、子宮頸癌、子宮頸部扁平上皮癌腫、直腸癌、結腸直腸癌腫、結腸癌、遺伝性非ポリポーシス結腸直腸癌、結腸直腸腺癌、消化管間質腫瘍（ＧＩＳＴ）、子宮内膜癌腫、子宮内膜間質肉腫、食道癌、食道扁平上皮癌腫、食道腺癌、眼メラノーマ、ブドウ膜黒色腫、胆嚢癌腫、胆嚢腺癌、腎細胞癌腫、腎明細胞癌腫、移行上皮癌腫、尿路上皮癌腫、ウィルムス腫瘍、白血病、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ性（ＣＬＬ）、慢性骨髄性（ＣＭＬ）、慢性骨髄単球性（ＣＭＭＬ）、肝臓癌、肝臓癌腫、ヘパトーマ、肝細胞癌腫、胆管癌腫、肝芽腫、肺癌、非小細胞肺癌（ＮＳＣＬＣ）、中皮腫、Ｂ細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型Ｂ細胞型リンパ腫、マントル細胞リンパ腫、Ｔ細胞リンパ腫、非ホジキンリンパ腫、前駆Ｔリンパ芽球性リンパ腫／白血病、末梢性Ｔ細胞リンパ腫、多発性骨髄腫、鼻咽頭癌腫（ＮＰＣ）、神経芽細胞腫、中咽頭癌、口腔扁平上皮癌腫、骨肉腫、卵巣癌腫、膵癌、膵管腺癌、偽乳頭状腫瘍、腺房細胞癌腫、前立腺癌、前立腺腺癌、皮膚癌、メラノーマ、悪性黒色腫、皮膚黒色腫、小腸癌腫、胃癌、胃癌腫、消化管間質腫瘍（ＧＩＳＴ）、子宮癌または子宮肉腫が挙げられる。

本明細書中に開示される方法およびシステムを用いて必要に応じて評価される他の遺伝子に基づく疾患、障害または症状の非限定的な例としては、軟骨形成不全、アルファ－１抗トリプシン欠損症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー・マリー・トゥース（ＣＭＴ）、ネコ鳴き症候群（ｃｒｉｄｕｃｈａｔ）、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第Ｖ因子ライデン栓友病、家族性高コレステロール血症、家族性地中海熱、脆弱Ｘ症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋緊張性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド奇形（Ｐｏｌａｎｄａｎｏｍａｌｙ）、ポルフィリン症、早老症、網膜色素変性症、重症複合免疫不全（ｓｃｉｄ）、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス病（Ｔａｙ－Ｓａｃｈｓ）、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、ＷＡＧＲ症候群、ウィルソン病などが挙げられる。

カスタマイズされた療法および関連する投与

いくつかの実施形態において、本明細書中に開示される方法は、所与の疾患、障害または症状を有する患者に対する療法の特定およびその投与に関する。本質的に任意の癌療法（例えば、外科的療法、放射線療法、化学療法など）が、これらの方法の一部として含められる。通常、療法には、少なくとも１つの免疫療法（または免疫療法薬）が含まれる。免疫療法とは、一般に、所与の癌のタイプに対する免疫応答を高める方法のことを指す。ある特定の実施形態において、免疫療法とは、腫瘍または癌に対するＴ細胞応答を高める方法のことを指す。

いくつかの実施形態において、免疫療法または免疫療法薬は、免疫チェックポイント分子を標的化する。ある特定の腫瘍は、免疫チェックポイント経路を利用することによって免疫系を免れることができる。したがって、免疫チェックポイントの標的化は、腫瘍が免疫系を免れる能力に対抗するためおよびある特定の癌に対する抗腫瘍免疫を活性化するための効果的なアプローチとして現れた。Ｐａｒｄｏｌｌ，ＮａｔｕｒｅＲｅｖｉｅｗｓ
Ｃａｎｃｅｒ，２０１２，１２：２５２－２６４。

ある特定の実施形態において、免疫チェックポイント分子は、抗原に対するＴ細胞応答に関わるシグナルを減じる阻害性分子である。例えば、ＣＴＬＡ４は、Ｔ細胞上に発現されており、抗原提示細胞上のＣＤ８０（別名、Ｂ７．１）またはＣＤ８６（別名、Ｂ７．２）に結合することによってＴ細胞活性化のダウンレギュレーションにおいて役割を果たす。ＰＤ－１は、Ｔ細胞上に発現されるもう１つの阻害性チェックポイント分子である。ＰＤ－１は、炎症反応中の末梢組織においてＴ細胞の活性を制限する。さらに、ＰＤ－１に対するリガンド（ＰＤ－Ｌ１またはＰＤ－Ｌ２）は、通常、多くの種々の腫瘍の表面上でアップレギュレートされ、その結果、腫瘍微小環境において抗腫瘍免疫応答がダウンレギュレーションする。ある特定の実施形態において、阻害性免疫チェックポイント分子は、ＣＴＬＡ４またはＰＤ－１である。他の実施形態において、阻害性免疫チェックポイント分子は、ＰＤ－Ｌ１またはＰＤ－Ｌ２などの、ＰＤ－１に対するリガンドである。他の実施形態において、阻害性免疫チェックポイント分子は、ＣＤ８０またはＣＤ８６などの、ＣＴＬＡ４に対するリガンドである。他の実施形態において、阻害性免疫チェックポイント分子は、リンパ球活性化遺伝子３（ＬＡＧ３）、キラー細胞免疫グロブリン様レセプター（ＫＩＲ）、Ｔ細胞膜タンパク質３（ＴＩＭ３）、ガレクチン９（ＧＡＬ９）またはアデノシンＡ２ａレセプター（Ａ２ａＲ）である。

これらの免疫チェックポイント分子を標的化するアンタゴニストを用いることにより、ある特定の癌に対する抗原特異的Ｔ細胞応答を高めることができる。したがって、ある特定の実施形態において、免疫療法または免疫療法薬は、阻害性免疫チェックポイント分子のアンタゴニストである。ある特定の実施形態において、阻害性免疫チェックポイント分子は、ＰＤ－１である。ある特定の実施形態において、阻害性免疫チェックポイント分子は、ＰＤ－Ｌ１である。ある特定の実施形態において、阻害性免疫チェックポイント分子のアンタゴニストは、抗体（例えば、モノクローナル抗体）である。ある特定の実施形態において、その抗体またはモノクローナル抗体は、抗ＣＴＬＡ４、抗ＰＤ－１、抗ＰＤ－Ｌ１または抗ＰＤ－Ｌ２抗体である。ある特定の実施形態において、その抗体は、モノクローナル抗ＰＤ－１抗体である。いくつかの実施形態において、その抗体は、モノクローナル抗ＰＤ－Ｌ１抗体である。ある特定の実施形態において、そのモノクローナル抗体は、抗ＣＴＬＡ４抗体と抗ＰＤ－１抗体との組み合わせ、抗ＣＴＬＡ４抗体と抗ＰＤ－Ｌ１抗体との組み合わせ、または抗ＰＤ－Ｌ１抗体と抗ＰＤ－１抗体との組み合わせである。ある特定の実施形態において、抗ＰＤ－１抗体は、ペンブロリズマブ（Ｋｅｙｔｒｕｄａ（登録商標））またはニボルマブ（Ｏｐｄｉｖｏ（登録商標））のうちの１つまたはそれを超えるものである。ある特定の実施形態において、抗ＣＴＬＡ４抗体は、イピリムマブ（Ｙｅｒｖｏｙ（登録商標））である。ある特定の実施形態において、抗ＰＤ－Ｌ１抗体は、アテゾリズマブ（Ｔｅｃｅｎｔｒｉｑ（登録商標））、アベルマブ（Ｂａｖｅｎｃｉｏ（登録商標））またはデュルバルマブ（Ｉｍｆｉｎｚｉ（登録商標））のうちの１つまたはそれを超えるものである。

ある特定の実施形態において、免疫療法または免疫療法薬は、ＣＤ８０、ＣＤ８６、ＬＡＧ３、ＫＩＲ、ＴＩＭ３、ＧＡＬ９またはＡ２ａＲに対するアンタゴニスト（例えば、抗体）である。他の実施形態において、そのアンタゴニストは、阻害性免疫チェックポイント分子の可溶性バージョン（例えば、阻害性免疫チェックポイント分子の細胞外ドメインおよび抗体のＦｃドメインを含む可溶性融合タンパク質）である。ある特定の実施形態において、その可溶性融合タンパク質は、ＣＴＬＡ４、ＰＤ－１、ＰＤ－Ｌ１またはＰＤ－Ｌ２の細胞外ドメインを含む。いくつかの実施形態において、その可溶性融合タンパク質は、ＣＤ８０、ＣＤ８６、ＬＡＧ３、ＫＩＲ、ＴＩＭ３、ＧＡＬ９またはＡ２ａＲの細胞外ドメインを含む。１つの実施形態において、その可溶性融合タンパク質は、ＰＤ－Ｌ２またはＬＡＧ３の細胞外ドメインを含む。

ある特定の実施形態において、免疫チェックポイント分子は、ある抗原に対するＴ細胞応答に関わるシグナルを増幅する共刺激分子である。例えば、ＣＤ２８は、Ｔ細胞上に発現される共刺激レセプターである。Ｔ細胞が、そのＴ細胞レセプターを介して抗原に結合するとき、ＣＤ２８は、抗原提示細胞上のＣＤ８０（別名、Ｂ７．１）またはＣＤ８６（別名、Ｂ７．２）に結合して、Ｔ細胞レセプターシグナル伝達を増幅し、Ｔ細胞活性化を促進する。ＣＤ２８は、ＣＴＬＡ４と同じリガンド（ＣＤ８０およびＣＤ８６）に結合するので、ＣＴＬＡ４は、ＣＤ２８によって媒介される共刺激シグナル伝達を相殺または制御することができる。ある特定の実施形態において、免疫チェックポイント分子は、ＣＤ２８、誘導性Ｔ細胞共刺激物質（ＩＣＯＳ）、ＣＤ１３７、ＯＸ４０またはＣＤ２７から選択される共刺激分子である。他の実施形態において、免疫チェックポイント分子は、共刺激分子のリガンドであり、例えば、ＣＤ８０、ＣＤ８６、Ｂ７ＲＰ１、Ｂ７－Ｈ３、Ｂ７－Ｈ４、ＣＤ１３７Ｌ、ＯＸ４０ＬまたはＣＤ７０が挙げられる。

これらの共刺激チェックポイント分子を標的化するアゴニストを用いることにより、ある特定の癌に対する抗原特異的Ｔ細胞応答を高めることができる。したがって、ある特定の実施形態において、免疫療法または免疫療法薬は、共刺激チェックポイント分子のアゴニストである。ある特定の実施形態において、その共刺激チェックポイント分子のアゴニストは、アゴニスト抗体であり、好ましくは、モノクローナル抗体である。ある特定の実施形態において、そのアゴニスト抗体またはモノクローナル抗体は、抗ＣＤ２８抗体である。他の実施形態において、そのアゴニスト抗体またはモノクローナル抗体は、抗ＩＣＯＳ、抗ＣＤ１３７、抗ＯＸ４０または抗ＣＤ２７抗体である。他の実施形態において、そのアゴニスト抗体またはモノクローナル抗体は、抗ＣＤ８０、抗ＣＤ８６、抗Ｂ７ＲＰ１、抗Ｂ７－Ｈ３、抗Ｂ７－Ｈ４、抗ＣＤ１３７Ｌ、抗ＯＸ４０Ｌまたは抗ＣＤ７０抗体である。

癌以外の、遺伝子に基づく特定の疾患、障害または症状を処置するための療法法の選択肢は、当業者に広く周知されており、検討中の特定の疾患、障害または症状を考慮すれば明らかである。

ある特定の実施形態において、本明細書中に記載されるカスタマイズされた療法は、通常、非経口的に（例えば、静脈内にまたは皮下に）施される。免疫療法薬を含む薬学的組成物は、通常、静脈内に投与される。ある特定の療法薬は、経口的に投与される。しかしながら、カスタマイズされた療法（例えば、免疫療法薬など）は、当該分野で公知の任意の方法によっても投与され得、その方法としては、例えば、頬側、舌下、直腸、膣、尿道内、局所的、眼内、鼻腔内および／または耳介内が挙げられ、その投与には、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル、スプレー、坐剤、軟膏剤（ｓａｌｖｅｓ）、軟膏剤（ｏｉｎｔｍｅｎｔｓ）などが含まれる。

システムおよびコンピュータ可読媒体

本開示は、様々なシステムおよびコンピュータプログラム製品または機械可読媒体も提供する。いくつかの実施形態において、例えば、本明細書中に記載される方法は、必要に応じて、システム、分散コンピューティングハードウェアおよびアプリケーション（例えば、クラウドコンピューティングサービス）、電子通信ネットワーク、通信用インターフェース、コンピュータプログラム製品、機械可読媒体、電子記憶媒体、ソフトウェア（例えば、機械が実行可能なコードまたは論理命令）などを少なくとも部分的に用いて、行われるかまたは促進される。例えば、図７は、本願に開示されている方法の態様を少なくとも実行して使用するのに適した例示的なシステムの模式図を提供している。示されているように、システム７００は、少なくとも１つのコントローラまたはコンピュータ、例えば、プロセッサー７０４およびメモリ、ストレージデバイスまたはメモリコンポーネント７０６を備えるサーバー７０２（例えば、検索エンジンサーバー）、ならびにリモートサーバー７０２から離れて位置するおよび電子通信ネットワーク７１２（例えば、インターネットまたは他のインターネットワーク）を介してリモートサーバー７０２と通信している、１つまたはそれを超える他のコミュニケーションデバイス７１４および７１６（例えば、クライアント側コンピュータ端末、電話、タブレット、ラップトップ、他のモバイルデバイスなど）を備える。コミュニケーションデバイス７１４および７１６は、通常、
例えばサーバー７０２コンピュータとネットワーク７１２を介して通信する電子ディスプレー（例えば、インターネット対応コンピュータなど）を含み、ここで、その電子ディスプレーは、本明細書中に記載される方法を実行したときの結果を表示するための、ユーザーインターフェース（例えば、グラフィカルユーザーインターフェース（ＧＵＩ）、ウェブベースのユーザーインターフェースなど）を備える。ある特定の実施形態において、通信ネットワークは、例えば、ハードドライブ、サムドライブまたは他のデータストレージメカニズムを用いて、１つの場所から別の場所にデータを物理的に移動させることも包含する。システム７００は、例えば、ガイド付き検索アプリケーションまたは１つもしくはそれを超える他のコミュニケーションデバイス（例えば、７１４（デスクトップまたはパーソナルコンピュータとして模式的に示されている）および７１６（タブレットコンピュータとして模式的に示されている））によって実行可能な他のアプリケーションに使用する、コンピュータ可読媒体または機械可読媒体（例えば、サーバー７０２によって可読な１つまたはそれを超える様々なタイプのメモリ、例えば、サーバー７０２のメモリ７０６）上に保存されたプログラム製品７０８も備える。いくつかの実施形態において、システム７００は、必要に応じて、少なくとも１つのデータベースサーバー（例えば、直接または検索エンジンサーバー７０２を介して検索可能なデータ（例えば、分類器スコア、コントロールサンプルの結果または比較対照の結果のデータ、インデックスされたカスタマイズされた療法など）を保存しているオンラインウェブサイトと関連付けられたサーバー７１０）も備える。システム７００は、必要に応じて、サーバー７０２から離れて位置する１つまたはそれを超える他のサーバーも備え、それらの各サーバーは、必要に応じて、その他の各サーバーと離れてまたは近くに配置されている１つまたはそれを超えるデータベースサーバー７１０と関連付けられている。その他のサーバーは、地理的に離れたユーザーにサービスを有益に提供でき、地理的に分散した操作を強化することができる。

当業者が理解するように、サーバー７０２のメモリ７０６は、必要に応じて、例えばとりわけ、ＲＡＭ、ＲＯＭおよび磁気ディスクまたは光ディスクを含む、揮発性および／または不揮発性のメモリを含む。単一のサーバーとして図示されているが、図示されているサーバー７０２の配置は、単に例として与えられているのであって、他の様々な方法または構造に従って構成された他のタイプのサーバーまたはコンピュータも使用できることも当業者は理解する。図７に模式的に示されているサーバー７０２は、サーバーまたはサーバークラスターまたはサーバーファームであり、任意の個々の物理的サーバーに限定されない。サーバーの場所は、サーバーホスティングプロバイダーが管理するサーバーファームまたはサーバークラスターとして配備され得る。サーバーならびにそれらの構造および配置の数は、システム７００に対する使用法、要求および容量の要件に基づいて増加させてよい。また、当業者が理解するように、これらの実施形態における他のユーザーコミュニケーションデバイス７１４および７１６は、例えば、ラップトップ、デスクトップ、タブレット、携帯情報端末（ＰＤＡ）、携帯電話、サーバーまたは他のタイプのコンピュータであり得る。当業者が承知および理解するように、ネットワーク７１２は、通信ネットワークおよび／またはローカルエリアネットワークもしく他のエリアネットワークの一部を介して１つまたはそれを超える他のコンピュータと通信している複数のコンピュータ／サーバーの、インターネット、イントラネット、テレコミュニケーションネットワーク、エクストラネットまたはワールドワイドウェブを含み得る。

当業者がさらに理解するように、例示的なプログラム製品または機械可読媒体７０８は、必要に応じて、ハードウェアの機能を制御し、その操作を指示する１セットまたはそれを超える順序づけられた操作を提供する、マイクロコード、プログラム、クラウドコンピューティング形式、ルーチンおよび／または記号言語の形である。プログラム製品７０８もまた、例示的な実施形態によると、その全体が揮発性メモリに存在する必要はないが、当業者が承知および理解するように、様々な方法に従って、必要に応じて選択的にロードされ得る。

当業者にさらに理解されるように、用語「コンピュータ可読媒体」または「機械可読媒体」とは、実行のためにプロセッサーに命令を提供することに関与する任意の媒体のことを指す。例えば、用語「コンピュータ可読媒体」または「機械可読媒体」は、配布媒体、クラウドコンピューティング形式、中間記憶媒体、コンピュータの実行メモリ、および例えばコンピュータによる読み取りのための、本開示の様々な実施形態の機能またはプロセスを実行するプログラム製品７０８を保存することができる他の任意の媒体またはデバイスを包含する。「コンピュータ可読媒体」または「機械可読媒体」は、不揮発性媒体、揮発性媒体および伝送媒体を含むがこれらに限定されない多くの形を取り得る。不揮発性媒体としては、例えば、光ディスクまたは磁気ディスクが挙げられる。揮発性媒体としては、所与のシステムのメインメモリなどのダイナミックメモリが挙げられる。伝送媒体としては、バスを構成するワイヤを含む、同軸ケーブル、銅線および光ファイバーが挙げられる。伝送媒体は、音波または光波（例えば、とりわけ、電波通信および赤外線通信中に発生するもの）の形も取り得る。コンピュータ可読媒体の例示的な形態としては、フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、フラッシュドライブもしくは他の任意の磁気媒体、ＣＤ－ＲＯＭ、他の任意の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の任意の物理的媒体、ＲＡＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ（登録商標）－ＥＰＲＯＭ、他の任意のメモリチップもしくはカートリッジ、搬送波、またはコンピュータが読める他の任意の媒体が挙げられる。

プログラム製品７０８は、必要に応じて、コンピュータ可読媒体からハードディスクまたは類似の中間記録媒体にコピーされる。プログラム製品７０８またはその一部が実行されるとき、それは、必要に応じて、それらの配布媒体、中間記録媒体などから、１つまたはそれを超えるコンピュータの実行メモリにロードされて、それらのコンピュータが、様々な実施形態の機能または方法に従って働くように構成される。そのような操作のすべてが、例えばコンピュータシステムの分野の当業者に周知である。

さらなる例証として、ある特定の実施形態において、本願は、１つまたはそれを超えるプロセッサー、およびそのプロセッサーと通信する１つまたはそれを超えるメモリコンポーネントを備えるシステムを提供する。そのメモリコンポーネントは、通常、実行されたとき、プロセッサーに、配列情報、サブクローナリティスコア、分類器スコア、試験結果、コントロールまたは比較対照の結果、カスタマイズされた療法などを（例えば、コミュニケーションデバイス７１４、７１６などを介して）表示させる情報を提供させる、ならびに／または他のシステムコンポーネントおよび／もしくはシステムユーザーから（例えば、コミュニケーションデバイス７１４、７１６などを介して）情報を受け取らせる、１つまたはそれを超える命令を含む。

いくつかの実施形態において、プログラム製品７０８は、コンピュータが実行可能な非一時的な命令を含み、その命令は、電子プロセッサー７０４によって実行されたとき、少なくとも、（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアを生成することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む、こと、およびｂ）少なくとも１つの選択されたカットオフ閾値をサブクローナリティスコアと比較することを行い、ここで、選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／またはそのカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる。さらなるコンピュータ可読媒体の実施形態が本明細書中に記載される。

システム７００は、通常、本明細書中に記載される方法の様々な態様を行うように構成されているさらなるシステムコンポーネントも備える。これらの実施形態のうちのいくつかにおいて、これらのさらなるシステムコンポーネントのうちの１つまたはそれを超えるものが、リモートサーバー７０２から離れて、かつ電子通信ネットワーク７１２を介してリモートサーバー７０２と通信した状態で、配置されるのに対して、他の実施形態では、これらのさらなるシステムコンポーネントのうちの１つまたはそれを超えるものが、ローカルに、かつサーバー７０２と通信した状態で（すなわち、電子通信ネットワーク７１２の非存在下において）配置されるか、または例えばデスクトップコンピュータ７１４と直接、配置される。

いくつかの実施形態において、例えば、さらなるシステムコンポーネントとしては、コントローラ７０２に作動可能に接続された（直接または間接的に（例えば、電子通信ネットワーク７１２を介して））サンプル調製コンポーネント７１８が挙げられる。サンプル調製コンポーネント７１８は、核酸増幅コンポーネント（例えば、サーマルサイクラーなど）および／または核酸配列決定装置によって増幅および／またはシーケンシングされる、サンプル中の核酸を調製する（例えば、核酸のライブラリーを調製する）ように構成されている。これらのうちのある特定の実施形態において、サンプル調製コンポーネント７１８は、サンプル中の他の構成要素から核酸を単離するように、バーコードを含む１つまたは複数のアダプターを本明細書中に記載されるような核酸に付着させるように、シーケンシングの前にゲノムまたはトランスクリプトームから１つまたはそれを超える領域を選択的に濃縮するように、など、構成されている。

ある特定の実施形態において、システム７００は、コントローラ７０２に作動可能に接続された（直接または間接的に（例えば、電子通信ネットワーク７１２を介して））核酸増幅コンポーネント７２０（例えば、サーマルサイクラーなど）も備える。核酸増幅コンポーネント７２０は、被験体由来のサンプル中の核酸を増幅するように構成されている。例えば、核酸増幅コンポーネント７２０は、必要に応じて、本明細書中に記載されるようなサンプル中のゲノムまたはトランスクリプトームから、選択的に濃縮された領域を増幅するように構成されている。

システム７００はまた、通常、コントローラ７０２に作動可能に接続された（直接または間接的に（例えば、電子通信ネットワーク７１２を介して））少なくとも１つの核酸配列決定装置７２２を備える。核酸配列決定装置７２２は、被験体由来のサンプル中の核酸（例えば、増幅核酸）から配列情報を提供するように構成されている。本質的に任意のタイプの核酸配列決定装置が、これらのシステムにおいて使用するために適合され得る。例えば、核酸配列決定装置７２２は、必要に応じて、核酸に対してバイサルファイトシーケンシング、パイロシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシングまたは他の手法を行って、シーケンシングリードを生成するように構成されている。必要に応じて、核酸配列決定装置７２２は、配列リードを配列リードのファミリーにグループ分けするように構成されており、その各ファミリーは、所与のサンプル中の核酸から生成された配列リードを含む。いくつかの実施形態において、核酸配列決定装置７２２は、シーケンシングライブラリーから得られたクローナル一分子アレイを用いて、シーケンシングリードを生成する。ある特定の実施形態において、核酸配列決定装置７２２は、シーケンシングライブラリーをシーケンシングしてシーケンシングリードを生成するためのマイクロウェルのアレイを有する少なくとも１つのチップを備える。

システムの完全なまたは部分的な自動化を促進するために、システム７００は、通常、コントローラ７０２に作動可能に接続された（直接または間接的に（例えば、電子通信ネットワーク７１２を介して））材料移動コンポーネント７２４も備える。材料移動コンポーネント７２４は、核酸配列決定装置７２２、サンプル調製コンポーネント７１８および核酸増幅コンポーネント７２０に、ならびに／またはそれらから、１つまたはそれを超える材料（例えば、核酸サンプル、アンプリコン、試薬など）を移動させるように構成されている。

コンピュータシステムおよびネットワーク、データベースならびにコンピュータプログラム製品に関するさらなる詳細は、例えば、Ｐｅｔｅｒｓｏｎ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｓ：ＡＳｙｓｔｅｍｓＡｐｐｒｏａｃｈ，ＭｏｒｇａｎＫａｕｆｍａｎｎ，５ｔｈＥｄ．（２０１１）、Ｋｕｒｏｓｅ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｉｎｇ：ＡＴｏｐ－ＤｏｗｎＡｐｐｒｏａｃｈ，Ｐｅａｒｓｏｎ，７^ｔｈＥｄ．（２０１６）、Ｅｌｍａｓｒｉ，ＦｕｎｄａｍｅｎｔａｌｓｏｆＤａｔａｂａｓｅＳｙｓｔｅｍｓ，ＡｄｄｉｓｏｎＷｅｓｌｅｙ，６ｔｈＥｄ．（２０１０）、Ｃｏｒｏｎｅｌ，ＤａｔａｂａｓｅＳｙｓｔｅｍｓ：Ｄｅｓｉｇｎ，Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ，＆Ｍａｎａｇｅｍｅｎｔ，ＣｅｎｇａｇｅＬｅａｒｎｉｎｇ，１１^ｔｈＥｄ．（２０１４）、Ｔｕｃｋｅｒ，ＰｒｏｇｒａｍｍｉｎｇＬａｎｇｕａｇｅｓ，ＭｃＧｒａｗ－ＨｉｌｌＳｃｉｅｎｃｅ／Ｅｎｇｉｎｅｅｒｉｎｇ／Ｍａｔｈ，２ｎｄＥｄ．（２００６）およびＲｈｏｔｏｎ，ＣｌｏｕｄＣｏｍｐｕｔｉｎｇＡｒｃｈｉｔｅｃｔｅｄ：ＳｏｌｕｔｉｏｎＤｅｓｉｇｎＨａｎｄｂｏｏｋ，ＲｅｃｕｒｓｉｖｅＰｒｅｓｓ（２０１１）（これらの各々は、その全体が参照により援用される）にも提供されている。

実施例１：循環腫瘍セルフリーＤＮＡ

手術後の結腸直腸癌（ＣＲＣ）患者におけるＣｔＤＮＡ（循環腫瘍セルフリーＤＮＡ）は、分子残存疾患（ｍｏｌｅｃｕｌａｒｒｅｓｉｄｕａｌｄｉｓｅａｓｅ）と相関し、予後判定に有用であり得、また、補助療法の意思決定を導くのに有用であり得る。

手術後のｃｔＤＮＡは、根治的手術を受けた転移性ＣＲＣを有する患者において疾患の再発と強く関連する（ｐ＝０．００４）。Ｏｖｅｒｍａｎら（２０１７）を参照のこと。高感度パネルを利用して、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を見出すことにより、肝切除術後の微小残存病変を検出することおよび疾患の再発を予測することができる。ＪＣＯ３５（ｓｕｐｐｌ）。初期の研究では、個々の患者特異的腫瘍組織由来変異にインデックスされた臨床的に無理のあるアッセイが用いられたか、またはクローン性造血に関係するバリアントを含む非腫瘍関連の体細胞性変化によって混乱が生じた。ＴｉｅＪ．ら（２０１６）．ＳｃｉＴｒａｎｓｌＭｅｄ８（３４６）を参照のこと。

高感度のＣＲＣ次世代シーケンシング（ＮＧＳ）パネルを用いることによって、手術後のｃｔＤＮＡの検出には、既知の体細胞性変化の予知が必要ないことを示すデータが提供される。手術後のＣＲＣ患者におけるｃｔＤＮＡ検出の特異度を高めることを目標に、バリアント分類器を用いて、腫瘍由来の変化と非腫瘍由来の変化をさらに区別した（図８Ａ～Ｃにおける分類器フィルターを参照のこと）。

肝臓の転移巣切除術を予定されていたＣＲＣ患者を、ＩＲＢ承認済みの治験に前向きに登録した。手術前および手術後の血漿を、ＣＲＣに対する理論的感度が９６％の３８遺伝子ＮＧＳパネルを用いて高デプスまでシーケンシングした。事前のｃｔＤＮＡ結果と事後のｃｔＤＮＡ結果の両方を有する５１人の転移性結腸直腸癌患者を単一施設で募集した（表４：コホートの人口統計）。このパネルまたはローカルテストを用いて、腫瘍組織をシーケンシングした。１７７００ＣＲＣｐｔｓ（ＧｕａｒｄａｎｔＨｅａｌｔｈ，ＲｅｄｗｏｏｄＣｉｔｙ，ＣＡ）からのｃｔＤＮＡプロファイルを用いて、非腫瘍由来の変化を除外するようにバリアント分類器を訓練した。その分類器は、腫瘍を起源とするｃｆＤＮＡ変異を識別するようにデザインされた。

手術後の体細胞性バリアント検出のみを用いた再発予測は、高い臨床上の偽陽性率を伴う。非腫瘍起源の変異の多くが、低アレル頻度で生じる。しかしながら、アレル頻度に対する単純な閾値は、多くの臨床的に関連性のある変異を除外し得る。腫瘍組織を用いたフィルタリングは有効であるが、複雑さおよびコストが増すので、臨床的に無理があり得る。腫瘍遺伝子型の予知なしで新規のバリアント分類器を用いるフィルタリングは、臨床的に許容され得る感度を維持しつつ、偽陽性を無くした。先験的なバリアント分類は、初期の疾患における補助療法の意思決定のための臨床的に実現可能なｃｔＤＮＡ診断を可能にし得る。

前述の開示は、明確化および理解の目的で例証および例示としてある程度詳細に説明してきたが、形態および詳細の様々な変更が、本開示の真の範囲から逸脱することなく可能であること、および添付の請求項の範囲内で行われ得ることが、本開示を読むことで当業者には明らかになるだろう。例えば、すべての方法、システム、コンピュータ可読媒体および／または構成要素の特徴、工程、エレメントまたはそれらの他の態様が、様々な組み合わせで用いることができる。

本明細書に引用されたすべての特許、特許出願、ウェブサイト、他の刊行物または書類、アクセッション番号などは、各個別の項目が参照により援用されると明確かつ個別に示されたのと同程度に、あらゆる目的のためにそれらの全体が参照により援用される。ある配列の異なるバージョンが、種々の時点におけるアクセッション番号と関連付けられている場合、本出願の有効出願日時点のそのアクセッション番号と関連付けられているバージョンを意味する。有効出願日とは、実際の出願日、または該当する場合、アクセッション番号を参照している優先権出願の出願日のうち、いずれか早い日を意味する。同様に、異なるバージョンの刊行物、ウェブサイトなどが、異なる時点に公開されている場合、別段示されない限り、本出願の有効出願日から最も近く公開されたバージョンを意味する。
本発明は、例えば、以下の項目を提供する。
(項目１)
少なくとも部分的にコンピュータを使用して、被験体内の標的細胞を起源とする核酸分子を検出する方法であって、前記方法は、
（ａ）前記被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を前記コンピュータによって受信する工程；および
（ｂ）前記試験配列情報における少なくとも１つのアレルバリアントを識別する工程；
（ｃ）前記アレルバリアントを標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルにマッピングする工程；
（ｄ）前記分類アレルのサブクローナリティスコアを識別する工程；および
（ｅ）前記サブクローナリティスコアを少なくとも１つの選択されたカットオフ閾値と比較する工程であって、ここで、前記サブクローナリティスコアが、前記選択されたカットオフ閾値未満であるとき、それは、前記分類アレルが、前記標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それによって、前記被験体内の前記標的細胞を起源とする核酸分子を検出する、工程
を含む、方法。
(項目２)
少なくとも部分的にコンピュータを使用して、被験体内の腫瘍細胞を起源とする核酸分子を検出する方法であって、前記方法は、
（ａ）前記被験体から得られた試験サンプル中のセルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントから得られた配列リードを含む試験配列情報を前記コンピュータによって受信する工程；
（ｂ）前記コンピュータによって、前記被験体の造血幹細胞を起源とする１つまたはそれを超える前記配列リードまたは分類アレルを試験配列情報から除去して、フィルターされた前記試験配列情報を生成する工程；および
（ｃ）１またはそれを超える参照被験体から得られた参照配列情報と実質的にアラインメントする１つまたはそれを超える前記配列リードが前記フィルターされた試験配列情報に存在することを前記コンピュータによって識別する工程であって、その参照配列情報は、前記参照被験体内の１つまたはそれを超える腫瘍細胞を起源とし、それによって、前記被験体内の前記腫瘍細胞を起源とする前記核酸分子を検出する、工程
を含む、方法。
(項目３)
被験体における疾患を処置する方法であって、前記方法は、
（ａ）前記被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信する工程；
（ｂ）標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが前記試験配列情報に存在することを識別する工程であって、その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、前記分類アレルは、罹患細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それによって、前記被験体における前記疾患を診断する、工程；および
（ｃ）前記被験体に１つまたはそれを超える療法を施し、それによって、前記被験体における疾患を処置する工程
を含む、方法。
(項目４)
少なくとも部分的にコンピュータを使用して、分類器を生成する方法であって、前記方法は、
（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアを、前記コンピュータによって生成する工程であって、ここで、各分類アレルは、潜在的に臨床的に有意であり、前記参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む、工程；および
（ｂ）前記コンピュータによって、前記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較する工程であって、
ここで、前記選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または
前記カットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられ、
それによって、前記分類器を生成する工程
を含む、方法。
(項目５)
少なくとも部分的にコンピュータを使用して、分類器を生成する方法であって、前記方法は、
（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットを前記コンピュータによって識別する工程であって、ここで、各分類アレルは、潜在的に臨床的に有意であり、前記参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む、工程；
（ｂ）前記配列情報から、前記参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値を前記コンピュータによって決定する工程；
（ｃ）前記参照サンプルの各々について、最大マイナーアレル頻度（ｍａｘＭＡＦ）の値を前記コンピュータによって決定する工程；
（ｄ）所与の参照サンプルにおいて観察された各分類アレルについて、前記参照サンプルの少なくとも一部に対する前記ｍａｘＭＡＦの値に対する前記ＭＡＦの値の比を前記コンピュータによって計算して、比の値を生成する工程；
（ｅ）前記参照サンプルの少なくとも一部における所与の分類アレルが、前記参照サンプルの少なくとも一部に出現した前記所与の分類アレルの回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、前記分類アレルの各々について、前記コンピュータによって計算して、前記参照サンプルの少なくと
も一部における前記分類アレルの各々に対するサブクローナリティスコアを生成する工程；および
（ｆ）前記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を前記コンピュータによって比較する工程であって、
ここで、前記選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または
前記カットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられ、
それによって、前記分類器を生成する工程
を含む、方法。
(項目６)
被験体から得られた試験サンプル中のセルフリー核酸（ｃｆＮＡ）フラグメントの細胞起源を分類する際に使用するサブクローナリティスコアのデータベースを作成する方法であって、前記方法は、
（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットをコンピュータによって識別する工程であって、ここで、各分類アレルは、潜在的に臨床的に有意であり、前記参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含む、工程；
（ｂ）前記配列情報から、前記参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値を前記コンピュータによって決定する工程；
（ｃ）前記参照サンプルの各々について、最大マイナーアレル頻度（ｍａｘＭＡＦ）の値を前記コンピュータによって決定する工程；
（ｄ）所与の参照サンプル中に観察された各分類アレルについて、前記参照サンプルの少なくとも一部に対する前記ｍａｘＭＡＦの値に対する前記ＭＡＦの値の比を前記コンピュータによって計算して、比の値を生成する工程；
（ｅ）前記参照サンプルの少なくとも一部における所与の分類アレルが、前記参照サンプルの少なくとも一部に出現した前記所与の分類アレル回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、前記分類アレルの各々について、前記コンピュータによって計算して、前記参照サンプルの少なくとも一部における前記分類アレルの各々に対するサブクローナリティスコアを生成する工程；および
（ｆ）対応する分類アレルにインデックスされた前記サブクローナリティスコアをデータベースシステムに非一時的に保存し、それによって、被験体から得られた試験サンプル中のｃｆＮＡフラグメントの前記細胞起源を分類する際に使用する前記サブクローナリティスコアのデータベースを作成する工程
を含む、方法。
(項目７)
前記分類アレルセットを識別する工程が、前記参照サンプルから得られた前記配列情報から、潜在的に臨床的に有意な標的ゲノム遺伝子座セット内の各遺伝子座における各体細胞性核酸バリアントに対するＭＡＦの値を決定する工程であって、ここで、前記標的ゲノム遺伝子座セットは、各参照サンプルにおいて同一である、工程、および前記参照サンプルの各々についてｍａｘＭＡＦの値を決定してアレル情報を生成する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目８)
各分類アレルに対する前記ＭＡＦが、約２％未満である、先行する項目のいずれか１項に記載の方法。
(項目９)
各分類アレルに対する前記ＭＡＦが、約１％未満である、先行する項目のいずれか１項に記載の方法。
(項目１０)
前記参照サンプルにインデックスされた臨床情報を用いて、前記分類器を生成する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目１１)
前記試験サンプルにインデックスされた臨床情報を用いて、前記被験体内の前記標的細胞を起源とする前記核酸分子を検出する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目１２)
前記臨床情報が、年齢、性別、人種、体重、ボディマス指数（ＢＭＩ）、病歴、喫煙および飲酒からなる群より選択される、先行する項目のいずれか１項に記載の方法。
(項目１３)
前記分類アレルの各々に対する各ＭＡＦ／ｍａｘ－ＭＡＦ値の頻度を用いて、サブクローナリティスコアを決定する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目１４)
前記選択されたクローナリティ境界値が、約１％～約９９％の範囲内である、先行する項目のいずれか１項に記載の方法。
(項目１５)
前記選択されたクローナリティ境界値が、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％または約９０％である、先行する項目のいずれか１項に記載の方法。
(項目１６)
前記選択されたカットオフ閾値が、約１％～約９９％の範囲内である、先行する項目のいずれか１項に記載の方法。
(項目１７)
前記選択されたカットオフ閾値が、約１０％、約２０％、約３０％、約４０％、約５０％、約６０％、約７０％、約８０％または約９０％である、先行する項目のいずれか１項に記載の方法。
(項目１８)
前記サブクローナリティスコアを複数の選択されたカットオフ閾値と比較する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目１９)
前記複数の選択されたカットオフ閾値が、第１のカットオフ閾値および第２のカットオフ閾値を含み、その第１のカットオフ閾値は、前記第２のカットオフ閾値より大きく、前記第１のカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、前記非標的核酸バリアントフィルターリストに加えられ、かつ／または前記第２のカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、前記標的核酸バリアントフィルターリストに加えられる、先行する項目のいずれか１項に記載の方法。
(項目２０)
非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、前記試験配列情報におけるアレルバリアントが、約１％を超えるＭＡＦを含むとき、前記アレルバリアントを、標的細胞を起源とすると分類する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目２１)
非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、前記試験配列情報におけるアレルバリアントが、トランケーション、インデルお
よび／またはスプライス部位バリアントを含むとき、前記アレルバリアントを、標的細胞を起源とすると分類する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目２２)
前記参照サンプルの少なくとも一部における所与の分類アレルに対する各比の値の頻度を決定する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目２３)
前記分類器を用いて、被験体から得られた試験サンプルが、前記標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目２４)
前記分類器を用いて、被験体から得られた試験サンプルが、前記非標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定する工程を含む、先行する項目のいずれか１項に記載の方法。
(項目２５)
先行する項目のいずれか１項に記載の標的核酸バリアントフィルターリストおよび／または非標的核酸バリアントフィルターリストを含む、データベース。
(項目２６)
前記非標的細胞が、非罹患細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目２７)
前記非標的細胞が、造血幹細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目２８)
前記非標的細胞が、非腫瘍細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目２９)
前記非標的細胞が、母体細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目３０)
前記非標的細胞が、移植レシピエント細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目３１)
前記標的細胞が、罹患細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目３２)
前記標的細胞が、腫瘍細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目３３)
前記標的細胞が、胎児細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目３４)
前記標的細胞が、移植ドナー細胞を含む、先行する項目のいずれか１項に記載の方法。
(項目３５)
前記疾患が、癌を含み、前記療法が、少なくとも１つの免疫療法を含む、先行する項目のいずれか１項に記載の方法。
(項目３６)
前記被験体が、哺乳動物被験体である、先行する項目のいずれか１項に記載の方法。
(項目３７)
前記哺乳動物被験体が、ヒト被験体である、先行する項目のいずれか１項に記載の方法。(項目３８)
前記被験体から前記試験サンプルを得る工程をさらに含む、先行する項目のいずれか１項に記載の方法。
(項目３９)
前記試験サンプルが、血液、血漿、血清、痰、尿、精液、膣液、便、滑液、髄液および唾液からなる群より選択される、先行する項目のいずれか１項に記載の方法。
(項目４０)
前記試験サンプル中の前記ｃｆＮＡフラグメントから前記試験配列情報を生成する工程を
さらに含む、先行する項目のいずれか１項に記載の方法。
(項目４１)
標的ゲノム遺伝子座を含む前記ｃｆＮＡフラグメントのセグメントを増幅して、増幅核酸を生成する工程をさらに含む、先行する項目のいずれか１項に記載の方法。
(項目４２)
前記試験サンプル中の前記ｃｆＮＡフラグメントをシーケンシングして、前記試験配列情報を生成する工程をさらに含む、先行する項目のいずれか１項に記載の方法。
(項目４３)
前記試験配列情報が、前記試験サンプル中の前記ｃｆＮＡフラグメントの標的化セグメントから得られ、前記標的化セグメントは、シーケンシングの前に、前記試験サンプル中の前記ｃｆＮＡフラグメントから１つまたはそれを超える領域を選択的に濃縮することによって得られる、先行する項目のいずれか１項に記載の方法。
(項目４４)
シーケンシングの前に、前記得られた標的化セグメントを増幅する工程をさらに含む、先行する項目のいずれか１項に記載の方法。
(項目４５)
シーケンシングの前に、バーコードを含む１つまたはそれを超えるアダプターを前記ｃｆＮＡフラグメントおよび／または前記増幅された標的化セグメントに付着させる工程をさらに含む、先行する項目のいずれか１項に記載の方法。
(項目４６)
前記シーケンシングが、ターゲットシーケンシング、バイサルファイトシーケンシング、イントロンシーケンシング、エクソームシーケンシングおよびホールゲノムシーケンシングからなる群より選択される、先行する項目のいずれか１項に記載の方法。
(項目４７)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたは前記コンピュータ可読媒体にアクセスできるコントローラを備えるシステムであって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること；および
（ｂ）標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが前記試験配列情報に存在することを識別することであって、その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、前記分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それによって、前記試験配列情報における前記アレルバリアントが、前記被験体内の前記標的細胞を起源とすることを示すこと
を行う、システム。
(項目４８)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたは前記コンピュータ可読媒体にアクセスできるコントローラを備えるシステムであって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）前記被験体から得られた試験サンプル中のセルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること；
（ｂ）前記被験体の造血幹細胞を起源とする１つまたはそれを超える前記配列リードまたは分類アレルを前記試験配列情報から除去して、フィルターされた試験配列情報を生成すること；および
（ｃ）１またはそれを超える参照被験体から得られた参照配列情報と実質的にアラインメントする１つまたはそれを超える前記配列リードが前記フィルターされた試験配列情報に存在することを識別することであって、それらの参照配列情報は、前記参照被験体内の腫瘍細胞を起源とし、それによって、前記試験サンプルが、前記被験体内の前記腫瘍細胞を
起源とする１つまたはそれを超えるｃｆＤＮＡフラグメントを含むことを示すこと
を行う、システム。
(項目４９)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたは前記コンピュータ可読媒体にアクセスできるコントローラを備えるシステムであって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアを生成することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、前記参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含むこと；および
（ｂ）前記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較すること
を行い、
ここで、前記選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または
前記カットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる、
システム。
(項目５０)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体を備えるかまたは前記コンピュータ可読媒体にアクセスできるコントローラを備えるシステムであって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットを識別することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、前記参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含むこと；
（ｂ）前記配列情報から前記参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値を決定すること；
（ｃ）前記参照サンプルの各々について、最大マイナーアレル頻度（ｍａｘＭＡＦ）の値を決定すること；
（ｄ）所与の参照サンプルにおいて観察された各分類アレルについて、前記参照サンプルの少なくとも一部に対する前記ｍａｘＭＡＦの値に対する前記ＭＡＦの値の比を計算して、比の値を生成すること；
（ｅ）前記参照サンプルの少なくとも一部における所与の分類アレルが、前記参照サンプルの少なくとも一部に出現した前記所与の分類アレルの回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、前記分類アレルの各々について計算して、前記参照サンプルの少なくとも一部における前記分類アレルの各々に対するサブクローナリティスコアを生成すること；および
（ｆ）前記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較すること
を行い、
ここで、前記選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または
前記カットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分
類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる、
システム。
(項目５１)
前記コントローラと作動可能に接続された核酸配列決定装置を備え、その核酸配列決定装置は、前記試験サンプル中および／または前記参照サンプル中の前記ｃｆＮＡフラグメントから前記配列情報を提供するように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５２)
前記核酸配列決定装置が、前記核酸に対してパイロシーケンシング、バイサルファイトシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシングまたはハイブリダイゼーションによるシーケンシングを行って、シーケンシングリードを生成するように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５３)
前記コントローラに作動可能に接続されたサンプル調製コンポーネントを備え、そのサンプル調製コンポーネントは、核酸配列決定装置によってシーケンシングされる前記ｃｆＮＡフラグメントを調製するように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５４)
前記サンプル調製コンポーネントが、前記試験サンプル中および／または前記参照サンプル中の前記ｃｆＮＡフラグメントからの領域を選択的に濃縮するように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５５)
前記サンプル調製コンポーネントが、バーコードを含む１つまたは複数のアダプターを前記ｃｆＮＡフラグメントに付着させるように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５６)
前記コントローラに作動可能に接続された核酸増幅コンポーネントを備え、前記核酸増幅コンポーネントは、前記試験サンプル中および／または前記参照サンプル中の前記ｃｆＮＡフラグメントを増幅するように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５７)
前記核酸増幅コンポーネントが、前記試験サンプル中および／または前記参照サンプル中の前記ｃｆＮＡフラグメントから、選択的に濃縮された領域を増幅するように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５８)
前記コントローラに作動可能に接続された材料移動コンポーネントを備え、その材料移動コンポーネントは、１つまたはそれを超える材料を、核酸配列決定装置、核酸増幅コンポーネントおよび／またはサンプル調製コンポーネントの間を移動させるように構成されている、先行する項目のいずれか１項に記載のシステム。
(項目５９)
前記コントローラに作動可能に接続されたデータベースを備え、そのデータベースは、前記非標的核酸バリアントフィルターリストおよび／または前記標的核酸バリアントフィルターリストを含む、先行する項目のいずれか１項に記載のシステム。
(項目６０)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体であって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）被験体から得られた試験サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること；および
（ｂ）標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする少なくとも１つのアレルバリアントが前記試験配列情報に存在することを識別することであって、その分類アレルは、少なくとも１つの選択されたカットオフ閾値未満のサブクローナリティスコアを含み、それによって、前記分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメントに由来することを示し、それによって、前記試験配列情報における前記アレルバリアントが、前記被験体内の前記標的細胞を起源とすることを示すこと
を行う、コンピュータ可読媒体。
(項目６１)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体であって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）前記被験体から得られた試験サンプル中のセルフリーデオキシリボ核酸（ｃｆＤＮＡ）フラグメントから得られた配列リードを含む試験配列情報を受信すること；
（ｂ）前記被験体の造血幹細胞を起源とする１つまたはそれを超える前記配列リードまたは分類アレルを前記試験配列情報から除去して、フィルターされた試験配列情報を生成すること；および
（ｃ）１またはそれを超える参照被験体から得られた参照配列情報と実質的にアラインメントする１つまたはそれを超える前記配列リードが前記フィルターされた試験配列情報に存在することを識別することであって、その参照配列情報は、前記参照被験体内の腫瘍細胞を起源とし、それによって、前記試験サンプルが、前記被験体内の前記腫瘍細胞を起源とする１つまたはそれを超えるｃｆＤＮＡフラグメントを含むことを示すこと
を行う、コンピュータ可読媒体。
(項目６２)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体であって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から、分類アレルセット内の各アレルに対するサブクローナリティスコアを生成することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、前記参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含むこと；および
（ｂ）前記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較すること
を行い、
ここで、前記選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または
前記カットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる、
コンピュータ可読媒体。
(項目６３)
コンピュータが実行可能な非一時的な命令を含むコンピュータ可読媒体であって、前記命令は、少なくとも１つの電子プロセッサーによって実行されたとき、少なくとも、
（ａ）１つまたはそれを超える参照サンプル由来のセルフリー核酸（ｃｆＮＡ）フラグメントから得られた配列リードを含む配列情報から分類アレルセットを識別することであって、ここで、各分類アレルは、潜在的に臨床的に有意であり、前記参照サンプル中の所与の遺伝子座に観察されるマイナーアレルを含むこと；
（ｂ）前記配列情報から前記参照サンプルの各々における各分類アレルに対するマイナーアレル頻度（ＭＡＦ）の値を決定すること；
（ｃ）前記参照サンプルの各々について、最大マイナーアレル頻度（ｍａｘＭＡＦ）の値を決定すること；
（ｄ）所与の参照サンプルにおいて観察された各分類アレルについて、前記参照サンプルの少なくとも一部に対する前記ｍａｘＭＡＦの値に対する前記ＭＡＦの値の比を計算して、比の値を生成すること；
（ｅ）前記参照サンプルの少なくとも一部における所与の分類アレルが、前記参照サンプルの少なくとも一部に出現した前記所与の分類アレルの回数の合計数に対する、少なくとも１つの選択されたクローナリティ境界値未満の比の値を有した回数の比を、前記分類アレルの各々について計算して、前記参照サンプルの少なくとも一部における前記分類アレルの各々に対するサブクローナリティスコアを生成すること；および
（ｆ）前記サブクローナリティスコアと少なくとも１つの選択されたカットオフ閾値を比較すること
を行い、
ここで、前記選択されたカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、非標的核酸バリアントフィルターリストに加えられ、かつ／または前記カットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、標的核酸バリアントフィルターリストに加えられる、
コンピュータ可読媒体。
(項目６４)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記参照サンプルから得られた前記配列情報から、潜在的に臨床的に有意な、標的ゲノム遺伝子座セット内の各遺伝子座における各体細胞性核酸バリアントに対するＭＡＦの値を決定することであって、ここで、前記標的ゲノム遺伝子座セットは、各参照サンプルにおいて同一であること、および前記参照サンプルの各々についてｍａｘＭＡＦの値を決定してアレル情報を生成することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目６５)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記参照サンプルにインデックスされた臨床情報を用いて、前記非標的核酸バリアントフィルターリストおよび／または前記標的核酸バリアントフィルターリストを生成することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目６６)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記試験サンプルにインデックスされた臨床情報を用いて、前記被験体内の前記標的細胞を起源とするｃｆＮＡフラグメントを検出することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。(項目６７)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記分類アレルの各々に対する各ＭＡＦ／ｍａｘ－ＭＡＦ値の頻度を用いてサブクローナリティスコアを決定することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目６８)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記サブクローナリティスコアを複数の選択されたカットオフ閾値と比較することであって、ここで、前記複数の選択されたカットオフ閾値は、第１のカットオフ閾値および第２のカットオフ閾値を含み、その第１のカットオフ閾値は、前記第２のカットオフ閾値より大きく、前記第１のカットオフ閾値を超えるサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、非標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、前記非標的核酸バリアントフィルターリストに加えられ、かつ／または前記第２のカットオフ閾値未満のサブクローナリティスコアを有する分類アレルは、それらの分類アレルが、標的細胞を起源とする参照ｃｆＮＡフラグメント由来であることを示し、それらの分類アレルは、前記標的核酸バリアントフィルターリストに加えられることを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目６９)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、前記試験配列情報におけるアレルバリアントが、約１％を超えるＭＡＦを含むとき、前記アレルバリアントを、標的細胞を起源とすると分類することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目７０)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、非標的核酸バリアントフィルターリスト上の少なくとも１つの分類アレルと実質的にマッチする、前記試験配列情報におけるアレルバリアントが、トランケーション、インデルおよび／またはスプライス部位バリアントを含むとき、前記アレルバリアントを、標的細胞を起源とすると分類することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目７１)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記参照サンプルの少なくとも一部における所与の分類アレルに対する各比の値の頻度を決定することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目７２)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記標的核酸バリアントフィルターリストを用いて、被験体から得られた試験サンプルが、前記標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。
(項目７３)
コンピュータが実行可能な非一時的な命令が、前記少なくとも１つの電子プロセッサーによって実行されたとき、前記非標的核酸バリアントフィルターリストを用いて、被験体から得られた試験サンプルが、前記非標的細胞を起源とするｃｆＮＡフラグメントを含むか否かを決定することを少なくともさらに行う、前記コンピュータが実行可能な非一時的な命令を、前記コンピュータ可読媒体が含む、先行する項目のいずれか１項に記載のシステムまたはコンピュータ可読媒体。

Claims

明細書に記載の発明。