JP2023052512A

JP2023052512A - 体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステム

Info

Publication number: JP2023052512A
Application number: JP2023006454A
Authority: JP
Inventors: ナンストレイシー; Nance Tracy; ヘルマンエレナ; Helman Elena; チュドヴァダーリヤ; Chudova Darya
Original assignee: Guardant Health Inc
Current assignee: Guardant Health Inc
Priority date: 2017-09-20
Filing date: 2023-01-19
Publication date: 2023-04-11
Also published as: JP2020536509A; CA3075932A1; WO2019060640A1; CN111357054A; US20200327954A1; EP3685386A1; JP7242644B2; SG11202002381TA; AU2018335405A1; KR20200057024A

Abstract

【課題】体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステムの提供。【解決手段】本発明の方法は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む核酸バリアントに関する定量測定値を判定するステップと、核酸バリアントの関連付けられた変数を識別するステップと、関連付けられた変数に関する定量値を判定するステップと、核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、少なくとも部分的に統計モデル、定量値および定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、核酸バリアントを分類するステップとを含む。【選択図】なし

Description

相互参照
本願は、参照することによってその全体として本明細書に組み込まれる、２０１７年９月２０日に出願された米国仮出願第６２／５６１，０４８号の利益を主張する。

背景
癌ゲノム科学の重要な側面は、患者の適切な処置のために、遺伝子改変の起源を精密に識別することである。最近の研究では、進行性癌の患者の２％を上回る者において、未確認の生殖細胞系統改変が、標的化可能体細胞改変に関する次世代シーケンシング（ＮＧＳ）の間に付随的に見出されたことが発見された。しかしながら、組織ベースのＮＧＳは、正常組織との比較を伴わずに、生殖細胞系統突然変異体と体細胞突然変異体を正確に区別することが不可能であり得る。血漿中では、体細胞バリアントは、典型的には、生殖細胞系統バリアントより１～２桁低い大きさであり得る、突然変異対立遺伝子割合（ＭＡＦ）で生じ、故に、液体生検は、生殖細胞系統／体細胞起源を正確に割り当てることができる。しかしながら、コピー数多型（ＣＮＶ）またはヘテロ接合性の消失（ＬＯＨ）からの対立遺伝子不均衡等のある要因は、生殖細胞系統ＭＡＦを生殖細胞系統ＭＡＦに関する予期される範囲から歪ませ得る。したがって、バリアントの起源を判定する際、これらの要因を考慮し得る、方法の必要性が存在する。

要旨
本開示は、無細胞デオキシリボ核酸（ｃｆＤＮＡ）等の核酸分子のサンプル中の体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステムを提供する。そのような方法は、共通一塩基多型（ＳＮＰ）を使用して、局所生殖細胞系統対立遺伝子カウント挙動をモデル化し得、観察される生殖細胞系統ＭＡＦからのＭＡＦ逸脱に基づいて、体細胞バリアントを区別し得る。

一側面では、本開示は、核酸バリアントの体細胞または生殖細胞系統起源を核酸分子のサンプル（例えば、組織サンプル、無細胞ＤＮＡのサンプル、および／または同等物）から識別する方法を提供する。本方法は、（ａ）核酸バリアントに関する１つまたはそれを上回る定量測定値を核酸サンプルから判定するステップを含む。定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む。本方法はまた、（ｂ）核酸バリアントの少なくとも１つの関連付けられた変数を核酸サンプルから識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップとを含む。本方法はさらに、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）予期される生殖細胞系統対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップとを含む。さらに、本方法はまた、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントのｐ値が閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップを含む。

一側面では、本開示は、核酸バリアントの体細胞または生殖細胞系統起源を無細胞核酸分子（例えば、無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子）のサンプルから識別する方法であって、（ａ）核酸バリアントに関する複数の定量測定値を無細胞核酸分子のサンプルから判定するステップであって、複数の定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの関連付けられた変数を無細胞核酸分子のサンプルから識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントに関するｐ値が所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を提供する。

いくつかの実施形態では、本方法は、無細胞核酸分子のサンプルを対象から取得するステップをさらに含む。いくつかの実施形態では、本方法は、無細胞核酸分子のサンプルから生成されたシーケンシング情報を受信するステップをさらに含み、シーケンシング情報は、核酸バリアントおよび核酸バリアントの関連付けられた変数を含む、無細胞核酸シーケンシングリードを含み、関連付けられた変数は、核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む。いくつかの実施形態では、本方法は、シーケンシング情報を生成するために、核酸を無細胞核酸分子のサンプルからシーケンシングするステップをさらに含み、核酸バリアントに関する複数の定量測定値および関連付けられた変数に関する定量値は、シーケンシング情報から判定される。

いくつかの実施形態では、本方法は、核酸バリアントに関する複数の定量測定値を判定するステップと、核酸バリアントの関連付けられた変数を識別するステップと、関連付けられた変数に関する定量値を無細胞核酸分子のサンプルから生成されたシーケンシング情報から判定するステップとをさらに含む。いくつかの実施形態では、本方法は、無細胞核酸分子のサンプルの核酸に関する予期される生殖細胞系統突然変異対立遺伝子カウントのベータ二項モデルを使用して、所定の閾値を生成するステップをさらに含む、請求項のいずれかに記載の方法。いくつかの実施形態では、本方法は、複数の核酸バリアントの体細胞または生殖細胞系統起源を無細胞核酸分子のサンプル内の複数のゲノム遺伝子座から分類するステップをさらに含む。

いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも２個のｈｅｔＳＮＰを含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、核酸バリアントを含むゲノム遺伝子座に連鎖するゲノム遺伝子座を含む。

いくつかの実施形態では、本方法は、核酸バリアントの関連付けられた変数に関する１つまたはそれを上回る突然変異対立遺伝子カウントの平均値および／または分散値を判定するステップをさらに含む。いくつかの実施形態では、本方法は、核酸バリアントの関連付けられた変数に関する平均定量値を判定するステップをさらに含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、ヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、および対象に関する臨床データのうちの１つまたはそれを上回るものを含む。いくつかの実施形態では、本方法は、核酸バリアントの関連付けられた変数の平均値および／または分散値を判定するステップをさらに含む。

いくつかの実施形態では、本方法は、核酸バリアントに関する局所生殖細胞系統折畳突然変異対立遺伝子割合（ＭＡＦ）、μｂｉｎを判定するステップをさらに含み、ｂｉｎは、核酸バリアントを含む、遺伝子または別の規定されたゲノム領域であって、折畳ＭＡＦは、ｍｉｎ（ＭＡＦ，１－ＭＡＦ）である。いくつかの実施形態では、規定されたゲノム領域は、核酸バリアントの約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、または１０^１０個の塩基対内の領域である。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、約０．００１を上回る集団対立遺伝子頻度（ＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも１個の非発癌性一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、約０．９未満の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。

いくつかの実施形態では、関連付けられた変数は、核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ＳＮＰ）を含み、方法は、以下を使用して、ベータ二項分布パラメータを推定するステップを含み：（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）式中、ｙ＝少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、ｘ＝ｍｉｎ（少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、μ_ｂｉｎ＝あるビン内のヘテロ接合型ＳＮＰの平均値突然変異対立遺伝子カウントの推定値であって、ビンは、核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である。いくつかの実施形態では、本方法はさらに、ｐ値に関する上界および下界を計算するステップを含む。いくつかの実施形態では、本方法はさらに：ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））を使用して、核酸バリアントに関する両側ｐ値を計算するステップを含み、式中、Ｐｒ_ｂｂ＝ベータ二項の確率であって、ｘ’＝ベータ二項を伴って分散される無作為変数であって、Ａ＝核酸バリアントの突然変異対立遺伝子カウントであって、Ｂ＝核酸バリアントの総分子カウントである。いくつかの実施形態では、ρは、過去のサンプルセットからのρ値の少なくとも１つのセットの中央値を含む。いくつかの実施形態では、本方法はさらに、中央値ρパラメータを核酸バリアントのＧＣ含量の関数と置換するステップを含む。いくつかの実施形態では、本方法はさらに、μ_ｂｉｎの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、本方法はさらに、μ_ｂｉｎの平均値推定値を判定するステップを含む。いくつかの実施形態では、本方法はさらに、ρの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、本方法はさらに、ρの分散推定値を判定するステップを含む。いくつかの実施形態では、本方法はさらに、体細胞または生殖細胞系統起源のいずれかである、核酸バリアントの分類のインジケーションを提供する、電子および／または紙フォーマットにおける報告を生成するステップを含む。

別の側面では、本開示は、少なくとも１つの電子プロセッサによって実行される場合に、（ａ）核酸バリアントに関する複数の定量測定値を無細胞核酸分子（例えば、無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子）のサンプルから生成されたシークエンシング情報から判定するステップであって、複数の定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの関連付けられた変数をシークエンシング情報から識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントに関するｐ値が所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を実施する、コンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を提供する。

いくつかの実施形態では、所定の閾値は、無細胞核酸分子（例えば、ｃｆＤＮＡ分子）のサンプルに関する予期される生殖細胞系統突然変異対立遺伝子カウントのベータ二項モデルを使用して生成される。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも２個のｈｅｔＳＮＰを含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、核酸バリアントを含むゲノム遺伝子座に連鎖するゲノム遺伝子座を含む。いくつかの実施形態では、１つまたはそれを上回る突然変異対立遺伝子カウントの平均値および／または分散値が、核酸バリアントの関連付けられた変数に関して判定される。いくつかの実施形態では、複数の定量測定値のうちの少なくとも１つは、核酸バリアントを含む、無細胞核酸分子のサンプルの核酸分子の数を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、ヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、および対象に関する臨床データのうちの１つまたはそれを上回るものを含む。

いくつかの実施形態では、局所生殖細胞系統折畳突然変異対立遺伝子割合（ＭＡＦ）、μｂｉｎが、核酸バリアントに関して判定され、ｂｉｎは、核酸バリアントを含む、遺伝子または別の規定されたゲノム領域であって、折畳ＭＡＦは、ｍｉｎ（ＭＡＦ，１－ＭＡＦ）である。いくつかの実施形態では、規定されたゲノム領域は、核酸バリアントの約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、または１０^１０個の塩基対内の領域である。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、約０．００１を上回る集団対立遺伝子頻度（ＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、関連付けられた変数は、少なくとも１個の非発癌性一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、約０．９未満の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。

いくつかの実施形態では、関連付けられた変数は、核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ＳＮＰ）を含み、ベータ二項分布パラメータが、以下を使用して推定される：（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）、式中、ｙ＝少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰのそれぞれに１つのエントリを伴い、ｘ＝ｍｉｎ（少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、μ_ｂｉｎ＝あるビン内のヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、ビンは、核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である。いくつかの実施形態では、ｐ値に関する上界および下界が、計算される。いくつかの実施形態では、核酸バリアントに関する両側ｐ値が、ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞ｘ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜ｘ｜μ_ｂｉｎ，ρ，Ｂ））を使用して計算され、式中、Ｐｒ_ｂｂ＝ベータ二項の確率であって、ｘ’＝ベータ二項を伴って分散される無作為変数であって、Ａ＝核酸バリアントの突然変異対立遺伝子カウントであって、Ｂ＝核酸バリアントの総分子カウントである。

別の側面では、本開示は、少なくとも１つの電子プロセッサによって実行される場合に、（ａ）核酸バリアントに関する複数の定量測定値を核酸分子のサンプル（例えば、無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子のサンプル）から生成されたシークエンシング情報から判定するステップであって、複数の定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの関連付けられた変数をシークエンシング情報から識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントに関するｐ値が所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を実行する、コンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を備えるか、またはこれにアクセス可能なコントローラを備えるシステムを提供する。

いくつかの実施形態では、本システムは、コントローラに動作可能に接続される、核酸シーケンシング装置を備え、核酸シーケンシング装置は、核酸分子（例えば、無細胞核酸分子）のサンプルの核酸からのシーケンシング情報を提供するように構成される。いくつかの実施形態では、コントローラに動作可能に接続される、サンプル調製構成要素を備え、サンプル調製構成要素は、核酸シーケンシング装置によってシーケンシングされるべきサンプルの核酸を調製するように構成される。いくつかの実施形態では、本システムは、コントローラに動作可能に接続される、核酸増幅構成要素を備え、核酸増幅構成要素は、サンプルの核酸を増幅させるように構成される。いくつかの実施形態では、本システムは、コントローラに動作可能に接続される、材料輸送構成要素を備え、材料輸送構成要素は、１つまたはそれを上回る材料を核酸シーケンシング装置とサンプル調製構成要素との間で輸送させるように構成される。

いくつかの実施形態では、所定の閾値は、サンプル（例えば、ｃｆＤＮＡ分子）の核酸に関する予期される生殖細胞系統突然変異対立遺伝子カウントのベータ二項モデルを使用して生成される。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも２個のｈｅｔＳＮＰを含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、核酸バリアントを含むゲノム遺伝子座に連鎖するゲノム遺伝子座を含む。

いくつかの実施形態では、１つまたはそれを上回る突然変異対立遺伝子カウントの平均値および／または分散値が、核酸バリアントの関連付けられた変数に関して判定される。いくつかの実施形態では、ｐ値は、核酸バリアントを分類するために使用される。いくつかの実施形態では、複数の定量測定値のうちの少なくとも１つは、核酸バリアントを含む、無細胞核酸分子のサンプルの核酸分子の数を含む。いくつかの実施形態では、関連付けられた変数は、ヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、および対象に関する臨床データのうちの１つまたはそれを上回るものを含む。

いくつかの実施形態では、局所生殖細胞系統折畳突然変異対立遺伝子割合（ＭＡＦ）、μｂｉｎが、核酸バリアントに関して判定され、ｂｉｎは、核酸バリアントを含む、遺伝子または別の規定されたゲノム領域であって、折畳ＭＡＦは、ｍｉｎ（ＭＡＦ，１－ＭＡＦ）である。いくつかの実施形態では、規定されたゲノム領域は、核酸バリアントの約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、または１０^１０個の塩基対内の領域である。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、約０．００１を上回る集団対立遺伝子頻度（ＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも１個の非発癌性一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、約０．９未満の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。

いくつかの実施形態では、関連付けられた変数は、核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型ＳＮＰを含み、ベータ二項分布パラメータが、以下を使用して推定され：（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）、式中、ｙ＝少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、ｘ＝ｍｉｎ（少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、μ_ｂｉｎ＝あるビン内のヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、ビンは、核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である。いくつかの実施形態では、ｐ値に関する上界および下界が、計算される。いくつかの実施形態では、核酸バリアントに関する両側ｐ値が、ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞ｘ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜ｘ｜μ_ｂｉｎ，ρ，Ｂ））を使用して計算され、式中、Ｐｒ_ｂｂ＝ベータ二項の確率であって、ｘ’＝ベータ二項を伴って分散される無作為変数であって、Ａ＝核酸バリアントの突然変異対立遺伝子カウントであって、Ｂ＝核酸バリアントの総分子カウントである。

別の側面では、本開示は、核酸バリアントの体細胞または生殖細胞系統起源を無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子のサンプルから識別する方法であって、（ａ）核酸バリアントの突然変異対立遺伝子カウント（Ａ）および総分子カウント（Ｂ）をｃｆＤＮＡ分子のサンプルから判定するステップと、（ｂ）核酸バリアントに対して規定されたゲノム領域内の少なくとも１個の生殖細胞系統ヘテロ接合型一塩基多型（ＳＮＰ）を識別するステップと、（ｃ）少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウント（ｙ）および突然変異対立遺伝子カウントを判定するステップと、（ｄ）（ｉ）μ_ｂｉｎおよびρの推定値をベータ二項分布から判定するステップであって、（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）、式中、ｙ＝少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、ｘ＝ｍｉｎ（少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、μ_ｂｉｎ＝あるビン内の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、ビンは、核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である、ステップと、（ｉｉ）両側ｐ値を下記の方程式から計算するステップであって、ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））、式中、Ｐｒ_ｂｂ＝ベータ二項の確率であって、ｘ’＝ベータ二項分布を伴って分散される無作為変数であって、Ａ＝核酸バリアントの突然変異対立遺伝子カウントであって、Ｂ＝核酸バリアントの総分子カウントである、ステップと、によって、核酸バリアントに関する確率値（ｐ値）を計算するステップと、（ｅ）核酸バリアントを、（ｉ）ｐ値が、所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）ｐ値が、所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を提供する。

いくつかの実施形態では、ρは、過去のサンプルセットからのρ値の少なくとも１つのセットの中央値を含む。いくつかの実施形態では、方法は、μ_ｂｉｎの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、方法は、μ_ｂｉｎの平均値推定値を判定するステップを含む。いくつかの実施形態では、方法は、ρの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、方法は、ρの分散推定値を判定するステップを含む。いくつかの実施形態では、本方法はさらに、体細胞または生殖細胞系統起源のいずれかである、核酸バリアントの分類のインジケーションを提供する、電子および／または紙フォーマットにおける報告を生成するステップを含む。

別の側面では、本開示は、通信ネットワーク上で、核酸分子のサンプル（例えば、無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子のサンプル）の核酸から生成されたシークエンシング情報を得る通信インターフェース、および通信インターフェースと通信するコンピュータであって、コンピュータは、少なくとも１つのコンピュータプロセッサおよび機械実行可能コードを含む非一過性コンピュータ可読媒体を備える、コンピュータを備えるシステムであって、機械実行可能コードは、少なくとも１つのコンピュータプロセッサによって実行されると、（ａ）核酸バリアントに関する複数の定量測定値をシークエンシング情報から判定するステップであって、複数の定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの関連付けられた変数をシークエンシング情報から識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントに関するｐ値が所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を実装する、システムを提供する。

いくつかの実施形態では、シーケンシング情報は、核酸シーケンシング装置によって提供される。いくつかの実施形態では、核酸シーケンシング装置は、核酸のパイロシーケンシング、単分子シーケンシング、ナノ細孔シーケンシング、半導体シーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシング、またはハイブリダイゼーションによるシーケンシングを実施し、シーケンシング情報を生成する。いくつかの実施形態では、核酸シーケンシング装置は、シーケンシングライブラリから導出されるクローン単分子アレイを使用して、シーケンシング情報を生成する。いくつかの実施形態では、核酸シーケンシング装置は、シーケンシングライブラリをシーケンシングし、シーケンシング情報を生成するためのマイクロウェルのアレイを有する、チップを備える。いくつかの実施形態では、非一過性コンピュータ可読媒体は、メモリ、ハードドライブ、またはコンピュータサーバのメモリもしくはハードドライブを備える。いくつかの実施形態では、通信ネットワークは、分散されるコンピューティングが可能な１つまたはそれを上回るコンピュータサーバを備える。いくつかの実施形態では、分散型コンピューティングは、クラウドコンピューティングである。いくつかの実施形態では、コンピュータは、核酸シーケンシング装置から遠隔の場所に位置する、コンピュータサーバの一部である。いくつかの実施形態では、本システムはさらに、ネットワークを経由してコンピュータと通信する電子ディスプレイを含み、電子ディスプレイは、（ａ）－（ｆ）の少なくとも一部を実装することに応じた結果を表示するためのユーザインターフェースを含む。いくつかの実施形態では、ユーザインターフェースは、グラフィカルユーザインターフェース（ＧＵＩ）またはウェブベースのユーザインターフェースである。いくつかの実施形態では、電子ディスプレイは、パーソナルコンピュータの部分である。いくつかの実施形態では、電子ディスプレイは、インターネット対応コンピュータの部分である。いくつかの実施形態では、インターネット対応コンピュータは、コンピュータから遠隔場所に位置する。いくつかの実施形態では、非一過性コンピュータ可読媒体は、メモリ、ハードドライブ、またはコンピュータサーバのメモリもしくはハードドライブを備える。いくつかの実施形態では、通信ネットワークは、電気通信ネットワーク、インターネット、エクストラネット、またはイントラネットを含む。

別の側面では、本開示は、対象における疾患を処置する方法であって、方法は、１つまたはそれを上回るカスタマイズされた療法を対象に投与し、それによって、対象における疾患を処置するステップを含み、カスタマイズされた療法は、（ａ）核酸バリアントに関する１つまたはそれを上回る定量測定値を核酸分子のサンプル（例えば、無細胞ＤＮＡのサンプル）から判定するステップであって、定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの少なくとも１つの関連付けられた変数を核酸分子のサンプルから識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのゲノム遺伝子座における予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）予期される生殖細胞系統対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントのｐ値が、閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントのｐ値が、閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、（ｇ）分類された核酸バリアントと１つまたはそれを上回る療法で索引化された１つまたはそれを上回る比較器結果を比較するステップと、（ｈ）実質的合致が、分類された核酸バリアントと比較器結果との間に存在するとき、対象における疾患を処置するための１つまたはそれを上回るカスタマイズされた療法を識別するステップと、によって識別されている、方法を提供する。

本開示の付加的側面および利点は、本開示の例証的実施形態のみが図示および説明される、以下の発明を実施するための形態から、当業者に容易に明白となる。認識されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、全て本開示から逸脱することなく、種々の明白な点で修正が可能である。故に、図面および説明は、制限としてではなく、本質的に例証と見なされるべきである。

本開示の付加的側面および利点は、本開示の例証的実施形態のみが示され、説明される、以下の発明を実施するための形態から、当業者に容易に明白となるであろう。認識されるであろうように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、全て本開示から逸脱することなく、種々の明白な点で修正が可能である。故に、図面および説明は、制限的ではなくて本質的に例証的と見なされるものである。
本発明の実施形態において、例えば以下の項目が提供される。
（項目１）
核酸バリアントの体細胞または生殖細胞系統起源を無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子のサンプルから識別する方法であって、
（ａ）前記核酸バリアントに関する複数の定量測定値を前記ｃｆＤＮＡサンプルから判定するステップであって、前記複数の定量測定値は、前記核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、
（ｂ）前記核酸バリアントの関連付けられた変数を前記ｃｆＤＮＡ分子のサンプルから識別するステップと、
（ｃ）前記核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）前記核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、
（ｅ）少なくとも部分的に、前記予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、前記核酸バリアントの関連付けられた変数に関する定量値、および前記核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、前記核酸バリアントに関する確率値（ｐ値）を生成するステップと、
（ｆ）前記核酸バリアントを、（ｉ）前記核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）前記核酸バリアントに関するｐ値が前記所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、
を含む、方法。
（項目２）
前記ｃｆＤＮＡ分子のサンプルを対象から取得するステップをさらに含む、項目１に記載の方法。
（項目３）
前記ｃｆＤＮＡサンプルから生成されたシーケンシング情報を受信するステップをさらに含み、前記シーケンシング情報は、前記核酸バリアントおよび前記核酸バリアントの関連付けられた変数を含む、ｃｆＤＮＡシーケンシングリードを含み、関連付けられた変数は、前記核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む、項目１または２に記載の方法。
（項目４）
シーケンシング情報を生成するために、核酸を前記ｃｆＤＮＡサンプルからシーケンシングするステップをさらに含み、前記核酸バリアントに関する複数の定量測定値および前記関連付けられた変数に関する定量値は、前記シーケンシング情報から判定される、前記項目のいずれかに記載の方法。
（項目５）
前記核酸バリアントに関する複数の定量測定値を判定するステップと、前記核酸バリアントの関連付けられた変数を識別するステップと、前記関連付けられた変数に関する定量値を前記ｃｆＤＮＡ分子のサンプルから生成されたシーケンシング情報から判定するステップとをさらに含む、前記項目のいずれかに記載の方法。
（項目６）
前記ｃｆＤＮＡ分子のサンプルの核酸に関する予期される生殖細胞系統突然変異対立遺伝子カウントのベータ二項モデルを使用して、前記所定の閾値を生成するステップをさらに含む、前記項目のいずれかに記載の方法。
（項目７）
前記複数の核酸バリアントの体細胞または生殖細胞系統起源を前記ｃｆＤＮＡ分子のサンプル内の複数のゲノム遺伝子座から分類するステップをさらに含む、前記項目のいずれかに記載の方法。
（項目８）
前記核酸バリアントの関連付けられた変数は、少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む、前記項目のいずれかに記載の方法。
（項目９）
前記核酸バリアントの関連付けられた変数は、少なくとも２個のｈｅｔＳＮＰを含む、項目８に記載の方法。
（項目１０）
前記核酸バリアントの関連付けられた変数は、前記核酸バリアントを含むゲノム遺伝子座に連鎖するゲノム遺伝子座を含む、前記項目のいずれかに記載の方法。
（項目１１）
前記核酸バリアントの関連付けられた変数に関する１つまたはそれを上回る突然変異対立遺伝子カウントの平均値および／または分散値を判定するステップをさらに含む、前記項目のいずれかに記載の方法。
（項目１２）
前記核酸バリアントの関連付けられた変数に関する平均定量値を判定するステップをさらに含む、前記項目のいずれかに記載の方法。
（項目１３）
前記核酸バリアントの関連付けられた変数は、ヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、および対象に関する臨床データのうちの１つまたはそれを上回るものを含む、前記項目のいずれかに記載の方法。
（項目１４）
前記核酸バリアントの関連付けられた変数の平均値および／または分散値を判定するステップをさらに含む、前記項目のいずれかに記載の方法。
（項目１５）
前記核酸バリアントに関する局所生殖細胞系統折畳突然変異対立遺伝子割合（ＭＡＦ）、μｂｉｎを判定するステップをさらに含み、ｂｉｎは、前記核酸バリアントを含む、遺伝子または別の規定されたゲノム領域であって、折畳ＭＡＦは、ｍｉｎ（ＭＡＦ，１－ＭＡＦ）である、前記項目のいずれかに記載の方法。
（項目１６）
前記規定されたゲノム領域は、前記核酸バリアントの約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、または１０^１０個の塩基対内の領域である、項目１５に記載の方法。
（項目１７）
前記核酸バリアントの関連付けられた変数は、約０．００１を上回る集団対立遺伝子頻度（ＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む、前記項目のいずれかに記載の方法。
（項目１８）
前記核酸バリアントの関連付けられた変数は、少なくとも１個の非発癌性一塩基多型（ＳＮＰ）を含む、前記項目のいずれかに記載の方法。
（項目１９）
前記核酸バリアントの関連付けられた変数は、約０．９未満の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む、前記項目のいずれかに記載の方法。
（項目２０）
前記関連付けられた変数は、前記核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ＳＮＰ）を含み、前記方法はさらに、以下を使用して、ベータ二項分布パラメータを推定するステップを含み、
（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）
式中、
ｙ＝前記生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、
ｘ＝ｍｉｎ（前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、
μ_ｂｉｎ＝あるビン内のヘテロ接合型ＳＮＰの平均値突然変異対立遺伝子カウントの推定値であって、前記ビンは、前記核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である、
前記項目のいずれかに記載の方法。
（項目２１）
以下を使用して、前記核酸バリアントに関する両側ｐ値を計算するステップをさらに含み、
ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））
式中、
Ｐｒ_ｂｂ＝ベータ二項の確率であって、
ｘ’＝前記ベータ二項を伴って分散される無作為変数であって、
Ａ＝前記核酸バリアントの突然変異対立遺伝子カウントであって、
Ｂ＝前記核酸バリアントの総分子カウントである、
項目２０に記載の方法。
（項目２２）
ρは、過去のサンプルセットからのρ値の少なくとも１つのセットの中央値を含む、項目２０に記載の方法。
（項目２３）
前記中央値ρパラメータを核酸バリアントのＧＣ含量の関数と置換するステップをさらに含む、項目２２に記載の方法。
（項目２４）
μ_ｂｉｎの最大尤度推定値を判定するステップをさらに含む、項目２０に記載の方法。
（項目２５）
μ_ｂｉｎの平均値推定値を判定するステップをさらに含む、項目２０に記載の方法。
（項目２６）
ρの最大尤度推定値を判定するステップをさらに含む、項目２０に記載の方法。
（項目２７）
ρの分散推定値を判定するステップをさらに含む、項目２０に記載の方法。
（項目２８）
前記ｐ値に関する上界および下界を計算するステップをさらに含む、前記項目のいずれかに記載の方法。
（項目２９）
少なくとも１つの電子プロセッサによって実行される場合に、
（ａ）核酸バリアントに関する複数の定量測定値を無細胞デオキシリボ核酸（ｃｆＤＮＡ）サンプルから生成されたシークエンシング情報から判定するステップであって、前記複数の定量測定値は、前記核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、
（ｂ）前記核酸バリアントの関連付けられた変数を前記シークエンシング情報から識別するステップと、
（ｃ）前記核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）前記核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、
（ｅ）少なくとも部分的に、前記予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、前記核酸バリアントの関連付けられた変数に関する定量値、および前記核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、前記核酸バリアントに関する確率値（ｐ値）を生成するステップと、
（ｆ）前記核酸バリアントを、（ｉ）前記核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）前記核酸バリアントに関するｐ値が前記所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、
を含む、方法を実施する、コンピュータ実行可能命令を含む非一過性コンピュータ可読媒体。
（項目３０）
前記所定の閾値は、前記ｃｆＤＮＡサンプルの核酸に関する予期される生殖細胞系統突然変異対立遺伝子カウントのベータ二項モデルを使用して生成される、項目２９に記載の非一過性コンピュータ可読媒体。
（項目３１）
前記核酸バリアントの関連付けられた変数は、少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む、項目２９－３０のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目３２）
前記核酸バリアントの関連付けられた変数は、少なくとも２個のｈｅｔＳＮＰを含む、項目３１に記載の非一過性コンピュータ可読媒体。
（項目３３）
前記核酸バリアントの関連付けられた変数は、前記核酸バリアントを含むゲノム遺伝子座に連鎖するゲノム遺伝子座を含む、項目２９－３２のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目３４）
１つまたはそれを上回る突然変異対立遺伝子カウントの平均値および／または分散値が、前記核酸バリアントの関連付けられた変数に関して判定される、項目２９－３３のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目３５）
前記複数の定量測定値のうちの少なくとも１つは、前記核酸バリアントを含む、前記ｃｆＤＮＡサンプルの核酸分子の数を含む、項目２９－３４のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目３６）
前記核酸バリアントの関連付けられた変数は、ヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、および対象に関する臨床データのうちの１つまたはそれを上回るものを含む、項目２９～３５のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目３７）
局所生殖細胞系統折畳突然変異対立遺伝子割合（ＭＡＦ）、μｂｉｎが、前記核酸バリアントに関して判定され、ｂｉｎは、前記核酸バリアントを含む、遺伝子または別の規定されたゲノム領域であって、折畳ＭＡＦは、ｍｉｎ（ＭＡＦ，１－ＭＡＦ）である、項目２９～３６のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目３８）
前記規定されたゲノム領域は、前記核酸バリアントの約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、または１０^１０個の塩基対内の領域である、項目３７に記載の非一過性コンピュータ可読媒体。
（項目３９）
前記核酸バリアントの関連付けられた変数は、約０．００１を上回る集団対立遺伝子頻度（ＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む、項目２９～３８のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目４０）
前記関連付けられた変数は、少なくとも１個の非発癌性一塩基多型（ＳＮＰ）を含む、項目２９～３９のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目４１）
前記核酸バリアントの関連付けられた変数は、約０．９未満の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む、項目２９～４０のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目４２）
前記関連付けられた変数は、前記核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ＳＮＰ）を含み、ベータ二項分布パラメータが、以下を使用して推定される、
（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）
式中、
ｙ＝前記生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰに１つのエントリを伴い、
ｘ＝ｍｉｎ（前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、
μ_ｂｉｎ＝あるビン内のヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、前記ビンは、前記核酸バリアントに対して規定されたゲノム領域であって、
ρ＝分散パラメータの推定値である、
項目２９～４１のいずれか一項に記載の非一過性コンピュータ可読媒体。
（項目４３）
前記ｐ値に関する上界および下界が、計算される、項目２９～４２のいずれか１項に記載の非一過性コンピュータ可読媒体。
（項目４４）
前記核酸バリアントに関する両側ｐ値が、以下を使用して計算される、
ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞ｘ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜ｘ｜μ_ｂｉｎ，ρ，Ｂ））
式中、
Ｐｒ_ｂｂ＝ベータ二項の確率であって、
ｘ’＝前記ベータ二項を伴って分散される無作為変数であって、
Ａ＝前記核酸バリアントの突然変異対立遺伝子カウントであって、
Ｂ＝前記核酸バリアントの総分子カウントである、
項目４３に記載の非一過性コンピュータ可読媒体。
（項目４５）
少なくとも１つの電子プロセッサによって実行される場合に、
（ａ）核酸バリアントに関する複数の定量測定値を無細胞デオキシリボ核酸（ｃｆＤＮＡ）サンプルから生成されたシークエンシング情報から判定するステップであって、前記複数の定量測定値は、前記核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、
（ｂ）前記核酸バリアントの関連付けられた変数を前記シークエンシング情報から識別するステップと、
（ｃ）前記核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）前記核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、
（ｅ）少なくとも部分的に、前記予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、前記核酸バリアントの関連付けられた変数に関する定量値、および前記核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、前記核酸バリアントに関する確率値（ｐ値）を生成するステップと、
（ｆ）前記核酸バリアントを、（ｉ）前記核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）前記核酸バリアントに関するｐ値が前記所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、
を含む、方法を実行する、コンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を備えるか、またはこれにアクセス可能なコントローラを備えるシステム。
（項目４６）
前記コントローラに動作可能に接続される、核酸シーケンシング装置を備え、前記核酸シーケンシング装置は、前記ｃｆＤＮＡサンプルの核酸からのシーケンシング情報を提供するように構成される、項目４５に記載のシステム。
（項目４７）
前記コントローラに動作可能に接続される、サンプル調製構成要素を備え、前記サンプル調製構成要素は、核酸シーケンシング装置によってシーケンシングされるべき前記ｃｆＤＮＡサンプルの核酸を調製するように構成される、項目４５または４６に記載のシステム。
（項目４８）
前記コントローラに動作可能に接続される、核酸増幅構成要素を備え、前記核酸増幅構成要素は、前記ｃｆＤＮＡサンプルの核酸を増幅させるように構成される、項目４５～４７のいずれか１項に記載のシステム。
（項目４９）
前記コントローラに動作可能に接続される、材料輸送構成要素を備え、前記材料輸送構成要素は、１つまたはそれを上回る材料を核酸シーケンシング装置とサンプル調製構成要素との間で輸送させるように構成される、項目４５～４８のいずれか１項に記載のシステム。
（項目５０）
前記所定の閾値は、前記ｃｆＤＮＡサンプルの核酸に関する予期される生殖細胞系統突然変異対立遺伝子カウントのベータ二項モデルを使用して生成される、項目４５～４９のいずれか１項に記載のシステム。
（項目５１）
前記核酸バリアントの関連付けられた変数は、少なくとも１個のヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）を含む、項目４５－５０のいずれか１項に記載のシステム。
（項目５２）
前記核酸バリアントの関連付けられた変数は、少なくとも２個のｈｅｔＳＮＰを含む、項目５１に記載のシステム。
（項目５３）
前記核酸バリアントの関連付けられた変数は、前記核酸バリアントを含むゲノム遺伝子座に連鎖するゲノム遺伝子座を含む、項目４５～５２のいずれか１項に記載のシステム。
（項目５４）
１つまたはそれを上回る突然変異対立遺伝子カウントの平均値および／または分散値が、前記核酸バリアントの関連付けられた変数に関して判定される、項目４５～５３のいずれか１項に記載のシステム。
（項目５５）
前記ｐ値は、前記核酸バリアントを分類するために使用される、項目４５～５４のいずれか１項に記載のシステム。
（項目５６）
前記複数の定量測定値のうちの少なくとも１つは、前記核酸バリアントを含む、前記ｃｆＤＮＡサンプルの核酸分子の数を含む、項目４５～５５のいずれか１項に記載のシステム。
（項目５７）
前記関連付けられた変数は、ヘテロ接合型一塩基多型（ｈｅｔＳＮＰ）、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、および対象に関する臨床データのうちの１つまたはそれを上回るものを含む、項目４５～５６のいずれか１項に記載のシステム。
（項目５８）
局所生殖細胞系統折畳突然変異対立遺伝子割合（ＭＡＦ）、μｂｉｎが、前記核酸バリアントに関して判定され、ｂｉｎは、前記核酸バリアントを含む、遺伝子または別の規定されたゲノム領域であって、折畳ＭＡＦは、ｍｉｎ（ＭＡＦ，１－ＭＡＦ）である、項目４５～５７のいずれか１項に記載のシステム。
（項目５９）
前記規定されたゲノム領域は、前記核酸バリアントの約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、または１０^１０個の塩基対内の領域である、項目４５～５８のいずれか１項に記載のシステム。
（項目６０）
前記核酸バリアントの関連付けられた変数は、約０．００１を上回る集団対立遺伝子頻度（ＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む、項目４５～５９のいずれか１項に記載のシステム。
（項目６１）
前記核酸バリアントの関連付けられた変数は、少なくとも１個の非発癌性一塩基多型（ＳＮＰ）を含む、項目４５～６０のいずれか１項に記載のシステム。
（項目６２）
前記核酸バリアントの関連付けられた変数は、約０．９未満の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む、項目４５～６１のいずれか１項に記載のシステム。
（項目６３）
前記関連付けられた変数は、前記核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型ＳＮＰを含み、ベータ二項分布パラメータが、以下を使用して推定され、
（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）
式中、
ｙ＝前記生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、
ｘ＝ｍｉｎ（前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、
μ_ｂｉｎ＝あるビン内の前記ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、前記ビンは、前記核酸バリアントに対して規定されたゲノム領域であって、
ρ＝分散パラメータの推定値である、
項目４５～６２のいずれか一項に記載のシステム。
（項目６４）
前記核酸バリアントに関する両側ｐ値が、以下を使用して計算される、
ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））
式中、
Ｐｒ_ｂｂ＝ベータ二項の確率であって、
ｘ’＝前記ベータ二項を伴って分散される無作為変数であって、
Ａ＝前記核酸バリアントの突然変異対立遺伝子カウントであって、
Ｂ＝前記核酸バリアントの総分子カウントである、
項目６３に記載のシステム。
（項目６５）
前記ｐ値に関する上界および下界が、計算される、項目４５～６４のいずれか１項に記載のシステム。
（項目６６）
核酸バリアントの体細胞または生殖細胞系統起源を無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子のサンプルから識別する方法であって、
（ａ）前記核酸バリアントの突然変異対立遺伝子カウント（Ａ）および総分子カウント（Ｂ）を前記ｃｆＤＮＡ分子のサンプルから判定するステップと、
（ｂ）前記核酸バリアントに対して規定されたゲノム領域内の少なくとも１個の生殖細胞系統ヘテロ接合型一塩基多型（ＳＮＰ）を識別するステップと、
（ｃ）前記少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウント（ｙ）および突然変異対立遺伝子カウントを判定するステップと、
（ｄ）
（ｉ）μ_ｂｉｎおよびρの推定値をベータ二項分布から判定するステップであって、
（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）
式中、
ｙ＝前記生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、
ｘ＝ｍｉｎ（前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－前記生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、（ｂ）において識別された生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、
μ_ｂｉｎ＝あるビン内の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、前記ビンは、前記核酸バリアントに対して規定されたゲノム領域であって、
ρ＝分散パラメータの推定値である、
ステップと、
（ｉｉ）両側ｐ値を下記の方程式から計算するステップであって、
ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））
式中、
Ｐｒ_ｂｂ＝ベータ二項の確率であって、
ｘ’＝前記ベータ二項分布を伴って分散される無作為変数であって、
Ａ＝前記核酸バリアントの突然変異対立遺伝子カウントであって、
Ｂ＝前記核酸バリアントの総分子カウントである、
ステップと、
によって、前記核酸バリアントに関する確率値（ｐ値）を計算するステップと、
（ｅ）前記核酸バリアントを、（ｉ）前記ｐ値が、所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）前記ｐ値が、前記所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、
を含む、方法。
（項目６７）
ρは、過去のサンプルセットからのρ値の少なくとも１つのセットの中央値を含む、項目６６に記載の方法。
（項目６８）
μ_ｂｉｎの最大尤度推定値を判定するステップを含む、項目６６または６７に記載の方法。
（項目６９）
μ_ｂｉｎの平均値推定値を判定するステップを含む、項目６６～６８のいずれか１項に記載の方法。
（項目７０）
ρの最大尤度推定値を判定するステップを含む、項目６６～６９のいずれか１項に記載の方法。
（項目７１）
ρの分散推定値を判定するステップを含む、項目６６～７０のいずれか１項に記載の方法。
（項目７２）
通信ネットワーク上で、無細胞デオキシリボ核酸（ｃｆＤＮＡ）サンプルの核酸から生成されたシークエンシング情報を得る通信インターフェース、および
前記通信インターフェースと通信するコンピュータであって、前記コンピュータは、少なくとも１つのコンピュータプロセッサおよび機械実行可能コードを含む非一過性コンピュータ可読媒体を備える、コンピュータ
を備えるシステムであって、
前記機械実行可能コードは、少なくとも１つのコンピュータプロセッサによって実行されると、
（ａ）核酸バリアントに関する複数の定量測定値を前記シークエンシング情報から判定するステップであって、前記複数の定量測定値は、前記核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、
（ｂ）前記核酸バリアントの関連付けられた変数を前記シークエンシング情報から識別するステップと、
（ｃ）前記核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）前記核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、
（ｅ）少なくとも部分的に、前記予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、前記核酸バリアントの関連付けられた変数に関する定量値、および前記核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、前記核酸バリアントに関する確率値（ｐ値）を生成するステップと、
（ｆ）前記核酸バリアントを、（ｉ）前記核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）前記核酸バリアントに関するｐ値が前記所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、
を含む、方法を実装する、システム。
（項目７３）
前記シーケンシング情報は、核酸シーケンシング装置によって提供される、項目７２に記載のシステム。
（項目７４）
前記核酸シーケンシング装置は、前記核酸のパイロシーケンシング、単分子シーケンシング、ナノ細孔シーケンシング、半導体シーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシング、またはハイブリダイゼーションによるシーケンシングを実施し、前記シーケンシング情報を生成する、項目７３に記載のシステム。
（項目７５）
前記核酸シーケンシング装置は、シーケンシングライブラリから導出されるクローン単分子アレイを使用して、前記シーケンシング情報を生成する、項目７３に記載のシステム。
（項目７６）
前記核酸シーケンシング装置は、シーケンシングライブラリをシーケンシングし、前記シーケンシング情報を生成するためのマイクロウェルのアレイを有する、チップを備える、項目７３に記載のシステム。
（項目７７）
前記非一過性コンピュータ可読媒体は、メモリ、ハードドライブ、またはコンピュータサーバのメモリもしくはハードドライブを備える、項目７２～７６のいずれか１項に記載のシステム。
（項目７８）
前記通信ネットワークは、分散されるコンピューティングが可能な１つまたはそれを上回るコンピュータサーバを備える、項目７２～７６のいずれか１項に記載のシステム。
（項目７９）
前記分散型コンピューティングは、クラウドコンピューティングである、項目７８に記載のシステム。
（項目８０）
前記コンピュータは、前記核酸シーケンシング装置から遠隔の場所に位置する、コンピュータサーバの一部である、項目７２～７９のいずれか１項に記載のシステム。
（項目８１）
ネットワークを経由して前記コンピュータと通信する電子ディスプレイをさらに含み、前記電子ディスプレイは、（ａ）－（ｆ）の少なくとも一部を実装することに応じた結果を表示するためのユーザインターフェースを含む、項目７２～８０のいずれか１項に記載のシステム。
（項目８２）
前記ユーザインターフェースは、グラフィカルユーザインターフェース（ＧＵＩ）またはウェブベースのユーザインターフェースである、項目８１に記載のシステム。
（項目８３）
前記電子ディスプレイは、パーソナルコンピュータの部分である、項目８１に記載のシステム。
（項目８４）
前記電子ディスプレイは、インターネット対応コンピュータの部分である、項目８１に記載のシステム。
（項目８５）
前記インターネット対応コンピュータは、前記コンピュータから遠隔場所に位置する、項目８４に記載のシステム。
（項目８６）
前記非一過性コンピュータ可読媒体は、メモリ、ハードドライブ、またはコンピュータサーバのメモリもしくはハードドライブを備える、項目７２～８５のいずれか１項に記載のシステム。
（項目８７）
前記通信ネットワークは、電気通信ネットワーク、インターネット、エクストラネット、またはイントラネットを含む、項目７２～８６のいずれか１項に記載のシステム。
（項目８８）
前記方法はさらに、体細胞または生殖細胞系統起源のいずれかである、前記核酸バリアントの分類のインジケーションを提供する、電子および／または紙フォーマットにおける報告を生成するステップを含む、項目１または項目６６に記載の方法。
（項目８９）
対象における疾患を処置する方法であって、前記方法は、１つまたはそれを上回るカスタマイズされた療法を前記対象に投与し、それによって、前記対象における前記疾患を処置するステップを含み、前記カスタマイズされた療法は、
（ａ）核酸バリアントに関する１つまたはそれを上回る定量測定値を無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子のサンプルから判定するステップであって、前記定量測定値は、前記核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、
（ｂ）前記核酸バリアントの少なくとも１つの関連付けられた変数を前記ｃｆＤＮＡ分子のサンプルから識別するステップと、
（ｃ）前記核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）前記核酸バリアントのゲノム遺伝子座における予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、
（ｅ）予期される生殖細胞系統対立遺伝子カウントに関する統計モデル、前記核酸バリアントの関連付けられた変数に関する定量値、および前記核酸バリアントに関する前記定量測定値のうちの少なくとも１つに基づいて、前記核酸バリアントに関する確率値（ｐ値）を生成するステップと、
（ｆ）前記核酸バリアントを、（ｉ）前記核酸バリアントのｐ値が、閾値を下回るとき、体細胞起源である、または（ｉｉ）前記核酸バリアントのｐ値が、前記閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、
（ｇ）前記分類された核酸バリアントと１つまたはそれを上回る療法で索引化された１つまたはそれを上回る比較器結果を比較するステップと、
（ｈ）実質的合致が、前記分類された核酸バリアントと前記比較器結果との間に存在するとき、前記対象における疾患を処置するための１つまたはそれを上回るカスタマイズされた療法を識別するステップと、
によって識別されている、方法。
（項目９０）
前記疾患は、癌である、項目８９に記載の方法。

本明細書内に組み込まれ、その一部を構成する、付随の図面は、ある実施形態を図示し、記載の説明とともに、本明細書に開示される方法、コンピュータ可読媒体、およびシステムのある原理を説明する役割を果たす。本明細書に提供される説明は、限定ではなく一例として含まれる付随の図面と併せて熟読されるとき、より深く理解される。文脈によって別様に示されない限り、同様の参照番号は、図面全体を通して同様の構成要素を識別することを理解されたい。また、図の一部または全部は、例証目的のための略図であり得、必ずしも、示される要素の実際の相対的サイズまたは場所を描写するわけではないことを理解されたい。

図１は、本開示のある実施形態による、核酸分子のサンプル中の体細胞および生殖細胞系統バリアントを鑑別するための方法のフローチャート表現である。

図２は、本開示のある実施形態による、ベータ二項分布を使用して核酸分子のサンプル中の体細胞および生殖細胞系統バリアントを鑑別するための方法のフローチャート表現である。

図３は、ベータ二項分布を使用して生殖細胞系統／体細胞バリアントを鑑別するための決定境界のグラフ表現である。

図４は、本開示のいくつかの実施形態と併用するために好適な例示的システムの概略図である。

図５Ａは、ＥＧＦＲ遺伝子中のＴ７９０Ｍバリアントおよび６個の共通生殖細胞系統ヘテロ接合型ＳＮＰに関する突然変異対立遺伝子割合（ＭＡＦ）対ゲノム位置のグラフ表現である。

図５Ｂは、ＥＧＦＲ遺伝子中のＴ７９０Ｍバリアントおよび６個の共通生殖細胞系統ヘテロ接合型ＳＮＰに関するｍｉｎ（ＭＡＦ，１－ＭＡＦ）対ゲノム位置のグラフ表現である。

定義
本開示がより容易に理解されるために、ある用語が、最初に、下記に定義される。以下の用語および他の用語に関する付加的定義は、明細書を通して記載され得る。下記に記載される用語の定義が、参照することによって組み込まれる出願または特許内の定義と矛盾する場合、本願に記載される定義が、用語の意味を理解するために使用されるべきである。

本明細書および添付の請求項において使用されるように、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈によって明確に別様に示されない限り、複数参照を含む。したがって、例えば、「方法」の言及は、本明細書に説明され、および／または本開示の熟読に応じて当業者に明白となるであろう、タイプの１つまたはそれを上回る方法ならびに／もしくはステップ等を含む。

また、本明細書で使用される専門用語は、特定の実施形態のみを説明する目的のためのものであって、限定することを意図するものではないことを理解されたい。さらに、別様に定義されない限り、本明細書で使用される全ての技術的および科学的用語は、本開示が関連する当業者によって一般に理解されるものと同一意味を有する。方法、コンピュータ可読媒体、およびシステムを説明および請求する際、以下の専門用語およびその文法的変形例が、下記に記載される定義に従って使用されるであろう。

約：本明細書で使用されるように、１つまたはそれを上回る着目値または要素に適用されるような「約」または「およそ」は、述べられた参照値または要素に類似する、値または要素を指す。ある実施形態では、用語「約」または「およそ」は、別様に記載されない限り、または文脈から別様に明白ではない限り、述べられた参照値または要素のいずれかの方向（それを上回るまたはそれ未満）において２５％、２０％、１９％、１８％、１７％、１６％、１５％、１４％、１３％、１２％、１１％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％以内またはそれ未満の値もしくは要素の範囲を指す（そのような数が、可能性として考えられる値または要素の１００％を超えるであろう場合を除く）。

アダプタ：本明細書で使用されるように、「アダプタ」は、典型的には、少なくとも部分的に二本鎖にされ、所与のサンプル核酸分子の一端または両端に連結するために使用される、短核酸（例えば、約５００個未満のヌクレオチド、約１００個未満のヌクレオチド、または約５０個未満のヌクレオチド長）を指す。アダプタは、両端をアダプタで挟まれる核酸分子の増幅を可能にするための核酸プライマー結合部位、および／または種々の次世代シーケンシング（ＮＧＳ）用途等のシーケンシング用途のためのプライマー結合部位を含む、シーケンシングプライマー結合部位を含むことができる。アダプタはまた、流動細胞支持体または同等物に付着されるオリゴヌクレオチド等の捕捉プローブのための結合部位を含むことができる。アダプタはまた、本明細書に説明されるように、核酸タグを含むことができる。核酸タグは、典型的には、核酸タグが、所与の核酸分子のアンプリコンおよびシーケンシングリード内に含まれるように、増幅プライマーおよびシーケンシングプライマー結合部位に対して位置付けられる。同一または異なるアダプタが、核酸分子の個別の末端に連結されることができる。いくつかの実施形態では、同一アダプタが、核酸タグが異なることを除き、核酸分子の個別の末端に連結される。いくつかの実施形態では、アダプタは、一端が、本明細書に説明されるように、同様に１つまたはそれを上回る相補的ヌクレオチドを伴った平滑末端または終端である、核酸分子に接合するための平滑末端または終端である、Ｙ形状のアダプタである。さらに他の例示的実施形態では、アダプタは、分析されるべき核酸分子に接合するための平滑または尾状末端を含む、ベル形状のアダプタである。アダプタの他の実施例は、Ｔ－終端およびＣ－終端アダプタを含む。

増幅：本明細書で使用されるように、核酸の文脈における「～を増幅させる」または「増幅」は、典型的には、少量のポリヌクレオチド（例えば、単一ポリヌクレオチド分子）から開始する、ポリヌクレオチドまたはポリヌクレオチドの一部の複数のコピーの生産を指し、増幅生成物またはアンプリコンは、概して、検出可能である。ポリヌクレオチドの増幅は、種々の化学および酵素プロセスを包含する。

関連付けられた変数：本明細書で使用されるように、用語「関連付けられた変数」は、核酸バリアントに関連し、予期される生殖細胞系統突然変異対立遺伝子カウントを推定する際に使用される、変数を指す。そのような変数は、限定ではないが、生殖細胞系統ヘテロ接合型ＳＮＰ、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、対象からの臨床データ、またはそれらの任意の組み合わせを含むことができる。

癌型：本明細書で使用されるように、「癌型」は、例えば、組織病理学によって定義された癌の型または亜型を指す。癌型は、所与の組織内における発生（例えば、血液癌、中枢神経系（ＣＮＳ）、脳癌、肺癌（小細胞および非小細胞）、皮膚癌、鼻癌、喉癌、肝臓癌、骨癌、リンパ腫、膵臓癌、腸癌、直腸癌、甲状腺癌、膀胱癌、腎臓癌、口癌、胃癌、乳癌、前立腺癌、卵巣癌、肺癌、腸癌、軟組織癌、神経内分泌癌、胃食道癌、頭頸部癌、婦人科系癌、結腸直腸癌、尿路上皮癌、固形癌、異種癌、同種癌）、未知の一次起源および同等物、および／または同一細胞系譜（例えば、癌腫、肉腫、リンパ腫、胆管細胞癌、白血病、中皮腫、黒色腫、または膠芽腫）、ならびに／もしくはＨｅｒ２、ＣＡ１５－３、ＣＡ１９－９、ＣＡ－１２５、ＣＥＡ、ＡＦＰ、ＰＳＡ、ＨＣＧ、ホルモン受容体、およびＮＭＰ－２２等の癌マーカを呈する、癌に基づいて等、任意の従来の基準によって定義されることができる。癌はまた、病期（例えば、病期１、２、３、または４）および一次または二次起源であるかどうかによって分類されることができる。

無細胞核酸：本明細書で使用されるように、「無細胞核酸」は、細胞内に含有されない、または別様にそこに結合されない核酸、もしくはいくつかの実施形態では、無傷細胞の除去後にサンプル中に残っている核酸を指す。無細胞核酸は、例えば、対象からの体液（例えば、血液、血漿、血清、尿、脳脊髄液（ＣＳＦ）等）に由来する全ての非被包型核酸を含むことができる。無細胞核酸は、ＤＮＡ（ｃｆＤＮＡ）、ＲＮＡ（ｃｆＲＮＡ）、およびそのハイブリッドを含み、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、循環ＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、核小体ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、長鎖ノンコーディングＲＮＡ（長ｎｃＲＮＡ）、および／またはこれらのいずれかの断片を含む。無細胞核酸は、二本鎖、一本鎖、またそのハイブリッドであることができる。無細胞核酸は、体液分泌物または細胞死プロセス、例えば、細胞壊死、アポトーシス、または同等物を通して、体液中に放出され得る。無細胞核酸は、エフェロソームまたはエキソソームが、他の細胞体液中に放出される、無細胞核酸を取り込んでいる場合、エフェロソームまたはエキソソーム内に見出されることができる。いくつかの無細胞核酸は、癌細胞、例えば、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）から体液中に放出される。その他は、健康な細胞から放出される。ＣｔＤＮＡは、非被包型腫瘍由来断片化ＤＮＡであることができる。無細胞核酸の別の実施例は、無細胞胎児ＤＮＡ（ｃｆｆＤＮＡ）とも呼ばれる、母体血流中で自由に循環する胎児ＤＮＡである。無細胞核酸は、１つまたはそれを上回るエピジェネティクス修正を有することができ、例えば、無細胞核酸は、アセチル化、５－メチル化、ユビキチン化、リン酸化、ＳＵＭＯ化、リボシル化、および／またはシトルリン化されることができる。

細胞核酸：本明細書で使用されるように、「細胞核酸」は、それらの核酸が、続いて、所与の分析プロセスの一部として除去される（例えば、細胞溶解を介して）場合でも、少なくともサンプルが対象から採取または収集された時点で、核酸が生じた１つまたはそれを上回る細胞内に配置されている、核酸を意味する。

共通生殖細胞系統ヘテロ接合型ＳＮＰ：本明細書で使用されるように、用語「共通生殖細胞系統ヘテロ接合型ＳＮＰ」は、ヘテロ接合型ＳＮＰが、少なくとも特定の集団対立遺伝子頻度（ＡＦ）を有するように（特定の集団ＡＦは、０～１の任意の値であることができる）、外部集団データベース（例えば、ＥｘＡＣ）および／または任意の過去のサンプルセットから取得される、生殖細胞系統ヘテロ接合型一塩基多型（ＳＮＰ）を指す。

比較器結果：本明細書で使用されるように、「比較器結果」は、所与の試験サンプルまたは試験結果が、試験サンプルまたは結果の１つまたはそれを上回る可能性の高い性質および／または試験サンプルが採取または別様に導出された対象のための１つまたはそれを上回る可能性として考えられる予後転帰ならびに／もしくは１つまたはそれを上回るカスタマイズされた療法を識別するために比較され得る、結果または結果のセットを意味する。比較器結果は、典型的には、参照サンプルのセットから（例えば、試験対象と同一疾患または癌型を有する、対象から）取得される。

コピー数切断点：本明細書で使用されるように、用語「コピー数切断点」は、そのゲノム遺伝子座の両側における（同一染色体内の）２つの近隣ゲノム領域のコピー数（ＣＮ）が異なる、ゲノム遺伝子座を指す。

コピー数バリアント：本明細書で使用されるように、「コピー数バリアント」、「ＣＮＶ」、または「コピー数多型」は、ゲノムの区分が反復され、ゲノム内の反復数が、検討中の集団内の個人間で変動し、個人の２つの条件または状態間で変動する（例えば、ＣＮＶは、療法を受けた前後において個人で変動し得る）、現象を指す。

カバレッジ：本明細書で使用されるように、用語「カバレッジ」、「総分子カウント」、または「総対立遺伝子カウント」は、同義的に使用される。それらは、所与のサンプル中の特定のゲノム位置におけるＤＮＡ分子の総数を指す。

カスタマイズされた療法：本明細書で使用されるように、「カスタマイズされた療法」は、所与の分類された核酸バリアントを有する対象または対象の集団のための所望の療法転帰と関連付けられる、療法を指す。

デオキシリボ核酸またはリボ核酸：本明細書で使用されるように、「デオキシリボ核酸」または「ＤＮＡ」は、水素基を糖部の２’－位置に有する、天然または修飾ヌクレオチドを指す。ＤＮＡは、典型的には、４つのタイプのヌクレオチド、すなわち、アデニン（Ａ）、チミン（Ｔ）、シトシン（Ｃ）、およびグアニン（Ｇ）を含む、ヌクレオチドの鎖を含む。本明細書で使用されるように、「リボ核酸」または「ＲＮＡ」は、ヒドロキシル基を糖部の２’－位置に有する、天然または修飾ヌクレオチドを指す。ＲＮＡは、典型的には、４つのタイプのヌクレオチド、すなわち、Ａ、ウラシル（Ｕ）、Ｇ、およびＣを含む、ヌクレオチドの鎖を含む。本明細書で使用されるように、用語「ヌクレオチド」は、天然ヌクレオチドまたは修飾ヌクレオチドを指す。ある対のヌクレオチドは、相補的方式において相互に特異的に結合する（相補的塩基対合と呼ばれる）。ＤＮＡでは、アデニン（Ａ）は、チミン（Ｔ）と対合し、シトシン（Ｃ）は、グアニン（Ｇ）と対合する。ＲＮＡでは、アデニン（Ａ）は、ウラシル（Ｕ）と対合し、シトシン（Ｃ）は、グアニン（Ｇ）と対合する。第１の核酸鎖が、第１の鎖内のものと相補的であるヌクレオチドから成る、第２の核酸鎖に結合すると、２つの鎖は、結合し、二重鎖を形成する。本明細書で使用されるように、「核酸シーケンシングデータ」、「核酸シーケンシング情報」、「シーケンス情報」、「核酸シーケンス」、「ヌクレオチドシーケンス」、「ゲノムシーケンス」、「遺伝子シーケンス」、または「断片シーケンス」、もしくは「核酸シーケンシングリード」は、ＤＮＡまたはＲＮＡ等の核酸の分子（例えば、全体的ゲノム、全体的トランスクリプトーム、エキソーム、オリゴヌクレオチド、ポリヌクレオチド、または断片）中のヌクレオチド塩基（例えば、アデニン、グアニン、シトシン、およびチミンまたはウラシル）の順序および識別を示す、任意の情報またはデータを示す。本教示は、限定ではないが、キャピラリー電気泳動、マイクロアレイ、ライゲーションベースのシステム、ポリメラーゼベースのシステム、ハイブリダイゼーションベースのシステム、直接または間接ヌクレオチド識別システム、パイロシーケンシング、イオンまたはｐＨベースの検出システム、および電子署名ベースのシステムを含む、技法、プラットフォーム、または技術の全ての利用可能な変形例を使用して取得される、シーケンス情報を検討することを理解されたい。

予期される生殖細胞系統突然変異対立遺伝子カウント：本明細書で使用されるように、用語「予期される生殖細胞系統突然変異対立遺伝子カウント」は、核酸バリアントのゲノム遺伝子座における生殖細胞系統ＳＮＰの予期される突然変異対立遺伝子カウントを指す。例えば、予期される生殖細胞系統突然変異対立遺伝子カウントは、統計分布によって推定されることができる。統計分布は、限定ではないが、ベータ二項分布であることができる。分布は、その遺伝子座における生殖細胞系統ヘテロ接合型ＳＮＰ内で予期される、突然変異対立遺伝子カウントを判定するために使用される。例えば、ベータ二項分布が、特定のゲノム遺伝子座における予期される生殖細胞系統突然変異対立遺伝子カウントを判定するために使用される場合、予期される突然変異対立遺伝子カウントの分布は、そのゲノム遺伝子座における平均値推定値（μ）、分散推定値（ρ）、およびカバレッジによってパラメータ化される。

生殖細胞系統突然変異体：本明細書で使用されるように、用語「生殖細胞系統突然変異体」または「生殖細胞系統変種」は、同義的に使用され、遺伝性突然変異体（すなわち、受胎後に生じるものではない）を指す。生殖細胞系統突然変異体は、子孫に遺伝され得、子孫における体細胞および生殖細胞系統細胞の全てに存在し得る、唯一の突然変異体であり得る。

過去のサンプルセット：本明細書で使用されるように、用語「過去のサンプルセット」は、正常対象（疾患／癌を有していない）、任意の疾患または癌を有する対象、特定の癌型を有する対象、および／または特定の療法を受けている、もしくは受けた対象から取得される、サンプルのセットを指す。

インデル：本明細書で使用されるように、「インデル」は、対象のゲノム内のヌクレオチドの挿入または欠失を伴う、突然変異体を指す。

突然変異対立遺伝子カウント：本明細書で使用されるように、用語「突然変異対立遺伝子カウント」は、特定のゲノム遺伝子座における突然変異対立遺伝子を持つ、ＤＮＡ分子の数を指す。

マイナー対立遺伝子カウント：本明細書で使用されるように、「マイナー対立遺伝子カウント」は、対象から取得されるサンプル等の核酸の所与の集団中に生じる、マイナー対立遺伝子（例えば、最も一般的対立遺伝子ではない）の数を指す。低マイナー対立遺伝子カウントにおける遺伝子バリアントは、典型的には、比較的に少数でサンプル中に存在する。

突然変異対立遺伝子割合：本明細書で使用されるように、「突然変異対立遺伝子割合」、「突然変異体用量」、または「ＭＡＦ」は、対立遺伝子改変または突然変異体を所与のサンプル中の所与のゲノム位置／遺伝子座に持つ、核酸分子の画分を指す。ＭＡＦは、概して、画分またはパーセンテージとして表される。例えば、体細胞バリアントのＭＡＦは、０．１５未満であり得る。

突然変異体：本明細書で使用されるように、「突然変異体」は、既知の参照シーケンスからの変種を指し、例えば、一塩基バリアント（ＳＮＶ）および挿入または欠失（インデル）等の突然変異体を含む。突然変異体は、生殖細胞系統または体細胞突然変異体であることができる。いくつかの実施形態では、比較の目的のための参照シーケンスは、試験サンプルを提供する対象の種の野生型ゲノムシーケンス、典型的には、ヒトゲノムである。

突然変異体コーラー：本明細書で使用されるように、「突然変異体コーラー」は、試験サンプルデータ（例えば、対象から取得されるシーケンス情報）内の突然変異体を識別するために使用される、アルゴリズム（典型的には、ソフトウェア内に具現化される、または別様にコンピュータ実装される）を意味する。

新生物：本明細書で使用されるように、用語「新生物」および「腫瘍」は、同義的に使用される。それらは、対象内の細胞の異常成長を指す。新生物または腫瘍は、良性、潜在的に悪性、または悪性であることができる。悪性腫瘍は、癌または癌性腫瘍と称される。

次世代シーケンシング：本明細書で使用されるように、「次世代シーケンシング」または「ＮＧＳ」は、従来のＳａｎｇｅｒおよびキャピラリー電気泳動ベースのアプローチと比較して増加されたスループットを有する、シーケンシング技術を指し、例えば、数十万個の比較的に小シーケンスリードを一度に生成する能力を伴う。次世代シーケンシング技法のいくつかの実施例は、限定ではないが、合成によるシーケンシング、ライゲーションによるシーケンシング、およびハイブリダイゼーションによるシーケンシングを含む。

核酸タグ：本明細書で使用されるように、「核酸タグ」は、異なるサンプル（例えば、サンプルインデックスを表す）からの核酸、または同一サンプル（例えば、分子バーコードを表す）中の、異なるタイプの、もしくは異なる処理を受けた、異なる核酸分子を区別するために使用される、短核酸（例えば、約５００個未満のヌクレオチド、約１００個未満のヌクレオチド、約５０個未満のヌクレオチド、または約１０個未満のヌクレオチド長）を指す。そのような核酸タグは、異なる核酸分子または異なる核酸サンプルもしくはサブサンプルを標識するために使用されてもよい。核酸タグは、一本鎖、二本鎖、または少なくとも部分的に二本鎖であることができる。核酸タグは、随意に、同一長または可変長を有する。核酸タグはまた、１つまたはそれを上回る平滑末端を有する、二本鎖分子を含む、５´または３´一本鎖領域（例えば、オーバーハング）を含む、および／または１つまたはそれを上回る他の一本鎖領域を所与の分子内の他の場所に含むことができる。核酸タグは、他の核酸（例えば、増幅および／またはシーケンシングされるべきサンプル核酸）の一端または両端に付着されることができる。核酸タグは、デコードされ、所与の核酸の起源のサンプル、形態、または処理等の情報を明らかにすることができる。例えば、核酸タグはまた、核酸が、続いて、核酸タグを検出する（例えば、読み取る）ことによって逆畳み込みされる、異なる分子バーコードおよび／またはサンプルインデックスを持つ核酸を含む、複数のサンプルの貯留および／または並列処理を可能にするために使用されることができる。核酸タグは、識別子またはインデックスとも称され得る。そのような核酸タグ、識別子、またはインデックスは、１つまたはそれを上回るバーコードを含んでもよい。加えて、または代替として、核酸タグは、分子識別子またはインデックスとして使用されることができる（例えば、同一サンプルまたはサブサンプル中の異なる分子または異なる親分子のアンプリコン間で区別するため）。これは、例えば、所与のサンプル中の各異なる核酸分子を一意にタグ付けするステップ、またはそのような分子を非一意にタグ付けするステップを含む。非一意的にタグ付けする用途の場合、限定数のタグ（例えば、バーコード）が、異なる分子が、少なくとも１つのバーコードと組み合わせて、その内因性シーケンス情報（例えば、それらが選択された参照ゲノムにマップされる、開始および／または停止位置、シーケンスの一端または両端のサブシーケンス、および／またはシーケンスの長さ）に基づいて、区別され得るように、各核酸分子をタグ付けするために使用されてもよい。典型的には、十分な数の異なる核酸タグが、任意の２個の分子が、同一内因性シーケンス情報（例えば、開始および／または停止位置、シーケンスの一端または両端のサブシーケンス、および／または長さ）を有し、また、同一核酸タグ（例えば、バーコード）を有し得る、確率が低くなる（例えば、約１０％未満、約５％未満、約１％未満、または約０．１％未満の機会）ように使用される。代替として、核酸タグは、内因性シーケンス情報（例えば、開始および／または停止位置、シーケンスの一端または両端のサブシーケンス、および／または長さ）のみを含んでもよい。いくつかの核酸タグは、複数の分子識別子を含み、サンプル、サンプル中の核酸分子の形態、および同一内因性シーケンス情報（例えば、開始および／または停止位置、シーケンスの一端または両端のサブシーケンス、および／または長さ）を有する形態内の核酸分子を標識する。そのような核酸タグは、例示的形態「Ａ１ｉ」を使用して参照され得、大文字は、サンプルタイプを示し、アラビア数字は、サンプル中の分子の形態を示し、小文字ローマ数字は、形態中の分子を示す。

ポリヌクレオチド：本明細書で使用されるように、「ポリヌクレオチド」、「核酸」、「核酸分子」、または「オリゴヌクレオチド」は、ヌクレオシド間連結によって接合される、ヌクレオシドの線状重合体（デオキシリボヌクレオシド、リボヌクレオシド、またはその類似体を含む）を指す。典型的には、ポリヌクレオチドは、少なくとも３個のヌクレオシドを含む。オリゴヌクレオチドは、多くの場合、サイズが、例えば、３～４の数個の単量体単位から数百個の単量体単位に及ぶ。ポリヌクレオチドが、「ＡＴＧＣＣＴＧ」等の文字のシーケンスによって表されるときは常に、ヌクレオチドは、左から右に５´→３´の順序であって、ＤＮＡの場合、別様に注記されない限り、「Ａ」は、デオキシアデノシンを示し、「Ｃ」は、デオキシシチジンを示し、「Ｇ」は、デオキシグアノシンを示し、「Ｔ」は、デオキシチミジンを示すことを理解されたい。文字Ａ、Ｃ、Ｇ、およびＴは、当技術分野において標準的であるように、塩基自体、塩基を含む、ヌクレオシド、またはヌクレオチドを指すために使用され得る。

参照シーケンス：本明細書で使用されるように、「参照シーケンス」は、実験的に判定されたシーケンスとの比較の目的のために使用される、既知のシーケンスを指す。例えば、既知のシーケンスは、ゲノム全体、染色体、またはその任意の区画であることができる。参照は、典型的には、少なくとも約２０、少なくとも約５０、少なくとも約１００、少なくとも約２００、少なくとも約２５０、少なくとも約３００、少なくとも約３５０、少なくとも約４００、少なくとも約４５０、少なくとも約５００、少なくとも約１，０００、または１，０００個を上回るヌクレオチドを含む。参照シーケンスは、ゲノムまたは染色体の単一連続シーケンスとアライメントすることができる、もしくはゲノムまたは染色体の異なる領域とアライメントする、非連続区画を含むことができる。参照シーケンスの実施例は、例えば、ｈＧ１９およびｈＧ３８等のヒトゲノムを含む。

サンプル：本明細書で使用されるように、「サンプル」は、本明細書に開示される方法および／またはシステムによって分析されることが可能な任意のものを意味する。

シーケンシング：本明細書で使用されるように、「シーケンシング」は、生体分子、例えば、ＤＮＡまたはＲＮＡ等の核酸のシーケンス（例えば、単量体単位の識別および順序）を判定するために使用される、いくつかの技術のいずれかを指す。シーケンシング方法の実施例は、限定ではないが、標的化されたシーケンシング、単分子リアルタイムシーケンシング、エクソンまたはエキソームシーケンシング、イントロンシーケンシング、電子顕微鏡検査ベースのシーケンシング、パネルシーケンシング、トランジスタ媒介シーケンシング、直接シーケンシング、無作為ショットガンシーケンシング、Ｓａｎｇｅｒジデオキシターミネーションシーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションによるシーケンシング、パイロシーケンシング、キャピラリー電気泳動、ゲル電気泳動、デュプレックスシーケンシング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、高スループットシーケンシング、超並列シグネチャシーケンシング、エマルションＰＣＲ、低変性温度ＰＣＲでの共増幅（ＣＯＬＤ－ＰＣＲ）、マルチプレックスＰＣＲ、可逆的ダイターミネータによるシーケンシング、ペアエンドシーケンシング、短期的シーケンシング、エキソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、ショートリードシーケンシング、単分子シーケンシング、合成によるシーケンシング、リアルタイムシーケンシング、リバースターミネータシーケンシング、ナノ細孔シーケンシング、４５４シーケンシング、ＳｏｌｅｘａＧｅｎｏｍｅＡｎａｌｙｚｅｒシーケンシング、ＳＯＬｉＤ（商標）シーケンシング、ＭＳ－ＰＥＴシーケンシング、およびそれらの組み合わせを含む。いくつかの実施形態では、シーケンシングは、例えば、数ある中でもとりわけ、Ｉｌｌｕｍｉｎａ，Ｉｎｃ．、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ，Ｉｎｃ．、またはＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ／ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃから市販の遺伝子分析器等の遺伝子分析器によって実施されることができる。

シーケンス情報：本明細書で使用されるように、核酸重合体の文脈における「シーケンス情報」は、その重合体内の単量体単位（例えば、ヌクレオチド等）の順序および識別を意味する。

一塩基多型：本明細書で使用されるように、用語「一塩基多型」または「ＳＮＰ」は、同義的に使用される。それらは、ゲノム内の特異的位置において生じる、一塩基中の変種を指し、各変種は、集団内である感知できるほどの程度で存在する（例えば、約１％を上回る）

一塩基バリアント：本明細書で使用されるように、「一塩基バリアント」または「ＳＮＶ」は、ゲノム内の特異的位置において生じる、一塩基中の突然変異体または変種を意味する。

体細胞突然変異体：本明細書で使用されるように、用語「体細胞突然変異体」または「体細胞変種」は、同義的に使用される。それらは、受胎後に生じる、ゲノム内の突然変異体を指す。体細胞突然変異体は、生殖細胞を除く、身体の任意の細胞内に生じ得、故に、子孫に遺伝されない。

対象：本明細書で使用されるように、「対象」は、哺乳類種（例えば、ヒト）または鳥類（例えば、トリ）種等の動物もしくは植物等の他の生物を指す。より具体的には、対象は、脊椎動物、例えば、マウス、霊長類、類人猿、またはヒト等の哺乳類であることができる。動物は、家畜（例えば、肉牛、乳牛、家禽、ウマ、ブタ、および同等物）、競技動物、および伴侶動物（例えば、ペットまたは支援動物）を含む。対象は、健康な個人、疾患または疾患にかかりやすい素因を有する、もしくは有すると疑われる個人、または療法を必要とする、もしくは療法を必要とすると疑われる個人であることができる。用語「個人」または「患者」は、「対象」と同義であるように意図される。

例えば、対象は、癌を患っていると診断されている、癌療法を受けることになっている、および／または少なくとも１つの癌療法を受けた個人であることができる。対象は、癌の寛解状態にあることができる。別の実施例として、対象は、自己免疫疾患を患っていると診断された個人であることができる。別の実施例として、対象は、妊娠している、または妊娠を計画中であって、疾患、例えば、癌、自己免疫疾患を患っていると診断された、または患っていると疑われ得る、女性の個人であることができる。

実質的マッチング：本明細書で使用されるように、「実質的マッチング」は、少なくとも第１の値または要素が、少なくとも第２の値または要素と少なくともおおよそ等しいことを意味する。ある実施形態では、例えば、カスタマイズされた療法は、分類された核酸バリアントと比較器結果との間に少なくとも実質的またはおおよその合致が認められるとき、識別される。

閾値：本明細書で使用されるように、「閾値」は、閾値とのその関係に応じて、異なるサンプルに関する同一パラメータの実験的に判定された値を特性評価するために使用される、所定の値を指す。例えば、ｐ値に関する閾値は、０～１の任意の所定の値を指し得、核酸バリアントの起源を識別するために使用される。

バリアント：本明細書で使用されるように、「バリアント」は、対立遺伝子について称され得る。バリアントは、通常、対立遺伝子がヘテロ接合型またはホモ接合型であるかどうかに応じて、５０％（０．５）または１００％（１）の頻度で存在する。例えば、生殖細胞系統バリアントは、遺伝性であって、通常、０．５または１の頻度を有する。しかしながら、体細胞バリアントは、後天性バリアントであって、通常、約０．５未満の頻度を有する。遺伝子座の優性および劣性対立遺伝子は、それぞれ、遺伝子座が参照シーケンスのヌクレオチドによって占有される遺伝子座を持つ核酸と、参照シーケンスと異なるバリアントヌクレオチドとを指す。遺伝子座における測定は、対立遺伝子割合（ＡＦ）の形態をとることができ、これは、対立遺伝子がサンプル中で観察される、頻度の測定値である。
詳細な説明
Ｉ．概要

本開示は、核酸分子のサンプル中の核酸バリアントを体細胞または生殖細胞系統起源として分類または識別するために、ベータ二項モデル等の統計モデルを使用するための方法およびシステムを提供する。いくつかの実施形態では、本開示の方法およびシステムは、無細胞ＤＮＡ（ｃｆＤＮＡ）等の無細胞核酸を分析するために好適である。腫瘍組織からのシーケンシングデータを使用して体細胞バリアントおよび生殖細胞系統バリアントを区別するために利用可能な多くの解決策は、合致された対の腫瘍の可用性に依拠し得、正常組織は、したがって、無細胞核酸から取得されるデータに適用され得ない。ｃｆＤＮＡサンプルを分析するための解決策は、突然変異対立遺伝子割合（ＭＡＦ）に関して閾値処理するステップ、またはＰｏｉｓｓｏｎ統計モデルを適用し、生殖細胞系統もしくは体細胞ステータスを判定するステップを含み得る。しかしながら、そのようなアプローチは、ｃｆＤＮＡ分子カウントに見られる分散を正確にモデル化し得ず、故に、これらのアプローチに基づく体細胞／生殖細胞系統区別は、最適に正確ではあり得ない。本明細書に開示される方法およびシステムは、（ｃｆＤＮＡにおけるような）核酸分子カウント内に見られる分散を正確にモデル化することができ、高正確度を伴って、体細胞および生殖細胞系統バリアントを鑑別することができる。本明細書に開示される方法およびシステムは、共通生殖細胞系統一塩基多型（ＳＮＰ）等のパラメータを使用して、局所生殖細胞系統突然変異対立遺伝子カウント挙動（例えば、核酸バリアントに対するゲノム領域内の生殖細胞系統突然変異対立遺伝子カウント挙動）を統計的にモデル化し、観察される生殖細胞系統ＭＡＦからのＭＡＦ偏差に基づいて、体細胞バリアントを区別することができる。

一側面では、本開示は、核酸バリアントの体細胞または生殖細胞系統起源を無細胞デオキシリボ核酸（ｃｆＤＮＡ）分子のサンプルから識別する方法であって、（ａ）核酸バリアントに関する複数の定量測定値をｃｆＤＮＡサンプルから判定するステップであって、複数の定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの関連付けられた変数をｃｆＤＮＡサンプルから識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントに関するｐ値が所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を提供する。

図１は、核酸分子のサンプル中の体細胞および生殖細胞系統バリアントを鑑別するための方法１００の例示的実施形態を図示する。いったん核酸バリアントが、サンプル中の核酸分子から識別されると、核酸バリアントに関連する定量値および関連付けられた変数が、統計モデルを実装するための入力値を提供するために確立され得る。核酸バリアントは、限定ではないが、米国特許第９，５９８，７３１号、第９，８３４，８２２号、第９，８４０，７４３号、および第９，９０２，９９２号（それぞれ、参照することによってその全体として本明細書に組み込まれる）に説明される方法を含む、任意の公知の方法によって識別または検出されてもよい。

動作１０２では、核酸バリアントに関する定量値が、測定および判定され得る。これらの値は、限定ではないが、核酸バリアントの突然変異対立遺伝子カウントおよび／または総分子カウントを含んでもよい。

モデルのために要求される別の入力値は、関連付けられた変数に関する定量値であり得る。動作１０４では、少なくとも１つの関連付けられた変数が、識別され得る。関連付けられた変数は、核酸バリアントのゲノム遺伝子座における予期される生殖細胞系統突然変異対立遺伝子カウントを推定する際に使用されてもよい。そのような関連付けられた変数は、限定ではないが、生殖細胞系統ヘテロ接合型ＳＮＰ、ＧＣ含量測定値、プローブ特有のバイアス測定値、断片長値、シーケンシング統計測定値、コピー数切断点、対象からの臨床データ、またはそれらの任意の組み合わせを含んでもよい。

いくつかの実施形態では、関連付けられた変数は、核酸バリアントに対して規定されたゲノム領域（「ビン」とも称される）内にあり得る。いくつかの実施形態では、ビンは、核酸バリアントを含む、遺伝子であってもよい。いくつかの実施形態では、ビンは、核酸バリアントに対して規定されたゲノム領域であることができる。いくつかの実施形態では、ビン（規定されたゲノム領域）は、核酸バリアントの約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、１０^１０、または１０^１０個を上回る塩基内にある。いくつかの実施形態では、ビンは、核酸バリアントの「Ｎ」個の塩基内にあって、Ｎは、約１、約５、約１０、約２５、約５０、約１００、約２５０、約５００、約１，０００、約５，０００、約１０，０００、約５０，０００、約１００，０００、約５００，０００、約１，０００，０００、または約１，０００，０００個を上回る塩基である。いくつかの実施形態では、Ｎは、最大３，０００，０００個の塩基であることができる。例えば、ビンは、核酸バリアントの１０^５個の塩基内にあることができる。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、核酸バリアントを含むゲノム遺伝子座に連鎖するゲノム遺伝子座を含む。いくつかの実施形態では、関連付けられた変数は、少なくとも１個、少なくとも２個、少なくとも５個、少なくとも１０個、または１０個を上回るヘテロ接合型ＳＮＰを含むことができる。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも０．００００１、少なくとも０．０００１、少なくとも０．００１、少なくとも０．００２、少なくとも０．００５、少なくとも０．０１、少なくとも０．０２、少なくとも０．０５、少なくとも０．１、少なくとも０．２、少なくとも０．５、少なくとも０．７５、または少なくとも０．９９の集団対立遺伝子頻度（ＡＦ）を含む、少なくとも１個のＳＮＰを含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、０～１の集団対立遺伝子頻度（ＡＦ）値を含む、少なくとも１個のＳＮＰを含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、０．９未満の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、０～約１の突然変異対立遺伝子割合（ＭＡＦ）を含む、少なくとも１個の一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも１個のヘテロ接合型ＳＮＰを含み、ヘテロ接合型ＳＮＰは、共通生殖細胞系統ヘテロ接合型ＳＮＰであることができる。

いくつかの実施形態では、関連付けられた変数は、コピー数切断点内にある。固定幅ビンまたは遺伝子アノテーションによって定義されたビンを有する代わりに、関連付けられた変数は、各核酸バリアントのビンが、任意のコピー数切断点に重複せずに、可能な限り広くなるように、コピー数切断点によって境界されたビン内で識別されてもよい。いくつかの実施形態では、関連付けられた変数は、コピー数切断点内のヘテロ接合型ＳＮＰを含む。

動作１０６では、核酸バリアントの関連付けられた変数に関する定量値が、判定され得る。関連付けられた変数の定量値は、統計モデルを適用し、核酸バリアントのゲノム遺伝子座における予期される生殖細胞系統突然変異対立遺伝子カウントを推定する際の入力として使用されてもよい。いくつかの実施形態では、関連付けられた変数に関する定量値は、関連付けられた変数の突然変異対立遺伝子カウントおよび／または総分子カウントを含む。いくつかの実施形態では、本方法はさらに、ＭＡＦを判定するステップを含む。いくつかの実施形態では、ＭＡＦは、本明細書では、関連付けられた変数の本明細書では「折畳ＭＡＦ」と称される、縮小スケールに調節され、折畳ＭＡＦ＝ｍｉｎ（ＭＡＦ，１－ＭＡＦ）である。いくつかの実施形態では、本方法は、関連付けられた変数の折畳突然変異対立遺伝子カウントを判定するステップを含み、折畳突然変異対立遺伝子カウント＝ｍｉｎ（突然変異対立遺伝子カウント、総分子カウント－突然変異対立遺伝子カウント）である。いくつかの実施形態では、定量値は、核酸バリアントの関連付けられた変数において識別された１つまたはそれを上回る対立遺伝子カウントを含むことができる。いくつかの実施形態では、本方法は、核酸バリアントの関連付けられた変数において識別された１つまたはそれを上回る対立遺伝子カウントの平均値および／または分散値を判定するステップを含む。いくつかの実施形態では、本方法は、核酸バリアントの関連付けられた変数に関する平均定量値を判定するステップを含む。いくつかの実施形態では、本方法は、核酸バリアントの関連付けられた変数に関する平均値および／または分散値を判定するステップを含む。いくつかの実施形態では、核酸バリアントの関連付けられた変数は、少なくとも１個の非発癌性ＳＮＰを含む。

動作１０８では、判定された定量値は、ベータ二項モデル等の統計モデルを使用して処理され得る。統計モデルから生成された分布は、その遺伝子座における生殖細胞系統ヘテロ接合型ＳＮＰ内で予期され得る、突然変異対立遺伝子カウントを判定するために使用されてもよい。例えば、ベータ二項分布が、特定のゲノム遺伝子座における予期される生殖細胞系統突然変異対立遺伝子カウントを判定するために使用される場合、予期される生殖細胞系統突然変異対立遺伝子カウントの分布は、そのゲノム遺伝子座におけるベータ二項分布、例えば、平均値推定値（μ）、分散推定値（ρ）、およびカバレッジに対応する統計パラメータのセットによってパラメータ化され得る。いくつかの実施形態では、本方法は、核酸バリアントに関するμ_ｂｉｎを判定するステップを含み、μ_ｂｉｎは、あるビン内のヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値である。

いくつかの実施形態では、関連付けられた変数は、核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ＳＮＰ）を含み、本方法は、以下を使用して、ベータ二項分布パラメータを推定するステップを含み、
（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）
式中、ｙ＝生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、検討される生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、ｘ＝ｍｉｎ（生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、検討される生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、μ_ｂｉｎ＝あるビン内のヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、ビンは、核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である。

ある実施形態では、ｘおよびｙは、ベクトルとして表され得、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴う。これは、２個またはそれを上回る生殖細胞系統ヘテロ接合型ＳＮＰがモデル内で検討される場合に当てはまる。例えば、２個の生殖細胞系統ヘテロ接合型ＳＮＰが、検討される場合、ｙは、ｙ_１（ＳＮＰ_１に関する総分子カウント）およびｙ_２（ｈｅｔＳＮＰ_２に関する総分子カウント）のベクトルとして表される。同様に、ｘは、ｘ_１（ｈｅｔＳＮＰ_１に関する）およびｘ_２（ｈｅｔＳＮＰ_２に関する）のベクトルとして表される。いくつかの実施形態では、１個のみの生殖細胞系統ヘテロ接合型ＳＮＰが、検討され得る。これらの場合では、ｘおよびｙに関する値は、１つのみのエントリを伴う、ベクトルとして、または代替として、ｙ＝ヘテロ接合型ＳＮＰの総分子カウントおよびｘ＝ｍｉｎ（ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）として表され得る。

いくつかの実施形態では、ρは、過去のサンプルセットからのρ値の少なくとも１つのセットの中央値を含む。いくつかの実施形態では、本方法は、中央値ρパラメータを核酸バリアントのＧＣ含量の関数と置換するステップを含む。いくつかの実施形態では、本方法は、μ_ｂｉｎの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、本方法は、μ_ｂｉｎの平均値推定値を判定するステップを含む。いくつかの実施形態では、本方法は、ρの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、本方法は、ρの分散推定値を判定するステップを含む。

いくつかの実施形態では、固定数としてモデル化されるのではなく、分散パラメータ（ρ）は、局所ゲノムコンテキスト（例えば、あるビンのゲノムコンテキスト）のＧＣ含量の関数としてモデル化されることができる。関数は、過去のサンプルセットから推定されることができ、上記の方程式内のρの中央値は、バリアントのＧＣ含量レベルにおける本関数の値によって置換されることができる。

動作１１０では、核酸バリアントに関する確率値（ｐ値）が、少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する定量測定値のうちの少なくとも１つに基づいて、判定され得る。いくつかの実施形態では、本方法は、以下を使用して、核酸バリアントに関する両側ｐ値を計算するステップを含み、
ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））
式中、Ｐｒ_ｂｂ＝ベータ二項の確率であって、ｘ’＝ベータ二項を伴って分散される無作為変数であって、Ａ＝核酸バリアントの突然変異対立遺伝子カウントであって、Ｂ＝核酸バリアントの総分子カウントである。

動作１１２では、核酸バリアントは、（ｉ）核酸バリアントのｐ値が、閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントのｐ値が、閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類され得る。閾値は、生殖細胞系統バリアントおよび体細胞バリアントを区別し得る、任意の値であることができる。閾値は、実験的データから判定されることができる。例えば、閾値は、０～１の任意の値であることができる。いくつかの実施形態では、閾値は、少なくとも１０^－５０、少なくとも１０^－４０、少なくとも１０^－３０、少なくとも１０^－２０、少なくとも１０^－１０、少なくとも１０^－５、少なくとも０．０１、少なくとも０．０１、少なくとも０．１、少なくとも０．２、少なくとも０．５、少なくとも０．７５、または少なくとも０．９９であることができる。いくつかの実施形態では、本方法は、サンプル中の核酸に関する予期される生殖細胞系統突然変異対立遺伝子カウントのベータ二項モデルを使用して、閾値を生成するステップを含む。

いくつかの実施形態では、本方法は、複数の核酸バリアントの体細胞または生殖細胞系統起源を核酸サンプル中の複数のゲノム遺伝子座から分類するステップを含む。

本明細書に開示される方法およびシステムは、概して、シーケンス情報を対象から採取されたサンプル中の核酸から取得するステップを含む。いくつかの実施形態では、本方法は、核酸サンプルから生成されたシーケンシング情報を受信するステップをさらに含み、シーケンシング情報は、核酸バリアントおよび核酸バリアントの関連付けられた変数を含む核酸からのシーケンシングリードを含み、関連付けられた変数は、核酸バリアントに対して規定されたゲノム領域内の少なくとも１個のヘテロ接合型一塩基多型（ＳＮＰ）を含む。いくつかの実施形態では、本方法はさらに、核酸をサンプルからシーケンシングし、シーケンシング情報を生成するステップを含み、定量測定値が、シーケンシング情報から判定される。いくつかの実施形態では、本方法は、核酸バリアントに関する定量測定値を判定するステップと、核酸バリアントの関連付けられた変数を識別するステップと、定量値をサンプルから生成されたシーケンシング情報から判定するステップとを含む。

別の側面では、本開示は、核酸バリアントの体細胞または生殖細胞系統起源を無細胞核酸（例えば、ｃｆＤＮＡ）のサンプルから識別する方法であって、（ａ）核酸バリアントの突然変異対立遺伝子カウント（Ａ）および総分子カウント（Ｂ）をｃｆＤＮＡサンプルから判定するステップと、（ｂ）核酸バリアントに対して規定されたゲノム領域内の少なくとも１個の生殖細胞系統ヘテロ接合型一塩基多型（ＳＮＰ）を識別するステップと、（ｃ）生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウント（ｙ）および突然変異対立遺伝子カウントを判定するステップと、（ｄ）（ｉ）以下で与えられるμ_ｂｉｎおよびρの推定値をベータ二項分布から判定するステップであって、
（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）
式中、ｙ＝少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、ｘ＝ｍｉｎ（少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、μ_ｂｉｎ＝あるビン内の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、ビンは、核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である、ステップと、（ｉｉ）両側ｐ値を下記を使用して計算するステップであって、
ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））
式中、Ｐｒ_ｂｂ＝ベータ二項の確率であって、ｘ’＝ベータ二項分布を伴って分散される無作為変数であって、Ｂ＝核酸バリアントの総分子カウントであって、Ａ＝核酸バリアントの突然変異対立遺伝子カウントである、ステップと、を含む、確率値（ｐ値）を計算するステップと、（ｅ）核酸バリアントを、（ｉ）ｐ値が、所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）ｐ値が、所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を提供する。

いくつかの実施形態では、ρは、過去のサンプルセットからのρ値の少なくとも１つのセットの中央値を含む。いくつかの実施形態では、本方法は、μ_ｂｉｎの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、本方法は、μ_ｂｉｎの平均値推定値を判定するステップを含む。いくつかの実施形態では、本方法は、ρの最大尤度推定値を判定するステップを含む。いくつかの実施形態では、本方法は、ρの分散推定値を判定するステップを含む。

図２は、ベータ二項モデルを使用してｃｆＤＮＡのサンプル中の体細胞および生殖細胞系統バリアントを鑑別するための方法の実施形態を図示する。動作２０２では、ｃｆＤＮＡサンプルから、核酸バリアントの突然変異対立遺伝子カウント（Ａ）および総分子カウント（Ｂ）が、判定される。動作２０４では、核酸バリアントに対して規定されたゲノム領域内の少なくとも１個の生殖細胞系統ヘテロ接合型一塩基多型（ＳＮＰ）が、識別され得る。動作２０６では、総分子カウント（ｙ）および生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントが、判定され得る。動作２０８では、ベータ二項分布から、μ_ｂｉｎおよびρが、以下を使用して推定され得る。
（ｘ，ｙ）～ベータ二項（μ_ｂｉｎ，ρ）
式中、ｙ＝少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの総分子カウントのベクトルであって、検討される生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、ｘ＝ｍｉｎ（少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント、ｙ－少なくとも１個の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウント）のベクトルであって、検討される生殖細胞系統ヘテロ接合型ＳＮＰ毎に１つのエントリを伴い、μ_ｂｉｎ＝あるビン内の生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントの推定値であって、ビンは、核酸バリアントに対して規定されたゲノム領域であって、ρ＝分散パラメータの推定値である。動作２１０では、両側ｐ値が、以下を使用して計算され得る。
ｐ値＝２＊ｍｉｎ（Ｐｒ_ｂｂ（ｘ’＞Ａ｜μ_ｂｉｎ，ρ，Ｂ），Ｐｒ_ｂｂ（ｘ’＜Ａ｜μ_ｂｉｎ，ρ，Ｂ））
式中、Ｐｒ_ｂｂ＝ベータ二項の確率であって、ｘ’＝ベータ二項分布を伴って分散される無作為変数であって、Ｂ＝核酸バリアントの総分子カウントであって、Ａ＝核酸バリアントの突然変異対立遺伝子カウントである。

ｃｆＤＮＡ中のバリアントの体細胞または生殖細胞系統起源を識別するための現在の解決策は、突然変異対立遺伝子割合（ＭＡＦ）に関して閾値処理するステップ、またはＰｏｉｓｓｏｎ統計モデルを適用し、生殖細胞系統もしくは体細胞ステータスを判定するステップを含み得る。しかしながら、そのようなアプローチは、ｃｆＤＮＡシーケンシング分子カウントに見られる分散を正確にモデル化する際に課題に直面し、したがって、不正確な生殖細胞系統／体細胞区別をもたらし得る。さらに、これらの方法は、核酸バリアントに対する近傍変量または他の共変量からの証拠に応答して、その体細胞閾値を調節し得ない。ベータ二項モデルは、核酸バリアントのゲノム遺伝子座における平均値および分散推定値ならびにカバレッジを使用して、予期される生殖細胞系統突然変異対立遺伝子カウントの分布をモデル化することによって、これらの問題を克服し得る。予期される生殖細胞系統ヘテロ接合型ＳＮＰの平均値推定値および分散推定値は、核酸バリアントのｐ値を計算する際に使用されてもよく、これは、ひいては、バリアントを体細胞または生殖細胞系統起源と分類するために使用されてもよい。

動作２１２では、核酸バリアントは、（ｉ）ｐ値が、所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）ｐ値が、所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類され得る。

図３は、ベータ二項分布を使用して生殖細胞系統／体細胞バリアントを鑑別するための決定境界の実施例を示す。核酸バリアントＭＡＦに関するベータ二項決定境界は、生殖細胞系統ヘテロ接合型ＳＮＰのＭＡＦ、バリアント位置において観察される分子の総カウント、および調節可能ｐ値閾値の関数であってもよい。実施例として、コピー数多型（ＣＮＶ）またはヘテロ接合性の消失（ＬＯＨ）に起因する対立遺伝子不均衡を伴う、遺伝子は、１０～３０％および７０～９０％範囲の両方における生殖細胞系統ＭＡＦを有し得る。図３に戻って参照すると、３０２（外側実線）、３０４（中央実線）、および３０６（内側実線）は、ベータ二項モデルを使用した生殖細胞系統／体細胞鑑別に関する決定境界を表し、ｐ値に関する閾値は、１０^－１６であって、バリアント総分子カウント（Ｂ）は、それぞれ、７００、１，５００、および３，０００である。さらに、３０８（外側破線）、３１０（中央破線）および３１２（内側破線）は、ベータ二項モデルを使用した生殖細胞系統／体細胞鑑別に関する決定境界を表し、ｐ値に関する閾値は、０．０１であって、バリアント総分子カウント（Ｂ）は、それぞれ、７００、１，５００、および３，０００である。

いくつかの実施形態では、シーケンス情報は、核酸の標的化された区画から取得される。本質的に、任意の数のゲノム領域が、随意に、標的化されてもよい。標的化された区画は、少なくとも１０、少なくとも５０、少なくとも１００、少なくとも５００、少なくとも１，０００、少なくとも２，０００、少なくとも５，０００、少なくとも１０，０００、少なくとも２０，０００、少なくとも５０，０００、または少なくとも１００，０００（例えば、２５、５０、７５、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２５，０００、３０，０００、３５，０００、４０，０００、４５，０００、５０，０００、または１００，０００）個の異なるおよび／または重複ゲノム領域を含むことができる。

いくつかの実施形態では、識別された生殖細胞系統および／または体細胞バリアントは、電子および／または紙フォーマットにおける報告を生成するための入力として使用され、これは、体細胞または生殖細胞系統起源のいずれかとしてのポリヌクレオチド中のこれらの遺伝子バリアントの分類のインジケーションを提供する。

本方法の種々のステップは、同一または異なる時間において、同一または異なる地理的場所、例えば、国で、同一または異なる人々もしくはエンティティによって行われてもよい。
ＩＩ．本方法の一般的特徴
Ａ．サンプル

サンプルは、対象から単離される、任意の生物学的サンプルであることができる。サンプルは、身体組織、全血、血小板、血清、血漿、糞便、赤血球、白血球（ｗｈｉｔｅｃｅｌｌｓまたはｌｅｕｃｏｃｙｔｅｓ）、内皮細胞、組織生検（例えば、既知または疑われる固形腫瘍からの生検）、脳脊髄液、滑液、リンパ液、腹水液、間質または細胞外流体（例えば、細胞ギャップからの流体）、歯肉滲出液、歯肉溝滲出液、骨髄、胸膜滲出液、脳脊髄液、唾液、粘液、喀痰、精液、汗、および尿を含むことができる。サンプルは、血液およびその画分、ならびに尿等の体液であってもよい。そのようなサンプルは、腫瘍から流出された核酸を含む。核酸は、ＤＮＡと、ＲＮＡとを含むことができ、二本鎖および一本鎖形態であることができる。サンプルは、元々は対象から単離された形態であることができるか、またはさらなる処理を受け、細胞等の成分を除去または追加する、一方の成分を別の成分に対して富化するか、またはＲＮＡからＤＮＡもしくは一本鎖核酸から二本鎖核酸等、１つの形態の核酸から別の形態の核酸に変換することができる。したがって、例えば、分析のための体液は、無細胞核酸、例えば、無細胞ＤＮＡ（ｃｆＤＮＡ）を含有する、血漿または血清であり得る。

いくつかの実施形態では、対象から採取された体液のサンプル体積は、シーケンシングされる領域に関する所望のリード深度に依存する。体積の実施例は、約０．４～４０ミリリットル（ｍＬ）、約５～２０ｍＬ、約１０～２０ｍＬである。例えば、体積は、約０．５ｍＬ、約１ｍＬ、約５ｍＬ、約１０ｍＬ、約２０ｍＬ、約３０ｍＬ、約４０ｍＬ、またはそれより多くのミリリットルであり得る。サンプリングされた血漿の体積は、代表的には、約５ｍＬ～約２０ｍＬである。

サンプルは、種々の量の核酸を含むことができる。典型的には、所与のサンプル中の核酸の量は、複数のゲノム均等物に匹敵する。例えば、約３０ナノグラム（ｎｇ）のＤＮＡのサンプルは、約１０，０００（１０^４）個の半数体ヒトゲノム均等物、ｃｆＤＮＡの場合、約２千億（２×１０^１１）個の個々のポリヌクレオチド分子を含有することができる。同様に、約１００ｎｇのＤＮＡのサンプルは、約３０，０００個の半数体ヒトゲノム均等物、ｃｆＤＮＡの場合、約６千億個の個々の分子を含有することができる。

いくつかの実施形態では、サンプルは、異なる源から、例えば、細胞からおよび無細胞源（例えば、血液サンプル等）からの核酸を含む。典型的には、サンプルは、核酸保有突然変異体を含む。例えば、サンプルは、随意に、ＤＮＡ保有生殖細胞系統突然変異体および／または体細胞突然変異体を含む。典型的には、サンプルは、ＤＮＡ保有癌と関連突然変異体（例えば、癌関連体細胞突然変異体）を含む。

増幅前のサンプル中の無細胞核酸の例示的量は、典型的には、約１フェムトグラム（ｆｇ）～約１マイクログラム（μｇ）、例えば、約１ピコグラム（ｐｇ）～約２００ナノグラム（ｎｇ）、約１ｎｇ～約１００ｎｇ、約１０ｎｇ～約１，０００ｎｇに及ぶ。いくつかの実施形態では、サンプルは、最大約６００ｎｇ、最大約５００ｎｇ、最大約４００ｎｇ、最大約３００ｎｇ、最大約２００ｎｇ、最大約１００ｎｇ、最大約５０ｎｇ、または最大約２０ｎｇの無細胞核酸分子を含む。随意に、量は、少なくとも約１ｆｇ、少なくとも約１０ｆｇ、少なくとも約１００ｆｇ、少なくとも約１ｐｇ、少なくとも約１０ｐｇ、少なくとも約１００ｐｇ、少なくとも約１ｎｇ、少なくとも約１０ｎｇ、少なくとも約１００ｎｇ、少なくとも約１５０ｎｇ、または少なくとも約２００ｎｇの無細胞核酸分子である。いくつかの実施形態では、量は、最大約１ｆｇ、約１０ｆｇ、約１００ｆｇ、約１ｐｇ、約１０ｐｇ、約１００ｐｇ、約１ｎｇ、約１０ｎｇ、約１００ｎｇ、約１５０ｎｇ、または約２００ｎｇの無細胞核酸分子である。いくつかの実施形態では、本方法は、約１ｆｇ～約２００ｎｇの無細胞核酸分子をサンプルから取得するステップを含む。

無細胞核酸は、典型的には、約１００個のヌクレオチド長～約５００個のヌクレオチド長のサイズ分布を有し、約１１０ヌクレオチド長～約２３０ヌクレオチド長の分子は、サンプル中の分子の約９０％を表し、（ヒト対象からのサンプル中の）約１６８ヌクレオチド長は、最頻値であって、第２の微小ピークは、約２４０ヌクレオチド～約４４０ヌクレオチド長の範囲内にある。いくつかの実施形態では、無細胞核酸は、約１６０ヌクレオチド～約１８０ヌクレオチド長、または約３２０ヌクレオチド～約３６０ヌクレオチド長、または約４４０ヌクレオチド～約４８０ヌクレオチド長である。

いくつかの実施形態では、無細胞核酸は、溶液中に見出されるような無細胞核酸が、無傷細胞および体液の他の非可溶性成分から分離される、パーティション化ステップを通して、体液から単離されることができる。いくつかの実施形態では、パーティション化は、遠心分離または濾過等の技法を含む。代替として、体液中の細胞は、溶解され得、無細胞および細胞核酸は、ともに処理され得る。概して、緩衝液の添加および洗浄ステップ後、無細胞核酸は、例えばアルコールで析出されることができる。いくつかの実施形態では、汚染物質または塩類を除去するためのシリカベースのカラム等のさらなる清浄ステップが、使用される。非特異的バルク担体核酸が、例えば、必要に応じて、反応全体を通して添加され、収率等の手技の例示的な側面を最適化する。そのような処理後、サンプルは、典型的には、二本鎖ＤＮＡ、一本鎖ＤＮＡ、および／または一本鎖ＲＮＡを含む、種々の形態の核酸を含む。随意に、一本鎖ＤＮＡおよび／または一本鎖ＲＮＡは、それらが後続処理および分析ステップ内に含まれるように、二本鎖形態に変換される。
Ｂ．タグ付け

いくつかの実施形態では、核酸分子は、サンプルインデックスおよび／または分子バーコード（概して、「タグ」と称される）でタグ付けされてもよい。タグは、他の方法の中でもとりわけ、化学合成、ライゲーション（例えば、平滑末端ライゲーションまたは粘着末端ライゲーション）、またはオーバーラップ伸長ポリメラーゼ連鎖反応（ＰＣＲ）によって、アダプタの中に組み込まれる、または別様に接合されてもよい。そのようなアダプタは、最終的には、標的核酸分子に接合され得る。他の実施形態では、１回またはそれを上回る増幅サイクル（例えば、ＰＣＲ増幅）が、概して、従来の核酸増幅方法を使用して、分子バーコードおよび／またはサンプルインデックスを核酸分子に導入するために適用される。増幅は、１つまたはそれを上回る反応混合物（例えば、アレイ内の複数のマイクロウェル）内で行われてもよい。分子バーコードおよび／またはサンプルインデックスは、同時に、または任意のシーケンシャル順序において、導入されてもよい。いくつかの実施形態では、分子バーコードおよび／またはサンプルインデックスは、シーケンス捕捉ステップが実施されることに先立って、および／またはその後に導入される。いくつかの実施形態では、分子バーコードのみが、プローブ捕捉に先立って導入され、サンプルインデックスは、シーケンス捕捉ステップが実施された後に導入される。いくつかの実施形態では、分子バーコードおよびサンプルインデックスは両方とも、プローブベースの捕捉ステップを実施することに先立って導入される。いくつかの実施形態では、サンプルインデックスは、シーケンス捕捉ステップが実施された後に導入される。典型的には、シーケンス捕捉プロトコルは、標的化された核酸シーケンス、例えば、ゲノム領域のコーディングシーケンスと相補的一本鎖核酸分子を導入するステップを伴い、そのような領域の突然変異体は、癌型と関連付けられる。

いくつかの実施形態では、タグは、サンプル核酸分子の一端または両端に位置してもよい。いくつかの実施形態では、タグは、所定のまたは無作為もしくは半無作為シーケンスオリゴヌクレオチドである。いくつかの実施形態では、タグは、約５００、２００、１００、５０、２０、１０、９、８、７、６、５、４、３、２、または１未満ヌクレオチド長であってもよい。タグは、無作為または非無作為に、サンプル核酸に連結されてもよい。

いくつかの実施形態では、サンプルまたはサブサンプルの各核酸分子は、分子バーコードまたは分子バーコードの組み合わせで一意にタグ付けされる。他の実施形態では、バーコードが、必ずしも複数のものの中で相互に一意ではない（例えば、非一意の分子バーコード）ように、複数のバーコードが、使用されてもよい。これらの実施形態では、バーコードは、概して、バーコードおよびシーケンスの組み合わせが、個々に追跡され得る一意のシーケンスを作成するように付着され得るように、個々の分子に付着される（例えば、ライゲーションまたはＰＣＲ増幅によって）。非一意にタグ付けされるバーコードの検出は、内因性シーケンス情報（例えば、サンプル中のオリジナル核酸分子のシーケンス、一端または両端におけるシーケンスリードのサブシーケンス、シーケンスリードの長さ、および／またはサンプル中のオリジナル核酸分子の長さに対応する、起始（開始）および／または末端（停止）部分）と組み合わせて、典型的には、特定の分子への一意の識別の割当を可能にする。個々のシーケンスリードの長さまたは塩基対の数もまた、随意に、一意の識別を所与の分子に割り当てるために使用される。本明細書に説明されるように、一意の識別を割り当てられている核酸の一本鎖からの断片は、それによって、親鎖および／または相補的鎖からの断片の後続識別を可能にし得る。

いくつかの実施形態では、分子バーコードは、識別子（例えば、一意または非一意のバーコードの組み合わせ）の予期される比率において、サンプル中の分子に導入される。一例示的フォーマットは、標的分子の両端にライゲーションされる、約２～約１，０００，０００個の異なる分子バーコード、または約５～約１５０個の異なる分子バーコード、または約２０～約５０個の異なる分子バーコードを使用する。代替として、約２５～約１，０００，０００個の異なるバーコードが、使用されてもよい。例えば、２０～５０×２０～５０個のタグに関して、合計４００～２，５００個の識別子が、作成される。識別子のそのような数は、典型的には、同一開始および停止点を有する異なる分子が、識別子の異なる組み合わせを受容する高確率（例えば、少なくとも９４％、９９．５％、９９．９９％、または９９．９９９％）を有するために十分である。いくつかの実施形態では、分子の約８０％、約９０％、約９５％、または約９９％は、分子バーコードの同一組み合わせを有する。

いくつかの実施形態では、反応における一意または非一意の分子バーコードの割当は、例えば、米国特許出願第２００１００５３５１９号、第２００３０１５２４９０号、および第２０１１０１６００７８号、ならびに米国特許第６，５８２，９０８号、第７，５３７，８９８号、第９，５９８，７３１号、および第９，９０２，９９２号（それぞれ、参照することによってその全体として本明細書に組み込まれる）に説明される方法およびシステムを使用して実施される。
Ｃ．増幅

サンプル核酸は、アダプタで挟まれ、増幅されるべきＤＮＡ分子を挟むアダプタ内のプライマー結合部位への核酸プライマー結合を使用して、ＰＣＲおよび他の増幅方法によって増幅されてもよい。いくつかの実施形態では、増幅方法は、伸長、変性、および熱サイクリングから生じるアニーリングのサイクルを伴う、または、例えば、転写媒介増幅におけるように、等温であることができる。随意に利用され得る、増幅方法の他の実施例は、リガーゼ連鎖反応、鎖置換増幅、核酸シーケンスベースの増幅、および自己持続的シーケンスベースの複製を含む。

典型的には、増幅反応は、約１５０個のヌクレオチド（ｎｔ）～約７００個のｎｔ、２５０個のｎｔ～約３５０個のｎｔ、または約３２０個のｎｔ～約５５０個のｎｔに及ぶサイズを伴う、分子バーコードおよびサンプルインデックスで複数の非一意または一意にタグ付けされる、核酸アンプリコンを生成する。いくつかの実施形態では、アンプリコンは、約１８０個のｎｔのサイズを有する。いくつかの実施形態では、アンプリコンは、約２００個のｎｔのサイズを有する。
Ｄ．富化

いくつかの実施形態では、シーケンスは、核酸をシーケンシングすることに先立って、富化される。富化は、随意に、特異的標的領域のためにまたは非特異的に（「標的シーケンス」）、実施される。いくつかの実施形態では、標的着目領域は、弁別タイリングおよび捕捉スキームを使用して、１つまたはそれを上回るベイトセットパネルに関して選択された核酸捕捉プローブ（「ベイト」）で富化されてもよい。弁別タイリングおよび捕捉スキームは、一般に、異なる相対的濃度のベイトセットを使用して、制約のセット（例えば、シーケンシング負荷等のシーケンシング装置制約、各ベイトの有用性等）に従って、ベイトと関連付けられたゲノム領域を横断して弁別的にタイリングし（例えば、異なる「分解能」で）、下流シーケンシングのために、標的化された核酸を所望のレベルで捕捉する。これらの標的化された着目ゲノム領域は、随意に、核酸構造体の天然または合成ヌクレオチドシーケンスを含む。いくつかの実施形態では、１つまたはそれを上回る着目領域へのプローブを伴う、ビオチン標識ビーズが、標的シーケンスを捕捉後、随意に、それらの領域の増幅が続き、着目領域を富化するために使用されることができる。

シーケンス捕捉は、典型的には、標的核酸シーケンスにハイブリダイズする、オリゴヌクレオチドプローブの使用を伴う。いくつかの実施形態では、プローブセット方略は、着目領域を横断してプローブをタイリングすることを伴う。そのようなプローブは、例えば、約６０～約１２０個のヌクレオチド長であることができる。セットは、約２Ｘ、３Ｘ、４Ｘ、５Ｘ、６Ｘ、７Ｘ、８Ｘ、９Ｘ、１０Ｘ、１５Ｘ、２０Ｘ、５０Ｘ、または５０Ｘを上回る深度（例えば、カバレッジの深度）を有することができる。シーケンス捕捉の有効性は、一般に、部分的に、プローブのシーケンスに相補的（またはほぼ相補的）標的分子内のシーケンスの長さに依存する。
Ｅ．シーケンシング

先行する増幅を伴ってまたは伴わずに、アダプターに随意に隣接する試料核酸を一般にシーケンシングに付す。シーケンシング方法または随意に使用される市販のフォーマットは、例えば、Ｓａｎｇｅｒシーケンシング、高スループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単分子シーケンシング、ナノ細孔ベースのシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ＲＮＡ－Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、デジタル遺伝子発現（Ｈｅｌｉｃｏｓ）、次世代シーケンシング（NGS）、合成による単分子シーケ
ンシング（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、超並列シーケンシング、クローン単分子アレイ（Ｓｏｌｅｘａ）、ショットガンシーケンシング、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、Ｍａｘｉｍ－Ｇｉｌｂｅｒｔシーケンシング、プライマーウォーキング、ＰａｃＢｉｏ、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔ、またはナノ細孔プラットフォームを使用したシーケンシングを含む。シーケンシング反応は、複数のレーン、複数のチャネル、複数のウェルまたは複数の試料セットを実質的に同時に処理するその他の手段を含み得る種々の試料処理ユニットで実施できる。試料処理ユニットはまた、複数の実施を同時に処理可能にする複数の試料チャンバーを含み得る。

シーケンシング反応は、がんまたは他の疾患のマーカーを含有することが分かっている１つまたは複数の核酸断片タイプまたは領域で実施することが可能である。シーケンシング反応はまた、試料中に存在する任意の核酸断片で実施できる。シーケンシング反応は、少なくとも約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％のゲノムに対して実施され得る。その他の場合には、シーケンシング反応は、約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％未満のゲノムに対して実施され得る。

同時シーケンシング反応は、マルチプレックスシーケンシング技術を使用して実施してもよい。いくつかの実施形態では、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００のシーケンシング反応を用いて無細胞ポルヌクレオチドをシーケンシングする。その他の実施形態では、約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００未満のシーケンシング反応を用いて無細胞ポリヌクレオチドをシーケンシングする。シーケンシング反応は、代表的に、逐次実施しても、同時に実施する。その後のデータ解析は、一般に、シーケンシング反応のすべてで実施されるか、または一部で実施される。いくつかの実施形態では、データ解析は、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００のシーケンシング反応で実施する。その他の実施形態では、データ解析を約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００未満のシーケンシング反応で実施する。リード深度の実施例は、遺伝子座（例えば、塩基位置）あたり約１０００～約５００００個のリードである。
Ｆ．分析

シーケンシングは、複数のシーケンシングリードまたはリードを生成し得る。シーケンシングリードまたはリードは、約１５０個未満の塩基長または約９０個未満の塩基長のヌクレオチドデータのシーケンスを含んでもよい。いくつかの実施形態では、リードは、約８０個の塩基～約９０個の塩基、例えば、約８５個の塩基長である。いくつかの実施形態では、本開示の方法は、非常に短リード、例えば、約５０個未満の塩基または約３０個未満の塩基長に適用される。シーケンシングリードデータは、シーケンスデータならびにメタ情報を含むことができる。シーケンスリードデータは、例えば、ＶＣＦファイル、ＦＡＳＴＡファイル、またはＦＡＳＴＱファイルを含む、任意の好適なファイルフォーマットで記憶されることができる。

ＦＡＳＴＡは、シーケンスデータベースを検索するためのコンピュータプログラムを指し得、名称ＦＡＳＴＡはまた、標準的ファイルフォーマットを指し得る。例えば、ＦＡＳＴＡは、例えば、Ｐｅａｒｓｏｎ＆Ｌｉｐｍａｎ，１９８８，Ｉｍｐｒｏｖｅｄｔｏｏｌｓｆｏｒｂｉｏｌｏｇｉｃａｌｓｅｑｕｅｎｃｅｃｏｍｐａｒｉｓｏｎ，ＰＮＡＳ８５：２４４４－２４４８（参照することによってその全体として本明細書に組み込まれる）によって説明されている。ＦＡＳＴＡフォーマットにおけるシーケンスは、単一行の説明から開始し、シーケンスデータの行が続く。説明行は、第１の列内の大なり（「＞」）記号によって、シーケンスデータから区別される。「＞」記号に続く単語は、シーケンスの識別子であって、行の残りは、説明である（両方とも、随意である）。「＞」と識別子の第１の文字との間には、空間が存在すべきではない。テキストの全ての行は、８０文字より短いことが推奨される。シーケンスは、別のシーケンスの開始を示す、「＞」から開始する別の行が現れる場合、終了する。

ＦＡＳＴＱフォーマットは、生物学的シーケンス（通常、ヌクレオチドシーケンス）およびその対応する品質スコアの両方を記憶するためのテキストベースのフォーマットである。ＦＡＳＴＡフォーマットに類似するが、品質スコアが、シーケンスデータに続く。シーケンス文字および品質スコアは両方とも、簡潔にするために、単一ＡＳＣＩＩ文字でエンコードされる。ＦＡＳＴＱフォーマットは、例えば、Ｃｏｃｋｅｔａｌ．（“ＴｈｅＳａｎｇｅｒＦＡＳＴＱｆｉｌｅｆｏｒｍａｔｆｏｒｓｅｑｕｅｎｃｅｓ
ｗｉｔｈｑｕａｌｉｔｙｓｃｏｒｅｓ，ａｎｄｔｈｅＳｏｌｅｘａ／ＩｌｌｕｍｉｎａＦＡＳＴＱｖａｒｉａｎｔｓ，”ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３８（６）：１７６７－１７７１，２００９）（参照することによってその全体として本明細書に組み込まれる）によって説明されるようなＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒ等の高スループットシーケンシング器具の出力を記憶するための事実上の標準である。

ＦＡＳＴＡおよびＦＡＳＴＱファイルに関して、メタ情報は、説明行を含み、シーケンスデータの行を含まない。いくつかの実施形態では、ＦＡＳＴＱファイルに関して、メタ情報は、品質スコアを含む。ＦＡＳＴＡおよびＦＡＳＴＱファイルに関して、シーケンスデータが、説明行の後に開始し、典型的には、随意に、「－」を伴う、ＩＵＰＡＣ多義コードのあるサブセットを使用して存在する。ある実施形態では、シーケンスデータは、随意に、必要に応じて、「－」またはＵ（例えば、ギャップまたはウラシルを表すため）を含む、Ａ、Ｔ、Ｃ、Ｇ、およびＮの文字を使用してもよい。

いくつかの実施形態では、少なくとも１つのマスタシーケンスリードファイルおよび出力ファイルが、プレーンテキストファイルとして記憶される（例えば、ＡＳＣＩＩ；ＩＳＯ／ＩＥＣ６４６；ＥＢＣＤＩＣ；ＵＴＦ－８、またはＵＴＦ－１６等のエンコーディングを使用して）。本開示によって提供されるコンピュータシステムは、プレーンテキストファイルを開くことが可能なテキストエディタプログラムを含んでもよい。テキストエディタプログラムは、テキストファイル（プレーンテキストファイル等）のコンテンツをコンピュータ画面上に提示することが可能であって、人間が、テキストを編集することを可能にする（例えば、モニタ、キーボード、およびマウスを使用して）、コンピュータプログラムを指し得る。テキストエディタの実施例は、限定ではないが、Ｍｉｃｒｏｓｏｆｔ
Ｗｏｒｄ、ｅｍａｃｓ、ｐｉｃｏ、ｖｉ、ＢＢＥｄｉｔ、およびＴｅｘｔＷｒａｎｇｌｅｒを含む。テキストエディタプログラムは、プレーンテキストファイルをコンピュータ画面上に表示し、メタ情報およびシーケンスリードを人間可読フォーマット（例えば、バイナリエンコードされず、代わりに、印刷または手書きの際に使用され得るような英数字文字を使用する）で示すことが可能であり得る。

方法は、ＦＡＳＴＡまたはＦＡＳＴＱファイルを参照して議論されたが、本開示の方法およびシステムは、例えば、バリアントコールフォーマット（ＶＣＦ）フォーマットにおけるファイルを含む、任意の好適なシーケンスファイルフォーマットを圧縮するために使用されてもよい。典型的ＶＣＦファイルは、ヘッダ区分およびデータ区分を含んでもよい。ヘッダは、それぞれ、文字「＃＃」から開始する、恣意的数のメタ情報行と、単一「＃」文字から開始する、タブ境界フィールド定義行とを含有する。フィールド定義行は、８つの必須列を指定し、本文区分は、フィールド定義行によって定義された列を埋めるデータの行を含有する。ＶＣＦフォーマットは、例えば、Ｄａｎｅｃｅｋｅｔａｌ．（“ＴｈｅｖａｒｉａｎｔｃａｌｌｆｏｒｍａｔａｎｄＶＣＦｔｏｏｌｓ，”Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２７（１５）：２１５６－２１５８，２０１１）（参照することによってその全体として本明細書に組み込まれる）によって説明されている。ヘッダ区分は、圧縮されたファイルに書き込むためのメタ情報として処理され得、データ区分は、行として処理され得、それぞれ、一意である場合のみ、マスタファイル内に記憶されるであろう。

いくつかの実施形態は、シーケンシングリードのアセンブリを提供する。アセンブリでは、アライメントによって、例えば、シーケンシングリードは、相互にアライメントされる、または参照シーケンスにアライメントされる。各リードを、順に、参照ゲノムにアライメントさせることによって、リードは全て、相互との関係において位置付けられ、アセンブリを作成する。加えて、シーケンシングリードを参照シーケンスにアライメントまたはマッピングすることはまた、シーケンシングリード内のバリアントシーケンスを識別するために使用されることができる。バリアントシーケンスを識別することは、疾患または病状の診断または予後をさらに補助する、もしくは処置決定を誘導するために、本明細書に説明される方法およびシステムと組み合わせて使用されることができる。

いくつかの実施形態では、ステップのいずれかまたは全ては、自動化される。代替として、本開示の方法は、全体的または部分的に、１つまたはそれを上回る専用プログラム内に具現化されてもよく、例えば、それぞれ、随意に、Ｃ＋＋等のコンパイルされた言語で書き込まれ、次いで、バイナリとしてコンパイルおよび配布される。本開示の方法は、全体的または部分的に、既存のシーケンス分析プラットフォーム内に、またはその中の機能性を呼び出すことによって、モジュールとして実装されてもよい。いくつかの実施形態では、本開示の方法は、全て、単一開始待ち行列（例えば、人間のアクティビティ、別のコンピュータプログラム、または機械に由来する、１つのトリガ事象またはその組み合わせ）に応答して、自動的に呼び出される、いくつかのステップを含む。したがって、本開示は、任意のステップまたはステップの任意の組み合わせが待ち行列に応答して自動的に生じ得る、方法を提供する。「自動的に」は、概して、介在人間入力、影響、または相互作用を伴わない（例えば、オリジナルまたは待ち行列前の人間のアクティビティにのみ応答する）ことを意味する。

本開示の方法はまた、対象の核酸サンプルの正確かつ感度の高い解釈を含む、種々の形態の出力を包含し得る。読み出しの出力は、コンピュータファイルのフォーマットで提供されることができる。いくつかの実施形態では、出力は、ＦＡＳＴＡファイル、ＦＡＳＴＱファイル、またはＶＣＦファイルである。出力は、参照ゲノムのシーケンスにアライメントされる核酸のシーケンス等のシーケンスデータを含有する、テキストファイルまたはＸＭＬファイルを生産するように処理されてもよい。他の実施形態では、処理は、参照ゲノムに対して対象核酸中の１つまたはそれを上回る突然変異体を説明する、座標またはストリングを含有する、出力をもたらす。アライメントストリングは、ＳｉｍｐｌｅＵｎＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＳＵＧＡＲ）、ＶｅｒｂｏｓｅＵｓｅｆｕｌＬａｂｅｌｅｄＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＶＵＬＧＡＲ）、およびＣｏｍｐａｃｔＩｄｉｏｓｙｎｃｒａｔｉｃＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＣＩＧＡＲ）を含んでもよい（例えば、Ｎｉｎｇｅｔ
ａｌ．，ＧｅｎｏｍｅＲｅｓｅａｒｃｈ１１（１０）：１７２５－９，２００１（参照することによってその全体として本明細書に組み込まれる）によって説明されるように）。これらのストリングは、例えば、ＥｕｒｏｐｅａｎＢｉｏｉｎｆｏｒｍａｔｉｃｓ
Ｉｎｓｔｉｔｕｔｅ（Ｈｉｎｘｔｏｎ，ＵＫ）からのＥｘｏｎｅｒａｔｅシーケンスアライメントソフトウェア内で実装されてもよい。

いくつかの実施形態では、例えば、ＣＩＧＡＲストリングを含む、シーケンスアライメントマップ（ＳＡＭ）またはバイナリアライメントマップ（ＢＡＭ）ファイル等のシーケンスアライメントが、生産される（ＳＡＭフォーマットは、例えば、Ｌｉｅｔａｌ．，“ＴｈｅＳｅｑｕｅｎｃｅＡｌｉｇｎｍｅｎｔ／ＭａｐｆｏｒｍａｔａｎｄＳＡＭｔｏｏｌｓ，”Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２５（１６）：２０７８－９，２００９（参照することによってその全体として本明細書に組み込まれる）によって説明されている）。いくつかの実施形態では、ＣＩＧＡＲは、行あたり１つずつ、ギャップ付きアライメントを表示する、または含む。ＣＩＧＡＲは、ＣＩＧＡＲストリングとして報告される圧縮ペアワイズアライメントフォーマットである。ＣＩＧＡＲストリングは、長（例えば、ゲノム）ペアワイズアライメントを表すために有用であり得る。ＣＩＧＡＲストリングは、参照ゲノムシーケンスへのリードのアライメントを表すために、ＳＡＭフォーマットにおいて使用されてもよい。

ＣＩＧＡＲストリングは、確立されたモチーフに従ってもよい。各文字の前に、数が置かれ、事象の塩基カウントを与える。使用される文字は、Ｍ、Ｉ、Ｄ、Ｎ、およびＳ（Ｍ＝マッチング、Ｉ＝挿入、Ｄ＝欠失、Ｎ＝ギャップ、Ｓ＝置換）を含むことができる。ＣＩＧＡＲストリングは、マッチング／ミスマッチングおよび欠失（またはギャップ）のシーケンスを定義する。例えば、ＣＩＧＡＲストリング２ＭＤ３Ｍ２Ｄ２Ｍは、アライメントが、２個のマッチング、１個の欠失（数１は、一部の空間を節約するために省略される）、３個のマッチング、２個の欠失、および２個のマッチングを含有することを示し得る。

いくつかの実施形態では、核酸集団が、一本鎖オーバーハングを一端または両端に伴う二本鎖核酸上に平滑末端を酵素的に形成することによって、シーケンシングのために調製される。これらの実施形態では、集団は、典型的には、ヌクレオチド（例えば、Ａ、Ｃ、Ｇ、およびＴまたはＵ）の存在下、５´－３´ＤＮＡポリメラーゼ活性および３´－５´エクソヌクレアーゼ活性を有する酵素で処理される。随意に使用され得る、酵素またはその触媒断片の実施例は、Ｋｌｅｎｏｗ大断片およびＴ４ポリメラーゼを含む。５´オーバーハングでは、酵素は、典型的には、５´末端と同一平面となり、平滑末端を生産するまで、対向鎖上の陥凹３´末端を伸長させる。３´オーバーハングでは、酵素は、概して、対向鎖の５´末端まで、時として、それを越えて、３´末端から消化させる。本消化が、対向鎖の５´末端を越えて進む場合、ギャップが、５´オーバーハングのために使用される同一ポリメラーゼ活性を有する酵素によって充填され得る。二本鎖核酸上の平滑末端の形成は、例えば、アダプタの付着および後続増幅を促進する。

いくつかの実施形態では、核酸集団は、一本鎖核酸から二本鎖核酸への変換および／またはＲＮＡからＤＮＡ（例えば、相補的ＤＮＡまたはｃＤＮＡ）への変換等、付加的処理を受ける。これらの形態の核酸はまた、随意に、アダプタに連結され、増幅される。

以前の増幅の有無にかかわらず、核酸は、上記に説明される平滑末端を形成するプロセスを被り、随意に、サンプル中の他の核酸も、シーケンシングされ、シーケンシングされた核酸を生産することができる。シーケンシングされた核酸は、核酸のシーケンス（例えば、シーケンス情報）またはそのシーケンスが判定された核酸のいずれかを指し得る。シーケンシングは、サンプル中の個々の核酸分子の増幅生成物のコンセンサスシーケンスから、直接または間接的にのいずれかにおいて、サンプル中の個々の核酸分子のシーケンスデータを提供するように実施されることができる。

いくつかの実施形態では、平滑末端形成後のサンプル中の一本鎖オーバーハングを伴う二本鎖核酸は、両端において、バーコードを含む、アダプタに連結され、シーケンシングは、核酸シーケンスならびにアダプタによって導入されたインラインバーコードを判定する。平滑末端ＤＮＡ分子は、随意に、少なくとも部分的に二本鎖のアダプタ（例えば、Ｙ形状またはベル形状のアダプタ）の平滑末端にライゲーションされる。代替として、サンプル核酸の平滑末端およびアダプタは、相補的ヌクレオチドで終端され、ライゲーション（例えば、粘着末端ライゲーションのため）を促進することができる。

核酸サンプルは、典型的には、同一核酸の任意の２つのコピーが、アダプタバーコードの同一組み合わせを両端において連結されたアダプタから受け取る確率が低い（例えば、約１または０．１％未満）、十分な数のアダプタと接触される。アダプタの使用は、このように、参照核酸上に同一開始および停止点を伴い、バーコードの同一組み合わせに連結される、核酸シーケンスのファミリーの識別を可能にし得る。そのようなファミリーは、増幅前のサンプル中の核酸の増幅生成物のシーケンスを表し得る。ファミリーメンバーのシーケンスは、平滑末端形成およびアダプタ付着によって修飾されるようなオリジナルサンプル中の核酸分子に関するコンセンサスヌクレオチドまたは完全なコンセンサスシーケンスを導出するためにコンパイルされることができる。言い換えると、サンプル中の核酸の規定された位置を占有する、ヌクレオチドは、ファミリーメンバーシーケンス内のその対応する位置を占有する、ヌクレオチドのコンセンサスであると判定されることができる。ファミリーは、二本鎖核酸の一方または両方の鎖のシーケンスを含むことができる。ファミリーのメンバーが、二本鎖核酸からの両方の鎖のシーケンスを含む場合、１つの鎖のシーケンスは、シーケンスをコンパイルし、コンセンサスヌクレオチドまたはシーケンスを導出する目的のために、その補体に変換されてもよい。いくつかのファミリーは、単一メンバーシーケンスのみを含む。この場合、本シーケンスは、増幅前のサンプル中の核酸のシーケンスと見なされ得る。代替として、単一メンバーシーケンスのみを伴うファミリーは、後続分析から排除されることができる。

シーケンシングされる核酸中のヌクレオチド変種（例えば、ＳＮＶまたはインデル）は、シーケンシングされた核酸と参照シーケンスを比較することによって判定されることができる。参照シーケンスは、多くの場合、既知のシーケンス、例えば、対象からの既知の全体的または部分的ゲノムシーケンス（例えば、ヒト対象の全体的ゲノムシーケンス）である。参照シーケンスは、例えば、ｈＧ１９またはｈＧ３８であることができる。シーケンシングされた核酸は、上記に説明されるように、サンプル中の核酸に関して直接判定されたシーケンスまたはそのような核酸の増幅生成物のシーケンスのコンセンサスを表すことができる。比較は、参照シーケンス上の１つまたはそれを上回る指定される位置において実施されることができる。個別のシーケンスが最大限にアライメントされるとき、参照シーケンスの指定される位置と対応する位置を含む、シーケンシングされた核酸のサブセットが、識別されることができる。そのようなサブセット内では、該当する場合、ヌクレオチド変種を指定される位置に含み、随意に、該当する場合、参照ヌクレオチド（例えば、参照シーケンス内のものと同一である）を含む、シーケンシングされた核酸が、判定されることができる。ヌクレオチドバリアントを含む、サブセット内のシーケンシングされた核酸の数が、選択された閾値を超える場合、バリアントヌクレオチドは、指定される位置にあると見なされ得る。閾値は、他の可能性の中でもとりわけ、ヌクレオチドバリアントを含む、サブセット内の少なくとも１、２、３、４、５、６、７、８、９、または１０個のシーケンシングされた核酸等の単純数であることができる、またはヌクレオチドバリアントを含む、サブセット内のシーケンシングされた核酸の、少なくとも０．５、１、２、３、４、５、１０、１５、または２０等の比率であることができる。比較は、参照シーケンス内の任意の指定される着目位置に関して繰り返されることができる。時として、比較は、参照シーケンス上の少なくとも約２０、１００、２００、または３００個の連続的位置、例えば、約２０～５００または約５０～３００個の連続的位置を占有する、指定される位置に関して実施されることができる。

本明細書に説明されるフォーマットおよび用途を含む、核酸シーケンシングに関する付加的詳細はまた、例えば、Ｌｅｖｙｅｔａｌ．，ＡｎｎｕａｌＲｅｖｉｅｗｏｆ
ＧｅｎｏｍｉｃｓａｎｄＨｕｍａｎＧｅｎｅｔｉｃｓ，１７：９５－１１５（２０１６）、Ｌｉｕｅｔａｌ．，Ｊ．ｏｆＢｉｏｍｅｄｉｃｉｎｅａｎｄＢｉｏｔｅｃｈｎｏｌｏｇｙ，Ｖｏｌｕｍｅ２０１２，ＡｒｔｉｃｌｅＩＤ２５１３６４：１－１１（２０１２）、Ｖｏｅｌｋｅｒｄｉｎｇｅｔａｌ．，ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８（２００９），ＭａｃＬｅａｎｅｔａｌ．，ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６（２００９）、Ａｓｔｉｅｒｅｔａｌ．，ＪＡｍＣｈｅｍＳｏｃ．，１２８（５）：１７０５－１０（２００６）、米国特許第６，２１０，８９１号、米国特許第６，２５８，５６８号、米国特許第６，８３３，２４６号、米国特許第７，１１５，４００号、米国特許第６，９６９，４８８号、米国特許第５，９１２，１４８号、米国特許第６，１３０，０７３号、米国特許第７，１６９，５６０号、米国特許第７，２８２，３３７号、米国特許第７，４８２，１２０号、米国特許第７，５０１，２４５号、米国特許第６，８１８，３９５号、米国特許第６，９１１，３４５号、米国特許第７，５０１，２４５号、米国特許第７，３２９，４９２号、米国特許第７，１７０，０５０号、米国特許第７，３０２，１４６号、米国特許第７，３１３，３０８号、および米国特許第７，４７６，５０３、（それぞれ、参照することによってその全体として本明細書に組み込まれる）に提供されている。
ＩＩＩ．コンピュータシステム

本開示の方法は、コンピュータシステムを使用するかまたはこれの助けとともに実装され得る。例えば、そのような方法は、（ａ）核酸バリアントに関する複数の定量測定値を核酸分子のサンプル（例えば、ｃｆＤＮＡのサンプル）から判定するステップであって、複数の定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの関連付けられた変数をサンプルから識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントに関するｐ値が所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含んでもよく、コンピュータプロセッサで実施され得る。

図４は、本開示の方法を実装するようにプログラムまたは別様に構成される、コンピュータシステム４０１を示す。コンピュータシステム４０１は、サンプル調製、シーケンシング、および／または分析の種々の側面を調整することができる。いくつかの実施例では、コンピュータシステム４０１は、核酸シーケンシングを含む、サンプル調製およびサンプル分析を実施するように構成される。

コンピュータシステム４０１は、単一コアまたはマルチコアプロセッサ、もしくは並列処理用の複数のプロセッサであり得る、中央処理装置（ＣＰＵ、本明細書ではまた、「プロセッサ」および「コンピュータプロセッサ」）４０５を含む。コンピュータシステム４０１はまた、メモリまたはメモリ場所４１０（例えば、無作為アクセスメモリ、読取専用メモリ、フラッシュメモリ）、電子記憶ユニット４１５（例えば、ハードディスク）、１つまたはそれを上回る他のシステムと通信するための通信インターフェース４２０（例えば、ネットワークアダプタ）、ならびにキャッシュ、他のメモリ、データ記憶装置、および／または電子ディスプレイアダプタ等の周辺デバイス４２５も含む。メモリ４１０、記憶ユニット４１５、インターフェース４２０、および周辺デバイス４２５は、マザーボード等の通信ネットワークまたはバス（実線）を通してＣＰＵ４０５と通信する。記憶ユニット４１５は、データを記憶するためのデータ記憶ユニット（またはデータレポジトリ）であり得る。コンピュータシステム４０１は、通信インターフェース４２０の助けを借りて、コンピュータネットワーク４３０に動作可能に結合されることができる。コンピュータネットワーク４３０は、インターネット、インターネットおよび／またはエクストラネット、もしくはインターネットと通信しているイントラネットおよび／またはエクストラネットであり得る。コンピュータネットワーク４３０は、ある場合には、電気通信および／またはデータネットワークである。コンピュータネットワーク４３０は、クラウドコンピューティング等の分散コンピューティングを可能にし得る、１つまたはそれを上回るコンピュータサーバを含むことができる。ネットワーク４３０は、ある場合には、コンピュータシステム４０１の助けを借りて、コンピュータシステム４０１に結合されたデバイスがクライアントまたはサーバとして挙動することを可能にし得る、ピアツーピアネットワークを実装することができる。

ＣＰＵ４０５は、プログラムまたはソフトウェアで具現化され得る、一連の機械可読命令を実行することができる。命令は、メモリ４１０等のメモリ場所に記憶されてもよい。ＣＰＵ４０５によって行われる動作の実施例は、フェッチ、解読、実行、およびライトバックを含むことができる。

記憶ユニット４１５は、ドライバ、ライブラリ、および保存されたプログラム等のファイルを記憶することができる。記憶ユニット４１５は、ユーザによって生成されたプログラムおよび記録されたセッションならびにプログラムと関連づけられた出力を記憶することができる。記憶ユニット４１５は、ユーザデータ、例えば、ユーザ選好およびユーザプログラムを記憶することができる。コンピュータシステム４０１は、ある場合には、イントラネットまたはインターネットを通してコンピュータシステム４０１と通信している遠隔サーバ上に位置するもの等の、コンピュータシステム４０１の外部にある１つまたはそれを上回る付加的データ記憶ユニットを含むことができる。データは、例えば、通信ネットワークまたは物理的データ転送を使用して（例えば、ハードドライブ、サムドライブ、または他のデータ記憶機構を使用して）１つの場所から別の場所に転送されてもよい。

コンピュータシステム４０１は、ネットワーク４３０を通して１つまたはそれを上回る遠隔コンピュータシステムと通信することができる。例えば、コンピュータシステム４０１は、ユーザの遠隔コンピュータシステム（例えば、オペレータ）と通信することができる。遠隔コンピュータシステムの実施例は、パーソナルコンピュータ（例えば、ポータブルＰＣ）、スレートまたはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ対応デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、または携帯情報端末を含む。ユーザは、ネットワーク４３０を介してコンピュータシステム４０１にアクセスすることができる。

本明細書に説明されるような方法は、例えば、メモリ４１０または電子記憶ユニット４１５上等のコンピュータシステム４０１の電子記憶場所上に記憶された機械（例えば、コンピュータプロセッサ）実行可能コードを介して実装されることができる。機械実行可能または機械可読コードは、ソフトウェアの形態で提供されることができる。使用中に、コードは、プロセッサ４０５によって実行されることができる。ある場合には、コードは、記憶ユニット４１５から読み出され、プロセッサ４０５による容易なアクセスのためにメモリ４１０上に記憶されることができる。ある状況では、電子記憶ユニット４１５は、排除されることができ、機械実行可能命令が、メモリ４１０上に記憶される。

ある側面では、本開示は、少なくとも１つの電子プロセッサによって実行される場合に、（ａ）核酸バリアントに関する複数の定量測定値をｃｆＤＮＡサンプルから判定するステップであって、複数の定量測定値は、核酸バリアントに関する総対立遺伝子カウントおよびマイナー対立遺伝子カウントを含む、ステップと、（ｂ）核酸バリアントの関連付けられた変数をｃｆＤＮＡサンプルから識別するステップと、（ｃ）核酸バリアントの関連付けられた変数に関する定量値を判定するステップと、（ｄ）核酸バリアントのあるゲノム遺伝子座において予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデルを生成するステップと、（ｅ）少なくとも部分的に、予期される生殖細胞系統突然変異対立遺伝子カウントに関する統計モデル、核酸バリアントの関連付けられた変数に関する定量値、および核酸バリアントに関する複数の定量測定値のうちの少なくとも１つに基づいて、核酸バリアントに関する確率値（ｐ値）を生成するステップと、（ｆ）核酸バリアントを、（ｉ）核酸バリアントに関するｐ値が所定の閾値を下回るとき、体細胞起源である、または（ｉｉ）核酸バリアントに関するｐ値が所定の閾値である、またはそれを上回るとき、生殖細胞系統起源であると分類するステップと、を含む、方法を実行するコンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を提供する。

コードは、コードを実行するように適合されるプロセッサを有する機械と併用するために事前にコンパイルおよび構成されることができるか、または実行時間中にコンパイルされることができる。コードは、事前コンパイルされた、またはコンパイルされた時点の様式で、コードが実行されることを可能にするように選択され得る、プログラミング言語で供給されることができる。

コンピュータシステム４０１等の本明細書で提供されるシステムおよび方法の側面は、プログラミングで具現化されることができる。本技術の種々の側面は、典型的には、一種の機械可読媒体上で搬送されるか、またはその中で具現化される、機械（もしくはプロセッサ）実行可能コードおよび／または関連データの形態の「製品」もしくは「製造品」と考えられてもよい。機械実行可能コードは、メモリ（例えば、読取専用メモリ、無作為アクセスメモリ、フラッシュメモリ）またはハードディスク等の電子記憶ユニット上に記憶されることができる。「記憶」型媒体は、ソフトウェアプログラミングのためにいかなる時でも非一過性の記臆装置を提供し得る、コンピュータ、プロセッサ、もしくは同等物の有形メモリ、または種々の半導体メモリ、テープドライブ、ハードドライブ、および同等物等のそれらの関連モジュールのうちのいずれかもしくは全てを含むことができる。

ソフトウェアの全てまたは部分は、時として、インターネットまたは種々の他の電気通信ネットワークを通して通信されてもよい。そのような通信は、例えば、１つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへ、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのロードを可能にし得る。したがって、ソフトウェア要素を持ち得る別のタイプの媒体は、ローカルデバイス間の物理的インターフェースを横断し、有線および光学地上通信線ネットワークを通し、かつ種々のエアリンクを経由して使用されるものなどの光波、電波、および電磁波を含む。有線もしくは無線リンク、光学リンク、または同等物等のそのような波動を搬送する物理的要素もまた、ソフトウェアを持つ媒体と見なされてもよい。本明細書で使用されるように、非一過性の有形「記憶」媒体に制限されない限り、コンピュータまたは機械「可読媒体」等の用語は、実行のために命令をプロセッサに提供することに参加する任意の媒体を指す。

したがって、コンピュータ実行可能コード等の機械可読媒体は、有形記憶媒体、搬送波媒体、または物理的伝送媒体を含むが、それらに限定されない、多くの形態を成してもよい。不揮発性記憶媒体は、例えば、図面に示されるデータベース等を実装するために使用されるような、任意のコンピュータまたは同等物の中の記憶デバイスのうちのいずれか等の光学または磁気ディスクを含む。揮発性記憶媒体は、そのようなコンピュータプラットフォームのメインメモリ等のダイナミックメモリを含む。有形伝送媒体は、同軸ケーブル、すなわち、コンピュータシステム内のバスを含むワイヤを含む、銅線および光ファイバを含む。搬送波伝送媒体は、電気もしくは電磁信号、または高周波（ＲＦ）および赤外線（ＩＲ）データ伝送中に生成されるもの等の音波もしくは光波の形態をとってもよい。コンピュータ可読媒体の一般的な形態は、したがって、例えば、フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤまたはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、孔のパターンを伴う任意の他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、任意の他のメモリチップまたはカートリッジ、データもしくは命令を輸送する搬送波、そのような搬送波を輸送するケーブルまたはリンク、もしくはコンピュータがプログラミングコードおよび／またはデータを読み取り得る任意の他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行するために１つまたはそれを上回る命令の１つまたはそれを上回るシーケンスをプロセッサに搬送することに関与し得る。

コンピュータシステム４０１は、例えば、サンプル分析の１つまたはそれを上回る結果を提供するためのユーザインターフェース（ＵＩ）を含む、電子ディスプレイを含む、またはそれと通信することができる。ＵＩの実施例は、限定ではないが、グラフィカルユーザインターフェース（ＧＵＩ）およびウェブベースのユーザインターフェースを含む。

コンピュータシステムおよびネットワーク、データベース、およびコンピュータプログラム製品に関連する付加的詳細はまた、例えば、Ｐｅｔｅｒｓｏｎ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｓ：ＡＳｙｓｔｅｍｓＡｐｐｒｏａｃｈ，ＭｏｒｇａｎＫａｕｆｍａｎｎ，５ｔｈＥｄ．（２０１１）、Ｋｕｒｏｓｅ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｉｎｇ：ＡＴｏｐ－ＤｏｗｎＡｐｐｒｏａｃｈ，Ｐｅａｒｓｏｎ，７^ｔｈＥｄ．（２０１６）、Ｅｌｍａｓｒｉ，ＦｕｎｄａｍｅｎｔａｌｓｏｆＤａｔａｂａｓｅＳｙｓｔｅｍｓ，ＡｄｄｉｓｏｎＷｅｓｌｅｙ，６ｔｈＥｄ．（２０１０）、Ｃｏｒｏｎｅｌ，ＤａｔａｂａｓｅＳｙｓｔｅｍｓ：Ｄｅｓｉｇｎ，Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ，＆Ｍａｎａｇｅｍｅｎｔ，ＣｅｎｇａｇｅＬｅａｒｎｉｎｇ，１１^ｔｈＥｄ．（２０１４）、Ｔｕｃｋｅｒ，ＰｒｏｇｒａｍｍｉｎｇＬａｎｇｕａｇｅｓ，ＭｃＧｒａｗ－ＨｉｌｌＳｃｉｅｎｃｅ／Ｅｎｇｉｎｅｅｒｉｎｇ／Ｍａｔｈ，２ｎｄＥｄ．（２００６）、およびＲｈｏｔｏｎ，ＣｌｏｕｄＣｏｍｐｕｔｉｎｇＡｒｃｈｉｔｅｃｔｅｄ：ＳｏｌｕｔｉｏｎＤｅｓｉｇｎＨａｎｄｂｏｏｋ，ＲｅｃｕｒｓｉｖｅＰｒｅｓｓ（２０１１）（それぞれ、参照することによってその全体として本明細書に組み込まれる）に提供されている。
ＩＶ．用途
Ａ．癌および他の疾患

いくつかの実施形態では、本明細書に開示される方法およびシステムは、体細胞または生殖細胞系統起源としての核酸バリアントの分類に基づいて、カスタマイズまたは標的化された療法を識別し、患者内の所与の疾患または病状を処置するために使用されてもよい。典型的には、検討中の疾患は、ある型の癌である。そのような癌の非限定的実施例は、胆管癌、膀胱癌、移行上皮癌、尿路上皮癌、脳癌、神経膠腫、星状細胞腫、乳癌、化生癌、子宮頸癌、子宮頸部扁平上皮癌、直腸癌、結腸直腸癌、結腸癌、遺伝性非ポリポーシス大腸癌、結腸直腸腺癌、消化管間質腫瘍（ＧＩＳＴ）、子宮内膜癌、子宮内膜間質肉腫、食道癌、食道扁平上皮癌、食道腺癌、眼内メラノーマ、ブドウ膜メラノーマ、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性骨髄単球性白血病（ＣＭＭＬ）、肝臓癌、肝癌腫、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺癌、非小細胞肺癌（ＮＳＣＬＣ）、中皮腫、Ｂ細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、Ｔ細胞リンパ腫、非ホジキンリンパ腫、前駆Ｔリンパ芽球性リンパ腫／白血病、末梢Ｔ細胞リンパ腫、多発性骨髄腫、鼻咽頭癌腫（ＮＰＣ）、神経芽細胞腫、口腔咽頭癌、口腔扁平上皮癌、骨肉腫、卵巣癌、膵臓癌、膵管腺癌、偽乳頭状腫瘍、腺房細胞癌、前立腺癌、前立腺腺癌、皮膚癌、メラノーマ、悪性メラノーマ、皮膚メラノーマ、小腸癌、胃癌、胃癌腫、消化管間質腫瘍（ＧＩＳＴ）、子宮癌、または子宮肉腫を含む。

本明細書に開示される方法およびシステムを使用して随意に評価される、他の遺伝子ベースの疾患、障害、または病状の非限定的実施例は、軟骨無形成症、アルファ－１アンチトリプシン欠損症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー・マリー・トゥース病（ＣＭＴ）、猫鳴き症候群、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第Ｖ因子ライデン血栓性素因、家族性高コレステロール血症、家族性地中海熱、脆弱Ｘ症候群、Ｇａｕｃｈｅｒ疾患、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド症候群、ポルフィリン症、早老症、網膜色素変性、重症複合免疫不全症候群（ｓｃｉｄ）、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス病、サラセミア、トリメチルアミン、ターナー症候群、口蓋心臓顔面症候群、ＷＡＧＲ症候群、ウィルソン病、または同等物を含む。
Ｂ．療法および関連投与

ある実施形態では、本明細書に開示される方法は、体細胞または生殖細胞系統起源としての核酸バリアントのステータスを前提として、カスタマイズされた療法を識別し、患者に投与することに関する。いくつかの実施形態では、本質的に、任意の癌療法（例えば、外科手術療法、放射線療法、化学療法、および／または同等物）が、これらの方法の一部として含まれてもよい。典型的には、カスタマイズされた療法は、少なくとも１つの免疫療法（または免疫療法作用物質）を含む。免疫療法は、概して、所与の癌型に対して免疫応答を向上させる方法を指す。ある実施形態では、免疫療法は、腫瘍または癌に対するＴ細胞応答を向上させる方法を指す。

ある実施形態では、体細胞または生殖細胞系統起源としての対象からのサンプルからの核酸バリアントのステータスは、参照集団からの比較器結果のデータベースと比較され、その対象のためのカスタマイズまたは標的化された療法を識別してもよい。典型的には、参照集団は、試験対象と同一癌または疾患型を患う患者、および／または試験対象と同一療法を受けている、もしくは受けた患者を含む。カスタマイズまたは標的化された療法（または療法）は、核バリアントおよび比較器結果がある分類基準を満たす（例えば、実質的または近似的にマッチングする）ときに識別され得る。

ある実施形態では、本明細書に説明されるカスタマイズされた療法は、典型的には、非経口的に（例えば、静脈内または皮下）投与される。免疫療法作用物質を含有する医薬品組成物が、典型的には、静脈内投与される。ある療法用作用物質は、経口投与される。しかしながら、カスタマイズされた療法（例えば、免疫療法作用物質等）はまた、例えば、口腔、舌下、経直腸、膣内、尿道内、局部、眼内、鼻腔内、および／または耳介内を含む、当技術分野において公知の任意の方法によって投与されてもよく、投与は、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル剤、スプレー剤、坐剤、塗剤、軟膏剤、または同等物を含んでもよい。

（実施例１）
ベータ二項モデル対閾値アプローチを使用して、ＥＧＦＲＴ７９０Ｍ突然変異体が生殖細胞系統または体細胞起源であるかどうかを判定する
サンプルのセットが、ＧｕａｒｄａｎｔＨｅａｌｔｈ，Ｉｎｃ．（Ｒｅｄｗｏｏｄ
Ｃｉｔｙ，ＣＡ）によって開発された血液ベースのＤＮＡアッセイを使用して、処理および分析された。分析されたサンプルのうちの１つは、Ｔ７９０Ｍ突然変異体（一塩基バリアント）を染色体７上のゲノム位置５５２４９０７１におけるＥＧＦＲ遺伝子内に有していた。バリアントの突然変異対立遺伝子カウント（Ａ）および総対立遺伝子カウント（Ｂ）が、バイオインフォマティクス分析を使用して、それぞれ、１，８５５および１０，８０６であると推定された。バリアントの突然変異対立遺伝子割合（ＭＡＦ）は、０．１７７（ＭＡＦ＝Ａ／Ｂ）であると推定された。

バリアントの起源を判定するために、ＥＧＦＲ遺伝子が、ベータ二項モデル内のビンとして使用された。６個の共通生殖細胞系統ヘテロ接合型ＳＮＰが、（ｉ）０．００１を上回る集団対立遺伝子頻度を伴うＥｘＡＣデータベース内で列挙されたか、または（ｉｉ）０．９未満のＭＡＦを伴う過去のサンプルセットのデータベース内の既知の生殖細胞系統ヘテロ接合型ＳＮＰとして列挙されたかのいずれかであった、ＥＧＦＲ遺伝子内に見出された。これらの６個の共通生殖細胞系統ヘテロ接合型ＳＮＰの突然変異対立遺伝子カウントおよび総対立遺伝子カウントは、ベータ二項モデルにおいて使用され、μ_ＥＧＦＲパラメータの最大尤度推定値（ＭＬＥ）が、ベータ二項モデルを使用して、０．３９７１であると推定された。図５Ａは、Ｔ７９０Ｍ（●）バリアントおよび６個の共通生殖細胞系統ヘテロ接合型ＳＮＰ（▲）に関するＭＡＦ対ゲノム位置のプロットを示す。図５Ｂは、Ｔ７９０Ｍ（●）バリアントおよび６個の共通生殖細胞系統ヘテロ接合型ＳＮＰ（▲）に関するｍｉｎ（ＭＡＦ，１－ＭＡＦ）対ゲノム位置のプロットを示す。ベータ二項モデルによって推定された０．３９７１のμ_ＥＧＦＲは、図５Ａおよび図５Ｂの両方において実線として示される。ρパラメータが、過去のサンプルセット内の生殖細胞系統ＳＮＰに関するρ値の中央値として推定され、９．２×１０^－５であると計算された。μ_ＥＧＦＲおよびρ値に関するこれらの値を使用して、Ｔ７９０Ｍバリアントに関する両側ｐ値が、２．８×１０^－３０２であると計算された。ｐ値に関する１０^－１６の所定の閾値が、バリアントの起源（例えば、生殖細胞系統または体細胞）を識別するために使用された。Ｔ７９０Ｍバリアントに関するｐ値は、所定の閾値未満であるため、Ｔ７９０Ｍバリアントは、体細胞起源であると判定される。

ベータ二項モデルの使用と比較して、任意のバリアントの起源は、０．１５のＭＡＦを閾値として使用することによって等、ＭＡＦ閾値方法に基づいて、判定されることができる（例えば、０．１５未満のＭＡＦを有するバリアントを体細胞バリアントとして、または０．１５を上回るまたはそれと等しいＭＡＦを有するバリアントを生殖細胞系統バリアントとして分類する）。本明細書に説明される、Ｔ７９０Ｍバリアントは、０．１５のＭＡＦ閾値を上回る、０．１７７の測定されたＭＡＦを有していた。したがって、Ｔ７９０Ｍバリアントは、ＭＡＦ閾値方法を使用すると、生殖細胞系統起源であると誤って識別されることになるであろう。対照的に、ベータ二項モデルは、ＥＧＦＲ遺伝子内で観察される任意の対立遺伝子不均衡を考慮することによって、ＥＧＦＲ遺伝子の局所ゲノムコンテキストを正確にモデル化し、故に、バリアントを体細胞起源であると正しく識別した。

本発明の好ましい実施形態が、本明細書で示され、説明されているが、そのような実施形態は、一例のみとして提供されることが当業者に明白となるであろう。本発明が本明細書内で提供される具体的実施例によって限定されることは意図されない。本発明は、前述の明細書を参照して説明されているが、本明細書の実施形態の説明および例証は、限定的な意味で解釈されるように意図されていない。多数の変形例、変更、および代用が、ここで、本発明から逸脱することなく、当業者に想起されるであろう。さらに、本発明の全ての側面は、種々の条件および変数に依存する、本明細書に記載される具体的描写、構成、または相対的割合に限定されないことを理解されたい。本明細書に説明される本発明の実施形態の種々の代替物が、本発明を実践する際に採用され得ることを理解されたい。したがって、本発明はまた、任意のそのような代替物、修正、変形例、または均等物も網羅するものとすると考慮される。以下の請求項は、本発明の範囲を定義し、それにより、これらの請求項およびそれらの均等物の範囲内の方法および構造が対象となることが意図される。

前述の開示は、明確性および理解の目的のために、例証および実施例として、ある程度詳細に説明されたが、本開示の熟読から、形態および詳細における種々の変更が、本開示の真の範囲から逸脱することなく行われることができ、添付の請求項の範囲内で実践されてもよいことが、当業者に明白となる。例えば、全ての方法、システム、コンピュータ可読媒体、および／またはその構成要素特徴、ステップ、要素、もしくは他の側面は、種々の組み合わせにおいて使用されることができる。

本明細書で引用されるすべての特許、特許出願、ウェブサイト、他の出版物、または書類、および受託番号などは、あたかもそれぞれ個々の項目が参照によりそのように組み込まれることが明確におよび個別に示されている場合と同じ程度にあらゆる目的のためにその全体が参照により組み込まれる。配列の異なるバージョンが異なる時期の受託番号に関連している場合、本出願の有効出願日にその受託番号に関連しているバージョンを意味する。有効出願日とは、実際の出願日よりも早期、または該当する場合、受託番号に言及する優先権出願の出願日を意味する。同様に、出版物、またはウェブサイトなどの異なるバージョンが異なる時期に公表される場合、他の方法で示されていなければ、出願の有効出願日の直近に公表されたバージョンを意味する。

Claims

明細書に記載の発明。