JP6867045B2

JP6867045B2 - 血漿ｄｎａの単分子配列決定

Info

Publication number: JP6867045B2
Application number: JP2018506601A
Authority: JP
Inventors: ユク−ミンデニスロ; ロッサウェイクンチウ; スクハンチョン
Original assignee: Chinese University of Hong Kong CUHK
Current assignee: Chinese University of Hong Kong CUHK
Priority date: 2015-08-12
Filing date: 2016-08-12
Publication date: 2021-04-28
Anticipated expiration: 2036-08-12
Also published as: TWI793586B; AU2020202153B2; JP2018531583A; AU2016305103B2; IL285795A; JP7506408B2; AU2023202572B2; JP2024113130A; AU2023202572A1; US11319586B2; MY188348A; IL294192B2; CN107849607A; SA518390907B1; TW201718874A; JP2021118691A; AU2020202153A1; TW202130815A; TWI728994B; WO2017025059A1

Description

関連出願の相互援用
本出願は、２０１５年８月１２日に出願された、米国特許仮出願第６２／２０４，３９６号の利益を主張するものであり、その内容は、全ての目的のために、参照により本明細書に組み込まれる。

母体血漿ＤＮＡ配列決定による非侵襲的出生前検査（ＮＩＰＴ）は、現在、胎児染色体異数性のスクリーニングに臨床的に利用可能である（１）。羊水穿刺とは異なり、母体血漿ＤＮＡ配列決定はいかなる流産リスクも引き起こさない。これらの試験は、９９％近くの感度および９９％近くの特異性を有する（１）。その結果、ＮＩＰＴの臨床的需要は、２０１１年に初めて市販されて以来、大幅に増加している。

超並列配列決定は、染色体異数性のＮＩＰＴのために現在使用されている実験プロトコルの大部分の中心的構成要素である（２）。高い計装コストのため、これらの試験は現在、参考検査室で実施されている。オックスフォードナノポアテクノロジーズは、ナノポアベースのＤＮＡ配列決定プラットフォームを開発した（３）。ナノポア配列決定装置は、設備コストが比較的低く、フットプリントが小さい。各フローセルのコストは５００〜９００米ドルで、４８時間まで複数回使用できる。配列決定速度も比較的速く、各ナノポアから３０塩基／秒を読み取ることができる。このような特徴は、臨床検査室での使用に有利であろう。しかし、現行のナノポア技術は、ＮＩＰＴに典型的に使用される試料（例えば、血漿）に対して非効率である。

概要
実施形態は、比較的小さなＤＮＡ断片で試料を分析する場合の単分子配列決定技術の効率を改善する。例えば、試料中のＤＮＡ断片の濃度を有意に増加させることができ、それにより、より多くのＤＮＡ断片を配列決定装置（例えば、ナノポア）と相互作用させることができる。別の例として、ＤＮＡ断片をコンカテマーに結合させて、より長い分子を読み取ることができ、それにより、１分子の配列を介して複数のＤＮＡ断片（すなわち、試料中にもともとあるＤＮＡ断片）を効率的に読み取ることができる。バイオインフォーマティック手法を用いて、同じコンカテマーの一部である異なるＤＮＡ試料を検出することができる。実施形態は、２つの技術を組み合わせることができる。

実施形態は、核酸配列を決定する方法を含むこととしてもよい。方法は、複数のＤＮＡ断片を受け取ることを含むこととしてもよい。また、方法は、ＤＮＡ断片の第１のセットをコンカテマー化して、第１のコンカテマーを得ることを含むこととしてもよい。方法は、第１のコンカテマーの単分子配列決定を実行して、第１のコンカテマーの第１の配列を得ることを含む。いくつかの実施形態では、単分子配列決定は、ナノポアを用いて実行され、方法は、第１のコンカテマーが第１のナノポアを通ることを含むこととしてもよい。第１の電気信号は、第１のコンカテマーが第１のナノポアを通るときに検出されることとしてもよい。第１の電気信号は、第１のコンカテマーの第１の配列に対応することとしてもよい。

別の実施形態は、核酸配列を決定する方法を含むこととしてもよい。方法は、複数のＤＮＡ断片を受け取ることを含むこととしてもよい。ＤＮＡ断片の第１のセットがコンカテマー化されて第１のコンカテマーを得ることとしてもよい。蛍光標識されたヌクレオチドは、コンカテマーへハイブリダイズされることとしてもよい。第１の蛍光シグナルは、特異的ヌクレオチドに対応する第１の蛍光シグナルで検出されることとしてもよい。蛍光標識は、その後、切断され、別の蛍光標識されたヌクレオチドが添加され、プロセスが繰り返されることとしてもよい。

実施形態は、コンピュータシステムにより実行される方法を含むこととしてもよい。方法は、ＤＮＡ断片の第１のセットをコンカテマー化することにより生成された第１のコンカテマーの第１の配列を受け取ることを含むこととしてもよい。また、方法は、第１の配列のサブシーケンスを整列させて、ＤＮＡ断片の第１のセットの各ＤＮＡ断片に対応する断片配列を同定することを含むこととしてもよい。

いくつかの実施形態は、細胞を含まないＤＮＡ断片を配列決定する方法を含むこととしてもよい。細胞を含まないＤＮＡ断片は、血漿ＤＮＡ断片を含むこととしてもよい。方法は、複数のＤＮＡ断片を含む生体試料を受け取ることを含むこととしてもよい。生体試料は、ＤＮＡ断片の第１の濃度を有することとしてもよい。方法は、また、ＤＮＡ断片の第２の濃度を有するように、対応する生体試料を濃縮することを含むこととしてもよい。ＤＮＡ断片の第２の濃度は、ＤＮＡ断片の第１の濃度より５倍以上高いこととしてもよい。方法は、さらに、複数のＤＮＡ断片が基体上のナノポアを通ることを含むこととしてもよい。複数のＤＮＡ断片のそれぞれについて、電気信号は、ＤＮＡ断片がナノポアを通るときに検出されることとしてもよい。電気信号は、ＤＮＡ断片の配列に対応することとしてもよい。

実施形態は、細胞を含まないＤＮＡ断片の配列決定の方法を含むこととしてもよい。方法は、ＤＮＡ断片の最初の濃度よりも５倍以上高いＤＮＡ断片の第２の濃度を有するように、対応する生体試料を濃縮することを含むこととしてもよい。方法は、さらに、単分子配列決定技術を含むこととしてもよい。ＤＮＡ断片は、蛍光標識されたヌクレオチドによりハイブリダイズされることとしてもよい。また、方法は、蛍光標識されたヌクレオチドからの信号を、ヌクレオチドに対応する信号で検出することを含むこととしてもよい。蛍光標識されたヌクレオチドは切断されることとしてもよく、プロセスは、追加のヌクレオチドを同定することと、ＤＮＡ断片の配列を繰り返すこととしてもよい。

また、実施形態は、複数のインストラクションを保存するコンピュータ読み取り可能媒体を含むコンピュータ製品を含み、本明細書に記載されるＤＮＡ配列決定のあらゆる方法の操作を実行することを含むこととしてもよい。いくつかの実施形態は、コンピュータ読み取り可能媒体に保存されるインストラクションを実行するために、１つ以上のプロセッサおよびコンピュータ製品を含む。追加の実施形態は、いずれかの方法を実行するためのシステムを含む。

他の実施形態は、本明細書に記載される方法に関連するシステム、ポータブル消費者装置、およびコンピュータ読み取り可能媒体を対象とする。

本発明の実施形態の性質および利点のより良い理解は、以下の詳細な説明および添付の図面を参照することによって得ることができる。

図１Ａは、本発明の実施形態に係るナノポアデバイスおよび核酸の簡略図を示す。図１Ｂは、本発明の実施形態によるＤＮＡ断片をコンカテマー化するプロセスを示す。図２は、本発明の実施形態によるＤＮＡ断片とスペーサーＤＮＡ断片とのコンカテマー化プロセスを示す。図３Ａは、ＤＮＡ断片をコンカテマー化し、本発明の実施形態による単分子配列決定を使用することによってＤＮＡ断片を配列決定する方法の簡略ブロックフロー図を示す。図３Ｂは、本発明の実施形態によるナノポア配列決定を使用してＤＮＡ断片を配列決定する方法の簡略ブロックフロー図を示す。図４は、本発明の実施形態によるコンカテマーの配列を分析する方法の簡略ブロックフロー図を示す。図５は、本発明の実施形態によるＤＮＡ断片の濃度を複数回増加させることによってＤＮＡ断片をより効率的に配列決定する方法の簡略ブロックフロー図を示す。図６は、本発明の実施形態によるナノポア配列決定装置によって配列決定された血漿ＤＮＡプールのサイズ分布を示す。０〜５００塩基対の範囲の配列決定された血漿ＤＮＡ断片の頻度分布をプロットする。図７は、本発明の実施形態による、ナノポア配列決定およびイルミナ配列決定プラットフォームによって得られたデータからの女性胎児を伴う母体血漿由来の血漿ＤＮＡのサイズプロファイルを示す。図８は、本発明の実施形態によるマッピング可能なヒトゲノムから予想される分布と比較した、染色体の読み取り分布を示す。ナノポア配列の比例分布は、試料プールごとに各染色体に読み取る。塗りつぶされた灰色のバーは、参照ヒトゲノムｈｇ１９のマッピング可能な部分に基づいて、それぞれのヒト染色体に由来するヌクレオチドの割合を表す。残りの色の棒グラフは、血漿ＤＮＡ試料のそれぞれのヒト染色体に整列した配列決定された読み取りの割合を表す。図９は、本発明の実施形態による、ナノポア配列決定および超並列配列決定を使用する癌患者からの血漿ＤＮＡ配列決定の結果のＣｉｒｃｏｓプロットを示す。図１０は、本発明の実施形態によるコンカテマー化ＤＮＡ分子のサイズ分布を示す。図１１は、本発明の実施形態による、非妊娠女性由来のコンカテマー化セグメントに由来する血漿ＤＮＡ分子のサイズ分布を示す。図１２は、本発明の実施形態による非妊娠女性由来の連結血漿ＤＮＡ由来の整列セグメントのゲノム表現を示す。図１３は、本発明の実施形態による男性胎児をみごもる妊娠女性由来のコンカテマー化セグメントに由来する血漿ＤＮＡ分子のサイズ分布を示す。図１４は、本発明の実施形態による、男性胎児をみごもる妊娠女性由来の濃縮された連結血漿ＤＮＡ由来の整列セグメントのゲノム表現を示す。図１５は、本発明の実施形態に従って実行するためのシステムのブロック図を示す。図１６は、本発明の実施形態によるシステムおよび方法と共に使用可能な例示的なコンピュータシステムのブロック図を示す。

用語
「組織」は、機能単位として一緒に群を成す細胞群に対応する。１つの組織内に２つ以上のタイプの細胞を見出すことができる。異なるタイプの組織は、異なるタイプの細胞（例えば、肝細胞、肺胞細胞または血液細胞）からなることができるが、異なる生物（母親または胎児）由来の組織または健常細胞対腫瘍細胞に対応してもよい。

「生体試料」とは、対象（例えば、妊婦、癌を有する者、または癌を有すると疑われる者などのヒト、臓器移植レシピエント、または臓器を伴う疾患プロセス（例えば、心筋梗塞の心臓、または脳卒中の脳、または貧血の造血系）を有すると疑われる対象から採取され、関心のある1つまたは複数の核酸分子を含む任意の試料を指す。生体試料は、血液、血漿、血清、尿、膣液、水晶体（例えば精巣）からの流体、膣洗浄液、胸水、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳頭からの排出液、身体の異なる部分（例えば、甲状腺、乳房）などからの吸引液などが挙げられる。便試料も使用することができる。様々な実施形態では、細胞を含まないＤＮＡ（例えば、遠心分離プロトコルによって得られた血漿試料）が濃縮された生体試料中の大部分のＤＮＡは細胞を含まない、例えば、５０％、６０％、７０％、８０％、９０％、９５％、または９９％のＤＮＡは細胞を含まないであり得る。遠心分離プロトコルは、例えば、３，０００ｇ×１０分を含み、流体部分を得、そして例えば３０，０００ｇでさらに１０分間遠心分離して残留細胞を除去することができる。試料中の細胞を含まないＤＮＡは、様々な組織の細胞に由来することができ、従って、試料は細胞を含まないＤＮＡの混合物を含むことができる。

「核酸」は、一本鎖または二本鎖のいずれかの形態のデオキシリボヌクレオチドまたはリボヌクレオチドおよびそのポリマーを意味し得る。この用語は、既知のヌクレオチド類似体または修飾された骨格残基または結合を含む核酸を包含し、それは、合成であり、天然に存在し、天然に存在せず、参照核酸と同様の結合特性を有し、それらは参照ヌクレオチドと同様の態様で代謝される。そのような類似体の例は、ホスホロチオエート、ホスホラミダイト、メチルホスホネート、キラルメチルホスホネート、２−Ｏ−メチルリボヌクレオチド、ペプチド−核酸（ＰＮＡ）を含むが、これらに限定されない。

特に明記しない限り、特定の核酸配列はまた、その保存的に改変された改変体（例えば、縮重コドン置換）および相補的配列、ならびに明示的に示される配列を暗黙に包含する。具体的には、縮重コドン置換は、１つ以上の選択された（またはすべての）コドンの第３位が混合塩基および／またはデオキシイノシン残基で置換された配列を生成することによって達成され得る。（Batzer et al., Nucleic Acid Res. 19: 5081 (1991) ； Ohtsuka et al., J. Biol. Chem. 260: 2605-2608 (1985) ； Rossolini et al., Mol. Cell. Probes 8: 91-98 (1994)）用語核酸は、遺伝子、cDNA、mRNA、オリゴヌクレオチドおよびポリヌクレオチドと互換的に使用される。

天然に存在するリボヌクレオチドまたはデオキシリボヌクレオチドモノマーに言及することに加えて、用語「ヌクレオチド」は、文脈上他に明白に示さない限り、そのヌクレオチドが使用される特定の状況（例えば、相補的塩基へのハイブリダイゼーション）に関して機能的に同等であるその関連する構造的変異体（誘導体および類似体を含む）を指すと理解され得る。

「コンカテマー」は、単分子に結合された別個のＤＮＡ断片からなる連続ＤＮＡ分子である。コンカテマーの別々のＤＮＡ断片の様々なものは、同じ配列を有していてもいなくてもよい。コンカテマー中のＤＮＡ断片の少なくともいくつかは、異なる配列を有し得る。コンカテマーを作製するために使用される別々のＤＮＡ断片は、例えば、ＤＮＡ断片が細胞を含まないＤＮＡ断片である場合、血漿および他の細胞を含まないＤＮＡ混合物中に存在し得るように、生体試料中に存在する様々な組織に由来し得る。

「配列読み取り」は、核酸分子の任意の部分または全部から配列決定されたヌクレオチドの列をいう。例えば、読み取られる配列は、生体試料中に存在する核酸断片全体であってもよい。配列読み取りは、単分子配列決定から得ることができる。「単分子配列決定」とは、鋳型ＤＮＡ分子のクローンコピーからの塩基配列情報を解釈する必要なしに配列読み取りを得るための単一鋳型ＤＮＡ分子の配列決定を指す。単分子配列決定は、分子全体またはＤＮＡ分子の一部のみを配列決定することができる。ＤＮＡ分子の大部分は配列決定され、例えば、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、または９９％以上である。

配列決定の場合、「信号」はある瞬間にとられた測定を指すことができる。このような信号の例には、光信号または電気信号が含まれる。光信号は、例えば、ハイブリダイゼーションが起こる場合に、特定の塩基に対応する特定の色に対応する画像を提供することができる。単一の画像は、配列決定装置のアレイ（例えば、ナノポアまたは他の配列決定容積）であってもよく、それにより、単一の画像が多くの光信号を有する。電気信号は、瞬時に電極を横切る測定値とすることができる。ある期間の電気信号は、ＤＮＡ分子の配列中に１つ以上の塩基を提供することができる。電気信号は、電流信号または電圧信号を含むことができる。

「ナノポア」は、ナノポア内にある分子の部分の１つまたは複数の特性に基づいてシグナルが検出され得る、分子または分子の一部が配置され得る開口部を指す。ナノポアは、ポリマー、金属または他の固体材料、タンパク質、またはそれらの組み合わせなどの様々な材料から構成することができる。

「分類」とは、試料の特定の特性に関連する任意の数または他の文字をいう。例えば、「＋」記号（または「陽性」という語）は、試料が欠失または増幅を有するものとして分類されていることを示すことができる。分類は、バイナリ（例えば、正または負）であってもよく、またはより多くの分類レベル（例えば、１〜１０または０〜１のスケール）を有してもよい。用語「カットオフ」および「閾値」は、操作において使用される所定の数を指す。例えば、カットオフサイズは、断片が除外されるサイズを指す。閾値は、特定の分類が適用される値を上回るか下回る値であってもよい。これらの用語のどちらも、これらのコンテキストのいずれでも使用できる。

本明細書で使用される「染色体異数性」という用語は、二倍体ゲノムの染色体量からの染色体量の変化を意味する。変動は獲得または喪失であることとしてもよい。これは、１つの染色体全体または染色体の領域を含むこととしてもよい。

本明細書で使用する「配列不均衡」または「収差」という用語は、参照量からの臨床的に関連する染色体領域の量における少なくとも1つのカットオフ値によって定義されるような有意な偏差を意味する。配列不均衡は、染色体投与不均衡、対立遺伝子不均衡、突然変異投与不均衡、コピー数不均衡、ハプロタイプ投与不均衡、および他の類似の不均衡を含み得る。例として、対立遺伝子の不均衡は、腫瘍が欠失された遺伝子の１つの対立遺伝子または遺伝子の１つの対立遺伝子をそのゲノム中の２つの対立遺伝子の増幅または異なる増幅を有する場合起こり得、これにより、試料中の特定の遺伝子座に不均衡を生じさせる。別の例として、患者は腫瘍サプレッサー遺伝子に遺伝的突然変異を有する可能性がある。次いで、患者は、腫瘍抑制遺伝子の非突然変異対立遺伝子が欠失した腫瘍を発症し得る。したがって、腫瘍内には突然変異の投薬量の不均衡がある。腫瘍がそのＤＮＡを患者の血漿に放出すると、腫瘍ＤＮＡは血漿中の患者の構成ＤＮＡ（正常細胞由来）と混合される。本明細書に記載の方法の使用により、血漿中のこのＤＮＡ混合物の突然変異投薬不均衡を検出することができる。収差は、染色体領域の欠失または増幅を含み得る。

用語「サイズプロファイル」は、一般的に、生体試料中のＤＮＡ断片のサイズに関する。サイズプロファイルは、様々なサイズのＤＮＡ断片の量の分布を提供するヒストグラムであり得る。１つのサイズプロファイルを別のサイズプロファイルと区別するために、様々な統計的パラメータ（サイズパラメータまたは単なるパラメータとも呼ばれる）を使用することができる。１つのパラメータは、特定のサイズまたは範囲のサイズのＤＮＡ断片の、すべてのＤＮＡ断片または他のサイズまたは範囲のＤＮＡ断片に対する割合である。

発明の詳細な説明
実施形態は、約２００塩基の比較的短い断片である生体試料（例えば、血漿または血清中）中の細胞を含まないＤＮＡ断片に適用される場合、単分子配列決定の効率を改善することができる。血漿ＤＮＡ断片などの細胞を含まないＤＮＡ断片は、小さくまたは短く、典型的には生体試料に低濃度で存在するため、細胞を含まないＤＮＡ断片を配列決定するためのナノポアの使用は、正確な結果をもたらすとは考えられない。小さな細孔を通過する小さな断片は、断片がナノポア内にある間に断片を配列決定するのを困難にする。さらに、小さな断片では、予想される配列決定誤差を考慮すると、参照ゲノムへの整列がより困難になるかもしれない。ナノポア配列決定は、約１０〜１５％の配列決定誤差を有し得る。いくつかの実施形態において、効率は、配列決定されるべきより長い分子を生成するためのＤＮＡ断片のコンカテマー化によって改善され得る。他の実施形態では、効率は、試料中のＤＮＡ断片の濃度を増加させることによって改善することができる。

これらの開発がなければ、血漿ＤＮＡ上の単分子配列決定は実用的ではないかもしれない。これらのアプローチでは、一連の血漿ＤＮＡ異常が単分子配列決定によって検出可能であった。実施形態は、出生前診断、癌評価、炎症性疾患管理、自己免疫疾患評価、および外傷などの急性医薬を含む、医学における多くの領域に適用することができる。さらに、メチル化シトシンは、単分子配列決定によって非メチル化シトシンと区別できることが報告されている（１２）。我々は以前に、血漿ＤＮＡのメチル化プロファイルを検出することにより、胎児ＤＮＡ画分を決定し、異常な胎盤メチル化プロフィールを有する妊娠関連疾患を検出し、癌および全身性エリテマトーデスに関連する異常メチル化を検出することができたことを報告した（７、９、１１）。従って、実施形態はまた、メチル化検出の用途にも使用することができる。

Ｉ．ＤＮＡ断片の単分子配列決定
血漿または血清ＤＮＡは、ヒト対象の循環系に見出され、細胞死のプロセスの間に自然な代謝回転または病理学的プロセスの一部として放出される細胞を含まない核酸分子である。ＤＮＡ分子は細胞分解プロセスの一部として循環中に放出されるので、短い断片（＜２００ｂｐ）の形で循環し、低濃度で存在する。健康な対象の血漿ＤＮＡの大部分は、血液細胞に由来することが知られている（６）。

妊娠中、胎盤は血漿ＤＮＡ分子を母体循環に与え、非侵襲的な出生前診断のために胎児ＤＮＡにアクセスする手段を提供する（７）。腫瘍や癌は細胞回転率が高く、ＤＮＡを血漿中に与え、染色体や遺伝子異常が非侵襲的に検出され、癌の診断、モニタリング、スクリーニング、予後診断のための液体生検として役立つ（８、９）。心筋梗塞、脳卒中、肝炎などの炎症状態もまた、炎症を起こした器官からの血漿ＤＮＡの付与を増加させる（１０）。全身性エリテマトーデスなどの自己免疫疾患も、血漿ＤＮＡ異常と関連している（１１）。上記の疾患において、血漿ＤＮＡプロファイルは、疾患、染色体または染色体のコピー数異常（コピー数の増加または減少、異数性）、異常なメチル化（過剰メチル化または低メチル化）およびサイズプロファイル異常（余分な量の短いＤＮＡ分子または余分な量の長いＤＮＡ分子）に関連する単一ヌクレオチド変異体を示し得る。要約すると、循環する細胞を含まないＤＮＡ分析は、広範囲の疾患に対する分子診断試験の開発にとって重要な手段となっている。

オックスフォードナノポアテクノロジーズによって製造されたフォーマットに限定されない単分子配列決定は、各ＤＮＡ塩基を同定することができる高速度のために、ＤＮＡ配列決定分析のための魅力的なプラットフォームである。増幅工程が省略されているため、ライブラリ構築のワークフローは単純化されている。これは、数百キロベースまでのＤＮＡの連続した伸長を配列することができる。しかしながら、そのような利点は、血漿ＤＮＡ分析に容易には適用できない。第一に、血漿ＤＮＡ分子は、ほとんどが＜２００ｂｐの長さの短い断片である。血漿および血清中のＤＮＡ濃度は、組織生検におけるＤＮＡ濃度よりも実質的に低い。したがって、血漿ＤＮＡ試料をナノポア配列決定装置に適用すると、配列決定効率は低かった。言い換えれば、試料中のＤＮＡが希薄であり、血漿ＤＮＡ分子があまりにも頻繁にナノポアに向かっていることが分かった。血漿ＤＮＡ分子がナノポアに到達し、その配列長が短いために配列決定されたとしても、配列決定情報はヒトゲノムに関して極めて少量の情報しか提供しなかった。一倍体ヒトゲノムは、サイズが３．３×１０^９塩基である。さらに、ナノポアを用いた配列決定エラー率は、短いＤＮＡ断片の配列決定を、長いＤＮＡ断片を配列決定する場合よりも正確さが低いと予測する。したがって、我々は、血漿ＤＮＡ分子がナノポアおよび他の単分子配列決定装置によって処理され得る頻度またはチャンスを増加させるアプローチを開発することを目的とした。

Ａ．ナノポア配列決定
ナノポア配列決定は、ＤＮＡ塩基がナノポアの使用によって検出される単分子配列決定装置の一形態である。オックスフォードナノポアテクノロジーズは、タンパク質細孔、α-溶血素を使用している。このような細孔のマトリックスは、膜上に位置するように作製される（５）。タンパク質細孔に加えて、ナノポアは、ナノポアが、窒化ケイ素およびグラフェンなどのケイ素化合物を含む半導体材料で製造される固体状態のナノポアであり得る。各ポアは、電気回路に接続されてもよい。

図１Ａは、本技術の実施形態によるナノポア１０２およびＤＮＡ分子１０４の簡略図を示す。電極１０６および電極１０８は、ナノポアの一部を画定してもよく、またはナノポアの近くに配置されてもよい。電極１０６および電極１０８は、円錐形または三角形状の端部を有するものとして示されている。いくつかの実施形態では、電極は異なる形状を有してもよい。例えば、電極は、平坦な端部、半球の端部、または丸みのある端部を有することができる。両方の電極は同じ形状でなくてもよい。例えば、一方の電極は円錐形の端部を有し、他方の電極は平坦であってもよい。電極間の距離は、ナノポアの直径または幅と等しいか、小さいか、または大きくすることができる。電極１０６および電極１０８は、電源１１０に接続することができる。電流１１２は、電極１０６から電極１０８にトンネルすることができる。電源１１０は、複数のナノポアおよびそれぞれの電極の対と電気的に連絡していてもよい。

ＤＮＡ分子１０４がナノポア１０２を通過するとき、電流の変化があり、これは、メータ１１４によって測定することができる。異なるＤＮＡ塩基、すなわちＡ、Ｃ、Ｇ、Ｔは、電流変化において異なる大きさを誘発するであろう。各ナノポアの電圧または電流パターンを観察することにより、ナノポア１０２を通過したＤＮＡ分子１０４の配列を決定することができた。配列決定はＤＮＡの単分子上のＤＮＡ塩基を検出するのに十分に感受性である、すなわちＤＮＡ配列決定ライブラリの増幅を必要としないので、配列検出の速度は実質的に向上する。

しかしながら、欠点は、ＤＮＡ塩基同定の精度が、イルミナ配列決定のような各ＤＮＡ分子の増幅クローンからのコンセンサス配列を検出する配列決定技術よりも相対的に劣ることである。しかしながら、２Ｄ読み取りが解釈される場合、ベース検出の精度は実質的に改善されることが示されている（３）。ナノポア配列決定のためのＤＮＡ試料を調製する場合、各二本鎖ＤＮＡ分子の一端にヘアピンアダプターを加える。そのようなＤＮＡ分子がナノポアに近づくと、二本鎖ははがれ、現在の一本鎖ＤＮＡ分子の一端は、現在の変化が検出されたときにナノポアを通過する。配列決定がこのシングルエンドの終わりに近づいているとき、ヘアピンによって連結された相補鎖はナノポアを通過し続け、配列決定される。ＤＮＡ分子の両方の鎖が配列決定される場合、コンセンサス配列が導かれ得、これは２Ｄ読み取りと呼ばれる。文献に報告されているように、２Ｄ読み取りは、１Ｄ読み取り（１本の鎖のみから解釈される配列）より高いベースコール精度を有する。

Ｂ．他の単分子配列決定
本実施形態はまた、ナノポアを使用する技術以外の単分子配列決定技術を含み得る。例えば、Helicos単分子配列決定装置（ＳｅｑＬＬ）を用いて、ＤＮＡ分子をガラス表面上にハイブリダイズさせることができる。次いで、蛍光標識されたヌクレオチドを各ＤＮＡ分子に添加し、画像を捕捉することができる。次いで、蛍光分子を切断して洗い流し、別の蛍光標識ヌクレオチドを添加して、このプロセスを繰り返すことができる。各ヌクレオチドは異なる蛍光標識を有することができ、ＤＮＡを配列決定することができる。

別の例は、Pacific Biosciences単分子リアルタイム（ＳＭＲＴ）配列決定法を含むことができる。この方法では、ＤＮＡポリメラーゼ酵素をゼロモード導波路（ＺＷＭ）の底に固定することができる。次いで、ポリメラーゼは、単分子のＤＮＡを捕捉することができる。次いで、蛍光標識されたヌクレオチドをＤＮＡ−酵素複合体に組み込むことができる。次いで、検出器が蛍光シグナルを検出し、ベースコールを行うことができる。次いで、蛍光タグを切断し、ＺＷＭから拡散させることができる。このプロセスは、各タイプのヌクレオチドが異なる蛍光標識を有し、ＤＮＡの配列決定を可能にするように繰り返してもよい。

ＩＩ．増殖効率
効率を高めるために、１つの選択肢は、配列決定チャンバまたはフローセルに適用される有限体積内の試料中の遺伝物質の量を増加させるために、血漿ＤＮＡプールを増幅することである。しかしながら、このようなプロトコルの採用は、元のＤＮＡ鋳型と複製されたＤＮＡ断片の全てを配列決定するため、単分子配列決定をもはや実行しないことを意味する。複製されたＤＮＡ断片のそのような使用は、元のＤＮＡ断片についての定量的情報、例えば染色体全体のような所与のゲノム領域における元のＤＮＡ断片のコピー数を得るときにエラーを引き起こす可能性がある。

以下のセクションでは、効率を高めるための２つのアプローチについて説明する。１つのアプローチでは、単分子配列決定を実施する前にＤＮＡ断片を連結してコンカテマーを形成することができる。別のアプローチでは、ＤＮＡ断片は、単分子配列決定の前に（例えば、ナノポア配列決定の前に）試料中に高度に濃縮される。

Ａ．コンカテマー
いくつかの実施形態では、図１Ｂに示すように、ＤＮＡ断片（例えば、血漿ＤＮＡ断片）をコンカテマー化してもよい。コンカテマー化は、一連のＤＮＡ断片を互いに結合させることができる。例えば、ＤＮＡ断片１５２およびＤＮＡ断片１５４は、試料中に存在し得る。ＤＮＡ断片を互いに付着させるための最初の手順として、ＤＮＡ断片１５２およびＤＮＡ断片１５４の末端を、末端にリン酸基を付加して調製して、ＤＮＡ断片１５６およびＤＮＡ断片１５８を得ることができる。次いで、ＤＮＡ断片を平滑末端ライゲーションでリガーゼ酵素によって一緒に連結して、長いＤＮＡ分子、例えばコンカテマー１６０を形成することができる。コンカテマー１６０は、ＤＮＡ断片１５２と１５４の組み合わせである新しい分子と考えることができる。コンカテマー１６０は、ＤＮＡ断片１５２および１５４に対応するサブシーケンスの組み合わせである配列を有する。

図２は、ＤＮＡ断片間にスペーサー断片（「スペーサー」とも呼ばれる）を有するコンカテマーを形成する同様のアプローチを示す。ＤＮＡ断片２０２およびＤＮＡ断片２０４は、「Ａ−テーリング」を受けることができ、ＡヌクレオチドをＤＮＡ断片の各鎖の一端に付加して、ＤＮＡ断片２０６およびＤＮＡ断片２０８を形成することができる。スペーサーＤＮＡ断片２１０は、スペーサーＤＮＡ断片の各鎖の一端にＴヌクレオチドを有する既知の配列を有することができる。スペーサーＤＮＡ断片の既知の配列は、スペーサー断片の末端に付加されたＡまたはＴヌクレオチドを含まない、４〜１０塩基対および１０〜２０塩基対を含む２０塩基対以下であってもよい。スペーサーＤＮＡ断片および血漿ＤＮＡ断片の末端には、他の相補的ヌクレオチドも同様に使用することができる。次いで、スペーサーＤＮＡ断片２１０は、リガーゼ酵素によってＤＮＡ断片２０６およびＤＮＡ断片２０８に連結され、コンカテマー２１２として示される長いＤＮＡ分子を形成し得る。スペーサーＤＮＡ断片は、スペーサーではない２つのＤＮＡ断片の間に置くことができる。例えば、１つのスペーサーＤＮＡ断片は、生体試料から抽出された２つのＤＮＡ断片の間にあってもよい。コンカテマー２１２は、１つ以上のスペーサーＤＮＡ断片２１０と共にＤＮＡ断片２０６および２０８に対応する配列の組み合わせである配列を有し得る。

いくつかの実施形態では、スペーサー断片の既知の配列が、対象に対応する参照ゲノム（例えば、ヒトゲノム）に現れない場合、または特定の回数未満（例えば、２または３未満）で現れる場合、スペーサー断片は、１つのＤＮＡ断片の末端および別のＤＮＡ断片の開始を示すことができる。コンピュータシステムは、サブシーケンスを、スペーサー断片に使用される１つまたは複数の既知の配列の予想されるセットと比較することによって、スペーサー断片の配列を同定することができる。いくつかの実施形態では、スペーサー断片は、１つの位置での単なるＡ−Ｔの組み合わせであり得る。そのような実施例では、ＡおよびＴの使用は、ＤＮＡ断片の開始および終了時の識別とは対照的に、主に付着のためであり得る。

スペーサーを有する方法は、生体試料のＤＮＡ断片に対応するサブシーケンスの開始塩基を同定することを含むことができる。開始塩基の同定は、スペーサーＤＮＡ断片の既知の配列の１つを同定することに基づくことができる。サブシーケンスの末端は、サブシーケンスの後のスペーサーＤＮＡ断片の既知の配列の１つを同定することに基づいて同定することができる。

これらのアプローチでは、長い分子（コンカテマー）がナノポアに達すると、コンカテマーが単一の長い分子内にいくつかの血漿ＤＮＡ断片を含むことができるので、多くの血漿ＤＮＡ断片が配列決定され得る。血漿ＤＮＡ分子は天然で二本鎖であり得るので、ヘアピンアダプターをコンカテマーの末端に適用して、２Ｄ読み取りが生成され得るようにする。すなわち、両方の鎖が読み取られる。配列決定の後、コンカテマーに組み込まれた元々の血漿ＤＮＡ分子の単位を同定することができる。いくつかのＤＮＡ断片から長い分子を作製し、長い分子をナノポア内で配列決定することは、同一のいくつかの分子が別々にナノポアに移動して配列決定されるのを待つよりも効率的である。

１．単分子配列決定における使用
図３Ａは、ＤＮＡ断片をコンカテマー化し、本発明の実施形態による単分子配列決定を使用することによってＤＮＡ断片を配列決定する方法３００の簡略ブロックフロー図を示す。

ブロック３０２において、方法３００は、複数のＤＮＡ断片を受け取ることを含むことができる。複数のＤＮＡ断片は、生体試料由来の細胞を含まないＤＮＡ断片であり得る。生体試料は、血漿または血清であり得る。ＤＮＡ断片は、例えば、血漿が血液の他の成分から分離されるとき、生体試料の他の成分から分離されてもよい。ＤＮＡ断片は、本明細書中に記載される任意のＤＮＡ断片であり得る。

ブロック３０４において、方法３００は、第１のコンカテマーを得るためにＤＮＡ断片の第１のセットをコンカテマー化することを含むことができる。コンカテマー化は、本明細書中に記載される任意の方法によるものであり得る。第１のコンカテマーは、第１のセット以外のＤＮＡ断片を含み得る。したがって、第１の組のＤＮＡ断片は、第１のコンカテマーを構成するＤＮＡ断片の全てではない可能性がある。第１のコンカテマー中の他のＤＮＡ断片は、スペーサーＤＮＡ断片を含み得る。

ブロック３０６は、方法３００が、第１のコンカテマーの第１の配列を得るために、第１のコンカテマーの単分子配列決定を行うことも含むことができることを示す。単分子配列決定は、ナノポア配列決定を含み得る。第１のコンカテマーは、単分子配列決定の一部として配列決定装置に提供されてもよい。配列決定装置は、ナノポアデバイス、光導波路、コンカテマーがフローセル上にハイブリダイズするように構成されたフローセル、または単一のＤＮＡ分子の配列検出が起こる任意の反応細胞または位置であってもよい。フローセルの例は、フローセルの表面に付着したオリゴヌクレオチドを有するフローセルを含むことができ、オリゴヌクレオチドは、第１のコンカテマーとハイブリダイズすることができる。方法３００は、配列決定装置を使用して、第１のコンカテマーに対応する複数の信号を検出するステップをさらに含むことができる。複数の信号は、第１のコンカテマーの第１の配列に対応することができる。信号は、蛍光標識または第１のコンカテマーに結合した光学的に検出可能な信号を有する他の標識からの信号を含み得る。蛍光標識からの信号は、光検出器、レーザー、電荷結合素子、ゼロモード導波路、光学的事象の有無を決定することができる他の光学的に敏感な素子、またはそれらの組み合わせによって検出することができる。

２．ナノポアにおける電気信号の検出
図３Ｂは、本発明の実施形態によるナノポア配列決定を使用してＤＮＡ断片を配列決定する方法３５０の簡略ブロックフロー図を示す。方法３５０において、配列決定装置はナノポアであり、これは基体上のナノポアのアレイに存在し得る。方法３５０の態様は、方法３００を実施するときに実行することができる。

ブロック３５２において、方法３５０は、複数のＤＮＡ断片を受け取ることを含むことができる。複数のＤＮＡ断片は、生体試料由来の細胞を含まないＤＮＡ断片であり得る。生体試料は、血漿または血清であり得る。ＤＮＡ断片は、例えば、血漿が血液の他の成分から分離されるとき、生体試料の他の成分から分離されてもよい。

ＤＮＡ断片は、コンカテマー化に使用される容器で受け取ることができる。容器は、バイアルまたはエッペンドルフ（Eppendorf）チューブなどのチューブであってもよい。ＤＮＡ断片は、容器内でリガーゼ酵素および緩衝液と混合することができる。

ブロック３５４は、方法３５０が第１のコンカテマーを得るためにＤＮＡ断片の第１のセットをコンカテマー化することも含むことを示す。コンカテマー化は、本明細書中に記載される任意の方法によるものであり得る。第１のコンカテマーは、第１のセット以外のＤＮＡ断片を含むことができる。したがって、第１の組のＤＮＡ断片は、第１のコンカテマーを構成するＤＮＡ断片の全てではない可能性がある。

複数のコンカテマー化プロセスを並行して実行することができ、各プロセスは別個のコンカテマーを形成する。様々なコンカテマーは、例えば異なるＤＮＡ断片が異なる長さであり得るため、様々な数のＤＮＡ断片がコンカテマーに組み込まれ得るため、異なる長さであり得る。例えば、１つのコンカテマーは３つのＤＮＡ断片で構成することができ、もう１つのコンカテマーは１００のＤＮＡ断片で構成することができる。

ブロック３５６において、方法３５０は、第１のナノポアを介して第１のコンカテマーを通過させることをさらに含むことができる。第１のナノポアは、基体上の複数のナノポアのうちの１つであってもよい。第１のコンカテマーが第１のナノポアを通る工程は、第１のコンカテマーの第１の鎖がナノポアに通る工程を含み得る。第１鎖がナノポアを通過した後、第１コンカテマーの第２鎖がナノポアを通過することができる。第１の鎖および第２の鎖は、ヘアピンアダプターによって連結されてもよい。このようにして、両方の鎖を配列決定することができ、これにより、ベースコールの精度を高めることができる。両方のストランドの電気信号は、ベースコールの一部として比較することができる。

ブロック３５８において、第１のコンカテマーが第１のナノポアを通過する際に、第１の電気信号を検出することができる。第１の電気信号は、第１のコンカテマーの第１の配列に対応することができる。第１の電気信号は、電流または電圧を含むことができる。第１のナノポアを通過する第１のコンカテマーが存在しない場合、イオン電流が電極間を通過することができる。コンカテマーなどの生体分子が電極間を通過するとき、生体分子は電極間のイオンまたは電子の通過に影響を及ぼす可能性がある。その結果、電流または電圧が低下する可能性があります。変化の大きさは、電極間の生体分子の部分に関連し得る。例えば、特定のヌクレオチドまたは官能基が電極間を通過するとき、電流または電圧は特定の電気信号シグニチャを有することができる。

いくつかの実施形態において、ナノポアは、２つの電極を含む電気回路の一部であり得る。２つの電極間の電流は、どのヌクレオチド（塩基）または対応するタグがナノポア内にあるかに基づいて変化し得る。第１の電気信号は、回路内の電圧または電流を測定するための任意の適切な技術を用いて検出することができる。

ブロック３６０において、方法３５０は、第１の配列を決定するために第１の電気信号を分析するステップを含むことができる。分析は、電気信号のパターンを、特定の塩基に対応する既知のパターンと比較することを含むことができる。ナノポアのベースコールには、全ての目的のために参照により本明細書に組み込まれる、Schreiber J. and Karplus K.,“Analysis of nanopore data using hidden Markov models,” Bioinformatics 2015 31: 1897-1903に記載されているように、隠れマルコフモデルを含む異なるモデルを使用することを含むことができる。分析するステップは、コンピュータシステムによって、第１の鎖および第２の鎖の第１の電気信号を分析して第１の配列を決定するステップを含むことができる。例えば、第１鎖および第２鎖について配列を決定することができ、２つの配列を互いに比較することができる。配列は相補的でなければならない。相補的でない位置は、例えば、無視または再分析され得る。

いくつかの実施形態では、第１の電気信号の分析を用いて、第１のコンカテマーの様々な部位、例えばＣｐＧ部位についてのメチル化分類を決定することができる。メチル化分類は、塩基がメチル化されているかどうか、異常メチル化（過剰メチル化または低メチル化）が存在するかどうか（例えば、ＣｐＧアイランドのような領域が異常なメチル化を有するかどうか）、およびコンカテマーがヒドロキシルメチル化されているかどうかを含むことができる。

ブロック３６２において、方法３５０は、第１の配列のサブシーケンスを整列させて、ＤＮＡ断片の第１のセットのそれぞれに対応する断片配列を同定することを含み得る。サブシーケンスは、例えばスライディングウィンドウ（sliding window）によって特定されるように、第１の配列の任意の１セットの連続する塩基であり得る。参照ゲノムへのアライメントのミスマッチを可能にする参照ゲノムに対してアライメントを行うことができる。サブシーケンスの整列については、以下でより詳細に説明する。

コンカテマー化は、第２のコンカテマーを得るためのＤＮＡ断片の第２のセットについて、および他のコンカテマーを得るためのＤＮＡ断片の他のセットについても行うことができる。コンカテマーの各々は、他のコンカテマーとは異なるＤＮＡ断片のコンビネーションまたはパーミュテーションを有することができる。各コンカテマーは、配列決定装置を含むことができる複数のナノポアの第１のナノポアまたは他のナノポアを通過することができる。他のコンカテマーがナノポアを通過する際に、他の電気信号を得ることができる。他の電気信号は、他のコンカテマーのそれぞれの配列に対応することができる。他のコンカテマーを含む詳細は、第１のコンカテマーを含む方法に類似し得る。

方法３５０はまた、第１のコンカテマーのＤＮＡ断片の第１のセットの各々のサイズを決定することを含むことができる。他のコンカテマーのＤＮＡ断片の他のセットのＤＮＡ断片のサイズも決定することができる。一例として、ＤＮＡ断片のサイズは、サブシーケンスを参照ゲノムまたは既知のスペーサー配列と整列させることによって決定することができる。例えば、スペーサー配列が同定され得る場合、ＤＮＡ断片の長さは、２つのスペーサー配列間の塩基数として同定され得る。スペーサー配列を使用するこのような実施形態では、スペーサー配列がそのような情報を提供することができるので、ＤＮＡ断片の同定された配列は、それらを同定するために参照ゲノムに整列される必要はない。さらに、ＤＮＡ断片の配列は、参照ゲノムへのアライメントの後またはその代わりに組み立てることができる。参照ゲノムに整列させる場合、ＤＮＡ断片のサイズを決定することは、参照ゲノムの１つの領域に整列させる最長サブシーケンスの長さを決定することを含むことができる。

３．サブシーケンスの整列
図４に示されるように、実施形態は、コンピュータシステムによって実行される方法４００を含むことができる。図４は、本発明の実施形態によるコンカテマーの配列を分析する方法の簡略ブロックフロー図を示す。

ブロック４０２において、方法４００は、ＤＮＡ断片の第１のセットをコンカテマー化することによって生成された第１のコンカテマーの第１の配列を受け取ることを含むことができる。いくつかの実施形態において、第１のコンカテマーは、ＤＮＡ断片の第１のセットおよびＤＮＡ断片の第２のセットをコンカテマー化することによって生成され得る。第１の配列は、コンピュータシステムが常駐し得る配列決定装置に常駐することができるベースコールルーチンから受信することができる。別の例として、コンピュータシステムは配列決定装置から分離することができ、第１の配列は、ネットワーク接続を介して、またはリムーバブルメモリ装置を介して受信することができる。コンカテマーは、例えば、本明細書に記載されるような任意のコンカテマーであり得る。

ブロック４０４において、方法４００はまた、第１の配列のサブシーケンスを整列させて、ＤＮＡ断片の第１のセットの各ＤＮＡ断片に対応する断片配列を同定することを含み得る。いくつかの実施形態では、サブシーケンスを整列させることは、サブシーケンスをＤＮＡ断片の第２のセットに整列させることを含み得る。ＤＮＡ断片の第２セットは、本明細書に記載のスペーサーＤＮＡであってもよい。スペーサーＤＮＡは、１５〜２０、１０〜１５および５〜１０ヌクレオチドを含む２０ヌクレオチド以下であってもよく、またはそれに等しい既知の配列であってもよい。

いくつかの実施形態では、方法４００は、第１の配列のサブシーケンスを参照ゲノムに整列させることを含み得る。参照ゲノムはヒトゲノムであってもよい。血漿ＤＮＡ分子の元の単位を同定するために、実施形態は長いＤＮＡ配列をウィンドウにわたってヒトゲノムに整列させることができる。例えば、コンカテマーの長い配列からスライディングウィンドウ（例えば、１００〜３００塩基）を選択することができ、ウィンドウ配列（サブシーケンス）を参照ゲノムに整列させることができる。参照ゲノムは、参照ヒトゲノムの誘導体であってもよく、例えば、ヒトゲノム配列のサブセット、反復マスクされたゲノム、エクソン、または中程度またはバランスのとれたＧＣ含量を有するゲノムの一部を含むが、これに限定されない。

ウィンドウは、ウィンドウの長さよりも少ない量だけ（例えば、２０〜５０塩基分）前進または後退させることができる（スライドさせる）。新しい位置にあるウィンドウは第２のウィンドウと見なすことができる。この第２のウィンドウのサブシーケンスは、参照ゲノムに整列させることもできる。第２のウィンドウのサブシーケンスが、参照ゲノムの前のサブシーケンスと重複する参照ゲノムのサブシーケンスに整列している場合、２つのサブシーケンスは同じＤＮＡ断片の一部であると考えることができる。２つのスライディングウィンドウを、参照ゲノムの異なる、非連続の、または重複しない領域に整列させる場合、２つのＤＮＡ断片の配列を区別することができる。

サブシーケンスがゲノムに整列しないが、前後のサブシーケンスが整列しない場合、２つのＤＮＡ断片間の交叉（エッジ）を同定することができる。整列した２つのＤＮＡ断片を分析して、交叉の特定の点（例えば、一方のＤＮＡ断片の開始塩基および他方のＤＮＡ断片の終了塩基）を決定することができる。この交叉は、ＤＮＡ断片のサブシーケンスの終結または開始であってもよい。このアプローチは、スペーサーがコンカテマーの構築に使用されない場合に特に有用であり得る。他の実施形態では、特定の配列（例えば、特定のバーコードまたはスペーサー）を元の分子の末端に付加することができ、これらの特定の配列は、１分子の終わりおよび別の分子の開始を示すことができる。

したがって、実施形態は、ヒトゲノム上の異なる領域に属するＤＮＡ塩基のストレッチまたはセグメント（一般に長さが数百塩基まで）を見出すことができる。ＤＮＡ塩基の各隣接ストレッチまたはセグメントは、１つの元の血漿ＤＮＡ分子を表すことができる。ヒトゲノムの異なる遠隔部分に整列された隣接する並置されたＤＮＡのセグメントまたはストレッチは、コンカテマーに組み立てられた他の血漿ＤＮＡ分子に属し得る。

ウィンドウのサイズおよびウィンドウが移動またはスライドされるステップのサイズは、ＤＮＡ断片のサイズに対する所望の解像度に基づいて調整することができる。より小さいステップサイズは、計算強度を増加させながら、ＤＮＡ断片の決定されたサイズの分解能を増加させることができる。ウィンドウサイズが大きいほど、ウィンドウサイズよりも小さいＤＮＡ断片は認識されない可能性があるが、ウィンドウサイズが小さければ、ゲノムとの一意の整列が得られないことがある。

ウィンドウサイズおよびステップサイズは、動的に調整されてもよい。例えば、大きなステップサイズを用いて潜在的なマッチの領域を絞り込むことができ、マッチをより正確に識別するためにステップサイズを小さくすることができる。サブシーケンスを整列させることは、参照ゲノムの染色体または染色体領域とすることができる。サブシーケンスを整列させることは、配列決定エラーを説明するための多数のまたは頻度のミスマッチを可能にすることを含むことができる。例えば、配列を整列させることにより、約１０〜１５％以下のミスマッチを可能にすることができる。

以下に述べるように、このアプローチは、血漿ＤＮＡ分子の配列決定、ヒト染色体の同定、各染色体のヌクレオチド含量の比例差の検出、およびコンカテマー化前の元の血漿ＤＮＡ試料のサイズプロファイルの決定に有効であった。コンカテマーは、ゲノム全体からのＤＮＡ断片を含むことができる。コンカテマーのＤＮＡ断片は、染色体の全てまたはほとんどの部分からランダムに分布していてもよい。

Ｂ．増加した濃度
別の実施形態は、フローセルの試料チャンバにロードされた血漿ＤＮＡライブラリの濃度を増加させることを含むことができる。血漿ＤＮＡの濃度を増加させることは、通常、ナノポア配列決定の効率を増加させるとは予想されない。ナノポアは、比較的高い配列決定誤差を有し、このような細胞を含まない試料中の低ＤＮＡ濃度と同様に、血漿および他の細胞を含まない試料から分析するための小さいＤＮＡ断片を考慮すると、ナノポアは断片を効果的に配列決定することは期待されない。ＤＮＡ断片の濃度の増加は、この問題に対処することは期待されない。しかしながら、抽出されたＤＮＡまたは入力配列決定ライブラリを濃縮することにより、ＤＮＡ分子がナノポアまたは他の単分子分析技術に到達する機会が増強される。抽出されたＤＮＡを濃縮することは、配列決定技術に適合する体積を得るために必要なレベルを超えて濃縮することを含む。場合によっては、抽出されたＤＮＡの濃度が１０倍以上増加することがある。換言すれば、体積は元の１０％未満に低減されてもよい。

図５は、本発明の実施形態によるＤＮＡ断片の濃度を複数倍に増加させることによってＤＮＡ断片をより効率的に配列決定する方法５００の簡略ブロックフロー図を示す。方法５００は、様々な単分子配列決定プラットフォームに使用することができる。提供される実施例において、ナノポア配列決定プラットフォームが記載される。

ブロック５０２において、方法５００は、複数のＤＮＡ断片を含む生体試料を受け取ることを含むことができる。生体試料は、出発体積中のＤＮＡ断片の第１の濃度を有し得る。生体試料は、例えば、本明細書に記載のように、様々なタイプのものであってもよい。例えば、生体試料は、血漿または血清であり得る。

ブロック５０４において、方法５００はまた、生体試料を濃縮して第２の濃度のＤＮＡ断片を有することを含むことができる。種々の例として、ＤＮＡ断片の第２の濃度は、ＤＮＡ断片の第１の濃度よりも、５回以上、６回以上、７回以上、８回以上、９回以上、１０回以上、５０回以上、１００回以上、５００倍以上、または１０００倍以上増加させることができる。濃度は、容量あたりまたは質量あたりで測定することができる。

濃縮は、当業者には理解されるように、様々な方法で達成され得る。例えば、生体試料の濃縮は、真空乾燥、浸透またはろ過による流体の除去、または当業者に公知の他の濃縮技術によることができる。ろ過または浸出は、遠心分離と組み合わせて、流体をサイズフィルターまたはモレキュラーシーブに通すことができる。流体の一方向の流れを可能にすることができる半透膜も、濃縮に使用することができる。濃縮後の生体試料の容量は、濃度の増加に反比例して減少してもよい。例えば、濃度を５倍に増加させると、容量は５倍に減少する可能性がある。

濃度は、従来のプロセスよりも大幅に増加する可能性がある。いくつかの従来のプロセスでは、少量の血漿ＤＮＡが血漿の体積から抽出される。分析用具における反応容積または他の要件を満たすように体積を減少させるために、体積をさらに濃縮してもよい。例えば、従来のプロセスでは、２１０μＬの血漿ＤＮＡを４ｍＬの血漿から抽出することができる。１００μＬの総反応容量を提供するために、２１０μＬの血漿ＤＮＡを８５μＬに濃縮することができる。従来のプロセスでは、濃度の増加は３倍未満であり、血漿ＤＮＡは配列決定精度または正確さを改善するために濃縮されていない。本方法において、濃度の増加は、ナノポアまたは他の配列決定装置を通るＤＮＡ断片のより頻繁な通過をもたらし、したがって、検出および分析の改善をもたらす。

ブロック５０６において、方法５００は、基体上のナノポアを介して複数のＤＮＡ断片を通過させるステップをさらに含むことができる。いくつかの実施形態では、方法は、ナノポア以外の単分子配列決定技術を含み得る。例えば、配列決定技術は、Pacific BiosciencesによるＳＭＲＴ技術またはSeqLLによるHelicos配列決定を含み得る。単分子配列決定技術は、全ての目的のために参照により本明細書に組み込まれる、Eid J. et al, “Real-time DNA sequencing from single polymerase molecules,” Science 2009 323: 133-138に記載された技術を含み得る。

ブロック５０８において、複数のＤＮＡ断片のそれぞれについて、ＤＮＡ断片がナノポアを通過するときに電気信号を検出することができる。電気信号は、ＤＮＡ断片の配列またはサブシーケンスに対応し得る。電気信号は、本明細書に記載された電流または電圧または任意の電気信号を含むことができる。他の配列決定技術が使用される場合、電気信号の代わりに蛍光シグナルが使用され得る。

ブロック５１０において、方法５００は、電気信号を分析してＤＮＡ断片の配列またはサブシーケンスを決定することを含むことができる。方法５００は、例えば、整列情報を用いることによって、ＤＮＡ断片のサイズおよび複数のＤＮＡ断片のサイズを決定することを含むことができる。結果として、ＤＮＡ断片のサイズ分布もまた決定され得る。ＤＮＡ断片のサイズ分布に基づいて、染色体の相違を決定することもでき、例えば、2010年11月5日に出願された米国特許出願第12/940,992号のタイトル“Size-based genomics, ”；2011年11月30日に出願された米国特許出願第13/308,473号のタイトル“Detection of genetic or molecular aberrations associated with cancer, ”；および2013年3月7日に出願された米国特許出願第13/789,553号のタイトル“Size-based analysis of fetal DNA fraction in maternal plasma, ”に記載される。

いくつかの実施形態では、電気信号は、第1のコンカテマーのメチル化分類に対応し得る。メチル化の分類には、塩基がメチル化されているか否か、異常メチル化（過剰メチル化または低メチル化）が存在するかどうか、およびコンカテマーがヒドロキシルメチル化されているかどうかが含まれ得る。

方法は、ＤＮＡ断片の配列またはサブシーケンスを参照ゲノムと整列させることを含み得る。特に、この整列は、参照ゲノムの特定の染色体または染色体領域とすることができる。

同じＤＮＡ断片は、同じナノポアを複数回通過し得る。各パスで、電気信号を検出することができる。配列を同定するのを助けるために、異なるパスからの電気信号を比較することができる。ＤＮＡ断片の濃度を増加させることは、ナノポア以外の単分子配列決定技術と共に使用することができる。

ＩＩＩ．高めた濃度を用いる実施例
実施例は、血漿ＤＮＡを濃縮してナノポア配列決定の効率を高めながら、正確な結果を提供できることを示している。高めた濃度を用いた配列決定について、Cheng S. H. et al., “Noninvasive prenatal testing by nanopore sequencing of maternal plasma DNA: feasibility assessment, ” Clin. Chem. 61: 10 (2015)にさらに記載されている。

Ａ．材料と方法
血漿試料は、インフォームドコンセントおよび施設承認を得て募集された４グループの集団、すなわち、男性胎児をみごもる３回目の妊娠の妊婦、女性胎児をみごもる３回目の妊娠の妊婦、成人男性および非妊娠女性から得た。ＥＤＴＡ血漿試料を各グループ内にプールして、群当たり少なくとも２０ｍＬの血漿を提供した。プールした血漿試料を、QIAamp DSP DNA血液ミニキット（Qiagen、Germany）を用いて抽出した（２）。プールあたり１，０５０μＬの溶出血漿ＤＮＡをSpeedvac濃縮装置（Thermo Fisher Scientific、Waltham、MA）により８５μＬまで濃縮した。各濃縮血漿ＤＮＡプールは、エンドリペアおよびＡテーリングモジュール（New England Biolabs、Ipswich、MA）およびゲノムＤＮＡ配列決定キット（SQK-MAP-005、Oxford Nanopore Technologies、UK)を用いるＤＮＡライブラリの調製のために完全に消費された。各ライブラリ（150μL）をMinION Flow Cell（v7.3）（Nanopore）に完全にロードし、配列決定した。出力データファイルは、METRICHORTM（商標）ソフトウェア（Nanopore）を用いてベースコールされた。LAST Genome-Scale Sequence Comparisonソフトウェア（Computational Biology Research Consortium、Japan）を用いて、２Ｄ読み取りを抽出し、参照ゲノムｈｇ１９に整列させた。

各ライブラリが消費されるまで配列決定を行い、６〜２４時間かかった。読み取りの２６．９％〜３２．５％がベースキャスターを通過した。男性胎児をみごもる妊婦、女性胎児をみごもる妊婦、成人男性および非妊娠女性からの血漿プールについては、２Ｄ読み取り数はそれぞれ５６，８４４、５０，２６８、３５，８７８および３６，１６７であった。観察された同一性の平均は、参照配列（３）における一致する塩基に整列すさせた読み取りにおける塩基の割合であり、８２．７％（８１．４〜８４．５％）であった。２Ｄ読み取りの中で、ユニークなゲノム位置に１６．９％（１５．６〜２３．９％）を整列させ、さらに分析した。

ヒトゲノムに整列した配列決定された血漿ＤＮＡ断片は、長さ７６〜５，７７６ｂｐの範囲にあり、１６２ｂｐ（１５５〜１６８ｂｐ）でピークに達した（図６）。図６の各グラフは、ｘ軸上の塩基対における配列決定された血漿ＤＮＡ断片のサイズ、および、配列決定された全血漿ＤＮＡ断片の百分率としての血漿ＤＮＡ断片サイズの頻度を示す。グラフは、男性胎児をみごもる母体血漿、女性胎児をみごもる母体血漿、成人男性血漿および非妊娠女性血漿から配列決定されたＤＮＡの結果である。４つの血漿由来のピーク血漿ＤＮＡサイズは、イルミナの配列決定プラットフォーム（４）に基づく以前の知見と一致する。長い血漿ＤＮＡ断片（＞１，０００ｂｐ）の微量（０．０６〜０．３％）がナノポア配列決定データから観察されたが、他の配列決定プラットフォーム（４）の以前のデータ解析からは観察されなかった。

図７は、ナノポア配列決定によって得られ、イルミナ配列決定プラットフォームによって得られたデータからの女性の胎児をみごもる母体血漿由来の血漿ＤＮＡのサイズプロファイルを示す。ナノポア配列決定データは、図６の女性胎児をみごもる母体血漿と同じデータである。図７のサイズプロファイルは、ほぼ同じサイズのピークを有する同様の形状を有する。例えば、１５０ｂｐ以下の断片と１６１ｂｐ〜１７０ｂｐの断片のナノポア配列決定のサイズ比は、イルミナ配列決定の１．１０と比較して１．２１である。これらの結果は、血漿ＤＮＡのサイズプロファイルが、ナノポアおよび濃縮血漿ＤＮＡを用いて正確に決定され得ることを示した。２５０〜４００ｂｐの範囲のピークは、イルミナ配列決定よりもナノポア配列決定によって得られたデータにおいてより顕著である。このピークは、ジヌクレオソーム由来の細胞を含まないＤＮＡに対応し、ピークの存在は個体間で変化する。さらに、イルミナ配列決定は、このサイズ範囲の配列断片ではあまり効率的ではない。

Ｂ．読み取りの分析
図８は、ｈｇ１９で標識された、マッピング可能なヒトゲノムから予想される分布と比較した、染色体の読み取り分布を示す。染色体はｘ軸上に列挙されている。ｙ軸上で、各染色体への読み取りの比例分布（ゲノム表現）は、その試料から配列決定され、頻度としておよびパーセンテージとして表された一意的に整列された読み取りの総数に対する各染色体に整列した読み取りの数をカウントすることにより、各試料について計算した。ｈｇ１９でプロットされているのは、男性胎児をみごもる母胎血漿、女性胎児をみごもる母体血漿、男性血漿および非妊娠女性血漿の結果である。全ての４つの血漿ＤＮＡプールについての常染色体への読み取り分布は、マッピング可能なヒトゲノムについて予測されたものと同等であった。

染色体Ｘおよび染色体Ｙの差異が読み取り分布で観察される。Ｘ染色体にマッピングされた読み取りの割合は、女性血漿（５．２２％）と比較して男性血漿（２．７０％）の方が低かった。成人男性（０．３０％）血漿ＤＮＡプールでは染色体Ｙ配列が検出されたが、妊娠していない女性血漿ＤＮＡプールでは検出されなかった。

男性胎児をみごもる女性の血漿ＤＮＡプールは、染色体Ｙに整列された読み取りが０．１１％であった。以前のデータ（２）と一致して、女性胎児をみごもる女性由来の血漿ＤＮＡプール中の染色体Ｙ配列に合わせて０．０１８％の読み取りが整列された。女性胎児をみごもる女性において、染色体Ｙに整列した読み取りの存在は、男性のゲノムに整列させることによる既知の誤りの結果であり得る。男性胎児をみごもる母体血漿ＤＮＡプールは、女性胎児をみごもる女性よりも約１％少ない染色体Ｘ配列を有していた。

染色体Ｘおよび染色体Ｙに対する読み取りの相対的分布は、予想される結果と同様であることが観察される。男性血漿は、妊娠した女性と妊娠していない女性の両方からの血漿よりも染色体Ｙが多く見られた。男性血漿は、妊娠した女性および妊娠していない女性の血漿より染色体Ｘが少なかった。男性血漿には、妊娠していない女性のＸ染色体の量の約半分が含まれており、このことは、男性は染色体Ｘを１つとし、女性は２つの染色体Ｘを有することが予測される。男性胎児をみごもる母体血漿は、女性胎児をみごもる母体血漿および女性血漿よりも染色体Ｙの読み取り分布が高かった。

したがって、胎児ＤＮＡ配列決定および男性と女性の胎児間の染色体Ｘの量の差異は、ナノポア配列決定および血漿ＤＮＡの濃縮によって検出可能である。男性の胎児の染色体Ｘの量は、モノソミーＸまたはターナー症候群の女性の胎児の染色体Ｘの量と同等である。従って、この観察は、モノソミーＸなどの胎児染色体異数性の非侵襲的検出、またはコピー数異常のためのナノポア配列決定の潜在的実現可能性を示唆する。モノソミーＸはゲノム中の１つの染色体コピーの減少を表すので、コピー数の変化の程度は、ゲノム中に１つの染色体コピーが付加されているトリソミーと同等である。したがって、これらのデータはまた、本発明者らのプロトコルが、非侵襲的に、胎児トリソミー２１、トリソミー１８、トリソミー１３および他の胎児染色体異数性の検出に適用され得ることを反映する。これらのデータは、ナノポア配列決定に基づくＮＩＰＴおよびポイントオブケアＮＩＰＴの実現可能性を示唆している。

ＩＶ．高めた濃度を用いる癌配列
循環する細胞を含まないＤＮＡは、癌のリアルタイムモニタリングのための「液体生検」として使用することができる。細胞を含まないＤＮＡは、基礎となる腫瘍において見出される遺伝的異常を示し、これは超並列配列決定技術によって検出することができる。癌患者の血漿ＤＮＡにおけるこれらの染色体異常はまた、ナノポア配列決定を用いて検出することができる。肝細胞癌（ＨＣＣ）を有する２人の患者由来の血漿ＤＮＡ試料を、ナノポア配列決定およびイルミナのプラットフォーム上の超並列配列決定の両方によって分析した。

Ａ．材料と方法
手術前にＨＣＣと診断された２人の患者から末梢血をそれぞれ２０ミリリットル採取した。血漿を、１６００×ｇで１０分間遠心分離し、次いで１６０００×ｇで１０分間遠心分離することにより単離した。QIAamp DSP DNA血液ミニキット（Qiagen）を用いて８ｍＬの血漿からＤＮＡを抽出した。血漿ＤＮＡの４分の３をナノポア配列決定に供し、残りのＤＮＡはNextSeq 500（Illumina）によって配列決定した。

ナノポア配列決定ライブラリは、エンドリペア／ｄＡテーリングモジュール（ＮＥＢ）およびナノポア配列決定キット（SQK-NSK007、Oxford Nanopore Technologies）によって調製した。ライブラリをMinion Flow Cell（R9バージョン）に完全にロードし、Minion Mk1B配列決定装置（Nanopore）で配列決定した。出力データファイルは、METRICHORTMソフトウェア（Nanopore）を用いてベースコールされた。２Ｄ読み取りを抽出し、ＬＡＳＴソフトウェアを用いて参照ゲノムｈｇ１９に整列した。血漿ＤＮＡのイルミナ配列決定は、これまでに記載されているように行った（８）。

Ｂ．結果
各染色体アーム（ゲノム表現、ＧＲ）に対する整列した読み取りの比例分布を各試料について計算した。換言すれば、染色体アーム、ｐまたはｑアームに整列した高品質通過フィルターの読み取りの数は、試料から配列決定された高品質通過フィルター読み取りの割合として表された。次いで、正常個体の血漿ＤＮＡ試料に対するＧＲの差を計算した。染色体アームのＧＲが対照群の平均より３標準偏差上である場合、その領域はコピー数増加を示すと考えられる。染色体アームのＧＲが対照群の平均よりも３標準偏差低い場合、その領域はコピー数の減少を示すと考えられる。

図９は、ナノポア配列決定（外リング）およびイルミナのプラットフォーム（内リング）によるＨＣＣの２つのケース（ＨＯＴ５３０およびＨＯＴ５３６）におけるＧＲの差異を示す。相違する染色体は外部に表示される。分析された領域は染色体のアームであった。染色体ゲインは緑色の棒グラフで表され、それぞれのリングの中心から外向きに伸びている。染色体の損失は、赤色のバーとして表され、それぞれのリングの中心から内側に向かって伸びる。図９に示されるように、ナノポア配列決定の結果は、Ｉｌｌｕｍｉｎａのプラットフォームによって生成された結果とほぼ一致した。配列決定された試料はまた、非癌対象由来の血漿ＤＮＡと比較してより長いＤＮＡを有する傾向を示した。この実施例は、増加した濃度法によるナノポア配列決定が、癌患者からの血漿ＤＮＡの分析に使用され得ることを示す。

Ｖ．コンカテマーを用いる実施例
血漿ＤＮＡ分子は典型的には短く（＜２００ｂｐ）、典型的には、長いＤＮＡ分子を配列決定するためにナノポア配列決定が使用され得る。短い血漿ＤＮＡ分子の配列決定の効率は、コンカテマーと呼ばれる長い分子を構築するために個々の分子を連結または結合することによって改善することができる。

Ａ．材料と方法
１．血漿ＤＮＡコンカテマーの生成
２人の異なる対象からの試料を試験した。妊娠していない女性被験者および男性胎児をみごもる女性被験者の両方から、末梢静脈血２０ミリリットルを採取した。１６００×ｇで１０分間の遠心分離後に血漿を回収し、さらに１６０００×ｇで１０分間遠心分離した。次いで、QIAamp DSP DNA血液ミニキット（Qiagen）を用いて８ｍＬの血漿からＤＮＡを抽出し、４２０μＬの血漿ＤＮＡ量を得た。抽出したＤＮＡをSpeedVac濃縮装置（Thermo Scientific）で８５μＬに濃縮し、ＮＥＢＮｅｘｔエンドリペアモジュール（New England Biolabs、NEB）で末端修復した。末端修復されたＤＮＡを、MinElute Reaction Cleanup Kit（Qiagen）を用いて精製し、２０μＬの緩衝液ＥＢで溶出した。次に、２０μＬの血漿ＤＮＡをBlunt/TA Ligase Master Mix（NEB）を加えて25℃で4時間インキュベートすることにより連結し、インキュベーション後にMinElute Reaction Cleanupキットで精製した。

２. ナノポア配列決定
次いで濃縮ＤＮＡを、エンドリペアおよびＡテーリングモジュール（ＮＥＢ）およびゲノムＤＮＡ配列決定キット（SQK-MAP-005、Oxford Nanopore Technologies）によるナノポア配列決定ライブラリ調製に使用した。ライブラリをMinion Flow Cell（v7.3）（Nanopore）に完全にロードし、配列決定した。出力データファイルは、METRICHORTM（商標）ソフトウェア（Nanopore）を用いてベースコールされた。２Ｄ読み取りが抽出された。

３．整列
整列は、LASTソフトウェアを用いて行った。それぞれの可能な開始位置についての最初の一致をみつけた。マッチは、参照ゲノム中の最大回数で起こる最小長のマッチに限定されたか、マッチは特定の所定の長さに制限された。これらの最初のマッチから、これらの最初のマッチよりも長い配列の付加的な整列が実施され、あるギャップスコアを有するものが、配列決定エラーの所望の許容差に基づいて保持された。複数の整列が同じエンドポイントを共有していた場合、最も高いスコアの整列が保持された。このようにして、ヒトゲノムに整列した断片が同定された。LASTで使用されるパラメータとルールは、精度と正確さの考慮事項によって変更される可能性がある。

Ｂ．結果
連結した血漿ＤＮＡを、ライブラリが消費されるまで６時間MinIONで配列決定した。

１．非妊娠女性
ベースコールは、２，２３４の２Ｄ読み取りをもたらし、読み取りの長さは８６から８，６７２ｂｐの範囲であった。図１０は、非妊娠女性から配列決定されたコンカテマーのサイズの頻度分布曲線を示す。塩基対におけるコンカテマーのサイズは、ｘ軸上にある。指定されたコンカテマーサイズが配列決定された試料中に存在する頻度（パーセンテージとして表される）は、ｙ軸上にプロットされる。グラフの可読性を向上させるために、８，６７２ｂｐの外れ値データポイントの外れ値データポイントは示されていない。配列決定された各試料について、約２０〜５０個の長いＤＮＡ分子が検出された。

配列決定された分子のサイズは、一般に２００ｂｐ未満である典型的な血漿ＤＮＡ断片の長さよりもはるかに長い。これらのデータは、血漿ＤＮＡ断片がコンカテマーとしてうまく組み立てられたことを示している。次に、その読み取りをヒトゲノム（ｈｇ１９）に整列させた。ヒトゲノム上の分離した領域に属する塩基またはセグメントのストレッチを分離し、１つの血漿ＤＮＡ断片とみなした。全体として、配列決定された血漿ＤＮＡ断片である３，８０１個の一意にマップされたセグメントが得られ、一意的にマップされたセグメントの８０．６％が参照ゲノムと同一の配列を示した。

図１１は、非妊娠女性の整列セグメントのサイズ分布を示す。これらの整列したセグメントのサイズは、７８ｂｐから５６０ｂｐまで変動し、ほとんどが２００ｂｐ未満であった。ピークサイズは１６２ｂｐであった。平均サイズは１７３ｂｐであった。メジアンサイズは１６２ｂｐであり、イルミナのプラットフォーム上での超並列配列決定による、および高めた濃度のＤＮＡ断片を用いたナノポア配列決定による、血漿ＤＮＡのサイズに関する以前の観察と一致する。

図１２は、男性由来の参照ゲノムと比較した整列したセグメントの計算された分布を示す。整列セグメントの各染色体への比例分布（ゲノム表現）を計算した。計算された分布は、すべての常染色体の中でｈｇ１９の分布に類似していた。性染色体では、染色体Ｘのゲノム表現は５．７９％であり、これは女性試料について予想される。染色体Ｙに対するミスアラインメントは見出されなかった。従って、ナノポアを有するコンカテマーを用いる方法は、男性血漿と女性血漿とを区別することができる。

２．男性胎児をみごもる女性妊婦
妊娠した女性の男性胎児は、血液試料を採取したときに、３８週の妊娠期間と４日間の妊娠期間を有していた。妊娠は正常とみなされた。血漿ＤＮＡ断片をナノポア配列決定のための処理の前にコンカテマー化した。コンカテマーのサイズは１００〜１３，４６６ｂｐであり、メジアンサイズは６７６ｂｐであり、平均サイズは９６５ｂｐであった。

図１３は、男性胎児を妊娠した女性のためのコンカテマーの整列したセグメントのサイズプロファイルを示す。サイズプロファイルは、典型的な血漿ＤＮＡである。断片のメジアンサイズは１９６ｂｐであった。ピークサイズは１７４ｂｐであり、サイズは９２〜２，９３４ｂｐであった。断片の約０．４％のみが２０００ｂｐより大きいサイズを有していた。この分布は、コンカテマーを用いる方法、高めた濃度、または超並列配列決定によって得られる他のサイズ分布に類似している。例えば、分布は、図６に示すように、男性胎児を有する母体血漿の高めた濃度の方法を用いて見出されたサイズ分布と同様である。

図１４は、男性および妊娠していない女性の参照ゲノムと比較した、男性胎児をみごもる女性妊婦についての整列したセグメントの計算された染色体分布を示す。コンカテマーの分布は、男性および非妊娠女性レベルの間の染色体Ｘレベルを示す。これは、染色体Ｘデータが、正常な男性胎児の染色体Ｘのモノソミーを反映していることを示唆している。さらに、コンカテマーは、胎児由来の染色体Ｙの証拠を示す。参照ゲノムからの配列決定によって得られた読み取り分布のいくつかの偏差は、参照ゲノムの整列可能な部分のみに分析を限定した結果であり得る。それにもかかわらず、これらの結果によって示されるように、コンカテマーを用いる方法は、男性胎児をみごもる母親血漿と男性または非妊娠女性と区別することができる。これらの方法は、男性胎児をみごもる母体血漿を、女性胎児をみごもる母体血漿と区別するために使用される可能性が高い。

ＶＩ．さらなる実施形態
実施形態１は、複数のＤＮＡ断片を受け取ることと、複数のＤＮＡ断片の第１のセットをコンカテマー化して第１のコンカテマーを得ることと、前記第１のコンカテマーが前記第１のナノポアを通ることと、前記第１のコンカテマーが前記第１のナノポアを通るときに第１の電気信号を検出することと、前記電気信号は前記第１のコンカテマーの前記第１の配列に対応することとを含む方法を含む。

実施形態２は、実施形態１の方法を含み、さらに、前記第１の配列を決定するために前記第１の電気信号を分析することと、参照ゲノムに対して前記第１の配列のサブシーケンスを整列させて、前記ＤＮＡ断片の前記第１のセットそれぞれに対応する断片配列を同定することを、コンピュータシステムにより実行すること含む。

実施形態３は、実施形態１の方法を含み、前記第１のコンカテマーが前記第１のナノポアを通ることは、前記第１のコンカテマーの第１の鎖が前記ナノポアを通り、その後、前記第１のコンカテマーの第２の鎖が前記ナノポアを通ることを含む。

実施形態４は、実施形態３の方法を含み、さらに、前記第１の鎖および前記第２の鎖についての前記第１の電気信号をコンピュータシステムにより分析して、前記第１の配列を決定することを含む。

実施形態５は、実施形態１の方法を含み、複数のＤＮＡ断片は、生体試料由来の細胞を含まないＤＮＡ断片である。

実施形態６は、実施形態２の方法を含み、前記生体試料は血漿または血清である。

実施形態７は、実施形態１の方法を含み、前記第１のナノポアは基体上の複数のナノポアの１つである。

実施形態８は、実施形態７の方法を含み、前記ＤＮＡ断片の第２のセットをコンカテマー化して第２のコンカテマーを得ることと、前記第２のコンカテマーが複数のナノポアの第２のナノポアを通り、前記第２のコンカテマーが前記第２のナノポアを通るときに電気信号を検出し、前記電気信号は前記第２のコンカテマーの第２の配列に対応することをさらに含む。

実施形態９は、実施形態７の方法を含み、前記ＤＮＡ断片の第２のセットをコンカテマー化して第２のコンカテマーを得ることと、前記第２のコンカテマーが前記第１のナノポアを通り、前記第２のコンカテマーが前記第１のナノポアを通るときに電気信号を検出し、前記電気信号は前記第２のコンカテマーの第２の配列に対応することをさらに含む。

実施形態１０は、複数のＤＮＡ断片を含む生体試料を受け取ることと、前記生体試料を濃縮してより高い濃度のＤＮＡ断片を得ることと、基体上で複数のＤＮＡ断片がナノポアを通ることと、複数のＤＮＡ断片のそれぞれについて、前記ＤＮＡ断片がナノポアを通るときに電気信号を検出することと、前記電気信号が前記ＤＮＡ断片の前記配列に対応することを含む方法を含む。

実施形態１１は、ＤＮＡ断片の第１のセットをコンカテマー化することにより生成される第１のコンカテマーの第１の配列を受け取ることと、参照ゲノムに前記第１の配列のサブシーケンスを整列させて、前記ＤＮＡ断片の前記第１のセットそれぞれに対応する断片配列を同定することを、コンピュータシステムにより実行することを含む方法を含む。実施形態１２は、実施形態１１の方法を含み、前記サブシーケンスの前記整列は、前記参照ゲノムに前記第１の配列のウィンドウを整列させることと、前記参照ゲノムの異なる領域に２つのウィンドウを整列させるときに同定することとを含む。実施形態１３は、実施形態１２の方法を含み、前記２つのウィンドウ間の１つ以上のウィンドウが前記参照ゲノムに整列されないときに同定される。

実施形態１４は、コンピュータシステムを制御するための複数のインストラクションを保存するコンピュータ読み取り可能媒体を含むコンピュータ製品を含み、実施形態１１〜１３のいずれか１つの操作を実行することを含む。実施形態１５は、実施形態１４のコンピュータ製品と、前記コンピュータ読み取り可能媒体に保存されるインストラクションを実行するための１つ以上のプロセッサとを含むシステムを含む。実施形態１６は、実施形態１１〜１３のいずれか１つを実行するための手段を含むシステムを含む。実施形態１７は、実施形態１１〜１３のいずれか１つを実行するように構成されるシステムを含む。実施形態１８は、実施形態１１〜１３のいずれか実施形態１１〜１３のいずれか１つのステップをそれぞれ実行するためモジュールを含むシステムを含む。

ＶＩＩ．実施例の配列決定システム
図１５は、本発明の実施形態による単分子配列決定を実施するためのシステム１５００のブロック図を示す。生体試料は、抽出装置１５０４によって患者１５０２から得ることができる。生体試料は、本明細書に記載される任意の体液または任意の生体試料であり得る。抽出装置１５０４は、尿などの試料を採取するためのシリンジ、ランセット、スワブ、または容器またはバイアルを含み得る。抽出装置１５０４は、QIAamp DSP DNA血液ミニキット（Qiagen、Germany）を含むことができる（２）。生体試料は、細胞を含まないＤＮＡ断片を含んでいてもよく、これは調製装置１５０６に送られる。調製装置１５０６は、単分子配列決定により効率的な細胞を含まないＤＮＡ断片の形態を生成する装置を含むことができる。例えば、調製装置１５０６の出力は、コンカテマーまたは細胞を含まないＤＮＡ断片の濃縮試料であってもよい。

コンカテマーが生成される場合、調製装置１５０６は、浸透またはろ過によって流体を除去するSpeedVacコンセントレータ（Thermo Scientific）または超濃縮器のような濃度を高めるための真空乾燥機を含むことができる。コンカテマーの場合、濃度は５倍以上増加しないことがある。調製装置１５０６は、NEBNextエンドリペアモジュール（New England Biolabs、NEB）などのＤＮＡ断片の末端を修復するためのモジュールを含むことができる。さらに、調製装置１５０６は、MinElute Reaction Cleanup Kit（Qiagen）のような末端修復ＤＮＡを精製するためのキットを含むことができる。調製装置１５０６はまた、リガーゼ酵素（例えば、Blunt/TA Ligase Master Mix（NEB））を数時間、ある温度（例えば、２５℃で４時間）でインキュベートし得るインキュベーターを含み得る。調製装置１５０６は、MinElute Reaction Cleanup Kit（Qiagen）を含み得る反応後のコンカテマーを精製するための追加のキットを含み得る。調製装置１５０６はまた、流体を混合して移送することができるロボット液体ハンドラを含むことができる。

高めた濃度の細胞を含まないＤＮＡ断片が生成される場合、調製装置１５０６は、真空乾燥機（例えばSpeedvac濃縮機（Thermo Fisher Scientific、Waltham、MA））または浸透またはろ過によって流体を除去する超濃縮機を含むことができる。調製装置１５０６はまた、エンドリペアおよびAテーリングモジュール（New England Biolabs、Ipswich、MA）を含み得る。調製装置１５０６はまた、流体を混合して移送することができるロボット液体ハンドラを含むことができる。

調製装置１５０６からのコンカテマーまたは濃縮ＤＮＡ断片は、配列読み取りを得るために単分子配列決定装置１５０８に送られてもよい。単分子配列決定デバイス１５０８はまた、MinION Flow Cell（v7.3）（Nanopore）、SMRTテクノロジー（Pacific Biosciences）、またはHelicos Single Molecule 配列決定装置（SeqLL）のようなデバイスを含み得る。単分子配列決定デバイス１５０８はまた、ゲノムＤＮＡ配列決定キット（SQK-MAP-005、Oxford Nanopore Technologies、UK）またはNanopore Sequencing Kit（SQK-NSK007、Oxford Nanopore Technologies）のようなナノポアに関連するキットを含み得る。

単分子配列決定装置１５０８は、コンカテマーまたは濃縮ＤＮＡ断片からの配列読み取りを出力することができる。配列読み取りは、データファイルとして出力されてもよく、コンピュータシステム１５１０によって解析されてもよい。コンピュータシステムは、配列読み取りを分析するソフトウェアを備えた特殊なコンピュータシステムであってもよい。出力データファイルは、METRICHORTM（商標）ソフトウェア（Nanopore）を用いてベースコールすることができる。２Ｄ読み取りは、ＬＡＳＴソフトウェアを使用して抽出し、整列させることができる。コンピュータシステムは、以下に記載されるように、図１６のコンピュータシステム１０であってもよい。

ＶＩＩＩ．コンピュータシステム
本明細書で言及されるコンピュータシステムのいずれも、任意の適切な数のサブシステムを利用することができる。コンピュータシステム１０における、そのようなサブシステムの例を図１６に示す。いくつかの実施形態では、コンピュータシステムは、単一のコンピュータ装置を含み、サブシステムは、コンピュータ装置の構成要素とすることができる。他の実施形態では、コンピュータシステムは、それぞれが内部構成要素を有するサブシステムである複数のコンピュータ装置を含むことができる。コンピュータシステムは、デスクトップおよびラップトップコンピュータ、タブレット、携帯電話および他のモバイルデバイスを含むことができる。

図６に示すサブシステムは、システムバス７５を介して相互接続されている。ディスプレイアダプタ８２に結合されたプリンタ７４、キーボード７８、ストレージデバイス７９、モニタ７６などの追加のサブシステムが示されている。Ｉ／Ｏコントローラ７１に結合する周辺機器および入力／出力（Ｉ／Ｏ）デバイスは、入力／出力（Ｉ／Ｏ）ポート７７のような（例えば、ＵＳＢ、ＦｉｒｅＷｉｒｅ（登録商標））当技術分野で公知の任意の数の手段によってコンピュータシステムに接続することができる。例えば、コンピュータシステム１０を、インターネット、マウス入力装置、またはスキャナなどの広域ネットワークに接続するために、Ｉ／Ｏポート７７または外部インターフェース８１（例えば、イーサネット、Ｗｉ−Ｆｉなど）を使用することができる。システムバス７５を介する相互接続は、中央プロセッサ７３が各サブシステムと通信し、システムメモリ７２または記憶装置７９（例えば、ハードドライブ、または光ディスクのような固定ディスク）からの複数の命令の実行を制御すること、並びに、サブシステム間の情報の交換を可能にする。システムメモリ７２および／または記憶装置７９はコンピュータ読み取り可能媒体を具体化することができる。別のサブシステムは、カメラ、マイクロホン、加速度計などのデータ収集装置８５である。ここに記載されたデータのいずれも、あるコンポーネントから別のコンポーネントに出力することができ、ユーザに出力することができる。

コンピュータシステムは、例えば、外部インターフェース８１によって、内部インターフェースによって、または１つの構成要素から別の構成要素に接続および取り外し可能なリムーバブルストレージデバイスを介して互いに接続された複数の同じ構成要素またはサブシステムを含むことができる。いくつかの実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワークを介して通信することができる。そのような場合、１つのコンピュータはクライアントとみなされ、別のコンピュータはサーバであり、それぞれが同じコンピュータシステムの一部となり得る。クライアントとサーバは、それぞれ複数のシステム、サブシステム、またはコンポーネントを含むことができる。

実施形態の態様は、ハードウェア（例えば、特定用途向け集積回路またはフィールドプログラマブルゲートアレイ）を使用する制御ロジックの形態で、および／または一般的にプログラム可能なプロセッサを備えたコンピュータソフトウェアをモジュール方式または統合方式で使用して実施することができる。本明細書で使用される場合、プロセッサは、単一コアプロセッサ、同一集積チップ上のマルチコアプロセッサ、または単一回路基体上の複数の処理ユニット、またはネットワーク化されたものを含む。本明細書で提供される開示および教示に基づいて、当業者は、ハードウェアおよびハードウェアおよびソフトウェアの組み合わせを使用して本発明の実施形態を実施する他の手法および／または方法を理解し、認識するであろう。

このアプリケーションに記載されているソフトウェアコンポーネントまたは機能のいずれかは、Ｊａｖａ、Ｃ、Ｃ＋＋、Ｃ＃、Ｏｂｊｅｃｔｉｖｅ−Ｃ、Ｓｗｉｆｔ、または例えば、ＰｅｒｌまたはＰｙｔｈｏｎのような従来の技術やオブジェクト指向の技術を使用するスクリプト言語のような、任意の適切なコンピュータ言語を使用してプロセッサによって実行されるソフトウェアコードとして実装されてもよい。ソフトウェアコードは、記憶および／または送信のためにコンピュータ読み取り可能媒体上に一連のインストラクションまたはコマンドとして格納することができる。適切な非一時的なコンピュータ読み取り可能媒体は、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、ハードドライブまたはフロッピーディスクなどの磁気媒体、またはコンパクトディスク（ＣＤ）またはＤＶＤ（デジタル多用途ディスク）、フラッシュメモリなどのような光学媒体を含むことができる。コンピュータ読み取り可能媒体は、そのような記憶装置または伝送装置の任意の組み合わせであってもよい。

このようなプログラムは、インターネットを含む様々なプロトコルに準拠した有線、光、および／または無線ネットワークを介した伝送に適合した搬送波信号を用いて符号化され、伝送されてもよい。このように、コンピュータ読み取り可能媒体は、そのようなプログラムで符号化されたデータ信号を使用して作成されてもよい。プログラムコードでコード化されたコンピュータ読み取り可能媒体は、互換性のあるデバイスと共にパッケージされてもよく、または（例えば、インターネットダウンロードを介して）他のデバイスとは別個に提供されてもよい。このようなコンピュータ読み取り可能媒体は、単一のコンピュータ製品（例えば、ハードドライブ、ＣＤ、またはコンピュータシステム全体）上またはその中に存在してもよく、システムまたはネットワーク内の異なるコンピュータ製品上またはその中に存在してもよい。コンピュータシステムは、モニタ、プリンタ、または本明細書で言及された結果のいずれかをユーザに提供するための他の適切なディスプレイを含むことができる。

本明細書に記載の方法のいずれも、ステップを実行するように構成することができる１つまたは複数のプロセッサを含むコンピュータシステムを用いて全体的にまたは部分的に実行することができる。したがって、実施形態は、可能性として、それぞれのステップまたはそれぞれのステップのグループを実行する異なるコンポーネントを用いて、本明細書に記載の方法のいずれかのステップを実行するように構成されたコンピュータシステムを対象とすることができる。番号付きのステップとして提示されているが、本明細書の方法のステップは、同時に、または異なる順序で実行することができる。さらに、これらのステップの一部は、他の方法の他のステップの一部と共に使用することができる。また、ステップの全部または一部は任意であってもよい。さらに、これらのステップを実行するためのモジュール、ユニット、回路、または他の手段を用いて、方法のいずれのステップも実行することができる。

特定の実施形態の特定の詳細は、本発明の実施形態の精神および範囲から逸脱することなく、任意の適切な方法で組み合わせることができる。しかしながら、本発明の他の実施形態は、それぞれの個々の態様、またはこれらの個々の態様の特定の組み合わせに関する特定の実施形態に向けられ得る。

本発明の例示的な実施形態の上記説明は、例示および説明のために提示されたものである。網羅的であることを意図するものでもなく、本発明を記載された厳密な形態に限定することも意図されておらず、上記教示に照らして多くの修正および変形が可能である。

「１つ（ａ）」、「１つ（ａｎ）」または「その（ｔｈｅ）」の列挙は、特に断らない限り、「１つまたは複数」を意味することを意図している。「または（ｏｒ）」の使用は、特に反対の指示がない限り、「包含的」であり、「排他的」ではないことを意味することを意図する。「第１の」構成要素への言及は、第２の構成要素が提供されることを必ずしも必要としない。さらに、「第１」または「第２」構成要素への言及は、明示的に述べられていない限り、参照される構成要素を特定の場所に限定するものではない。

本明細書で言及したすべての特許、特許出願、刊行物および説明は、あらゆる目的のためにその全体が参考として援用される。いずれも先行技術であるとは認められない。

IX. 参考文献:
1. Dondorp W, de Wert G, Bombard Y, Bianchi DW, Bergmann C, Borry P, et al. Non-invasive prenatal testing for aneuploidy and beyond: Challenges of responsible innovation in prenatal screening. Eur J Hum Genet 2015.
2. Chiu RWK, Chan KCA, Gao Y, Lau VYM, Zheng W, Leung TY, et al. Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of dna in maternal plasma. Proc Natl Acad Sci USA 2008； 105: 20458-63.
3. Jain M, Fiddes IT, Miga KH, Olsen HE, Paten B, Akeson M. Improved data analysis for the MinION nanopore sequencer. Nat Methods 2015； 12: 351-6.
4. Lo YMD, Chan KCA, Sun H, Chen EZ, Jiang P, Lun FMF, et al. Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus. Sci Transl Med 2010； 2: 61ra91-61ra91.
5. Bayley H. Nanopore sequencing: From imagination to reality. Clin Chem 2015； 61: 25-31.
6. Zheng YW, Chan KCA, Sun H, Jiang P, Su X, Chen EZ, et al. Nonhematopoietically derived DNA is shorter than hematopoietically derived DNA in plasma: A transplantation model. Clin Chem 2012； 58: 549-58.
7. Lun FMF, Chiu RWK, Sun K, Leung TY, Jiang P, Chan KCA, et al. Noninvasive prenatal methylomic analysis by genomewide bisulfite sequencing of maternal plasma DNA. Clin Chem 2013； 59: 1583-94.
8. Chan KCA, Jiang P, Zheng YW, Liao GJW, Sun H, Wong J, et al. Cancer genome scanning in plasma: Detection of tumor-associated copy number aberrations, single-nucleotide variants, and tumoral heterogeneity by massively parallel sequencing. Clin Chem 2013； 59: 211-24.
9. Chan KCA, Jiang P, Chan CWM, Sun K, Wong J, Hui EP, et al. Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing. Proc Natl Acad Sci U S A 2013； 110: 18761-8.
10. Chan RWY, Wong J, Chan HLY, Mok TSK, Lo WYW, Lee V, et al. Aberrant concentrations of liver-derived plasma albumin mrna in liver pathologies. Clin Chem 2010； 56: 82-9.
11. Chan RWY, Jiang P, Peng X, Tam LS, Liao GJW, Li EK, et al. Plasma DNA aberrations in systemic lupus erythematosus revealed by genomic and methylomic sequencing. Proc Natl Acad Sci U S A 2014； 111: E5302-11.
12. Schreiber J, Wescoe ZL, Abu-Shumays R, Vivian JT, Baatar B, Karplus K, Akeson M. Error rates for nanopore discrimination among cytosine, methylcytosine, and hydroxymethylcytosine along individual DNA strands. Proc Natl Acad Sci U S A 2013； 110: 18910-5.

Claims

対象から得られた生物試料を準備し、ここで、当該生物試料はセルフリーＤＮＡ断片を含む体液を含み、
当該生物試料から複数のセルフリーＤＮＡ断片を抽出し、
前記複数のセルフリーＤＮＡ断片の第１のセットをコンカテマー化して第１のコンカテマーを得、ここで、当該第１のセットのセルフリーＤＮＡ断片は、異なった配列を有し、対象のゲノムでの異なった位置由来であり、前記第１のコンカテマーの単分子配列決定を行って、第１の配列を得ること、ここで、当該第１の配列は、当該第１の配列内のサブシーケンスとして、複数のセルフリーＤＮＡ断片の第１のセットの異なった配列を含む、
を含む、方法。
前記単分子配列決定の実行の一部として、配列決定装置に前記第１のコンカテマーを提供し、
前記配列決定装置を用いて、前記第１のコンカテマーに対応する複数の信号、前記第１のコンカテマーの前記第１の配列に対応する複数の信号を検出すること、
をさらに含む、請求項１に記載の方法。
前記配列決定装置が第１のナノポアを含み、方法は、さらに、
前記第１のコンカテマーが前記第１のナノポアを通り、
前記第１のコンカテマーが前記第１のナノポアを通るときに第１の電気信号を検出すること、ここで、前記第１の電気信号は前記第１のコンカテマーの前記第１の配列に対応し、前記複数の信号は前記第１の電気信号を含む、
を含む、請求項２に記載の方法。
前記第１の配列を決定するために前記第１の電気信号を分析し、
参照ゲノムに対して前記第１の配列のサブシーケンスを整列させて、前記複数のセルフリーＤＮＡ断片の前記第１のセットそれぞれに対応する断片配列を同定すること、をコンピュータシステムにより実行することをさらに含む、請求項３に記載の方法。
前記第１のコンカテマーが前記第１のナノポアを通ることは、
前記第１のコンカテマーの第１の鎖が前記第１のナノポアを通ること、及び、
その後、前記第１のコンカテマーの第２の鎖が前記第１のナノポアを通ること、
を含む、請求項３に記載の方法。
前記第１の鎖および前記第２の鎖についての前記第１の電気信号をコンピュータシステムにより分析して、前記第１の配列を決定することをさらに含む、請求項５に記載の方法。
前記第１のナノポアは、基体上の複数のナノポアの１つである、請求項３に記載の方法。
前記複数のセルフリーＤＮＡ断片の第２のセットをコンカテマー化して第２のコンカテマーを得、
前記第２のコンカテマーが前記複数のナノポアの第２のナノポアを通り、
前記第２のコンカテマーが前記第２のナノポアを通るときに複数の第２の電気信号を検出すること、ここで、前記第２の電気信号は前記第２のコンカテマーの第２の配列に対応する、
をさらに含む、請求項７に記載の方法。
前記第１のコンカテマーに対して蛍光標識されたヌクレオチドをハイブリダイズし、蛍光シグナルを検出すること、ここで、前記蛍光シグナルはヌクレオチドに対応する、をさらに含む、請求項２に記載の方法。
参照ゲノムに対して前記第１の配列のサブシーケンスを整列させて、前記セルフリーＤＮＡ断片の前記第１のセットそれぞれに対応する断片配列を同定することを、コンピュータシステムにより実行することをさらに含む、請求項１に記載の方法。
前記サブシーケンスの整列に基づいて、前記複数のセルフリーＤＮＡ断片の前記第１のセットそれぞれのサイズを決定することをさらに含む、請求項１０に記載の方法。
前記複数のセルフリーＤＮＡ断片の前記第１のセットをコンカテマー化することは、前記複数のセルフリーＤＮＡ断片の前記第１のセットおよび既知の配列を有する前記複数のセルフリーＤＮＡ断片の第２のセットをコンカテマー化することを含み、前記複数のセルフリーＤＮＡ断片の前記第２のセットは前記複数のセルフリーＤＮＡ断片の前記第１のセットの中に分散され、
前記第１の配列のサブシーケンスを整列させることは、前記既知の配列に対してサブシーケンスを整列させて、前記第１のコンカテマーにおける前記複数のセルフリーＤＮＡ断片の前記第２のセットの位置を同定することを含む、請求項１０に記載の方法。
前記コンカテマー化は、前記複数のセルフリーＤＮＡ断片の前記第２のセットの１つのセルフリーＤＮＡ断片を、前記複数のセルフリーＤＮＡ断片の前記第１のセットの２つのセルフリーＤＮＡ断片間に配置する、請求項１２に記載の方法。
前記第１のサブシーケンスの前に、前記複数のセルフリーＤＮＡ断片の前記第２のセットの既知の配列の１つを同定することに基づいて、前記複数のセルフリーＤＮＡ断片の前記第１のセットの第１のセルフリーＤＮＡ断片に対応する第１のサブシーケンスの開始塩基を、前記コンピュータシステムにより同定し、
前記第１のサブシーケンスの後に、前記複数のセルフリーＤＮＡ断片の前記第２のセットの既知の配列の１つを同定することに基づいて、前記複数のセルフリーＤＮＡ断片の前記第１のセットの前記第１のセルフリーＤＮＡ断片に対応する前記第１のサブシーケンスの終了塩基を、前記コンピュータシステムにより同定すること、
を前記コンピュータシステムにより実行することをさらに含む、請求項１３に記載の方法。
前記複数のセルフリーＤＮＡ断片の前記第２のセットの各セルフリーＤＮＡ断片は７ヌクレオチド以下の既知の配列を有する、請求項１２に記載の方法。
前記複数のセルフリーＤＮＡ断片の前記第２のセットそれぞれは、同じ既知の配列を有する、請求項１２に記載の方法。
前記サブシーケンスの整列は、
前記参照ゲノムに前記第１の配列のスライドウィンドウを整列させることであって、各スライドウィンドウは前記参照ゲノムに整列されたサブシーケンスに対応する、整列させることと、
２つのスライドウィンドウが前記参照ゲノムの異なる領域に整列するとき同定して、前記複数のセルフリーＤＮＡ断片の前記第１のセットの２つのセルフリーＤＮＡ断片の配列間を区別すること、
とを含む、請求項１０に記載の方法。
前記参照ゲノムの前記異なる領域に整列させる２つのスライドウィンドウに基づいて、前記複数のセルフリーＤＮＡ断片の前記第１のセットの第１のセルフリーＤＮＡ断片の終了および開始の第１のサブシーケンスを決定することを、前記コンピュータシステムにより実行することをさらに含む、請求項１７に記載の方法。
前記参照ゲノムの前記異なる領域は、異なる染色体上の領域を含む、請求項１７に記載の方法。
前記２つのスライドウィンドウ間の１つ以上のウィンドウが、前記参照ゲノムに整列していないものとして同定される、請求項１７に記載の方法。
前記複数のセルフリーＤＮＡ断片の前記第１のセットの第１のセルフリーＤＮＡ断片のサイズを決定することをさらに含み、前記第１のセルフリーＤＮＡ断片の前記サイズを決定することは、
前記参照ゲノムの１つの領域に整列させる最も長いサブシーケンスの長さを決定することを含む、請求項２０に記載の方法。
前記生体試料は、血漿または血清である、請求項１に記載の方法。
前記セルフリーＤＮＡ断片の前記第１セットが複数の染色体からランダムに分布されている、請求項１に記載の方法。
前記複数のセルフリーＤＮＡ断片の第２のセットをコンカテマー化して第２のコンカテマーを得、ここで、当該第２のセットのセルフリーＤＮＡ断片は、前記第１のコンカテマーとは異なるセルフリーＤＮＡ断片のコンビネーション又はパーミュテーションを含み、ここで、複数のセルフリーＤＮＡ断片の第２のセットをコンカテマー化することは、複数のセルフリーＤＮＡ断片の第１のセットをコンカテマー化することと並行して起こる、
前記第２のコンカテマーの単分子配列決定を行って、第２の配列を得ること、ここで、当該第２の配列は、当該第２の配列内のサブシーケンスとして、複数のセルフリーＤＮＡ断片の第２のセットの異なった配列を含む、
をさらに含む、請求項１に記載の方法。
前記第１のコンカテマーが、複数のセルフリーＤＮＡ断片の複製されたＤＮＡ断片を含まず、前記第２のコンカテマーが、複数のセルフリーＤＮＡ断片の複製されたＤＮＡ断片を含まない、請求項２４に記載の方法。
前記第１のコンカテマーが、複数のセルフリーＤＮＡ断片の第1のセットのセルフリーＤＮＡ断片間に既知の配列を有するスペーサー断片を含まない、請求項１に記載の方法。
第１の配列内のサブシーケンスを用いて複数のセルフリーＤＮＡ断片のサイズ分布を決定することを更に含む、請求項１に記載の方法。
前記生物試料が、母親セルフリーＤＮＡ断片及び胎児セルフリーＤＮＡ断片を含む母親血漿であり、そこから、複数のセルフリーＤＮＡ断片の少なくとも第１のセットが得られる、請求項１に記載の方法。
（１）第１のコンカテマーを生成するセルフリーＤＮＡ断片の第１のセットをコンカテマー化し、（２）第１のコンカテマーの単一分子配列決定を行って、第１の配列を得ることにより生成された第１のコンカテマーの第１の配列を準備し、ここで、
前記セルフリーＤＮＡ断片の第１のセットは、生物試料から抽出され、
前記生物試料は対象から得られ、
前記生物試料は、前記セルフリーＤＮＡ断片を含む体液を含み、
前記第１の配列のサブシーケンスを整列させて、前記セルフリーＤＮＡ断片の前記第１のセットの各セルフリーＤＮＡ断片に対応する断片配列を同定すること、
をコンピュータシステムにより実行することを含む、方法。
前記第１のコンカテマーは、前記ＤＮＡ断片の前記第１のセットとＤＮＡ断片の第２のセットとをコンカテマー化することにより生成され、
前記第１の配列のサブシーケンスを整列させることは、前記ＤＮＡ断片の前記第２のセットにサブシーケンスを整列させることを含む、請求項２９に記載の方法。
前記セルフリーＤＮＡ断片の前記第２のセットの各セルフリーＤＮＡ断片は、７ヌクレオチド以下の既知の配列を含む、請求項３０に記載の方法。
前記第１の配列のサブシーケンスを整列させることは、参照ゲノムに前記第１の配列のサブシーケンスを整列させることを含む、請求項２９に記載の方法。
前記サブシーケンスの前記整列は、
前記参照ゲノムに前記第１の配列のウィンドウを整列させることと、
前記参照ゲノムの異なる領域に２つのウィンドウを整列させるときに同定することとを含む、請求項３２に記載の方法。
前記２つのウィンドウ間の１つ以上のウィンドウが前記参照ゲノムに整列していないものとして同定される、請求項３３に記載の方法。
請求項２９〜３４のいずれか１項に記載の操作を実行するために前記コンピュータシステムを制御するための複数のインストラクションを保存する、コンピュータ読み取り可能媒体。
請求項３５のコンピュータ読み取り可能媒体と、
前記コンピュータ読み取り可能媒体に保存されるインストラクションを実行するための１つ以上のプロセッサと
を含む、システム。
請求項２９〜３４のいずれか１項を実行するための手段を含む、システム。
請求項２９〜３４のいずれか１項を実行するために構成される、システム。
請求項２９〜３４のいずれか１項に記載のステップをそれぞれ実行するモジュールを含む、システム。