JP2023527761A

JP2023527761A - 核酸サンプル富化およびスクリーニング方法

Info

Publication number: JP2023527761A
Application number: JP2022570629A
Authority: JP
Inventors: チュー，クレメント; ティールマン，マーク; ウェルカー，ノア; グローマン，ピーター
Original assignee: ミリアド・ウィメンズ・ヘルス・インコーポレーテッド
Priority date: 2020-05-18
Filing date: 2021-05-18
Publication date: 2023-06-30
Also published as: EP4153777A1; WO2021236680A1; US20230193247A1

Abstract

さらなる遺伝学的スクリーニングのための標的核酸分子に関して試験サンプルを富化するための方法が、本明細書中に記載される。方法は、試験被験体から核酸を単離するステップ、核酸ライブラリーを調製するステップであって、起源サンプルを特定するために核酸分子がタグ付けまたはバーコード付加されるステップ、断片サイズ分布を決定するステップ、標的核酸集団の存在量を決定するステップ、断片サイズ選択のために添加するためのライブラリーの量を決定するために、数値的オフセット値を算出するステップ、断片サイズ選択を行なうステップ、および標的核酸に関して富化されたサンプルに対して診断アッセイを行なうステップを含むことができる。【選択図】図２

Description

関連出願に対する相互参照
本出願は、2020年5月18日出願の発明の名称「Pooled Nucleic Acid Sample Enrichment and Screening Methods」である米国特許仮出願第62/704,616号および2020年11月13日出願のこれもまた発明の名称「Pooled Nucleic Acid Sample Enrichment and Screening Methods」である同第63/113,730号に対する優先権の利益を主張する。

発明の分野
本発明は、さらなる遺伝学的スクリーニングのために標的核酸分子に関して試験サンプルを富化するための方法に関する。

遺伝的多様性が、限定するものではないが、血友病、サラセミア、デュシェンヌ型筋ジストロフィー（DMD）、ハンチントン病（HD）、アルツハイマー病および嚢胞性線維症（CF）をはじめとする医学的状態を引き起こすことが知られている。しばしば、変化の原因は、重要な遺伝子中の単一ヌクレオチド塩基の単純な付加、置換、または欠失である。加えて、出生異常が、21トリソミー（ダウン症候群）、13トリソミー（パトウ症候群）、18トリソミー（エドワーズ症候群）、モノソミーX（ターナー症候群）およびクラインフェルター症候群（XXY）などの一部の性染色体異数性などの染色体異常により引き起こされる。別の遺伝的多様性は、多くの場合に性染色体XおよびYに基づいて決定することができる、胎児性別である。一部の遺伝的多様性は、例えば、糖尿病、動脈硬化、肥満、様々な自己免疫疾患および癌（例えば、結腸直腸、乳房、卵巣、肺）などの任意の多数の疾患に個体を罹患し易くする場合がある。遺伝的変化を特定することは、医学的状態の診断、またはそれに対する素因の決定につながり、かつ医学的判断を知らせることができる。有害な健康上の影響を生じさせる遺伝的異常を見出すための研究開発の努力により、遺伝的疾患に対する特異的遺伝子および/または重要な診断マーカーが特定されている。

例えば、無細胞DNA（cfDNA）が、疾患および出生異常に対する有効なバイオマーカーとして機能することが、記載および開発されてきた。例えば、妊娠中の母親の血漿中のcfDNAの発見が、ここ10年で、数種類の非侵襲的出生前診断（NIPS）技術の開発をもたらした。しかしながら、母体血漿中のcfDNAのごく一部のみが胎児に由来するので、cfDNAを用いる胎児異数性および常染色体劣性障害の検出は、困難を有する。所与の母体血漿サンプル中の異数性に対するNIPS感度の主な駆動因子（primary driver）は、胎児画分（FF）である。Hui, L. et al., Prenat Diagn. 2020; 40:155-163。ほとんどのサンプルに関して、FF値は4％～30％である。Wang, E. et al., Prenat Diagn. 2013; 33:662-666。多数の検査機関が、偽陰性報告を発するリスクを軽減するために、4％未満のFFを含むサンプルを失格にする。NIPSの分子的およびバイオインフォマティクス実装は、時間をかけて発展、多角化および全般的に改善してきたので、徐々に低下するFFレベルでの感度は、プラットフォームおよび検査機関に依存する。Hui, L. et al., Prenat Diagn. 2020; 40:155-163；Artieri, C.G. et al., Prenat Diagn. 2017; 37:482-490。実際に、近年公開された臨床経験研究は、低FFサンプルを失格にしないカスタム化された全ゲノム配列決定（WGS）に基づくNIPSが、13番、18番、および21番染色体に対する一般的な異数性に関して、高FFおよび低FFでの同等な精度を有し得ることを実証した。Hancock, S. et al., Ultrasound Obstet Gynecol. 2020; 56:422-430。一般的な異数性はそれらの頻度および非常に浸透率（penetrant）の高い表現型を理由として長らくNIPSの主な焦点となっているが、臨床的に問題になる染色体異常は、広範囲のサイズにわたり、かつゲノムのどこにでも起こり得る。Wapner, R.J. et al., Am J Obstet Gynecol. 2015; 212:332；Advani, H.V. et al., Prenat Diagn. 2017; 37:1067-1075；Pertile, M.D. et al., Sci Transl Med. 2017; 9:eaan1240。したがって、NIPS開発の重要な前線は、スクリーニングの解像度（すなわち、比較的小さな異常を検出する）および範囲（すなわち、領域の数）を高めることである。

cfDNAは、特性（例えば、サイズ、配列、存在量）および起源組織（例えば、母体または胎児）における変動（vary）を有するDNAの混合物である。例えば、妊婦から取得されるcfDNAは、母体および胎児起源の両方のDNAを含有し、癌患者から取得されるcfDNAは、腫瘍および正常細胞起源の両方のDNAを含有し、移植患者から取得されるcfDNAは、宿主および移植片起源の両方のDNAを含有する。cfDNAの特性（例えば、サイズ）を起源組織と統計学的にも関連付ける多数の公知の例がある。例えば、妊婦由来のcfDNA中では、胎児DNAは、母体DNAよりも小さな断片サイズ分布を有する。Fan, H. C., et al., (2010). Analysis of the Size Distributions of Fetal and Maternal Cell-Free DNA by Paired-End Sequencing. Clinical Chemistry. 56(8): 1279-1286。

cfDNAは、統合失調症および癌などの他の疾患に対する診断用バイオマーカーとしての考えられる用途を有する。癌患者では、腫瘍DNAは、正常組織由来DNAよりも小さな断片サイズのサイズ分布を有する。さらに、統合失調症患者でのcfDNAが比較的短いDNA分子から構成され、かつアポトーシス様分布パターンを示したことが示されている。Jang et al., Translational Psychiatry 2018; 8:104。

断片サイズなどの医学的状態または遺伝的異常バイオマーカーとして機能し得る識別可能な特性を有する核酸分子（例えば、cfDNA）を含むアッセイに関して、試験性能（test performance）に影響する主要な因子は、サンプル中の標的DNA画分（例えば、胎児、腫瘍、移植片）の相対的な割合である。cfDNAの文脈では、これは多くの場合に「胎児画分またはFFまたはcffDNA」または「腫瘍画分またはcftDNA」と称される。例えば、胎児画分は、cfDNAサンプル中の全DNAに対する胎児DNAの比率（すなわち、胎盤に由来するcfDNA断片の割合）である。標的DNA画分が高いほど、染色体異常などの標的DNA特性を検出することが容易になる。核酸メチル化痕跡（methylation signature）が、用いることができる別の識別力のある特徴である。例えば、母体と胎児との間でのメチル化痕跡の差異が観察されている。Hong-Dan, W., et al., Mol. Med. Rep. 2017;15(6): 3989-3998。さらに、プロモーター過剰メチル化と特定の癌タイプを生じるDNA修復に関与する遺伝子の不活性化との間の関連が示されている。Jin, B. et al., Adv. Exp. Med. Biol. 2013; 754: 3-29。

比較的小さな断片サイズ分布を有する標的DNA画分を、電気泳動を用いて比較的小さな断片に関して混合物を富化することにより増加させることができることが示されてきた。Liang, B., et al., Scientific Reports. 2018; 8:17675。そのプロセス中で、比較的大きな断片は廃棄される。結果は、多くの場合、混合物中の標的DNAの割合における変化であるが、総量が低下する。2倍以上の標的DNA画分富化が可能である。例えば、以前には10％胎児DNAであったcfDNA混合物が、電気泳動による比較的小さなDNA断片に関する富化後には、20％胎児DNAになる。、そのような富化プロセス、この場合であれば電気泳動を介したプロセスは、多くの場合、「サイズ選択」と称される。

胎児画分の診断での有用性に起因して、低FFサンプルに関する懸念を表明する報告および専門家団体の意見が一般的である。Artieri, C.G. et al., Prenat Diagn. 2017; 37:482-490；Gregg, A.R. et al., Genet Med. 2016; 18:1056-1065；Committee on Practice Bulletins - Obstetrics, Committee on Genetics, Society for Maternal-Fetal Medicine. Practice bulletin no. 163., Obstet Gynecol. 2016; 127:e123-e137。多数の刊行物が、低FFサンプルの取り扱いに関する異なるアプローチのメリットを探索および議論してきた：低FFでの信頼性のある結果を発するためにNIPSアルゴリズムを最適化すること（Hancock, S. et al., Ultrasound Obstet Gynecol. 2020; 56:422-430）、そのようなサンプルを完全に失格にすること、または失格となった低FFサンプルに対する軽減戦略を続行すること（例えば、連続的再引き出し（Benn, P. et al., Obstet Gynecol. 2018;132:428-435；Hunkapiller, N. et al., Fetal Diagn Ther. 2016; 40:219-223）およびFFに基づくリスクスコアなど（McKanna, T. et al., Ultrasound Obstet Gynecol. 2019; 53:73-79；Benn, P. et al., J Genet Couns. 2019; 29:800-806））。しかしながら、一致意見は捉えにくいままである。したがって、FXプロトコールは、標準的NIPSに対して低FFを有していたであろうサンプルが高FFを有するサンプルへと分子的に変換されるので、NIPSでの前進を代表する。FXプロトコールが提供する試験性能での増大に伴って、アッセイ改善は、供給業者および患者がNIPSを用いるそれらの結果で有する信頼性を増大させるであろう。

FFはcfDNAサンプルの不変かつ固有の特徴に見える場合があるが、変更することができ、FFを増大させるための戦略が、FFと相関する因子により明らかになる。Hui, L. et al., 2020; 40:155-163；Peng, X.L. et al., Int J Mol Sci. 2017; 18:453；Hestand, M.S. et al., Eur J Hum Genet. 2019; 27:198-202。例えば、FFは、在胎期間に伴って増大することが知られており（Wang, E. et al., Prenat Diagn. 2013; 33:662-666）、したがって、妊娠後期での採血は比較的高いFFをもたらすが、1週間でFFが1％未満の増大であるので影響は大きくない。Livergood, M.C. et al., Am J Obstet Gynecol. 2017; 216:413 e411-413 e419；Yared, E. et al., Am J Obstet Gynecol. 2016; 215:370 e1-376 e6。FFはまた、第1三半期体格指数（BMI）および母体年齢と負に相関もするが（Suzumori, N. et al., J Hum Genet. 2016; 61: 647-652）、これらの値は、いかなる所与の妊娠に関しても、実質的に一定である。分子レベルでは、胎児由来cfDNA断片は比較的短く（Qiao, L., et al., Am J Obstet Gynecol. 2019; 221:345 e1-345 e11；Liang, B., et al., Sci Rep. 2018; 8:17675）、過剰メチル化され（Sun, K. et al., Proc Natl Acad Sci USA. 2015; 112: E5503-E5512；Nygren, A.O., et al., Clin Chem. 2010; 56:1627-1635；Lun, F.M., et al., Clin Chem. 2013; 59:1583-1594）、かつ母体cfDNA断片とは異なる箇所で富化されている傾向があることが観察されている。Chan, K.C., et al., Proc Natl Acad Sci USA. 2016; 113: E8159-E8168。分子レベルおよびバイオインフォマティクスレベルでのこれらの偏りを活用することが、各サンプルのFFを乗算的に強化する潜在能力を有する。

さらに、慣用の選択技術（例えば、サイズ選択）は、並行する単一サンプルに限定されており、非効率でありかつ時間がかかる。例えば、並行した100サンプルの試験は、100回の並行した電気泳動に基づくサイズ選択手順を必然的に伴うであろう。現在までに、サンプル起源の同一性を維持しながら、富化を行なう前に、複数の患者由来のサンプルをプールすることを可能にするであろう方法は開発されていない。そのようなプール化および富化技術の顕著な技術的障壁が、これが開発されて来なかった理由であり得る。例えば、cfDNAに関して、任意のそのような解決策に伴う1つの課題は、サイズによる断片の相対的割合がサンプル間で異なることである。さらに、サイズ選択前に等量のサンプルをプールすることにより、最終的なサイズ選択されたプール中でのサンプルの不均等な相対的表示（representation）が生じる。さらに、サンプル毎での場合と異なり、大量にプロトコールを実行することにより、いかなるサンプルサイズ選択プロトコールで導入される変動も低減される。多数の配列異常検出ツールがバッチレベルのバックグラウンド補正に頼るので、このことは有益である。

NIPSなどのスクリーニングプロセスを受けるサンプルに対して拡張可能に適用することができ、かつ顕著により高い標的DNA画分レベル（例えば、FFレベル）を生じ、それによりすべての異常に対して感度および特異度を増大させる手順が必要である。

Hui, L. et al., Prenat Diagn. 2020; 40:155-163 Wang, E. et al., Prenat Diagn. 2013; 33:662-666 Artieri, C.G. et al., Prenat Diagn. 2017; 37:482-490 Hancock, S. et al., Ultrasound Obstet Gynecol. 2020; 56:422-430 Wapner, R.J. et al., Am J Obstet Gynecol. 2015; 212:332 Advani, H.V. et al., Prenat Diagn. 2017; 37:1067-1075 Pertile, M.D. et al., Sci Transl Med. 2017; 9:eaan1240 Fan, H. C., et al., (2010). Analysis of the Size Distributions of Fetal and Maternal Cell-Free DNA by Paired-End Sequencing. Clinical Chemistry. 56(8): 1279-1286 Jang et al., Translational Psychiatry 2018; 8:104 Hong-Dan, W., et al., Mol. Med. Rep. 2017;15(6): 3989-3998 Jin, B. et al., Adv. Exp. Med. Biol. 2013; 754: 3-29 Liang, B., et al., Scientific Reports. 2018; 8:17675 Gregg, A.R. et al., Genet Med. 2016; 18:1056-1065 Committee on Practice Bulletins - Obstetrics, Committee on Genetics, Society for Maternal-Fetal Medicine. Practice bulletin no. 163., Obstet Gynecol. 2016; 127:e123-e137 Benn, P. et al., Obstet Gynecol. 2018;132:428-435 Hunkapiller, N. et al., Fetal Diagn Ther. 2016; 40:219-223 McKanna, T. et al., Ultrasound Obstet Gynecol. 2019; 53:73-79 Benn, P. et al., J Genet Couns. 2019; 29:800-806 Peng, X.L. et al., Int J Mol Sci. 2017; 18:453 Hestand, M.S. et al., Eur J Hum Genet. 2019; 27:198-202 Livergood, M.C. et al., Am J Obstet Gynecol. 2017; 216:413 e411-413 e419 Yared, E. et al., Am J Obstet Gynecol. 2016; 215:370 e1-376 e6 Suzumori, N. et al., J Hum Genet. 2016; 61: 647-652 Qiao, L., et al., Am J Obstet Gynecol. 2019; 221:345 e1-345 e11 Sun, K. et al., Proc Natl Acad Sci USA. 2015; 112: E5503-E5512 Nygren, A.O., et al., Clin Chem. 2010; 56:1627-1635 Lun, F.M., et al., Clin Chem. 2013; 59:1583-1594 Chan, K.C., et al., Proc Natl Acad Sci USA. 2016; 113: E8159-E8168

本発明の目的は、試験サンプル中の標的核酸画分（例えば、DNAまたはRNA）に関して富化し、かつこれをスクリーニングする方法を提供することである。別の実施形態では、試験サンプルは、複数の試験被験体からプールされる。

本発明の別の目的は、核酸サンプルの遺伝学的診断アッセイの感度および解像度を強化する方法を提供することである。

一部の実施形態では、核酸は、ゲノムDNAである。他の実施形態では、核酸は、無細胞DNAであり、他の実施形態では、核酸は、FFPE DNAである。

一部の実施形態では、標的核酸画分は、無細胞DNAの胎児画分（FF）（cffDNA）を含む。

本発明の別の目的は、各サンプル由来の標的核酸画分（例えば、特定のサイズ範囲内）の等しい量または濃度が、診断アッセイまたはさらなる選択/富化のための少なくとも1種の試験サンプルにおいて表わされるように、少なくとも1種の試験サンプルにおいて用いるためのサンプル特異的核酸ライブラリーの適正な体積/質量を決定することである。

本発明の別の目的は、各サンプル由来の数値的オフセット値を算出し、続いてそれに従って体積/質量を調整することにより、少なくとも1種の試験サンプルにおいて用いるための適正な体積/質量を決定することである。

本発明の別の目的は、標的核酸画分に関して富化されるサンプル特異的核酸ライブラリーから試験サンプルを生成することである。一実施形態では、試験サンプルは、特定のサイズ範囲内の核酸断片に関して富化され、かつ概ね等しい濃度の各特定の起源サンプル由来の特定のサイズ範囲内の核酸を含有する。別の実施形態では、標的核酸画分に関して富化された試験サンプルはまた、起源サンプルの同一性を維持する。一実施形態では、富化された試験サンプルは、無細胞DNAの胎児画分（FF）を含む。また別の実施形態では、富化された試験サンプルは、過剰メチル化された核酸配列断片を含む。

一実施形態では、核酸ライブラリーは、収集された各起源サンプルに関して調製/増幅される。この実施形態では、各核酸ライブラリーは、特定のライブラリー内に含まれる核酸が特定のサンプルから取得されたものであるという点で、起源サンプルに対応する。別の実施形態では、固有マーカー（例えば、標識、タグ）を、起源サンプルの同一性を保存する目的で、ライブラリー中の核酸断片を標識するために用いることができる。例えば、起源サンプルを一意的に特定する配列に基づくバーコードを、一方または両方の末端上で各サンプル中の核酸断片に付加することができる。別の実施形態では、サンプル特異的ライブラリー中に含まれる標識された（例えば、バーコード付加された）核酸混合物は、第1の試験サンプルを生成するために、体積（μL）または質量（ng）比率で1：1に混合される。別の実施形態では、元のサンプルにおける、目的の特徴を保持する核酸断片の分布（例えば、DNA断片サイズ分布）が、公知の方法論、およびそれに続く、存在する核酸の相対量（例えば、目的の特徴を保持して存在する核酸の相対的存在量）のサンプル特異的な算出によって決定される。別の実施形態では、サンプル特異的相対量を用いて、数値的オフセットが、ライブラリー中の実際の核酸濃度/ライブラリー中の予測される核酸濃度の比率を用いて算出される。また別の実施形態では、数値的オフセット値は、目的の特徴を保持する断片のさらなる選択または富化のために第2の試験サンプルへと添加される、サンプル特異的ライブラリーからの重み付けされた体積または重み付けされた核酸濃度を算出するために用いられる。別の実施形態では、重み付けされた体積のサンプル特異的ライブラリーを混合して、第2の試験サンプルをつくり出し、この第2の試験サンプル中には、サンプル特異的ライブラリー毎に、等量の目的の特徴を保持する核酸がある。別の実施形態では、慣用の技術を用いて第2の試験サンプルに対する選択（または富化）が行なわれ、それにより、目的の特徴を保持する核酸断片を含有する第3の試験サンプルが生成される。目的の特徴を有しない断片は廃棄することができる。一実施形態では、公知の配列決定技術を用いて第3の試験サンプルが配列決定され、サンプル特異的標識（例えば、バーコード）を用いてサンプル特異的核酸が単離され、かつ異常に関してスクリーニングされる。

別の実施形態では、核酸ライブラリーが、収集された各起源サンプルに関して調製/増幅される。別の実施形態では、固有マーカー（例えば、標識、タグ）を、起源サンプルの同一性を保存する目的で、ライブラリー中の核酸断片を標識するために用いることができる。例えば、起源サンプルを一意的に特定する配列に基づくバーコードを、一方または両方の末端上で各サンプル中の核酸断片に付加することができる。一実施形態では、サンプル特異的ライブラリー中に含まれる標識された（例えば、バーコード付加された）核酸混合物は、第1の試験サンプルを生成するために、体積（μL）または質量（ng）比率で1：1に混合される。一実施形態では、慣用の技術を用いて第1の試験サンプルに対して選択（または富化）が行なわれ、それにより、目的の特徴を保持する核酸断片を含有する第2の試験サンプル（例えば、「標的核酸集団」）が生成される。目的の特徴を有しない断片は廃棄することができる。一実施形態では、各起源サンプルに対する標的核酸集団の相対量は、限定するものではないが、配列決定をはじめとする技術を用いて決定される。他の実施形態では、相対量は、例えば、定量的PCR（qPCR）、ドロップレットデジタルPCR（ddPCR）などの他の技術を用いて決定することができる。別の実施形態では、サンプル特異的相対量を用いて、数値的オフセットが、ライブラリー中の実際の核酸濃度/ライブラリー中の予測される核酸濃度の比率を用いて算出される。一実施形態では、数値的オフセット値は、目的の特徴を保持する断片のさらなる選択または富化のために第3の試験サンプルへと添加される、サンプル特異的ライブラリーからの重み付けされた体積または重み付けされた核酸濃度を算出するために用いられる。一部の実施形態では、重み付けされた体積のサンプル特異的ライブラリーを混合して、第3の試験サンプルをつくり出し、第3の試験サンプル中には、サンプル特異的ライブラリー毎に、等量の目的の特徴を保持する核酸がある。一部の実施形態では、第3の試験サンプルが配列決定され、かつ遺伝的異常に関して標的核酸集団がスクリーニングされる。一部の実施形態では、第2の選択（富化）が第3の試験サンプルに対して行なわれ、懸濁物中の標的核酸集団を単離して、当該標的核酸集団に関して富化され、かつ各起源サンプルからの実質的に等しい割合を含む第4の試験サンプルを形成させる。一部の実施形態では、第4の試験サンプルが配列決定され、かつ遺伝的異常に関して標的核酸集団がスクリーニングされる。

本発明の追加の実施形態としては、限定するものではないが、以下のものが挙げられる：

(1) a. 複数の試験被験体から核酸を単離および精製して、少なくとも1種の起源サンプルを生成するための対応する起源サンプルを生成させるステップ；
b. 各試験被験体に対するライブラリーを調製するステップであって、このとき、核酸断片がバーコード付加され、かつ各ライブラリーが特異的な起源サンプルに対応するステップ；
c. 各起源サンプルから第1の数の核酸単位を添加して、第1のプールされた試験サンプルを形成させるステップ；
d. 各起源サンプル内の断片サイズ分布を決定するステップ；
e. 各起源サンプル中の標的核酸集団の存在量を決定するステップ；
f. 各起源サンプルに対する固有の数値的オフセット値を算出するステップ；
g. 固有の数値的オフセット値に基づいて各起源サンプルから第2の数の核酸単位を添加して、第2のプールされた試験サンプルを形成させるステップ；および
h. 第2のプールされた試験サンプルに対して断片サイズ選択を行ない、かつ懸濁物中の標的核酸集団を単離して、該標的核酸集団に関して富化された第3のプールされた試験サンプルを形成させるステップであって、このとき、該第3のプールされた試験サンプルは診断アッセイに対して準備できているステップ
を含む、プールされた核酸サンプルの遺伝学的診断アッセイの感度および解像度を強化する方法。

(2) 前記第3のプールされた試験サンプルを配列決定し、かつ遺伝的異常に関して標的核酸集団をスクリーニングするステップをさらに含む、(1)の方法。

(3) 前記断片サイズ分布が配列決定により決定される、(1)の方法。

(4) 前記配列決定がペアエンド配列決定である、(3)の方法。

(5) 前記断片サイズ分布が、蛍光相関分光法により決定される、(1)の方法。

(6) 第3のプールされた試験サンプル中の核酸断片を、それぞれの起源サンプルとペアリングさせるステップをさらに含む、(1)の方法。

(7) 前記核酸がゲノムDNAである、(1)の方法。

(8) 前記核酸がFFPE DNAである、(1)の方法。

(9) 前記核酸がRNAである、(1)の方法。

(10) 前記核酸が無細胞DNAである、(1)の方法。

(11) 前記核酸が全血から単離される、(1)の方法。

(12) 前記固有の数値的オフセット値が、核酸単位の第1の数により、ステップeで決定される標的核酸集団の存在量を除算することにより算出される、(1)の方法。

(13) 前記標的核酸集団が、前記無細胞DNAの胎児画分である、(12)の方法。

(14) 前記標的核酸集団が、前記無細胞DNAの腫瘍画分である、(12)の方法。

(15) 前記標的核酸集団が、特定のメチル化痕跡を含む核酸の断片である、(12)の方法。

(16) 前記メチル化痕跡が、過剰メチル化または過少メチル化である、(15)の方法。

(17) 前記標的核酸集団が、所定の長さ範囲内の断片に関して富化される、(1)の方法。

(18) 前記標的核酸集団が、所定の長さの断片に関して富化される、(1)の方法。

(19) 前記標的核酸集団が、特定のメチル化痕跡を含む断片に関して富化される、(1)の方法。

(20) 前記メチル化痕跡が、過剰メチル化または過少メチル化である、(19)の方法。

(21) 前記断片サイズ選択が、ゲル電気泳動を用いて行なわれる、(1)の方法。

(22) 前記核酸単位の第1および第2の数が、マイクロリットル、ナノグラム、およびモルからなる群より選択される、(1)の方法。

(23) 全ゲノム配列決定を行なうステップをさらに含む、(1)の方法。

(24) 前記プールされた試験サンプルが、2～1000種類の異なるサンプルを含む、(1)の方法。

(25) a. 複数の試験被験体から核酸を単離および精製して、対応する起源サンプルを生成させるステップ；
b. 各試験被験体に対するライブラリーを調製するステップであって、このとき、核酸断片がバーコード付加され、かつ各ライブラリーが特異的な起源サンプルに対応するステップ；
c. 各起源サンプルから第1の数の核酸単位を添加して、第1のプールされた試験サンプルを形成させるステップ；
d. 第1のプールされた試験サンプルに対して断片サイズ選択を行ない、かつ懸濁物中の標的核酸集団を単離して、該標的核酸集団に関して富化された第2のプールされた試験サンプルを形成させるステップ；
e. 各起源サンプル中の標的核酸集団の存在量を決定するステップ；
f. 各起源サンプルに対する固有の数値的オフセット値を算出するステップ；
g. 固有の数値的オフセット値に基づいて各起源サンプルから第2の数の核酸単位を添加して、該標的核酸集団に関して富化された第3のプールされた試験サンプルを形成させるステップ；および
h. 第3のプールされた試験サンプルに対して第2の断片サイズ選択を行ない、かつ懸濁物中の標的核酸集団を単離して、該標的核酸集団に関して富化され、かつそれぞれの該起源サンプルからの実質的に等しい割合を含む、第4のプールされた試験サンプルを形成させるステップであって、該第4のプールされた試験サンプルは診断アッセイに対して準備できているステップ
を含む、プールされた核酸サンプルの遺伝学的診断アッセイの感度および解像度を強化する方法。

(26) ステップfが配列決定により行なわれる、(25)の方法。

(27) 前記配列決定がペアエンド配列決定である、(25)の方法。

(28) ステップfが定量的PCRにより行なわれる、(25)の方法。

(29) ステップfがデジタルPCRにより行なわれる、(25)の方法。

(30) 前記デジタルPCRがドロップレットデジタルPCRである、(29)の方法。

(31) 前記第4のプールされた試験サンプルを配列決定し、かつ遺伝的異常に関して標的核酸集団をスクリーニングするステップをさらに含む、(25)の方法。

(32) 第4のプールされた試験サンプル中の核酸断片を、それぞれの起源サンプルとペアリングさせるステップをさらに含む、(25)の方法。

(33) 前記核酸がゲノムDNAである、(25)の方法。

(34) 前記核酸がFFPE DNAである、(25)の方法。

(35) 前記核酸がRNAである、(25)の方法。

(36) 前記核酸が無細胞DNAである、(25)の方法。

(37) 前記核酸が全血から単離される、(25)の方法。

(38) 前記固有の数値的オフセット値が、核酸単位の第1の数により、ステップeで決定される標的核酸集団の存在量を除算することにより算出される、(25)の方法。

(39) 前記標的核酸集団が、前記無細胞DNAの胎児画分である、(25)の方法。

(40) 前記標的核酸集団が、前記無細胞DNAの腫瘍画分である、(25)の方法。

(41) 前記標的核酸集団が、特定のメチル化痕跡を含む断片である、(25)の方法。

(42) 前記メチル化痕跡が、過剰メチル化または過少メチル化である、(25)の方法。

(43) 前記標的核酸集団が、所定の長さ範囲内の核酸断片に関して富化される、(25)の方法。

(44) 前記標的核酸集団が、所定の長さの断片に関して富化される、(25)の方法。

(45) 前記標的核酸集団が、特定のメチル化痕跡を含む断片に関して富化される、(25)の方法。

(46) 前記メチル化痕跡が、過剰メチル化または過少メチル化である、(25)の方法。

(47) 前記断片サイズ選択が、ゲル電気泳動を用いて行なわれる、(25)の方法。

(48) 前記核酸単位の第1および第2の数が、マイクロリットル、ナノグラム、およびモルからなる群より選択される、(25)の方法。

(49) 全ゲノム配列決定を行なうステップをさらに含む、(25)の方法。

(50) 前記プールされた試験サンプルが、2～1000種類の異なるサンプルを含む、(25)の方法。

(51) a. 少なくとも1種の試験被験体から核酸を単離および精製して、少なくとも1種の起源サンプルを生成させるステップ；
b. 該少なくとも1種の試験被験体に対する核酸ライブラリーを調製するステップであって、このとき、核酸断片がバーコード付加され、かつ該核酸ライブラリーが該少なくとも1種の起源サンプルに対応するステップ；
c. 該核酸ライブラリーから第1の数の核酸単位を添加して、第1の試験サンプルを形成させるステップ；
d. 該核酸ライブラリー内の断片サイズ分布を決定するステップ；
e. 該核酸ライブラリー中の標的核酸集団の存在量を算出するステップ；
f. 該核酸ライブラリーに対する固有の数値的オフセット値を算出するステップ；
g. 固有の数値的オフセット値に基づいて該核酸ライブラリーから第2の数の核酸単位を添加して、第2の試験サンプルを形成させるステップ；および
h. 第2の試験サンプルに対して断片サイズ選択を行ない、かつ懸濁物中の標的核酸集団を単離して、該標的核酸集団に関して富化された第3の試験サンプルを形成させるステップであって、このとき、該第3の試験サンプルは診断アッセイに対して準備できているステップ
を含む、遺伝学的診断アッセイの感度および解像度を強化する方法。

(52) 複数の試験被験体、複数の起源サンプル、および該複数の起源サンプルに対応する複数の核酸ライブラリーを含む、(51)の方法。

(53) 単一の試験被験体、単一の起源サンプル、および該起源サンプルに対応する単一の核酸ライブラリーを含む、(51)の方法。

(54) ステップa～hのうちの1種以上が多重化され、かつ1枚以上のマイクロタイタープレート（起源サンプル当たり1ウェル）上で行なわれる、(52)の方法。

(55) 前記複数の核酸ライブラリーが、診断アッセイに先立ってプールされる、(54)の方法。

参照による組み込み
本明細書中で言及されるすべての刊行物、特許、および特許出願は、各個別の刊行物、特許、または特許出願が参照により組み込まれることが具体的かつ個別に示されている場合と同程度まで、参照により本明細書中に組み入れられる。参照により組み込まれる刊行物および特許または特許出願が本明細書中に含まれる開示と矛盾する限りは、本明細書が、いかなるそのような矛盾材料よりも優先されかつ/または上位になることが意図される。

本発明の代表的な実施形態が、以下の図面を参照して、より詳細に開示される。

本明細書中に記載される方法の実施形態を図示するフローチャートを示す図である。本明細書中に記載される方法（FXプロトコール）がどのようにして全BMIレベルにわたって胎児画分（FF）を増大させるかを図示するグラフを示す図である。試験要求用紙にBMI値を示した2,401名の患者に関して、方法前（丸）および後（三角形）に測定された胎児画分レベルが、患者のBMI値（縦軸）の関数としてプロットされる。上側パネルは、方法の適用アリまたはナシでのサンプルのヒストグラムをプロットする。男性胎児妊娠に関してプロットされたchrYからのcfDNA断片の存在量の測定を図示するグラフを示す図である。FXプロトコールは、本図面中で「FFA」として標識される。 FXプロトコールを用いない元のFFの関数としての、FXプロトコール適用の結果としてのFFにおける変化差異倍率を図示するプロットを示す図である。点線は、FFにおける変化がないことを示し、陰付きの領域中のサンプルは、FXプロトコールを用いた場合に増大したFFを有した。図5Aは、FXプロトコールの結果としての常染色体当たりの深度中央値における変化の模式図を示す図である。バックグラウンドからの逸脱の程度は、それ自体がFFの尺度であり、かつFF_陽性として示される。図5Bは、FXプロトコールを用いない場合（丸）およびFXプロトコールを用いる場合（三角形）のFF_陽性の増大が、示される染色体異常を有する異数性サンプルに関して示されることを図示する図である。図5Cは、それらのスクリーニング結果により階層化され、かつ集団分布として要約された、図5Bと同じサンプルに関する、FXプロトコールを用いない場合（「標準的NIPS」）およびFXプロトコールを用いる場合（「FXプロトコールでのNIPS」）のzスコアを図示する図である。スクリーニング陰性サンプル（陰性；点線）の分布は、右側のスクリーニング陽性分布（実線）と比較可能な高さになるようにスケール変更されている。垂直実線は、スクリーニング陰性（左側）とスクリーニング陽性（右側）結果との間のzスコアカットオフを示す。SCAに関して、chrX異数性を特定するためにzスコアを用いるので、女性胎児妊娠のみが示され（すなわち、MXおよびTX）、zスコアを用いない二次元解析（図示していない）が、XXYおよびXYYの特定のために必要とされる（FXプロトコールを用いて試験されたすべてのXXYおよびXYY妊娠で増大するFF陽性）。NIPS：非侵襲的出生前スクリーニング、RAA：稀な常染色体異数性、SCA：性染色体異数性。図5Dは、それらのスクリーニング結果により階層化され、かつ個別のサンプルとして要約された、図5Bと同じサンプルに関する、FXプロトコールを用いない場合（丸）およびFXプロトコールを用いる場合（三角形）のzスコアを図示する図である。 FXプロトコールがどのようにしてFXプロトコールを用いない手順と比較してマッピングされたリードに関する変動係数（CV）を改善するかを図示するプロットを示す図である。 FXプロトコール（このプロット図中で「FFA」と標識される）および標準的NIPS条件下での、短い微小欠失（約3MB；各プロット図の左側で青色に陰付けされる）に関するアッセイ感度を比較するプロット図を示す図である。FFA（左側）の強化された胎児画分が微小欠失を明らかにし、標準的NIPS（右側）は陰性としてスクリーニングした。散布点は、ビンレベル標準化深度であり；黒色散布点は、青色点のローリング中央値（25ビンウインドウにわたる中央値）を示す。この特定の欠失は、典型的な5p欠失よりも短く、これに関する中央値3'ブレイクポイントが示される（http://dbsearch.clinicalgenome.org/search/）。FFは、FFAを用いた場合に11％であり、標準的NIPSを用いた場合に7％であった。 FXプロトコール（このプロット中で「FFA」と標識される）が、略完璧な分析特異度を伴う略完璧な分析感度を可能にすることを示す、染色体異常の様々なクラスに関するROC曲線グラフを示す図である。一般的な異数性の感度は、RAAの総計感度（aggregate sensitivity）であり、FXプロトコールを用いる場合により高い。女性または男性とコールされるサンプルに関するFFchrY値の分布を示す図である。標準的NIPS（上側）およびFXプロトコールを用いるプリクエル（下側）の両方に関して、実線は生データを示し、点線は女性（ガウス分布）および男性（ベータ分布）集団に対する最良適合トレースを示す。正倍数性サンプルのみが含められる。矢印は、標準的NIPSで女性とコールされ、かつFXプロトコールを用いた場合に男性とコールされる（胎児は男性であることが確認された）両方のプラットフォームで試験された1つのサンプルを描写する。各プラットフォームでの推定されるミスコールの個数を最小化した後、解析上のミスコールは、FXプロトコールを用いて318倍低下することが予測される。胎児由来cfDNAは、母体由来cfDNAよりも存在量が低くかつ秩序良く短いことを図示する模式図を示す図である。標準的NIPSアプローチは、長さとは無関係に、すべてのcfDNAのサンプルを配列決定する。母体由来cfDNA分布と比較して相対的に多くの胎児由来cfDNA分布が保持されるので、比較的短いcfDNA断片を選択するためにアガロースゲル電気泳動を用いて、FXプロトコール（または本図面中で標識される場合は「FFA」）はFFを増大させる。FXプロトコールは、サイズ選択を介して、胎児由来cfDNA断片の相対的濃度を増大させる。

本発明の様々な実施形態が本明細書中に示されかつ説明されてきたが、そのような実施形態は、例としてのみ提供されることが、当業者には明らかであろう。多数の変動、変化、および置換は、本発明から逸脱することなく、当業者が思い付くことができる。本明細書中に記載される本発明の実施形態に対する代替物を利用することができる。値が範囲として記載される場合、そのような開示は、具体的な数値または具体的な部分範囲が明示的に記載されているか否かにかかわらず、そのような範囲内のすべての考えられる部分範囲ならびにそのような範囲内に入る具体的な数値の開示を含むことが理解されるであろう。

ある用語が、文「本明細書中で用いる場合、用語『_____』は一般的に～を意味する」または類似の文を用いて本特許中で明示的に定義されない限り、その平易または通常の意味を超えて、明示的または暗示によるかのいずれかで、その用語の意味を限定する意図はなく、かつそのような用語は、（特許請求の範囲の文言を除いて）本特許のいかなる節中に行なわれるいかなる記述に基づいても、範囲に限定して解釈されるべきではない。本特許の末尾の特許請求の範囲に記載される任意の用語が単一の意味と合致する様式で本特許中で参照される程度まで、読者が混乱しないように明確にする目的のためだけに行われ、かつそのような特許請求の範囲の用語は、暗示またはそれ以外により、その単一の意味に限定されることは意図されない。最後に、特許請求の範囲の要素が、単語「意味する」および任意の構造の説明を伴わない機能を記述することにより定義されない限り、いかなる特許請求の範囲の要素の範囲も、米国特許法第112条、第6文の適用に基づいて解釈されることを意図されない。

別途定義されない限り、本明細書中で用いられるすべての技術的および科学的用語は、一般的に、本発明が属する分野の当業者により通常理解されるのと同じ意味を有する。一般的に、本明細書中で用いられる命名法ならびに以下に記載される細胞培養、分子遺伝学、有機化学、および核酸化学およびハイブリダイゼーションでの実験手順は、当技術分野で周知かつ一般的に利用されるものである。技術および手順は、一般的に、当技術分野で慣用の方法および本文書全体を通して提供される様々な一般的参考文献（一般的に、参照により本明細書中に組み入れられるSambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, 2d ed. (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.を参照されたい）に従って行なわれる。本明細書中で用いられる命名法ならびに以下に記載される分析化学、および有機合成での実験手順は、当技術分野で周知かつ一般的に利用されるものである。

本明細書中で用いる場合、単数形「a」、「an」および「the」は、文脈が明らかにそうでないことを指示しない限り、複数形の参照を含む。

本明細書中で用いる場合、用語「約」または「概ね」とは、一般的に、当業者により決定される通りの値に関する許容可能な誤差範囲内を意味し、これはその値がどのように測定または決定されるか、すなわち、測定系の限界に部分的に依存するであろう。例えば、「約」とは、関連する分野での実務に従い、1または1超の標準偏差以内を意味することができる。あるいは、「約」とは、所与の値の20％まで、10％まで、5％まで、または1％までの範囲を意味することができる。

本明細書中で用いる場合、用語「被験体」とは、一般的に、哺乳動物（例えば、ヒト）もしくは鳥類（例えば、鳥）などの動物、または植物などの他の生物を意味する。例えば、被験体は、脊椎動物、哺乳動物、げっ歯類（例えば、マウス）、霊長類、類人猿またはヒトであり得る。動物としては、限定するものではないが、家畜、競技動物、およびペットが挙げられる。被験体は、健康もしくは無症候個体、疾患もしくは疾患に対する素因を有するかまたは有することが疑われる個体、および/あるいは治療を必要とするかまたは治療が必要であると疑われる個体であり得る。被験体は、患者であり得る。被験体は、微生物（microorganismまたはmicrobe）（例えば、細菌、真菌、古細菌、ウイルス）であり得る。

本明細書中で用いる場合、用語「ゲノム」とは、一般的に、被験体由来の遺伝情報を意味し、例えば、被験体の親から伝わった情報のうちの少なくとも一部分または全体であり得る。ゲノムは、DNA中またはRNA中のいずれかにコードされることができる。ゲノムは、コード領域（例えば、タンパク質をコードする）ならびに非コード領域を含むことができる。ゲノムは、生物中に揃ったすべての染色体の配列を含むことができる。例えば、ヒトゲノムは、通常、合計46本の染色体を有する。これらの揃ったすべての配列が、ヒトゲノムを構成することができる。

本明細書中で用いる場合、用語「ポリヌクレオチド」、「ヌクレオチド」、「ヌクレオチド配列」、「核酸」および「オリゴヌクレオチド」は、相互に交換可能に用いられ、かつ一般的に、任意の長さの、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれか、またはそのアナログのヌクレオチドのポリマー形態を意味する。ポリヌクレオチドは、任意の三次元構造を有することができ、かつ既知または未知の任意の機能を実現することができる。以下のものは、ポリヌクレオチドの非限定的な例である：遺伝子もしくは遺伝子断片のコードまたは非コード領域、遺伝子間DNA、連鎖解析から規定される遺伝子座、エクソン、イントロン、メッセンジャーRNA（mRNA）、トランスファーRNA、リボソームRNA、低分子干渉RNA（siRNA）、低分子ヘアピンRNA（shRNA）、マイクロRNA（miRNA）、低分子核小体RNA、リボザイム、cDNA、FFPE DNA、組み換えポリヌクレオチド、分岐鎖ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、アプタマー、およびプライマー。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチドアナログなどの、修飾型ヌクレオチドを含むことができる。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーの組み立ての前または後に賦与することができる。ヌクレオチドの配列は、非ヌクレオチド構成要素により中断されることができる。ポリヌクレオチドは、標識性構成要素、タグ、反応性部分、または結合性パートナーとのコンジュゲート化によるなど、重合後にさらに修飾することができる。提供される場合、ポリヌクレオチド配列は、別途記載されない限り、5'から3'方向で列記される。

本明細書中で用いる場合、用語「遺伝子」とは、一般的に、ポリペプチドの生成に関与し、かつコード領域に先行する領域およびコード領域に続く領域ならびに個別のコードセグメント（エクソン）間の介在性配列（イントロン）を含むDNAセグメントを意味する。

本明細書中で用いる場合、用語「塩基対」または「bp」とは、一般的に、二本鎖DNA分子中のアデニン（A）とチミン（T）との、またはシトシン（C）とグアニン（G）との相互関係（すなわち、水素結合型対形成）を意味する。一部の実施形態では、塩基対は、例えば、DNA/RNA二重鎖中の、ウラシル（U）と対形成したAを含むことができる。

本明細書中で用いる場合、用語「バーコード」とは、一般的に、そのバーコードが伴うポリヌクレオチドの一部の特徴が特定されることを可能にする既知の核酸配列を意味する。一部の実施形態では、特定対象であるポリヌクレオチドの特徴は、ポリヌクレオチドが由来するサンプルである。一部の実施形態では、バーコードは、約もしくは少なくとも約3、4、5、6、7、8、9、10、11、12、13、14、15またはそれ以上のヌクレオチド長である。一部の実施形態では、バーコードは、10、9、8、7、6、5、または4ヌクレオチド長未満である。一部の実施形態では、一部のポリヌクレオチドに伴うバーコードは、他のポリヌクレオチドに伴うバーコードとは異なる長さである。一般的に、バーコードは、十分な長さであり、かつそれらが伴うバーコードに基づいて、サンプルの特定を可能にするために十分に異なる配列を含む。一部の実施形態では、バーコード、およびそれが伴うサンプル供給源は、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個もしくはそれ以上のヌクレオチドの突然変異、挿入、または欠失などの、バーコード配列中の1個以上のヌクレオチドの突然変異、挿入、または欠失後に、正確に特定することができる。一部の実施形態では、複数のバーコード中の各バーコードは、少なくとも3箇所、4箇所、5箇所、6箇所、7箇所、8箇所、9箇所、10箇所、またはそれ以上のヌクレオチド位置などの、少なくとも3箇所のヌクレオチド位置で、複数の中のすべての他のバーコードとは異なる。複数のバーコードは、サンプルのプール中に表わすことができ、各サンプルは、プール中の他のサンプルから誘導されるポリヌクレオチドに含められるバーコードとは異なる1種以上のバーコードを含むポリヌクレオチドを含む。1種以上のバーコードを含むポリヌクレオチドのサンプルは、それらが組み合わせられるバーコード配列に基づいてプールして、それにより、4種類のヌクレオチド塩基A、G、C、およびTが、プール中の各バーコードに沿った1箇所以上の位置（バーコードのうちの1箇所、2箇所、3箇所、4箇所、5箇所、6箇所、7箇所、8箇所、もしくはそれ以上の位置、またはすべての位置など）で概ね均等に表わされるようにすることができる。一部の実施形態では、本発明の方法は、標的ポリヌクレオチドが組み合わせられるバーコード配列に基づいて、標的ポリヌクレオチドがそれに由来するサンプルを特定するステップをさらに含む。一般的に、バーコードは、標的ポリヌクレオチドと組み合わせられた場合に、標的ポリヌクレオチドが由来するサンプルの識別子として機能する核酸配列を含む。一部の実施形態では、別個の増幅反応が、各サンプルに対する少なくとも1種の異なるバーコード配列を含む増幅プライマーを用いて、別個のサンプルに関して行なわれ、それにより、2種以上のサンプルのプールにおいて1種を超えるサンプルの標的ポリヌクレオチドに組み合わせられるバーコード配列がなくなる。一部の実施形態では、異なるサンプルに由来しかつ異なるバーコードを含む増幅されたポリヌクレオチドが、ポリヌクレオチドのその後の操作に進む前に（増幅および/または固相上での配列決定前など）、プールされる。プールは、反応体積全体をはじめとする全構成要素増幅反応の任意の画分を含むことができる。サンプルは、均等または不均等にプールすることができる。一部の実施形態では、標的ポリヌクレオチドは、それらが組み合わせられるバーコードに基づいてプールされる。プールは、約2種、3種、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、20種、25種、30種、40種、50種、75種、100種もしくはそれ以上、約2種、3種、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、20種、25種、30種、40種、50種、75種、100種もしくはそれ以上未満、または約2種、3種、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、20種、25種、30種、40種、50種、75種、100種もしくはそれ以上を超える異なるサンプルに由来するポリヌクレオチドを含むことができる。

本明細書中で用いる場合、用語「配列決定」とは、一般的に、1種以上のポリヌクレオチド中のヌクレオチド塩基の配列を決定するための方法および技術を意味する。例えば、ポリヌクレオチドは、デオキシリボ核酸（DNA）またはリボ核酸（RNA）などの核酸分子であり得る（その変異体または誘導体を含む（例えば、一本鎖DNA））。配列決定は、限定するものではないが、Illumina(登録商標)社、Pacific Biosciences社（PacBio(登録商標)）、Oxford Nanopore(登録商標)社、またはLife Technologies社（Ion Torrent(登録商標)）による配列決定システムなどの、現在利用可能な様々なシステムにより行なうことができる。そのようなシステムは、被験体により提供されるサンプルからシステムにより生成される場合、被験体（例えば、ヒト）の遺伝情報に対応する複数の生の遺伝学的データを提供することができる。一部の例では、そのようなシステムは、配列決定リード（本明細書中で「リード」とも称される）を提供する。リードは、配列決定された核酸分子の配列に対応する核酸塩基の文字列を含むことができる。

本明細書中で用いる場合、「次世代シーケンシング」（NGS）とは、一般的に、単一サンプル由来または複数の異なるサンプル由来の複数、例えば100万個の核酸断片が一斉に配列決定される、クローン的に増幅された核酸分子および単一核酸分子の大規模な並行配列決定を可能にする配列決定方法を意味する。NGSの非限定的な例としては、合成による配列決定（sequencing-by-synthesis）、ライゲーションによる配列決定（sequencing-by-ligation）、リアルタイム配列決定、およびナノポア配列決定が挙げられる。

本明細書中で用いる場合、用語「ペアエンド配列決定」（paired-end sequencing）とは、一般的に、核酸分子の両方の末端から配列決定データを生成する高スループット配列決定に基づく方法を意味する。方法は、一般的に、内部に向かって核酸配列の末端から配列決定するステップを含む。ペアエンド配列決定は、2種類の配列の間に位置するDNAのセグメントの長さを決定するために有用である。

本明細書中で用いる場合、用語「全ゲノム配列決定」（whole genome sequencing）とは、ゲノムの完全なDNA配列を一度に決定することを意味する。本明細書中で用いる場合、「全ゲノム配列」またはWGS（当技術分野で「全部」、「完全」または「全体」ゲノム配列とも称される）とは、一般的に、必ずしも完全ではないが、被験体の相当なゲノムを包含することを意味する。当技術分野では、用語「全ゲノム配列」またはWGSは、一部の用法では少なくとも95％完全などの、被験体の略完全なゲノムを意味するために用いられる。用語「全ゲノム配列」またはWGSは、本明細書中で用いる場合、典型的にゲノムのうちの0.1％未満を網羅する一塩基多型（SNP）遺伝子型決定などの遺伝子特異的技術について利用される「配列」を包含しない。用語「全ゲノム配列」、またはWGSは、本明細書中で用いる場合、ゲノムがいずれかの参照配列とアライメントされることを必要とせず、かつ変異体または他の特徴が注釈付けされることを必要としない。

用語「断片サイズ分布」とは、特定の群に対応する分子（例えば、特定の染色体領域に由来する核酸断片）の長さ、質量、重量、またはサイズの他の尺度を表わす、いずれか1つの値または値の組を意味する。様々な実施形態が、多様なサイズ分布を用いることができる。一部の実施形態では、サイズ分布は、他の染色体の断片と比較した、ある染色体の断片のサイズ（例えば、算術平均（average）、中央値、または平均（mean））のランク付けに関する。他の実施形態では、サイズ分布は、染色体の断片の実際のサイズの統計学的値に関することができる。一遂行では、統計学的値は、染色体の断片のいずれかの算術平均、平均、または中央値サイズを含むことができる。別の遂行では、統計学的値は、全断片の、または少なくともより大きなカットオフ値未満の断片の合計長さにより除算することができる、カットオフ値未満の断片合計長さを含むことができる。

本明細書中で用いる場合、一般的に、用語「ライブラリー」または「配列決定ライブラリー」とは、例えば、大規模並行法、例えば、NGSを用いて、配列決定のために加工される、核酸（例えば、DNAまたはRNA）を意味する。核酸は、任意により、NGSまたは他の好適な技術により配列決定されることができる、加工済み核酸の複数コピーの集団を得るために、増幅することができる。

本明細書中で用いる場合、一般的に、「画分増幅化技術」（fraction multiplier technology）または「FX技術」または「FXプロトコール」とは、標的核酸画分（例えば、cffDNA）の収率を増大させ、それにより、例えば、ゲノムにわたる任意のサイズのコピー数変化から生じる胎児異常などの、異常の検出に関する感度を増大させるための、本明細書中に記載される方法を意味する。FXプロトコールを利用する方法の実施形態が、以下でさらに詳細に記載される。一部の実施形態では、FXプロトコールは、標的核酸画分の相対的存在量を増大させるために、標的核酸分子の低減されたサイズを活用する。そのような例では、方法は、「胎児画分増幅」または「FFA」と称される場合がある。

図1を参照すると、一実施形態では、生物学的試料が試験被験体から収集され（例えば、妊婦由来の血漿）、核酸が、単離、精製され、ライブラリーが調製され、かつ配列に基づくバーコードと組み合わせられたプライマーを用いて増幅される。一部の実施形態では、核酸は、ホルマリン固定パラフィン包埋組織から抽出される（FFPE DNA）。ホルマリンは、長期的組織サンプル保存および保管のための固定剤として一般的に用いられる。固定プロセスは組織の超微細構造を適切に保存するが、組織内のDNAに対する様々な種類の損傷をもたらす。FFPE DNAのDNA損傷痕跡としては、N-グリコシル結合の加水分解、脱アミノ化、酸化、チミン二量体、ニック、および二本鎖切断が挙げられる。二本鎖切断は、様々な長さのゲノムDNA断片を生じる。固有バーコード配列は、それぞれの元のサンプル（「起源サンプル（sample of origin）」または「元のサンプル（original sample）」）に対して用いられる。この実施形態では、固有配列に基づくバーコード（ヌクレオチド配列識別子またはNSIとしても知られる）は、起源サンプルの同一性を保存する目的で、核酸断片を標識するために用いられる。一般的に、高スループット配列決定技術は、しばしば核酸断片に対するバーコードのライゲーションを含み、それはその核酸断片の捕捉、増幅および/または配列決定のために用いられるプライマー結合部位を含み得る。この技術は、異なる起源由来のサンプルが単一の高スループット配列決定実行へと組み合わせられる場合に、特に有用である。配列に基づくバーコードは、技術者が、プールされた試験サンプルから各サンプルの起源をたどることを可能にする。各サンプルの起源を追跡するためにヌクレオチド配列識別子を利用するそのような高スループット配列決定システムが、当技術分野で公知である。この技術の非限定的な例は、多重化識別子配列（MID）を利用する、Roche社により設計されたゲノムシーケンサーFLXシステムである。類似のヌクレオチド配列識別子が、次世代シーケンシング（NGS）を用いる他の配列決定システムに対して利用可能である。

以下の説明は、プールされたサンプルに対する方法の実行を含み；しかしながら、本明細書中に記載されるプロセスが、単一サンプルおよび/または多重化（multiplex）サンプルに対して等しく適用可能であることを、注記するべきである。例えば、多重PCR反応を、標的核酸に関して富化するために用いることができる。1つの多重化実施形態では、PCRプライマーをバーコードに対して設計することができ、かつPCR反応を、バーコードを含む配列を増幅するために実行することができる。別の実施形態では、元のサンプルを、所望の混合比率へと組み合わせて、第1のプールされた試験サンプルが生成される。一実施形態では、所定量の元のサンプルを添加して第1のプールされた試験サンプルを生成させ、それにより、各サンプルの単位を、実質的に同等（例えば、1：1：1：1等）、等混合比率とする。「単位」は、例えば、ナノグラム（ng）、マイクロリットル（μL）、またはモル（mol）などの、測定の任意の適切な単位として定義することができる。

また別の実施形態では、第1のプールされた試験サンプルについて、特定の特徴（例えば、断片サイズ、分子量、メチル化状態）を保持する核酸断片の分布がアッセイされる。例えば、cfDNAまたはFFPE DNAの場合には、第1のプールされた試験サンプル内のそれぞれの元のサンプルの断片サイズ分布を推定するために、ペアエンド配列決定を用いることができる。ペアエンド配列決定は、当技術分野で公知であり、かつ元々はSmith, M. W. et al. (1994). Genomic sequence sampling: a strategy for high resolution sequence-based physical mapping of complex genomes. Nature Genetics. 7: 40-47に記載された。ペアエンド配列決定は、各DNA分子の両端に対する情報を取得する。配列アライメントを介してゲノムに対する2種類の配列の座標を見出すことにより、DNA断片の長さを推定することができる。1回の配列決定実験が、100万個～10億個のDNA断片に対する配列およびサイズ情報を生じる。配列決定は、限定するものではないが、Illumina(登録商標)、Pacific Biosciences社（PacBio(登録商標)）、Oxford Nanopore(登録商標)、またはLife Technologies社（Ion Torrent(登録商標)）による配列決定システムなどの、現在利用可能な様々なシステムにより行なうことができる。他の好適な技術が、断片サイズ分布を決定するために利用可能であることが、理解されるべきである。例えば、Jiang, J., et al. (2018). Analysis of the concentrations and size distributions of cell-free DNA in schizophrenia using fluorescence correlation spectroscopy. Translational Psychiatry. 8:104に記載される通りの蛍光相関分光法である。

一実施形態では、第1のプールされた試験サンプルにおける断片サイズ分布が決定されたら、続いて、長さビン内の標的断片サイズ範囲（例えば、100～165bp）内のDNA断片、または代替的に、特定の標的サイズ（例えば、165bp）のDNA断片のサンプル特異的相対量（すなわち、選択された単位での）を、それぞれの元のサンプルに関して算出することができる。サンプル特異的相対量は、ポリメラーゼ連鎖反応（PCR）、定量的PCR（qPCR）、ドロップレットデジタルPCR（ddPCR）、および等温増幅などの増幅手順を用いて算出することができる。別の実施形態では、サンプル特異的相対量を用いて、数値的オフセット値を、サンプル特異的相対量（単位）/第1のプールされた試験サンプル中の総単位の比率を決定することにより、算出することができる。また別の実施形態では、断片サイズ選択のために第2のプールされた試験サンプルへと添加される、サンプル特異的ライブラリーからの重み付けされた単位の数（例えば、μL、ng等）を算出するために、数値的オフセット値が用いられる。

一実施形態では、各起源サンプルの重み付けされた数の単位（例えば、質量、体積等に基づく）を一緒に混合し、第2のプールされた試験サンプルが生成される。一部の実施形態では、重み付けされた数の単位を混合し、それにより、単位が実質的に等しい割合となる。一部の実施形態では、不等量（所定のサンプル特異的単位）の1種以上の起源サンプルが、実行されるアッセイに応じて、一緒に混合される。第2のプールされた試験サンプルが生成されたら、所望の断片長さに関して選択するために、断片サイズ選択を行なうことができる。一部の実施形態では、所望の核酸サイズ画分を単離、切り出し、および精製し、かつ標的サイズ範囲内または特定の標的サイズの核酸断片を含有する第3のプールされた試験サンプルを生成するために、ゲル電気泳動を用いることができる。一実施形態では、核酸電気泳動分離およびそれに続く所望の断片長の回収が用いられる。様々な公知の電気泳動プロセスをこの目的のために用いることができるが、一実施形態では、高スループット核酸サイズ選択のための、Ranger Technology^TMを用いるNIMBUS Select^TMワークステーションを用いることができる。

断片選択のための代替的な技術、例えば、重亜硫酸塩変換技術およびそれに続くメチル化DNAに対するカラム上精製；メチル化DNA免疫沈降（他の核酸と比較した核酸メチル化に基づく）；固相捕捉（例えば、アフィニティーカラム）（抗体コーティングスピンカラムなど）；抗力変化の同期（または非同期）係数サイズ選別（synchronous (or non-synchronous) coefficient of drag alteration sizing：SCODA）；固相可逆固相化サイズ選別（例えば、カルボキシル化磁性ビーズを用いる）；アフィニティークロマトグラフィープロセス、または様々な長さのアンプリコンを伴うPCR増幅とマイクロチップ分離との組み合わせを用いることができることが、理解されるべきである。

別の実施形態では、特定のサイズまたはサイズ範囲の標的核酸断片に関して富化された核酸混合物を含み、ならびに元のサンプルのうちの各々からの所定の割合（等しいかまたは様々な割合）を含有する第3のプールされた試験サンプルの調製に続いて、第3のプールされた試験サンプルが、次世代シーケンシング（NGS）などにより配列決定される。第3のプールされた試験サンプルが配列決定されたら、上記でさらに詳細に記載される通りに、バーコード配列に基づいて起源サンプルに対してリードをペアリングさせるために、市販のソフトウェアプログラムを介して、バーコードをデコンボリューションすることができる。起源サンプルに対するリードペアリングに続いて、配列決定リードを、所望の場合、実行されるスクリーニングに応じて、解析することができる。

代替的な実施形態では、例えば、ペアエンド配列決定を介する上記の断片サイズ分布ステップを省略して、第1のプールされたサンプルに対して断片サイズ選択を行なうことにより、数値的オフセット値が決定される。この実施形態では、所定量の第1のプールされた試験サンプルを用いて、標的サイズ範囲内または特定の標的サイズの核酸断片を含有する第2のプールされた試験サンプルを単離、抽出、および生成する。一実施形態では、核酸の電気泳動分離およびそれに続く所望の長さの核酸断片の回収が、上記の通りに用いられる。一部の実施形態では、回収に続いて、第2のプールされた試験サンプルを配列決定し、各起源サンプル内の標的断片の相対的存在量を、サンプル特異的ビン内の特異的サンプルに対して割り当てられたリード数に基づいて推定することができる。続いて、長さビン内の標的断片サイズ範囲（例えば、100～165bp）内のDNA断片、または代替的に、特定の標的サイズ（例えば、165bp）のDNA断片のサンプル特異的相対量（すなわち、選択された単位での）を、それぞれの元のサンプルに関して算出することができる。サンプル特異的相対量は、ポリメラーゼ連鎖反応（PCR）、定量的PCR（qPCR）、ドロップレットデジタルPCR（ddPCR）、および等温増幅などの増幅手順を用いて算出することができる。別の実施形態では、サンプル特異的相対量を用いて、数値的オフセット値を、サンプル特異的相対量（単位）/第1のプールされた試験サンプル中の総単位の比率を決定することにより、算出することができる。また別の実施形態では、断片サイズ選択のために第2のプールされた試験サンプルへと添加される、サンプル特異的ライブラリーからの重み付けされた単位の数（例えば、μL、ng等）を算出するために、数値的オフセット値が用いられる。この実施形態では、数値的オフセット値は、サンプル特異的配列決定リードから観察される相対的存在量に基づいて決定される。数値的オフセット値に基づいて調整される、各起源サンプルからのアリコートをプールして、第3のプールされた試験サンプルが生成され、断片サイズ選択/配列決定ステップが繰り返される。理想的には、等しい相対的存在量（モル濃度、分子量等に基づく）の標的断片が、第3のプールされた試験サンプル中に存在し、これはまた標的断片に関して富化される。一部の実施形態では、第3のプールされた試験サンプルに対する第2の断片サイズ選択を、慣用の技術を用いて行なうことができ、かつ標的核酸集団が懸濁物中で単離され、これにより、当該標的核酸集団に関して富化され、かつそれぞれの当該起源サンプルからの実質的に等しい割合を含む第4のプールされた試験サンプルが形成される。一部の実施形態では、第3のプールされた試験サンプルおよび/または第4のプールされた試験サンプルが、遺伝的異常に関して標的核酸集団をスクリーニングするために配列決定される。

一実施形態では、FXプロトコールを、全ゲノム配列決定（WGS）に基づくNIPSと組み合わせることができる。例えば、WGSに基づくNIPS（FXプロトコールを用いない）は、ゲノム中のどこかでの新規微小欠失を特定するために構成されているが、その感度および解像度は、7MB長を超える微小欠失に限定される。多数の微小欠失は7MB未満に及ぶので、ゲノムにわたる小さな領域に関する感度の増大は、大きな臨床的価値を有し得るであろう。ゲノム全体にわたるコピー数変異体検出の解像度の限界は、サンプル中のシグナルの相対量（サンプル中のFFの相対量およびCNVのサイズにより決定付けられる）およびサンプル中に存在するノイズの量（サンプルが配列決定される深度により決定付けられる）により駆動される（例えば、低FFを有するサンプル中の小さな欠失を検出することは、より困難である）。より深い配列決定により解像度を増大させるための試みは、減少した、結果および迅速な取得を提供し、経済的に存続不能なスクリーニング試験である。したがって、FF（胎児画分）を増大させる方法は、これらの状況下では好ましく；それゆえ、FXプロトコールの影響および適用可能性を示す。

以下で議論される各実施例に関して、すべてのサンプルは、非特定化研究に同意し、かつプリクエルNIPSを用いる検査を受けた患者からのものであった。研究は、Advarra社による施設内審査委員会（IRB）免除を付与された（Pro0042194）。

実施例1
2段階遠心分離プロセスを用いる1600gで10分間の遠心分離を介して、10mL全血サンプルから血漿を分離し、血漿を微小遠沈管に移し、16,000×gで10分間遠心分離した。DNA抽出まで、血漿を－80℃で保存した。循環核酸キット（Qiagen社、GE）を用いて、0.6mL無細胞血漿からDNA断片を抽出した。Ion ProtonプラットフォームのためのIon Plus断片ライブラリーキット（Life Technologies社、USA）を、各血漿サンプルに対する配列決定ライブラリーを構築するために用い、ライブラリーを、Qubit蛍光光度計上で定量化し、ここで各サンプル特異的ライブラリーは、実質的に同じ濃度の総DNAを含有した。サンプル特異的ライブラリーは、起源サンプルの同一性に関してバーコード付加される。各ライブラリーは、特定のサイズ範囲（100～165bp）または特定の標的サイズ（165bp）内のDNAを異なる量で含有する。表1に示される通り、サンプル1～5（残りのサンプルは示していない）を1：1比率（各10ng）で混合し、第1のプールされた試験サンプル（FPTS）を生成した。

一部の実施形態では、代替的な抽出およびライブラリー調製プロトコールは、比較的均一な濃度および断片サイズまたは長さ（例えば、165bp）でのサンプルを得るために、シラノールコーティング磁性ビーズ（Dynabeads、ThermoFisher社）を用いる血漿からの標的核酸画分（例えば、cffDNA）の抽出を含む。標的核酸画分を定量化し（PicoGreen、ThermoFisher社）、かつ製造業者の説明書を用いて、Illuminaプラットフォームに対して好適なバーコード付加型次世代（NGS）適格配列決定ライブラリーへと変換した。12ラウンドのポリメラーゼ連鎖反応（PCR）（KAPA HiFi HotStart PCRキット、Roche社）を介してライブラリーを増幅し、その後、磁性ビーズに基づくPCR浄化およびそれに続くさらなる定量化ラウンドを行なった。

FPTS内の各サンプルの断片サイズ分布を決定し、標的サイズ範囲（100～165bp）内のDNAの相対量（ng）を取得した。FPTS中に代表される各サンプル由来の2μLサンプルを、断片アナライザー（Advanced Analytical Technologies社、Ames Iowa）を用いて断片サイズ分布に関して分析した。引き続き表1を参照すると、FPTSについて添加された総単位（total unit）（10ng）と比較して、各サンプル1～5について、DNAが標的サイズ範囲内にあるの割合が算出される。得られた値を用いて、標的サイズ範囲内の等しくかつ所定のDNA単位（1ng）を有するために5種類のサンプルのそれぞれから必要とされるDNAの総量を算出した。

計算に従って、各サンプルについて標的サイズ範囲内のDNAを1ng添加するであろう体積で、元のライブラリーサンプルを再混合し、第2のプールされた試験サンプル（SPTS）を生成させた。SPTSを、Qiao et al.およびLiang et al.の通りに、2％E-Gel EX CloneWellアガロースゲル（Invitrogen社、Carlsbad, CA, USA）を用いる断片サイズ選択手順に供した。1個のE-Gelは6個の有効ウェルを含み、各ウェルはDNA配列決定ライブラリーの5種類のサンプルを含有する混合サンプルを処理できる。標的サイズ範囲内のDNAをゲル上の底部ウェルから回収し、選択されたライブラリー（すなわち、第3のプールされた試験サンプル（TPTS））を、Ion Protonシステム（Life Technologies社）を用いて配列決定した。他の配列決定戦略、例えば、Illumina HiSeq 4000およびそれに続くカスタムバイオインフォマティクスパイプラインを介する処理を用いることができる。

断片サイズ選択のための他の戦略としては、「range」モードに関する製造業者の説明書に従う、2％アガロースカセット（BluePippin、Sage Science社）上での電気泳動が挙げられる。溶出されるDNAの所望の標的サイズが、例えば、140ntになるまで、短い断片がゲルから溶出される。図10を参照されたい。胎児cfDNAに関して、このサイズは適正に胎児cfDNAを保持し、母体cfDNAを枯渇させる。胎児由来断片は総サイズ選択cfDNAのうちの比較的高い画分を含むので、サイズ選択されたライブラリーは比較的高いFFを有した。

バーコード配列に基づいて起源サンプルに対してリードをペアリングさせるために、市販のソフトウェアプログラムを介してバーコードをデコンボリューションし、続いて、関連する医学的状態または染色体異常、例えば、胎児異数性に関して、リードをスクリーニングした。

実施例2
FXプロトコールを分析的に検証するために、2段階遠心分離プロセスを用いて10mLの全血サンプル（11バッチに対して試験した1,264個のNIPS患者サンプルおよび66個の対照）から血漿を抽出し、血漿を微小遠沈管に移し、残留細胞を除去して無細胞血漿を得るために16,000×gで10分間遠心分離し、無細胞血漿をDNA抽出まで－80℃で保存した。循環核酸キット（Qiagen社、GE）を用いて、0.6mLの無細胞血漿からDNA断片を抽出した。Ion ProtonプラットフォームのためのIon Plus断片ライブラリーキット（Life Technologies社、USA）を用いて各血漿サンプルに対して配列決定ライブラリーを構築し、Qubit蛍光分光計上でライブラリーを定量化し、ここで各サンプル特異的ライブラリーは、実質的に同じ濃度の総DNAを含有した。サンプル特異的ライブラリーは、起源サンプルの同一性に関してバーコード付加される。各ライブラリーは、特定のサイズ範囲（100～165bp）または特定の標的サイズ（165bp）内のDNAを様々な量で含有する。サンプルを1：1比率（各10ng）で混合し、第1のプールされた試験サンプル（FPTS）を生成した。

各患者サンプルを、2つのワークフローを通して処理した：(1) FXプロトコールを用いない標準的なWGSに基づくNIPSまたは(2) FXプロトコールを用いるWGSに基づくNIPS。FXプロトコールは、胎児cfDNAの相対的存在量を増大させるために、胎児由来cfDNA分子の低減したサイズを活用する。ワークフローを、完全に独立して、それぞれ反復血漿アリコートからのcfDNAの抽出から開始して実行した。

FPTS内の各サンプルの断片サイズ分布を決定し、標的サイズ範囲（100～165bp）内のDNAの相対量（ng）を取得した。FPTS中に代表される各サンプル由来の2μLサンプルを、断片アナライザー（Advanced Analytical Technologies社、Ames Iowa）を用いて断片化サイズ分布に関して分析した。FPTSに添加された総単位（10ng）と比較して、各サンプルについてDNAが標的サイズ範囲内にある割合を算出した。得られた値を用いて、標的サイズ範囲内の等しくかつ所定のDNA単位（1ng）を有するために5種類のサンプルのそれぞれから必要とされるDNAの総量を算出した。計算に従って、各サンプルにについて標的サイズ範囲内のDNAを1ng添加するであろう体積で元のライブラリーサンプルを再混合し、第2のプールされた試験サンプル（SPTS）を生成させた。SPTSを、この場合はE-Gel CloneWellアガロースゲル（Invitrogen社、Carlsbad, CA, USA）を用いる断片サイズ選択手順に供した。1個のE-Gelは6個の有効ウェルを含み、各ウェルはDNA配列決定ライブラリーの5種類のサンプルを含有する混合サンプルを処理できる。標的サイズ範囲内のDNAをゲル上の底部ウェルから回収し、選択されたライブラリー（すなわち、第3のプールされた試験サンプル（TPTS））を、Ion Protonシステム（Life Technologies社）を用いて配列決定した。

A. FXプロトコールは胎児画分（FF）を増大させる
FXプロトコールの影響を直接的に測定するために、FF＞4％を有するサンプルの個数に特に焦点を当てて、標準的NIPSおよびFXプロトコールの両方を用いて、サンプルを試験した。米国臨床遺伝・ゲノム学会（ACMG）に従えば、低FFに対する閾値は4％未満である。図2（上側）に示される通り、標準的NIPSプロトコールを用いて試験したサンプルのうちの3.7％が、4％未満のFF（例えば、cffDNAを含有する画分）を有した。しかしながら、FXプロトコールを用いた場合、0個のサンプルが4％未満のFFを有した。FX群で観察された最小値FFは4.9％であった。高BMIを有する患者由来のサンプルは低FFを有する傾向があり、かつ標準的NIPSを用いた場合に試験失敗の上昇を引き起こすことが観察されているので、サンプルを、それらのBMIクラスにより分割した（図2（下側））。サンプルのうちの16％が標準的NIPSを用いた場合に低FFを有した最高BMIレベル（クラスIII肥満）でさえも、FXプロトコールを用いて試験したすべてのサンプルがFF＞4％を有した（クラスIII患者の間で観察された最小値FFは7.1％であった）。

FXプロトコールが本発明者らのFF推論回帰モデルを破損させることにより人工的にFFを増大させた訳ではないことを確認するために、本発明者らは、男性胎児を有する妊娠でのchrYからのリードの密度が、比例して上昇したことを検証した。図3を参照されたい。したがって、FXプロトコールは、それぞれの配列決定されたサンプル中の胎児由来cfDNA断片の相対的存在量を直接的に増大させることにより、FFを増大させる。

全体的FF分布での上方シフトがサンプルのサブセット中の下方シフトするFFを目立たなくさせる場合があるか否かを決定するための、FXプロトコールから生じるFFでのサンプルレベル変化。図3を参照されたい。図4は、FXプロトコールにより賦与されるFFでの相対的増大を示す。特に、試験した2401個のサンプルのうちの2395個（99.8％）が、FXプロトコールを用いた場合にFFでの増大を有し、2.3倍の平均FF増加を伴った。FFでの相対的サンプルレベル増大はFFの関数として変化し（図3）：標準的NIPSを用いた場合に低FF（4％未満）であったサンプルが、FXプロトコールを受けた後に、3.9倍高いFFの平均を伴って、最大のFF増大を有した。より高い元のFFレベルでは減少するFF増大と合致して、FXプロトコールを用いてFFが減少した6種類のサンプルは、27.8％の中央値FF値（最小値6.5％）を有し、かつFXプロトコールを用いたFFは高いままであった（中央値：25.4％、最小値：6.4％）。

B. FXプロトコールはNIPS感度を増大させる
胎児画分（FF）をchrXおよびchrYの相対的NGS深度から男性胎児妊娠で直接的に測定できることと同様に、異数性染色体に対する相対的NGS深度を介して異数性サンプルのFFを測定することが可能である（FF_陽性/図5A）。FF_陽性は、異数性領域のzスコアに直接的に比例し、より高いzスコアは、異数性がより検出され易いことを意味する。したがって、FXプロトコールが異数性領域のFF_陽性を増大させる場合、FXプロトコールは、NIPS感度もまた増大させる。

一般的な異数性（例えば、性染色体異数性（SCA））、稀な常染色体異数性（RAA）、および微小欠失にわたって試験されたすべての陽性サンプルで、FXプロトコールはFFでの増大を生じた（図5B）。FXプロトコールを用いないFF_陽性での増大は灰色丸により示され、FXプロトコールを用いるFF_陽性での増大は紫色三角形により示される。FFの分布でのこの上方シフトは、FXにより変化しなかった。FXはまた、すべての試験された異数性サンプルに関するzスコアも増大させ、一方で、正倍数性サンプルのzスコア分布は変化しなかった（図5C～D）。陽性サンプルと陰性サンプルとの間の比較的大きなzスコア分離が、そのようなサンプルを区別する能力を高め、それにより、偽陰性および偽陽性の変化を減少させる。同時に、これらの知見は、FXプロトコールが各サンプル中での胎児由来リードの濃度を直接的に増大させ、かつNIPSの感度および特異度を強化することを実証する。

標準的NIPSを用いた場合に5p微小欠失に関して陰性であるとスクリーニングされたがFXプロトコールを用いた場合に陽性であるとスクリーニングされたサンプル（図7、5B、5D）が、FXプロトコールが賦与する胎児染色体異常に関する強化された感度に対するさらなる支持を提供した。この3MBの微小欠失に関して、コピー数変化は、FXプロトコールデータ中で際立って明らかであり（図7）、コール閾値未満のzスコアを閾値超に変換した（図3D、微小欠失の行）。

FXプロトコールを用いて達成可能である感度および特異度での増大を定量化するために、本発明者らは、zスコア、深度、発生率、およびFFなどの臨床的および技術的測定基準の間の関係を解析した（材料および方法を参照されたい）。染色体異常の異なるクラスに関するROC曲線（図8）は、FXプロトコールが、略完璧な分析特異度を伴う略完璧な分析感度を可能にすることを示す（表2）。本発明者らの臨床経験ではFXプロトコールを用いずに高いことが示された一般的な異数性の感度は、RAAの総計感度（aggregate sensitivity）であるので、FXプロトコールを用いる場合にはより高い（図8）。しかしながら、微小欠失感度での増大は大幅である：FXプロトコールを用いた場合に、5種類の一般的な微小欠失に対する総計感度は、99.8％の共同特異度（joint specificity）で97.2％である。特に、ディジョージ症候群に関して、FXプロトコールは、99.95％の分析特異度を伴って、95.6％の分析感度を有する。表2（下記）。

上記のROC解析を用いる性能の評価に加えて、本発明者らは、確認された異数性または微小欠失を有するすべてのサンプルが、FXプロトコールを用いて正しく特定されたことも観察した（表3）。

さらに、結果は、バッチ内およびバッチ間それぞれで反復性および再現性を有した（表4および表5）。同時に、これらの実験は、FXプロトコールの分析的信頼性を確立する。

最後に、標準的NIPSまたはFxプロトコールを用いるプリクエル（本明細書中でFFAと標識される）を用いてスクリーニングされたサンプル当たりの偽陰性（FN）結果の数を推定した。偽陰性率（FNR）を（1－感度）として算出し、このとき、感度はROC解析から推定される分析感度である。スクリーニングされたサンプル当たりのFNの個数は、FNRと有病率との積である。有病率の数は、年齢および他の因子に基づいて変動する場合があり、つまり、有病率の値は、x中の1 として表わされる近似値であり、このとき、xは最も近い百（一般的な異数性およびRAAに関して）または最も近い1000（一般的な微小欠失および22q11.2に関して）へと丸められる。5種類の一般的な微小欠失は、1p、4p、5p、15q11、および22q11.2である。スクリーニングされたサンプル当たりのFNRおよびFNの割合は、胎児画分を強化するためにFXプロトコールが用いられる場合にはるかに低い。下記の表6を参照されたい。

C. FXプロトコールは性別コール精度を増大させる
NIPSでの性別のミスコールは、生物学的（例えば、真の胎児モザイク、バニシングツイン）または技術的（例えば、低FF）のいずれかの限界から生じる。前者は内在する困難性を保有するが（多数の性別ミスコールが、4％よりもはるかに大きいFFで生じる）、後者は、すべてのサンプルのFFを増大させるその能力に起因して、FXプロトコールにより軽減させることができ、したがって、境界コールを除去することができる。図9は、標準的NIPSおよびFXプロトコールに対して観察される場合の、男性胎児および女性胎児妊娠に関するFFchrYの分布（すなわち、Y染色体上のNGSリード密度から測定される場合のFF）を示す。特に、男性および女性FFchrY分布の間の分離は、FXプロトコールを用いた場合に比較的大きく、約318倍まで境界FFchrY値に起因する性ミスコールの機会を低減させる。改善を強調することには、検証研究で試験された1個のサンプル（図9、橙色矢印）は、標準的NIPSでは境界であり、XXとミスコールされた；しかしながら、サンプルはFXプロトコールを用いるスクリーニングでは明らかにXYであり、妊娠は超音波を介して男性であることが直交的（orthogonally）に確認された。

実施例3
多数の次世代シーケンシング（NGS）に基づく試験の目標は、等量で配列決定に先立ってサンプルを統合することである。理想的には、すべてのサンプルが、試験性能を維持するためにそれらが必要とする正確な数のリードを受け取るであろう。多くの場合に、一貫性のために、このリードの個数は、すべてのサンプル間で等しいであろうし、マッピングされたリードに関する変動係数（CV）は0であろう。しかしながら、プロセス（すなわち、液体取り扱い、定量化等）でのエラーに起因して、多くの場合にこのことが当てはまらない。プールされたサンプルがサイズ選択されて、核酸の特定のサイズ範囲のみが単離される場合に、このことは、さらにより悪化する。

この実験では、約120種類のNGSライブラリーが等モル濃度で統合され（またはプールされ）、かつ200～250塩基対の間の断片を単離するためのゲルに基づくサイズ選択をゲル電気泳動により行なった。続いて、プールされたNGSライブラリーを、Illuminaシーケンサー上で配列決定し、すべてのサンプルに関してゲノムに対してマッピングされたリードの個数を決定するための下流の解析を行なった。図6を参照すると、平均を中心にマッピングされたリードの分布を、標識「in silico係数なし」の下に左側の箱ひげ図中に示す。すべてのライブラリーが、当初は等モル濃度でプールされたが、各サンプルが200～250塩基対サイズビン内の異なる数の断片を有したので、それらのリードの分布は非常に広範であり、最低リードカウントサンプルが最高リードカウントサンプルの3分の1のリードの個数を受け取る。これらのサンプルに対するCVは0.16であった。

続いて、同じ等モルプールを、小規模Illumina配列決定プラットフォーム上で配列決定し、ペアエンドデータを用いて、プール中のすべてのサンプルに対する断片長分布を決定した。200～250bpサイズ範囲内に存在したDNAの相対量を決定し、ここでは「in silico係数」と命名される、元の定量化値に対して適用することができる「係数」をつくり出すために用いた。これらの更新された定量化値を用いて、NGSライブラリーを再度統合し、それにより、各ライブラリーが200～250bpサイズ範囲内の等モル量のDNAを含むようにした。続いて、この再統合されたプールを、同じ200～250bpゲルに基づくサイズ選択、Illumina配列決定、および上記で概説される通りの解析に供した。平均を中心にマッピングされたリードの分布を、右側の箱ひげ図に示す。ここでは200～250bpサイズビン中に存在する分子の数に基づいてサンプルをプールしたので、この統合されたプールに対するマッピングされたリードのCVは、0.03とかなり低い。

NGSを利用する多数のアッセイが、解析に対して必要とされる最小限のリード閾値を有するので、マッピングされたリードのより低いCV（すなわち、より緊密な分布）は、より低いコストおよび/またはより少ない失格サンプルを可能にする。多くの場合、広い分布のマッピングされたリードを有するライブラリーは、十分なリード個数を受け取らないサンプルを有する。これに関する軽減戦略は、比較的少ないサンプルを、統合されたプールと組み合わせるが、これは代償として増大したコストを伴う。このワークフローは、マッピングされたリードの緊密な分布（低CV）をそれでも維持しながら、DNAサンプルのプールのサイズ選択を可能にする。

ここで、本発明者らは、すべてのサンプルにFXプロトコールを適用するNIPSの性能を検証および特性決定した。試験されたサンプルのうちの99.8％に関して、FXプロトコールを用いてFFが増大し、2.3倍の平均増大を伴った。低FFサンプルは最大FFスケール変更を受け、試験された2401個のサンプルのうち、3.7％がFXプロトコール前には低FFを有したが、FXプロトコール後に低FFを有するサンプルはなかった。FFでの増大は、分子によるものであり、アルゴリズムによるものではない：FXプロトコールは、母体DNAと胎児DNAとを区別し、WGSを受けるサンプル中の胎児DNAの相対的割合を増大させる。NIPSはFXプロトコール技術を用いずにFFスペクトルにわたる一般的な異数性に関して高感度および特異度を示したが、FXプロトコールの適用は、各タイプの異数性に関する性能を増大させる。増大は、微小欠失に関して特に大幅であった。

FXプロトコールは、NIPSでの微小欠失スクリーニングの性能に対する劇的な影響を有する。一般的な微小欠失に関して、予期される総計感度が増大し（表1、図8）、FXプロトコールを用いた場合に97.2％に達する。微小欠失感度および特異度が微小欠失に対して低かった従来は、米国産科婦人科学会（ACOG）は、微小欠失スクリーニングを推奨していなかったが；しかしながら、本発明者らは、微小欠失に対する97％超の感度および99％超の特異度が、専門家団体が微小欠失に対するスクリーニングの技術的制約よりも臨床的メリットを考慮することを可能にできると予期する。

一般的な微小欠失を超えて、本発明者らのデータは、FXプロトコールがgwCNV検出の解像度を増大させ、標準的NIPSを用いて到達可能である7MBの現在の限界を下回る微小欠失の信頼性の高い特定を可能にすることを示唆する。低FFを有するサンプル中の短い微小欠失は、NIPSを用いて検出することが困難であり、かつ感度を制限することがあり得るが、FXプロトコールは、低FFサンプルの頻度を低減させることにより、達成可能な感度制限を上昇させる。特に、ディジョージ症候群を引き起こす22q11.2微小欠失は、最も一般的には約2～3MBにわたり、かつFXプロトコールを用いた場合に95.6％の予期される感度を有する。偽陽性が稀であることを確実にするために、新規gwCNV検出に対する解像度限界は、3MB超である必要がある場合があるが、dbVarは、その個数が臨床的に重篤な表現型に関連付けられる、3MB～7MBのサイズの1000種類超の固有の病因性微小欠失を含み、したがって、解像度のいかなる増大も、患者および供給業者に対するNIPSの有用性を増大させるはずである。

2つのNIPS検査機関が同じ血漿サンプルを試験しなければならない場合でさえも、報告されるFFおよび異数性に関する感度は、検査機関のそれぞれの分子的なおよびコンピュータのプロトコールにおける変動に起因して異なり得る。例えば、アライメント、ろ過、計数、およびNGSリード解析の異なる方法に基づいて、8％FFを報告する検査機関が、10％FFを報告する検査機関よりも高い異数性感度を有し得るであろう。特に、検査機関は異なるサンプルセットに対してかつ異なる研究設計（例えば、臨床経験研究と分析的検証研究）を用いて性能を実証するので、これらの差異は、NIPS性能の検査機関間の比較を複雑にする。したがって、相対的NIPS性能に関して断定的に意見することは困難であり得る。しかしながら、本明細書中で、本発明者らは明快なNIPS性能増大を実証してきた：2種類のプロトコール（標準的NIPSおよびFXプロトコール）を、単一異数性コールアルゴリズムを用いて、単一検査機関内での単一セットのサンプルに対して比較した。FFは平均して2.3倍増大し、このFF増大は、より高い頻度の胎児由来NGSリードから生じた。性能での（in performance）相対的増大に関する証拠を示すまでもなく、本発明者らが行なったROC解析は、大きな集団の臨床サンプルを反映する偏りのないコホートでの分析感度および特異度の推定を生じる。

本明細書中に記載されるFXプロトコール戦略は、配列決定の上流のサイズ選択を介して、分子レベルでサンプルのFFを増大させ、その上、配列決定の下流で、アルゴリズムによるサイズ選択を介してFFを増大させることもまた可能である。具体的には、バイオインフォマティクスパイプラインが、そのペアエンドリードのそれぞれのマッピング位置に基づいて各断片の長さを算出し、かつ解析中に比較的短い断片を重み付けすることができるであろう。しかしながら、このバイオインフォマティクスアプローチの欠点は、相当なリソースが、それでも、胎児異数性検出にほとんど寄与しない、母体由来である可能性が高い比較的長い断片を配列決定することにより消費されることである。対照的に、配列決定の上流で分子サイズ選択を行なう場合、配列決定される断片のうちの全部が、胎児由来である確からしさの上昇を有する。

上述の本発明を、明確な理解の目的のために例示および実施例を用いて幾分か詳細に説明してきたが、特定の変更および改変を、本発明の精神および範囲から逸脱することなく実施できることが、当業者には明らかであろう。したがって、説明は、本発明の範囲を限定するものと理解されるべきではない。

Claims

プールされた核酸サンプルの遺伝学的診断アッセイの感度および解像度を強化する方法であって、以下のステップ：
a. 複数の試験被験体から核酸を単離および精製して、少なくとも1種の起源サンプルを生成するための対応する起源サンプルを生成させるステップ；
b. 各試験被験体に対するライブラリーを調製するステップであって、核酸断片がバーコード付加され、かつ各ライブラリーが特異的な起源サンプルに対応するステップ；
c. 各起源サンプルから第1の数の核酸単位を添加して、第1のプールされた試験サンプルを形成させるステップ；
d. 各起源サンプル内の断片サイズ分布を決定するステップ；
e. 各起源サンプル中の標的核酸集団の存在量を決定するステップ；
f. 各起源サンプルに対する固有の数値的オフセット値を算出するステップ；
g. 該固有の数値的オフセット値に基づいて各起源サンプルから第2の数の核酸単位を添加して、第2のプールされた試験サンプルを形成させるステップ；および
h. 該第2のプールされた試験サンプルに対して断片サイズ選択を行ない、かつ懸濁物中の該標的核酸集団を単離して、該標的核酸集団に関して富化された第3のプールされた試験サンプルを形成させるステップであって、該第3のプールされた試験サンプルは診断アッセイに対して準備できているステップ
を含む、前記方法。
前記第3のプールされた試験サンプルを配列決定し、かつ遺伝的異常に関して前記標的核酸集団をスクリーニングするステップをさらに含む、請求項1に記載の方法。
前記断片サイズ分布が配列決定により決定される、請求項1に記載の方法。
前記配列決定がペアエンド配列決定である、請求項3に記載の方法。
前記断片サイズ分布が、蛍光相関分光法により決定される、請求項1に記載の方法。
前記第3のプールされた試験サンプル中の核酸断片を、それぞれの起源サンプルとペアリングさせるステップをさらに含む、請求項1に記載の方法。
前記核酸がゲノムDNAである、請求項1に記載の方法。
前記核酸がFFPE DNAである、請求項1に記載の方法。
前記核酸がRNAである、請求項1に記載の方法。
前記核酸が無細胞DNAである、請求項1に記載の方法。
前記核酸が全血から単離される、請求項1に記載の方法。
前記固有の数値的オフセット値が、前記核酸単位の第1の数により、ステップeで決定される前記標的核酸集団の存在量を除算することにより算出される、請求項1に記載の方法。
前記標的核酸集団が、前記無細胞DNAの胎児画分である、請求項12に記載の方法。
前記標的核酸集団が、前記無細胞DNAの腫瘍画分である、請求項12に記載の方法。
前記標的核酸集団が、特定のメチル化痕跡を含む核酸の断片である、請求項12に記載の方法。
前記メチル化痕跡が、過剰メチル化または過少メチル化である、請求項15に記載の方法。
前記標的核酸集団が、所定の長さ範囲内の断片に関して富化される、請求項1に記載の方法。
前記標的核酸集団が、所定の長さの断片に関して富化される、請求項1に記載の方法。
前記標的核酸集団が、特定のメチル化痕跡を含む断片に関して富化される、請求項1に記載の方法。
前記メチル化痕跡が、過剰メチル化または過少メチル化である、請求項19に記載の方法。
前記断片サイズ選択が、ゲル電気泳動を用いて行なわれる、請求項1に記載の方法。
前記核酸単位の第1および第2の数が、マイクロリットル、ナノグラム、およびモルからなる群より選択される、請求項1に記載の方法。
全ゲノム配列決定を行なうステップをさらに含む、請求項1に記載の方法。
前記プールされた試験サンプルが、2～1000種類の異なるサンプルを含む、請求項1に記載の方法。
プールされた核酸サンプルの遺伝学的診断アッセイの感度および解像度を強化する方法であって、以下のステップ：
a. 複数の試験被験体から核酸を単離および精製して、対応する起源サンプルを生成させるステップ；
b. 各試験被験体に対するライブラリーを調製するステップであって、核酸断片がバーコード付加され、かつ各ライブラリーが特異的な起源サンプルに対応するステップ；
c. 各起源サンプルから第1の数の核酸単位を添加して、第1のプールされた試験サンプルを形成させるステップ；
d. 該第1のプールされた試験サンプルに対して断片サイズ選択を行ない、かつ懸濁物中の標的核酸集団を単離して、該標的核酸集団に関して富化された第2のプールされた試験サンプルを形成させるステップ；
e. 各起源サンプル中の標的核酸集団の存在量を決定するステップ；
f. 各起源サンプルに対する固有の数値的オフセット値を算出するステップ；
g. 該固有の数値的オフセット値に基づいて各起源サンプルから第2の数の核酸単位を添加して、該標的核酸集団に関して富化された第3のプールされた試験サンプルを形成させるステップ；および
h. 該第3のプールされた試験サンプルに対して第2の断片サイズ選択を行ない、かつ懸濁物中の該標的核酸集団を単離して、該標的核酸集団に関して富化され、かつそれぞれの該起源サンプルからの実質的に等しい割合を含む、第4のプールされた試験サンプルを形成させるステップであって、該第4のプールされた試験サンプルは診断アッセイに対して準備できているステップ
を含む、前記方法。
ステップfが配列決定により行なわれる、請求項25に記載の方法。
前記配列決定がペアエンド配列決定である、請求項25に記載の方法。
ステップfが定量的PCRにより行なわれる、請求項25に記載の方法。
ステップfがデジタルPCRにより行なわれる、請求項25に記載の方法。
前記デジタルPCRがドロップレットデジタルPCRである、請求項29に記載の方法。
前記第4のプールされた試験サンプルを配列決定し、かつ遺伝的異常に関して前記標的核酸集団をスクリーニングするステップをさらに含む、請求項25に記載の方法。
前記第4のプールされた試験サンプル中の核酸断片を、それぞれの起源サンプルとペアリングさせるステップをさらに含む、請求項25に記載の方法。
前記核酸がゲノムDNAである、請求項25に記載の方法。
前記核酸がFFPE DNAである、請求項25に記載の方法。
前記核酸がRNAである、請求項25に記載の方法。
前記核酸が無細胞DNAである、請求項25に記載の方法。
前記核酸が全血から単離される、請求項25に記載の方法。
前記固有の数値的オフセット値が、前記核酸単位の第1の数により、ステップeで決定される前記標的核酸集団の存在量を除算することにより算出される、請求項25に記載の方法。
前記標的核酸集団が、前記無細胞DNAの胎児画分である、請求項25に記載の方法。
前記標的核酸集団が、前記無細胞DNAの腫瘍画分である、請求項25に記載の方法。
前記標的核酸集団が、特定のメチル化痕跡を含む断片である、請求項25に記載の方法。
前記メチル化痕跡が、過剰メチル化または過少メチル化である、請求項25に記載の方法。
前記標的核酸集団が、所定の長さ範囲内の核酸断片に関して富化される、請求項25に記載の方法。
前記標的核酸集団が、所定の長さの断片に関して富化される、請求項25に記載の方法。
前記標的核酸集団が、特定のメチル化痕跡を含む断片に関して富化される、請求項25に記載の方法。
前記メチル化痕跡が、過剰メチル化または過少メチル化である、請求項25に記載の方法。
前記断片サイズ選択が、ゲル電気泳動を用いて行なわれる、請求項25に記載の方法。
前記核酸単位の第1および第2の数が、マイクロリットル、ナノグラム、およびモルからなる群より選択される、請求項25に記載の方法。
全ゲノム配列決定を行なうステップをさらに含む、請求項25に記載の方法。
前記プールされた試験サンプルが、2～1000種類の異なるサンプルを含む、請求項25に記載の方法。
遺伝学的診断アッセイの感度および解像度を強化する方法であって、以下のステップ：
a. 少なくとも1種の試験被験体から核酸を単離および精製して、少なくとも1種の起源サンプルを生成させるステップ；
b. 該少なくとも1種の試験被験体に対する核酸ライブラリーを調製するステップであって、核酸断片がバーコード付加され、かつ該核酸ライブラリーが該少なくとも1種の起源サンプルに対応するステップ；
c. 該核酸ライブラリーから第1の数の核酸単位を添加して、第1の試験サンプルを形成させるステップ；
d. 該核酸ライブラリー内の断片サイズ分布を決定するステップ；
e. 該核酸ライブラリー中の標的核酸集団の存在量を算出するステップ；
f. 該核酸ライブラリーに対する固有の数値的オフセット値を算出するステップ；
g. 該固有の数値的オフセット値に基づいて該核酸ライブラリーから第2の数の核酸単位を添加して、第2の試験サンプルを形成させるステップ；および
h. 該第2の試験サンプルに対して断片サイズ選択を行ない、かつ懸濁物中の該標的核酸集団を単離して、該標的核酸集団に関して富化された第3の試験サンプルを形成させるステップであって、該第3の試験サンプルは診断アッセイに対して準備できているステップ
を含む、前記方法。