JP2015534807A

JP2015534807A - 胎児の染色体異数性を検出するための非侵襲的方法

Info

Publication number: JP2015534807A
Application number: JP2015538513A
Authority: JP
Inventors: マグネエステロース，; サーニュ，セシルデルーン; ナディンヴィンセント，; ベルナルドコンラッド，
Original assignee: Genesupport SA
Current assignee: Genesupport SA
Priority date: 2012-10-31
Filing date: 2013-10-31
Publication date: 2015-12-07
Also published as: CN105074004A; EP3026124A1; EP2728014A1; IL238426A0; AU2013340795A1; US20150275290A1; EP2914738A1; WO2014068075A1; DK2728014T3; HK1208708A1; EP2728014B1; CA2888906A1

Abstract

本発明は、無細胞ＤＮＡを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び／又は参照パラメータのセットを得るための方法であって、正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞ＤＮＡを抽出するステップと；抽出ステップの後、各試料中のＤＮＡ分子のサイズ分布を分析して、前記試料中のＤＮＡ分子のサイズ分布に基づいて試料のセットを選択するステップと；サイズ選択された各試料のＤＮＡの大量並行シーケンシングを実施するステップと；試料ごとに得られた配列をヒトゲノムにマッピングするステップと；参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；参照試料のセット及び／又は参照パラメータのセットを得るステップとを含む方法に関する。【選択図】なし

Description

本発明は、無細胞ＤＮＡ、特にサイズ選択無細胞ＤＮＡを使用する、胎児の異数性の非侵襲的出生前診断に関する。より詳細には、本発明は、極めて向上した感受性及び特異性を提供する外部参照試料のセットを用いることを特徴とする、胎児の異数性の診断方法に関する。本発明は、胎児の異数性の診断に用いられる参照試料並びに参照試料及び／又は参照パラメータのセットを含むキットを得るための方法にも関する。

胎児の染色体異数性の検出は、出生前診断で重要な処置である。いくつかの主要な疾患、例えばダウン症候群（２１トリソミーとも呼ばれる）、１８トリソミー、１３トリソミーは染色体異数性によって引き起こされ、胎児がこれらの異常の１つによる影響を受けているかどうかできるだけ早く予測することが最も重要である。さらに、胎児が異数性に罹る危険は、母体の年齢と共に一般に増加する。したがって、ほとんどの先進国での妊娠女性の平均年齢の上昇は、胎児の染色体異数性を検出するための強力で安全な診断法の必要性をさらに高める。

胎児の染色体異数性の検出は、漿膜絨毛試料採取、羊水穿刺又は臍帯血試料採取などの侵襲的処置を通して一般に実施される。これらの方法は、核型分析のために必要な胎児の細胞を得るために、胎児の生体材料（羊水、絨毛膜絨毛、臍帯血）の収集物に頼ることにおいて共通する。これらの方法は、長い間日常的に実践されている。しかし、それらの侵襲性のために、それらは胎児及び母体にとって危険がないとは限らない。最も頻度の高い危険は流産の可能性であり、羊水穿刺の場合は１％近くである。他の危険、例えば感染症の危険、母体から胎児への疾患の伝染（例えばＡＩＤＳ又はＢ型肝炎）、羊水漏出又は早産などが、これらの侵襲的処置と関連している。

超音波スキャン又は母体の血清生化学的マーカーの検出に基づく非侵襲的方法も開発されているが、これらの方法は随伴現象の検出に主に制限され、染色体異常の核心的病理を検出することに対する臨床有用性は限定されている。

１９９７年における母体血漿中の無細胞胎児核酸の発見は、新しい可能性を開いた。胎児の染色体量を評価するためのこれらの核酸を使用する第１の戦略は、ＳＮＰの対立遺伝子比率分析による胎児染色体量の評価に基づく、標的核酸（胎盤特異的ＤＮＡメチル化サインを有する胎盤ｍＲＮＡ及びＤＮＡ分子）でのＳＮＰの対立遺伝子の比の分析をベースとしていた。ごく近年では、デジタルＰＣＲを使用して、別の戦略が開発された（Ｌｏら、２００７）。この技術は、母体血漿中の潜在的な異数性染色体（例えば第２１染色体）の上の特定座位の全量を測定し、この量を参照染色体上のそれと比較することからなる。

２００８年に、Ｃｈｉｕらは、母体血漿で胎児の２１トリソミーを診断する方法において大量並行シーケンシングに成功した（Ｃｈｉｕら、２００８）。彼らの方法は、血漿試料から抽出されたＤＮＡで大量並行シーケンシングを実行することからなる。ＭＰＧＳステップから得られた配列をヒトゲノムの参照配列と次に整列させ、ミスマッチなしでヒトゲノムの上に位置に固有にマッピングされた配列の数を各染色体について数え、ＭＰＧＳの間に得られた配列の総数と比較する。この比は、母体血漿試料で見出されるＤＮＡ分子の「染色体表示」の指標を提供する。正倍数体として既知の参照試料セットと比較して、所与の試料での第２１染色体の過剰表示は、胎児の２１トリソミーの指標である。

ほぼ同時に、Ｆａｎらは、無細胞血漿のショットガンシーケンシングを使用して、胎児の２１トリソミーの診断のための別の方法の開発に成功を収めた（Ｆａｎら、２００８）。母体血漿試料から抽出された無細胞ＤＮＡを大規模にシーケンシングした後に、Ｆａｎらは、各配列をヒトゲノムにマッピングした。次にヒトゲノムの各染色体を５０ｋｂビンに分け、各ビンにつき、多くても１つのミスマッチを有するヒトゲノムに固有にマッピングされた配列タグの数を数えた。次にＦａｎらは、各染色体にわたる配列タグのこのカウントの中間値を計算した。最後に、Ｆａｎらは、２１トリソミーに罹った胎児を妊娠している母体に由来する血漿の第２１染色体配列のタグ密度を、正倍数性の胎児を妊娠している母体に由来する血漿のそれと比較し、彼らは、２１トリソミー配列タグ密度が９９％信頼レベルで正倍数性試料のそれより高いことに気がついた。

これらの技術はいずれも、正倍数性参照試料と比較した所与の染色体の過剰表示の検出に依存する。それらは有益な「概念実証」を提供し、胎児の異数性の診断での次世代のシーケンシング技術の効率的利用のための道を開いた。しかし、日常の臨床場面でのその方法の実行は、先行技術で現在記載されているものより高いレベルの感度及び特異性を必要とする。

全ゲノム次世代シーケンシング（ＷＧ−ＮＧＳ）で胎児の異数性を検出する非侵襲的出生前診断の感度は、母体血漿中の胎児ＤＮＡの割合及びシーケンシングの深度に依存する。胎児ＤＮＡの割合は一連のほぼ固有の生物学的変数に依存するが、実験上の改変を受ける技術的変数には、ｉ）ＤＮＡ抽出手順の効率、ｉｉ）ＮＧＳの精度及び処理量、すなわち、シーケンシングされたゲノムと整列させることができる固有の正確な一致を有する配列タグ（「ミスマッチのない固有同一配列（ｕｎｉｑｕｅｅｘａｃｔｓｅｑｕｅｎｃｅｓ）」又は「ＵＥＳ」と呼ばれる）の割合、及びシーケンシングされた分子の総数、ｉｉｉ）バイオインフォマティクアルゴリズムの性質、並びにｉｖ）参照セットを提供する正常な胎児核型をもつ妊娠女性からの試料の対照群が含まれる。各単一の染色体についての個々の分子計数は全ての常染色体の中間配列タグ密度で標準化されるので、後者が最も重要である（Ｆａｎら、２００８）。

本発明は、非侵襲的出生前診断のためにこれまで使用されておらず、標準方法より５倍大きな収率を有するＤＮＡ抽出法を、公表された参照より全体的に２５〜３０％多くのＵＥＳ及び現行の標準より３倍高い１５×１０^６を超えるＵＥＳの平均総カウントによる厳しく品質管理されたＮＧＳワークフローと一緒に実行する。試験の最終読み出しは、頑健な臨床試験の必要条件、すなわち主要な胎児の異数性について１００％の感度及び１００％の特異性に適合する。この手法は、例えば、偶然に誤った結果をもたらす≦１．１×１０^−５の事前確率で、２１トリソミー又はダウン症候群を正常な雄及び雌の核型と区別する。基準は≦２．７×１０^−３なので、それは２桁の向上を表す。本発明は配列の高品質の参照セットの構築を可能にする方法の組合せを提供し、それはＮＧＳ手法の性能を規定するための鍵となるステップである。

したがって、本発明の第１の態様は、母体生体試料、好ましくは血液試料から、胎児の異数性診断用参照試料のセット及び／又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料、好ましくは血液試料のセットから無細胞ＤＮＡを抽出するステップと；
各試料のＤＮＡの大量並行シーケンシングを実施するステップと；
試料ごとに得られた配列をヒトゲノムにマッピングするステップと；
任意選択で参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；
参照試料のセット及び／又は参照パラメータのセットを得るステップと
を含む方法に関し、前記方法は以下の追加のステップ／機構の少なくとも１つを含む：
各生体試料からの無細胞ＤＮＡの抽出は、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと；
前記混合物から水相を抽出するステップと；
前記水相からＤＮＡを沈殿させるステップと；
沈殿したＤＮＡを任意選択で収集するステップとを含む。
抽出ステップの後、各試料中のＤＮＡ分子のサイズ分布を分析して、前記試料中のＤＮＡ分子のサイズ分布に基づいて試料のセットを選択するステップ；
抽出ステップ又はＤＮＡ分子のサイズ分布に基づく選択ステップの後、各試料のＤＮＡをプレシーケンスし、得られた配列をヒトゲノムにマッピングし、ヒトゲノムにマッピングした固有同一配列の量に基づいて試料のセットを選択するステップ；
大量並行シーケンシングから得られた配列をマッピングするステップの後、ヒトゲノムにマッピングした固有同一配列の数に基づいて試料のセットを選択するステップ。

本方法は、これらの追加のステップ若しくは機構のいずれか１つ、これらの追加のステップ若しくは機構の２つか３つの任意の組合せ、又は４つの追加のステップ及び機構を含むことができる。

本発明の方法は、特に抽出ステップの直後及び大量並行シーケンシングの前に、無細胞ＤＮＡのサイズ選択のステップを含むことが好ましい。この実施形態により、本発明は、無細胞ＤＮＡを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び／又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞ＤＮＡを抽出するステップと；
抽出ステップの後、各試料中のＤＮＡ分子のサイズ分布を分析して、前記試料中のＤＮＡ分子のサイズ分布に基づいて試料のセットを選択するステップと；
サイズ選択された各試料のＤＮＡの大量並行シーケンシングを実施するステップと；
試料ごとに得られた配列をヒトゲノムにマッピングするステップと；
参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；
参照試料のセット及び／又は参照パラメータのセットを得るステップと
を含む方法に関する。

サイズ選択ステップを含む参照試料のセットを得るためのそのような方法の好ましい例は、
ａ）正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセット、及び任意選択で異数性胎児を妊娠している正倍数性妊娠女性から得られたさらなる生体試料のセットから無細胞ＤＮＡを抽出するステップと；
ｂ）特に２００ｂｐを超えるサイズを有する無細胞ＤＮＡ分子を除去するために、抽出された無細胞ＤＮＡの試料をサイズ選択ステップにかけるステップと；
ｃ）シーケンシングライブラリーの調製のために、ステップ（ｂ）で得られたサイズ選択された抽出されたＤＮＡ試料を、例えばＤＮＡ分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと；
ｄ）（ｃ）で得られたサイズ選択された各試料のＤＮＡの大量並行シーケンシングを実施するステップと；
ｅ）試料ごとにステップ（ｄ）で得られた配列をヒトゲノムにマッピングするステップと；
ｆ）参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；
ｇ）参照試料のセット及び／又は参照パラメータのセットを得るステップと
を含む。

試料の参照セットを得ることにおいて、無細胞ＤＮＡを抽出する生体試料のセットは、異数性胎児を妊娠している正倍数性の妊娠女性から得られた試料をさらに含むことが特に好ましい。この方法で、参照セットは、正倍数性と異数性の両方の試料の参照値を提供する。

代替実施形態では、無細胞ＤＮＡを含有する母体生体試料から胎児の異数性診断用参照試料のセットを得る方法は、大量並行シーケンシングの前に、サイズ選択された試料のサブセットのプレシーケンス及びマッピングのステップを含む。この代替実施形態により、本方法は、
（ｉ）正倍数性胎児を妊娠している正倍数性妊娠女性のセットから得られた生体試料、好ましくは血液試料のセットから無細胞ＤＮＡを抽出するステップと；
（ｉｉ）各試料中のＤＮＡ分子のサイズ分布を分析するステップと；
（ｉｉｉ）前記試料中のＤＮＡ分子のサイズ分布に基づいて試料の第１のセットを選択するステップと；
（ｉｖ）試料の前記第１のセットからの各試料のＤＮＡをプレシーケンスするステップと；
（ｖ）ステップ（ｉｖ）で得られた配列をヒトゲノムにマッピングするステップと；
（ｖｉ）ステップ（ｖ）でヒトゲノムにマッピングされた固有同一配列の量に基づいて試料の第２のセットを選択するステップと；
（ｖｉｉ）試料の前記第２のセットからの各試料のＤＮＡを大量並行シーケンシングするステップと；
（ｖｉｉｉ）ステップ（ｖｉｉ）で得られた配列をヒトゲノムにマッピングするステップと；
（ｉｘ）ステップ（ｖｉｉｉ）でヒトゲノムにマッピングされた固有同一配列の数に基づいて参照試料のセットを選択するステップと
を含む。

具体的な実施形態では、ステップ（ｉｉｉ）は、ＤＮＡ分子の少なくとも９０重量％、好ましくは９５重量％より多くが１５６ｂｐ〜１７６ｂｐのサイズを有する試料を選択するステップを含む。

別の実施形態では、ステップ（ｉｉｉ）は、少なくとも０．８８ｎｇ／μｌの、サイズが１５６ｂｐ〜１７６ｂｐのＤＮＡ分子を有する試料を選択するステップを含む。

別の実施形態では、ステップ（ｉｖ）は、各試料中の１０００〜１０００００個の配列をシーケンシングするステップを含む。

別の実施形態では、ステップ（ｖｉ）は、ステップ（ｉｖ）で得られた配列の総数に対して少なくとも７０％の固有同一配列を有する試料を選択するステップを含む。

別の実施形態では、ステップ（ｖｉｉ）は、試料ごとに少なくとも２５，０００，０００個の配列をシーケンシングするステップを含む。別の実施形態では、ステップ（ｖｉｉ）は、試料ごとに少なくとも２５，０００，０００個のフィルターを通過するリードを得るステップを含む。

別の実施形態では、ステップ（ｉｘ）は、１５，０００，０００個を超える固有同一配列のリードを有する試料を選択するステップを含む。

本発明は、母体生体検査試料、好ましくは血液試料から胎児の異数性を診断する方法であって、
（ａ）妊娠女性から得られた母体生体検査試料から無細胞ＤＮＡを抽出するステップと；
（ｂ）前記検査試料から抽出される無細胞ＤＮＡを大量並行シーケンシングするステップと；
（ｃ）ステップ（ｂ）で得られた配列をヒトゲノムにマッピングするステップと；
（ｄ）対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと；
（ｅ）参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば正倍数性参照試料のセット、例えば本発明により得られたセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；
（ｆ）ステップ（ｄ）で計算された前記検査パラメータをステップ（ｅ）で計算された参照パラメータの前記セットと比較するステップと；
（ｇ）比較に基づいて胎児の異数性を診断するステップと
を含む方法にも関する。

胎児の異数性の診断の好ましい方法は、抽出ステップの後、前記試料中のＤＮＡ分子のサイズに基づくサイズ選択ステップが実施される、上記方法を含む。サイズ選択ステップは、サイズが２００ｂｐを超えるＤＮＡ分子を検査試料から実質的に排除する。このステップは、シーケンシングライブラリーの調製の前に実行されることが好ましい。この診断方法は、上記の無細胞ＤＮＡサイズ選択ステップも受けた参照試料と併用することが特に好ましい。実際、本発明により、検査試料が参照試料と同じ方法で処理されることが好ましい。

この好ましい実施形態により、母体生体検査試料、好ましくは血液試料から胎児の異数性を診断する方法は、
（ａ）妊娠女性から得られた血液などの母体生体検査試料から無細胞ＤＮＡを抽出するステップと；
（ｂ）サイズが２００ｂｐを超えるＤＮＡ分子が試料から実質的に排除されるように、抽出された無細胞ＤＮＡに対してサイズ選択ステップを実施するステップと；
（ｃ）シーケンシングライブラリーの調製のために、サイズ選択された抽出された無細胞ＤＮＡを、例えばＤＮＡ分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと；
（ｄ）ステップ（ｃ）で得られた無細胞ＤＮＡを大量並行シーケンシングするステップと；
（ｅ）ステップ（ｄ）で得られた配列をヒトゲノムにマッピングするステップと；
（ｆ）対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと；
（ｇ）参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば本発明のサイズ選択法により得られた正倍数性参照試料のセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；
（ｈ）ステップ（ｆ）で計算された前記検査パラメータをステップ（ｇ）で計算された参照パラメータの前記セットと比較するステップと；
（ｉ）比較に基づいて胎児の異数性を診断するステップと
を含む。

母体生体検査試料からの無細胞ＤＮＡの抽出は、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと；
前記混合物から水相を抽出するステップと；
前記水相からＤＮＡを沈殿させるステップと；
沈殿したＤＮＡを任意選択で収集するステップと
を含むことが好ましい。

具体的な実施形態では、前記検査パラメータは、全ての常染色体の中間固有同一配列タグ密度に標準化した対象の染色体又は染色体領域の固有の配列タグ密度である。

別の実施形態では、前記検査パラメータは、全ての染色体にマッピングされた固有同一配列の総数に対する、又は全ての常染色体にマッピングされた固有同一配列の総数に対する、前記染色体又は染色体領域にマッピングされた固有同一配列の百分率である。

別の実施形態では、ステップ（ｆ）の比較は、参照パラメータのセットに対する前記検査パラメータのｚスコアの計算によって実行される。

別の実施形態では、検査パラメータは、対象の染色体若しくは染色体領域の絶対同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントである。

さらなる実施形態では、ステップ（ｆ）の比較は、対象の染色体若しくは染色体領域の固有同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントが、参照セットの対象の染色体の固有同一配列カウントの正規分布に属する確率の計算によって実施される。

別の実施形態では、対象の染色体は、第２１染色体、第１８染色体、第１６染色体、第１１染色体又は第１３染色体である。

別の実施形態では、対象の染色体は第２１染色体であり、２１トリソミー試料のｚスコアは少なくとも４．４であるが、第２１染色体の正倍数性試料のｚスコアの絶対値は４．４未満である。

本発明は、胎児と母体の無細胞ＤＮＡを含有する母体生体試料から無細胞ＤＮＡを抽出する方法であって、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと；
前記混合物から水相を抽出するステップと；
前記水相からＤＮＡを沈殿させるステップと；
沈殿したＤＮＡを任意選択で収集するステップと
を含む方法にも関する。

本発明は、胎児と母体の無細胞ＤＮＡを含有する母体生体試料から無細胞ＤＮＡを抽出するための、クロロホルム及びフェノール、好ましくはクロロホルム及びフェノールを含む組成物の使用にも関する。具体的な態様では、前記使用は、母体生体試料から胎児の異数性診断用参照試料のセットを得る方法におけるものである。

別の態様では、前記使用は、母体生体検査試料から胎児の異数性を診断するための方法におけるものである。

本発明は、本発明の方法により入手可能な参照試料のセットにも関する。

本発明は、母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の１つ又は複数のステップを実行するための、コンピュータプログラム製品にも関する。

本発明は、母体生体検査試料から胎児の異数性を診断するための方法の１つ又は複数のステップ、例えばステップ（ｄ）から（ｇ）の１つ又は複数を実行するための、コンピュータプログラム製品にも関する。

本発明は、
無細胞ＤＮＡを抽出するための、例えばフェノール及びクロロホルムを含む組成物を含む、１つ又は複数の組成物及び／又はキット；
本発明の方法により入手可能な参照試料のセット；
コンピュータ可読媒体などの物理的支持体に任意選択で含まれる、本発明による方法で入手できる参照パラメータのセット；
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の１つ又は複数のステップを実行するためのコンピュータプログラム製品；
母体生体検査試料から胎児の異数性を診断するための方法の１つ又は複数のステップを実行するためのコンピュータプログラム製品
の１つ又は複数を含むキットにも関する。

好ましい実施形態により、胎児の異数性の診断のためのキットは、
本発明の方法により入手可能な参照試料のセット、例えばサイズが≦２００ｂｐの無細胞ＤＮＡのために試料を濃縮するためにサイズ選択を受け、２００ｂｐを超えるＤＮＡ分子を排除し、正倍数性胎児を妊娠している正倍数性妊娠女性からの試料に加えて異数性胎児を妊娠している正倍数性妊娠女性からの試料も含む試料のセット、
及び／又は参照パラメータのセットであって、ここで各参照パラメータは、任意選択で物理的支持体に含まれる本発明の方法により入手可能な参照セットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、参照パラメータのセットを含み、
そのようなキットは、
無細胞ＤＮＡを抽出するための、フェノール及びクロロホルムを含む組成物などの、１つ又は複数の組成物及び／又はキット；
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の１つ又は複数のステップを実行するためのコンピュータプログラム製品；
母体生体検査試料から胎児の異数性を診断するための方法の１つ又は複数のステップを実行するためのコンピュータプログラム製品
の少なくとも１つをさらに含むことができる。

キャピラリー電気泳動によって得られた３つの母体血漿試料のサイズ分布を示す図である。これらの試料中のＤＮＡ分子は、１３２ｂｐシーケンシングアダプター／バーコードにライゲートされる。９１個の試料（正倍数性及び異数性）についてのＮＧＳシーケンシングによって得られたフィルターを通過する配列リードの総数を示す図である。縦座標の軸凡例は、「Ｃｎｔ＋１ｅ６」、すなわち１００万単位の配列カウントと読む。図２に示すのと同じ試料についての固有同一配列の数を示す図である。縦座標の軸凡例は、「Ｃｎｔ＋１ｅ６」、すなわち１００万単位の配列カウントと読む。既知の健全個体（本発明の方法によって選択された参照試料）に対して１／１００，０００の信頼区間（ｚスコア＝４．４）で第２１染色体にマッピングされた全固有配列リードの百分率を示す図である。中央の水平点線は、参照試料の平均百分率に対応する。点線の上下の水平実線は、識別閾値（平均±４．４^＊ＳＤ）に対応する。２１トリソミー試料は、正に識別される。既知の健全個体（本発明の方法によって選択された参照試料）に対して１／１００，０００の信頼区間（ｚスコア＝４．４）で第１８染色体にマッピングされた全固有配列リードの百分率を示す図である。中央の水平点線は、参照試料の平均百分率に対応する。点線の上下の水平実線は、識別閾値（平均±４．４^＊ＳＤ）に対応する。１８トリソミー試料は、正に識別される。第２のスコアリングアルゴリズムを使用した第１染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。第２のスコアリングアルゴリズムを使用した第１９染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。第２のスコアリングアルゴリズムを使用した第１３染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。１３トリソミー試料は、正に識別される。第２のスコアリングアルゴリズムを使用した第１８染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。１８トリソミー試料は、正に識別される。第２のスコアリングアルゴリズムを使用した第２１染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。２１トリソミー試料は、正に識別される。第２のスコアリングアルゴリズムを使用した第２２染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。２２トリソミー試料は、正に識別される。第２のスコアリングアルゴリズムを使用した第４染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。４ｐ微小欠失（ウルフ−ハーシュホーン症候群）試料は、負に識別される。第２のスコアリングアルゴリズムを使用した第５染色体のスコアを示す図である。識別閾値は、既知の健全個体（本発明の方法により選択された参照試料）に対する１／１００，０００，０００，０００の信頼区間に対応する。５ｐ微小欠失／重複（ネコ鳴き症候群）試料は、正に識別される。４ｐ微小欠失症候群試料の第４染色体での配列タグ密度を示す図である。４ｐ欠失位置で参照試料の平均密度からの負の偏差が明らかである。５ｐ微小欠失／重複症候群試料の第５染色体での配列タグ密度を示す図である。それぞれ５ｐ微小欠失及び重複の位置で、参照試料の平均密度からの正及び負の偏差が明らかである。図２〜１３に示すデータは、９１個の試料の同じセットで全て得られ、各図において同じ順序で示す。１０個の試料ごとのＩＤを、バーの下に示す。特定の試料（試料２、３、４、２６、４０、４４、４５、５５、５６、６１、６３、６８、６９、７０、７１、８３、８５、８８、８９、９０、９１）の核型を、対応するバーの中か上に示す。これらの核型は、表５にも掲載する（テキストは図のそれに同じ）。サイズ選択：３つの検査試料ＧＷＸ−３５１、−３５２及び−３５３についてＡＭＰｕｒｅビーズを使用した、抽出された無細胞ＤＮＡのサイズ選択の前（パネルＡ、左側）及び後（パネルＢ、右側）のバイオアナライザー結果を示す図である。１１３．００及び４３．００のピークはサイズマーカーである（［ｓ］は秒で表す移動時間を意味し、塩基対に直接に変換することができる）。サイズ選択された試料（パネルＢ）では、＞１０００ｂｐの大きな分子量のピークは精製工程によって消去され、１５０〜２００ｂｐの胎児無細胞ＤＮＡに対応するより低い分子量のピークは保持される。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第２染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第３染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第４染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第５染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第６染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第７染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第８染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第９染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１０染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１１染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１２染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１３染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１４染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１５染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１６染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１７染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１８染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第１９染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第２０染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第２１染色体。本発明のサイズ選択手法（ＴＰＲ、ｙ軸）及びサイズ選択なしの同じ手法（ＧＷ、ｘ軸）を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例３に記載されるプロトコルによって４８個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで６個の参照試料Ａ１、Ａ２、Ｎ１、Ｎ２、Ｂ１、Ｂ２と比較した。サイズ選択による胎児の濃縮が、１３、１６、１８及び２１トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第２２染色体。ＧＷＸ−１１３７と命名された正倍数性試料で得られた、参照セットＡ１と比較した結果を示す図である。図３９ａ〜３９ｄでは、内部の微細な点線は１／１０００の確率閾値を表し、外部のより太い点線は１／１００００の確率閾値を表し、すなわち、これらの閾値の外側に存在する値は、それぞれ、１０００に１つ未満が正常である可能性、又は１００００に１つ未満が正常である可能性を有する：図３９ａ：検証された異数性Ｔ１３試料を含む、第１３染色体のための参照セットＡ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１１３７の第１３染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の中にある。図３９ｂ：検証されたＴ１６異数性試料を含む、第１６染色体のための参照セットＡ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１１３７の第１６染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の中にある。図３９ｃ：検証されたＴ１８異数性試料を含む、第１８染色体のための参照セットＡ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１１３７の第１８染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の中にある。図３９ｄ：検証されたＴ２１異数性試料を含む、第２１染色体のための参照セットＡ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１１３７の第２１染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の中にある。異数性試料で得られた、参照セットＮ１と比較した結果を示す図である。図４０ａ〜４０ｄでは、内部の微細な点線は１／１０００の確率閾値を表し、外部のより太い点線は１／１００００の確率閾値を表し、すなわち、これらの閾値の外側に存在する値は、それぞれ、１０００に１つ未満が正常である可能性、又は１００００に１つ未満が正常である可能性を有する。図４０ａは、検証された異数性Ｔ１３試料を含む、第１３染色体のための参照セットＮ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１１９６ＦＤＴ８ｂの第１３染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、１００００に１つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦１×１０^−５である。１３トリソミーが疑われる。図４０ｂ：検証された異数性Ｔ１６試料を含む、第１６染色体のための参照セットＮ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１４２０ＦＤＴ６ｂの第１６染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、１００００に１つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦１×１０^−５である。１６トリソミーが疑われる。図４０ｃ：検証された異数性Ｔ１８試料を含む、第１８染色体のための参照セットＮ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１４２１ＦＤＴ５ｂの第１８染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、１００００に１つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦１×１０^−５である。１８トリソミーが疑われる。図４０ｄ：検証された異数性Ｔ２１試料を含む、第２１染色体のための参照セットＮ１の各試料のＵＥＭから得られた値（灰色の点）と比較した、検査試料ＧＷＸ−１４７０ＦＤＴ４ｂの第２１染色体のＵＥＭから得られた値（円形黒点）を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、１００００に１つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦１×１０^−５である。２１トリソミーが疑われる。実施例５に記載の大量並行シーケンシングのための半導体ベースのＮＧＳプラットホームを使用した、３つのトリソミー試料での本発明の異数性検出検査の結果を示す図である。太く黒いボックスは、問題の試料が半導体技術を使用する６つの異なる正常な参照セットに属する確率を表し、ここで６つの参照セットも、検査試料を扱うために使用したものに同じ半導体技術及び実験プロトコルを使用して生成した。同じ検査試料、及び合成プラットホームによるシーケンシングの使用によって生成された４つの参照セットで得られた結果の比較を示す（細いバー）。

定義
本明細書で用いるように、用語「次世代シーケンシング」（ＮＧＳ）又は「大量並行シーケンシング」は同義語であり、何十万ものシーケンシング工程が並行実施されるハイスループットシーケンシング方法を指す。次世代シーケンシング方法は、一回の実行で数百万の配列を得るために有益である。これらの方法には、単一分子リアルタイムシーケンシング、イオン半導体シーケンシング、ピロシーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシングが含まれる。

本明細書で用いるように、用語「無細胞ＤＮＡ」は、生体試料、例えば血液中で自由に循環するＤＮＡ分子又はＤＮＡ分子のセットを指す。同義語は、「循環ＤＮＡ」である。無細胞ＤＮＡは細胞外にあり、この用語は、例えば細胞の核又はミトコンドリアで見出すことができる細胞内ＤＮＡと対照的に使用される。

本明細書で用いるように、異数性という用語は、１つの染色体の定量的量が二倍体ゲノムの定量的量と変動していることを指す。変動は、増加又は損失であってもよい。それは、染色体全体に関連する場合もあるし、又はその一部だけに関連する場合もあり、例えば染色体の所定領域のみに関連する場合もある。異数性は、モノソミー（１つの染色体の欠如）、部分的モノソミー（染色体の一部の転位又は欠失）、トリソミー（１つの余分の染色体の増加）、部分的トリソミー（染色体の一部の増加及び／又は重複）を含むことができる。本明細書において、正倍数性は異数性の反対を意味するために使用され、すなわち正倍数性試料は二倍体のゲノム、染色体又は染色体の一部を指す。例えば、第２１染色体についての個々の正倍数体は、第２１染色体の２つのコピーを有する。

モノソミー又は部分的モノソミーの例には、ウルフ−ハーシュホーン症候群、ネコ鳴き症候群、５ｑ欠失症候群、ウィリアムズ症候群、ヤコブセン症候群、アンゲルマン症候群、プラダー−ビリ症候群、ミラー−ジーカー症候群、スミス−マゲニス症候群、１８ｑ欠失症候群、ディジョージ症候群が含まれる。

トリソミーの例には、１トリソミー、２トリソミー、３トリソミー、４トリソミー、５トリソミー、６トリソミー、７トリソミー、８トリソミー（ワーカニー症候群）、９トリソミー、１０トリソミー、１１トリソミー、１２トリソミー、１３トリソミー（パトー症候群）、１４トリソミー、１５トリソミー、１６トリソミー、１７トリソミー、１８トリソミー（エドワーズ症候群）、１９トリソミー、２０トリソミー、２１トリソミー（ダウン症候群）、２２トリソミーが含まれる。１つ又はいくつかの染色体領域の損失（欠失）が関与する障害の他の例には、１ｐ３６欠失症候群、ＴＡＲ欠失、１ｑ２１．１欠失、２ｑ１１．２欠失、２ｑ１１．２ｑ１３欠失、２ｑ１３欠失、２ｑ３７欠失、３ｑ２９欠失、ウルフ−ハーシュホーン欠失、ソトス症候群欠失、６ｑ１６欠失、ウィリアムズ症候群欠失、ＷＢＳ遠位欠失、８ｐ２３．１欠失、９ｑ３４欠失、１０ｑ２３欠失、ポトキ−シェーファー症候群、ＳＨＡＮＫ２ＦＧＦ欠失、１２ｑ１４欠失症候群、１３ｑ１２欠失、１５ｑ１１．２欠失、プラダー−ビリ／アンゲルマン症候群、１５ｑ１３．３欠失、１５ｑ２４ＢＰ０−ＢＰ１欠失、１５ｑ２４ＢＰ０−ＢＰ１欠失、１５ｑ２４ＢＰ２−ＢＰ３欠失、１５ｑ２５．２欠失、ルービンスタイン−テービ症候群、１６ｐ１３．１１欠失、１６ｐ１１．２ｐ１２．１欠失、１６ｐ１２．１欠失、１６ｐ１１．２遠位欠失、１６ｐ１１．２欠失、１７ｐ１３．３欠失、１７ｐ１３．３欠失、ＨＮＰＰ、スミス−マゲニス症候群欠失、ＮＦ１欠失症候群、ＲＣＡＤ（腎嚢胞及び糖尿病）、１７ｑ２１．３１欠失、ディジョージ／ＶＣＦＳ欠失、２２ｑ１１．２遠位欠失、フェラン−マクダーミド症候群が含まれる。

１つ又はいくつかの染色体領域の増加（重複）が関与する障害の他の例には、１ｐ３６重複、１ｑ２１．１重複、２ｑ１１．２重複、２ｑ１１．２ｑ１３重複、２ｑ１３重複、２ｑ３７重複、３ｑ２９重複、ウルフ−ハーシュホーン領域重複、５ｑ３５重複、６ｑ１６重複、ウィリアムズ症候群重複、ＷＢＳ遠位重複、８ｐ２３．１重複、９ｑ３４重複、１０ｑ２３重複、１１ｐ１１．２重複、ＳＨＡＮＫ２ＦＧＦ重複、１２ｑ１４重複、１３ｑ１２重複、１５ｑ１１．２重複、プラダー−ビリ／アンゲルマン領域重複、１５ｑ１３．３重複、１５ｑ２４ＢＰ０−ＢＰ１重複、１５ｑ２４ＢＰ２−ＢＰ３重複、１５ｑ２５．２重複、ルービンスタイン−テービ領域重複、１６ｐ１３．１１重複、１６ｐ１１．２ｐ１２．１重複、１６ｐ１２．１重複、１６ｐ１１．２遠位重複、１６ｐ１１．２重複、１７ｐ１３．３重複、１７ｐ１３．３重複、１７ｐ１３．３重複、ＣＭＴ１Ａ、ポトキ−ルプスキ症候群、ＮＦ１重複、１７ｑ１２重複、１７ｑ２１．３１重複、２２ｑ１１．２重複、２２ｑ１１．２遠位重複、２２ｑ１３重複が含まれる。

１０Ｍｂ未満の染色体の一部のコピー数変動が関与する異数性関連のゲノム障害の包括的レビューと一緒に、これらの障害に関する参考文献は、本明細書に参照により組み込まれているＣｏｏｐｅｒら、２０１１、に見出すことができる。

本明細書で用いるように、用語「正倍数性試料」は、正倍数性の胎児を妊娠している正倍数性の母体から得られた試料を指す。用語「正倍数性」は相対的な意味で、すなわち対象の特定の染色体又は染色体領域に関して使用することができる。或いは、用語「正倍数性」は、絶対的な意味で、すなわち全ゲノムに関して使用することができる。この場合には、正倍数性試料は、その全ゲノムにわたっていかなる異数性によっても冒されない。

本明細書で用いるように、用語「異数性試料」は、異数性の胎児を妊娠している正倍数性の母体から得られた試料を指す。「正倍数性」と同様に、用語「異数性」は、対象の特定の染色体若しくは染色体領域に関して、又は全ゲノムに関して使用することができる。

本明細書で用いるように、用語「固有同一配列」は、いかなるミスマッチもなくヒトゲノムに固有にマッピングされた配列を指す。言い換えると、配列はヒトゲノムの単一の位置で整列しており、前記位置と正確に同じ配列を有し、すなわち、ヒトゲノムの前記位置で見出される配列に関していかなる欠失、付加又は突然変異もない。固有同一配列は、２０〜１００ｂｐ、好ましくは４０〜７０ｂｐ、さらに好ましくは５０ｂｐの長さを一般に有する。本明細書において、用語「固有同一配列」（ＵＥＳ）は、用語「固有の正確な一致」（ＵＥＭ：ｕｎｉｑｕｅｅｘａｃｔｍａｔｃｈ）と同義的に使用される。

本明細書で用いるように、「母体生体試料」などでの「母体試料」は、妊娠女性から得られた試料である。

本明細書で用いるように、「生体試料」は、好ましくは無細胞ＤＮＡを含有する生体試料を指し、より好ましくは全血、血漿、血清、尿又は母乳試料を指す。

本発明の第１の態様は、正倍数性の参照生体試料のセット、又は正倍数性と異数性の両方の参照試料のセットの構築に関し、ここで各参照試料は、胎児の異数性診断方法の統計的信頼度を高めるように慎重に選択される。この選択工程のワークフローは、いくつかの重要な選択ステップを含む：
試料中のＤＮＡのサイズ分布に基づく選択（ステップ（ｉｉ）及び（ｉｉｉ））；
試料をプレシーケンシングして、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択（ステップ（ｉｖ）〜（ｖｉ））；
試料のシーケンシングを実施し、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択（ステップ（ｖｉｉ）〜（ｉｘ））；
本発明による方法は、３つの前述の選択ステップのいずれかを含むことができる。しかし、好ましい実施形態では、３つの選択ステップの全てが実施され、このように、参照試料の最終セットの品質を向上させる。

生体試料収集物
本発明による方法は、無細胞ＤＮＡ、特に胎児と母体の無細胞ＤＮＡを見出すことができる任意の生体試料で一般に実施することができる。生体試料は、特に血液、尿、母乳などの体液であってもよい。血液試料が好ましい。本明細書で言及される場合、血液試料は全血試料、血漿試料又は血清試料を指す。生体試料は妊娠中の任意のときに回収されてもよいが、好ましくは妊娠７週以降、例えば妊娠７週〜２０週、好ましくは妊娠７〜１４週、なお好ましくは妊娠７〜１０週に回収される。妊娠７週のように早く実施される診断は、妊娠を中絶する決定がとられる場合により多くの医療選択肢を保留する利点を提供する（例えば、国内法令に従い薬物又は薬物の組合せの使用を通しての中絶を可能にすることができる）。

生体試料は、漿膜絨毛試料採取、羊水穿刺又は臍帯血試料採取などの侵襲的出生前処置の後に収集することができる。それらは、侵襲的処置の後の任意の時間に、例えば侵襲的処置の少なくとも１０分、２０分又は３０分後に収集することができる。生体試料は、侵襲的処置の少なくとも１日又は複数日後に、例えば侵襲的処置の２〜５日後にも収集することもできる。

或いは、生体試料は、侵襲的出生前処置をまだ受けていない女性から収集することができる。本方法の利点はまさにあらゆる侵襲的処置を回避することにあるので、この状況は診断される生体試料にとって好ましい。

参照セットの形成を意図する試料での胎児の異数性状態は、本発明による方法とは別に診断されてもよい。このことは、試料の参照セットを形成するために使用される試料が実際に正倍数性試料であること、言い換えると正倍数性の胎児を妊娠している正倍数性の母体から得られた試料であることを確かめるために有益であると予想される。試料の参照セットを得るために使用される正倍数性試料は、好ましくは上述した用語の「絶対的」定義に従って正倍数性であり、すなわち、それらは対象の特定の染色体についてだけでなくゲノム全体にわたり正倍数性である。上に示すように、本発明の好ましい変異形により、参照試料を構築する予定の試料は、異数性胎児、例えば２１、１８又は１３トリソミーを有する胎児を妊娠している正倍数性の母体からの試料をさらに含むことができる。前と同じように、そのような試料での胎児の異数性状態は、本発明による方法とは別に診断されてもよい。

胎児の異数性状態を評価するための方法は、侵襲的出生前診断処置、例えば羊水穿刺、漿膜絨毛試料採取又は臍帯血試料採取によって母体から胎児の細胞材料を収集することを含むことができる。胎児の異数性状態は、以下の技術のいずれかによって次に評価することができる：核型分析、蛍光ＩｎＳｉｔｕハイブリダイゼーション（ＦＩＳＨ）、ショートタンデムリピートの定量的ポリメラーゼ連鎖反応（ＰＣＲ）、定量的蛍光ＰＣＲ（ＱＦ−ＰＣＲ）、定量的リアルタイムＰＣＲ（ＲＴ−ＰＣＲ）量分析、一塩基多型の定量的質量分析及び比較ゲノムハイブリダイゼーション（ＣＧＨ）。

ほとんどの場合、ほとんどの異数性関連の疾患は症候性なので、母体の異数性状態は既知である。しかし、必要ならば、母体の異数性状態は、母体から得られた細胞材料を用いて評価することもできる。前記の技術のいずれかを用いることができる。

無細胞ＤＮＡ抽出
本発明による方法の重要なパラメータは、母体生体試料からの効率的なＤＮＡ抽出である。無細胞ＤＮＡ抽出は、フェノール−クロロホルム抽出のプロトコルを通して実施されることが好ましい。抽出プロトコルは、一般的に以下のステップを含む：
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップ；
前記混合物から水相を抽出するステップ；
前記水相から無細胞ＤＮＡを沈殿させるステップ；
任意選択で無細胞ＤＮＡを収集するステップ。

本発明は、生体試料、好ましくは血漿試料などの血液試料から無細胞ＤＮＡを抽出するための、フェノール／クロロホルムの使用を包含する。この方法は、既存の方法より頑健な胎児ＤＮＡシグナルを与えるので、入り混じった胎児及び母体の無細胞ＤＮＡを母体生体試料から抽出するために特に評価できる。本発明により、用語「フェノール／クロロホルム」は、フェノールとクロロホルムの混合物を指し、すなわちフェノール及びクロロホルムを含む組成物を指す。前記組成物は好ましくは水溶液であり、好ましくはイソアミルアルコールも含む。組成物のｐＨは、好ましくは７〜９、なお好ましくは７．８〜８．２である。好ましい組成物は、ｐＨが７．８〜８．２のフェノール：クロロホルム：イソアミルアルコールの２５：２４：１の混合物である。組成物は、１つ又は複数の添加剤、例えば１つ又は複数の抗酸化剤及び／又は安定剤を含むことができる。

具体的な実施形態では、抽出方法は、プロテイナーゼＫなどの１つ又は複数のプロテアーゼで生体試料を前処理するステップを含む。

水相の抽出は、クロロホルム及びフェノールと混合した生体試料を遠心分離し、水相を収集することを含むことができる。遠心分離は、主にフェノール、タンパク質又はタンパク質細片を含む下部の有機相、及び核酸を含む上部の水相への混合した生体試料の分離を提供する。

一実施形態では、水相からの無細胞ＤＮＡの沈殿は、以下のステップを含む：
少なくとも１つの沈殿剤を水相と混合するステップ；
前記混合された水相を遠心分離するステップ；及び
遠心分離ペレットを収集するステップ。

沈殿剤は、グリコーゲン、低級アルコール、例えばイソプロパノール若しくはエタノール、又はそれらの混合物から選択されることが好ましい。ＤＮＡを含有する遠心分離ペレットは、次に例えばエタノール及び／又はエーテルで、１回又は複数回洗浄することができる。最後に、懸濁緩衝液、例えばトリス緩衝液にＤＮＡを再懸濁することができる。

フェノール−クロロホルム抽出プロトコルは、大量並行シーケンシングを使用する胎児の異数性の検出のために従来用いられてきたカラム方法の５倍の量のＤＮＡを産出する（Ｃｈｉｕら、２００８、Ｆａｎら、２００８）。このプロトコルはさらに、より高い割合の１５６〜１７６ｂｐのサイズのＤＮＡ、すなわち母体と胎児の無細胞ＤＮＡも与える。したがって、このプロトコルは、胎児ＤＮＡを起源とする配列リードの数を増加させるための重要なツールである。

シーケンシングライブラリーの調製
無細胞ＤＮＡ抽出の後、抽出されたＤＮＡを含有する試料は、シーケンシングライブラリーを調製するために任意選択で処理する。そのような処理は無細胞ＤＮＡの抽出直後に実施してもよく、又は、好ましくは、抽出された無細胞ＤＮＡのサイズ選択のステップの後に実施してもよい。

ライブラリー調製は、１つ又は複数の増幅ステップ、１つ又は複数のシーケンシングアダプターによるライゲート、及び／又はＤＮＡ分子のバーコード化を含むことができる。シーケンシングライブラリー調製の一般的なワークフローは、１つ又は複数のバーコード配列に任意選択で連結される１つ又は複数のアダプター配列の、試料中のＤＮＡ分子へのライゲートのステップ、続くアダプター／バーコードにライゲートされたＤＮＡ分子の増幅を含む。

シーケンシングアダプターは、現代のシーケンシング技術で一般的に使用される短いヌクレオチド配列である。アダプターは、シーケンシングをするＤＮＡ分子を固体表面、例えばフローセルに固着させるために使用される。したがって、これらのアダプターは、固体表面に連結される標的オリゴヌクレオチドとハイブリダイズするように設計される。アダプターのライゲートは、ＤＮＡ分子の末端を修復することによって、すなわち、例えば１つ又は複数のエキソヌクレアーゼ及び／又はポリメラーゼの作用を通して抽出されたＤＮＡ分子のオーバーハングを取り去るか埋め合わせるかして、平滑末端のＤＮＡ分子を得ることによって実施することが好ましい。次に任意選択で、平滑末端のＤＮＡ分子の３’末端に、１つ又は複数の「Ａ」塩基のオーバーハングを付加してもよい。次にそれらの３’末端に１つ又は複数の「Ｔ」塩基のオーバーハングを含有するアダプターを付加して、ＤＮＡ分子の３’末端の１つ又は複数の「Ａ」塩基のオーバーハングにライゲートする。アダプターは、平滑面でライゲートされてもよい。

試料中のＤＮＡ断片は、バーコード化されてもよい。バーコード化は、試料のＤＮＡ分子への、試料特異的タグのライゲートを指す。バーコード化は、１回のシーケンシング実行での数種の試料のシーケンシングを可能にすることから、時間及び資源が節約される。

試料中のＤＮＡ断片は、例えばＰＣＲによる１つ又は複数の増幅サイクルにかけることもできる。１０〜２５の増幅サイクル、例えば１８増幅サイクルを実行することができる。増幅は、ＤＮＡ分子へのアダプター配列のライゲートの後に実行することが好ましい。ＰＣＲ増幅はアダプター配列に対するプライマーを使用することが好ましく、このように、アダプターにライゲートした断片にライブラリーを濃縮する。

無細胞ＤＮＡのサイズ分布分析及び選択
無細胞ＤＮＡ抽出の後に、各試料中のＤＮＡ分子のサイズ分布を分析することができる。この分析は、キャピラリー電気泳動によって実施することが好ましい。例えばそれは、市販のｌａｂ−ｏｎ−ａ−ｃｈｉｐキャピラリー電気泳動システムを用いて実行される。サイズ分布分析は、シーケンシングライブラリーの調製の前後に実行することができる。しかし、それはシーケンシングライブラリーの調製の前に実施することが好ましい。

本発明者らは、等しい総量の投入ＤＮＡに対して、ＮＧＳの後の未処理リードの総数に予想外の変動性があることを立証した。未処理の抽出物をキャピラリー電気泳動したところ、これの１つの可能な説明は、ＮＧＳに利用できる対象の胎児ＤＮＡを含有する低分子量画分の相対量を減少させる、高分子量（ＭＷ）ＤＮＡ種（＞１０００ｂｐ）の存在であるかもしれないことが明らかになった。無細胞ＤＮＡ抽出の直後及びライブラリー調製の前に高分子量種を除去するために実施した実験から、低分子量種（＜２００ｂｐ、特に１５０〜２００ｂｐ）のサイズ選択及び高分子量種の除外がＮＧＳの後に得られた未処理リードの数の変動性をほとんど除去することが確認された（図１６を参照）。この技術ステップは、サイズ選択された分子だけがシーケンシングライブラリー調製のために処理され、大規模にシーケンシングされるという事実から生じるその経済的利益に加えて、アッセイの頑健性及び分解能も向上させる。具体的には、サイズ選択のこの処置は胎児画分、すなわち循環無細胞ＤＮＡの全量に占める無細胞循環胎児ＤＮＡの割合を増加させ、その使用を低い胎児画分の場合でのアッセイの頑健性のために決定的にする。ライブラリー調製の前のサイズ選択によってもたらされる胎児画分の増加は、トリソミーを確実に検出するために必要とされるリードの数を減少させる効果を有する。

サイズが２００ｂｐを超える無細胞ＤＮＡ分子を除去するステップは、当技術分野で公知の任意の技術によって実行することができる。磁気ビーズ、例えば下の実施例に記載のＡＭＰｕｒｅＸＰ（登録商標）ビーズの使用が特に好ましい。ゲル電気泳動を使用することもできる。本発明者は、本発明によるサイズ選択の有益効果は、大量並行シーケンシングステップのために使用される特定の技術にかかわりなく達成されることを実証した。例えば、それは、合成によるシーケンシング方法、並びに半導体ベースの次世代配列技術を使用して達成される。検査試料及び参照セットのために同じ大量並行シーケンシングプラットホームを使用することが最適であるが、それにもかかわらず、信頼できる結果は異なるプラットホームが試料及び参照セットに適用されるときに達成されることも実証された。

さらに、正倍数性の試料のセットでＤＮＡ分子のサイズ分布を分析することによって、本出願の発明者は、シーケンシングライブラリーの調製のために処理した無細胞ＤＮＡ、すなわちアダプターにライゲートされた無細胞ＤＮＡのサイズ分布が、約２９８ｂｐにサイズピークを有することを見出した（図１）。アダプター／バーコード配列の１３２ｂｐのサイズを減算した後、ピークサイズは１６６ｂｐに相当する。この値は、Ｆａｎら、２００８、によって以前に提供されたデータと、及び無細胞ＤＮＡの主にモノヌクレオソーム起源の仮説とも一致する。

本発明により、試料中のＤＮＡのサイズ分布は、胎児の異数性診断用参照試料の適切なセットを構成する過程において基準として使用することができる。この基準は、高レベルの無細胞ＤＮＡを有する試料の選択、及び低レベルの無細胞ＤＮＡを有する試料の排除を可能にする。

選択基準は、約１６６ｂｐでのサイズピークの発生に存することができる。本明細書で用いるように、用語「約１６６ｂｐ」は、「１５１〜１８１ｂｐ」、又は「１５６〜１７６ｂｐ」、又は「１６１〜１７１ｂｐ」、又は「１６３〜１６９ｂｐ」、又は「１６５〜１６７ｂｐ」の意味を有し得る。或いは、この用語は「正確に１６６ｂｐ」の意味を有し得る。

適切な参照試料を選択するための別の基準は、ピークの高さが約１６６ｂｐであること、又は言い換えればサイズが約１６６ｂｐのＤＮＡ分子の画分に存する場合もある。したがって、具体的な実施形態では、ステップ（ｉｉｉ）は、試料を選択するサブステップであって、ここで試料中のＤＮＡ分子の少なくとも８０重量％、なお好ましくは少なくとも９０重量％、好ましくは少なくとも９５重量％、なお好ましくは少なくとも９７重量％が約１６６ｂｐ、好ましくは１５６〜１７６ｂｐのサイズを有する、サブステップを含む。

その代わりに、又はそれに加えて、ステップ（ｉｉｉ）は、試料を選択するサブステップであって、ここでサイズが約１６６ｂｐ、好ましくは１５６〜１７６ｂｐのＤＮＡ分子の濃度が、少なくとも０．８８ｎｇ／μｌ、好ましくは少なくとも０．９０ｎｇ／μｌ、なお好ましくは少なくとも０．９５ｎｇ／μｌ、又は少なくとも１．００ｎｇ／μｌ、又は少なくとも１．０５ｎｇ／μｌ、又は少なくとも１．１０ｎｇ／μｌである、サブステップを含む。

その代わりに、又はそれに加えて、ステップ（ｉｉｉ）は、試料を選択するサブステップであって、ここでサイズが約１６６ｂｐ、好ましくは１５６〜１７６ｂｐのＤＮＡ分子の量が、少なくとも１３ｎｇ、好ましくは少なくとも１３．５ｎｇ、なお好ましくは少なくとも１４．２５ｎｇ、又は少なくとも１５ｎｇ、又は少なくとも１５．７５ｎｇ、又は少なくとも１６．５ｎｇである、サブステップを含む。

ステップ（ｉｉｉ）で選択される試料のセットの中で、サイズが約１６６ｂｐ、好ましくは１５６〜１７６ｂｐの抽出されるＤＮＡ分子の平均濃度は、少なくとも０．８８ｎｇ／μｌ、好ましくは少なくとも０．９０ｎｇ／μｌ、なお好ましくは少なくとも０．９５ｎｇ／μｌ、又は少なくとも１．００ｎｇ／μｌ、又は少なくとも１．０５ｎｇ／μｌ、又は少なくとも１．１０ｎｇ／μｌであることが好ましい。

ステップ（ｉｉｉ）で選択される試料のセットの中で、サイズが約１６６ｂｐ、好ましくは１５６〜１７６ｂｐのＤＮＡ分子の平均量は、少なくとも１３ｎｇ、好ましくは少なくとも１３．５ｎｇ、なお好ましくは少なくとも１４．２５ｎｇ、又は少なくとも１５ｎｇ、又は少なくとも１５．７５ｎｇ、又は少なくとも１６．５ｎｇであることが好ましい。

濃度及び／又は量は、シーケンシングステップのために調製されるＤＮＡライブラリーで測定することができ、例えば、それはアダプター／バーコードとライゲートされるＤＮＡ分子、例えば１３２ｂｐアダプター／バーコードとライゲートされるＤＮＡ分子で測定することができる。ＤＮＡ分子はアダプター／バーコードのライゲートの後、１８増幅サイクルを受けていることが好ましい。濃度及び／又は量は、投入材料として２０ｎｇのＤＮＡを使用してＩｌｌｕｍｉｎａのＣｈＩＰシーケンシングプロトコルを使用して調製されるＤＮＡライブラリーで測定することがなお好ましい。濃度及び／又は量は、ＤＮＡライブラリーの調製の前に測定することもできる。

興味深いことに、本出願の発明者は、母体血漿試料中のＤＮＡ分子が約１３３〜１４３ｂｐにより小さいサイズのショルダーを示すことも発見した（図１、右パネル）。このショルダーは胎児ＤＮＡを反映する可能性があり、胎児ＤＮＡの濃縮画分を有する試料の選択のための追加又は代替の品質管理基準として使用することができる。したがって、ステップ（ｉｉｉ）は、そのＤＮＡサイズ分布が１３３〜１４３ｂｐの間でピーク又はショルダーを明らかにする試料を選択することを含むこともできる。

上に示したサイズ値（１６６ｂｐのピーク及び関連する値）は、アダプター又はバーコードにライゲートしていないＤＮＡ分子、すなわち母体血液に見出されるＤＮＡ分子に相当する。必要な場合は、アダプター、バーコード又はＤＮＡ分子の片方若しくは両方の末端の任意の配列タグの存在を考慮するために、これらの値を適合させることができる。

本明細書で用いるように、ピークは、試料中のＤＮＡ分子のサイズ分布を表す曲線での局所最大値を指す。ショルダーは、この曲線中の屈折点を指す。

プレシーケンシング
本発明により、プレシーケンシングは、より大きな規模の次世代シーケンシングの前に任意選択で実施することができる、小規模シーケンシングを指す。したがって、先行技術の方法に反して、本発明のこの変異形は、参照セットの各試料で連続して実施される２つのシーケンシングステップによって特徴付けられる。したがって、「プレシーケンシング」は、「第１のシーケンシング」と称することもできる。同様に、「大量並行シーケンシング」は「第２のシーケンシング」と称することができる。配列の小さいライブラリー中の固有同一配列の割合は、次世代のシーケンシングによって得られたフルスケールライブラリー中の固有同一配列の割合を代表すると発明者は仮定した。したがって、初期段階でＤＮＡ試料の小規模シーケンシングを実行することによって、不十分な量の固有同一配列しか有しない試料を早期に排除することが可能である。このプレシーケンシングステップは、その後実施される大量並行シーケンシングよりずっと少ない時間及び費用しか消費しない。したがって、本発明は、不十分な品質の試料を排除し、それによって向上した品質の参照セットを与えつつ、時間及び資源の節約を可能にする。

プレシーケンシングステップは、１試料につき１０００〜１００，０００個の配列、なお好ましくは１試料につき５０００〜５００００個の配列のシーケンシングを含むことが好ましい。

各配列リードのサイズは、好ましくは２０ｂｐ〜１００ｂｐ、なお好ましくは４０〜７０ｂｐ、例えば５０ｂｐである。これらのサイズ、特に５０ｂｐは、ヒトゲノムの複数の位置にマッピングする可能性がより高い短すぎるリードと、配列中にＳＮＰを有する可能性をもたらす長すぎるリードの間の優れた妥協である。

無細胞ＤＮＡ抽出の後、及びライブラリー調製の前に上記のサイズ選択ステップが実行される場合は、プレシーケンシングのステップは通例必要でない。

配列マッピング
ヒトゲノムの上での配列のアラインメントは、例えばＣｈｉｕら、２００８又はＦａｎら、２００８に記載される任意の標準のアラインメントソフトウェアを用いて実行することができる。マッピングのために使用されるヒトゲノム配列は、ＮＢＣＩ（ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ａｓｓｅｍｂｌｙ／２７５８／）又はＵＣＳＣ（ｈｔｔｐ：／／ｈｇｄｏｗｎｌｏａｄ．ｃｓｅ．ｕｃｓｃ．ｅｄｕ／ｄｏｗｎｌｏａｄｓ．ｈｔｍｌ＃ｈｕｍａｎ）によって確立された配列などの参照配列であることが好ましい。参照配列は、ｈｇ１９とも称される２００９年２月（ｈｇ１９、ＧＲＣｈ３７）であることが好ましい。

本発明による方法が２つのシーケンシングステップ（任意選択の変異形として）を含む場合は、それは２つのマッピングステップも含む：プレシーケンシングステップで得られた配列のマッピング、及び大量並行シーケンシングステップで得られた配列のマッピング。２つのマッピングステップは同じ方法で、すなわち同じヒトゲノム配列及び／又は同じアラインメントソフトウェアを用いて実施することが好ましい。

両方のマッピングステップは、ヒトゲノムの全配列にわたって、例えば全ｈｇ１９参照配列にわたって行うことができる。

或いは、アラインメントは、ヒトゲノムの一部だけで、言い換えるとヒトゲノムの部分配列について行うことができる。一般的に言って、スコア計算で使用されるヒトゲノムの部分配列は、ヒトゲノムの所定の領域をマスキングすることによって得られる。マスキングされる領域は、以下を含むいくつかの異なるパラメータに基づいて選択することができる：領域のより低い品質のシーケンシング（これらの領域は「注釈不良領域」としても知られる）；領域中での多数の反復の発生；ヒトゲノム内での領域の重複；複合体構造を有する領域。したがって、マスキングされる領域は、ヒトゲノムの注釈不良領域、ヒトゲノムの多コピー反復領域、ヒトゲノムの重複領域又は複合体構造を有する領域から選択されることが好ましい。

例えば、より低い品質のシーケンシングを有する領域又は「注釈不良」領域は、４６，３９５，６４１未満の足場Ｎ５０及び／又は３８，５０８，９３２未満のコンティグＮ５０及び／又は２３９，８４５，１２７／３，１３７，１４４，６９３を超える全アセンブリーギャップ長及び／又は少なくとも９０％、好ましくは少なくとも９５％のゲノムカバレージを有する領域である（Ｙａｎｄｅｌｌら、２０１２）。注釈不良領域の例は、テロメア下領域及び動原体周囲領域である。

ゲノムアセンブリーは、足場及びコンティグで構成される。コンティグは、重複するリードの集合から得られた連続したコンセンサス配列である。足場は、シーケンシングリードのメイト対によってお互いに連結され、順序づけら、方向づけられるコンティグのセットである。コンティグＮ５０は、先ず最も長いものから最も短いものにかけて、長さによってあらゆるコンティグを順序づけることによって計算される。次に、最も長いコンティグから出発して、この連続の合計がアセンブリー中の全てのコンティグの全長の２分の１に等しくなるまで、各コンティグの長さを合計する。アセンブリーのコンティグＮ５０は、このリストで最も短いコンティグの長さである。足場Ｎ５０は、コンティグではなく足場を使用すること以外は同じ方法で計算される。約８００ｂｐより短いコンティグ及び足場と同様に、単一のリード又はリード対−しばしば「シングルトン」と呼ばれる−だけを含む足場及びコンティグはこれらの計算から排除することができる。

ゲノムカバレージは、サイズ予想に基づくアセンブリーに含まれるゲノムの百分率を指し、これらは、細胞学的技術に通常基づく。例えば、複合構造を有する領域は、高度に変異した領域、例えば多数のＣＮＶ（コピー数変異形）及び／又はＳＮＶ（単一ヌクレオチド変異形）を有する領域である（Ｆｒａｚｅｒら、２００９）。例えば、ヒトゲノムの５％の推定値は、コピー数変異である。

プレシーケンシング後の固有同一配列の量に基づく品質管理
本発明による方法の任意選択のステップ（ｖｉ）は、前記試料で得られた固有同一配列の量に基づいて試料セットを選択することに存する。したがって、ステップ（ｖｉ）は、固有同一配列の最小限の量より多くを有する試料を選択すること、又は他の用語では、固有同一配列の最小限の量より少なく有する試料を排除することに存する。

本明細書で用いるように、用語「量」は、固有同一配列の絶対数、又は比を指すことができる。比は、プレシーケンシングステップで得られた配列リードの総数に対して計算することができる。しかし、比は、フィルターを通過するリードの数に対して計算することが好ましい。

フィルタリングは、アダプター配列に少なくとも部分的にマッピングされた配列を排除することに存することができる。フィルターを通過するリードの数は、アダプター配列に少なくとも部分的にマッピングされた配列リードの数を配列リードの総数から引いたものである。

好ましい実施形態では、ステップ（ｖ）は、前記試料のプレシーケンシングステップで得られた配列リードの総数に対して少なくとも７０％の固有同一配列、好ましくは少なくとも７２％の固有同一配列、なお好ましくは少なくとも７５％、又はなお好ましくは少なくとも７７％、又はなお好ましくは少なくとも８０％の固有同一配列を有する試料を選択することを含む。

無細胞ＤＮＡ抽出の後、及びライブラリー調製の前に上記のサイズ選択ステップが実行される場合は、プレシーケンシングステップ及び続く前記試料で得られた固有同一配列の量に基づく試料セットの選択は通例必要でない。

大量並行シーケンシング
様々な大量並行シーケンシング技術及びプラットホームを、本発明で用いることができる。

例えば、大量並行シーケンシングプラットホームは、ＩｌｌｕｍｉｎａのＨｉＳｅｑ２０００プラットホームなどの「合成によるシーケンシング」システムに存することができる。このプラットホームは、成長するＤＮＡ鎖に単独塩基が組み込まれるときにそれらを検出する、可逆的ターミネーターベースの方法を使用する。「合成によるシーケンシング」システムでのシーケンシングワークフローは、３つの段階に要約することができる：

第１に、ＤＮＡライブラリーの調製：このステップは既に記載されており、上で指摘した通り、それは正倍数性の適切な参照試料を選択する全過程又は診断過程の初期に実行することができる。それは例えばＤＮＡ抽出の直後、又は抽出された無細胞ＤＮＡのサイズ選択の直後に実施される。この段階で、ＤＮＡ分子は両末端でアダプターにライゲートされる。さらに、それらは、ＰＣＲによってライブラリーを増幅し、それをシーケンシングするために使用されるプライマー部位を含有する。

第２に、クラスター生成：この段階で、ＤＮＡ分子はフローセル内の固体表面に連結されるオリゴヌクレオチドプローブとハイブリダイズされる。各ＤＮＡ分子は固相ブリッジ増幅によって増幅され、同一の配列を有する分子のクラスターを形成する。

第３に、「合成によるシーケンシング」段階。各々蛍光標識ターミネーターを含有する４つのヌクレオチドの混合物をフローセルに導入する。各ｄＮＴＰが成長するＤＮＡ鎖に組み込まれるときに蛍光標識ターミネーターを画像化し、次に切断して次の塩基の組込みを可能にする。全４つの可逆的ターミネーター結合ｄＮＴＰが各シーケンシングサイクルに存在するので、天然の競合が組込みバイアスを最小にする。各サイクルで、強度シグナル測定からベースコールが直接実行される。

或いは、大量並行シーケンシングプラットホームは、例えば半導体をベースとした次世代配列技術に存することができる。

具体的な実施形態では、大量並行シーケンシングステップは、１試料につき少なくとも１０，０００，０００個、好ましくは少なくとも２０，０００，０００個、なお好ましくは少なくとも３０，０００，０００個の配列をシーケンシングすることに存する。

その代わりに、又はそれに加えて、１試料につき少なくとも６，０００，０００個、好ましくは少なくとも８，０００，０００個、なお好ましくは少なくとも１０，０００，０００個、又は少なくとも１２，０００，０００個、又は少なくとも１４，０００，０００個、又は少なくとも１５，０００，０００個の固有同一配列がマッピングステップ（例えばステップ（ｖｉｉｉ））で得られる。その代わりに、又はそれに加えて、１試料につき少なくとも１２，０００，０００個、好ましくは少なくとも１５，０００，０００個、なお好ましくは少なくとも２０，０００，０００個の平均数の固有同一配列がマッピングステップ（例えばステップ（ｖｉｉｉ））で得られる。

配列の総数及び／又は大量並行シーケンシングステップで得られた固有同一配列の数は、参照試料セットを形成する試料を選択する工程で品質管理基準として使用することもできる。

具体的な実施形態では、本発明による正倍数性の参照試料のセット又は正倍数性及び異数性の参照試料のセットを得る方法は、１試料につき少なくとも１０，０００，０００個、好ましくは少なくとも２０，０００，０００個、なお好ましくは少なくとも３０，０００，０００個の総数の配列を有する試料を選択することを含む。

その代わりに、又はそれに加えて、本発明による正倍数性の参照試料のセット、又は正倍数性及び異数性の参照試料のセットを得る方法は、少なくとも６，０００，０００個、好ましくは少なくとも８，０００，０００個、なお好ましくは少なくとも１０，０００，０００個、又は少なくとも１２，０００，０００個、又は少なくとも１４，０００，０００個、又は少なくとも１５，０００，０００個の固有同一配列を有する試料を選択することを含む。正倍数性及び異数性の参照試料中の１０，０００，０００〜１２，５００，０００個の固有同一配列が特に好ましい。

その代わりに、又はそれに加えて、参照試料のセットは、大量並行シーケンシングステップで得られた少なくとも２０，０００，０００個、好ましくは少なくとも２５，０００，０００個、なお好ましくは少なくとも２７，０００，０００個の平均総数の配列を有する。用語「配列総数」は、シーケンシングステップで得られた非フィルタリングリードの総数、又はシーケンシングプラットホームがフィルタリングを含む場合はフィルターを通過するリードの総数を指すことができる。そのような場合、用語「配列総数」は、好ましくはフィルターを通過するリードの総数を指す。

その代わりに、又はそれに加えて、参照試料セットは、少なくとも１２，０００，０００個、好ましくは少なくとも１５，０００，０００個、なお好ましくは少なくとも２０，０００，０００個の平均数の固有同一配列を有する。

診断方法
本発明の第２の主要な態様は、母体生体試料から胎児の異数性を診断する方法に存し、診断する試料を上記の参照試料セットを得る方法で得られた試料の参照セットと比較することを特徴とする。

簡潔には、この方法のワークフローは以下の通りに要約することができる：
生体試料からの無細胞ＤＮＡの抽出；
抽出したＤＮＡ分子のＮＧＳ（大規模並行）シーケンシング；
ヒトゲノムに配列をマッピングすること；
前記試料について対象の染色体又は染色体領域のスコアを計算すること；
前記スコアを参照試料セットの同じ染色体又は染色体領域で得られたスコアのセットと比較すること；
比較の結果に基づいて胎児の染色体の異数性の有無を診断すること。

したがって、参照試料セットを得る方法の上記の実施形態と比較して、診断方法のワークフローは、ステップ（ｉｉ）、（ｉｉｉ）、（ｉｖ）、（ｖ）及び（ｖｉ）、すなわちサイズ分布に基づく選択及びプレシーケンシング結果に基づく選択を必ずしも含むとは限らない。当然ながら、これは、診断する試料でサイズ分布分析／選択又はプレシーケンシングを実施することができないことを意味しない。実際、サイズが２００ｂｐを超えるＤＮＡ分子を排除するサイズ選択ステップを、検査試料からの無細胞ＤＮＡの抽出の後、及び大量並行シーケンシングの前、より詳細にはライブラリー調製の前に実施することが特に好ましい。

一般的に言って、参照試料セットを選択する方法での特定のステップに関する上記の特色及び実施形態は、胎児の異数性の診断方法での対応するステップにも適用される。

スコアリングアルゴリズム
所与の染色体又は染色体領域について計算したスコアは、所与の試料について前記染色体又は染色体領域にマッピングされた固有同一配列（ＵＥＳ又はＵＥＭ）カウントの指標であるパラメータである。スコアは、全ヒトゲノム配列について、又はヒトゲノムの部分配列について、又は他の用語では、一部の領域がマスキングされている配列について計算することができる。

ヒトゲノムの慎重に選択された一部だけについてスコアを計算することは、診断方法の統計的信頼度を高くする方法である。一般的に言って、スコア計算で使用されるヒトゲノムの部分配列は、ヒトゲノムの所定の領域をマスキングすることによって得られる。マスキングする領域を規定するために、領域のより低い品質のシーケンシング（他の用語では注釈不良領域とも規定される）、領域中での多数の反復の発生、ヒトゲノム内での領域の重複、複合体構造を有する領域を含む、いくつかのパラメータを考慮することができる。したがって、マスキングされる領域は、ヒトゲノムの注釈不良領域、ヒトゲノムの多コピー反復領域、ヒトゲノムの重複領域又は複合体構造を有する領域から選択されることが好ましい。

各染色体のスコアは、各染色体を所定の長さのビン、例えば５０ｋｂビンに分けることによって計算することができる。分割は、全ヒトゲノム配列で、又は部分的ヒトゲノム配列で、すなわち上で説明されるように一部の領域がマスキングされたヒトゲノム配列で実行することができる。所与のビンにマッピングされた固有同一配列（ＵＥＳ）の数を次にカウントし、各ビンのＵＥＳカウントを得る。

具体的な実施形態では、各ビンのＵＥＳカウントはバイアス修正され、すなわち、それはシーケンシング工程に関連するバイアスを考慮するように修正される。公知のバイアスは、ゲノム全体でのＧＣ分布の変動によって引き起こされる。Ｆａｎら、２０１０、が記すように、ゲノム全体での配列タグの分布は均一でない。実際、染色体領域のＧＣ含有量と前記領域にマッピングされた配列の数の間に正の相関が存在し、そのことは、ＧＣに富む領域を起源とする配列がＧＣ欠乏領域を起源とする配列よりも多く配列ライブラリーに現れる理由を説明する。このバイアスは、例えば前記ビンでのＧＣ含有量に反比例する重みで各ビンでのＵＥＳカウントを重み付けすることによって補償することができる。

対象の染色体又は染色体領域での全てのビンの中間ＵＥＳカウント値を、次に計算する。この値は染色体又は染色体領域全体でのＵＥＳカウントの代表であり、染色体又は染色体領域の配列タグ密度と称される。この中間値は、非加重ＵＥＳカウントを使用することにより、又は、上に示すように各ＵＥＳカウントをバイアス補正係数で重み付けすることによって計算することができる。別の実施形態では、染色体全体でのＵＥＳカウントを表すために中間値以外の他の値、例えば染色体中の全てのビンのＵＥＳカウントの合計が選択される。

最後に、対象の染色体又は染色体領域の配列タグ密度を、全ての染色体の中間配列タグ密度に標準化することができる。或いは、全ての常染色体の中間配列タグ密度にそれを標準化することができる。なお代わりに、所定の染色体セットの中間配列タグ密度にそれを標準化することができる。本明細書で用いるように、「染色体セット」は、第１染色体から第２２染色体並びにＸ染色体及びＹ染色体から選択される染色体の任意の組合せを指す。なお代わりに、所定の染色体領域セットの中間配列タグ密度にそれを標準化することができる。なお代わりに、全ての染色体、又は全ての常染色体、又は所定の染色体セット、又は所定の染色体領域セットの配列タグ密度の合計にそれを標準化することができる。

染色体又は染色体領域の標準化配列タグ密度は、所与の試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標であるパラメータとして使用することができる。しかし、このパラメータは、他の値によって表すことができる：
対象の染色体又は染色体領域の配列タグ密度；
対象の前記染色体又は染色体領域にマッピングされたＵＥＳの数；
試料のＵＥＳの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたＵＥＳの数；
染色体又は染色体領域の所定のセットにマッピングされたＵＥＳの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたＵＥＳの数。

図６〜１３に例示されるように、異数性試料を正倍数性試料と区別し、このようにして対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である他のパラメータを得るために、他のスコアリングアルゴリズムを使用することができる。

対象の染色体は第２１染色体であり、及び／又は胎児の異数性は２１トリソミーであることが好ましい。或いは、対象の染色体は第１８染色体であり、及び／又は胎児の異数性は１８トリソミーである。或いは、対象の染色体は第１３染色体であり、及び／又は胎児の異数性は１３トリソミーである。或いは、対象の染色体は第２２染色体であり、及び／又は胎児の異数性は２２トリソミーである。或いは、対象の染色体は第４染色体であり、及び／又は胎児の異数性はウルフ−ハーシュホーン症候群である。

或いは、対象の染色体領域は、ウルフ−ハーシュホーン症候群の欠失領域を含む第４染色体の一部である。或いは、対象の染色体は第５染色体であり、及び／又は胎児の異数性はネコ鳴き症候群である。或いは、対象の染色体領域は、ネコ鳴き症候群の欠失及び／又は重複領域を含む第５染色体の一部であり、及び／又は胎児の異数性はネコ鳴き症候群である。或いは、対象の染色体は第１９染色体である。或いは、対象の染色体は第１染色体である。前記の染色体又は染色体領域の任意の組合せを、具体的な実施形態として選択することもできる。

対象の染色体は第２１染色体、第１８染色体又は第１３染色体であることがより好ましく、対象の染色体は第２１染色体又は第１８染色体であることがなお好ましい。

検査試料と参照試料セットの比較
検査試料の対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標として選択される検査パラメータがなんであれ、試料の参照セットの各試料について同じパラメータを計算し、このようにして参照パラメータのセットを得る（「同じパラメータ」は、検査試料のために使用したのと同じ方法を用いてパラメータが計算されるが、検査試料で得られるものの代わりに参照試料で得られたシーケンシングデータに適用されることを意味する）。

次に、検査試料で得られた検査パラメータを、参照試料で得られた参照パラメータのセットと比較する。

第１の方法では、式：
ｚスコア＝（Ｐ_ｔｅｓｔ−平均（Ｐ_ｒｅｆ））／（ＳＤ（Ｐ_ｒｅｆ））
によって検査試料のｚスコアを計算することによって比較を行うことができ、上式で、
Ｐ_ｔｅｓｔは、検査試料から計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータであり、
平均（Ｐ_ｒｅｆ）及びＳＤ（Ｐ_ｒｅｆ）は、それぞれ、参照試料セットから計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である参照パラメータのセットの平均及び標準偏差である。

対象の染色体又は染色体領域について異数性である試料のｚスコアの絶対値は、４より上、なお好ましくは４．４より上であることが好ましい。

対象の染色体又は染色体領域について正倍数性である試料のｚスコアの絶対値は、４．４より下、なお好ましくは４より下であることが好ましい。

参照試料セットの各試料のｚスコアの絶対値は、４．４より下、なお好ましくは４より下であることが好ましい。

図４及び５に例示されるように、本発明による方法を使用することによる参照試料の適切なセットの選択は、４．４のｚスコアをカットオフ値として、正倍数性試料からの２１トリソミー及び１８トリソミー試料の識別を可能にする。このｚスコアは、偶然に誤った結果をもたらす≦１．１×１０^−５の事前確率に対応し、それは先行技術の対応するデータより極めて低い。

第２の方法では、確率に基づく計算を使用して、好ましくは正倍数性と異数性（トリソミー）の試料を含む参照セットを使用して比較を行うことができる。この方法により、工程は２つのステップを同様に含む。第１は、参照ヒトゲノムでの検査試料から得られた配列のアラインメントを含み、第２は、検査試料の各染色体で得られた結果を、参照セットの試料の対応する染色体で得られた結果と比較することを含む：
検証されたトリソミーを有する試料セットの所与の染色体についてのＵＥＳカウントから得られた値を、正常な参照試料のセットの同じ所与の染色体についてのＵＥＳカウントから得られた値と一緒にグラフに表す；
参照セットの正常な試料は、確率的に千に１つの正常な試料だけが超えるはずである値の区間を決定するために使用される。この区間を、グラフに示す。したがって、１染色体につき１つの「参照グラフ」が確立される。
次に、検査試料の所与の染色体についてＵＥＳカウントから得られた値も、臨床評価の基準として役立つ対応する参照グラフに示す。少なくとも５０個、好ましくは少なくとも７５個の参照試料を各々含む複数の参照セット、例えば少なくとも４つ、好ましくは６つの参照セット（例えば、図１７〜３８に例示する参照セットＮ１、Ｎ、Ｂ１、Ｂ２、Ａ１及びＡ２）を、診断を確立するのに一貫して使用することにより、診断の確証を得る。

実施例１
母体血液からのＤＮＡ抽出及び品質管理アッセイ
地域の倫理委員会による承認が係属中の前向き臨床試験の状況で、１００人の妊娠女性から血液試料を収集した。母体の妊娠年齢は、１４．６３±４．００週であった。

侵襲的出生前診断の３０分後に、２つの７．５ｍｌ管（ＢＤバキュテーナー採血管、ＢｅｃｋｔｏｎＤｉｃｋｉｎｓｏｎ、ＮＪＵＳＡ０７４１７、又はＢＣＴ管、Ｓｔｒｅｃｋ，Ｉｎｃ．、Ｏｍａｈａ、ＮＥ６８１２８）を収集した。記載の通りに血漿を精製し（Ｃｈｉｕら２００８；Ｆａｎら２００８）、−２０℃で直ちに冷凍した。ヌクレオスピン（ｎｕｃｌｅｏｓｐｉｎ）血漿キット（ＭａｃｈｅｒｅｌｙＮａｇｅｌ、下記の通りに製造業者の指示による）、又は以下の通りのフェノール−クロロホルム方法による無細胞ＤＮＡ抽出のために、２ｍｌの一定分量の血漿を使用した。

ヌクレオスピン血漿キット（製造業者の指示による）
２０μｌのプロテイナーゼＫを２ｍｌの一定分量の血漿に加え、混合液を（撹拌せずに）３７℃で１０分の間加熱した。混合液血漿−プロテイナーゼＫを５ｍＬ管に移し、次に緩衝液ＢＢを加え（１．５×血漿容量）、それらを倒置により管を３回混合し、３秒間撹拌した。混合液をいくつかのカラムに加え（６００μｌ／カラム）、２０００ｇ（３２０ｒｐｍ）で３０秒間、次に１１０００ｇ（９６００ｒｐｍ）で５秒間遠心分離した。次に、カラムを１回目は５００μｌの緩衝液ＷＢで洗浄して、１１０００ｇ（９６００ｒｐｍ）で３０秒間遠心分離し、２回目は２５０μｌの緩衝液ＷＢで洗浄して１１０００ｇ（９６００ｒｐｍ）で３分の間遠心分離した。最後に、２０μｌの溶出緩衝液をカラムに加え、それを次に１１０００ｇ（９６００ｒｐｍ）で３０秒間遠心分離した。得られたＤＮＡ抽出物を単一の２ｍＬ管にプールした。

フェノール−クロロホルム方法
２００μｌの１０％ＳＤＳ、４０μｌの０．５ＭＥＤＴＡ及び２５μｌのプロテイナーゼＫを加えて、試料を５８℃で２時間インキュベートした。室温で平衡化した２ｍｌのビオフェノール（ｂｉｏｐｈｅｎｏｌ）を加えて試料を撹拌し、４０００ｒｐｍで１０分間遠心分離した。水相（１８００ｍｌ）を新しい５ｍｌ管に移し、ＤＮＡを２０μｌのグリコーゲン／ＧｌｙｃｏＢｌｕｅ、１／９容量の３ＭＮａＡｃ、及び０．７容の氷冷イソプロパノールで沈殿させた。激しく撹拌した後、２ｍｌを新しい管に移し、最大速度の微量遠心管で１０分の間遠心分離した。上清をデカントし、残りの量を加え、同じ条件下で管を遠心分離した。ＤＮＡペレットを先ず６００μｌのエタノール７０％で、続いて６００μｌのエーテルで洗浄し、２０μｌの０．５ｍＭトリスｐＨ８．２に懸濁した。

ＰｉｃｏＧｒｅｅｎでＤＮＡ濃度を測定し、雄胎児に対応する試料でＴＨＯ１及びＳＲＹのｑＰＣＲアッセイを実施した。これらのアッセイの原理は、以下を数量化することである：
ヒトＹ染色体に存在するＳＲＹ遺伝子の１３７ｂｐ配列を増幅することによる雄ＤＮＡ、すなわち胎児ＤＮＡ；

ヒト第１１染色体に存在するＴＨＯ１ＳＴＲ（ショートタンデムリピート）を含む１６２ｂｐ配列を増幅することによる全ヒトＤＮＡ、すなわち胎児＋母体のＤＮＡ。

マウス遺伝子ＧＡＬＴを内部対照として用いた。簡潔には、試料ごとに、１２．５μｌの絶対ＱＰＣＲミックス（ＡＢ−１１３３／Ａ、ＡＢＧｅｎｅ）、２．５μｌのプライマー／プローブＳＲＹ／ＴＨＯ１／ＧＡＬＴ混合物、及び０．４μｌのＡｍｐｌｉＴａｇＧｏｌｄ５Ｕ／μｌ（Ｎ８０８０２４９、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）を含有するマスターミックスを調製した。各々以下：Ｈ_２Ｏに増幅する５μｌのＤＮＡ試料、５μｌのＳｔｄＧａｌｔ１０コピー／μｌ（ＧＡＬＴの標準配列）、１５μｌのマスターミックスを含有する２５μｌのＰＣＲミックスを調製した。

各系列は、標準（１０μｌ標準、細胞数２００／１０μｌ）を含む。５０サイクルのＲＴ−ＰＣＲ（９５℃／１５秒；６０℃／６０秒）をＲｏｔｏｒＧｅｎｅｑＰＣＲ機器（Ｑｉａｇｅｎ）で実行し、６０℃でチャネルＳＲＹ（緑色）、ＴＨＯ１（黄色）、ＧＡＬＴ（赤色）での獲得であった。

表１は、２つの方法、カラム及びフェノールに基づく方法で並行して抽出された雄胎児を妊娠している妊娠女性からの９つの血漿試料の比較結果を示す。見られるとおり、収量はフェノールに基づく抽出で有意により高く（ｐ＝２．２×１０^−５）、フェノールに基づく処置は、約５倍多くのＤＮＡ、及び最も重要なことにＳＲＹ、すなわち胎児ＤＮＡのより一貫して、より頑健なシグナルを与える（ｐ＜０．０５）。表１では、「細胞数／μｌ」の値は標準を参照して計算され、６ｐｇゲノムＤＮＡ／細胞の仮定に基づく細胞数でのゲノムＤＮＡの量の等価を指す。

実施例２
染色質−免疫沈降（ＣｈＩＰ）に基づくショットガンシーケンシングＮＧＳプロトコル
方法
ＣｈＩＰシーケンシングプロトコル（Ｉｌｌｕｍｉｎａ）を指示通りに実施した。ライブラリー構築のために、２０ｎｇの無細胞ＤＮＡを使用した。全ライブラリー容量の１／１５に相当する各ライブラリーの１μｌを、サイズ分布分析及びピーク濃度の決定のために２１００バイオアナライザー（Ａｇｉｌｅｎｔ）に流した。５個のライブラリーごとに、ＭｉＳｅｑ（Ｉｌｌｕｍｉｎａ）でプレシーケンシングした。５０ｂｐの単一のリード及び５０＋７サイクルでライブラリーをＨｉＳｅｑ２０００（Ｉｌｌｕｍｉｎａ）でシーケンシングをし、このように、指示（Ｉｌｌｕｍｉｎａ）に従ってＴｒｕＳｅｑＳＢＳｖ３キットを用いて１試料につき３０×１０^６個のリードをもたらした。

５０個の試料で、上記の通り２つの抽出プロトコル（カラム抽出及びフェノール／クロロホルム抽出）を並行して実施した。残りの試料は、フェノール／クロロホルム方法だけで抽出した。

結果
無細胞ＤＮＡのサイズ決定は、アダプター／バーコード配列サイズの減算の後、ピークサイズはほぼ完全に予測された１６６ｂｐのサイズの範囲内にあることを示す（図１；Ｌｏら２０１０）。ピークサイズ分布は、分析した全９１個の試料で均一であり、１〜２ｂｐの変動があった。右パネルで見られるより小さいサイズのショルダーは、胎児ＤＮＡをおそらく反映し、それは１３３〜１４３ｂｐのピークサイズを有する。

フェノール／クロロホルム抽出プロトコルは、約１６６ｂｐのピークサイズを有するＤＮＡ分子の極めてより高い濃度を与え、カラムライブラリーとフェノール／クロロホルムライブラリーの間に統計的有意差があった（ｐ＜１０^−２５；表２、各抽出方法につき５０個のライブラリーで測定したときのサイズが１５６ｂｐ〜１７６ｂｐのＤＮＡ分子画分の濃度を示す）。

３０個のプレシーケンシングライブラリー（表３）、及び９１個の試料の最終出力配列（表４及び図２）の固有同一配列は、フィルターを通過するリードの７５〜８０％であった。

全体として、ＵＥＳの中間数は２０，０００，０００より多く、それは公表された異数性検査のための基準として使用されるそれぞれの数より４倍を超えて高い（Ｆａｎら、２００８、Ｃｈｉｕら、２００８、Ｓｔｕｍｍら２０１２）。

各染色体を５０ｋｂビンに分け、各ビンにつき、前記ビンにマッピングされたＵＥＳの数をカウントした。ビンあたりのＵＥＳカウントの中間値を各染色体について計算し、全ての常染色体について配列タグ密度値を得た。

全９１個の正倍数性及び異数性試料について図４に示すように、第２１染色体の配列タグ密度を全ての常染色体の配列タグの中間密度に標準化し、このようにして、第２１染色体の標準化配列タグ密度を得た。この値は、第２１染色体に由来する胎児と母体のＤＮＡ断片の割合の指標である。

単一の染色体カウントを標準化するための基準を提供する参照セットを構築するために、正常な核型の試料を使用した。そのような参照セットで、本発明による診断方法は、４．４のｚスコアを使用して非２１トリソミー症例から２１トリソミー症例を完全に識別することが可能である（図３）。

同様に、この研究で分析した全９１個の正倍数性及び異数性試料について図５に示すように、第１８染色体の配列タグ密度を全ての常染色体の配列タグの中間密度に標準化し、このようにして標準化配列タグ密度を得た。

図５から明らかなように、本発明による診断方法は、６６個の正倍数性試料の同じ参照セットを用い、４．４のｚスコアを使用することにより、非１８トリソミー症例から１８トリソミー症例を識別することも可能である。

全体として、本発明による方法は、偶然に誤った結果をもたらす≦１．１×１０^−５の事前確率で、第１世代アッセイ（Ｃｈｉｕら２００８、Ｆａｎら２００８、Ｓｔｕｍｍら２０１２）の約２桁上のよりストリンジェントな識別を可能にする。

最後に、９１個の試料から得られたデータを処理するために、別のアルゴリズムが使用されている。結果を、図６〜１３に示す。この第２のアルゴリズム及び本発明の方法によって選択された参照試料のセットを用いることにより、診断方法は、偶然に誤った結果をもたらす≦１．１×１０^−１１の事前確率で、正倍数性の試料から２１トリソミー試料、１３トリソミー試料、１８トリソミー試料、２２トリソミー試料、４ｐ微小欠失試料、５ｐ微小欠失−重複試料を識別することを可能にする。

実施例３：無細胞ＤＮＡのサイズ選択：
以前の研究は、血液中に存在する無細胞胎児ＤＮＡは２００ｂｐより小さく、平均でおよそ１５０ｂｐであることが示されている。

規定量の血液から抽出されるＤＮＡの量は、数ナノグラムから１マイクログラムを超える量（平均で血漿２ｍｌに１０〜５０ｎｇ）まで変動することがある。ＤＮＡの分析は、おそらく細胞溶解、したがって母体起源の結果である大きなＤＮＡ断片（≧１ｋｂ）の有無によってこの変動性の大部分が引き起こされることを示している。

本発明者は、抽出した無細胞ＤＮＡ試料から大きなＤＮＡ断片を排除し、このようにして胎児ＤＮＡを含有する小さいＤＮＡ断片（２００ｂｐ以下）を「濃縮」し、それによって非侵襲的出生前診断検査の質を向上させたプロトコルを考案した。サイズ選択処置は、シーケンシングライブラリー調製などのいかなるさらなる処理の前に粗ＤＮＡ抽出物で実行される。

サイズ選択のために、磁気ビーズ（ＡＭＰｕｒｅ（登録商標）ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を使用した。この技術により、ＤＮＡ断片を磁気ビーズに結合し、その後磁場を加えることによって汚染物質から分離する。結合したＤＮＡをエタノールで洗浄し、その後磁気粒子から溶出させる。

実験及び結果
それらのサイズ分布を検査するために、いくつかの粗抽出無細胞ＤＮＡ試料を高感度バイオアナライザーによって分析した。３つの粗ＤＮＡ抽出物（ＧＷＸ−３５１、ＧＷＸ−３５２及びＧＷＸ−３５３と呼ぶ）からのＤＮＡサイズ分布の例を、図１６Ａ（左パネル）に示す。

精製（サイズ選択）のために、２０μＬのＤＮＡ溶液（１０ｎｇ）を試料ＧＷＸ−３５１、−３５２及び−３５３から調製した。１０μＬのＡＭＰｕｒｅビーズを加え、試料を室温で数分インキュベートした。次に磁気スタンドでビーズを混合液から分離し、上清を新しい管に移した。

ビーズの分離をさらに数回実行した。最終回の精製の後、ビーズを再懸濁せずに、２００μＬの新鮮な８０％エタノールでビーズを二回洗浄した。ビーズを次に１０分間乾燥させ、１０μＬのＥＢ緩衝液に再懸濁させた。

図１６Ｂ（右パネル）は、ＡＭＰｕｒｅビーズによる数回の連続した精製の後、試料ＧＷＸ−３５１、−３５２及び−３５３についてのバイオアナライザーによる分析により得られた結果を示す。大分子量ピークは精製工程によって排除され、１５０〜２００ｂｐのより低い分子量のピークは保持される。他の試料でも、同等の結果が得られた。結果は、ビーズを使用することによって高分子量画分を除去することができ、およそ２００ｂｐ以下のサイズの画分を生成することを確認する。

実施例４：サイズ選択された無細胞ＤＮＡ試料での異数性の検出（１）
ａ）ＤＮＡ抽出
血液試料を４８人の妊娠女性から収集し、実施例１に記載のフェノール−クロロホルム方法で無細胞ＤＮＡを抽出した。

ｂ）サイズが２００ｂｐ未満の無細胞ＤＮＡ断片の濃縮：サイズ選択
血液から抽出した無細胞ＤＮＡを、実施例３に記載の磁気ビーズ（ＡＭＰｕｒｅＸＰ（登録商標）、ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）でのサイズ選択の連続ステップにかけた。サイズ選択の有る無しでの異数性検出アッセイの感度の比較を可能にするために、試料の一部はサイズ選択処置にかけなかった。

ｃ）ライブラリー調製（合成によるシーケンシング技術による大量並行シーケンシングのため）
ｉ）末端修復：
この工程は、末端修復ミックスを使用して、ｄｓＤＮＡの断片化からもたらされるオーバーハングを平滑末端に変換する。このミックスの３’から５’へのエキソヌクレアーゼ活性は３’オーバーハングを除去し、ポリメラーゼ活性は５’オーバーハングを埋める。

試料ＤＮＡを含有するプレートの各ウェルに２０μＬの末端修復ミックス（ＥＲＰ）を加え、混合液を十分に混ぜて短時間遠心分離した。次に、製造業者の指示に従ってプレートをサーマルサイクラーでインキュベートした。

試料をサーマルサイクラーから取り出し、精製ステップにかけた。

ｉｉ）アデニレート３’末端の付加
アダプターライゲート反応の過程でそれらがお互いにライゲートするのを防ぐために、及び、その３’末端に対応する単一のヌクレオチドを有する断片にアダプターをその後ライゲートするための相補的なオーバーハングを提供するために、単一の「Ａ」ヌクレオチドを平滑ｄｓＤＮＡ断片の３’末端に加えた。この戦略は、キメラ（連結された鋳型）形成率の低下を確かなものにする。

平滑ＤＮＡ断片を含有するプレートの各ウェルに、１２．５μＬのＡテーリングミックス（ＡＴＬ）を加えた。混合と短時間の遠心分離の後、製造業者の指示に従ってプレートをサーマルサイクラーでインキュベートした。
ｉｉｉ）アダプターのライゲート

アデニレート３’末端の付加の直後に、ＰＣＲ増幅を可能にする、Ｉｌｌｕｍｉｎａによって市販されるものなどの対末端アダプターをｄｓＤＮＡの末端にライゲートする。

Ａテーリングプレートの各ウェルに５μＬのアダプタープレミックスを、続いて２．５μＬのライゲートミックスを加えた。製造業者の指示に従ってプレートを短時間遠心分離し、サーマルサイクラーでインキュベートした。次に、ライゲートを不活性化するために、５μＬの停止ライゲート緩衝液を各ウェルに加えた。精製ステップを次に実行した。

ｉｖ）ＤＮＡ断片の濃縮
工程のこのステップは、各試料に特定のＶＩＮＣＩ指数を加え、アダプター配列を完成させてフローセルでの以降のハイブリダイゼーションを可能にしつつ、両末端にアダプター分子を有するＤＮＡ断片を選択的に濃縮するためにＰＣＲを使用する。アダプターを欠く断片はフローセルで表面結合プライマーとハイブリダイズすることができず、片方の末端だけにアダプターを有する断片は表面結合プライマーとハイブリダイズすることができるが、クラスターを形成することができない。

ＰＣＲプレートの各ウェルに３４μＬのＰＣＲプレミックスを加え、続いて１μＬの解凍したＰＣＲＰ７指数プライマー（２５μΜ）を加えた。ＰＣＲプレートの各ウェルに１５μＬの試料を移し、試料プレートの空のウェルに陰性対照として１５μＬの水を加えた。

以下のＰＣＲプログラムを使用して、プレートをサーマルサイクラーでインキュベートした：
９８℃で３０秒間
以下を１５サイクル：
９８℃で１０秒間
６５℃で３０秒間
７２℃で３０秒間
７２℃で５分間
１０℃で保持

増幅は、およそ２８０ｂｐを中心とするスミアを生成した。約１２０ｂｐでバンドを生成したあらゆる空のアダプターを、以降のＡＭＰｕｒｅ精製ステップで除去した。

ｄ）大量並行シーケンシング及びマッピング
実施例２に記載のＨｉＳｅｑ２０００（Ｉｌｌｕｍｉｎａ）でライブラリーをシーケンシングし、ヒトゲノムにマッピングした。

ｅ）結果
各検査試料の各常染色体の固有同一配列（ＵＥＳ、ＵＥＭとも呼ぶ）カウントを決定し、確率スケールを用いて第１の参照セットの各試料の対応する染色体の値と比較した。この操作をさらなる５つの参照セットで繰り返し、合計６つの参照セット（Ａ１、Ａ２、Ｂ１、Ｂ２、Ｎ１、Ｎ２と命名）を得た。全ての参照セットは、検証された正倍数性及びトリソミーの試料を含み、上記の通り、≦２００ｂｐのＤＮＡ分子のサイズ選択ステップを含む本発明の方法に従って得られた。参照セットＡ１及びＡ２は合計２６７個の試料を含み；セットＮ１及びＮ２は合計１６７個の試料を含み：セットＢ１及びＢ２は合計１００個の試料を含んだ。

具体的には、検証されたトリソミー及び検証された正倍数性を有する参照試料の第１のセット（例えば参照セットＮ１）中の所与の染色体のＵＥＳカウントから得られた値を、グラフにプロットした。確率的に千に１つの正常な試料だけが超えるはずである値の区間を決定するために、参照セットの正常な（正倍数性）試料を使用した。この区間を、グラフに示した。

このように、１参照セット及び１染色体につき１つの「参照グラフ」が確立された（すなわち１染色体につき６つの参照グラフ）。参照セットＡ１の第１３、１６、１８及び２１染色体のための「参照グラフ」は、それぞれ図３９ａ〜３９ｄで見ることができる（灰色のスポット）。確率区間も示す。類似の参照グラフ（灰色のスポット）は、それぞれ参照セットＮ１の第１３、１６、１８及び２１染色体について図４０ａ〜４０ｄで見ることができる。図３９及び４０では、内部の微細な点線は１／１０００の確率閾値を表し、外部のより太い点線は１／１００００の確率閾値を表す

各染色体及び各参照セットについて参照グラフが確立されたら、各検査試料の所与の染色体についてＵＥＳカウントから得られた値を、対応する参照グラフにプロットした。図３９では、単一の検査試料の第１３、１６、１８及び２１染色体の値を、参照グラフにおいて円形黒点で示す。図４０では、４つの異なる検査試料の第１３、１６、１８及び２１染色体の値を、参照グラフにおいて円形黒点で示す。全４８個の検査試料について、この操作を全ての染色体及び全ての参照セットで実行した。

結果は、本発明の検査が胎児の異数性の検出を顕著な信頼性で可能にすることを明らかに確認した。図３９ａ〜３９ｄは、ＧＷＸ−１１３７と命名された試料は第１３、１６、１８及び２１染色体が正常であることを示す。図４０ａ〜４０ｄは、ＧＷＸ−１１９６、ＧＷＸ−１４２０、ＧＷＸ−１４２１及びＧＷＸ−１４７０と命名された試料は、それぞれ第１３、１６、１８及び２１染色体が正常である可能性が１００００に１つ未満であることを示す。

サイズ選択処置で得られた結果、及びサイズ選択なしで得られた結果の比較は、サイズ選択が胎児画分を効果的に濃縮し、その結果、ほとんど常に存在する増加したシグナル強度が示す通り、特に低い胎児画分のより頑健な検出をもたらすことを明白に示した。全ての常染色体についてシグナル強度を評価した。全ての常染色体の比較を図１７〜３８に示すが、ｘ軸「ＧＷＸ」はサイズ選択なしであり、ｙ軸「ＴＰＲ」はサイズ選択ありである。サイズ選択の後のシグナル強度は、４１／４８又は８５％の場合により強く、７／４８又は１５％の場合にはサイズ選択のない試料と同等であった。サイズ選択の後にシグナル強度が悪化した例は全くなかった。サイズ選択によって付与されたこの改善されたシグナル強度は、統計値を計算するために使用されたより少ないＵＥＳの存在下でさえ測定可能だった。実際、対応するサイズ選択されていない試料より少ないＵＥＳのサイズ選択された試料の２５％の中で、より高いシグナル強度を有する画分はなお８３％であった。シグナル強度比較の第１３、１６、１８及び２１染色体のパネルに示す通り、特に低い胎児画分で異数性はより頑健に検出された（図２９、３２、３４及び３７）。後者の実験は、サイズ選択処置によって常染色体の検出でバイアスが導入されないことも示した。

サイズ選択処置は、潜在的に偽陽性の結果も減少させた。使用した４８個の試料のうち、９個は当初病的であると疑われた：７個は核型分析によって最終的に検証され、２個の境界例はサイズ選択後に正常な結果を有することがわかった。

全体として、サイズ選択処置は全般的にシグナル強度を改善することがわかり、それは、低い胎児画分を有するリスクのある試料に特に有益な、胎児画分のより頑健な検出につながった。

実施例５：サイズ選択された無細胞ＤＮＡ試料での異数性の検出（２）
合成によるシーケンシングプラットホームの代わりに半導体ベースのＮＧＳプラットホームでの使用のために、４８個の検査試料を再び使用して、実施例４に記載されるプロトコルを構成した。サイズ選択及び半導体ベースのＮＧＳプラットホームの使用を含む、検査試料の分析のために使用したのと同じ方法を使用して、６つの新しい参照セットを生成した。このプラットホームのためのライブラリー調製は、平滑末端アダプターライゲートを使用しており、ｄＡテーリングは含まない。さらに、より少数のＰＣＲサイクルを使用した（１５回の代わりに８回）。サイズ選択ステップは、実施例４に記載のものと同一であった。

合成によるシーケンシングプラットホームを使用して生成された参照試料と一緒に、４８個の試料に対して、半導体ベースのＮＧＳプラットホームを使用した検査も実施した。この検査では、２つの実験群の間で参照試料の調製のために使用したシーケンシングプラットホームが唯一の違いであった。

３つの試料の結果を、図４１ａ、ｂ及びｃに示す。太く黒いバーは、検査試料及び参照試料を同一のプロトコルを使用して調製したときに得られた結果を示す。より小さく細いバーは、試料を調製するために使用したシーケンシングプラットホームが参照セットを調製するために使用したものと異なったときに得られた結果を表す。検査試料及び参照セットを同じシーケンシングプラットホームで処理したときに最適な結果が得られるが、それにもかかわらず、検査試料のために使用したプラットホームが参照セットのために使用したものと異なるときにも結果が有益であり識別することがわかる。全体として、半導体技術による結果は、本発明による無細胞ＤＮＡのサイズ選択がより頑健なアッセイを提供することをさらに確認した。この実施例は、サイズ選択処置によってもたらされる利点が、大量並行シーケンシングプラットホームのタイプと無関係であることも確認する。

参考文献
Chiu RW, Chan KC, Gao Y, Lau VY, Zheng W,Leung TY, Foo CH, Xie B, Tsui NB, Lun
FM, Zee BC, Lau TK, Cantor CR, Lo YM.Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massivelyparallel genomic sequencing of DNA in maternal plasma. Proc Natl Acad Sci U SA. 2008 Dec 23;105(51 ):20458-63.
Cooper GM, Coe BP, Girirajan S, RosenfeldJA, Vu TH, Baker C, Williams C, Stalker H, Hamid R, Hannig V, Abdel-Hamid H,Bader P, McCracken E, Niyazov D, Leppig K, Thiese H, Hummel M, Alexander N,Gorski J, Kussmann J, Shashi V, Johnson K, Rehder C, Ballif BC, Shaffer LG,Eichler EE. A copy number variation morbidity map of developmental delay, NatGenet. 201 1 Aug 14;43(9):838-46
Fan HC, Blumenfeld YJ, Chitkara U, HudginsL, Quake SR. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencingDNA from maternal blood. Proc Natl Acad Sci U S A. 2008 Oct 21 ; 105(42):16266-71
Frazer KA, Murray SS, Schork NJ, Topol EJ.Human genetic variation and its contribution to complex traits. Nat Rev Genet.2009 Apr; 10(4):241-51.
Lo YM, Lun FM, Chan KC, Tsui NB, Chong KC,Lau TK, Leung TY, Zee BC, Cantor CR, Chiu RW. Digital PCR for the moleculardetection of fetal chromosomal aneuploidy. Proc Natl Acad Sci U S A. 2007 Aug7; 104(32):131 16-21.
Lo YM, Chan KC, Sun H, Chen EZ, Jiang P,Lun FM, Zheng YW, Leung TY, Lau TK, Cantor CR, Chiu RW. Maternal plasma DNAsequencing reveals the genome-wide genetic and mutational profile of the fetus.Sci Transl Med. 2010 Dec 8;2(61 ):61 ra91
Stumm M, Entezami M, Trunk N, Beck M,Locherbach J, Wegner RD, Hagen A, Becker R, Hofmann W. Noninvasive prenataldetection of chromosomal aneuploidies using different next generationsequencing strategies and algorithms. Prenat Diagn. 2012 Jun;32(6):569-77.
Yandell M, Ence D. A beginner's guide toeukaryotic genome annotation. Nat Rev Genet. 2012 Apr 18; 13(5):329-42.

Claims

無細胞ＤＮＡを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び／又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞ＤＮＡを抽出するステップと；
抽出ステップの後、各試料中のＤＮＡ分子のサイズ分布を分析して、前記試料中のＤＮＡ分子のサイズ分布に基づいて試料のセットを選択するステップと；
サイズ選択された各試料のＤＮＡの大量並行シーケンシングを実施するステップと；
試料ごとに得られた配列をヒトゲノムにマッピングするステップと；
参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；
参照試料のセット及び／又は参照パラメータのセットを得るステップと
を含む方法。
（ｉ）正倍数性胎児を妊娠している正倍数性妊娠女性のセットから得られた生体試料のセットから無細胞ＤＮＡを抽出するステップと；
（ｉｉ）各試料中のＤＮＡ分子のサイズ分布を分析するステップと；
（ｉｉｉ）前記試料中のＤＮＡ分子のサイズ分布に基づいて試料の第１のセットを選択するステップと；
（ｉｖ）試料の前記第１のセットからの各試料のＤＮＡをプレシーケンシングするステップと；
（ｖ）ステップ（ｖｉ）で得られた配列をヒトゲノムにマッピングするステップと；
（ｖｉ）ステップ（ｖ）でヒトゲノムにマッピングされた固有同一配列の量に基づいて試料の第２のセットを選択するステップと；
（ｖｉｉ）試料の前記第２のセットからの各試料のＤＮＡを大量並行シーケンシングするステップと；
（ｖｉｉｉ）ステップ（ｖｉｉ）で得られた配列をヒトゲノムにマッピングするステップと；
（ｉｘ）ステップ（ｖｉｉｉ）でヒトゲノムにマッピングされた固有同一配列の数に基づいて参照試料のセットを選択するステップと
を含む、請求項１に記載の方法。
生体試料のセットの各試料からの無細胞ＤＮＡの抽出が、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと；
前記混合物から水相を抽出するステップと；
前記水相からＤＮＡを沈殿させるステップと
を含む、請求項１又は２に記載の方法。
ＤＮＡ分子のサイズ分布に基づいて試料のセットを選択するステップが、試料からサイズが２００ｂｐを超えるＤＮＡ分子を排除するステップを含む、請求項１〜３のいずれか一項に記載の方法。
前記試料中のＤＮＡ分子のサイズ分布に基づいて試料のセットを選択するステップが、ＤＮＡ分子の少なくとも９０重量％、好ましくは９５重量％より多くが２００ｂｐ未満、好ましくは１５６ｂｐ〜１７６ｂｐのサイズを有する試料を選択するステップを含む、請求項１〜３のいずれか一項に記載の方法。
前記試料中のＤＮＡ分子のサイズ分布に基づいて試料のセットを選択するステップが、少なくとも０．８８ｎｇ／μＬの、サイズが２００ｂｐ未満、好ましくは１５６ｂｐ〜１７６ｂｐのＤＮＡ分子を有する試料を選択するステップを含む、請求項１〜３のいずれか一項に記載の方法。
サイズ選択がシーケンシングライブラリーの調製の前に実行される、請求項１〜６のいずれか一項に記載の方法。
参照試料のセットが１０，０００，０００個を超える固有同一配列のリードを有する試料を含む、請求項１に記載の方法。
ステップ（ｖｉ）が、ステップ（ｉｖ）で得られた配列の総数に対して少なくとも７０％の固有同一配列を有する試料を選択するステップを含む、請求項２〜６のいずれか一項に記載の方法。
ステップ（ｖｉｉ）が、各試料について少なくとも２５，０００，０００個の配列をシーケンシングするステップを含む、請求項２〜６のいずれか一項に記載の方法。
ステップ（ｉｘ）が、１５，０００，０００個を超える固有同一配列のリードを有する試料を選択するステップを含む、請求項２〜６、８及び９のいずれか一項に記載の方法。
無細胞ＤＮＡを抽出する生体試料のセットが、異数性胎児を妊娠している正倍数性の妊娠女性から得られた試料をさらに含む、請求項１〜１１のいずれか一項に記載の方法。
母体生体検査試料から胎児の異数性を診断する方法であって、
（ａ）妊娠女性から得られた母体生体検査試料から無細胞ＤＮＡを抽出するステップと；
（ｂ）前記検査試料から抽出された無細胞ＤＮＡを大量並行シーケンシングするステップと；
（ｃ）ステップ（ｂ）で得られた配列をヒトゲノムにマッピングするステップと；
（ｄ）対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと；
（ｅ）参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、請求項１〜１１で得られた参照試料のセットの試料の、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと；
（ｆ）ステップ（ｄ）で計算された前記検査パラメータをステップ（ｅ）で計算された参照パラメータの前記セットと比較するステップと；
（ｇ）比較に基づいて胎児の異数性を診断するステップと
を含む方法。
抽出ステップの後、前記試料中のＤＮＡ分子のサイズ分布に基づいてサイズ選択ステップを実行する、請求項１３に記載の方法。
サイズ選択がシーケンシングライブラリーの調製の前に実行される、請求項１４に記載の方法。
サイズ選択が、試料からサイズが２００ｂｐを超えるＤＮＡ分子を排除するステップを含む、請求項１４又は１５に記載の方法。
母体生体検査試料からの無細胞ＤＮＡの抽出が、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと；
前記混合物から水相を抽出するステップと；
前記水相からＤＮＡを沈殿させるステップと
を含む、請求項１３〜１６のいずれか一項に記載の方法。
前記検査パラメータが、全ての常染色体の中間固有同一配列タグ密度に標準化した対象の染色体又は染色体領域の固有の配列タグ密度である、請求項１３に記載の方法。
ステップ（ｆ）の比較が、参照パラメータのセットに対する前記検査パラメータのｚスコアの計算によって実施される、請求項１３に記載の方法。
前記検査パラメータが、対象の染色体若しくは染色体領域の絶対同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントである、請求項１４〜１６のいずれか一項に記載の方法。
ステップ（ｆ）の比較が、対象の染色体若しくは染色体領域の固有同一配列カウント、又は対象の染色体若しくは染色体領域の同一配列の平均カウントが、参照セットの対象の染色体の固有同一配列カウントの正規分布に属する確率の計算によって実施される、請求項２０に記載の方法。
対象の染色体が、第２１染色体、第１６染色体、第１８染色体、第１３染色体又は第１１染色体である、請求項１３〜２１のいずれか一項に記載の方法。
胎児と母体の無細胞ＤＮＡを含有する母体生体試料から無細胞ＤＮＡを抽出する方法であって、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと；
前記混合物から水相を抽出するステップと；
前記水相からＤＮＡを沈殿させるステップと
を含む方法。
胎児の異数性の診断のためのキットであって、
請求項１〜１２のいずれか一項に記載の方法により入手可能な参照試料のセット；
及び／又は参照パラメータのセットであって、ここで各参照パラメータは、任意選択で物理的支持体に含まれる請求項１〜１１のいずれか一項に記載の方法により入手可能な参照セットの試料の、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、参照パラメータのセット
を含むキット。
無細胞ＤＮＡを抽出するための、フェノール及びクロロホルムを含む組成物を含む、１つ又は複数の組成物及び／又はキット；
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の１つ又は複数のステップを実施するためのコンピュータプログラム製品；
母体生体検査試料から胎児の異数性を診断するための方法の１つ又は複数のステップを実行するためのコンピュータプログラム製品
の少なくとも１つをさらに含む、請求項２４に記載のキット。