JP2020054400A

JP2020054400A - 高度多重ｐｃｒ法および組成物

Info

Publication number: JP2020054400A
Application number: JP2020005470A
Authority: JP
Inventors: ベルンハルトツィマーマン，; Zimmermann Bernhard; マシューエム．ヒル，; M Hill Matthew; フィリップギルバートラクルート，; Gilbert Lacroute Philippe; マイケルドッド，; Dodd Michael
Original assignee: Natera Inc
Current assignee: Natera Inc
Priority date: 2012-07-24
Filing date: 2020-01-16
Publication date: 2020-04-09
Anticipated expiration: 2032-11-21
Also published as: JP6997815B2; SG11201408813VA; JP7503043B2; JP2018183189A; JP7510913B2; JP2015526073A; JP2020058388A; IL236435A0; AU2012385961B9; CN104685064A; RU2014152883A; KR20150038216A; JP7348330B2; AU2012385961A1; JP6916153B2; JP7027468B2; JP7343563B2; JP2020054402A; AU2012385961B2; JP6392222B2

Abstract

【課題】本発明は、１反応体積で対象の複数の核酸領域を同時に増幅する方法、ならびに、このような増幅法に使用するプライマーライブラリーを選択する方法を提供する。また、本発明は、増幅プライマー二量体またはその他の非標的増幅産物の最小限の形成など所望の特性を有するプライマーライブラリーを提供する。【解決手段】例えば、核酸試料中の標的遺伝子座を増幅する方法であって、（ａ）少なくとも１，０００個の異なる標的遺伝子座に同時にハイブリダイズする試験プライマーライブラリーと前記核酸試料を接触させ反応混合物を生成するステップと、（ｂ）前記反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、を含む方法が提供される。【選択図】図２９

Description

関連出願の相互参照
本出願は、２０１２年１１月２１日出願の米国実用新案出願第１３／６８３，６０４号、および２０１２年７月２４日出願の米国特許仮出願第６１／６７５，０２０号の利益と優先権を主張する。米国実用新案出願第１３／６８３，６０４号は、２０１１年５月１８日出願の米国実用新案出願第１３／１１０，６８５号の一部継続である２０１１年１１月１８日出願の米国実用新案出願第１３／３００，２３５号の一部継続であり、２０１２年７月２４日出願の米国特許仮出願第６１／６７５，０２０号の利益を主張する。米国実用新案出願第１３／１１０，６８５号は、２０１０年５月１８日出願の米国特許仮出願第６１／３９５，８５０号；２０１０年６月２１日出願の米国特許仮出願第６１／３９８，１５９号；２０１１年２月９日出願の米国特許仮出願第６１／４６２，９７２号；２０１１年３月２日出願の米国特許仮出願第６１／４４８，５４７号；および２０１１年４月１２日出願の米国特許仮出願第６１／５１６，９９６号の利益を主張する。米国実用新案出願第１３／３００，２３５号は、２０１１年６月２３日出願の米国特許仮出願第６１／５７１，２４８号の利益を主張する。これら全ての特許出願の全体は、それらのすべての教示のために参照により本明細書中に組み込まれる。

連邦政府による資金提供を受けた研究開発の記載
本発明は、認可番号第５Ｒ４４ＨＤ６０４２３−３号による米国国立衛生研究所の支援によって行われた。米国政府は本出願に由来する全ての特許に対し権利を保有できる。

発明の分野
本発明は、一般に、複数の目的の核酸領域を１反応体積で同時に増幅する方法と組成物に関する。

アッセイスループットを高め、核酸試料のより効率的な使用を可能とするために、多くのオリゴヌクレオチドプライマーを試料と混合した後、当技術分野で多重ＰＣＲとして知られるプロセスでポリメラーゼ連鎖反応（ＰＣＲ）条件に試料を供することにより、目的の試料中の多くの標的核酸の同時増幅を実行できる。多重ＰＣＲの使用は、非常に単純な実験手順であり、核酸分析および検出に要する時間を短縮できる。しかし、複数の対が同じＰＣＲ反応に加えられる場合、増幅されたプライマー二量体などの非標的増幅産物が生成されることがある。プライマーの数が増えるに伴いこのような産物生成の可能性が増加する。これらの非標的増幅産物は、その後の分析、および／またはアッセイでの増幅産物の使用を大きく制限する。従って、多重ＰＣＲの間の非標的増幅産物の形成を減らすように改善された方法が必要である。

改善された多重ＰＣＲ法は、非侵襲的出生前遺伝子診断（ＮＰＤ）などの様々な用途に有用となるであろう。具体的には、出生前診断の現行の方法により、医師および親に、成長している胎児の異常を警告することができる。出生前診断をしないと、５０人に１人の乳児が重大な身体的または精神的ハンディキャップを持って生まれ、３０人に１人もが先天性奇形のいくつかの形態を有する。残念ながら、標準の方法は、正確度が乏しいか、または流産のリスクを有する侵襲的な手順を伴う。母系の血中ホルモンレベルまたは超音波測定に基づく方法は非侵襲的であるが、同様に正確度が低い。羊水穿刺、絨毛膜絨毛生検および胎児の血液試料採取などの方法は正確度が高いが、侵襲的であり、著しいリスクを有する。米国では全妊娠のおよそ３％に対して羊水穿刺が実施されたが、その使用頻度は過去１５年にわたって減少している。

正常なヒトは、健康な二倍体細胞の全てに２３種の染色体を２組有し、１つのコピーが各親に由来する。多すぎる染色体および／または少なすぎる染色体を有する核細胞における状態である異数性が、着床の失敗、流産、および遺伝病の大部分に関与すると考えられる。染色体異常を検出することにより、とりわけ、妊娠成功の機会が増すことに加えて、ダウン症候群、クラインフェルター症候群、およびターナー症候群などの状態を有する個体または胚を同定することができる。染色体異常を検査することは、母親の年齢が３５歳から４０歳の間では胚の少なくとも４０％が異常であり、４０歳を超えると、胚の半分超が異常であるということが推定されるので、特に重要である。

最近、無細胞胎児ＤＮＡおよびインタクトな胎児細胞が母系の血液循環系に進入し得ることが発見された。したがって、この遺伝材料を分析することにより、早期のＮＰＤが可能になると思われる。改善された方法では、感度および特異性が高められ、ＮＰＤに要する時間とコストが減らされるのが望ましい。

一態様では、本発明は、核酸試料中の標的遺伝子座を増幅する方法を特徴とする。いくつかの実施形態では、前記方法は、（ｉ）核酸試料を、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズする試験プライマーライブラリーと接触させて反応混合物を生成するステップと、（ｉｉ）反応混合物をプライマー伸長反応条件に供し、標的増幅産物を含む増幅産物を生成するステップとを含む。いくつかの実施形態では、前記方法は、少なくとも１個の標的増幅産物（例えば、少なくとも、５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的増幅産物）の存在の有無を判定するステップも含む。いくつかの実施形態では、前記方法は、少なくとも１種の標的増幅産物（例えば、少なくとも、５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的増幅産物）の配列を決定するステップも含む。

本発明のいずれかの態様の種々の実施形態では、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座が増幅される。いくつかの実施形態では、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の増幅産物が標的増幅産物である。いくつかの実施形態では、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的遺伝子座が増幅される。種々の実施形態では、増幅産物の内の６０、５０、４０、３０、２０、１０、５、４、３、２、１、０．５、０．２５、０．１、または０．０５％未満がプライマー二量体である。いくつかの実施形態では、試験プライマーのライブラリーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の試験プライマー対を含み、各プライマー対は、同じ標的遺伝子座にハイブリダイズするフォワード試験プライマーおよびリバース試験プライマーを含む。いくつかの実施形態では、試験プライマーのライブラリーは、異なる標的遺伝子座にハイブリダイズする少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の個別試験プライマーを含み、個別プライマーは、プライマー対の一部ではない。

本発明のいずれかの態様の種々の実施形態では、各試験プライマーの濃度は、１００、７５、５０、２５、１０、５、２、または１ｎＭ未満である。種々の実施形態では、試験プライマーのＧＣ含量は、３０〜８０％で、例えば、４０〜７０％または５０〜６０％である。いくつかの実施形態では、試験プライマーのＧＣ含量の範囲（例えば、最大ＧＣ含量−最小ＧＣ含量、例えば、８０％−６０％＝２０％の範囲）は、３０、２０、１０、または５％未満である。いくつかの実施形態では、試験プライマーの融解温度（Ｔ_ｍ）は、４０〜８０℃、例えば、５０〜７０℃、５５〜６５℃、または５７〜６０．５℃である。いくつかの実施形態では、試験プライマーの融解温度の範囲は、２０、１５、１０、５、３、または１℃未満の範囲である。いくつかの実施形態では、試験プライマーの長さは、１５〜１００ヌクレオチド、例えば、１５〜７５ヌクレオチド、１５〜４０ヌクレオチド、１７〜３５ヌクレオチド、１８〜３０ヌクレオチド、２０〜６５ヌクレオチドである。いくつかの実施形態では、試験プライマーは、標的特異的ではないタグ、例えば、内部ループ構造を形成するタグを含む。いくつかの実施形態では、タグは、２つのＤＮＡ結合領域の間に存在する。種々の実施形態では、試験プライマーは、標的遺伝子座に特異的な５’領域、標的遺伝子座に特異的でないループ構造を形成する内部領域、および標的遺伝子座に特異的な３’領域を含む。種々の実施形態では、３’領域の長さは、少なくとも７ヌクレオチドである。いくつかの実施形態では、３’領域の長さは、７〜２０ヌクレオチド、例えば、７〜１５ヌクレオチド、または７〜１０ヌクレオチドである。種々の実施形態では、試験プライマーは、標的遺伝子座に特異的ではない５’領域（例えば、タグまたはユニバーサルプライマー結合部位）、それに続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的でないループ構造を形成する内部領域、および標的遺伝子座に特異的な３’領域を含む。いくつかの実施形態では、試験プライマーの長さの範囲は、５０、４０、３０、２０、１０、または５ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さは、５０〜１００ヌクレオチド、例えば、６０〜８０ヌクレオチド、または６０〜７５ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、５０、２５、１５、１０、または５ヌクレオチド未満である。

本発明のいずれかの態様の種々の実施形態では、プライマー伸長反応条件は、ポリメラーゼ連鎖反応条件（ＰＣＲ）である。種々の実施形態では、アニーリングステップの長さは、３、５、８、１０、または１５分超である。種々の実施形態では、伸長ステップの長さは、３、５、８、１０、または１５分超である。

本発明のいずれかの態様の種々の実施形態では、胎児染色体異常の存在の有無を判定するための胎児の妊娠中の母親由来の母系ＤＮＡおよび胎児ＤＮＡを含む試料中の少なくとも１，０００個の異なる標的遺伝子座を同時に増幅するために試験プライマーが使用される。種々の実施形態では、前記方法は、ユニバーサルプライマー結合部位を試料中のＤＮＡ分子にライゲーションするステップと、少なくとも１，０００個の特異的プライマーおよびユニバーサルプライマーを使ってライゲーションしたＤＮＡ分子を増幅し、第１の増幅産物の集合を生成するステップと少なくとも１，０００対の特異的プライマーを使って第１の増幅産物の集合を増幅して第２の増幅産物の集合を生成するステップとを含む。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なるプライマー対が使われる。

本発明のいずれかの態様の種々の実施形態では、試験プライマーを使って、胎児の父親とされる人由来のＤＮＡを含む試料中の少なくとも１，０００個の異なる標的遺伝子座を同時に増幅し、さらに胎児の妊娠中の母親由来の母系ＤＮＡおよび胎児ＤＮＡを含む試料中の標的遺伝子座を同時に増幅して、父親とされる人が胎児の生物学上の父親であるかどうかが確定される。

本発明のいずれかの態様の種々の実施形態では、試験プライマーを使用して、胚由来の１個の細胞または複数の細胞中の少なくとも１，０００個の異なる標的遺伝子座を同時に増幅して染色体異常の存在の有無が判定される。種々の実施形態では、２個以上の胚の集合由来の細胞が分析され、インビトロ受精用に一個の胚が選択される。

本発明のいずれかの態様の種々の実施形態では、試験プライマーを使って、法医学核酸試料中の少なくとも１，０００個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、アニーリングステップの長さは、３、５、８、１０、または１５分超である。

本発明のいずれかの態様の種々の実施形態では、前記方法は、試験プライマーを使って、対照核酸試料中の少なくとも１，０００個の異なる標的遺伝子座を同時に増幅して第１の標的増幅産物の集合を生成し、さらに試験核酸試料中の標的遺伝子座を同時に増幅して第２の標的増幅産物の集合を生成するステップと第１と第２の標的増幅産物の集合を比較して、標的遺伝子座が１個の試料中に存在するがその他の試料中には存在しないかどうか、または標的遺伝子座が対照試料中と試験試料中で異なるレベルで存在するかどうかを判定するステップとを含む。種々の実施形態では、試験試料は、対象疾患もしくは表現型（例えば、癌）であるか、または対象疾患もしくは表現型である危険性の増加が疑われる個体由来であり、さらに１個または複数個の標的遺伝子座が、対象疾患もしくは表現型の危険性の増加に関連する、または対象疾患もしくは表現型に関連する配列（例えば、多型または他の変異）を含む。種々の実施形態では、前記方法は、試験プライマーを使って、ＲＮＡを含む対照試料中の１，０００個の異なる標的遺伝子座を同時に増幅して第１の標的増幅産物の集合を生成し、さらにＲＮＡを含む試験試料中の標的遺伝子座を同時に増幅して第２の標的増幅産物の集合を生成するステップと第１と第２の標的増幅産物の集合を比較し、対照試料と試験試料との間のＲＮＡ発現レベルの差異の有無を判定するステップとを含む。種々の実施形態では、ＲＮＡは、ｍＲＮＡである。種々の実施形態では、試験試料は、対象疾患もしくは表現型（例えば、癌）であることが疑われるか、または対象疾患もしくは表現型（例えば、癌）の危険性の増加が疑われる個体由来であり、１個または複数個の標的遺伝子座は、対象疾患もしくは表現型の危険性の増加に関連するか、または対象疾患もしくは表現型に関連する配列（例えば、多型または他の変異）を含む。いくつかの実施形態では、試験試料は、対象疾患もしくは表現型（例えば、癌）と診断された個体由来であり、この場合、対照試料と試験試料との間のＲＮＡ発現レベルの差異は、標的遺伝子座が対象疾患もしくは表現型の危険性の増加または減少に関連する配列（例えば、多型または他の変異）を含むことを示す。

本発明のいずれかの態様のいくつかの実施形態では、試験プライマーは、本発明のいずれかの方法を使ったプライマーの選択などの１個または複数個のパラメータに基づく候補プライマーのライブラリーから選択される。いくつかの実施形態では、試験プライマーは、候補プライマーのプライマー二量体形成能力に少なくとも一部基づいて候補プライマーライブラリーから選択される。

一態様では、本発明は、候補プライマーライブラリーから試験プライマーを選択する方法を特徴とする。種々の実施形態では、選択は、（ｉ）コンピュータを使ってライブラリー由来の２個の候補プライマーの大部分または全ての可能な組み合わせに対するアンデザイアラビリティスコア（ｕｎｄｅｓｉｒａｂｉｌｉｔｙｓｃｏｒｅ）を計算するステップであって、それぞれのアンデザイアラビリティスコアが、２個の候補プライマー間の二量体形成の尤度に少なくとも一部基づくステップと、（ｉｉ）最高のアンデザイアラビリティスコアを有する候補プライマーライブラリー由来の候補プライマーを除去するステップと、（ｉｉｉ）ステップ（ｉｉ）で除去された候補プライマーがプライマー対のメンバーである場合、候補プライマーライブラリー由来のプライマー対のもう一方のメンバーを除去するステップと、（ｉｖ）任意選択で、ステップ（ｉｉ）と（ｉｉｉ）を反復して試験プライマーライブラリーを選択するステップとを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て最小閾値以下になるまで行われる。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの数が所望の数まで減らされるまで行われる。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の候補プライマーの可能な組み合わせの少なくとも８０、９０、９５、９８、９９、または９９．５％に対し計算される。種々の実施形態では、ライブラリー中に残っている候補プライマーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座を同時に増幅できる。種々の実施形態では、前記方法は、（ｖ）標的遺伝子座を含む核酸試料をライブラリー中に残っている候補プライマーと接触させて反応混合物を生成するステップ；および（ｖｉ）反応混合物をプライマー伸長反応条件に供し、標的増幅産物を含む増幅産物を生成するステップも含む。

一態様では、本発明は、候補プライマーライブラリーから試験プライマーを選択する方法を特徴とする。種々の実施形態では、候補プライマーライブラリーからの試験プライマーの選択方法は、（ｉ）コンピュータを使ってライブラリー由来の２個の候補プライマーの大部分または全ての可能な組み合わせに対するアンデザイアラビリティスコアを計算するステップであって、各アンデザイアラビリティスコアが、２個の候補プライマー間の二量体形成の尤度に少なくとも一部基づくステップと、（ｉｉ）候補プライマーライブラリーから第１の最小閾値を超えるアンデザイアラビリティスコアを有する２個の候補プライマーの組み合わせのうち最多数のもののの一部である候補プライマーを除去するステップと、（ｉｉｉ）ステップ（ｉｉ）で除去された候補プライマーがプライマー対のメンバーである場合、候補プライマーライブラリー由来のプライマー対の残りのメンバーを除去するステップと、（ｉｖ）任意選択で、ステップ（ｉｉ）と（ｉｉｉ）を反復し、試験プライマーライブラリーを選択するステップとを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが、全て第１の最小閾値以下となるまで行われる。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで行われる。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の可能な候補プライマー組み合わせの少なくとも８０、９０、９５、９８、９９、または９９．５％に対して計算される。種々の実施形態では、ライブラリー中に残っている候補プライマーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座を同時に増幅できる。種々の実施形態では、前記方法は、（ｖ）標的遺伝子座を含む核酸試料をライブラリー中に残っている候補プライマーと接触させて反応混合物を生成するステップ；および（ｖｉ）反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップも含む。

本発明のいずれかの態様の種々の実施形態では、選択法は、ステップ（ｉｉ）で使われる第１の最小閾値をより小さい第２の最小閾値に下げることによりライブラリー中に残っている候補プライマーの数をさらに減らすステップ、および任意選択で（ｉｉ）と（ｉｉｉ）を反復するステップ含む。いくつかの実施形態では、選択法は、ステップ（ｉｉ）で使われる第１の最小閾値をより大きい第２の最小閾値に高めるステップ、および任意選択で（ｉｉ）と（ｉｉｉ）を反復するステップを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て第２の最小閾値以下になるまで、またはライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで、実行される。

本発明のいずれかの態様の種々の実施形態では、前記方法は、ステップ（ｉ）の前に、標的遺伝子座にハイブリダイズするプライマーを特定するか、または選択するステップを含む。いくつかの実施形態では、複数プライマー（またはプライマー対）が、同じ標的遺伝子座にハイブリダイズするが、１個または複数個のパラメータに基づく選択法を使って、この標的遺伝子座に対し１個のプライマー（または１個のプライマー対）が選択される。種々の実施形態では、前記方法は、ステップ（ｉｉ）の前に、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対をライブラリーから除去するステップを含む。種々の実施形態では、候補プライマーライブラリーから除去することを目的として、１個または複数個の他のパラメータに基づいて、同等のアンデザイアラビリティスコアを有する２個以上の候補プライマーの群から候補プライマーが選択される。いくつかの実施形態では、ライブラリー中に残っている候補プライマーは、本発明のいずれかの方法で試験プライマーライブラリーとして使用される。いくつかの実施形態では、得られた試験プライマーライブラリーは、本発明のプライマーライブラリーのいずれかを含む。

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、標的遺伝子座の配列（例えば、多型）に関連する有病率、標的遺伝子座の配列（例えば、多型）に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される１個または複数個のパラメータに少なくとも一部基づく。

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される１個または複数個のパラメータに少なくとも一部基づき、また、試験プライマーを使って、胎児染色体異常の有無を判定するための胎児の妊娠中の母親由来の母系ＤＮＡおよび胎児ＤＮＡを含む試料中の少なくとも１，０００個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、前記方法は、ユニバーサルプライマー結合部位を試料中のＤＮＡ分子にライゲーションするステップと、少なくとも１，０００特異的プライマーおよびユニバーサルプライマーを使ってライゲーションしたＤＮＡ分子を増幅し第１の増幅産物の集合を生成するステップと、少なくとも１，０００対の特異的プライマーを使って第１の増幅産物の集合を増幅して第２の増幅産物の集合を生成するステップとを含む。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なるプライマー対が使用される。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座が増幅される。

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群から選択される１個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、胎児の父親とされる人由来のＤＮＡを含む試料中の少なくとも１，０００個の異なる標的遺伝子座が増幅され、また、胎児の妊娠中の母親由来の母系ＤＮＡおよび胎児ＤＮＡを含む試料中の標的遺伝子座が同時に増幅されて、父親とされる人が生物学上の胎児の父親であるかどうかが確定される。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座が増幅される。

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率，候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される１個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、胚由来の１個の細胞または複数個の細胞中の少なくとも１，０００個の異なる標的遺伝子座が同時に増幅されて染色体異常の有無が判定される。種々の実施形態では、２個以上の胚の集合由来の細胞が分析され、１個の胚がインビトロ受精用に選択される。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座が増幅される。

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率，候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される１個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、法医学核酸試料中の少なくとも１，０００個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、アニーリングステップの長さは、３、５、８、１０、または１５分超である。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座が増幅される。

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率，標的遺伝子座の配列（例えば、多型）に関連する有病率、標的遺伝子座の配列（例えば、多型）に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される１個または複数個のパラメータに少なくとも一部基づいており、また、前記方法は、試験プライマーを使って対照核酸試料中の少なくとも１，０００個の異なる標的遺伝子座を同時に増幅し、第１の標的増幅産物の集合を生成し、試験核酸試料中の標的遺伝子座を同時に増幅して第２の標的増幅産物の集合を生成するステップと、第１と第２の標的増幅産物集合を比較して、標的遺伝子座が１つの試料中に存在し、他のものには存在しないかどうか、または、標的遺伝子座が対照試料と試験試料中で異なるレベルで存在するかどうかを判定するステップとを含む。種々の実施形態では、試験試料は、対象疾患もしくは表現型、または対象疾患もしくは表現型の危険性の増加が疑われる個人由来であり、この場合、１個または複数個の標的遺伝子座が、標的遺伝子座に対象疾患もしくは表現型の危険性の増加に関連するかまたは対象疾患もしくは表現型に関連する配列（例えば、多型）を含む。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座が増幅される。

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率，標的遺伝子座の配列（例えば、多型）に関連する有病率、標的遺伝子座の配列（例えば、多型）に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される１個または複数個のパラメータに少なくとも一部基づいており、また、前記方法は、試験プライマーを使ってＲＮＡを含む対照核酸試料中の１，０００個の異なる標的遺伝子座を同時に増幅し、第１の標的増幅産物の集合を生成し、ＲＮＡを含む試験試料中の標的遺伝子座を同時に増幅して第２の標的増幅産物の集合を生成するステップと、第１と第２の標的増幅産物の集合を比較して対照試料と試験試料との間のＲＮＡ発現レベルの差異の有無を判定するステップとを含む。種々の実施形態では、ＲＮＡは、ｍＲＮＡである。種々の実施形態では、試験試料は、対象疾患もしくは表現型（例えば、癌）または対象疾患もしくは表現型（例えば、癌）の危険性の増加が疑われる個体由来であり、この場合、１個または複数個の標的遺伝子座は、対象疾患もしくは表現型の危険性の増加に関連するかまたは対象疾患もしくは表現型に関連する配列（例えば、多型または他の変異）を含む。いくつかの実施形態では、試験試料は、対象疾患もしくは表現型（例えば、癌）であると診断された個体由来であり、この場合、対照試料と試験試料との間のＲＮＡ発現レベルの差異は、標的遺伝子座が対象疾患もしくは表現型の増加または減少に関連する配列（例えば、多型または他の変異）を含むことを示す。種々の実施形態では、少なくとも２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座が増幅される。

一態様では、本発明は、プライマーライブラリーを特徴とする。いくつかの実施形態では、プライマーは、本発明のいずれかの方法を使って候補プライマーライブラリーから選択される。いくつかの実施形態では、ライブラリーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズするプライマーを含む。いくつかの実施形態では、ライブラリーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、６０、４０、３０、２０、１０、５、４、３、２、１、０．５、０．２５、０．１、または０．０５％未満の増幅産物がプライマー二量体となるように、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の増幅産物が標的増幅産物であるように、１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座からの少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的遺伝子座が増幅されるように、標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、プライマーライブラリーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００プライマー対を含み、各プライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、各試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ、異なる標的遺伝子座にハイブリダイズする少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。

本発明のいずれかの態様の種々の実施形態では、各プライマーの濃度は、１００、７５、５０、２５、１０、５、２、または１ｎＭ未満である。種々の実施形態では、プライマーのＧＣ含量は、３０〜８０％で、例えば、４０〜７０％または５０〜６０％である。いくつかの実施形態では、プライマーのＧＣ含量範囲は、３０、２０、１０、または５％未満である。いくつかの実施形態では、プライマーの融解温度は、４０〜８０℃で、例えば、５０〜７０℃，５５〜６５℃，または５７〜６０．５℃である。いくつかの実施形態では、プライマーの融解温度の範囲は、１５、１０、５、３、または１℃未満である。いくつかの実施形態では、プライマーの長さは、１５〜１００ヌクレオチドで、例えば、１５〜７５ヌクレオチド、１５〜４０ヌクレオチド、１７〜３５ヌクレオチド、１８〜３０ヌクレオチド、または２０〜６５ヌクレオチドの長さである。いくつかの実施形態では、プライマーは、標的特異的ではないタグ、例えば、内部ループ構造を形成するタグを含む。いくつかの実施形態では、タグは、２個のＤＮＡ結合領域の間に存在する。種々の実施形態では、プライマーは、標的遺伝子座に対し特異的な５’領域、標的遺伝子座に特異的でなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な３’領域を含む。種々の実施形態では、３’領域の長さは、少なくとも７ヌクレオチドである。いくつかの実施形態では、３’領域の長さは、７〜２０ヌクレオチドであり、例えば、７〜１５ヌクレオチド、または７〜１０ヌクレオチドである。種々の実施形態では、プライマーは、標的遺伝子座に対し特異的ではない５’領域（例えば、別のタグまたはユニバーサルプライマー結合部位）、続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的でなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な３’領域を含む。いくつかの実施形態では、プライマーの長さの範囲は、５０、４０、３０、２０、１０、または５ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さは、５０〜１００ヌクレオチドであり、例えば、６０〜８０ヌクレオチド、または６０〜７５ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、５０、２５、１５、１０、または５ヌクレオチド未満である。

一態様では、本発明は、核酸試料中の標的遺伝子座を増幅するための本発明のプライマーライブラリーのいずれかを含むキットを提供する。いくつかの実施形態では、キットは、ライブラリーを使用して標的遺伝子座を増幅するための説明書を含む。

一態様では、本発明は、妊娠中の胎児の染色体の倍数性状態を決定する方法を特徴とする。いくつかの実施形態では、前記方法は、核酸試料を少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座に同時にハイブリダイズするプライマーライブラリーに接触させて反応混合物を生成するステップを含み、核酸試料は、胎児の母親由来の母系ＤＮＡおよび胎児由来の胎児ＤＮＡを含む。いくつかの実施形態では、反応混合物が、プライマー伸長反応条件に供されて増幅産物が生成され、増幅産物から、ハイスループットシーケンサーを使って配列決定データが生成され、配列決定データに基づきコンピュータで多形遺伝子座の対立遺伝子数が計算され、それぞれ異なる染色体の可能な倍数性状態に関連する複数の倍数性仮説がコンピュータにより作成され、それぞれの倍数性仮説に対し染色体の多形遺伝子座で予測される対立遺伝子数に対する同時分布モデルがコンピュータで構築され、それぞれの倍数性仮説の相対的確率が同時分布モデルおよび対立遺伝子数を使ってコンピュータで算出され、さらに、最大の確率を有する仮説に対応する倍数性状態を選択することにより胎児の倍数性状態がコールされる。

一態様では、本発明は、妊娠中の胎児の染色体の倍数性状態を決定する方法を特徴とする。ある実施形態では、妊娠中の胎児における染色体の倍数性状態を決定するための方法は、胎児の母親由来の母系ＤＮＡおよび胎児由来の胎児ＤＮＡを含む第１のＤＮＡの試料を得るステップと、調製された試料が得られるようにＤＮＡを単離することによって第１の試料を調製するステップと、染色体上の複数の多型遺伝子座における、調製された試料中のＤＮＡを測定するステップと、調製された試料に対して行ったＤＮＡ測定から、複数の多型遺伝子座における対立遺伝子数をコンピュータで算出するステップと、それぞれが、染色体における可能性のある異なる倍数性状態に関する、複数の倍数性仮説をコンピュータで作製するステップと、各倍数性仮説について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数についての同時分布モデルをコンピュータで構築するステップと、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、倍数性仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールするステップとを含む。

一態様では、本発明は、母系および胎児ＤＮＡの混合物を含む試料中の染色体の異常分布を検査する方法を特徴とする。いくつかの実施形態では、前記方法は、（ｉ）少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと試料を接触させて反応混合物を生成するステップであって、標的遺伝子座が複数個の異なる染色体由来であり、複数個の異なる染色体が試料中で異常分布を有すると疑われる少なくとも１個の第１の染色体、および試料中で正常に分布していると推定される少なくとも１個の第２の染色体を含むステップと、（ｉｉ）反応混合物をプライマー伸長反応条件に供して増幅産物を生成するステップと、（ｉｉｉ）増幅産物を配列決定して標的遺伝子座に整列した複数の配列タグを得るステップであって、配列タグが特定の標的遺伝子座に割り付けるのに十分な長さであるステップと、（ｉｖ）コンピュータで複数の配列タグをそれらの対応する標的遺伝子座に割り付けるステップと、（ｖ）コンピュータで第１の染色体の標的遺伝子座に割り付ける配列タグの数および第２の染色体の標的遺伝子座に割り付ける配列タグの数を決定するステップと、（ｖｉ）コンピュータでステップ（ｖ）からの数を比較して、第１の染色体の異常分布の有無を判定するステップとを含む。

一態様では、本発明は、胎児の異数性の存在の有無を検出する方法を提供する。いくつかの実施形態では、前記方法は、（ｉ）母系と胎児ＤＮＡの混合物を含む試料を、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる、複数の異なる染色体由来である非多形標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、（ｉｉ）反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、（ｉｉｉ）コンピュータで対象の第１と第２の染色体由来の標的増幅産物の相対度数を定量化するステップと、（ｉｖ）コンピュータで対象の第１と第２の染色体由来の標的増幅産物の相対度数を比較するステップと、（ｖ）対象の第１と第２の染色体の比較した相対的度数に基づいて異数性の存在の有無を特定するステップとを含む。いくつかの実施形態では、第１の染色体は、正倍数体であると疑われる染色体である。いくつかの実施形態では、第２の染色体は、異数性であると疑われる染色体である。

一態様では、胎児のゲノムＤＮＡおよび母系のゲノムＤＮＡを含む母系の組織試料において胎児の異数性の存在または不在を決定するための方法であって、（ａ）前記母系の組織試料から、胎児のゲノムＤＮＡと母系のゲノムＤＮＡの混合物を得るステップと、（ｂ）ステップ（ａ）の胎児のゲノムＤＮＡと母系のゲノムＤＮＡの混合物から無作為に選択されたＤＮＡ断片の大規模並行ＤＮＡ配列決定を行って、前記ＤＮＡ断片の配列を決定するステップと、（ｃ）ステップ（ｂ）で得られた配列が属する染色体を同定するステップと、（ｄ）ステップ（ｃ）のデータを用いて、前記母系のゲノムＤＮＡと胎児のゲノムＤＮＡの混合物中の少なくとも１つの第１の染色体の量を決定するステップであって、前記少なくとも１つの第１の染色体が、胎児において正倍数性であると推定されるステップと、（ｅ）ステップ（ｃ）のデータを用いて、前記母系のゲノムＤＮＡと胎児のゲノムＤＮＡの混合物中の第２の染色体の量を決定するステップであって、前記第２の染色体が、胎児において異数体であることが疑われるステップと、（ｆ）胎児ＤＮＡと母系ＤＮＡの混合物中の胎児ＤＮＡの割合を算出するステップと、（ｇ）第２の標的染色体が正倍数性である場合、ステップ（ｄ）の数を用いて第２の標的染色体の量の予測される分布を算出するステップと、（ｈ）第２の標的染色体が異数性である場合、ステップ（ｄ）の第１の数およびステップ（ｆ）で算出された、胎児ＤＮＡと母系ＤＮＡの混合物中の胎児ＤＮＡの割合を用いて第２の標的染色体の量の予測される分布を算出するステップと、（ｉ）最尤法または最大事後法を用いて、ステップ（ｅ）で決定された第２の染色体の量がステップ（ｇ）で算出された分布またはステップ（ｈ）で算出された分布の一部である可能性がより高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が開示されている。

本発明のいずれかの態様の種々の実施形態では、前記方法は、胎児の一方の親または両親から遺伝子型データを得るステップも包含する。いくつかの実施形態では、胎児の一方の親または両親から遺伝子型データを得るステップは、親由来のＤＮＡを調製するステップであって、複数の多型遺伝子座におけるＤＮＡを優先的に富化し、調製された親のＤＮＡを得ることを含むステップと、必要に応じて、調製された親のＤＮＡを増幅するステップと、複数の多型遺伝子座における、調製された試料中の親のＤＮＡを測定するステップとを含む。

本発明のいずれかの態様の種々の実施形態では、染色体上の複数の多型遺伝子座における予測される対立遺伝子数の確率についての同時分布モデルを構築するステップを、一方の親または両親から得られた遺伝子データを用いて行う。いくつかの実施形態では、試料（例えば、第１の試料）を母系の血漿から単離し、母親から遺伝子型データを得るステップを、調製された試料に対して行ったＤＮＡ測定から母系の遺伝子型データを推定することによって行う。

一態様では、妊娠中の胎児における染色体の倍数性状態の決定に役立つ診断ボックス（ｄｉａｇｎｏｓｔｉｃｂｏｘ）であって、本発明の方法のいずれかの調製および測定ステップを実行することができる診断ボックスが開示されている。

本発明のいずれかの態様の種々の実施形態では、対立遺伝子数は、バイナリーではなく確率的なものである。いくつかの実施形態では、複数の多型遺伝子座における、調製された試料中のＤＮＡの測定値を、胎児が１つまたは複数の疾患連鎖ハプロタイプを有するか否かを決定するためにも用いる。

本発明のいずれかの態様の種々の実施形態では、対立遺伝子数の確率についての同時分布モデルを構築するステップを、染色体内の異なる場所における染色体乗換えの確率に関するデータを使用して、染色体上の多型対立遺伝子間の依存性をモデリングすることによって行う。いくつかの実施形態では、対立遺伝子数についての同時分布モデルを構築するステップおよび各仮説の相対的確率を決定するステップを、参照染色体を使用することを必要としない方法を用いて行う。

本発明のいずれかの態様の種々の実施形態では、各仮説の相対的確率を決定するステップに、調製された試料中の胎児ＤＮＡの推定される割合（ｅｓｔｉｍａｔｅｄｆｒａｃｔｉｏｎ）を使用する。いくつかの実施形態では、対立遺伝子数の確率を算出するステップおよび各仮説の相対的確率を決定するステップにおいて使用する、調製された試料からのＤＮＡ測定値は、一次遺伝子データを含む。いくつかの実施形態では、最大の確率を有する仮説に対応する倍数性状態を選択するステップを、最尤推定または最大事後推定を用いて行う。

本発明のいずれかの態様の種々の実施形態では、胎児の倍数性状態をコールするステップは、同時分布モデルおよび対立遺伝子数の確率を用いて決定される倍数性仮説のそれぞれの相対的確率と、リード数解析（ｒｅａｄｃｏｕｎｔａｎａｌｙｓｉｓ）、ヘテロ接合率の比較、親の遺伝子情報を使用する場合にのみ利用可能な統計量、特定の親の状況に対して正規化された遺伝子型シグナルの確率、試料（例えば、第１の試料）または調製された試料の推定される胎児画分を用いて算出される統計量、およびそれらの組み合わせからなる群から選択される統計学的技法を用いて算出される倍数性仮説のそれぞれの相対的確率とを組み合わせるステップも包含する。

本発明のいずれかの態様の種々の実施形態では、信頼度推定値は、コールされた倍数性状態に対し計算される。いくつかの実施形態では、前記方法は、コールされた胎児の倍数性状態に基づいて、妊娠中絶すること、または妊娠を維持することの一方から選択される臨床的措置をとるステップも包含する。

本発明のいずれかの態様の種々の実施形態では、前記方法は、妊娠４週から５週の間；妊娠５週から６週の間；妊娠６週から７週の間；妊娠７週から８週の間；妊娠８週から９週の間；妊娠９週から１０週の間；妊娠１０週から１２週の間；妊娠１２週から１４週の間；妊娠１４週から２０週の間；妊娠２０週から４０週の間；妊娠初期；妊娠中期；妊娠後期；またはそれらの組み合わせにおいて、胎児に対して実施することができる。

本発明のいずれかの態様の種々の実施形態では、前記方法を用いて、妊娠中の胎児における決定された染色体の倍数性状態を示す報告を作製する。いくつかの実施形態では、本発明のいずれかの方法で使用するために設計された、妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットであって、複数の内側のフォワードプライマーおよび、必要に応じて複数の内側のリバースプライマーであって、該プライマーのそれぞれが標的染色体上の多型部位のうちの１つのすぐ上流および／または下流のＤＮＡの領域とハイブリダイズするように設計されているプライマーと、必要に応じてさらに別の染色体であって、ハイブリダイズする領域が、少数の塩基によって該多型部位から隔てられており、前記少数が、１、２、３、４、５、６〜１０、１１〜１５、１６〜２０、２１〜２５、２６〜３０、３１〜６０、およびそれらの組み合わせからなる群から選択される染色体とを含むキットが開示されている。

一態様では、本発明は、父親とされる人が妊娠中の母親が懐胎している胎児の生物学上の父親であるか否かを確定する方法を特徴とする。いくつかの実施形態では、前記方法は、（ｉ）父親とされる人由来の少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる遺伝物質上の多形遺伝子座を含む複数の多形遺伝子座を同時に増幅して第１の増幅産物の集合を生成するステップと、（ｉｉ）妊娠中の母親の血液試料由来の胎児ＤＮＡと母系ＤＮＡを含むＤＮＡの混合試料の対応する複数の多形遺伝子座を同時に増幅して第２の増幅産物の集合を生成するステップと、（ｉｉｉ）コンピュータで、第１と第２の増幅産物の集合に基づく遺伝子型測定値を使って父親とされる人が生物学上の胎児の父親である確率を決定するステップと、（ｉｖ）父親とされる人が生物学上の胎児の父親であることの決定された確率を使って、生物学上の胎児の父親であるか否かを確定するステップとを含む。種々の実施形態では、前記方法は、母親由来の対応する複数の遺伝物質上の多形遺伝子座を同時に増幅して第３の増幅産物の集合を生成するステップをさらに含み、この場合、父親とされる人が生物学上の胎児の父親である確率が第１、第２、および第３の増幅産物の集合に基づいた遺伝子型測定値を使って決定される。

一態様では、本発明は、胚の集合由来のそれぞれの胚を所望の通り発生させる相対尤度を推定する方法が提供される。いくつかの実施形態では、前記方法は、それぞれの胚由来の試料を少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させてそれぞれの胚の反応混合物を生成するステップを含み、試料は１個または複数個の胚由来の細胞からそれぞれ得られる。いくつかの実施形態では、それぞれの反応混合物は、プライマー伸長反応条件に供され、増幅産物を生成する。いくつかの実施形態では、前記方法は、コンピュータで、それぞれの胚由来の少なくとも１個の細胞の１つまたは複数の特性を増幅産物に基づいて決定するステップと、コンピュータで、それぞれの胚の少なくとも１個の細胞の１つまたは複数の特性に基づいて、それぞれの胚を所望の通り発生させる相対尤度を推定するステップとを含む。

一態様では、本発明は、核酸試料中の２個以上の標的遺伝子座の量を測定する方法を特徴とする。いくつかの実施形態では、前記方法は、（ｉ）ＰＣＲを使って、第１の基準遺伝子座、第２の基準遺伝子座、第１の標的遺伝子座、および第２の標的遺伝子座を含む核酸試料を増幅して増幅産物を形成するステップであって、第１の基準遺伝子座および第１の標的遺伝子座が同じ数のヌクレオチドであるが、１個または複数個のヌクレオチドの位置で異なる配列を有し、第２の基準遺伝子座および第２の標的遺伝子座が同じ数のヌクレオチドであるが、１個または複数個のヌクレオチドの位置で異なる配列を有するステップと、（ｉｉ）増幅産物を配列決定して増幅された第２の基準遺伝子座に比べて増幅された第１の基準遺伝子座の相対的量を比較する基準比率を決定するステップであって、基準比率が第１の基準遺伝子座および第２の基準遺伝子座の増幅に対するＰＣＲ効率の差異を示すステップと、（ｉｉｉ）増幅された第２の標的遺伝子座に比べて増幅された第１の標的遺伝子座の相対量を比較する標的比率を決定するステップと、（ｉｖ）ステップ（ｉｉ）からの基準比率に基づいてステップ（ｉｉｉ）からの標的比率を調節して試料中の第１の標的遺伝子座および第２の標的遺伝子座の相対量を決定するステップとを含む。種々の実施形態では、前記方法は、試料中の第１の標的遺伝子座および第２の標的遺伝子座の絶対量を決定するステップを含む。種々の実施形態では、前記方法は、試料中の標的遺伝子座（例えば、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座）の存在の有無を判定するステップをさらに含む。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座を同時に増幅するステップを含む。

一態様では、本発明は、分析用試料の複数の遺伝的標的を定量的に測定する方法を特徴とする。いくつかの実施形態では、前記方法は、（ｉ）分析用試料由来の遺伝物質を、複数の標的特異的増幅試薬および標的特異的増幅試薬の標的に対応する複数の基準配列と混合するステップと、（ｉｉ）遺伝物質の標的領域および基準配列を増幅して標的増幅産物および基準配列増幅産物を生成するステップと、（ｉｉｉ）生成した標的増幅産物および基準配列増幅産物の量を測定するステップとを含む。いくつかの実施形態では、遺伝物質は、遺伝子ライブラリー中に存在する。いくつかの実施形態では、遺伝的標的は、多形遺伝子座（ＳＮＰなど）である。いくつかの実施形態では、量を測定するステップは、配列を計数することにより実現される。いくつかの実施形態では、前記方法は、遺伝子ライブラリーが由来する試料中の少なくとも１個の染色体の推定コピー数を測定するステップをさらに含み、測定は、標的増幅産物のシーケンスリード数を基準増幅産物のシーケンスリード数と比較するステップを含む。いくつかの実施形態では、基準配列および遺伝子ライブラリーは、同じプライマーによりプライミングできるユニバーサルプライミング部位を含む。いくつかの実施形態では、混合ステップは、少なくとも１０；１００；５００；１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的特異的増幅試薬および少なくとも１０；１００；５００；１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の基準配列を含む。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、基準配列のそれぞれの相対量は既知である。いくつかの実施形態では、配列のそれぞれの相対量は、参照ゲノムに対し較正されている。いくつかの実施形態では、分析用試料は、胎児と母系ゲノムの混合物を含む。いくつかの実施形態では、分析用試料は、妊婦の血液由来であるか、または血漿由来である。いくつかの実施形態では、参照ゲノムは、染色体１３、１８、２１、Ｘ、またはＹの異数性などの少なくとも１つの異数性を有する。いくつかの実施形態では、参照ゲノムは、二倍体である。

一態様では、本発明は、複数の遺伝子基準配列を含む混合物を特徴とし、混合物中のそれぞれの遺伝子基準配列の相対量は、参照ゲノムに対する較正により決定されている。種々の実施形態では、混合物は、少なくとも１０；１００；５００；１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の遺伝子基準配列を含む。種々の実施形態では、遺伝子基準配列は、第１のユニバーサルプライミング部位、第２のユニバーサルプライミング部位、第１の標的特異的プライミング部位、第２の標的特異的プライミング部位、および第１と第２の標的特異的プライミング部位の間に位置するマーカー配列を含み、第１の標的特異的部位および第２の標的特異的プライミング部位は、第１と第２のユニバーサルプライミング部位の間に位置する。種々の実施形態では、較正は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、較正は、１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは、染色体１３、１８、２１、Ｘ、またはＹの異数性などの少なくとも１個の異数性を有する。いくつかの実施形態では、参照ゲノムは二倍体である。

一態様では、本発明は、較正された遺伝子基準配列の集合を生成する方法を特徴とする。いくつかの実施形態では、前記方法は、（ｉ）参照ゲノムから調製された遺伝子ライブラリー、複数の標的特異的増幅プライマー試薬の集合、および標的特異的増幅試薬の集合に対応する複数の遺伝子基準配列を含む増幅反応混合物を形成するステップと、（ｉｉ）遺伝子ライブラリーおよび遺伝子基準配列を増幅して標的配列由来の増幅産物および遺伝子基準配列由来の増幅産物を生成するステップと、（ｉｉｉ）標的配列由来の増幅産物および遺伝子基準配列由来の増幅産物の量を測定するステップと、（ｉｖ）それぞれの遺伝子基準配列相互の相対量を決定し、それにより、複数の遺伝子基準配列が較正されるステップとを含む。種々の実施形態では、少なくとも１０；１００；５００；１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の遺伝子基準配列が使用される。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、本発明は、１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる配列を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは、染色体１３、１８、２１、Ｘ、またはＹの異数性などの少なくとも１個の異数性を有する。いくつかの実施形態では、参照ゲノムは二倍体である。

一態様では、本発明は、本発明のいずれかの方法により較正されている遺伝子基準配列の集合を提供する。一態様では、本発明は、前記方法が実行される前、その間、その後に較正できる遺伝子基準配列の集合を提供する。

一態様では、本発明は、欠失を有する少なくとも１個の対立遺伝子を含む対象遺伝子のコピー数を測定する方法を特徴とする。いくつかの実施形態では、前記方法は、（ｉ）分析用試料由来の遺伝物質を、対象の遺伝子に特異的で、対象の遺伝子の対立遺伝子を含む欠失を大きくは増幅できない増幅試薬、対象の遺伝子に対応する基準配列、参照配列に特定的な増幅試薬、および参照配列に対応する基準配列と混合するステップと、（ｉｉ）対象の遺伝子配列、対象の遺伝子に対応する基準配列、参照配列、および参照配列に対応する基準配列を増幅し、対象の遺伝子増幅産物、参照配列増幅産物、および基準配列増幅産物を生成するステップと、（ｉｉｉ）生成標的増幅産物および基準配列増幅産物の量を測定するステップとを含む。いくつかの実施形態では、量の測定は、シーケンスリードを計数することにより実現される。いくつかの実施形態では、前記方法は、少なくとも１個の遺伝子ライブラリーが由来する試料中の染色体の推定コピー数を算出するステップをさらに含み、算出ステップは、標的増幅産物の配列の数を、基準増幅産物の配列の数と比較するステップを含む。いくつかの実施形態では、基準配列および遺伝子ライブラリーは、同じプライマーによりプライミングできるユニバーサルプライミング部位を含む。いくつかの実施形態では、それぞれの配列の相対的量は、参照ゲノムに対して較正されている。種々の実施形態では、少なくとも１０；１００；５００；１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の遺伝子基準配列が使われる。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは二倍体である。いくつかの実施形態では、分析用試料は、血液由来である。

本発明のいずれかの態様の種々の実施形態では、標的遺伝子座（例えば、複数の多型遺伝子座）における試料（例えば、第１の試料）中のＤＮＡを優先的に富化するステップは、複数の環状化前プローブであって、それぞれのプローブが遺伝子座（例えば、多型遺伝子座）のうちの１つを標的とし、好ましくは、該プローブの３’末端および５’末端が遺伝子座の多型部位から少数の塩基で隔てられているＤＮＡの領域とハイブリダイズするように設計されており、前記少数が、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１〜２５、２６〜３０、３１〜６０、またはそれらの組み合わせであるプローブを得るステップと、環状化前プローブと試料（例えば、第１の試料）由来のＤＮＡをハイブリダイズさせるステップと、ハイブリダイズしたプローブ末端間のギャップを、ＤＮＡポリメラーゼを用いて埋めるステップと、環状化前プローブを環状化するステップと、環状化されたプローブを増幅するステップとを含む。

本発明のいずれかの態様の種々の実施形態では、標的遺伝子座（例えば、複数の多型遺伝子座）におけるＤＮＡを優先的に富化するステップは、複数のライゲーション媒介性ＰＣＲプローブであって、それぞれのＰＣＲプローブが標的遺伝子座（例えば、多型遺伝子座）のうちの１つを標的とし、その上流および下流ＰＣＲプローブが、好ましくは、遺伝子座の多型部位から少数の塩基で隔てられているＤＮＡの一方の鎖上のＤＮＡの領域とハイブリダイズするように設計されており、前記少数が、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１〜２５、２６〜３０、３１〜６０、またはそれらの組み合わせであるＰＣＲプローブを得るステップと、ライゲーション媒介性ＰＣＲプローブと試料（例えば、第１の試料）由来のＤＮＡをハイブリダイズさせるステップと、ライゲーション媒介性ＰＣＲプローブ末端間のギャップを、ＤＮＡポリメラーゼを用いて埋めるステップと、ライゲーション媒介性ＰＣＲプローブをライゲーションするステップと、ライゲーションされたライゲーション媒介性ＰＣＲプローブを増幅するステップとを含む。

本発明の種々の態様のいくつかの実施形態では、標的遺伝子座（例えば、複数の多型遺伝子座）におけるＤＮＡを優先的に富化するステップは、遺伝子座（例えば、多型遺伝子座）を標的とする複数のハイブリッド捕捉プローブを得るステップと、ハイブリッド捕捉プローブを、試料（例えば、第１の試料）中のＤＮＡとハイブリダイズさせるステップと、ＤＮＡに関する試料（例えば、第１の試料）からハイブリダイズしていないＤＮＡの一部または全部を物理的に除去するステップとを含む。

本発明のいずれかの態様のいくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位と隣接しているがオーバーラップはしていない領域とハイブリダイズするように設計されている。いくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位と隣接しているがオーバーラップはしていない領域とハイブリダイズするように設計されており、隣接捕捉プローブの長さは、約１２０塩基未満、約１１０塩基未満、約１００塩基未満、約９０塩基未満、約８０塩基未満、約７０塩基未満、約６０塩基未満、約５０塩基未満、約４０塩基未満、約３０塩基未満、および約２５塩基未満からなる群から選択することができる。いくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位とオーバーラップする領域とハイブリダイズするように設計されており、複数のハイブリッド捕捉プローブは、各多型遺伝子座に対する少なくとも２つのハイブリッド捕捉プローブを含み、各ハイブリッド捕捉プローブが、一方の多型遺伝子座において別の対立遺伝子と相補的であるように設計されている。

本発明のいずれかの態様のいくつかの実施形態では、複数の多型遺伝子座のＤＮＡを優先的に富化するステップは、複数の内側のフォワードプライマーであって、それぞれのプライマーが多型遺伝子座のうちの１つを標的とし、該内側のフォワードプライマーの３’末端が、多型部位の上流にあり、少数の塩基で多型部位から隔てられているＤＮＡの領域とハイブリダイズするように設計されており、少数が、１塩基対、２塩基対、３塩基対、４塩基対、５塩基対、６〜１０塩基対、１１〜１５塩基対、１６〜２０塩基対、２１〜２５塩基対、２６〜３０塩基対または３１〜６０塩基対からなる群から選択されるプライマーを得るステップと、必要に応じて、複数の内側のリバースプライマーであって、それぞれのプライマーが多型遺伝子座のうちの１つを標的とし、内側のリバースプライマーの３’末端が、多型部位の上流にあり、少数の塩基で多型部位から隔てられているＤＮＡの領域とハイブリダイズするように設計されており、少数が、１塩基対、２塩基対、３塩基対、４塩基対、５塩基対、６〜１０塩基対、１１〜１５塩基対、１６〜２０塩基対、２１〜２５塩基対、２６〜３０塩基対または３１〜６０塩基対からなる群から選択されるプライマーを得るステップと、内側のプライマーをＤＮＡとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてＤＮＡを増幅して増幅産物を形成するステップとを含む。

本発明のいずれかの態様のいくつかの実施形態では、前記方法は、複数の外側のフォワードプライマーであって、それぞれのプライマーが標的遺伝子座（例えば、多型遺伝子座）のうちの１つを標的とし、内側のフォワードプライマーの上流のＤＮＡの領域とハイブリダイズするように設計されているプライマーを得るステップと、必要に応じて、複数の外側のリバースプライマーであって、それぞれのプライマーが標的遺伝子座（例えば、多型遺伝子座）のうちの１つを標的とし、内側のリバースプライマーのすぐ下流のＤＮＡの領域とハイブリダイズするように設計されているプライマーを得るステップと、第１のプライマーをＤＮＡとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてＤＮＡを増幅するステップとをさらに含む。

本発明のいずれかの態様のいくつかの実施形態では、前記方法は、複数の外側のリバースプライマーであって、それぞれのプライマーが標的遺伝子座（例えば、多型遺伝子座）のうちの１つを標的とし、内側のリバースプライマーのすぐ下流のＤＮＡの領域とハイブリダイズするように設計されているプライマーを得るステップと、必要に応じて、複数の外側のフォワードプライマーであって、それぞれのプライマーが多型遺伝子座のうちの１つを標的とし、内側のフォワードプライマーの上流のＤＮＡの領域とハイブリダイズするように設計されているプライマーを得るステップと、第１のプライマーをＤＮＡとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてＤＮＡを増幅するステップとをさらに含む。

本発明のいずれかの態様のいくつかの実施形態では、試料（例えば、第１の試料）調整ステップは、ユニバーサルアダプタを試料（例えば、第１の試料）中のＤＮＡに付加するステップおよびポリメラーゼ連鎖反応を使って試料（例えば、第１の試料）中のＤＮＡを増幅するステップをさらに含む。いくつかの実施形態では、増幅された増幅産物の少なくとも一部分が１００ｂｐ未満、９０ｂｐ未満、８０ｂｐ未満、７０ｂｐ未満、６５ｂｐ未満、６０ｂｐ未満、５５ｂｐ未満、５０ｂｐ未満、または４５ｂｐ未満であり、一部分とは１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または９９％である。

本発明のいずれかの態様のいくつかの実施形態では、ＤＮＡを増幅するステップは、１つまたは複数の個々の反応容積で行われ、個々の反応容積のそれぞれは、１００超の異なるフォワードプライマーとリバースプライマーの対、２００超の異なるフォワードプライマーとリバースプライマーの対、５００超の異なるフォワードプライマーとリバースプライマーの対、１，０００超の異なるフォワードプライマーとリバースプライマーの対、２，０００超の異なるフォワードプライマーとリバースプライマーの対、５，０００超の異なるフォワードプライマーとリバースプライマーの対、１０，０００超の異なるフォワードプライマーとリバースプライマーの対、２０，０００超の異なるフォワードプライマーとリバースプライマーの対、５０，０００超の異なるフォワードプライマーとリバースプライマーの対、または、１００，０００超の異なるフォワードプライマーとリバースプライマーの対を含有する。

本発明のいずれかの態様のいくつかの実施形態では、試料（例えば、第１の試料）を調製するステップは、試料（例えば、第１の試料）を複数の部分に分割するステップであって、標的遺伝子座（例えば、複数の多型遺伝子座）のサブセットにおいて各部分内のＤＮＡが優先的に富化されるステップをさらに含む。いくつかの実施形態では、望ましくないプライマー２重鎖を形成する可能性があるプライマー対を同定するステップ、および望ましくないプライマー２重鎖を形成する可能性があると同定されたプライマーの対の少なくとも１つを複数のプライマーから除去するステップによって内側のプライマーを選択する。いくつかの実施形態では、内側のプライマーは、標的の遺伝子座（例えば、多型遺伝子座）の上流または下流のいずれかとハイブリダイズするように設計された領域を含有し、必要に応じて、ＰＣＲ増幅が可能になるように設計されたユニバーサルプライミング配列（ｐｒｉｍｉｎｇｓｅｑｕｅｎｃｅ）を含有する。いくつかの実施形態では、プライマーの少なくとも一部は、個々のプライマー分子各々について異なるランダムな領域をさらに含有する。いくつかの実施形態では、プライマーの少なくとも一部は分子バーコードをさらに含有する。

本発明のいずれかの態様のいくつかの実施形態では、優先的な富化により、調製された試料と試料（例えば、第１の試料）との間に、２倍以下、１．５倍以下、１．２倍以下、１．１倍以下、１．０５倍以下、１．０２倍以下、１．０１倍以下、１．００５倍以下、１．００２倍以下、１．００１倍以下および１．０００１倍以下からなる群から選択される係数の程度の、平均の対立遺伝子の偏りがもたらされる。いくつかの実施形態では、複数の多型遺伝子座はＳＮＰである。いくつかの実施形態では、調製された試料中のＤＮＡを測定するステップを配列決定によって行う。

本発明のいずれかの態様のいくつかの実施形態では、標的遺伝子座は、対照の同じ核酸（例えば、同じ染色体または染色体の同じ領域）上に存在する。いくつかの実施形態では、少なくともいくつかの標的遺伝子座は、対象の異なる核酸（例えば、異なる染色体）上に存在する。いくつかの実施形態では、核酸試料は、フラグメント化または消化核酸を含む。いくつかの実施形態では、核酸試料は、ゲノムＤＮＡ、ｃＤＮＡ、またはｍＲＮＡを含む。いくつかの実施形態では、核酸試料は、単一細胞由来のＤＮＡを含む。いくつかの実施形態では、核酸試料は、実質的に細胞不含の血液または血漿試料である。いくつかの実施形態では、核酸試料は、血液、血漿、唾液、精液、精子、細胞培養上清、粘液分泌、歯垢、消化管組織、便、尿、毛、骨、体液、涙、組織、皮膚、爪、卵割球、胚、羊水、絨毛膜絨毛試料、胆汁、リンパ液、子宮頸管粘液、または法医学試料を含むか、またはそれら由来である。いくつかの実施形態では、標的遺伝子座は、ヒト核酸のセグメントである。いくつかの実施形態では、標的遺伝子座は、単一ヌクレオチド多型（ＳＮＰ）を含むか、またはそれから構成される。いくつかの実施形態では、プライマーは、ＤＮＡ分子である。

本発明のいずれかの態様のいくつかの実施形態では、試料（例えば、第１の試料）中のＤＮＡは、母系血漿由来である。いくつかの実施形態では、試料（例えば、第１の試料）を調製するステップは、ＤＮＡを増幅するステップをさらに含む。いくつかの実施形態では、試料（例えば、第１の試料）を調製するステップは、標的遺伝子座（例えば、複数の多型遺伝子座）における試料（例えば、第１の試料）中のＤＮＡを優先的に富化するステップをさらに含む。

種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、ポリメラーゼによる１個または複数個のヌクレオチドの付加を含む。種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、ライゲーション媒介性ＰＣＲを含まない。種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、リガーゼによる２個のプライマーの連結を含まない。種々の実施形態では、プライマーは、連結逆方向プローブ（ＬＩＰ）を含まない。このプローブは、環状化前プローブ（ｐｒｅ−ｃｉｒｃｕｌａｒｉｚｅｄｐｒｏｂｅ）、環状化前プローブ（ｐｒｅ−ｃｉｒｃｕｌａｒｉｚｉｎｇｐｒｏｂｅ）または環状化プローブ、環状化プローブ、Ｐａｄｌｏｃｋプローブ、または分子反転プローブ（ＭＩＰ）とも呼ばれる。

本明細書に記載される本発明のすべての態様および実施形態は、態様および実施形態「を含む（ｃｏｍｐｒｉｓｉｎｇ）」、態様およ及び実施形態「からなる（ｃｏｎｓｉｓｔｉｎｇ）」、および態様及び実施形態「から実質的になる（ｃｏｎｓｉｓｔｉｎｇｅｓｓｅｎｔｉａｌｌｙｏｆ）」を含むことが理解されよう。

定義
一塩基多型（ＳＮＰ）とは、同じ種の２つのメンバーのゲノム間で異なる可能性がある一塩基を指す。この用語の使用は、各変異体が発生する頻度に対するいかなる限定も意味するべきではない。

配列とは、ＤＮＡ配列または遺伝子配列を指す。配列とは、個体のＤＮＡ分子または鎖の一次の物理的構造を指し得る。配列とは、ＤＮＡ分子またはＤＮＡ分子の相補鎖に見いだされるヌクレオチドの配列を指し得る。配列とは、インシリコで表示される、ＤＮＡ分子に含有される情報を指し得る。

遺伝子座とは、個体のＤＮＡ上の対象の特定の領域を指し、可能性のある挿入もしくは欠失の部位またはいくつかの他の関連性のある遺伝的変異の部位である、ＳＮＰを指し得る。疾患連鎖ＳＮＰとは、疾患連鎖遺伝子座を指す場合もある。

多型対立遺伝子、同様に「多型遺伝子座」とは、所与の種内の個体間で遺伝子型が変動する対立遺伝子または遺伝子座を指す。多型対立遺伝子のいくつかの例としては、一塩基多型、短いタンデム反復、欠失、重複、および逆位が挙げられる。

多型部位とは、個体間で変動する多型領域に見いだされる特異的なヌクレオチドを指す。

対立遺伝子とは、特定の遺伝子座を占有する遺伝子を指す。

遺伝子データ、同様に「遺伝子型データ」とは、１個または複数個の個体のゲノムの態様を記載するデータを指す。これは、１つの遺伝子座または遺伝子座の集合、部分配列または全配列、染色体の部分もしくは染色体の全体、またはゲノム全体を指し得る。これは、１個または複数個のヌクレオチドの同一性を指してもよく、これは、逐次的なヌクレオチドの集合またはゲノム内の異なる場所由来のヌクレオチド、またはそれらの組み合わせを指してもよい。遺伝子型データは、一般にはインシリコであるが、化学的にコードされる遺伝子データとして配列内に物理的なヌクレオチドを考えることも可能である。遺伝子型データは、個体（複数可）「ｏｎ（に関する）」、「ｏｆ（の）」、「ａｔ（における）」、「ｆｒｏｍ（からの）」または「ｏｎ（に関する）」と言うことができる。遺伝子型データとは、これらの測定を遺伝物質に対して行う場合、遺伝子型決定プラットフォームからの出力測定値を指し得る。

遺伝物質、同様に「遺伝子試料」とは、ＤＮＡまたはＲＮＡを含む１つまたは複数の個体由来の組織または血液などの物理的物質を指す。

ノイズを伴う遺伝子データとは、以下のいずれかを伴う遺伝子データを指す：対立遺伝子ドロップアウト、不確実な塩基対測定値、不正確な塩基対測定値、塩基対測定値の欠落、挿入または欠失の不確実な測定値、染色体セグメントコピー数の不確実な測定値、偽のシグナル、測定値の欠落、他のエラー、またはそれらの組み合わせ。

信頼度とは、コールされたＳＮＰ、対立遺伝子、対立遺伝子の集合、倍数性コールまたは決定された染色体セグメントコピーの数が個体の実際の遺伝子の状態を正確に示す統計学的尤度を指す。

倍数性コール、同様に「染色体コピー数コール」または「コピー数コール」（ＣＮＣ）、とは、細胞内に存在する１個または複数個の染色体の量および／または染色体の同一性を決定する行為を指し得る。

異数性とは、細胞中の誤った数の染色体（例えば、誤った数の完全染色体または誤った数の染色体セグメント、例えば、染色体セグメントの欠失または複製の存在）が存在する状態を意味する。ヒト体細胞の場合には、異数性とは、細胞が、２２対の常染色体および１対の性染色体を含有しない場合を指し得る。ヒト配偶子の場合には、異数性とは、細胞が、２３種の染色体のそれぞれのうちの１つを含有しない場合を指し得る。単一染色体型の場合には、異数性とは、大体２つの相同であるが同一ではない染色体コピーが存在する場合、または同じ親を起源とする２つの染色体コピーが存在する場合を指し得る。いくつかの実施形態では、染色体セグメントの欠失は微小欠失である。

倍数性状態とは、細胞における１つまたは複数の染色体型の量および／または染色体の同一性を指す。

染色体とは、単一染色体コピーを指してもよく、これは正常な体細胞に４６個存在するＤＮＡの単一分子を意味し、その例は「母体由来の第１８染色体」である。染色体とは、正常なヒト体細胞に２３個存在する染色体型を指す場合もあり、例は「第１８染色体」である。

染色体の同一性とは、指示対象の染色体数、すなわち染色体型を指し得る。正常なヒトは、２２種類の番号が付された常染色体型、および２種類の性染色体を有する。染色体の同一性とは、親起源の染色体を指す場合もある。染色体の同一性とは、親から遺伝によって受け継がれる特定の染色体を指す場合もある。染色体の同一性とは、染色体の他の同定される形体（ｆｅａｔｕｒｅ）を指す場合もある。

遺伝物質の状態または単に「遺伝子の状態」とは、ＤＮＡ上のＳＮＰの集合の同一性、相が特定された（ｐｈａｓｅｄ）遺伝物質のハプロタイプ、および挿入、欠失、反復および変異を含めたＤＮＡの配列を指し得る。これは、１個または複数個の染色体の倍数性状態、染色体セグメントまたは染色体セグメントの集合を指す場合もある。

対立遺伝子データとは、１個または複数個の対立遺伝子の集合に関する遺伝子型データの集合を指す。対立遺伝子データとは、相が特定されたハプロタイプデータを指し得る。対立遺伝子データとは、ＳＮＰの同一性を指してもよく、対立遺伝子データとは、挿入、欠失、反復および変異を含めたＤＮＡの配列データを指してもよい。対立遺伝子データとは、親起源の各対立遺伝子を包含してもよい。

対立遺伝子の状態とは、１個または複数個の対立遺伝子の集合内の遺伝子の実際の状態を指す。対立遺伝子の状態とは、対立遺伝子データに記載されている遺伝子の実際の状態を指し得る。

対立遺伝子の比（ａｌｌｅｌｉｃｒａｔｉｏ）または対立遺伝子の比（ａｌｌｅｌｅｒａｔｉｏ）とは、試料または個体に存在する遺伝子座における各対立遺伝子の量の間の比を指す。試料を配列決定によって測定した場合、対立遺伝子の比とは、遺伝子座における各対立遺伝子にマッピングされるシーケンスリードの比を指し得る。試料を強度に基づく測定方法によって測定した場合、対立遺伝子の比とは、測定方法によって推定される遺伝子座に存在する各対立遺伝子の量の比を指し得る。

対立遺伝子数とは、特定の遺伝子座にマッピングされる配列の数を指し、その遺伝子座が多型である場合、対立遺伝子数とは、対立遺伝子のそれぞれにマッピングされる配列の数を指す。各対立遺伝子がバイナリー様式でカウントされる場合は、対立遺伝子数は整数になる。対立遺伝子が確率的にカウントされる場合は、対立遺伝子数は分数であり得る。

対立遺伝子数確率とは、マッピングの確率と組み合わせた、特定の遺伝子座または多型遺伝子座における対立遺伝子の集合にマッピングされる可能性がある配列の数を指す。カウントされた配列のそれぞれについてのマッピングの確率がバイナリーである（０または１）対立遺伝子数は、対立遺伝子数の確率と等しいことに留意されたい。いくつかの実施形態では、対立遺伝子数の確率はバイナリーであってよい。いくつかの実施形態では、対立遺伝子数の確率は、ＤＮＡ測定値と等しくなるように設定することができる。

対立遺伝子分布または「対立遺伝子数分布」とは、遺伝子座の集合内の各遺伝子座に存在する各対立遺伝子の相対量を指す。対立遺伝子分布は、個体、試料または試料に対して得た測定値の集合を指す場合がある。配列決定との関連において、対立遺伝子分布とは、多型遺伝子座の集合内の各対立遺伝子についての、特定の対立遺伝子にマッピングされるリード数または見込み数を指す。対立遺伝子測定値は、確率的に処理することができる、すなわち所与の対立遺伝子が所与のシーケンスリードを示す尤度は、０から１の間の分数である、または対立遺伝子測定値は、バイナリー様式で処理することができる、すなわち任意の所与のリードは、特定の対立遺伝子のちょうど０コピーまたは１コピーであると考えられる。

対立遺伝子分布パターンとは、異なる親の状況についての異なる対立遺伝子分布の集合を指す。特定の対立遺伝子分布パターンにより、特定の倍数性状態が示され得る。

対立遺伝子の偏りとは、ヘテロ接合性遺伝子座における測定された対立遺伝子の比が、元のＤＮＡの試料に存在していた比と異なる程度を指す。特定の遺伝子座における対立遺伝子の偏りの程度は、その遺伝子座において観察された対立遺伝子比を測定し、その遺伝子座における元のＤＮＡ試料中の対立遺伝子の比で割ったものと等しい。対立遺伝子の偏りは１より大きいと定義することができ、したがって、対立遺伝子の偏りの程度の算出によって１未満の値ｘが生じる場合、対立遺伝子の偏りの程度は１／ｘと言い換えることができる。対立遺伝子の偏りは、増幅の偏り、精製の偏りまたは異なる対立遺伝子に違うように影響を及ぼすいくつかの他の現象に起因し得る。

プライマー、同様に「ＰＣＲプローブ」とは、単一のＤＮＡ分子（ＤＮＡオリゴマー）またはＤＮＡ分子（ＤＮＡオリゴマー）の集団を指し、ＤＮＡ分子は同一またはほぼ同一であり、プライマーは、標的遺伝子座（例えば、標的多型遺伝子座または非多型遺伝子座）とハイブリダイズするように設計された領域を含有しており、ＰＣＲ増幅が可能になるように設計されたプライミング配列を含有してよい。プライマーは、分子バーコードも含有してよい。プライマーは、個々の分子それぞれについて異なるランダムな領域を含有してよい。用語の「試験プライマー」および「候補プライマー」は、限定を意味するものではなく、本明細書開示のいずれかのプライマーを意味してもよい。

プライマーライブラリーは、２個以上のプライマーの集団を意味する。種々の実施形態では、ライブラリーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なるプライマーを含む。種々の実施形態では、ライブラリーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なるプライマー対を含み、それぞれのプライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、それぞれの試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ異なる標的遺伝子座にハイブリダイズする少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。いくつかの実施形態では、ライブラリーは、（ｉ）プライマー対、および（ｉｉ）プライマー対の一部ではない個別プライマー（例えば、ユニバーサルプライマー）の両方を含む。

ハイブリッド捕捉プローブとは、ＰＣＲまたは直接的な合成などの種々の方法によって生成され、試料中の特異的な標的ＤＮＡ配列の一方の鎖と相補的であることが意図された、場合によっては改変された任意の核酸配列を指す。外因性のハイブリッド捕捉プローブを調製された試料に加え、変性−再アニーリングプロセスを通じてハイブリダイズさせて、外因性断片−内因性断片の２重鎖を形成することができる。次いで、これらの２重鎖を、種々の手段によって試料から物理的に分離することができる。

シーケンスリードとは、クローン配列決定法を用いて測定したヌクレオチド塩基の配列を示すデータを指す。クローン配列決定により、単一の１つの元のＤＮＡ分子または１つの元のＤＮＡ分子のクローンまたは１つの元のＤＮＡ分子のクラスターを示す配列データを生じることができる。シーケンスリードは、配列の各塩基の位置において、ヌクレオチドが正確にコールされている確率を示す関連する品質スコアも有し得る。

シーケンスリードのマッピングとは、特定の生物体のゲノム内配列におけるシーケンスリードの開始場所を決定するプロセスである。シーケンスリードの開始場所は、リードとゲノム配列のヌクレオチド配列の類似性に基づく。

一致コピーエラー、同様に「一致染色体異数性」（ＭＣＡ）とは、１つの細胞が、２つの同一またはほぼ同一の染色体を含有する異数性の状態を指す。この種類の異数性は、減数分裂における配偶子形成の間に生じる可能性があり、減数分裂不分離エラーと称することができる。この種類のエラーは、有糸分裂において生じる可能性がある。一致トリソミーとは、所与の染色体の３つのコピーが個体に存在し、コピーのうちの２つが同一である場合を指し得る。

不一致コピーエラー、同様に「独自の染色体異数性（ｕｎｉｑｕｅｃｈｒｏｍｏｓｏｍｅａｎｅｕｐｌｏｉｄｙ）」（ＵＣＡ）とは、１つの細胞が同じ親由来であり、かつ相同であるが同一ではない可能性がある２つの染色体を含有する異数性の状態を指す。この種類の異数性は、減数分裂の間に生じる可能性があり、減数分裂エラーと称することができる。不一致トリソミーとは、所与の染色体の３つのコピーが個体に存在し、コピーのうちの２つが同じ親由来であり、かつ相同であるが同一ではない場合を指し得る。不一致トリソミーとは、一方の親由来の２つの相同染色体が存在し、染色体の一部のセグメントは同一であるが他のセグメントはただ単に相同なだけである場合を指し得ることに留意されたい。

相同染色体とは、通常は減数分裂の間に対合する同じ遺伝子の集合を含有する染色体コピーを指す。

同一染色体とは、同じ遺伝子の集合を含有する染色体コピーを指し、各遺伝子について、同一染色体は同一またはほぼ同一である同じ対立遺伝子の集合を有する。

対立遺伝子ドロップアウト（ＡＤＯ）とは、所与の対立遺伝子における相同染色体由来の塩基対の集合内の塩基対の少なくとも一方が検出されない状況を指す。

遺伝子座ドロップアウト（ＬＤＯ）とは、所与の対立遺伝子における相同染色体由来の塩基対の集合内の塩基対の両方が検出されない状況を指す。

ホモ接合性とは、対応する染色体の遺伝子座と同様の対立遺伝子を有することを指す。

ヘテロ接合性とは、対応する染色体の遺伝子座と同様でない対立遺伝子を有することを指す。

ヘテロ接合性率とは、集団内の個体が所与の遺伝子座においてヘテロ接合性対立遺伝子を有する率を指す。ヘテロ接合性率は、個体またはＤＮＡの試料中の所与の遺伝子座における予測された対立遺伝子の比または測定された対立遺伝子の比を指す場合もある。

情報価値が高い一塩基多型（ＨＩＳＮＰ）とは、胎児が母親の遺伝子型には存在しない対立遺伝子を有するＳＮＰを指す。

染色体領域とは、染色体のセグメントまたは完全な染色体を指す。

染色体のセグメントとは、１つの塩基対から染色体全体までサイズに幅があり得る染色体のセクションを指す。

染色体とは、完全な染色体または染色体のセグメントもしくはセクションのいずれかを指す。

コピーとは、染色体セグメントのコピーの数を指す。それは、染色体セグメントの同一のコピー、または同一ではない相同なコピーを指す場合があり、染色体セグメントの異なるコピーは実質的に類似した遺伝子座の集合を含有し、対立遺伝子のうちの１個または複数個が異なる。Ｍ２コピーエラーなどの異数性のいくつかの場合には、所与の染色体セグメントの同一であるいくらかのコピーならびに同じ染色体セグメントの同一ではないいくらかのコピーを有する可能性があることに留意されたい。

ハプロタイプとは、一般には、同じ染色体上で一緒に遺伝によって受け継がれる、複数の遺伝子座における対立遺伝子の組み合わせを指す。ハプロタイプとは、所与の遺伝子座の集合の間で起こった組換え事象の数に応じて、わずか２つの遺伝子座または染色体全体を指し得る。ハプロタイプとは、統計学的に関連する単一の染色分体上の一塩基多型（ＳＮＰ）の集合も指す場合がある。

ハプロタイプデータ、同様に「相が特定されたデータ」または「順序づけられた遺伝子データ」とは、二倍体ゲノムまたは倍数体ゲノムの単一染色体、すなわち、二倍体ゲノムの染色体の分離された母系のコピーまたは父系のコピーのいずれかからのデータを指す。

相の特定（Ｐｈａｓｉｎｇ）とは、順序づけられていない、二倍体（または倍数性）遺伝子データを考慮して個体のハプロタイプ遺伝子データを決定する行為を指す。相の特定とは、１つの染色体上に見いだされる対立遺伝子の集合について、対立遺伝子の２つの遺伝子のどちらが、個体の２つの相同染色体のそれぞれと関連するかを決定する行為を指し得る。

相が特定されたデータとは、１個または複数個のハプロタイプが決定された遺伝子データを指す。

仮説とは、所与の染色体の集合における可能性のある倍数性状態または所与の遺伝子座の集合における可能性のある対立遺伝子の状態の集合を指す。可能性の集合は、１個または複数個のエレメントを含んでよい。

コピー数仮説、同様に「倍数性状態仮説」とは、個体の染色体のコピーの数に関する仮説を指す。これは、各染色体の起源となる親、および親の２つの染色体のどちらが個体に存在するかを含めた、染色体のそれぞれの同一性に関する仮説を指す場合もある。これは、もしあれば、関連する個体由来の染色体または染色体セグメントのいずれが、個体由来の所与の染色体に遺伝的に対応するかに関する仮説を指す場合もある。

標的個体とは、遺伝子の状態が決定される個体を指す。いくつかの実施形態では、限られた量のＤＮＡのみが標的個体から入手可能である。いくつかの実施形態では、標的個体は胎児である。いくつかの実施形態では、２体以上の標的個体が存在し得る。いくつかの実施形態では、一対の親から生まれた胎児をそれぞれ標的個体とみなすことができる。いくつかの実施形態では、決定される遺伝子データは、１つの対立遺伝子のコールまたは対立遺伝子のコールの集合である。いくつかの実施形態では、決定される遺伝子データは、倍数性コールである。

関連する個体とは、標的個体と遺伝的に関連する、したがって、標的個体とハプロタイプブロックを共有する任意の個体を指す。ある状況では、関連する個体は、標的個体の遺伝学的な親、または親に由来する任意の遺伝物質、例えば、精子、極体、胚、胎児または子であってよい。関連する個体とは、同胞、親または祖父母を指す場合もある。

同胞とは、遺伝学的な親が問題の個体と同じである任意の個体を指す。いくつかの実施形態では、同胞とは、生まれた子、胚もしくは胎児、または生まれた子、胚もしくは胎児に由来する１個または複数個の細胞を指し得る。同胞とは、親の一方を起源とする一倍体個体、例えば、精子、極体または任意の他のハプロタイプの遺伝物質の集合を指す場合もある。個体は、それ自体を同胞とみなすことができる。

胎児の（ｆｅｔａｌ）とは、「胎児の（ｏｆｔｈｅｆｅｔｕｓ）」、または「胎児と遺伝的に類似である胎盤の領域の（ｏｆｔｈｅｒｅｇｉｏｎｏｆｔｈｅｐｌａｃｅｎｔａｔｈａｔｉｓｇｅｎｅｔｉｃａｌｌｙｓｉｍｉｌａｒｔｏｔｈｅｆｅｔｕｓ）」を指す。妊娠中の女性では、胎盤の一部は胎児と遺伝的に類似であり、母系の血液中に見いだされる浮動性胎児ＤＮＡは、遺伝子型が胎児と一致する胎盤の部分を起源とし得る。胎児の染色体の半分の遺伝子情報は、胎児の母親から遺伝によって受け継がれることに留意されたい。いくつかの実施形態では、胎児の細胞に由来するこれらの母系的に遺伝によって受け継がれた染色体からのＤＮＡは、「母体起源の（ｏｆｍａｔｅｒｎａｌｏｒｉｇｉｎ）」ものではなく「胎児起源の（ｏｆｆｅｔａｌｏｒｉｇｉｎ）」ものと考えられる。

胎児起源のＤＮＡとは、元々は遺伝子型が基本的に胎児の遺伝子型と等しい細胞の一部であったＤＮＡを指す。

母体起源のＤＮＡとは、元々は遺伝子型が基本的に母親の遺伝子型と等しい細胞の一部であったＤＮＡを指す。

子とは、胚、割球または胎児を指し得る。ここで開示されている実施形態では、記載されている概念は、生まれた子、胎児、胚またはそれら由来の細胞の集合である個体に同等に良好に当てはまることに留意されたい。子という用語の使用は、単に子と称される個体が親の遺伝学的子孫であることを内包することを意味する。

親とは、個体の遺伝学的母親または父親を指す。個体は、一般には、２体の親、母親および父親を有するが、これは、例えば、遺伝子または染色体のキメラ現象において、必ずしもそうではない。親は個体とみなすことができる。

親の状況とは、標的の２体の親の一方または両方について、２つの関連性のある染色体のそれぞれにおける所与のＳＮＰの遺伝子の状態を指す。

所望の通り発生させる、同様に「正常に発生させる」とは、成長可能な胚を子宮内に着床させ、妊娠をもたらすこと、および／または、妊娠を継続し、出生をもたらすこと、および／または、生まれた子に染色体異常がないこと、および／または、生まれた子に他の望ましくない遺伝子の状態、例えば、疾患連鎖遺伝子がないことを指す。「所望の通り発生させる」という用語は、親または健康管理の補助者により所望され得るいかなるものも包含することを意味する。いくつかの場合には、「所望の通り発生させる」とは、医学的な研究または他の目的に有用である成長できない胚または成長可能な胚を指し得る。

子宮への挿入とは、インビトロでの受精との関連において胚を子宮腔に移入するプロセスを指す。

母系の血漿とは、妊娠中の女性由来の血液の血漿部分を指す。

臨床的決定とは、個体の健康または生存に影響を及ぼす転帰を有する措置を取るか取らないかの任意の決定を指す。出生前診断との関連において、臨床的決定とは、胎児を流産するか流産しないかの決定を指し得る。臨床的決定とは、さらなる検査を行うこと、望ましくない表現型を減ずるための措置を取ること、または異常を持つ子の誕生の準備をするための措置を取ることの決定を指す場合もある。

診断ボックスとは、本明細書に開示されている方法の１つまたは複数の態様を実施するために設計された１つの機械またはその機械の組み合わせを指す。ある実施形態では、診断ボックスは、患者をケアする所に置くことができる。ある実施形態では、診断ボックスにより、標的化増幅、その後の配列決定を実施することができる。ある実施形態では、診断ボックスは、単独で、または技師の補助で機能し得る。

インフォマティクスに基づく方法とは、大量のデータを解明するために、統計量に大きく依拠する方法を指す。出生前診断との関連において、インフォマティクスに基づく方法とは、１個または複数個の染色体における倍数性状態または１個または複数個の対立遺伝子における対立遺伝子の状態を、状態を直接物理的に測定することによってではなく、例えば、分子アレイまたは配列決定からの大量の遺伝子データを考慮して、最も可能性が高い状態を統計学的に推論することによって決定するために設計された方法を指す。本開示のある実施形態では、インフォマティクスに基づく技法は、本特許に開示されているものであってよい。本開示のある実施形態では、インフォマティクスに基づく技法はＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）であってよい。

一次遺伝子データとは、遺伝子型決定プラットフォームから出力されるアナログの強度シグナルを指す。ＳＮＰアレイとの関連において、一次遺伝子データとは、いかなる遺伝子型コールも行われる前の強度シグナルを指す。配列決定との関連において、一次遺伝子データとは、いかなる塩基対の同一性も決定される前、および配列がゲノムにマッピングされる前にシーケンサーから生じる、クロマトグラムと類似しているアナログ測定値を指す。

二次遺伝子データとは、遺伝子型決定プラットフォームから出力される加工された遺伝子データを指す。ＳＮＰアレイとの関連において、二次遺伝子データとは、ＳＮＰアレイリーダーに付随するソフトウェアによって行われる対立遺伝子コールを指し、該ソフトウェアにより、試料中に所与の対立遺伝子が存在するか存在しないかのコールが行われる。配列決定との関連において、二次遺伝子データとは、配列の塩基対の同一性が決定されることを指し、場合によっては、同様に、配列がゲノムにマッピングされたことを指す。

非侵襲的な出生前診断（ＮＰＤ）または、同様に「非侵襲的な出生前スクリーニング」（ＮＰＳ）とは、母親の血液中に見いだされる遺伝物質を用いて、母親が妊娠中の胎児の遺伝子の状態を決定する方法を指し、遺伝物質は、母親の静脈内血液を抜き取ることによって得る。

遺伝子座に対応するＤＮＡを優先的に富化すること、または遺伝子座におけるＤＮＡを優先的に富化することは、その遺伝子座に対応する富化後のＤＮＡ混合物中のＤＮＡ分子の百分率を、その遺伝子座に対応する富化前のＤＮＡ混合物中のＤＮＡ分子の百分率よりも高くする任意の方法を指す。前記方法は、遺伝子座に対応するＤＮＡ分子の選択的増幅を包含し得る。前記方法は、遺伝子座に対応しないＤＮＡ分子を除去するステップを包含し得る。前記方法は、方法の組み合わせを包含し得る。富化の程度は、その遺伝子座に対応する富化後の混合物におけるＤＮＡ分子の百分率を、その遺伝子座に対応する富化前の混合物におけるＤＮＡ分子の百分率で割ったものと定義される。優先的な富化は、複数の遺伝子座において行うことができる。本開示のいくつかの実施形態では、富化の程度は２０を超える。本開示のいくつかの実施形態では、富化の程度は２００を超える。本開示のいくつかの実施形態では、富化の程度は２，０００を超える。優先的な富化を複数の遺伝子座において行う場合、富化の程度とは、遺伝子座の集合内の全ての遺伝子座の平均の富化の程度を指し得る。

増幅とは、ＤＮＡ分子のコピーの数を増加させる方法を指す。

選択的な増幅とは、特定のＤＮＡ分子またはＤＮＡの特定の領域に対応するＤＮＡ分子のコピーの数を増加させる方法を指し得る。選択的な増幅とは、特定の標的のＤＮＡ分子または標的のＤＮＡの領域のコピーの数を、ＤＮＡの標識していない分子または領域を増大させるよりも増加させる方法を指す場合もある。選択的な増幅は、優先的に富化する方法であってよい。

ユニバーサルプライミング配列とは、標的ＤＮＡ分子の集団に、例えば、ライゲーション、ＰＣＲまたはライゲーション媒介性ＰＣＲによって付加することができるＤＮＡ配列を指す。標的分子の集団に付加した後、ユニバーサルプライミング配列に特異的なプライマーを用いて、増幅プライマーの単一の対を使用して標的集団を増幅することができる。ユニバーサルプライミング配列は、一般には、標的配列に関連しない。

ユニバーサルアダプタまたは「ライゲーションアダプタ」または「ライブラリータグ」
は、標的二本鎖ＤＮＡ分子の集団の５’末端および３’末端に共有結合的に連結することができるユニバーサルプライミング配列を含有するＤＮＡ分子である。アダプタを付加することにより、そこからＰＣＲ増幅を行うことができる標的集団の５’末端および３’末端にユニバーサルプライミング配列がもたらされ、標的集団由来の全ての分子を、増幅プライマーの単一の対を使用して増幅する。

標的化とは、ＤＮＡの混合物中の遺伝子座の集合に対応するＤＮＡ分子を選択的に増幅する、または別の方法で優先的に富化するために使用される方法を指す。

同時分布モデルとは、複数のランダムな変数に関して定義済みの事象の確率を、変数の確率が関連づけられている、同じ確率空間に対して定義済みの複数のランダムな変数を考慮して、定義するモデルを指す。いくつかの実施形態では、変数の確率が関連づけられていない退化事例を用いることができる。

ここで開示されている実施形態は、添付図を参照してさらに説明され、同様の構造はいくつかの概観を通じて同様の数字で参照される。示されている図は必ずしも一定の縮尺ではなく、概して、ここで開示されている実施形態の原理の例示が強調されている。

直接多重ｍｉｎｉ−ＰＣＲ法の模式図である。セミネステッドｍｉｎｉ−ＰＣＲ法の説明図である。完全ネステッドｍｉｎｉ−ＰＣＲ法の説明図である。ヘミネステッドｍｉｎｉ−ＰＣＲ法の説明図である。３重ヘミネステッドｍｉｎｉ−ＰＣＲ法の説明図である。片側ネステッドｍｉｎｉ−ＰＣＲ法の説明図である。片側ｍｉｎｉ−ＰＣＲ法の説明図である。逆セミネステッドｍｉｎｉ−ＰＣＲ法の説明図である。セミネステッド法のいくつかの可能性のあるワークフロー図である。ループライゲーションアダプタの説明図である。内部にタグを付けたプライマーの説明図である。内部のタグを有するいくつかのプライマーの例である。ライゲーションアダプタ結合領域を有するプライマーを使用する方法の説明図である。２つの異なる分析技法を用いた計数方法についてのシミュレートされた倍数性コールの正確度を示すグラフである。実験４の細胞系における複数のＳＮＰについての２個の対立遺伝子の比を示す図である。染色体により分けた、実験４の細胞系における複数のＳＮＰについての２つの対立遺伝子の比を示す図である。図１７Ａ〜Ｄは、染色体により分けた、４人の妊娠中の女性の血漿試料における複数のＳＮＰについての２個の対立遺伝子の比を示す図である。図１７Ａ〜Ｄは、染色体により分けた、４人の妊娠中の女性の血漿試料における複数のＳＮＰについての２個の対立遺伝子の比を示す図である。図１７Ａ〜Ｄは、染色体により分けた、４人の妊娠中の女性の血漿試料における複数のＳＮＰについての２個の対立遺伝子の比を示す図である。図１７Ａ〜Ｄは、染色体により分けた、４人の妊娠中の女性の血漿試料における複数のＳＮＰについての２個の対立遺伝子の比を示す図である。データ補正の前後の二項分散によって説明することができるデータの割合を示すグラフである。短いライブラリー調製プロトコール後の試料中の胎児ＤＮＡの相対的な富化を示すグラフである。リード深度に関し直接ＰＣＲとセミネステッド法を比較したグラフである。３種のゲノム試料の直接ＰＣＲのリード深度の比較を示すグラフである。３種の試料のセミネステッドｍｉｎｉ−ＰＣＲのリード深度の比較を示すグラフである。１，２００プレックス反応および９，６００プレックス反応のリード深度の比較を示すグラフである。６種の細胞について３つの染色体におけるリード数比率を示すグラフである。３種の染色体における、２つの３細胞反応についての、および１ｎｇのゲノムＤＮＡに対して行った第３の反応についての対立遺伝子の比を示す図である。３種の染色体における、２つの単一細胞反応についての対立遺伝子の比を示す図である。２種のプライマーライブラリーのそれぞれにより標的とされる特定のマイナー対立遺伝子頻度を有する遺伝子座の数を示す図である。図２８Ａ：ＰＣＲ産物の電気泳動のグラフである。図２８Ｂ〜２８Ｍは、図２８Ａ中のそれぞれのレーン１〜１２の電気泳動図である。図２８Ｂ〜２８Ｍは、図２８Ａ中のそれぞれのレーン１〜１２の電気泳動図である。図２８Ｂ〜２８Ｍは、図２８Ａ中のそれぞれのレーン１〜１２の電気泳動図である。図２９Ａ〜２９Ｅ：胎児の異数性の決定用の本発明の方法のイメージ表現である（図２９Ａ）。ハップマップデータベース由来の母系および父系遺伝子型データ（血液または頬スワブ由来）および乗換え頻度データを利用してそれぞれの可能な胎児倍数性状態に対する複数の独立仮説をインシリコにより生成する（図２９Ｂ）。これらの仮説のそれぞれを異なる可能な乗換え点を考慮に入れた副次的仮説を含むように拡張する。データモデルにより、それぞれの仮説上の胎児の遺伝子型および異なる胎児のｃｆＤＮＡ割合に対して、生成しそうな配列決定データが予測され（予測対立遺伝子分布）、実際の配列決定データと比較される（図２９Ｃ）。ベイズ統計学を使ってそれぞれの仮説に対する尤度が決定される。この仮説上の例で、最高尤度（正倍数性）を有する仮説が決定される（図２９Ｄ）。図２９Ｃのそれぞれのコピー数仮説ファミリー（モノソミー、ダイソミー、または三倍体性）の個別の尤度が合計される。最大尤度の仮説は、倍数性状態としてコールされ、胎児画分を明らかにし、試料特異的な計算精度（図２９Ｅ）を示す。図３０Ａ〜３０Ｈ：正倍数性（図３０Ａ〜３０Ｃ）、モノソミー（図３０Ｄ）、およびトリソミー（図３０Ｅ〜３０Ｈ）の代表的なグラフ表示である。全プロットでｘ軸は、それぞれの染色体（プロットの下部に示す）に沿った個別多形遺伝子座のリニア位置、およびｙ軸は、合計（Ａ＋Ｂ）対立遺伝子リード中の割合としてＡ対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるｙ軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がＡＡの母系遺伝子型を示し、青色がＢＢの母系遺伝子型を示し、緑色がＡＢの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がＡＡで胎児がＡＢである対立遺伝子の場合にＡＡ｜ＡＢのように、母系｜胎児の形式で表される。図３０Ａは、２個の染色体が存在し、胎児のｃｆＤＮＡ画分が０％である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、１（ＡＡ対立遺伝子）、０．５（ＡＢ対立遺伝子）、および０（ＢＢ対立遺伝子）を中心として分布する。図３０Ｂは、２個の染色体が存在し、胎児画分が１２％の場合に生成するプロットを示す。Ａ対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がｙ軸に沿って上下に移動する。そのために、バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．９４（ＡＡ｜ＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．４４（ＡＢ｜ＢＢ対立遺伝子）、０．０６（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心になる。図３０Ｃは、２個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。２本の赤色と２本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．８７（ＡＡ｜ＡＢ対立遺伝子）、０．６３（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．３７（ＡＢ｜ＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心となる。図３０Ｄは、１個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。１本の外側赤色および１本の外側青色周辺バンド、ならびに、２本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した（色は図には示されていない）。胎児は対立遺伝子リードに対し、単一対立遺伝子（ＡまたはＢ）のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、２本のバンドに圧縮される（色は図には示されていない）。バンドは、１（ＡＡ｜Ａ対立遺伝子）、０．５７（ＡＢ｜Ａ対立遺伝子）、０．４３（ＡＢ｜Ｂ対立遺伝子）、および０（ＢＢ｜Ｂ対立遺伝子）が中心である。図３０Ｅは、３個の染色体が存在し、胎児画分が２７％の場合に生成されたプロットである。２本の赤色および２本の青色周辺バンドならびに２本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８８（ＡＡ｜ＡＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．１２（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）を中心とする。図３０Ｆは、３個の染色体が存在し、胎児画分が１４％の場合に生成したプロットである。３本の赤色と３本の青色周辺バンド、ならびに２本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．９３（ＡＡ｜ＡＡＢ対立遺伝子）、０．８７（ＡＡ｜ＡＢＢ対立遺伝子）、０．６０（ＡＢ｜ＡＡＡ対立遺伝子）、０．５３（ＡＢ｜ＡＡＢ対立遺伝子）、０．４７（ＡＢ｜ＡＢＢ対立遺伝子）、０．４０（ＡＢ｜ＢＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＡＢ対立遺伝子）、０．０７（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｇは、３個の染色体が存在し、胎児画分が３５％の場合に生成されたプロットである。２本の赤色と２本の青色周辺バンドおよび４本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８５（ＡＡ｜ＡＡＢ対立遺伝子）、０．７２（ＡＢ｜ＡＡＡ対立遺伝子）、０．５７（ＡＢ｜ＡＡＢ対立遺伝子）、０．４３（ＡＢ｜ＡＢＢ対立遺伝子）、０．２８（ＡＢ｜ＢＢＢ対立遺伝子）、０．１５（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｈは、３個の染色体が存在し、胎児画分が２５％の場合に生成したプロットである。２本の赤色と２本の青色周辺バンド、ならびに、４本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。このパターンは、母系遺伝有糸分裂トリソミー（図３０Ｇのような）のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．７８（ＡＡ｜ＡＢＢ対立遺伝子）、０．６７（ＡＢ｜ＡＡＡ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．３３（ＡＢ｜ＢＢＢ対立遺伝子）、０．２２（ＢＢ｜ＡＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ａ〜３０Ｈ：正倍数性（図３０Ａ〜３０Ｃ）、モノソミー（図３０Ｄ）、およびトリソミー（図３０Ｅ〜３０Ｈ）の代表的なグラフ表示である。全プロットでｘ軸は、それぞれの染色体（プロットの下部に示す）に沿った個別多形遺伝子座のリニア位置、およびｙ軸は、合計（Ａ＋Ｂ）対立遺伝子リード中の割合としてＡ対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるｙ軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がＡＡの母系遺伝子型を示し、青色がＢＢの母系遺伝子型を示し、緑色がＡＢの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がＡＡで胎児がＡＢである対立遺伝子の場合にＡＡ｜ＡＢのように、母系｜胎児の形式で表される。図３０Ａは、２個の染色体が存在し、胎児のｃｆＤＮＡ画分が０％である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、１（ＡＡ対立遺伝子）、０．５（ＡＢ対立遺伝子）、および０（ＢＢ対立遺伝子）を中心として分布する。図３０Ｂは、２個の染色体が存在し、胎児画分が１２％の場合に生成するプロットを示す。Ａ対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がｙ軸に沿って上下に移動する。そのために、バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．９４（ＡＡ｜ＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．４４（ＡＢ｜ＢＢ対立遺伝子）、０．０６（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心になる。図３０Ｃは、２個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。２本の赤色と２本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．８７（ＡＡ｜ＡＢ対立遺伝子）、０．６３（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．３７（ＡＢ｜ＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心となる。図３０Ｄは、１個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。１本の外側赤色および１本の外側青色周辺バンド、ならびに、２本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した（色は図には示されていない）。胎児は対立遺伝子リードに対し、単一対立遺伝子（ＡまたはＢ）のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、２本のバンドに圧縮される（色は図には示されていない）。バンドは、１（ＡＡ｜Ａ対立遺伝子）、０．５７（ＡＢ｜Ａ対立遺伝子）、０．４３（ＡＢ｜Ｂ対立遺伝子）、および０（ＢＢ｜Ｂ対立遺伝子）が中心である。図３０Ｅは、３個の染色体が存在し、胎児画分が２７％の場合に生成されたプロットである。２本の赤色および２本の青色周辺バンドならびに２本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８８（ＡＡ｜ＡＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．１２（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）を中心とする。図３０Ｆは、３個の染色体が存在し、胎児画分が１４％の場合に生成したプロットである。３本の赤色と３本の青色周辺バンド、ならびに２本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．９３（ＡＡ｜ＡＡＢ対立遺伝子）、０．８７（ＡＡ｜ＡＢＢ対立遺伝子）、０．６０（ＡＢ｜ＡＡＡ対立遺伝子）、０．５３（ＡＢ｜ＡＡＢ対立遺伝子）、０．４７（ＡＢ｜ＡＢＢ対立遺伝子）、０．４０（ＡＢ｜ＢＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＡＢ対立遺伝子）、０．０７（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｇは、３個の染色体が存在し、胎児画分が３５％の場合に生成されたプロットである。２本の赤色と２本の青色周辺バンドおよび４本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８５（ＡＡ｜ＡＡＢ対立遺伝子）、０．７２（ＡＢ｜ＡＡＡ対立遺伝子）、０．５７（ＡＢ｜ＡＡＢ対立遺伝子）、０．４３（ＡＢ｜ＡＢＢ対立遺伝子）、０．２８（ＡＢ｜ＢＢＢ対立遺伝子）、０．１５（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｈは、３個の染色体が存在し、胎児画分が２５％の場合に生成したプロットである。２本の赤色と２本の青色周辺バンド、ならびに、４本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。このパターンは、母系遺伝有糸分裂トリソミー（図３０Ｇのような）のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．７８（ＡＡ｜ＡＢＢ対立遺伝子）、０．６７（ＡＢ｜ＡＡＡ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．３３（ＡＢ｜ＢＢＢ対立遺伝子）、０．２２（ＢＢ｜ＡＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ａ〜３０Ｈ：正倍数性（図３０Ａ〜３０Ｃ）、モノソミー（図３０Ｄ）、およびトリソミー（図３０Ｅ〜３０Ｈ）の代表的なグラフ表示である。全プロットでｘ軸は、それぞれの染色体（プロットの下部に示す）に沿った個別多形遺伝子座のリニア位置、およびｙ軸は、合計（Ａ＋Ｂ）対立遺伝子リード中の割合としてＡ対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるｙ軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がＡＡの母系遺伝子型を示し、青色がＢＢの母系遺伝子型を示し、緑色がＡＢの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がＡＡで胎児がＡＢである対立遺伝子の場合にＡＡ｜ＡＢのように、母系｜胎児の形式で表される。図３０Ａは、２個の染色体が存在し、胎児のｃｆＤＮＡ画分が０％である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、１（ＡＡ対立遺伝子）、０．５（ＡＢ対立遺伝子）、および０（ＢＢ対立遺伝子）を中心として分布する。図３０Ｂは、２個の染色体が存在し、胎児画分が１２％の場合に生成するプロットを示す。Ａ対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がｙ軸に沿って上下に移動する。そのために、バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．９４（ＡＡ｜ＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．４４（ＡＢ｜ＢＢ対立遺伝子）、０．０６（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心になる。図３０Ｃは、２個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。２本の赤色と２本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．８７（ＡＡ｜ＡＢ対立遺伝子）、０．６３（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．３７（ＡＢ｜ＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心となる。図３０Ｄは、１個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。１本の外側赤色および１本の外側青色周辺バンド、ならびに、２本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した（色は図には示されていない）。胎児は対立遺伝子リードに対し、単一対立遺伝子（ＡまたはＢ）のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、２本のバンドに圧縮される（色は図には示されていない）。バンドは、１（ＡＡ｜Ａ対立遺伝子）、０．５７（ＡＢ｜Ａ対立遺伝子）、０．４３（ＡＢ｜Ｂ対立遺伝子）、および０（ＢＢ｜Ｂ対立遺伝子）が中心である。図３０Ｅは、３個の染色体が存在し、胎児画分が２７％の場合に生成されたプロットである。２本の赤色および２本の青色周辺バンドならびに２本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８８（ＡＡ｜ＡＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．１２（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）を中心とする。図３０Ｆは、３個の染色体が存在し、胎児画分が１４％の場合に生成したプロットである。３本の赤色と３本の青色周辺バンド、ならびに２本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．９３（ＡＡ｜ＡＡＢ対立遺伝子）、０．８７（ＡＡ｜ＡＢＢ対立遺伝子）、０．６０（ＡＢ｜ＡＡＡ対立遺伝子）、０．５３（ＡＢ｜ＡＡＢ対立遺伝子）、０．４７（ＡＢ｜ＡＢＢ対立遺伝子）、０．４０（ＡＢ｜ＢＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＡＢ対立遺伝子）、０．０７（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｇは、３個の染色体が存在し、胎児画分が３５％の場合に生成されたプロットである。２本の赤色と２本の青色周辺バンドおよび４本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８５（ＡＡ｜ＡＡＢ対立遺伝子）、０．７２（ＡＢ｜ＡＡＡ対立遺伝子）、０．５７（ＡＢ｜ＡＡＢ対立遺伝子）、０．４３（ＡＢ｜ＡＢＢ対立遺伝子）、０．２８（ＡＢ｜ＢＢＢ対立遺伝子）、０．１５（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｈは、３個の染色体が存在し、胎児画分が２５％の場合に生成したプロットである。２本の赤色と２本の青色周辺バンド、ならびに、４本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。このパターンは、母系遺伝有糸分裂トリソミー（図３０Ｇのような）のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．７８（ＡＡ｜ＡＢＢ対立遺伝子）、０．６７（ＡＢ｜ＡＡＡ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．３３（ＡＢ｜ＢＢＢ対立遺伝子）、０．２２（ＢＢ｜ＡＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ａ〜３０Ｈ：正倍数性（図３０Ａ〜３０Ｃ）、モノソミー（図３０Ｄ）、およびトリソミー（図３０Ｅ〜３０Ｈ）の代表的なグラフ表示である。全プロットでｘ軸は、それぞれの染色体（プロットの下部に示す）に沿った個別多形遺伝子座のリニア位置、およびｙ軸は、合計（Ａ＋Ｂ）対立遺伝子リード中の割合としてＡ対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるｙ軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がＡＡの母系遺伝子型を示し、青色がＢＢの母系遺伝子型を示し、緑色がＡＢの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がＡＡで胎児がＡＢである対立遺伝子の場合にＡＡ｜ＡＢのように、母系｜胎児の形式で表される。図３０Ａは、２個の染色体が存在し、胎児のｃｆＤＮＡ画分が０％である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、１（ＡＡ対立遺伝子）、０．５（ＡＢ対立遺伝子）、および０（ＢＢ対立遺伝子）を中心として分布する。図３０Ｂは、２個の染色体が存在し、胎児画分が１２％の場合に生成するプロットを示す。Ａ対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がｙ軸に沿って上下に移動する。そのために、バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．９４（ＡＡ｜ＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．４４（ＡＢ｜ＢＢ対立遺伝子）、０．０６（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心になる。図３０Ｃは、２個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。２本の赤色と２本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡ対立遺伝子）、０．８７（ＡＡ｜ＡＢ対立遺伝子）、０．６３（ＡＢ｜ＡＡ対立遺伝子）、０．５０（ＡＢ｜ＡＢ対立遺伝子）、０．３７（ＡＢ｜ＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢ対立遺伝子）が中心となる。図３０Ｄは、１個の染色体が存在し、胎児画分が２６％の場合に生成したプロットを示す。１本の外側赤色および１本の外側青色周辺バンド、ならびに、２本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した（色は図には示されていない）。胎児は対立遺伝子リードに対し、単一対立遺伝子（ＡまたはＢ）のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、２本のバンドに圧縮される（色は図には示されていない）。バンドは、１（ＡＡ｜Ａ対立遺伝子）、０．５７（ＡＢ｜Ａ対立遺伝子）、０．４３（ＡＢ｜Ｂ対立遺伝子）、および０（ＢＢ｜Ｂ対立遺伝子）が中心である。図３０Ｅは、３個の染色体が存在し、胎児画分が２７％の場合に生成されたプロットである。２本の赤色および２本の青色周辺バンドならびに２本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８８（ＡＡ｜ＡＡＢ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．１２（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）を中心とする。図３０Ｆは、３個の染色体が存在し、胎児画分が１４％の場合に生成したプロットである。３本の赤色と３本の青色周辺バンド、ならびに２本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．９３（ＡＡ｜ＡＡＢ対立遺伝子）、０．８７（ＡＡ｜ＡＢＢ対立遺伝子）、０．６０（ＡＢ｜ＡＡＡ対立遺伝子）、０．５３（ＡＢ｜ＡＡＢ対立遺伝子）、０．４７（ＡＢ｜ＡＢＢ対立遺伝子）、０．４０（ＡＢ｜ＢＢＢ対立遺伝子）、０．１３（ＢＢ｜ＡＡＢ対立遺伝子）、０．０７（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｇは、３個の染色体が存在し、胎児画分が３５％の場合に生成されたプロットである。２本の赤色と２本の青色周辺バンドおよび４本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．８５（ＡＡ｜ＡＡＢ対立遺伝子）、０．７２（ＡＢ｜ＡＡＡ対立遺伝子）、０．５７（ＡＢ｜ＡＡＢ対立遺伝子）、０．４３（ＡＢ｜ＡＢＢ対立遺伝子）、０．２８（ＡＢ｜ＢＢＢ対立遺伝子）、０．１５（ＢＢ｜ＡＢＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３０Ｈは、３個の染色体が存在し、胎児画分が２５％の場合に生成したプロットである。２本の赤色と２本の青色周辺バンド、ならびに、４本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す（色は図には示されていない）。このパターンは、母系遺伝有糸分裂トリソミー（図３０Ｇのような）のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、１（ＡＡ｜ＡＡＡ対立遺伝子）、０．７８（ＡＡ｜ＡＢＢ対立遺伝子）、０．６７（ＡＢ｜ＡＡＡ対立遺伝子）、０．５６（ＡＢ｜ＡＡＢ対立遺伝子）、０．４４（ＡＢ｜ＡＢＢ対立遺伝子）、０．３３（ＡＢ｜ＢＢＢ対立遺伝子）、０．２２（ＢＢ｜ＡＡＢ対立遺伝子）、および０（ＢＢ｜ＢＢＢ対立遺伝子）が中心である。図３１：正倍数体（図３１Ａ）、Ｔ１３（図３１Ｂ）、Ｔ１８（図３１Ｃ）、Ｔ２１（図３１Ｄ）、４５、Ｘ（図３１Ｅ）、および４７、ＸＸＹ（図３１Ｆ）試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、ｘ軸は、それぞれの染色体に沿ったＳＮＰのリニア位置を表し、ｙ軸は、合計リードに対する割合で表したＡ対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一ＳＮＰ遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。図３１：正倍数体（図３１Ａ）、Ｔ１３（図３１Ｂ）、Ｔ１８（図３１Ｃ）、Ｔ２１（図３１Ｄ）、４５、Ｘ（図３１Ｅ）、および４７、ＸＸＹ（図３１Ｆ）試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、ｘ軸は、それぞれの染色体に沿ったＳＮＰのリニア位置を表し、ｙ軸は、合計リードに対する割合で表したＡ対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一ＳＮＰ遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。図３１：正倍数体（図３１Ａ）、Ｔ１３（図３１Ｂ）、Ｔ１８（図３１Ｃ）、Ｔ２１（図３１Ｄ）、４５、Ｘ（図３１Ｅ）、および４７、ＸＸＹ（図３１Ｆ）試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、ｘ軸は、それぞれの染色体に沿ったＳＮＰのリニア位置を表し、ｙ軸は、合計リードに対する割合で表したＡ対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一ＳＮＰ遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。図３１：正倍数体（図３１Ａ）、Ｔ１３（図３１Ｂ）、Ｔ１８（図３１Ｃ）、Ｔ２１（図３１Ｄ）、４５、Ｘ（図３１Ｅ）、および４７、ＸＸＹ（図３１Ｆ）試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、ｘ軸は、それぞれの染色体に沿ったＳＮＰのリニア位置を表し、ｙ軸は、合計リードに対する割合で表したＡ対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一ＳＮＰ遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。性染色体異数性による複合出生有病率は、常染色体異数性による場合より高いことを示すグラフである。

上記の図は、ここで開示されている実施形態がについて説明しているが、考察において言及されている通り、他の実施形態も意図されている。本開示は、例示により実施形態を代表として示しており、限定として示しているのではない。当業者は、ここで開示されている実施形態の原理の範囲および趣旨の範囲内に入る多数の他の改変および実施形態を考案することができる。

本発明は、一部は、プライマーライブラリー中の相対的に少数に過ぎないプライマーが多重ＰＣＲ反応中に形成される相当量の増幅プライマー二量体生成の原因である場合が多いという予期しない発見に基づいている。候補プライマーライブラリーから除去する目的で最も望ましくないプライマーを選択する方法が開発された。無視できる量（ＰＣＲ産物の約０．１％）までプライマー二量体の量を減らすことにより、これらの方法は、生成したプライマーライブラリーを使ってただ１回の多重ＰＣＲ反応で多数の標的遺伝子座を同時に増幅することを可能とする。プライマーは、標的遺伝子座にハイブリダイズし、他のプライマーにハイブリダイズして増幅されたプライマー二量体を形成することなく標的遺伝子座を増幅するので、増幅できる異なる標的遺伝子座の数が増加する。また、通常より低プライマー濃度およびかなり長いアニーリング時間を使うことにより、相互にハイブリダイズしてプライマー二量体を形成するのではなく、プライマーが標的遺伝子座にハイブリダイズする尤度が高まることも明らかになった。

ＰＣＲ増幅およびゲノム試料中の１９，４８８標的遺伝子座のシークエンシングの間に、これらの９９．４〜９９．７％のシークエンシングリードがゲノムにマップされ、９９．９９％が標的遺伝子座にマップされた。１０００万シークエンシングリードを有する血漿試料に対しては、通常、１９，４８８標的遺伝子座の内の少なくとも１９，３５０（９９．３％）が増幅され、配列決定された。このような多数の標的遺伝子座を一度に同時増幅できることにより、数千の標的遺伝子座の解析に必要な時間とＤＮＡの量を大幅に減らせる。例えば、インビトロ受精の前の胚由来の単一細胞の遺伝子検査または小量のＤＮＡを含む法医学試料の遺伝子検査などのＤＮＡの量が少ない用途で重要である数千の標的遺伝子座を同時に解析するために、単１細胞由来のＤＮＡで充分である。さらに、標的遺伝子座を複数の別の反応に試料を分割しないで１反応体積（例えば、１つの容器またはウェル）で解析できることにより、反応中に起こり得る変動を減らせる。さらに、前記方法は、参照基準を使用し、異なる標的遺伝子座の間で起こる得る増幅の偏りを補正するように開発されている。例えば、ＧＣ含量などの因子に起因する標的遺伝子座間の増幅効率の差異により、実際は同じ量で産生されるべき標的遺伝子座のＰＣＲ産物の量が、異なった量になってしまう場合がある。標的遺伝子座に類似の参照基準の使用により、このような増幅の偏りを検出して、それを標的遺伝子座の定量化の間に補正することができる。

ＰＣＲ産物のシークエンシング中に、プライマー二量体などのアーチファクトが検出され、その結果、標的増幅産物の検出を阻害する。この制限のために、ハイブリダイゼーションプローブを備えたマイクロアレイが検出用に使用される場合が多い。理由は、プライマー二量体の干渉に対する感度が低いためである。現状達成できる最小限の非標的増幅産物を含む高レベルの多重化により、マイクロアレイの代替としてＰＣＲとそれに引き続くシークエンシングが使用可能となる。

本発明の多重ＰＣＲ法は、多様な用途に使用可能である。例えば、遺伝子型分析、染色体異常（例えば、胎児染色体異数性）の検出、遺伝子変異および多型（例えば、一塩基多型、ＳＮＰ）分析、遺伝子欠失分析、父子鑑定、集団内の遺伝的差異分析、法医学分析、疾患に対する素因測定、ｍＲＮＡの定量分析、および感染病原体（例えば、細菌、寄生虫、およびウイルス）の検出と特定に使用可能である。また、多重ＰＣＲ法は、無侵襲的出生前遺伝学的検査、例えば、父子鑑定または胎児染色体異常の検出用にも使用できる。

代表的プライマー設計法
高度多重ＰＣＲにより、多くの場合、プライマー二量体形成などの非生産的な副反応がもたらす産物ＤＮＡが非常に高い割合で産生され得る。ある実施形態では、非生産的な副反応を引き起こす可能性が最も高い特定のプライマーを、プライマーライブラリーから除去して、ゲノムにマッピングされる増幅されたＤＮＡを高い割合でもたらすプライマーライブラリーを得ることができる。問題のあるプライマー、すなわち、特に二量体を安定させる可能性があるプライマーを除去するステップにより、予想外に、その後の配列決定による分析のための非常に高いＰＣＲ多重化レベルが可能になった。プライマー二量体および／または他の悪影響を及ぼす産物によって性能が著しく低下する配列決定などの系では、他に記載されている多重化よりも１０倍超、５０倍超、および１００倍超高度な多重化が実現された。これは、過剰なプライマー二量体が感知できるほど結果に影響を及ぼさないプローブに基づく検出方法、例えば、マイクロアレイ、ＴＡＱＭＡＮ、ＰＣＲとは対照的であることに留意されたい。当技術分野における一般的な考えでは、配列決定するための多重化ＰＣＲは、同じウェルでは約１００アッセイに限られることにも留意されたい。ＦｌｕｉｄｉｇｍおよびＲａｉｎＤａｎｃｅは、１つの試料について並行した反応で４８または１０００のＰＣＲアッセイを実施するためのプラットフォームを提供する。

非マッピングプライマー二量体または他の悪影響を及ぼすプライマー産物の量を最小限にしたライブラリーのためのプライマーを選択するためのいくつもの方法が存在する。経験的なデータにより、少数の「悪い」プライマーは大量の非マッピングプライマー二量体副反応に関与することが示されている。これらの「悪い」プライマーを除去することにより、標的の遺伝子座に対して位置を決めるシーケンスリードのパーセントを上昇させることができる。「悪い」プライマーを同定するための１つの方法は、標的化増幅によって増幅されたＤＮＡの配列決定データを調べることであり、最大の頻度で認められるプライマー二量体を除去して、ゲノムにマッピングされない副産物ＤＮＡをもたらす可能性が有意に低いプライマーライブラリーを生じることができる。種々のプライマーの組み合わせの結合エネルギーを算出することができる公的に入手可能なプログラムも存在し、結合エネルギーが最も高いプライマーの組み合わせを除去することにより、同様に、ゲノムにマッピングされない副産物ＤＮＡをもたらす可能性が有意に低いプライマーライブラリーが生じる。

プライマー選択のためのいくつかの実施形態では、初期の候補プライマーライブラリーは、候補標的遺伝子座に対する１個または複数個のプライマーまたはプライマー対を設計することにより作製される。候補標的遺伝子座（例えば、ＳＮＰ）の集合は、標的集団内のＳＮＰの頻度またはＳＮＰのヘテロ接合率などの標的遺伝子座の所望のパラメータに関する公的に入手可能な情報に基づいて選択できる。一実施形態では、ＰＣＲプライマーは、Ｐｒｉｍｅｒ３プログラム（ｐｒｉｍｅｒ３．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔのｗｏｒｌｄｗｉｄｅｗｅｂ；ｌｉｂｐｒｉｍｅｒ３ｒｅｌｅａｓｅ２．２．３、（参照によりその全体が本明細書に組み込まれる））を使って設計できる。必要に応じ、プライマーは、特定のアニーリング温度範囲内でアニールするように、特定の範囲のＧＣ含量となるように、特定のサイズ範囲に入るように、特定のサイズ範囲の標的増幅産物を産生するように、および／または他のパラメータ特性を有するように設計できる。候補標的遺伝子座当たり複数プライマーまたはプライマー対から出発することにより、ライブラリー中にほとんどのまたは全ての標的遺伝子座に対するプライマーまたはプライマー対が残る尤度を高める。一実施形態では、選択基準は、標的遺伝子座当たり少なくとも１個のプライマー対がライブラリー中に残ることが必要であるということであってもよい。そのようにして、最終プライマーライブラリーを使うことにより、ほとんどまたは全ての標的遺伝子座が増幅されるであろう。これは、欠失の選別またはゲノム中の多数の部位での複製または疾患または疾患の危険性の増加に関連する多数の配列（例えば、多型または他の変異）の選別などの用途にとって望ましい。ライブラリー由来のプライマー対が別のプライマー対により生成された標的増幅産物と重複する標的増幅産物を生成する場合には、プライマー対の片方をライブラリーから取り除き、干渉を防止できる。

いくつかの実施形態では、「アンデザイアラビリティスコア」（より高いスコアが最小の望ましさを表す）が、候補プライマーライブラリー由来の２個のプライマーのほとんどまたは全ての可能な組み合わせに対し計算（コンピュータによる計算等で）される。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の候補プライマーの少なくとも８０、９０、９５、９８、９９、または９９．５％の可能な組み合わせに対して計算される。それぞれのアンデザイアラビリティスコアは、２個の候補プライマー間の二量体形成の尤度に少なくとも一部基づいている。必要に応じ、アンデザイアラビリティスコアはまた、標的遺伝子座のヘテロ接合率、標的遺伝子座での配列（例えば、多型）に関連する有病率、標的遺伝子座での配列（例えば、多型）に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のＧＣ含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群から選択される１個または複数個の他のパラメータに基づいてもよい。複数の因子を考慮する場合、アンデザイアラビリティスコアは、種々のパラメータの加重平均に基づいて計算してもよい。パラメータは、プライマーが使われる特定の用途に対する重要性に基づいて異なる加重を割り付けることができる。いくつかの実施形態では、最高のアンデザイアラビリティスコアを有するプライマーは、ライブラリーから取り除かれる。取り除かれたプライマーが１つの標的遺伝子座にハイブリダイズするプライマー対のメンバーである場合、プライマー対のもう一方のメンバーもライブラリーから取り除くことができる。プライマーと取り除くプロセスは、必要に応じ繰り返すことができる。いくつかの実施形態では、ライブラリー中に残っている候補プライマーの組み合わせのアンデザイアラビリティスコアが全て最小閾値以下になるまでその選択方法が実行される。いくつかの実施形態では、その選択方法は、ライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで実行される。

種々の実施形態では、アンデザイアラビリティスコアが計算された後で、第１の最小閾値を超えるアンデザイアラビリティスコアを有する２個の候補プライマーの組み合わせのうち最多数のもののの一部である候補プライマーがライブラリーから取り除かれる。このステップは、第１の最小閾値以下の相互作用を無視する。理由は、これらの相互作用は、重要性が低いからである。取り除かれたプライマーが１つの標的遺伝子座にハイブリダイズするプライマー対のメンバーの場合は、プライマー対のもう一方のメンバーをライブラリーから取り除くことができる。プライマーを取り除くプロセスは、必要に応じ繰り返すことができる。いくつかの実施形態では、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て第１の最小閾値以下になるまでその選択方法が実行される。ライブラリー中に残っている候補プライマーの数が必要数より多い場合は、第１の最小閾値を第２の最小閾値に下げ、プライマーを取り除くプロセスを繰り返すことによりプライマーの数を減らすことができる。ライブラリー中に残っている候補プライマーの数が必要数より少ない場合は、第１の最小閾値をより大きい第２の最小閾値に増やし、ことにより、元の候補プライマーライブラリーを使ってプライマーを取り除くプロセスを繰り返し、それにより、より多くの候補プライマーをライブラリー中に残すことにより前記方法を継続できる。いくつかの実施形態では、ライブラリー中に残っている補プライマーの組み合わせのアンデザイアラビリティスコアが全て第２の最小閾値以下になるか、またはライブラリー中に残っている候補プライマーの数が所望の数に減るまでその選択方法が実行される。

必要に応じ、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対は、別の増幅反応に分割できる。多重ＰＣＲ増幅反応は、（重複する標的増幅産物のために分析から候補標的遺伝子座を除くのではなく）全ての候補標的遺伝子座を分析するのが望ましい用途への適用が好ましい場合もある。

これらの選択方法は、プライマー二量体の所望の低減を達成するためにライブラリーから取り除く必要のある候補プライマーの数を最小限化する。より少ない数の候補プライマーをライブラリーから取り除くことにより、得られたプライマーライブラリーを使ってより多くの（または全ての）標的遺伝子座を増幅できる。

多数のプライマーを多重化することにより、含めることができるアッセイにかなりの制約が課される。意図せずに相互作用するアッセイにより、偽の増幅産物がもたらされる。ｍｉｎｉＰＣＲのサイズの制約により、さらなる制約がもたらされ得る。ある実施形態では、非常に多数の潜在的なＳＮＰ標的（約５００から１００万超の間）で開始し、各ＳＮＰを増幅するためのプライマーを設計することを試みることが可能である。プライマーを設計することができる場合、可能性のあるプライマーの対の全ての間で偽のプライマー２重鎖が形成される尤度を、ＤＮＡ２重鎖形成についての公開された熱力学的なパラメータを使用して評価することによって、偽の産物を形成する可能性があるプライマー対を同定することを試みることが可能である。プライマー相互作用は、相互作用に関連するスコア関数によって順位づけ、所望のプライマーの数に見合うまで相互作用スコアが最も悪いプライマーを排除することができる。ヘテロ接合性の可能性があるＳＮＰが最も有用である場合には、同様にアッセイの一覧を順位付け、最もヘテロ接合性に適合するアッセイを選択することが可能である。実験により、相互作用スコアが高いプライマーが、プライマー二量体を形成する可能性が最も高いことが検証された。高度な多重化においては、全ての偽の相互作用を排除することは不可能であるが、インシリコで相互作用スコアが最も高いプライマーまたはプライマー対は、全体の反応の優位を占め、意図された標的からの増幅を著しく限定するので、これらを除去することが必須である。この手順を実施して、１０，０００プライマーにも達する、および、場合によってはそれを超える多重化プライマー集合を作製した。この手順による改善は、実質的なものであり、全てのＰＣＲ産物の配列決定によって決定された通り、最も悪いプライマーを除去しなかった反応からの１０％と比較して、標的産物の８０％超、９０％超、９５％超、９８％超、およびさらには９９％超の増幅を可能にする。以前に記載されている部分的なセミネステッド手法と組み合わせると、９０％超、および９５％超までもの増幅産物を標的の配列にマッピングすることができる。

どのＰＣＲプローブが二量体を形成する可能性があるかを決定するための他の方法が存在することに留意されたい。ある実施形態では、最適化されていないプライマーの集合を使用して増幅したＤＮＡのプールの分析が、問題のあるプライマーを決定するために十分であり得る。例えば、分析は配列決定を用いて行うことができ、最大の数で存在する二量体を、二量体を形成する可能性が最も高いものであると決定し、除去することができる。

この方法には、いくつもの潜在的な適用、例えば、ＳＮＰ遺伝子型決定、ヘテロ接合性率決定、コピー数測定、および他の標的化配列決定への適用がある。ある実施形態では、プライマーを設計する方法を、本文書の他の箇所に記載されているｍｉｎｉ−ＰＣＲ法と組み合わせて用いることができる。いくつかの実施形態では、プライマーの設計方法を、大規模な多重ＰＣＲ法の一部として用いることができる。

プライマーにタグを使用することにより、プライマー二量体産物の増幅および配列決定を減らすことができる。いくつかの実施形態では、プライマーは、タグを有するループ構造を形成する内部領域を含む。特定の実施形態では、プライマーは、標的遺伝子座に特異的な５’領域、標的遺伝子座に特異的ではないループ構造を形成する内部領域，および標的遺伝子座に特異的な３’領域を含む。いくつかの実施形態では、ループ領域は、２つの結合領域がテンプレートＤＮＡの近接または隣接領域に結合するように設計されている２つの結合領域の間に位置してもよい。種々の実施形態では、３’領域の長さは、少なくとも７ヌクレオチドである。いくつかの実施形態では、３’領域の長さは、７〜２０ヌクレオチドであり、例えば、７〜１５ヌクレオチド，または７〜１０ヌクレオチドである。種々の実施形態では、プライマーは、標的遺伝子座に特異的ではない５’領域（例えば、タグまたはユニバーサルプライマー結合部位）、続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的ではないループ構造を形成する内部領域，および標的遺伝子座に特異的な３’領域を含む。タグ−プライマーを用いて、必要な標的特異的配列を２０塩基対未満、１５塩基対未満、１２塩基対未満、さらには１０塩基対未満までに短縮することができる。これは、プライマー結合部位内で標的配列が断片化される場合に標準のプライマーの設計に伴って偶然発見され得る、または、または、プライマー設計へと企画することができる。この方法の利点としては、特定の最大の増幅産物の長さに対して設計することができるアッセイの数が増加すること、および「情報価値のない」プライマー配列の配列決定が短縮されることが挙げられる。前記方法は、内部のタグ付けと組み合わせて用いることもできる（本文書の他の箇所を参照されたい）。

ある実施形態では、多重標的ＰＣＲ増幅における非生産的な産物の相対量を、アニーリング温度を上昇させることによって減少させることができる。標的特異的プライマーと同じタグを有するライブラリーを増幅する場合には、タグがプライマー結合に寄与するので、アニーリング温度をゲノムＤＮＡと比較して増大させることができる。いくつかの実施形態では、以前報告されたものよりも相当低いプライマー濃度を用い、それと一緒に、他の箇所で報告されているものよりも長いアニーリング時間を用いる。いくつかの実施形態では、アニーリング時間は、３分超、５分超、８分超、１０分超、１５分超、２０分超、３０分超、６０分超、１２０分超、２４０分超、４８０分超、およびさらには９６０分超であってよい。ある実施形態では、以前の報告よりも長いアニーリング時間を用い、これにより、より低いプライマー濃度が可能になる。種々の実施形態では、例えば、３，５，８，１０，または１５分を超える通常より長い伸長時間が使われる。いくつかの実施形態では、プライマー濃度は、５０ｎＭ、２０ｎＭ、１０ｎＭ、５ｎＭ、１ｎＭ、および１μＭ未満までの低さである。驚いたことに、これにより、高度に多重化された反応、例えば、１，０００プレックス反応、２，０００プレックス反応、５，０００プレックス反応、１０，０００プレックス反応、２０，０００プレックス反応、５０，０００プレックス反応、およびさらには１００，０００プレックス反応に対して頑強な性能がもたらされる。ある実施形態では、増幅には、長いアニーリング時間で実行する１サイクル、２サイクル、３サイクル、４サイクルまたは５サイクルを用い、その後、タグを付けたプライマーを用いて通常のアニーリング回数より多いＰＣＲサイクルを行う。

標的場所を選択するために、候補となるプライマー対設計物のプールを用いて着手し、プライマー対間の潜在的に有害な相互作用の熱力学的モデルを作製し、次いで、このモデルを用いてプール内の他の設計物と適合しない設計物を排除することができる。

選択プロセス後、ライブラリー中に残っているプライマーは、本発明のいずれかの方法で使用できる。

代表的プライマーライブラリー
一態様では、本発明は、プライマー、例えば、候補プライマーライブラリーから本発明のいずれかの方法を使って選択されたプライマーのライブラリーを特徴とする。いくつかの実施形態では、ライブラリーは、１反応体積で、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズする（もしくは、同時にハイブリダイズ可能な）、または同時に増幅する（もしくは、同時に増幅可能な）プライマーを含む。種々の実施形態では、ライブラリーは、１，０００〜２，０００；２，０００〜５，０００；５，０００〜７，５００；７，５００〜１０，０００；１０，０００〜２０，０００；２０，０００〜２５，０００；２５，０００〜３０，０００；３０，０００〜４０，０００；４０，０００〜５０，０００；５０，０００〜７５，０００；７５，０００〜１００，０００個の異なる標的遺伝子座を１反応体積で同時に増幅する（もしくは、同時に増幅可能な）プライマーを含む。種々の実施形態では、ライブラリーは、１反応体積で、１，０００〜１００，０００個の異なる標的遺伝子座、例えば、１，０００〜５０，０００；１，０００〜３０，０００；１，０００〜２０，０００；１，０００〜１０，０００；２，０００〜３０，０００；２，０００〜２０，０００；２，０００〜１０，０００；５，０００〜３０，０００；５，０００〜２０，０００；または５，０００〜１０，０００個の異なる標的遺伝子座を同時に増幅する（もしくは、同時に増幅可能な）プライマーを含む。いくつかの実施形態では、ライブラリーは、標的遺伝子座を１反応体積で同時に増幅する（もしくは、同時に増幅可能な）プライマーを含み、それにより、増幅産物の６０、４０、３０、２０、１０、５、４、３、２、１、０．５、０．２５、０．１、または０．５％未満がプライマー二量体となる。種々の実施形態では、プライマー二量体増幅産物の量は、０．５〜６０％であり、例えば、０．１〜４０％，０．１〜２０％，０．２５〜２０％，０．２５〜１０％，０．５〜２０％，０．５〜１０％，１〜２０％，または１〜１０％である。いくつかの実施形態では、プライマーは、標的遺伝子座を１反応体積で同時に増幅し（もしくは、同時に増幅可能であり）、それにより、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の増幅産物が標的増幅産物である。種々の実施形態では、標的増幅産物である増幅産物の量は、５０〜９９．５％，例えば、６０〜９９％，７０〜９８％，８０〜９８％，９０〜９９．５％，または９５〜９９．５％である。いくつかの実施形態では、プライマーは、標的遺伝子座を１反応体積で同時に増幅し（もしくは、同時に増幅可能であり）、それにより、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的遺伝子座が増幅される。種々の実施形態では、増幅された標的遺伝子座の量は、５０〜９９．５％であり、例えば、６０〜９９％，７０〜９８％，８０〜９９％，９０〜９９．５％，９５〜９９．９％，または９８〜９９．９９％である。いくつかの実施形態では、プライマーライブラリーは、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個のプライマー対を含み、それぞれの対のプライマーは、フォワード試験プライマーおよびリバース試験プライマーを含み、それぞれの試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ異なる標的遺伝子座にハイブリダイズする少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。

種々の実施形態では、それぞれのプライマーの濃度は、１００、７５、５０、２５、２０、１０、５、２、もしくは１ｎＭ未満、または５００、１００、１０、もしくは１ｕＭ未満である。種々の実施形態では、それぞれのプライマーの濃度は、１ｕＭ〜１００ｎＭであり、例えば、１ｕＭ〜１ｎＭ，１〜７５ｎＭ，２〜５０ｎＭまたは５〜５０ｎＭである。種々の実施形態では、プライマーのＧＣ含量は、３０〜８０％であり、例えば、４０〜７０％，または５０〜６０％である。いくつかの実施形態では、プライマーのＧＣ含量の範囲は、３０、２０、１０、または５％未満である。いくつかの実施形態では、プライマーのＧＣ含量の範囲は、５〜３０％であり、例えば、５〜２０％または５〜１０％である。いくつかの実施形態では、試験プライマーの融解温度（Ｔ_ｍ）は、４０〜８０℃であり、例えば、５０〜７０℃，５５〜６５℃，または５７〜６０．５℃である。いくつかの実施形態では、Ｔ_ｍは、組込みＳａｎｔａＬｕｃｉａパラメータ（ｐｒｉｍｅｒ３．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔのｗｏｒｌｄｗｉｄｅｗｅｂ）を使ってｐｒｉｍｅｒ３プログラム（ｌｉｂｐｒｉｍｅｒ３ｒｅｌｅａｓｅ２．２．３）で計算される。いくつかの実施形態では、プライマーの融解温度の範囲は、１５、１０、５、３、または１℃未満である。いくつかの実施形態では、プライマーの融解温度の範囲は、１〜１５℃であり、例えば、１〜１０℃、１〜５℃、または１〜３℃である。いくつかの実施形態では、プライマーの長さは、１５〜１００ヌクレオチドであり、例えば、１５〜７５ヌクレオチド、１５〜４０ヌクレオチド、１７〜３５ヌクレオチド、１８〜３０ヌクレオチド、２０〜６５ヌクレオチドである。いくつかの実施形態では、プライマーの長さの範囲は、５０、４０、３０、２０、１０、または５ヌクレオチド未満である。いくつかの実施形態では、プライマーの長さの範囲は、５〜５０ヌクレオチドであり、例えば、５〜４０ヌクレオチド、５〜２０ヌクレオチド、または５〜１０ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さは、５０〜１００ヌクレオチドであり、例えば、６０〜８０ヌクレオチド、または６０〜７５ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、５０、２５、１５、１０、または５ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さの範囲は、５〜５０ヌクレオチドであり、例えば、５〜２５ヌクレオチド、５〜１５ヌクレオチド、または５〜１０ヌクレオチドである。

これらのプライマーライブラリーは、本発明のいずれかの方法で使用可能である。

代表的プライマーキット
一態様では、本発明は、本発明のいずれかのプライマーライブラリーを含むキット（例えば、核酸試料中の標的遺伝子座を増幅するキット）を特徴とする。いくつかの実施形態では、本開示で記載の方法を実現するために設計された複数のプライマーを含むキットを処方することができる。プライマーは、本明細書に開示されている外側のフォワードプライマーおよびリバースプライマー、内側のフォワードプライマーおよびリバースプライマーであってよく、プライマーの設計のセクションに開示されている通り、キット内の他のプライマーに対する結合親和性が低いように設計されたプライマーであってよく、関連するセクションに記載のとおりハイブリッド捕捉プローブまたは環状化前プローブであるかまたはそのいくつかの組み合わせであってよい。ある実施形態では、本明細書に開示されている方法で使用するために設計された、妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットであって、複数の内側のフォワードプライマー、および必要に応じて複数の内側のリバースプライマー、および必要に応じて、外側のフォワードプライマーおよび外側のリバースプライマーであって、該プライマーのそれぞれが、標的染色体および必要に応じて、さらに別の染色体上の標的部位（例えば、多型部位）のうちの１つのすぐ上流および／または下流のＤＮＡの領域とハイブリダイズするように設計されているプライマー、を含むキットを構築することができる。ある実施形態では、プライマーキットは、本文書の他の箇所に記載されている診断ボックスと組み合わせて用いることができる。いくつかの実施形態では、キットは、ライブラリーを使用して標的遺伝子座を増幅するための説明書を含む。

代表的多重ＰＣＲ法
一態様では、本発明は、核酸試料中の標的遺伝子座を増幅する方法を特徴とし、前記方法は、（ｉ）核酸試料を、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップ、および（ｉｉ）反応混合物をプライマー伸長反応条件（例えば、ＰＣＲ条件）に供し、標的増幅産物を含む増幅産物を生成するステップを含む。いくつかの実施形態では、前記方法はまた、少なくとも１種の標的増幅産物（例えば、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的増幅産物）の存在の有無を判定するステップも含む。いくつかの実施形態では、前記方法はまた、少なくとも１種の標的増幅産物（例えば、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的増幅産物）の配列を決定するステップも含む。いくつかの実施形態では、少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、または９９．５％の標的遺伝子座が増幅される。種々の実施形態では、６０、５０、４０、３０、２０、１０、５、４、３、２、１、０．５、０．２５、０．１、または０．０５％未満の増幅産物がプライマー二量体である。

ある実施形態では、本明細書に開示されている方法は、非常に効率的な高度多重標的ＰＣＲを使用して、ＤＮＡを増幅し、その後ハイスループット配列決定を行って各標的遺伝子座における対立遺伝子頻度を決定する。約５０または１００を超えるＰＣＲプライマーを１反応体積で、生じたシーケンスリードの大部分が、標的の遺伝子座にマッピングされるように多重化できることは、新規かつ非自明である。非常に効率的な様式で実施するための高度多重標的ＰＣＲを可能にする１つの技法は、互いとハイブリダイズする可能性が低いプライマーの設計を伴う。一般にはプライマーと称されるＰＣＲプローブは、少なくとも５００、少なくとも１，０００、少なくとも２，０００、少なくとも５，０００、少なくとも７，５００、少なくとも１０，０００、少なくとも２０，０００、少なくとも２５，０００、少なくとも３０，０００、少なくとも４０，０００、少なくとも５０，０００、少なくとも７５，０００、または少なくとも１００，０００の潜在的なプライマー対間の潜在的に有害な相互作用、または、プライマーと試料ＤＮＡの間の意図されたものではない相互作用の熱力学的モデルを作製し、次いで、このモデルを使用して、プール内の他の設計物と適合しない設計物を排除することによって選択する。非常に効率的な様式で実施するための高度多重標的ＰＣＲを可能にする別の技法は、部分的な、または完全なネスティング手法を用いて標的ＰＣＲを行うことである。これらの手法の１つまたはその組み合わせを用いることにより、単一のプール内の少なくとも３００個、少なくとも８００個、少なくとも１，２００個、少なくとも４，０００個または少なくとも１０，０００個のプライマーを多重化することが可能になり、生じた増幅されたＤＮＡは、配列決定すると、標的の遺伝子座にマッピングされる大多数のＤＮＡ分子を含む。これらの手法の１つまたはその組み合わせを用いることにより、単一のプール内の多数のプライマーを多重化することが可能になり、生じた増幅されたＤＮＡは、５０％超、６０％超、６７％超、８０％超、９０％超、９５％超、９６％超、９７％超、９８％超、９９％超、または９９．５％超の、標的の遺伝子座にマッピングされるＤＮＡ分子を含む。

いくつかの実施形態では、標的遺伝物質の検出は多重様式で行うことができる。並行して実行することができる遺伝子の標的配列の数は、１〜１０、１０〜１００、１００〜１，０００、１，０００〜１０，０００、１０，０００〜１００，０００、１００，０００〜１，０００，０００または１，０００，０００〜１０，０００，０００にわたり得る。プール当たり１００個超のプライマーを多重化するための以前の試みでは、プライマーの二量体形成などの望ましくない副反応を伴う重大な問題が生じた。

標的ＰＣＲ
いくつかの実施形態では、ＰＣＲを用いて、ゲノムの特定の場所を標的とすることができる。血漿試料において、元のＤＮＡは高度に断片化されている（一般には、５００ｂｐ未満、平均長２００ｂｐ未満）。ＰＣＲでは、増幅を可能にするために、フォワードプライマーとリバースプライマーの両方が同じ断片とアニーリングする。したがって、断片が短い場合、ＰＣＲアッセイでは、同様に比較的短い領域を増幅しなければならない。ＭＩＰＳのように、多型の位置がポリメラーゼ結合部位と近すぎると、異なる対立遺伝子からの増幅に偏りが生じる。現在、ＳＮＰを含有するものなどの多型領域を標的とするＰＣＲプライマーは、一般には、プライマーの３’末端が１個または複数個の多型の塩基のすぐ隣の塩基とハイブリダイズするように設計される。本開示のある実施形態では、フォワードＰＣＲプライマーおよびリバースＰＣＲプライマーの両方の３’末端が、標的の対立遺伝子の変異の位置（多型部位）と１つまたは少数の位置だけ離れている塩基とハイブリダイズするように設計する。多型部位（ＳＮＰまたは他の種類のもの）と、プライマーの３’末端がハイブリダイズするように設計された塩基との間の塩基の数は、１塩基であってよい、２塩基であってよい、３塩基であってよい、４塩基であってよい、５塩基であってよい、６塩基であってよい、７〜１０塩基であってよい、１１〜１５塩基であってよい、または、１６〜２０塩基であってよい。フォワードプライマーおよびリバースプライマーは、多型部位から離れた異なる数の塩基とハイブリダイズするように設計することができる。

ＰＣＲアッセイを多数生成することができるが、異なるＰＣＲアッセイ間の相互作用により、約１００アッセイを越えてそれらを多重化することが難しくなる。種々の複雑な分子的手法を用いて、多重化のレベルを上昇させることができるが、それでも反応当たり１００未満、おそらく２００、またはことによると５００アッセイに限られ得る。多量のＤＮＡを有する試料は、複数の副次反応に分割し、次いで配列決定の前に組み換えることができる。ＤＮＡ分子の全体的な試料または一部の亜集団のいずれかが限られている試料については、試料を分割することにより統計学的なノイズが導入されることになる。ある実施形態では、少ないまたは限られた量のＤＮＡとは、１０ｐｇ未満、１０ｐｇから１００ｐｇの間、１００ｐｇから１ｎｇの間、１ｎｇから１０ｎｇの間または１０ｎｇから１００ｎｇの間の量を指し得る。この方法は、複数のプールに分割するステップを包含する他の方法では確率論的ノイズの導入に関連する重大な問題が引き起こされ得る少量のＤＮＡに対して特に有用であるが、この方法は、いかなる量のＤＮＡの試料に対して実行された場合でも、偏りを最小化する利益をもたらすことに留意されたい。これらの状況では、ユニバーサル前増幅ステップを使用して、全体的な試料の量を増大させることができる。理想的には、この前増幅ステップでは、対立遺伝子分布を感知できるほどには変えるべきでない。

ある実施形態では、本開示の方法により、体液由来の単一細胞またはＤＮＡなどの限られた試料から、配列決定またはいくつかの他の遺伝子型決定方法によって遺伝子型決定するために、多数の標的の遺伝子座、詳細には１，０００〜５，０００の遺伝子座、５，０００〜１０，０００の遺伝子座、または１０，０００超の遺伝子座に特異的なＰＣＲ産物を生成することができる。現在、５超〜１０個の標的の多重ＰＣＲ反応を実施することにより、大きな課題が示され、多くの場合、プライマー副産物、例えば、プライマー二量体、および他のアーチファクトが妨害となる。ハイブリダイゼーションプローブを用いたマイクロアレイを使用して標的配列を検出する場合、プライマー二量体および他のアーチファクトは検出されないので、これらは無視することができる。しかし、検出の方法として配列決定を用いる場合、シーケンシングリードの大部分は、そのようなアーチファクトを配列決定し、試料中の所望の標的配列は配列決定しない。１反応体積において５０超または１００の反応を多重化し、その後に配列決定するために用いられる先行技術に記載の方法により、一般には２０％超、および多くの場合５０％超、多くの場合８０％超およびいくつかの場合には９０％超のオフターゲットのシーケンスリードがもたらされる。

一般に、試料における多数の（ｎ）標的（５０超、１００超、５００超または１，０００超）に対し標的化配列決定を実施するために、試料をいくつもの並行した反応物へと分割し、１つの個体標的を増幅することができる。これは、ＰＣＲ多ウェルプレートにおいて実施されている、または商業的なプラットフォーム、例えば、ＦＬＵＩＤＩＧＭＡＣＣＥＳＳＡＲＲＡＹ（マイクロ流体チップにおいて試料当たり４８の反応）またはＲＡＩＮＤＡＮＣＥＴＥＣＨＮＯＬＯＧＹからのＤＲＯＰＬＥＴＰＣＲ（１００〜数千もの標的）において実行することができる。残念ながら、これらのスプリットアンドプール（ｓｐｌｉｔ−ａｎｄ−ｐｏｏｌ）方法は、多くの場合、存在するゲノムのコピーが、各ウェル中にゲノムの各領域の１つのコピーが存在することを確実にするためには不十分であるので、ＤＮＡの量が限られている試料に対しては問題がある。これは、多型遺伝子座を標的とする場合に特に重大な問題であり、分割およびプールすることによって導入される確率論的ノイズにより、元のＤＮＡの試料に存在していた対立遺伝子の割合の非常に不十分に正確な測定が引き起こされるので、多型遺伝子座における対立遺伝子の相対的な割合が必要である。限られた量のＤＮＡのみが利用可能である場合に適用可能な、多くのＰＣＲ反応物を有効かつ効率的に増幅するための方法が本明細書に記載されている。ある実施形態では、単一細胞、体液、ＤＮＡの混合物、例えば、母系の血漿中に見いだされる浮動性ＤＮＡ、生検材料、環境試料および／または法医学試料を分析するために前記方法を適用することができる。

ある実施形態では、標的シークエンシングは、１つの、複数の、または全ての次のステップを含んでもよい。ａ）ＤＮＡ断片の両端にアダプタ配列を有するライブラリーを生成し、増幅する。ｂ）ライブラリー増幅後、複数反応に分割する。ｃ）ＤＮＡ断片の両端にアダプタ配列を有するライブラリーを生成し、任意選択で、増幅する。ｄ）標的当たり１個の標的特異的「フォワード」プライマーおよび１個のタグ特異的プライマーを使って、選択標的の１０００〜１０，０００プレックス増幅を行う。ｅ）「リバース」標的特異的プライマーおよび第１ラウンドで標的特異的フォワードプライマーの一部として導入されたユニバーサルタグ特異的１個（または２個以上）のプライマーを使ってこの産物から第２の増幅を行う。ｆ）限定サイクル数で選択標的の１０００プレックスプレ増殖を行う。ｇ）産物を複数分割量に分け、標的のサブプールを個別反応で増幅する（例えば、５０〜５００プレックス（この方法は、単一プレックスまでの任意プレックスで使用できる））。ｈ）並列サブプール反応の産物をプールする。ｉ）これらの増幅の間、プライマーは、シークエンシング適合性タグ（部分長または全長）を保持でき、それにより、産物をシークエンシングできる。

高度多重ＰＣＲ
本明細書には、血漿から得られるゲノムＤＮＡなどの核酸試料由来の１００〜数万をも超える標的配列（例えば、ＳＮＰ遺伝子座）の標的化増幅を可能にする方法が開示されている。増幅された試料は、プライマー二量体産物を比較的含まず、標的遺伝子座における対立遺伝子の偏りが少ない。増幅の間または増幅後に、産物に配列決定適合性アダプタを付加する場合、これらの産物の分析を配列決定によって実施することができる。

当技術分野で公知の方法を用いて高度多重ＰＣＲ増幅を実施することにより、所望の増幅産物が過剰であり、配列決定に適さないプライマー二量体産物が生成する。これらは、経験的に、これらの産物を形成するプライマーを排除することによって、またはプライマーのインシリコ選択を実施することによって減少させることができる。しかし、アッセイの数が多くなるほど、この問題はより困難になる。

１つの解法は、５，０００プレックス反応をいくつかの低プレックス増幅、例えば、１００回の５０プレックス反応または５０回の１００プレックス反応に分割すること、またはマイクロフルイディクスを使用すること、または、さらには、試料を個々のＰＣＲ反応に分割することである。しかし、妊娠血漿からの非侵襲的な出生前診断においてなど試料ＤＮＡが限られている場合は、多数の反応間に試料を分割することは、これによりボトルネッキングが生じるので、回避するべきである。

本明細書には、まず試料の血漿ＤＮＡを全体的に増幅し、次いで試料を、反応当たり、より中程度の数の標的配列を伴う複数の多重化標的富化反応に分割するための方法が記載されている。ある実施形態では、本開示の方法は、ＤＮＡ混合物を複数の遺伝子座で優先的に富化するために用いることができ、前記方法は以下のステップの１つまたは複数を含む：ＤＮＡの混合物からライブラリーを生成し、増幅するステップであって、ライブラリー内の分子がＤＮＡ断片の両末端にライゲーションされたアダプタ配列を有するステップ、増幅されたライブラリーを複数の反応に分割するステップ、選択された標的の多重増幅の第１ラウンドを、標的当たり１つの標的特異的「フォワード」プライマーおよび１個または複数個のアダプタ特異的なユニバーサル「リバース」プライマーを使用して実施するステップ。ある実施形態では、本開示の方法は、「リバース」標的特異的プライマー、および１個または複数個の、第１ラウンドにおいて標的特異的フォワードプライマーの一部として導入されたユニバーサルタグに特異的なプライマーを使用して第２の増幅を実施するステップをさらに含む。ある実施形態では、前記方法は、完全ネステッドＰＣＲ手法、ヘミネステッドＰＣＲ手法、セミネステッドＰＣＲ手法、片側完全ネステッドＰＣＲ手法、片側ヘミネステッドＰＣＲ手法または片側セミネステッドＰＣＲ手法を伴ってよい。ある実施形態では、ＤＮＡ混合物を複数の遺伝子座において優先的に富化するために本開示の方法を用い、前記方法は、選択された標的の多重化前増幅を、限られたサイクル数で実施するステップと、産物を複数の一定分量に分けるステップと、個々の反応における標的のサブプールを増幅するステップと、並行サブプール反応の産物をプールするステップとを含む。この手法は、５０〜５００遺伝子座について、５００〜５，０００遺伝子座について、５，０００〜５０，０００遺伝子座について、または、さらには５０，０００〜５００，０００遺伝子座について、対立遺伝子の偏りが低レベルになるように標的化増幅を実施するために用いることができることに留意されたい。ある実施形態では、プライマーは、部分長、または完全長の配列決定適合性タグを担持する。

ワークフローは、（１）血漿ＤＮＡなどのＤＮＡを抽出するステップと、（２）断片の両末端にユニバーサルアダプタを有する断片ライブラリーを調製するステップと、（３）ライブラリーを、アダプタに特異的なユニバーサルプライマーを使用して増幅するステップと、（４）増幅された試料「ライブラリー」を複数の一定分量に分けるステップと、（５）一定分量に対して多重化（例えば、標的当たり１つの標的特異的プライマーおよびタグ特異的プライマーを用いた約１００プレックス、１，０００または１０，０００プレックス）増幅を実施するステップと、（６）１つの試料の一定分量をプールするステップと、（７）試料についてバーコーディングを行うステップと、（８）試料を混合し、濃度を調整するステップと、（９）試料について配列決定するステップとを伴ってよい。ワークフローは、列挙されているステップのうちの１つを含有する複数のサブステップを含んでよい（例えば、ステップ（２）のライブラリーを調製するステップは、３つの酵素的ステップ（平滑末端化、ｄＡテーリングおよびアダプタライゲーション）および３つの精製ステップを伴ってよい）。ワークフローのステップは、組み合わせることができる、分けることができる、または異なる順序で実施することができる（例えば、試料のバーコーディングおよびプール）。

ライブラリーの増幅は、短い断片をより効率的に増幅することに偏りがあるように実施することができることに留意することが重要である。このように、より短い配列、例えば、モノヌクレオソームのＤＮＡ断片を妊娠中の女性の循環中に見いだされる無細胞の胎児ＤＮＡ（胎盤起源の）として優先的に増幅することが可能である。ＰＣＲアッセイは、タグ、例えば配列決定タグ（通常１５〜２５塩基の切断形態）を有してよいことに留意されたい。多重化した後、試料のＰＣＲ多重化産物をプールし、次いで、タグ特異的ＰＣＲによって（ライゲーションによって行うこともできる）タグ付けを完了する（バーコーディングを含む）。また、多重化として完全な配列決定タグを同じ反応に加えることができる。第１のサイクルでは、標的を、標的特異的プライマーを用いて増幅することができ、その後、タグ特異的プライマーが優勢になって完全なＳＱアダプタ配列を完成させる。ＰＣＲプライマーはタグを担持しなくてよい。配列決定タグはライゲーションによって増幅産物に付加することができる。

ある実施形態では、高度多重ＰＣＲ、その後クローン配列決定を用いて増幅された材料を評価することによって、胎児の異数性を検出などの種々の用途に使用することができる。従来の多重ＰＣＲでは最大で５０遺伝子座を同時に評価するが、本明細書に記載の手法を使用して、５０超の遺伝子座を同時に、１００超遺伝子座を同時に、５００超遺伝子座を同時に、１，０００超遺伝子座を同時に、５，０００超遺伝子座を同時に、１０，０００超遺伝子座を同時に、５０，０００超遺伝子座を同時に、および１００，０００超遺伝子座を同時に、同時評価することを可能にし得る。実験により、１０，０００まで、１０，０００を含めて、および１０，０００超の別個の遺伝子座を、単一反応において、十分に優良な効率および特異性で同時に評価して、非侵襲的な出生前異数性診断および／またはコピー数のコールを高い正確度で行うことができることが示された。アッセイは、単一反応において、母系の血漿から単離されたｃｆＤＮＡ試料などの試料全体、その画分またはｃｆＤＮＡ試料のさらに加工した誘導体と組み合わせることができる。試料（例えば、ｃｆＤＮＡまたは誘導体）は、複数の並行の多重反応に分割することもできる。最適な試料の分割および多重化を、種々の性能仕様のトレードオフによって決定する。材料の量が限られているので、試料を複数の画分に分割することにより、サンプリングノイズ、取扱い時間、およびエラーの可能性の増大がもたらされる可能性がある。逆に、高多重化の結果、偽の増幅の量が増え、増幅の不等性が増す可能性があり、どちらによっても検査性能が低下する。

本明細書に記載の方法の適用における２つの極めて重要な関連する考慮すべき事柄は、限られた量の元の試料（例えば、血漿）および対立遺伝子頻度または他の測定値を得る材料内の元の分子の数である。元の分子の数が特定のレベルを下回る場合、ランダムサンプリングノイズが著しくなり、検査の正確度に影響を及ぼす可能性がある。一般には、標的遺伝子座当たり５００〜１０００個の元の分子相当を含む試料に対して測定を行う場合、非侵襲的な出生前異数性診断を行うために十分な品質のデータを得ることができる。別個の測定値の数を増加させる、例えば、試料の体積を増加させるいくつもの方法が存在する。試料に適用される各操作によっても、潜在的に材料が損失する。検査の性能を低下させ得る損失を回避するために、種々の操作によって受けた損失を特徴付けること、および特定の操作を回避するまたは必要に応じてその収量を改善することが必須である。

ある実施形態では、元の試料（例えば、ｃｆＤＮＡ試料）の全てまたはある割合を増幅することによって、その後のステップにおける潜在的な損失を減ずることが可能である。試料中の遺伝物質の全てを増幅し、それにより下流の手順のために利用可能な量を増大させるために、種々の方法が利用可能である。ある実施形態では、ライゲーション媒介性ＰＣＲ（ＬＭ−ＰＣＲ）ＤＮＡ断片を、１つの別個のアダプタ、２つの別個のアダプタまたは多くの別個のアダプタのいずれかをライゲーションした後に、ＰＣＲによって増幅する。ある実施形態では、多置換増幅（ＭＤＡ）ｐｈｉ−２９ポリメラーゼを使用して、全てのＤＮＡを等温的に増幅する。ＤＯＰ−ＰＣＲおよびその変形では、ランダムプライミングを使用して元の材料ＤＮＡを増幅する。各方法は、特定の特性、例えば、代表的なゲノムの領域全てにわたる増幅の均一性、元のＤＮＡの捕捉および増幅の効率、および断片の長さに応じた増幅性能を有する。

ある実施形態では、ＬＭ−ＰＣＲを、３’チロシンを有する単一のヘテロ二本鎖アダプタと一緒に使用することができる。ヘテロ二本鎖アダプタにより、ＰＣＲの第１ラウンドの間に元のＤＮＡ断片の５’末端および３’末端上の２つの別個の配列に変換することができる単一のアダプタ分子を使用することが可能になる。ある実施形態では、サイズ分離によって増幅されたライブラリー、またはＡＭＰＵＲＥ、ＴＡＳＳ、もしくは他の同様の方法などの産物を分画することが可能である。ライゲーションの前に、試料ＤＮＡを平滑末端化し、次いで、単一のアデノシン塩基を３’末端に付加する。ライゲーションの前に、ＤＮＡを、制限酵素またはいくつかの他の切断方法を用いて切断することができる。ライゲーションの間、試料断片の３’アデノシンおよびアダプタの相補的な３’チロシンオーバーハングにより、ライゲーション効率が増強され得る。ＰＣＲ増幅の伸長ステップは、約２００ｂｐ、約３００ｂｐ、約４００ｂｐ、約５００ｂｐまたは約１，０００ｂｐより長い断片からの増幅を低下させるための時間の観点から、限られ得る。母系の血漿中に見いだされるより長いＤＮＡはほぼ排他的に母系であるので、これにより、胎児ＤＮＡの１０〜５０％の富化および検査性能の改善がもたらされ得る。市販のキットによって規定されている条件を用いていくつもの反応を実行し、試料ＤＮＡ分子の１０％未満の上首尾のライゲーションがもたらされた。これに対する反応条件の一連の最適化により、ライゲーションがおよそ７０％に改善された。

Ｍｉｎｉ−ＰＣＲ
下記のＭｉｎｉ−ＰＣＲ法は、ｃｆＤＮＡなどの短い核酸，消化核酸，またはフラグメント化核酸を含む試料に好適する。従来のＰＣＲアッセイ設計により、特徴的な胎児の分子の損失が大きいが、この損失は、ｍｉｎｉ−ＰＣＲアッセイと称される非常に短いＰＣＲアッセイを設計することによって著しく低下させることができる。母系の血清中の胎児のｃｆＤＮＡは高度に断片化されており、断片サイズはほぼガウス様式で分布しており、平均が１６０ｂｐであり、標準偏差が１５ｂｐであり、最小サイズが約１００ｂｐであり、最大サイズが約２２０ｂｐである。標的の多型に関する断片の開始位置および終了位置の分布は、必ずしもランダムではないが、個々の標的の間で、および集合的に全ての標的の間で広範に変動し、１つの特定の標的遺伝子座の多型部位は、その遺伝子座を起源とする種々の断片の中で開始から終了までの任意の位置を占有し得る。ｍｉｎｉ−ＰＣＲという用語は、さらなる制限または限定なく、通常のＰＣＲを等しく良好に指し得ることに留意されたい。

ＰＣＲの間、増幅はフォワードプライマー部位とリバースプライマー部位の両方を含む鋳型ＤＮＡ断片のみから起こる。胎児のｃｆＤＮＡ断片は短いので、両方のプライマー部位が存在する尤度であって、フォワードプライマー部位とリバースプライマー部位の両方を含む長さＬの胎児の断片の尤度は、増幅産物の長さと断片の長さの比である。理想的な条件下では、増幅産物が４５ｂｐ、５０ｂｐ、５５ｂｐ、６０ｂｐ、６５ｂｐまたは７０ｂｐであるアッセイにより、それぞれ、利用可能な鋳型断片分子の７２％、６９％、６６％、６３％、５９％または５６％から首尾よく増幅される。増幅産物の長さは、フォワードプライミング部位およびリバースプライミング部位の５’末端の間の距離である。当業者により一般に使用されるものよりも短い長さの増幅産物により、必要な短いシーケンスリードのみによる所望の多型遺伝子座のより効率的な測定がもたらされ得る。ある実施形態では、増幅産物の実質的な画分は１００ｂｐ未満、９０ｂｐ未満、８０ｂｐ未満、７０ｂｐ未満、６５ｂｐ未満、６０ｂｐ未満、５５ｂｐ未満、５０ｂｐ未満、または４５ｂｐ未満であるべきである。

先行技術で公知の方法において、本明細書に記載のものなどの短いアッセイは、必要ではなく、また、プライマーの設計に対して、プライマーの長さの限定、アニーリング特性、およびフォワードプライマーとリバースプライマーの間の距離によってかなりの制約を課すので、通常は回避されることに留意されたい。

いずれかのプライマーの３’末端が多型部位のおよそ１〜６塩基の範囲内である場合、増幅の偏りが潜在的に存在することにも留意されたい。最初にポリメラーゼが結合する部位におけるこの一塩基の差異により、一方の対立遺伝子の優先的な増幅がもたらされる可能性があり、これにより、観察される対立遺伝子頻度が変更され、性能が低下する可能性がある。これらの制約の全てにより、特定の遺伝子座を首尾よく増幅するプライマーを同定すること、およびそれに加えて、同じ多重化反応に適合するプライマーの大きな集合を設計することが非常に困難になる。ある実施形態では、内側のフォワードプライマーおよびリバースプライマーの３’末端を、多型部位の上流にあり、少数の塩基で多型部位から隔てられているＤＮＡの領域とハイブリダイズするように設計する。理想的には、塩基の数は６塩基から１０塩基の間であってよいが、同等に良好に、４塩基から１５塩基の間、３塩基から２０塩基の間、２塩基から３０塩基の間または１塩基から６０塩基の間であってよく、実質的に同じ結果が実現され得る。

多重ＰＣＲは、全ての標的が増幅される単回ラウンドのＰＣＲを伴ってよい、または、１ラウンドのＰＣＲ、その後の１または複数のラウンドのネステッドＰＣＲまたはネステッドＰＣＲのいくつかの変形を伴ってよい。ネステッドＰＣＲは、前のラウンドで使用されたプライマーよりも少なくとも１つの塩基対だけ内部に結合する１個または複数個の新しいプライマーを使用した、次の１または複数のラウンドのＰＣＲ増幅からなる。ネステッドＰＣＲにより、正確な内部の配列を有する前の反応からの増幅産物のみを、その後の反応において、増幅することによって偽の増幅標的の数が減少する。偽の増幅標的が減少することにより、特に配列決定において得ることができる有用な測定値の数が改善される。ネステッドＰＣＲは、一般には、前のプライマー結合部位よりも完全に内部のプライマーを設計することを伴い、必然的に、増幅のために必要な最小のＤＮＡセグメントサイズが増大する。ＤＮＡが高度に断片化されている母系の血漿ｃｆＤＮＡなどの試料については、より大きなアッセイサイズにより、測定値を得ることができる別個のｃｆＤＮＡ分子の数が減少する。ある実施形態では、この影響を相殺するために、第２ラウンドのプライマーの一方または両方が、いくつかの数の塩基を内部に伸長させている第１の結合部位とオーバーラップしている部分的なネスティング手法を用いて、全アッセイサイズの拡大を最小限にしながらさらに別の特異性を実現することができる。

ある実施形態では、ＰＣＲアッセイの多重プールを、潜在的にヘテロ接合性である１個または複数個の染色体上のＳＮＰまたは他の多型遺伝子座または非多型遺伝子座を増幅するように設計し、これらのアッセイを単一反応において用いてＤＮＡを増幅する。ＰＣＲアッセイの数は、５０回から２００回の間のＰＣＲアッセイ、２００回から１，０００回の間のＰＣＲアッセイ、１，０００回から５，０００回の間のＰＣＲアッセイまたは５，０００回から２０，０００回の間のＰＣＲアッセイ（５０〜２００プレックス、２００〜１，０００プレックス、１，０００〜５，０００プレックス、５，０００〜２０，０００プレックス、２０，０００超プレックスそれぞれ）であってよい。ある実施形態では、約１０，０００ＰＣＲアッセイ（１０，０００プレックス）の多重プールを、Ｘ染色体、Ｙ染色体、第１３染色体、第１８染色体、および第２１染色体および第１染色体または第２染色体上の潜在的にヘテロ接合性であるＳＮＰ遺伝子座を増幅するように設計し、これらのアッセイを単一反応において用いて、材料血漿試料、絨毛膜絨毛試料、羊水穿刺試料、単一または少数の細胞、他の体液または組織、がんまたは他の遺伝物質から得られたｃｆＤＮＡを増幅する。各遺伝子座のＳＮＰ頻度は、増幅産物の配列決定のクローンによる方法またはいくつかの他の方法によって決定することができる。対立遺伝子頻度分布の統計分析または全てのアッセイの比を使用して、試料が、検査に含まれる染色体のうちの１個または複数個のトリソミーを含有するかどうかを決定することができる。別の実施形態では、元のｃｆＤＮＡ試料を２つの試料に分割し、並行した５，０００プレックスアッセイを実施する。別の実施形態では、元のｃｆＤＮＡ試料をｎ個の試料に分割し、並行した（約１０，０００／ｎ）プレックスアッセイを実施し、ここでｎは、２から１２の間または１２から２４の間または２４から４８の間または４８から９６の間である。データを収集し、既に記載されているものと同様に分析する。この方法は、転座、欠失、重複、および他の染色体異常を検出することに同等に良好に適用可能であることに留意されたい。

ある実施形態では、標的ゲノムに対する相同性を有さない尾部をプライマーのいずれかの３’末端または５’末端に付加することもできる。これらの尾部により、その後の操作、手順または測定が容易になる。ある実施形態では、尾部配列は、標的特異的フォワードプライマーと標的特異的リバースプライマーに対して同じであってよい。ある実施形態では、標的特異的フォワードプライマーと標的特異的リバースプライマーのために異なる尾部を用いることができる。ある実施形態では、異なる遺伝子座または遺伝子座の集合に対して複数の異なる尾部を用いることができる。全ての遺伝子座の間で、または遺伝子座のサブセットの間で特定の尾部が共有されてよい。例えば、現行の配列決定プラットフォームのいずれかに必要なフォワード配列およびリバース配列に対応するフォワード尾部およびリバース尾部を用いて、増幅後の直接配列決定が可能になる。ある実施形態では、尾部を、全ての増幅された標的の間で、他の有用な配列を付加するために使用することができる一般的なプライミング部位として使用することができる。いくつかの実施形態では、内側のプライマーは、標的の遺伝子座（例えば、多型遺伝子座）の上流または下流のいずれかとハイブリダイズするように設計された領域を含有してよい。いくつかの実施形態では、プライマーは、分子バーコードを含有してよい。いくつかの実施形態では、プライマーは、ＰＣＲ増幅が可能になるように設計されたユニバーサルプライミング配列を含有してよい。

ある実施形態では、１０，０００プレックスＰＣＲアッセイプールを、フォワードプライマーおよびリバースプライマーが、ハイスループット配列決定計器、例えば、ＩＬＬＵＭＩＮＡから入手可能なＨＩＳＥＱ、ＧＡＩＩＸまたはＭＹＳＥＱに必要な所要のフォワード配列およびリバース配列に対応する尾部を有するように作製する。さらに、配列決定尾部に対して５’側には、その後のＰＣＲにおいて増幅産物にヌクレオチドバーコード配列を付加するためのプライミング部位として用いることができるさらに別の配列が含まれ、それにより、複数の試料をハイスループット配列決定計器の単一のレーンで多重化シークエンシングが可能になる。

ある実施形態では、１０，０００プレックスＰＣＲアッセイプールを、リバースプライマーが、ハイスループット配列決定計器に必要な所要のリバース配列に対応する尾部を有するように作製する。第１の１０，０００プレックスアッセイで増幅した後、その後のＰＣＲ増幅を、全ての標的に対して部分ネステッドフォワードプライマー（例えば、６塩基ネステッド）、および第１ラウンドに含まれたリバース配列決定尾部に対応するリバースプライマーを有する別の１０，０００プレックスプールを使用して実施することができる。この、ただ１つの標的特異的プライマーおよびユニバーサルプライマーを用いた部分ネステッド増幅の次のラウンドでは、アッセイに必要なサイズが限られ、サンプリングノイズが低下するが、偽の増幅産物の数が著しく減少する。配列決定タグを、付加したライゲーションアダプタに、および／またはＰＣＲプローブの一部として付加することができ、したがって、タグは最後の増幅産物の一部になる。

胎児画分は検査の性能に影響を及ぼす。母系の血漿中に見いだされるＤＮＡの胎児画分を富化するためのいくつもの方法が存在する。胎児画分は、既に考察されている上記のＬＭ−ＰＣＲ法によって、ならびに長い母系断片の標的化除去によって増大させることができる。ある実施形態では、標的遺伝子座の多重ＰＣＲ増幅の前に、追加の多重ＰＣＲ反応を行って、その後の多重ＰＣＲにおいて標的とされる遺伝子座に対応する長くて大きい母系断片を選択的に除去することができる。追加のプライマーを、無細胞の胎児ＤＮＡ断片の間に存在することが予想されるよりも多型からの距離が長い部位とアニーリングするように設計する。これらのプライマーは、標的多型遺伝子座の多重ＰＣＲの前の１サイクル多重ＰＣＲ反応において用いることができる。これらの遠位プライマーには、タグを付けたＤＮＡの小片の選択的な認識を可能にし得る分子または部分でタグ付けする。ある実施形態では、これらのＤＮＡの分子は、１サイクルのＰＣＲ後に、これらのプライマーを含む新しく形成された二本鎖ＤＮＡを除去することを可能にするビオチン分子を用いて共有結合的に修飾することができる。その第１ラウンドの間に形成された二本鎖ＤＮＡは、母体起源であるようである。ハイブリッド材料の除去は、磁性ストレプトアビジンビーズを使用することにより実現することができる。同等に良好に機能し得るタグ付けの他の方法が存在する。ある実施形態では、サイズ選択法を使って、例えば、約８００ｂｐ未満、約５００ｂｐ未満、または約３００ｂｐ未満のＤＮＡなどのより短鎖のＤＮＡのために試料を富化できる。次いで、短い断片の増幅を通常通り進める。

本開示に記載のｍｉｎｉ−ＰＣＲ法により、単一反応において、単一の試料から数百〜数千、またはさらに数百万もの遺伝子座の高度に多重化された増幅および分析が可能になる。同時に、増幅されたＤＮＡの検出を多重化することができ、バーコーディングＰＣＲを用いることによって、数十〜数百の試料を１つの配列決定レーンにおいて多重化することができる。この多重化検出は、最大４９プレックスまで首尾よく試験されており、はるかに高い程度の多重化が可能である。事実上、これにより、単回の配列決定の実行で、数百の試料について数千ものＳＮＰにおける遺伝子型決定することが可能になる。これらの試料について、前記方法により、遺伝子型およびヘテロ接合性率を決定すること、また、同時に、コピー数を決定することが可能になり、これらはどちらも異数性を検出するために用いることができる。この方法は、母系の血漿中に見いだされる浮動性ＤＮＡから妊娠中の胎児の異数性を検出することにおいて特に有用である。この方法は、胎児の性判別をし、かつ／または胎児の父系性を予測するための方法の一部として用いることができる。この方法は、変異量決定ための方法の一部として用いることができる。この方法は、任意の量のＤＮＡまたはＲＮＡに対して用いることができ、標的の領域はＳＮＰ、他の多型領域、非多型領域、およびそれらの組み合わせであってよい。

いくつかの実施形態では、断片化されたＤＮＡのライゲーション媒介性ユニバーサルＰＣＲ増幅を用いることができる。ライゲーション媒介性ユニバーサルＰＣＲ増幅を用いて、血漿ＤＮＡを増幅することができ、次いで、それを複数の並行した反応へと分割することができる。ライゲーション媒介性ユニバーサルＰＣＲ増幅は、短い断片を優先的に増幅し、それにより、胎児画分を富化するためにも用いることができる。いくつかの実施形態では、ライゲーションによって断片にタグを付加することにより、より短い断片を検出すること、プライマーのより短い標的配列特異的部分を使用すること、および／または非特異的な反応を減少させるより高温でアニーリングすることを可能にし得る。

本明細書に記載の方法は、ある量の混入ＤＮＡと混在している標的ＤＮＡの集合が存在する場合の、いくつもの目的のために用いることができる。いくつかの実施形態では、標的ＤＮＡおよび混入ＤＮＡは、遺伝的に関連する個体由来であってよい。例えば、胎児（標的）における遺伝子の異常は、胎児（標的）のＤＮＡおよび同様に母系の（混入）ＤＮＡを含有する母系の血漿から検出することができ、異常としては、全染色体異常（例えば、異数性）、部分的な染色体異常（例えば、欠失、重複、逆位、転座）、ポリヌクレオチド多型（例えば、ＳＴＲ）、一塩基多型、および／または他の遺伝子の異常または差異が挙げられる。いくつかの実施形態では、標的ＤＮＡおよび混入ＤＮＡは、同じ個体由来であってよいが、例えば、がんの場合には、標的ＤＮＡと混入ＤＮＡが１個または複数個の変異によって異なる (例えば、Ｈ．Ｍａｍｏｎｅｔａｌ．ＰｒｅｆｅｒｅｎｔｉａｌＡｍｐｌｉｆｉｃａｔｉｏｎｏｆＡｐｏｐｔｏｔｉｃＤＮＡｆｒｏｍＰｌａｓｍａ：ＰｏｔｅｎｔｉａｌｆｏｒＥｎｈａｎｃｉｎｇＤｅｔｅｃｔｉｏｎｏｆＭｉｎｏｒＤＮＡＡｌｔｅｒａｔｉｏｎｓｉｎＣｉｒｃｕｌａｔｉｎｇＤＮＡ．ＣｌｉｎｉｃａｌＣｈｅｍｉｓｔｒｙ５４：９（２００８）、を参照）。いくつかの実施形態では、ＤＮＡは、細胞培養物（アポトーシス性）上清中に見いだすことができる。いくつかの実施形態では、その後のライブラリーの調製、増幅および／または配列決定のために、生体試料（例えば、血液）においてアポトーシスを誘導することが可能である。この目的を実現するためのいくつもの可能となるワークフローおよびプロトコールが本開示の他の箇所に示されている。

いくつかの実施形態では、標的ＤＮＡは、単一細胞、標的ゲノムの１個に満たないコピーからなるＤＮＡ試料、小量のＤＮＡ、混合起源からのＤＮＡ（例えば、妊娠血漿：胎盤および母系ＤＮＡ；癌患者血漿および腫瘍：健康および癌ＤＮＡの混合物、移植片、など）、他の体液，細胞培養物、培養上清、法医学ＤＮＡ試料、古代ＤＮＡ試料（例えば、琥珀中に捕捉された昆虫），他のＤＮＡ試料、およびこれらの組み合わせ由来であってよい。

いくつかの実施形態では、短い増幅産物サイズを用いることができる。短い増幅産物サイズは、断片化されたＤＮＡに特に適している（例えば、Ａ．Ｓｉｋｏｒａら、Ｄｅｔｅｃｔｉｏｎｏｆｉｎｃｒｅａｓｅｄａｍｏｕｎｔｓｏｆｃｅｌｌ−ｆｒｅｅｆｅｔａｌＤＮＡｗｉｔｈｓｈｏｒｔＰＣＲａｍｐｌｉｃｏｎｓ．ＣｌｉｎＣｈｅｍ．２０１０年１月；５６巻（１号）：１３６〜８頁を参照されたい）。

短い増幅産物サイズを用いることにより、いくつかの重要な利益がもたらされ得る。短い増幅産物サイズにより、最適化された増幅効率がもたされ得る。短い増幅産物サイズにより、一般には、より短い産物が生じ、したがって、非特異的なプライミングの見込みは少ない。より短い産物は、クラスターがより小さくなるほど、配列決定フローセル上により高密度にクラスター化することができる。本明細書に記載の方法は、より長いＰＣＲ増幅産物に対して同等に良好に機能し得ることに留意されたい。増幅産物の長さは、必要であれば、例えば、より大きな配列の範囲について配列決定する場合には増大させることができる。ネステッドＰＣＲプロトコールの第１のステップとして１００ｂｐ〜２００ｂｐ長のアッセイを伴う１４６プレックス標的化増幅を用いた実験を、単一細胞およびゲノムＤＮＡに対して行い、陽性の結果を得た。

いくつかの実施形態では、本明細書に記載の方法を用いて、ＳＮＰ、コピー数、ヌクレオチドのメチル化、ｍＲＮＡのレベル、他の種類のＲＮＡの発現レベル、他の遺伝子の形体および／または後成的な形体を増幅し、かつ／または検出することができる。本明細書に記載のｍｉｎｉ−ＰＣＲ法は、次世代配列決定と一緒に用いることができ、前記方法は、他の下流の方法、例えば、マイクロアレイ、デジタルＰＣＲによる計数、リアルタイムＰＣＲ、質量分析などと一緒に用いることができる。

いくつかの実施形態では、本明細書に記載のｍｉｎｉ−ＰＣＲ増幅方法は、少数集団を正確に定量化するための方法の一部として用いることができる。前記方法は、スパイク較正物質を使用した絶対的定量化のために用いることができる。前記方法は、超ディープシーケンシングによる、変異／微量な対立遺伝子の定量化のために用いることができ、高度に多重化された様式で実行することができる。前記方法は、ヒト、動物、植物または他の生き物における近親者または祖先の標準の父系性および同一性検査のために用いることができる。前記方法は、法医学的試験のために用いることができる。前記方法は、任意の種類の材料、例えば、羊水およびＣＶＳ、精子、受胎産物（ＰＯＣ）に対する迅速な遺伝子型決定およびコピー数解析（ＣＮ）のために用いることができる。前記方法は、胚からの生検試料に対する遺伝子型決定などの単一細胞分析のために用いることができる。前記方法は、ｍｉｎ−ＰＣＲを用いた標的化配列決定による迅速な胚分析（生検から１日未満、１日、または２日以内）のために用いることができる。

いくつかの実施形態では、ｍｉｎｉ−ＰＣＲ増幅方法は、腫瘍分析に使用できる：腫瘍生検は、健康と腫瘍細胞の混合物であることが多い。標的ＰＣＲにより、近くにバックグラウンド配列がないＳＮＰおよび遺伝子座のディープシーケンシングが可能になる。前記方法は、腫瘍ＤＮＡに対するコピー数およびヘテロ接合性の損失の分析のために用いることができる。前記腫瘍ＤＮＡは、腫瘍患者の多くの異なる体液または組織に存在し得る。前記方法は、腫瘍の再発の検出および／または腫瘍スクリーニングのために用いることができる。前記方法は、種子の品質管理試験のために用いることができる。前記方法は、育種または漁業のために用いることができる。これらの方法はいずれも、倍数性コールのための非多型の遺伝子座の標的化に同等に良好に用いることができることに留意されたい。

本開示の基礎になるいくつかの基本的な方法を記載している一部の文献には、（１）ＷａｎｇＨＹ，ＬｕｏＭ，ＴｅｒｅｓｈｃｈｅｎｋｏＩＶ，ＦｒｉｋｋｅｒＤＭ，ＣｕｉＸ，ＬｉＪＹ，ＨｕＧ，ＣｈｕＹ，ＡｚａｒｏＭＡ，ＬｉｎＹ，ＳｈｅｎＬ，ＹａｎｇＱ，ＫａｍｂｏｕｒｉｓＭＥ，ＧａｏＲ，ＳｈｉｈＷ，ＬｉＨ．ＧｅｎｏｍｅＲｅｓ．２００５Ｆｅｂ；１５（２）：２７６−８３．ＤｅｐａｒｔｍｅｎｔｏｆＭｏｌｅｃｕｌａｒＧｅｎｅｔｉｃｓ，ＭｉｃｒｏｂｉｏｌｏｇｙａｎｄＩｍｍｕｎｏｌｏｇｙ／ＴｈｅＣａｎｃｅｒＩｎｓｔｉｔｕｔｅｏｆＮｅｗＪｅｒｓｅｙ，ＲｏｂｅｒｔＷｏｏｄＪｏｈｎｓｏｎＭｅｄｉｃａｌＳｃｈｏｏｌ，ＮｅｗＢｒｕｎｓｗｉｃｋ，ＮｅｗＪｅｒｓｅｙ０８９０３，ＵＳＡ．（２）Ｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔｇｅｎｏｔｙｐｉｎｇｏｆｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍｓｗｉｔｈｈｉｇｈｓｅｎｓｉｔｉｖｉｔｙ．ＬｉＨ，ＷａｎｇＨＹ，ＣｕｉＸ，ＬｕｏＭ，ＨｕＧ，ＧｒｅｅｎａｗａｌｔＤＭ，ＴｅｒｅｓｈｃｈｅｎｋｏＩＶ，ＬｉＪＹ，ＣｈｕＹ，ＧａｏＲ．ＭｅｔｈｏｄｓＭｏｌＢｉｏｌ．２００７；３９６−ＰｕｂＭｅｄＰＭＩＤ：１８０２５６９９．（３）ＮｅｓｔｅｄＰａｔｃｈＰＣＲｅｎａｂｌｅｓｈｉｇｈｌｙｍｕｌｔｉｐｌｅｘｅｄｍｕｔａｔｉｏｎｄｉｓｃｏｖｅｒｙｉｎｃａｎｄｉｄａｔｅｇｅｎｅｓ．ＶａｒｌｅｙＫＥ，ＭｉｔｒａＲＤ．ＧｅｎｏｍｅＲｅｓ．２００８Ｎｏｖ；１８（１１）：１８４４−５０．Ｅｐｕｂ２００８Ｏｃｔ１０（この文献にはシーケンシング用の平均９種のアッセイの多重化を含む方法が記載されている）、が含まれる。本明細書に開示されている方法により、上記の参考文献におけるものよりも桁の大きい多重化が可能になることに留意されたい。

標的ＰＣＲの変形物−ネスティング
ＰＣＲを行う場合に可能である多くのワークフローが存在し、本明細書に開示されている方法に典型的ないくつかのワークフローが記載されている。本明細書において概説されているステップは、他の可能性のあるステップを排除することを意図しておらず、かつ、方法が適正に機能するために本明細書に記載のステップいずれかが必要であることも意味しない。多数のパラメータの変形または他の改変が文献において公知であり、本発明の核心に影響を及ぼすことなく行うことができる。１つの特定の一般的なワークフローが下に示され、その後にいくつもの可能性のある変形物（ｖａｒｉａｎｔ）が続く。変形物とは、一般には、可能性のある二次ＰＣＲ反応、例えば、行うことができる異なる種類のネスティング（ステップ３）を指す。変形物は、本明細書に明確に記載されているものと違う時間において、または異なる順序で行うことができることに留意することが重要である。説明のために多形遺伝子座を使用している例は、必要に応じ、非多形遺伝子座の増幅に容易に適合させることができる。
１．試料中のＤＮＡには、多くの場合ライブラリータグまたはライゲーションアダプタタグ（ＬＴ）と称されるライゲーションアダプタを付加することができ、ライゲーションアダプタはユニバーサルプライミング配列を含有し、その後にユニバーサル増幅が続く。ある実施形態では、これは、断片化後に、配列決定ライブラリーを作製するために設計された標準のプロトコールを使用して行うことができる。ある実施形態では、ＤＮＡ試料を平滑末端化し、次いで、Ａを３’末端に付加することができる。Ｔ−オーバーハングを有するＹ−アダプタを付加し、ライゲーションすることができる。いくつかの実施形態では、ＡまたはＴオーバーハング以外の他の粘着末端を使用することができる。いくつかの実施形態では、他のアダプタ、例えば、ループライゲーションアダプタを付加することができる。いくつかの実施形態では、アダプタは、ＰＣＲ増幅のために設計されたタグを有してよい。
２．特異的標的増幅（ＳＴＡ）：数百、数千、数万、さらには数十万もの標的を１反応体積において前増幅で多重化することができる。ＳＴＡは、一般には、１０〜３０サイクル実行されるが、５〜４０サイクル、２〜５０サイクル、およびさらには１〜１００サイクル実行することができる。例えば、より単純なワークフローのため、または大部分の二量体の配列決定を回避するために、プライマーに尾部を付けることができる。一般には、同じタグを保有する両方のプライマーの二量体は効率的に増幅または配列決定されないことに留意されたい。いくつかの実施形態では、１サイクルから１０サイクルの間のＰＣＲを行うことができ、いくつかの実施形態では、１０サイクルから２０サイクルの間のＰＣＲを行うことができ、いくつかの実施形態では、２０サイクルから３０サイクルの間のＰＣＲを行うことができ、いくつかの実施形態では、３０サイクルから４０サイクルの間のＰＣＲを行うことができ、いくつかの実施形態では、４０サイクル超のＰＣＲを行うことができる。増幅は、線形増幅であってよい。ＰＣＲサイクルの数を最適化して、最適なリード深度（ＤＯＲ）プロファイルをもたらすことができる。異なるＤＯＲプロファイルは異なる目的のために望ましい場合がある。いいくつかの実施形態では、全てのアッセイ間のリードのより均一な分布が望ましい；いくつかのアッセイについてＤＯＲが非常に小さい場合、データが非常に有用であるためには確率論的ノイズが高すぎる可能性があるが、リード深度が非常に深い場合、各追加のリードの限界有用性は比較的小さい。
プライマー尾部により、普遍的にタグを付けたライブラリーからの断片化されたＤＮＡの検出を改善することができる。ライブラリータグおよびプライマー尾部が相同な配列を含有する場合、ハイブリダイゼーションを改善することができ（例えば、融解温度（Ｔ_Ｍ）を下げる）、プライマー標的配列の一部が試料のＤＮＡ断片内にある場合にのみ、プライマーを伸長することができる。いくつかの実施形態では、１３以上の標的特異的塩基対を用いることができる。いくつかの実施形態では、１０〜１２の標的特異的塩基対を用いることができる。いくつかの実施形態では、８〜９の標的特異的塩基対を用いることができる。いくつかの実施形態では、６〜７の標的特異的塩基対を用いることができる。いくつかの実施形態では、ＳＴＡは、前増幅されたＤＮＡ、例えば、ＭＤＡ、ＲＣＡ、他の全ゲノム増幅またはアダプタ−媒介性ユニバーサルＰＣＲに対して実施することができる。いくつかの実施形態では、ＳＴＡは、例えば、サイズ選択、標的捕捉、指向性分解によって特定の配列および集団が富化された、または枯渇した試料に対して実施することができる。
３．いくつかの実施形態では、二次的な多重ＰＣＲまたはプライマー伸長反応を実施して、特異性を増大させ、望ましくない産物を減少させることが可能である。例えば、完全なネスティング、セミネスティング、ヘミネスティング、および／またはより小さなアッセイプールの並行した反応への細分化は、全て、特異性を増大させるために用いることができる技法である。実験により、試料を３回の４００プレックス反応に分割することにより、正確に同じプライマーを用いた１回の１，２００プレックス反応よりも高い特異性で産物ＤＮＡがもたらされることが示された。同様に、実験により、試料を４回の２，４００プレックス反応に分割することにより、正確に同じプライマーを用いた１回の９，６００プレックス反応よりも高い特異性で産物ＤＮＡがもたらされることが示された。ある実施形態では、同じ方向性および反対の方向性の標的特異的プライマーおよびタグ特異的プライマーを用いることが可能である。
４．いくつかの実施形態では、ＳＴＡ反応によって産生されるＤＮＡ試料（希釈、精製またはその他）をタグ特異的プライマーおよび「ユニバーサル増幅」を用いて増幅すること、すなわち、前増幅し、タグを付けた標的の多くまたは全てを増幅することが可能である。プライマーは、ハイスループット配列決定プラットフォームにおける配列決定に必要な追加の機能的な配列、例えば、バーコードまたは完全なアダプタ配列を含有してよい。

これらの方法は、任意のＤＮＡの試料を分析するために用いることができ、ＤＮＡの試料が特に少ない場合、または、それが、ＤＮＡが２つ以上の個体を起源とするＤＮＡの試料である場合、例えば、母系の血漿の場合に特に有用である。これらの方法は、単一または少数の細胞、ゲノムＤＮＡ、血漿ＤＮＡ、増幅された血漿ライブラリー、増幅されたアポトーシス性の上清ライブラリーまたは他の混合ＤＮＡの試料などのＤＮＡ試料に対して用いることができる。ある実施形態では、これらの方法は、遺伝子の構成が異なる細胞が、単一の個体に存在する可能性がある場合、例えば、がんまたは移植片に用いることができる。

プロトコールの変形物（上記のワークフローに対する変形物および／または追加物）
直接多重ｍｉｎｉ−ＰＣＲ：タグを付けたプライマーを用いた複数の標的配列の特異的標的増幅（ＳＴＡ）が図１に示されている。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、ＰＣＲプライマーがハイブリダイズした、ユニバーサル増幅された一本鎖ＤＮＡを示す。１０４は、最終のＰＣＲ産物を示す。いくつかの実施形態では、ＳＴＡは、１００超、２００超、５００超、１，０００超、２，０００超、５，０００超、１０，０００超、２０，０００超、５０，０００超、１００，０００超、または２００，０００超の標的に対して行うことができる。その後の反応において、タグ特異的プライマーにより全ての標的配列を増幅し、サンプリングインデックスを含めた、配列決定するために必要な全ての配列を含むタグを伸長する。ある実施形態では、プライマーにタグ付けしなくてよい、または特定のプライマーのみにタグを付けてよい。シーケンシングアダプタは、従来のアダプタライゲーションによって付加することができる。ある実施形態では、最初のプライマーはタグを担持してよい。

ある実施形態では、プライマーを、増幅されるＤＮＡの長さが予想外に短くなるように設計する。先行技術により、当業者が一般には、１００＋ｂｐの増幅産物を設計することが実証されている。ある実施形態では、増幅産物を、８０ｂｐ未満になるように設計することができる。ある実施形態では、増幅産物を、７０ｂｐ未満になるように設計することができる。ある実施形態では、増幅産物を、６０ｂｐ未満になるように設計することができる。ある実施形態では、増幅産物を、５０ｂｐ未満になるように設計することができる。ある実施形態では、増幅産物を、４５ｂｐ未満になるように設計することができる。ある実施形態では、増幅産物を、４０ｂｐ未満になるように設計することができる。ある実施形態では、増幅産物を、３５ｂｐ未満になるように設計することができる。ある実施形態では、増幅産物を、４０ｂｐから６５ｂｐの間になるように設計することができる。

実験を、このプロトコールを使用して、１２００プレックス増幅を用いて実施した。ゲノムＤＮＡと妊娠血漿の両方を使用した；シーケンスリードの約７０％が標的の配列にマッピングされた。詳細は本文書の他の箇所に示されている。アッセイの設計および選択を伴わない１０４２プレックスの配列決定により、配列の＞９９％がプライマー二量体産物となった。

逐次的なＰＣＲ：ＳＴＡ１の後、産物の複数の一定分量を、同じプライマーを有する複雑さが低下したプールを用いて並行して増幅することができる。第１の増幅により、分割するために十分な材料が生じ得る。この方法は、少ない試料、例えば、約６〜１００ｐｇ、約１００ｐｇ〜１ｎｇ、約１ｎｇ〜１０ｎｇまたは約１０ｎｇ〜１００ｎｇの試料に対して特に優良である。１２００プレックスを３回の４００プレックスにしたプロトコールを実施した。シーケンシングリードのマッピングは、１２００プレックス単独における約６０〜７０％から９５％超まで増大した。

セミネステッドｍｉｎｉ−ＰＣＲ：（図２参照）ＳＴＡ１の後、内側のネステッドフォワードプライマー（１０３Ｂ、１０５ｂ）の多重のセットおよび１つ（または少数）のタグ特異的リバースプライマー（１０３Ａ）で構成される第２のＳＴＡを実施する。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、フォワードプライマーＢおよびリバースプライマーＡがハイブリダイズした、ユニバーサル増幅された一本鎖ＤＮＡを示す。１０４は、１０３からのＰＣＲ産物を示す。１０５は、ハイブリダイズしたネステッドフォワードプライマーｂ、および既に１０３と１０４の間に生じたＰＣＲからの分子の一部であるリバースタグＡを有する１０４からの産物を示す。１０６は、最終のＰＣＲ産物を示す。このワークフローを用いると、通常、配列の９５％超が意図された標的にマッピングされる。ネステッドプライマーは外側のフォワードプライマー配列とオーバーラップしてよいが、追加の３’末端塩基を導入する。いくつかの実施形態では、１から２０個の間の余分の３’塩基を用いることが可能である。実験により、１２００プレックス設計物において９個以上の余分の３’塩基を用いると良好に機能することが示された。

完全ネステッドｍｉｎｉ−ＰＣＲ：（図３参照）ＳＴＡステップ１の後、第２の多重ＰＣＲ（または複雑さが低下した並行のｍ．ｐ．ＰＣＲ）を、タグ（Ａ、ａ、Ｂ、ｂ）を保有する２つのネステッドプライマーを用いて実施することが可能である。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、フォワードプライマーＢおよびリバースプライマーＡがハイブリダイズした、ユニバーサル増幅された一本鎖ＤＮＡを示す。１０４は、１０３からのＰＣＲ産物を示す。１０５は、ネステッドフォワードプライマーｂおよびネステッドリバースプライマーａがハイブリダイズした、１０４からの産物を示す。１０６は、最終のＰＣＲ産物を示す。いくつかの実施形態では、２つのプライマーの完全なセットを用いることが可能である。完全ネステッドｍｉｎｉ−ＰＣＲプロトコールを使用した実験を用いて、単一細胞および３つの細胞に対して、ユニバーサルライゲーションアダプタを付加し、増幅するステップ１０２を伴わずに１４６プレックス増幅を実施した。

ヘミネステッドｍｉｎｉ−ＰＣＲ：（図４参照）断片の末端にアダプタを有する標的ＤＮＡを用いることが可能である。フォワードプライマー（Ｂ）の多重セットおよび１つ（または少数）のタグ特異的リバースプライマー（Ａ）で構成されるＳＴＡを実施する。第２のＳＴＡを、ユニバーサルタグ特異的フォワードプライマーおよび標的特異的リバースプライマーを使用して実施することができる。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、リバースプライマーＡがハイブリダイズした、ユニバーサル増幅された一本鎖ＤＮＡを示す。１０４は、リバースプライマーＡおよびライゲーションアダプタタグプライマーＬＴを使用して増幅した、１０３からのＰＣＲ産物を示す。１０５は、フォワードプライマーＢがハイブリダイズした、１０４からの産物を示す。１０６は、最終のＰＣＲ産物を示す。このワークフローでは、標的特異的フォワードプライマーおよびリバースプライマーを別々の反応において使用し、それにより、反応の複雑さが減少し、フォワードプライマーとリバースプライマーの二量体形成が防がれる。この例では、プライマーＡおよびＢを、第１のプライマーとみなすことができ、プライマー「ａ」および「ｂ」を、内側のプライマーとみなすことができることに留意されたい。この方法は、直接ＰＣＲと同等に優良であるが、プライマー二量体を回避するので、直接ＰＣＲに対する大きな改善である。第１ラウンドのヘミネステッドプロトコールの後、一般には、約９９％の非標的ＤＮＡが認められるが、第２ラウンドの後には一般には、大きく改善される。

三重ヘミネステッドｍｉｎｉ−ＰＣＲ：（図５参照）断片の末端にアダプタを有する標的ＤＮＡを用いることが可能である。フォワードプライマー（Ｂ）の多重セットおよび１つ（または少数）のタグ特異的なリバースプライマー（Ａ）および（ａ）で構成されるＳＴＡを実施する。第２のＳＴＡを、ユニバーサルタグ特異的フォワードプライマーおよび標的特異的リバースプライマーを使用して実施することができる。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、リバースプライマーＡがハイブリダイズした、ユニバーサル増幅された一本鎖ＤＮＡを示す。１０４は、リバースプライマーＡおよびライゲーションアダプタタグプライマーＬＴを使用して増幅した、１０３からのＰＣＲ産物を示す。１０５は、フォワードプライマーＢがハイブリダイズした、１０４からの産物を示す。１０６は、リバースプライマーＡおよびフォワードプライマーＢを使用して増幅した、１０５からのＰＣＲ産物を示す。１０７は、リバースプライマー「ａ」がハイブリダイズした、１０６からの産物を示す。１０８は、最終のＰＣＲ産物を示す。この例では、プライマー「ａ」およびＢを、内側のプライマーとみなすことができ、Ａを、第１のプライマーとみなすことができることに留意されたい。必要に応じて、ＡとＢの両方を第１のプライマーとみなすことができ、「ａ」を、内側のプライマーとみなすことができる。リバースプライマーおよびフォワードプライマーの名称は切り換えることができる。このワークフローでは、標的特異的フォワードプライマーおよびリバースプライマーを別々の反応において使用し、それにより、反応の複雑さが減少し、フォワードプライマーとリバースプライマーの二量体形成が防がれる。この方法は、直接ＰＣＲと同等に優良であるが、プライマー二量体を回避するので、直接ＰＣＲに対する大きな改善である。第１ラウンドのヘミネステッドプロトコールの後、一般には、約９９％の非標的ＤＮＡが認められるが、第２ラウンドの後には一般には、大きく改善される。

片側ネステッドｍｉｎｉ−ＰＣＲ：（図６参照）断片の末端にアダプタを有する標的ＤＮＡを用いることが可能である。ＳＴＡを、ネステッドフォワードプライマーの多重セットを用い、リバースプライマーとしてライゲーションアダプタタグを使用して実施することもできる。次いで、ネステッドフォワードプライマーおよびユニバーサルリバースプライマーのセットを使用して第２のＳＴＡを実施することができる。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、フォワードプライマーＡがハイブリダイズした、ユニバーサル増幅された一本鎖ＤＮＡを示す。１０４は、フォワードプライマーＡおよびライゲーションアダプタタグリバースプライマーＬＴを使用して増幅した、１０３からのＰＣＲ産物を示す。１０５は、ネステッドフォワードプライマーがハイブリダイズした、１０４からの産物を示す。１０６は、最終のＰＣＲ産物を示す。この方法では、第１のＳＴＡおよび第２のＳＴＡにおいてオーバーラップしているプライマーを使用することにより、標準のＰＣＲによるよりも短い標的配列を検出することができる。前記方法は、一般には、既に上記のＳＴＡステップ１−ユニバーサルタグの付加および増幅を受けたＤＮＡの試料を差し引いて実施し、２つのネステッドプライマーは一方の側にのみあり、他方の側にはライブラリータグを使用する。前記方法を、アポトーシス性の上清および妊娠血漿のライブラリーに対して実施した。このワークフローを用いると、配列の約６０％が意図された標的にマッピングされた。リバースアダプタ配列を含有したリードはマッピングしておらず、したがって、リバースアダプタ配列を含有するリードをマッピングした場合にはこの数字は大きくなることが予想されることに留意されたい。

片側のみのｍｉｎｉ−ＰＣＲ：断片の末端にアダプタを有する標的ＤＮＡを用いることが可能である（図７参照）。ＳＴＡを、フォワードプライマーの多重セットおよび１つ（または少数）のタグ特異的なリバースプライマーを用いて実施することができる。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、フォワードプライマーＡがハイブリダイズした一本鎖ＤＮＡを示す。１０４は、フォワードプライマーＡおよびライゲーションアダプタタグリバースプライマーＬＴを使用して増幅した、１０３からのＰＣＲ産物を示し、これは最終のＰＣＲ産物である。この方法により、標準のＰＣＲによるよりも短い標的配列を検出することができる。しかし、ただ１つの標的特異的プライマーを使用するので、比較的非特異的であり得る。このプロトコールの有効性は片側ネステッドｍｉｎｉＰＣＲの半分である。

リバースセミネステッドｍｉｎｉ−ＰＣＲ：断片の末端にアダプタを有する標的ＤＮＡを用いることが可能である（図８参照）。ＳＴＡを、フォワードプライマーの多重セットおよび１つ（または少数）のタグ特異的なリバースプライマーを用いて実施することができる。１０１は、Ｘに対象の多型遺伝子座を有する二本鎖ＤＮＡを示す。１０２は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖ＤＮＡを示す。１０３は、リバースプライマーＢがハイブリダイズした一本鎖ＤＮＡを示す。１０４は、リバースプライマーＢおよびライゲーションアダプタタグフォワードプライマーＬＴを使用して増幅した、１０３からのＰＣＲ産物を示す。１０５は、フォワードプライマーＡ、および内側のリバースプライマー「ｂ」がハイブリダイズした、ＰＣＲ産物１０４を示す。１０６は、フォワードプライマーＡおよびリバースプライマー「ｂ」を使用して１０５から増幅されたＰＣＲ産物を示し、これは最終のＰＣＲ産物である。この方法により、標準のＰＣＲによるよりも短い標的配列を検出することができる。

上記の方法の単に反復または組み合わせであるさらなる変形物、例えば、プライマーの３つのセットを使用する二重ネステッドＰＣＲも存在し得る。別の変形物は片側半ネステッドｍｉｎｉ−ＰＣＲであり、ＳＴＡをネステッドフォワードプライマーの多重セットおよび１つ（または少数）のタグ特異的なリバースプライマーを用いて実施することもできる。

これらの変形物の全てにおいて、フォワードプライマーおよびリバースプライマーの同一性は交換することができることに留意されたい。いくつかの実施形態では、ネステッド変形物は、アダプタタグを付加すること、およびユニバーサル増幅ステップを含む最初のライブラリーの調製を伴わずに同等に良好に実行することができることに留意されたい。いくつかの実施形態では、追加のフォワードプライマーおよび／またはリバースプライマーおよび増幅ステップを伴ってＰＣＲの追加のラウンドを含めることができ、これらの追加のステップは、標的の遺伝子座に対応するＤＮＡ分子のパーセントをさらに増大させることが望ましい場合に特に有用であり得ることに留意されたい。

ネスティングワークフロー
異なる程度のネスティング、および異なる程度の多重化を伴って増幅を実施するための多くの方法が存在する。図９では、フローチャートが、可能性のあるワークフローのいくつかと共に示されている。１０，０００プレックスＰＣＲの使用は単なる例であり、これらのフローチャートは他の多重化の程度に対しても同等に良好に機能することに留意されたい。

ループライゲーションアダプタ
例えば、配列決定するためのライブラリーを作出するためにユニバーサルタグを付けたアダプタを付加する場合、アダプタをライゲーションするためのいくつもの方法が存在する。１つの方法は、試料ＤＮＡを平滑末端化し、Ａ−テーリングを実施し、Ｔ−オーバーハングを有するアダプタとライゲーションすることである。アダプタをライゲーションするための、いくつもの他の方法が存在する。ライゲーションすることができるアダプタもいくつも存在する。例えば、ＤＮＡの２つの鎖からなり、一方の鎖が二本鎖領域、およびフォワードプライマー領域によって指定される領域を有し、他方の鎖が第１の鎖上の二本鎖領域と相補的な二本鎖領域、およびリバースプライマーを伴う領域によって指定されるＹ−アダプタを使用することができる。アニーリングする場合、二本鎖領域は、Ａオーバーハングを有する二本鎖ＤＮＡとライゲーションするために、Ｔ−オーバーハングを含有してよい。

ある実施形態では、アダプタは、末端領域が相補的であって、フォワードプライマーでタグを付けた領域（ＬＦＴ）、リバースプライマーでタグを付けた領域（ＬＲＴ）、およびその２つの間の切断部位を含有する、ＤＮＡのループであってよい（図１０参照）。１０１は、二本鎖の平滑末端の標的ＤＮＡを指す。１０２は、Ａ尾部をもつ標的ＤＮＡを指す。１０３は、Ｔオーバーハング「Ｔ」および切断部位「Ｚ」を有するループライゲーションアダプタを指す。１０４は、ループライゲーションアダプタが付加された標的ＤＮＡを指す。１０５は、切断部位において切断された、ライゲーションアダプタが付加された標的ＤＮＡを指す。ＬＦＴはライゲーションアダプタフォワードタグを指し、ＬＲＴはライゲーションアダプタリバースタグを指す。相補的な領域はＴオーバーハング、または標的ＤＮＡとライゲーションするために使用することができる他の形体で終わってよい。切断部位は、ＵＮＧに沿った切断のための一連のウラシルであり得るか、あるいは制限酵素もしくは他の切断方法または単に基本的な増幅によって認識され切断され得る配列であり得る。これらのアダプタは、例えば、配列決定するための任意のライブラリーを調製するために使用することができる。これらのアダプタは、本明細書に記載の他の方法のいずれか、例えば、ｍｉｎｉ−ＰＣＲ増幅方法と組み合わせて用いることができる。

内部にタグを付けたプライマー
所与の多型遺伝子座に存在する対立遺伝子を決定するために配列決定を用いる場合、シーケンスリードは、一般には、プライマー結合部位（ａ）の上流で開始され、次いで、多型部位（Ｘ）が読まれる。タグは一般には、図１１の左側に示されている通り配置される。１０１は、対象の多型遺伝子座「Ｘ」およびタグ「ｂ」が付加されたプライマー「ａ」を有する一本鎖標的ＤＮＡを指す。非特異的なハイブリダイゼーションを回避するために、プライマー結合部位（「ａ」と相補的な標的ＤＮＡの領域）は、一般には、１８〜３０ｂｐの長さである。配列タグ「ｂ」は、一般には約２０ｂｐであり、理論上は、これらは約１５ｂｐより長い任意の長さであってよいが、多くの人々は配列決定プラットフォームの企業から販売されているプライマー配列を使用する。「ａ」と「Ｘ」の間の距離「ｄ」は、対立遺伝子の偏りを回避するために少なくとも２ｂｐであってよい。Ｗ多重ＰＣＲ増幅を、過剰なプライマー間相互作用を回避するために慎重なプライマーの設計が必要である、本明細書に開示されている方法または他の方法を用いて実施する場合、許容できる「ａ」と「Ｘ」の間の距離「ｄ」のウィンドウは、相当に変動し得る：２ｂｐ〜１０ｂｐ、２ｂｐ〜２０ｂｐ、２ｂｐ〜３０ｂｐまたは、さらには２ｂｐ〜３０ｂｐ超。したがって、図１１の左側に示されているプライマーの配置を用いる場合、シーケンスリードは、多型遺伝子座を測定するために十分に長いリードを得るために、最小の４０ｂｐでなければならず、また、「ａ」および「ｄ」の長さに応じてシーケンスリードは６０ｂｐまたは７５ｂｐまでが必要になる場合がある。通常、シーケンスリードが長いほど、所与の数のリードについて配列決定するための費用および時間が増し、したがって、必要なリードの長さを最小化することにより、時間と金の両方を節約することができる。さらに、平均で、リードの初期の塩基のリードは、リード後期のリードよりも正確なリードであるので、必要なシーケンスリードの長さを減らすことにより、多型領域の測定の正確度を上げることもできる。

ある実施形態では、図１１の１０３に示されている通り、内部にタグを付けたプライマーと称されるプライマー結合部位（ａ）を複数のセグメント（ａ’、ａ’’、ａ’’’．．．．）に分割し、配列タグ（ｂ）を、２つのプライマー結合部位の中央のＤＮＡのセグメント上に置く。この配置により、シーケンサーがより短いシーケンスリードを行うことが可能になる。ある実施形態では、ａ’＋ａ’’は少なくとも約１８ｂｐであるべきであり、３０ｂｐ、４０ｂｐ、５０ｂｐ、６０ｂｐ、８０ｂｐ、１００ｂｐ、または１００ｂｐ超の長さであってよい。ある実施形態では、ａ’’は少なくとも約６ｂｐであるべきであり、ある実施形態では、約８ｂｐから１６ｂｐの間である。全ての他の因子も同等であり、内部にタグを付けたプライマーを使用することにより、必要なシーケンスリードの長さを、少なくとも６ｂｐ、８ｂｐ、１０ｂｐ、１２ｂｐ、１５ｂｐと同程度、さらには２０ｂｐまたは３０ｂｐと同程度に切り詰めることができる。この結果、かなりの金、時間および正確度の利点がもたらされ得る。内部にタグを付けたプライマーの例は図１２に示されている。

ライゲーションアダプタ結合領域を有するプライマー
断片化されたＤＮＡに伴う１つの問題は、その長さが短いので、多型がＤＮＡ鎖の末端の近くにある見込みが長い鎖よりも高いことである（例えば、１０１、図１０）。多型をＰＣＲによって捕捉するためには、多型の両側に適切な長さのプライマー結合部位が必要であるので、プライマーと標的の結合部位の間のオーバーラップが不十分であることに起因して、標的の多型を有するかなりの数のＤＮＡの鎖が捕捉し損なわれる。ある実施形態では、標的ＤＮＡ１０１にはライゲーションアダプタ１０２を付加することができ、標的プライマー１０３は、設計された結合領域（ａ）の上流に付加したライゲーションアダプタタグ（ｌｔ）と相補的な領域（ｃｒ）を有し得る（図１３参照）；したがって、結合領域（ａと相補的な１０１の領域）が一般にハイブリダイゼーションのために必要な１８ｂｐよりも短い場合には、ライブラリータグと相補的なプライマーの領域（ｃｒ）により、ＰＣＲが進行することができるところまで結合エネルギーを増大させることができる。より短い結合領域に起因して失われる任意の特異性は、適切に長い標的結合領域を有する他のＰＣＲプライマーによって補うことができることに留意されたい。この実施形態は、直接ＰＣＲまたは本明細書に記載の他の方法のいずれか、例えば、ネステッドＰＣＲ、セミネステッドＰＣＲ、ヘミネステッドＰＣＲ、片側ネステッドまたはセミネステッドまたはヘミネステッドＰＣＲまたは他のＰＣＲプロトコールと組み合わせて用いることができることに留意されたい。

配列決定データを用い、種々の仮説について、観察された対立遺伝子データと予測される対立遺伝子分布を比較することを伴う分析的な方法と組み合わせて倍数性を決定する場合、リード深度が低い対立遺伝子からの追加のリードのそれぞれにより、リード深度が高い対立遺伝子からのリードよりも多くの情報がもたらされる。したがって、理想的には、各遺伝子座が同様の数の代表的なシーケンスリードを有する均一なリード深度（ＤＯＲ）が認められることが望まれる。したがって、ＤＯＲの分散を最小限にすることが望ましい。ある実施形態では、アニーリング時間を増加させることによってＤＯＲの変動係数（これは、ＤＯＲの標準偏差／平均ＤＯＲと定義することができる）を減少させることが可能である。いくつかの実施形態では、アニーリング温度は、２分超、４分超、１０分超、３０分超、および１時間超またはさらに長くてよい。アニーリングは平衡プロセスであるので、アニーリング時間の増加に伴うＤＯＲの分散の改善に限界はない。ある実施形態では、プライマー濃度を増加させることにより、ＤＯＲの分散が減少する。

代表的全ゲノム増幅法
いくつかの実施形態では、標的遺伝子座のみを増幅する前に、核酸試料を増幅するために全ゲノムアプリケーションなどのＤＮＡ増幅を含めることができる。ＤＮＡの増幅は、少量の遺伝物質を、同様の遺伝子データの集合を含む、より大量の遺伝物質に変換するプロセスであり、これに限定されないが、ポリメラーゼ連鎖反応（ＰＣＲ）を含めた多種多様な方法によって行うことができる。ＤＮＡを増幅する１つの方法は、全ゲノム増幅（ＷＧＡ）である。ＷＧＡに利用可能ないくつもの方法がある：ライゲーション媒介性ＰＣＲ（ＬＭ−ＰＣＲ）、縮重オリゴヌクレオチドプライマーＰＣＲ（ＤＯＰ−ＰＣＲ）、および多置換増幅（ＭＤＡ）。ＬＭ−ＰＣＲでは、アダプタと称される短いＤＮＡ配列をＤＮＡの平滑末端にライゲーションする。これらのアダプタはユニバーサル増幅配列を含有し、これを使用して、ＰＣＲによってＤＮＡを増幅する。ＤＯＰ−ＰＣＲでは、同様にユニバーサル増幅配列を含有するランダムプライマーが第１ラウンドのアニーリングおよびＰＣＲにおいて使用されている。次いで、第２ラウンドのＰＣＲを使用して、さらにユニバーサルプライマー配列を用いて配列を増幅する。ＭＤＡでは、ＤＮＡを複製する高度にプロセッシブかつ非特異的な酵素であり、単一細胞分析のために使用されているｐｈｉ−２９ポリメラーゼを用いる。単一細胞由来の材料の増幅に対する主要な限定は、（１）極度に希釈したＤＮＡ濃度または非常に小さな体積の反応混合物を使用する必要性、および（２）全ゲノムにわたってＤＮＡをタンパク質から確実に解離することの難しさである。それにもかかわらず、単一細胞全ゲノム増幅は、何年にもわたる種々の適用のために首尾よく用いられてきた。ＤＮＡの試料からＤＮＡを増幅する他の方法がある。ＤＮＡ増幅では、最初のＤＮＡの試料を、配列の集合が同様であるが、はるかに量が多いＤＮＡの試料に変換する。いくつかの場合には、増幅は必要ない可能性がある。

いくつかの実施形態では、ＤＮＡを、ユニバーサル増幅、例えば、ＷＧＡまたはＭＤＡを用いて増幅することができる。いくつかの実施形態では、ＤＮＡを、標的化増幅、例えば、標的ＰＣＲまたは環状化プローブを用いることによって増幅することができる。いくつかの実施形態では、ＤＮＡを、標的化増幅方法または所望のＤＮＡと望ましくないＤＮＡの完全なまたは部分的な分離をもたらす方法、例えば、ハイブリダイゼーション手法による捕捉を用いて、優先的に富化することができる。いくつかの実施形態では、ＤＮＡを、ユニバーサル増幅方法と優先的な富化方法の組み合わせを用いることによって増幅することができる。これらの方法のいくつかについてのより充実した記載は本文書の他の箇所に見いだすことができる。

代表的富化およびシークエンシング法
ある実施形態では、本明細書に開示されている方法は、元のＤＮＡの試料中、標的遺伝子座（例えば、多型遺伝子座）の集合からの各標的遺伝子座（例えば、各多型遺伝子座）に存在する相対的な対立遺伝子頻度を保存する選択的富化技法を用いる。富化は多形遺伝子座の分析法として特に有益であるが、これらの富化方法は、必要に応じ、非多形遺伝子座に対しても容易に適合させることができる。いくつかの実施形態では、増幅および／または選択的富化技法は、ライゲーション媒介性ＰＣＲなどのＰＣＲ、ハイブリダイゼーションによる断片の捕捉、分子反転プローブまたは他の環状化プローブを伴い得る。いくつかの実施形態では、増幅または選択的な富化のための方法は、標的配列と正確にハイブリダイズした際に、ヌクレオチドプローブの３’末端または５’末端が、少数のヌクレオチドで対立遺伝子の多型部位から隔てられるようなプローブの使用を伴ってよい。この隔たりにより、対立遺伝子の偏りと称される、一方の対立遺伝子の優先的な増幅が減少する。
これは、正確にハイブリダイズしたプローブの３’末端または５’末端が対立遺伝子の多型部位と直接隣接する、またはそれと非常に近くなるようなプローブの使用を伴う方法よりも改善されている。ある実施形態では、ハイブリダイズ領域が、多型部位を含有する可能性がある、またはそれを確実に含有するプローブは排除される。ハイブリダイゼーションの部位に多型部位があることにより、一部の対立遺伝子において不均等なハイブリダイゼーションが引き起こされ得る、または、ハイブリダイゼーションが全体で阻害されてもよく、その結果、特定の対立遺伝子が優先的に増幅される。これらの実施形態は、試料が単一の個体由来の純粋なゲノム試料であろうが個体の混合物であろうが、試料の各多型遺伝子座における元の対立遺伝子頻度をより良好に保存するという点で、標的化増幅および／または選択的な富化を伴う他の方法よりも改善されている。

非侵襲的な出生前対立遺伝子コールまたは倍数性コールのための方法の一部としてＤＮＡの試料を標的遺伝子座の集合において富化し、その後、配列決定する技法を使用することにより、いくつもの予想外の利点が付与され得る。本開示のいくつかの実施形態では、前記方法は、インフォマティクスに基づく方法、例えば、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）（ＰＳ）で使用するための遺伝子データを測定するステップを包含する。実施形態のいくつかの最終の転帰は、胚または胎児のすぐに使用可能な遺伝子データである。具体化された方法の一部として、個体および／または関連する個体の遺伝子データを測定するために用いることができる多くの方法が存在する。ある実施形態では、標的の対立遺伝子の集合の濃度を富化するための方法が本明細書に開示されており、前記方法は、以下のステップの１個または複数個を含む：遺伝物質を標的化増幅するステップ、遺伝子座に特異的なオリゴヌクレオチドプローブを添加するステップ、特定のＤＮＡ鎖をライゲーションするステップ、所望のＤＮＡの集合を単離するステップ、反応の望ましくない構成成分を除去するステップ、ハイブリダイゼーションによって特定のＤＮＡの配列を検出するステップ、およびＤＮＡの配列決定方法によって１個または複数個のＤＮＡ鎖の配列を検出するステップ。いくつかの場合には、ＤＮＡ鎖とは標的遺伝物質を指してもよく、いくつかの場合には、ＤＮＡ鎖とはプライマーを指してもよく、いくつかの場合には、ＤＮＡ鎖とは合成された配列、またはそれらの組み合わせを指してもよい。これらのステップは、いくつもの異なる順序で行うことができる。

例えば、標的化増幅の前のＤＮＡのユニバーサル増幅ステップにより、いくつかの有利な点、例えば、ボトルネックのリスクの除去および対立遺伝子の偏りの低減が付与され得る。ＤＮＡを、標的配列の両側の２つの隣接する領域とハイブリダイズすることができるオリゴヌクレオチドプローブと混合することができる。ハイブリダイゼーション後、プローブの末端を、ライゲーションの手段であるポリメラーゼ、およびプローブの環状化を可能にするための任意の必要な試薬を加えることによって結びつけることができる。環状化した後、エキソヌクレアーゼを加えて環状化されていない遺伝物質を消化し、その後、環状化されたプローブを検出することができる。ＤＮＡを、標的配列の両側の２つの隣接する領域とハイブリダイズすることができるＰＣＲプライマーと混合することができる。ハイブリダイゼーション後、プローブの末端を、ライゲーションの手段であるポリメラーゼ、およびＰＣＲ増幅を完了させるための任意の必要な試薬を加えることによって結びつけることができる。増幅されたＤＮＡまたは増幅されなかったＤＮＡは、遺伝子座の集合を標的とするハイブリッド捕捉プローブの標的であってもよく、ハイブリダイゼーション後、プローブを局在させ、混合物から分離して、標的配列で富化されたＤＮＡの混合物をもたらすことができる。

対立遺伝子コールまたは倍数性コールの方法の一部として特定の遺伝子座を標的とし、その後配列決定する方法を用いることにより、いくつもの予想外の利点が付与され得る。ＤＮＡを標的とし得る、または優先的に富化することができるいくつかの方法は、環状化プローブ、連結逆方向プローブ（ｌｉｎｋｅｄｉｎｖｅｒｔｅｄｐｒｏｂｅ）（ＬＩＰ、ＭＩＰ）、ＳＵＲＥＳＥＬＥＣＴなどのハイブリダイゼーションによる捕捉方法、および標的ＰＣＲまたはライゲーション媒介性ＰＣＲ増幅戦略を使用することを含む。

いくつかの実施形態では、本開示の方法は、インフォマティクスに基づく方法、例えば、本明細書でさらに説明されるＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）（ＰＳ）で使用するための遺伝子データを測定するステップを包含する。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、遺伝子データを操作するためのインフォマティクスに基づく手法であり、その態様は本明細書に記載されている。実施形態のいくつかの最終の転帰は、胚または胎児のすぐに使用可能な遺伝子データ、その後のすぐに使用可能なデータに基づく臨床的決定である。ＰＳ法の背景のアルゴリズムは、標的個体、多くの場合は胚または胎児の測定された遺伝子データ、および関連する個体から測定された遺伝子データを取得し、標的個体の遺伝子の状態が分かる正確度を上昇させることができる。ある実施形態では、測定された遺伝子データを、出生前遺伝子診断の間に倍数性の決定を行う状況において使用する。ある実施形態では、測定された遺伝子データを、インビトロでの受精の間に胚に対して倍数性の決定または対立遺伝子コールを行う状況において使用する。上述の状況において個体および／または関連する個体の遺伝子データを測定するために用いることができる多くの方法が存在する。異なる方法は、いくつものステップを含み、これらのステップは、多くの場合、遺伝物質を増幅するステップ、オリゴヌクレオチドプローブを添加するステップ、特定のＤＮＡ鎖をライゲーションするステップ、所望のＤＮＡの集合を単離するステップ、反応の望ましくない構成成分を除去するステップ、ハイブリダイゼーションによって特定のＤＮＡの配列を検出するステップ、ＤＮＡの配列決定方法によって１個または複数個のＤＮＡ鎖の配列を検出するステップを伴う。ある場合には、ＤＮＡ鎖とは標的遺伝物質を意味し、ある場合には、ＤＮＡ鎖とはプライマーを意味し、ある場合には、ＤＮＡ鎖とは合成された配列、またはそれらの組み合わせを意味する。これらのステップは、いくつもの異なる順序で行うことができる。

理論上はゲノム内の任意の数の遺伝子座、１個の遺伝子座から１００万超までのいずれかの遺伝子座を標的とすることが可能であることに留意されたい。ＤＮＡの試料を標的化、次いで配列決定に供する場合、シーケンサーによって読み取られる対立遺伝子の割合は、それらが試料中に天然に存在する量に対して富化される。富化の程度は、１パーセント（またはさらに低い）から１０倍、１００倍、１，０００倍またはさらに多く１００万倍までのいずれであってもよい。ヒトゲノムには、およそ７，５００万の多型遺伝子座を含む、およそ３０億の塩基対、およびヌクレオチドが存在する。標的とされる遺伝子座が多いほど、より少ない富化の程度が可能である。標的とされる遺伝子座の数が少ないほど、より大きな富化の程度が可能であり、それらの遺伝子座において、所与の数のシーケンスリードに対してより大きなリード深度を実現することができる。

本開示のある実施形態では、標的化または優先（ｐｒｅｆｅｒｅｎｔｉａｌ）は、完全にＳＮＰに焦点を当てることができる。ある実施形態では、標的化または優先は、任意の多型部位に焦点を当てることができる。エクソンを富化するためのいくつもの商業的な標的化産物が利用可能である。驚いたことに、排他的にＳＮＰを、または排他的に多型遺伝子座を標的化することは、対立遺伝子分布に依拠するＮＰＤのための方法を用いる場合に特に有利である。配列決定を用いるＮＰＤのための公開された方法も存在し、例えば、米国特許第７，８８８，０１７号は、リード数が、所与の染色体にマッピングされるリード数をカウントすることに焦点が当てられるリード数解析を伴い、分析されたシーケンスリードは、多型のゲノムの領域には焦点を当てていない。多型対立遺伝子に焦点を当てないこれらの種類の方法体系は、対立遺伝子の集合を標的化または優先的に富化することほど役立たない。

本開示のある実施形態では、遺伝子試料をゲノムの多型領域において富化するためにＳＮＰに焦点を当てる標的化方法を用いることが可能である。ある実施形態では、少数のＳＮＰ、例えば、１から１００の間のＳＮＰ、またはそれよりも多数、例えば、１００から１，０００の間、１，０００から１０，０００の間、１０，０００から１００，０００の間、または１００，０００超のＳＮＰに焦点を当てることが可能である。ある実施形態では、生存するトリソミーでの出生と相関する１つまたは少数の染色体、例えば、第１３染色体、第１８染色体、第２１染色体、Ｘ染色体およびＹ染色体またはそのいくつかの組み合わせに焦点を当てることが可能である。ある実施形態では、標的のＳＮＰを小さな係数、例えば、１．０１倍から１００倍の間、またはそれよりも大きな係数、例えば、１００倍から１，０００，０００倍の間、または１，０００，０００超倍まで富化することが可能である。本開示のある実施形態では、標的化方法を用いて、ゲノムの多型領域において優先的に富化されたＤＮＡの試料を作製することが可能である。ある実施形態では、この方法を用いて、これらの特性のいずれかを有するＤＮＡの混合物を作製することが可能であり、ここで、ＤＮＡの混合物は、母系ＤＮＡと、浮動性胎児ＤＮＡも含有する。ある実施形態では、この方法を用いて、これらの係数の任意の組み合わせを有するＤＮＡの混合物を作製することが可能である。例えば、本明細書に記載の方法を用いて、母系ＤＮＡおよび胎児ＤＮＡを含み、２００ＳＮＰであって、全てが第１８染色体または第２１染色体のいずれかに位置し、平均で１，０００倍に富化される２００ＳＮＰに対応するＤＮＡにおいて優先的に富化されたＤＮＡの混合物を生成することができる。別の例では、前記方法を用いて、１０，０００ＳＮＰであって、全てまたはほとんどが第１３染色体、第１８染色体、第２１染色体、Ｘ染色体およびＹ染色体に位置し、遺伝子座当たりの平均の富化が５００倍を超える１０，０００ＳＮＰにおいて優先的に富化されたＤＮＡの混合物を作製することが可能である。本明細書に記載の標的化方法のいずれかを用いて、特定の遺伝子座において優先的に富化されたＤＮＡの混合物を作製することができる。

いくつかの実施形態では、本開示の方法は、ハイスループットＤＮＡシーケンサーを使用して混合画分中のＤＮＡを測定するステップであって、混合画分中のＤＮＡが、不相応な数の１個または複数個の染色体由来の配列を含有し、１個または複数個の染色体が第１３染色体、第１８染色体、第２１染色体、Ｘ染色体、Ｙ染色体およびそれらの組み合わせを含む群から選択されるステップをさらに含む。

本明細書には３つの方法、多重ＰＣＲ、ハイブリダイゼーションによる標的化捕捉、および連結逆方向プローブ（ＬＩＰ）が記載されており、それを用いて、胎児の異数性を検出するために、母系の血漿試料由来の十分な数の多型遺伝子座から測定値を得て解析することができる。これは、標的の遺伝子座を選択的に富化する他の方法を排除するものではない。前記方法の核心を変化させることなく他の方法を同等に良好に用いることができる。それぞれの場合において、アッセイされる多型は、一塩基多型（ＳＮＰ）、小さな挿入欠失またはＳＴＲを含んでよい。好ましい方法は、ＳＮＰの使用を伴う。各手法により、対立遺伝子頻度データが生じ、各標的の遺伝子座についての対立遺伝子頻度データおよび／またはこれらの遺伝子座からの同時対立遺伝子頻度分布を解析して、胎児の倍数性を決定することができる。各手法は、供給源材料が限られていること、および母系の血漿が母系ＤＮＡと胎児ＤＮＡの混合物からなるという事実に起因して、それ自体の考慮すべき事柄を有する。この方法は、より正確な決定をもたらすための他の手法と組み合わせることができる。ある実施形態では、この方法を、米国特許第７，８８８，０１７号に記載のものなどの配列計数手法と組み合わせることができる。記載されている手法は、胎児の父系性を非侵襲的に、母系の血漿試料から検出するために用いることもできる。さらに、各手法は、異数性染色体の存在または不在を検出するため、分解されたＤＮＡ試料由来の多数のＳＮＰについて遺伝子型決定するため、セグメントに分かれたコピー数の変動（ＣＮＶ）を検出するため、他の対象の遺伝子型の状態またはそのいくつかの組み合わせを検出するために、他のＤＮＡの混合物または純粋なＤＮＡ試料に適用することができる。

試料中の対立遺伝子分布の正確な測定
現行の配列決定手法を用いて、試料中の対立遺伝子の分布を推定することができる。そのような方法の１つは、ショットガン配列決定と称される、プールＤＮＡから配列を無作為にサンプリングするステップを包含する。配列決定データにおける特定の対立遺伝子の割合は、一般には、非常に低く、単純統計量によって決定することができる。ヒトゲノムは、およそ３０億の塩基対を含有する。したがって、使用した配列決定方法により１００ｂｐのリードが生じた場合、特定の対立遺伝子は、およそ３，０００万回のシーケンスリードごとに１回測定される。

ある実施形態では、本開示の方法を用いて、ＤＮＡの試料中の同じ遺伝子座の集合を含有する２種以上の異なるハプロタイプの存在または不在を、その染色体由来の遺伝子座の測定された対立遺伝子分布から決定する。異なるハプロタイプは、１つの個体由来の２つの異なる相同染色体、トリソミーの個体由来の３つの異なる相同染色体、母親および胎児由来の３つの異なる相同なハプロタイプであって、該ハプロタイプのうちの１つが母親と胎児の間で共有されるハプロタイプ、母親および胎児由来の３つまたは４つのハプロタイプであって、該ハプロタイプの１つまたは２つが母親と胎児の間で共有されるハプロタイプ、または他の組み合わせを示し得る。ハプロタイプ間で多型である対立遺伝子はより情報価値がある傾向があるが、母親および父親がどちらも同じ対立遺伝子についてホモ接合性ではない任意の対立遺伝子により、測定された対立遺伝子分布を通じて、単純リード数解析から入手可能である情報を越えた有用な情報がもたらされる。

しかし、そのような試料のショットガン配列決定は、それにより、試料中の異なるハプロタイプ間で多型ではない領域、または対象ではない染色体についての多くの配列がもたらされ、したがって、標的ハプロタイプの割合に関する情報を示さないので、非常に非効率的である。本明細書には、ゲノム内で多型である可能性がより高い、試料中のＤＮＡのセグメントを特異的に標的とし、かつ／または優先的に富化して、配列決定によって得られる対立遺伝子の情報の収量を上昇させる方法が記載されている。標的個体に存在する実際の量を真に表すことになる富化された試料において測定された対立遺伝子分布について、標的のセグメント内の所与の遺伝子座における他の対立遺伝子と比較して１つの対立遺伝子の優先的な富化がわずかである、または存在しないことが重大であることに留意されたい。多型対立遺伝子を標的とするための現行の当技術分野で公知の方法は、存在する任意の対立遺伝子の少なくとも一部が検出されることが確実になるように設計されている。しかし、これらの方法は、元の混合物に存在する多型対立遺伝子の不偏の対立遺伝子分布を測定する目的では設計されていなかった。標的富化の任意の特定の方法により、富化された試料を生成することができ、測定された対立遺伝子分布が元の増幅されていない試料に存在する対立遺伝子分布を、任意の他の方法よりも良好に正確に示すことは自明ではない。理論上は、多くの富化方法がそのような目的を実現することが予測され得るが、当業者は、現行の増幅、標的化および他の優先的な富化方法には相当量の確率論的または決定論的な偏りがあることをよく理解している。本明細書に記載の方法の一実施形態により、ゲノム内の所与の遺伝子座に対応するＤＮＡの混合物に見いだされる複数の対立遺伝子を、対立遺伝子のそれぞれの富化の程度がほぼ同じになるように増幅または優先的に富化することが可能になる。別の言い方では、前記方法により、各遺伝子座に対応する対立遺伝子間の比は元のＤＮＡの混合物における比と基本的に同じままで、混合物に存在する対立遺伝子の相対的な量を全体として増大させることが可能になる。いくつかの報告されている方法では、１％超、２％超、５％超、さらには１０％超の対立遺伝子の偏りがもたらされ得る。この優先的な富化は、ハイブリダイゼーション手法による捕捉を用いた場合の捕捉の偏り、または各サイクルに関しては小さい可能性があるが、２０サイクル、３０サイクルまたは４０サイクルにわたって組み立てる（ｃｏｍｐｏｕｎｄｅｄ）と大きくなり得る増幅の偏りに起因し得る。本開示の目的で、比が基本的に同じままであるとは、元の混合物における対立遺伝子の比を、生じた混合物における対立遺伝子の比で割ったものが、０．９５から１．０５の間、０．９８から１．０２の間、０．９９から１．０１の間、０．９９５から１．００５の間、０．９９８から１．００２の間、０．９９９から１．００１の間、または０．９９９９から１．０００１の間であることを意味する。本明細書で提示された対立遺伝子の比の算出は、標的個体の倍数性状態の決定には使用することができず、単に対立遺伝子の偏りを測定するために使用されるメトリックであり得ることに留意されたい。

ある実施形態では、混合物が標的遺伝子座の集合において優先的に富化されたら、クローン試料（単一分子から生成される試料；例としては、ＩＬＬＵＭＩＮＡＧＡＩＩｘ、ＩＬＬＵＭＩＮＡＨｉＳｅｑ、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＳＯＬｉＤ、５５００ＸＬが挙げられる）について配列決定する、以前の、現行のまたは次世代の配列決定計器のうちの任意の１つを用いてシークエンシングができる。比は、標的の領域内の特定の対立遺伝子を通してシークエンシングによって評価することができる。これらのシーケンシングリードを、対立遺伝子の型、および、したがって決定される異なる対立遺伝子の割り当てに応じて分析し、カウントすることができる。１から数塩基の長さである変動について、対立遺伝子の検出は配列決定によって実施し、捕捉された分子の対立遺伝子の組成を評価するために、シーケンシングリードが問題の対立遺伝子にわたることが必須である。遺伝子型についてアッセイする捕捉された分子の総数は、シーケンシングリードの長さが増加することによって増加することができる。全ての分子の完全な配列決定により、富化されたプールにおいて利用可能な最大量のデータの収集が保証される。しかし、配列決定は、現在は費用がかかり、少数のシーケンスリードを用いて対立遺伝子分布を測定することができる方法は非常に価値がある。さらに、リードの長さが増加すると、可能性のあるリードの最大長に対する技術的な限界ならびに正確度の限界がでてくる。有用性が最大である対立遺伝子は、１〜数塩基の長さのものであるが、理論的には、シーケンシングリードの長さよりも短い任意の対立遺伝子を使用することができる。対立遺伝子の変動は全ての型で生じるが、本明細書において提供される実施例は、ほんの数個隣接する塩基対に含有されるＳＮＰまたは変異体に焦点を当てる。より大きな変異体、例えば、セグメントに分かれたコピー数の変異体は、多くの場合、セグメントの内部のＳＮＰの全体的な集団が重複しているので、これらのより小さな変動を総計することによって検出することができる。数塩基よりも大きな変異体、例えば、ＳＴＲは、特別な考慮およびいくつかの標的化手法研究を必要とするが、他のものは必要としない。

ゲノム内の１個または複数個の変異体の位置を特異的に単離し、富化するために使用することができる複数の標的化手法が存在する。一般には、これらは、変異体配列に隣接している変異していない配列を利用することに依拠する。基質が母系血漿場合のシークエンシングにおける標的化に関連する他の研究者による報告がある（例えば、Ｌｉａｏｅｔａｌ．，Ｃｌｉｎ．Ｃｈｅｍ．２０１１；５７（１）：ｐｐ．９２−１０１、を参照）。しかし、これらの手法は、エクソンを標的とする標的化プローブを使用し、ゲノムの多型領域を標的とすることには焦点を当てていない。ある実施形態では、本開示の方法は、多型領域に排他的またはほぼ排他的に焦点を当てた標的化プローブを使用するステップを包含する。ある実施形態では、本開示の方法は、ＳＮＰに排他的またはほぼ排他的に焦点を当てる標的化プローブを使用するステップを包含する。本開示のいくつかの実施形態では、標的の多型部位は、少なくとも１０％のＳＮＰ、少なくとも２０％のＳＮＰ、少なくとも３０％のＳＮＰ、少なくとも４０％のＳＮＰ、少なくとも５０％のＳＮＰ、少なくとも６０％のＳＮＰ、少なくとも７０％のＳＮＰ、少なくとも８０％のＳＮＰ、少なくとも９０％のＳＮＰ、少なくとも９５％のＳＮＰ、少なくとも９８％のＳＮＰ、少なくとも９９％のＳＮＰ、少なくとも９９．９％のＳＮＰまたは排他的にＳＮＰからなる。

ある実施形態では、本開示の方法を用いて、遺伝子型（特定の遺伝子座におけるＤＮＡの塩基組成）およびＤＮＡ分子の混合物由来のこれらの遺伝子型の相対的な割合を決定することができ、これらのＤＮＡ分子は、１つまたはいくつもの遺伝的に別個の個体を起源とし得る。ある実施形態では、本開示の方法を用いて、多型遺伝子座の集合における遺伝子型、およびこれらの遺伝子座に存在する異なる対立遺伝子の量の相対的な比を決定することができる。ある実施形態では、多型遺伝子座は、完全にＳＮＰからなってよい。ある実施形態では、多型遺伝子座は、ＳＮＰ、単一のタンデム反復、および他の多型を含んでよい。ある実施形態では、本開示の方法を用いて、ＤＮＡの混合物における多型遺伝子座の集合における対立遺伝子の相対的な分布を決定することができ、ＤＮＡの混合物は、母親を起源とするＤＮＡ、および胎児を起源とするＤＮＡを含む。ある実施形態では、妊娠中の女性由来の血液から単離されたＤＮＡの混合物について同時対立遺伝子分布を決定することができる。ある実施形態では、遺伝子座の集合における対立遺伝子分布を使用して、妊娠中の胎児について１個または複数個の染色体の倍数性状態を決定することができる。

ある実施形態では、ＤＮＡ分子の混合物は、１つの個体の複数の細胞から抽出したＤＮＡに由来してよい。ある実施形態では、個体がモザイク（生殖系列または体細胞）である場合、ＤＮＡが由来する元の細胞の集団は、同じ遺伝子型または異なる遺伝子型の二倍体細胞または一倍体細胞の混合物を含み得る。ある実施形態では、ＤＮＡ分子の混合物は、単一細胞から抽出したＤＮＡに由来してもよい。ある実施形態では、ＤＮＡ分子の混合物は、同じ個体の２つ以上の細胞または異なる個体の２つ以上の細胞の混合物から抽出したＤＮＡに由来してもよい。ある実施形態では、ＤＮＡ分子の混合物は、無細胞ＤＮＡを含有することが公知である血漿などの、既に細胞から遊離した生物材料から単離されたＤＮＡに由来してよい。ある実施形態では、この生物材料は、胎児ＤＮＡが混合物中に存在することが示されている妊娠中の場合と同様に、１つまたは複数の個体由来のＤＮＡの混合物であってよい。ある実施形態では、生物材料は、母系の血液中に見いだされた細胞の混合物由来であってよく、細胞のいくつかは胎児を起源とする。ある実施形態では、生物材料は、胎児の細胞において富化された妊娠中の血液由来の細胞であってよい。

環状化プローブ
本開示のいくつかの実施形態は、以前文献に記載された「連結逆方向プローブ」（ＬＩＰ）を使用し、本発明の多重ＰＣＲ法でＬＩＰではないプライマーを使って増幅する前または後で、標的遺伝子座を増幅することを含む。ＬＩＰとは、環状ＤＮＡ分子を作製することを伴う技術を包含することを意味する総称であり、プローブは、標的の対立遺伝子の両側の標的のＤＮＡの領域とハイブリダイズするように設計されており、したがって、適切なポリメラーゼおよび／もしくはリガーゼ、および適切な条件、緩衝液および他の試薬の添加により、標的の対立遺伝子をわたるＤＮＡの相補的な逆方向領域が完成し標的の対立遺伝子に見いだされる情報を捕捉するＤＮＡの環状ループを作製される。ＬＩＰは、環状化前プローブ（ｐｒｅ−ｃｉｒｃｕｌａｒｉｚｅｄｐｒｏｂｅ）、環状化前プローブ（ｐｒｅ−ｃｉｒｃｕｌａｒｉｚｉｎｇｐｒｏｂｅ）または環状化プローブとも称される。ＬＩＰプローブは、長さが５０ヌクレオチドから５００ヌクレオチドの間の直鎖ＤＮＡ分子であってよく、ある実施形態では、長さが７０ヌクレオチドから１００ヌクレオチドの間であってよく、いくつかの実施形態では、本明細書に記載されているよりも長くてよい、または短くてよい。本開示の他の複数の実施形態は、ＬＩＰ技術の異なる具体化、例えば、Ｐａｄｌｏｃｋプローブおよび分子逆方向プローブ（ＭＩＰ）を伴う。

配列決定するために特定の場所を標的とする１つの方法は、プローブの３’末端および５’末端が標的ＤＮＡと、標的の領域に近接し、その両側の場所で、逆方向様式でアニーリングし、したがって、ＤＮＡポリメラーゼおよびＤＮＡリガーゼを添加することにより、３’末端からの伸長がもたらされ、標的分子と相補的な一本鎖プローブに塩基が付加され（ギャップ充填）、その後、新しい３’末端が元のプローブの５’末端とライゲーションし、その結果、後でバックグラウンドＤＮＡから単離することができる環状ＤＮＡ分子がもたらされるようなプローブを合成することである。プローブ末端は、対象の標的の領域に隣接するように設計されている。Ｏこの手法の一態様は、一般に、ＭＩＰＳと称され、充填される配列の性質を決定するために、アレイ技術と併せて用いられている。対立遺伝子の比を測定する状況においてＭＩＰを用いることの１つの欠点は、ハイブリダイゼーションステップ、環状化ステップおよび増幅ステップが、同じ遺伝子座における異なる対立遺伝子について同等の率で起こらないことである。その結果、元の混合物に存在する実際の対立遺伝子の比を表さない対立遺伝子の比が測定される。

ある実施形態では、環状化プローブは、標的の多型遺伝子座の上流とハイブリダイズするように設計されているプローブの領域および標的の多型遺伝子座の下流とハイブリダイズするように設計されているプローブの領域が、非核酸骨格を通じ共有結合的に接続するように構築される。この骨格は、任意の生体適合性分子または生体適合性分子の組み合わせであってよい。可能性のある生体適合性分子のいくつかの例は、ポリ（エチレングリコール）、ポリカーボネート、ポリウレタン、ポリエチレン、ポリプロピレン、スルホンポリマー、シリコーン、セルロース、フルオロポリマー、アクリル化合物、スチレンブロック共重合体、および他のブロック共重合体である。

本開示のある実施形態では、この手法は、配列内の充填を調べる手段として配列決定を容易に受けられるように改変されている。元の試料の元の対立遺伝子の割合を保持するために、少なくとも１つの重要な考慮すべき事柄を考慮に入れなければならない。ギャップ充填領域内の異なる対立遺伝子の間の可変性の位置は、変異体の鑑別をもたらすＤＮＡポリメラーゼによる開始の偏りがあり得るので、プローブ結合部位に近すぎないようにすべきである。別の考慮すべき事柄は、異なる対立遺伝子からの不均等な増幅をもたらし得るギャップ充填領域内の変異体と相関があるプローブ結合部位にさらなる変動が存在する可能性があることである。本開示のある実施形態では、環状化前プローブの３’末端および５’末端を、標的の対立遺伝子の変異の位置（多型部位）と１つまたは少数の位置だけ離れている塩基とハイブリダイズするように設計する。多型部位（ＳＮＰまたは他の種類のもの）と、環状化前プローブの３’末端および／または５’末端がハイブリダイズするように設計されている塩基との間の塩基の数は、１塩基であってよく、２塩基であってよく、３塩基であってよく、４塩基であってよく、５塩基であってよく、６塩基であってよく、７〜１０塩基であってよく、１１〜１５塩基であってよく、または、１６〜２０塩基、２０〜３０塩基または３０〜６０塩基であってよい。フォワードプライマーおよびリバースプライマーは、多型部位から離れた異なる数の塩基とハイブリダイズするように設計することができる。現行のＤＮＡ合成技術を用いて環状化プローブを多数生成することができ、これにより、非常に多数のプローブを生成し、潜在的にプールすることが可能になり、多くの遺伝子座を同時に調べることができる。３００，０００超のプローブで作業することが報告されている。標的個体のゲノムのデータを測定するために使用することができる環状化プローブを伴う方法を考察している２つの論文としては、Ｐｏｒｒｅｃａら、ＮａｔｕｒｅＭｅｔｈｏｄｓ、２００７年、４巻（１１号）、９３１〜９３６頁；および同様にＴｕｒｎｅｒら、ＮａｔｕｒｅＭｅｔｈｏｄｓ、２００９年、６巻（５号）、３１５〜３１６頁が挙げられる。これらの論文に記載されている方法は、本明細書に記載の他の方法と組み合わせて用いることができる。これらの２つの論文からの方法の特定のステップは、本明細書に記載の他の方法からの他のステップと組み合わせて用いることができる。

本明細書に開示されている方法のいくつかの実施形態では、標的個体の遺伝物質を、必要に応じて増幅し、その後、環状化前プローブとハイブリダイズさせ、ギャップ充填を実施してハイブリダイズしたプローブの２つの末端間の塩基を充填し、２つの末端をライゲーションして環状化されたプローブを形成し、環状化されたプローブを、例えば、ローリングサークル増幅を用いて増幅する。所望の標的対立遺伝子の遺伝子情報が適切に設計された環状化オリゴヌクレオチド性プローブ、例えば、ＬＩＰ系において捕捉されたら、環状化されたプローブの遺伝子配列を測定して、所望の配列データをもたらすことができる。ある実施形態では、適切に設計されたオリゴヌクレオチドプローブを、増幅されなかった標的個体の遺伝物質において直接環状化し、その後増幅することができる。ローリングサークル増幅、ＭＤＡまたは他の増幅プロトコールを含めたいくつもの増幅手順を使用して、元の遺伝物質を増幅することまたはＬＩＰを環状化することができることに留意されたい。異なる方法を用いて、例えば、ハイスループット配列決定、サンガー配列決定、他の配列決定方法、ハイブリダイゼーションによる捕捉、環状化による捕捉、多重ＰＣＲ、他のハイブリダイゼーション方法、およびそれらの組み合わせを用いて、標的ゲノム上の遺伝子情報を測定することができる。

上記の方法の１つまたは組み合わせ、インフォマティクスに基づく方法、例えば、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法を、適切な遺伝子測定と一緒に用いて個体の遺伝物質を測定したら、次いで、それを用いて、個体における１個または複数個の染色体の倍数性状態、および／または対立遺伝子の１つもしくは対立遺伝子の集合（詳細には、対象の疾患または遺伝子の状態と相関する対立遺伝子）の遺伝子の状態を決定することができる。遺伝子配列を多重化捕捉し、その後、配列決定を用いて遺伝子型決定するためのＬＩＰの使用が報告されていることに留意されたい。しかし、ＬＩＰに基づく戦略によって生じる配列決定データを、単一細胞、少数の細胞または細胞外ＤＮＡにおいて見いだされる遺伝物質を増幅するために使用することは、標的個体の倍数性状態を決定するためには用いられていない。

ハイブリダイゼーションアレイ、例えば、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭアレイまたはＡＦＦＹＭＥＴＲＩＸ遺伝子チップによって測定された遺伝子データから個体の倍数性状態を決定するためのインフォマティクスに基づく方法の適用は、本文書の他の箇所の参考文献に記載されている。しかし、本明細書に記載の方法は、以前に文献に記載された方法に対する改善を示す。例えば、ＬＩＰに基づく手法、その後のハイスループット配列決定により、この手法は、多重化についての能力がより優れ、捕捉特異性がより優れ、均一性がより優れ、対立遺伝子の偏りが少ないので、予想外に、より良好な遺伝子型データがもたらされる。多重化がより大きいことにより、より多くの対立遺伝子を標的とすることが可能になり、より正確な結果がもたらされる。均一性がより優れていることにより、より多くの標的の対立遺伝子が測定され、より正確な結果がもたらされる。対立遺伝子の偏りの率がより低いことにより、誤ったコールの率が低下し、より正確な結果がもたらされる。より正確な結果により、臨床転帰が改善され、より良い医療がもたらされる。

ＬＩＰを、配列決定以外の方法によって遺伝子型決定するために、ＤＮＡの試料における特定の遺伝子座を標的とするための方法として用いることができることに留意することが重要である。例えば、ＳＮＰアレイまたは他のＤＮＡもしくはＲＮＡに基づくマイクロアレイを用いて遺伝子型決定するために、ＬＩＰを用いてＤＮＡを標的とすることができる。

ライゲーション媒介性ＰＣＲ
ライゲーションされていないプライマーを使ってＰＣＲ増幅する前または後でライゲーション媒介性ＰＣＲを使って標的遺伝子座を増幅できる。ライゲーション媒介性ＰＣＲは、ＤＮＡの混合物における１個または複数個の遺伝子座を増幅することによってＤＮＡの試料を優先的に富化するために用いるＰＣＲの方法であり、前記方法は、プライマー対の集合を得るステップであって、対の各プライマーが標的特異的配列および非標的配列を含有し、好ましくは、標的特異的配列が、標的領域であって、１つが多型部位の上流、および１つが多型部位の下流である標的領域とアニーリングするように設計されており、該標的特異的配列が、多型部位から０、１、２、３、４、５、６、７、８、９、１０、１１〜２０、２１〜３０、３１〜４０、４１〜５０、５１〜１００、または、１００超隔てられていてよいステップと、上流のプライマーの３’末端からＤＮＡを重合させて、それと、標的分子と相補的なヌクレオチドを有する下流のプライマーの５’末端との間の一本鎖領域を充填するステップと、上流のプライマーの最後の重合した塩基を、近接する下流のプライマーの５’塩基とライゲーションさせるステップと、重合し、ライゲーションした分子のみを、上流のプライマーの５’末端および下流のプライマーの３’末端を含有する非標的配列を使用して増幅するステップとを含む。別個の標的に対するプライマー対を同じ反応において混合することができる。非標的配列は、ユニバーサル配列としての機能を果たし、したがって、首尾よく重合し、ライゲーションした全てのプライマー対を、増幅プライマーの単一の対を用いて増幅することができる。

ハイブリダイゼーションによる捕捉
いくつかの実施形態では、本開示の方法は、多重ＰＣＲを使用して標的遺伝子座を増幅することに加えて、次のいずれかのハイブリダイゼーション法による捕捉を使用するステップを含むことができる。標的ゲノムにおける特異的な配列の集合を優先的に富化することは、いくつもの方法で実現することができる。本文書の他の箇所に、特異的な配列の集合を標的とするためにＬＩＰをどのように用いることができるかについての記載があるが、これらの適用の全てにおいて、他の標的化および／または優先的な富化方法を、同じ目的のために同等に良好に用いることができる。別の標的化方法の１つの例はハイブリダイゼーション手法による捕捉である。商業的なハイブリダイゼーション技術による捕捉のいくつかの例としては、ＡＧＩＬＥＮＴのＳＵＲＥＳＥＬＥＣＴ、およびＩＬＬＵＭＩＮＡのＴｒｕＳｅｑが挙げられる。ハイブリダイゼーションによる捕捉では、所望の標的の配列と相補的またはほぼ相補的なオリゴヌクレオチドの集合をＤＮＡの混合物とハイブリダイズさせ、次いで混合物から物理的に分離することが可能になる。所望の配列が標的化オリゴヌクレオチドとハイブリダイズしたら、標的化オリゴヌクレオチドを物理的に取り出す作用により、標的の配列も取り出されることになる。ハイブリダイズしたオリゴを取り出したら、それらを、それらの融解温度を上回るまで加熱し、増幅することができる。標的化オリゴヌクレオチドを物理的に取り出すためのいくつかの方法は、標的化オリゴを固体支持体、例えば磁気ビーズまたはチップと共有結合させることによる。標的化オリゴヌクレオチドを物理的に取り出すための別の方法は、標的化オリゴヌクレオチドを、別の分子部分に対する強力な親和性を有する分子部分と共有結合させることによる。そのような分子対の例は、例えばＳＵＲＥＳＥＬＥＣＴにおいて使用されるビオチンおよびストレプトアビジンである。したがって、その標的の配列をビオチン分子に共有結合的に付着させ、ハイブリダイゼーション後に、ストレプトアビジンを付加した固体支持体を使用して、標的の配列がハイブリダイズしたビオチン化オリゴヌクレオチドをプルダウンすることができる。

ハイブリッド捕捉は、対象の標的と相補的なプローブを標的分子とハイブリダイズさせることを伴う。ハイブリッド捕捉プローブはもともと、標的間に相対的な均一性を有するゲノムの大部分を標的とし、富化するために開発された。その適用では、増幅される全ての標的が、全ての領域を配列決定によって検出することができる十分な均一性を有することが重要であったが、元の試料における対立遺伝子の割合を保持することには注意が払われなかった。捕捉した後、試料中に存在する対立遺伝子を、捕捉された分子の直接配列決定によって決定することができる。これらのシーケンシングリードを、対立遺伝子の型に応じて分析し、カウントすることができる。しかし、現行の技術を用いると、測定された捕捉された配列の対立遺伝子分布は、一般には、元の対立遺伝子分布を表さない。

ある実施形態では、配列決定によって対立遺伝子の検出を実施する。多型部位における対立遺伝子の同一性を捕捉するために、捕捉された分子の対立遺伝子の組成を評価するために、シーケンシングリードが問題の対立遺伝子にわたることが必須である。捕捉分子は多くの場合、長さが変動するので、配列決定の際に、分子全体が配列決定されなければ、変異の位置がオーバーラップすることを保証することができない。しかし、最大の可能性のある長さおよびシーケンシングリードの正確度に関する費用検討ならびに技術的な限界により、分子全体の配列決定は実行できない。ある実施形態では、約３０塩基から約５０塩基または約７０塩基まで増加させることができるリードの長さにより、標的の配列内の変異の位置とオーバーラップするリード数を著しく増加させることができる。

対象の位置を調べるリード数を増加させるための別の方法は、基礎をなす富化された対立遺伝子の偏りをもたらさない限りはプローブの長さを減少させることである。合成されたプローブの長さは、１つの遺伝子座において見いだされた２つの異なる対立遺伝子とハイブリダイズするように設計された２種のプローブが元の試料中の種々の対立遺伝子とほぼ同等の親和性でハイブリダイズするために十分な長さであるべきである。現在、当技術分野で公知の方法には、一般には１２０塩基より長いプローブが記載されている。現行の実施形態において、対立遺伝子が１つまたは少数の塩基である場合、捕捉プローブは、約１１０塩基未満、約１００塩基未満、約９０塩基未満、約８０塩基未満、約７０塩基未満、約６０塩基未満、約５０塩基未満、約４０塩基未満、約３０塩基未満、および約２５塩基未満であってもよく、全ての対立遺伝子からの同等の富化を確実にするためにはこの量で十分である。ハイブリッド捕捉技術を用いて富化するＤＮＡの混合物が、血液、例えば母系の血液から単離された浮動性ＤＮＡを含む混合物である場合、ＤＮＡの平均長はかなり短く、一般には、２００塩基未満である。より短いプローブを使用することにより、ハイブリッド捕捉プローブが所望のＤＮＡ断片を捕捉する見込みが大きくなる。より大きな変動は、より長いプローブを必要とする場合がある。ある実施形態では、対象の変動は、１（ＳＮＰ）〜数塩基の長さである。ある実施形態では、ゲノム内の標的の領域を、ハイブリッド捕捉プローブを使用して優先的に富化することができ、ここで、ハイブリッド捕捉プローブの長さは９０塩基未満であり、８０塩基未満、７０塩基未満、６０塩基未満、５０塩基未満、４０塩基未満、３０塩基未満または２５塩基未満であってよい。ある実施形態では、所望の対立遺伝子が配列決定される見込みを増大させるために、多型の対立遺伝子の場所に隣接している領域とハイブリダイズするように設計されているプローブの長さを、９０塩基超から、約８０塩基まで、または約７０塩基まで、または約６０塩基まで、または約５０塩基まで、または約４０塩基まで、または約３０塩基まで、または約２５塩基まで減少させることができる。

捕捉を可能にするために、合成されたプローブと標的分子の間に最小のオーバーラップが存在する。この合成されたプローブは、できるだけ短くすることができるが、それでもこの最小の必要なオーバーラップよりも大きい。多型領域を標的とするためにより短いプローブ長を用いることの効果は、より多くの分子が標的対立遺伝子領域とオーバーラップすることである。元のＤＮＡ分子の断片化の状態も、標的の対立遺伝子とオーバーラップするリード数に影響を及ぼす。血漿試料などの一部のＤＮＡ試料は、インビボで起こる生物学的プロセスに起因して既に断片化されている。しかし、より長い断片を有する試料には、配列決定ライブラリーの調製および富化の前の断片化が有益である。プローブと断片の両方が短い（約６０〜８０ｂｐ）場合、最大の特異性は、対象の重要な領域とオーバーラップできない比較的少ないシーケンスリードで実現することができる。

ある実施形態では、ハイブリダイゼーション条件を調整して、元の試料中に存在する異なる対立遺伝子の捕捉における均一性を最大にすることができる。ある実施形態では、対立遺伝子間のハイブリダイゼーションの偏りの差異を最小限にするためにハイブリダイゼーション温度を低下させる。当技術分野で公知の方法では、温度を低下させることには、プローブと、意図されたものではない標的とのハイブリダイゼーションを増大させる効果があるので、ハイブリダイゼーションのためにより低い温度を用いることを回避する。しかし、目的が、最大の忠実度で対立遺伝子の比を保存することである場合、現行技術の教示がこの手法を避けているという事実にもかかわらずより低いハイブリダイゼーション温度を用いる手法により、最適に正確な対立遺伝子の比がもたらされる。ハイブリダイゼーション温度は、標的の領域の実質的なオーバーラップを有する標的のみが捕捉されるように、標的と合成されたプローブとの間のより大きなオーバーラップを必要とするために上昇させることもできる。本開示のいくつかの実施形態では、ハイブリダイゼーション温度を、通常のハイブリダイゼーション温度から、約４０℃まで、約４５℃まで、約５０℃まで、約５５℃まで、約６０℃まで、約６５までまたは約７０℃まで低下させる。

ある実施形態では、ハイブリッド捕捉プローブは、多型の対立遺伝子に隣接している領域に見いだされるＤＮＡと相補的なＤＮＡを有する捕捉プローブの領域が多型部位のすぐ隣ではないように設計することができる。その代わりに、捕捉プローブは、標的の多型部位に隣接しているＤＮＡとハイブリダイズするように設計されている捕捉プローブの領域が、多型部位とファンデルワールスにより接触する捕捉プローブの部分と、１つまたは少数の塩基と等しい長さの小さな距離で隔てられているように設計することができる。ある実施形態では、ハイブリッド捕捉プローブは、多型の対立遺伝子と隣接しているが、それとは交差していない領域とハイブリダイズするように設計されており、これは、隣接捕捉プローブと称される。隣接捕捉プローブの長さは、約１２０塩基未満、約１１０塩基未満、約１００塩基未満、約９０塩基未満であってよく、約８０塩基未満、約７０塩基未満、約６０塩基未満、約５０塩基未満、約４０塩基未満、約３０塩基未満、または約２５塩基未満であってよい。隣接捕捉プローブの標的となるゲノムの領域は、多型遺伝子座と１塩基対、２塩基対、３塩基対、４塩基対、５塩基対、６塩基対、７塩基対、８塩基対、９塩基対、１０塩基対、１１〜２０塩基対、または、２０超塩基対で隔てられていてよい。

標的化配列捕捉を用いる、標的化捕捉に基づく疾患スクリーニング検査についての記載。現在ＡＧＩＬＥＮＴ（ＳＵＲＥＳＥＬＥＣＴ）、ＲＯＣＨＥ−ＮＩＭＢＬＥＧＥＮまたはＩＬＬＵＭＩＮＡから提供されているものなどの特別注文の標的化配列捕捉。捕捉プローブは、種々の種類の変異の捕捉を確実にするために特別注文で設計することができる。点変異については、点変異とオーバーラップする１個または複数個のプローブが、変異を捕捉し、配列決定するために十分であるはずである。

小さな挿入または欠失については、変異とオーバーラップする１個または複数個のプローブが、変異を含む断片を捕捉し、配列決定するために十分であり得る。ハイブリダイゼーションは、一般には、ゲノム配列を参照するために設計されるプローブ限定捕捉効率の間で効率が低い可能性がある。変異を含む断片の捕捉を確実にするために、正常な対立遺伝子と一致するものと、変異対立遺伝子と一致するものの２種のプローブを設計することができる。より長いプローブにより、ハイブリダイゼーションを増強することができる。複数のオーバーラッププローブにより捕捉を増強することができる。最後に、プローブをすぐ隣であるがオーバーラップはしていないところに置くと、変異は、正常な対立遺伝子と変異対立遺伝子の比較的同様の捕捉効率が可能となり得る。

単純タンデム反復（ＳＴＲ）については、これらの高度に可変性の部位とオーバーラップしているプローブは、断片を上手く捕捉する可能性が低い。捕捉を増強するために、プローブを、可変性部位と近接しているがオーバーラップはしていないところに置くことができる。次いで、断片について通常通り配列決定して、ＳＴＲの長さおよび組成を示すことができる。

大規模な欠失については、現在エクソン捕捉系において用いられている一般的な手法である一連のオーバーラッププローブが機能し得る。しかし、この手法を用いると、個体がヘテロ接合性であるか否かを決定することが難しい場合がある。捕捉された領域内のＳＮＰを標的とし、評価することにより、個体が保有者であることを示す、その領域にわたるヘテロ接合性の損失を潜在的に示すことができる。ある実施形態では、非オーバーラッププローブまたはシングルトンプローブを、潜在的に欠失した領域にわたって置き、捕捉された断片の数をヘテロ接合性の尺度として使用することが可能である。個体が大規模な欠失を有する場合には、非欠失（二倍体）参照遺伝子座と比較して、断片の数の２分の１を捕捉のために利用可能であることが予測される。したがって、欠失した領域から得られたリード数は、正常な二倍体の遺伝子座から得られたリード数のおよそ半分であるはずである。潜在的に欠失した領域にわたる複数のシングルトンプローブからのシーケンシングリード深度を総計し、平均することにより、シグナルを増強し、診断の信頼度を改善することができる。２つの手法、ＳＮＰを標的として、ヘテロ接合性の損失を同定すること、および複数のシングルトンプローブを使用して、その遺伝子座から基礎をなす断片の量の定量的尺度を得ることを組み合わせることもできる。これらの戦略のいずれか、または両方を、他の戦略と組み合わせて、同じ結果をよりよく得ることができる。

試験の間に、同じ試験において捕捉され、配列決定されるＹ染色体断片の存在によって示される、男の胎児のｃｆＤＮＡの検出、ならびに母親および父親が影響されないＸ連鎖優性変異または母親が影響されない優性変異のいずれかにより、胎児に対するリスクが高まることが示される。影響のない母親における同じ遺伝子内に２つの変異劣性対立遺伝子が検出されることは、胎児が、変異対立遺伝子を父親から、および潜在的に第２の変異対立遺伝子を母親から遺伝によって受け継いだことを意味する。全ての場合において、羊水穿刺または絨毛膜絨毛採取による追跡検査も示され得る。

標的化捕捉に基づく疾患スクリーニング検査は、異数性についての標的化捕捉に基づく非侵襲的な出生前診断検査と組み合わせることができる。リード深度（ＤＯＲ）の変動性を減少させるためのいくつもの方法が存在する：例えば、プライマー濃度を上昇させることができる、より長い標的化増幅プローブを使用することができる、または、ＳＴＡサイクルをより多く実行することができる（例えば、２５超、３０超、３５超、または、さらには４０超）。

試料中のＤＮＡ分子数の代表的決定方法
第１ラウンドのＤＮＡ増幅の間に試料中の元のＤＮＡ分子のそれぞれについて独自に同定された分子を生成することによって、試料中のＤＮＡ分子の数を決定するための方法が本明細書に記載されている。上記の目的を実現し、その後に単一分子配列決定法またはクローン配列決定法が続く手順が本明細書に記載されている。

該手法は、１個または複数個の特定の遺伝子座を標的とするステップ、および、各標的の遺伝子座が独特のタグを有し、このバーコードをクローン配列決定または単一分子配列決定を用いて配列決定した際に互いに区別することができるように元の分子のタグを付けたコピーを生成するステップを包含する。独特の配列決定されたバーコードのそれぞれは元の試料における独特の分子を示す。同時に、配列決定データを使用して、分子が由来する遺伝子座を確認する。この情報を使用して、各遺伝子座について、元の試料中の独特の分子の数を決定することができる。

この方法は、元の試料中の分子の数の定量的評価が必要な任意の適用のために用いることができる。さらに、１個または複数個の標的の独特の分子の数を、１個または複数個の他の標的に対する独特の分子の数に関連づけて、相対的なコピー数、対立遺伝子分布または対立遺伝子の比を決定することができる。あるいは、元の標的のコピーの最も可能性の高い数を同定するために、種々の標的から検出されたコピーの数を分布によってモデリングすることができる。適用としては、これらに限らないが、挿入および欠失、例えば、デュシェンヌ型筋ジストロフィーの保有者に見いだされるものの検出；染色体のセグメントの欠失または重複、例えば、コピー数変異体において観察されたものの定量；生まれた個体由来の試料の染色体コピー数；生まれていない個体、例えば、胚または胎児由来の試料の染色体コピー数が挙げられる。

前記方法は、配列による標的化に含有される同時に起こる変動の評価と組み合わせることができる。これを用いて、元の試料における各対立遺伝子を示す分子の数を決定することができる。このコピー数法は、ＳＮＰまたは他の配列の変動の評価と組み合わせて、生まれた個体および生まれていない個体の染色体コピー数を決定することができる；短い配列の変動を有するが、その中でＰＣＲにより複数の標的領域から増幅することができる遺伝子座由来のコピーの識別および定量化、例えば、棘筋萎縮の保有者検出の目的で；異なる個体の混合物からなる試料由来の分子の種々の供給源のコピー数の決定、例えば、母系の血漿から得られた浮動性ＤＮＡからの胎児の異数性の検出の目的で。

ある実施形態では、単一の標的遺伝子座に関係する方法は、以下のステップの１つまたは複数を含んでよい：（１）特定の遺伝子座をＰＣＲ増幅するための、オリゴマーの標準の対を設計するステップ。（２）合成の間に、標的特異的オリゴマーのうちの１つの５’末端側に、標的遺伝子座またはゲノムに対する相補性を有さない、または最小の相補性を有する特定の塩基の配列を付加するステップ。尾部と称されるこの配列は既知の配列であって、その後の増幅のために用いられるものであり、ランダムなヌクレオチドの配列が後に続く。これらのランダムなヌクレオチドはランダムな領域を含む。ランダムな領域は、各プローブ分子間で確率的に異なる、ランダムに生成した核酸の配列を含む。したがって、合成した後、尾部を付けたオリゴマープールは、既知の配列から始まり、その後に分子間で異なる未知の配列が続き、その後に標的特異的配列が続くオリゴマーの集団からなる。（３）尾部を付けたオリゴマーのみを使用して１ラウンドの増幅（変性、アニーリング、伸長）を実施するステップ。（４）エキソヌクレアーゼを反応物に加え、ＰＣＲ反応を有効に停止させ、反応物を適切な温度でインキュベートして、鋳型とアニーリングしなかったフォワード一本鎖オリゴを除去し、伸長させて二本鎖産物を形成するステップ。（５）反応物を高い温度でインキュベートして、エキソヌクレアーゼを変性させ、その活性を排除するするステップ（６）第１の反応において使用したオリゴマーの尾部と相補的な新しいオリゴヌクレオチドを他の標的特異的オリゴマーと一緒に反応物に加えて、ＰＣＲの第１ラウンドで生成した産物のＰＣＲ増幅を可能にするステップ。（７）増幅を継続して下流のクローン配列決定のために十分な産物を生成させるステップ。（８）十分な数の塩基を配列に結んだ、増幅されたＰＣＲ産物を、多数の方法、例えば、クローン配列決定によって測定するステップ。

ある実施形態では、本開示の方法は、多数の遺伝子座を並行してまたは別の方法で標的とするステップを包含する。異なる標的遺伝子座に対するプライマーを独立に生成し、混合して多重ＰＣＲプールを作製することができる。ある実施形態では、元の試料を、サブプールに分けることができ、各サブプールにおいて異なる遺伝子座を標的とした後に組み換え、シークエンシングができる。ある実施形態では、プールを細分する前にタグを付けるステップおよびいくつもの増幅サイクルを実施して全ての標的の効率的な標的化を確実にした後に、分割し、改善し、その後、細分されたプールにおけるより小さなプライマーの集合を使用して増幅を継続することによって増幅することができる。

この技術が特に有用になる適用の１つの例は、非侵襲的な出生前異数性診断であり、所与の遺伝子座における対立遺伝子の比またはいくつもの遺伝子座における対立遺伝子の分布を用いて、胎児に存在する染色体のコピーの数の決定に役立てることができる。この状況では、最初の試料中に存在するＤＮＡを、種々の対立遺伝子の相対的な量を維持しながら増幅することが望ましい。一部の場合、特に、存在するＤＮＡが非常に少量である、例えば、５，０００未満のゲノムのコピー、１，０００未満のゲノムのコピー、５００未満のゲノムのコピー、および１００未満のゲノムのコピーである場合には、ボトルネッキングと称される現象が起こり得る。これは、最初の試料中に任意の所与の対立遺伝子の少数のコピーが存在し、増幅の偏りの結果、増幅されたＤＮＡのプールの有するそれらの対立遺伝子の比が最初のＤＮＡの混合物におけるそれらの対立遺伝子の比とは有意に異なるということである。標準のＰＣＲ増幅の前に、各ＤＮＡの鎖にバーコードの独特のまたはほぼ独特の集合を適用することにより、同じ元の分子を起源とする配列決定されたＤＮＡのｎ個の同一の分子の集合からＤＮＡのｎ−１コピーを排除することが可能である。

例えば、個体のゲノム内のヘテロ接合性であるＳＮＰ、および元のＤＮＡの試料中に各対立遺伝子が１０分子存在する個体由来のＤＮＡの混合物を考える。増幅した後、その遺伝子座に対応する１００，０００分子のＤＮＡが存在し得る。確率論的なプロセスに起因して、ＤＮＡの比は１：２〜２：１のいずれであってもよいが、元の分子のそれぞれに独特のタグでタグを付けたので、増幅されたプール内のＤＮＡが正確に各対立遺伝子由来の１０分子のＤＮＡを起源とすることを決定することが可能である。したがって、この方法により、この手法を用いない方法よりも正確な測度の相対的な各対立遺伝子の量がもたらされる。対立遺伝子の偏りの相対量を最小限にすることが望ましい方法に対して、この方法により正確なデータがもたらされる。

配列決定された断片と標的遺伝子座の関連づけは、いくつもの方法で実現することができる。ある実施形態では、標的配列に対応する分子バーコード、同様に、十分な数の独特の塩基を標的の断片に結んで十分な長さの配列を得て、標的遺伝子座を明白に同定することを可能にする。別の実施形態では、ランダムに生成した分子バーコードを含有する分子バーコーディングプライマーは、それが関連づけられる標的を同定する遺伝子座に特異的なバーコード（遺伝子座バーコード）も含有することができる。この遺伝子座バーコードは、個々の標的の各々に対する全ての分子バーコーディングプライマー間で、したがって、生じた増幅産物の全ての間で同一であるが、他の全ての標的とは異なる。ある実施形態では、本明細書に記載のタグ付け方法を、片側のネスティングプロトコールと組み合わせることができる。

ある実施形態では、分子バーコーディングプライマーの設計および生成は、以下の通り実施化することができる：分子バーコーディングプライマーは、標的配列と相補的でない配列、それに続くランダムな分子バーコード領域、それに続く標的特異的配列からなってよい。分子バーコードの５’の配列は部分配列ＰＣＲ増幅ために用いることができ、配列決定するために増幅産物をライブラリーに変換することにおいて有用な配列を含み得る。ランダムな分子バーコード配列は多数の方法で生成することができる。好ましい方法では、分子タグを付けたプライマーを、バーコード領域を合成する間の反応のために４種の塩基全てを含むように合成する。塩基の全てまたは塩基の種々の組み合わせは、ＩＵＰＡＣＤＮＡ多義コードを使用して明記することができる。このように、合成された分子の集団は、分子バーコード領域内の配列のランダムな混合物を含有する。バーコード領域の長さにより、どのくらい多くのプライマーが独特のバーコードを含有するかが決定される。独特の配列の数は、Ｎ^Ｌとしてバーコード領域の長さに関連づけられ、ここで、Ｎは塩基の数であり、一般には４であり、Ｌはバーコードの長さである。５塩基のバーコードにより、最大１０２４個の独特の配列をもたらすことができ、８塩基のバーコードにより、６５５３６個の独特のバーコードをもたらすことができる。ある実施形態では、ＤＮＡを、配列決定方法によって測定することができ、配列データは単一分子の配列を示す。これは、単一分子について直接配列決定する方法、または単一分子を増幅して、配列決定計器によって検出可能なクローンを形成するが、なお単一分子を示す、本明細書ではクローン配列決定と称される方法を含むことができる。

増幅産物の定量化の代表的方法および試薬対象の特異的核酸配列の定量化は、通常、ＴＡＱＭＡＮ（ＬＩＦＥＴＥＣＨＮＯＬＯＧＩＥＳ）、ＩＮＶＡＤＥＲプローブ（ＴＨＩＲＤＷＡＶＥＴＥＣＨＮＯＬＯＧＩＥＳ）、などの定量的リアルタイムＰＣＲ技術により行われる。このような技術は、複数配列の並行同時分析（多重化）に対する限られた能力および増幅サイクルが可能な狭い範囲（例えば、ＰＣＲ増幅産生量の対数対サイクル数が、直線範囲内）でのみ正確な定量データを生成する能力などの多くの短所がある。ＭＹＳＥＱ（ＩＬＬＵＭＩＮＡ）、ＨＩＳＥＱ（ＩＬＬＵＭＩＮＡ）、ＩＯＮＴＯＲＲＥＮＴ（ＬＩＦＥＴＥＣＨＮＯＬＯＧＩＥＳ）、ＧＥＮＯＭＥＡＮＡＬＹＺＥＲＩＬＸ（ＩＬＬＵＭＩＮＡ）、ＧＳＦＬＥＸ＋（ＲＯＣＨＥ４５４）などで採用されるようなＤＮＡシークエンシング技術、特に高スループット次世代シークエンシング技術（大量並列シーケンシング技術と呼ばれることも多い）を使って、試料中に存在する対象配列のコピー数の定量的測定ができ、それにより、出発物質に関する定量的情報、例えば、コピー数または転写レベルを得ることができる。高スループット遺伝子シーケンサーは、バーコーディング（すなわち、特徴的核酸配列を使った試料のタギング）を使用して、個別集団から特異的試料を特定し、それにより、ＤＮＡシーケンサーの１回の操作で複数試料の同時分析を可能とする。ライブラリー調製物（または他の対象核酸調製物）中の一定の領域のゲノムが配列決定される回数（リード数）は、対象ゲノム中のその配列のコピー数（または、ｃＤＮＡ含有調製物の場合は、発現レベル）に比例するであろう。しかし、遺伝子ライブラリーの調製およびシークエンシング（および、類似のゲノム由来の調製）は、対象の核酸配列の正確な定量的リードの取得と干渉する多くの偏りを持ち込む場合がある。例えば、核酸配列が異なると、遺伝子ライブラリー調製または試料調製の間に発生する核酸増幅ステップ中の増幅効率が異なる場合がある。

異なる増幅効率に関連する問題は、本発明の特定の実施形態を使うことにより緩和できる。本発明は、定量化の正確度を改善するために使用できる増幅プロセス中の含有物基準の使用に関連する種々の方法と組成物を含む。本明細書で記載し、また、特に、米国特許第８，００８，０１８号；同７，３３２，２７７号；国際公開第ＷＯ２０１２／０７８７９２Ａ２号；同ＷＯ２０１１／１４６６３２Ａ１号に記載されているように、本発明は、母系血液中の浮動性胎児ＤＮＡを分析することによる胎児の異数性の検出の領域で特に有用である。これらの特許は、参照によりその全体が本明細書に組み込まれる。また、本発明の実施形態は、インビトロ生成胚中の異数性の検出にも有用である。商業的に重要な検出可能な異数性には、ヒト染色体１３、１８、２１、ＸおよびＹの異数性が含まれる。

本発明の実施形態は、ヒトまたは非ヒト核酸に対して使用でき、また、動物および植物由来核酸の両方に適用できる。また、本発明の実施形態を使って、欠失または挿入により特徴付けられる他の遺伝性障害に関連する対立遺伝子の検出、および／または定量化も可能である。欠失含有対立遺伝子が、対象対立遺伝子保持者と疑われる人から検出される場合がある。

本発明の一実施形態は、既知の量（相対的または絶対的）で存在する基準を含む。例えば、染色体８（遺伝子座Ａを含む）は二倍体、および染色体２１（遺伝子座Ｂを含む）は三倍体である遺伝源から作製される遺伝子ライブラリーを考える。遺伝子ライブラリーは、試料中に存在する染色体の数、例えば、２００コピーの遺伝子座Ａおよび３００コピーの遺伝子座Ｂの関数となる量の配列を含む試料から生成できる。しかし、遺伝子座Ａが遺伝子座Ｂよりはるかに高い効率で増幅される場合、ＰＣＲ後には、６０，０００コピーのＡ増幅産物および３０，０００コピーのＢ増幅産物が存在する可能性があり、従って、高スループットＤＮＡシークエンシング（または他の定量核酸検出技術）による分析の場合に、初期の真のゲノム試料の染色体コピー数を不明確にすることになる。この問題を軽減するために、遺伝子座Ａに対する基準配列が採用され、この場合、基準配列は、実質的に遺伝子座Ａと同じ効率で増幅される。同様に、遺伝子座Ｂの基準配列が形成され、この場合、基準配列は、遺伝子座Ｂと実質的に同じ効率で増幅される。ＰＣＲ（または他の増幅技術）の前に遺伝子座Ａの基準配列および遺伝子座Ｂの基準配列が混合物に加えられる。これらの基準配列は、相対量または絶対量としての既知の量で存在する。従って、同じ条件セット下で、基準配列Ａと基準配列Ｂの１：１混合物が、前の例中の混合物に（増幅の前に）加えられた場合、３０００コピーの基準Ａ増幅産物が生成され、また、１０００コピーの基準Ｂ増幅産物が生成され、遺伝子座Ａは、遺伝子座Ｂより３倍効率的に増幅されることを示す。

対象ＳＮＰ（または他の多型）を含むゲノムの１つまたは複数の選択領域に対し、特異的増幅およびその後の配列決定ができる。この標的特異的増幅は、シークエンシング用の遺伝子ライブラリー形成中に行わせることができる。ライブラリーは、多くの標的増幅領域を含むことができる。いくつかの実施形態では、少なくとも１０；１００；５００；１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００の対象領域を含む。このようなライブラリーの例は、本明細書に記載され、また、２０１１年１１月１８日出願の米国特許公開第２０１２／０２７０２１２号で見出すことができる。この特許は、参照によりその全体が本明細書に組み込まれる。

多くの高スループットＤＮＡシークエンシング技術は、ライブラリー形成に出発遺伝物質の改変、例えば、ユニバーサルプライミング部位および／またはバーコードのライゲーションが必要で、それにより、その後のシークエンシング反応を行う前に小さい核酸フラグメントのクローン増幅を促進する。いくつかの実施形態では、遺伝子ライブラリー形成中に１個または複数個の基準配列が付加されるか、またはライブラリーの増幅の前に遺伝子ライブラリーの前駆成分に付加される。基準配列は、高スループット遺伝子シークエンシング技術によりシークエンシング用に調製される標的ゲノムフラグメントを模倣する（それでも、ヌクレオチド塩基配列に基づいて区別できる）ように選択できる。一実施形態では、基準配列は、１、２、３、４〜１０、または１１〜２０個のヌクレオチドを除いて標的ゲノムフラグメントと同じであってもよい。いくつかの実施形態では、標的遺伝子配列がＳＮＰを含む場合、基準配列は、多形塩基のヌクレオチド以外のＳＮＰと同じであってもよく、天然の部位には観察されない４個のヌクレオチドの内の１個であるように選択できる。基準配列は、複数標的遺伝子座（例えば、多形遺伝子座）の高度多重化分析に使用できる。基準配列は、ライブラリー形成（増幅前）のプロセス中に（相対的または絶対的）既知の量で付加されて分析試料中の対象標的配列の量の決定に際し、より高い正確度のための基準メトリックを提供できる。以前に特徴が明らかにされた倍数性レベル、例えば、全常染色体が二倍体であるとわかっているゲノムから形成されたシークエンシング用倍数性レベルライブラリー形成の情報と共に、使用された既知の量の基準配列の情報の組み合わせを使って、それぞれの基準配列のそれに対応する標的配列に関する増幅特性を較正でき、また、複数基準配列を含むバッチ混合物間の変動を考慮に入れることができる。大量の遺伝子座を同時に分析することが必要となる場合が多いことを考慮すれば、多くの基準配列セットを含む混合物を生成することは有用である。本発明の実施形態には、複数基準配列を含む混合物が含まれる。混合物中のそれぞれの基準配列の量が高精度で分かっていることが理想的である。しかし、この理想の達成は極めて困難である。理由は、実際問題として、混合物中のそれぞれの基準配列の量、特に、多数の異なる合成オリゴヌクレオチドを含む混合物の基準配列の量に大きな変動があるためである。この変動には多くの発生源、例えば、インビトロオリゴヌクレオチド合成反効率のバッチ間変動、体積測定の不正確さ、ピペット操作の変動が挙げられる。さらに、この変動は、理論的に正確に同じ量の正確に同じ基準配列セットを含むバッチ間でも起こる場合がある。従って、それぞれの基準配列バッチを独立に較正することは有意義である。基準配列バッチは、既知の染色体組成の参照ゲノムに対し較正できる。基準配列バッチは、シークエンシングプロトコール中に含まれる増幅ステップを最小限にして、または増幅ステップ無しで、基準配列バッチをシークエンシングすることにより較正できる。本発明の実施形態は、較正された種々の基準配列の混合物を含む。他の本発明の実施形態は、異なる基準配列の混合物を較正する方法および本方法により作製された較正された異なる基準配列の混合物を含む。

対象基準配列混合物およびそれらの使用方法の種々の実施形態は、少なくとも１０；１００；５００；１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個以上の基準配列、ならびに、種々のこれらの中間の個数を含んでよい。基準配列の数は、ＤＮＡシークエンシング用標的ライブラリーの生成中に分析用に選択された標的配列の数と同じであってもよい。しかし、いくつかの実施形態では、構築されるライブラリー中の標的領域の数より少ない数の基準配列を使用するのが有利な場合がある。より少ない数を使って採用した高スループットＤＮＡシーケンサーのシークエンシング能力の限界に達するのを避けるのが有利であろう。基準配列の数は、標的領域の数の５０％以下、標的領域の数の４０％以下、標的領域の数の３０％以下、標的領域の数の２０％以下、標的領域の数の１０％以下、標的領域の数の５％以下、標的領域の数の１％以下、ならびに種々のこれらの中間の数であってよい。例えば、遺伝子ライブラリーが特異的ＳＮＰ含有遺伝子座を標的とする１５，０００対のプライマーを使って作製される場合、１５，０００個の標的遺伝子座の内の１５００個に対応する１５００個の基準配列を含む適切な混合物を、ライブラリー構築の増幅ステップの前に添加できる。

ライブラリー構築中に添加される基準配列の量は、個別実施形態間で大きく変化してもよい。いくつかの実施形態では、それぞれの基準配列の量は、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の予測量とほぼ同じであってよい。他の実施形態では、それぞれの基準配列の量は、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の予測量よりも多くても、または少なくてもよい。標的配列および基準配列の初期の相対量は、本発明の目的にとって重大なものではないが、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の量より１００倍多い量から１００倍少ない量の範囲であるのが好ましい。過剰な量の基準配列は、装置の定められた操作回数でＤＮＡシーケンサーのシークエンシング能力の多くを使い過ぎる可能性がある。あまりに少ない量の基準配列を使用した場合は、増幅効率の変動の分析に役立たせるにしては不充分なデータになるであろう。

基準配列は、増幅される対象領域に極めて類似したヌクレオチド塩基配列となるように選択でき、好ましくは、基準配列は、分析されるゲノム領域、すなわち、「標的配列」と正確に同じプライマー結合部位を有する。基準配列は、所与の遺伝子座の対応する標的配列とは区別できる必要がある。便宜上、この区別可能な基準配列の領域を「マーカー配列」と呼ぶ。いくつかの実施形態では、標的配列のマーカー配列領域は、多形領域、例えば、ＳＮＰを含み、プライマー結合領域が両側の位置に配置されていてもよい。基準配列は、対応する標的配列のＧＣ含量に厳密に適合するように選択できる。いくつかの実施形態では、基準配列のプライマー結合領域は、ユニバーサルプライミング部位により両脇を挟まれている。これらのユニバーサルプライミング部位は、分析用ゲノムライブラリー中で使われるユニバーサルプライミング部位に適合するように選択される。他の実施形態では、基準配列は、ユニバーサルプライミング部位が無く、ユニバーサルプライミング部位は、ライブラリー形成中に付加される。基準配列は、通常、一本鎖型で提供される。基準配列は、対応する標的配列に対して定義され、配列特異的試薬を使用して標的配列が増幅される。いくつかの実施形態では、標的配列は、分析用の核酸試料中に存在する対象多型、例えば、ＳＮＰ、欠失、または挿入を含む。基準配列は、ヌクレオチド塩基配列が標的配列と類似であるが、それでも、少なくとも１個のヌクレオチド塩基の差異のために標的配列とは区別でき、それにより、基準配列由来の増幅産物配列を、標的配列由来の増幅産物配列とは区別する機構を与える合成ポリヌクレオチドである。基準配列は、同じセットの増幅試薬、例えば、ＰＣＲプライマーと共に増幅される場合、対応する標的配列と実質的に同じ増幅特性を有するように選択される。いくつかの実施形態では、基準配列は、対応する標的配列と同じプライマー配列結合部位を有することができる。他の実施形態では、基準配列は、対応する標的配列とは異なるプライマー配列結合部位を持つことができる。いくつかの実施形態では、基準配列は、対応する標的配列由来の増幅産物の長さと同じ長さの増幅産物を生成するように選択できる。他の実施形態では、基準配列は、対応する標的配列由来の増幅産物の長さよりわずかに異なる長さの増幅産物を生成するように選択できる。

増幅反応が完了後、ライブラリーは、高スループットＤＮＡシーケンサーで配列決定されるが、この場合、個別分子をクローン増幅して配列決定される。標的配列のそれぞれの対立遺伝子のシーケンスリード数が計数され、また、同様に、標的配列に対応する基準配列のシーケンスリード数も計数される。また、このプロセスは、少なくとももう一対の標的配列と対応する基準配列に対しても同様に行われる。例えば、遺伝子座Ａに関し、遺伝子座Ａの対立遺伝子１に対しＸ_Ａ１リード、遺伝子座Ａの対立遺伝子２に対しＸ_Ａ２リードが生成され、基準配列Ａに対しＸ_ＡＣリードが生成されたとする。それぞれの対象遺伝子座に対し、Ｘ_ＡＣに対する（Ｘ_Ａ１プラスＸ_Ａ２）の比率が決定される。前に考察のように、このプロセスは、参照ゲノム、例えば、全染色体が二倍体であるとわかっているゲノムで行うことができる。このプロセスは、多くの数のリード値を得て平均リード数およびリード数の標準偏差を測定するために多数回反復できる。このプロセスは、異なる遺伝子座に対応する多数の異なる基準配列を含む混合物で行われる。（１）Ｘ_Ａ１プラスＸ_Ａ２が、既知の数の染色体、例えば、通常のヒトの女性ゲノムに対しては２に対応すること、および（２）基準配列が、それらの対応する天然遺伝子座と類似の増幅（および検出）特性を有することを仮定することにより、多重基準混合物中の相対量の異なる基準配列が決定できる。その後、較正された多重基準配列混合物を使って、多重増幅反応における異なる遺伝子座間の増幅効率の変動を調節できる。

他の本発明の実施形態は、複製およびシークエンシングによる定量化と干渉する可能性のある大きな欠失が特徴の変異体遺伝子などの対象特異的遺伝子のコピー数を測定する方法と組成物を含む。シークエンシングでは、このような欠失を有する対立遺伝子の検出が難しい場合がある。基準配列を含む増幅プロセスを使用して、この問題を低減できる。

本発明の一実施形態では、分析用標的配列は、野性型（すなわち、機能型）および欠失が特徴の変異型の遺伝子である。代表的なこのような遺伝子は、遺伝疾患の脊髄性筋萎縮症（ＳＭＡ）の原因である欠失を有する対立遺伝子のＳＭＮ１である。高スループット遺伝子シークエンシング技術によって変異型の遺伝子を保持する個人を検出することは有意義である。特に、シークエンシング中に配列の欠如が観察される（単純点変異またはＳＮＰの検出とは対照的に）という理由で、欠失変異の検出へのこのような技術の応用は、問題がある場合がある。このような実施形態では、（１）対象の遺伝子（またはその一部）を増幅し、変異対立遺伝子を大きくは増幅しない、対象の遺伝子に特異的な一対の増幅プライマー、（２）対象の遺伝子（すなわち、標的配列）の野性型対立遺伝子に対応するが、少なくとも１個の検出可能ヌクレオチド塩基が異なる基準配列、（３）参照配列として機能する第２の標的配列に特異的な一対の増幅プライマー、および（４）参照配列に対応する基準配列、を用いる。

本発明の一実施形態では、対象の遺伝子のコピー数を測定する方法が提供され、対象の遺伝子は、欠失を含む１個の意図的対立遺伝子を有する。前記方法は、対象の遺伝子の欠失含有対立遺伝子を増幅しないで、少なくとも対象の遺伝子の一部、もしくは対象の全遺伝子、または対象の遺伝子に隣接する領域を増幅する点で対象の遺伝子に特異的な増幅試薬、例えば、ＰＣＲプライマーを採用できる。さらに、本方法は、対象の遺伝子に対応する基準配列を採用し、この場合、基準配列は、少なくとも１個のヌクレオチド塩基分だけ対象の遺伝子とは異なる（基準配列の配列が、対象の天然の遺伝子とは容易に区別できるように）。通常、基準配列は、対象の遺伝子と同じプライマー結合部位を含み、それにより、対象の遺伝子と、対象の遺伝子に対応する基準配列との間の全ての増幅時の差異を最小化する。また、反応は、参照配列に特異的な増幅試薬も含む。参照配列は、分析されるゲノム中の既知の（または少なくとも既知であると想定される）コピー数の配列である。反応は、参照配列に対応する基準配列をさらに含む。通常、参照配列に対応する基準配列は、参照配列と同じプライマー結合部位を含み、それにより、参照配列と、参照配列に対応する基準配列との間の全ての増幅時の差異を最小化する。

代表的核酸試料
いくつかの実施形態では、遺伝子試料を調製し、かつ／または精製することができる。そのような目的を実現するための当技術分野で公知のいくつもの標準の手順がある。いくつかの実施形態では、試料を遠心分離して、種々の層に分離することができる。いくつかの実施形態では、濾過を用いてＤＮＡを単離することができる。いくつかの実施形態では、ＤＮＡの調製は、増幅、分離、クロマトグラフィーによる精製、液液分離、単離、優先的な富化、優先的な増幅、標的化増幅または当技術分野で公知であるか、または本明細書に記載されているいくつもの他の技法のいずれかを伴ってよい。

いくつかの実施形態では、本明細書に開示されている方法は、存在するＤＮＡが非常に少量である状況において、例えば、インビトロでの受精または、１つまたは少数の細胞（一般には、細胞１０個未満、細胞２０個未満または細胞４０個未満）が利用可能である法医学的な状況において用いることができる。これらの実施形態では、本明細書に開示されている方法は、他のＤＮＡが混入していないが、ＤＮＡが少量であるので倍数性コールが非常に難しい場合に少量のＤＮＡから倍数性コールを行うために役立つ。いくつかの実施形態では、本明細書に開示されている方法は、標的ＤＮＡに別の個体のＤＮＡが混入している状況において、例えば、出生前診断、父子試験との関連における母系の血液または受胎検査の産物において用いることができる。これらの方法が特に有利になるいくつかの他の状況は、より大量の正常な細胞の中でただ１つまたは少数の細胞が存在するがん検査の場合である。これらの方法の一部として用いる遺伝子測定は、ＤＮＡまたはＲＮＡを含む任意の試料、例えば、これらに限定されないが血液、血漿、体液、尿、毛髪、涙、唾液、組織、皮膚、指の爪、割球、胚、羊水、絨毛膜絨毛試料、糞便、胆汁、リンパ液、頸管粘液、精液または核酸を含む他の細胞または材料に対して行うことができる。ある実施形態では、本明細書に開示されている方法は、核酸検出方法、例えば、配列決定、マイクロアレイ、ｑＰＣＲ、デジタルＰＣＲまたは核酸を測定するために用いられる他の方法と一緒に実行することができる。何らかの理由で望ましいことが見いだされた場合、遺伝子座における対立遺伝子数の確率の比を算出することができ、対立遺伝子の比を、本明細書に記載の方法のいくつかと、それらの方法に適合性がある限りにおいて組み合わせて用いて倍数性状態を決定することができる。いくつかの実施形態では、本明細書に開示されている方法は、加工された試料に対して行ったＤＮＡ測定から、複数の多型遺伝子座における対立遺伝子の比をコンピュータで算出するステップを包含する。いくつかの実施形態では、本明細書に開示されている方法は、本開示に記載の他の改善の任意の組み合わせと一緒に、加工された試料に対して行ったＤＮＡ測定から、複数の多型遺伝子座における対立遺伝子の比をコンピュータで算出するステップを包含する。

いくつかの実施形態では、この方法を用いて、単一細胞、少数の細胞、２〜５個の細胞、６〜１０個の細胞、１０〜２０個の細胞、２０〜５０個の細胞、５０〜１００個の細胞、１００〜１，０００個の細胞または少量、例えば、１〜１０ピコグラム、１０〜１００ピコグラム、１００ピコグラム〜１ナノグラム、１〜１０ナノグラム、１０〜１００ナノグラムまたは１００ナノグラム〜１マイクログラムの細胞外ＤＮＡについて遺伝子型決定することができる。

代表的ＲＮＡ発現調査
本発明の多重ＰＣＲ法を使って、遺伝子発現プロファイリング実験中に評価できる標的遺伝子座の数を増やすことができる。例えば、数千の遺伝子の発現レベルを同時にモニターして、疾患（例えば、癌）または疾患の危険性の増加に関連する配列（例えば、多型または他の変異）を有するかどうかを判定できる。これらの方法を使って、患者由来の試料中の遺伝子発現（例えば、特定のｍＲＮＡ対立遺伝子の発現）を疾患の有無と比較することにより、疾患、例えば、癌の危険性の増加または減少に関する配列（例えば、多型または他の変異）を特定できる。さらに、特定の治療、疾患、または発育段階が遺伝子発現に与える影響を決定できる。同様に、これらの方法を使って、感染および非感染細胞または組織中の遺伝子発現を比較することにより、病原体または他の生物に反応してどの遺伝子の発現が変化したかを特定できる。これらの方法では、シークエンシングリード数は、検出されるべき多型に対し十分なリードが実行されるように、その多型の頻度に基づいて調節できる（分析される多型が存在する場合）。

いくつかの実施形態では、ＲＮＡ（例えば、ｍＲＮＡ）を含む試料は、逆転写酵素（ＲＴ）を使って増幅され、得られたＤＮＡ（例えば、ｃＤＮＡ）は、その後、ＤＮＡポリメラーゼ（ＰＣＲ）を使って増幅される。ＲＴとＰＣＲステップは、同じ反応体積中でまたは別々に、順次行うことができる。本発明のプライマーライブラリーのいずれかを、このリバース転写ポリメラーゼ連鎖反応（ＲＴ−ＰＣＲ）法で使用できる。種々の実施形態では、リバース転写は、オリゴｄＴ、ランダムプライマー、オリゴｄＴとランダムプライマーの混合物、または標的遺伝子座特異的プライマーを使って行うことができる。混入ゲノムＤＮＡの増幅を避けるために、ＲＴ−ＰＣＲ用のプライマーは、１個のプライマーの一部が、１個のエキソンの３’末端にハイブリダイズし、他のプライマーの一部が隣接エキソンの５’末端にハイブリダイズするように設計できる。このようなプライマーは、スプライスされたｍＲＮＡから合成されたｃＤＮＡにアニールするが、ゲノムＤＮＡにはアニールしない。混入ＤＮＡの増幅を検出するために、ＲＴ−ＰＣＲプライマー対を、少なくとも１個のイントロンを含む領域の側に配置されるように設計できる。ｃＤＮＡ（イントロン不含）から増幅された産物は、ゲノムＤＮＡ（イントロン含有）から増幅されたものより小さい。産物のサイズ差を使って混入ＤＮＡの存在が検出される。いくつかの実施形態では、ｍＲＮＡ配列のみが既知である場合、少なくとも３００〜４００塩基対離れているプライマーアニーリング部位が選択される。理由は、真核生物ＤＮＡ由来のこのサイズのフラグメントは、スプライスジャンクションを含む可能性があるためである。あるいは、試料をＤＮＡ分解酵素で処理して混入ＤＮＡを分解できる。

代表的父子鑑定方法
非常に多くの標的遺伝子座を一度に分析できるために、（例えば、２０１１年１２月２２日出願の米国特許公開第２０１２／０１２２７０１号を参照。この特許は、参照によりその全体が本明細書に組み込まれる）本発明の多重ＰＣＲ法を使って父子鑑定の正確度を改善できる。例えば、多重ＰＣＲ法は、数千の多形遺伝子座（例えば、ＳＮＰ）を本明細書記載のＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴアルゴリズム中で使用するために分析して父親とされる人が胎児の生物学上の父親であるかどうかを判定することを可能とする。いくつかの実施形態では、前記方法は、（ｉ）父親とされる人由来の遺伝物質上の少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座を含む複数の多形遺伝子座を同時に増幅して第１の増幅産物集合を生成するステップと、（ｉｉ）妊娠中の母親の血液試料由来の胎児ＤＮＡおよび母系ＤＮＡを含む混合ＤＮＡ試料の対応する複数の多形遺伝子座を同時に増幅して第２の増幅産物集合を生成するステップと、（ｉｉｉ）第１および第２の増幅産物集合に基づく遺伝子型測定値を使って父親とされる人が胎児の生物学上の父親である確率をコンピュータで算出するステップと、（ｉｖ）父親とされる人が胎児の生物学上の父親であることに関する算出された確率を使って父親とされる人が胎児の生物学上の父親かどうかを確定するステップとを含む。種々の実施形態では、前記方法は、母親由来の遺伝物質上の対応する複数の多形遺伝子座を同時に増幅して第３の増幅産物集合を生成するステップをさらに含み、この場合、第１、第２、および第３の増幅産物集合に基づく遺伝子型測定値を使って父親とされる人が胎児の生物学上の父親である確率が算出される。

代表的胚キャラクタリゼーションおよび選択方法
本発明の多重ＰＣＲ法を使って数千の標的遺伝子座を一度に分析可能とすることにより、インビトロ受精用の胚の選択を改善できる（例えば、２００８年５月２７日出願、２０１１年１２月２２日出願の米国特許公開第２０１１／００９２７６３号を参照。この特許は、参照によりその全体が本明細書に組み込まれる）。例えば、多重ＰＣＲ法は、本明細書で記載のＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴアルゴリズムで使用するための数千の多形遺伝子座（例えば、ＳＮＰ）を分析可能として、胚の集合からインビトロ受精用の胚の選択を行うことができる。

いくつかの実施形態では、本発明は、胚集合由来のそれぞれの胚を所望の通り発生させる相対的尤度を推定する方法を提供する。いくつかの実施形態では、前記方法は、それぞれの胚由来の試料を、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させてそれぞれの胚の混合物を生成するステップを含み、試料は、それぞれ、胚由来の１個または複数個の細胞から得られる。いくつかの実施形態では、それぞれの反応混合物は、プライマー伸長反応条件に供されて増幅産物を生成する。いくつかの実施形態では、前記方法は、コンピュータでそれぞれの胚由来の少なくとも１個の細胞の１つまたは複数の特性を増幅産物に基づいて決定するステップと、それぞれの胚を所望の通り発生させる相対的尤度をそれぞれの胚に対する少なくとも１個の細胞の１つまたは複数の特性に基づいてコンピュータで推定するステップとを含む。いくつかの実施形態では、前記方法は、インフォマティクスベースの方法を使用して少なくとも１つの特性、例えば、本明細書で記載のＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴアルゴリズムを決定するステップを含む。いくつかの実施形態では、特性は、倍数性状態を含む。いくつかの実施形態では、特性は、異数体、正倍数体、モザイク、零染色体性、モノソミー、片親ダイソミー、トリソミー、テトラソミー、異数性のタイプ、不一致コピーエラートリソミー、一致コピーエラートリソミー、母体起源の異数性、父系起源の異数性、疾患連鎖遺伝子の存在の有無、全ての正倍数体染色体の染色体同一性、異常遺伝子状態、欠失または複製、特性の尤度、およびこれらの組み合わせからなる群より選択される。特性は、染色体１、染色体２、染色体３、染色体４、染色体５、染色体６、染色体７、染色体８、染色体９、染色体１０、染色体１１、染色体１２、染色体１３、染色体１４、染色体１５、染色体１６、染色体１７、染色体１８、染色体１９、染色体２０、染色体２１、染色体２２、Ｘ染色体またはＹ染色体、およびこれらの組み合わせ、からなる群より選択される染色体に関連するものであってよい。

代表的出生前診断法
本発明の多重ＰＣＲ法を使用して、胎児染色体の倍数性状態の判定などの出生前診断法を改善できる。同時に増幅される多数の標的遺伝子座を考慮すれば、より正確な判定を行うことが可能である。

ある実施形態では、本開示は、ＤＮＡの混合試料（すなわち、胎児の母親由来のＤＮＡ、および胎児由来のＤＮＡ）から測定された遺伝子型データから、および必要に応じて、母親由来の遺伝物質および場合によっては同様に父親由来の遺伝物質の試料から測定された遺伝子型データから、妊娠中の胎児における染色体の倍数性状態を決定するためのエクスビボ方法であって、前記決定を、同時分布モデルを用い、親の遺伝子型データを考慮して、胎児における可能性のある異なる倍数性状態についての予測される対立遺伝子分布の集合を作製し、予測される対立遺伝子分布と、混合試料において測定された実際の対立遺伝子分布とを比較し、予測される対立遺伝子分布パターンが観察された対立遺伝子分布パターンと最も厳密に一致する倍数性状態を選択することによって行う方法を提供する。ある実施形態では、混合試料は、母系の血液または母系の血清もしくは血漿に由来する。ある実施形態では、ＤＮＡの混合試料を、標的遺伝子座(例えば、複数の多型遺伝子座）で優先的に富化することができる。ある実施形態では、優先的な富化は、対立遺伝子の偏りが最小限になるように行う。ある実施形態では、本開示は、複数の遺伝子座において対立遺伝子の偏りが少なくなるように優先的に富化されたＤＮＡの組成に関する。ある実施形態では、対立遺伝子分布（複数可）を、混合試料由来のＤＮＡについてシークエンシングによって測定する。ある実施形態では、同時分布モデルにより、対立遺伝子が二項様式で分布することが仮定される。ある実施形態では、種々の供給源からの現存の組換え頻度を考慮して、例えば、ＩｎｔｅｒｎａｔｉｏｎａｌＨａｐＭａｐＣｏｎｓｏｒｔｉｕｍからのデータを使用して、遺伝的に連鎖している遺伝子座について予測同時対立遺伝子分布の集合を作製する。

ある実施形態では、本開示は、非侵襲的な出生前診断（ＮＰＤ）の方法、詳細には、ＤＮＡ混合物について測定された遺伝子型データにおいて複数の多型遺伝子座における対立遺伝子測定値を観察することによって胎児の異数性状態を決定するための方法であって、ある特定の対立遺伝子測定値により異数体の胎児が示され、一方、他の対立遺伝子測定値により正倍数性の胎児が示される示す方法を提供する。ある実施形態では、遺伝子型データを、母系の血漿に由来するＤＮＡ混合物についてシークエンシングによって測定する。ある実施形態では、ＤＮＡ試料を、対立遺伝子分布を算出する複数の遺伝子座に対応するＤＮＡ分子について優先的に富化することができる。ある実施形態では、母親由来の遺伝物質のみを含む、または、ほぼ母親由来の遺伝物質のみを含むＤＮＡの試料を測定し、場合によっては、父親由来の遺伝物質のみを含む、または、ほぼ父親由来の遺伝物質のみを含むＤＮＡの試料も測定する。ある実施形態では、一方の親または両親の遺伝子測定値を推定される胎児画分と一緒に使用して、胎児における可能性のある異なる基礎をなす遺伝子の状態に対応する複数の予測される対立遺伝子分布を作製し、前記予測される対立遺伝子分布は、仮説と称することができる。ある実施形態では、母系の遺伝子データは、天然で排他的またはほぼ排他的に母系のものである遺伝物質を測定することによって決定するのではなく、母系ＤＮＡと胎児ＤＮＡの混合物を含む母系の血漿に対して行われる遺伝子測定から推定する。いくつかの実施形態では、仮説は、１個または複数個の染色体における胎児の倍数性、胎児のどの染色体のどのセグメントがどちらの親から遺伝したか、およびそれらの組み合わせを含んでよい。いくつかの実施形態では、胎児の倍数性状態は、観察された対立遺伝子測定値と、異なる仮説であって、前記仮説の少なくとも一部が、異なる倍数性状態に対応する仮説を比較し、観察された対立遺伝子測定値を考慮して、真である可能性が最も高い仮説に対応する倍数性状態を選択することによって決定する。ある実施形態では、この方法は、遺伝子座がホモ接合性であるかヘテロ接合性であるかにかかわらず、測定されたＳＮＰの一部または全部からの対立遺伝子測定データの使用を伴い、したがって、ヘテロ接合性のみである遺伝子座の対立遺伝子の使用は伴わない。この方法は、遺伝子データがただ１つの多型遺伝子座に関係する状況には適さない場合がある。この方法は、遺伝子データが、標的染色体に対して１０超の多型遺伝子座、または２０超の多型遺伝子座についてのデータを含む場合に特に有利である。この方法は、遺伝子データが、標的染色体に対して５０超の多型遺伝子座、１００超の多型遺伝子座、または標的染色体に対して２００超の多型遺伝子座についてのデータを含む場合に特に有利である。いくつかの実施形態では、遺伝子データは、標的染色体に対して５００超の多型遺伝子座、１，０００超の多型遺伝子座、２，０００超の多型遺伝子座、または、標的染色体に対して５，０００超の多型遺伝子座についてのデータを含んでよい。

ある実施形態では、本明細書に開示されている方法は、多型遺伝子座の各対立遺伝子の独立した観察の数の定量的尺度を提供する。これは、マイクロアレイまたは定性的ＰＣＲなどの、２つの対立遺伝子の比に関する情報をもたらすが、いずれかの対立遺伝子の独立した観察の数を定量化しない大多数の方法とは異なる。独立した観察の数に関する定量的情報をもたらす方法では、倍数性の算出には比のみを利用し、一方、定量的情報はそれ自体では有用ではない。独立した観察の数に関する情報を保持することの重要性を例示するために、２つの対立遺伝子、ＡおよびＢを有する試料の遺伝子座について考察する。第１の実験では２０の対立遺伝子Ａおよび２０の対立遺伝子Ｂを観察し、第２の実験では２００の対立遺伝子Ａおよび２００の対立遺伝子Ｂを観察する。どちらの実験でも、比（Ａ／（Ａ＋Ｂ））は０．５と等しいが、第２の実験は、第１の実験よりも対立遺伝子ＡまたはＢの頻度の確実性に関する多くの情報を伝える。別の研究者によるいくつかの方法は、個々の対立遺伝子からの対立遺伝子の比（チャネル比）（すなわちｘ_ｉ／ｙ_ｉ）を平均または合計し、この比を、参照染色体と比較するか、またはこの比が特定の状況でどのように挙動すると予想されるかに関する規則を用いるかのいずれかで解析することを伴う。このような方法では、対立遺伝子の重み付けを伴わず、各対立遺伝子についてほぼ同じ量のＰＣＲ産物を確実にすることができること、および全ての対立遺伝子が同じように挙動するはずであることが想定される。このような方法にはいくつもの不都合があり、より重要なことに、本開示の他の箇所で記載されているいくつもの改善を用いることが妨げられる。

ある実施形態では、本明細書に開示されている方法は、ダイソミーにおいて予測される対立遺伝子頻度分布ならびに減数分裂Ｉの間の染色体不分離、減数分裂ＩＩの間の染色体不分離、および／または胎児発生の初期の有糸分裂の間の染色体不分離によって生じるトリソミーの場合に予測され得る複数の対立遺伝子頻度分布を明確にモデリングする。なぜこれが重要であるかを例示するために、乗換えがない場合を考える：減数分裂Ｉの間の染色体不分離により、２つの異なる相同体が一方の親から遺伝によって受け継がれたトリソミーがもたらされ、対照的に、減数分裂ＩＩの間、または胎児発生の初期の有糸分裂の間の染色体不分離により、一方の親由来の同じ相同体の２つのコピーがもたらされることになる。各筋書きにより、各多型遺伝子座において、また遺伝連鎖に起因して、共同して考えられる全ての遺伝子座において、予測される対立遺伝子の異なる頻度がもたらされることになる。相同体間での遺伝物質の交換をもたらす乗換えにより、遺伝様式がより複雑になり、ある実施形態では、当該方法は、遺伝子座間の物理的な距離に加えて、組換え率の情報を使用することによってこれに適応する。ある実施形態では、減数分裂Ｉ時の染色体不分離と減数分裂ＩＩまたは有糸分裂時の染色体不分離との間の区別の改善を可能にするために、当該方法では、モデルに、セントロメアからの距離が増加するにつれて上昇する乗換えの確率を組み入れる。減数分裂ＩＩおよび有糸分裂時の染色体不分離は、有糸分裂時の染色体不分離により、一般には、１つの相同体の同一またはほぼ同一のコピーがもたらされるが、一方、減数分裂ＩＩ時の染色体不分離事象の後に存在する２つの相同体は、多くの場合、配偶子形成の間の１つまたは複数の乗換えに起因して異なるという事実によって区別することができる。

いくつかの実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子異数性に対応する理論的仮説と比較するステップを包含し、ヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップは包含しない。遺伝子座の数が約２０未満の場合、ヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップを含む方法を用いて行った倍数性の決定と、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的な対立遺伝子分布の仮説と比較することを含む方法を用いて行った倍数性の決定は、同様の結果をもたらし得る。しかし、遺伝子座の数が５０超である場合、これらの２つの方法は、有意に異なる結果をもたらす可能性があり、遺伝子座の数が４００超、１，０００超または２，０００超である場合、これらの２つの方法は、ますます有意に異なる結果をもたらす可能性が高い。これらの差は、各対立遺伝子の大きさを独立に測定すること、および比を総計または平均することを伴わずにヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップを含む方法が、同時分布モデルを用いること、連鎖解析を実施すること、二項分布モデルを用いること、および／または他の高度な統計学的技法を含めた技法を用いることを妨げるが、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的な対立遺伝子分布の仮説と比較するステップを含む方法を用いると、決定の正確度を実質的に上昇させることができるこれらの技法を用いることができるという事実に起因する。

ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、同時分布モデルを用いて正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。同時分布モデルの使用は、方法であって、多型遺伝子座を独立に処理することによってヘテロ接合率を決定する方法とは、得られた決定の正確度が有意に高いという点で異なり、それよりも有意に改善されている。いかなる特定の理論にも縛られることなく、それらの正確度が高い１つの理由は、同時分布モデルでは、ＳＮＰ間の連鎖、および成長して胎児になる胚を形成する配偶子を生じる減数分裂の間に起こった乗換えの尤度を考慮に入れることであると考えられる。１個または複数個の仮説について対立遺伝子測定値の予測される分布を作製する際に連鎖の概念を用いる目的は、それにより、連鎖を用いない場合よりも相当よい現実に対応する予測される対立遺伝子測定値分布の作製を可能にすることである。例えば、２つのＳＮＰが存在し、１および２は、互いに近くに位置し、母親は、一方の相同体上のＳＮＰ１がＡであり、ＳＮＰ２がＡであり、相同体２上のＳＮＰ１がＢであり、ＳＮＰ２がＢであると考える。父親が、両方の相同体上の両方のＳＮＰについてＡであり、胎児のＳＮＰ１についてＢが測定された場合、これは、相同体２を胎児が遺伝によって受け継いだこと、したがって、胎児のＳＮＰ２にＢが存在する尤度がはるかに高いことを示す。連鎖を考慮に入れたモデルではこれが予測されるが、連鎖を考慮に入れないモデルでは予測されない。あるいは、母親のＳＮＰ１がＡＢであり、近くのＳＮＰ２がＡＢである場合、その場所における母系トリソミーに対応する２つの仮説−一致コピーエラー（減数分裂ＩＩまたは胎児発生初期の有糸分裂における染色体不分離）を伴うもの、および不一致コピーエラー（減数分裂Ｉにおける染色体不分離）を伴うものを用いることができる。一致コピーエラートリソミーの場合には、胎児が、ＳＮＰ１において母親からＡＡを遺伝によって受け継いだ場合、胎児は、ＳＮＰ２において母親から、ＡＢではなく、ＡＡまたはＢＢのいずれかを遺伝によって受け継ぐ可能性がはるかに高い。不一致コピーエラーの場合には、胎児は、両方のＳＮＰにおいて母親からＡＢを遺伝によって受け継ぐことになる。連鎖を考慮に入れた、倍数性コール方法によって立てられた対立遺伝子分布の仮説により、これらの予測がなされ、したがって、連鎖を考慮に入れなかった倍数性コール方法よりも相当に大きな程度で、実際の対立遺伝子測定値に対応する。連鎖手法は、対立遺伝子の比を算出することおよびそれらの対立遺伝子の比を総計することに依拠する方法を用いる場合には不可能であることに留意されたい。

観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的仮説と比較するステップを含む方法を用いる倍数性の決定の正確度がより高いと考えられる１つの理由は、配列決定を使用して対立遺伝子を測定する場合、この方法では、リードの総数が他の方法よりも少ない場合に、対立遺伝子からのデータから、より多くの情報を収集することができることであり、例えば、対立遺伝子の比を算出することおよび総計することに依拠する方法では、不釣り合いに重み付けられた確率論的ノイズが生じる。例えば、配列決定を用いて対立遺伝子を測定することを伴う場合であって、各遺伝子座についてシーケンスリードが５つのみ検出された遺伝子座の集合が存在する場合を考える。ある実施形態では、対立遺伝子のそれぞれについて、データを、仮定された対立遺伝子分布と比較し、シーケンスリード数に従って重み付けることができ、したがって、これらの測定からのデータは、適切に重み付けられ、全体的な決定に組み入れられる。これは、ヘテロ接合性遺伝子座における対立遺伝子の比を定量することを伴う方法が、可能性のある対立遺伝子の比として０％、２０％、４０％、６０％、８０％または１００％の比しか算出することができず、これらはいずれも予測される対立遺伝子の比には近づくことができないので、上記方法とは対照的である。この後者の場合、算出された対立遺伝子の比は、リードが不十分なので棄却しなければならないか、あるいは、不相応に重み付けされ、確率論的ノイズが決定に導入され、それにより、決定の正確度が低下する。ある実施形態では、個々の対立遺伝子測定を、独立した測定として処理することができ、この場合、同じ遺伝子座の対立遺伝子に対して行った測定間の関係が、異なる遺伝子座の対立遺伝子に対して行った測定間の関係と異ならない。

ある実施形態では、本明細書に開示されている方法は、任意のメトリックを、ダイソミーであることが予想される参照染色体において観察された対立遺伝子測定値と比較するステップ（ＲＣ法と称される）を包含せずに、観察された対立遺伝子測定値の分布により、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。これは、疑わしい染色体から無作為に配列決定された断片の割合を、１個または複数個の推測ダイソミー参照染色体と比較して評価することによって異数性を検出する、ショットガン配列決定を用いる方法などの方法に対する有意な改善である。このＲＣ法では、推測ダイソミー参照染色体が実際にはダイソミーではない場合、不正確な結果がもたらされる。これは、異数性が、単一染色体のトリソミーより実質的である場合、または胎児が三倍体であり、全ての常染色体がトリソミーである場合に起こり得る。雌性三倍体（６９、ＸＸＸ）胎児の場合には、実際は、ダイソミー染色体は全く存在しない。本明細書に記載の方法は、参照染色体を必要とせず、雌性三倍体胎児におけるトリソミー染色体を正確に同定することができる。染色体、仮説、子の割合（ｃｈｉｌｄｆｒａｃｔｉｏｎ）およびノイズレベルのそれぞれについて、同時分布モデルを、参照染色体のデータ、全体的な子の割合の見積もりまたは固定された参照仮説のいずれも伴わずに適合させることができる。

ある実施形態では、本明細書に開示されている方法は、観察されている多型遺伝子座における対立遺伝子分布をどのように使用して、先行技術の方法よりも高い正確度で胎児の倍数性状態を決定することができるかを実証している。ある実施形態では、前記方法は、標的化配列決定を用いて、複数のＳＮＰにおける混合母体−胎児遺伝子型、および必要に応じて、母親の遺伝子型および／または父親の遺伝子型を得て、最初に異なる仮説の下での種々の予測される対立遺伝子頻度分布を確立すること、次いで、母体−胎児混合物において得られる定量的な対立遺伝子の情報を観察すること、および、どの仮説がデータに最もよく適合するかを評価することを用い、データに最もよく適合する仮説に対応する遺伝子の状態を正確な遺伝子の状態としてコールする。ある実施形態では、本明細書に開示されている方法は、コールされた遺伝子の状態が正確な遺伝子の状態であることの信頼度を生成するために、適合の程度も用いる。ある実施形態では、本明細書に開示されている方法は、親の状況が異なる遺伝子座に関して見いだされる対立遺伝子の分布を解析するアルゴリズムを使用するステップ、および異なる親の状況（異なる親の遺伝子型のパターン）についての、異なる倍数性状態について、観察された対立遺伝子分布を、予測される対立遺伝子分布と比較するステップを包含する。これは、母体−胎児混合試料中の各遺伝子座における各対立遺伝子の独立した事例の数を推定することができる方法を用いない方法とは異なり、それよりも改善されている。ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、母親がヘテロ接合性である遺伝子座において測定された、観察された対立遺伝子分布を用いて、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。これは、その特定の標的個体に対して情報価値が高いことが知られていない遺伝子座についてＤＮＡが優先的に富化されていない場合、または優先的に富化されている場合、倍数性の決定において、配列データの集合から約２倍の遺伝子測定データを用いることが可能になり、それにより、より正確な決定がもたらされるので、母親がヘテロ接合性である遺伝子座における観察された対立遺伝子分布を用いない方法とは異なり、それよりも改善されている。

ある実施形態では、本明細書に開示されている方法は、天然では、各遺伝子座における対立遺伝子頻度が多項式（したがって、ＳＮＰが二対立遺伝子である場合は二項式）であると仮定する同時分布モデルを用いる。いくつかの実施形態では、同時分布モデルは、ベータ二項分布を使用する。各遺伝子座に存在する各対立遺伝子についての定量的尺度を提供する配列決定などの測定技法を用いる場合、二項モデルを、各遺伝子座に適用することができ、対立遺伝子頻度の基礎をなす程度およびその頻度の信頼度を確かめることができる。対立遺伝子の比から倍数性コールを生成する当技術分野で公知の方法または定量的な対立遺伝子情報が棄却される方法を用いて、観察された比の確実性を確かめることができない。当該方法は、特定の遺伝子座における対立遺伝子の比を算出し、次いでそれらの比を総計することを伴う任意の方法では、任意の所与の対立遺伝子または遺伝子座からのＤＮＡの量を示す測定された強度または計数値がガウス様式で分布することを必ず仮定するので、対立遺伝子の比を算出し、それらの比を総計して倍数性コールを行う方法とは異なり、それよりも改善されている。本明細書に開示されている方法は、対立遺伝子の比を算出することを伴わない。いくつかの実施形態では、本明細書に開示されている方法は、複数の遺伝子座の各対立遺伝子の観察結果の数をモデルに組み入れるステップを包含し得る。いくつかの実施形態では、本明細書に開示されている方法は、予測される分布自体を算出するステップであって、それにより、対立遺伝子測定値のガウス分布を仮定するモデルのいずれよりも正確であり得る同時二項分布（ｊｏｉｎｔｂｉｎｏｍｉａｌｄｉｓｔｒｉｂｕｔｉｏｎ）モデルを用いることが可能になるステップを包含し得る。二項分布モデルがガウス分布よりも有意に正確である尤度は、遺伝子座の数が増加するにつれて増大する。例えば、２０未満の遺伝子座を調べる場合、二項分布モデルが有意にすぐれている尤度は低い。しかし、１００超、または特に４００超、または特に１，０００超、または特に２，０００超の遺伝子座を使用すると、二項分布モデルの、ガウス分布モデルよりも有意に正確である尤度は非常に高くなり、それにより、より正確な倍数性の決定がもたらされる。二項分布モデルがガウス分布よりも有意に正確である尤度は、同様に、各遺伝子座における観察結果の数が増加するにつれて増大する。例えば、各遺伝子座において１０未満の別個の配列を観察する場合、二項分布モデルが有意にすぐれている尤度は低い。しかし、各遺伝子座について５０超のシーケンスリード、または特に１００超のシーケンスリード、または特に２００超のシーケンスリード、または特に３００超のシーケンスリードを使用すると、二項分布モデルの、ガウス分布モデルよりも有意に正確である尤度は非常に高くなり、それにより、より正確な倍数性の決定がもたらされる。

ある実施形態では、本明細書に開示されている方法では、配列決定を用いて、ＤＮＡ試料中の各遺伝子座における各対立遺伝子の事例の数を測定する。シーケンシングリードのそれぞれは、特定の遺伝子座にマッピングし、バイナリーのシーケンスリードとして処理することができる、あるいは、リードおよび／またはマッピングの同一性の確率を、シーケンスリードの一部として組み入れることができ、その結果、確率的なシーケンスリード、すなわち所与の遺伝子座にマッピングされるシーケンスリードの推定の整数または分数がもたらされる。バイナリーの計数値または計数値の確率を使用すると、測定値の各集合について二項分布を用いることが可能であり、これにより、計数値の範囲の（ａｒｏｕｎｄｔｈｅｎｕｍｂｅｒｏｆｃｏｕｎｔｓ）信頼区間を算出することが可能になる。二項分布を用いることができることにより、より正確な倍数性の推定およびより精度の高い信頼区間を算出することが可能になる。これは、存在する対立遺伝子の量を測定するために強度を用いる方法、例えば、マイクロアレイを用いる方法、または電気泳動のバンドにおいて蛍光性タグを付けたＤＮＡの強度を測定するために蛍光リーダーを用いて測定を行う方法とは異なり、それよりも改善されている。

ある実施形態では、本明細書に開示されている方法では、本データの集合の態様を用いて、そのデータの集合についての推定される対立遺伝子頻度分布のパラメータを決定する。これは、本予測される対立遺伝子頻度分布または場合によっては予測される対立遺伝子の比のパラメータを設定するために、トレーニングデータ集合または事前データ集合を利用する方法よりも改善されている。これは、あらゆる遺伝子試料の収集および測定に関与する異なる状態の集合が存在することが原因であり、したがって、当該データの集合からのデータを使用して、その試料についての倍数性の決定に使用するためのものである同時分布モデルのパラメータを決定する方法がより正確になりやすい。

ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、最尤法を用いて、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。最尤法を用いることは、得られる決定の正確度が有意に高いという点で、単一仮説棄却法を用いる方法とは異なり、それよりも有意に改善されている。１つの理由は、単一仮説棄却法では、２つの測定値分布ではなく、ただ１つの測定値分布に基づいてカットオフ閾値が設定される、つまり、閾値が通常は最適ではないことである。別の理由は、最尤法では、個々の試料の各々の特定の特性にかかわらず全ての試料に対して使用されるカットオフ閾値を決定するのではなく、個々の試料の各々についてカットオフ閾値を最適化することが可能になることである。別の理由は、最尤法を用いることにより、各倍数性コールについて信頼度を算出することが可能になることである。各コールに対して信頼度の算出を行うことができることにより、実践者が、どのコールが正確であるか、およびどれが誤りである可能性がより高いかを知ることが可能になる。いくつかの実施形態では、多種多様な方法を最尤推定法と組み合わせて、倍数性コールの正確度を増強することができる。ある実施形態では、最尤法を、米国特許第７，８８８，０１７号に記載の方法と組み合わせて用いることができる。ある実施形態では、最尤法を、標的ＰＣＲ増幅を用いて混合試料中のＤＮＡを増幅し、その後、リード計数方法、例えば、２０１１年１０月のＭｏｎｔｒｅａｌでのＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｇｒｅｓｓｏｆＨｕｍａｎＧｅｎｅｔｉｃｓ２０１１年において発表されたＴＡＮＤＥＭＤＩＡＧＮＯＳＴＩＣＳを用いて配列決定し分析する方法と組み合わせて用いることができる。ある実施形態では、本明細書に開示されている方法は、混合試料中のＤＮＡの胎児画分を推定するステップ、およびその推定値を用いて倍数性コールと倍数性コールの信頼度の両方を算出するステップを包含する。これは、推定される胎児画分を十分な胎児画分のスクリーニングとして用い、その後、胎児画分を考慮に入れず、コールについての信頼度の算出も生じない単一仮説棄却法を用いて倍数性コールを行う方法とは異なり、かつその方法とは区別されることに留意されたい。

ある実施形態では、本明細書に開示されている方法は、各測定値に確率を付与することによってデータがノイズを伴い、エラーを含有する傾向を考慮に入れる。付与された確率的な推定値を伴う測定データを使用して立てられた仮説の集合から正確な仮説を選択するために最尤法を用いることにより、不正確な測定値が考慮に入れられない可能性が高くなり、倍数性コールを導く算出において正確な測定値が用いられる。より精度が高くあるために、この方法では、倍数性の決定において不正確に測定されたデータの影響を系統的に低下させる。これは、全てのデータが同等に正確であると仮定される方法または範囲外のデータが倍数性コールを導く算出から任意に排除される方法よりも改善されている。チャネル比測定値を用いる現行の方法は、個々のＳＮＰチャネル比を平均することによってこの方法を多数のＳＮＰに拡張することを主張する。ＳＮＰの質および観察されたリード深度に基づいて予測される測定値の分散によって個々のＳＮＰに重み付けをしないことにより、生じた統計量の正確度が低下し、その結果、倍数性コールの正確度が、特に境界の場合に有意に低下する。

ある実施形態では、本明細書に開示されている方法は、胎児においてどのＳＮＰまたは他の多型遺伝子座がヘテロ接合性であるかの知見を前提としない。この方法により、父系の遺伝子型の情報が入手不可能である場合に倍数性コールを行うことが可能になる。これは、標的とする遺伝子座を適切に選択するため、または混合胎児ＤＮＡ／母系ＤＮＡ試料に対して得た遺伝子測定値を解釈するために、どのＳＮＰがヘテロ接合性であるかの知見が前もって知られていなければならない方法よりも改善されている。

本明細書に記載の方法は、利用可能なＤＮＡが少量である試料、または胎児ＤＮＡのパーセントが低い試料に対して用いる場合に特に有利である。これは、少量のＤＮＡしか利用可能でない場合に生じる、対立遺伝子ドロップアウト率が相応して高いこと、および／または胎児ＤＮＡと母系ＤＮＡの混合試料中の胎児ＤＮＡのパーセントが低い場合に胎児の対立遺伝子ドロップアウト率が相応して高いことに起因する。対立遺伝子ドロップアウト率が高いこと、つまり、標的個体について、対立遺伝子の大部分が測定されなかったことにより、不十分に正確な胎児画分の算出、および不十分に正確な倍数性の決定がもたらされる。本明細書に開示されている方法は、ＳＮＰ間の遺伝様式における連鎖を考慮に入れた同時分布モデルを用いることができるので、有意により正確な倍数性の決定を行うことができる。本明細書に記載の方法により、混合物中の胎児性のＤＮＡ分子のパーセントが４０％未満、３０％未満、２０％未満、１０％未満、８％未満、さらには６％未満である場合に、正確な倍数性の決定を行うことが可能になる。

ある実施形態では、個体のＤＮＡが関連する個体のＤＮＡと混在している場合の測定値に基づいて個体の倍数性状態を決定することが可能である。ある実施形態では、ＤＮＡの混合物は、母系の血漿中に見いだされる浮動性ＤＮＡであり、これは、既知の核型および既知の遺伝子型を有する母親由来のＤＮＡを含んでもよく、また、未知の核型および未知の遺伝子型を有する胎児ＤＮＡと混在してもよい。一方の親または両親からの既知の遺伝子型の情報を用いて、混合試料中のＤＮＡの複数の潜在的な遺伝子の状態を、異なる倍数性状態、各親から胎児への異なる染色体の寄与、および必要に応じて、混合物中の異なる胎児ＤＮＡの割合について予測することが可能である。潜在的な組成のそれぞれは、仮説と称することができる。次いで、胎児の倍数性状態を、実際の測定値について調べ、観察されたデータを考慮してどの潜在的な組成が最も可能性が高いかを決定することによって決定することができる。

上記の点のさらなる考察は、本文書の他の箇所に見いだすことができる。

非侵襲的な出生前診断（ＮＰＤ）
非侵襲的な出生前診断のプロセスは、いくつものステップを伴う。ステップのいくつかとしては、（１）胎児から遺伝物質を得るステップと、（２）混合試料中に存在する可能性がある胎児の遺伝物質をエクスビボで富化するステップと、（３）遺伝物質をエクスビボで増幅するステップと、（４）遺伝物質の特定の遺伝子座をエクスビボで優先的に富化するステップと、（５）遺伝物質をエクスビボで測定するステップと、（６）遺伝子型データを、エクスビボで、コンピュータで分析するステップとを挙げることができる。これらの６つおよび他の関連性のあるステップの実施を減少させるための方法が本明細書に記載されている。前記方法のステップの少なくとも一部は、直接体には適用されない。ある実施形態では、本開示は、体から単離され、分離された組織および他の生物材料に適用される処置および診断の方法に関する。前記方法のステップの少なくとも一部は、コンピュータで実行される。

本開示のいくつかの実施形態により、臨床医は母親が妊娠中の胎児の遺伝子の状態を非侵襲的に決定することが可能になり、それにより、胎児の遺伝物質を採取することによって乳児の健康が危険にさらされることがなく、また、母親が侵襲的手順を受ける必要がない。さらに、ある特定の態様では、本開示により、胎児の遺伝子の状態を、高い正確度、例えば、出生前ケアに広く用いられているトリプルテストの、非侵襲的な母系の血清分析物に基づくスクリーニングよりも有意に高い正確度で決定することが可能になる。

本明細書に開示されている方法の正確度が高いことは、本明細書に記載の、遺伝子型データを分析するためのインフォマティクス手法の結果である。現代の技術的な進歩により、ハイスループット配列決定および遺伝子型決定アレイなどの方法を用いて遺伝子試料から大量の遺伝子情報を測定することができるようになった。本明細書に開示されている方法により、臨床医は利用可能な大量のデータをより大きく活用すること、および胎児の遺伝子の状態のより正確な診断を行うことが可能になる。いくつもの実施形態の詳細が下に示されている。異なる実施形態は、上述のステップの異なる組み合わせを包含し得る。異なるステップの異なる実施形態の種々の組み合わせを互換的に用いることができる。

ある実施形態では、妊娠中の母親から血液試料を取得し、母体起源のＤＮＡ、および胎児起源のＤＮＡの両方の混合物を含有する母親の血液の血漿中の浮動性ＤＮＡを単離し、胎児の倍数性状態を決定するために使用する。ある実施形態では、本明細書に開示されている方法は、多型対立遺伝子に対応するＤＮＡの混合物中のＤＮＡ配列を、対立遺伝子の比および／または対立遺伝子分布が、富化に際してほとんど変わらないままであるように、優先的に富化するステップを包含する。ある実施形態では、本明細書に開示されている方法は、生じた分子の非常に高い百分率が、標的の遺伝子座に対応するように、非常に効率的な標的ＰＣＲに基づく増幅を伴う。ある実施形態では、本明細書に開示されている方法は、母体起源のＤＮＡ、および胎児起源のＤＮＡの両方を含有するＤＮＡの混合物について配列決定するステップを包含する。ある実施形態では、本明細書に開示されている方法は、測定された対立遺伝子分布を用いて、母親が妊娠中の胎児の倍数性状態を決定するステップを包含する。ある実施形態では、本明細書に開示されている方法は、決定された倍数性状態を臨床医に報告するステップを包含する。ある実施形態では、本明細書に開示されている方法は、臨床的措置をとるステップ、例えば、絨毛膜絨毛採取または羊水穿刺の侵襲的検査の経過観察を実施するステップ、トリソミーの個体の誕生の準備をするステップ、またはトリソミーの胎児の選択的中絶を包含する。

本出願は、２００６年１１月２８日出願の米国実用新案出願第１１／６０３，４０６号（米国特許出願公開第：２００７０１８４４６７）；２００８年３月１７日出願の米国実用新案出願第１２／０７６，３４８号（米国特許出願公開第：２００８０２４３３９８）；２００９年８月４日出願のＰＣＴ出願第ＰＣＴ／ＵＳ０９／５２７３０号（ＰＣＴ公開第ＷＯ／２０１０／０１７２１４号）；２０１０年９月３０日出願のＰＣＴ出願第ＰＣＴ／ＵＳ１０／０５０８２４号（ＰＣＴ公開第ＷＯ／２０１１／０４１４８５号）、２０１１年５月１８日出願の米国実用新案出願第１３／１１０，６８５号、および２０１２年１０月３日出願のＰＣＴ出願第ＰＣＴ／ＵＳ１２／５８５７８号を参照する。これらの特許は、その全体が参照により本明細書に組み込まれる。本出願において使用される語彙のいくつかは、これらの参考文献にその前例を有し得る。本明細書に記載の概念のいくつかは、これらの参考文献に見いだされる概念に照らして、よりよく理解することができる。

浮動性胎児ＤＮＡを含む母系の血液のスクリーニング
本明細書に記載の方法を用いて、標的の遺伝物質が、ある量の他の遺伝物質の存在下で見いだされる、子、胎児または他の標的個体の遺伝子型の決定を補助することができる。いくつかの実施形態では、遺伝子型とは、１個または複数個の染色体の倍数性状態を指してもよく、１つまたは複数の疾患連鎖対立遺伝子またはそのいくつかの組み合わせを指してもよい。本開示では、考察は、胎児ＤＮＡが母系の血液中に見いだされる場合に胎児の遺伝子の状態を決定することに焦点が当てられるが、この例は、この方法を適用することができる可能性のある状況に限定することを示していない。さらに、前記方法は、標的ＤＮＡの量が非標的ＤＮＡに対していかなる割合で存在する場合にも適用可能であり、例えば、標的ＤＮＡは、存在するＤＮＡの０．０００００１％から９９．９９９９９９％の間のいずれを構成してもよい。さらに、非標的ＤＮＡは、関連性のある非標的個体（複数可）の一部または全部からの遺伝子データが既知である限りは、必ずしも１つの個体由来である必要はなく、さらには関連する個体由来である必要はない。ある実施形態では、本明細書に開示されている方法を用いて、胎児ＤＮＡを含有する母系の血液から胎児の遺伝子型データを決定することができる。前記方法は、妊娠中の女性の子宮内に複数の胎児がいる場合、または他の混入ＤＮＡ、例えば、他の既に生まれている同胞由来のＤＮＡが試料に存在する可能性がある場合にも用いることができる。

この技法は、胎児の血液細胞が胎盤絨毛を通じて母系の循環に進入する現象を用いることができる。普通は、胎児の細胞の非常に少数のみが、このように母系の循環に入る（胎児母体間出血についてのＫｌｅｉｈａｕｅｒ−Ｂｅｔｋｅ検査で陽性になるには不十分である）。胎児の細胞を選別し、さまざまな技法によって解析して特定のＤＮＡ配列を探すことができるが、侵襲的手順が本質的に有するリスクは伴わない。この技法は、問題の胎盤組織が胎児と同じ遺伝子型のＤＮＡを含有する場合、胎盤組織のアポトーシス後のＤＮＡ放出によって浮動性胎児ＤＮＡが母系の循環に進入する現象も用いることができる。母系の血漿中に見いだされる浮動性ＤＮＡは、３０〜４０％の胎児ＤＮＡと同程度の割合で胎児ＤＮＡを含有することが示されている。

ある実施形態では、血液を妊娠中の女性から抜き取ることができる。研究により、母系の血液は、母体起源の浮動性ＤＮＡに加えて、胎児由来の少量の浮動性ＤＮＡを含有し得ることが示された。さらに、母体起源の多くの血液細胞に加えて、胎児起源のＤＮＡを含む脱核胎児血液細胞も存在してよく、これは、一般には、核ＤＮＡを含有しない。胎児ＤＮＡを単離するまたは胎児ＤＮＡが富化された画分を作製するための当技術分野で公知の多くの方法が存在する。例えば、クロマトグラフィーにより、胎児ＤＮＡが富化された特定の画分が作製されることが示されている。

比較的非侵襲的に抜き取られ、ある量の胎児ＤＮＡを、細胞性または浮動性のいずれかで、その母系ＤＮＡに対する割合に富化されて、またはその元の比率のいずれかで含有する母系の血液、血漿または他の体液の試料を手にしたら、前記試料中に見いだされるＤＮＡの遺伝子型を決定することができる。いくつかの実施形態では、血液は、血液を静脈、例えば、尺側皮静脈から回収するための針を使用して抜き取ることができる。本明細書に記載の方法を用いて、胎児の遺伝子型データを決定することができる。例えば、前記方法を用いて、１個または複数個の染色体における倍数性状態を決定することができ、前記方法を用いて、挿入、欠失、および転座を含め、１つのＳＮＰまたはＳＮＰの集合の同一性を決定することができる。前記方法を用いて、１個または複数個の遺伝子型の形体の起源である親を含めた１個または複数個のハプロタイプを決定することができる。

この方法は、任意の遺伝子型決定および／または配列決定方法、例えば、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭＡＲＲＡＹプラットフォーム、ＡＦＦＹＭＥＴＲＩＸＧＥＮＥＣＨＩＰ、ＩＬＬＵＭＩＮＡＧＥＮＯＭＥＡＮＡＬＹＺＥＲまたはＬＩＦＥＴＥＣＨＮＯＬＧＩＥＳ’ ＳＯＬＩＤＳＹＳＴＥＭに使用することができる任意の核酸を用いて機能する点に留意されたい。これは、血漿から抽出された浮動性ＤＮＡまたはその増幅物（例えば、全ゲノム増幅、ＰＣＲ）；他の細胞型（例えば、全血由来のヒトリンパ球）由来のゲノムＤＮＡまたはその増幅物を含む。ＤＮＡを調製するために、これらのプラットフォームのうちの１つに適したゲノムＤＮＡを生成する任意の抽出または精製方法も同様に機能する。この方法は、ＲＮＡの試料を用いて同等に良好に機能し得る。ある実施形態では、試料の保管は、分解が最小限になるように行ない得る（例えば、約−２０℃またはそれよりも低い温度で凍結下）。

親支援
いくつかの実施形態は、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）（ＰＳ）法と組み合わせて用いることができ、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）（ＰＳ）法の複数の実施形態は、その全体が参照により本明細書に組み込まれる、米国特許出願第１１／６０３，４０６号（米国特許出願公開第２００７０１８４４６７号）、米国特許出願第１２／０７６，３４８号（米国特許出願公開第２００８０２４３３９８号）、米国特許出願第１３／１１０，６８５号、ＰＣＴ出願第ＰＣＴ／ＵＳ０９／５２７３０号（ＰＣＴ公開第ＷＯ／２０１０／０１７２１４号）、およびＰＣＴ出願第ＰＣＴ／ＵＳ１０／０５０８２４号（ＰＣＴ公開第ＷＯ／２０１１／０４１４８５号）に記載されている。これらの特許は、その全体が参照により本明細書に組み込まれる。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、遺伝子データを解析するために使用することができる、インフォマティクスに基づく手法である。いくつかの実施形態では、本明細書に開示されている方法は、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法の一部とみなすことができる。いくつかの実施形態では、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法は、標的個体の遺伝子データを高い正確度で、その個体由来の１つまたは少数の細胞の遺伝子データ、または標的個体由来のＤＮＡおよび１個または複数個の他の個体由来のＤＮＡからなるＤＮＡの混合物の遺伝子データを決定するため、詳細には、標的個体における疾患関連対立遺伝子、他の対象の対立遺伝子、および／または１個または複数個の染色体の倍数性状態を決定するために使用することができる方法の集合である。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）とは、これらの方法のいずれも指し得る。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、インフォマティクスに基づく方法の例である。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法の代表的実施形態は、図２９〜３１Ｇに図示され、また、実験１９に記載されている。

ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法では、既知の親の遺伝子データ、すなわち母親および／または父親のハプロタイプおよび／または二倍体の遺伝子データを、減数分裂の機構および標的ＤＮＡの不完全な測定、および場合によっては１つまたは複数の関連する個体の知見と共に、集団に基づく乗換え頻度と一緒に、インシリコで、複数の対立遺伝子における遺伝子型、および／または胚または任意の標的細胞（複数可）の倍数性状態、および重要な遺伝子座に対して位置を決める標的ＤＮＡを高い程度の信頼度で再構築するために使用する。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法により、不十分に測定された一塩基多型（ＳＮＰ）だけでなく、挿入および欠失、ならびに全く測定されなかったＳＮＰまたはＤＮＡの全領域も再構築することができる。さらに、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法により、単一細胞から、複数の疾患連鎖遺伝子座の測定ならびに異数性についてのスクリーニングの両方を行うことができる。いくつかの実施形態では、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法を用いて、１個または複数個の細胞の遺伝子の状態を決定するために、ＩＶＦサイクルの間に生検された胚由来の１個または複数個の細胞を特徴付けることができる。

ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法により、ノイズを伴う遺伝子データをクリーニングすることが可能になる。これは、関連する個体（親）の遺伝子型を参照として用いて、標的ゲノム（胚）における正確な遺伝子の対立遺伝子を推定することによって行ない得る。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、少量の遺伝物質しか利用可能でない場合（例えば、ＰＧＤ）、および遺伝物質の量が限られていることに起因して遺伝子型の直接的な測定が本質的にノイズを伴う場合に特に適し得る。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、利用可能な遺伝物質のごく一部のみが標的個体由来である場合（例えば、ＮＰＤ）、および別の個体由来の混入ＤＮＡシグナルに起因して遺伝子型の直接的な測定が本質的にノイズを伴う場合に特に適し得る。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法により、従来の順序づけられていない二倍体測定値は対立遺伝子のドロップアウト、ドロップイン、可変性の増幅の偏りおよび他のエラーの率が高いことによって特徴付けることができるが、胚上に非常に正確な規則正しい二倍体の対立遺伝子配列を、染色体セグメントのコピー数と共に再構築することができる。前記方法では、基礎をなす遺伝子モデルおよび基礎をなす測定エラーのモデルの両方を使用することができる。遺伝子モデルにより、各ＳＮＰにおける対立遺伝子の確率およびＳＮＰ間の乗換え確率の両方を決定することができる。対立遺伝子の確率は、各ＳＮＰにおいて親から得られたデータに基づいてモデリングすることができ、ＩｎｔｅｒｎａｔｉｏｎａｌＨａｐＭａｐＰｒｏｊｅｃｔにより開発されたＨａｐＭａｐデータベースから得られたデータに基づいてＳＮＰ間の乗換え確率をモデリングすることができる。適切な基礎をなす遺伝子モデルおよび測定エラーモデルを考慮すると、最大事後（ＭＡＰ）推定を、計算的に効率的にするための改変を伴って用いて、正確な、胚の各ＳＮＰにおける規則正しい対立遺伝子値を推定することができる。

上で概説した技法により、いくつかの場合には、個体の遺伝子型を、その個体に由来する非常に少量のＤＮＡを考慮して決定することができる。これは、１つまたは少数の細胞由来のＤＮＡであってよい、または、母系の血液中に見いだされる少量の胎児ＤＮＡ由来であってよい。

仮説
本開示との関連において、仮説とは、可能性のある遺伝子の状態を指す。仮説とは、可能性のある倍数性状態を指し得る。仮説とは、可能性のある対立遺伝子の状態を指し得る。仮説の集合とは、可能性のある遺伝子の状態の集合、可能性のある対立遺伝子の状態の集合、可能性のある倍数性状態の集合、またはそれらの組み合わせを指し得る。いくつかの実施形態では、仮説の集合は、集合からの１つの仮説が、任意の所与の個体の実際の遺伝子の状態に対応するように設計することができる。いくつかの実施形態では、仮説の集合は、あらゆる可能性のある遺伝子の状態が、集合からの少なくとも１つの仮説によって記載することができるように設計することができる。本開示のいくつかの実施形態では、方法の一態様は、どの仮説が問題の個体の実際の遺伝子の状態に対応するかを決定することである。

本開示の別の実施形態では、１つのステップは仮説を作製するステップを包含する。いくつかの実施形態では、仮説は、コピー数仮説であってよい。いくつかの実施形態では、仮説は、関連する個体のそれぞれ由来のどの染色体のセグメントが、もしあれば、他の関連する個体のどのセグメントに遺伝的に対応するかに関する仮説を包含する。仮説を作製することとは、変数の限度を、考慮中の可能性のある遺伝子の状態の全集合がそれらの変数に包含されるように設定する行為を指し得る。

「コピー数仮説」は、「倍数性仮説」または「倍数性状態仮説」とも称され、標的個体における所与の染色体コピー、染色体型または染色体のセクションについての可能性のある倍数性状態に関する仮説を指し得る。これは、個体の２種以上の染色体型における倍数性状態を指す場合もある。コピー数仮説の集合とは、仮説の集合を指してもよく、各仮説は、個体における可能性のある異なる倍数性状態に対応する。仮説の集合は、可能性のある倍数性状態の集合、可能性のある親のハプロタイプの寄与の集合、混合試料中の可能性のある胎児ＤＮＡの百分率の集合、またはそれらの組み合わせに関するものであってもよい。

正常な個体は、各親由来の各染色体型のうちの１つを含有する。しかし、減数分裂および有糸分裂におけるエラーに起因して、個体が、各親由来の所与の染色体型を０個、１個、２個、またはそれより多くを有する可能性がある。実際には、親由来の所与の染色体が３つ以上認められることはまれである。本開示では、いくつかの実施形態では、所与の染色体の０コピー、１コピーまたは２コピーが親に由来する、可能性のある仮説のみを考慮し、親を起源とするいくらか可能性のあるコピーを考慮することは自明の拡張である。いくつかの実施形態では、所与の染色体に対して、可能性のある仮説が９つある：母体起源の０個の染色体、１個の染色体または２個の染色体に関する３つの可能性のある仮説に父系起源の０個の染色体、１個の染色体または２個の染色体に関する３つの可能性のある仮説を掛け合わせたもの。（ｍ，ｆ）を、ｍが母親から遺伝によって受け継がれた所与の染色体の数であり、およびｆが父親から遺伝によって受け継がれた所与の染色体の数である仮説を指すものとする。したがって、９つの仮説は、（０、０）、（０、１）、（０、２）、（１、０）、（１、１）、（１、２）、（２、０）、（２、１）、および（２、２）である。これらは、Ｈ_００、Ｈ_０１、Ｈ_０２、Ｈ_１０、Ｈ_１２、Ｈ_２０、Ｈ_２１、およびＨ_２２と記載することもできる。．異なる仮説は、異なる倍数性状態に対応する。例えば、（１、１）とは、通常のダイソミー染色体を指し、（２、１）とは、母系トリソミーを指し、（０、１）とは、父系モノソミーを指す。いくつかの実施形態では、２つの染色体が一方の親から遺伝によって受け継がれ、１つの染色体が他方の親から遺伝によって受け継がれる場合は、２つの場合にさらに分けられ得る：２つの染色体が同一である場合（一致コピーエラー）と、２つの染色体が相同であるが同一ではない場合（不一致コピーエラー）。これらの実施形態では、可能性のある仮説が１６ある。他の仮説の集合、および異なる数の仮説を使用することが可能であることが理解されるべきである。

本開示のいくつかの実施形態では、倍数性仮説とは、他の関連する個体由来の染色体のいずれが、標的個体のゲノムに見いだされる染色体に対応するかに関する仮説を指す。いくつかの実施形態では、方法の鍵となるのは、関連する個体がハプロタイプブロックを共有することが予測され得るという事実であり、関連する個体から測定された遺伝子データを、どのハプロタイプブロックが標的個体と関連する個体との間で一致するかの知見と一緒に用いると、標的個体の遺伝子測定値を単独で用いるよりも高い信頼度で標的個体についての正確な遺伝子データを推論することが可能である。従って、いくつかの実施形態では、倍数性仮説は、染色体の数だけでなく、関連する個体のどの染色体が、標的個体の１個または複数個の染色体と同一またはほぼ同一であるかに関し得る。

仮説の集合が定義されたら、アルゴリズムが入力遺伝子データに対して作動すると、考慮中の仮説のそれぞれについて、決定された統計学的な確率が出力され得る。種々の仮説の確率は、種々の仮説のそれぞれについて、専門技法、アルゴリズム、および／または本開示の他の箇所に記載されている方法のうちの１つまたは複数により示された確率が等しい値を、関連性のある遺伝子データを入力として用いて数学的に算出することによって決定することができる。

複数の技法によって決定された通り、異なる仮説の確率が推定されたら、それらを組み合わせることができる。これは、各仮説について、各技法によって決定された確率を掛け算することを必要とし得る。仮説の確率の積を正規化することができる。１つの倍数性仮説は、染色体についての１つの可能性のある倍数性状態を指す。

「確率の組み合わせ」プロセスは、「仮説の組み合わせ」または専門技法の結果の組み合わせとも称され、線形代数の当業者によく知られているはずの概念である。１つの可能性のある確率の組み合わせ方は以下の通りである：専門技法を用いて、遺伝子データの集合を考慮して仮説の集合を評価する場合、方法の出力は、仮説の集合内の各仮説と１対１で関連する確率の集合である。そのそれぞれが集合内の仮説のうちの１つと関連づけられる、第１の専門技法によって決定された確率の集合を、そのそれぞれが同じ仮説の集合と関連づけられる、第２の専門技法によって決定された確率の集合と組み合わせる場合、確率の２つの集合を掛け算する。これは、集合内の各仮説について、２つの専門方法によって決定された、その仮説と関連づけられる２つの確率を掛け合わせ、対応する積が出力確率であることを意味する。このプロセスは、任意の数の専門技法に拡大することができる。ただ１つの専門技法を用いる場合、出力確率は入力確率と同じである。３つ以上の専門技法を用いる場合、関連性のある確率を同時に掛け算することができる。積は、仮説の集合内の仮説の確率が合計で１００％になるように正規化することができる。

いくつかの実施形態では、所与の仮説についての複合確率が他の仮説のいずれかについての複合確率を超える場合、その仮説が、最も可能性が高いと決定されるとみなすことができる。いくつかの実施形態では、正規化された確率が閾値を超えた場合、仮説を、最も可能性が高いと決定することができ、倍数性状態または他の遺伝子の状態をコールすることができる。ある実施形態では、これは、その仮説に関連づけられる染色体の数および同一性を、倍数性状態としてコールすることができることを意味し得る。ある実施形態では、これは、その仮説に関連づけられる対立遺伝子の同一性を、対立遺伝子の状態としてコールすることができることを意味し得る。いくつかの実施形態では、閾値は、約５０％から約８０％の間であり得る。いくつかの実施形態では、閾値は、約８０％から約９０％の間であり得る。いくつかの実施形態では、閾値は、約９０％から約９５％の間であり得る。いくつかの実施形態では、閾値は、約９５％から約９９％の間であり得る。いくつかの実施形態では、閾値は、約９９％から約９９．９％の間であり得る。いくつかの実施形態では、閾値は、約９９．９％超であり得る。

親の状況
親の状況とは、標的の２体の親の一方または両方についての、２つの関連性のある染色体のそれぞれの所与の対立遺伝子の遺伝子の状態を指す。ある実施形態では、親の状況とは、標的の対立遺伝子の状態を指すのではなく、親の対立遺伝子の状態を指すことに留意されたい。所与のＳＮＰについての親の状況は、父系の２つと母系の２つの、４塩基対からなってよく、これらは互いに同じであってよい、または異なってよい。「ｍ_１ｍ_２｜ｆ_１ｆ_２」と書くことが一般的であり、ここでｍ_１およびｍ_２は、２つの母系染色体上の所与のＳＮＰの遺伝子の状態であり、ｆ_１およびｆ_２は２つの父系染色体上の所与のＳＮＰの遺伝子の状態である。いくつかの実施形態では、親の状況は、「ｆ_１ｆ_２｜ｍ_１ｍ_２」と書くことができる。下付き文字の「１」および「２」は、第１の染色体および第２の染色体の所与の対立遺伝子における遺伝子型を示すことに留意されたい。どの染色体を「１」とし、どの染色体を「２」とするかの選択は任意であることにも留意されたい。

本開示では、塩基対の同一性を一般的に示すために、多くの場合、ＡおよびＢを使用することに留意されたい；ＡまたはＢは、Ｃ（シトシン）、Ｇ（グアニン）、Ａ（アデニン）またはＴ（チミン）を同等に上手く示すことができる。例えば、所与のＳＮＰに基づく対立遺伝子において、母親の遺伝子型が１つの染色体上のそのＳＮＰにおいてＴであり、相同染色体上のそのＳＮＰにおいてＧであり、その対立遺伝子における父親の遺伝子型が、相同染色体の両方のそのＳＮＰにおいてＧであった場合、標的個体の対立遺伝子が親の状況ＡＢ｜ＢＢを有するということができ、対立遺伝子が親の状況ＡＢ｜ＡＡを有するということもできる。理論上、４種の可能性のあるヌクレオチドはいずれも所与の対立遺伝子に存在してもよく、したがって、例えば、所与の対立遺伝子において母親が遺伝子型ＡＴを有し、父親が遺伝子型ＧＣを有する可能性があることに留意されたい。しかし、経験的なデータにより、ほとんどの場合、所与の対立遺伝子において４種の可能性のある塩基対のうち２種のみが観察されることが示されている。例えば、単一のタンデム反復を用いた場合、２超、４超、さらには１０超の親の状況を有する可能性がある。本開示の考察では、所与の対立遺伝子において２種の可能性のある塩基対のみが観察されると仮定するが、本明細書に開示されている実施形態は、この仮定が当てはまらない場合を考慮に入れるように改変することができる。

「親の状況」とは、同じ親の状況を有する標的ＳＮＰの集合またはサブセットを指し得る。例えば、標的個体の所与の染色体上の１０００個の対立遺伝子を測定する場合、状況ＡＡ｜ＢＢとは、標的の母親の遺伝子型がホモ接合性であり、標的の父親の遺伝子型がホモ接合性であるが、その遺伝子座における母系の遺伝子型と父系の遺伝子型が同様でない、１，０００個の対立遺伝子群内の全ての対立遺伝子の集合を示し得る。親のデータについて相が特定されない、したがって、ＡＢ＝ＢＡである場合は、可能性のある親の状況は９ある：ＡＡ｜ＡＡ、ＡＡ｜ＡＢ、ＡＡ｜ＢＢ、ＡＢ｜ＡＡ、ＡＢ｜ＡＢ、ＡＢ｜ＢＢ、ＢＢ｜ＡＡ、ＢＢ｜ＡＢ、およびＢＢ｜ＢＢ。親のデータについて相が特定される、したがって、ＡＢ≠ＢＡである場合は、可能性のある異なる親の状況が１６ある：ＡＡ｜ＡＡ、ＡＡ｜ＡＢ、ＡＡ｜ＢＡ、ＡＡ｜ＢＢ、ＡＢ｜ＡＡ、ＡＢ｜ＡＢ、ＡＢ｜ＢＡ、ＡＢ｜ＢＢ、ＢＡ｜ＡＡ、ＢＡ｜ＡＢ、ＢＡ｜ＢＡ、ＢＡ｜ＢＢ、ＢＢ｜ＡＡ、ＢＢ｜ＡＢ、ＢＢ｜ＢＡ、およびＢＢ｜ＢＢ。性染色体上の一部のＳＮＰを除いて、染色体上のあらゆるＳＮＰ対立遺伝子が、これらの親の状況のうちの１つを有する。一方の親についての親の状況がヘテロ接合性であるＳＮＰの集合は、ヘテロ接合性の状況と称することができる。

ＮＰＤにおける親の状況の使用
非侵襲的な出生前診断は、非侵襲的に、例えば、妊娠中の母親に対する採血によって得られる遺伝物質から胎児の遺伝子の状態を決定するために用いることができる重要な技法である。血液を分離し、血漿単離し、その後血漿ＤＮＡを単離することができる。サイズ選択を用いて、適切な長さのＤＮＡを単離することができる。ＤＮＡを遺伝子座の集合において優先的に富化することができる。次いで、このＤＮＡを、遺伝子型決定アレイにハイブリダイズさせ、蛍光を測定することによって、またはハイスループットシーケンサーでシークエンシングによる、いくつもの手段によって測定することができる。

非侵襲的な出生前診断との関連において胎児の倍数性コールのために配列決定を使用する場合、配列データを使用するいくつもの方法がある。配列データを使用することができる最も一般的な方法は、単に所与の染色体にマッピングされるリード数をカウントすることである。例えば、胎児の第２１染色体の倍数性状態を決定しようとすると考える。さらに、試料中のＤＮＡの１０％が胎児起源のＤＮＡで構成され、９０％が母体起源のＤＮＡで構成されると考える。この場合、ダイソミーであることが予測され得る染色体、例えば、第３染色体のリードの平均の数を調べ、それを、リードを独特の配列の一部である染色体上の塩基対の数について調整した第２１染色体上のリード数と比較する。胎児が正倍数性であった場合、ゲノムの単位当たりのＤＮＡの量は全ての場所においてほぼ同等であることが予想される（確率的変動を受けやすい）。他方では、胎児が第２１染色体においてトリソミーであった場合、第２１染色体由来の遺伝単位当たりのＤＮＡがゲノムの他の場所よりもわずかに多いことが予想される。詳細には、混合物中の第２１染色体由来のＤＮＡが約５％多いことが予想される。配列決定を使用してＤＮＡを測定する場合、独特のセグメント当たりの第２１染色体由来の独自にマッピング可能なリードが他の染色体由来のものよりも約５％多いことが予想される。ある特定の閾値よりも多い量の特定の染色体由来のＤＮＡの観察を、その染色体に独自にマッピング可能な配列の数について調整した場合に、異数性を診断するための基礎として使用することができる。異数性を検出するために使用することができる別の方法は、親の状況を考慮に入れることができること以外は上記のものと同様である。

どの対立遺伝子を標的とするかを考える際、一部の親の状況が、他よりも情報価値がある可能性がある尤度を考慮に入れることができる。例えば、ＡＡ｜ＢＢおよび対称の状況ＢＢ｜ＡＡでは、胎児が母親とは異なる対立遺伝子を保有することが既知であるので、最も情報価値のある状況である。対称性の理由で、ＡＡ｜ＢＢ状況とＢＢ｜ＡＡ状況はどちらもＡＡ｜ＢＢと称することができる。情報価値のある親の状況の別の集合はＡＡ｜ＡＢおよびＢＢ｜ＡＢであり、これは、これらの場合、胎児が、母親が有さない対立遺伝子を保有する見込みが５０％であるからである。対称性の理由で、ＡＡ｜ＡＢ状況とＢＢ｜ＡＢ状況はどちらも、ＡＡ｜ＡＢと称することができる。情報価値のある親の状況の第３の集合はＡＢ｜ＡＡおよびＡＢ｜ＢＢであり、これは、これらの場合、胎児が既知の父系対立遺伝子を保有し、その対立遺伝子が母系ゲノムにも存在するからである。対称性の理由で、ＡＢ｜ＡＡ状況とＡＢ｜ＢＢ状況は、ＡＢ｜ＡＡと称することができる。第４の親の状況はＡＢ｜ＡＢであり、ここでは胎児は未知の対立遺伝子の状態を有し、対立遺伝子の状態がいかなるものでも、それは、母親が同じ対立遺伝子を有するものである。第５の親の状況はＡＡ｜ＡＡであり、ここでは母親および父親がヘテロ接合性である。

ここで開示されている実施形態の異なる実行
標的個体の倍数性状態を決定するための方法が本明細書に開示されている。標的個体は、割球、胚または胎児であってよい。本開示のいくつかの実施形態では、標的個体における１個または複数個の染色体の倍数性状態を決定するための方法は、本文書に記載のステップのいずれか、およびそれらの組み合わせを包含し得る：

いくつかの実施形態では、胎児の遺伝子の状態を決定することにおいて使用する遺伝物質の供給源は、母系の血液から単離された胎児有核赤血球などの胎児の細胞であってよい。前記方法は、妊娠中の母親由来の血液試料を得るステップを包含し得る。前記方法は、視覚的な技法を用いて、色の特定の組み合わせは有核赤血球と独自に関連づけられ、色の同様の組み合わせは母系の血液中に存在する任意の他の細胞には関連づけられないというアイデアに基づいて胎児の赤血球を単離するステップを包含し得る。有核赤血球に関連づけられる色の組み合わせは、染色することによってより区別可能にすることができる核の周りのヘモグロビンの赤色、および、例えば青色に染色することができる核材料の色を含んでよい。母系の血液から細胞を単離し、それをスライドに広げ、次いで、赤色（ヘモグロビン由来）と青色（核材料由来）の両方が認められる点を同定することにより、有核赤血球の場所を同定することが可能となり得る。次いで、これらの有核赤血球を、マイクロマニピュレーターを使用して抽出し、遺伝子型決定および／または配列決定技法を用いて、これらの細胞の遺伝物質の遺伝子型の態様を測定することができる。

ある実施形態では、胎児のヘモグロビンの存在下でのみ蛍光を発し、母系のヘモグロビンの存在下では蛍光を発しない色素を用いて有核赤血球を染色し、したがって、有核赤血球が、母親に由来するかまたは胎児に由来するかの多義性を除くことができる。本開示のいくつかの実施形態は、染色または他の方法で核材料に印をつけることを伴ってよい。本開示のいくつかの実施形態は、胎児の細胞に特異的な抗体を使用して胎児核材料に特異的に印をつけることを伴ってよい。

胎児の細胞を母系の血液から単離するため、または胎児ＤＮＡを母系の血液から単離するため、または母系遺伝物質の存在下で胎児の遺伝物質の試料を富化するための多くの方法がある。これらの方法のいくつかがここに列挙されているが、これは網羅的な列挙を意図したものではない。便宜上、一部の適切な技法がここに列挙されている：蛍光で、または別の方法でタグを付けた抗体、サイズ排除クロマトグラフィー、磁気で、または他の方法で標識したアフィニティータグ、後成的な差異、例えば、特定の対立遺伝子における母系の細胞と胎児の細胞の間の示差的なメチル化、密度勾配遠心分離に続くＣＤ４５／１４枯渇およびＣＤ４５／１４陰性細胞からのＣＤ７１陽性選択、異なる重量オスモル濃度を用いた一重または二重のＰｅｒｃｏｌｌ勾配またはガラクトース特異的レクチン法。

本開示のある実施形態では、標的個体は胎児であり、胎児由来の複数のＤＮＡ試料に対して異なる遺伝子型測定を行う。本開示のいくつかの実施形態では、胎児ＤＮＡ試料は単離された胎児の細胞由来であり、その胎児の細胞は、母系の細胞と混在している可能性がある。本開示のいくつかの実施形態では、胎児ＤＮＡ試料は浮動性胎児ＤＮＡ由来であり、その胎児ＤＮＡは、浮動性母系ＤＮＡと混在している可能性がある。いくつかの実施形態では、胎児ＤＮＡ試料は、母系ＤＮＡと胎児ＤＮＡの混合物を含有する母系の血漿または母系の血液から得ることができる。いくつかの実施形態では、胎児ＤＮＡは、母系ＤＮＡと、９９．９：０．１％〜９９：１％；９９：１％〜９０：１０％；９０：１０％〜８０：２０％；８０：２０％〜７０：３０％；７０：３０％〜５０：５０％；５０：５０％〜１０：９０％；または１０：９０％〜１：９９％；１：９９％〜０．１：９９．９％、の範囲の母体：胎児比で混在している可能性がある。

標的個体および／または関連する個体の遺伝子データは、これらに限定されないが、遺伝子型決定マイクロアレイ、およびハイスループット配列決定を含めた群から選択されるツールおよび、または技法を用いて適切な遺伝物質を測定することによって、分子的状態から電子的状態に変換することができる。いくつかのハイスループット配列決定方法としては、サンガーＤＮＡ配列決定、パイロシークエンシング、ＩＬＬＵＭＩＮＡＳＯＬＥＸＡプラットフォーム、ＩＬＬＵＭＩＮＡのＧＥＮＯＭＥＡＮＡＬＹＺＥＲまたはＡＰＰＬＩＥＤＢＩＯＳＹＳＴＥＭの４５４配列決定プラットフォーム、ＨＥＬＩＣＯＳのＴＲＵＥＳＩＮＧＬＥＭＯＬＥＣＵＬＥＳＥＱＵＥＮＣＩＮＧプラットフォーム、ＨＡＬＣＹＯＮＭＯＬＥＣＵＬＡＲの電子顕微鏡配列決定法または任意の他の配列決定法が挙げられる。これらの方法は全て、ＤＮＡの試料に保存されている遺伝子データを、一般には、途中でメモリデバイスに保存されて加工される遺伝子データの集合に物理的に変換する。

関連性のある個体の遺伝子データは、これらに限定されないが、個体のバルク二倍体組織、個体由来の１個または複数個の二倍体細胞、個体由来の１個または複数個の一倍体細胞、標的個体由来の１個または複数個の割球、個体において見いだされる細胞外遺伝物質、母系の血液中に見いだされる個体由来の細胞外遺伝物質、母系の血液中に見いだされる個体由来の細胞、関連する個体由来の配偶子（複数可）から作製される１個または複数個の胚、そのような胚から取得した１個または複数個の割球、関連する個体において見いだされる細胞外遺伝物質、関連する個体を起源とすることが既知である遺伝物質、およびそれらの組み合わせを含めた群から選択される物質を分析することによって測定することができる。

いくつかの実施形態では、標的個体の対象の染色体型のそれぞれについて、少なくとも１つの倍数性状態仮説の集合を作製することができる。倍数性状態仮説はそれぞれ、標的個体の染色体または染色体セグメントの１つの可能性のある倍数性状態を指し得る。仮説の集合は、標的個体の染色体が有すると予測することができる、可能性のある倍数性状態の一部または全部を含んでよい。可能性のある倍数性状態のいくつかは、零染色体性、モノソミー、ダイソミー、片親性ダイソミー、正倍数性、トリソミー、一致トリソミー、不一致トリソミー、母系トリソミー、父系トリソミー、テトラソミー、平衡（２：２）テトラソミー、不平衡（３：１）テトラソミー、ペンタソミー、ヘキサソミー、他の異数性、およびそれらの組み合わせを含んでよい。これらの異数性状態はいずれも、混在していてよい、または、部分的な異数性、例えば、不平衡転座、平衡転座、ロバートソン転座、組換え、欠失、挿入、乗換え、およびそれらの組み合わせであってよい。

いくつかの実施形態では、決定された倍数性状態の知見を使用して、臨床的決定を行うことができる。この知見は、一般には、事項の物理的配列としてメモリデバイスに保存され、次いで、報告に変換することができる。次いで、報告は実行され得る。例えば、臨床的決定は、妊娠中絶することであってよい、あるいは、臨床的決定は、妊娠を継続することであってよい。いくつかの実施形態では、臨床的決定は、遺伝的障害の表現型の発現の重症度を低下させるために設計された介入、または特別支援児（ｓｐｅｃｉａｌｎｅｅｄｓｃｈｉｌｄ）に対する準備をするための関連性のあるステップを取る決定を伴ってよい。

本開示のある実施形態では、本明細書に記載の任意の方法は、複数の標的が、同じ標的個体、例えば、同じ妊娠中の母親からの複数の採血に由来することを可能にするために改変することができる。これにより、複数の遺伝子測定によって標的遺伝子型を決定することができるより多くのデータがもたらされ得るので、モデルの正確度を改善することができる。ある実施形態では、１つの標的遺伝子データの集合は、報告された一次データとしての機能を果たし、他の標的遺伝子データの集合は、一次標的遺伝子データを再確認するためのデータとしての機能を果たす。ある実施形態では、標的個体から取得した遺伝物質からそれぞれ測定された複数の遺伝子データの集合を並行して考慮し、したがって、両方の標的遺伝子データの集合は、高い正確度で測定された親の遺伝子データのどのセクションが胎児のゲノムを構成するかを決定するための助けとして機能する。

ある実施形態では、前記方法を、父子試験のために使用することができる。例えば、母親から、および遺伝学的父親である、またはそうでない可能性がある男性からのＳＮＰに基づく遺伝子型の情報ならびに混合試料から測定された遺伝子型の情報を考慮すると、その男性の遺伝子型の情報が実際に妊娠中の胎児の実際の遺伝学的父親を表しているかどうかを決定することが可能である。これを行うための単純な方法は、単に、母親がＡＡであり、可能性のある父親がＡＢまたはＢＢである状況について検査することである。これらの場合、それぞれ、父親が２分の１回（ＡＡ｜ＡＢ）または常に（ＡＡ｜ＢＢ）寄与することを予想することができる。予測ＡＤＯを考慮に入れると、観察される胎児のＳＮＰが、可能性のある父親のＳＮＰと相関するかどうかを決定することは簡単である。

本開示の一実施形態は以下の通りであってよい：妊娠中の女性が、自身の胎児がダウン症候群を患っているかどうか、および／または嚢胞性線維症を患っているかどうか知ることを望んでおり、その女性はこれらの状態のいずれかを患っている子を産むことを望んでいない。医師はその女性の血液を採り、ヘモグロビンを１つのマーカーではっきり赤色があらわれるように染色し、核材料を別のマーカーではっきり青色があらわれるように染色する。母系の赤血球は、一般には無核であるが、高い割合の胎児の細胞が核を含有することが公知であるので、医師は、赤色および青色の両方を示す細胞を同定することにより、いくつもの有核赤血球を視覚的に単離することができる。医師は、これらの細胞を、マイクロマニピュレーターでスライドから取り出し、検査室に送り、そこで１０個の個々の細胞を増幅し、遺伝子型決定する。遺伝子測定を使用することによって、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法で、細胞１０個のうち６個が母系の血液細胞であり、細胞１０個のうち４個が胎児の細胞であることを決定することができる。妊娠中の母親に既に子が生まれている場合、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、胎児の細胞に対して信頼できる対立遺伝子コールを行い、それらが生まれた子の対立遺伝子と同様でないことを示すことによって、胎児の細胞が生まれた子の細胞と別個のものであることを決定するためにも使用することができる。この方法は、本開示の父系検査実施形態と同様の概念であることに留意されたい。胎児の細胞から測定された遺伝子データは質が非常に悪い可能性があり、単一細胞の遺伝子型決定の難しさに起因して、多くの対立遺伝子ドロップアウトを含む。臨床医は、測定された胎児ＤＮＡを親の信頼できるＤＮＡ測定値と一緒に用い、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）を使用して胎児のゲノムの態様を高い正確度で推定し、それにより、胎児由来の遺伝物質に含有される遺伝子データを、コンピュータ上に保存される、予測される胎児の遺伝子の状態に変換することができる。臨床医は、胎児の倍数性状態と、複数の疾患連鎖対象遺伝子の存在または不在の両方とを決定することができる。胎児は正倍数性であり、嚢胞性線維症の保有者ではないことが分かり、母親は妊娠を継続することを決定する。

本開示のある実施形態では、妊娠中の母親は、自身の胎児がいずれかの全染色体異常を患っているかどうかを決定することを望んでいる。その女性は担当医師の所に行き、自身の血液の試料を提供し、また、その女性とその女性の夫は、頬スワブにより自身のＤＮＡの試料を提供する。検査室の研究者は、親のＤＮＡを増幅するためのＭＤＡプロトコールを使用し、多数のＳＮＰにおける親の遺伝子データを測定するためのＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭアレイを使用して、親のＤＮＡの遺伝子型決定を行う。次いで、研究者は血液を遠心沈澱し、血漿を採り、サイズ排除クロマトグラフィーを使用して浮動性ＤＮＡの試料を単離する。あるいは、研究者は、１個または複数個の蛍光抗体、例えば、胎児のヘモグロビンに特異的な抗体を使用して、胎児有核赤血球を単離する。次いで、研究者は、単離または富化された胎児の遺伝物質を取得し、それを、各オリゴヌクレオチドの２つの末端が標的対立遺伝子のいずれかの側の隣接配列に対応するように適切に設計された７０−マー（ｍｅｒ）のオリゴヌクレオチドのライブラリーを使用して増幅する。ポリメラーゼ、リガーゼ、および適切な試薬を添加すると、オリゴヌクレオチドはギャップ充填環状化、所望の対立遺伝子の捕捉を受けた。エキソヌクレアーゼを加え、熱失活させ、産物を直接ＰＣＲ増幅の鋳型として使用した。ＰＣＲ産物について、ＩＬＬＵＭＩＮＡＧＥＮＯＭＥＡＮＡＬＹＺＥＲで配列決定した。シーケンスリードをＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法のための入力として使用し、次いで、それにより胎児の倍数性状態を予測した。

別の実施形態では、母親が妊娠中であり、高齢出産である夫婦が、妊娠中の胎児がダウン症候群、ターナー症候群、プラダーウィリー症候群またはいくつかの他の全染色体異常を有するかどうかを知ることを望んでいる。産科医は、母親および父親から採血を行う。血液を検査室に送り、そこで、技師が母体試料を遠心分離して血漿およびバフィーコートを単離する。バフィーコート内のＤＮＡおよび父系の血液試料を増幅によって変換し、増幅された遺伝物質にコードされる遺伝子データを、遺伝物質をハイスループットシーケンサーにかけることによって、分子的に保存された遺伝子データから電子的に保存された遺伝子データにさらに変換して、親の遺伝子型を測定する。血漿試料を、５，０００プレックスヘミネステッド標的ＰＣＲ法を用いて、遺伝子座の集合において優先的に富化する。ＤＮＡ断片の混合物を、配列決定に適したＤＮＡライブラリーに調製する。次いで、ＤＮＡを、ハイスループット配列決定方法、例えば、ＩＬＬＵＭＩＮＡＧＡＩＩｘＧＥＮＯＭＥＡＮＡＬＹＺＥＲを用いて配列決定する。配列決定により、ＤＮＡ内に分子的にコードされている情報をコンピュータハードウェアに電子的にコードされる情報に変換する。ここで開示されている実施形態を含むインフォマティクスに基づく技法、例えば、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）を使用して、胎児の倍数性状態を決定することができる。これは、調製された試料に対して行ったＤＮＡ測定から、複数の多型遺伝子座における対立遺伝子数の確率をコンピュータで算出するステップと、それぞれが、染色体における可能性のある異なる倍数性状態に関連する、複数の倍数性仮説をコンピュータで作製するステップと、各倍数性仮説について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数についての同時分布モデルをコンピュータで構築するステップと、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、倍数性仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールするステップとを包含し得る。胎児がダウン症候群を有することが決定される。報告を印刷する、または妊娠中の女性の担当産科医に電子的に送信し、その産科医が診断をその女性に伝達する。その女性、その女性の夫、および医師は腰を据えて選択肢を議論する。夫婦は、胎児がトリソミーの状態を患っているという知見に基づいて、妊娠中絶することを決定する。

ある実施形態では、企業が、母系の採血から妊娠中の胎児における異数性を検出するために設計された診断技術を提供することを決定し得る。その産物により、母親が、該母親の血液を採取することができる担当産科医に来診することを必要とし得る。産科医は、胎児の父親からも遺伝子試料を収集することができる。臨床医は、母親の血液から血漿を単離し、血漿からＤＮＡを精製することができる。臨床医は、母親の血液からバフィーコート層を単離し、バフィーコートからＤＮＡを調製することもできる。臨床医は、父親の遺伝子試料からＤＮＡを調製することもできる。臨床医は、本開示に記載の分子生物学技法を用いて、血漿試料に由来するＤＮＡにおいてＤＮＡにユニバーサル増幅タグを付加することができる。臨床医は、ユニバーサルタグが付けられたＤＮＡを増幅することができる。臨床医は、ハイブリダイゼーションによる捕捉および標的ＰＣＲを含めたいくつもの技法によってＤＮＡを優先的に富化することができる。標的ＰＣＲは、ネスティング、ヘミネスティングまたはセミネスティングまたは血漿由来ＤＮＡの効率的な富化をもたらす任意の他の手法を伴ってよい。標的ＰＣＲにより、例えば、１反応体積で１０，０００個のプライマーを用いて大規模に多重化することができ、ここで、プライマーは、第１３染色体、第１８染色体、第２１染色体、Ｘ染色体上のＳＮＰおよびＸおよびＹの両方に共通し、必要に応じて、他の染色体にも共通する遺伝子座を標的とする。選択的な富化および／または増幅は、個々の分子それぞれに、異なるタグ、分子バーコード、増幅用タグ、および／または配列決定用タグを用いてタグ付けすることを伴ってよい。次いで、臨床医は血漿試料について配列決定し、また、場合によっては、調製された母系ＤＮＡおよび／または父系ＤＮＡをシークエンシングができる。分子生物学的ステップを、診断ボックスによって完全にまたは部分的に実行することができる。配列データを、単一のコンピュータに、または別の種類の計算プラットフォーム、例えば、「クラウド」において見出すことができるものに供給することができる。計算プラットフォームにより、シーケンサーによって行われた測定から標的の多型遺伝子座における対立遺伝子数を算出することができる。計算プラットフォームにより、第１３染色体、第１８染色体、第２１染色体、Ｘ染色体およびＹ染色体のそれぞれについての零染色体性、モノソミー、ダイソミー、一致トリソミー、および不一致トリソミーに関係する、複数の倍数性仮説を作製することができる。計算プラットフォームにより、調べられている５つの染色体のそれぞれに対して、各倍数性仮説に対して、染色体上の標的の遺伝子座における予測される対立遺伝子数についての同時分布モデルを構築することができる。計算プラットフォームにより、同時分布モデルおよび血漿試料に由来する優先的に富化されたＤＮＡに対して測定された対立遺伝子数を用いて、倍数性仮説のそれぞれが真である確率を決定することができる。計算プラットフォームにより、第１３染色体、第１８染色体、第２１染色体、Ｘ染色体およびＹ染色体のそれぞれについて、最大の確率を有する適切な仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールすることができる。コールされた倍数性状態を含む報告を作製することができ、それを産科医に電子的に送ること、出力デバイスに表示すること、または印刷した報告のハードコピーを産科医に送達することができる。産科医は、患者、および必要に応じて胎児の父親に知らせることができ、彼らは、どの臨床的な選択肢を受け入れられるか、およびどれが最も望ましいかを決定することができる。

別の実施形態では、以後「母親」と称される妊娠中の女性は、自身の胎児（複数可）がいずれかの遺伝子異常または他の状態を保有するか否か知りたいと決めることができる。母親は、いかなる全体的異常もないことを確実にしてから妊娠の継続を確信することを希望することができる。母親は、担当産科医のもとに行くことができ、担当産科医は、母親の血液の試料も採ることができる。担当産科医は、母親の頬からの頬スワブなどの遺伝子試料を採ることもできる。担当産科医は、胎児の父親からも遺伝子試料、例えば、頬スワブ、精子試料または血液試料を採ることができる。担当産科医は、試料を臨床医に送ることができる。臨床医は、母系の血液試料中の浮動性胎児ＤＮＡの画分を富化することができる。臨床医は、母系の血液試料中の脱核胎児血液細胞の画分を富化することができる。臨床医は、本明細書に記載の方法の種々の態様を用いて、胎児の遺伝子データを決定することができる。その遺伝子データは、胎児の倍数性状態、および／または胎児における１つまたはいくつもの疾患連鎖対立遺伝子の同一性を含み得る。出生前診断の結果が要約されている報告を作製することができる。報告は、医師に送達または郵送することができ、医師は、母親に胎児の遺伝子の状態を告げることができる。母親は、胎児が１個または複数個の染色体もしくは遺伝子の異常または望ましくない状態を有するという事実に基づいて、妊娠を中止することを決定することができる。母親は、同様に、胎児が、いかなる染色体全体もしくは遺伝子の異常またはいかなる対象の遺伝子の状態も有さないという事実に基づいて、妊娠を継続することを決定することができる。

別の例は、精子ドナーにより人工受精し、妊娠中である妊娠中の女性に関し得る。その女性は、自身が保有している胎児が遺伝病を有するリスクを最小限にすることを希望している。その女性は、静脈瀉血士による採血を受け、本開示に記載の技法を用いて、３つの胎児有核赤血球を単離し、組織試料も、母親および遺伝学的父親から採取する。胎児由来の遺伝物質ならびに母親および父親由来の遺伝物質を、必要に応じて増幅し、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭＢＥＡＤＡＲＲＡＹを用いて遺伝子型決定し、本明細書に記載の方法により親の遺伝子型および胎児の遺伝子型をきれいにし、高い正確度で相を特定し、ならびに、胎児についての倍数性コールを行う。胎児が正倍数性であることが見いだされ、再構築された胎児の遺伝子型から表現型による罹病性を予測し、報告を作製し、母親の担当医師に送り、したがって、彼らはどんな臨床的決定が最良であり得るかを決定することができる。

ある実施形態では、母親および父親の未処理の遺伝物質を、増幅によって、ある量の、配列は同様であるが量がより多いＤＮＡに変換する。次いで、遺伝子型決定方法により、核酸によりコードされる遺伝子型データを、上記のものなどのメモリデバイスに物理的かつ／または電子的に保存することができる遺伝子測定値に変換する。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）アルゴリズムを構成する関連性のあるアルゴリズムを、プログラミング言語を用いてコンピュータプログラムに翻訳するが、そのアルゴリズムの関連性のある部分は本明細書において詳細に考察されている。次いで、物理的にコードされるビットおよびバイトではなく、生の測定データを示すパターンに整理されているコンピュータハードウェアでコンピュータプログラムを実行することにより、胎児の倍数性状態の高い信頼度の決定を示すパターンに変換される。この変換の詳細は、本明細書に記載の方法を実行するために使用するデータ自体およびコンピュータ言語およびハードウェアシステムに依拠する。次いで、高い質の胎児の倍数性の決定を示すように物理的に構成されたデータを、健康管理実践者に送ることができる報告に変換する。この変換は、プリンタまたはコンピュータディスプレイを使用して行うことができる。報告は、紙または他の適切な媒体に印刷されたコピーであってよい、あるいは、報告は、電子的なものであってよい。電子報告の場合は、伝達することができ、健康管理実践者が利用できるコンピュータに位置するメモリデバイス上に物理的に保存することができる。電子報告は、読み取ることができるようにスクリーン上に表示することもできる。スクリーン表示の場合には、データは、表示デバイス上でピクセルの物理的変換を引き起こすことによって可読の形式に変換することができる。変換は、リン光性スクリーンに電子を物理的に発射することによって、光子を放出または吸収する基材の前に置くことができるスクリーン上のピクセルの特定の集合の透明度を物理的に変化させる電気的な電荷を変更することによって実現することができる。この変換は、ピクセルの特定の集合において、液晶中のナノスケールの分子の配向を、例えば、ネマティック相からコレステリック相またはスメクチックな相に変化させることによって実現することができる。この変換は、意味のあるパターンに配置された複数の発光ダイオードで構成されたピクセルの特定の集合からの光子の放出を引き起こす電流によって実現することができる。この変換は、情報を表示するために使用される任意の他の方法、例えば、コンピュータスクリーンまたはいくつかの他の出力デバイスまたは情報伝達法によって実現することができる。次いで、健康管理実践者は、報告にあるデータを措置に変換するように、報告に基づいて行動することができる。措置は、妊娠を継続または中止することであってよく、その場合、遺伝子の異常を有する妊娠中の胎児は、非生存胎児に変換される。本明細書において列挙されている変換は、例えば、妊娠中の母親および父親の遺伝物質を、本開示において概説されているいくつものステップを通じて、遺伝子の異常を有する胎児を流産することからなる、または妊娠を継続することからなる医学的な決定に変換することができるように総計することができる。あるいは、遺伝子型の測定値の集合を、医師が妊娠中の患者を処置することに役立つ報告に変換することができる。

本開示のある実施形態では、本明細書に記載の方法を用いて、宿主母親、すなわち妊娠中の女性が、自身が保有している胎児の生物学的母親ではない場合にでも、胎児の倍数性状態を決定することができる。本開示のある実施形態では、本明細書に記載の方法を用いて、母系の血液試料のみを使用し、父系の遺伝子試料を必要とせずに胎児の倍数性状態を決定することができる。

ここで開示されている実施形態における数学のいくつかにより、限られた数の異数性の状態に関する仮説が立てられる。いくつかの場合には、例えば、０、１つまたは２つの染色体のみが、各親を起源とすることが予測される。本開示のいくつかの実施形態では、本開示の基本的な概念を変化させることなく、数学的な導出を拡大して異数性の他の形態、例えば、３つの染色体が一方の親を起源とするクアドロソミー（ｑｕａｄｒｏｓｏｍｙ）、ペンタソミー、ヘキサソミーを考慮に入れることができる。同時に、より小さな数の倍数性状態、例えば、トリソミーおよびダイソミーのみに焦点を当てることが可能である。整数でない染色体を示す倍数性の決定は、遺伝物質の試料中のモザイク現象を示し得ることに留意されたい。

いくつかの実施形態では、遺伝子の異常は、ダウン症候群（または２１トリソミー）、エドワーズ症候群（１８トリソミー）、パトー症候群（１３トリソミー）、ターナー症候群（４５Ｘ）、クラインフェルター症候群（２つのＸ染色体を持つ男性）、プラダーウィリー症候群、およびディジョージ症候群（ＵＰＤ１５）などの異数性の一種である。前文に列挙されているものなどの先天性障害は、一般に望ましくなく、胎児が１つまたは複数の表現型の異常を患っているという知見により、妊娠中絶すること、特別支援児の誕生のための準備をするために必要な対策をとること、または染色体異常の重症度を減らすことを意図したいくつかの治療的手法をとることを決定するための基礎を提供することができる。

いくつかの実施形態では、本明細書に記載の方法を、非常に初期の妊娠期間、例えば、早ければ４週、早ければ５週、早ければ６週、早ければ７週、早ければ８週、早ければ９週、早ければ１０週、早ければ１１週、および早ければ１２週において用いることができる。

いくつかの実施形態では、本明細書に開示されている方法を、インビトロでの受精の間に胚を選択するための着床前遺伝子診断（ＰＧＤ）との関連において使用し、ここで、標的個体は胚であり、３日目の胚由来の単一細胞または２つの細胞の生検または５日目または６日目の胚の栄養外胚葉生検材料からの配列決定データから、胚に関する倍数性の決定を行うために、親の遺伝子型データを使用することができる。ＰＧＤの環境では、子のＤＮＡのみを測定し、ほんの少数の細胞、一般に、１〜５個であるが、多くて１０個、２０個または５０個を検査する。次いで、対立遺伝子ＡおよびＢ（ＳＮＰにおける）の開始時のコピーの総数が子の遺伝子型および細胞の数によって自明に決定される。ＮＰＤでは、開始時のコピーの数は非常に多く、したがって、ＰＣＲの後の対立遺伝子の比が開始時の比を正確に反映することが予想される。しかし、ＰＧＤにおける開始時のコピーが少数であることは、コンタミネーションおよび不完全なＰＣＲ効率が、ＰＣＲ後の対立遺伝子の比に対する非自明の効果を有することを意味する。この効果は、配列決定後に測定された対立遺伝子の比における分散を予測することにおけるリード深度よりも重要であり得る。既知の子の遺伝子型を考慮して測定された対立遺伝子の比の分布は、ＰＣＲプローブの効率およびコンタミネーションの確率に基づいたＰＣＲプロセスのＭｏｎｔｅＣａｒｌｏシミュレーションによって作製することができる。可能性のある子の遺伝子型のそれぞれについて対立遺伝子の比の分布を考慮して、種々の仮説の尤度を、ＮＩＰＤについて記載されているのと同様に算出することができる。

最尤推定
生物学的な現象または医学的状態の存在または不在を検出するための当技術分野で公知の大多数の方法は、状態と相関するメトリックを測定し、メトリックが所与の閾値の一方の側にあれば、その状態が存在し、メトリックが閾値の他方の側にあれば、その状態は存在しないという単一仮説棄却検定を用いることを包含する。単一仮説棄却検定では、帰無仮説と対立仮説の間の決定を行う際に帰無分布を調べるだけである。対立分布を考慮に入れなければ、観察されたデータを考慮して各仮説の尤度を推定することはできず、したがって、コールに対する信頼度を算出することができない。したがって、単一仮説棄却検定を用いて、特定の場合と関連する信頼度についての感受性を伴わずにｙｅｓまたはｎｏの答えを得る。

いくつかの実施形態では、本明細書に開示されている方法では、生物学的な現象または医学的状態の存在または不在を、最尤法を用いて検出することができる。最尤法は、状態の不在または存在をコールするための閾値をそれぞれの場合について適切に調整することができるので、単一仮説棄却法を用いる方法に対する実質的な改善である。これは、母系の血漿中に見いだされる浮動性ＤＮＡに存在する胎児ＤＮＡと母系ＤＮＡの混合物から入手可能な遺伝子データから、妊娠中の胎児における異数性の存在または不在を決定することを目的とする診断技法に特に関連性がある。これは、血漿中の胎児ＤＮＡの一部分により割合の変化（ｆｒａｃｔｉｏｎｃｈａｎｇｅ）が導かれると、異数性対正倍数性をコールするための最適な閾値が変化することに起因する。胎児画分が降下すると、異数性に関連づけられるデータの分布がますます正倍数性に関連づけられるデータの分布と同様になる。

最尤推定法では、各仮説に関連づけられる分布を使用して、各仮説に対して条件づけたデータの尤度を推定する。次いで、これらの条件的確率を、仮説コールおよび信頼度に変換することができる。同様に、最大事後推定法では、最尤推定と同じ条件的確率を使用するが、最良の仮説を選択し、信頼度を決定する際に前の母集団も組み入れる。

したがって、最尤推定（ＭＬＥ）技法または密接に関連する最大事後（ＭＡＰ）技法を用いることにより、２つの利点が生じ、まず、正確なコールの見込みが増大し、また、各コールに対して信頼度を算出することが可能になる。ある実施形態では、最大の確率を有する仮説に対応する倍数性状態を選択するステップを、最尤推定または最大事後推定を使用して行う。ある実施形態では、妊娠中の胎児の倍数性状態を決定するための方法であって、単一仮説棄却法を用いる現在当技術分野で公知の任意の方法をとり、それをＭＬＥ技法またはＭＡＰ技法を用いるように再公式化することを含む方法が開示されている。これらの技法を適用することによって有意に改善することができる方法のいくつかの例は、米国特許第８，００８，０１８号、米国特許第７，８８８，０１７号または米国特許第７，３３２，２７７号に見いだすことができる。

ある実施形態では、胎児のゲノムＤＮＡおよび母系のゲノムＤＮＡを含む母系の血漿試料における胎児の異数性の存在または不在を決定するための方法であって、母系の血漿試料を得るステップと、血漿試料中に見いだされるＤＮＡ断片を、ハイスループットシーケンサーを用いて測定するステップと、配列を染色体にマッピングし、各染色体にマッピングされるシーケンスリード数を決定するステップと、血漿試料中の胎児ＤＮＡの割合を算出するステップと、第２の標的染色体が正倍数性である場合に存在すると予測される標的染色体の量の予測される分布、およびその染色体が異数性である場合に予測される１つまたは複数の予測される分布を、胎児画分および正倍数性であることが予測される１個または複数個の参照染色体にマッピングされるシーケンスリード数を使用して算出するステップと、ＭＬＥまたはＭＡＰを用いて、どの分布が、正確である可能性が最も高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が記載されている。ある実施形態では、血漿由来のＤＮＡを測定するステップは、大規模な並行のショットガン配列決定を行うことを包含し得る。ある実施形態では、血漿試料由来のＤＮＡを測定するステップは、例えば、標的化増幅によって、複数の多型遺伝子座または非多型遺伝子座において優先的に富化されたＤＮＡをシークエンシングを包含し得る。複数の遺伝子座を、１つまたは少数の異数性が疑わしい染色体および１つまたは少数の参照染色体を標的とするように設計することができる。優先的に富化することの目的は、倍数性を決定するために情報価値のあるシーケンスリード数を増加させることである。

倍数性コールのインフォマティクスによる方法
本明細書には、配列データを考慮して胎児の倍数性状態を決定するための方法が記載されている。いくつかの実施形態では、この配列データは、ハイスループットシーケンサーで測定することができる。いくつかの実施形態では、配列データは、母系の血液から単離された浮動性ＤＮＡを起源とするＤＮＡについて測定することができ、ここで、浮動性ＤＮＡは、いくらかの母体起源のＤＮＡ、およびいくらかの胎児／胎盤起源のＤＮＡを含む。このセクションでは、分析された混合物中の胎児ＤＮＡの割合は未知であり、データから推定されると仮定して胎児の倍数性状態を決定する本開示の一実施形態が記載される。混合物中の胎児ＤＮＡの割合（「胎児画分」）または胎児ＤＮＡの百分率を別の方法によって測定することができ、また、それが胎児の倍数性状態の決定において既知であると仮定される実施形態も記載される。いくつかの実施形態では、胎児ＤＮＡと母系ＤＮＡの混合物である母系の血液試料自体に対して行った遺伝子型決定測定値のみを使用して胎児画分を算出することができる。いくつかの実施形態では、測定されたか、または別の方法で既知である母親の遺伝子型および／または測定されたか、または別の方法で既知である父親の遺伝子型を用いてその割合を算出することもできる。別の実施形態では、胎児の倍数性状態は、単に、問題の染色体について算出された胎児ＤＮＡの割合に基づいて、ダイソミーであると仮定される参照染色体について算出された胎児ＤＮＡの割合と比較して決定することができる。

好ましい実施形態では、特定の染色体について、Ｎ個のＳＮＰを観察し、解析する場合、
・ＮＲ個の浮動性ＤＮＡ配列測定値の集合Ｓ＝（ｓ_１，．．．，ｓ_ＮＲ）となる。この方法では、ＳＮＰ測定値を利用するので、非多型の遺伝子座に対応する配列データは全て無視することができる。単純化形では、各ＳＮＰに対して計数値（Ａ，Ｂ）が得られ、ＡおよびＢが、所与の遺伝子座に存在する２つの対立遺伝子に対応する場合、ＳはＳ＝（（ａ_１，ｂ_１），．．．，（ａ_Ｎ，ｂ_Ｎ））と書くことができ、式中、ａ_ｉはＳＮＰｉ上のＡ計数値であり、ｂ_ｉはＳＮＰｉ上のＢ計数値であり、Σ_{ｉ＝１：Ｎ}（ａ_ｉ＋ｂ_ｉ）＝ＮＲであり、また
・親のデータは、
〇ＳＮＰマイクロアレイまたは他の強度に基づく遺伝子型決定プラットフォームからの
遺伝子型：母親Ｍ＝（ｍ_１，．．．，ｍ_Ｎ）、父親Ｆ＝（ｆ_１，．．．，ｆ_Ｎ）、ｍ_ｉ，ｆ_ｉ∈（ＡＡ，ＡＢ，ＢＢ）、および／または
〇配列データ測定値：ＮＲＭ個の母親の測定値ＳＭ＝（ｓｍ_１，．．．，ｓｍ_ｎｒｍ）、ＮＲＦ個の父親の測定値ＳＦ＝（ｓｆ_１，．．．，ｓｆ_ｎｒｆ）から構成される。上記の単純化と同様、各ＳＮＰについて計数値（Ａ，Ｂ）が得られる場合、ＳＭ＝（（ａｍ_１，ｂｍ_１），．．．，（ａｍ_Ｎ，ｂｍ_Ｎ））、ＳＦ＝（（ａｆ_１，ｂｆ_１），．．．，（ａｆ_Ｎ，ｂｆ_Ｎ））となる。

まとめて、母親、父親、子のデータはＤ＝（Ｍ，Ｆ，ＳＭ，ＳＦ，Ｓ）で示される。親のデータの取得が望ましく、それによりアルゴリズムの正確度が上昇するが、親のデータ、特に父親のデータは必ずしも必要ではないことに留意されたい。これは、母親および／または父親のデータの不在下でさえ、非常に正確なコピー数の結果を得ることが可能であることを意味する。

データの対数尤度ＬＩＫ（Ｄ｜Ｈ）を、考えられる仮説（Ｈ）全てにわたって最大にすることによって最良のコピー数の推定値（Ｈ^†＊）を導くことが可能である。特に、倍数性仮説のそれぞれの相対的確率は、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、また、以下の通り正確である可能性が最も高い仮説を決定することが可能である：
同様に事後仮説尤度は、データを考慮すると：
と書くことができ、式中、ｐｒｉｏｒｐｒｏｂ（Ｈ）はモデル設計および以前の知見に基づいて各仮説Ｈに割り当てられた事前確率である。
事前確率を用いて最大事後推定値を得ることも可能である：

ある実施形態では、考慮に入れることができるコピー数仮説は、以下である：
・モノソミー：
○ 母系Ｈ１０（母親由来の１つのコピー）
○ 父系Ｈ０１（父親由来の１つのコピー）
・ダイソミー：Ｈ１１（母親および父親それぞれにつき１つのコピー）
・単純なトリソミー、乗換えは考慮しない：
○ 母系：Ｈ２１＿一致（母親由来の２つの同一のコピー、父親由来の１つのコピー）、Ｈ２１＿不一致（母親由来の両方のコピー、父親由来の１つのコピー）
○父系：Ｈ１２＿一致（母親由来の１つのコピー、父親由来の２つの同一のコピー）、Ｈ１２＿不一致（母親由来の１つのコピー、父親由来の両方のコピー）
・複合トリソミー、乗換えを考慮する（同時分布モデルを用いる）：
○ 母系Ｈ２１（母親由来の２つのコピー、父親由来の１つのコピー）、
○ 父系Ｈ１２（母親由来の１つのコピー、父親由来の２つのコピー）

他の実施形態では、他の倍数性状態、例えば、ゼロ染色体性（Ｈ００）、片親性ダイソミー（Ｈ２０およびＨ０２）、およびテトラソミー（Ｈ０４、Ｈ１３、Ｈ２２、Ｈ３１およびＨ４０）を考慮することができる。

乗換えがない場合、起源が有糸分裂、減数分裂Ｉまたは減数分裂ＩＩのいずれにしろ、各トリソミーは、一致トリソミーまたは不一致トリソミーのうちの一方になる。乗換えに起因して、真のトリソミーは通常、２つの組み合わせになる。まず、単純仮説について仮説の尤度を導く方法が記載されている。次に、個々のＳＮＰ尤度を乗換えと組み合わせた複合仮説について仮説の尤度を導く方法が記載されている。

単純仮説についてのＬＩＫ（Ｄ｜Ｈ）
ある実施形態では、単純仮説について、以下の通りＬＩＫ（Ｄ｜Ｈ）を決定することができる。単純仮説Ｈについて、染色体全体についての仮説Ｈの対数尤度ＬＩＫ（Ｈ）を、既知のまたは導かれた子の割合ｃｆを仮定して、個々のＳＮＰの対数尤度の合計として算出することができる。ある実施形態では、データからｃｆを導くことが可能である。
この仮説では、いかなるＳＮＰ間の連鎖も仮定せず、したがって、同時分布モデルを利用しない。

いくつかの実施形態では、ＳＮＰごとに対数尤度を決定することができる。特定のＳＮＰｉについて、胎児の倍数性についての仮説Ｈおよびパーセント胎児ＤＮＡｃｆを仮定すると、観察されたデータＤの対数尤度は、
と定義され、式中、ｍは可能性のある真の母親の遺伝子型であり、ｆは可能性のある真の父親の遺伝子型であり、ｍ，ｆ∈｛ＡＡ，ＡＢ，ＢＢ｝であり、ｃは、仮説Ｈを考慮した、可能性のある子の遺伝子型である。特に、モノソミーについてはｃ∈｛Ａ，Ｂ｝であり、ダイソミーについてはｃ∈｛ＡＡ，ＡＢ，ＢＢ｝であり、トリソミーについてはｃ∈｛ＡＡＡ，ＡＡＢ，ＡＢＢ，ＢＢＢ｝である。

遺伝子型事前頻度：ｐ（ｍ｜ｉ）は、ＳＮＰＩにおける既知の母集団頻度に基づくＳＮＰｉにおける母親の遺伝子型ｍの一般的な事前確率であり、ｐＡｉで示される。具体的には、
ｐ（ＡＡ｜ｐＡ_ｉ）＝（ｐＡ_ｉ）^２，ｐ（ＡＢ｜ｐＡ_ｉ）＝２（ｐＡ_ｉ）＊（１−ｐＡ_ｉ），ｐ（ＢＢ｜ｐＡ_ｉ）＝（１−ｐＡ_ｉ）^２
父親の遺伝子型の確率、ｐ（ｆ｜ｉ）も同様に決定することができる。

真の子の確率：ｐ（ｃ｜ｍ，ｆ，Ｈ）は、親ｍ、ｆ、および仮定している仮説Ｈを考慮して真の子の遺伝子型＝ｃが得られる確率であり、これは容易に算出することができる。例えば、Ｈ１１、Ｈ２１一致およびＨ２１不一致についてのｐ（ｃ｜ｍ，ｆ，Ｈ）が以下に示されている。

データの尤度：Ｐ（Ｄ｜ｍ，ｆ，ｃ，Ｈ，ｉ，ｃｆ）は、真の母親の遺伝子型ｍ、真の父親の遺伝子型ｆ、真の子の遺伝子型ｃ、仮説Ｈおよび子の割合ｃｆを考慮したＳＮＰｉにおける所与のデータＤの確率である。これは、以下の通り母親、父親および子データの確率に分解することができる：
Ｐ（Ｄ｜ｍ，ｆ，ｃ，Ｈ，ｃｆ，ｉ）＝Ｐ（ＳＭ｜ｍ，ｉ）Ｐ（Ｍ｜ｍ，ｉ）Ｐ（ＳＦ｜ｆ，ｉ）Ｐ（Ｆ｜ｆ，ｉ）Ｐ（Ｓ｜ｍ，ｃ，Ｈ、ｃｆ，ｉ）

母親のＳＮＰアレイデータの尤度：ＳＮＰアレイ遺伝子型が正確であると仮定して、真の遺伝子型ｍと比較した、ＳＮＰｉにおける母親のＳＮＰアレイ遺伝子型データの確率ｍ_ｉは、単に、
である。

母親の配列データの尤度：ＳＮＰｉにおける母親の配列データの確率は、計数値Ｓ_ｉ＝（ａｍ_ｉ，ｂｍ_ｉ）の場合には、余分のノイズまたは偏りを伴わず、Ｐ（ＳＭ｜ｍ，ｉ）＝Ｐ_Ｘ｜ｍ（ａｍ_ｉ）と定義される二項確率であり、ここで、Ｘ｜ｍ〜Ｂｉｎｏｍ（ｐ_ｍ（Ａ），ａｍ_ｉ＋ｂｍ_ｉ）であり、ｐ_ｍ（Ａ）は下表に示す値である。

父親のデータの尤度：同様の式が父親のデータの尤度にも当てはまる。親のデータ、特に父親のデータを用いずに子の遺伝子型を決定することが可能であることに留意されたい。例えば、父親の遺伝子型データＦが利用可能でない場合、単にＰ（Ｆ｜ｆ，ｉ）＝１を使用することができる。父親の配列データＳＦが利用可能でない場合、単にＰ（ＳＦ｜ｆ，ｉ）＝１を使用することができる。

いくつかの実施形態では、前記方法は、各倍数性仮説について、染色体上の複数の多型遺伝子座において予測される対立遺伝子数についての同時分布モデルを構築することを伴い、そのような目的を実現するための１つの方法がここに記載されている。遊離の胎児ＤＮＡデータの尤度：Ｐ（Ｓ｜ｍ，ｃ，Ｈ，ｃｆ，ｉ）は、ＳＮＰｉにおける遊離の胎児ＤＮＡ配列データの確率であり、真の母親の遺伝子型ｍ、真の子の遺伝子型ｃ、子のコピー数仮説Ｈを考慮し、子の割合ｃｆを仮定する。これは、実際、ＳＮＰｉにおけるＡ含量の真の確率μ（ｍ，ｃ，ｃｆ，Ｈ）を考慮したＳＮＰＩにおける配列データＳの確率Ｐ（Ｓ｜ｍ，ｃ，Ｈ，ｃｆ，ｉ）＝Ｐ（Ｓ｜μ（ｍ，ｃ，ｃｆ，Ｈ），ｉ）である。
計数値に関しては、Ｓ_ｉ＝（ａ_ｉ，ｂ_ｉ）であり、データに余分のノイズまたは偏りを伴わない場合、
Ｐ（Ｓ｜μ（ｍ，ｃ，ｃｆ，Ｈ），ｉ）＝Ｐ_ｘ（ａ_ｉ）
となり、式中、Ｘ〜Ｂｉｎｏｍ（ｐ（Ａ），ａ_ｉ＋ｂ_ｉ）であり、ｐ（Ａ）＝μ（ｍ，ｃ，ｃｆ，Ｈ）である。正確なアラインメントおよびＳＮＰ当たりの（Ａ，Ｂ）計数値が未知の、より複雑な場合には、Ｐ（Ｓ｜μ（ｍ，ｃ，ｃｆ，Ｈ），ｉ）は積分した二項式の組み合わせである。

真のＡ含量の確率：この母親／子混合物におけるＳＮＰｉにおけるＡ含量の真の確率μ（ｍ，ｃ，ｃｆ，Ｈ）は、真の母親の遺伝子型＝ｍ、真の子の遺伝子型＝ｃ、および全体的な子の割合＝ｃｆと仮定して、
と定義され、式中、＃Ａ（ｇ）＝遺伝子型ｇにおけるＡの数であり、ｎ_ｍ＝２は、母親のソミーであり、ｎ_ｃは仮説Ｈの下での子の倍数性である（１はモノソミーであり、２はダイソミーであり、３はトリソミーである）。

同時分布モデルの使用：複合仮説についてのＬＩＫ（Ｄ｜Ｈ）
いくつかの実施形態では、この方法は、各倍数性仮説について、染色体上の複数の多型遺伝子座において、予測される対立遺伝子数の同時分布モデルを構築することを伴い、そのような目的を実現するための１つの方法がここに記載されている。多くの場合、トリソミーは、通常、乗換えに起因して、純粋に一致または不一致ではなく、したがって、このセクションでは、可能性のある乗換えを考慮に入れて、一致トリソミーと不一致トリソミーが組み合わされた複合仮説Ｈ２１（母系トリソミー）およびＨ１２（父系トリソミー）についての結果が導かれる。

トリソミーの場合には、乗換えがなければ、トリソミーは単に一致トリソミーまたは不一致トリソミーになる。一致トリソミーとは、子が一方の親由来の同一染色体セグメントの２つのコピーを遺伝によって受け継ぐ場合である。不一致トリソミーとは、子が親由来の各相同染色体セグメントの１つのコピーを遺伝によって受け継ぐ場合である。乗換えにより、染色体の一部のセグメントが一致トリソミーを有する場合もあり、他の部分が、不一致トリソミーを有してもよい。このセクションには、対立遺伝子の集合について、ヘテロ接合率について、すなわち、１個または複数個の仮説について、いくつもの遺伝子座における予測される対立遺伝子数の同時分布モデルをどのように構築するかが記載されている。

ＳＮＰｉに対し、ＬＩＫ（Ｄ｜Ｈｍ，ｉ）は、一致仮説Ｈ_ｍに対する適合であり、ＬＩＫ（Ｄ｜Ｈｕ，ｉ）は、不一致仮説Ｈ_ｕに対する適合であり、ｐｃ（ｉ）＝ＳＮＰｉ−１とＳＮＰｉの間の乗換えの確率であると仮定する。このとき、完全な尤度を以下の通り算出することができる：
式中、ＬＩＫ（Ｄ｜Ｅ，１：Ｎ）は、ＳＮＰ１：Ｎについての仮説Ｅの最終尤度である。Ｅ＝最後のＳＮＰの仮説であり、Ｅ∈（Ｈｍ，Ｈｕ）である。再帰的に、以下を算出することができる：
式中、〜ＥはＥ以外の仮説（非Ｅ）であり、考慮される仮説はＨ_ｍおよびＨ_ｕである。詳細には、１：ｉＳＮＰの尤度を、１から（ｉ−１）までのＳＮＰの尤度に基づいて、同じ仮説で乗換えなしか、または逆の仮説で乗換えありのいずれかを用い、ＳＮＰｉの尤度を乗じて算出することができる：
ＳＮＰ１に対し、ｉ＝１、ＬＩＫ（Ｄ｜Ｅ，１：１）＝ＬＩＫ（Ｄ｜Ｅ，１）、
ＳＮＰ２に対し、ｉ＝２、ＬＩＫ（Ｄ｜Ｅ，１：２）＝ＬＩＫ（Ｄ｜Ｅ，２）＋ｌｏｇ（ｅｘｐ（ＬＩＫ（Ｄ｜Ｅ，１））＊（１−ｐｃ（２））＋ｅｘｐ（ＬＩＫ（Ｄ｜〜Ｅ，１））＊ｐｃ（２））、
また、ｉ＝３：Ｎについても同様である。

いくつかの実施形態では、子の割合（ｆｒａｃｔｉｏｎ）を決定することができる。子の割合とは、ＤＮＡの混合物における子を起源とする配列の割合（ｐｒｏｐｏｒｔｉｏｎ）を指してもよい。非侵襲的な出生前診断との関連において、子の割合とは、母系の血漿における、胎児または胎児の遺伝子型を有する胎盤の部分を起源とする配列の割合を指してもよい。子の割合とは、母系の血漿から調製したＤＮＡの試料中の子の画分を指してもよく、胎児ＤＮＡに関して富化されていてよい。ＤＮＡの試料中の子の割合を決定する１つの目的は、胎児に関して倍数性コールを行うことができるアルゴリズムにおいて使用するためであり、したがって、子の割合とは、非侵襲的な出生前診断のために配列決定によって分析したいかなるＤＮＡの試料を指してもよい。

非侵襲的な出生前異数性診断の方法の一部である本開示において示されているアルゴリズムのいくつかは、既知の子の割合を仮定するが、これはいつでもこのようになるわけではない。ある実施形態では、親のデータの存在を含めて、または含めずに、選択された染色体上のダイソミーの尤度を最大にすることによって、最も可能性が高い子の割合を見いだすことが可能である。

詳細には、ダイソミー仮説について、および染色体ｃｈｒ上の子の割合ｃｆについて、上記の通りＬＩＫ（Ｄ｜Ｈ１１，ｃｆ，ｃｈｒ）＝対数尤度と仮定する。正倍数性であると仮定した、Ｃｓｅｔにおいて選択された染色体（通常、１：１６）についての完全な尤度は：
である。
最も可能性が高い子の割合（ｃｆ^†＊）は、ｃｆ^＊＝ａｒｇｍａｘ_ｃｆＬＩＫ（ｃｆ）として導かれる。

染色体の任意の集合を使用することが可能である。参照染色体における正倍数性を仮定せずに子の割合を導くことも可能である。この方法を用いて、以下の状況のいずれかについて子の割合を決定することが可能である：（１）親に関するアレイデータおよび母系の血漿に関するショットガン配列決定データを有する；（２）親に関するアレイデータおよび母系の血漿に関する標的化配列決定データを有する；（３）親と母系の血漿の両方に関する標的化配列決定データを有する；（４）母親と母系の血漿画分の両方に関する標的化配列決定データを有する；（５）母系の血漿画分に関する標的化配列決定データを有する；（６）親の画分および子の画分の測定値の他の組み合わせ。

いくつかの実施形態では、インフォマティクスによる方法により、データドロップアウトを組み入れることができる。これにより、より正確度が高い倍数性の判定結果を得ることができる。本開示の他の箇所において、Ａが生じる確率は、真の母親の遺伝子型、真の子の遺伝子型、混合物中の子の割合、および子のコピー数の一次関数であると仮定されている。例えば、混合物中の真の子ＡＢを測定する代わりに、母親または子の対立遺伝子がドロップアウトする可能性もあり、これは対立遺伝子Ａにマッピングされる配列のみを測定する場合に起こり得る。ゲノムのイルミナデータについての親のドロップアウト率をｄ_ｐｇ、配列データについての親のドロップアウト率をｄ_ｐｓおよび配列データについての子のドロップアウト率をｄ_ｃｓで示すことができる。いくつかの実施形態では、母親のドロップアウト率を０、子のドロップアウト率を比較的低いと仮定することができ、この場合、結果はドロップアウトの影響を大きくは受けない。いくつかの実施形態では、対立遺伝子ドロップアウトの可能性は、それにより予測される倍数性コールに有意な影響がもたらされるのに十分に大きい場合がある。そのような場合、対立遺伝子ドロップアウトをここでアルゴリズムに組み入れる：

親のＳＮＰアレイデータドロップアウト：母親のゲノムのデータＭについて、ドロップアウト後の遺伝子型をｍ_ｄとすると、
で、式中、上記と同様に、
であり、Ｐ（ｍ_ｄ｜ｍ）は、ドロップアウト率ｄについて以下の通り定義される真の遺伝子型ｍを考慮した可能性のあるドロップアウト後の遺伝子型ｍ_ｄの尤度である
同様の式が父親のＳＮＰアレイデータにも当てはまる。

親の配列データドロップアウト：母親の配列データＳＭに対し、
式中、Ｐ（ｍ_ｄ｜ｍ）は前のセクションで定義された通りであり、二項分布からのＰ_ｘ｜ｍｄ（ａｍ_ｉ）確率は、親のデータの尤度セクションにおいて上記の通り定義される。同様の式が父系の配列データにも適用できる。

浮動性ＤＮＡ配列データドロップアウト：
式中、Ｐ（Ｓ｜μ（ｍ_ｄ，ｃ_ｄ，ｃｆ，Ｈ），ｉ）は浮動性のデータの尤度に関するセクションにおいて定義されている通りである。

ある実施形態では、ｐ（ｍ_ｄ｜ｍ）は、真の母親の遺伝子型ｍを考慮し、ドロップアウト率ｄ_ｐｓを仮定した、観察された母親の遺伝子型ｍ_ｄの確率であり、ｐ（ｃ_ｄ｜ｃ）は、真の子の遺伝子型ｃを考慮し、ドロップアウト率ｄ_ｃｓを仮定した、観察された子の遺伝子型ｃ_ｄの確率である。ｎＡ_Ｔ＝真の遺伝子型ｃにおける対立遺伝子Ａの数であり、ｎＡ_Ｄ＝観察された遺伝子型ｃ_ｄにおける対立遺伝子Ａの数であり、ｎＡ_Ｔ≧ｎＡ_Ｄであり、同様に、ｎＢ_Ｔ＝真の遺伝子型ｃにおける対立遺伝子Ｂの数であり、ｎＢ_Ｄ＝観察された遺伝子型ｃ_ｄにおける対立遺伝子Ｂの数であり、ｎＢ_Ｔ≧ｎＢ_Ｄであり、ｄ＝ドロップアウト率であるとすると、
である。

ある実施形態では、インフォマティクスによる方法により、ランダムな偏りおよび一貫した偏りが組み入れられる可能性がある。理想的に言えば、配列計数値にＳＮＰ当たりの一貫したサンプリングの偏りまたはランダムなノイズ（二項分布の変動に加えて）は存在しない。詳細には、ＳＮＰｉにおいて、母親の遺伝子型ｍ、真の子の遺伝子型ｃおよび子の割合ｃｆ、およびＸ＝ＳＮＰｉにおける（Ａ＋Ｂ）リードの集合内のＡの数に対して、ＸはＸ〜Ｂｉｎｏｍｉａｌ（ｐ，Ａ＋Ｂ）として作用し、ｐ＝μ（ｍ，ｃ，ｃｆ，Ｈ）＝Ａ含量の真の確率である。

ある実施形態では、インフォマティクスによる方法により、ランダムな偏りが組み入れられる可能性がある。大抵の場合、測定値に偏りがあると仮定し、したがってこのＳＮＰにおいてＡが生じる確率は、上で定義されたｐとは少し異なるｑに等しい。ｐとｑがどのくらい異なるかは、測定プロセスの正確度および他の因子の数に左右され、ｐから離れたｑの標準偏差によって定量化することができる。ある実施形態では、ｑを、ベータ分布を有するとしてｐに集中したその分布の平均に応じたパラメータα、β、および一部の特定の標準偏差ｓを用いてモデリングすることが可能である。詳細には、これによりＸ｜ｑ〜Ｂｉｎ（ｑ，Ｄ_ｉ）がもたらされ、ｑ〜Ｂｅｔａ（α，β）である。Ｅ（ｑ）＝ｐ、Ｖ（ｑ）＝ｓ^２とすれば、パラメータα、βはα＝ｐＮ、β＝（１−ｐ）Ｎとして導くことができ、
である。

これはベータ二項分布の定義であり、可変性のパラメータｑを伴う二項分布からサンプリングし、ｑは平均のｐを有するベータ分布に従う。したがって、偏りがないセットアップでは、ＳＮＰｉにおいて、真の母親の遺伝子型（ｍ）を仮定し、ＳＮＰｉ上の母親の配列Ａ計数値（ａｍ_ｉ）およびＳＮＰｉ上の母親の配列Ｂ計数値（ｂｍ_ｉ）を考慮した親の配列データ（ＳＭ）確率を以下の通り算出することができる：Ｐ（ＳＭ｜ｍ，ｉ）＝Ｐ_Ｘ｜ｍ（ａｍ_ｉ）、ここで、Ｘ｜ｍ〜Ｂｉｎｏｍ（ｐ_ｍ（Ａ），ａｍ_ｉ＋ｂｍ_ｉ）である。

ここで、標準偏差ｓを有するランダムな偏りを含めると、以下になる：
Ｘ｜ｍ〜ＢｅｔａＢｉｎｏｍ（ｐ_ｍ（Ａ），ａｍ_ｉ＋ｂｍ_ｉ，ｓ）。

偏りがない場合には、真の母親の遺伝子型（ｍ）、真の子の遺伝子型（ｃ）、子の割合（ｃｆ）を仮定し、子の仮説Ｈを仮定し、ＳＮＰｉ上の浮動性ＤＮＡ配列Ａ計数値（ａｉ）およびＳＮＰｉ上の浮動性配列Ｂ計数値（ｂｉ）を考慮した母系の血漿ＤＮＡ配列データ（Ｓ）確率を以下の通り算出することができる：
Ｐ（Ｓ｜ｍ，ｃ，ｃｆ，Ｈ，ｉ）＝Ｐｘ（ａ_ｉ）
式中、Ｘ〜Ｂｉｎｏｍ（ｐ（Ａ），ａ_ｉ＋ｂ_ｉ）、ｐ（Ａ）＝μ（ｍ，ｃ，ｃｆ，Ｈ）。

ある実施形態では、標準偏差ｓを有するランダムな偏りを含めると、これはＸ〜ＢｅｔａＢｉｎｏｍ（ｐ（Ａ），ａ_ｉ＋ｂ_ｉ、ｓ）になり、余分の変動の量は偏差パラメータｓまたは同等にＮによって指定される。ｓの値が小さいほど（またはＮの値が大きいほど）この分布は標準的な二項分布に近づく。偏りの量を推定すること、すなわち上記のＮを、明白な状況ＡＡ｜ＡＡ、ＢＢ｜ＢＢ、ＡＡ｜ＢＢ、ＢＢ｜ＡＡから、上記の確率における推定：
を用いて推定することが可能である。データの挙動に応じて、Ｎを、リード深度ａ_ｉ＋ｂ_ｉまたはａ_ｉ＋ｂ_ｉの関数に関係なく一定になるようにし、これにより、より大きなリード深度に対して偏りをより小さくすることができる。

ある実施形態では、インフォマティクスによる方法により、一貫したＳＮＰごとの偏りが組み入れられる可能性がある。配列決定プロセスのアーチファクトに起因して、一部のＳＮＰは、真のＡ含量に関係なく、一貫して低いまたは高い計数値を有し得る。ＳＮＰｉが一貫してＡ計数値に対してｗ_ｉパーセントの偏りを加えると仮定する。いくつかの実施形態では、この偏りを、同じ条件で導かれたトレーニングデータの集合から推定し、以下のように親の配列データ推定値に戻すことができる：
Ｐ（ＳＭ｜ｍ，ｉ）＝Ｐ_Ｘ｜ｍ（ａｍ_ｉ）＜ここで、Ｘ｜ｍ〜ＢｅｔａＢｉｎｏｍ（ｐ_ｍ（Ａ）＋ｗ_ｉ，ａｍ_ｉ＋ｂｍ_ｉ，ｓ）＞、
また、浮動性ＤＮＡ配列データ確率推定値は：
Ｐ（Ｓ｜ｍ，ｃ，ｃｆ，Ｈ，ｉ）＝Ｐ_Ｘ（ａ_ｉ）＜ここで、Ｘ〜ＢｅｔａＢｉｎｏｍ（ｐ（Ａ）＋ｗ_ｉ，ａ_ｉ＋ｂ_ｉ，ｓ）＞
となる。

いくつかの実施形態では、前記方法は、特にさらに別のノイズ、示差的な試料の質、示差的なＳＮＰの質、およびランダムサンプリングの偏りを考慮に入れて書くことができる。この例はここに示されている。この方法は、データを大規模に多重化されたｍｉｎｉ−ＰＣＲプロトコールを使用して生成した状況において特に有用であることが示されており、これを実験７〜１３において用いた。前記方法は、それぞれが最終のモデルに異なる種類のノイズおよび／または偏りを導入するいくつかのステップを伴う：
（１）母系ＤＮＡと胎児ＤＮＡの混合物を含む第１の試料は、サイズ＝Ｎ_０分子、通常、１，０００〜４０，０００の範囲、ｐ＝真の％ｒｅｆの元のＤＮＡの量を含有すると仮定する。
（２）ユニバーサルライゲーションアダプタを使用した増幅において、Ｎ_１分子がサンプリングされると仮定する；通常、サンプリングに起因してＮ_１〜Ｎ_０／２分子およびランダムサンプリングの偏りが導入される。増幅された試料は、いくつもの分子Ｎ_２を含有してよく、Ｎ_２＞＞Ｎ_１である。Ｘ_１はＮ_１サンプリングされた分子のうちの参照遺伝子座の量（ＳＮＰごと）を示し、プロトコールの残り全体を通してランダムサンプリングの偏りを導入するｐ_１＝Ｘ_１／Ｎ_１の変動を伴うとする。このサンプリングの偏りを、単純な二項分布モデルを使用する代わりにベータ二項（ＢＢ）分布を使用することによってモデルに含める。ベータ二項分布のパラメータＮを後で、試料ごとに、０＜ｐ＜１のＳＮＰについて漏れおよび増幅の偏りを調整した後に、トレーニングデータから推定することができる。漏れは、ＳＮＰが不正確に読み取られる傾向である。
（３）増幅ステップにより、対立遺伝子のあらゆる偏りが増幅され、したがって、可能性のある一様でない増幅によって増幅の偏りが導入される。遺伝子座における一方の対立遺伝子がｆ倍に増幅され、その遺伝子座における他方の対立遺伝子がｇ倍に増幅されると仮定すると、ｆ＝ｇｅ^ｂであり、ｂ＝０は偏りがないことを示す。偏りパラメータｂは０に集中し、特定のＳＮＰにおいて対立遺伝子Ａが対立遺伝子Ｂと対照的にどのくらい多くまたは少なく増幅されたかを示す。パラメータｂは、ＳＮＰによって異なってよい。偏りパラメータｂは、ＳＮＰごとに、例えば、トレーニングデータから推定することができる。
（４）配列決定ステップは、増幅された分子の試料について配列決定するステップを包含する。このステップでは、漏れが存在する可能性があり、漏れとは、ＳＮＰが不正確に読み取られる状況である。漏れは、様々な問題に起因する可能性があり、漏れの結果、ＳＮＰは、正確な対立遺伝子Ａとして読み取られないが、その遺伝子座において見いだされる別の対立遺伝子Ｂとして、または一般にはその遺伝子座において見いだされない対立遺伝子ＣまたはＤとして読み取られる。配列決定により、サイズＮ_３、Ｎ_３＜Ｎ_２の増幅された試料からいくつものＤＮＡ分子の配列データが測定されると仮定する。いくつかの実施形態では、Ｎ_３は、２０，０００〜１００，０００；１００，０００〜５００，０００；５００，０００〜４，０００，０００；４，０００，０００〜２０，０００，０００；または２０，０００，０００〜１００，０００，０００の範囲内であってよい。サンプリングされた各分子は正確に読み取られた確率ｐ_ｇを有し、その場合、正確に対立遺伝子Ａとして示される。試料は、確率１−ｐｇで元の分子と無関係の対立遺伝子として不正確に読み取られ、確率ｐｒで対立遺伝子Ａのようであり、確率ｐ_ｍで対立遺伝子Ｂのようであり、または確率ｐ_ｏで対立遺伝子Ｃまたは対立遺伝子Ｄのようであり、ｐ_ｒ＋ｐ_ｍ＋ｐ_ｏ＝１である。パラメータｐ_ｇ、ｐ_ｒ、ｐ_ｍ、ｐ_ｏは、ＳＮＰごとに、トレーニングデータから推定する。

異なるプロトコールは、同様のステップを包含し、分子生物学的ステップに変動を伴ってよく、その結果、異なる量のランダムサンプリング、異なるレベルの増幅および異なる漏れによる偏りがもたらされる。以下のモデルを、これらの場合のそれぞれに同等に良好に適用することができる。サンプリングされたＤＮＡの量のモデルは、ＳＮＰごとに、以下によって示される：
Ｘ_３〜ＢｅｔａＢｉｎｏｍｉａｌ（Ｌ（Ｆ（ｐ，ｂ），ｐ_ｒ，ｐ_ｇ）、Ｎ＊Ｈ（ｐ，ｂ））
式中、ｐ＝参照ＤＮＡの真の量であり、ｂ＝ＳＮＰ当たりの偏りであり、上記のように、ｐ_ｇは正確なリードの確率であり、ｐ_ｒは、上記の通り、悪いリードの場合、不正確に読み取られたが、偶然に正確な対立遺伝子に見えるリードの確率であり：
Ｆ（ｐ，ｂ）＝ｐｅ^ｂ／（ｐｅ^ｂ＋（１−ｐ））、Ｈ（ｐ，ｂ）＝（ｅ^ｂｐ＋（１−ｐ））^２／ｅ^ｂ、Ｌ（ｐ，ｐ_ｒ，ｐ_ｇ）＝ｐ＊ｐ_ｇ＋ｐ_ｒ＊（１−ｐ_ｇ）である。

いくつかの実施形態では、前記方法では単純な二項分布の代わりにベータ二項分布を使用する。これは、ランダムサンプリングの偏りに対処する。ベータ二項分布のパラメータＮは、試料ごとに、必要に応じて推定する。単にｐの代わりに偏り補正Ｆ（ｐ，ｂ）、Ｈ（ｐ，ｂ）を用いて、増幅の偏りに対処する。偏りのパラメータｂは、前もって、ＳＮＰごとに、トレーニングデータから推定する。

いくつかの実施形態では、前記方法では、単にｐの代わりに漏れ補正Ｌ（ｐ，ｐ_ｒ，ｐ_ｇ）を用い、これは漏れによる偏り、すなわちＳＮＰおよび試料の質の変動に対処する。いくつかの実施形態では、パラメータｐ_ｇ、ｐ_ｒ、ｐ_ｏは、前もって、ＳＮＰごとに、トレーニングデータから推定する。いくつかの実施形態では、パラメータｐ_ｇ、ｐ_ｒ、ｐ_ｏは、実行されている現行の試料を用いて更新して、試料の質の変動を明らかにすることができる。

本明細書に記載のモデルは、かなり一般的であり、示差的な試料の質と示差的なＳＮＰの質の両方を明らかにすることができる。異なる試料およびＳＮＰは、いくつかの実施形態では平均および分散が元のＤＮＡの量、ならびに試料およびＳＮＰの質の関数であるベータ二項分布を用いるという事実によって例証されるように、異なって処理される。

プラットフォームのモデリング
血漿中に存在する予測される対立遺伝子の比がｒである（母系の遺伝子型および胎児の遺伝子型に基づいて）単一のＳＮＰを考慮に入れる。予測される対立遺伝子の比は、母系ＤＮＡと胎児ＤＮＡの組み合わせにおいて、予測される対立遺伝子Ａの割合と定義される。母系の遺伝子型ｇ_ｍおよび子の遺伝子型ｇ_ｃについて、予測される対立遺伝子の比は、遺伝子型が同様に対立遺伝子の比で示されると仮定して、式１によって示される。
ｒ＝ｆｇ_ｃ＋（１−ｆ）ｇ_ｍ（１）

ＳＮＰにおける観察は、存在する各対立遺伝子でマッピングされたリード数、ｎ_ａおよびｎ_ｂからなり、合計してリード深度ｄになる。閾値が既にマッピング確率およびｐｈｒｅｄスコアに適用されており、したがって、マッピングおよび対立遺伝子の観察を正確であるとみなすことができると仮定する。ｐｈｒｅｄスコアとは、特定の塩基における特定の測定値が誤りである確率に関する数値尺度である。ある実施形態では、塩基を配列決定によって測定した場合、ｐｈｒｅｄスコアは、コールされた塩基に対応する色素の強度と他の塩基の色素の強度の比から算出することができる。尤度を観察するための最も単純なモデルは、ｄリードのそれぞれが、対立遺伝子の比ｒを有する大規模なプールからそれぞれ独立に抜き取られたと仮定する二項分布である。式２によりこのモデルが説明される。

二項式モデルは、いくつもの方法で拡張することができる。母系の遺伝子型および胎児の遺伝子型が全てＡであるかまたは全てＢであるかのいずれかの場合、血漿における予測される対立遺伝子の比は０または１になり、二項確率は明確に定義されない。実際には、時には実施において予想外の対立遺伝子が観察される。ある実施形態では、補正した対立遺伝子の比
を用いて、予想外の対立遺伝子を少数にすることが可能である。ある実施形態では、トレーニングデータを用いて、各ＳＮＰ上に現れる予想外の対立遺伝子の比率をモデリングすること、およびこのモデルを使用して予測される対立遺伝子の比を補正することが可能である。予測される対立遺伝子の比が０または１ではない場合、観察された対立遺伝子の比は、増幅の偏りまたは他の現象に起因して、予測される対立遺伝子の比に十分に高いリード深度に収束し得ない。次いで、対立遺伝子の比を、予測される対立遺伝子の比に集中したベータ分布としてモデリングし、二項分布よりも分散が大きいＰ（ｎ_ａ，ｎ_ｂ｜ｒ）についてのベータ二項分布を得ることができる。

単一のＳＮＰにおける応答についてのプラットフォームモデルは、Ｆ（ａ，ｂ、ｇ_ｃ，ｇ_ｍ，ｆ）と定義される（３）、または観察されているｎ_ａ＝ａおよびｎ_ｂ＝ｂの確率は、母系の遺伝子型および胎児の遺伝子型を考慮すると、同様に式１による胎児画分に左右される。Ｆの関数形式は、二項分布、ベータ二項分布または上記と同様の関数であってよい。
Ｆ（ａ，ｂ，ｇ_ｃ，ｇ_ｍ，ｆ）＝Ｐ（ｎ_ａ＝ａ，ｎ_ｂ＝ｂ｜ｇ_ｃ，ｇ_ｍ，ｆ）＝Ｐ（ｎ_ａ＝ａ，ｎ_ｂ＝ｂ｜ｒ（ｇ_ｃ，ｇ_ｍ，ｆ））（３）

ある実施形態では、子の割合を以下の通り決定することができる。出生前検査のための胎児画分ｆの最尤推定値は、父系の情報を使用することなく導くことができる。これは、父系の遺伝子データが入手不可能である場合、例えば、記録の父親が実際には胎児の遺伝学的父親ではない場合に関連性があり得る。胎児画分は、母系の遺伝子型が０または１である場合にＳＮＰの集合から推定し、その結果、可能性のある胎児の遺伝子型２つのみの集合がもたらされる。Ｓ_０を、母系の遺伝子型が０であるＳＮＰの集合と定義し、Ｓ_１を、母系の遺伝子型が１であるＳＮＰの集合と定義する。Ｓ_０における可能性のある胎児の遺伝子型は０および０．５であり、可能性のある対立遺伝子の比の集合Ｒ_０（ｆ）＝｛０，ｆ／２｝がもたらされる。同様に、Ｒ_１（ｆ）＝｛１−ｆ／２，１｝である。この方法は、母系の遺伝子型が０．５であるＳＮＰを含むように自明に拡張され得るが、これらのＳＮＰは、可能性のある対立遺伝子の比のより大きな集合に起因して情報価値が低い。

Ｎ_ａ０およびＮ_ｂ０を、Ｓ_０におけるＳＮＰについてｎ_ａｓおよびｎ_ｂｓによって形成されるベクトルと定義し、Ｎ_ａ１およびＮ_ｂ１を同様にＳ_１について定義する。ｆの最尤推定値
は式４によって定義される。

各ＳＮＰにおける対立遺伝子数をＳＮＰの血漿対立遺伝子の比に対して独立して条件づけたと仮定して、確率は、各集合内のＳＮＰに関する積として表すことができる（５）。

ｆへの依存は、可能性のある対立遺伝子の比の集合Ｒ_０（ｆ）およびＲ_１（ｆ）による。ＳＮＰ確率Ｐ（ｎ_ａｓ，ｎ_ｂｓ｜ｆ）は、ｆに対して条件づけた最尤遺伝子型を仮定することによって概算することができる。合理的に高い胎児画分およびリード深度における最尤遺伝子型の選択は信頼度が高くなる。例えば、胎児画分１０パーセントおよびリード深度１０００において、母親が遺伝子型ゼロを有するＳＮＰを考慮する。予測される対立遺伝子の比は０パーセントおよび５パーセントであり、これは十分に高いリード深度において容易に区別可能である。推定される子の遺伝子型を式５に代入することにより、胎児画分を推定するための完全な式（６）が得られる。

胎児画分は、範囲［０，１］でなければならず、したがって、条件付き一次元検索によって最適化を容易に実行することができる。

低いリード深度の場合または高いノイズレベルの存在下では、不自然に高い信頼度をもたらし得る最尤遺伝子型を仮定しないことが好ましい場合がある。別の方法では、各ＳＮＰにおける可能性のある遺伝子型にわたって合計し、その結果、Ｓ_０におけるＳＮＰについてのＰ（ｎ_ａ，ｎ_ｂ｜ｆ）について以下の式（７）が得られる。事前確率Ｐ（ｒ）は、Ｒ_０（ｆ）にわたって一様であると仮定することができ、または母集団頻度に基づいてよい。群Ｓ_１への拡大は自明である。

いくつかの実施形態では、確率を以下の通り導くことができる。２つの仮説Ｈ_ｔおよびＨ_ｆのデータ尤度から信頼度を算出することができる。各仮説の尤度を、応答モデル、推定される胎児画分、母親の遺伝子型、対立遺伝子の母集団頻度、および血漿対立遺伝子数に基づいて導く。
以下の表記を定義する：
Ｇ_ｍ、Ｇ_ｃ真の母系の遺伝子型および子の遺伝子型
Ｇ_ａｆ、Ｇ_ｔｆ父親とされる人の真の遺伝子型および真の父親の真の遺伝子型
Ｇ（ｇ_ｃ，ｇ_ｍ，ｇ_ｔｆ）＝Ｐ（Ｇ_ｃ＝ｇ_ｃ｜Ｇ_ｍ＝ｇ_ｍ，Ｇ_ｔｆ＝ｇ_ｔｆ）遺伝形質確率
Ｐ（ｇ）＝Ｐ（Ｇ_ｔｆ＝ｇ）特定のＳＮＰにおける遺伝子型ｇの母集団頻度

各ＳＮＰにおける観察は血漿対立遺伝子の比に対して独立して条件づけられると仮定して、父系性仮説の尤度はＳＮＰにおける尤度の積である。以下の式により、単一のＳＮＰについての尤度が導かれる。式８は、任意の仮説ｈの尤度についての一般的な表現であり、次いで、Ｈ_ｔおよびＨ_ｆの特定の場合に分解される。
Ｈ_ｔの場合には、父親とされる人は真の父親であり、胎児の遺伝子型は、式９に従って母系の遺伝子型および父親とされる人の遺伝子型から遺伝によって受け継がれる。

Ｈ_ｆの場合には、父親とされる人は真の父親ではない。真の父親の遺伝子型の最良の推定値は、各ＳＮＰにおける母集団頻度によって生じる。したがって、子の遺伝子型の確率を、式１０の場合と同様に既知の母親の遺伝子型および母集団頻度によって決定する。

正確な父系性に対する信頼度Ｃ_ｐを、ベイズの法則（１１）を用いて、２つの尤度のＳＮＰに関する積から算出する。

パーセントによる胎児画分を用いた最尤モデル
母系の血清中に含有される浮動性ＤＮＡを測定することによって、または任意の混合試料中の遺伝子型の材料を測定することによって胎児の倍数性状態を決定することは、非自明の作業である。いくつもの方法があり、例えば、推測が、胎児が特定の染色体においてトリソミーである場合は、母系の血液中に見いだされるその染色体由来の全体的なＤＮＡの量が参照染色体に対して上昇するというものであるリード数解析を実施する方法が存在する。そのような胎児においてトリソミーを検出するための１つの方法は、各染色体について予測されるＤＮＡの量を、例えば、所与の染色体に対応する分析集合内のＳＮＰの数に従って、または染色体の独自にマッピング可能な部分の数に従って正規化することである。測定値が正規化されたら、特定の閾値を超えるＤＮＡの量が測定された任意の染色体をトリソミーであると決定する。この手法は、ＦａｎらＰＮＡＳ、２００８年；１０５巻（４２号）；１６２６６〜１６２７１頁に記載されており、ＣｈｉｕらＢＭＪ２０１１年；３４２巻：ｃ７４０１頁にも記載されている。Ｃｈｉｕらの論文では、正規化は、以下の通りＺスコアを算出することによって実現された：
検査例における第２１染色体の百分率についてのＺスコア＝（（検査例における第２１染色体の百分率）−（参照対照における第２１染色体の百分率の平均））／（参照対照における第２１染色体の百分率の標準偏差）。
これらの方法では、単一仮説棄却法を用いて胎児の倍数性状態を決定する。しかし、これらは、いくつかの著しい欠点を被る。胎児における倍数性を決定するためのこれらの方法は試料中の胎児ＤＮＡの百分率に従って不変であるので、１つのカットオフ値を使用し、その結果、決定の正確度は最適ではなく、混合物中の胎児ＤＮＡの百分率が比較的低い場合は、正確度が最も悪くなる。

ある実施形態では、胎児の倍数性状態を決定するために用いる本開示の方法は、試料中の胎児ＤＮＡの割合を考慮に入れるステップを包含する。本開示の別の実施形態では、前記方法は、最尤推定の使用を包含する。ある実施形態では、本開示の方法は、試料中の胎児起源または胎盤起源のＤＮＡのパーセントを算出するステップを包含する。ある実施形態では、異数性をコールするための閾値は、算出されたパーセント胎児ＤＮＡに基づいて適応調整する。いくつかの実施形態では、ＤＮＡの混合物中の胎児起源のものであるＤＮＡの百分率を推定するための方法は、母親由来の遺伝物質、および胎児由来の遺伝物質を含む混合試料を得るステップと、胎児の父親由来の遺伝子試料を得るステップと、混合試料中のＤＮＡを測定するステップと、父親の試料中のＤＮＡを測定するステップと、混合試料のＤＮＡ測定値、および父親の試料のＤＮＡ測定値を使用して、混合試料中の胎児起源のものであるＤＮＡの百分率を算出するステップとを含む。

本開示のある実施形態では、混合物中の胎児ＤＮＡの割合または胎児ＤＮＡの百分率を測定することができる。いくつかの実施形態では、胎児ＤＮＡと母系ＤＮＡの混合物である母系の血漿試料自体に対して行った遺伝子型決定の測定値のみを使用して割合を算出することができる。いくつかの実施形態では、測定されたか、または別の方法で既知である母親の遺伝子型および／または測定されたか、または別の方法で既知である父親の遺伝子型を用いてその割合を算出することもできる。いくつかの実施形態では、母系ＤＮＡと胎児ＤＮＡの混合物に対して得た測定値を親の状況の知見と一緒に使用して、パーセント胎児ＤＮＡを算出することができる。ある実施形態では、特定の対立遺伝子測定値についての確率についてのモデルを調整するために母集団頻度を使用して胎児ＤＮＡの割合を算出することができる。

本開示のある実施形態では、胎児の倍数性状態の決定の正確度について信頼度を算出することができる。ある実施形態では、最大の尤度（Ｈ_{ｍａｊｏｒ}）の仮説の信頼度を（１−Ｈ_{ｍａｊｏｒ}）／Σ（全てのＨ）として算出することができる。仮説の全ての分布が既知である場合、仮説の信頼度を決定することが可能である。親の遺伝子型情報が既知である場合、仮説の全ての分布を決定することが可能である。正倍数性の胎児についての予測されるデータの分布および異数性の胎児についての予測されるデータの分布の知見が既知である場合、倍数性の決定の信頼度を算出することが可能である。親の遺伝子型データが既知である場合、これらの予測される分布を算出することが可能である。ある実施形態では、正常な仮説の周りの検定統計量の分布および異常な仮説の周りの検定統計量の分布の知見を用いて、コールの信頼性を決定すること、ならびに閾値を改良してより信頼できるコールを行うことができる。これは、混合物中の胎児ＤＮＡの量および／またはパーセントが低い場合に特に有用である。これは、Ｚ統計量などの検定統計量が、胎児ＤＮＡが高いパーセントで存在する場合に対して最適化された閾値に基づいて設けた閾値を超えないことが原因で、実際には異数性である胎児が正倍数性であると見いだされる状況を回避するために役立つ。

ある実施形態では、本明細書に開示されている方法を用いて、母系の遺伝物質と胎児の遺伝物質の混合物中の母系の標的染色体および胎児の標的染色体のコピーの数を決定することによって胎児の異数性を決定することができる。この方法は、母系の遺伝物質と胎児の遺伝物質の両方を含む母系の組織を得るステップを伴ってよく、いくつかの実施形態では、この母系の組織は、母系の血液から単離された母系の血漿または組織であってよい。この方法は、上述の母系の組織を加工することによって、前記母系の組織から母系の遺伝物質と胎児の遺伝物質の混合物を得るステップも伴ってよい。この方法は、標的染色体由来の標的配列を含む個々の反応試料および標的染色体由来の標的配列を含まない個々の反応試料を無作為にもたらすために、得られた遺伝物質を複数の反応試料に分配するステップ、例えば、試料に対してハイスループット配列決定を実施するステップも伴ってよい。この方法は、前記個々の反応試料中に存在するまたは存在しない遺伝物質の標的配列を分析して、反応試料中の正倍数性であると推測される胎児の染色体の存在または不在を示すバイナリーの結果の第１の数、および反応試料中の異数性である可能性がある胎児の染色体の存在または不在を示すバイナリーの結果の第２の数をもたらすステップを伴ってよい。例えば、特定の染色体、染色体の特定の領域、特定の遺伝子座または遺伝子座の集合にマッピングされるシーケンスリードをカウントするインフォマティクス技法によってバイナリーの結果の数のいずれかを算出することができる。この方法は、集団内の染色体の長さ、染色体の領域の長さまたは遺伝子座の数に基づいてバイナリーの事象の数を規格化するステップを包含し得る。この方法は、反応試料中の正倍数性であると推測される胎児の染色体について、第１の数を用いてバイナリーの結果の数の予測される分布を算出するステップを伴ってよい。この方法は、反応試料中の異数性であることが推測される胎児の染色体についてのバイナリーの結果の数の予測される分布を算出するステップであって、第１の数、および混合物において見いだされる胎児ＤＮＡの推定される割合を、例えば、正倍数性であると推測される胎児の染色体についてのバイナリーの結果の数の予測リード数分布に（１＋ｎ／２）（ｎは推定される胎児画分である）を掛けることによって用いて算出するステップを伴ってよい。いくつかの実施形態では、シーケンスリードを、バイナリーの結果ではなく、確率的なマッピングで処理することができ、この方法では、より高い正確度がもたらされるが、さらなる計算能力が必要である。胎児画分は、複数の方法によって推定することができ、そのいくつかは、本開示の他の箇所に記載されている。この方法は、最尤手法を用いて、第２の数が、正倍数性であるまたは異数性である、異数性である可能性がある胎児の染色体に対応するかどうかを決定するステップを伴ってよい。この方法は、測定されたデータを考慮して、正確である尤度が最大である仮説に対応する倍数性状態である胎児の倍数性状態をコールするステップを包含し得る。

最尤モデルを用いて、胎児の倍数性状態を決定する任意の方法の正確度を上昇させることができることに留意されたい。同様に、胎児の倍数性状態を決定する任意の方法について信頼度を算出することができる。最尤モデルを用いることにより、単一仮説棄却法を用いて倍数性の決定を行う任意の方法の正確度が改善される。最尤モデルは、正常な場合と異常な場合の両方について尤度分布を算出することができる任意の方法に用いることができる。最尤モデルを用いることは、倍数性コールについての信頼度を算出する能力を意味する。

方法のさらなる考察
ある実施形態では、本明細書に開示されている方法では、多型遺伝子座の各対立遺伝子の独立した観察の数の定量的尺度を利用し、ここで、これには対立遺伝子の比を算出するステップは包含されない。これは、遺伝子座の２つの対立遺伝子の比に関する情報をもたらすが、いずれかの対立遺伝子の独立した観察の数を定量化しない、一部のマイクロアレイに基づく方法などの方法とは異なる。当技術分野で公知のいくつかの方法では、独立した観察の数に関する定量的情報がもたらされ得るが、倍数性の決定をもたらす算出には対立遺伝子の比のみを利用し、定量的情報は利用しない。独立した観察の数に関する情報を保持することの重要性を例示するために、２つの対立遺伝子、ＡおよびＢを有する試料の遺伝子座について考察する。第１の実験では２０の対立遺伝子Ａおよび２０の対立遺伝子Ｂを観察し、第２の実験では２００の対立遺伝子Ａおよび２００の対立遺伝子Ｂを観察する。どちらの実験でも、比（Ａ／（Ａ＋Ｂ））は０．５と等しいが、第２の実験は、第１の実験よりも対立遺伝子ＡまたはＢの頻度の確実性に関する多くの情報を伝える。当該方法では、対立遺伝子の比を利用するのではなく、定量的データを使用して、各多型遺伝子座における最も可能性が高い対立遺伝子頻度をより正確にモデリングする。

ある実施形態では、当該方法では、複数の多型遺伝子座からの測定値を総計するための遺伝子モデルを構築して、トリソミーとダイソミーをよりよく区別し、トリソミーの種類も決定する。さらに、当該方法では、遺伝連鎖情報を組み入れて、方法の正確度を増強する。これは、対立遺伝子の比を染色体上の多型遺伝子座の全てにわたって平均する、当技術分野で公知のいくつかの方法とは対照的である。本明細書に開示されている方法により、ダイソミーにおいて予測される対立遺伝子頻度分布、ならびに、減数分裂Ｉの間の染色体不分離、減数分裂ＩＩの間の染色体不分離、および胎児発生の初期の有糸分裂の間の染色体不分離によって生じるトリソミーが明確にモデリングされる。なぜこれが重要であるかを例示すると、乗換えがなければ、減数分裂Ｉの間の染色体不分離により、２つの異なる相同体が一方の親から遺伝によって受け継がれたトリソミーがもたらされ、減数分裂ＩＩの間、または胎児発生の初期の有糸分裂の間の染色体不分離により、一方の親由来の同じ相同体の２つのコピーがもたらされることになる。各筋書きにより、各多型遺伝子座において、および、一緒に考慮に入れたすべの物理的に連鎖した遺伝子座（すなわち同じ染色体上の遺伝子座）においても予測される対立遺伝子の異なる頻度がもたらされる。相同体間での遺伝物質の交換をもたらす乗換えにより、遺伝様式がより複雑になるが、当該方法は、遺伝連鎖情報、すなわち組換え率の情報および遺伝子座間の物理的な距離を使用することによってこれに対して適応する。減数分裂Ｉ時の染色体不分離と減数分裂ＩＩまたは有糸分裂時の染色体不分離をよりよく区別するために、当該方法では、乗換えの確率の上昇をセントロメアからの距離の増加としてモデルに組み入れる。減数分裂ＩＩおよび有糸分裂時の染色体不分離は、有糸分裂時の染色体不分離により、一般には、１つの相同体の同一またはほぼ同一のコピーがもたらされるが、一方、減数分裂ＩＩ時の染色体不分離事象の後に存在する２つの相同体は、多くの場合、配偶子形成の間の１つまたは複数の乗換えに起因して異なるという事実によって区別することができる。

ある実施形態では、本開示の方法では、ダイソミーを仮定する場合、親のハプロタイプを決定することができない。ある実施形態では、トリソミーの場合、当該方法により、血漿が一方の親由来の２つのコピーを取り、親の相情報は、２つのコピーが問題の親から遺伝によって受け継がれたいずれによっても決定することができないという事実を用いることによって、一方の親または両親のハプロタイプに関する決定を行うことができる。詳細には、子は、親の２つの同じコピー（一致トリソミー）または親の両方のコピー（不一致トリソミー）のいずれかを遺伝によって受け継ぐことができる。各ＳＮＰにおいて、一致トリソミーの尤度および不一致トリソミーの尤度を算出することができる。乗換えを考慮している連鎖モデルを使用しない倍数性コール方法では、トリソミーの全体的な尤度を、染色体全体にわたって一致トリソミーおよび不一致トリソミーの単純な重み付けられた平均として算出する。しかし、乗換えが存在する場合にのみ、分離エラーおよび乗換えをもたらす生物学的な機構に起因して、トリソミーは、染色体上で一致から不一致に変化し得る（および逆もまた同じ）。当該方法は、確率的に、乗換えの尤度を考慮に入れ、その結果、乗換えの尤度を考慮に入れない方法よりも正確度が高い倍数性コールがもたらされる。

ある実施形態では、参照染色体を使用して子の割合およびノイズレベルの量または確率分布を決定する。ある実施形態では、子の割合、ノイズレベル、および／または確率分布を、倍数性の状態が決定される染色体から入手可能な遺伝子情報のみを使用して決定する。当該方法は、参照染色体を伴わずに、ならびに特定の子の割合またはノイズレベルの固定を伴わずに機能する。これは、子の割合および染色体の挙動を較正するために参照染色体由来の遺伝子データが必要な、当技術分野で公知の方法の有意な改善であり、また、それと異なる点である。

胎児画分を決定するために参照染色体を必要としないある実施形態では、仮説の決定を以下の通り行う：
参照染色体を用いるアルゴリズムでは、一般には、参照染色体はダイソミーであると仮定し、次いで、（ａ）最も可能性が高い子の割合およびランダムなノイズレベルＮを、この仮定および参照染色体のデータに基づいて固定し：
とし、次いで、ＬＩＫ（Ｄ｜Ｈ）＝ＬＩＫ（Ｄ｜Ｈ，ｃｆｒ^＊，Ｎ^＊）として換算するか、または、
（ｂ）この仮定および参照染色体のデータに基づいて、子の割合およびノイズレベルの分布を推定する。詳細には、ｃｆｒおよびＮについてただ１つの値に固定しないが、確率ｐ（ｃｆｒ，Ｎ）を可能性のあるｃｆｒ、Ｎ値の広い範囲に割り当てる：
ｐ（ｃｆｒ，Ｎ）〜ＬＩＫ（Ｄ（ｒｅｆ．ｃｈｒｏｍ）｜Ｈ１１，ｃｆｒ，Ｎ）＊ｐｒｉｏｒｐｒｏｂ（ｃｆｒ，Ｎ）
式中、ｐｒｉｏｒｐｒｏｂ（ｃｆｒ，Ｎ）が特定の子の割合およびノイズレベルの事前確率であり、以前の知見および実験によって決定される。場合によっては、ｃｆｒ，Ｎの範囲にわたって一様にする。次いで、
と書くことができる。上記のどちらの方法も良好な結果をもたらす。

いくつかの場合には、参照染色体を使用することは望ましくない、可能でない、または実行可能でないことがあることに留意されたい。そのような場合には、各染色体について最良の倍数性コールを別々に導くことが可能である。詳細には：
ｐ（ｃｆｒ，Ｎ｜Ｈ）は、各染色体について別々に、単に参照染色体についてダイソミーであると仮定するのではなく、仮説Ｈを仮定して、上記の通り決定することができる。この方法を用いて、固定されたノイズのパラメータと子の画分のパラメータ両方を保持すること、いずれかのパラメータを固定すること、または両方のパラメータを各染色体および各仮説について確率的な形態で保持することが可能である。

ＤＮＡの測定、特にＤＮＡの量が少ない場合、またはＤＮＡが混入ＤＮＡと混在している場合の測定は、ノイズが入りかつ／または誤りがちである。このノイズにより、正確度が低い遺伝子型データ、および正確度が低い倍数性コールが得られる。いくつかの実施形態では、プラットフォームのモデリングまたはいくつかの他のノイズモデリングの方法を用いて、倍数性の決定に対するノイズの有害作用をカウントすることができる。当該方法では、両チャネルの同時モデル（ｊｏｉｎｔｍｏｄｅｌ）を用い、入力ＤＮＡの量、ＤＮＡの質、および／またはプロトコールの質に起因するランダムなノイズを考慮する。

これは、遺伝子座における対立遺伝子の強度の比を用いて倍数性の決定を行う、当技術分野で公知のいくつかの方法とは対照的である。この方法は、正確なＳＮＰノイズモデリングを妨げる。詳細には、測定におけるエラーは、一般には、測定されたチャネル強度比に特異的に依存せず、モデルを、一次元の情報を使用するように縮小する。ノイズ、チャネルの質およびチャネルの相互作用の正確なモデリングには、対立遺伝子の比を用いてモデリングすることができない２次元の同時モデルが必要である。

詳細には、２つのチャネル情報を、ｆ（ｘ，ｙ）がｒ＝ｘ／ｙである比ｒに投影すること自体は、正確なチャネルノイズおよび偏りのモデリングに役立たない。特定のＳＮＰにおけるノイズは、比率の関数ではない、すなわちノイズ（ｘ，ｙ）≠ｆ（ｘ，ｙ）であるが、実際には、両方のチャネルの同時関数（ｊｏｉｎｔｆｕｎｃｔｉｏｎ）である。例えば、二項式モデルでは、測定された比率のノイズはｒ（１−ｒ）／（ｘ＋ｙ）の分散を有し、これは、純粋にｒの関数ではない。任意のチャネルの偏りまたはノイズが包含されるモデルでは、ＳＮＰｉにおいて、観察されたチャネルＸ値はｘ＝ａ_ｉＸ＋ｂ_ｉであると仮定し、ここで、Ｘは真のチャネル値であり、ｂ_ｉは余分のチャネルの偏りおよびランダムなノイズである。同様に、ｙ＝ｃ_ｉＹ＋ｄ_ｉと仮定する。（ａ_ｉＸ＋ｂ_ｉ）／（ｃ_ｉＹ＋ｄ_ｉ）はＸ／Ｙの関数ではないので、観察された比ｒ＝ｘ／ｙでは、真の比率Ｘ／Ｙを正確に予測することまたは残りのノイズをモデリングすることができない。

本明細書に開示されている方法には、個々の測定チャネルの全ての同時二項分布を使用したノイズおよび偏りの有効なモデリングの方法が記載されている。関連性のある式は、文書の他の箇所、ＳＮＰの挙動を有効に調整するＳＮＰ当たりの一貫した偏り、Ｐ（ｇｏｏｄ）およびＰ（ｒｅｆ｜ｂａｄ）、Ｐ（ｍｕｔ｜ｂａｄ）について記載されているセクションに見いだすことができる。ある実施形態では、本開示の方法では、対立遺伝子の比のみに依拠する、実施による限定を回避し、その代わりに、挙動を両方のチャネル計数値に基づいてモデリングするベータ二項分布を使用する。

ある実施形態では、本明細書に開示されている方法により、全ての利用可能な測定値を使用することによって、母系の血漿中に見いだされる遺伝子データから妊娠中の胎児の倍数性をコールすることができる。ある実施形態では、本明細書に開示されている方法により、親の状況のサブセットのみからの測定値を使用することによって、母系の血漿中に見いだされる遺伝子データから妊娠中の胎児の倍数性をコールすることができる。当技術分野で公知のいくつかの方法では、親の状況がＡＡ｜ＢＢ状況からのものである場合、すなわち所与の遺伝子座において親がどちらもホモ接合性であるが、対立遺伝子が異なる場合に測定された遺伝子データのみを使用する。この方法に伴う１つの問題は、ＡＡ｜ＢＢ状況からの多型遺伝子座の割合が小さく、一般には、１０％未満であることである。本明細書に開示されている方法のある実施形態では、方法は、親の状況がＡＡ｜ＢＢである遺伝子座において行われた母系の血漿の遺伝子測定値を使用しない。ある実施形態では、当該方法では、親の状況がＡＡ｜ＡＢ、ＡＢ｜ＡＡ、およびＡＢ｜ＡＢである多型遺伝子座についてのみ血漿測定値を使用する。

当技術分野で公知のいくつかの方法は、両親の遺伝子型が存在するＡＡ｜ＢＢ状況におけるＳＮＰからの対立遺伝子の比を平均し、これらのＳＮＰにおける平均の対立遺伝子の比から倍数性コールの決定を主張するステップを包含する。この方法は、示差的なＳＮＰの挙動に起因して著しく不正確である。この方法では、両親の遺伝子型が既知であることを仮定することに留意されたい。対照的に、いくつかの実施形態では、当該方法では、親のいずれかの存在を仮定せず、均一なＳＮＰの挙動を仮定しない、同時チャネル分布モデルを使用する。いくつかの実施形態では、当該方法では、異なるＳＮＰの挙動／重み付けを考慮に入れる。いくつかの実施形態では、当該方法は、一方の親または両親の遺伝子型の知見を必要としない。当該方法がどのようにこれを実現するかの例は以下の通りである：

いくつかの実施形態では、仮説の対数尤度をＳＮＰごとに決定することができる。特定のＳＮＰｉについて、胎児の倍数性についての仮説Ｈおよびパーセント胎児ＤＮＡｃｆを仮定すると、観察されたデータＤの対数尤度は：
と定義され、式中、ｍは可能性のある真の母親の遺伝子型であり、ｆは可能性のある真の父親の遺伝子型であり、ｍ，ｆ∈｛ＡＡ，ＡＢ，ＢＢ｝であり、ｃは、仮説Ｈを考慮した、可能性のある子の遺伝子型である。詳細には、モノソミーについてはｃ｛Ａ，Ｂ｝であり、ダイソミーについてはｃ∈｛ＡＡ，ＡＢ，ＢＢ｝であり、トリソミーについてはｃ∈｛ＡＡＡ，ＡＡＢ，ＡＢＢ，ＢＢＢ｝である。親の遺伝子型データを含めることにより、一般には、より正確な倍数性の決定がもたらされるが、当該方法が良好に機能するために親の遺伝子型データは必須ではないことに留意されたい。

当技術分野で公知のいくつかの方法は、母親がホモ接合性であるが、血漿において異なる対立遺伝子が測定される（ＡＡ｜ＡＢまたはＡＡ｜ＢＢの状況）ＳＮＰからの対立遺伝子の比を平均し、これらのＳＮＰにおける平均の対立遺伝子の比から倍数性コールの決定を主張するステップを包含する。この方法は、父系の遺伝子型が入手不可能である場合を意図している。ホモ接合性で反対の父親ＢＢの存在を伴わずに、血漿が特定のＳＮＰにおいてヘテロ接合性であることをどのくらい正確に主張することができるかどうかは疑問であることに留意されたい：子の割合が少ない場合、対立遺伝子Ｂが存在するように見えるのは、単にノイズの存在である場合があり、さらに、Ｂが存在しないように見えるのは、胎児の測定値のうちの単純対立遺伝子のドロップアウトである場合もある。さらには、血漿のヘテロ接合性を実際に決定することができる場合であっても、この方法では、父系トリソミーを区別することができない。詳細には、母親がＡＡであるＳＮＰ、および血漿においていくらかのＢが測定されるＳＮＰについて、父親がＧＧである場合、生じた子の遺伝子型はＡＧＧであり、平均の比は３３％のＡになる（子の割合＝１００％）。しかし、父親がＡＧである場合には、生じた子の遺伝子型は、一致トリソミーについてはＡＧＧであってもよく、３３％のＡの比を与える、または不一致トリソミーについてはＡＡＧであってもよく、平均の比についてさらに６６％に近いＡが得られる。多くのトリソミーが乗換えを伴って染色体上にあるとすれば、全体的な染色体は、不一致トリソミーが全くないところと全てが不一致トリソミーであるところとの間のいずれの場合もあり、この比率は、３３〜６６％の間のいずれにも変動し得る。通常のダイソミーについては、比率は約５０％であるはずである。連鎖モデルまたは平均の正確なエラーモデルを使用しないと、この方法では多くの場合、父系トリソミーが見落とされる。対照的に、本明細書に開示されている方法では、利用可能な遺伝子型の情報および母集団頻度に基づいて、各親の遺伝子型の候補に対して親の遺伝子型の確率を割り当て、親の遺伝子型を明確に必要としない。さらに、本明細書に開示されている方法により、親の遺伝子型データの不在下または存在下でさえもトリソミーを検出することができ、また、連鎖モデルを使用して可能性のある一致トリソミーから不一致トリソミーへの乗換えの点を同定することによって補償することができる。

当技術分野で公知のいくつかの方法は、母系の遺伝子型も父系の遺伝子型も未知であるＳＮＰからの対立遺伝子の比を平均するため、および、これらのＳＮＰにおける平均の比から倍数性コールを決定するための方法を主張する。しかし、これらの目的を実現する方法は開示されていない。本明細書に開示されている方法により、そのような状況において正確な倍数性コールを行うことができ、同時確率最尤法を用い、必要に応じて、ＳＮＰノイズおよび偏りのモデル、ならびに連鎖モデルを利用する実施化が本文書の他の箇所に開示されている。

当技術分野で公知のいくつかの方法は、対立遺伝子の比を平均し、１つまたは少数のＳＮＰにおける平均の対立遺伝子の比からの倍数性コールの決定を主張するステップを包含する。しかし、そのような方法では、連鎖の概念を利用しない。本明細書に開示されている方法にはこれらの欠点がない。

ＤＮＡの起源を決定するための事前として配列の長さを使用すること
配列の長さの分布は母系ＤＮＡと胎児ＤＮＡで異なり、胎児の方が一般に短いことが報告されている。本開示のある実施形態では、以前の知見を経験的なデータの形態で用い、母親のＤＮＡ（Ｐ（Ｘ｜母系））と胎児ＤＮＡ（Ｐ（Ｘ｜胎児））の両方の予測される長さの事前分布を構築することが可能である。長さｘの新しい未確認のＤＮＡ配列を考慮すると、母系または胎児のいずれかを考慮したｘの事前尤度に基づいて、ＤＮＡの所与の配列が母系ＤＮＡまたは胎児ＤＮＡのいずれかである確率を定めることが可能である。詳細には、Ｐ（ｘ｜母系）＞Ｐ（ｘ｜胎児）である場合は、ＤＮＡ配列を母系に分類することができ、Ｐ（ｘ｜母系）＝Ｐ（ｘ｜母系）／［（Ｐ（ｘ｜母系）＋Ｐ（ｘ｜胎児）］であり、ｐ（ｘ｜母系）＜ｐ（ｘ｜胎児）である場合は、ＤＮＡ配列を胎児に分類することができ、Ｐ（ｘ｜胎児）＝Ｐ（ｘ｜胎児）／［（Ｐ（ｘ｜母系）＋Ｐ（ｘ｜胎児）］である。本開示のある実施形態では、その試料に対して特異的である母系の配列の長さおよび胎児の配列の長さの分布を、高い確率で母系または胎児に割り当てることができる配列を考慮に入れることによって決定することができ、次いで、その試料に特異的な分布を、その試料についての予測されるサイズ分布として用いることができる。

配列決定の費用を最小限にするための可変性のリード深度
診断薬に関する多くの臨床試験、例えば、ＣｈｉｕらＢＭＪ、２０１１年：３４２巻：ｃ７４０１頁では、いくつものパラメータを用いるプロトコールを設定し、次いで、試験における患者のそれぞれに対して同じパラメータを用いて同じプロトコールを実行する。遺伝物質を測定するための方法として配列決定を用いて母親が妊娠中の胎児の倍数性の状態を決定する場合には、１つの関係するパラメータはリード数である。リード数とは、実際のリード数、意図されたリード数、シーケンサーの分割レーン、完全なレーンまたは完全なフローセルを指し得る。これらの試験では、リード数は、一般には、全てまたはほぼ全ての試料が正確度の所望のレベルを実現することを確実にするレベルで設定する。配列決定は、現在のところ費用のかかる技術であり、マッピング可能な５００万リード当たりおよそ＄２００の費用がかかり、一方価格が下がると、同様のレベルの正確度で作動するがリードが少ない配列決定に基づく診断を可能にする任意の方法により、かなりの量の金が必ず節約される。

倍数性の決定の正確度は、一般には、リード数および混合物中の胎児ＤＮＡの割合を含めたいくつもの因子に左右される。正確度は、一般には、混合物中の胎児ＤＮＡの割合がより多いほどより高い。同時に、正確度は、一般には、リード数がより多いほどより高い。匹敵する正確度で倍数性の状態を決定する２つの場合を伴う状況を有することが可能であり、第１の場合には第２の場合よりも混合物中の胎児ＤＮＡの割合がより少なく、第１の場合には第２の場合よりも多くのリードが配列決定される。混合物中の胎児ＤＮＡの推定される割合を、所与のレベルの正確度を実現するために必要なリード数を決定することにおけるガイドとして使用することが可能である。

本開示のある実施形態では、試料の集合を、集合内の異なる試料が異なるリード深度に配列決定される場合に実行することができ、試料のそれぞれに対して実行されるリード数は、各混合物において算出された胎児ＤＮＡの割合を考慮して、所与のレベルの正確度が実現されるように選択する。本開示のある実施形態では、これは、混合物中の胎児ＤＮＡの割合を決定するために混合試料の測定を行うことを伴ってよく、この胎児画分の推定は、配列決定を用いて行うことができ、ＴＡＱＭＡＮを用いて行うことができ、ｑＰＣＲを用いて行うことができ、ＳＮＰアレイを用いて行うことができ、所与の遺伝子座における異なる対立遺伝子を区別することができる任意の方法を用いて行うことができる。胎児画分を推定することの必要性は、実際の測定データと比較する際に考慮される仮説の集合内の全てのまたは選択された胎児画分の集合を包含する仮説を含めることによって排除することができる。混合物中の胎児ＤＮＡの割合を決定した後、各試料について読み取られる配列の数を決定することができる。

本開示のある実施形態では、妊娠中の女性１００人が各人のＯＢに来診し、抗ｌｙｓａｎｔ（ａｎｔｉ−ｌｙｓａｎｔ）および／またはＤＮＡアーゼを不活化するものが入った血液チューブ中に各人の血液を採取する。該女性はそれぞれ、自身が妊娠中の胎児の父親が唾液試料を提供するためのキットを家に持ち帰る。１００組の夫婦全てについての両者の遺伝物質の集合を検査室に送り返し、そこで母親の血液を遠心沈澱させ、血漿だけでなくバフィーコートも単離する。血漿は、母系ＤＮＡならびに胎盤に由来するＤＮＡの混合物を含む。母系のバフィーコートおよび父系の血液についてＳＮＰアレイを使用して遺伝子型決定し、母系の血漿試料中のＤＮＡを、ＳＵＲＥＳＥＬＥＣＴハイブリダイゼーションプローブを用いて標的とする。プローブを用いてプルダウンされたＤＮＡを使用して、母体試料のそれぞれに対するものであり、各試料に異なるタグでタグ付けした、タグ付けしたライブラリーを１００個生成する。各ライブラリーからの一部分を取り出し、それらの一部分のそれぞれを一緒に混合し、ＩＬＬＵＭＩＮＡＨＩＳＥＱＤＮＡシーケンサーの２つのレーンに多重様式で加え、各レーンからおよそ５，０００万のマッピング可能なリードがもたらされ、１００の多重化混合物においておよそ１億のマッピング可能なリード、または試料当たりおよそ１００万のリードがもたらされた。シーケンスリードを使用して、各混合物中の胎児ＤＮＡの割合を決定した。５０の試料が、混合物中１５％超の胎児ＤＮＡを有し、１００万のリードが、９９．９％の信頼度で胎児の倍数性の状態を決定するために十分であった。

残りの混合物のうち、２５個が１０％から１５％の間の胎児ＤＮＡを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、ＨＩＳＥＱの１つのレーンに流し、各試料についてさらなる２００万のリードを生成した。１０％から１５％の間の胎児ＤＮＡを有する混合物のそれぞれについての配列データの２つの集合を一緒に加え、生じた試料当たり３００万のリードは、それらの胎児の倍数性の状態を９９．９％の信頼度で決定するために十分であった。

残りの混合物のうち、１３個が６％から１０％の間の胎児ＤＮＡを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの画分を多重化し、ＨＩＳＥＱの１つのレーンに流し、各試料についてさらなる４００万のリードを生成した。６％から１０％の間の胎児ＤＮＡを有する混合物のそれぞれについての配列データの２つの集合を一緒に加え、生じた混合物当たり５００万の総リードは、それらの胎児の倍数性の状態を９９．９％の信頼度で決定するために十分であった。

残りの混合物のうち、８つが４％から６％の間の胎児ＤＮＡを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、ＨＩＳＥＱの１つのレーンに流し、各試料についてさらなる６００万のリードを生成した。４％から６％の間の胎児ＤＮＡを有する混合物のそれぞれについての配列データの２つの集合を一緒に加え、生じた混合物当たり７００万の総リードは、それらの胎児の倍数性の状態を９９．９％の信頼度で決定するために十分であった。

残りの４つの混合物のうちの全てが２％から４％の間の胎児ＤＮＡを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、ＨＩＳＥＱの１つのレーンに流し、各試料についてさらなる１２００万のリードを生成した。２％から４％の間の胎児ＤＮＡを有する混合物のそれぞれについての配列データの２つの集合を一緒に加え、生じた混合物当たり１３００万の総リードは、それらの胎児の倍数性の状態を９９．９％の信頼度で決定するために十分であった。

この方法では、試料１００個にわたって９９．９％の正確度を実現するために、ＨＩＳＥＱ機械で配列決定するための６レーンが必要であった。あらゆる試料に対して同じ数の実行が必要である場合、あらゆる倍数性の決定が９９．９％の正確度で行われることを確実にするためには、配列決定に２５レーンが取られ、４％のコールなしの比または誤差率を許容する場合、１４レーンの配列決定で実現することができた。

未加工の遺伝子型決定データの使用
母系の血液中に見いだされる胎児ＤＮＡにおいて測定された胎児の遺伝子情報を使用してＮＰＤを実現できるいくつもの方法が存在する。これらの方法のいくつかは、ＳＮＰアレイを使用して胎児ＤＮＡの測定を行うことを包含し、いくつかの方法は非標的化配列決定を包含し、いくつかの方法は標的化配列決定を包含する。標的化配列決定ではＳＮＰを標的とすることができ、ＳＴＲを標的とすることができ、他の多型遺伝子座を標的とすることができ、非多型の遺伝子座またはそのいくつかの組み合わせを標的とすることができる。これらの方法のいくつかは、測定を行う機械のセンサーによってもたらされる強度データから対立遺伝子の同一性をコールする、商業的なまたは専有の対立遺伝子コーラーを使用することを含めてよい。例えば、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭシステムまたはＡＦＦＹＭＥＴＲＩＸＧＥＮＥＣＨＩＰマイクロアレイシステムは、ＤＮＡの相補的なセグメントとハイブリダイズすることができるＤＮＡ配列を付着させたビーズまたはマイクロチップを含み、ハイブリダイゼーションすると、センサー分子の蛍光性が変化し、それを検出することができる。配列決定方法、例えば、ＩＬＬＵＭＩＮＡＳＯＬＥＸＡＧＥＮＯＭＥＳＥＱＵＥＮＣＥＲまたはＡＢＩＳＯＬＩＤＧＥＮＯＭＥＳＥＱＵＥＮＣＥＲもあり、これは、ＤＮＡの断片の遺伝子配列について配列決定し、配列決定される鎖と相補的なＤＮＡの鎖が伸長すると、伸長したヌクレオチドの同一性が、一般には、相補的なヌクレオチドに付加した蛍光性タグまたは放射性タグを介して検出される。これらの方法の全てにおいて、遺伝子型データまたは配列決定データは、一般には、蛍光もしくは他のシグナルまたはそれがないことに基づいて決定される。これらのシステムは、一般には、蛍光または他の検出デバイスのアナログ出力（一次遺伝子データ）から特定の対立遺伝子のコール（二次遺伝子データ）を行う低レベルのソフトウェアパッケージと組み合わせる。例えば、ＳＮＰアレイ上の所与の対立遺伝子の場合には、該ソフトウェアにより、蛍光強度がある特定の閾値を上回る、または下回る量である場合に、特定のＳＮＰが存在するまたは存在しないというコールを行う。同様に、シーケンサーの出力は、色素のそれぞれについて検出された蛍光のレベルを示すクロマトグラムであり、該ソフトウェアにより、特定の塩基対が、ＡもしくはＴまたはＣもしくはＧであるというコールを行う。ハイスループットシーケンサーにより、一般には、リードと称される一連のそのような測定が行われ、配列決定された、最も可能性が高いＤＮＡ配列の構造が示される。クロマトグラムの直接的なアナログ出力は、本明細書では一次遺伝子データであると定義され、該ソフトウェアによって行われる塩基対／ＳＮＰのコールは、本明細書では二次遺伝子データとみなされる。ある実施形態では、一次データとは、遺伝子型決定プラットフォームの加工されていない出力である生の強度データを指し、遺伝子型決定プラットフォームとは、ＳＮＰアレイまたは配列決定プラットフォームを指し得る。二次遺伝子データとは、加工された遺伝子データであって、対立遺伝子のコールが行われている、または配列データが塩基対に割り当てられている、かつ／またはシーケンスリードがゲノムにマッピングされているデータを指す。

多くのより高レベルの適用では、これらの対立遺伝子のコール、ＳＮＰのコールおよびシーケンスリード、すなわち遺伝子型決定ソフトウェアにより生じる二次遺伝子データを活用する。例えば、ＤＮＡＮＥＸＵＳ、ＥＬＡＮＤまたはＭＡＱでシーケンシングリードを取得し、それらをゲノムにマッピングする。例えば、非侵襲的な出生前診断との関連において、複雑なインフォマティクス、例えば、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、個体の遺伝子型を決定するための多数のＳＮＰのコールに影響を及ぼし得る。また、着床前遺伝子診断との関連において、ゲノムにマッピングされるシーケンスリードの集合を取得することが可能であり、各染色体または染色体のセクションにマッピングされる正規化されたリード数を取得することにより、個体の倍数性の状態を決定することが可能であり得る。非侵襲的な出生前診断との関連において、母系の血漿中に存在するＤＮＡにおいて測定されたシーケンスリードの集合を取得し、それらをゲノムにマッピングすることが可能であり得る。次いで、各染色体または染色体のセクションにマッピングされる正規化されたリード数を取得し、そのデータを使用して、個体の倍数性の状態を決定することができる。例えば、不釣り合いに多数のリードを有する染色体は、血液を抜き取った母親が妊娠中の胎児においてトリソミーであると結論づけることが可能であり得る。

しかし、実際には、測定計器からの最初の出力は、アナログシグナルである。特定の塩基対を、配列決定ソフトウェアに関連するソフトウェア、例えば、塩基対Ｔをコールすることができるソフトウェアによってコールする場合、実際には、そのコールは、該ソフトウェアにより可能性が最も高いと考えられるコールである。しかし、いくつかの場合には、コールは低信頼度であってもよく、例えば、アナログシグナルにより、特定の塩基対が、Ｔである可能性が９０％だけであり、Ａである可能性が１０％であることが示される場合もある。別の例では、ＳＮＰアレイリーダーに付随する遺伝子型コールソフトウェアにより、特定の対立遺伝子がＧであることがコールされる場合もある。しかし、実際には、基礎をなすアナログシグナルにより、対立遺伝子がＧである可能性が７０％だけであり、対立遺伝子がＴである可能性が３０％であることが示される場合もある。これらの場合には、より高レベルの適用においてより低レベルのソフトウェアによって行った遺伝子型のコールおよび配列のコールを用いる場合、一部の情報が失われる。すなわち、遺伝子型決定プラットフォームによって直接測定される一次遺伝子データは、添付のソフトウェアパッケージによって決定される二次遺伝子データよりも厄介であり得るが、それはより多くの情報を含有する。二次遺伝子データ配列のゲノムへのマッピングにおいて、一部の塩基が十分に明瞭に読み取られていないので、または、マッピングが明瞭ではないので、多くのリードが捨てられる。一次遺伝子データシーケンスリードを使用する場合、二次遺伝子データシーケンスリードに最初に変換された際に捨てられた可能性があるリードの全てまたはその多くを、リードを確率的に処理することによって使用することができる。

本開示のある実施形態では、より高レベルのソフトウェアは、より低いレベルのソフトウェアによって決定される対立遺伝子のコール、ＳＮＰのコールまたはシーケンスリードに依拠しない。その代わりに、より高レベルのソフトウェアは、遺伝子型決定プラットフォームから直接測定されたアナログシグナルにその算出の基礎を置く。本開示のある実施形態では、インフォマティクスに基づく方法、例えば、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）を、胚／胎児／子の遺伝子データを再構築するその能力が、遺伝子型決定プラットフォームによって測定された一次遺伝子データを直接使用するように工学的に操作されるように改変する。本開示のある実施形態では、インフォマティクスに基づく方法、例えば、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）では、一次遺伝子データを使用し、二次遺伝子データを使用せずに、対立遺伝子のコール、および／または染色体コピー数のコールを行うことができる。本開示のある実施形態では、遺伝子のコール、ＳＮＰのコール、すべてのシーケンスリード、配列マッピングを、一次遺伝子データを二次的な遺伝子のコールに変換するのではなく、遺伝子型決定プラットフォームによって直接測定された生の強度データを使用することによって確率的に処理する。ある実施形態では、対立遺伝子数の確率を算出するステップおよび各仮説の相対的確率を決定するステップにおいて使用する調製された試料からのＤＮＡ測定値は、一次遺伝子データを含む。

いくつかの実施形態では、前記方法により、少なくとも１つの関連する個体の遺伝子データを組み入れる、標的個体の遺伝子データの正確度を上昇させることができ、前記方法は、標的個体のゲノムに特異的な一次遺伝子データおよび関連する個体（複数可）のゲノム（複数可）に特異的な遺伝子データを得るステップと、関連する個体（複数可）由来のどの染色体のセグメントが、標的個体のゲノム内のそれらのセグメントに対応する可能性があるかに関する１個または複数個の仮説の集合を作製するステップと、標的個体の一次遺伝子データおよび関連する個体（複数可）の遺伝子データを考慮して仮説のそれぞれの確率を決定するステップと、各仮説に関連する確率を用いて、実際の標的個体の遺伝物質の最も可能性が高い状態を決定するステップとを含む。いくつかの実施形態では、前記方法により、標的個体のゲノム内の染色体のセグメントのコピーの数を決定することができ、前記方法は、どのくらいの染色体セグメントのコピーが標的個体のゲノム内に存在するかに関するコピー数についての仮説の集合を作製するステップと、標的個体からの一次遺伝子データおよび１つまたは複数の関連する個体からの遺伝子情報をデータ集合に組み入れるステップと、データ集合に関連するプラットフォームの応答の特性を推定するステップであって、プラットフォームの応答が、ある実験と別の実験で変動し得るステップと、データ集合およびプラットフォームの応答特性を考慮して、コピー数についての仮説のそれぞれの相対的確率を計算するステップと、最も可能性の高いコピー数についての仮説に基づいて染色体セグメントのコピー数を決定するステップとを含む。ある実施形態では、本開示の方法は、標的個体の少なくとも１つの染色体の倍数性の状態を決定することができ、前記方法は、標的個体から、および１つまたは複数の関連する個体から、一次遺伝子データを得るステップと、標的個体の染色体のそれぞれについて、少なくとも１つの倍数性の状態についての仮説の集合を作製するステップと、１つまたは複数の専門技法を用いて、集合内の倍数性の状態についての仮説のそれぞれの統計的確率を決定するステップと、使用した専門技法のそれぞれについて、得られた遺伝子データを考慮して、倍数性の状態についての仮説のそれぞれについて、１つまたは複数の専門技法によって決定された統計的確率を組み合わせるステップと、標的個体の染色体のそれぞれについて、倍数性の状態についての仮説のそれぞれについての複合統計確率に基づいて倍数性の状態を決定するステップとを含む。ある実施形態では、本開示の方法は、対立遺伝子の集合において、標的個体において、および標的個体の一方の親または両親から、および必要に応じて、１つまたは複数の関連する個体から、対立遺伝子の状態を決定することができ、前記方法は、標的個体から、および一方の親または両親から、および任意の関連する個体から一次遺伝子データを得るステップと、標的個体について、および一方の親または両親について、および必要に応じて、１つまたは複数の関連する個体について、少なくとも１つの対立遺伝子についての仮説の集合を作製するステップであって、仮説が対立遺伝子の集合における可能性のある対立遺伝子の状態を記載するステップと、仮説の集合内の各対立遺伝子についての仮説について統計的確率を、得られた遺伝子データを考慮して決定するステップと、対立遺伝子の集合内の対立遺伝子のそれぞれについて、標的個体について、および一方の親または両親について、および必要に応じて、１つまたは複数の関連する個体について、対立遺伝子についての仮説のそれぞれの統計的確率に基づいて対立遺伝子の状態を決定するステップとを含む。

いくつかの実施形態では、混合試料の遺伝子データは、配列データを含んでよく、ここで、配列データは、ヒトゲノムに独自にマッピングされない場合がある。いくつかの実施形態では、混合試料の遺伝子データは、配列データを含んでよく、ここで、配列データは、ゲノム内の複数の場所にマッピングされ、ここで、可能性のあるマッピングのぞれぞれは、所与のマッピングが正確である確率を伴う。いくつかの実施形態では、シーケンスリードは、ゲノム内の特定の位置に関連づけられると仮定されない。いくつかの実施形態では、シーケンスリードは、ゲノム内の複数の位置に関連づけられ、付随する確率はその位置に属する。

染色体コピー数を決定する計数法
一態様では、本発明は、異なる染色体に整列させた配列タグの数を比較することにより、胎児染色体の異常分布を検査する方法を特徴とする（例えば、２０１２年４月２０日出願の米国特許第８，２９６，０７６号を参照。この特許は、参照によりその全体が本明細書に組み込まれる）。当技術分野で知られているように、用語の「配列タグ」は、例えば、染色体またはゲノム領域または遺伝子にマップされる一定のより大きな配列を特定するために使用できる比較的短い（例えば、１５〜１００）核酸配列を意味する。いくつかの実施形態では、前記方法は、（ｉ）母系および胎児ＤＮＡの混合物を含む試料を、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップであって、標的遺伝子座が複数の異なる染色体由来であり、複数の異なる染色体が試料中で異常分布を有すると疑われる少なくとも１個の第１の染色体および試料中で正常分布であると推定される少なくとも１個の第２の染色体を含むステップと、（ｉｉ）反応混合物をプライマー伸長反応条件に供して増幅産物を生成するステップと、（ｉｉｉ）増幅産物をシークエンシングして標的遺伝子座に整列した複数の、特異的標的遺伝子座を割り付けるのに十分な長の配列タグを得るステップと、（ｉｖ）コンピュータで複数の配列タグをそれらの対応する標的遺伝子座に割り付けるステップと、（ｖ）第１の染色体の標的遺伝子座に整列した配列タグの数および第２の染色体の標的遺伝子座に整列した配列タグの数をコンピュータで決定するステップと、（ｖｉ）ステップ（ｖ）からの数を比較して第１の染色体の異常分布の存在の有無を判定するステップとを含む。

一態様では、本発明は、染色体間の標的増幅産物の相対度数を比較することにより、胎児の異数性の存在の有無を検出する方法を提供する（例えば、２０１２年１月２３日出願の国際公開第ＷＯ２０１２／１０３０３１号を参照。この特許は、参照によりその全体が本明細書に組み込まれる）。いくつかの実施形態では、前記方法は、（ｉ）母系および胎児ＤＮＡの混合物を含む試料を、複数の異なる染色体由来の少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる非多形標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、（ｉｉ）反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、（ｉｉｉ）第１と第２の対象染色体由来の標的増幅産物の相対度数をコンピュータで定量化するステップと、（ｉｖ）第１と第２の対象染色体由来の標的増幅産物の相対度数をコンピュータで比較するステップと、（ｖ）第１と第２の対象染色体の比較結果の相対度数に基づいて異数性の存在の有無を特定するステップとを含む。いくつかの実施形態では、第１の染色体は、正倍数体と疑われる染色体である。いくつかの実施形態では、第２の染色体は、異数性であると疑われる染色体である。

出生前診断の組み合わせ方法
異数性または他の遺伝的欠陥を出生前診断または出生前スクリーニングするために用いることができる多くの方法が存在する。本文書の他の箇所、ならびに、２００６年１１月２８日に出願された米国実用新案出願第１１／６０３，４０６号；２００８年３月１７日に出願された米国実用新案出願第１２／０７６，３４８号、およびＰＣＴ出願第ＰＣＴ／Ｓ０９／５２７３０号に、関連する個体の遺伝子データを使用して、胎児などの標的個体の遺伝子データが公知であるまたは推定される正確度を上昇させる方法の１つが記載されている。出生前診断のために用いる他の方法は、母系の血液中の、種々の遺伝子の異常と相関する特定のホルモンのレベルを測定するステップを包含する。この例はトリプルテストと称される、母系の血液中のいくつか（一般に、２つ、３つ、４つまたは５つ）の異なるホルモンのレベルを測定する検査である。複数の方法を用いて所与の転帰の尤度を決定し、どの方法もそれ自体が決定的でない場合には、これらの方法によって生じる情報を組み合わせて、個々の方法のいずれよりも正確な予測を行うことが可能である。トリプルテストでは、３つの異なるホルモンから生じる情報を組み合わせることにより、個々のホルモンレベルにより予測され得るよりも正確な遺伝子の異常の予測がもたらされ得る。

本明細書には、胎児の遺伝子の状態、詳細には、胎児における遺伝子の異常の可能性に関してより正確な予測を行うための方法であって、種々の方法を用いて行った胎児における遺伝子の異常の予測を組み合わせること含む方法が開示されている。「より正確な」方法とは、所与の偽陽性率において、偽陰性率がより低い、異常を診断するための方法を指し得る。好ましい本開示の実施形態では、予測のうちの１つまたは複数を、胎児に関する公知の遺伝子データに基づいて行い、遺伝子の知見はＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）法を使用して決定した、すなわち、胎児に関連する個体の遺伝子データを使用して、胎児の遺伝子データをより高い正確度で決定した。いくつかの実施形態では、遺伝子データは、胎児の倍数性の状態を含んでよい。いくつかの実施形態では、遺伝子データとは、胎児のゲノムにおける対立遺伝子のコールの集合を指し得る。いくつかの実施形態では、予測のいくつかは、トリプルテストを用いて行われた。いくつかの実施形態では、予測のいくつかを、母系の血液中の他のホルモンレベルの測定値を用いて行った。いくつかの実施形態では、診断を考慮する方法によって行われる予測を、スクリーニングを考慮する方法によって行われる予測と組み合わせることができる。いくつかの実施形態では、前記方法は、アルファ−フェトプロテイン（ＡＦＰ）の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、コンジュゲートしていないエストリオール（ＵＥ_３）の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、ベータヒト絨毛性ゴナドトロピン（ベータ−ｈＣＧ）の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、浸潤性トロホブラスト抗原（ＩＴＡ）の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、インヒビンの母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、妊娠関連血漿タンパク質Ａ（ＰＡＰＰ−Ａ）の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、他のホルモンまたは母系の血清マーカーの母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、予測のいくつかは、他の方法を用いて行なわれてもよい。いくつかの実施形態では、予測のいくつかは、完全に組み込まれた検査、例えば、妊娠の約１２週における超音波検査および血液検査ならびに約１６週における第２の血液検査を組み合わせた検査を用いて行なわれてもよい。いくつかの実施形態では、前記方法は、胎児の項部浮腫（ＮＴ）を測定するステップを包含する。いくつかの実施形態では、前記方法は、予測を行うために、測定された上述のホルモンのレベルを使用するステップを包含する。いくつかの実施形態では、前記方法は、上述の方法の組み合わせを包含する。

予測を組み合わせるための多くの方法が存在し、例えば、ホルモンの測定値を、中央値の倍数（ｍｕｌｔｉｐｌｅｏｆｔｈｅｍｅｄｉａｎ）（ＭｏＭ）に変換し、次いで、尤度比（ＬＲ）に変換することができる。同様に、他の測定値を、ＮＴ分布の混合モデルを使用してＬＲに変換することができる。ＮＴおよび生化学的マーカーについてのＬＲに、年齢および妊娠に関連するリスクを掛けて、２１トリソミーなどの種々の状態に対するリスクを導くことができる。検出率（ＤＲ）および偽陽性率（ＦＰＲ）を、所与のリスク閾値を上回るリスクを有する割合を取ることによって算出することができる。

ある実施形態では、倍数性の状態をコールするための方法は、同時分布モデルおよび対立遺伝子数の確率を用いて決定される倍数性についての仮説のそれぞれの相対的確率と、これらに限定されないが、リード数解析、ヘテロ接合率の比較、親の遺伝子情報を使用する場合にのみ利用可能な統計量、特定の親の状況に対して正規化された遺伝子型シグナルの確率、第１の試料または調製された試料における推定される胎児画分を用いて算出される統計量、およびそれらの組み合わせを含めた、胎児がトリソミーであるリスクスコアを決定する他の方法から選択される統計学的技法を用いて算出された倍数性についての仮説のそれぞれの相対的確率とを組み合わせるステップを包含する。

別の方法は、４つの測定されたホルモンレベルを伴う状況であって、これらのホルモンのまわりの確率分布が既知である状況を包含し得：正倍数性の場合はｐ（ｘ_１、ｘ_２、ｘ_３、ｘ_４｜ｅ）、異数性の場合はｐ（ｘ_１、ｘ_２、ｘ_３、ｘ_４｜ａ）である。次いで、ＤＮＡ測定値についての確率分布を測定することができ、正倍数性の場合および異数性の場合、それぞれｇ（ｙ｜ｅ）およびｇ（ｙ｜ａ）である。これらは、正倍数性／異数性の仮定を考慮して、独立していると仮定すると、ｐ（ｘ_１、ｘ_２、ｘ_３、ｘ_４｜ａ）ｇ（ｙ｜ａ）およびｐ（ｘ_１、ｘ_２、ｘ_３、ｘ_４｜ｅ）ｇ（ｙ｜ｅ）として組み合わせ、次いで、母系の年齢を考慮して、それぞれに事前ｐ（ａ）およびｐ（ｅ）を掛けることができる。次いで、最も高いものを選択することができる。

ある実施形態では、中心極限定理を惹起して、ｇ（ｙ｜ａまたはｅ）の分布がガウス分布であると仮定し、多数の試料について調べることによって平均値および標準偏差を測定することが可能である。別の実施形態では、転帰を考慮して、これらが独立していないと仮定し、同時分布ｐ（ｘ_１、ｘ_２、ｘ_３、ｘ_４｜ａまたはｅ）を推定するために十分な試料を収集することができる。

ある実施形態では、標的個体が倍数性の状態であると決定されるための倍数性の状態は、最大の確率を有する仮説に関連づけられる。いくつかの場合には、１つの仮説は、９０％超の正規化された複合確率を有する。各仮説は１つの倍数性の状態または倍数性の状態の集合に関連づけられ、その正規化された複合確率が９０％超であるかまたはいくつかの他の閾値、例えば、５０％、８０％、９５％、９８％、９９％または９９．９％を超えている仮説に関連づけられる倍数性の状態を、決定された倍数性の状態として仮説がコールされるのに必要な閾値として選択することができる。

母系の血液中の、以前の妊娠由来の子由来のＤＮＡ非侵襲的な出生前診断の１つの難しさは、現行の妊娠由来の胎児の細胞と以前の妊娠由来の胎児の細胞を鑑別することである。一部では、前の妊娠由来の遺伝物質（ｇｅｎｅｔｉｃｍａｔｔｅｒ）はいくらかの時間の後に消えると考えられているが、決定的な証拠は示されていない。本開示のある実施形態では、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）（ＰＳ）法、および父系のゲノムの知見を使用して、母系の血液中に存在する父系起源の胎児ＤＮＡ（すなわち胎児が父親から遺伝によって受け継いだＤＮＡ）を決定することが可能である。この方法では、相が特定された親の遺伝子情報を利用することができる。相が特定されていない遺伝子型の情報から、祖父母の遺伝子データ（例えば、祖父の精子から測定された遺伝子データ）を使用して、または、他の生まれた子からの遺伝子データ、または流産の試料から親の遺伝子型の相を特定することが可能である。父系の細胞のＨａｐＭａｐに基づく相の特定またはハプロタイピングによって、相が特定されていない遺伝子情報の相を特定することもできる。上首尾のハプロタイピングは、染色体が緊密な束である有糸分裂の相にある細胞を静止させ、マイクロフルイディクスを使用して別々の染色体を別々のウェルに入れることによって実証されている。別の実施形態では、相が特定された親のハプロタイプデータを使用して、父親由来の２種以上の相同体の存在を検出することが可能であり、これは、２人以上の子由来の遺伝物質が血液中に存在することを意味する。胎児において正倍数性であることが予測される染色体に焦点を当てることにより、胎児がトリソミーを患っている可能性を除外することができる。また、胎児ＤＮＡが現在の父親由来でないかどうかを決定することが可能であり、その場合、他の方法、例えば、トリプルテストを用いて遺伝子の異常を予測することができる。

採血以外の方法によって入手可能な、胎児の遺伝物質の他の供給源があり得る。母系の血液において入手可能な胎児の遺伝物質の場合には、２つの主要なカテゴリー：（１）胎児の細胞全体、例えば、胎児有核赤血球または赤芽球、および（２）浮動性胎児ＤＮＡがある。胎児の細胞全体の場合には、胎児の細胞が母系の血液中で長期間存続することができ、したがって、妊娠中の女性から、前の妊娠由来の子または胎児由来のＤＮＡを含有する細胞を単離することが可能であるといういくつかの証拠が存在する。浮動性胎児ＤＮＡは、数週間のうちに系から取り除かれるという証拠も存在する。１つの難題は、その遺伝物質が細胞に含有される個体の同一性をどのように決定するか、すなわち、測定された遺伝物質が前の妊娠由来の胎児由来でないことをどのように確実にするかである。本開示のある実施形態では、母系遺伝物質の知見を用いて、問題の遺伝物質が母系遺伝物質ではないことを確実にすることができる。本文書または本文書において参照されているいずれかの特許に記載の通り、インフォマティクスに基づく方法、例えば、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）を含めた、この目的を実現するためのいくつもの方法が存在する。

本開示のある実施形態では、妊娠中の母親から抜き取った血液を、浮動性胎児ＤＮＡを含む画分、および有核赤血球を含む画分に分離することができる。浮動性ＤＮＡは必要に応じて富化することができ、ＤＮＡの遺伝子型の情報を測定することができる。浮動性ＤＮＡから測定された遺伝子型の情報から、母系の遺伝子型の知見を使用して、胎児の遺伝子型の態様を決定することができる。これらの態様は、倍数性の状態、および／または対立遺伝子の集合の同一性を指し得る。次いで、個々の有核赤血球について、本文書の他の箇所および他の参考特許に記載されている方法、特に本文書の最初のセクションに記載の方法を用いて遺伝子型決定することができる。母系ゲノムの知見により、任意の所与の単一の血液細胞が遺伝的に母系かどうかを決定することが可能になる。また、上記の通り決定された胎児の遺伝子型の態様により、単一の血液細胞が、現在妊娠中の胎児に遺伝的に由来するかどうかを決定することが可能になる。本質的に、本開示のこの態様により、母親の遺伝子の知見、および場合によっては他の関連する個体、例えば、父親からの遺伝子情報を、母系の血液中に見いだされる浮動性ＤＮＡから測定された遺伝子情報と一緒に使用して、母系の血液中に見いだされる単離された有核細胞が、（ａ）遺伝的に母系であるか、（ｂ）遺伝的に現在妊娠中の胎児由来であるか、または（ｃ）遺伝的に前の妊娠由来の胎児由来であるかのいずれかを決定することが可能になる。

出生前の性染色体異数性の決定
当技術分野で公知の方法では、妊娠中の胎児の性別を、母親の血液からを決定することを試みる人は、胎児の浮動性ＤＮＡ（ｆｆｆＤＮＡ）が母親の血漿中に存在するという事実を用いている。母系の血漿中のＹ特異的遺伝子座を検出することができれば、これは、妊娠中の胎児が男であることを意味する。しかし、当技術分野で既知の方法を用いる場合、いくつかの場合には、ｆｆｆＤＮＡの量が、男の胎児の場合にＹ特異的遺伝子座が検出されることを確実にするには低すぎるので、血漿中のＹ特異的遺伝子座が検出されないことでは、妊娠中の胎児が女であることは必ずしも保証されない。

本明細書では、Ｙ特異的核酸、すなわち排他的に父系的に由来する遺伝子座由来であるＤＮＡを測定することを必要としない新規の方法が提示される。以前に開示されたＰａｒｅｎｔａｌＳｕｐｐｏｒｔ方法では、乗換え頻度データ、親の遺伝子型データ、および妊娠中の胎児の倍数性の状態を決定するためのインフォマティクス技法を用いる。胎児の性別は、単に性染色体における胎児の倍数性の状態である。ＸＸである子は女であり、およびＸＹは男である。本明細書に記載の方法により、胎児の倍数性の状態を決定することもできる。性判別は性染色体の倍数性の決定と有効に同義であることに留意されたい；性判別の場合には、仮定は、多くの場合、子が正倍数性であるとして立てられ、したがって、可能性のある仮説が少ない。

本明細書に開示されている方法は、Ｘ染色体とＹ染色体の両方に共通する遺伝子座について調べて、胎児について予測される存在する胎児ＤＮＡの量に関するベースラインを作製するステップを包含する。次いで、Ｘ染色体のみに特異的な領域を調べて、胎児が女であるか男であるかを決定することができる。男の場合には、Ｘ染色体に特異的な遺伝子座由来の胎児ＤＮＡが、ＸとＹの両方に特異的な遺伝子座由来の胎児ＤＮＡよりも少ないと認められることが予想される。対照的に、女の胎児では、これらの群のそれぞれのＤＮＡの量が同じであることが予想される。問題のＤＮＡは、試料に存在するＤＮＡの量を定量することができる任意の技法、例えば、ｑＰＣＲ、ＳＮＰアレイ、遺伝子型決定アレイまたは配列決定によって測定することができる。排他的に１個体に由来するＤＮＡについては、以下が認められることが予想される：
胎児由来のＤＮＡが母親由来のＤＮＡと混在しており、混合物中の胎児ＤＮＡの割合がＦであり、混合物中の母系ＤＮＡの割合がＭであり、したがってＦ＋Ｍ＝１００％である場合、以下が認められることが予想される：
ＦおよびＭが既知である場合には、予測比を計算することができ、観察されたデータを、予測データと比較することができる。ＭおよびＦが未知である場合には、閾値を過去のデータに基づいて選択することができる。どちらの場合でも、ＸとＹの両方に特異的な遺伝子座において測定されたＤＮＡの量をベースラインとして用いることができ、胎児の性別の検査は、Ｘ染色体のみに特異的な遺伝子座において観察されたＤＮＡの量に基づいてよい。その量がベースラインよりも、およそ１／２Ｆと等しい量だけ低い、またはそれが予め定義された閾値未満になる量だけ低ければ、胎児は男であることが決定され、その量がベースラインとほとんど等しい、またはそれが予め定義された閾値未満になる量だけ低くなければ、胎児は女であることが決定される。

別の実施形態では、多くの場合Ｚ染色体と称される、Ｘ染色体とＹ染色体に共通である遺伝子座のみを調べることができる。Ｚ染色体上の遺伝子座のサブセットは、一般には、常にＸ染色体上のＡ、およびＹ染色体上のＢである。Ｚ染色体由来のＳＮＰがＢ遺伝子型を有することが見いだされた場合は、胎児は男であるとコールされ、Ｚ染色体由来のＳＮＰがＡ遺伝子型のみを有することが見いだされた場合には、胎児は女であるとコールされる。別の実施形態では、Ｘ染色体においてのみ見いだされる遺伝子座を調べることができる。ＡＡ｜Ｂなどの状況は、Ｂが存在することにより、胎児が父親由来のＸ染色体を有することが示されるので、特に情報価値がある。ＡＢ｜Ｂなどの状況も、女の胎児の場合には、男の胎児と比較して、多くの場合、Ｂが半分しか存在しないことが認められると予想されるので、情報価値がある。別の実施形態では、対立遺伝子ＡとＢの両方がＸ染色体とＹ染色体の両方に存在し、どのＳＮＰが父系のＹ染色体由来であるか、およびどれが父系のＸ染色体由来であるかが既知であるＺ染色体上のＳＮＰを調べることができる。

ある実施形態では、Ｙ染色体とＸ染色体によって共有される相同な非組換え（ＨＮＲ）領域間で変動することが公知の一塩基位置を増幅することが可能である。このＨＮＲ領域内の配列は、Ｘ染色体とＹ染色体の間でほとんど同一である。この同一の領域内に、母集団内のＸ染色体の間およびＹ染色体の間では不変であるが、Ｘ染色体とＹ染色体の間では異なる一塩基位置がある。各ＰＣＲアッセイによりＸ染色体とＹ染色体の両方に存在する遺伝子座由来の配列を増幅することができる。増幅された配列のそれぞれの内部に、配列決定またはいくつかの他の方法を用いて検出することができる単一の塩基がある。

ある実施形態では、胎児の性別を、母系の血漿中に見いだされる胎児の浮動性ＤＮＡから決定することができ、方法は以下のステップの一部または全部を含む：１）ＨＮＲ領域内のＸ／Ｙ変異体一塩基位置を増幅するＰＣＲ（通常のＰＣＲまたはｍｉｎｉ−ＰＣＲのいずれか、所望であればそれに加えて多重化）プライマーを設計するステップ、２）母系の血漿を得るステップ、３）母系の血漿由来の標的を、ＨＮＲＸ／ＹＰＣＲアッセイを用いてＰＣＲ増幅するステップ、４）増幅産物について配列決定するステップ、５）配列データを、増幅された配列のうちの１個または複数個の内部のＹ対立遺伝子の存在について検査するステップ。１個または複数個の存在により、男の胎児が示される。全ての増幅産物由来の全てのＹ対立遺伝子が存在しないことにより、女の胎児が示される。

ある実施形態では、標的化配列決定を用いて、母系の血漿中のＤＮＡおよび／または親の遺伝子型を測定することができる。ある実施形態では、父系的に供給されたＤＮＡを起源とすることが明白な配列を全て無視することができる。例えば、状況ＡＡ｜ＡＢでは、Ａ配列の数を計数し、Ｂ配列の全てを無視することができる。上記のアルゴリズムについてヘテロ接合性率を決定するために、所与のプローブについて、観察されたＡ配列の数と総配列の予測数を比較することができる。試料ごとに各プローブについて配列の予測数を算出することができる多くの方法がある。ある実施形態では、過去のデータを使用して、全てのシーケンスリードのどの画分が特異的なプローブのそれぞれに属するかを決定し、次いで、この経験的な画分をシーケンスリードの総数と組み合わせて使用して、各プローブにおける配列の数を推定することが可能である。別の手法では、一部の公知のホモ接合性の対立遺伝子を標的とし、次いで、過去のデータを使用して、各プローブにおけるリード数と既知のホモ接合性の対立遺伝子におけるリード数を関連づけることができる。次いで、各試料について、ホモ接合性の対立遺伝子におけるリード数を測定し、次いで、この測定値を経験的に導かれた関連性と一緒に使用して、各プローブにおけるシーケンスリード数を推定することができる。

いくつかの実施形態では、複数の方法によって行われた予測を組み合わせることによって胎児の性別を決定することが可能である。いくつかの実施形態では、複数の方法は、本開示に記載の方法から選択される。いくつかの実施形態では、複数の方法の少なくとも１つは本開示に記載の方法から選択される。

いくつかの実施形態では、本明細書に記載の方法を用いて、妊娠中の胎児の倍数性の状態を決定することができる。ある実施形態では、倍数性コール方法では、Ｘ染色体に特異的な遺伝子座またはＸ染色体とＹ染色体の両方に共通する遺伝子座を使用するが、いかなるＹ特異的遺伝子座も使用しない。ある実施形態では、倍数性コール方法では、以下の１つまたは複数を使用する：Ｘ染色体に特異的な遺伝子座、Ｘ染色体とＹ染色体の両方に共通する遺伝子座、およびＹ染色体に特異的な遺伝子座。ある実施形態では、性染色体の比が同様である場合、例えば、４５，Ｘ（ターナー症候群）、４６，ＸＸ（正常な女性）および４７，ＸＸＸ（Ｘトリソミー）、鑑別は、種々の仮説に従って対立遺伝子分布と予測される対立遺伝子分布とを比較することによって実現することができる。別の実施形態では、これは、性染色体についてのシーケンスリードの相対的な数と、正倍数性であることが仮定される１個または複数個の参照染色体とを比較することによって実現することができる。これらの方法は、異数性の場合を含むように拡大することができることにも留意されたい。

単一遺伝子疾患スクリーニング
ある実施形態では、胎児の倍数性の状態を決定するための方法は、単一遺伝子障害についての同時検査が可能になるように拡張することができる。単一遺伝子疾患の診断は、異数性試験のために用いる同じ標的化手法に影響を及ぼし、さらなる特異的な標的を必要とする。ある実施形態では、単一遺伝子ＮＰＤ診断は連鎖解析による。多くの場合、ｃｆＤＮＡ試料の直接的な試験は、母系ＤＮＡが存在することにより、胎児が母親の変異を遺伝によって受け継いだかどうかを決定することが実質的に不可能になるので、信頼できない。独自の父系的に由来する対立遺伝子を検出することは困難が少ないが、疾患が優性であり、父親が保有する場合にのみ完全に情報価値があり、それによりこの手法の有用性が限定される。ある実施形態では、前記方法は、ＰＣＲまたは関連する増幅手法を包含する。

いくつかの実施形態では、前記方法は、親において、周囲に非常にしっかりと連鎖したＳＮＰがある異常な対立遺伝子について、第一度近親者からの情報を用いて相を特定するステップを包含する。次いで、これらのＳＮＰから得られた標的化配列決定データに対してＰａｒｅｎｔａｌＳｕｐｐｏｒｔを実行して、正常な相同体または異常な相同体のいずれを、両親から胎児が遺伝によって受け継いだかを決定することができる。ＳＮＰが十分に連鎖している限りは、胎児の遺伝子型の遺伝を非常に確実に決定することができる。いくつかの実施形態では、方法は、（ａ）日常病の特定の集合を密に隣接させるためのＳＮＰ遺伝子座の集合を、異数性を試験するための本発明者らの多重プールに付加するステップと；（ｂ）正常な対立遺伝子および異常な対立遺伝子を有する、付加したこれらのＳＮＰから、種々の近親者からの遺伝子データに基づいて、対立遺伝子について確実に相の特定をするステップと、（ｃ）疾患遺伝子座の周囲の領域内の遺伝によって受け継がれた母系の相同体および父系の相同体における胎児のハプロタイプまたは相が特定されたＳＮＰ対立遺伝子の集合を再構築して、胎児の遺伝子型を決定するステップとを含む。いくつかの実施形態では、疾患連鎖遺伝子座に確実に結合するさらなるプローブを、異数性試験のために用いる多型遺伝子座の集合に加える。

試料は母系ＤＮＡと胎児ＤＮＡの混合物であるので、胎児のディプロタイプを再構築することは困難である。いくつかの実施形態では、前記方法では、近親者の情報を組み入れて、ＳＮＰおよび疾患対立遺伝子の相を特定し、次いで、場所特異的な組換え尤度からのＳＮＰおよび組換えデータと母系の血漿の遺伝子測定値から観察されたデータの物理的な距離を考慮に入れて、最も可能性が高い胎児の遺伝子型を得る。

ある実施形態では、疾患連鎖遺伝子座あたりいくつものさらなるプローブを標的の多型遺伝子座の集合に含める；疾患連鎖遺伝子座あたりのさらなるプローブの数は、４個から１０個の間、１１個から２０個の間、２１個から４０個の間、４１個から６０個の間、６１個から８０個の間、またはそれらの組み合わせであってよい。

親由来の二倍体データの相の特定が困難な場合があり、これを行うことができる多くの方法がある。いくつかは本開示で考察されており、他のものは、別の開示でさらに詳細に記載されている（例えば、２００９年２月９日出願の国際公開第ＷＯ２００９１０５５３１号、および２００９年８月４日出願の同ＷＯ２０１００１７２１４号を参照。これらの特許は、参照によりその全体が本明細書に組み込まれる）。一実施形態では、親由来の半数体組織を測定することにより、例えば、１個または複数個の精子または卵子を測定することにより、親の相を推測して特定できる。一実施形態では、第一度近親者、例えば、親の親または同胞の測定遺伝子型データを使って推測して親の相を特定できる。一実施形態では、それぞれのウェル中に約１個以下のそれぞれのハプロタイプのコピーとなることが予測されるまで１個または複数個のウェル中でＤＮＡを希釈し、その後、１個または複数個のウェル中のＤＮＡを測定することにより親の相を特定できる。一実施形態では、集団ベースハプロタイプ頻度を使用して最も可能性のある相を推測するコンピュータプログラムを使って親の遺伝子型の相の特定ができる。一実施形態では、親の遺伝学的子孫の１個または複数個の相の未特定遺伝子データに加えて、相の特定がなされたハロタイプデータがもう一方の親で既知である場合、親の相の特定ができる。いくつかの実施形態では、親の遺伝学的子孫は、１個または複数個の胚、１人または複数人の胎児、および／または産まれた子供であってもよい。一方の親または両親の相の特定に関するいくつかのこれらの方法のおよび他の方法は、例えば、２０１０年８月１９日出願の米国特許公開第２０１１／００３３８６２号；２０１１年２月３日出願の同２０１１／０１７８７１９号；２００６年１１月２２日出願の同２００７／０１８４４６号；２００８年３月１７日出願の同２００８／０２４３３９８号、にさらに詳細に開示されている。これらの特許は、参照によりその全体が本明細書に組み込まれる。

胎児のゲノム再構築
一態様では、本発明は、胎児のハプロタイプを決定する方法を特徴とする。種々の実施形態では、前記方法は、どの多形遺伝子座（例えば、ＳＮＰ）が胎児に遺伝したか判定し、胎児中に存在する相同体を再構築（組換えイベントを含む）すること（および、それにより、多形遺伝子座間の配列を補間すること）を可能とする。必要に応じ、実質的に胎児の全ゲノムを再構築できる。胎児のゲノムにいくつかの曖昧さ（例えば、乗換え間隔）が残されている場合、この曖昧さは、必要に応じ、追加の多形遺伝子座を解析することにより最小化できる。種々の実施形態では、所望レベルに対する全ての曖昧さを減らすために、多形遺伝子座は、１個または複数個の染色体の範囲にわたり一定の密度になるように選択される。前記方法は、胎児ゲノム中の対象多型または他の変異の直接検出ではなく連鎖（例えば、胎児ゲノム中に連鎖多形遺伝子座の存在）に基づくそれらの検出を可能とするために、胎児における対象の多型または他の変異の検出に関し重要な用途がある。例えば、親が嚢胞性線維症（ＣＦ）に関連する変異の保持者である場合、胎児の母親由来の母系ＤＮＡおよび胎児由来の胎児ＤＮＡを含む核酸試料を分析して、胎児ＤＮＡがＣＦ変異を有するハプロタイプを含むかどうかを判定できる。特に、胎児ＤＮＡ中のＣＦ変異それ自体を検出することを必要とせずに、多形遺伝子座を分析して、胎児ＤＮＡがＣＦ変異を有するハプロタイプを含むかどうかを判定できる。

いくつかの実施形態では、前記方法は、親のハプロタイプ（例えば、胎児の母および父のハプロタイプ）を決定するステップを含む。いくつかの実施形態では、この決定は、母親または父親の親類由来のデータを使うことなく行われる。いくつかの実施形態では、本明細書および別の文献で記載（例えば、２０１０年８月１９日出願の米国特許公開第２０１１／００３３８６２号を参照。この特許は、参照によりその全体が本明細書に組み込まれる）のように、親のハプロタイプは、希釈手法に続くＳＮＰ遺伝子型解析またはシークエンシングを使って決定される。ＤＮＡが希釈されるために、１個超のハプロタイプが同じ部分（またはチューブ）中に存在することはないであろう。これにより、事実上チューブ中にＤＮＡ単一分子が存在し得る状態となり、単一ＤＮＡ分子上のハプロタイプを決定できる。いくつかの実施形態では、前記方法は、ＤＮＡ試料を複数の部分に分割して、少なくとも１つの部分が染色体対由来の１個の染色体または１個の染色体セグメントを含み、少なくとも１つの部分中のＤＮＡ試料の遺伝子型解析を行い（例えば、２個以上の多形遺伝子座の存在の決定）、それにより、親のハプロタイプを決定するステップを含む。いくつかの実施形態では、遺伝子型解析は、シークエンシング（例えば、ショットガンシークエンシング）を行うステップを含む。いくつかの実施形態では、遺伝子型解析は、ＳＮＰアレイを使用して、多形遺伝子座、例えば、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座を検出するステップを含む。いくつかの実施形態では、遺伝子型解析は、多重ＰＣＲを使用するステップを含む。いくつかの実施形態では、前記方法は、分割試料を、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座（例えば、ＳＮＰ）に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、反応混合物をプライマー伸長反応条件に供して、ハイスループットシーケンサーで測定して配列決定データを生成する増幅産物を得るステップとを含む。

いくつかの実施形態では、母親のハプロタイプは、母親の親類由来のデータを使って本明細書で記載の方法のいずれかにより決定される。いくつかの実施形態では、父親のハプロタイプは、父親の親類由来のデータを使って本明細書で記載の方法のいずれかにより決定される。いくつかの実施形態では、父親と母親の両方に対するハプロタイプが決定される。いくつかの実施形態では、ＳＮＰアレイを使って、母親（または父親）および母親（または父親）の親類由来のＤＮＡ試料中の少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座の存在が決定される。いくつかの実施形態では、前記方法は、母親（または父親）および／または母親（または父親）の親類由来のＤＮＡ試料を、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座（例えば、ＳＮＰ）に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、反応混合物をプライマー伸長反応条件に供し、ハイスループットシーケンサーで測定して配列決定データを生成する増幅産物を得るステップとを含む。親のハプロタイプは、ＳＮＰアレイまたは配列決定データに基づいて決定できる。いくつかの実施形態では、本文書で記載されているか、または本文書の他の場所で参照されている方法により親のデータの相の特定を行うことができる。

この親のハプロタイプデータを使って、胎児が親のハプロタイプを受け継いでいるかどうかを判定できる。いくつかの実施形態では、胎児の母親由来の母系ＤＮＡおよび胎児由来の胎児ＤＮＡを含む核酸試料がＳＮＰアレイを使って分析されて、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座が検出される。いくつかの実施形態では、胎児の母親由来の母系ＤＮＡおよび胎児由来の胎児ＤＮＡを含む核酸試料は、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座（例えば、ＳＮＰ）に同時にハイブリダイズするプライマーライブラリーと試料を接触させて反応混合物を生成することにより分析される。いくつかの実施形態では、反応混合物は、プライマー伸長反応条件に供されて増幅産物を生成する。いくつかの実施形態では、増幅産物は、ハイスループットシーケンサーで測定され、配列決定データが生成される。種々の実施形態では、ＳＮＰアレイまたは配列決定データを使って、染色体中の種々の部位での染色体乗換え確率に関するデータを使うことにより（例えば、ハップマップデータベース中で見つけることができるような組換えデータを使って任意の間隔に対する組換えリスクスコアを生成することにより）染色体上の多形対立遺伝子間の依存性をモデル化することにより親のハプロタイプが決定される。いくつかの実施形態では、多形遺伝子座での対立遺伝子数は、配列決定データに基づいてコンピュータで計算される。いくつかの実施形態では、それぞれ異なる可能な染色体の倍数性状態に関する複数の倍数性仮説がコンピュータで生成され、染色体上の多形遺伝子座で予測される対立遺伝子数に対するモデル（例えば、同時分布モデル）がそれぞれの倍数性仮説に対しコンピュータで構築され、同時分布モデルおよび対立遺伝子数を使って、それぞれの倍数性仮説の相対的確率がコンピュータで算出され、最大確率を有する仮説に対応する倍数性状態を選択することにより胎児の倍数性状態がコールされる。いくつかの実施形態では、対立遺伝子数についての同時分布モデルを構築するステップおよび各仮説の相対的確率を決定するステップを、参照染色体を使用することを必要としない方法を用いて行う。

いくつかの実施形態では、胎児のハプロタイプが、染色体１３、１８、２１、Ｘ、およびＹからなる群より選択される１個または複数個の染色体に対し決定される。いくつかの実施形態では、胎児のハプロタイプは、全ての胎児染色体に対し決定される。種々の実施形態では、前記方法は、実質的に胎児の全ゲノムを決定する。いくつかの実施形態では、ハプロタイプは、少なくとも３０、４０、５０、６０、７０、８０、９０、または９５％の胎児のゲノムに対し決定される。いくつかの実施形態では、胎児のハプロタイプ決定は、少なくとも１，０００；２，０００；５，０００；７，５００；１０，０００；２０，０００；２５，０００；３０，０００；４０，０００；５０，０００；７５，０００；または１００，０００個の異なる多形遺伝子座に対しどの対立遺伝子が存在するかに関する情報を含む。

ＤＮＡの組成
胎児に関するゲノムの情報、例えば、胎児の倍数性状態を決定するために、胎児の血液と母系の血液の混合物について測定された配列決定データに対してインフォマティクス分析を実施する場合、対立遺伝子の集合における対立遺伝子分布を測定することが有利であり得る。残念ながら母系の血液試料の血漿において見いだされるＤＮＡ混合物から胎児の倍数性状態を決定することを試みる場合などの多くの場合、利用可能なＤＮＡの量は、混合物において優良な忠実度で対立遺伝子分布を直接測定するためには十分でない。これらの場合には、ＤＮＡ混合物を増幅することにより、所望の対立遺伝子分布を優良な忠実度で測定することができる十分な数のＤＮＡ分子がもたらされる。しかし、配列決定するためのＤＮＡの増幅に一般に用いられる増幅の現行の方法は、多くの場合、非常に偏りがある、つまり、多型遺伝子座の両方の対立遺伝子が同じ量で増幅されない。偏りのある増幅の結果、元の混合物における対立遺伝子分布とかなり異なる対立遺伝子分布がもたらされ得る。ほとんどの目的のためには、多型遺伝子座に存在する対立遺伝子の相対的な量を非常に正確に測定することは必要とされない。対照的に、本開示のある実施形態では、多型対立遺伝子を特異的に富化し、対立遺伝子の比を保存する増幅または富化方法は有利である。

対立遺伝子の偏りが最小限になるようにＤＮＡの試料を複数の遺伝子座で優先的に富化するために用いることができるいくつもの方法が本明細書に記載されている。いくつかの例では、複数の遺伝子座を標的とするために環状化プローブを使用し、環状化前プローブの３’末端および５’末端が、標的の対立遺伝子の多型部位から１つまたは少数の位置離れた塩基とハイブリダイズするように設計されている。別の例は、３’末端ＰＣＲプローブが標的の対立遺伝子の多型部位から１つまたは少数の位置離れた塩基とハイブリダイズするように設計されているＰＣＲプローブを使用するというものである。別の例は、スプリットアンドプール手法を用いて、優先的に富化された遺伝子座が、対立遺伝子の偏りが少なく、直接的な多重化の欠点を伴わずに富化されているＤＮＡの混合物を作製するというものである。別の例は、標的の多型部位に隣接しているＤＮＡとハイブリダイズするように設計されている捕捉プローブの領域が、多型部位と１つまたは少数の塩基で隔てられるように捕捉プローブが設計されているハイブリッド捕捉手法を用いるというものである。

多型遺伝子座の集合における測定された対立遺伝子分布を使用して個体の倍数性状態を決定する場合には、遺伝子測定のためにＤＮＡの試料が調製されるとき該ＤＮＡ試料における対立遺伝子の相対的な量を保存することが望ましい。この調製は、ＷＧＡ増幅、標的化増幅、選択的富化技法、ハイブリッド捕捉法、環状化プローブまたはＤＮＡの量を増幅し、かつ／または特定の対立遺伝子に対応するＤＮＡ分子の存在を選択的に増強することを意図した他の方法を包含し得る。

本開示のいくつかの実施形態では、マイナー対立遺伝子頻度が最大である遺伝子座を標的とするように設計されたＤＮＡプローブの集合が存在する。本開示のいくつかの実施形態では、胎児がそれらの遺伝子座において情報価値が高いＳＮＰを有する尤度が最大である遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが所与の母集団サブグループに対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが母集団サブグループの所与の混合物に対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが、異なるマイナー対立遺伝子頻度プロファイルを有する異なる母集団サブグループに由来する所与の親の対に対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、胎児起源のＤＮＡの一部分とアニーリングした少なくとも１つの塩基対を含む環状化ＤＮＡ鎖が存在する。本開示のいくつかの実施形態では、胎盤起源のＤＮＡの一部分とアニーリングした少なくとも１つの塩基対を含む環状化ＤＮＡ鎖が存在する。本開示のいくつかの実施形態では、環状化し、その一方でヌクレオチドの少なくとも一部が胎児起源のＤＮＡとアニーリングした環状化ＤＮＡ鎖が存在する。本開示のいくつかの実施形態では、環状化し、その一方でヌクレオチドの少なくとも一部が胎盤起源のＤＮＡとアニーリングした環状化ＤＮＡ鎖が存在する。本開示のいくつかの実施形態では、いくつかが単一のタンデム反復を標的とし、いくつかが一塩基多型を標的とするプローブの集合が存在する。いくつかの実施形態では、非侵襲的な出生前診断のために遺伝子座を選択する。いくつかの実施形態では、非侵襲的な出生前診断のためにプローブを使用する。いくつかの実施形態では、環状化プローブ、ＭＩＰ、ハイブリダイゼーションプローブによる捕捉、ＳＮＰアレイ上のプローブ、またはそれらの組み合わせを含んでよい方法を用いて遺伝子座を標的とする。いくつかの実施形態では、プローブを環状化プローブ、ＭＩＰ、ハイブリダイゼーションプローブによる捕捉、ＳＮＰアレイ上のプローブ、またはそれらの組み合わせとして使用する。いくつかの実施形態では、非侵襲的な出生前診断のために遺伝子座について配列決定する。

配列の相対的（ｒｅｌａｔｉｖｅ）情報価値が、関連する親の状況と組み合わせるとより大きくなる場合には、親の状況が既知であるＳＮＰを含有するシーケンスリード数を最大にすることにより、混合試料についてのシーケンシングリードの集合の情報価値が最大になり得る。ある実施形態では、親の状況が既知であるＳＮＰを含有するシーケンスリード数は、ｑＰＣＲを用いて特定の配列を優先的に増幅することによって増強することができる。ある実施形態では、親の状況が既知であるＳＮＰを含有するシーケンスリード数を、環状化プローブ（例えば、ＭＩＰ）を用いて特定の配列を優先的に増幅することによって増強することができる。ある実施形態では、親の状況が既知であるＳＮＰを含有するシーケンスリード数を、ハイブリダイゼーション法による捕捉（例えば、ＳＵＲＥＳＥＬＥＣＴ）を用いて特定の配列を優先的に増幅することによって増強することができる。異なる方法を用いて、親の状況が既知であるＳＮＰを含有するシーケンスリード数を増強することができる。ある実施形態では、標的化は、伸長ライゲーション、伸長を伴わないライゲーション、ハイブリダイゼーションによる捕捉またはＰＣＲによって実現することができる。

断片化されたゲノムＤＮＡの試料において、ＤＮＡ配列のある一部分（ｆｒａｃｔｉｏｎ）が個々の染色体に独自にマッピングされ、他のＤＮＡ配列は異なる染色体上に見いだされる。血漿中に見いだされるＤＮＡは、母体起源であろうと胎児起源であろうと、一般には、多くの場合、５００ｂｐを下回る長さに断片化されていることに留意されたい。典型的なゲノム試料では、マッピング可能な配列のおよそ３．３％が第１３染色体にマッピングされ、マッピング可能な配列の２．２％が第１８染色体にマッピングされ、マッピング可能な配列の１．３５％が第２１染色体にマッピングされ、女性ではマッピング可能な配列の４．５％がＸ染色体にマッピングされ、マッピング可能な配列の２．２５％がＸ染色体にマッピングされ（男性では）、マッピング可能な配列の０．７３％がＹ染色体にマッピングされる（男性では）。これらは胎児において異数性である可能性が最も高い染色体である。また、ｄｂＳＮＰに含まれるＳＮＰを使用すると、短い配列の中では２０配列のうちおよそ１つがＳＮＰを含有する。この割合は、発見されていない多くのＳＮＰが存在し得るとすれば、より高くなり得る。

本開示のある実施形態では、標的化方法を用いて、所与の染色体にマッピングされるＤＮＡの試料中のＤＮＡの一部分を、その一部分が、上に列挙されているゲノム試料に典型的な百分率を有意に超えるように増強することができる。本開示のある実施形態では、標的化方法を用いて、ＤＮＡの試料中のＤＮＡの一部分を、ＳＮＰを含有する配列の百分率が、ゲノム試料に典型的に見出され得る百分率を有意に超えるように増強することができる。本開示のある実施形態では、出生前診断のために、標的化方法を用いて、母系ＤＮＡと胎児ＤＮＡの混合物中の染色体由来のＤＮＡまたはＳＮＰの集合由来のＤＮＡを標的とすることができる。

疑わしい染色体にマッピングされるリード数を計数し、それを、参照染色体にマッピングされるリード数と比較し、疑わしい染色体上のリードの存在量が過剰であることは、その染色体における胎児の三倍体性に対応するという仮定を用いることによって胎児の異数性を決定するための方法が報告されていることに留意されたい（米国特許第７，８８８，０１７号）。これらの出生前診断のための方法では、いかなる種類の標的化も使用されず、また、出生前診断のための標的化の使用については記載されていない。

混合試料の配列決定において標的化手法を用いることにより、少ないシーケンスリードを用いて特定のレベルの正確度を実現することが可能であり得る。正確度とは感度を指す場合があり、正確度とは特異度を指す場合があり、または正確度はそのいくつかの組み合わせを指す場合がある。正確度の所望のレベルは、９０％から９５％の間であってもよく、正確度の所望のレベルは、９５％から９８％の間であってもよく、正確度の所望のレベルは、９８％から９９％の間であってもよく、正確度の所望のレベルは、９９％から９９．５％の間であってもよく、正確度の所望のレベルは、９９．５％から９９．９％の間であってもよく、正確度の所望のレベルは、９９．９％から９９．９９％の間であってもよく、正確度の所望のレベルは、９９．９９％から９９．９９９％の間であってもよく、正確度の所望のレベルは、９９．９９９％から１００％の間であってもよい。９５％を上回る正確度のレベルを、高い正確度と称することができる。

母系ＤＮＡと胎児ＤＮＡの混合試料からどのように胎児の倍数性状態を決定することができるかについて実証している、いくつもの公開された先行技術の方法、例えば：Ｇ．Ｊ．Ｗ．ＬｉａｏらＣｌｉｎｉｃａｌＣｈｅｍｉｓｔｒｙ２０１１年；５７巻（１号）９２〜１０１頁が存在する。これらの方法は、各染色体に沿った数千もの場所に焦点を当てる。標的とすることができ、一方ではＮＡの混合試料から、所与の数のシーケンスリードについて、胎児における倍数性の決定を高い正確度でもたらす染色体に沿った場所の数は予想外に少ない。本開示のある実施形態では、任意の標的化の方法、例えば、ｑＰＣＲ、リガンド媒介性ＰＣＲ、他のＰＣＲ法、ハイブリダイゼーションによる捕捉または環状化プローブを用いた標的化配列決定を用いることによって正確な倍数性の決定を行うことができ、ここで、標的とする必要がある染色体に沿った遺伝子座の数は、５，０００個から２，０００個の間の遺伝子座であってもよく、２，０００個から１，０００個の間の遺伝子座であってもよく、１，０００個から５００個の間の遺伝子座であってもよく、５００個から３００個の間の遺伝子座であってもよく、３００個から２００個の間の遺伝子座であってもよく、２００個から１５０個の間の遺伝子座であってもよく、１５０個から１００個の間の遺伝子座であってもよく、１００個から５０個の間の遺伝子座であってもよく、５０個から２０個の間の遺伝子座であってもよく、２０個から１０個の間の遺伝子座であってもよい。最適には、標的とする必要がある染色体に沿った遺伝子座の数は、１００個から５００個の間の遺伝子座であり得る。高レベルの正確度は、少数の遺伝子座を標的とし予想外に少数のシーケンスリードを実行することによって実現することができる。リード数は、１億個から５０００万個の間のリードであってもよく、リード数は、５０００万個から２０００万個の間のリードであってもよく、リード数は、２０００万個から１０００万個の間のリードであってもよく、リード数は、１０００万個から５００万個の間のリードであってもよく、リード数は、５００万個から２００万個の間のリードであってもよく、リード数は、２００万個から１００万個の間であってもよい；リード数は、１００万個から５００，０００個の間であってもよい；リード数は、５００，０００個から２００，０００個の間であってもよく、リード数は、２００，０００個から１００，０００個の間であってもよく、リード数は、１００，０００個から５０，０００個の間であってもよく、リード数は、５０，０００個から２０，０００個の間であってもよく、リード数は、２０，０００個から１０，０００個の間であってもよく、リード数は、１０，０００個未満であってもよい。より大量の入力ＤＮＡに対してはより少数のリードが必要である。

いくつかの実施形態では、胎児起源のＤＮＡと母体起源のＤＮＡの混合物を含む組成物であって、第１３染色体に独自にマッピングされる配列のパーセントが４％超、５％超、６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超、２０％超、２５％超または３０％超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のＤＮＡと母体起源のＤＮＡの混合物を含む組成物であって、第１８染色体に独自にマッピングされる配列のパーセントが３％超、４％超、５％超、６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超、２０％超、２５％超または３０％超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のＤＮＡと母体起源のＤＮＡの混合物を含む組成物であって、第２１染色体に独自にマッピングされる配列のパーセントが２％超、３％超、４％超、５％超、６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超、２０％超、２５％超または３０％超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のＤＮＡと母体起源のＤＮＡの混合物を含む組成物であって、独自にＸ染色体にマッピングされる配列のパーセントが６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超、２０％超、２５％超または３０％超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のＤＮＡと母体起源のＤＮＡの混合物を含む組成物であって、独自にＹ染色体にマッピングされる配列のパーセントが１％超、２％超、３％超、４％超、５％超、６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超、２０％超、２５％超または３０％超である組成物が存在する。

いくつかの実施形態では、組成物は、胎児起源のＤＮＡと母体起源のＤＮＡの混合物を含むと記載され、ある染色体に独自にマッピングされ少なくとも１つの一塩基多型を含有する配列のパーセントは、０．２％超、０．３％超、０．４％超、０．５％超、０．６％超、０．７％超、０．８％超、０．９％超、１％超、１．２％超、１．４％超、１．６％超、１．８％超、２％超、２．５％超、３％超、４％超、５％超、６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超または２０％超であり、染色体は１３、１８、２１、ＸまたはＹの群から選択される。本開示のいくつかの実施形態では、胎児起源のＤＮＡと母体起源のＤＮＡの混合物を含む組成物であって、ある染色体に独自にマッピングされ一塩基多型の集合からの少なくとも１つの一塩基多型を含有する配列のパーセントは０．１５％超、０．２％超、０．３％超、０．４％超、０．５％超、０．６％超、０．７％超、０．８％超、０．９％超、１％超、１．２％超、１．４％超、１．６％超、１．８％超、２％超、２．５％超、３％超、４％超、５％超、６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超または２０％超であり、染色体は第１３染色体、第１８染色体、第２１染色体、Ｘ染色体およびＹ染色体の集合から選択され、一塩基多型の集合内の一塩基多型の数は、１個から１０個の間、１０個から２０個の間、２０個から５０個の間、５０個から１００個の間、１００個から２００個の間、２００個から５００個の間、５００個から１，０００個の間、１，０００個から２，０００個の間、２，０００個から５，０００個の間、５，０００個から１０，０００個の間、１０，０００個から２０，０００個の間、２０，０００個から５０，０００個の間、および５０，０００個から１００，０００個の間である組成物が存在する。

理論上は、増幅の各サイクルにより、存在するＤＮＡの量が倍増するが、実際には、増幅の程度は２倍よりわずかに低い。理論上は、標的化増幅を含めた増幅により、偏りのないＤＮＡ混合物の増幅がもたらされるが、実際には、異なる対立遺伝子は他の対立遺伝子と異なる程度で増幅される傾向がある。ＤＮＡを増幅する場合、対立遺伝子の偏りの程度は、一般には増幅ステップの数に伴って上昇する。いくつかの実施形態では、本明細書に記載の方法は、低レベルの対立遺伝子の偏りでＤＮＡを増幅するステップを包含する。対立遺伝子の偏りはさらに別のサイクルのそれぞれで複合されるので、全体的な偏りのｎ乗根を算出することによってサイクル当たりの対立遺伝子の偏りを決定することができ、ここで、ｎは富化の程度の、底を２とする対数である。いくつかの実施形態では、第２のＤＮＡの混合物を含む組成物が存在し、該第２のＤＮＡの混合物は、第１のＤＮＡの混合物からの複数の多型遺伝子座に優先的に富化されており、富化の程度は、少なくとも１０、少なくとも１００、少なくとも１，０００、少なくとも１０，０００、少なくとも１００，０００または少なくとも１，０００，０００であり、第２のＤＮＡの混合物での各遺伝子座における対立遺伝子の比は、第１のＤＮＡの混合物でのその遺伝子座における対立遺伝子の比とは、平均で、１，０００％未満、５００％、２００％、１００％、５０％、２０％、１０％、５％、２％、１％、０．５％、０．２％、０．１％、０．０５％、０．０２％または０．０１％の係数だけ異なる。いくつかの実施形態では、第２のＤＮＡの混合物を含む組成物が存在し、第２のＤＮＡの混合物は、第１のＤＮＡの混合物からの複数の多型遺伝子座に優先的に富化されており、ここで、サイクル当たりの複数の多型遺伝子座についての対立遺伝子の偏りは、平均で、１０％未満、５％、２％、１％、０．５％、０．２％、０．１％、０．０５％または０．０２％である。いくつかの実施形態では、複数の多型遺伝子座は、少なくとも１０個の遺伝子座、少なくとも２０個の遺伝子座、少なくとも５０個の遺伝子座、少なくとも１００個の遺伝子座、少なくとも２００個の遺伝子座、少なくとも５００個の遺伝子座、少なくとも１，０００個の遺伝子座、少なくとも２，０００個の遺伝子座、少なくとも５，０００個の遺伝子座、少なくとも１０，０００個の遺伝子座、少なくとも２０，０００個の遺伝子座、または少なくとも５０，０００個の遺伝子座を含む。

いくつかの実施形態
いくつかの実施形態では、妊娠中の胎児における染色体についての決定された倍数性の状態が開示されている報告を作製するための方法が本明細書に開示されており、前記方法は、胎児の母親由来のＤＮＡおよび胎児由来のＤＮＡを含有する第１の試料を得るステップと、胎児の一方の親または両親から遺伝子型データを得るステップと、調製された試料が得られるようにＤＮＡを単離することによって第１の試料を調製するステップと、複数の多型遺伝子座において調製された試料中のＤＮＡを測定するステップと、調製された試料に対して得たＤＮＡ測定値から、対立遺伝子数または複数の多型遺伝子座における対立遺伝子数の確率をコンピュータで算出するステップと、染色体における可能性のある異なる倍数性の状態について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数の確率に関する、倍数性についての複数の仮説をコンピュータで作製するステップと、倍数性についての仮説のそれぞれについて、胎児の一方の親または両親からの遺伝子型データを使用して、染色体上の各多型遺伝子座の対立遺伝子数確率についての同時分布モデルをコンピュータで構築するステップと、調製された試料についての同時分布モデルおよび算出された対立遺伝子数の確率を用いて、倍数性についての仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性の状態を選択することによって胎児の倍数性の状態をコールするステップと、決定された倍数性の状態が開示されている報告を作製するステップとを含む。

いくつかの実施形態では、前記方法を用いて、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性の状態を決定し、前記方法は、調製された試料のそれぞれにおける胎児起源のＤＮＡのパーセントを決定するステップをさらに含み、ここで、調製された試料中のＤＮＡを測定するステップは、各調製された試料中のいくつものＤＮＡ分子についてシークエンシングによって行い、より大きな胎児ＤＮＡの画分を有する調製された試料よりも、より小さな胎児ＤＮＡの画分を有する調製された試料由来のＤＮＡ分子について多く配列決定する。

いくつかの実施形態では、前記方法を用いて、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性の状態を決定し、ここで、調製された試料中のＤＮＡを測定するステップは、各胎児に対して、ＤＮＡの調製された試料の第１の画分について配列決定して第１の測定値の集合を得ることによって行い、前記方法は、第１のＤＮＡ測定値の集合を考慮して、各胎児の倍数性についての仮説のそれぞれに対して第１の相対的確率の決定を行うステップと、倍数性についての仮説のそれぞれに対する第１の相対的確率の決定が、異数体の胎児に対応する倍数性についての仮説が有意であるが決定的ではない確率を有することを示す、その胎児からの調製された試料の第２の画分について再び配列決定して、第２の測定値の集合を得るステップと、第２の測定値の集合および必要に応じて、第１の測定値の集合も使用して、胎児の倍数性についての仮説に対して第２の相対的確率の決定を行うステップと、第２の相対的確率の決定によって決定された通り最大の確率を有する仮説に対応する倍数性の状態を選択することによって第２の試料を再び配列決定した、その胎児の倍数性の状態をコールするステップとをさらに含む。

いくつかの実施形態では、優先的に富化されたＤＮＡの試料を含む組成物であって、優先的に富化されたＤＮＡの試料が、第１のＤＮＡの試料からの複数の多型遺伝子座において優先的に富化されており、第１のＤＮＡの試料が母系の血漿に由来する母系ＤＮＡと胎児ＤＮＡの混合物からなり、富化の程度が少なくとも２倍であり、第１の試料と優先的に富化された試料の間の対立遺伝子の偏りが、平均で、２％未満、１％未満、０．５％未満、０．２％未満、０．１％未満、０．０５％未満、０．０２％未満、および０．０１％未満からなる群から選択される組成物が開示されている。いくつかの実施形態では、そのような優先的に富化されたＤＮＡの試料を作製するための方法が開示されている。

いくつかの実施形態では、胎児のゲノムＤＮＡおよび母系のゲノムＤＮＡを含む母系の組織試料において胎児の異数性の存在または不在を決定するための方法であって、（ａ）前記母系の組織試料から、胎児のゲノムＤＮＡと母系のゲノムＤＮＡの混合物を得るステップと、（ｂ）胎児ＤＮＡと母系ＤＮＡの混合物を複数の多型対立遺伝子において選択的に富化するステップと、（ｃ）ステップａにおける胎児のゲノムＤＮＡと母系のゲノムＤＮＡの混合物から選択的に富化された断片を分布させて、単一のゲノムＤＮＡ分子または単一のゲノムＤＮＡ分子の増幅産物を含む反応試料をもたらすステップと、（ｄ）ステップｃ）における反応試料中の選択的に富化されたゲノムＤＮＡの断片についての大規模並行ＤＮＡ配列決定を行って、前記選択的に富化された断片の配列を決定するステップと、（ｅ）ステップｄ）において得られた配列が属する染色体を同定するステップと、（ｆ）ステップｄ）からのデータを分析して、ｉ）母親および胎児の両方において二倍体であると推測される、少なくとも１つの最初の標的の染色体に属する、ステップｄ）からのゲノムＤＮＡの断片の数、およびｉｉ）胎児において異数体であることが疑われる第２の標的染色体に属する、ステップｄ）からのゲノムＤＮＡの断片の数を決定するステップと、（ｇ）第２の標的染色体が正倍数性である場合、第２の標的染色体について、ステップｆ）パートｉ）において決定された数を使用してステップｄ）からのゲノムＤＮＡの断片の数の予測される分布を算出するステップと、（ｈ）第２の標的染色体が異数体である場合、第２の標的染色体について、ステップｆ）パートｉ）である第１の数およびステップｂ）の混合物において見いだされる胎児ＤＮＡの推定される割合を用いてステップｄ）からのゲノムＤＮＡの断片の数の予測される分布を算出するステップと、（ｉ）最尤法または最大事後法を用いて、ステップｆ）パートｉｉ）において決定されたゲノムＤＮＡの断片の数が、ステップｇ）で算出された分布またはステップｈ）で算出された分布のどちらの一部である可能性がより高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が開示されている。

代表的癌診断法
宿主において生存しているがんを起源とするＤＮＡを、宿主の血液中に見いだすことができることが実証されていることに留意されたい。母系の血液中に見いだされる混合ＤＮＡを測定することによって遺伝子診断を行うことができるのと同様に、宿主血液中に見いだされる混合ＤＮＡを測定することによって同等に良好に遺伝子診断を行うことができる。遺伝子診断は、異数性状態または遺伝子変異を含み得る。母系の血液に対して行った測定からの胎児の倍数性状態または遺伝子の状態を決定することにおいて読み取る当該開示における任意の主張は、宿主血液に対する測定からがんの倍数性状態または遺伝子の状態を決定することにおいて、同等に良好に読み取ることができる。

いくつかの実施形態では、本開示の方法により、がんの倍数性状態を決定することが可能になり、前記方法は、宿主由来の遺伝物質を含有する混合試料、およびがん由来の遺伝物質を得るステップと、混合試料中のＤＮＡを測定するステップと、混合試料中のがん起源のＤＮＡの割合を算出するステップと、混合試料に対して得た測定値および算出された割合を用いてがんの倍数性状態を決定するステップとを含む。いくつかの実施形態では、前記方法は、がんの倍数性状態の決定に基づいてがん治療を施すステップをさらに含んでよい。いくつかの実施形態では、前記方法は、がんの倍数性状態の決定に基づいてがん治療を施すステップをさらに含んでよく、がん治療は、医薬品、生物学的治療薬、および抗体に基づく治療およびそれらの組み合わせを含む群から選択される。

代表的実装方法
本明細書に開示されている実施形態はいずれも、デジタル電子回路、集積回路、特別に設計されたＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェアにおいて、またはそれらの組み合わせにおいて実行することができる。ここで開示されている実施形態の装置は、プログラム可能なプロセッサによって実行するための機械可読記憶デバイスに実体的に具体化されたコンピュータプログラム産物において実行することができ、ここで開示されている実施形態の方法のステップは、入力データを操作し、出力を生成することによってここで開示されている実施形態の機能を実施するための命令のプログラムを実行するプログラム可能なプロセッサによって実施することができる。ここで開示されている実施形態は、少なくとも１つのプログラム可能なプロセッサを含むプログラム可能なシステムにおいて実行可能かつ／または解釈可能な１つまたは複数のコンピュータプログラムで有利に実行することができ、該少なくとも１つのプログラム可能なプロセッサは、特別または汎用であり得る、データおよび命令を受け、データおよび命令を伝達するための記憶システム、少なくとも１つの入力デバイス、および少なくとも１つの出力デバイスと連結している。各コンピュータプログラムは、所望であれば、高レベルの手続き型のまたはオブジェクト指向のプログラミング言語で、またはアセンブリ言語または機械語で実装することができ、どんな場合でも、言語はコンパイラ型言語またはインタープリタ型言語であってよい。コンピュータプログラムは、独立型プログラムとして、またはモジュール、コンポーネント、サブルーチンまたはコンピュータ環境において使用するために適した他のユニットとしてのものを含めた、任意の形態で展開することができる。コンピュータプログラムは、１か所の、または複数か所にわたって分布した、および通信網により相互接続された１台のコンピュータまたは複数のコンピュータで実行または解釈されるように展開することができる。

コンピュータ可読の記憶媒体とは、本明細書で使用される場合、物理的なまたは有形の記憶装置（シグナルとは対照的に）を指し、これらに限定することなく、情報の有形の記憶装置、例えば、コンピュータ可読の命令、データ構造、プログラムモジュールまたは他のデータの任意の方法または技術において実装される揮発性のおよび不揮発性の、取り外し可能なおよび取り外し不可能な媒体を指す。コンピュータ可読の記憶媒体としては、これらに限定されないが、所望の情報またはデータまたは命令を実体的に保存するために使用することができ、コンピュータまたはプロセッサがアクセスすることができるＲＡＭ、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリまたは他のソリッドステート記憶技術、ＣＤ−ＲＯＭ、ＤＶＤまたは他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶デバイスまたは任意の他の物理的なまたは有形の媒体が挙げられる。

本明細書に記載の方法のいずれかは、コンピュータスクリーンまたは紙への印刷などの物理的形式でデータを出力するステップを含んでよい。本文書の他の箇所の任意の実施形態の記載では、記載されている方法を、医師がそれに基づいて行動することができる形式のすぐに使用可能なデータを出力するステップと組み合わせることができることが理解されるべきである。さらに、記載されている方法を、臨床処置、または措置を行わないという臨床的決定の実行をもたらす臨床的決定の実際の実行と組み合わせることができる。標的個体に関係する遺伝子データを決定するための本文書に記載の実施形態のいくつかを、ＩＶＦとの関連において、１個または複数個の胚を移入するために選択する決定と組み合わせ、必要に応じて、胚を将来の母親の子宮に移入するプロセスと組み合わせることができる。標的個体に関係する遺伝子データを決定するための本文書に記載の実施形態のいくつかを、潜在的な染色体異常またはそれがないことの医療専門家による通知と組み合わせ、必要に応じて、出生前診断との関連において、胎児を流産するか流産しないかの決定と組み合わせることができる。本明細書に記載の実施形態のいくつかを、すぐに使用可能なデータを出力すること、および臨床処置、または措置を行わないという臨床的決定の実行をもたらす臨床的決定を実行することと組み合わせることができる。

代表的診断ボックス
ある実施形態では、本開示は、本開示に記載の方法のいずれかを部分的にまたは完全に実行することができる診断ボックスを含む。ある実施形態では、診断ボックスは、診察室、病院の検査室または患者をケアする場所に合理的に近い任意の適切な場所に置かれてよい。ボックスは、方法全体を完全に自動化された様式で実行することを可能にし得る、またはボックスは、技師が手動で完了するための、１つまたはいくつものステップを必要とする場合がある。ある実施形態では、ボックスは、少なくとも母系の血漿について測定された遺伝子型データを解析することを可能にし得る。ある実施形態では、ボックスは、診断ボックスで測定された遺伝子型データを、次いで遺伝子型データを解析し、場合によっては報告の作製も行う外部の計算設備に伝達する手段と連結することができる。診断ボックスは、水性試料または液体試料を１つの容器から別の容器に移すことができるロボットユニットを含んでよい。診断ボックスは、固体と液体の両方のいくつもの試薬を含んでよい。診断ボックスは、ハイスループットシーケンサーを含んでよい。診断ボックスは、コンピュータを含んでよい。

実験セクション
ここで開示されている実施形態は、以下の実施例に記載されており、これらは本開示の理解を補助するために記載され、その後に続く特許請求の範囲において定義されている本開示の範囲をいかなる形でも限定するものと解釈されるべきではない。以下の実施例は、当業者に、本記載した実施形態をどのように用いるかについての完全な開示および記載を提供するために提示されており、本開示の範囲を限定するものではなく、以下の実験が、実施した全ての実験または唯一の実験であることを示すものでもない。使用される数字（例えば、量、温度など）に関して正確さを確実にするための試みが行われているが、いくらかの実験的な誤差および偏差が考慮されるべきである。別段の指定のない限り、部分は体積による部分であり、温度は摂氏度である。記載されている方法の変形は、実験が例示することを意味する基本的な態様を変化させることなく行うことができることが理解されるべきである。

実験１
目的は、親の遺伝子型を使用して胎児画分を算出するベイズ最尤推定（ＭＬＥ）アルゴリズムにより、公開された方法と比較して非侵襲的な出生前トリソミー診断の正確度が改善されることを示すことであった。
母系のｃｆＤＮＡについてシミュレートされた配列決定データを、２１トリソミーおよびそれぞれの母親の細胞系において得られたリードをサンプリングすることによって作製した。正確なダイソミーおよびトリソミーのコールの率を、公開された方法（ＣｈｉｕらＢＭＪ２０１１年：３４２巻：ｃ７４０１頁）および本発明者らのＭＬＥに基づくアルゴリズムについての種々の胎児画分における５００のシミュレーションから決定した。ＩＲＢに承認されたプロトコールの下で収集した、４人の妊娠中の母親およびそれぞれの父親由来の５００万のショットガンリードを得ることによってシミュレーションを検証した。親の遺伝子型を２９０ＫＳＮＰアレイで得た（図１４参照）。

シミュレーションでは、ＭＬＥに基づく手法により、９％の低さの胎児画分に対して９９．０％の正確度が実現され、全体的な正確度によく対応した信頼度が報告された。本発明者らは、これらの結果を、４つの実際の試料を用いて検証し、全て正確なコールが得られ、計算された信頼度は９９％を超えた。対照的に、Ｃｈｉｕらの公開されたアルゴリズムを実行したところ、９９．０％の正確度を実現するためには１８％の胎児画分が必要であり、９％の胎児ＤＮＡでは８７．８％の正確度しか実現されなかった。

ＭＬＥに基づく手法と併せて、親の遺伝子型から胎児画分を決定することにより、妊娠初期および妊娠中期の早期に予測される胎児画分において、公開されているアルゴリズムよりも高い正確度が実現される。さらに、本明細書に開示されている方法は、結果の信頼性の決定において、特に倍数性の検出がより難しい低胎児画分において、極めて重要な信頼度メトリックを生じる。公開された方法では、偽陽性率を予め定義する手法である、ダイソミートレーニングデータの大きな集合に基づく、倍数性をコールするための正確度が低い閾値方法を用いる。さらに、信頼度メトリックなしでは、公開された方法でコールを行うには胎児のｃｆＤＮＡが不十分である場合に、偽陰性の結果を報告する危険性がある。いくつかの実施形態では、コールされた倍数性状態について信頼度推定値を算出する。

実験２
目的は、ベイズ最尤推定（ＭＬＥ）アルゴリズムにおいて、標的化配列決定手法を親の遺伝子型およびＨａｐｍａｐデータと組み合わせて用いることによって、特に低胎児画分からなる試料における、胎児の１８トリソミー、２１トリソミー、およびＸトリソミーの非侵襲的な検出を改善することであった。

４つの正倍数性妊娠および２つのトリソミー陽性妊娠由来の母体試料およびそれぞれの父系の試料を、ＩＲＢに承認されたプロトコールの下で、胎児の核型が既知である患者から得た。母系のｃｆＤＮＡを血漿から抽出し、標的の特定のＳＮＰを優先的に富化した後、およそ１，０００万のシーケンスリードを得た。親試料について同様に配列決定して、遺伝子型を得た。

記載されているアルゴリズムにより、正倍数性の試料および異数性の試料の正常な染色体の全てについて第１８染色体ダイソミーおよび第２１染色体ダイソミーが正確にコールされた。１８トリソミーおよび２１トリソミーのコールは正確であり、男の胎児および女の胎児におけるＸ染色体コピー数も正確であった。アルゴリズムによって生じる信頼度は、全ての場合において９８％を超えた。

記載されている方法により、妊娠初期の試料および妊娠中期の早期の試料のおよそ３０％を占める、１２％未満の胎児ＤＮＡで構成される試料を含めた、６つの試料由来の試験した染色体の全てについて倍数性が正確に報告された。当該ＭＬＥアルゴリズムと公開された方法の間の極めて重要な差異は、ＭＬＥアルゴリズムでは親の遺伝子型およびＨａｐｍａｐデータを活用して、正確度を改善し、信頼度メトリックを生成することである。低胎児画分では、全ての方法の正確度が低くなる；十分な胎児のｃｆＤＮＡがない試料を正確に同定して、信頼できるコールを行うことが重要である。他のものは男の胎児の胎児画分を推定するためにＹ染色体特異的プローブを使用したが、同時に親の遺伝子型決定を行うことにより、両方の性について胎児画分を推定することができる。非標的化ショットガン配列決定を用いた公開された方法の別の固有の限界は、ＧＣリッチなどの因子が異なることにより、倍数性コールの正確度が染色体間で変動することである。当該標的化配列決定手法は、そのような染色体規模の変動とはほとんど無関係であり、染色体間でより一貫した性能をもたらす。

実験３
目的は、母系の血漿中の浮動性胎児ＤＮＡのＳＮＰ遺伝子座を解析するための新規のインフォマティクスを用いて、三倍体の胎児においてトリソミーが高い信頼度で検出可能であるかどうかを決定することであった。

超音波異常の後に、血液２０ｍＬを妊娠中の患者から抜き取った。遠心分離した後、母系ＤＮＡをバフィーコートから抽出し（ＤＮＥＡＳＹ、ＱＩＡＧＥＮ）、無細胞ＤＮＡを血漿から抽出した（ＱＩＡＡＭＰＱＩＡＧＥＮ）。両方のＤＮＡ試料において、第２染色体、第２１染色体、およびＸ染色体上のＳＮＰ遺伝子座に標的化配列決定を適用した。最尤ベイズ推定により、全ての可能性のある倍数性の状態の集合から、最も可能性が高い仮説を選択した。前記方法により、胎児ＤＮＡ割合、倍数性の状態および倍数性の決定における明確な信頼度を決定する。参照染色体の倍数性に関する仮定は行わない。診断では、現在の技術水準である、シーケンスリード数と無関係の検定統計量を使用する。

当前記方法により、第２染色体および第２１染色体のトリソミーが正確に診断された。子の割合は１１．９％［ＣＩ１１．７〜１２．１］と推定された。胎児は、第２染色体および第２１染色体の１つの母系のコピーおよび２つの父系のコピーを有することが見いだされ、信頼度は有効に１（エラー確率＜１０^−３０）であった。これは、第２染色体および第２１染色体のそれぞれ９２，６００リードおよび２５８，１００リードを用いて実現された。

これは、中期の核型によって確認されるように、母系の血液に由来するトリソミー染色体であって、その胎児が三倍体であるという非侵襲的な出生前診断の最初の実証である。非侵襲的な診断の現存の方法では、この試料において異数性は検出されない。現行の方法は、ダイソミー参照染色体と比較した、トリソミー染色体における余剰なシーケンスリードに依拠するが、三倍体の胎児はダイソミー参照を有さない。さらに、現存の方法では、この胎児ＤＮＡの割合およびシーケンスリード数を用いては同様に信頼度が高い倍数性の決定は実現されない。該手法を２４の染色体全てに拡張することは簡単である。

実験４
正倍数性の妊娠由来の母系の血漿から単離されたＤＮＡ、および同様に２１三倍体性細胞系由来のゲノムＤＮＡの、標準のＰＣＲ（ネスティングを使用しなかったことを意味する）を使用した８００プレックス増幅のために以下のプロトコールを使用した。ライブラリーの調製および増幅は、単一チューブ平滑末端化、その後のＡ−テーリングを伴った。ＡＧＩＬＥＮＴＳＵＲＥＳＥＬＥＣＴキットに見いだされるライゲーションキットを使用してアダプタライゲーションを実行し、ＰＣＲを７サイクル実行した。次いで、第２染色体、第２１染色体およびＸ染色体上のＳＮＰを標的とする８００の異なるプライマー対を使用して、ＳＴＡを１５サイクル行った（９５℃で３０秒間；７２℃で１分間；６０℃で４分間；６５℃で１分間；７２℃で３０秒間）。１２．５ｎＭのプライマー濃度で反応を実行した。次いで、ＩＬＬＵＭＩＮＡＩＩＧＡＸシーケンサーを用いてＤＮＡについて配列決定した。シーケンサーにより１９０万のリードが出力され、その９２％がゲノムにマッピングされ、ゲノムにマッピングされたリードのうち９９％超が、標的のプライマーにより標的とされた領域のうちの１つにマッピングされた。数は血漿ＤＮＡとゲノムＤＮＡの両方で基本的に同じであった。図１５は、第２１染色体において既知のトリソミーを有する細胞系から取得したゲノムＤＮＡにおける、シーケンサーによって検出された約７８０ＳＮＰについての２つの対立遺伝子の比を示す。対立遺伝子分布は視覚的に読み取ることが簡単ではないので、ここでは可視化を容易にするために対立遺伝子の比がプロットされていることに留意されたい。丸印はダイソミー染色体上のＳＮＰを示し、星印はトリソミー染色体上のＳＮＰを示す。図１６は、図Ｘの場合と同様に、同じデータの別の表示であり、Ｙ軸は各ＳＮＰについて測定されたＡとＢの相対的な数であり、Ｘ軸は染色体によってＳＮＰを分けたＳＮＰ数である。図１６では、ＳＮＰ１〜３１２は、第２染色体上に見いだされ、ＳＮＰ３１３〜６０５は、トリソミーである第２１染色体上に見いだされ、ＳＮＰ６０６〜８００はＸ染色体上に見出される。第２染色体およびＸ染色体からのデータは、相対的な配列計数値が３つのクラスター内にあるとおり、ダイソミー染色体を示す：グラフの一番上がＡＡであり、グラフの一番下がＢＢであり、グラフの中央がＡＢである。トリソミーである第２１染色体からのデータは４つのクラスターを示す：グラフの一番上がＡＡＡであり、０．６５の線（２／３）の周辺がＡＡＢであり、．３５の線（１／３）の周囲がＡＢＢであり、グラフの一番下がＢＢＢである。

図１７Ａ〜Ｄは、同じ８００プレックスプロトコールについてのデータであって、妊娠中の女性由来の４つの血漿試料から増幅したＤＮＡに対して測定されたデータを示す。これらの４つの試料について、点について７つのクラスターが認められることが予想される：（１）グラフの一番上に沿っているのは、母親および胎児がどちらもＡＡである遺伝子座であり、（２）グラフの一番上のわずかに下は、母親がＡＡであり、胎児がＡＢである遺伝子座であり、（３）０．５の線のわずかに上は、母親がＡＢであり、胎児がＡＡである遺伝子座であり、（４）０．５の線に沿っているのは、母親および胎児がどちらもＡＢである遺伝子座であり、（５）０．５の線のわずかに下は、母親がＡＢであり、胎児がＢＢである遺伝子座であり、（６）グラフの一番下のわずかに上は、母親がＢＢであり、胎児がＡＢである遺伝子座であり、（１）グラフの一番下に沿っているのは、母親および胎児がどちらもＢＢである遺伝子座である。胎児画分が小さいほど、クラスター（１）と（２）の間、クラスター（３）、（４）および（５）の間、ならびにクラスター（６）と（７）の間の分離が小さくなる。分離は、胎児起源のＤＮＡの画分の半分であることが予想される。例えば、ＤＮＡの２０％が胎児性であり、８０％が母系である場合、（１）〜（７）は、それぞれ１．０、０．９、０．６、０．５、０．４、０．１および０．０に集中することが予想される；例えば、図１７Ｄ、ＰＯＯＬ１＿ＢＣ５＿ｒｅｆ＿ｒａｔｅを参照されたい。その代わりに、ＤＮＡの８％が胎児性であり、９２％が母系である場合、（１）〜（７）は、それぞれ１．００、０．９６、０．５４、０．５０、０．４６、０．０４および０．００に集中することが予想される；例えば、図１７Ｂ、ＰＯＯＬ１＿ＢＣ２＿ｒｅｆ＿ｒａｔｅを参照されたい。胎児ＤＮＡが検出されない場合は、（２）、（３）、（５）または（６）が認められることは予想されない；あるいは、分離は０であると言える、したがって（１）および（２）は互いに一番上にあり、（３）、（４）および（５）、ならびに、同様に（６）および（７）も同様である；例えば、図１７Ｃ、ＰＯＯＬ１＿ＢＣ７＿ｒｅｆ＿ｒａｔｅを参照されたい。図１７Ａ、ＰＯＯＬ１＿ＢＣ１＿ｒｅｆ＿ｒａｔｅについて胎児画分は約２５％であることに留意されたい。

実験５
ＤＮＡの増幅および測定の大多数の方法により、一般に遺伝子座において見いだされる２つの対立遺伝子が、ＤＮＡの試料中の対立遺伝子の実際の量を表さない強度または計数値で検出される、いくらかの対立遺伝子の偏りが生じる。例えば、単一の個体について、ヘテロ接合性遺伝子座において、ヘテロ接合性遺伝子座について予測される理論的な比である、２つの対立遺伝子の１：１の比が認められることが予想されるが、対立遺伝子の偏りに起因して、５５：４５または、さらには６０：４０が認められ得る。配列決定との関連において、リード深度が低い場合には、単純な確率論的ノイズにより、有意な対立遺伝子の偏りがもたらされる可能性があることにも留意されたい。ある実施形態では、各ＳＮＰの挙動をモデリングすることが可能であり、したがって、特定の対立遺伝子について一貫した偏りが観察される場合、この偏りを補正することができる。図１８は、偏り補正の前後の、二項分散によって説明することができるデータの割合を示す。図１８では、星印は、８００プレックス実験について、生の配列データにおいて観察された対立遺伝子の偏りを示し、丸印は、補正後の対立遺伝子の偏りを示す。対立遺伝子の偏りが全くない場合には、データがｘ＝ｙの線に沿うことが予想されることに留意されたい。１５０プレックス標的化増幅を用いてＤＮＡを増幅することによって生じる同様のデータの集合により、偏り補正後に１：１の線のごく近傍に包含されるデータが生じた。

実験６
プライマーのアニーリングおよび伸長の時間が数分に限られている、アダプタタグに特異的なプライマーとライゲーションしたアダプタを使用したＤＮＡのユニバーサル増幅は、より短いＤＮＡ鎖の割合を富化する効果を有する。配列決定に適したＤＮＡライブラリーを作製するために設計された大多数のライブラリープロトコールはそのようなステップを含み、プロトコールの例は公開されており、当業者に周知である。本発明のいくつかの実施形態では、ユニバーサルタグを有するアダプタを血漿ＤＮＡにライゲーションし、アダプタタグに特異的なプライマーを使用して増幅する。いくつかの実施形態では、ユニバーサルタグは、配列決定のために用いるものと同じタグであってよく、それはＰＣＲ増幅のためだけのユニバーサルタグであってよい、またはそれはタグの集合であってよい。胎児ＤＮＡは一般には、天然では短く、一方、母系ＤＮＡは天然では短いものと長いものの両方であり得るので、この方法は、混合物中の胎児ＤＮＡの割合を富化する効果を有する。アポトーシス性の細胞由来のＤＮＡであると考えられ、胎児ＤＮＡと母系ＤＮＡの両方を含有する浮動性ＤＮＡは短く、大部分は２００ｂｐ未満である。静脈切開後の一般的な現象である細胞溶解によって放出される細胞性ＤＮＡは、一般には、ほぼ排他的に母系であり、同様にかなり長く、大部分が５００ｂｐを超える。したがって、数分超放置した血液試料は、短い（胎児性＋母系）ＤＮＡおよびより長い（母系）ＤＮＡの混合物を含有する。母系の血漿に対してユニバーサル増幅を比較的短い伸長時間で実施し、その後、標的化増幅することにより、胎児ＤＮＡの相対的な割合が、標的化増幅を単独で用いて増幅した血漿と比較して増大する傾向がある。これは、入力が血漿ＤＮＡ（垂直方向の軸）である場合に測定された胎児のパーセント対入力ＤＮＡがＩＬＬＵＭＩＮＡＧＡＩＩｘライブラリー調製プロトコールを用いて調製したライブラリーを有する血漿ＤＮＡである場合に測定された胎児のパーセントを示す図１９において認めることができる。線の下に入る点は全て、ライブラリーの調製ステップにより胎児起源のＤＮＡの割合（ｆｒａｃｔｉｏｎ）が富化されることを示す。赤色であった２つの血漿の試料は溶血を示し、したがって、細胞溶解によって存在する長い母系ＤＮＡの量が増大したことを示し、これは、標的化増幅の前にライブラリーの調製を実施した場合に、胎児画分（ｆｅｔａｌｆｒａｃｔｉｏｎ）が特に有意に富化されることを示す。本明細書に開示されている方法は、溶血があるまたは比較的長い鎖の混入ＤＮＡを含む細胞が溶解し、短いＤＮＡと長いＤＮＡが混合した試料に混入するいくつかの他の状況が生じている場合に特に有用である。一般には、比較的短いアニーリング時間および伸長時間は３０秒間から２分間の間であるが、５秒または１０秒以下の短さであってよく、または５分間または１０分間の長さであってよい。

実験７
正倍数性の妊娠由来の母系の血漿から単離されたＤＮＡ、および同様に２１三倍体性細胞系由来のゲノムＤＮＡの、直接ＰＣＲプロトコール、および同様にセミネステッド手法を用いた１，２００プレックス増幅のために以下のプロトコールを使用した。ライブラリーの調製および増幅は、単一チューブ平滑末端化、その後のＡ−テーリングを伴った。ＡＧＩＬＥＮＴＳＵＲＥＳＥＬＥＣＴキットに見いだされるライゲーションキットの改変を用いてアダプタライゲーションを実行し、ＰＣＲを７サイクル実行した。標的のプライマープールでは、第２１染色体由来のＳＮＰについての５５０のアッセイ、ならびに第１染色体およびＸ染色体のそれぞれ由来のＳＮＰについての３２５のアッセイを行った。どちらのプロトコールも、１６ｎＭのプライマー濃度を用いてＳＴＡの１５サイクルを伴った（９５℃で３０秒間；７２℃で１分間；６０℃で４分間；６５℃で３０秒間；７２℃で３０秒間）。セミネステッドＰＣＲプロトコールは、２９ｎＭの内側のフォワードタグ濃度、および１μＭまたは０．１μＭのリバースタグ濃度を用いたＳＴＡ１５サイクルの第２の増幅を伴った（９５℃で３０秒間；７２℃で１分間；６０℃で４分間；６５℃で３０秒間；７２℃で３０秒間）。次いで、ＩＬＬＵＭＩＮＡＩＩＧＡＸシーケンサーを用いてＤＮＡについて配列決定した。直接ＰＣＲプロトコールについては、リードの７３％がゲノムにマッピングされ、セミネステッドプロトコールについては、シーケンスリードの９７．２％がゲノムにマッピングされる。したがって、セミネステッドプロトコールにより、およそ３０％多くの情報がもたらされ、これは、主に、プライマー二量体を引き起こす可能性が最も高いプライマーが排除されたことに起因すると推測される。

リード深度の変動性は、セミネステッドプロトコールを使用した場合、直接ＰＣＲプロトコールを使用した場合よりも高い傾向があり（図２０参照）、ひし形はセミネステッドプロトコールを用いて実行した遺伝子座についてのリード深度を指し、四角はネスティングなしで実行した遺伝子座についてのリード深度を指す。ＳＮＰは、ひし形についてリード深度によって配置されており、したがって、ひし形は全て曲線上に置かれ、一方四角は、ゆるく相関するようである；ＳＮＰの配置は任意であり、リード深度を指すのは、ドットの左から右への場所ではなく、ドットの高さである。

いくつかの実施形態では、本明細書に記載の方法により、優れたリード深度（ＤＯＲ）の分散を実現することができる。例えば、１，２００アッセイの、ゲノムＤＮＡの１，２００プレックス直接ＰＣＲ増幅を用いたこの実験の１つのバージョン（図２１）において、１１８６アッセイでは、ＤＯＲが１０超であり、平均のリード深度が４００であり、１０６３アッセイ（８８．６％）では、リード深度が２００から８００の間であり、各対立遺伝子についてのリード数は、意味のあるデータを得るために十分に高いが、各対立遺伝子についてのリード数は、これらのリードの限界使用が特に小さい場合、それほど高くない、理想的なウィンドウを有した。１２の対立遺伝子のみが、高いリード深度を有し、１０３５のリードが一番深かった。ＤＯＲの標準偏差は２９０であり、平均ＤＯＲは４５３であり、ＤＯＲの変動係数は６４％であり、９５０，０００の総リードが存在し、およびリードの６３．１％がゲノムにマッピングされた。１，２００プレックスセミネステッドプロトコールを使用した別の実験（図２２）では、ＤＯＲはより高かった。ＤＯＲの標準偏差は５８３であり、平均ＤＯＲは６３０であり、ＤＯＲの変動係数は９３％であり、８７０，０００の総リードが存在し、リードの９６．３％がゲノムにマッピングされた。これらの場合のどちらにおいても、ＳＮＰは母親についてのリード深度によって配置され、したがって、曲線は母系のリード深度を示すことに留意されたい。子と父親の間の鑑別は重要でなく、それは単にこの説明のために重要であるトレンドである。

実験８
実験において、セミネステッド１，２００プレックスＰＣＲプロトコールを用いて、１つの細胞由来のＤＮＡおよび３つの細胞由来のＤＮＡを増幅した。この実験は、母系の血液から単離された胎児の細胞を使用した出生前異数性試験と関連する、または生検割球または栄養外胚葉試料を使用した着床前遺伝子診断のためのものである。条件ごとに２個体（４６ＸＹおよび４７ＸＸ＋２１）由来の１つの細胞および３つの細胞の３つの複製物が存在した。アッセイは、第１染色体、第２１染色体およびＸ染色体を標的とした。３つの異なる溶解方法を使用した：ＡＲＣＴＵＲＵＳ、ＭＰＥＲｖ２およびアルカリ溶解。１つの配列決定レーンにおいて多重化４８試料に配列決定を実行した。アルゴリズムにより、３つの染色体のそれぞれについて、および複製物のそれぞれについての正確な倍数性コールが生じた。

実験９
１つの実験では、４つの母系の血漿試料を調製し、ヘミネステッド９，６００プレックスプロトコールを使用して増幅した。試料を以下のように調製した：母系の血液最大４０ｍＬを遠心分離して、バフィーコートおよび血漿を単離した。母系試料のゲノムＤＮＡをバフィーコートから調製し、父系のＤＮＡを血液試料または唾液試料から調製した。母系の血漿中の無細胞ＤＮＡを、ＱＩＡＧＥＮＣＩＲＣＵＬＡＴＩＮＧＮＵＣＬＥＩＣＡＣＩＤキットを使用して単離し、ＴＥ緩衝液４５μＬで製造者の指示に従って溶出した。ユニバーサルライゲーションアダプタを、精製された血漿ＤＮＡ３５μＬの各分子の末端に付加し、ライブラリーを、アダプタ特異的プライマーを使用して７サイクルにわたって増幅した。ライブラリーを、ＡＧＥＮＣＯＵＲＴＡＭＰＵＲＥビーズを使用して精製し、水５０μｌで溶出した。

９，６００個の標的特異的タグを付けたリバースプライマーのプライマー濃度１４．５ｎＭおよび１つのライブラリーアダプタ特異的フォワードプライマーの５００ｎＭを使用し、１５サイクルのＳＴＡを用いて、３μｌのＤＮＡを増幅した（最初のポリメラーゼ活性化のために９５℃で１０分間、次いで、９５℃で３０秒間；７２℃で１０秒間；６５℃で１分間；６０℃で８分間；６５℃で３分間および７２℃で３０秒間；を１５サイクル、および７２℃で２分間の最終の伸長）。

ヘミネステッドＰＣＲプロトコールは、第１のＳＴＡ産物の希釈物の、１０００ｎＭのリバースタグ濃度、および９，６００個の標的特異的フォワードプライマーのそれぞれについて１６．６ｕｎＭの濃度を用いたＳＴＡを１５サイクルにわたる第２の増幅を伴った（最初のポリメラーゼ活性化のために９５℃で１０分間、次いで９５℃で３０秒間；６５℃で１分間；６０℃で５分間；６５℃で５分間および７２℃で３０秒間；の１５サイクル、および７２℃で２分間の最終の伸長）。

次いで、ＳＴＡ産物の一定分量を、標準のＰＣＲによって、１μＭのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて１０サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。

このように、単一ウェル反応において９，６００個のプライマーを使用した；プライマーは、第１染色体、第２染色体、第１３染色体、第１８染色体、第２１染色体、Ｘ染色体およびＹ染色体上に見いだされるＳＮＰを標的とするように設計した。次いで、増幅産物について、ＩＬＬＵＭＩＮＡＧＡＩＩＸシーケンサーを用いて配列決定した。試料当たり、およそ３９０万のリードがシーケンサーによって生成され、３７０万のリードがゲノムにマッピングされ（９４％）、それらのうち、２９０万のリード（７４％）が標的のＳＮＰにマッピングされ、平均のリード深度は３４４であり、リード深度の中央値は２５５であった。４つの試料についての胎児画分は、９．９％、１８．９％、１６．３％、および２１．２％であることが見いだされた。

関連性のある母系のゲノムＤＮＡ試料および父系のゲノムＤＮＡ試料を、セミネステッド９６００プレックスプロトコールを使用して増幅し、配列決定した。セミネステッドプロトコールは、第１のＳＴＡにおいて９，６００個の外側のフォワードプライマーおよびタグを付けたリバースプライマーを７．３ｎＭで適用するという点で異なる。サーモサイクリング条件および第２のＳＴＡの組成、およびバーコーディングＰＣＲはヘミネステッドプロトコールについてのものと同じであった。

配列決定データを、本明細書に開示されているインフォマティクス方法を用いて解析し、ＤＮＡが４つの母系の血漿試料中に存在した胎児について、６つの染色体において倍数性の状態をコールした。集団内の２８個の染色体全てについての倍数性コールは正確にコールされ、信頼度は、正確にコールされたが、信頼度が８３％であった１つの染色体以外は９９．２％を超えた。

図２３は、９，６００プレックスヘミネスティング手法のリード深度を、実験７に記載の１，２００プレックスセミネステッド手法のリード深度と一緒に示すが、リード深度が１００超、２００超および４００超であるＳＮＰの数は１，２００プレックスプロトコールにおけるそれよりも有意に多かった。第９０パーセンタイルにおけるリード数を第１０パーセンタイルにおけるリード数で割って、無次元のメトリックを得ることができ、それにより、リード深度の均一性が示され；その数が小さいほど、リード深度がより均一である（狭い）。平均の第９０パーセンタイル／第１０パーセンタイル比は、実験９において行った方法では１１．５であるが、実験７において行った方法では５．６である。特定のリードの百分率がリード数の閾値を超えることを確実にするために、より少ないシーケンスリードが必要であるので、配列決定効率のためには、所与のプロトコールプレキシティ（ｐｌｅｘｉｔｙ）に対してより狭いリード深度がより良い。

実験１０
１つの実験では、４つの母系の血漿試料を調製し、セミネステッド９，６００プレックスプロトコールを使用して増幅した。実験１０の詳細は実験９と非常に類似しており、例外はネスティングプロトコールであること、および４つの試料の同一性を含めたことであった。集団内の２８個の染色体全てについての倍数性コールは正確にコールされ、信頼度は９９．７％を超えた。７６０万（９７％）のリードがゲノムにマッピングされ、リードの６３０万（８０％）が標的のＳＮＰにマッピングされた。平均のリード深度は７５１であり、リード深度の中央値は３９６であった。

実験１１
１つの実験では、３つの母系の血漿試料を５つの均等な部分に分割し、各部分を、２，４００個の多重化プライマー（４つの部分）または１，２００個の多重化プライマー（１つの部分）のいずれかを使用して増幅し、合計１０，８００個のプライマーについて、セミネステッドプロトコールを使用して増幅した。増幅した後、配列決定するために該部分を一緒にプールした。実験１１の詳細は実験９と非常に類似しており、例外は、ネスティングプロトコール、およびスプリットアンドプール手法であった。集団内の２１個の染色体の全てについて、倍数性コールは正確にコールされ、信頼度は、信頼度８３％でコールが上手く行かなかった１つ以外は９９．７％を超えた。３４０万のリードが標的のＳＮＰにマッピングされ、平均のリード深度は４０４であり、リード深度の中央値は２５８であった。

実験１２
１つの実験では、４つの母系の血漿試料を、４つの均等な部分に分割し、各部分を、２，４００個の多重化プライマーを使用して増幅し、合計９，６００個のプライマーについて、セミネステッドプロトコールを使用して増幅した。増幅した後、配列決定するために該部分を一緒にプールした。実験１２の詳細は実験９と非常に類似しており、例外は、ネスティングプロトコール、およびスプリットアンドプール手法であった。集団内の２８個の染色体全てについての倍数性コールは正確にコールされ、信頼度は、信頼度７８％でコールが上手く行かなかった１つ以外は９７％を超えた。４５０万のリードが標的のＳＮＰにマッピングされ、平均のリード深度は５３５であり、リード深度の中央値は４１２であった。

実験１３
１つの実験では、４つの母系の血漿試料を調製し、合計９，６００個のプライマーについて、９，６００プレックス３重ヘミネステッドプロトコールを使用して増幅した。実験１２の詳細は実験９と非常に類似しており、例外は、増幅の３つのラウンドを伴うネスティングプロトコールであり；該３つのラウンドは、それぞれ１５サイクルのＳＴＡ、１０サイクルのＳＴＡおよび１５サイクルのＳＴＡを伴った。集団内の２８個の染色体のうち２７個についての倍数性コールは正確にコールされ、信頼度は、９４．６％で正確にコールされた１つ、および信頼度８０．８％でコールが上手く行かなかった１つ以外は９９．９％を超えた。３５０万のリードが標的のＳＮＰにマッピングされ、平均のリード深度は４１４であり、リード深度の中央値は２４９であった。

実験１４１つの実験では、細胞の集合４５個を、１，２００プレックスセミネステッドプロトコールを使用して増幅し、配列決定し、倍数性の決定を３つの染色体において行った。この実験は、３日目の胚由来の単一細胞生検材料または５日目の胚由来の栄養外胚葉生検材料において着床前遺伝子診断を実施する条件をシミュレートすることを意図していることに留意されたい。個々の単一細胞１５個および３つの細胞の集合３０個を、合計４５の反応のために、４５個の個々の反応チューブに入れ、各反応は、ただ１つの細胞系由来の細胞を含有したが、異なる反応は異なる細胞系由来の細胞を含有した。細胞を洗浄バッファー５μｌ中に調製し、ＡＲＣＴＵＲＵＳＰＩＣＯＰＵＲＥ溶解緩衝液（ＡＰＰＬＩＥＤＢＩＯＳＹＳＴＥＭＳ）５μｌを加えることによって溶解させ、５６℃で２０分間、９５℃で１０分間インキュベートした。

単一の細胞／３つの細胞のＤＮＡを、１２００個の標的特異的フォワードプライマーおよびタグを付けたリバースプライマーを５０ｎＭのプライマー濃度を使用して、２５サイクルのＳＴＡを用いて増幅した（最初のポリメラーゼ活性化のために９５℃で１０分間、次いで９５℃で３０秒間；７２℃で１０秒間；６５℃で１分間；６０℃で８分間；６５℃で３分間および７２℃で３０秒間；を２５サイクル、および７２℃で２分間の最終の伸長）。

セミネステッドＰＣＲプロトコールは、１０００ｎＭの濃度のリバースタグ特異的プライマー、および、それぞれ６０ｎＭの濃度の４００個の標的特異的ネステッドフォワードプライマーを使用したＳＴＡの２０サイクル（最初のポリメラーゼ活性化のために９５℃で１０分間、次いで９５℃で３０秒間；６５℃で１分間；６０℃で５分間；６５℃で５分間および７２℃で３０秒間；を１５サイクル、および７２℃で２分間の最終の伸長）にわたる、第１のＳＴＡ産物の希釈物の３つの並行した第２の増幅を伴った。したがって、３つの並行４００プレックス反応では、第１のＳＴＡにおいて増幅された合計１２００個の標的が増幅された。

次いで、ＳＴＡ産物の一定分量を、標準のＰＣＲによって、１μＭのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて１５サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。

このように、単一細胞反応において１，２００個のプライマーを使用した；プライマーは、第１染色体、第２１染色体およびＸ染色体上に見いだされるＳＮＰを標的とするように設計した。次いで、増幅産物について、ＩＬＬＵＭＩＮＡＧＡＩＩＸシーケンサーを用いて配列決定した。試料当たりおよそ３９０万のリードがシーケンサーによって生成され、５０００億〜８０００億のリードがゲノムにマッピングされた（試料当たりの全てのリードの７４％〜９４％）。

細胞系由来の関連性のある母系のゲノムＤＮＡ試料および父系のゲノムＤＮＡ試料を、同じセミネステッド１２００プレックスアッセイプールを使用して、同様のプロトコールを用い、より少ないサイクルおよび１２００プレックスの第２のＳＴＡを用いて解析し、配列決定した。

配列決定データを、本明細書に開示されているインフォマティクス方法を用いて解析し、試料について３つの染色体において倍数性の状態をコールした。

図２４は、６つの試料について、３つの染色体（１＝第１染色体；２＝第２１染色体；３＝Ｘ染色体）における正規化されたリード深度の比（垂直方向の軸）を示す。比は、その染色体にマッピングされるリード数と等しくなるように設定し、正規化し、それぞれが３つの４６ＸＹ細胞を含む３つのウェルにわたって平均した、その染色体にマッピングされるリード数で割った。４６ＸＹ反応に対応する３つのデータ点の集合は、１：１の比を有することが予測される。４７ＸＸ＋２１細胞に対応する３つのデータ点の集合は、第１染色体については１：１、第２１染色体については１．５：１、およびＸ染色体については２：１の比を有することが予測される。

図２５は、３つの反応に関して３つの染色体（１、２１、Ｘ）についてプロットした対立遺伝子の比を示す。左下の反応は、３つの４６ＸＹ細胞における反応を示す。左側の領域は第１染色体についての対立遺伝子の比であり、中央の領域は第２１染色体についての対立遺伝子の比であり、右側の領域はＸ染色体についての対立遺伝子の比である。４６ＸＹ細胞に関して、第１染色体については、ＳＮＰ遺伝子型ＡＡ、ＡＢおよびＢＢに対応する１、０．５および０の比が認められることが予想される。４６ＸＹ細胞に関して、第２１染色体については、ＳＮＰ遺伝子型ＡＡ、ＡＢおよびＢＢに対応する１、０．５および０の比が認められることが予想される。４６ＸＹ細胞に関して、Ｘ染色体については、ＳＮＰ遺伝子型Ａ、およびＢに対応する１および０の比が認められることが予想される。右下の反応は、３つの４７ＸＸ＋２１細胞における反応を示す。対立遺伝子の比は、左下のグラフの場合と同様に染色体によって分離される。４７ＸＸ＋２１細胞に関して、第１染色体については、ＳＮＰ遺伝子型ＡＡ、ＡＢおよびＢＢに対応する１、０．５および０の比が認められることが予想される。４７ＸＸ＋２１細胞に関して、第２１染色体については、ＳＮＰ遺伝子型ＡＡＡ、ＡＡＢ、ＡＢＢおよびＢＢＢに対応する１、０．６７、０．３３および０の比が認められることが予想される。４７ＸＸ＋２１細胞に関して、Ｘ染色体については、ＳＮＰ遺伝子型ＡＡ、ＡＢ、およびＢＢに対応する１、０．５および０の比が認められることが予想される。右上のプロットは、４７ＸＸ＋２１細胞系由来のゲノムＤＮＡを１ｎｇ含む反応に対して行われた。図２６は、図２５と同じグラフを示すが、ただ１つの細胞に対して実施された反応についてのものである。左側のグラフは、４７ＸＸ＋２１細胞を含有する反応についてのグラフであり、右側のグラフは４６ＸＸ細胞を含有する反応についてのグラフであった。

図２５および図２６に示されているグラフから、１および０の比が認められることが予想される染色体については点のクラスターが２つあること、１、０．５、および０の比が認められることが予想される染色体については点のクラスターが３つあること、および１、０．６７、０．３３および０の比が認められることが予想される染色体については点のクラスターが４つあることが視覚的に明白である。ｐａｒｅｎｔａｌｓｕｐｐｏｒｔアルゴリズムにより、４５反応全ての３つの染色体の全てについて正確なコールを行うことができた。

実験１５
１つの実験では、母系の血漿試料を調製し、ヘミネステッド１９，４８８プレックスプロトコールを使用して増幅した。試料を以下のように調製した：母系の血液最大20ｍＬを遠心分離して、バフィーコートおよび血漿を単離した。母系試料のゲノムＤＮＡをバフィーコートから調製し、父系のＤＮＡを血液試料または唾液試料から調製した。母系の血漿中の無細胞ＤＮＡを、ＱＩＡＧＥＮＣＩＲＣＵＬＡＴＩＮＧＮＵＣＬＥＩＣＡＣＩＤキットを使用して単離し、ＴＥ緩衝液５０μＬで製造者の指示に従って溶出した。ユニバーサルライゲーションアダプタを、精製された血漿ＤＮＡ４０μＬの各分子の末端に付加し、ライブラリーを、アダプタ特異的プライマーを使用して９サイクルにわたって増幅した。ライブラリーを、ＡＧＥＮＣＯＵＲＴＡＭＰＵＲＥビーズを使用して精製し、５０μｌのでＤＮＡ懸濁緩衝液で溶出した。

１９，４８８個の標的特異的タグを付けたリバースプライマーのプライマー濃度７．５ｎＭおよび１つのライブラリーアダプタ特異的フォワードプライマーの５００ｎＭを使用し、１５サイクルのＳＴＡＲ１を用いて、６μｌのＤＮＡを増幅した（最初のポリメラーゼ活性化のために９５℃で１０分間、次いで、９６℃で３０秒間；６５℃で１分間；５８℃で６分間；６０℃で８分間；６５℃で４分間および７２℃で３０秒間；を１５サイクル、および７２℃で２分間の最終の伸長）。

ヘミネステッドＰＣＲプロトコールは、第１のＳＴＡＲ１産物の希釈物の、１０００ｎＭのリバースタグ濃度、および１９，４８８個の標的特異的フォワードプライマーのそれぞれについて２０ｎＭの濃度を用いた１５サイクル（ＳＴＡＲ２）の第２の増幅を伴った（最初のポリメラーゼ活性化のために９５℃で１０分間、次いで９５℃で３０秒間；６５℃で１分間；６０℃で５分間；６５℃で５分間および７２℃で３０秒間；の１５サイクル、および７２℃で２分間の最終の伸長）。

次いで、ＳＴＡＲ２産物の一定分量を、標準のＰＣＲによって、１μＭのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて１２サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。

このように、単一ウェル反応において１９，４８８個のプライマーを使用した。プライマーは、第１染色体、第２染色体、第１３染色体、第１８染色体、第２１染色体、Ｘ染色体およびＹ染色体上に認められるＳＮＰを標的とするように設計した。次いで、増幅産物について、ＩＬＬＵＭＩＮＡＧＡＩＩＸシーケンサーを用いて配列決定した。血漿試料に対し、およそ１０００万のリードがシーケンサーによって生成され、９４０〜９６０万のリードがゲノムにマッピングされ（９４〜９６％）、それらのうち、９９．９５％が標的のＳＮＰにマッピングされ、平均のリード深度は４６０であり、リード深度の中央値は３５０であった。比較のために計算してみると、完全に均等な分布は、１０００万リード／１９，４８８個の標的＝５１３リード／標的となる。プライマー二量体に対しては、３０，０００リード（シーケンサーにより生成されたリードの０．３％）が配列決定されたプライマー二量体由来であった。ゲノム試料に対しては、９９．４〜９９．７％のリードがゲノムにマップされ、この内の９９．９９％が標的ＳＮＰにマップされ、シーケンサーにより生成されたリードの０．１％がプライマー二量体であった。

１０００万シークエンシングリードの血漿試料に対しては、通常、少なくとも１９，４８８個の標的ＳＮＰの内の１９，３５０個（９９．３％）が増幅および配列決定される。２００万シークエンシングリードのＤＮＡ試料に対しては、通常、少なくとも１９，０００標的ＳＮＰ（９７．５％）が増幅および配列決定される。数字が小さいのは、ランダムサンプリングノイズに起因する可能性がある。理由は、リード数が小さく、シーケンサーが一部の増幅産物を見逃すためである。必要があれば、シークエンシングリード数を多くして、増幅および配列決定される標的ＳＮＰの数を増やすことができる。

関連性のある母系および父系ゲノムＤＮＡ試料を、ＳＴＡＲ１中の７．５ｎＭのセミネステッド１９，４８８外側フォワードプライマーおよびタグ付加リバースプライマーを使って増幅した。サーモサイクリング条件およびＳＴＡＲ２の組成、およびバーコーディングＰＣＲはヘミネステッドプロトコールについてのものと同じであった。

４０７個の試料に対する平均胎児画分は、１４．８％であることが明らかになった。配列決定データを本明細書で開示のインフォマティクス法を使って解析し、４０７個の母系血漿試料の３７８個中にＤＮＡが存在していた胎児の４個の染色体（１３、１８、２１、Ｙ）、および４０７個の母系血漿試料の３７５個中の染色体Ｘの倍数性状態をコールした。集団内の１，８８７個の染色体全てについての倍数性コールは正確にコールされ、信頼度は９０％を超えた。１８８７コールの内の１８８２は、９５％を超える信頼度であり、１，８８７コールの内の１，８６２は９９％を超える信頼度であった。

血漿から抽出したＤＮＡの代わりに水を使って、血漿ＰＣＲプロトコールにより類似の対照実験を行った。６種のこのような試行実験では、５〜６％の配列決定リードがプライマー二量体であった。他の配列決定リードは、バックグラウンドノイズによるものであった。この実験は、プライマーがハイブリダイズする標的遺伝子座を有する核酸試料が存在しない場合であっても、（他のプライマーにハイブリダイズして増幅プライマー二量体が形成されないで）少量のプライマー二量体が形成されることを示す。

実験１６
次の実験は、本発明のいずれかの多重ＰＣＲ法で使うことができるプライマーライブラリーの代表的設計および選択方法を示す。目的は、ただ１回の反応で大量の標的遺伝子座（または標的遺伝子座のサブセット）を同時に増幅するために使用できるプライマーを初期の候補プライマーライブラリーから選択することである。初期の候補標的遺伝子座集合に対しては、それぞれの標的遺伝子座に対するプライマーを設計または選択する必要はない。できるだけ多くの望ましい標的遺伝子座に対しプライマーが設計、選択されるの好ましい。

ステップ１
候補標的遺伝子座（例えば、ＳＮＰ）の集合を、標的遺伝子座の望ましいパラメータ例えば、標的集団内のＳＮＰ頻度またはＳＮＰのヘテロ接合率（ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｐｒｏｊｅｃｔｓ／ＳＮＰ／のｗｏｒｌｄｗｉｄｅｗｅｂ；ＳｈｅｒｒｙＳＴ，ＷａｒｄＭＨ，ＫｈｏｌｏｄｏｖＭ，ｅｔａｌ．ｄｂＳＮＰ：遺伝的変異のＮＣＢＩデータベース、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２００１Ｊａｎ１；２９（１）：３０８−１１。これらのそれぞれは、参照によりその全体が本明細書に組み込まれる）に関する公的に入手可能な情報に基づいて選択した。それぞれの候補遺伝子座に対し、Ｐｒｉｍｅｒ３プログラム（ｐｒｉｍｅｒ３．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔのｗｏｒｌｄｗｉｄｅｗｅｂ；ｌｉｂｐｒｉｍｅｒ３ｒｅｌｅａｓｅ２．２．３。これらは、参照によりその全体が本明細書に組み込まれる）を使って、１個または複数個のＰＣＲプライマー対が設計された。特定の標的遺伝子座のＰＣＲプライマーに対する実行可能な設計が存在しなかった場合は、その標的遺伝子座をその後の検討から除外した。

必要に応じ、ほとんど、または全ての標的遺伝子座に対し「標的遺伝子座スコア」（高いスコアは、高い望ましさを表す）、例えば、種々の標的遺伝子座に望ましいパラメータの加重平均をベースにして計算した標的遺伝子座スコアを計算してもよい。パラメータは、プライマーが使われる特定の用途に対するそれらの重要性に応じて異なる加重を割り付けることができる。代表的パラメータには、標的遺伝子座のヘテロ接合率、標的遺伝子座の配列（例えば、多型）に関連する有病率、標的遺伝子座の配列（例えば、多型）に関連する疾患浸透度、標的遺伝子座の増幅に使われる候補プライマーの特異性、標的遺伝子座の増幅に使われる候補プライマーのサイズ、および標的増幅産物のサイズが含まれる。

ステップ２
それぞれのプライマーと、ステップ１からの全てのその他の標的遺伝子座に対する全てのプライマーとの間で熱力学的相互作用スコアを計算した（例えば、Ａｌｌａｗｉ，Ｈ．Ｔ．＆ＳａｎｔａＬｕｃｉａ，Ｊ．，Ｊｒ．（１９９８），「ＴｈｅｒｍｏｄｙｎａｍｉｃｓｏｆＩｎｔｅｒｎａｌＣ−ＴＭｉｓｍａｔｃｈｅｓｉｎＤＮＡ」，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２６，２６９４−２７０１；Ｐｅｙｒｅｔ，Ｎ．，Ｓｅｎｅｖｉｒａｔｎｅ，Ｐ．Ａ．，Ａｌｌａｗｉ，Ｈ．Ｔ．＆ＳａｎｔａＬｕｃｉａ，Ｊ．，Ｊｒ．（１９９９），「Ｎｅａｒｅｓｔ−ＮｅｉｇｈｂｏｒＴｈｅｒｍｏｄｙｎａｍｉｃｓａｎｄＮＭＲｏｆＤＮＡＳｅｑｕｅｎｃｅｓｗｉｔｈＩｎｔｅｒｎａｌＡ−Ａ，Ｃ−Ｃ，Ｇ−Ｇ，ａｎｄＴ−ＴＭｉｓｍａｔｃｈｅｓ」，Ｂｉｏｃｈｅｍｉｓｔｒｙ３８，３４６８−３４７７；Ａｌｌａｗｉ，Ｈ．Ｔ．＆ＳａｎｔａＬｕｃｉａ，Ｊ．，Ｊｒ．（１９９８），「Ｎｅａｒｅｓｔ−ＮｅｉｇｈｂｏｒＴｈｅｒｍｏｄｙｎａｍｉｃｓｏｆＩｎｔｅｒｎａｌＡ−ＣＭｉｓｍａｔｃｈｅｓｉｎＤＮＡ：ＳｅｑｕｅｎｃｅＤｅｐｅｎｄｅｎｃｅａｎｄｐＨＥｆｆｅｃｔｓ），Ｂｉｏｃｈｅｍｉｓｔｒｙ３７，９４３５−９４４４．；Ａｌｌａｗｉ，Ｈ．Ｔ．＆ＳａｎｔａＬｕｃｉａ，Ｊ．，Ｊｒ．（１９９８），「ＮｅａｒｅｓｔＮｅｉｇｈｂｏｒＴｈｅｒｍｏｄｙｎａｍｉｃＰａｒａｍｅｔｅｒｓｆｏｒＩｎｔｅｒｎａｌＧ−ＡＭｉｓｍａｔｃｈｅｓｉｎＤＮＡ」，Ｂｉｏｃｈｅｍｉｓｔｒｙ３７，２１７０−２１７９；およびＡｌｌａｗｉ，Ｈ．Ｔ．＆ＳａｎｔａＬｕｃｉａ，Ｊ．，Ｊｒ．（１９９７），「ＴｈｅｒｍｏｄｙｎａｍｉｃｓａｎｄＮＭＲｏｆＩｎｔｅｒｎａｌＧ−ＴＭｉｓｍａｔｃｈｅｓｉｎＤＮＡ」，Ｂｉｏｃｈｅｍｉｓｔｒｙ３６，１０５８１−１０５９４；ＭｕｌｔｉＰＬＸ２．１（ＫａｐｌｉｎｓｋｉＬ，ＡｎｄｒｅｓｏｎＲ，ＰｕｕｒａｎｄＴ，ＲｅｍｍＭ．ＭｕｌｔｉＰＬＸ：ａｕｔｏｍａｔｉｃｇｒｏｕｐｉｎｇａｎｄｅｖａｌｕａｔｉｏｎｏｆＰＣＲｐｒｉｍｅｒｓ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００５Ａｐｒ１５；２１（８）：１７０１−２、を参照。これらの文献は参照によりその全体が本明細書に組み込まれる）。このステップは、相互作用スコアの２Ｄ行列を生成する。相互作用スコアにより、２個の相互作用プライマーを含むプライマー二量体の尤度を予測した。スコアは、下式のように計算された：
相互作用＿スコア＝ｍａｘ（−ｄｅｌｔａＧ＿２，０．８＊（−ｄｅｌｔａＧ＿１））
式中、
ｄｅｌｔａＧ＿２＝ＰＣＲにより両端で伸長可能な、すなわち、それぞれのプライマーの３’末端が他のプライマーにアニールする二量体に対するギブズエネルギー（二量体を破断するのに要するエネルギー）；および
ｄｅｌｔａＧ＿１＝少なくとも一端でＰＣＲにより伸長可能な二量体に対するギブズエネルギー、である。

ステップ３：
それぞれの標的遺伝子座に対し、２個以上のプライマー対設計が存在する場合、下記の方法を使って１個の設計が選択される：
１遺伝子座のそれぞれのプライマー対設計に対し、その設計の２個のプライマーおよびその他の全ての標的遺伝子座に対する全ての設計による全てのプライマーに対し、最悪の（最高の）相互作用スコアを見つける。
２最悪相互作用スコア中で最良の（最低の）スコアを有する設計を選択する。

ステップ４
それぞれのノードが１個の遺伝子座およびその関連するプライマー対設計（例えば、最大クリーク問題）を表すようにグラフが構築された。それぞれのノード対間に１個のエッジをを形成した。それぞれのエッジに、エッジにより連結された２つのノードに関連するプライマーの内の最悪の（最高の）相互作用スコアに等しい加重を割り付けた。

ステップ５
必要に応じ、１つの設計による１個のプライマーと、別の設計による１個のプライマーが重複する標的領域にアニールすると思われる２個の異なる標的遺伝子座の全ての設計対に対して、２個の設計に対するノード間に追加のエッジを加えた。これらのエッジの加重を、ステップ４で割りつけられた最高加重と同じに設定した。従って、ステップ５は、重複する標的領域にアニールし、従って、多重ＰＣＲ反応中に相互に干渉すると思われるプライマーがライブラリーに含まれるのを防ぐ。

ステップ６
初期の相互作用スコア閾値は、次式で計算された：
加重＿閾値＝ｍａｘ（エッジ＿加重）−０．０５＊（ｍａｘ（エッジ＿加重）−ｍｉｎ（エッジ＿加重））
式中、
ｍａｘ（エッジ＿加重）は、グラフ中の最大エッジ加重であり、
ｍｉｎ（エッジ＿加重）は、グラフ中の最小エッジ加重である。
閾値の開始点は、下記のように設定された：
ｍａｘ＿加重＿閾値＝ｍａｘ（エッジ＿加重）
ｍｉｎ＿加重＿閾値＝ｍｉｎ（エッジ＿加重）

ステップ７
加重＿閾値を超える加重のエッジのみを有し、ステップ５のグラフと同じ設定のノードからなる新規グラフを構築した。従って、このステップは、加重＿閾値以下のスコアの相互作用を無視している。

ステップ８
残存エッジが無くなるまで、ノード（および除去されたノードに連結された全てのエッジ）をステップ７のフラグから除去した。それぞれ以下の手順を反復適用して、ノードを除去した：
１最高角度の（最高数のエッジを持つ）ノードを見つける。２個以上ある場合は、任意の１個を選択する。
２上記で選択したノードからなるノードおよびそれに連結した全てのノードの集合を定める（但し、上記で選択したものより小さい角度のノードは除く）。
３ステップ１由来の最小標的遺伝子座スコア（より小さいスコアは、より低い望ましさを表す）を有する集合からノードを選択する。そのノードをグラフから除去する。

ステップ９
グラフに残っているノードの数が多重ＰＣＲプール用として必要な標的遺伝子の数を満たす場合は（許容可能な誤差内で）、前記方法をステップ１０で継続した。

グラフに残っているのが多すぎるか、または少なすぎる場合は、二分探索を行って何の閾値がグラフ中に残っている望ましい数のノードを生成したかを判定した。グラフ中に多すぎるノードがあった場合、加重閾値境界を下式のように調節した：
ｍａｘ＿加重＿閾値＝加重＿閾値
そうでない場合（グラフ中に少なすぎるノードしかない場合）、加重閾値境界を下式のように調節した：
ｍｉｎ＿加重＿閾値＝加重＿閾値
次に、加重閾値を下式のように調節した：
加重＿閾値＝（ｍａｘ＿加重＿閾値＋ｍｉｎ＿加重＿閾値）／２
ステップ７〜９を繰り返した。

ステップ１０
グラフ中に残っているノードに関連するプライマー対設計をプライマーライブラリー用に選択した。このプライマーライブラリーを本発明のいずれかの方法で使用できる。

必要に応じ、このプライマー設計および選択方法は、１個のみのプライマー（プライマー対ではなく）が標的遺伝子座の増幅に使用されるプライマーライブラリーに対しても実行できる。この場合には、ノードは、（プライマー対ではなく）１個のプライマー当たりの標的遺伝子座を示す。

実験１７
図２７は、本発明の方法を使って設計された２種のプライマーライブラリーを比較するグラフである。このグラフは、それぞれのプライマーライブラリーの標的となる特定のマイナー対立遺伝子頻度を有する遺伝子座の数を示す。「新規プール」ライブラリーの選択中、より多くのプライマーが保持された。このライブラリーは、より多くの標的遺伝子座、特に、より多くの比較的大きなマイナー対立遺伝子頻度を有する標的遺伝子座（これは、本発明の一部の方法、例えば、胎児の染色体異常の検出に対しより高い情報価値のある対立遺伝子である）の増幅を可能とする。

これらのプライマーライブラリーを次の多重ＰＣＲ法で使用した。血液（２０〜４０ｍＬ）をそれぞれの対象から２個〜４個のＣＥＬＬ−ＦＲＥＥ（商標）ＤＮＡチューブ（Ｓｔｒｅｃｋ）中に採取した。血漿（最低限７ｍＬ）を、２，０００ｇで２０分間、続けて３，２２０ｇで３０分間の二重遠心分離プロトコールによりそれぞれの試料から単離し、第１回目の遠心分離後に上清を移した。ＱＩＡＧＥＮＱＩＡａｍｐＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄキットを使ってｃｆＤＮＡを７〜２０ｍＬの血漿から単離し、４５ｕＬのＴＥ緩衝剤で溶出した。純母系ゲノムＤＮＡを第１回目の遠心分離後に得られたバフィーコートから単離し、純父系ゲノムＤＮＡを血液，唾液または頬側試料から同様にして調製した。

１１，０００標的特異的アッセイを使って、母系ｃｆＤＮＡ、母系ゲノムＤＮＡ、および父系ゲノムＤＮＡ試料を１５サイクル前増幅し、一定分量をネステッドプライマーを使った１５サイクルの第２のＰＣＲ反応に移した。最終的に、第３の１２サイクルラウンドのＰＣＲでバーコード化タグを付加することにより試料をシークエンシング用に調製した。従って、１回の反応で１１，０００標的を増幅し、標的は、１３、１８、２１、Ｘ、およびＹ染色体上に認められるＳＮＰを含んでいた。その後、ＩＬＬＵＭＩＮＡＧＡＩＩｘまたはＨＩＳＥＱシーケンサーを使って増幅産物を配列決定した。胎児の遺伝子型より浅いリード深度（ｃｆＤＮＡのリード深度の約２０％）で親の遺伝子型を配列決定した。

実験１８
必要に応じ、標準的な方法、例えば、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ２１００Ｂｉｏａｎａｌｙｚｅｒ（図２８Ａ−Ｍ）を使ってＰＣＲ産物のサイズと量を分析できる。例えば、２，４００プレックス（図２８Ｂ−２８Ｇ）および１９，４８８プレックス実験（図２８Ｈ〜２８Ｍ）に本明細書で記載のネスティングなしの直接ＰＣＲ法を使用した。図２８Ｂ〜２８Ｄと２８Ｈ〜２８Ｊ用のプライマーの量は１０ｎＭであった。図２８Ｅ〜２８Ｇと２８Ｋ〜２８Ｍのプライマーの量は１ｎＭであった。図２８Ｂ、２８Ｅ、２８Ｈ、および２８Ｋでは、入力ＤＮＡの量は２４ｎｇ；図２８Ｃ、２８Ｆ、２８Ｉ、および２８Ｌでは、８０ｎｇ；ならびに、図２８Ｄ、２８Ｇ、２８Ｊ、および２８Ｍでは２５０ｎｇであった。より多くの入力ＤＮＡでは、より大きな比率の所望の１８０塩基対産物が生成した。１４０塩基対の位置のピークは、プライマー二量体産物である。

実験１９
原理証明調査は、全染色体にわたり等しく高い正確度でのＴ１３，Ｔ１８，Ｔ２１，４５，Ｘ，および４７，ＸＸＹの検出を実証した。

患者
地域法に準じて施設内審査委員会により承認されたプロトコールに基づいて、妊娠中の夫婦を特殊出生前ケアセンター（ｓｐｅｃｉｆｉｃｐｒｅｎａｔａｌｃａｒｅｃｅｎｔｅｒ）に登録した。選択規準は、少なくとも１８才の年令、少なくとも９週間の妊娠期間、単胎妊娠、およびインフォームドコンセントへのサインであった。血液試料を妊娠中の母親から採取し、血液または頬側試料を父親から集めた。２例のＴ１３（パトー症候群）を有する妊娠、２例のＴ１８（エドワーズ症候群）を有する妊娠、２例のＴ２１（ダウン症候群）を有する妊娠、２例の４５，Ｘを有する妊娠、２例の４７，ＸＸＹを有する妊娠、および９０例の正常妊娠、由来の試料を、試験前に約５００人の女性のコホートから選択し、その方法がどの染色体異常を検出するかを試験した。誕生後の子供組織が入手可能な場合、その試料に対し、正常胎児の核型を分子核型分析により確認した。低リスク女性の侵襲的検査の前に正倍数体試料を採取した。正倍数体試料を、侵襲的検査後少なくとも７日間採取し、別々の研究所での細胞遺伝学的核型分析または蛍光インサイツハイブリダイゼーションにより異数性を確認した。

試料調製および多重ＰＣＲ
図３０Ａ〜Ｅ、３０Ｇ、３０Ｈ、および３１Ａ−３１Ｇ中のデータに対しては、実験１５で記載のように試料調製および１９，４８８プレックスＰＣＲを行った。図３０Ｆ中のデータに関しては、実験１７で記載のように試料調製および１１，０００プレックスＰＣＲを行った。

方法およびデータ解析
アルゴリズムは、親の遺伝子型および乗換え頻度データ（例えば、ハップマップデータベース由来のデータ）を考慮して、極めて多数の可能な胎児の倍数性状態、および、種々の胎児のｃｆＤＮＡ画分に対する１９，４８８多形遺伝子座での予測される対立遺伝子分布を計算する（図２９Ａ〜２９Ｃ）。対立遺伝子比に基づく方法と異なり、アルゴリズムは、連鎖不平衡も考慮に入れ、非ガウス分布データモデルを使って、観察プラットフォーム特性および増幅の偏りを有するＳＮＰに対する対立遺伝子測定の予測分布を示す。その後、アルゴリズムは、種々の予測対立遺伝子分布を、ｃｆＤＮＡ試料で測定した実際の対立遺伝子分布と比較し（図２９Ｃ）、配列決定データに基づいてそれぞれの仮説（モノソミー，ダイソミー，またはトリソミー、これらに対しては、種々の可能な乗換えに基づいて多くの仮説が存在する）の尤度を計算する。アルゴリズムは、それぞれの個別のモノソミー，ダイソミー，またはトリソミー仮説の尤度を合計し（図２９Ｄ）、コピー数および胎児画分として最大合計尤度を有する倍数性状態をコールする（図２９Ｅ）。研究室の研究者は、試料核型に対し盲検方式ではなかったが、アルゴリズムは、ヒトの介入なしに倍数性状態をコールするので、真実に対し盲検性が維持されている。

データの解釈
生成データのグラフ表示
対象染色体の倍数性状態を決定するために、アルゴリズムは、染色体当たり３，０００〜４，０００個のＳＮＰ位置のそれぞれの２個の可能な対立遺伝子の配列数の分布を考慮する。アルゴリズムは、可視化には役立たない手法を使って倍数性コールを行うことに留意することは重要である。従って、説明のために、本明細書では、データは単純化された方式で、ＡとＢとして標識される２個の最も可能性のある対立遺伝子の比率として示され、それにより、関連する傾向がより容易に可視化できる。この単純化図示は、アルゴリズムの一部の特徴を考慮していない。例えば、対立遺伝子比率を提示する可視化の方法では説明できない２つの重要なアルゴリズムの側面は、１）連鎖不平衡、すなわち、１個のＳＮＰでの測定が隣接するＳＮＰの可能な固有の特性に与える影響を活用する能力、および、２）プラットフォーム特性および増幅偏りを有するＳＮＰに対する予測される対立遺伝子測定値の分布を説明する非ガウス分布データモデルの使用である。また、アルゴリズムは、それぞれのＳＮＰ位置で２つの、最も頻度の高い対立遺伝子を考慮するのみで、他の可能な対立遺伝子を無視することにも留意されたい。

図３０Ａ〜３０Ｈのグラフ表示は、２個、１個、または３個の胎児染色体が存在する試料を含む。通常、これらは、正倍数性（図３０Ａ〜３０Ｃ）、モノソミー（図３０Ｄ）、およびトリソミー（図３０Ｅ〜３０Ｈ）をそれぞれ示す。全てのプロットで、それぞれのスポットは、単一ＳＮＰを示し、標的ＳＮＰは、１個の染色体に対し左から右へ水平軸に沿って順次プロットされる。垂直軸は、Ａ対立遺伝子に対するリード数を、そのＳＮＰに対するＡとＢ両方の対立遺伝子の合計リード数に対する比率として示す。測定は、母系血液から単離された合計ｃｆＤＮＡに対し行われ、ｃｆＤＮＡは、母系と胎児両方のｃｆＤＮＡを含み、従って、それぞれのスポットは、そのＳＮＰに対する胎児と母系ＤＮＡの寄与の組み合わせを表すことに留意されたい。従って、母系ｃｆＤＮＡの０％〜１００％の比率の増加は、いくつかのスポットを、母系と胎児の遺伝子型に応じてプロット内で徐々にに上下に移動させることになるであろう。

可視化を容易にすることが必要な場合には、母系遺伝子型はそれぞれのスポットの局在化に多く寄与し、大部分のトリソミーは、母系遺伝であるため、母系遺伝子型に応じてスポットを色分けでき、これは倍数性状態の可視化に有用である。具体的には、母系遺伝子型がＡＡであるＳＮＰは、赤色で示すことができ、母系遺伝子型がＡＢであるＳＮＰは緑色で示すことができ、母系遺伝子型がＢＢであるＳＮＰは青色で示すことができる。

全てのケースで、Ａ対立遺伝子に対し母親と胎児の両方由来のホモ接合（ＡＡ）であるＳＮＰは、Ｂ対立遺伝子が存在しないはずのためＡ対立遺伝子リード比率が高いので、プロットの上限にぴったりと張り付いているのが認められる。逆に、Ｂ対立遺伝子に対し母親と胎児の両方由来のホモ接合であるＳＮＰは、Ｂ対立遺伝子のみが存在するはずなのでＡ対立遺伝子リード比率が小さいために、プロットの下限にぴったりと張り付いているのが認められる。プロットの上限にも下限にもぴったりと張り付かないスポットは、母親、胎児、または両方がヘテロ接合であるＳＮＰを示す。これらのスポットは、胎児の倍数性を特定するのに有用であるが、父系対母系遺伝の判定に対し情報価値のある場合もある。これらのスポットは、母系と胎児の遺伝子型および胎児画分の両方に基づいて分離し、従って、それぞれのｙ軸に沿った個別のスポットの詳細な位置は、化学量論および胎児画分の両方に依存する。例えば、母がＡＡで胎児がＡＢである遺伝子座は、異なるＡ対立遺伝子リード比率を有し、従って、胎児画分に応じてｙ軸に沿った異なる位置を取ると予測される。

２個の染色体の存在
図３０Ａ〜３０Ｃは、試料が完全に母系の場合（胎児のｃｆＤＮＡが存在しない場合：図３０Ａ）、中程度の胎児のｃｆＤＮＡ画分を含む場合（図３０Ｂ）、または高い胎児のｃｆＤＮＡ画分を含む場合（図３０Ｃ）の２個の染色体の存在を示すデータである。

図３０Ａは、非妊婦の血液から単離したｃｆＤＮＡから得たデータを示す。胎児のｃｆＤＮＡが存在せず、試料が母系ｃｆＤＮＡのみを含む場合、プロットは、純粋に正倍数体母系遺伝子型を表し、ホールマークパターンは、スポットの「クラスター」を含み、赤色クラスターがプロットの上端にぴったりと張り付いており（母系遺伝子型がＡＡであるＳＮＰ）、青色クラスターがプロットの下端にぴったりと張り付いており（母系遺伝子型がＢＢであるＳＮＰ）、さらに、単一の緑色クラスターが中央に存在する（母系遺伝子型がＡＢであるＳＮＰ）（図では色を示さず）。

胎児のｃｆＤＮＡが存在する場合は、スポットの位置は、クラスターが離散的「バンド」に分離するように移動する。０％の胎児画分の試料に対して、ひとまとまりのスポットは、「クラスター」と呼ばれ（図３０Ａのように）、また、０％を超える胎児画分の全ての試料に対しては、ひとまとまりのスポットは、「バンド」（図３０Ｂ〜３０Ｊのように）と呼ばれることに留意されたい。胎児画分が十分大きい場合、これらの離散的バンドは、容易に目視可能となろう。具体的には、図３０Ｂと３０Ｃは、中程度および高い胎児画分がそれぞれ存在する２個の胎児染色体に関連する特徴的パターンを示す。このパターンは、母親中でヘテロ接合であるＳＮＰに対応する３つの中央緑色バンド、および母親中でホモ接合であるＳＮＰに対応するそれぞれプロットの上端（赤）および下端（青）の両方にある２つの「周辺」バンドを含む（図では色を示さず）。

図３０Ｂは、正倍数体胎児保有女性由来で、１２％胎児のｃｆＤＮＡ画分を含む血漿試料から単離したｃｆＤＮＡ由来のデータを示す。ここで、プロットの上端および下端にぴったり張り付いたスポットのクラスターは、それぞれ：プロットの上端または下端にぴったり張り付いたまま残っている１つの赤色および１つの青色外側周辺バンド、ならびにプロットの端部から離れた１つの赤色および１つの青色内側周辺バンド、の２つの離散的バンドに分離する（図では色を示さず）。これらの０．９２と０．０８近傍を中心とする内側周辺バンドは、母系遺伝子型がＡＡで胎児の遺伝子型がＡＢ（赤色で示す）であるＳＮＰ、および母系遺伝子型がＢＢで胎児の遺伝子型がＡＢであるＳＮＰ（青色で示す）をそれぞれ表す。緑色のスポットの中央クラスターは広がっているが、この胎児画分では、明確なバンドへの分離は容易には視認できない。

高い胎児のｃｆＤＮＡ画分では、２個の染色体の存在を示す典型的パターン（３組の緑色のバンド、ならびに２つの赤色および２つの青色周辺バンド）が容易に見てとれる（図では色を示さず）。図３０Ｃは、２６％の胎児のｃｆＤＮＡ画分の場合の、正倍数体胎児を保有する女性由来の血漿試料から得たデータを示す。ここで、周辺バンドは、増加した胎児のｃｆＤＮＡ画分由来の変化したＢ対立遺伝子のレベルに起因して、内側バンドが分離してプロットの中心部へ向かって移動する。高い胎児画分で中央の緑色クラスターの３つの別々のバンドへの分離は、この時点でかなり容易に見てとれるのは意義深いことである。この中央の３組のバンドは、この場合、０．３７、０．５０および０．６３近傍にクラスター化し、母系遺伝子型がＡＢで、それぞれ、胎児の遺伝子型がＢＢ（下部）、ＡＢ（中央）およびＡＡ（上部）であるＳＮＰに対応する。

これらのホールマークパターン、すなわち、３つの緑色バンドおよび四つの周辺バンド（２つの赤色および２つの青色）は、常染色体正倍数性の場合、または女性（ＸＸ）胎児中のＸ染色体の場合のように、２個の染色体の存在を示す。

１個の染色体の存在
胎児が単一染色体のみを受け継ぎ、従って、単一の対立遺伝子のみを受け継ぐ場合、胎児のヘテロ接合性は、不可能である。従って、唯一の可能な胎児のＳＮＰの識別情報は、ＡまたはＢである。従って、母系遺伝モノソミー染色体は、母親がヘテロ接合であるＳＮＰを示す２つの中央緑色バンド、および母親がホモ接合であるＳＮＰを示し、プロットの上端および下端にぴったり張り付いたまま残っているそれぞれ唯一の赤色および青色周辺バンド（１と０のリード比率）（図３０Ｄ）（図では色を示さず）の特徴的パターンを有する。内側周辺バンドが存在しないことに留意されたい。このパターンは、母系遺伝常染色体モノソミーの場合、または男性（ＸＹ）胎児のＸ染色体の場合のように、１個の染色体の存在を示す。

３個の染色体の存在
トリソミー染色体は、３つの特徴的パターンを有する。第１のパターンは、母系遺伝減数分裂トリソミー（減数分裂エラー）を示し、胎児は相同性の、同一でない２個の染色体を母親から受け継いでいる（図３０Ｅ）。このパターンは、それぞれ２つの赤色および青色周辺バンドを有する２つの中央緑色バンドを含む（図では色を示さず）。第２のパターンは、父親から受け継いでいる減数分裂トリソミーを示し、胎児は、２個の相同性の、同一でない父親由来染色体を受け継いでいる（図３０Ｆ）。このパターンは、４つの中央緑色バンドおよびそれぞれ３つの赤色および青色周辺バンドを含む（図では色を示さず）。第３のパターンは、母親から（図３０Ｇ）または父親から受け継いでいる（図３０Ｈ）有糸分裂トリソミー（有糸分裂エラー）を示し、胎児は、２個の同一の母親または父親由来の染色体を受け継いでいる。このパターンは、それぞれ２つずつ赤色および青色周辺バンドを有する４つの中央緑色バンド含む。母親からおよび父親から受け継いだ有糸分裂トリソミーは、赤色および青色バンドに隣接した配置により識別できる。父親から受け継いでいる有糸分裂トリソミーでは、赤色および青色内側周辺バンド（プロットの端に張り付いていないバンド）が中央により近くなる（図では色を示さず）。これは、同一染色体の父系寄与が原因である。我々の以前の結果から、卵割球段階で、６６．７％の母系遺伝トリソミーが減数分裂であり、１０．２％のトリソミーのみが父系遺伝であることが示されることに留意されたい。

Ｙ染色体に関しては、ＰＳ法は、別々の仮説セット：ゼロ個、１個、または２個の染色体の存在を考慮している。それぞれの遺伝子座でのシーケンスリードに母系の寄与が無い場合、ヘテロ接合遺伝子座は可能ではないので（２個のＹ染色体のケースは、必ず２個の同一染色体を含む）、バンドは、プロットの上端（Ａ対立遺伝子）または下端（Ｂ対立遺伝子）にぴったり張り付いたまま残り（データは図示せず）、解析は極めて単純となり、定量的対立遺伝子数データに依存する。前記方法はＳＮＰを調べるので、Ｙ染色体由来の相同非組換え型ＳＮＰを使用し、従って、１個のプローブ対に対してＸとＹの両方上のデータを取得することに留意されたい。

異数性の特定
上述のように、このプロットベース可視化法を使った常染色体異数性の特定は、直接的に十分な胎児画分が与えられ、異常な数の染色体が存在するプロットを特定することが必要でなだけである。ＸとＹ染色体のコピー数の情報を合計することにより、性染色体異数性が存在するか否かが特定される。具体的には、４７，ＸＸＸ遺伝子型を有する胎児を表すプロットは、典型的な「３染色体」パターンを有し、４７，ＸＸＹ遺伝子型を有する胎児を表すプロットは、Ｘ染色体に対し典型的な「２染色体」パターンを有するが、また、１個のＹ染色体の存在を示す対立遺伝子リードも有する。同様に、前記方法は、４７，ＸＹＹをコールすることもでき、この場合、「１染色体」パターンは、単一Ｘ染色体の存在を示し、また、対立遺伝子リードは、２個のＹ染色体の存在を示す。４５，Ｘ遺伝子型を有する胎児は、Ｘ染色体に対して典型的な「１染色体」パターンを有し、データは、ゼロＹ染色体を示す。

胎児画分の影響
上記で考察のように、胎児由来シーケンスリード数は、プロットのｙ軸に沿ったそれぞれのスポットの正確な位置を与える。胎児画分は、胎児および母親由来のリードの比率に影響を与えるので、それぞれのスポットの位置取りにも影響を与える。図３０Ｃ〜３０Ｅおよび図３０Ｇと３０Ｈの胎児のｃｆＤＮＡの高い比率（通常約２０％）では、スポットクラスターは、主に母系遺伝子型に基づいているが、遺伝子型が母系遺伝子型と異なる対立遺伝子由来の胎児ＤＮＡの存在により、クラスターが複数の別個のバンドに変化することが容易に見てとれる。しかし、胎児画分が減少するに伴い（図３０Ｂおよび３０Ｆの場合のように）、スポットは、プロットの両端および中心の方に戻り、より詰まったクラスターを生じる。具体的には、母系遺伝子型がＡＡである赤色周辺バンドの集合は、プロットの上端の方向に戻り、母系遺伝子型がＢＢの青色周辺バンドの集合は、下端の方向に戻り、母親がヘテロ接合の緑色中央バンドの集合は、プロット中心部の単一クラスターに圧縮される（図３０Ｂと３０Ｃとを比較されたい）（図では色を示さず）。低胎児画分の場合に対しこの可視化手法を使った場合には、異数性は容易に視認できないが、アルゴリズムは、非常に小さい胎児画分、例えば、３％胎児画分の場合の倍数性状態を特定できる。統計的技術を使って所与の試料パラメータセット（例えば、コピー数、親の遺伝子型、および胎児画分、など）に対し、観察データを、対立遺伝子分布を予測する極めて正確なデータモデルと比較することにより、これが可能となる。小胎児画分の場合には、異なる倍数性状態に対する対立遺伝子分布間の差異は胎児画分に比例するので、データモデル精度が重要である。さらに、アルゴリズムは、データセットに信頼性のある胎児の倍数性決定を行うために十分なデータが含まれない場合を判定できる。

結果
標的ＳＮＰのマッピングされたシークエンシングリードは、情報価値があると見なされ、アルゴリズムで使用された。シークエンシング結果で、９５％超の標的遺伝子座が観察された。重要な倍数性コールを可視化するプロットを、図３１Ａ〜３１Ｇに示す。図３１Ａは、正倍数体試料を示す。ここでは、染色体１３、１８、および２１は、典型的な「２染色体」パターン（本明細書で記載のように）を有する。これは、３組の緑色中央バンド、および２つの赤色バンドおよび２つの青色周辺バンドを含む。これは、Ｘ染色体に対する２つの緑色中央バンドおよびプロットの端部に沿ったＹ染色体バンドの存在と一緒に、正倍数体ＸＹ遺伝子型を示す（図では色を示さず）。

最も一般的な常染色体トリソミーのＴ１３、Ｔ１８、およびＴ２１は、図３１Ｂ、３１Ｃ、および３１Ｄ中のプロットでそれぞれ示されている。具体的には、図３１Ｂは、Ｔ１３試料を示す。ここで、染色体１８と２１は典型的な「２染色体」パターンを示し、染色体Ｘは典型的な「１染色体」パターンを示し、Ｙ染色体由来のリードが存在する。全体で、これは、染色体１８および２１でダイソミーを示し、胎児のＸＹ遺伝子型を識別する。しかし、具体的には、染色体１３は、典型的な「３染色体」パターンを示す。同様に、図３１ＣはＴ１８試料を示し、図３１ＤはＴ２１試料を示す。

また、前記方法は、４５，Ｘ（図３１Ｅ），４７，ＸＸＹ（図３１Ｆ），および４７，ＸＹＹ（図３１Ｇ）を含む性染色体異数性を検出することができる。前記方法は、染色体１３、１８、２１、Ｘ、およびＹでのコピー数をコールしており、全体の染色体数は、残っている染色体にダイソミーを仮定して報告されていることに留意されたい。プロットの４５、Ｘ試料を示すＸ染色体領域は、単一染色体の存在を示す。しかし、染色体１３、１８、および２１に対する「２染色体」パターンに加えて、Ｙ染色体由来のリードの欠如は、４５，Ｘ遺伝子型を指し示す。逆に、４７，ＸＸＹ試料は、２Ｘ染色体の存在を示すプロットを生成する。また、データは、Ｙ染色体由来の対立遺伝子のリードを示した。染色体１３、１８、および２１の２コピーに加えて、これは、４７，ＸＸＹ遺伝子型を指し示す。４７，ＸＹＹ遺伝子型は、Ｘ染色体に対する「１染色体」パターン、および２個のＹ染色体の存在を表すリードの存在により示される。

考察
前記方法は、母系血液からＴ１３、Ｔ１８、Ｔ２１、４５，Ｘ、４７，ＸＸＹ、および４７，ＸＹＹを非侵襲的に検出した。前記方法は、１９，４８８個のＳＮＰの標的多重ＰＣＲ増幅および高スループットシークエンシングにより母系血漿からｃｆＤＮＡを調べる。前記方法は、胎児画分およびＤＮＡ品質を含む親の遺伝子型情報および多くの試料パラメータを考慮に入れる前記方法の高度インフォマティクス解析と組み合わせて、より確実に胎児の前兆を検出し、７種の最も良く見られるタイプの出生時異数性（Ｔ１３、Ｔ１８、Ｔ２１、４５，Ｘ、４７，ＸＸＸ、４７，ＸＸＹ、および４７，ＸＹＹ）に関連する５個の染色体の全てで高度に正確な倍数性コールを行う。前記方法は、以前の方法に比べて、顕著に大きな臨床的適用範囲および高い試料特異的計算精度（個別化されたリスクスコアと同様に）などの多くの臨床的利点を提供する。

臨床的適用範囲の拡大
常染色体トリソミーおよび性染色体異数性を正確に検出する能力を考慮すれば、前記方法は、臨床的に利用可能なＮＩＰＴ法に比べて異数性適用範囲を２倍程度増加させる。本明細書で提示された方法は、性染色体の倍数性を高正確度でコールする非侵襲的検査に過ぎない。以前のＤＮＡ混合実験および我々の実験的アッセイで解析された別の血漿試料は、前記方法により４７，ＸＸＸを含むより大きな性染色体異常コホートを検出できることを示唆している。また、本明細書で提示の方法により、染色体１３、１８、および２１の異数性を高感度および高特異性で検出でき、また、適切なプライマー設計を行えば、残りの染色体でも同様にコピー数を検出できることが期待される。

試料特異的精度の計算
特に意味があるのは、前記方法がそれぞれの試料中のそれぞれの染色体の倍数性コールに関する試料特異的正確度を計算することである。前記方法で計算された正確度は、低い正確度の検定結果を生じる可能性のある悪い品質のＤＮＡまたは低胎児画分を有する個別試料を特定し、印を付けることにより、間違ったコールの比率を大きく低減させることが期待される。対照的に、大規模ショットガンシークエンシング（ＭＰＳＳ）に基づく方法は、単一仮説棄却検定を使ったポジティブまたはネガティブコールを行い、それらの正確度推定は、個別試料の特徴ではなく、公表された調査コホートに基づいており、正確度がコホートと同じ正確度を有すると仮定されている。しかし、コホート分布の裾にあるパラメータを有する試料に対する個別の正確度は大きく異なる場合がある。早期妊娠期間の場合のような低胎児画分では、または低ＤＮＡ品質の試料に対しては、この現象は悪化する。これらの試料は、通常、追跡観察用として特定およびタグ付けされず、この結果、コールが見逃される可能性がある。しかし、本発明は、胎児画分および多くのＤＮＡ品質尺度などの多くのパラメータを考慮に入れてそれぞれの染色体コピー数コールを行い、そのコールに対し試料特異的正確度を計算する。これにより、前記方法を使って、低い正確度を有する個別試料を追跡用として特定し、フラグ付加が可能となる。これにより、特に、胎児画分が通常少ない妊娠早期段階で、ほとんどのコールの見逃しがなくなることが期待される。この前提は、コールの無い場合には単に再採血と再分析をすればよいので、コールの見逃しよりもコールのない方がはるかに好ましいということである。

計算された正確度の従来のリスクスコアへの変換
前記方法は、高リスク妊娠女性に対する異数性のリスクの調製済みリスクを提供でき、この場合、調製済みリスクには、事前リスクが考慮されている（ＢｅｎｎＰ，ＣｕｃｋｌｅＨ，ＰｅｒｇａｍｅｎｔＥ．Ｎｏｎ−ｉｎｖａｓｉｖｅｐｒｅｎａｔａｌｄｉａｇｎｏｓｉｓｆｏｒＤｏｗｎｓｙｎｄｒｏｍｅ：ｔｈｅｐａｒａｄｉｇｍｗｉｌｌｓｈｉｆｔ，ｂｕｔｓｌｏｗｌｙ．ＵｌｔｒａｓｏｕｎｄＯｂｓｔｅｔＧｙｎｅｃｏｌ２０１２；３９：１２７−１３０。この文献は参照によりその全体が本明細書に組み込まれる）。前記方法は、それぞれの患者に合わせた計算正確度を提供するが、臨床用途に対しては、これらの正確度を従来のリスクスコアに変化できる。これは正倍数体妊娠のリスクも意味するが、割合として表される。従来のリスクスコアは、母体年齢関連性リスクおよび血清レベルの生化学マーカーなどの種々のパラメータを考慮してリスクスコアが提供され、その値を超えると母親は高リスクと見なされ、該当する母親に対して、追跡観察のための侵襲的診断手順が薦められる。前記方法は、このリスクスコアを大幅に正確化し、従って、擬陽性および偽陰性割合の両方を減らし、個別の母系リスクのより正確な評価を与える。本明細書で使われる計算正確度は、倍数性コールが正確である尤度であり、パーセントで表されるが、実験１９で使われる計算正確度は、年齢関連リスクを含まない。リスクスコアの計算は、通常、年齢関連リスクを含むために、計算正確度および従来のリスクスコアは、互換性がなく、従来のリスクスコアに変換するためにそれらを組み合わせる必要がある。年齢関連リスクを計算正確度と組み合わせる式は：
であり、式中、Ｒ_１は前記方法により計算したリスクスコアで、Ｒ_２は第１期スクリーニング（ｆｉｒｓｔｔｒｉｍｅｓｔｅｒｓｃｒｅｅｎｉｎｇ）により計算したリスクスコアである。

ＳＮＰベースの方法は増幅変動に関する問題を解消する
他の一部の方法により使われる計数法の固有の欠点は、参照染色体にマッピングされるリード数に対する対象染色体（例えば、染色体２１）にマッピングされるリード数の比率を測定することにより胎児の倍数性状態を決定することである。染色体１３、Ｘ、およびＹを含む高または低ＧＣ含量の染色体の増幅で大きな変動がある。これにより、胎児のｃｆＤＮＡ信号と同程度の大きさの信号変動を生ずる場合があり、この結果、参照染色体由来リードに対する対象染色体由来対立遺伝子リードの比率を変えることによるコピー数コールを間違える可能性がある。これが染色体１３、Ｘ、およびＹに対し低い正確度を生じる場合がある。重要なのは、この問題は、早期妊娠期間で起こりやすい低胎児ｃｆＤＮＡ割合の場合に悪化することである。

対照的に、ＳＮＰベースの方法は、染色体間の一貫性のある増幅レベルに依存せず、従って、全染色体にわたり等しい精度の結果を与えることが期待される。前記方法は、定義によりただ一個のヌクレオチドが異なる多形遺伝子座にある別の対立遺伝子の相対数を検査するといった理由から、前記方法は参照染色体の使用を必要とせず、これにより、定量化リード数に依存する方法に固有の染色体間増幅変動に関する問題を防ぐ。正倍数体の参照染色体を必要とする定量的方法とは異なり、前記方法は、三倍体性、ならびに片親性ダイソミーのようなコピー数の変化を伴わない異常を検出できることが期待される。

早期検出の重要性
重大なのは、性染色体異数性の複合出生有病率が、最も一般的な常染色体異数性の場合より高いことである（図３２）。しかし、信頼性良く性染色体異常を検出できるルーチン非侵襲的選別法は現状存在しない。従って、性染色体異常は、通常、ダウン症候群または他の常染色体異数性用のルーチン検査の副次的効用として出生前に検出され、大部分の症例が全く見逃される。早期治療介入により臨床的転帰が改善されるこれら内の多くの障害にとって、早期の正確な検出が非常に重要である。例えば、ターナー症候群の全体複合出生有病率は、２，５００人の女性に１人であるが、ターナー症候群は、青年期まで診断されない場合が多い。成長ホルモン療法は、その障害が原因の低身長を防ぐことが知られているが、４才前に開始すれば、治療は顕著に高い効果がある。さらに、エストロゲン補充療法は、ターナー症候群の患者の第二次性徴を刺激可能であるが、この場合も、症候群が通例の通り検出される前の思春期直前に治療を開始すべきである。これらは全て、早期のルーチン的で安全な性染色体異数性の検出の重要性を強調するものである。前記方法は、性染色体異常に対するルーチンスクリーニングとして役立つ可能性を秘めた最初の手法を提供する。

追加の用途
前記方法は、標的増幅を利用するために、超顕微鏡的異常、例えば、微小欠失および微細重複を独特な方法で検出する準備ができた状態である。ＭＰＳＳのような非標的方法により、ディジョージ微小欠失症候群を検出できることが明らかにされているが、前記方法は、実行困難な手法を行うために、十分に高いレベルの遺伝子カバレッジを必要とする。
これが、非常に少ない比率のシークエンシングリードが情報価値のあると思われる場合に、超顕微鏡的領域に対して、非標的増幅で効率が数桁悪い理由である。さらに、最近利用可能な方法は、性染色体に対して倍数性状態を正確に特定することに関し問題があるという事実は、より小さい染色体セグメントに対して、それらの方法も同様に変動性増幅問題に直面していることを示唆している。

同様に、ＳＮＰベースの方法は、計数依存の現状の非侵襲的方法または羊水穿刺のような従来の侵襲的方法および細胞遺伝学的核型分析および／または蛍光インサイチューハイブリダイゼーションに依存するＣＶＳでは検出できない、コピー数の変化を伴わない異常であるＵＰＤ障害を検出できる。これは、臨床的に利用可能なＭＰＳＳベースの標的化方法が非多形遺伝子座を増幅し、従って、例えば、対象染色体が同じ親由来であるかどうかを判定できない一方で、ＳＮＰベースの方法が個別ハプロタイプを特異的に識別できることが理由である。このことは、これらのプラダー・ウィリ、アンジェルマン、およびベックウィズ・ヴィーデマン症候群などの微小欠失／微細重複およびＵＰＤ症候群は、通常、出生前に診断されず、出生後の初期に誤診される場合が多いことを意味する。この結果、治療介入を著しく遅らせる。さらに、前記方法がＳＮＰを標的とするために、前記方法はまた、親のハプロタイプの再構築を促進し、個別疾患連鎖遺伝子座の胎児遺伝の検出を可能とする（ＫｉｔｚｍａｎＪＯ，ＳｎｙｄｅｒＭＷ，ＶｅｎｔｕｒａＭ，ｅｔａｌ．Ｎｏｎｉｎｖａｓｉｖｅｗｈｏｌｅ−ｇｅｎｏｍｅｓｅｑｕｅｎｃｉｎｇｏｆａｈｕｍａｎｆｅｔｕｓ．ＳｃｉＴｒａｎｓｌＭｅｄ２０１２；４：１３７ｒａ７６、この文献は、参照によりその全体が本明細書に組み込まれる）。

本明細書で提示の結果は、出生前異数性特定のために前記方法の範囲を拡大できることを立証している。具体的には、１９，４８８個のＳＮＰの増幅およびシークエンシングにより、前記方法は、染色体１３、１８、２１、Ｘ、およびＹのコピー数を決定でき、他の染色体異常、例えば、いずれか他の臨床的に利用可能な非侵襲的方法では検出されない三倍体性およびＵＰＤを特異的に検出することが期待される。臨床的適用範囲の増加および強力な試料特異的計算正確度は、前記方法が、胎児の染色体異数性検出のために、侵襲的検査に対する有用な補助的手法を提供できることを示唆する。

本明細書において引用されている全ての特許、特許出願および刊行参考文献は、その全体が参照により本明細書に組み込まれる。本開示の方法はその特定の実施形態とともに記載されているが、さらに改変することができることが理解されよう。さらに、本出願は、本開示の方法が関する当技術分野における公知または通例の実施の範囲内に入る、および添付の特許請求の範囲の範囲内に入る本開示からの逸脱を含めた、本開示の方法の任意の変動、使用または適応を包含するものとする。例えば、本明細書でＤＮＡ用に開示されたいずれの方法も、リバース転写ステップを導入してＲＮＡをＤＮＡに変換することにより容易にＲＮＡに適合させることができる。例示のために多形遺伝子座を使用する実施例は、必要に応じ、容易に非多形遺伝子座の増幅に適合させることができる。

Claims

核酸試料中の標的遺伝子座を増幅する方法であって、
（ａ）少なくとも１，０００個の異なるプライマー対を含む試験プライマーライブラリーを、標的遺伝子座を含む前記核酸試料と接触させ、反応混合物を生成し、ここで各プライマー対は、同じ標的遺伝子座に結合するフォワード試験プライマー及びリバース試験プライマーを含むステップと、
（ｂ）前記反応混合物をポリメラーゼ連鎖反応（ＰＣＲ）条件に供して標的増幅産物を含む増幅産物を生成し、ここで、各試験プライマーの濃度が１０ｎＭ未満であり、反応条件のアニーリングステップの長さが１０分超であり、少なくとも１，０００の異なる標的遺伝子座が同時に増幅されるステップと、
を含み、
ここで、(i)前記増幅産物の２０％未満が試験プライマー二量体であり、(ii)前記増幅産物の少なくとも８０％が標的増幅産物であり、(iii)前記標的遺伝子座の少なくとも８０％が増幅される、方法。
少なくとも５，０００個の異なる標的遺伝子座が増幅される請求項１に記載の方法。
少なくとも１０，０００個の異なる標的遺伝子座が増幅される請求項１に記載の方法。
少なくとも２０，０００個の異なる標的遺伝子座が増幅される請求項１に記載の方法。
少なくとも３０，０００個の異なる標的遺伝子座が増幅される請求項１に記載の方法。
少なくとも９０％の前記増幅産物が標的増幅産物である請求項１に記載の方法。
少なくとも９５％の前記増幅産物が標的増幅産物である請求項１に記載の方法。
少なくとも９９％の前記増幅産物が標的増幅産物である請求項１に記載の方法。
少なくとも９０％の前記標的遺伝子座が増幅される請求項１に記載の方法。
少なくとも９５％の前記標的遺伝子座が増幅される請求項１に記載の方法。
少なくとも９９％の前記標的遺伝子座が増幅される請求項１に記載の方法。
前記増幅産物の２０％未満が試験プライマー二量体である請求項１に記載の方法。
前記増幅産物の１０％未満が試験プライマー二量体である請求項１に記載の方法。
前記増幅産物の１％未満が試験プライマー二量体である請求項１に記載の方法。
前記増幅産物の０．１％未満が試験プライマー二量体である請求項１に記載の方法。
前記候補プライマーのプライマー二量体形成能力に少なくとも一部基づいて前記試験プライマーが候補プライマーライブラリーから選択される請求項１に記載の方法。
試験プライマーのライブラリーが候補プライマーのライブラリーから選択され、前記選択を行う方法が、
（ｉ）前記ライブラリー由来の候補プライマー２個のほとんどまたは全ての可能な組み合わせに対してコンピュータでアンデザイアラビリティスコアを計算するステップであって、それぞれのアンデザイアラビリティスコアが、前記２個の候補プライマー間の二量体形成の尤度に少なくとも一部基づいているステップと、
（ｉｉ）第１の最小閾値を超えるアンデザイアラビリティスコアを有する候補プライマー２個の組み合わせのうち最多数のものの一部である前記候補プライマーを、前記候補プライマーライブラリーから除去するステップと、
（ｉｉｉ）ステップ（ｉｉ）で除去された前記候補プライマーがプライマー対のメンバーである場合、前記プライマー対のもう一方のメンバーを前記候補プライマーライブラリーから除去するステップと、
（ｉｖ）任意選択で、ステップ（ｉｉ）および（ｉｉｉ）を繰り返すステップと、
により、試験プライマーのライブラリーを選択することを含む、請求項１に記載の方法。
ステップ（ｉｉ）で使われる前記第１の最小閾値をより小さい第２の最小閾値に引き下げ、前記ライブラリーに残る前記候補プライマーの組み合わせのアンデザイアラビリティスコアが全て前記第２の最小閾値以下になるまで、または前記ライブラリー中に残る候補プライマーの数が所望の数に減らされるまで、ステップ（ｉｉ）および（ｉｉｉ）を繰り返すことにより前記ライブラリー中に残る候補プライマーの数を減らすステップをさらに含む請求項１７に記載の方法。
ステップ（ｉｉ）で使われる前記第１の最小閾値をより大きい第２の最小閾値に引き上げるステップと、前記ライブラリー中に残る前記候補プライマーの組み合わせの前記アンデザイアラビリティスコアが全て前記第２の最小閾値以下になるまで、または前記ライブラリー中に残る候補プライマーが所望の数に減らされるまで、ステップ（ｉｉ）および（ｉｉｉ）を繰り返すステップとを含む請求項１７に記載の方法。
核酸試料が単一細胞由来ＤＮＡを含む請求項１に記載の方法。
前記アンデザイアラビリティスコアが、前記標的遺伝子座のヘテロ接合率、前記標的遺伝子座の多型または変異に関連する有病率、前記標的遺伝子座の多型または変異に関連する疾患浸透度、前記候補プライマーの前記標的遺伝子座に対する特異性、前記候補プライマーのサイズ、前記標的増幅産物の融解温度、前記標的増幅産物のグアニン−シトシン（ＧＣ）含量、前記標的増幅産物の増幅効率、および前記標的増幅産物のサイズからなる群から選択される１個または複数個のパラメータに少なくとも一部基づいている請求項１８に記載の方法。
ステップ（ｂ）の前に、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対を前記ライブラリーから除去するステップをさらに含む請求項１８に記載の方法。
前記方法が、少なくとも1,000個の異なる試験プライマーのライブラリーを選択することと、選択された少なくとも1,000個の異なる前記試験プライマーを用いて、少なくとも１，０００個の異なる標的遺伝子座を同時に増幅することとを含む、請求項１７に記載の方法。
前記プライマー対のプライマーの融解温度が５５℃〜６５℃である、請求項１に記載の方法。
前記プライマー対のプライマーの融解温度が５７℃〜６０．５℃である、請求項１に記載の方法。
アニーリング温度を昇温することを含む、請求項１に記載の方法。
ＰＣＲがネステッドＰＣＲである、請求項１に記載の方法。
標的増幅産物の長さが１００ヌクレオチド未満である、請求項１に記載の方法。
標的増幅産物の長さが５０〜１００ヌクレオチドである、請求項１に記載の方法。
前記プライマー対が、Ｘ染色体、Ｙ染色体、第１３染色体、第１８染色体、及び第２１染色体上の潜在的にヘテロ接合性であるＳＮＰ遺伝子座を増幅するように設計されると共に、これらのアッセイを単一反応において用いて、母体血漿試料から得られたｃｆＤＮＡを増幅する、請求項１に記載の方法。
前記試料が、胎児の母親たる妊婦由来の母系ＤＮＡ及び胎児ＤＮＡを含むと共に、前記方法が、配列データに基づいて胎児染色体異常の存在の有無を決定することを含む、請求項１に記載の方法。
前記標的遺伝子座が、ヒトゲノムに存在するか、ヒト一塩基多型を含む、請求項１に記載の方法。
前記核酸試料が、腫瘍、移植片又は胎児由来のＤＮＡを含む、請求項１に記載の方法。