JP6068598B2

JP6068598B2 - 多胎妊娠の分子検査

Info

Publication number: JP6068598B2
Application number: JP2015217329A
Authority: JP
Inventors: ミンデニスローユク; クンロッサチウワイ; クワンチェーチャン; タクユンルン; ペイヨンチャン
Original assignee: Chinese University of Hong Kong CUHK
Current assignee: Chinese University of Hong Kong CUHK
Priority date: 2011-02-24
Filing date: 2015-11-05
Publication date: 2017-01-25
Anticipated expiration: 2032-02-24
Also published as: EP3202921A1; CN103492589A; EP2860265A1; EP2678451B1; EP2678451A4; EP3489368B1; CA2827873C; CN106011237A; CN103492589B; HK1203567A1; CN106011237B; TWI611186B; US10900080B2; EP2678451A1; EP2682887A2; AU2012311262C1; JP5837622B2; EP3202921B1; AU2012311262A1; JP2014507158A

Description

関連出願の相互参照
本出願は、２０１１年２月２４日に出願された「双胎妊娠の分子検査」の名称の米国特許仮出願第６１／４４６，２５６号の非仮出願であり、この仮出願特許の優先権を主張する。この特許の全内容は、あらゆる目的において、参照によって本明細書に組み込まれる。

本出願は、２０１０年１１月１日に出願されたＬｏらによる「母体の生物学的試料による胎児ゲノム解析」の名称の所有者共通米国特許出願第１２／９４０，９９３号（代理人整理番号８００１５−００６７１０ＵＳ）に関し、この特許の開示は、参照によってその全体が組み込まれる。

背景
多胎妊娠は、２人以上の胎児を宿している妊婦の妊娠を意味する。双胎妊娠は、最も多い形の多胎妊娠である。一卵性双生児は、同じ受精卵由来の一組の双生児を意味する。従って、その一組の双生児は、ゲノム全体にわたり同じ遺伝的構成を有する。二卵性双生児は、２つの異なる受精卵由来の一組の双生児である。その一組の双生児の遺伝的構成は、同じではないであろう。その代わりに、この一組の双生児の遺伝的構成の類似性は、異なる時に生まれた一組の同胞に似ているであろう。

双胎妊娠の接合状態に関する情報は、従来、超音波走査（ＣｈａｕｈａｎＳＰｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２０１０；２０３：３０５−３１５）または侵襲的出生前診断（例えば、羊水穿刺）（ＣｈｅｎＣＰｅｔａｌ．ＨｕｍＲｅｐｒｏｄ２０００；１５：９２９−９３４）により取得されてきた。このような接合状態情報は、その後の産科管理にとって有用である。例えば、異数性検出用に羊水穿刺を行う場合には、二卵性双生児を伴う妊娠では、各羊膜嚢に対し別々にサンプリングが必要となろう。２つの羊膜嚢を伴う一卵性双生児妊娠に対しては、理論的には、２つの羊膜嚢の内の１つのサンプリングのみで充分であろう。しかし、超音波走査は、不正確であるか、または制限がある（例えば、胎児が異なる性である場合）場合があり、また、侵襲的出生前診断は、胎児および／または母親に対し害を与える場合がある。

従って、多胎児を伴う妊娠に対する接合状態情報を得る新規技術が望まれる。

簡単な概要
本発明の実施形態は、母親から採取した、胎児に対し非侵襲的な生物学的試料を使って多胎児妊娠の接合状態を判定する方法、システム、および装置を提供する。試料（例えば、血漿）中の胎児および母体のＤＮＡの特定の染色体領域を分析して、胎児の遺伝的差異を特定することができる。例えば、胎児が二卵性である場合は、主要または副次的アレルの尺度の正規化パラメータにおける、異なる染色体の領域での不一致が示される。このような不一致は、胎児が遺伝的に同一である場合の期待値に比較して決定できる。正規化パラメータの変動を解析し、胎児ＤＮＡ濃度および種々の座位での母体胎児混合遺伝子型を決定する統計的方法が提供される。また、親の遺伝子型およびハプロタイプ情報を使用して、胎児の間での遺伝的差異を示す異なる親のハプロタイプの継承を特定することもできる。他の利点として、多胎妊娠の接合状態の判定により、例えば、母体の血液を使って行われる非侵襲的出生前検診の実施を支援できる。

一実施形態は、多胎児を宿す妊婦の生物学的試料を分析し、少なくとも妊婦の２人の胎児が二卵性であるか否かを判定する方法である。生物学的試料は、胎児および母体のＤＮＡを含む。妊婦の遺伝子型は、第１の染色体の領域内の１つまたは複数の第１の座位のそれぞれの座位で決定される。母親は、それぞれの第１の座位でホモ接合であるか、またはそれぞれの第１の座位でヘテロ接合である。各第１の座位は、生物学的試料中のそれぞれの主要アレルおよびそれぞれの副次的アレルを示す。それぞれの主要アレルは、各第１の座位において、それぞれの副次的アレルよりも量が多い。生物学的試料中の１つまたは複数の第１の座位において、１つまたは複数の主要アレルの第１の量、および／または１つまたは複数の副次的アレルの第２の量が測定される。第１の量または第２の量に対し、正規化パラメータが得られる。胎児が第１の染色体領域で遺伝的に同じである場合に、正規化パラメータがカットオフ値と比較され、正規化パラメータが統計的に期待値とは異なるか否かが判定される。期待値は、生物学的試料の測定により得られる。カットオフ値に対する正規化パラメータの比較に基づき、妊婦の胎児の内の少なくとも２人が二卵性であるか否かが判定される。

別の実施形態では、１つまたは複数の胎児特異的配列の第１の量が、生物学的試料中の１つまたは複数の第１の座位の測定時に測定される。第１の量に対し、正規化パラメータが得られる。第１の染色体領域で胎児が遺伝的に同じ場合に、正規化パラメータが、カットオフ値と比較され、正規化パラメータが期待値と統計的に異なるか否かが判定される。期待値は、生物学的試料の測定により得られる。次に、カットオフ値に対する正規化パラメータの比較に基づいて、妊婦の胎児の内の少なくとも２人が二卵性であるか否かが判定される。

別の実施形態では、複数の染色体のそれぞれの領域に対し、１つまたは複数のアレルが、生物学的試料中のそれぞれの染色体の領域の１つまたは複数のそれぞれの座位において測定され、それぞれの測定されたアレルのそれぞれの量が、各座位において決定される。胎児の内の少なくとも２人がそれぞれの染色体の領域の第１の親由来の異なるハプロタイプを受け継いでいるか否かが、測定されたアレルのそれぞれの量に基づいて判定される。胎児の内の少なくとも２人が第１の親由来の異なるハプロタイプを受け継いでいる染色体の領域の第１の量が決定される。その第１の量が、１つまたは複数のカットオフ値と比較され、胎児の内の少なくとも２人が二卵性であるか否かが判定される。

別の実施形態では、以下のようにして、ヒストグラムが作られる。複数の染色体のそれぞれの領域に対し、生物学的試料中のそれぞれの第１のアレルおよびそれぞれの第２のアレルが検出される位置でそれぞれの染色体の領域の１つまたは複数の座位が特定され、生物学的試料の１つまたは複数の座位での１つまたは複数の第１のアレルの第１の量、および／または１つまたは複数の第２のアレルの第２の量が測定され、また、この第１の量または第２の量から正規化パラメータが得られる。ヒストグラムのカウンターは、規定値の正規化パラメータを有する染色体の領域の数に基づいて増やされる。母親がホモ接合で、胎児の内の少なくとも１人がヘテロ接合である座位に対応するか、または母親がヘテロ接合で、胎児の内の少なくとも１人がホモ接合である座位に対応する染色体の領域が特定される。多成分混合モデルが特定された染色体の領域に対応するヒストグラムに適合する。多成分混合モデルは、複数の成分の各々に対する混合係数を含む。混合係数の内の少なくとも２つを使って、胎児の内の少なくとも２人が二卵性であるか否かが判定される。

別の実施形態では、少なくとも２人の胎児を宿す妊婦由来の生物学的試料中の胎児ＤＮＡパーセンテージの測定方法が提供される。複数の染色体の領域のそれぞれに対し、それぞれの染色体の領域中の１つまたは複数の座位が、生物学的試料中のそれぞれの第１のアレルおよびそれぞれの第２のアレルが検出される位置で特定され、生物学的試料中の１つまたは複数の座位で、１つまたは複数の第１のアレルの第１の量、および／または１つまたは複数の第２のアレルの第２の量が測定され、さらに、第１の量または第２の量の正規化パラメータが得られる。ヒストグラムのカウンターは、規定値の正規化パラメータを有する染色体の領域の数に基づいて増やされる。確率分布の線形結合がヒストグラムに適合し、この場合、胎児ＤＮＡパーセンテージは、確率分布の線形結合への入力である。入力胎児ＤＮＡパーセンテージを変えることにより、確率分布の線形結合のヒストグラムへのフィットを最適化できる最適胎児ＤＮＡパーセンテージが見つけられる。

他の実施形態は、本明細書記載の方法に関連するシステムおよびコンピュータ可読メディアに関する。

以下の詳細説明および付随する図を参照することにより、本発明の特質および利点のさらなる理解が得られるであろう。

図１は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を解析し、妊婦の胎児の内の少なくとも２人が二卵性であるか否かの判定をする方法１００を示すフローチャートである。図２Ａは、所与の染色体領域の２つの座位の親のハプロタイプがわかっている場合に、胎児の接合状態を決定する例を示す。図２Ａは、母親が２つの座位でホモ接合であり、父親がヘテロ接合である場合の例を示す。図２Ｂは、所与の染色体領域の２つの座位の親のハプロタイプがわかっている場合に、胎児の接合状態を決定する例を示す。図２Ｂは、母親が２つの座位でヘテロ接合であり父親がホモ接合である場合の例を示す。図３は、また、座位が４つの異なるアレルを有する場合のマイクロサテライト分析の例を示す。図４は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を解析し、妊婦の胎児の内の少なくとも２人が第１の染色体領域で遺伝的に異なるか否かの判定を行う方法４００を示すフローチャートである。図５は、第１の染色体領域に対する見かけのパラメータ比率（例えば、胎児ＤＮＡ濃度）を測定することにより、第１の親由来の第１の染色体領域で、妊婦の胎児の内の少なくとも２人が遺伝的に異なるか否かを判定する方法５００を示すフローチャートである。図６は、本発明の実施形態に従って、母体血漿中の胎児ＤＮＡ画分中の領域によるゲノム変異を使用して双胎妊娠の接合状態を明らかにする例である。図７は、本発明の実施形態に従って、母体血漿中の胎児ＤＮＡ画分中の領域によるゲノム変異を使用して双胎妊娠の接合状態を明らかにする例である。図８は、本発明の実施形態に従って、等量の胎児ＤＮＡを与える二卵性双生児に対する胎児ＤＮＡ濃度のヒストグラムの例を示す。図９は、２人の胎児が異なる量のＤＮＡを母体の血漿試料に与える場合の、ＳＮＰ分析に基づく胎児ＤＮＡ比率分布のヒストグラムを示す。図１０は、一組の二卵性双生児を宿している妊婦で、見かけの胎児ＤＮＡ濃度比率に与える組換えの効果の例を示す。図１１は、本発明の実施形態に従って、少なくとも２人の胎児を宿す妊婦由来の生物学的試料中の胎児ＤＮＡパーセンテージを測定し、胎児の内の少なくとも２人が二卵性であるか否かを判定する方法１１００を示すフローチャートである。図１２Ａは、本発明の実施形態に従って、演繹的ＳＮＰ分析の結果を示す表である。図１２Ｂは、本発明の実施形態に従って、演繹的ＳＮＰ分析の結果を示す表である。図１２Ｃは、本発明の実施形態に従って、演繹的ＳＮＰ分析の結果を示す表である。図１２Ｄは、本発明の実施形態に従って、演繹的ＳＮＰ分析の結果を示す表である。図１２Ｅ1は、本発明の実施形態に従って、演繹的ＳＮＰ分析の結果を示す表である。図１３は、二卵性妊娠に対する２つの異なるピークの特定を示す。図１４は、一卵性妊娠に対する１つのピークの特定を示す。図１５は、一卵性および二卵性双生児を宿す妊婦の異なる染色体領域に対する血漿中胎児ＤＮＡ濃度比率を示す。図１６は、一組の一卵性双生児の存在を仮定した、確率的変動レベルを測定するためのシミュレーション分析を示す。図１７は、本発明の実施形態に従って、３人の胎児（胎児Ａ、ＢおよびＣ）に対するいくつかの可能なピークを示すヒストグラムを示す。図１８は、本発明の実施形態によるシステムおよび方法で使用可能な例としてのコンピュータシステム１８００のブロックダイアグラムを示す。

定義
本明細書で使われる用語の「生物学的試料」は、対象（例えば、妊婦等のヒト）から採取される任意の試料を意味し、１つまたは複数の目的の核酸分子を含む。例には、血漿、唾液、胸水、汗、腹水、胆汁、尿、血清、膵液、糞便および子宮頸部スメア試料が含まれる。

用語の「核酸」または「ポリヌクレオチド」は、単鎖または二重鎖型のデオキシリボ核酸（ＤＮＡ）またはリボ核酸（ＲＮＡ）およびそれらのポリマーを意味する。特に制限されていなければ、この用語は、参照核酸と類似の結合特性を有し、天然ヌクレオチドに類似の方式で代謝される天然ヌクレオチドの既知の類似体を含む核酸を包含する。別段の記載がなければ、特定の核酸配列は、また、保存的に改変されたそれらの変異体（例えば、縮重コドン置換）、アレル、オーソログ、ＳＮＰ、および相補的配列を暗黙裏に包含し、また同様に明示的に示された配列も含む。具体的には、縮重コドン置換は、１つまたは複数の選択（または全ての）コドンの第３の位置が、混合塩基、および／またはデオキシイノシン残基で置換される配列を生成することにより実現できる（ＢａｔｚｅｒＭＡｅｔａｌ．、ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ１９９１；１９：５０８１；ＯｈｔｓｕｋａＥｅｔａｌ．、ＪＢｉｏｌＣｈｅｍ１９８５；２６０：２６０５−２６０８；およびＲｏｓｓｏｌｉｎｉＧＭｅｔａｌ．、ＭｏｌＣｅｌｌＰｒｏｂｅｓ１９９４；８：９１−９８）。用語の核酸は、遺伝子、ｃＤＮＡ、ｍＲＮＡ、小分子ノンコーディングＲＮＡ、マイクロＲＮＡ（ｍｉＲＮＡ）、Ｐｉｗｉ結合ＲＮＡ、および遺伝子または座位によりコードされる低分子ヘアピン型ＲＮＡ（ｓｈＲＮＡ）と同義に使用される。

用語の「遺伝子」は、ポリペプチド鎖または転写されたＲＮＡ産物の産生に関与するＤＮＡのセグメントを意味する。これは、コード領域（リーダーおよびトレーラー）前後の領域、ならびに各コードセグメント（エキソン）の間の介在配列（イントロン）を含んでもよい。

本明細書で使われる用語の「反応」は、目的の特定のポリヌクレオチド配列の存在または非存在を示す化学的、酵素的、または物理的作用を伴ういずれかのプロセスを意味する。「反応」の一例は、ポリメラーゼ連鎖反応（ＰＣＲ）等の増幅反応である。「反応」の別の例は、合成、連結反応、ハイブリダイゼーションまたは分解によるシーケンシング反応である。「情報価値の高い反応」は、１つまたは複数の目的の特定のポリヌクレオチド配列の存在を示す反応であり、唯一目的の配列のみが存在する場合もある。本明細書で使われる用語の「ウエル」は、限定された構造、例えば、ウエル形状のバイアル、小容器、ＰＣＲアレイ中の容器、乳剤中の液滴、粒子、ナノポアまたは表面上のある領域、の内の所定の部位での反応を意味する。

本明細書で使われる用語の「過剰出現核酸配列」は、生物学的試料中の２つの目的の配列（例えば、臨床的に関連する配列およびバックグラウンド配列）の間で、他の配列よりも多い存在量である核酸配列を意味する。

本明細書で使われる用語の「〜に基づく」は、「少なくとも一部は〜に基づく」を意味し、ある方法の入力およびその方法の出力の関係で発生するような、別の値の決定に使われるある値（または結果）を指す。本明細書で使われる用語の「誘導する」は、また、導出が式の計算である場合に発生するような、方法の入力およびその方法の出力の関係を指す。

本明細書で使われる用語の「定量データ」は、１つまたは複数の反応から得られ、１つまたは複数の数値を与えるデータを意味する。例えば、特定の配列に対する蛍光マーカーを示すウエルの数は、定量的データでありうる。

本明細書で使われる用語の「パラメータ」は、定量的データセット、および／または定量的データセット間の数値的関係を特徴付ける数値を意味する。例えば、第１の核酸配列の第１の量および第２の核酸配列の第２の量の間の比率（または比率の関数）は、パラメータである。

本明細書で使われる用語の「座位（ｌｏｃｕｓ）」またはその複数形「座位（ｌｏｃｉ）」は、ゲノム全域にわたり変化する、任意の長さのヌクレオチド（または塩基対）の位置またはアドレスである。用語の「アレル」は、同じ物理ゲノム座位の代替ＤＮＡ配列を意味し、異なる表現型形質を生じても生じなくてもよい。それぞれの染色体の２つのコピー（男性ヒト対象の性染色体を除く）を有するいずれの特定の二倍体生物体でも、各遺伝子に対する遺伝子型は、その座位に存在する一組のアレルを含み、それらは、ホモ接合体では同じで、ヘテロ接合体では異なる。典型的な例では、生物体の集団または種は、種々の個体の中の各座位で複数のアレルを含む。集団中に２つ以上のアレルが認められるゲノム座位は、多型部位と呼ばれる。ある座位でのアレル変異は、存在するアレルの数（すなわち、多型の程度）、または集団中のヘテロ接合体の比率（すなわち、ヘテロ接合割合）として測定可能である。座位は、配列を含むことも、配列を含まないことも可能なので、配列（例えば、遺伝子）の存在または非存在は、また、アレル変異の１つのタイプと見なされる。このような配列の非存在（例えば、ＲＨＤ遺伝子）は、通常は、欠失した配列の前後に存在する配列の結合により、特定できる。本明細書で使われる用語の「多型」は、その頻度に関係なく、ヒトゲノム中のいずれかの個体相互の変化を意味する。このような変化の例には、限定されないが、一塩基多型、単純タンデムリピート多型（ｓｉｍｐｌｅｔａｎｄｅｍｒｅｐｅａｔｐｏｌｙｍｏｒｐｈｉｓｍ）、挿入−欠失多型、変異（疾患の原因となりうる）およびコピー数変化、が含まれる。

本明細書で使われる用語の「ハプロタイプ」は、同じ染色体または染色体の領域上で一緒に移動される、複数の座位にあるアレルの組み合わせを意味する。ハプロタイプは、わずか一対の座位でも、染色体の領域でも、または全染色体であってもよい。「染色体の領域」は、特定の染色体の複数のヌクレオチド位置を指す。染色体の領域は、全染色体でも、より小さい区域であってもよい。正常な人では、染色体の領域は、領域を含む染色体の各コピーに対し１つずつの、２つのハプロタイプを持つ。２つのハプロタイプは、染色体の領域中で同じでも異なってもよい。

本明細書で使われる用語の「カットオフ値」は、生物学的試料の分類上の２つ以上の状態（例えば、疾患および非疾患）の間の判定を行うのに使用される数値を意味する。例えば、パラメータがカットオフ値よりも大きい場合は、定量データに対し第１の分類が適用され（例えば、疾患状態）；またはパラメータがカットオフ値より小さい場合は、定量データの異なる分類が適用される（例えば、非疾患状態）。

本明細書で使われる用語の「不均衡」は、臨床的に関連する核酸配列の量の参照量からの、少なくとも１つのカットオフ値により規定される何らかの大きな偏差を意味する。例えば、参照量は、３／５の比率であってもよく、従って、不均衡は、測定された比率が１：１の場合に発生することになる。

用語の「配列決定されたタグ」は、全てのまたは一部の核酸分子、例えば、ＤＮＡ断片から得られる配列を意味する。一実施形態では、例えば、約３０ｂｐの断片の一方の末端のみが配列決定される。配列決定されたタグは、次に、参照ゲノムに整列させることができる。あるいは、断片の両末端が配列決定されて２つの配列決定がなされたタグが生成でき、より高い正確さで整列化でき、また、断片の長さを与えることができる。さらに別の実施形態では、直鎖ＤＮＡ断片を、例えば、連結反応により環状化でき、連結反応部位をまたぐ部分が配列決定できる。

用語の「ユニバーサルシーケンシング（ｕｎｉｖｅｒｓａｌｓｅｑｕｅｎｃｉｎｇ）」は、アダプターが断片の末端に付加され、シーケンシング用プライマーがそのアダプターに付加されている場合のシーケンシングを意味する。従って、いずれの断片も同じプライマーを使って配列決定でき、シーケンシングをランダムに行うことができる。

本明細書で使われる用語の「分類」は、特定の試料の特性に関連する何らかの数字または他の文字（単語を含む）を指す。例えば、「＋」記号は、試料が欠失または増幅を有するとして分類されることを意味してもよい。用語の「カットオフ値」および「閾値」は、操作で使用される所定の数値を指す。例えば、カットオフサイズは、それを越える断片が排除されるサイズを指す。閾値は、それを越える、またはそれ未満の場合に、特定の分類が適用される値でありうる。これらの用語のどちらも、これらの文脈のいずれかで使用できる。

用語の「ヒストグラム」は、指定範囲内のいくつかのデータポイントの数を保持しているデータ構造を意味する。例えば、一連の値としてのパラメータ（例えば、胎児ＤＮＡパーセンテージ）を提示している染色体の領域の数のデータ構造。

用語の「最適な」は、数値的に１つまたは複数の他の値よりも良いと判断されるいずれかの値を意味する。例えば、最適値は、必ずしも最良の値ではなく、単に基準を満たすのみでよい（例えば、費用関数における前の値からの変化が許容範囲内である）。

発明の詳細な説明
胎児ＤＮＡは、妊婦の血漿および血清中に存在することが示されている（Ｌｏｅｔａｌ．Ｌａｎｃｅｔ１９９７；３５０：４８５−４８７；および米国特許第６，２５８，５４０号）。母体の血漿または血清中の胎児ＤＮＡの分析は、比較的に非侵襲的であり、母親の血液試料が必要なだけであるという利点がある。出生前検診用の従来の非侵襲的方法、例えば、超音波走査と比べて、母体の血漿または血清中の胎児ＤＮＡ検査は、胎児の遺伝情報の直接的評価を可能とするであろう。以降で、我々は、母体の血漿または血清（または他の生物学的試料）中のＤＮＡをどのようにして分析し、妊婦が一卵性または二卵性胎児（例えば、一組の一卵性または二卵性双生児）を宿しているか否かを識別する原理を説明する。

最初に、複数の染色体の領域を分析して胎児ゲノム間の差異のレベルを測定し、これを、胎児の接合状態に関する分類を行うために使用する。次に、我々は、複数の座位の２つの異なる父方のハプロタイプが既知で、母親がこれらの座位でホモ接合である場合（母親がヘテロ接合で、父親がホモ接合の例も、考察される）、特定の染色体の領域を分析し、胎児がその領域中で遺伝的に異なるかどうか（例えば、各双生児が異なる父方のハプロタイプを受け継いでいるかどうか）を判定する具体的な例を考察する。両親の遺伝子型情報が既知である場合の他の例、例えば、３つ以上の異なるアレルが特定の座位にある場合も、記載される。その後、見かけの胎児ＤＮＡ濃度の測定値の変化、または領域全体の他のパラメータの変動を比較および／または特定する技術が記載される。このような技術は、明確な母体の遺伝子型情報を使用してもよく、または胎児および母体のＤＮＡを含む生物学的試料、例えば、妊婦の血漿、の測定により母体の遺伝子型を推定してもよい。多胎児妊娠に対する演繹的技術もまた、説明される。

Ｉ．異なる染色体領域を使った接合状態の判定
一卵性胎児は、遺伝的に同じであるが、二卵性胎児は、遺伝的に異なる。遺伝的差異の程度は、同じ両親の家庭に生まれた他の妊娠での他の同胞と類似しているであろう。しかし、統計的確率に従って、二卵性胎児は、ゲノムの一部で同じ遺伝的配列を共有できる。

胎児は、通常、特定の染色体領域に対し、染色体の２つのコピーのそれぞれに１つずつ、２つのハプロタイプ（同じでも同じでなくてもよい）を有する。胎児が一卵性の場合は、胎児は、染色体領域中に同じ２つのハプロタイプを持つであろう。また、二卵性胎児は、所与の染色体領域で、統計的確率に従い同じ対のハプロタイプを持つことができる。実施形態は、複数の染色体領域を分析し、胎児が異なるハプロタイプを受け継いでいるか否かを検出でき、それにより、異なる領域のパーセンテージ（または他のパラメータ）を使って、胎児が一卵性であるか、二卵性であるかを判定できる。規定数の染色体領域を分析して所望の統計的有意性を得ることができる。

Ａ．方法
図１は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を分析して妊婦の胎児の内の少なくとも２人が二卵性であるか否かを判定する方法１００を示すフローチャートである。生物学的試料は、胎児および母体のＤＮＡを含む。例えば、妊婦由来の血漿を使用できる。方法１００は、本明細書記載のいずれかの方法で可能なように、コンピュータシステムを使って実施できる。

ステップ１１０では、生物学的試料中の複数の染色体領域のそれぞれに対し、１つまたは複数のアレルが、それぞれの染色体領域中の１つまたは複数のそれぞれの座位で測定される。生物学的試料中のＤＮＡは、種々の技術で分析でき、これらには、その座位の特定のアレルを測定するための、定量ポリメラーゼ連鎖反応（ＰＣＲ）、デジタルＰＣＲ、シーケンシング（例えば、サンガーシーケンシングおよび大量並列シーケンシング）、連結反応、ハイブリダイゼーションおよび質量分析（ＳｅｑｕｅｎｏｍＭａｓｓＡＲＲＡＹプラットフォーム、等）を含む。シーケンシングに向けて、シーケンシングの前に濃縮ステップを実施し、一連の特定の染色体領域由来のＤＮＡ断片の割合を増やすことができる。一実施形態では、このような濃縮ステップは、溶液相（例えば、ＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔプラットフォームを使って）、または固相（例えば、ＲｏｃｈｅＮｉｍｂｌｅＧｅｎプラットフォームを使って）ハイブリダイゼーションを使って行うことができる。測定ステップそれ自体は、いずれか１つまたは複数の上記技術から得られるデータを使って実現できる。例えば、配列決定されたタグを、参照ゲノムに配列させ、配列決定されたタグが得られた、対応するＤＮＡ断片の部位およびアレルを特定できる。生物学的試料中のＤＮＡを解析するのに使用できる１つの方法は、選択領域のデジタル解析（ＤＡＮＳＲ）と呼ばれる技術であり、これは、ハイブリダイゼーション、連結反応、増幅および大量並列シーケンシングを含む（ＳｐａｒｋｓＡＢｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２０１２；ｄｏｉ：１０．１０１６／ｊ．ａｊｏｇ．２０１２．０１．０３０）。

使用可能な大量並列シーケンシングプラットフォームの例には、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒプラットフォーム、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔａｎｄＩｏｎＰｒｏｔｏｎｓｙｓｔｅｍｓ、Ｒｏｃｈｅ４５４ｓｙｓｔｅｍ、ＨｅｌｉｃｏｓやＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ社の単分子シーケンシングシステム、またはナノポアをベースにしたシステム（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓのシステム）が含まれる。別の実施形態では、標的シーケンシングが行われ、この場合、選択されたゲノム領域（例えば、ＳＮＰまたはマイクロサテライト多型等の他のタイプの変異を含む領域）が補足または増幅され、その後、この補足または増幅された領域に対し、大量並列シーケンシングが優先的に行われる。一実施形態では、ＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔｓｙｓｔｅｍを使って標的シーケンシングが行われる（ＬｉａｏＧＪｅｔａｌ．ＣｌｉｎＣｈｅｍ２０１１；５７：９２−１０１）。標的シーケンシングは、また、ＲｏｃｈｅＮｉｍｂｌｅＧｅｎｓｙｓｔｅｍを使って行うこともできる。

デジタルＰＣＲを使って、母体の血漿中のＤＮＡ単分子の分析を行うことができる（ＶｏｇｅｌｓｔｅｉｎＢａｎｄＫｉｎｚｌｅｒＫＷ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１９９９；９６：９２３６−９２４１；ＬｏＹＭＤｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００７；１０４；１３１１６−１３１２１）。デジタルＰＣＲは、限定されないが、マイクロフルイディクス（ＬｕｎＦＭＦｅｔａｌ．ＣｌｉｎＣｈｅｍ２００８；５４：１６６４−１６７２）、ＲａｉｎＤａｎｃｅプラットフォーム（ＫｉｓｓＭＭｅｔａｌ．ＡｎａｌＣｈｅｍ２００８；８０：８９７５−８９８１）等のエマルジョンＰＣＲ（ＤｒｅｓｓｍａｎＤｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００３；１００：８８１７−８８２２）を含むいくつかのプラットフォーム使って行うことができる。

ステップ１２０では、測定されたアレルのそれぞれの量が決定される。例えば、試料中のＤＮＡ断片を（例えば、ユニバーサルシーケンシングを使って）配列決定し、配列決定されたタグ（これは、末端タグ対であってもよい）を得ることができ、配列決定されたタグを、参照ゲノムに整列させ、断片のゲノム位置を特定できる。母親および／または胎児のゲノムの座位に変異がある場合は、次に、その座位の別のアレルが測定されることになる。座位の各アレルに対応する断片のそれぞれの量は、追跡できる。特定の座位の特定のアレルのそれぞれの量は、断片の数または比率、同じ多型部位の異なるアレルの間の比率、マイクロアレイハイブリダイゼーションに対するシグナル強度、リアルタイムＰＣＲでの閾値サイクルの数、または閾値サイクルの差異、デジタルＰＣＲで測定したアレルの陽性反応の比率または数、および、質量分析のピーク高さ、等の種々の方法で測定できる。

ステップ１３０では、複数の染色体領域のそれぞれに対し、測定されたアレルのそれぞれの量に基づいて、それぞれの染色体領域の第１の親由来の異なるハプロタイプを胎児の内の２人が受け継いでいるか否かが判定される。１人の胎児が第１のハプロタイプを受け継ぎ、もう１人の胎児が異なるハプロタイプを受け継いでいる場合は、これは、二卵性の指標である。３人以上の胎児の場合は、一組は、同じハプロタイプを受けつぎ、別の組は異なるハプロタイプを受けつぐことが可能である。一実施形態では、異なるハプロタイプの継承は、１つまたは複数の座位のアレルの測定されたデータから推測可能である。例えば、演繹的方法を使って、下記に示すように、胎児のゲノムの差異を特定することができる。

別の実施形態では、片方または両方の親由来の遺伝子型情報が既知であってもよい。このような情報は、１つの座位のみからの測定値を使って異なるハプロタイプが第１の親から受け継がれている部位の判定を可能とする。例えば、親の第１の座位の３つの異なる遺伝子型がある場合、第１の座位だけを使って判定できる。しかし、座位に２つの遺伝子型しか存在しない場合は、別の座位の測定値が必要となろう。いくつかの例が以降で示される。

染色体領域で複数の座位が使われている場合は、その座位由来のデータは、種々の方法で組み合わせることができる。例えば、アレルが特定のハプロタイプと関連していることがわかっている場合は、特定の座位の特定のアレルを有する断片の数の計数は、実質上、特定のハプロタイプの断片の数の計数になる。例えば、第１の親（例えば、父親）の第１のハプロタイプに対応するいくつかの断片の数を、第１のハプロタイプのアレルおよび座位を有する断片の数を加え合わせることにより求めることができる。あるいは、測定を、それぞれの座位に対し独立に行うことができ、それぞれの座位の測定値の一致性を比較できる。

ステップ１４０では、胎児の内の少なくとも２人が第１の親由来の異なるハプロタイプを受け継いでいる染色体領域の第１の量が求められる。第１の量は、単に胎児間で差異を有すると特定されている染色体領域の数であってもよい。別の例のように、第１の量は、胎児間で差異を有すると特定されている染色体領域の割合であってもよい。

ステップ１５０では、第１の量が１つまたは複数のカットオフ値と比較され、２人の胎児が一卵性であるか二卵性であるかが決定される。例えば、第１の量は、１０％等のパーセンテージ（または他の比率）であってもよく、この量は、カットオフ値と比較でき、５％を越える場合は二卵性に分類される。カットオフ値は、所望の正確さ、ステップ１３０での判定の正確さ、使った染色体領域の数、ならびに集団中の異なる染色体領域の結合不均衡および分析した異なる染色体領域間の組換え確率に基づいて決定できる。これらについては次のセクションで記述する。一態様では、３人以上の胎児が存在する場合、決定は、一組が二卵性であることのみが可能であり、従って、別の組が一卵性である可能性を残す。

Ｂ．ハプロタイプ検出に対する統計的分析
上述のように、染色体領域の親由来の両方のハプロタイプ（すなわち、異なる場合）の継承は、双生児が一卵性ではなく二卵性であることを示す。例えば、染色体領域の第１の座位での父方の両方のハプロタイプの検出は、その組の双生児が二卵性であることを示すであろう。しかし、母体の血漿試料中の染色体領域で父方の１つのみのハプロタイプの検出に対しては、いくつかの説明が可能である。

第１に、２人の胎児は、染色体領域で父親由来の同じ父方のハプロタイプを単に偶然に受け継ぐ場合がある。それらが一組の一卵性双生児である場合は、全ゲノム領域にわたり、父親由来の同じ父方のハプロタイプを常に受け継いでいるであろう。しかし、たとえそれらが二卵性双生児であるにしても、いずれの特定の領域に対しても、父親由来の同じ父方のハプロタイプを受け継ぐ５０％の確率がある。しかし、その１組の二卵性双生児が同じ父方のハプロタイプを全ゲノム領域にわたり受け継ぐ可能性はほとんど無いであろう。

別のシナリオでは、２人の二卵性双生児胎児は、異なる父方のハプロタイプを受け継いでいる可能性があるが、不適切なサンプリングが原因で、特定の分析により１つの父方のハプロタイプのみが検出される。これらの種々のシナリオの発生する確率は、特定の染色体領域に対し分析される母体血漿試料中の胎児ＤＮＡ濃度比率および母体血漿ＤＮＡ分子の数に依存する。以下に我々は、染色体領域に対応するどのくらい多くの分子およびどのくらい多くの染色体領域を使って、充分な統計的検出力を有するロバストな分類に到達し、不適切なサンプリングが原因の誤ったハプロタイプ解釈の確率を最小限にすることができるかに関する計算を提供する。

特定の染色体領域に対応する分析に必要な分子の数は、下記の方式で決定できる。母体血漿中に父方のハプロタイプが存在する場合、特定の母体血漿ＤＮＡ試料中でそれを検出する確率は、その父方のハプロタイプを持つ胎児ＤＮＡ濃度比率および分析される分子の合計数に依存し、ポアソン分布に従う。

表１は、母体血漿中に存在する父方のハプロタイプを有するが、特定の試料中で検出されない確率が１％未満であるような、分析に必要な染色体の対象領域に対応する分子の数を示す。この表は、次の式：０．０１＞ｅｘｐ（−Ｎｘｆ／２）、に基づいて計算される。式中、Ｎは、分析に必要な分子の数；ｆは、ただ１組の双生児胎児により与えられる胎児ＤＮＡ濃度比率；およびｅｘｐは指数関数である。分子の数は、染色体領域を分析するのに使用されるいずれかの座位でのＤＮＡ断片の数である。父方のハプロタイプ検出の所望の確実性を得るために、分析に必要な分子の数は、染色体領域中の１つの座位を表１に示す数まで測定することにより得ることができる。あるいは、同じ染色体領域中のいくつかの座位を分析する場合は、座位当たりの分析に必要な分子の数は、座位の数と、座位当たり分析される分子の平均数の積が表１の分子数に達する程度まで減らすことが可能であろう。

分析に必要な染色体領域の数も、決定できる。染色体領域は、結合不均衡ではないと仮定して、２人の二卵性双生児が異なる父方のハプロタイプを受け継いでいる確率は、それぞれの異なる染色体領域に対し、５０％となるであろう。染色体領域の数をｎとすると、これらのｎ染色体領域のそれぞれに対し、１組の二卵性双生児が同じ父方のハプロタイプを受け継いでいる確率は、２^-nとなるであろう。従って、７つの独立した染色体領域分析される場合、それぞれの７領域に対し、１組の二卵性双生児が同じ父方のハプロタイプを受け継いでいる確率は、１％未満であろう。この場合、ステップ１４０のカットオフを、１４％とすると、７つの領域の内の異なる遺伝性ハプロタイプを示す１つの領域は、二卵性の分類が割り当てられるであろう。１つの領域の絶対値もまた、使用可能である。多数の領域（例えば、５０または１００）を使用する場合は、受け継がれた異なるハプロタイプを示す１つまたは複数の領域が許容されうるが、その場合でもまだ一卵性の分類が割り当てられる。

ＩＩ．親の遺伝子型を使った胎児ハプロタイプの特定
上述のように、染色体領域の１つまたは複数の座位での親遺伝子型を使って、２人の胎児が親由来の異なるハプロタイプを受け継いでいるか否かを判定するのを支援できる。例えば、双生児妊娠の妊婦から採取された母体血漿試料中の同じゲノム領域に対応する２つの異なる父方のハプロタイプの検出を使うことができる。下記の分析は、２つの異なる父方のハプロタイプの検出に基づく試料に注目しているが、技術のアレンジにより、２つの異なる母方ハプロタイプへの適用も可能である。

ａ．２つの座位でのＳＮＰ分析
図２Ａは２つの異なる座位に対し母親の遺伝子型がわかっており、所与の染色体領域に対し父親のハプロタイプが解っている場合の、接合状態を判定する例を示す。この実施形態は、双生児の母親妊婦がホモ接合で、双生の父親がヘテロ接合であるＳＮＰ座位に注目している。図２Ａに示す例では、母親は、ＳＮＰ座位１および２でホモ接合であり、それぞれ遺伝子型ＡＡおよびＴＴである。父親はＳＮＰ座位１および２でヘテロ接合であり、それぞれ遺伝子型ＡＣおよびＧＴである。

座位１および２は、接近している、すなわち、組換えが起こりそうもない（例えば、２つの座位間で組換え発生確率＜０．１％）と仮定して、２つの座位のアレルは、胎児により一緒に受け継がれ、ハプロタイプを形成するであろう。母親は座位１および座位２の両方でホモ接合であるので、母親は２つの同じハプロタイプを持つ。我々は、これらの同じ母体のハプロタイプをＨａｐＩおよびＨａｐＩＩと定義する。他方、父親は、２つの異なるハプロタイプを有し、我々は、図２Ａに示すように、それらをＨａｐＩＩＩおよびＩＶと定義する。

妊婦が一組の一卵性双生児を宿している場合、２人の胎児の遺伝的構成は、同じであろう。換言すれば、２つの父方のハプロタイプの１つのみが、これらの２人の双生児胎児により受け継がれるであろう。図示した例では、両方の胎児が父親由来のＨａｐＩＩＩを受け継いでいる。

母体血漿試料が分析される場合、座位１でアレルＡのみが検出されるであろう。理由は、母親および両方の胎児がアレルＡに関しホモ接合であるからである。分析された座位１に対応する分子の数が充分に大きい場合、母体血漿中のＣアレルの非存在は、胎児のどちらもＨａｐＩＶを父親から受け継いでいないことを示す。分析に必要な分子の数は、例えば、表１に示すように、母体血漿試料中のＣアレルの存在の除外に必要な母体血漿ＤＮＡ試料中の胎児ＤＮＡ濃度比率および統計的検出力に依存するであろう。

他方、ＴおよびＧアレルの両方は、母体血漿試料中の座位２で検出されるであろう。母親がＴアレルに対しホモ接合のであるので、これは、胎児の内の少なくとも１人が父親由来のＨａｐＩＩＩを受け継いでいることを示す。座位１および座位２由来の情報をまとめると、両方の胎児が父親由来のＨａｐＩＩＩを受け継いでいる可能性がある。

二卵性双生児の状況では、２人の双生児胎児は、父親由来の異なるハプロタイプを受け継いでいる可能性がある。図２Ａの例では、双生児１は、ＨａｐＩＩＩを受け継いでおり、双生児２は、父親由来のＨａｐＩＶを受け継いでいる可能性がある。従って、母体血漿中では、ＡおよびＣアレルの両方が座位１で検出される可能性があり、ＧおよびＴアレルの両方が、座位２で検出される可能性がある。座位のアレルの検出は、定量化され、検出が不正確ではない（例えば、分析誤差が原因で、特定のタイプの１つか２つのアレルのみが測定される）ことを保証できる。例えば、特定のタイプのアレルの数が、測定され、閾値と比較でき、特定のアレルの統計的に有意な量が測定されていることが保証される。カットオフは、試料の測定値の数（例えば、特定の座位に対し測定されたアレルの数）に基づいて変更できる。例えば、ある座位に対し１，０００アレルが測定された場合、閾値は、その座位で１００アレルのみが測定された場合よりも大きくできる。従って、測定量が閾値を超える場合は、アレルが検出されていると見なすことができる。

これらの知見は、父方のＨａｐＩＩＩおよびＨａｐＩＶの両方が、母体血漿中に存在していることを示す。それぞれの胎児は、父親由来の１つのハプロタイプを受け継ぐことのみが可能であるから、これらの知見は、２人の胎児が父親由来の異なるハプロタイプを受け継ぎ、従って、２人の胎児は遺伝的に異なることをさらに示す。従って、例えば、この染色体領域または他の染色体領域由来のデータと組み合わせて使うだけで、２人の胎児は、座位１および２を含む染色体領域に対し異なるハプロタイプを受け継いでいると特定でき、そのため、２人の胎児は、一組の二卵性双生児であると判断できる。

従って、第１の親が父親の場合、第１の親の２つのハプロタイプは、第１の染色体領域に対し、複数の座位で決定できる。例えば、ＨａｐＩＩＩおよびＨａｐＩＶが、特定の染色体領域に対し決定できる。胎児の内の２人が第１の親由来の第１の染色体領域の異なるハプロタイプを受け継いでいるという判定は、以下のように進めることができる。第１の座位および第２の座位（例えば、座位１および座位２）は、第１の親がヘテロ接合である第１の染色体領域中で特定でき、座位１および座位２の父性的に特有のアレル（すなわち、母体のゲノム中には現れない）は、同じ父方のハプロタイプ上には存在しない。

統計的に有意な量の第１の座位の第１の親の第１のハプロタイプが、生物学的試料中で検出できる。上述のように、母親が第１のアレル（座位１のＡ）に対しホモ接合であり、父親が第１のハプロタイプ上の第２のアレル（座位１のＨａｐＩＶ）を有するヘテロ接合である場合に、これが実現される。第２のアレル（座位１のＣ）を有するＤＮＡ断片の数を検出し、カットオフ値（閾値）と比較して、統計的に有意な量の第１のハプロタイプが検出されているか否かを判定できる。第２のアレルを含むＤＮＡ断片の数（第２のアレルの測定量の１例）は、そのままで（例えば、カットオフは絶対数でもよい）で、または正規化して（例えば、カットオフは、比率であってもよい）使用できる。

次に、第２の座位の第１の親の第２のハプロタイプの統計的に有意な量が、生物学的試料中で検出できる。上述のように、第３のアレル（座位２のＴ）に対し母親がホモ接合で、父親が第２のハプロタイプ上の第４のアレル（座位１のＧ）を有するヘテロ接合（座位２のＨａｐＩＩＩ）である場合にこれが実現できる。第４のアレル（座位１のＧ）を有するＤＮＡ断片の数を検出し、カットオフ値（閾値）と比較して、統計的に有意な量の第１のハプロタイプが検出されているか否かを判定できる。第３および第４のアレルは、再度ＡおよびＣであってもよいが、ＨａｐＩＩＩ上のＣを伴うことに留意されたい。

従って、一実施形態では、ある染色体領域に対し、第１の親の第１のハプロタイプが、いずれかの胎児により受け継がれているか否かを判定できる。第１のハプロタイプが受け継がれている場合は、その染色体領域に対し、第１の親の第２のハプロタイプがいずれかの胎児により受け継がれているか否かが判定される。その染色体領域に対し第２のハプロタイプもまた受け継がれている場合は、胎児は、二卵性に分類される。上記の考察は第１の親が父親であった場合の１つの例を提供したが、以降で、第１の親が母親である場合の１つの例を提供する。

また、２つの母体のハプロタイプの定量分析を使って、２人の胎児が一卵性であるか、二卵性であるかの判定をすることができる。図２Ｂは、父親の２つの異なる座位での遺伝子型および所与の染色体領域に対する母親のハプロタイプが解っている場合に、接合状態を決定する１つの例を示す。２人の胎児が一卵性であるシナリオでは、２人の胎児は、全ての染色体領域に対し同じ母体のハプロタイプを受け継いでいるであろう。胎児に受け継がれているハプロタイプは、母体血漿中により高濃度で存在する可能性がある。２つの母体ハプロタイプの濃度の差異は、母体血漿中の胎児ＤＮＡ濃度比率に比例する。これは、２０％胎児ＤＮＡ濃度に比例する差異により、ＢアレルよりもＡアレルが高頻度に発生する座位１に関して、図２Ｂに示されている。座位２に関しては、アレルＢに対し父親がホモ接合であるために、等量のアレルＡおよびアレルＢが存在する。胎児が、等しくないパーセンテージの胎児ＤＮＡを与える場合は、座位１でのアレルＢに対するアレルＡの比率は、合計胎児ＤＮＡパーセンテージ（すなわち、個別胎児ＤＮＡパーセンテージの合計）に依存するであろう。胎児が等しくないパーセンテージの胎児ＤＮＡを与える場合は、座位１のアレルＢに対するアレルＡの比率は、合計胎児ＤＮＡ濃度比率（すなわち、個別胎児ＤＮＡ濃度比率または胎児ＤＮＡパーセンテージの合計）に正の相関を持つであろう。本発明では、用語の胎児ＤＮＡ濃度比率および胎児ＤＮＡパーセンテージは、同義に使用される。

他方、２人の胎児が二卵性である場合は、２人の胎児は、いずれかの染色体領域で異なる母体のハプロタイプを受け継いでいる可能性がある。２人の胎児が特定の染色体領域で異なる母体のハプロタイプを受け継いでいる場合は、２つの母体のハプロタイプは、母体血漿中に等量で存在するであろう。従って、１つまたは複数の染色体領域で２つの母体ハプロタイプの等しい出現は、一組の二卵性双生児の存在を示すのに使用できる可能性がある。この等しい出現は、座位１および座位２の両方に対し、アレルＡおよびＢの間の同じ差異として顕在化するが、過剰出現アレルは異なる。過剰出現アレルは、異なるハプロタイプ由来であるという事実を使って、胎児が母親の特定された異なるハプロタイプを有することを識別できる。過剰出現の程度は、合計胎児ＤＮＡパーセンテージの半分（示されているように１０％）であることに留意されたい。このような現象は、後程さらに詳細に考察される。胎児が等しくないパーセンテージの胎児ＤＮＡを与える場合は、座位１のアレルＢに対するアレルＡの比率は、双生児１により与えられる胎児ＤＮＡパーセンテージに依存し、座位２のアレルＢに対するアレルＡの比率は、双生児２により与えられる胎児ＤＮＡパーセンテージに依存するであろう。ＨａｐＩ上のアレルは、両方の座位で同じである必要はないことに留意されたい。

従って、母体のハプロタイプが第１の座位および第２の座位でわかっている場合、検出対象の母親の異なるハプロタイプを検出できる方法がある。図２Ｂに示すように、父親が、第１の座位の第１のアレル（図中のＡ）に対しホモ接合であり、母親が、第１の座位の第１のアレルおよび第２のアレル（図中のＢ）に対しヘテロ接合である。第１のアレルは、母親の第１のハプロタイプ（ＨａｐＩ）上にあり、第２のアレルは、第２のハプロタイプ（ＨａｐＩＩ）上にある。第１の座位の第１の親の第１のハプロタイプの検出には、第１の座位で測定されたそれぞれの量の第１のアレルが、第２の座位で測定されたそれぞれの量の第２のアレルよりも統計的に有意な量だけ大きいことの判定を含むことができる。これは、１１０：９０の比率で示される。一実施態様では、カットオフ値を使って、その値間の差異が統計的に有意であることを保証することができる。

第２の座位に対しては、父親が第２の座位の第３のアレル（Ｂで示されるが、Ａを含むいずれのアレルでもよい）に対してホモ接合であり、母親が第１の座位の第３のアレルおよび第４のアレル（Ａで示す）に対し、ヘテロ接合である。第３のアレルは、母親の第１のハプロタイプ上にあり、第４のアレルは、第２のハプロタイプ上にある。生物学的試料中の第２の座位の第１の親の第２のハプロタイプの検出には、第２の座位で測定されたそれぞれの量の第４のアレルが、第２の座位で測定されたそれぞれの量の第３のアレルよりも統計的に有意な量だけ大きいことを判定することを含むことができる。

ｂ．他のタイプの多型に対する分析
上記の例は、ある染色体領域に対し、異なるハプロタイプが第１の親から引き継がれているか否かを判定するために使われる座位で、異なるヌクレオチドを含んでいた。しかし、ＳＮＰ以外の多型も、異なる父方のハプロタイプのマーカーとして使用可能である。他のタイプの多型の例には、限定されないが、マイクロサテライト、制限断片長多型、挿入／欠失多型、およびコピー数多型（ＣＮＶ）が含まれる。このような他の多型は、図２Ａおよび２Ｂの構成を生じうるが、この場合、第１のアレルおよび第２のアレルは、これらの他の多型の１つから生ずる。いずれの多型に対しても、また、３つ以上のアレルが存在しうる。一例を下記に示す。

図３は、また、座位が４つの異なるアレルを有する場合のマイクロサテライト分析の一例を示す。マイクロサテライトは、ゲノム中の可変数の短いタンデム反復（ＳＴＲ）を含む多型性の領域である。この例では、母親は、このマイクロサテライト領域に対し、２つの異なるアレル、すなわち、４および７反復から成るそれぞれアレルＩおよびアレルＩＩを有する。父親もまた、２つのアレル、すなわち、５および８反復から成るそれぞれアレルＩＩＩおよびアレルＩＶを有する。従って、座位は、事実上、親中の４つの異なるアレルを有する。

一組の一卵性双生児の遺伝的構成は同一であると思われるので、それらは同じ父方のアレルを受け継いでいるであろう。結果として、１つのみの父方のアレルが母体血漿中で検出できる。この例では、５反復を有する父方のアレルＩＩＩのみが、４反復を有する母体のアレルＩと一緒に、母体血漿試料中で検出されるであろう。所与の染色体領域に対し、複数の座位が分析され、それぞれの座位に対し、ただ１つの父方のアレルが母体血漿試料中で検出可能である場合、上述のように、双生児が一卵性である確率を統計的に決定可能であろう。

他方、その一組の双生児が二卵性である場合、２人の双生児胎児は、異なる父方のアレルを受け継ぐことができる。図３に例示されているように、二卵性双生児の１人が、父親由来のアレルＩＩＩを受け継ぎ、もう１人が、アレルＩＶを受け継ぐ。結果として、両方の父方のアレルが、例えば、上述の検出方法により、母体血漿試料中で検出可能である。換言すれば、両方の父方のアレルが母体血漿試料中で同時に検出できる場合は、胎児が染色体異常（例えば、胎児が、その座位でトリソミーである）を持たない限り、双生児胎児は、二卵性であろう。母親がその座位で、例えば、反復数４（またはいずれかの他のアレルの多型）に対し、ホモ接合である場合、類似の分析を行うことができる。

従って、多型が３つ以上のアレルを有する状況では、両方共妊婦のゲノム中には存在しない２つの父方から受け継いでいるアレルが母体血漿中で検出される場合は、二卵性双生児妊娠を検出可能である。一実施形態では、母体血漿中のこのような遺伝子型パターンは、双生児妊娠の存在の超音波による証拠により支持されうるであろう。このような超音波による双生児妊娠の証拠がない場合には、このような血漿遺伝子型パターンは、トリソミー胎児の存在を示すと思われる（ＧｈａｎｔａＳｅｔａｌ．ＰＬｏＳＯＮＥ２０１０；５：ｅ１３１８４）。

ＩＩＩ．ゲノム領域の変異の特定
前のセクションでは、染色体領域の異なるハプロタイプが第１の親から受け継がれているか否かを判定する技術の例を記載した。このような例では、親遺伝子型情報は、両親に関し既知であり、分析に使用された。下記の説明では、親の遺伝子型は、使用することができるが必要ではない。例えば、胎児ＤＮＡ濃度（または他のパラメータ）は、二卵性胎児に対し、種々の座位で異なる値を示すであろう。

Ａ．一般的方法
図４は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を分析し、妊婦の胎児の内の少なくとも２人が第１の染色体領域に関し遺伝的に異なるか否かの判定をする方法４００を示すフローチャートである。他の方法と同様に、生物学的試料は、胎児および母体のＤＮＡを含む。方法４００は、方法１００のステップ１３０を実行するために使用できる。

ステップ４１０では、妊婦の遺伝子型が、第１の染色体領域内の１つまたは複数の第１の座位のそれぞれで決定される。第１の座位は、妊婦が、１つまたは複数の第１の座位のそれぞれでホモ接合であるか、または１つまたは複数の第１の座位のそれぞれでヘテロ接合であるような座位である。従って、それぞれの第１の座位は、母体の遺伝子型に関し同じカテゴリー（すなわち、ホモ接合またはヘテロ接合）である。遺伝子型は、種々の方法で決定できる。例えば、妊婦の全血由来の主に母体のＤＮＡのみが存在するバフィーコートまたは細胞ペレットレイヤー、または他の母体のみの試料を分析できる。標準的遺伝子型技術を使用できる。別の例として、遺伝子型は、胎児および母体のＤＮＡを含む生物学的試料の分析から推定できる（このような技術は、下記でさらに詳細に説明される）。

それぞれの第１の座位は、主要アレルおよび副次的アレルを示し、すなわち、生物学的試料は、それぞれの座位に対し、主要アレルおよび副次的アレルを含む。母親が第１の座位でホモ接合である場合は、副次的アレルは、胎児の内の少なくとも１人から与えられる。このような状況では、それぞれの座位は、主要アレルおよび副次的アレルを有し、主要アレルは、副次的アレルよりも量が多い。母親がヘテロ接合で、胎児の内の少なくとも１人がホモ接合の場合、主要アレルは、また、副次的アレルより量が多い。しかし、母親がヘテロ接合で、胎児の全ても、ヘテロ接合である（同じアレルに対し）場合は、主要アレルも、副次的アレルも、どちらも量的に他方より多いことはない。各座位が主要アレルおよび副次的アレルを有するという事実は、種々の方法で、例えば、アレルを検出することにより（ステップ４２０参照）または親遺伝子型を知ること（演繹的または系統的）により、測定できる。

ステップ４２０では、それぞれの第１の座位のそれぞれの主要アレルおよび／またはそれぞれの副次的アレルが、生物学的試料中で検出できる。主要アレルのみ、または副次的アレルのみが検出される場合の実施形態では、親遺伝子型に関するいくつかの情報を介して、他のアレルの存在を知ることができる。例えば、副次的アレルＢが検出され、母親がある座位の主要アレルＡに対しホモ接合であることがわかっている場合は、生物学的試料がその座位で２つのアレルを有することが決定できる。このような１つの例は、母親がＲｈＤ陰性（従って、ＲＨＤ遺伝子の非存在により表されるアレルに対するホモ接合）であり、ＲＨＤ遺伝子が生物学的試料中で検出される場合である。それぞれの座位の両方のアレルもまた、検出される。

主要および副次的アレルがある座位に存在することがわかっている場合は、胎児遺伝子型は、実質上類似のカテゴリーにあると特定できる。例えば、母親が、その座位の１つでアレルＡに対しホモ接合である場合、アレルＡは、主要アレルであろう。さらに、副次的アレルＢが検出されることから、胎児の内の少なくとも１人がヘテロ接合であることがわかる。従って、全ての第１の座位は、カテゴリーＡＡ_ABに入るであろう。ここで下付文字は胎児の内の少なくとも１人がヘテロ接合であることを示す。母親がヘテロ接合のＡＢで、胎児の内の少なくとも１人がホモ接合のＡＡである場合の一例では、Ｂが、再度、副次的アレルで、Ａが主要アレルであろう。この場合では、全ての第１の座位は、カテゴリーＡＢ_AAに属し、下付文字は胎児の内の少なくとも１人がホモ接合であることを示す。

ステップ４３０では、第１の量の１つまたは複数の主要アレルおよび／または第２の量の１つまたは複数の副次的アレルが生物学的試料中の１つまたは複数の座位で測定される。各座位は、異なる主要アレルを持つことができるが、それぞれの主要アレルの量は、組み合わせて（例えば、合算して）、第１の量を得ることができる。同じことは、第２の量に対しても行うことができる。一実施形態では、第１の量のみが決定される。別の実施形態では、第２の量のみが決定される。さらに別の実施形態では、第１と第２の量の両方が決定される。ステップ４２０および４３０は、同時に達成でき、従って、実質的に同じステップでありうる。

ステップ４４０では、第１の量または第２の量に対する正規化パラメータが得られる。一実施形態では、正規化パラメータは、第１の領域に対する比率のパラメータ値（例えば、胎児ＤＮＡ濃度比率）を計算することにより得られる。この場合、比率は、第２の量に対する第１の量の比率である。一態様では、第１の染色体領域で２人の胎児が遺伝的に異なる（例えば、１人のみがヘテロ接合）場合、実際の胎児ＤＮＡ濃度とは異なる可能性があるために、胎児ＤＮＡ濃度比率は、見かけの値である。別の実施形態では、正規化パラメータは、検量方式、すなわち、期待値と同じ、またはそれに相関した方式で得られる。これに関しては下記で説明される。相関方式は、一定の差異または比率（例えば、１つの技術は、別の技術の値の１．２倍の値を常に与える）の再現性のよい値を提供する、または、ひとつの技術から得られた結果を別の技術の期待値に変える変換曲線が存在するいずれの方法であってもよい。従って、正規化パラメータは、それが較正方式で得られる場合は、単に、第１の量（または、第２の量）であってもよい。

正規化パラメータは、また、別の染色体領域内の１つまたは複数の座位由来の第３の量の１つまたは複数の他の配列（例えば、アレルまたはホモ接合配列）を計算することにより決定でき、第３の量を使って第１の量または第２の量を正規化できる。このような正規化（ならびに他のタイプの正規化）は、他の領域に対し異なる技術または非較正技術を使って計算された量の比較を可能とする。較正された技術では、第１の量または第２の量を他の領域由来の測定値と比較できる。第１の量または第２の量の使用により、同じ情報を伝達できる。

ステップ４５０では、胎児が第１の染色体領域で遺伝的に同じである場合、正規化パラメータがカットオフ値と比較され、正規化パラメータが期待値と統計的に異なるか否かが判定される。例えば、１人のみの胎児がヘテロ接合である場合、全ての胎児がヘテロ接合であるか、またはホモ接合である場合の数に比べて、副次的アレルの数は異なるであろう。期待値（例えば、胎児ＤＮＡ濃度）は、例えば、他の染色体領域由来の生物学的試料の測定値から、染色体Ｙ配列の量を定量して、または１つまたは複数のエピジェネティックマーカーを使って、得ることができる。これについては、下記でより詳細に説明される。他の期待値は、胎児ＤＮＡ濃度のこのような測定値から得ることができ、または直接測定でき、従って、期待値は、胎児ＤＮＡ濃度期待値に限定されない。

カットオフ値は、所望の正確さに基づき選択できる。例えば、期待値の測定値の標準偏差を知ることができる。この場合、カットオフは、期待値マイナス（または、場合によってはプラス）標準偏差（ＳＤ）の３倍になるように選択できる。この方式の実施形態では、正規化パラメータの期待値との差異（または、１からの比率の偏差）が、カットオフ値との関係に基づいて統計的に有意であることを判定できる。他の実施形態では、カットオフは、２．０、２．５、３．５、または４ＳＤであってもよい。

ステップ４６０では、カットオフ値に対する正規化パラメータの比較に基づいて、妊婦の２人の胎児が二卵性であるか否かが判定される。例えば、正規化パラメータが統計的に期待値と異なる場合は、妊婦の２人の胎児が第１の染色体領域で遺伝的に異なることが判定できる。正規化パラメータが統計的に期待値と異ならない場合は、胎児は、一卵性であると判定できる。染色体領域のこのような測定を例えば、上述のステップ１５０のためのような接合状態の決定用の、他の染色体領域の測定由来の測定値と組み合わせることができる。あるいは、第１の染色体領域で同じでない２人の胎児の測定により、他の染色体領域の測定値がなくとも、二卵性の分類を付与することができる。

Ｂ．見かけの比率パラメータ（胎児ＤＮＡ濃度）
上述のように、ステップ４４０での正規化パラメータは、第１の量および第２の量を含む比率値であってもよい。図５は、第１の染色体領域の見かけの比率パラメータ（例えば、胎児ＤＮＡ濃度）を決定することにより、妊婦の胎児の内の少なくとも２人が、第１の親由来の第１の染色体領域で遺伝的に異なるか否かを判定する方法５００を示すフローチャートである。方法５００は、方法４００と同様に、多胎児を宿す妊婦の生物学的試料を分析する。方法５００は、母親が第１の座位でホモ接合である状況に対し説明されているが、この方法は、母親がヘテロ接合の場合の座位に対しても同様に適用できる。

ステップ５１０では、妊婦がホモ接合で、胎児の内の少なくとも１人がヘテロ接合である第１の染色体領域内の１つまたは複数の座位が特定される。このような状況下で、各座位は、主要アレルおよび副次的アレルを有し、主要アレルは副次的アレルより量が多いであろう。例えば、母親がアレルＡに対しホモ接合の場合、アレルＡは、主要アレルであろう。あるいは、妊婦がヘテロ接合で、胎児の内の少なくとも１人がホモ接合である１つまたは複数の座位が特定でき、この場合、胎児に対しホモ接合のアレルが主要アレルであろう。

このような座位は、ステップ１１０のような測定ステップから得られるアレルを分析することにより特定できる。例えば、特定の座位のアレルの測定により、大部分がアレルＡ（主要アレル）で、例えば、７０％超であり、唯一の他のアレル（例えば、Ｔ）が有意な量で計数されることを示すことができる。このような測定により、母親がアレルＡに対しホモ接合で、提示の内の少なくとも１人がアレルＴに対しヘテロ接合であることを示すことができる。異なるカットオフ値（例えば、より高い副次的アレル比率）を使って、母親がヘテロ接合で、胎児の内の少なくとも１人がホモ接合であるかどうかを判定できる。座位が上記条件を満たすか否かを判定するための種々のカットオフ値が、仮定または測定された胎児ＤＮＡ濃度に基づいて決定できる。米国特許出願第１２／９４０，９９３号は、このような技術を１人の胎児を宿す妊娠に対し、より詳細に説明している。以下のセクションで、多胎児妊娠における座位に対し遺伝子型情報を得るためのさらに複雑な方法を提供する。

ステップ５２０では、１つまたは複数の主要アレルの第１の量ｑが、生物学的試料中の１つまたは複数の座位で測定される。各座位は、異なる主要アレルを持つことができるが、各主要アレルの量を、組み合わせて（例えば、合算して）、第１の量を得ることができる。この方式では、複数の座位が使用されるため、染色体領域に対する分析の読み深度が基本的に拡大する。例えば、限られた量のアレルが各座位で測定可能であるが、座位全体として考えると、統計的ロバスト性を得るのに充分な数のアレルが測定できている。染色体領域内の座位は、座位間の組換えの確率が低く、例えば、１％未満になるように選択できる。

ステップ５３０では、１つまたは複数の副次的アレルの第２の量ｐが、生物学的試料中の１つまたは複数の座位で測定される。類似の方式で、各座位は、異なる副次的アレルを持つことができるが、各副次的アレルの量は、組み合わせて（例えば、合算されて）、第２の量を得ることができる。副次的アレルは、座位の間の異なるハプロタイプから生じることも可能である。

ステップ５４０では、第１の量および第２の量から第１のパラメータが決定される。第１のパラメータは、第１の量および第２の量の間の相対量を提供する。例えば、第１のパラメータは、Ｆ＝２ｐ／（ｐ＋ｑ）として計算される胎児ＤＮＡ濃度比率Ｆの値であってもよい。他の例には、２つの量の何らかの比率、第１の量の関数の比率、またはこのような比率の関数が含まれる。別の例は、２つの量の差異で、正規化されてもよい。

ステップ５５０では、第１の染色体領域で２人の胎児が遺伝的に同じである場合、第１のパラメータがカットオフ値に対し比較され、第１のパラメータが統計的に期待値と異なるかどうかが判定される。例えば、両方の胎児が、第１の染色体領域中の座位で主要および副次的アレルに対しヘテロ接合である場合、第１のパラメータは、上式が使用される場合、合計胎児ＤＮＡ濃度に等しくなければならない。しかし、また、胎児の１人が、その座位でホモ接合である場合、胎児ＤＮＡ濃度は、合計胎児ＤＮＡ濃度よりも低いであろう。胎児ＤＮＡ濃度期待値は、生物学的試料の測定値、例えば、両方の胎児が男児であることがわかっている（例えば、超音波走査により）場合は、他の染色体領域から、染色体Ｙ配列の量を測定して、または１つまたは複数のエピジェネティックマーカーを使って、得ることができる。これら両方については、後程さらに詳細に記載される。他の期待値は、胎児ＤＮＡ濃度のこのような測定値から、または直接測定により得ることができ、従って、期待値は、胎児ＤＮＡ濃度期待値に限定されない。

ステップ５６０では、カットオフ値に対する第１のパラメータの比較に基づいて、妊婦の２人の胎児が二卵性であるか否かが判定される。例えば、第１のパラメータが統計的に期待値と異なる場合に、妊婦の２人の胎児が第１の染色体領域で遺伝的に同じでないことが判定できる。正規化パラメータが期待値と統計的に異ならない場合は、胎児は、一卵性であると判定できる。第１のパラメータが胎児ＤＮＡ濃度比率の場合には、第１のパラメータは、見かけの胎児ＤＮＡ濃度比率でもよく、実際の胎児ＤＮＡ濃度比率でなくともよい。胎児ＤＮＡ濃度比率の計算は、２人の胎児が二卵性である場合には異なる可能性があり、従って、計算された値が、実際の胎児ＤＮＡ濃度比率ではないという理由から、用語の「見かけの」が使われる。

従って、母体血漿試料中の見かけの胎児ＤＮＡ濃度比率（Ｆ）は、母親がホモ接合で、双生児の内の少なくとも１人に対しヘテロ接合である多型座位（例えば、ＳＮＰ座位）で、式：
Ｆ＝２ｐ／（ｐ＋ｑ）、
により決定できる。
式中、ｐは、胎児特異的アレルを含むＤＮＡ分子の数で、ｑは、胎児および母親で共通のアレルを含むＤＮＡ分子の数である。見かけの胎児ＤＮＡ濃度比率分析に適するＳＮＰ座位は、本出願の前のセクションで記載のように、２つの異なるアレルが母体血漿中で個別ＳＮＰ座位に対し検出される座位である。このような座位は、母親がホモ接合であるか、またはヘテロ接合のタイプでよいが、領域は、比較時に同じタイプでなければならない。

胎児ＤＮＡ濃度比率の計算のために、１つのＳＮＰ座位または複数のＳＮＰ座位由来の情報が使用できる。複数のＳＮＰ座位から読み取られた数は、一緒に合算できる。換言すれば、ゲノム全領域のＳＮＰ座位が「グループ」に分割される。１つのグループの座位は、好ましくは、同じ隣接の一続きのＤＮＡであるべきである。一実施形態では、このようなグループは、同じ染色体腕上のＳＮＰを含む。別の実施形態では、このようなグループは、１ｋｂ、５ｋｂまたは１０ｋｂのヒト続きのＤＮＡ内のＳＮＰを含む。各グループ内のＳＮＰ座位の数は、胎児ＤＮＡ濃度比率の所望の測定精度および各ＳＮＰ座位の読み深度（すなわち、各ＳＮＰ座位が検出され、定量される回数）に依存するであろう。一態様では、所望の濃度比率の測定精度は、２つの異なるＳＮＰ座位グループが同じか、または少なくとも２つの異なる見かけの胎児ＤＮＡ濃度比率を有するかどうかの判定を可能にする最低限の精度であろう。

各ＳＮＰ座位の読み深度を高めることで、胎児ＤＮＡ濃度比率を正確に測定するのに必要なＳＮＰの数を減らすことができる。一実施形態では、目的のＳＮＰ座位に対する読み深度は、標的シーケンシング手法により深めることができる（ＬｉａｏＧＪｅｔａｌ．ＣｌｉｎＣｈｅｍ２０１１；５７：９２−１０１）。この手法では、血漿ＤＮＡ分子が、最初に目的領域中の配列に相補的なプローブにハイブリダイズされ、捕捉された分子が大量並列シーケンシングに供せられる。必要な分子の数に関する計算は、以降のセクションで考察される。

Ｃ．異なる領域に対する量の期待値としての使用
上述のように、期待値は、別の染色体領域の分析から決定できる。例えば、第２のパラメータが、第２の染色体領域に対し決定でき（例えば、上述と類似の方式で）、このような値を期待値として使用できる。全ての胎児がヘテロ接合、例えば、第２の染色体領域に対し、ある座位でＡ：Ｔ（例えば、母親がホモ接合のＡ：Ａで、父親がＴ：Ｔであることがわかっている場合）である場合は、２つのアレルの２つの量から得た第２のパラメータを、合計胎児ＤＮＡ濃度の期待値とすることができる。その後、第１の領域に対する第１のパラメータが、第２の領域に対し決定された期待値とは統計的に異なる場合、データは、１人の胎児のみが、第１の染色体領域の座位でヘテロ接合であり、胎児は、遺伝的に異なることを示唆している。他の技術を使って、期待値を決定することができる。これについては次のセクションで説明する。

また、他の染色体領域に対するパラメータも、決定でき、それぞれは、方法４００の複数回の反復に使用できる。種々の実施形態により、決定されたパラメータをグループに分割でき、その集団が相互に異なるかどうかを判定できる。これについては、後程さらに詳細に記載される。このような集団は、最初に選別され、母親の類似の領域が使われていることを確認でき、例えば、パラメータ値がクラスター形成している領域で、母親がホモ接合であることを確実にすることができる。その後、２つ以上のパラメータ値の集団がデータ中に現れる場合、一部の領域は、胎児間で同じであるが、他の領域は異なり、それにより二卵性を示すことが推測できる。従って、母体血漿中の胎児ＤＮＡ画分中の局所的ゲノム変異は、双胎妊娠の接合状態を示すことができる。下記の例では、見かけの胎児ＤＮＡ濃度分析が使用されるが、他のパラメータも使用できる。

一組の双生児が一卵性か、または二卵性であるかの判定は、複数のＳＮＰ座位を使って、見かけの胎児ＤＮＡ濃度比率分析することにより実現できる。見かけの胎児ＤＮＡ濃度は、胎児特異的遺伝子マーカーを使って特定の領域で測定された胎児ＤＮＡ濃度である。特定の領域の見かけの胎児ＤＮＡ濃度は、胎児の内の少なくとも２人が二卵性である場合には、実際の胎児ＤＮＡ濃度とは異なる可能性がある。一卵性双生児に対しては、見かけの胎児ＤＮＡ濃度比率は、全ゲノム領域の異なるＳＮＰ座位で類似であろう。しかし、二卵性双生児に対しては、見かけの胎児ＤＮＡ濃度比率は、２人の胎児の遺伝子型の差異が理由で、二峰性または三峰性分布を示すであろう。このような方法では、父親および／または母親に対するハプロタイプ情報は、使用できるが、必要ではない。

見かけの胎児ＤＮＡ濃度を使った例
図６および７は、本発明の実施形態に従い、母体血漿中の胎児ＤＮＡ画分中の局所的ゲノム変異を使って、双胎妊娠の接合状態を示す例である。図６は、双生児が一卵性である例を示し、図７は、双生児が二卵性である例を示す。２つのＳＮＰ座位（座位１および座位２）での父親、母親および一組の双生児（一卵性または二卵性）の遺伝子型を示す。これらの２つの座位は、異なる染色体領域由来であり、従って、上記の用語を使って表すと、２つの異なるグループの一部である。

説明のために、我々は、２つの双生児胎児のそれぞれが、母体血漿ＤＮＡ中の１０％を与え、母体血漿試料中に合計で１００ゲノム当量のＤＮＡが存在すると仮定する。１ゲノム当量は、正倍数性ヒト細胞に含まれるＤＮＡの量である。別のシナリオでは、２人の胎児がそれぞれ異なる量のＤＮＡを生物学的試料（例えば、母体血漿）に与える。

一卵性双生児に対しては（図６に示すように）、それらの遺伝的組成物は、同じである。従って、両方の双生児は、座位１および座位２の両方、ならびに、母体血漿試料中の共有の、および胎児特異的アレルの両方を定量化することによる見かけの胎児ＤＮＡ濃度比率を測定するのに適する他のいずれの座位でもヘテロ接合である。座位１に対しては、Ａアレルを有する１８０分子、およびＴアレルを有する２０分子が母体血漿中に存在し、従って、見かけの胎児ＤＮＡ濃度比率：２０％［２０ｘ２／（１８０＋２０）］を生ずる。座位２に対しては、ＧおよびＣアレルの定量化により、見かけの胎児ＤＮＡ濃度比率の２０％が、同様に検出される。２つの双生児胎児の遺伝的構成が同じであるので、双生児１が特定のＳＮＰ座位でヘテロ接合である場合、双生児２もまた、同じＳＮＰ座位でヘテロ接合となろう。従って、全ゲノム領域のいずれかのＳＮＰ座位で測定される見かけの胎児ＤＮＡ濃度比率は、類似となるであろう。

二卵性双生児に対しては、少なくとも一部のゲノムに対する遺伝子型は、異なるであろう。図７に示すように、双生児１および双生児２の両方が、座位１でヘテロ接合であり、従って、見かけの胎児ＤＮＡ濃度比率：２０％を与える。他方、双生児１は、座位２でＧアレルに対しホモ接合であり、双生児２は、ヘテロ接合である。結果として、座位２での見かけの胎児ＤＮＡ濃度比率は、ＧおよびＣアレルの量に基づいて、１０％［１０ｘ２／（１０＋１９０）］である。換言すれば、両方の胎児が、ある座位でヘテロ接合である場合は、見かけの胎児ＤＮＡ濃度比率は、２０％となるであろう。しかし、１人のみの胎児が、ある座位でヘテロ接合である場合は、見かけの胎児ＤＮＡ濃度比率は、減らされることになろう（例えば、双生児の各メンバーにより放出された胎児ＤＮＡの量が等しい場合は、１０％）。従って、見かけの胎児ＤＮＡ濃度比率が複数のＳＮＰ座位で測定される場合、両胎児が等しい量の胎児ＤＮＡを放出すると、二峰性分布を生ずるであろう。双生児のそれぞれのメンバーが異なる量のＤＮＡを母体血漿中に放出する可能性が存在する。このシナリオでは、母体血漿ＤＮＡが分析される場合に、胎児ＤＮＡ濃度比率の三峰性分布が見られるであろう。これに関しては以下で考察する。

Ｄ．期待値測定用の他の技術
上述のように、期待値（例えば、実際の胎児ＤＮＡ濃度比率）は、他の染色体領域での遺伝的測定値から決定できる。この変動を測定する別の手法は、遺伝子マーカーを使って測定された胎児ＤＮＡの濃度比率（またはいくつかの他のパラメータ）を、別の手法、例えば、事実上遺伝的ではないマーカーに基づいた手法を使って測定されたものと比較することである。従って、期待値（例えば、全胎児由来の胎児ＤＮＡ濃度比率の合計）は、また、他の測定値により決定できる。一実施形態では、生物学的試料中の胎盤特異的エピジェネティックマーカー、例えば、ＤＮＡメチル化の量を測定することを含む。

一実施形態では、胎児ＤＮＡの濃度比率は、エピジェネティックマーカーを使って測定できる。一実施形態では、エピジェネティックマーカーは、ＤＮＡメチル化マーカーであってもよい。１例の胎児ＤＮＡメチル化マーカーは、血漿中の胎児由来および母体由来ＤＮＡの間で異なるＤＮＡメチル化パターンを示すものである（米国特許第６，９２７，０２８号）。このようなマーカーの１例は、ｍａｓｐｉｎをコードするＳＥＲＰＩＮＢ５遺伝子で、これは、母体血漿中に存在する胎児ＤＮＡ中で低メチル化を示すが、母体血漿中の母体ＤＮＡに対し高度メチル化を示す（米国特許第８，０２６，０６７号）。別の例は、ＲＡＳＳＦ１Ａ遺伝子で、これは、母体血漿中に存在する胎児ＤＮＡ中で高度メチル化を示すが、母体血漿中の母体のＤＮＡに対して、低メチル化を示す（米国特許第７，７５４，４２８号）。他のＤＮＡメチル化マーカーが別の文献に記載されている（ＰａｐａｇｅｏｒｇｉｏｕＥＡｅｔａｌ．ＡｍＪＰａｔｈｏｌ２００９；１７４：１６０９−１６１８）。

このようなＤＮＡメチル化マーカーは、当業者によく知られたいくつかの技術を使って母体血漿中で検出できる。これらの技術には、メチル化特異的ＰＣＲ（ＨｅｒｍａｎＪＧ、ｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１９９６；９３：９８２１−９８２６）、リアルタイムメチル化特異的ＰＣＲ（ＬｏＹＭＤｅｔａｌ．ＣａｎｃｅｒＲｅｓ１９９９；５９：３８９９−３９０３）またはＭｅｔｈｙＬｉｇｈｔ（ＥａｄｓＣｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ２０００；２８：Ｅ３２）、重亜硫酸塩シーケンシング（ＦｒｏｍｍｅｒＭ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１９９２；８９：１８２７−１８３１）、メチル化感受性制限酵素消化（ＣｈａｎＫＣＡｅｔａｌ．ＣｌｉｎＣｈｅｍ２００６；５２：２２１１−２２１８）、ｍｅｔｈｙｌ−ＢＥＡＭｉｎｇ（ＬｉＭｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ２００９；２７：８５８−８６３）、および大量並列シーケンシング（ＫｏｍｏｒｉＨＫｅｔａｌ．ＧｅｎｏｍｅＲｅｓ２０１１；２１：１７３８−１７４５）、が含まれる。

一例であるが、ＲＡＳＳＦ１Ａを分子マーカーとして使用して、母体血漿中の合計（すなわち、高度メチル化＋低メチル化）ＲＡＳＳＦ１Ａ配列に対する高度メチル化を示すＲＡＳＳＦ１Ａ配列の割合を測定することにより、母体血漿中の胎児ＤＮＡ濃度比率を計算できる。一卵性双胎妊娠に対しては、１つの、または一連の胎児遺伝子マーカーを使ってゲノムの異なる部分について測定した母体血漿中の胎児ＤＮＡ濃度比率は、この項の最初の文章で説明されているＲＡＳＳＦ１ＡＤＮＡメチル化マーカーシステムを使って測定したものと密接な相関があるはずである。しかし、二卵性双胎妊娠に対しては、胎児遺伝子マーカーを使って測定した胎児ＤＮＡ濃度比率の間の相関は、ＲＡＳＳＦ１ＡＤＮＡメチル化マーカーシステムと、より弱い相関を示すはずである。一実施形態では、一連のこれらそれぞれのタイプのマーカーを使って、遺伝的およびＤＮＡメチル化マーカーシステムの間の相関を解析できる。例えば、その相関は、ピアソン相関または線形回帰を使って調査できる。他のタイプのエピジェネティックマーカーには、メチル化およびアセチル化等のヒストン修飾に基づくものが含まれる。

別の実施形態は、胎児ゲノム中に存在するが母体ゲノム中には存在しない遺伝的配列の量の測定である。このような遺伝的配列の例には、母親がＲｈＤ陰性で、父親がＲＨＤに対しホモ接合的に陽性の妊娠に対するＲＨＤ遺伝子が含まれる。従って、全ての胎児がＲｈＤ陽性で、母親がＲｈＤ陰性の場合、ＲＨＤ遺伝子は、実際の胎児ＤＮＡ濃度を測定するのに使用できる。別の例は、男児の胎児のみを含む多胎児妊娠における染色体Ｙ配列の量の測定である。例えば、全ての胎児が男児の場合、実際の胎児ＤＮＡ濃度は、Ｙ染色体上の座位を使って測定できる。

従って、一実施形態では、遺伝子マーカーを使って、１つまたは複数の胎児特異的配列から選択される胎児特異的配列を有するＤＮＡ断片の第３の量を測定することにより、期待値（例えば、胎児ＤＮＡ濃度）を計算できる。期待値（例えば、胎児ＤＮＡ濃度）に関する計算であることから、胎児が遺伝的に同じである場合は、全ての胎児が、胎児特異的配列（例えば、上記例のもの）を有する。例えば、本明細書記載の方法により、第３の量の正規化値が得られ、正規化パラメータが決定される。正規化値は、次に、期待値（例えば、胎児ＤＮＡ濃度）として使用できる。一実施態様では、胎児がそれぞれの第１のアレルを有し、母親がそれぞれの第１のアレルを持たない１つまたは複数の第２の座位が特定される。胎児特異的配列は、また、それぞれの第１のアレルである。第３の量の正規化値は、１つまたは複数の第２の座位のアレル合計量を測定し、第３の量の比率および合計量から胎児ＤＮＡ濃度を計算することにより得ることができる。

Ｅ．非多型性胎児特異的配列
別の実施形態では、非多型性胎児特異的配列を使って、見かけの胎児ＤＮＡ濃度比率を測定できる。例えば、母体血漿試料中の染色体Ｙ配列の量は、非胎児特異的配列、例えば、レプチンをコードするＬＥＰ遺伝子を基準として測定できる。ＬＥＰＤＮＡに対する染色体Ｙの比率は、期待値、例えば、胎盤特異的ＤＮＡメチル化マーカーを使って測定した合計胎児ＤＮＡ濃度比率と比較できる。染色体Ｙ濃度比率が期待値とは異なる場合は、妊娠が、少なくとも１つの二卵性胎児セットを含み、さらに、胎児の内の少なくとも１人が男児であり、同様に、胎児の内の少なくとも１人が女児であることを意味する。染色体Ｙ量比率に加えて、母体血漿試料中の染色体Ｙ配列の量の絶対値もまた、以降で記載のように、接合状態を判定する測定値として使用可能である。

従って、１つまたは複数の胎児特異的配列（非多型性配列を含んでもよい）の第１の量は、生物学的試料中で、１つまたは複数の第１の座位で測定できる。第１の量に対する正規化パラメータを得ることができ、次に、本明細書記載のように使用して、胎児の内の少なくとも２人が二卵性であるか否かを判定できる。

Ｆ．絶対胎児ＤＮＡ濃度
胎児ＤＮＡ濃度比率の代替物として、何らかの較正（正規化を暗黙裏に含む）が行われる限り、染色体領域に対する副次的アレルの測定値（例えば、数）の絶対値を使用できる。このような使用は、明示的比率が計算されないという意味で、「絶対値」と名付けられる。例えば、測定ステップで、ある領域由来の特定の量のＤＮＡ断片が１つの実験から別の実験へと制御、または相関付けできるように較正できる場合は、主要アレルの量は、合計−副次的アレルの第２の量として暗黙裏に決定できる。領域（すなわち、領域の特異的座位）に対するＤＮＡ断片の量（例えば、数）の絶対値を知ることに加え、１つの領域から別の領域までの固定比率のＤＮＡ断片により、較正が提供される。例えば、プロトコルは、第１の領域由来のＤＮＡ断片の合計数が第２の領域のＤＮＡ断片合計数の１．４倍であるような、指定された方式の試料調製を要求してもよい。この拡大縮小因子は、その後、比較の一部として使用できる。一実施形態では、既知量のＤＮＡまたは他のタイプの較正用試料を生物学的試料に添加できる。

この方式で、異なる染色体領域由来の副次的アレル（または他の胎児特異的遺伝子マーカー）の量を直接相互に比較できる。このような状況では、パラメータは、まだ、主要アレルの第１の量を使って効率的に計算されるが、このような値は、較正が原因で消滅する（すなわち、第１の量、または第１の量＋第２の量が同じで、そのため、それらはその式から取り消される）。例えば、デジタルＰＣＲ結果の計数またはシーケンシングデータの解析は別として、マーカーは、標的濃度が同じの場合、マーカーが較正されて同じ定量的読み出しを与えるように適切に構築された較正曲線により測定できる。同様に、異なる染色体領域由来の主要アレルの第１の量は、相互に比較でき、第１の量は第２の量の変動とは逆に変化するであろうから（例えば、二卵性胎児では、第１の量の２つのピークが見られるであろう。図８と比較されたい）、このような変化は、副次的アレルの量に対し本明細書記載の同じ結果を与えることができる。

従って、所与のこのような胎児特異的遺伝子マーカーセットに対し、一卵性および二卵性双胎妊娠におけるそれらの相関性は異なるであろう。一実施形態では、マーカーは、デジタルＰＣＲを使って定量化され、この場合、それらは、一卵性双胎妊娠において全て同じまたは類似の測定量を与えるであろう。逆に、二卵性双胎妊娠では、このようなマーカーの比率は、さらに多岐にわたる結果を与えるであろう。説明のために、二卵性妊娠の両方の胎児が同じ濃度の胎児ＤＮＡを母体血漿中に放出すると仮定する（必ずしもこれが必要な事例ではないが）。このケースで、両方の胎児が母親のゲノムにはない同じ父系遺伝性アレルを受け継いでいる場合の第１のマーカーに対し、第１のマーカー（例えば、母親がホモ接合の場合の副次的アレル）の測定された量は、１人の胎児のみが母親のゲノムにはない父系遺伝性アレルを受け継いでいる場合の第２のマーカーにより測定された量の２倍であるはずである。それぞれが異なる量の胎児ＤＮＡを放出する二卵性双生児に対しては、第１のマーカーの測定量は、第２のマーカーの測定量より多いが、２つの値は２倍までの差異はないであろう。

デジタルＰＣＲ分析を使った較正方法の１例として、同じ母体血漿ＤＮＡ試料を使って、デジタルＰＣＲ反応当たり同じ平均テンプレート分子濃度で、座位１の胎児特異的アレルの定量化、および座位２の別の胎児特異的アレルの定量化を行うことができる。このようなシナリオでは、非胎児ＤＮＡのバックグラウンド量は、座位１および座位２で同じである。従って、座位１の胎児特異的アレルに対し、デジタルＰＣＲウエル陽性の数を単純にカウントして座位１の胎児ＤＮＡの見かけの絶対量を決定できる。同じプロセスを座位２で行い、胎児ＤＮＡの見かけの絶対量を決定できる。次に、２つの絶対値を、相互に比較して（例えば、１つが期待値として使用される場合）、または別の方法で決定した期待値と比較して（例えば、上述のように）統計的に有意差があるか否かを判定できる。

Ｇ．胎児ＤＮＡ濃度の差異の検出
図８は、本発明の実施形態に従って、等量の胎児ＤＮＡを与える二卵性双生児に対する胎児ＤＮＡ濃度のヒストグラム８００の例を示す。このヒストグラムでは、横軸（Ｘ）は、胎児ＤＮＡ濃度である。ある染色体領域に対し測定された胎児ＤＮＡ濃度（絶対値または比率）を使って、測定値を含む範囲に対しカウンターを増やすことができる。図で、第１のピーク８１０は、１人の胎児のみが胎児特異的アレルを有する場合の座位の測定胎児ＤＮＡ濃度に対応し、他方、第２のピーク８２０は、両方の胎児が胎児特異的アレルを有する場合の座位の測定胎児ＤＮＡ濃度に対応する。ピーク８２０は、実際の胎児ＤＮＡ濃度に対応するであろうが、ピーク８１０は、見かけの胎児ＤＮＡ濃度に対応するであろう。２つのピークが認められるので、胎児は二卵性であると推測できる。一態様では、ピークの相対的高さを、例えば、ステップ１５０の一部として、接合状態の判定に使用できる。

ヒストグラム８００は、また、実際の胎児ＤＮＡ濃度が、ヒストグラム生成以外の技術を使って、種々の染色体領域でのパラメータ値から測定される場合の方法を模式化するのを助けることができる。例えば、実際の胎児ＤＮＡ濃度が２Ｆ％であると測定できる（例えば、エピジェネティック手法を用いて）。次に、ピーク８１０に属する領域が分析される場合、見かけのＤＮＡ濃度に対する尺度パラメータは、ピーク８１０の近くに出現するはずである。これは、２Ｆ％の値から離れた統計的に有意な距離であろう。

ピークの位置は、一グループの正規化パラメータ（この例では胎児ＤＮＡ濃度）の統計値の１つの例であり、この場合、グループは８１５および８２５の曲線の内の１つに対するデータポイント（すなわち、正規化パラメータの数）である。例えば、ピーク８２０は、曲線８２５により表される正規化パラメータグループに対する統計値であり、ピーク８２０は、期待値として使用できる。曲線８１５および８２５（基のデータにフィットする場合）は、後程考察されるように、混合モデルの確率分布、および構成要素の例であることに留意されたい。

２つの異なる胎児ＤＮＡ濃度比率から１つを識別するのにどのくらい多くの読み取り数が必要かの判定は、以下のように行うことができる。２人の二卵性双生児のそれぞれが母体のＤＮＡのＦ％に寄与すると仮定する。母体血漿中の２つの異なる胎児ＤＮＡ濃度比率を示すＳＮＰ座位の２つの集団（クラスター）が存在する。１つのＳＮＰ集団で、見かけの濃度比率は、Ｆ％であるが、他方、他のＳＮＰ集団では、見かけの濃度比率は、２Ｆ％である。優先ＳＮＰ座位セットの分布の標準偏差（ＳＤ）は、

で、式中、Ｎは、このＳＮＰ座位セットに整合させた読み取りの合計数である。後者のグループのＳＮＰ座位のＳＤは、また、大略

に等しい。

２つのＳＮＰ座位集団は、

の場合は、５％オーバーラッピング未満で識別できる。従って、Ｎ＞１６（１−Ｆ％）／Ｆ％である。

表２は、種々のＦ％の値に対し、２つのＳＮＰ座位集団から得られた２つの見かけの胎児ＤＮＡ濃度比率（Ｆ％ｖｓ２Ｆ％）を識別するのに必要な配列読み取り数を示す。

Ｈ．各胎児のための別のピーク
双生児の各メンバーが異なる量のＤＮＡを母体血漿中に放出する場合もある。このシナリオでは、母体血漿ＤＮＡが分析されると、胎児ＤＮＡ濃度比率の三峰性分布が認められるであろう。これらのピークの内の２つは、２人の個別双生児胎児のそれぞれにより放出された胎児ＤＮＡ濃度比率を表すが、他方、３番目のピークは、２人の胎児の胎児ＤＮＡ比率の全体の累計を表すであろう。従って、実施形態は、また、双生児の各メンバーにより放出された相対的量のＤＮＡが推定できる方法を提供できる。

各双生児により放出されたＤＮＡの量の大きな不一致は、有害な結果、例えば、双生児の内の１人の危急の死亡に繋がる可能性があると思われる。各胎児の胎児ＤＮＡの異なる寄与は、経時的に追跡され、胎児の健康をモニターできる。各双生児により放出された相対ＤＮＡ量の別の有用性は、胎児染色体の異数性、例えば、トリソミー２１の検出のために母体血漿ＤＮＡの大量並列シーケンシングを使っている場合であろう（ＣｈｉｕＲＷＫｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００８；１０５：２０４５８−２０４６３；ＦａｎＨＣｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００８；１０５：１６２６６−１６２７１；ＳｅｈｎｅｒｔＡＪｅｔａｌ．ＣｌｉｎＣｈｅｍ２０１１；５７：１０４２−１０４９；ＳｐａｒｋｓＡＢｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２０１２；ｄｏｉ：１０．１０１６／ｊ．ａｊｏｇ．２０１２．０１．０３０）。胎児ＤＮＡ濃度比率は、このような手法の診断鋭敏度の重要なパラメータである。

従って、双生児が一卵性であることを示すことができる場合は、胎児トリソミー２１の非侵襲的検出には、基本的に、大量並列シーケンシングデータを取り扱うのと同じアルゴリズムを使うのみでよい。他方、二卵性双生児を含む場合には、最初に各双生児により与えられる胎児ＤＮＡの相対比率を測定し、その後、より少ない量のＤＮＡを母体血漿中に放出した双生児の胎児ＤＮＡ濃度比率が、使われるシーケンシングの深度で検出可能か否かを調べることができる。必要に応じ、シーケンシング深度を増やすことができる。換言すれば、実施形態は、双胎妊娠に対しても、胎児染色体の異数性選別を行うことを可能とする。

説明のために、特定の二卵性双生児妊娠において、胎児１および胎児２が、妊婦である母親の血漿中のＤＮＡのそれぞれ３％および２％の寄与をすると仮定する。また、母親の血漿の大量並列シーケンシングを使って、トリソミー２１の検出を実行することを希望していると仮定する（ＣｈｉｕＲＷＫｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００８；１０５：２０４５８−２０４６３）。実施形態を使うことにより、我々が、３％および２％の胎児ＤＮＡ濃度比率、ならびに両方の胎児の一緒の寄与、すなわち、５％の胎児ＤＮＡ濃度比率を特定することが可能となる。ロバストなトリソミー２１検出を可能とするのに必要なシーケンシング深度は、胎児ＤＮＡ濃度比率が２％の場合には、トリソミー２１胎児を検出するのに充分な深度であろう。必要なシーケンシング深度および胎児ＤＮＡの濃度比率の間の関係は、以前に報告されている（ＦａｎＨＣｅｔａｌ．ＰＬｏＳＯＮＥ２０１０；５：ｅ１０４３９；ＣｈｉｕＲＷＫｅｔａｌ．ＢＭＪ２０１１；３４２：ｃ７４０１）。類似の考慮が、トリソミー１３、トリソミー１８の出生前検出（ＣｈｅｎＥＺｅｔａｌ．ＰＬｏＳＯＮＥ２０１１；６：ｅ２１７９１；ＰａｌｏｍａｋｉＧＥｅｔａｌ．ＧｅｎｅｔＭｅｄ２０１２；ｄｏｉ：１０．１０３８／ｇｉｍ．２０１１．７３）、性染色体異数性（ＬａｕＴＫｅｔａｌ．ＪＭａｔｅｒｎＦｅｔａｌＮｅｏｎａｔａｌＭｅｄ２０１１；ｄｏｉ：１０．３１０９／１４７６７０５８．２０１１．６３５７３０、染色体の転座（ＬｕｎＦＭｅｔａｌ．ＣｌｉｎＣｈｅｍ２０１１；５７：９１７−９１９）および染色体の微小欠失（ＰｅｔｅｒｓＤｅｔａｌ．ＮＥｎｇｌＪＭｅｄ２０１１；３６５：１８４７−１８４８）に対しても適用できる。

従って、胎児ＤＮＡ濃度比率の計算は、出生前診断の他の適用のために重要でありうる。例えば、母体血漿分析による非侵襲的出生前診断の正確度は、母体血漿試料中の評価対象胎児が寄与するＤＮＡの濃度比率に依存する可能性がある。染色体の異数性の出生前の検出に対しては、母体血漿中の罹患した染色体の追加の染色体投与量は、胎児ＤＮＡ濃度比率に比例する。２人の胎児のそれぞれが寄与する胎児ＤＮＡ濃度比率は、上述の技術を使って次のように決定できる。

図９は、本発明の実施形態に従って、２人の胎児が、異なる量のＤＮＡを母体血漿試料に寄与する場合の、ＮＰ分析に基づく胎児ＤＮＡ比率分布のヒストグラム９００を示す。胎児ＤＮＡ濃度比率の３つのピークが観察され、４％、７％および１１％の濃度比率に対応する。最初の２つのピークは、それぞれ２人の胎児の寄与による濃度比率に対応するであろう。理由は、１人の胎児のみが、母親がホモ接合のＳＮＰ座位でヘテロ接合である場合、胎児特異的アレルにより与えられる割合は、その特定の双生児胎児の胎児ＤＮＡ濃度比率を反映するために使えることによる。最後のピークは、両方の胎児がヘテロ接合であるが、母親がホモ接合であるＳＮＰ座位に対応する。これらのＳＮＰ座位を使って計算された胎児ＤＮＡ濃度比率は、両方の胎児により与えられた合計胎児ＤＮＡ濃度比率である。正確な診断をするために最小限の胎児ＤＮＡ濃度比率を必要とするいずれの適用に対しても、３つの図の最も低い濃度比率側のものが重要であろう。理由は、これが母体血漿試料に対し最低量の寄与による胎児由来の胎児ＤＮＡ濃度比率を反映していると思われるためである。シーケンシングの深度は、したがって、後者の胎児の胎児ＤＮＡ濃度比率を前提として、統計的にロバストな診断結果を提供できるように調節できるであろう。

Ｉ．全体集団に対する統計的変動の使用
一実施形態では、２つ以上のピークの組み合わせ集団に対するＳＤ値は、接合状態を決定するのに使用できる。一卵性胎児に対しては、ＳＤ（パラメータ値の広がりの尺度の例）は、二卵性双生児に対するＳＤより小さいであろう。これは、基のデータが実際に２つのピーク由来であり、従って、パラメータ値が１つのピークの場合よりも多様で、測定パラメータ値の広がりが単純に統計的変動に起因したという理由による。このような技術は、特定の母体の遺伝子型内の別々の集団の座位の特定を必要としないであろう。それでも、例えば、２つのアレルが検出される座位に対し、母親がヘテロ接合である領域と、母親がホモ接合である領域の区別の必要がまだあるかもしれない。

このように、二卵性双胎妊娠では、母体血漿中の合計ＤＮＡに比較して、個別の、または選択された組み合わせの濃度比率の一連の胎児特異的遺伝子マーカーにより測定した母体血漿または血清中の胎児ＤＮＡの濃度比率は、一卵性双胎妊娠の場合の濃度比率より大きな変動を示すであろう。変動は、当業者によく知られた統計的方法、例えば、ＳＤ、分布範囲、四分位数間範囲、等により測定できる。

従って、正規化パラメータ（例えば、ステップ４４０で計算されたような）の標準偏差または他の分散を使って、接合状態を決定できる。分散は、閾値と比較でき、分散が閾値を超える場合、胎児の内の少なくとも２人は二卵性であると判定できる。正規化パラメータをカットオフ値に比較して、正規化パラメータが統計的に期待値と異なるかどうかの判定は、分散の計算および閾値との比較により効率的に実現される。

Ｊ．減数分裂組換えに対する考察
上述のように、染色体領域内の座位は、座位間の組換え確率が低いように、例えば、１％未満になるように選択される。以下の例は、染色体領域の座位間の組換えが起こる場合に生ずる問題を取り扱う。

上述のように、いずれかの染色体領域に対し、２人の胎児が同じ父方のハプロタイプを受け継いでいる場合、胎児特異的アレルに基づいて計算された見かけの胎児ＤＮＡ濃度比率は、２人の胎児により寄与される合計ＤＮＡを表すであろう。他方、２人の胎児が、父親がヘテロ接合（ＡＢ）で、母親がホモ接合（ＡＡ）であるいずれかのＳＮＰ座位で、異なる父方のハプロタイプを父親から受け継いでいる場合は、１人の胎児のみが、母体血漿に対し胎児特異的アレルを与えるであろう。結果として、これらの座位で測定された見かけの胎児ＤＮＡ濃度比率は、両方の胎児が同じ父方のハプロタイプを受け継いでいる場合の座位で測定された値より、低くなるであろう。

図１０は、一組の二卵性双生児を宿す妊婦の見かけの胎児ＤＮＡ濃度比率に与える組換えの効果の例を示す。この例では、父方のハプロタイプが双生児１に伝えられる場合、父方のＨａｐＩＩＩおよびＨａｐＩＶの間の組換えがある。組換えは、ＳＮＰ座位３および４の間で発生する。実際上、双生児１は、座位１から３でＨａｐＩＩＩを受け継ぎ、座位４から６でＨａｐＩＶを受け継いでいる。双生児２は、何ら組換えなしに、父親からＨａｐＩＶを受け継いでいる。

この妊婦に関し、胎児ＤＮＡ濃度比率の分析の間、１、２、３および５のみが情報価値がある。理由は、胎児特異的アレル（Ｂアレル）は、母体血漿中に存在すると思われるからである。座位４および６は、情報価値がなくなるであろう。理由は、両方の胎児が、父親から母体のアレルと同じＡアレルを受け継いでいるからである。他方、座位５では、両方の胎児が父親からＢアレルを受け継いでおり、座位１から３に対し決定された値に比べて、より高い見かけの胎児ＤＮＡの原因となる。全領域（座位１から６を含む）を見かけの胎児ＤＮＡ濃度の分析に使用する場合、推定濃度は、両胎児が同じ父方のハプロタイプを受け継いでいる領域および２人の胎児が異なる父方のハプロタイプを受け継いでいる領域の見かけの胎児ＤＮＡ濃度比率の間になるであろう。

ＩＶ．演繹的ＳＮＰコール
上記セクションでは、両方の親の遺伝子型情報が既知の場合、および母親の遺伝子型だけが既知の場合の接合状態特定に関する例を記載した。しかし、実施形態（例えば、方法１００および４００）は、親に関する遺伝子型情報がわかっていない場合に適用できる。このような状況では、測定パラメータ値は、母体遺伝子型、または少なくとも最も可能性のある母体遺伝子型を特定するために、グループに分けることができる。この方式では、母親から採取された生物学的試料の分析の前に、演繹的知識を持つ必要がない。従って、実施形態は、母体の遺伝子型、および胎児遺伝子型を推察できる。いくつかの領域は、未分類で残ってもよいことに留意されたい。

少なくとも一部の染色体領域が分類される（例えば、母親がホモ接合で、胎児の内の少なくとも１人がヘテロ接合であるグループに）とすぐに、本明細書記載の方法を胎児の接合状態を判定するために使用できる。例えば、一組の双生児が一卵性であるか、または二卵性であるかの判定は、見かけの胎児ＤＮＡ濃度比率（または他のパラメータ）を複数のＳＮＰ座位を使って分析することにより実現できる。一卵性双生児に対しては、見かけの胎児ＤＮＡ濃度比率は、全ゲノム領域の異なるＳＮＰ座位で類似であろう。しかし、二卵性双生児に対しては、２人の胎児の遺伝子型の差異のために、見かけの胎児ＤＮＡ濃度比率は、二峰性分布を示すであろう。

接合状態の決定に加えて、胎児ＤＮＡ濃度は、また、遺伝的分析からも決定できる。この分析は、上述のように、多胎妊娠が原因で複雑である。上述のように、胎児ＤＮＡ濃度は、接合状態の特定に加えて、非侵襲的胎児診断技術にとって有用である。

Ａ．方法
胎児ＤＮＡ濃度比率を配列決定データ（例えば、高倍読み深度の）またはＰＣＲデータから直接求めるために、我々は、ＳＮＰ部位ｉで可変比

を次のように定義する：

式中、ａ_iは、ＳＮＰ座位（部位）ｉでの特異的アレル（すなわち、主要アレル）の最大数、およびｂ_iは、ＳＮＰ座位ｉの別のアレル（すなわち、副次的アレル）の２番目の最大数である。この値は、母親がホモ接合の座位に対し上述の式を使って得た見かけの胎児ＤＮＡ濃度の半分である。この技術は、また、上述の絶対胎児ＤＮＡ濃度等の他の正規化パラメータと一緒に使用できる。

単胎妊娠の母体血漿中のＳＮＰ部位（または他の多型部位）を考慮すれば、これらのＳＮＰ部位は、母体の遺伝子型および胎児遺伝子型の組み合わせ、いわゆる母体−胎児混合遺伝子型に基づいて、暗黙裏にＡＡ_AA、ＡＡ_AB、ＡＢ_AAおよびＡＢ_ABの形式の４つのカテゴリーに分類でき、ここで、下付文字は、胎児遺伝子型を表す。ＡＡは、ホモ接合状態を示し、ＡＢは、ヘテロ接合状態を示す。従って、各ＳＮＰ座位ｉでの測定値は、シーケンシングデータ由来の最大数に相当するアレルＡの発生数（ａ_i）および次の最大数に相当するアレルＢの発生数（ｂ_i）から構成される。胎児ＤＮＡ濃度比率は、カテゴリーＡＡ_ABおよびＡＢ_AAに対するそれぞれのＳＮＰ部位で

に影響を与えるであろう。理論では、カテゴリーＡＡ_AAに対する

は、０で、カテゴリーＡＢ_ABに対する

は、０．５である。従って、胎児ＤＮＡ濃度比率により、母体血漿中の母体−胎児混合遺伝子型の分布を特定できる。原理的には、胎児ＤＮＡ濃度比率の最適推定は、最高確率を有する

の観察プロファイルを生成する分布を作り出すであろう。

実施形態は、４つのカテゴリーを識別でき、さらなるカテゴリーＡＡ_ABおよびＡＢ_AAの分析を、例えば、上述の方法４００のように、実行できる。異なるカテゴリーの間での識別（すなわち、どの染色体領域がそのカテゴリーに属するか）の一部として、実施形態は、データが確率分布の線形結合に最適フィットする最適濃度を見つけることにより、胎児ＤＮＡ濃度を決定できる。

図１１は、本発明の実施形態に従って、少なくとも２人の胎児を宿す妊婦由来の生物学的試料中の胎児ＤＮＡパーセンテージを特定し、胎児の内の少なくとも２人が二卵性であるか否かを判定する方法１１００を示すフローチャートである。生物学的試料は、胎児および母体のＤＮＡを含む。

ステップ１１１０では、複数の染色体領域それぞれに対し正規化パラメータを決定することによりヒストグラムが生成される（例えば、方法４００で上述のように）。複数の染色体領域のそれぞれに対し、それぞれの染色体領域中の１つまたは複数の座位が特定され、そこで、生物学的試料中のそれぞれの第１のアレルおよびそれぞれの第２のアレルが検出される。このような領域は、上述の４つの異なるカテゴリーに対応する。

アレルは、いずれかの適切な方式で検出でき、統計的に有意な量のそれぞれのアレルを確かなものにできる。第１の量の１つまたは複数の第１のアレルおよび／または第２の量の１つまたは複数の第２のアレルが生物学的試料中の１つまたは複数の座位で測定される。複数座位の間で、第１のアレルが異なっていてもよく、第２のアレルの場合も同様である。一実施形態では、第１のアレルが、染色体領域中の特定の座位の第２のアレルより量が多い場合は、第１のアレルの全体は、それぞれの座位の第２のアレルより量が多い。このような方式で、複数の座位由来のアレルの数を組み合わせることができる。

第１の量または第２の量の正規化パラメータが得られる。正規化パラメータは、本明細書記載のいずれのタイプでもよい。例えば、正規化パラメータは、第１の量および第２の量から決定でき、第１の量および第２の量の間の相対的尺度を与える。１例には、胎児ＤＮＡ濃度比率が含まれる。正規化パラメータは、また、適切な較正により決定できるような絶対胎児ＤＮＡ濃度であってもよい。一実施形態では、上記で定義の

が使用される。

それぞれの染色体領域に対し正規化パラメータが決定されるとすぐに、これらのデータポイントを使って、ヒストグラムを生成できる。ヒストグラムのデータ構造は、正規化パラメータの可能な値をいくつかのサブレンジに分割することにより生成できる。例えば、範囲が０と０．５の間の場合、サブレンジは、それぞれ０．０１のサイズであってもよい。カウンターを、各サブレンジに関連付けることができる。次に、正規化パラメータの指定された値を持ついくつかの染色体領域に基づいて（すなわち、対応する各サブレンジ内の値に対し）カウンターを増やすことができる。

ステップ１１２０では、確率分布の線形結合がヒストグラムにフィッティングされる。例えば、２つの確率分布を使って、カテゴリーＡＡ_ABおよびＡＢ_AAに対しデータをフィッティングできる。下記のように、これらのカテゴリーのそれぞれに対するデータポイントの位置は、胎児ＤＮＡパーセンテージに依存する。従って、胎児ＤＮＡパーセンテージは、確率分布の線形結合への入力である。下記に示すように、他のカテゴリーに対する分布もまた、使用できる。

別の実施形態では、データポイントは、もはや特定のカテゴリー：ＡＡ_ABおよびＡＢ_AAに限定できる。双生児妊娠に対しては、分布の数は、両方の胎児が生物学的血漿に対し等量のＤＮＡの寄与をする場合、２つになるか、または２人の胎児が母体血漿に対し異なる量のＤＮＡの寄与をする場合は、３つになるであろう。３人以上の胎児を含む妊娠に対しては、分布の数は、各胎児が母体血漿に対し等量のＤＮＡの寄与をする場合は、胎児の数となるであろう。このような実施形態では、ステップ１１５０は、冗長であるとしてスキップでき、ステップ１１６０では、確率分布係数を使用することになる。

ステップ１１３０では、入力胎児ＤＮＡパーセンテージφを変化させ、確率分布の線形結合のヒストグラムへのフィッティングを最適化する最適胎児ＤＮＡパーセンテージを見つけることができる。用語の「最適な」は、上記で定義されている。最適化プロセスの一部として、データおよび確率分布の線形結合の間で誤差が特定できる。この誤差項を使用して、φの値がデータに充分フィッティングする場合を特定できる（すなわち、誤差が充分小さいのでφの値が最適であると呼ばれる）。

ステップ１１４０では、胎児ＤＮＡパーセンテージφがわかるとすぐに、母親がホモ接合で、胎児の内の少なくとも１人がヘテロ接合である座位に対応する確率分布、または母親がヘテロ接合で、胎児の内の少なくとも１人がホモ接合である座位に対応する確率分布が特定される。例えば、２つの線形結合が使用される場合は、胎児ＤＮＡパーセンテージφは、分布のピークのおよその位置を与えることができる。胎児（またはそれらの内の少なくとも２人）は二卵性である可能性があるので、ピークは、φにより予測される正確な位置にはない可能性があるが、２つの分布が識別できる。例えば、φ／２の値に近いピークを有する分布は、カテゴリーＡＡ_ABに属し、０．５−φ／２に近いピークを有する分布は、ＡＢ_AAに属するであろう。

ステップ１１５０では、多成分混合モデルが特定の確率分布にフィッティングされる。多成分混合モデルは、複数の成分のそれぞれに対する混合係数を含む。一態様では、成分は、図８または９のピークに対応する。成分は、ガウス分布等のいずれかの適切な関数形を使って定義でき、その場合、各成分は、異なるガウス関数に対応するであろう。

下記で述べるように、追加のピークは、トリプレットを生ずるであろう。混合モデルの成分の数を求める１つの方法は、胎児が母体血漿に対し等量のＤＮＡの寄与をする場合、成分の数＝胎児の数とすること（例えば、実際の胎児ＤＮＡ濃度を示す領域を考慮すること）である。あるいは、ベイズ情報量基準（ＢＩＣ）または赤池の情報量基準（ＡＩＣ）を使って、混合モデルの成分の数を求めることができる。従って、混合モデルは、等量の胎児ＤＮＡの寄与をする双生児に対しては２つの成分を持ち、または各双生児が異なる量のＤＮＡの寄与をする場合、もしくは、２人以上の胎児を含む妊娠に対し、さらに多くの成分の数を持つことができる。

一実施形態では、特定された分布は、母親を遺伝子型解析して、カテゴリーＡＡ_ABまたはＡＢ_AAを特定することにより見つけることができる。このような実施形態では、ステップ１１３０および１１４０が実施されないであろう。また、φの値は、他の方法、例えば、エピジェネティックマーカーを使って求めることが可能である。逆に、母親の特定の染色体領域の遺伝子型は、その特定の染色体領域に対応する確率分布を決定することにより特定できる。例えば、特定の染色体領域の正規化パラメータの最高値を有する確率分布を決定でき、その確率分布を使って母体の遺伝子型を決定できる。確率分布は、胎児ＤＮＡパーセンテージに別々に依存するので、対応する母体の遺伝子型は、直接的に決定できる。

同様に、特定の染色体領域での胎児の遺伝子型は、その特定の染色体領域に対応する確率分布（混合モデルの成分であってもよい）を決定することにより特定できる。例えば、特定の染色体領域の正規化パラメータの最高値を有する確率分布を決定でき、その確率分布を使用して、それぞれのＳＮＰ座位でヘテロ接合の胎児の数を特定できる。確率分布は、それぞれのＳＮＰ座位でのヘテロ接合の胎児の数、および胎児ＤＮＡパーセンテージにも依存するので、胎児の遺伝子型情報が推定できる。

ステップ１１６０では、胎児の内の少なくとも２人が、混合係数の内の少なくとも２つを使って、二卵性であるか否かが判定される。例えば、混合係数の内の少なくとも２つを、閾値と比較できる。係数の値を使って、ピークが実際に存在するか否かを判定できる。ピークが小さい場合は、混合係数は小さく、追加のピークが実際に存在しないと仮定できる（例えば、２Ｆ％が実際の胎児ＤＮＡパーセンテージの場合、Ｆ％の位置に生ずるであろうピーク）。その場合、混合モデルは、１つのピークのみが実際に存在し、胎児は一卵性であることを表すであろう。混合係数の内２つが閾値を超える場合は、少なくとも２つのピークが実際に存在し、胎児の内の少なくとも２人が二卵性である。閾値は、他の成分の係数に比べ絶対値でも、または相対値でもよい（例えば、閾値は、１つまたは複数の係数の値、例えば、最大値のパーセンテージまたは係数のカバー率に依存する）。用語の「係数」は、係数に乗じる、または成分中に暗黙裏に含まれる任意の拡大縮小因子を包含することに留意されたい。３つの成分が使われる場合（例えば、合計胎児ＤＮＡパーセンテージに対する各胎児の個別の寄与が求められるか、または三つ子が検査されているという理由で）、二卵性の判定は、この場合、二卵性は、既に特定されているであろうという理由から、２つの係数のみが検査された後、中止できる。

一実施形態では、混合モデルの成分のピーク位置は、所定の値を超える分離ギャップを持つように強制される。分離ギャップは、１つのピークから最近接ピークまでの距離（ヒストグラムのパラメータ値の単位で測定した距離）である。所定の値は、所望の正確さおよび所望の結果に依存する。例えば、接合状態を特定することのみを望む場合（例えば、それぞれ個別胎児からの寄与のピークの間の区別が目的ではない場合）、モデルに対する２つの成分を使うことができ、所定の値は、所定の胎児ＤＮＡ濃度に依存しうる（例えば、より大きな胎児ＤＮＡ濃度は、より大きな分離距離に繋がる可能性がある）。所定の値は、また、胎児の数に依存する可能性があり、例えば、三つ子に対しては、異なるピークの分離は、相対基準でみて、より小さい可能性がある。理由は、ピークは、実際の胎児ＤＮＡ濃度の１／２ではなく、大略１／３に相当する可能性があるためである。

相対的ピークサイズを使うことができる。例えば、相対的サイズにより、胎児が遺伝的に同じであるか、または胎児が遺伝的に異なるさらに多くの領域が存在するか否かを示すことができる。これは、染色体領域の選択に依存するであろう。しかし、複数胎児のシナリオでは、染色体領域の選択がランダムである場合には、２人の二卵性双生児が同じ父方のハプロタイプおよび異なる父方のハプロタイプを受け継いでいる領域の数は、類似であるはずである。この点で、相対的ピークサイズを使って、データを、異なる分布曲線に対し、より正確にフィッティングできる。

Ｂ．演繹的ＳＮＰコール分析による胎児ＤＮＡ比率の決定
上記原理の操作を説明するために、我々は、標的シーケンシングを行い、二項混合モデルを適用して、胎児ＤＮＡ濃度を推定した。二項混合モデリングの適用に成功し、腫瘍ゲノム中の単一ヌクレオチド変異体が特定されている（ＧｏｙａＲｅｔａｌ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２０１０；２６：７３０−７３６；ＳｈａｈＳＰｅｔａｌ．Ｎａｔｕｒｅ２００９；４６１：８０９−８１３）。我々は、そのモデルを採用し、妊婦母体血漿中の胎児ＤＮＡ濃度を推定した。我々は、血漿中のＳＮＰ位置ｉでの母体−胎児混合遺伝子型Ｇ_i＝ｋ、ｋ∈｛ＡＡ_AA，ＡＡ_AB，ＡＢ_AA，ＡＢ_AB｝を、多項ランダム変数であると仮定する。また、

でＳＮＰ位置ｉでのＡアレルおよびＢアレルのアレル数を表すとする。ここでＮ_i＝ａ_i＋ｂ_iは、観察された読み深度である。我々は、ＳＮＰ位置ｉでの数は、Ｇ_i＝ｋ、Ｘ_i〜Ｂｉｎｏｍ（ｂ_i｜μ_k，Ｎ_i）が条件とされる二項分布により生成されると仮定する。式中、μ_k∈｛μ_AAAA，μ_AAAB，μ_ABAA，μ_ABAB｝は、母体血漿中のＢアレル頻度（ｂ_i）の期待分布であり、これは、下式で与えられる：

理論的には、μ_AAAAは定数０に、μ_AAABは胎児ＤＮＡ濃度の半分：φ／２に、μ_ABAAは０．５−φ／２に、μ_ABABはほぼ定数０．５に近づく。μ_AAAAおよびμ_ABABでは、それぞれ期待定数値０および０．５からのずれは、主にシーケンシング誤差および分析の偏りにより影響され、一方、μ_AAABおよびμ_ABAAでは、０および０．５からの摂動は、胎児ＤＮＡ濃度比率によりほとんど決まる。分析の偏りの例には、大量並列シーケンシングにおけるＧＣバイアス（ＣｈｅｎＥＺｅｔａｌ．ＰＬｏＳＯｎｅ２０１１；６：ｅ２１７９１）およびアラインメントバイアス（ＤｅｇｎｅｒＪＦｅｔａｌ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００９．２５：３２０７−３２１２．）、が含まれる。

その後、我々は、二項混合モデルを適用して観察アレル数を説明した。所与のＳＮＰ位置ｉに対し、Ｘ_i、ｐ（Ｘ_i）の混合分布は、多項式π_k、０≦π_k≦１、および Σ_kπ_k＝１により重みをつけた二項分布の線形結合：

から導かれる。式中、π_kは、母体−胎児混合遺伝子型の事前確率である。換言すれば、π_kは、ランダムに選択された位置がそれぞれの遺伝子型の位置となるであろうという事前信念を表す。

最終的データ対数尤度は、

により与えられる。式中、Ｔは、母体血漿中の観察ＳＮＰ位置の合計数、π_k∈｛π_AAAA，π_AAAB，π_ABAA，π_ABAB｝、である。さらに、その尤度は、正確さを潜在的に改善できるマッピング特性および塩基特性により下記式でモデル化できる（ＧｏｙａＲｅｔａｌ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２０１０；２６：７３０−７３６）：

式中、

は、マッピング特性、および

は、位置ｉのｊ番目に整列した塩基に対するシーケンシング特性である。我々のデフォルト分析では、現在のマッピングソフトウェアがマッピング特性の利益をもたらさなかったので、シーケンシング特性をモデル化した。

一般的には、π_kは、異なる母体−胎児混合遺伝子型の集団頻度に従って、それぞれ、０．７、０．１、０．１、および０．１に指定され、例えば、ＡｆｆｙｍｅｔｒｉｘＧｅｎｏｍｅ−ＷｉｄｅＨｕｍａｎＳＮＰＡｒｒａｙ６．０を使って推定できる。μ_kは、ＡＡ_ABおよびＡＢ_AAの両方に対し、胎児ＤＮＡ濃度比率φ（０≦φ≦１．０）に依存する。妊婦母体血漿では、φが０．４より大きいことはありそうにない（ＣｈｉｕＲＷｅｔａｌ．ＢＭＪ２０１１；３４２：ｃ７４０１）。従って、われわれは、０〜０．５の胎児ＤＮＡ濃度比率φについて、繰り返し毎に０．００１以下の増分で、対数尤度が最大になるまで繰り返し計算する。φが実際の胎児ＤＮＡ濃度比率に近づくと、対数尤度が最大になると予測される。換言すれば、対数尤度を最大化する典型的なφは、最高確率を有する観察アレル数を説明できる。そうでない場合には、上記で定義のように、対数尤度がその最大値に対するまでπ_kおよびμ_kを繰り返し更新する必要がある。

更新ルールは、ＡＡ_AAおよびＡＢ_ABを考慮すると、下記の式で定義される：

式中、Ｉ（Ｇ_i＝ｋ）は、母体−胎児混合遺伝子型ｋＧ_iが、異なる母体−胎児混合遺伝子型の荷重確率に従って、ＳＮＰ位置ｉのＧ_iに割り当てられているか否かを示す指標関数であり、さらに：

であり、式中、ＡＡ_ABおよびＡＢ_AAは、血漿中の胎児ＤＮＡ濃度比率の拘束下にあり、従って：

である。

さらに、上記式（６）〜（９）に対し、μ_kは、ベータ分布μ_k〜β（μ_k｜α_k，β_k）に従って分布する。Ｇ_k∈｛ＡＡ_AA，ＡＡ_AB，ＡＢ_AA，ＡＢ_AB｝にそれぞれ対応させて、α_k＝｛１００００，９５００，５５００，５０００｝およびβ_k＝｛１，５００，４５００，５０００｝とし、μ_kをβ_k／（α_k＋β_k）で初期化する。理由は、μ_kは、｛０，０．０５，０．４５，０．５｝近傍で変動し、実際に観察される分布

により調節されることが期待されると我々は考えるからである。π_kは、ディリクレ分布：π_k〜β（π_k｜δ_k）に従って分布する。π_kは、

により初期化される。式中、δ_kは、デフォルトで重みベクトル｛７，１，１，１｝により設定され、これは、妊婦母体血漿中のＧ_kの比率を表し、従って、ランダムに選択された位置がそれぞれの遺伝子型に割り当てられるであろうという事前信念を示す。

パラメータπ_kおよびμ_kが観察アレル数により適合されるとすぐに、我々は、ベイズの定理を適用し、母体−胎児混合遺伝子型に対する事後確率γ_k＝Ｐｒ（Ｇ_k｜ａ_i，Ｎ_i，π_k，μ_k）を計算できる。
式中：

である。
さらに、γ_kに基づいて、ＡＡ_ABの形の情報価値のあるＳＮＰ部位を特定することができる。

Ｃ．情報価値のあるＳＮＰ部位から接合状態の特定
双胎妊娠で、上記アルゴリズムを適用して見かけの胎児ＤＮＡ濃度比率を推定し、母体−胎児混合遺伝子型ＡＡ_ABに属するＳＮＰ部位を特定できる。この状況では、ＡＡ_ABは、単胎児妊娠とは異なる意味を有する。一卵性双生児に対しては、ＡＡ_ABの母体−胎児混合遺伝子型の演繹による結論では、両胎児でＡＢの胎児遺伝子型が示される。二卵性双生児に対しては、ＡＡ_ABは、異なる遺伝的構成から生じた、それぞれ、ＡＡ／ＡＡ／ＡＢ（母親／胎児Ｉ／胎児ＩＩ）、ＡＡ／ＡＢ／ＡＡおよびＡＡ／ＡＢ／ＡＢ、の３つの潜伏型グループを含む。シーケンシングデータのみからは、ＡＡ／ＡＢ／ＡＡからＡＡ／ＡＡ／ＡＢを区別できないので、我々は、前者２つのカテゴリーを１つに融合し、以下の分析を行うために、それぞれ、ＡＡ／ＡＡ／ＡＢおよびＡＡ／ＡＢ／ＡＢ、の２つの有効な潜伏型カテゴリーのみを存在させる。

母体血漿中の全ゲノム（または標的にしている目的領域）に対し、胎児ＤＮＡ濃度比率のモダリティー（すなわち、１つまたは２つの最頻値があるか否か）（ＳＮＰ部位当たりまたはブロック当たり、または血漿中の染色体当たりの

）が双生児の接合状態により決定される。双生児に対しては、二卵性状態で、２つの最頻値が生じる可能性があり、胎児が異なるパーセンテージの胎児ＤＮＡの寄与をする場合、これらの最頻値の内の１つは、実際は、２つのサブノードから構成される場合がある（例えば、図９に示すように）。

遺伝的構成のモダリティーを明らかにするために、我々は、２成分混合ガウスモデル（ＧＭＭ）を下記の

の分布にフィッティングさせる：

式中、λ_mは、ｍ＝１，…，Ｍ（Ｍは、可能な最大ピーク数）に対し、

を満たす混合比率である。胎児が、母体血漿中に等量のＤＮＡの寄与を与える場合は、Ｍは、胎児の数、すなわち、双生児妊娠に対しては２に等しい。Φ_mおよびσ² _mは、正規分布の平均および分散である。

我々は、標準的期待値最大化（ＥＭ）アルゴリズム（ＭｃＬａｃｈｌａｎＧＪａｎｄＫｒｉｓｈｎａｎＴ．ＥＭアルゴリズムと機能拡張（ＴｈｅＥＭＡｌｇｏｒｉｔｈｍａｎｄＥｘｔｅｎｓｉｏｎｓ）．ＮｅｗＹｏｒｋ：Ｗｉｌｅｙ；１９９７）を使って、モデル（１１）の混合成分を推定する。このアルゴリズムで、２つの成分を特定する場合、我々は、２つの追加の拘束を設定した：
１）

式中、λ_mは、ピークｍのサイズを表す；
２）

式中、

は、２つのピーク間の距離を示す。

Ｄ．結果
我々は、調査用に１つの二絨毛膜二羊膜（ＤＣＤＡ）双生児妊娠および１つの単絨毛膜二羊膜（ＭＣＤＡ）双生児妊娠を採用した。ＤＣＤＡのケースに対しては、妊娠の１７週に母親から各双生児由来の臍帯血を調査用に貯蔵した。ＭＣＤＡのケースでは、妊娠の１２週に母親から血液サンプルを採取した。絨毛膜絨毛試料（ＣＶＳ）ＤＮＡの一部を調査用に貯蔵した。

ＳＮＰ遺伝子型同定を行うために、母体のバフィーコートから抽出したＤＮＡおよび双生児由来の臍帯血またはＣＶＳ試料を、ＡｆｆｙｍｅｔｒｉｘＧｅｎｏｍｅ−ＷｉｄｅＨｕｍａｎＳＮＰＡｒｒａｙ６．０システムを使って遺伝子型解析を行った。母親および各胎児のホモ接合状態／ヘテロ接合状態に基づいて、ＳＮＰを異なるカテゴリーに分類した（図１２Ａの表１２００および図１２Ｂの表１２２０）。双生児Ｉおよび双生児ＩＩに対する遺伝子型の一致は、ＤＣＤＡのケースが二卵性であることを示す（図１２Ｃの表１２４０）。表１２００は、ＤＣＤＡのケースの遺伝子型解析結果を示す。表１２２０は、ＭＣＤＡのケースに対する遺伝子型解析結果を示す。表３は、ＤＣＤＡのケースの双生児Ｉおよび双生児ＩＩに対する一致を示す。

血漿ＤＮＡのシーケンシングを次のように行った。母体血漿から抽出したＤＮＡを、例示の目的のために、ＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔ技術を使って標的濃縮し、その後、合計５．５Ｍｂサイズの標的領域に対し平均１３８〜１４３倍の読み深度に相当する抽出ＤＮＡ断片（２０３００〜２０９００万）で、イルミナ社Ｈｉ−Ｓｅｑｓｔａｎｄａｒｄｐａｉｒｅｄ−ｅｎｄプロトコル（各末端５０ｂｐ）を使って配列決定した。標的領域には、ｃｈｒ１（０．３３Ｍｂ）、ｃｈｒ２（０．３０Ｍｂ）、ｃｈｒ３（０．６２Ｍｂ）、ｃｈｒ４（０．３２Ｍｂ）、ｃｈｒ５（０．３３Ｍｂ）、ｃｈｒ７（０．３１Ｍｂ）、ｃｈｒ８（０．６２Ｍｂ）、ｃｈｒ９（０．３１Ｍｂ）、ｃｈｒ１２（０．０５Ｍｂ）、ｃｈｒ１３（０．３０Ｍｂ）、ｃｈｒ１５（０．３３Ｍｂ）、ｃｈｒ１７（０．６６Ｍｂ）、ｃｈｒ１９（０．３５Ｍｂ）、ｃｈｒ２０（０．３４Ｍｂ）およびｃｈｒ２２（０．３０Ｍｂ）を含めた。他の標的濃縮技術、例えば、ＲｏｃｈｅＮｉｍｂｌｅＧｅｎプラットフォームおよびＰＣＲベース技術（例えば、ＲａｉｎＤａｎｃｅプラットフォームを使った）もまた使用可能である。

見かけの胎児ＤＮＡ濃度比率を各染色体全領域で測定した。母体血漿中の見かけの胎児ＤＮＡ濃度比率を、シーケンシングデータと組み合わせた遺伝子型を使って計算した。図１２Ｄは、シーケンシングデータと組み合わせた遺伝子型に基づいて計算した見かけの胎児ＤＮＡ濃度比率を示す（母親がＡＡで、胎児の少なくとも１人がＡＢ）。各染色体に対する結果は、ＭＣＤＡのケースに対しては、比較的一定で、１．５２のＳＤであったが、他方、ＤＣＤＡのケースに対しては、より大きい変動を示し、ＳＤはほぼ２倍の３．３６になった（図１２Ｄの表１２６０）。ＭＣＤＡに対しては、胎児ＤＮＡ濃度比率は、１６．３５％であった。ＤＣＤＡでは、胎児Ｉの胎児ＤＮＡ濃度比率は、１２．３５％（ＡＡ／ＡＢ／ＡＡ）で、胎児ＩＩの胎児ＤＮＡ濃度比率は、１３．６０％（ＡＡ／ＡＢ／ＡＡ）であった。合わせた胎児ＤＮＡ濃度比率は、２２．４５％（ＡＡ／ＡＢ／ＡＢ）で、見かけの胎児ＤＮＡ濃度比率は、１８．８２％であった。

標的シーケンシングデータから直接に接合状態を区別できるかどうかを調べるために、我々は、演繹的ＳＮＰコール分析を行い、胎児ＤＮＡ濃度を計算した。図１２Ｅは、演繹的ＳＮＰコール分析により計算された見かけの胎児ＤＮＡ濃度比率を示す。結果は、遺伝子型とシーケンシングデータの組み合わせに基づく推定値と高い一致を示した（ピアソンの相関係数：ＤＣＤＡおよびＭＣＤＡに対しそれぞれ０．８および０．８）（図１２Ｅの表１２８０）。さらに、ＳＤは、一卵性双生児と二卵性双生児を直接識別するのを可能とした（二卵性双生児および一卵性双生児に対し、それぞれ、２．１４および１．１０）。

見かけの胎児ＤＮＡ濃度比率の包括的分布に対し、我々は、標的ゲノム領域を複数のブロック（ＤＣＤＡおよびＭＣＤＡに対し、それぞれ、４３２および４４５）に分割し、５０ｋｂ未満の距離を有する５つを越える近接ＳＮＰを含めることにより、各ブロックを構築した。次に、各ブロックに対し見かけの胎児ＤＮＡ濃度比率を計算し、胎児ＤＮＡ濃度の分布を描いた。２成分混合ガウスモデルを使って、ブロック毎の胎児ＤＮＡ濃度比率の分布をフィッティングさせた。

結果として、ＤＣＤＡのケースに対し、我々は、分布由来の２つの異なるピークを特定することができた（図１３）が、一方、ＭＣＤＡのケースに対しては、１つのピークを得たのみであった（図１４）。従って、二卵性双生児は、混合ガウスモデルを介して、一卵性双生児と識別できる。

別の実施形態では、我々は、それぞれ、一卵性双生児および二卵性双生児の対する胎児ＤＮＡ濃度比率の２つの分布をコンピュータによりシミュレートした。その後、実際の胎児ＤＮＡ分布比率をシミュレート胎児ＤＮＡ分布比率と比較し、どちらのシミュレート分布が実際の胎児ＤＮＡ分布により近いかを判定することにより、接合状態を推定した。また、実施形態は式（１１）中のＭの値を変更することにより、３人以上の胎児を含む妊娠に対しても使用できる。

結論としては、母体血漿ＤＮＡの大量並列シーケンシングにより、我々は、ＳＮＰ当たり、またはブロック当たり、または染色体当たりの見かけ胎児ＤＮＡ濃度比率の観点から、一卵性双生児と二卵性双生児の間に有意差を認めた。この技術は、非侵襲的であり、また、超音波走査による形態学的観察より信頼性が高いという利点を有する。他の実施形態では、胎児ＤＮＡ濃度の１つまたは複数のピークが存在するか否かの判定のために、他の統計的モデル、例えば、隠れマルコフモデル、も使用できる。

Ｖ．胎児ＤＮＡ濃度比率の変動
異なる染色体領域で胎児ＤＮＡ濃度比率を測定することにより、我々は、１つのみの胎児ＤＮＡ濃度なのか、または２つ以上の胎児ＤＮＡ濃度が存在するのかを判定できる。一卵性および二卵性双生児を宿す妊婦の異なる染色体領域に対する血漿胎児ＤＮＡ濃度比率を図１５に示す。一組の一卵性双生児を宿す妊婦に対しては、胎児ＤＮＡ濃度比率は、異なる染色体領域全体で一定である。対照的に、一組の二卵性双生児を宿す妊婦では、異なる染色体領域全体で胎児ＤＮＡ濃度比率間の変動が増加する。このような変動は、二卵性胎児に対し上で示した標準偏差（ＳＤ）の増加に匹敵する。

別の実施形態では、我々は、異なる染色体領域全体の見かけの胎児ＤＮＡ濃度比率の計算のために固定数のＳＮＰを使用した。原理的には、二卵性双生児を宿す妊婦では、異なるゲノム領域全体にわたり、見かけの胎児ＤＮＡ濃度比率は変動を示すと思われるが、一方、一卵性双生児を宿す妊婦では、異なるゲノム領域全体にわたり、見かけの濃度は変動がないであろう。濃度比率の変動が、一卵性双生児に伴う確率的変動に起因するのか、または二卵性双生児に伴う異なる胎児ＤＮＡ濃度比率の存在に起因するのかを判定するために、我々は、一組の一卵性双生児の存在を仮定して、シミュレーション分析を行い、確率的変動のレベルを特定した（図１６）。

シミュレーションは、以下の仮定に基づいて行った：（ａ）一組の一卵性双生児が存在する；（ｂ）全領域の全体濃度比率をそれぞれの試験領域の濃度比率として使用する；（ｃ）それぞれの試験領域中のＳＮＰの配列決定深度は、全領域の平均配列決定深度と同じである；および（ｄ）二項分布に従うＳＮＰアレルの分布。

図１６では、相対的見かけの胎児ＤＮＡ濃度比率を、１０００の連続ＳＮＰの内のアレル数に基づいて、その時点までの途中経過の合計として計算した。１０００ＳＮＰに対する局所領域濃度を、全領域の平均胎児ＤＮＡ濃度比率で除算することにより、相対的見かけの濃度比率を計算した。緑の線は、一組の一卵性双生児を宿す母親に対する結果を表し、赤い線は、一組の二卵性双生児を宿す母親に対する結果を表す。灰色の陰影領域は、上述の１０００の異なるシミュレーションの結果を表す。緑の線が陰影領域内で変動し、濃度比率の変動が一組の一卵性双生児に対する予測変動範囲内にあることを示すのがわかる。一方、赤い線は、陰影領域を越えて変動し、濃度比率の変動が確率的変動のみでは説明できず、従って、その一組の双生児が二卵性であることを示唆することを示す。

ＶＩ．三つ子以上の多胎児
また、上述の方法を使って、３つ子以上の多胎妊娠における全ての胎児が遺伝的に同じであるか、または胎児の内の少なくとも１人が他の胎児とは遺伝的に異なるかを判定できる。三つ子以上の多胎妊娠は、例えば、超音波により立証されるように、母体血漿試料中で２つの父方のハプロタイプが検出できる場合は、胎児内の少なくとも１人が他の胎児とは異なることが示されるであろう。胎児ＤＮＡ濃度比率の分析に対し、情報価値のあるＳＮＰの推定方法は代わらないであろう。情報価値のあるＳＮＰの特定および異なるゲノム領域に対する胎児ＤＮＡ濃度比率の計算の後で、状況に応じて変更した式中のパラメータを使って、上記の式により、胎児の接合状態を決定できる。

三つ子およびそれより多い多胎児に対しては、多成分混合モデルに対する可能なピークＭの数は、次のように決定できる。三つ子以上の胎児が存在する場合は、Ｍの計算は、一層複雑になるであろう。図１７は、本発明の実施形態に従って、３人の胎児（胎児Ａ、ＢおよびＣ）に対するいくつかの可能なピークを示すヒストグラムである。これら３人の胎児は、遺伝的に異なり、異なる量のＤＮＡを母体血漿に対し寄与する。塗りつぶされていないピークは、１人の胎児のみがヘテロ接合である染色体領域を表す。１つの色のピークは、２人の胎児がヘテロ接合である染色体領域を表す。異なるパターンで塗りつぶされたピークは、３人全ての胎児がヘテロ接合である染色体領域を表す。従って、合計６つのピークが存在することになる。

胎児の数（Ｎ）およびピークの数（Ｍ）の間の関係は、

となる。実際、胎児の全てが異なる量のＤＮＡを母体血漿に対し寄与する場合、必ずしも全てのピークを特定する必要はないであろう。しかし、胎児の全てが等量のＤＮＡを母体血漿に対し寄与する場合は、Ｍは、Ｎに等しくなるであろう。

ＶＩＩ．実施例
以下は、１人の胎児またはいく人かの一卵性胎児が寄与する最小の胎児濃度比率の決定のための仮説例である。最初の例に関して、多胎妊娠における異なる胎児の胎児ＤＮＡ濃度比率の決定は、母体血漿の分析に基づく出生前診断試験の感度を調節するのに有用である（段落１１８も参照）。このような用途では、遺伝的に異なる胎児のいずれか１人により与えられる最小胎児ＤＮＡ濃度比率、または２人以上の遺伝的に同じ胎児由来の組み合わせ胎児ＤＮＡ濃度は、どちらが低いにしても、診断試験の感度が、胎児遺伝子異常、例えば、胎児異数性を検出するのに充分であるか否かを示すために使用できる。図１７に示す例では、胎児Ａにより寄与されるピークは、最小の見かけの胎児ＤＮＡ濃度を表す。

一実施形態では、最小胎児ＤＮＡ濃度比率は、母親がホモ接合で、父親がヘテロ接合である位置のいくつかの情報価値のあるＳＮＰを分析することにより決定できる。これらのＳＮＰは、いくつかの異なる染色体または染色体領域上に位置していることが好ましい。これらのＳＮＰのそれぞれでの見かけの胎児ＤＮＡ濃度比率は、胎児特異的アレルおよび母親と胎児の間で共通のアレルを有するＤＮＡ断片の数により計算される。母体血漿中への最小量のＤＮＡの寄与を与える胎児のみがヘテロ接合であるが、他の胎児がホモ接合であるいずれのＳＮＰ座位でも、見かけの胎児ＤＮＡ濃度比率は、全ての分析されたＳＮＰ座位中で最小になるであろう。従って、これらのＳＮＰ座位で決定された最小胎児ＤＮＡ濃度比率は、いずれかの遺伝的に異なる胎児により寄与がなされた最小量の胎児ＤＮＡの推定値として使用できる。

別の実施形態では、ＳＮＰ座位でのＤＮＡ濃度比率の決定を、ＳＮＰ座位上の選択領域のデジタル解析（ＤＡＮＳＲ）を使って行うことができる（ＳｐａｒｋｓＡＢｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２０１２；ｄｏｉ：１０．１０１６／ｊ．ａｊｏｇ．２０１２．０１．０３０）。１つまたは複数の染色体上に位置する胎児特異的および共通のアレルのデジタル計数を使って、ＳＮＰ座位のそれぞれで見かけの濃度比率を推定できる。あるいは、同じ染色体領域上に位置する複数のＳＮＰ座位に関するアレル数情報を、一緒に分析し、それぞれの染色体領域での見かけの胎児ＤＮＡ濃度比率を示すことができる。最小の見かけの胎児ＤＮＡ濃度を示す染色体領域を使って、いずれかの胎児により寄与された最小胎児ＤＮＡを示すことができる。他の実施形態では、異なるＳＮＰ座位での濃度比率の決定を、リアルタイムＰＣＲ、質量分析（例えば、ＳｅｑｕｅｎｏｍＭａｓｓＡＲＲＡＹシステムにより）およびデジタルＰＣＲ分析を使って行うことができる。

分析されるＳＮＰ座位の数は、分析される座位の内の少なくとも１つで、二卵性双生児の内の少なくとも一組を宿す妊娠に対し、母体のアレルに関して、最小量のＤＮＡを母体血漿に対し寄与する胎児（または一卵性胎児の組み合わせ）のみがヘテロ接合であるが、他の胎児は、ホモ接合であることを保証するのに充分な大きさでなければならない。例えば、１００を越える潜在的に情報価値のあるＳＮＰが分析されるべきである。さらに、それぞれに情報価値のあるＳＮＰ座位の分析に関し、充分に大きな量のＤＮＡ断片を分析して、胎児特異的アレルが検出されることを保証しなければならない。

２つ目の例では、実施形態のプロセスに従って説明が行われる。１０ｍＬの母体の末梢血試料を、超音波により双生児胎児を宿すことがわかっている妊婦から採取する。血液サンプルを血漿および血液細胞中に分取する。血漿を採取し、ＤＮＡを抽出する。次に、母体血漿ＤＮＡを一連の１０マルチプレックスＰＣＲにより増幅する。各ＰＣＲは、異なるゲノム領域に分布した２０のＳＮＰ座位の増幅を可能とする。従って、この例では、全体で２００ＳＮＰ座位が分析されることになる。

マルチプレックスＰＣＲのそれぞれ由来のＰＣＲ産物をプライマー伸長アッセイにより解析し、伸長産物を、例えば、ＳｅｑｕｅｎｏｍＭａｓｓＡＲＲＡＹシステムにより分析する。各プライマー伸長アッセイに続けて、ＳｅｑｕｅｎｏｍＭａｓｓＡＲＲＡＹ分析により、ＳＮＰ座位のそれぞれのアレルに対応する質量分析ピークを明らかにする。相対的ピーク高さは、各ＳＮＰアレルの相対量を示す。妊婦母親および胎児の両方が、同じアレルに対しホモ接合であるＳＮＰでは、そのアレルに対応する１つのピークのみが、質量分析の読み取りで認められる。妊婦である母親がヘテロ接合であるＳＮＰでは、両方のＳＮＰのアレルに対応するほぼ同じ高さの２つのピークが、質量分析の読み出しで認められる。妊婦である母親がホモ接合で、胎児の内の少なくとも１人がヘテロ接合であるＳＮＰに対しては、１つのピーク（母親のアレルに対応する）および１つの小さなピーク（母親のゲノム中に存在しない胎児アレルに対応する）が、質量分析の読み出しで認められる。後者の２つのピークの相対的サイズにより、胎児ＤＮＡパーセンテージ（すなわち、胎児ＤＮＡ濃度比率）の測定が可能となる。

一実施形態では、座位の特定の組み合わせで、１つの大きな（母体のアレルに対応する）ピークおよび１つの小さな（胎児特異的アレルに対応する）ピークを示すＳＮＰの比率は、例えば、６％になるであろう。双生児胎児が一卵性の場合には、これらの６％のＳＮＰにより測定した胎児ＤＮＡ濃度比率は、相対的に相互に近いはずである。値の近さは、例えば、標準偏差（ＳＤ）により測定できる。双生児胎児が二卵性の場合は、６％のＳＮＰを２つのグループに分割できる。第１のグループに対しては、２人の胎児は、両方共、単に偶然に、ヘテロ接合であろう。２つ目のグループでは、またしても単に偶然に、胎児の内の１人は、ホモ接合で、残りはヘテロ接合であろう。第１のグループで１つまたは複数のＳＮＰにより測定された胎児ＤＮＡ濃度比率は、２つ目のグループで１つまたは複数のＳＮＰにより測定された濃度比率より大きいであろう。このような分析用に選択されるＳＮＰは、特定の集団に対し最も情報価値のあるように選択できる。

質量分析の代わりとして、この例の分析を当業者に既知の同等の方法を使って行うことができる。１例は、大量並列シーケンシングの前の、増幅手続きのＳＮＰ座位に対する性能である。この戦略の１つの変形は、選択領域のデジタル解析である（ＤＡＮＳＲ）（ＳｐａｒｋｓＡＢｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２０１２；ｄｏｉ：１０．１０１６／ｊ．ａｊｏｇ．２０１２．０１．０３０）。別の例は、ＱｕａｎｔａＬｉｆｅプラットフォームまたはＲａｉｎＤａｎｃｅプラットフォームを使う等の、微小滴デジタルＰＣＲ（ｍｉｃｒｏｄｒｏｐｌｅｔｄｉｇｉｔａｌＰＣＲ）である（ＺｈｏｎｇＱｅｔａｌ．ＬａｂＣｈｉｐ２０１１；１１：２１６７−２１７４）、さらに別の例は、マイクロフルイディクスデジタルＰＣＲの使用である。このようなアッセイのマルチプレクシングにより、このような分析のスループットを高められるであろう。

ＶＩＩＩ．コンピュータシステム
本明細書に記載のいずれのコンピュータシステムに関しても、任意の適切な数のサブシステムを利用することが可能である。このようなサブシステムの例を、図１８のコンピュータ装置１８００に示す。一部の実施形態では、コンピュータシステムは、ただ１つのコンピュータ装置を含み、この場合、サブシステムは、コンピュータ装置の構成要素でありうる。他の実施形態では、コンピュータシステムは、複数のコンピュータ装置を含み、それぞれが内部構成要素を含むサブシステムであってもよい。

図１８に示すサブシステムは、システムバス１８７５を介して相互接続される。例えば、プリンター１８７４、キーボード１８７８、固定ディスク１８７９、ディスプレイアダプター１８８２に接続されたモニター１８７６、等の追加のサブシステム、が示されている。Ｉ／Ｏ制御装置１８７１に接続された周辺装置および入／出力（Ｉ／Ｏ）装置を、当技術分野で既知の任意の数のシリアルポート１８７７、等の手段によりコンピュータシステムに接続できる。例えば、シリアルポート１８７７または外部インターフェイス１８８１を使って、コンピュータシステム１８００をインターネット等の広域ネットワーク、マウス入力装置、またはスキャナーに接続できる。システムバス１８７５を介した相互接続は、中央処理装置１８７３のそれぞれのサブシステムとの通信、およびシステムメモリー１８７２または固定ディスク１８７９からの命令の実行の制御、ならびにサブシステム間の情報交換の制御を可能とする。システムメモリー１８７２および／または固定ディスク１８７９は、コンピュータ可読メディアを組み入れることができる。本明細書に記載のいずれのデータも、１つの装置から別の装置に出力でき、また、ユーザーにも出力できる。

コンピュータシステムは、例えば、外部インターフェイス１８８１または内部インターフェイスにより接続された複数の同じ装置またはサブシステムを含むことができる。一部の実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワークを介して通信できる。このような場合は、１つのコンピュータをクライアント、別のコンピュータをサーバーと見なすことができ、この場合、それぞれは、同じコンピュータシステムの一部となりうる。クライアントおよびサーバーは、それぞれ複数のシステム、サブシステム、または装置を含んでもよい。

本発明のいずれの実施形態も、モジュールまたは集積方式のハードウェアおよび／またはコンピュータソフトウェアを使った制御論理の形で実装できることは理解されよう。本明細書で提供される開示と教示に基づいて、当業者なら、ハードウェアおよびハードウェアとソフトウェアの組み合わせを使って、本発明の実施形態を実施する他の手段、および／または方法を知り、理解するであろう。

本出願に記載のいずれのソフトウェア成分または機能も、例えば、Ｊａｖａ、Ｃ＋＋またはＰｅｒｌ等のいずれかの適切なコンピュータ言語を使い、例えば、従来の、またはオブジェクト指向技術を使って、プロセッサにより実行されるソフトウェアコードとして実装可能である。ソフトウェアコードは、保存、および／または送信用のコンピュータ可読メディア上の一連の指令または命令として保存できる。適切なメディアには、ランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、ハードドライブもしくはフロッピーディスク、等の磁気メディア、またはコンパクトディスク（ＣＤ）もしくはＤＶＤ（デジタル多用途ディスク）等の光学メディア、フラッシュメモリ、等が含まれる。コンピュータ可読メディアは、このような保存または送信装置のいずれかの組み合わせであってもよい。

このようなプログラムは、また、インターネットを含む種々のプロトコルに準拠した有線、光学、および／または無線ネットワークを介した送信に適応したキャリアシグナルを使って、コード化および送信できる。従って、本発明の実施形態によるコンピュータ可読メディアは、このようなプログラムでコードされたデータシグナルを使って作成できる。プログラムコードでコードされたコンピュータ可読メディアは、互換性のある装置と一緒にパッケージされても、または他の装置から別々に（例えば、インターネットのダウンロードで）提供されてもよい。いずれのこのようなコンピュータ可読ディアも、単一コンピュータプログラム製品（例えば、ハードドライブ、ＣＤ、または全体コンピュータシステム）上にあっても、内部にあってもよく、また、システムまたはネットワーク内の異なるコンピュータプログラム製品上にあっても、内部にあってもよい。コンピュータシステムは、モニター、プリンター、または本明細書記載のいずれかの結果をユーザーに提供するための他の適切なディスプレイを含んでもよい。

本明細書記載の方法のいずれかは、全体的に、または部分的に、ステップを実行するように構成できる、プロセッサを含むコンピュータシステムを使って行うことができる。従って、実施形態は、本明細書記載の方法のいずれかのステップを実行するように構成され、場合によっては、それぞれのステップまたはそれぞれのステップグループを実行する異なる装置を備えた、コンピュータシステムを対象にできる。番号を付けたステップとして示したが、本明細書にある方法のステップは、同時にまたは異なる順で行うことができる。さらに、これらのステップの一部は、他の方法由来の他のステップの一部と一緒に使用できる。また、全部または一部のステップは、任意に選択できる。さらに、いずれかの方法のいずれかのステップは、モジュール、回路、またはこれらのステップを実行する他の手段と一緒に行うことができる。

特定の実施形態の特定の詳細は、本発明の実施形態の趣旨および範囲を逸脱することなく、いずれかの適切な方法で組み合わせることができる。しかし、本発明の他の実施形態は、それぞれの個別態様、またはこれらの個別態様の特定の組み合わせ、に関連する具体的実施形態を対象にできる。

本発明の代表的実施形態の上記説明は、例示と説明の目的で提示されている。それは、網羅的とする意図、または本発明を記載された通りの形態に限定する意図はなく、上記教示を考慮すると多くの修正及び変形が可能である。実施形態は、本発明の原理およびその実際的適用を最良に説明し、それにより、種々の実施形態で、特定の意図された用途に適合されるように種々の変形を用いて、他の当業者が本発明を最良に利用するのを可能とするように選択および記載された。

特に逆の指示がなければ、「ａ」、「ａｎ」または「ｔｈｅ」の記述は、「１つまたは複数の」を意味することが意図されている。

全ての特許、特許出願、出版物、および上述の記載は、参照によってその全体が、あらゆる目的において、本明細書に組み込まれる。これらのいずれも先行技術であることを認めるものではない。

Claims

多胎児を宿す妊婦の、胎児および母体のＤＮＡを含む生物学的試料を分析する方法であって、以下のステップ：
妊婦が１つまたは複数の第１の座位のそれぞれでホモ接合であるか、または１つまたは複数の第１の座位のそれぞれでヘテロ接合であり、第１の座位のそれぞれが生物学的試料中でそれぞれの主要アレルおよびそれぞれの第２の（secondary）アレルを示し、第１の座位のそれぞれに対するそれぞれの主要アレルがそれぞれの第２のアレルよりも量が多い、第１の染色体領域内の１つまたは複数の第１の座位のそれぞれで妊婦の遺伝子型を決定し；
１つまたは複数の第１の座位で、生物学的試料中の１つまたは複数の主要アレルの第１の量および／または１つまたは複数の第２のアレルの第２の量を測定し；
第１の量または第２の量に対する正規化パラメータを取得し；および
第１の染色体領域で胎児が遺伝的に互いに同じ場合に、正規化パラメータが統計的に期待値とは異なるかどうかの判定を行うために、正規化パラメータとカットオフ値とを比較し、ここで、期待値は、生物学的試料の別個の測定により取得され、該生物学的試料中の胎児ＤＮＡの総画分に対応し、それによって、カットオフ値に対する正規化パラメータの比較に基づき、妊婦の胎児の内の少なくとも２人が二卵性であるか否かを評価すること、
を含む、方法。
第１の座位のそれぞれで、生物学的試料中のそれぞれの主要アレルおよびそれぞれの第２のアレルの検出をさらに含む、請求項１に記載の方法。
正規化パラメータの取得が、
異なる染色体領域内での１つまたは複数の座位由来の１つまたは複数の配列の第３の量の測定；および
正規化パラメータを計算するための第３の量および第１の量または第２の量の使用；
を含む、請求項１に記載の方法。
正規化パラメータの取得が、
１つまたは複数の第１の座位で、生物学的試料中の１つまたは複数の主要アレルの第１の量および１つまたは複数の第２のアレルの第２の量の測定；
第１の量および第２の量の間の相対量を与える、第１の量および第２の量からの第１のパラメータの決定；さらに
第１のパラメータの、第１の量の正規化値としての使用、
を含む、請求項１に記載の方法。
正規化パラメータの取得が、
較正プロセスを使った測定ステップの実行；および
第１の量または第２の量の正規化パラメータとしての使用、
を含む、請求項１に記載の方法。
期待値が、生物学的試料中の胎児ＤＮＡ濃度である、請求項１に記載の方法。
１つまたは複数のエピジェネティックマーカーを用いる胎児ＤＮＡ濃度の測定をさらに含む、請求項６に記載の方法。
１つまたは複数のエピジェネティックマーカーが、１つまたは複数のＤＮＡメチル化マーカーを含む、請求項７に記載の方法。
全ての胎児が胎児特異的配列を有する場合に、１つまたは複数の胎児特異的配列から選択される胎児特異的配列を有するＤＮＡ断片の第３の量の測定；
第３の量の正規化値の取得；および
正規化値の胎児ＤＮＡ濃度としての使用、
による遺伝子マーカーを使った胎児ＤＮＡ濃度の計算をさらに含む、請求項６に記載の方法。
胎児が全て男児で、１つまたは複数の胎児特異的配列がＹ染色体上にある、請求項９に記載の方法。
胎児特異的配列がＲＨＤ遺伝子で、母親がＲｈＤ陰性であり、全ての胎児がＲｈＤ陽性である、請求項９に記載の方法。
胎児がそれぞれの第１のアレルを有し、母親がそれぞれの第１のアレルを持たない１つまたは複数の第２の座位の特定、ここで、胎児特異的配列がそれぞれの第１のアレルである、をさらに含み、
第３の量に対する正規化値の取得が：
１つまたは複数の第２の座位でのアレル合計量の測定；
第３の量および合計量の比率からの胎児ＤＮＡ濃度の計算、
を含む、請求項９に記載の方法。
１つまたは複数の座位がＲＨＤ遺伝子の座位を含み、母親がＲＨＤ遺伝子の非存在により表されるアレルに対しホモ接合であり、胎児の内の少なくとも１人がＲｈＤ陽性である、請求項１に記載の方法。
妊婦が１つまたは複数の第１の座位のそれぞれでホモ接合であるか、または１つまたは複数の第１の座位のそれぞれでヘテロ接合であり、第２の座位のそれぞれが、生物学的試料中のそれぞれの主要アレルおよびそれぞれの第２のアレルを提示する場合に、第２の染色体領域内の１つまたは複数の第２の座位のそれぞれで妊婦の遺伝子型を決定し；
生物学的試料中の１つまたは複数の第２の座位で、１つまたは複数の主要アレルの第３の量および／または１つまたは複数の第２のアレルの第４の量を測定し；
第３の量または第４の量に対する第２の正規化パラメータを取得し；および
期待値を得るための第２の正規化パラメータを使用すること、
をさらに含む、請求項１に記載の方法。
第２の正規化パラメータが期待値として使用される、請求項１４に記載の方法。
他の染色体領域の追加の正規化パラメータの計算；
染色体領域の第１のグループの正規化パラメータから第１の統計値の計算；および
第１の統計値の期待値としての使用
をさらに含む、請求項１４に記載の方法。
第１の染色体領域グループの座位の全てに対し、それぞれの主要アレルが、それぞれの第２のアレルより量が多い、請求項１６に記載の方法。
第１の統計値が、第１の染色体領域グループに対する正規化パラメータのヒストグラムの正規化パラメータの値のピーク位置である、請求項１６に記載の方法。
第１の染色体領域を含む第２の染色体領域グループのパラメータから第２の統計値の計算をさらに含み、
正規化パラメータのカットオフ値との比較が、第２の統計値のカットオフ値との比較を含む、請求項１６に記載の方法。
計算パラメータのヒストグラムの分析による第１および第２の染色体領域グループの特定をさらに含み、第１の染色体領域グループがヒストグラムの第１のピークに対応し、第２の染色体領域グループがヒストグラムの第２のピークに対応する、請求項１９に記載の方法。
大量並列シーケンシング、標的大量並列シーケンシング、ＰＣＲ、定量ＰＣＲ、リアルタイムＰＣＲ、デジタルＰＣＲ、連結反応（ライゲーション）、ハイブリダイゼーションまたは質量分析から得たデータを使って測定が行われる、請求項１に記載の方法。
異なる染色体領域内の１又は複数の座位から１又は複数の配列の第３の量を計算し；
該第３の量のもう一つの正規化パラメータを取得し；
他の正規化パラメータが統計的に期待値とは異なるかどうかの判定を行うための、他の正規化パラメータとカットオフ値とを比較し、ここで、妊婦の胎児の内の少なくとも２人が二卵性であるか否かの評価は、正規化パラメータとカットオフ値との比較に更に基づく、
をさらに含む、請求項１に記載の方法。
多胎児を宿す妊婦の、胎児および母体のＤＮＡを含む生物学的試料を分析する方法であって、
生物学的試料中の１つまたは複数の第１の座位で、１つまたは複数の胎児特異的配列の第１の量の測定；
第１の量の正規化パラメータの取得；および
第１の染色体領域で胎児が遺伝的に互いに同じ場合に、正規化パラメータが統計的に期待値とは異なるか否かの判定のための、正規化パラメータのカットオフ値に対する比較、ここで、期待値は、生物学的試料の別個の測定により取得され、該生物学的試料中の胎児ＤＮＡの総画分に対応する、それによって、カットオフ値に対する正規化パラメータの比較に基づき、妊婦の胎児の内の少なくとも２人が二卵性であるか否かの評価、
を含む、方法。
胎児特異的配列がＹ染色体上にある、請求項２３に記載の方法。
胎児特異的配列がＲＨＤ遺伝子であり、妊婦がＲｈＤ陰性である、請求項２３に記載の方法。
生物学的試料中の期待値が胎児ＤＮＡ濃度である、請求項２３に記載の方法。
１つまたは複数の第１の座位が第１の染色体領域内にあり、
第１の染色体領域とは異なる第２の染色体領域内にある１つまたは複数の第２の座位で、生物学的試料中の１つまたは複数の追加の胎児特異的配列の第２の量の測定；
第２の量に対する追加の正規化パラメータの取得；および
追加の正規化パラメータの期待値を得るための使用；
をさらに含む、請求項２３に記載の方法。
１つまたは複数の第１の座位が第１の染色体領域内にあり、
第１の染色体領域とは異なる第２の染色体領域内にある１つまたは複数の第２の座位で、生物学的試料中の１つまたは複数の追加の胎児特異的配列の第２の量の測定；
第２の量に対する追加の正規化パラメータの取得；および
追加の正規化パラメータの期待値を得るための使用
をさらに含む、請求項２３に記載の方法。
演算を実行するためのプロセッサ制御用の複数の命令を記憶したコンピュータ可読メディアであって、その命令が請求項１〜２８のいずれか１項で定義された方法を含む、コンピュータ可読メディア。
請求項１〜２８のいずれか１項で定義された方法を実行する手段を含むコンピュータシステムであって、少なくともプロセッサおよびメモリを更に含む、コンピュータシステム。