JP7311934B2

JP7311934B2 - 妊娠中の無細胞断片を使用する分子分析

Info

Publication number: JP7311934B2
Application number: JP2022547772A
Authority: JP
Inventors: ユク－ミンデニスロー; ロッサワイクンチウ; クワンチーチャン; ペイヨンチアン; スクハンチョン; チョクインユイ; イェーティンチョン; ウェンレイポン
Original assignee: Chinese University of Hong Kong CUHK
Current assignee: Chinese University of Hong Kong CUHK
Priority date: 2020-02-05
Filing date: 2021-02-05
Publication date: 2023-07-20
Anticipated expiration: 2041-02-05
Also published as: EP4069864A4; IL298811B2; MX2022009820A; US11371084B2; IL298811A; BR122022015680A2; GB2620304A; GB2605736A; IL294431B1; AU2021216616B2; IL294431B2; US20210254142A1; BR112022015073A2; CN116004786A; IL294431A; AU2021216616A1; US11591642B2; GB202313363D0; US20210265007A1; US20220275433A1

Description

関連出願の相互参照
本出願は、２０２０年２月５日に出願された米国仮特許出願第６２／９７０，６３４号、および２０２１年１月８日に出願された米国仮特許出願第６３／１３５，４８６号の優先権の利益を主張し、これらの両方の全容は、すべての目的のために本明細書に組み込まれる。

妊娠中の循環遊離ＤＮＡのモーダルサイズは、約１６６ｂｐであると報告されている（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１）。６００ｂｐよりも大きい断片に関する公開データはほとんどない。一例は、母体血漿からのＹ染色体由来の塩基性タンパク質Ｙ２遺伝子（ＢＰＹ２）からの８ｋｂ断片のＰＣＲを使用して増幅を報告したＡｍｉｃｕｃｃｉｅｔａｌによる研究である（Ａｍｉｃｕｃｃｉｅｔａｌ．ＣｌｉｎＣｈｅｍ２０００；４０：３０１－２）。そのようなデータがゲノムにわたって一般化され得るかどうかは不明である。実際、超並列ショートリード配列決定技術を使用して、例えば、Ｉｌｌｕｍｉｎａプラットフォームを使用して、例えば６００ｂｐ超のような長いＤＮＡ断片を検出するには多くの課題がある（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１、Ｆａｎｅｔａｌ，ＣｌｉｎＣｈｅｍ．２０１０；５６：１２７８－８６）。これらの課題には、以下が含まれる：（１）Ｉｌｌｕｍｉｎａ配列決定プラットフォームの推奨サイズ範囲は通常、１００～３００ｂｐである（ＤｅＭａｉｏｅｔａｌ．ＭｉｃｏｂＧｅｎｏｍ．２０１９；５（９））。（２）ＤＮＡ増幅は、配列決定ライブラリ調製（ＰＣＲを介した）またはフローセル上でのブリッジ増幅を介した配列決定クラスター生成に関与する。そのような増幅プロセスは、部分的に、長いＤＮＡ鋳型（例えば、６００ｂｐ超）が、短いＤＮＡ鋳型（例えば、２００ｂｐ未満）と比較して娘鎖の合成を完了するのに比較的長い時間を必要とするという事実により、より短いＤＮＡ断片を増幅することを好み得る。したがって、Ｉｌｌｕｍｉｎａプラットフォーム上の配列決定の前または最中のこれらのＰＣＲプロセスについての固定時間枠内で、娘鎖がＰＣＲプロセス中に完全に生成されなかったそれらの長いＤＮＡ分子は、下流分析において利用可能ではない。（３）長いＤＮＡ分子は、増幅を妨げる二次構造を形成する可能性がより高くなる。（４）Ｉｌｌｕｍｉｎａ配列決定技術を使用すると、ライブラリが二次元表面上で変性、希釈、拡散され、続いてブリッジが増幅されるため、長いＤＮＡ分子は、短いＤＮＡ分子と比較して、２つ以上のクローンＤＮＡ分子を含有するクラスターを引き起こす可能性がより高くなる（Ｈｅａｄｅｔａｌ．Ｂｉｏｔｅｃｈｎｉｑｕｅｓ．２０１４；５６：６１－４）。

本明細書に記載の方法およびシステムは、長い無細胞ＤＮＡ断片を使用して、生物学的試料を分析することを含む。これらの長い無細胞ＤＮＡ断片を使用すると、より短い無細胞ＤＮＡ断片では企図されないか、または不可能な分析が可能になる。メチル化ＣｐＧ部位および一塩基多型（ＳＮＰ）の状態は、生物学的試料のＤＮＡ断片を分析するためによく使用される。ＣｐＧ部位およびＳＮＰは典型的には、最も近いＣｐＧ部位またはＳＮＰから数百または数千の塩基対だけ分離されている。生物学的試料中の無細胞ＤＮＡ断片のほとんどの長さは通常、２００ｂｐ未満である。結果として、ほとんどの無細胞ＤＮＡ断片上で２つ以上の連続したＣｐＧ部位またはＳＮＰを見つけることは、起こりそうにもないかまたは不可能である。６００ｂｐまたは１ｋｂよりも長いものを含む、２００ｂｐよりも長い無細胞ＤＮＡ断片は、複数のＣｐＧ部位および／またはＳＮＰを含み得る。長い無細胞ＤＮＡ断片上の複数のＣｐＧ部位および／またはＳＮＰの存在は、短い無細胞ＤＮＡ断片のみの場合よりも効率的かつ／または正確な分析を可能にし得る。長い無細胞ＤＮＡ断片は、起源組織を特定するため、および／または妊娠中の女性の胎児に関する情報を提供するために使用され得る。さらに、長い無細胞ＤＮＡ断片を使用して妊娠中の女性からの試料を正確に分析することは、そのような長い無細胞ＤＮＡ断片が主に起源が母体であると期待されるため、驚くべきことである。胎児起源の長い無細胞ＤＮＡ断片が、胎児に関する情報を提供するのに十分な量で存在することは期待されない。

ＳＮＰが存在する長い無細胞ＤＮＡ断片は、胎児によって受け継がれたハプロタイプを決定するために使用され得る。長い無細胞ＤＮＡ断片は、複数のＣｐＧ部位を有することによって、起源組織を示すメチル化パターンを有し得る。さらに、トリヌクレオチド反復および他の反復配列が、長い無細胞ＤＮＡ断片上に存在し得る。これらの反復は、胎児または胎児の父における遺伝性障害の尤度を決定するために使用され得る。長い無細胞ＤＮＡ断片の量は、在胎期間を決定するために使用され得る。同様に、長い無細胞ＤＮＡ断片の末端のモチーフもまた、在胎期間を決定するために使用され得る。長い無細胞ＤＮＡ断片（例えば、そのような断片の量、長さ分布、ゲノム位置、メチル化状態などを含む）が、妊娠関連障害を決定するために使用され得る。

本開示のこれらおよび他の実施形態を、以下で詳細に説明する。例えば、他の実施形態は、本明細書に記載の方法と関連付けられたシステム、デバイス、およびコンピュータ可読媒体を対象とする。

本開示の実施形態の性質および利点のより良好な理解は、以下の詳細な説明および添付の図面を参照して得ることができる。

本発明の実施形態に従って決定された無細胞ＤＮＡのサイズ分布を示す。（Ａ）線形スケールで０～２０ｋｂ、（Ｂ）対数スケールで０～２０ｋｂ。本発明の実施形態に従って決定された無細胞ＤＮＡのサイズ分布を示す。（Ａ）線形スケールで０～２０ｋｂ、（Ｂ）対数スケールで０～２０ｋｂ。本発明の実施形態に従って決定された無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～５ｋｂ。（Ｂ）ｙ軸の対数スケールで０～５ｋｂ。本発明の実施形態に従って決定された無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～５ｋｂ。（Ｂ）ｙ軸の対数スケールで０～５ｋｂ。本発明の実施形態に従って決定された無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～４００ｂｐ。（Ｂ）ｙ軸の対数スケールで０～４００ｂｐ。本発明の実施形態に従って決定された無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～４００ｂｐ。（Ｂ）ｙ軸の対数スケールで０～４００ｂｐ。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～２０ｋｂ。（Ｂ）ｙ軸の対数スケールで０～２０ｋｂ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～２０ｋｂ。（Ｂ）ｙ軸の対数スケールで０～２０ｋｂ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～５ｋｂ。（Ｂ）ｙ軸の対数スケールで０～５ｋｂ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～５ｋｂ。（Ｂ）ｙ軸の対数スケールで０～５ｋｂ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～１ｋｂ。（Ｂ）ｙ軸の対数スケールで０～１ｋｂ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～１ｋｂ。（Ｂ）ｙ軸の対数スケールで０～１ｋｂ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～４００ｂｐ。（Ｂ）ｙ軸の対数スケールで０～４００ｂｐ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態に従って決定された共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。（Ａ）ｙ軸の線形スケールで０～４００ｂｐ。（Ｂ）ｙ軸の対数スケールで０～４００ｂｐ。青色の線は、（母体起源の優勢な）共有対立遺伝子を担持する断片を示し、赤色の線は、（胎盤起源の）胎児特異的対立遺伝子を担持する断片を示す。本発明の実施形態による、母体特異的対立遺伝子を担持する断片と胎児特異的対立遺伝子を担持する断片との間の単一分子、二本鎖ＤＮＡメチル化レベルを示す。本発明の実施形態による、（Ａ）母体特異的対立遺伝子を担持する断片と胎児特異的対立遺伝子を担持する断片との間の単一分子、二本鎖ＤＮＡメチル化レベルの適合分布、および（Ｂ）単一分子、二本鎖ＤＮＡメチル化レベルを使用した受信者動作特性（ＲＯＣ）分析を示す。本発明の実施形態による、（Ａ）母体特異的対立遺伝子を担持する断片と胎児特異的対立遺伝子を担持する断片との間の単一分子、二本鎖ＤＮＡメチル化レベルの適合分布、および（Ｂ）単一分子、二本鎖ＤＮＡメチル化レベルを使用した受信者動作特性（ＲＯＣ）分析を示す。本発明の実施形態による、単一分子、二本鎖ＤＮＡメチル化レベルと血漿ＤＮＡの断片サイズとの間の相関関係を示す。（Ａ）０～２０ｋｂのサイズ範囲。（Ｂ）０～１ｋｂのサイズ範囲。本発明の実施形態による、単一分子、二本鎖ＤＮＡメチル化レベルと血漿ＤＮＡの断片サイズとの間の相関関係を示す。（Ａ）０～２０ｋｂのサイズ範囲。（Ｂ）０～１ｋｂのサイズ範囲。本発明の実施形態による、妊娠中の女性の母体血漿ＤＮＡにおいて特定された長い胎児特異的ＤＮＡ分子の一例を示す。（Ａ）黒色の棒は、ヒト参照ゲノムの第１０染色体中の領域にアラインメントされた長い胎児特異的ＤＮＡ分子を示す。（Ｂ）本開示に従ってＰａｃＢｉｏ配列決定を使用して決定された遺伝子およびエピジェネティックの詳細な図。（矢印で印された）黄色で強調表示された塩基は、いくつかの実施形態において補正され得る配列誤差が原因である可能性が高い。本発明の実施形態による、妊娠中の女性の母体血漿ＤＮＡにおいて特定された長い胎児特異的ＤＮＡ分子の一例を示す。（Ａ）黒色の棒は、ヒト参照ゲノムの第１０染色体中の領域にアラインメントされた長い胎児特異的ＤＮＡ分子を示す。（Ｂ）本開示に従ってＰａｃＢｉｏ配列決定を使用して決定された遺伝子およびエピジェネティックの詳細な図。（矢印で印された）黄色で強調表示された塩基は、いくつかの実施形態において補正され得る配列誤差が原因である可能性が高い。本発明の実施形態による、妊娠中の女性の母体血漿ＤＮＡにおいて特定された共有対立遺伝子を担持する長い母体ＤＮＡ分子の一例を示す。（Ａ）黒色の棒は、ヒト参照の第６染色体中の領域にアラインメントされた長い母体特異的ＤＮＡ分子を示す。（Ｂ）本発明の実施形態に従ってＰａｃＢｉｏ配列決定を使用して決定された遺伝子情報およびエピジェネティック情報の詳細な図。本発明の実施形態による、妊娠中の女性の母体血漿ＤＮＡにおいて特定された共有対立遺伝子を担持する長い母体ＤＮＡ分子の一例を示す。（Ａ）黒色の棒は、ヒト参照の第６染色体中の領域にアラインメントされた長い母体特異的ＤＮＡ分子を示す。（Ｂ）本発明の実施形態に従ってＰａｃＢｉｏ配列決定を使用して決定された遺伝子情報およびエピジェネティック情報の詳細な図。本発明の実施形態による、１ｋｂ～２０ｋｂの異なる分解能でのメチル化レベルに応じた胎盤（赤色）および母体血球（青色）からのＤＮＡについての頻度分布を示す。本発明の実施形態による、１６ｋｂおよび２４ｋｂウィンドウ内のメチル化レベルに応じた胎盤（赤色）および母体血球（青色）からのＤＮＡについての頻度分布を示す。本発明の実施形態による、１６ｋｂおよび２４ｋｂウィンドウ内のメチル化レベルに応じた胎盤（赤色）および母体血球（青色）からのＤＮＡについての頻度分布を示す。本発明の実施形態による、妊娠中の女性の母体血漿ＤＮＡにおいて特定された長い母体特異的ＤＮＡ分子の一例を示す。（Ａ）黒色の棒は、ヒト参照の第８染色体中の領域にアラインメントされた長い母体特異的ＤＮＡ分子を示す。（Ｂ）本発明の実施形態に従ってＰａｃＢｉｏ配列決定を使用して決定された遺伝子およびエピジェネティックの詳細な図。本発明の実施形態による、妊娠中の女性の母体血漿ＤＮＡにおいて特定された長い母体特異的ＤＮＡ分子の一例を示す。（Ａ）黒色の棒は、ヒト参照の第８染色体中の領域にアラインメントされた長い母体特異的ＤＮＡ分子を示す。（Ｂ）本発明の実施形態に従ってＰａｃＢｉｏ配列決定を使用して決定された遺伝子およびエピジェネティックの詳細な図。本発明の実施形態による、胎児の母性遺伝を推定する図を示す。本発明の実施形態による、母体および胎児起源の情報を用いた血漿ＤＮＡ分子における遺伝性／エピジェネティック障害の決定を示す。本発明の実施形態による、胎児異常断片の特定を示す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。「．」は、ワトソン鎖内の参照塩基と同一の塩基を表す。「，」は、クリック鎖内の参照塩基と同一の塩基を表す。「アルファベット文字」は、参照対立遺伝子とは異なる代替の対立遺伝子を表す。「＊」は、挿入を表す。「＾」は、欠失を表す。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析する方法を示す。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析して、ハプロタイプの遺伝を決定する方法を示す。本発明の実施形態による、血漿中の長いＤＮＡ分子の起源組織を決定するためのメチル化パターンを示す。本発明の実施形態による、胎児および母体起源の決定のための受信者動作特性（ＲＯＣ）曲線を示す。本発明の実施形態による一対メチル化パターンを示す。本発明の実施形態による、異なる染色体間の選択されたマーカー領域の分布の表である。本発明の実施形態による、マーカー領域の選択基準として、０．３よりも大きい不一致スコア有するバフィーコートＤＮＡ分子の異なるパーセンテージを使用した、単一分子のメチル化パターンに基づく血漿ＤＮＡ分子の分類の表である。本発明の実施形態による、胎盤特異的メチル化ハプロタイプを使用して、非侵襲的方法で胎児遺伝を決定するためのプロセスフローを示す。本発明の実施形態による、母体血漿中の長い無細胞ＤＮＡを使用した脆弱Ｘ症候群の非侵襲的出生前検出の原理を示す。本発明の実施形態による、メチル化パターンに基づく胎児の母性遺伝を示す。本発明の実施形態による、血漿ＤＮＡ分子の遺伝子情報およびエピジェネティック情報を使用した胎児の母性遺伝の定性分析を示す。本発明の実施形態による、相対ハプロタイプ投与量（ＲＨＤＯ）分析と比較した、血漿ＤＮＡ分子の遺伝子情報およびエピジェネティック情報を使用したゲノムワイドな方法における胎児の母性遺伝についての定性分析の検出率を示す。本発明の実施形態による、ゲノムワイドな方法における父性特異的バリアントの検出率と、分析に使用された異なるサイズを有する配列決定された血漿ＤＮＡ分子の数との間の関係を示す。本発明の実施形態による、脆弱Ｘ症候群の非侵襲的検出のためのワークフローを示す。本発明の実施形態による、胎盤およびバフィーコートＤＮＡのメチル化プロファイルと比較した血漿ＤＮＡのメチル化パターンを示す。本発明の実施形態による、ヒトゲノムにわたる５００ｂｐ領域内のＣｐＧ部位の分布を示す表である。本発明の実施形態による、ヒトゲノムにわたる１ｋｂ領域内のＣｐＧ部位の分布を示す表である。本発明の実施形態による、ヒトゲノムにわたる３ｋｂ領域内のＣｐＧ部位の分布を示す表である。本発明の実施形態による、メチル化状態マッチング分析を使用した、母体血漿中の異なる組織からのＤＮＡ分子の比例的寄与を示す表である。本発明の実施形態による、胎盤寄与とＳＮＰアプローチによって推定された胎児ＤＮＡ画分との間の関係を示す。本発明の実施形態による、胎盤寄与とＳＮＰアプローチによって推定された胎児ＤＮＡ画分との間の関係を示す。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析して、メチル化パターン分析を使用して起源組織を決定する方法を示す。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布を示す。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布を示す。発明の実施形態による、異なる妊娠期における長い血漿ＤＮＡ分子の割合を示す表である。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。発明の実施形態による、異なる妊娠期における長い胎児および母体血漿ＤＮＡ分子の割合の表である。本発明の実施形態による、異なる妊娠期にわたる特定のサイズ範囲の胎児特異的血漿ＤＮＡ断片の割合のプロットを示す。本発明の実施形態による、異なる妊娠期にわたる特定のサイズ範囲の胎児特異的血漿ＤＮＡ断片の割合のプロットを示す。本発明の実施形態による、異なる妊娠期にわたる特定のサイズ範囲の胎児特異的血漿ＤＮＡ断片の割合のプロットを示す。本発明の実施形態による、０～３ｋｂの断片サイズの範囲にわたる、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの無細胞ＤＮＡ分子の５’末端の塩基含有量の割合のグラフを示す。本発明の実施形態による、０～３ｋｂの断片サイズの範囲にわたる、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの無細胞ＤＮＡ分子の５’末端の塩基含有量の割合のグラフを示す。本発明の実施形態による、０～３ｋｂの断片サイズの範囲にわたる、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの無細胞ＤＮＡ分子の５’末端の塩基含有量の割合のグラフを示す。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子間での末端ヌクレオチド塩基の割合の表である。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの胎児特異的対立遺伝子をカバーする短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子間での末端ヌクレオチド塩基の割合の表である。本発明の実施形態による、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの母体特異的対立遺伝子をカバーする短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子間での末端ヌクレオチド塩基の割合の表である。本発明の実施形態による、２５６個の末端モチーフを使用した短いおよび長い血漿無細胞ＤＮＡ分子の階層的クラスタリング分析を示す。本発明の実施形態による、４ｍｅｒ末端モチーフプロファイルの主成分分析を示す。本発明の実施形態による、妊娠初期の母体血漿からの短い血漿ＤＮＡ分子間で最も頻度が高い２５個の末端モチーフの表である。本発明の実施形態による、妊娠中期の母体血漿からの短い血漿ＤＮＡ分子間で最も頻度が高い２５個の末端モチーフの表である。本発明の実施形態による、妊娠後期の母体血漿からの短い血漿ＤＮＡ分子間で最も頻度が高い２５個の末端モチーフの表である。本発明の実施形態による、妊娠初期の母体血漿からの長い血漿ＤＮＡ分子間で最も頻度が高い２５個の末端モチーフの表である。本発明の実施形態による、妊娠中期の母体血漿からの長い血漿ＤＮＡ分子間で最も頻度が高い２５個の末端モチーフの表である。本発明の実施形態による、妊娠後期の母体血漿からの長い血漿ＤＮＡ分子間で最も頻度が高い２５個の末端モチーフの表である。本発明の実施形態による、（Ａ）妊娠初期、（Ｂ）妊娠中期、および（Ｃ）妊娠後期の母体血漿中の短いおよび長い血漿ＤＮＡ分子間の１６個のＮＮＸＹモチーフのモチーフ頻度の散布図を示す。本発明の実施形態による、（Ａ）妊娠初期、（Ｂ）妊娠中期、および（Ｃ）妊娠後期の母体血漿中の短いおよび長い血漿ＤＮＡ分子間の１６個のＮＮＸＹモチーフのモチーフ頻度の散布図を示す。本発明の実施形態による、（Ａ）妊娠初期、（Ｂ）妊娠中期、および（Ｃ）妊娠後期の母体血漿中の短いおよび長い血漿ＤＮＡ分子間の１６個のＮＮＸＹモチーフのモチーフ頻度の散布図を示す。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析して、在胎期間を決定する方法を示す。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析して、妊娠関連障害の尤度を分類する方法を示す。本発明の実施形態による、４つの子癇前症の症例の臨床情報を示す表である。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、子癇前症および正常血圧の妊娠後期の母体血漿試料からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の胎児特異的対立遺伝子および母体特異的対立遺伝子をカバーする短いＤＮＡ分子の割合のグラフである。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の胎児特異的対立遺伝子および母体特異的対立遺伝子をカバーする短いＤＮＡ分子の割合のグラフである。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定およびＩｌｌｕｍｉｎａ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の短いＤＮＡ分子の割合のグラフである。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定およびＩｌｌｕｍｉｎａ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の短いＤＮＡ分子の割合のグラフである。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の、短いＤＮＡ分子および長いＤＮＡ分子の相対的割合を示すサイズ比のグラフである。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の血漿ＤＮＡ分子の異なる末端の割合を示す。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の血漿ＤＮＡ分子の異なる末端の割合を示す。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の血漿ＤＮＡ分子の異なる末端の割合を示す。本発明の実施形態による、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の血漿ＤＮＡ分子の異なる末端の割合を示す。本発明の実施形態による、４タイプの断片末端（各鎖の５’末端の第１のヌクレオチド）、すなわちＣ末端、Ｇ末端、Ｔ末端、およびＡ末端の各々を有する血漿ＤＮＡ分子の頻度を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。本発明の実施形態による、１６個の２ヌクレオチドモチーフＸＹＮＮ（５’末端からの第１および第２のヌクレオチドのジヌクレオチド配列）を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。本発明の実施形態による、１６個の２ヌクレオチドモチーフＮＮＸＹ（５’末端からの第３および第４のヌクレオチドのジヌクレオチド配列）を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。本発明の実施形態による、２５６個の４ヌクレオチドモチーフ（５’末端からの第１～第４のヌクレオチドのジヌクレオチド配列）を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。本発明の実施形態による、子癇前症および正常血圧の母体血漿ＤＮＡ試料中の４タイプの断片末端間のＴ細胞の寄与を示す。本発明の実施形態による、子癇前症および正常血圧の母体血漿ＤＮＡ試料中の４タイプの断片末端間のＴ細胞の寄与を示す。本発明の実施形態による、子癇前症および正常血圧の母体血漿ＤＮＡ試料中の４タイプの断片末端間のＴ細胞の寄与を示す。本発明の実施形態による、子癇前症および正常血圧の母体血漿ＤＮＡ試料中の４タイプの断片末端間のＴ細胞の寄与を示す。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析して、妊娠関連障害の尤度を決定する方法を示す。本発明の実施形態による、反復関連疾患についての胎児の母性遺伝を推定する図を示す。本発明の実施形態による、反復関連疾患についての胎児の父性遺伝を推定する図を示す。反復伸長病の例を示す表である。反復伸長病の例を示す表である。反復伸長病の例を示す表である。本発明の実施形態による、胎児における反復伸長検出および反復関連メチル化決定の例を示す表である。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析して、胎児における遺伝性障害の尤度を決定する方法を示す。本発明の実施形態による、胎児を妊娠中の女性から取得された生物学的試料を分析して、父子関係を決定する方法を示す。サイズ選択後の２つの代表的な血漿ＤＮＡ分子についてのメチル化パターンを示す。本発明の実施形態による、サイズ選択ありおよびなしの試料についての配列決定情報の表である。本発明の実施形態による、ビーズベースのサイズ選択ありおよびなしの試料についての血漿ＤＮＡサイズプロファイルのグラフを示す。本発明の実施形態による、ビーズベースのサイズ選択ありおよびなしの試料についての血漿ＤＮＡサイズプロファイルのグラフを示す。本発明の実施形態による、サイズ選択ありの試料中の胎児ＤＮＡ分子と母体ＤＮＡ分子との間のサイズプロファイルを示す。本発明の実施形態による、サイズ選択ありの試料中の胎児ＤＮＡ分子と母体ＤＮＡ分子との間のサイズプロファイルを示す。本発明の実施形態による、サイズ選択ありおよびなしの試料間の有益なＳＮＰを担持する血漿ＤＮＡ分子の数についての統計表である。本発明の実施形態による、サイズ選択された、およびサイズ選択されていない血漿ＤＮＡ試料中のメチル化レベルの表である。本発明の実施形態による、母体または胎児特異的無細胞ＤＮＡ分子のメチル化レベルの表である。本発明の実施形態による、サイズ選択ありおよびなしの試料中の上位１０個の末端モチーフの表である。本発明の実施形態による、長い血漿ＤＮＡ分子が起源組織分析の性能を増強することを示す受信者動作特性（ＲＯＣ）グラフである。本発明の実施形態による、血漿ＤＮＡ分子についてのエアポート配列決定の原理を示す。本発明の実施形態による、特定のサイズ範囲内の血漿ＤＮＡ分子のパーセンテージおよびそれらの対応するメチル化レベルの表である。本発明の実施形態による、異なるサイズにわたるサイズ分布およびメチル化パターンのグラフである。本発明の実施形態による、ナノポア配列決定を使用して決定された胎児ＤＮＡ画分の表である。本発明の実施形態による、胎児特異的ＤＮＡ分子と母体特異的ＤＮＡ分子との間のメチル化レベルの表である。本発明の実施形態による、胎児および母体ＤＮＡ分子についての特定のサイズ範囲内の血漿ＤＮＡ分子のパーセンテージおよびそれらの対応するメチル化レベルの表である。本発明の実施形態による、ナノポア配列決定によって決定された胎児および母体ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、ナノポア配列決定によって決定された胎児および母体ＤＮＡ分子のサイズ分布のグラフである。本発明の実施形態による、単一の有益なＳＮＰおよび２つの有益なＳＮＰに基づく、胎児ＤＮＡ分子と母体ＤＮＡ分子との間のメチル化レベルの差を示すグラフである。本発明の実施形態による、胎児ＤＮＡ分子と母体ＤＮＡ分子との間のメチル化レベルの差の表である。本発明の実施形態による測定システムを示す。本発明の実施形態によるコンピュータシステムを示す。

用語
「組織」は、妊娠中の対象またはその胎児における機能単位としてともに群化する細胞の群に対応する。２つ以上のタイプの細胞が、単一の組織内に見出され得る。異なるタイプの組織は、異なるタイプの細胞（例えば、肝細胞、肺胞細胞、または血球）からなり得るが、異なる生物由来の組織（母体対胎児、移植を受けた妊娠中の対象の組織、微生物またはウイルスに感染した妊娠中の生物またはその胎児の組織）にも対応し得る。「参照組織」は、組織特異的メチル化レベルを決定するために使用される組織に対応し得る。異なる妊娠中の個体またはその胎児由来の同じ組織タイプの複数の試料を使用して、その組織タイプの組織特異的メチル化レベルを決定し得る。

「生物学的試料」は、妊娠中の対象（例えば、妊娠中の女性、障害を有する人、もしくは障害を有する疑いがある妊娠中の人、妊娠中の臓器移植レシピエント、または臓器が関与する疾患プロセス（例えば、心筋梗塞における心臓、脳卒中における脳、もしくは貧血における造血系）を有する疑いがある妊娠中の対象などのヒト（または他の動物））から採取され、目的の１つ以上の核酸分子を含有する任意の試料を指す。生物学的試料は、血液、血漿、血清、尿、膣液、膣洗浄液体、胸膜液、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳首からの排出液、身体の異なる部分（例えば、甲状腺、乳腺）からの吸引液、眼内液（例えば、房水）などの体液であり得る。便試料もまた、使用され得る。様々な実施形態において、無細胞ＤＮＡのために濃縮された生物学的試料（例えば、遠心分離プロトコルを介して取得された血漿試料）におけるＤＮＡの大部分は、無細胞であり得、例えば、ＤＮＡの５０％超、６０％超、７０％超、８０％超、９０％超、９５％超、または９９％超は、無細胞であり得る。遠心分離プロトコルは、例えば、３，０００ｇ×１０分で流体部分を取得することと、残留細胞を除去するために３０，０００ｇでさらに１０分間再遠心分離することと、を含み得る。生物学的試料の分析の一部として、統計的に有意な数の無細胞ＤＮＡ分子が、生物学的試料について分析され得る（例えば、正確な測定値を提供するために）。いくつかの実施形態において、少なくとも１，０００個の無細胞ＤＮＡ分子が分析される。他の実施形態において、少なくとも１０，０００個または５０，０００個または１００，０００個または５００，０００個または１，０００，０００個または５，０００，０００個、またはそれより多い無細胞ＤＮＡ分子が分析され得る。少なくとも同数の配列リードが分析され得る。

「配列リード」は、核酸分子の任意の部分または全部から配列決定されるヌクレオチドの鎖を指す。例えば、配列リードは、核酸断片から配列決定された短鎖ヌクレオチド（例えば、約２０～１５０ヌクレオチド）、核酸断片の片端もしくは両端の短鎖ヌクレオチド、または生物学的試料中に存在する核酸断片全体の配列決定であり得る。配列リードは、例えば、配列決定技術を使用した、またはプローブを使用した様々な方法で、例えば、ハイブリダイゼーションアレイもしくはマイクロアレイで使用され得るような捕捉プローブで、または単一プライマーもしくは等温増幅を使用した、ポリメラーゼ連鎖反応（ＰＣＲ）もしくは線形増幅などの増幅技術で、取得することができる。生物学的試料の分析の一部として、統計的に有意な数の配列リードが分析され得、例えば、少なくとも１，０００個の配列リードが、分析され得る。他の例として、少なくとも１０，０００個または５０，０００個または１００，０００個または５００，０００個または１，０００，０００個または５，０００，０００個、またはそれより多い配列リードが分析され得る。

「部位」（「ゲノム部位」とも呼ばれる）は、単一の塩基位置、または相関する塩基位置の群、例えば、ＣｐＧ部位、または相関する塩基位置のより大きい群であり得る、単一の部位に対応する。「遺伝子座」は、複数の部位を含む領域に対応し得る。遺伝子座は、遺伝子座をその文脈における部位と等価にするであろうただ１つの部位を含み得る。

「メチル化状態」とは、所与の部位でのメチル化の状態を指す。例えば、ある部位は、メチル化されているか、メチル化されていないか、または場合によっては未決定であるかのいずれかである。

各ゲノム部位（例えば、ＣｐＧ部位）に対する「メチル化指数」は、その部位におけるメチル化を、その部位をカバーするリードの総数にわたって示す、（例えば、配列リードまたはプローブから決定されるような）ＤＮＡ断片の割合を指し得る。「リード」は、ＤＮＡ断片から取得された情報（例えば、部位のメチル化状態）に対応することができる。リードは、１つ以上の部位における特定のメチル化状態のＤＮＡ断片と優先的にハイブリダイズする試薬（例えば、プライマーまたはプローブ）を使用して、取得することができる。典型的には、このような試薬は、それらのメチル化状態に応じて、ＤＮＡ分子を示差的に修飾するかまたは認識するプロセス、例えば、バイサルファイト変換、またはメチル化感受性制限酵素、またはメチル化結合タンパク質、または抗メチルシトシン抗体、あるいはメチルシトシンおよびヒドロキシメチルシトシンを認識する単一分子配列決定技術（例えば、単一分子リアルタイム配列決定およびナノポア配列決定（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓから））で処理した後で適用される。

領域の「メチル化密度」は、この領域における部位をカバーするリードの総数で割った、メチル化を示す領域内の部位でのリード数を指し得る。この部位は、具体的な特徴を有し得、例えば、ＣｐＧ部位であり得る。したがって、領域の「ＣｐＧメチル化密度」は、この領域におけるＣｐＧ部位（例えば、特定のＣｐＧ部位、ＣｐＧアイランド内またはそれより大きい領域のＣｐＧ部位）をカバーするリードの総数で割ったＣｐＧメチル化を示すリード数を指す。例えば、ヒトゲノム中の各１００ｋｂビンのメチル化密度は、１００ｋｂ領域へマッピングされた配列リードによってカバーされたすべてのＣｐＧ部位の割合として、ＣｐＧ部位のバイサルファイト処理後に変換されていないシトシン（メチル化されたシトシンに対応する）の総数から決定され得る。この分析はまた、５００ｂｐ、５ｋｂ、１０ｋｂ、５０ｋｂ、もしくは１Ｍｂなどの他のビンサイズに対して実施され得る。領域は、全ゲノム、または染色体、または染色体の一部（例えば、染色体腕）であり得る。ＣｐＧ部位のメチル化指数は、領域がそのＣｐＧ部位のみを含む場合、その領域のメチル化密度と同じである。「メチル化シトシンの割合」は、領域において分析されたシトシン残基の総数、すなわちＣｐＧの文脈外のシトシンを含む、に対する、メチル化されていることが示されている（例えば、バイサルファイト変換後に変換されていない）シトシン部位「Ｃ」の数を指し得る。「メチル化レベル」の例としては、メチル化指数、メチル化密度、１つ以上の部位でメチル化された分子の数、および１つ以上の部位でメチル化された分子（例えば、シトシン）の割合がある。バイサルファイト変換とは別に、当業者に既知の他のプロセスを使用してＤＮＡ分子のメチル化状態を調べることができ、限定されないが、メチル化状態に感受性の酵素（例えば、メチル化感受性制限酵素）、メチル化結合タンパク質、メチル化状態に感受性のプラットフォームを使用した単一分子配列決定（例えば、ナノポア配列決定（Ｓｃｈｒｅｉｂｅｒｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉ２０１３；１１０：１８９１０－１８９１５）、および単一分子リアルタイム配列決定（例えば、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓによる）（Ｆｌｕｓｂｅｒｇｅｔａｌ．ＮａｔＭｅｔｈｏｄｓ２０１０；７：４６１－４６５））が含まれる。

「メチローム」は、ゲノムにおける複数の部位または遺伝子座のＤＮＡメチル化の量の尺度を提供する。メチロームは、ゲノムの全部、ゲノムの実質的な部分、またはゲノムの比較的わずかな箇所に対応し得る。

「メチル化プロファイル」には、複数の部位または領域のＤＮＡまたはＲＮＡのメチル化に関連する情報が含まれる。ＤＮＡメチル化に関連する情報は、ＣｐＧ部位のメチル化指数、領域中のＣｐＧ部位のメチル化密度（略称ＭＤ）、連続した領域にわたるＣｐＧ部位の分布、２つ以上のＣｐＧ部位を含有する領域内の各個々のＣｐＧ部位のメチル化のパターンまたはレベル、および非ＣｐＧメチル化を含み得るが、これらに限定されない。一実施形態では、メチル化プロファイルは、２つ以上のタイプの塩基（例えば、シトシンまたはアデニン）のメチル化または非メチル化のパターンを含み得る。ゲノムの実質的な部分のメチル化プロファイルは、メチロームと等価とみなすことができる。哺乳動物ゲノムにおける「ＤＮＡメチル化」とは、典型的には、ＣｐＧジヌクレオチド間でシトシン残基の５’炭素へのメチル基の付加（すなわち、５－メチルシトシン）を指す。ＤＮＡメチル化は、他の文脈、例えば、ＣＨＧおよびＣＨＨにおいてシトシンで生じ得、ここで、Ｈは、アデニン、シトシン、またはチミンである。シトシンのメチル化は、５－ヒドロキシメチルシトシンの形態でもあり得る。Ｎ^６－メチルアデニンなどの非シトシンメチル化もまた、報告されている。

「メチル化パターン」とは、メチル化塩基と非メチル化塩基の順序を指す。例えば、メチル化パターンは、単一のＤＮＡ鎖、単一の二本鎖ＤＮＡ分子、または別のタイプの核酸分子上のメチル化塩基の順序であり得る。一例として、３つの連続するＣｐＧ部位は、以下のメチル化パターン：ＵＵＵ、ＭＭＭ、ＵＭＭ、ＵＭＵ、ＵＵＭ、ＭＵＭ、ＭＵＵ、またはＭＭＵ、のいずれかを有し得る。ここで、「Ｕ」は非メチル化部位を示し、「Ｍ」はメチル化部位を示す。限定されないが、この概念をメチル化を含む塩基修飾に拡張する場合、修飾塩基と非修飾塩基の順序を指す「修飾パターン」という用語を使用するであろう。例えば、修飾パターンは、単一のＤＮＡ鎖、単一の二本鎖ＤＮＡ分子、または別のタイプの核酸分子上の修飾された塩基の順序であり得る。一例として、３つの連続する潜在的に修飾可能な部位は、以下の修飾パターン：ＵＵＵ、ＭＭＭ、ＵＭＭ、ＵＭＵ、ＵＵＭ、ＭＵＭ、ＭＵＵ、またはＭＭＵ、のいずれかを有し得る。ここで、「Ｕ」は非修飾部位を示し、「Ｍ」は修飾部位を示す。メチル化に基づかない塩基修飾の一例は、８－オキソグアニンなどの酸化的変化である。

「高メチル化」および「低メチル化」という用語は、その単一分子のメチル化レベルによって測定される単一のＤＮＡ分子のメチル化密度、例えば、その分子内のメチル化された塩基またはヌクレオチドの数を、その分子内のメチル化可能な塩基またはヌクレオチドの総数で割ったものを指し得る。高メチル化分子は、単一分子のメチル化レベルが閾値以上である分子であり、用途ごとに定義され得る。この閾値は、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または９５％であり得る。低メチル化分子は、単一分子のメチル化レベルが閾値以下である分子であり、用途ごとに定義され得、用途ごとに変化し得る。この閾値は、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または９５％であり得る。

「高メチル化」および「低メチル化」という用語はまた、これらの分子の複数の分子のメチル化レベルによって測定される、ＤＮＡ分子の集団のメチル化レベルを指してもよい。分子の高メチル化集団は、複数の分子のメチル化レベルが閾値以上である集団であり、用途ごとに定義され得、用途ごとに変化し得る。この閾値は、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または９５％であり得る。分子の低メチル化集団は、複数の分子のメチル化レベルが閾値以下である集団であり、用途ごとに定義され得、用途ごとに変化し得る。この閾値は、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または９５％であり得る。一実施形態では、分子の集団は、１つ以上の選択されたゲノム領域に整列され得る。一実施形態において、選択されたゲノム領域は、遺伝性障害、インプリンティング障害、代謝障害、または神経障害などの疾患に関連し得る。選択されたゲノム領域は、５０ヌクレオチド（ｎｔ）、１００ｎｔ、２００ｎｔ、３００ｎｔ、５００ｎｔ、１０００ｎｔ、２ｋｎｔ、５ｋｎｔ、１０ｋｎｔ、２０ｋｎｔ、３０ｋｎｔ、４０ｋｎｔ、５０ｋｎｔ、６０ｋｎｔ、７０ｋｎｔ、８０ｋｎｔ、９０ｋｎｔ、１００ｋｎｔ、２００ｋｎｔ、３００ｋｎｔ、４００ｋｎｔ、５００ｋｎｔ、または１Ｍｎｔの鎖長を有し得る。

「配列決定深度」という用語は、遺伝子座が、その遺伝子座にアラインメントされた配列リードによってカバーされる回数を指す。遺伝子座は、ヌクレオチドの小ささ、または染色体腕の大きさ、またはゲノム全体の大きさであり得る。配列決定深度は、５０ｘ、１００ｘなどと表され、「ｘ」は、遺伝子座が配列リードでカバーされる回数を指す。また、配列決定深度は、複数の遺伝子座またはゲノム全体に適用することもでき、この場合、ｘはそれぞれ、遺伝子座もしくはハプロイドゲノムまたはゲノム全体が配列決定される平均回数を指し得る。ウルトラディープ配列決定は、少なくとも１００ｘの配列決定深度を指し得る。

「較正試料」は、臨床的関連ＤＮＡの画分濃度（例えば、組織特異的ＤＮＡ画分）が既知であるか、または較正方法を介して、例えば、ドナーのゲノムには存在するがレシピエントのゲノムには存在しない対立遺伝子を移植臓器のマーカーとして使用し得る妊娠中の対象における移植など、組織に特異的な対立遺伝子を使用して決定される生物学的試料に対応し得る。別の例として、較正試料は、末端モチーフを決定し得る試料に対応し得る。較正試料は、両方の目的に使用され得る。

「較正データ点」は、「較正値」および臨床的関連ＤＮＡ（例えば、特定の組織タイプのＤＮＡ）の測定されたまたは既知の画分濃度を含む。較正値は、臨床的関連ＤＮＡの画分濃度が既知である較正試料について決定された相対頻度（例えば、集計値）から決定され得る。較正データ点は、様々な方法で、例えば、離散点として、または較正関数（検量線または較正面とも呼ばれる）として定義され得る。較正関数は、較正データ点の追加の数学的変換から導出され得る。

「分離値」は、２つの値を包含する差または比、例えば、２つの画分寄与または２つのメチル化レベルに相当する。分離値は、単純な差または比であり得る。例として、ｘ／ｙの直接比は、ｘ／（ｘ＋ｙ）と同様に分離値である。分離値は、他の因子、例えば、乗法的因子を含み得る。他の例として、値の関数の差または比、例えば、２つの値の自然対数（ｌｎ）の差または比が使用され得る。分離値には、差および比を含み得る。

「分離値」および「集計値」（例えば、相対頻度）は、異なる分類（状態）間で変化する試料の測定値を提供するパラメータ（メトリックとも呼ばれる）の２つの例であり、したがって様々な分類を決定するために使用され得る。集計値は、例えば、クラスタリングで行われるように、試料の相対頻度のセットと相対頻度の参照セット間で差が取られる場合の分離値であり得る。

本明細書で使用される「分類」という用語は、試料の特定の特性と関係した任意の数または他の特徴を指す。例えば、「＋」という記号（または「陽性」という語）は、試料が欠失または増幅を有するものとして分類されることを意味し得る。分類は、二者択一（例えば、陽性もしくは陰性）であり得、またはより多くのレベルの分類（例えば、１～１０もしくは０～１のスケール）を有し得る。

本明細書で使用される場合、「パラメータ」という用語は、定量的データセットを特徴付ける数値、および／または定量的データセット間の数的関連性を意味する。例えば、第１の核酸配列の第１の量と第２の核酸配列の第２の量との比率（またはある比率の関数）は、パラメータである。

「サイズプロファイル」という用語は一般に、生物学的試料中のＤＮＡ断片のサイズに関する。サイズプロファイルは、様々なサイズのある量のＤＮＡ断片の分布を提供するヒストグラムであり得る。様々な統計パラメータ（サイズパラメータまたは単にパラメータとも呼ばれる）を使用して、あるサイズプロファイルを別のサイズプロファイルと区別することができる。１つのパラメータは、すべてのＤＮＡ断片に対する、または他のサイズもしくは範囲のＤＮＡ断片に対する、特定のサイズもしくはサイズ範囲のＤＮＡ断片の割合である。

「カットオフ」および「閾値」という用語は、ある操作において使用される所定の数を指す。例えば、カットオフサイズは、それを超えると断片が除外されるサイズを指し得る。閾値は、特定の分類が適用されるのを上回るまたは下回る値であり得る。これらの用語のいずれかは、これらの文脈のいずれかにおいて使用され得る。カットオフまたは閾値は、「参照値」であり得るか、または特定の分類を表すか、もしくは２つ以上の分類間を区別する参照値から導出され得る。そのような参照値は、当業者によって理解されるように、様々な方法で決定され得る。例えば、異なる既知の分類を有する対象の２つの異なるコホートについて、メトリックを決定することができ、参照値を１つの分類（例えば、平均）の代表として、またはメトリックの２つのクラスター間の値（例えば、所望の感度と特異度を取得するために選択される）として選択し得る。別の例として、参照値は、統計分析または試料のシミュレーションに基づいて決定することができる。カットオフ、閾値、参照などの特定の値は、所望の精度（例えば、感度および特異度）に基づいて決定され得る。

「妊娠関連障害」には、母体および／もしくは胎児組織における遺伝子の異常な相対的発現レベルによって、ならびに／または母体および／もしくは胎児における異常な臨床特性によって特徴付けられる任意の障害が含まれる。これらの障害としては、子癇前症（Ｋａａｒｔｏｋａｌｌｉｏｅｔａｌ．ＳｃｉＲｅｐ．２０１５；５：１４１０７、Ｍｅｄｉｎａ－Ｂａｓｔｉｄａｓｅｔａｌ．ＩｎｔＪＭｏｌＳｃｉ．２０２０；２１：３５９７）、子宮内胎児発育遅延（Ｆａｘｅｎｅｔａｌ．ＡｍＪＰｅｒｉｎａｔｏｌ．１９９８；１５：９－１３、Ｍｅｄｉｎａ－Ｂａｓｔｉｄａｓｅｔａｌ．ＩｎｔＪＭｏｌＳｃｉ．２０２０；２１：３５９７）、侵襲的胎盤形成、早産（Ｅｎｑｕｏｂａｈｒｉｅｅｔａｌ．ＢＭＣＰｒｅｇｎａｎｃｙＣｈｉｌｄｂｉｒｔｈ．２００９；９：５６）、新生児溶血性疾患、胎盤機能不全（Ｋｅｌｌｙｅｔａｌ．Ｅｎｄｏｃｒｉｎｏｌｏｇｙ．２０１７；１５８：７４３－７５５）、胎児水腫（Ｍａｇｏｒｅｔａｌ．Ｂｌｏｏｄ．２０１５；１２５：２４０５－１７）、胎児奇形（Ｓｌｏｎｉｍｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００９；１０６：９４２５－９）、ＨＥＬＬＰ症候群（Ｄｉｊｋｅｔａｌ．ＪＣｌｉｎＩｎｖｅｓｔ．２０１２；１２２：４００３－４０１１）、全身性エリテマトーデス（Ｈｏｎｇｅｔａｌ．ＪＥｘｐＭｅｄ．２０１９；２１６：１１５４－１１６９）、および他の母親の免疫疾患が挙げられるが、これらに限定されない。

略語「ｂｐ」は、塩基対を指す。場合によっては、「ｂｐ」は、ＤＮＡ断片が一本鎖であり、塩基対を含まない場合でも、ＤＮＡ断片の鎖長を示すために使用され得る。一本鎖ＤＮＡの文脈では、「ｂｐ」は、ヌクレオチドの鎖長を提供すると解釈される場合がある。

略語「ｎｔ」は、ヌクレオチドを指す。場合によっては、「ｎｔ」を使用して、塩基単位で一本鎖ＤＮＡの長さを示し得る。また、「ｎｔ」は、分析される遺伝子座の上流または下流などの相対位置を示すために使用され得る。二本鎖ＤＮＡの場合、「ｎｔ」はそれでもなお、文脈上明らかに他の指示がない限り、２本の鎖のヌクレオチドの総数ではなく単一の鎖の長さを指し得る。技術的概念化、データ表示、処理、および分析に関する一部の文脈では、「ｎｔ」と「ｂｐ」は互換的に使用される場合がある。

「機械学習モデル」という用語には、試料データ（例えば、訓練データ）を使用して試験データを予測することに基づくモデルが含まれる場合があり、したがって、教師あり学習が含まれ得る。機械学習モデルは、しばしば、コンピュータまたはプロセッサを使用して開発される。機械学習モデルには、統計モデルが含まれ得る。

「データ分析フレームワーク」という用語は、データを入力として受け取り、次に予測結果を出力することができるアルゴリズムおよび／またはモデルを含み得る。「データ分析フレームワーク」の例には、統計モデル、数学的モデル、機械学習モデル、その他の人工知能モデル、およびそれらの組み合わせが含まれる。

「リアルタイム配列決定」という用語は、配列決定に関与する反応の進行中にデータ収集または監視を伴う技術を指す場合がある。例えば、リアルタイム配列決定は、新しい塩基を組み込むＤＮＡポリメラーゼの光学的監視または撮影を伴う場合がある。

「部分配列」という用語は、核酸分子に対応する完全な配列よりも少ない一連の塩基を指し得る。例えば、核酸分子の完全な配列が５つ以上の塩基を含む場合、部分配列は、１、２、３、または４つの塩基を含み得る。いくつかの実施形態において、部分配列は、単位を形成する一連の塩基を指し得、単位は、タンデムに連続して複数回反復される。例としては、トリヌクレオチド反復障害と関連する遺伝子座で反復される３ｎｔ単位もしくは部分配列、マイクロサテライトとして５～５０回反復される１ｎｔ～６ｎｔ単位もしくは部分配列、マイクロサテライトとして、またはＡｌｕ反復などの他の遺伝子要素において５～５０回反復される１０ｎｔ～６０ｎｔ単位もしくは部分配列が挙げられる。

「約」または「およそ」という用語は、当業者によって決定される特定の値の許容誤差範囲内を意味し得、これは値の測定または決定方法、すなわち測定システムの制限について部分的に依存する。例えば、「約」は、当技術分野の慣例により、１以内または１を超える標準偏差を意味し得る。あるいは、「約」は、所与の値の最大２０％、最大１０％、最大５％、または最大１％の範囲を意味し得る。あるいは、特に生物学的システムまたはプロセスに関して、「約」または「およそ」という用語は、値の１桁以内、５倍以内、より好ましくは２倍以内を意味し得る。本出願および特許請求の範囲に特定の値が記載されている場合、特に明記しない限り、特定の値の許容誤差範囲内の「約」という用語を想定すべきである。「約」という用語は、当業者によって一般に理解されている意味を有し得る。「約」という用語は、±１０％を指し得る。「約」という用語は、±５％を指し得る。

値の範囲が提供される場合、文脈が明確に別段に示さない限り、その範囲の上限と下限との間の各介在する値も、下限の１０分の１まで具体的に開示されていると理解される。記載された範囲における任意の記載された値または介在する値と、その記載された範囲における任意の他の記載された値または介在する値との間の各より小さい範囲が、本開示の実施形態内に包含される。これらのより小さい範囲の上限および下限は、範囲に独立して含まれるか除外されてもよく、どちらか一方、両方の限度がより小さい範囲に含まれるか、またはどちらも含まれない各範囲も、記載された範囲における任意の具体的に除外された限度を条件として、本開示内に包含される。記載された範囲が一方または両方の限度を含む場合、それらの含まれた限度のいずれかまたは両方を除外する範囲も、本開示に含まれる。

標準的な略語、例えば、ｂｐ：塩基対、ｋｂ：キロベース、ｐｉ：ピコリットル、ｓまたはｓｅｃ：秒、ｍｉｎ：分、ｈまたはｈｒ：時間、ａａ：アミノ酸、ｎｔ：ヌクレオチドなどが使用され得る。

別段の定義がない限り、本明細書で使用される技術用語および科学用語はすべて、本開示が属する技術の分野における当業者によって一般に理解されているのと同じ意味を有する。本開示の実施形態の実施または試験には、本明細書に記載されているものと類似または同等の任意の方法および材料が使用され得るが、いくつかの潜在的かつ例示的な方法および材料が、ここで説明され得る。

無細胞ＤＮＡ分子の分析は、多くの場合、分析技術の限界の結果として、主に短い無細胞ＤＮＡ断片を伴う。Ｉｌｌｕｍｉｎａ配列決定技術を使用して長いＤＮＡ分子から配列情報を取得する能力が限られていることは、マウス無細胞ＤＮＡの近年の配列決定の結果で実証された（Ｓｅｒｐａｓｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１９；１１６：６４１－６４９）。野生型マウスにおいてＩｌｌｕｍｉｎａ配列決定を使用した場合、配列決定されたＤＮＡ分子の０．０２％のみが、６００ｂｐ～２０００ｂｐの範囲内にあった。ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓからの単一分子リアルタイム（ＳＭＲＴ）技術（すなわち、ＰａｃＢｉｏＳＭＲＴ配列決定）を使用して、Ｉｌｌｕｍｉｎａ配列決定用に元々調製されたＤＮＡライブラリを配列決定した場合でも、配列決定されたＤＮＡ分子の０．３３％のみが、６００ｂｐ～２０００ｂｐの範囲内にあった。これらの報告されたデータは、配列決定ステップが、元のＤＮＡライブラリに存在する６００ｂｐ～２０００ｂｐの範囲内の長いＤＮＡ分子の９３％を失うことを示唆した。

上記の長いＤＮＡ分子の増幅におけるＰＣＲの制限により、ＤＮＡライブラリ調製のステップでもかなりの割合の長い無細胞ＤＮＡ分子が失われると推測した。Ｊａｈｒｅｔａｌは、ゲル電気泳動を使用して、多くのキロベース、例えば約１０，０００の大きいサイズの断片の存在を報告した（Ｊａｈｒｅｔａｌ．ＣａｎｃｅｒＲｅｓ．２００１；６１：１６５９－６５）。しかしながら、ゲル電気泳動画像に示されるバンドは、エピジェネティック情報の提供は言うまでもなく、ゲル内のこれらの分子の配列情報を容易には提供しない。

以前に、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ配列決定プラットフォームを使用して、母体血漿から抽出された無細胞ＤＮＡを研究した（ＣｈｅｎｇｅｔａｌＣｌｉｎＣｈｅｍ．２０１５；６１：１３０５－６）。１ｋｂを超える非常に小さい割合の長い血漿ＤＮＡが観察された（０．０６％～０．３％）。そのような低いパーセンテージは、このプラットフォームの低い配列決定精度の結果である可能性があると仮定した。

無細胞ＤＮＡのこの分野では、ほとんどの研究が短いＤＮＡ分子（例えば、６００ｂｐ未満）に焦点を当てた。長い無細胞ＤＮＡ分子の遺伝子情報およびエピジェネティック情報を含む特性は、調査されていない。本開示は、長い無細胞ＤＮＡ分子を分析する（その遺伝子情報およびエピジェネティック情報、ならびに単一遺伝子障害の非侵襲的検出、胎児ゲノムの解明（例えば、非侵襲的な全胎児ゲノム配列決定）、ゲノムワイドレベルでのデノボ変異の検出、ならびに子癇前症および早期陣痛などの妊娠関連障害の検出／監視などであるが、これらに限定されない非侵襲的出生前検査におけるその臨床的有用性の解読を含む）ための体系的な方法を提供した。

Ｉ．無細胞ＤＮＡサイズ分析
妊娠中の女性から取得された無細胞ＤＮＡ試料を配列決定し、ＤＮＡ断片のかなりの部分が長いことがわかった。長い無細胞ＤＮＡ断片の正確な配列決定を実証した。これらの長い無細胞ＤＮＡ分子のサイズプロファイルを分析した。胎児および母体の長い無細胞ＤＮＡ分子の量を比較した。長い無細胞ＤＮＡ分子は、参照ゲノムにより正確にアライメントされ得る。長い無細胞ＤＮＡ分子は、ハプロタイプの遺伝を決定するために使用され得る。

妊娠後期の妊娠中の女性の１つの血漿ＤＮＡ試料を、ＰａｃＢｉｏＳＭＲＴ配列決定を使用して分析した。二本鎖無細胞ＤＮＡ分子をヘアピンアダプターと連結ライゲーションし、ゼロモード導波路および単一ポリメラーゼ分子を利用した単一分子リードタイム配列決定に供した（Ｅｉｄｅｔａｌ．Ｓｃｉｅｎｃｅ．２００９；３２３：１３３－８）。

１１億個のサブリードを配列決定し、そのうち６億５，９３０万個のサブリードをヒト参照ゲノム（ｈｇ１９）にアラインメントすることができた。サブリードを、４６０万個のＰａｃＢｉｏＳｉｎｇｌｅＭｏｌｅｃｕｌａｒＲｅａｌ－Ｔｉｍｅ（ＳＭＲＴ）配列決定ウェルから生成し、ウェルは、ヒト参照ゲノムにアラインメントされ得る少なくとも１つのサブリードを含有した。平均して、ＳＭＲＴウェル内の各分子を平均１４３回配列決定した。この例では、４５０万個の循環コンセンサス配列（ＣＣＳ）があり、下流分析に使用され得る４５０万個の無細胞ＤＮＡ分子を示唆している。各無細胞ＤＮＡのサイズを、特定された塩基の数をカウントすることによってＣＣＳから決定した。

図１Ａおよび１Ｂは、０～２０ｋｂの無細胞ＤＮＡのサイズ分布を示す。ｙ軸は、頻度を示す。ｘ軸は、線形スケール（図１Ａ）または対数スケール（図１Ｂ）での０～２０ｋｂの塩基対のサイズを示す。配列決定をＤＮＡ分子の全長にわたって実施したため、各ＤＮＡ分子のサイズは、サブリードまたはＣＣＳのヌクレオチド数をカウントすることによって直接決定され得る。ＤＮＡ断片サイズの測定は、ＤＮＡ断片の全長を読み取ることができ、単一分子シーケンサーの使用に限定されない任意の配列決定プラットフォームを使用して達成され得る。例えば、Ｓａｎｇｅｒシーケンサーは、８００ｂｐまで読み取ることができる。Ｉｌｌｕｍｉｎａプラットフォームなどによるショートリード配列決定は、２５０ｂｐまで読み取ることができる。ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓおよびＯｘｆｏｒｄＮａｎｏｐｏｒｅなどの単一分子シーケンサーは、１０，０００ｂｐを超えるまで読み取ることができる。ＤＮＡ断片のサイズはまた、参照ゲノム、例えばヒト参照ゲノムにアラインメントした後に決定され得る。ＤＮＡ断片のサイズは、対末端配列決定、それに続く参照ゲノムへのアラインメントによって決定され得る。図１Ｂは、長い裾パターンを示す。４５０万個のＣＣＳの間で、２００ｂｐよりも大きい無細胞ＤＮＡが２２．５％、３００ｂｐよりも大きいものが１９．０％、４００ｂｐよりも大きいものが１１．８％、５００ｂｐよりも大きいものが１０．６％、６００ｂｐよりも大きいものが８．９％、１ｋｂよりも大きいものが６．４％、２ｋｂよりも大きいものが３．５％、３ｋｂよりも大きいものが１．９％、４ｋｂよりも大きいものが０．９％、および１０ｋｂよりも大きいものが０．０４％あった。現在のＰａｃＢｉｏＳＭＲＴの結果で観察された最長のものは、２９，８０４ｂｐであった。

妊娠中の対象の１つの血漿ＤＮＡを、ＰＣＲベースのライブラリ調製プロトコルを使用してＩｌｌｕｍｉｎａ配列決定プラットフォームでも配列決定した（Ｌｕｎｅｔａｌ．ＣｌｉｎＣｈｅｍ．２０１３；５９：１５８３－９４）。１，８２０万個の対末端リードの間で、２００ｂｐよりも大きい無細胞ＤＮＡが５．３％、３００ｂｐよりも大きいものが２．０％、４００ｂｐよりも大きいものが０．３％、５００ｂｐよりも大きいものが０．２％、６００ｂｐよりも大きいものが０．２％あった（表１）。比較として、５人の妊娠中の対象からの単一分子リアルタイム配列決定データ（すなわち、合計４４０万個のＣＣＳ）を集計することによって、サイズプロファイルを分析した。Ｉｌｌｕｍｉｎａ配列決定プラットフォームによって取得された対応物（０．２％）と比較して、６００ｂｐよりも大きい血漿ＤＮＡ分子がより多く観察された（２８．５６％）。これらの結果は、ＰａｃＢｉｏＳＭＲＴ配列決定が、１４３倍長いＤＮＡ分子（６００ｂｐよりも長い）を実現することを可能にし得ることを示唆した。Ｉｌｌｕｍｉｎａ配列決定プラットフォームでは読み出しがなかったが、単一分子リアルタイム配列決定を使用して、３ｋｂよりも大きい血漿ＤＮＡ分子を４．７７％取得することができる。

ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ配列決定プラットフォームを使用して、１ｋｂを超える非常に小さい割合の長い血漿ＤＮＡ分子（０．０６％～０．３％）を示した以前の報告（ＣｈｅｎｇｅｔａｌＣｌｉｎＣｈｅｍ．２０１５；６１：１３０５－６）とは対照的に、１ｋｂを超える２１倍多い血漿ＤＮＡ（６．４％）を取得することができ、ＰａｃＢｉｏＳＭＲＴ配列決定が長いＤＮＡ集団から配列情報を取得するのにはるかにより効率的であったことを実証している。

Ｉｌｌｕｍｉｎａ配列決定プラットフォームなどの対末端ショートリード配列決定と比較して、ＰａｃＢｉｏＳＭＲＴ技術などのロングリード配列決定技術は、長いＤＮＡ断片の特性（例えば、長さ）を決定する上で多くの利点を有する。例えば、ロングリードは概して、より正確にヒト参照ゲノム（例えば、ｈｇ１９）にアラインメントすることを可能にする。ロングリード技術はまた、配列決定されたヌクレオチドの数を直接カウントすることによって、血漿ＤＮＡ分子の長さを正確に決定することも可能にする。対照的に、対末端ショートリードベースの血漿ＤＮＡサイズ推定は、アラインメントされた対末端リードの最も外側の座標を使用して血漿ＤＮＡ分子のサイズを推定する間接的な方法である。そのような間接的なアプローチの場合、アラインメンの誤差が、正確なサイズ推定をもたらす。この点で、対末端リード間のサイズ範囲が大きくなると、アライメント誤差の可能性が高くなる。

表１無細胞ＤＮＡのＰａｃＢｉｏ配列決定とＩｌｌｕｍｉｎａ配列決定との間のサイズ分布の比較。

図２Ａおよび２Ｂは、０～５ｋｂの無細胞ＤＮＡのサイズ分布を示す。ｙ軸は、頻度を示す。ｘ軸は、線形スケール（図２Ａ）または対数スケール（図２Ｂ）での０～５ｋｂの塩基対のサイズを示す。周期的なパターンで生じる一連の主要なピークがあった。そのような周期的なパターンは、１ｋｂ～２ｋｂの範囲内の分子にさえ広がっていた。最高頻度（２．６％）のピークは１６６ｂｐであり、これは、Ｉｌｌｕｍｉｎａ技術を使用した以前の発見と一致していた（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１）。図２Ｂ中の隣接する主要なピーク間の距離は約２００ｂｐであり、長い無細胞ＤＮＡ生成がヌクレオソーム構造も伴うことを示唆している。

図３Ａおよび３Ｂは、０～４００ｂｐの無細胞ＤＮＡのサイズ分布を示す。ｙ軸は、頻度を示す。ｘ軸は、線形スケール（図３Ａ）または対数スケール（図３Ｂ）での０～４００ｂｐの塩基対のサイズを示す。以前に報告された（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１）、１６６ｂｐでの最も顕著なピークおよび１６６ｂｐ未満の分子中に生じる１０ｂｐの周期性を有する特徴的な特性はまた、本開示による新しい方法を使用して再現可能であった。これらの結果は、本開示に従って単一分子から配列決定された塩基数をカウントすることによる分子のサイズ決定が信頼できることを示唆した。

Ａ．胎児および母体ＤＮＡについてのサイズ分析
母体および胎児ＤＮＡ断片のサイズを分析および比較した。一例として、１人の妊娠中の女性のバフィーコートＤＮＡおよび対応する胎盤ＤＮＡを配列決定して、それぞれ、５９倍および５８倍のハプロイドゲノムカバレッジを取得した。母親がホモ接合であり、胎児がヘテロ接合であった合計８２２，４０９個の有益な一塩基多型（ＳＮＰ）を特定した。胎児特異的対立遺伝子は、胎児ゲノムには存在するが母体ゲノムには存在しない対立遺伝子として定義される。ＰａｃＢｉｏ配列決定を通して、母体血漿（Ｍ１３１６０）において、２，６５２個の胎児特異的断片および２４，８３７個の共有断片（すなわち、共有対立遺伝子を担持する断片、主に母体起源）を特定した。胎児ＤＮＡ画分は、２１．８％であった。

図４Ａおよび４Ｂは、共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。ｘ軸は、線形スケール（図４Ａ）または対数スケール（図４Ｂ）での０～２０ｋｂの塩基対のサイズを示す。共有対立遺伝子（主に母体起源）および胎児特異的対立遺伝子（胎盤起源）を担持する両方の断片は、長い裾の分布を示し、胎児源および母体源の両方に由来する長いＤＮＡ分子の存在を示唆している。主に母体起源の断片について、サイズが２ｋｂよりも大きい血漿ＤＮＡ分子が２２．６％あった一方で、胎児起源の断片について、サイズが２ｋｂよりも大きい血漿ＤＮＡ分子は、８．５％あった。これらの結果は、胎児ＤＮＡ分子がより少ない長いＤＮＡ分子を含有していたことを示唆した。血漿ＤＮＡの胎児および母体起源に関するこのＳＮＰベースの分析において存在する長いＤＮＡのパーセンテージは、一見したところ、全体的サイズ分析で観察されたものよりもはるかに高かった。そのような相違は、長いＤＮＡ分子が短いものよりも１つ以上のＳＮＰをカバーする可能性が高く、したがって、長いＤＮＡがＳＮＰベースの分析に有利に選択されるという事実が原因である可能性が高かった。元のプール内の対応する長いＤＮＡの割合からスキューされたＳＮＰによってタグ付けされた長いＤＮＡ分子の相対的割合は、それらの分子のサイズによって支配される。それらの胎児特異的ＤＮＡ断片の間で、最長のものが１６，１８６ｂｐであった一方で、共有対立遺伝子を担持する断片の間では、最長のものは２４，１６６ｂｐであった。

図５Ａおよび５Ｂは、共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。ｘ軸は、線形スケール（図５Ａ）または対数スケール（図５Ｂ）での０～５ｋｂの塩基対のサイズを示す。胎児特異的ＤＮＡ断片および共有ＤＮＡ断片の両方について、２ｋｂ未満の断片に対して周期的に生じる一連の主要なピークがあった。主要なピークは、ヌクレオソーム構造と合致する可能性が高かった。

図６Ａおよび６Ｂは、共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。ｘ軸は、線形スケール（図６Ａ）または対数スケール（図６Ｂ）での０～１ｋｂの塩基対のサイズを示す。胎児特異的ＤＮＡ断片および共有ＤＮＡ断片の両方について、１ｋｂ未満の断片に対して周期的に生じる一連の主要なピークがあった。主要なピークは、ヌクレオソーム構造と合致する可能性が高かった。共有ＤＮＡ断片のサイズプロファイルの左側への胎児ＤＮＡサイズプロファイルの観察可能なシフトがあるように思われ、胎児ＤＮＡが母体ＤＮＡよりも短いＤＮＡ分子を含むことを示唆している。

図７Ａおよび７Ｂは、共有対立遺伝子（共有）および胎児特異的対立遺伝子（胎児特異的）を担持する断片間の無細胞ＤＮＡのサイズ分布を示す。ｘ軸は、線形スケール（図７Ａ）または対数スケール（図７Ｂ）での０～４００ｂｐの塩基対のサイズを示す。以前に報告された（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１）、１６６ｂｐでの最も顕著なピークおよび１６６ｂｐ未満の胎児および母体の両方の分子中に生じる１０ｂｐの周期性を有する特徴的な特性はまた、本開示による新しい方法を使用して再現可能であった。これらの結果は、本開示に従って単一分子から配列決定された塩基数をカウントすることによる分子のサイズ決定が信頼できることを示唆した。

Ｂ．サイズおよびメチル化分析
長い無細胞の母体および胎児ＤＮＡ分子のメチル化レベルを分析した。胎児ＤＮＡ分子のメチル化レベルは、母体ＤＮＡ分子のメチル化レベルよりも低いことがわかった。

ＰａｃＢｉｏＳＭＲＴ配列決定において、ＤＮＡポリメラーゼは、蛍光標識されたヌクレオチドの相補鎖への取り込みを媒介する。パルス間持続時間およびパルス幅を含む、ＤＮＡ合成中に生成される蛍光パルスの特性は、我々の以前の開示（「ＤＥＴＥＲＭＩＮＡＴＩＯＮＯＦＢＡＳＥＭＯＤＩＦＩＣＡＴＩＯＮＳＯＦＮＵＣＬＥＩＣＡＣＩＤＳ」と題する２０２０年８月１７日出願の米国出願第１６／９９５，６０７号）（その内容全体は、すべての目的で参照により本明細書に組み込まれる）に記載されるアプローチを使用して、５－メチルシトシンなどであるがこれに限定されない、ヌクレオチド修飾を決定するために使用され得るポリメラーゼ動態を反映する。

実施形態において、母体特異的対立遺伝子を担持する９５，２１０個の断片および胎児特異的対立遺伝子を担持する２，６５２個の断片をそれぞれ特定した。母体特異的対立遺伝子は、本明細書において、母体ゲノムには存在するが胎児ゲノムには存在しない対立遺伝子として定義され、これは、母体がヘテロ接合であり、胎児がホモ接合であるＳＮＰから特定され得る。この例において、合計６７７，３７５個のそのような有益なＳＮＰを特定した。各無細胞ＤＮＡ分子のサイズを決定した。一実施形態において、ゲノム中のメチル化状態が可変であり、例えば、ＣｐＧアイランドのメチル化レベルが概して、ＣｐＧアイランドのない領域よりも低いため、ゲノムコンテキストによって導入される変動を最小限に抑えるために、インシリコで、１ｋｂよりも大きく、少なくとも５つのＣｐＧ部位を含有し、５％未満のＣｐＧ密度（すなわち、０．０５未満の分子中のＣｐＧ部位の数をその分子の全長で割ったもの）に対応する断片を選択することができ、下流分析に使用した。

図８は、母体特異的対立遺伝子を担持する断片と胎児特異的対立遺伝子を担持する断片との間の単一分子、二本鎖ＤＮＡメチル化レベルを示す。ｙ軸は、単一分子、二本鎖ＤＮＡメチル化レベルをパーセントで示す。ｘ軸は、母体特異的対立遺伝子を担持する断片および胎児特異的対立遺伝子を担持する断片の両方を示す。胎児特異的対立遺伝子を担持する断片の単一分子、二本鎖ＤＮＡメチル化レベル（平均：６２．７％、四分位範囲、ＩＱＲ：５０．０％～７７．２％）は、母体特異的対立遺伝子を担持する断片の対応物（平均：７２．７％、ＩＱＲ：６０．６％～８３．３％）よりも低い（Ｐ＜０．０００１）。

図９Ａは、Ｒパッケージ（ｒ－ｐｒｏｊｅｃｔ．ｏｒｇ／）で実装されたカーネル密度推定によって適合された断片の単一分子、二本鎖ＤＮＡメチル化レベルの経験分布を示す。周波数は、ｙ軸上に示される。ｘ軸は、単一分子、二本鎖ＤＮＡメチル化レベルをパーセントで示す。胎児特異的な長いＤＮＡ断片の分布は、母体特異的断片の分布の左側にあり、胎児ＤＮＡ分子中に存在するより低い単一分子、二本鎖ＤＮＡメチル化レベルを示唆している。

図９Ｂは、単一分子、二本鎖ＤＮＡメチル化レベルを使用した受信者動作特性（ＲＯＣ）分析を示す。ｙ軸は、感度を示す。ｘ軸は、特異度を示す。単一分子、二本鎖ＤＮＡメチル化レベルを使用してＲＯＣ分析を実施して、単一分子、二本鎖ＤＮＡメチル化レベルを使用して胎児ＤＮＡ断片と母体ＤＮＡ断片とを区別する能力を調査すると、ＲＯＣ曲線下面積（ＡＵＣ）は、０．６２であることがわかり、これは、０．５のランダムな推測結果よりも大きかった。実施形態において、単一分子中でメチル化状態の配列などのメチル化状態の空間パターン、または修飾塩基とゲノム座標との間の相対もしくは絶対距離を利用して、血漿中の断片について胎児／母体起源の決定をさらに改善することができる。実施形態において、メチル化パターンを、好ましい末端（Ｃｈａｎｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１６；１１３：Ｅ８１５９－８１６８）、末端モチーフ（Ｓｅｒｐａｓｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１９；１１６：６４１－６４９）、サイズ（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ）、配向認識（すなわち、ゲノム内の特定の要素、例えば、オープンクロマチン領域、断片化パターンに関する配向（Ｓｕｎｅｔａｌ．ＧｅｎｏｍｅｓＲｅｓ．２０１９；２９：４１８－４２７））、トポロジー型（例えば、線状対円形ＤＮＡ分子（Ｍａｅｔａｌ．ＣｌｉｎＣｈｅｍ．２０１９；６５：１１６１－１１７０））を含むがこれらに限定されない他の断片化測定基準（すなわち、ＤＮＡの断片化に関するパラメータ）と組み合わせて、胎盤起源（胎児起源）の断片を区別する分類力を改善することができる。

図１０Ａおよび１０Ｂは、胎児および母体の両方のＤＮＡ断片の単一分子、二本鎖ＤＮＡメチル化レベルが断片サイズによって変動したことを示す。ｙ軸は、単一分子、二本鎖ＤＮＡメチル化レベルをパーセントで示す。ｘ軸は、０～２０ｋｂ超（図１０Ａ）および０～１ｋｂ超（図１０Ｂ）のサイズを示す。一方、胎児特異的ＤＮＡ分子の単一分子、二本鎖ＤＮＡメチル化レベルは概して、長い範囲（図１０Ａ）および短い範囲（図１０Ｂ）の両方において、母体特異的ＤＮＡ分子よりも低かった。この発見は、短いＤＮＡ分子についての、胎児ＤＮＡのメチル化レベルが妊娠中の女性の血漿中の母体ＤＮＡよりも低いという現在の知見と一致していた（Ｌｕｎｅｔａｌ．ＣｌｉｎＣｈｅｍ．２０１３；５９：１５８３－９４）。

実施形態において、胎児ＤＮＡ分子のメチル化レベルが母体ＤＮＡ分子よりも比較的低いため、単一分子、二本鎖ＤＮＡメチル化レベルが、８０％、７０％、６０％、５０％、４０％、３０％、２０％、１０％、および５％などであるがこれらに限定されない、特定の閾値未満である分子を選択して、血漿ＤＮＡプール中の胎児起源の無細胞ＤＮＡ分子を濃縮する。例えば、胎児ＤＮＡ画分は、１ｋｂ超の断片について２．６％である。５０％未満の単一分子、二本鎖メチル化レベルを有する断片（１ｋｂ超）を選択した場合、１ｋｂ超のそれらのさらに選択された断片の胎児ＤＮＡ画分は、５．６％に増加する（すなわち、１１５．４％の増加）。別の例において、胎児ＤＮＡ画分は、２００ｂｐ未満の断片について２６．２％である。５０％未満の単一分子、二本鎖メチル化レベルを有する断片（２００ｂｐ未満）を選択した場合、２００ｂｐ超のそれらのさらに選択された断片の胎児ＤＮＡ画分は、４１．６％に増加する（すなわち、５８．８％）。したがって、胎児ＤＮＡを濃縮するための閾値化単一分子、二本鎖ＤＮＡメチル化レベルの使用は、特定の状況下で長いＤＮＡ分子に対してより有効である。

Ｃ．長い無細胞ＤＮＡのハプロタイプおよびメチル化
実施形態において、本開示に記載の方法を使用して、各単一ＤＮＡ分子についての塩基組成、サイズ、および塩基修飾を取得することができる。長い無細胞ＤＮＡ分子のＳＮＰおよびメチル化情報は、ハプロタイプ決定に使用され得る。本開示で明らかにされた無細胞ＤＮＡプール中に存在する長いＤＮＡ分子の使用は、限定されないが、公開された方法（Ｅｄｇｅｅｔａｌ．ＧｅｎｏｍｅＲｅｓ．２０１７；２７：８０１－８１２、Ｗｅｎｇｅｒｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１９；３７：１１５５－１１６２）に従って、各コンセンサス配列に存在するハプロタイプ情報を利用することによって、ゲノム中のバリアントのフェージングを可能にする。組織ＤＮＡから調製された長いＤＮＡに依存しなければならない以前の研究とは異なる、無細胞ＤＮＡの配列情報に従ってハプロタイプを決定する実装。ゲノム領域内のハプロタイプは、時にハプロタイプブロックと称され得る。ハプロタイプブロックは、段階化された染色体上の対立遺伝子のセットとみなすことができる。いくつかの実施形態において、ハプロタイプブロックは、染色体上で物理的に連結された２つの対立遺伝子を支持する配列情報のセット、ならびに異なる配列間の対立遺伝子重複情報に従って、可能な限り長く延長される。

図１１Ａおよび１１Ｂは、妊娠中の女性の母体血漿ＤＮＡにおいて特定された長い胎児特異的ＤＮＡ分子の一例を示す。それらの胎児特異的ＤＮＡ断片の間で、１６，１８６ｂｐであった１つの分子を使用した本発明の実施形態をここに示し、この断片は、ヒト参照ゲノムの第１０染色体の領域（ｃｈｒ１０：５６２８２９８１～５６２９９１６６）にアラインメントされた（図１１Ａ）、および７つの胎児特異的対立遺伝子を担持した（図１１Ｂ）。（Ｉｌｌｕｍｉｎａプラットフォームを使用して）母体および胎児ゲノムの深度配列決定から推定された対立遺伝子情報と一致した胎児特異的対立遺伝子は、７つのうち６つであった（図１１Ｂ）。そのメチル化レベルは、本開示に記載の方法に従って２７．１％であると決定され（図１１Ｂ）、これは、母体特異的断片の平均レベル（７２．７％）よりもはるかに低かった。これらの結果は、単一分子、二本鎖ＤＮＡメチル化パターンが、胎児および母体起源の無細胞ＤＮＡ分子を区別するためのマーカーとしての役割を果たすことを示唆した。

図１２Ａおよび１２Ｂは、妊娠中の女性の母体血漿ＤＮＡにおいて特定された共有対立遺伝子を担持する長い母体特異的ＤＮＡ分子の一例を示す。共有対立遺伝子を担持するそれらの断片の間で、最長のものは２４，１６６ｂｐであり、これは、ヒト参照の第６染色体の領域（ｃｈｒ６：１１１０７４３７１～１１１０９８５３６）にアラインメントされた（図１２Ａ）、および１８個の共有対立遺伝子を担持した（図１２Ｂ）。それらのすべての共有対立遺伝子が、（Ｉｌｌｕｍｉｎａプラットフォームを使用して）母体および胎児ゲノムの深度配列決定から推定された対立遺伝子情報と一致していた（図１２Ｂ）。そのメチル化レベルは、本開示に記載の方法に従って６６．９％であると決定された（図１２Ｂ）。数キロベースほどの長さの無細胞ＤＮＡ分子の遺伝子情報およびエピジェネティック情報を、バイサルファイト配列決定（Ｉｌｌｕｍｉｎａ）などのショートリード配列決定を使用して簡単に特定することはできなかった。

ここで、分子が妊娠中の女性または胎児に由来する相対尤度を決定する方法を説明する。妊娠中の女性において、胎児の遺伝子型を担持するＤＮＡ分子が実際に胎盤に由来する一方で、母体の遺伝子型を担持するＤＮＡ分子のほとんどは、母体の血球に由来する。本方法において、最初に、胎盤および母体の両方の血球についてのメチル化レベルに応じて、ＤＮＡ分子の頻度分布曲線を構築する。これを実現するために、ヒトゲノムを異なるサイズの瓶に分割した。

図１３は、１ｋｂ～２０ｋｂの異なる分解能でのメチル化レベルに応じた胎盤（赤色）および母体血球（青色）からのＤＮＡについての頻度分布を示す。周波数は、ｙ軸上に示される。メチル化レベルは、ｘ軸上に示される。瓶のサイズの例としては、１ｋｂ、２ｋｂ、５ｋｂ、１０ｋｂ、１５ｋｂ、および２０ｋｂが挙げられるが、これらに限定されない。各瓶のメチル化レベルを、メチル化されたＣｐＧ部位の数をＣｐＧ部位の総数で割ったものに基づいて決定した。すべての瓶のメチル化レベルを決定した後、異なる瓶サイズについて、胎盤ゲノムおよび母体血球ゲノムの各々に対して頻度分布曲線が構築され得る。

長いＤＮＡ分子のメチル化レベルに基づいて、それが胎盤または母体の血球に由来する尤度は、そのようなメチル化レベルでの２タイプのＤＮＡ分子の相対存在量、ならびに試料中の胎児ＤＮＡの画分濃度によって決定され得る。

ｘおよびｙをそれぞれ、特定のメチル化レベルでの胎盤および母体血球に由来するＤＮＡ分子の頻度とし、ｆを試料中の胎児ＤＮＡの画分濃度とする。

ＤＮＡ分子が胎児に由来する確率（Ｐ）は、以下のように計算され得る：
以前の例から、１６ｋｂの血漿ＤＮＡ分子および２７．１％のメチル化レベルが考慮される。

図１４Ａおよび１４Ｂは、１６ｋｂ（図１４Ａ）および２４ｋｂ（図１４Ｂ）ウィンドウ内のメチル化レベルに応じた胎盤（赤色）および母体血球（青色）からのＤＮＡについての頻度分布を示す。周波数は、ｙ軸上に示される。メチル化レベルは、ｘ軸上に示される。１６ｋｂの断片についての頻度分布プロット（図１４Ａ）に基づいて、胎盤および母体血球に由来するＤＮＡ分子についての頻度はそれぞれ、０．６％および０．０８％である。胎児ＤＮＡ画分は２１．８％であるため、このＤＮＡ断片が胎盤に由来する確率は６４％であり、胎盤起源の可能性が高いことを示唆している。

ＤＮＡ分子が胎児組織に由来する確率は、２４ｋｂの血漿ＤＮＡ分子および６６．９％のメチル化レベルについても計算され得る。２４ｋｂの断片についての頻度分布プロットに基づいて、胎盤および母体血球に由来するＤＮＡ分子についての頻度はそれぞれ、０．０５％および０．１６％である（図１４Ｂ）。このＤＮＡ断片が胎盤に由来する確率は０．８％であり、それが胎盤起源である可能性が非常に低いことを示唆している。言い換えれば、分子が母体起源である尤度が高い。

この計算は、胎児および母体ＤＮＡについてのサイズ分布曲線を参照することによって、ＤＮＡ分子のサイズをさらに考慮することができる。そのような分析は、例えば限定されないが、ベイズの定理、ロジスティック回帰、重回帰およびサポートベクターマシン、ランダムフォレスト分析、分類および回帰ツリー（ＣＡＲＴ）、Ｋ近傍アルゴリズムを使用して実施され得る。

図１５Ａおよび１５Ｂは、血漿中の長いＤＮＡ断片が、サイズが１８，８９６ｂｐであることを示し、これは、ヒト参照の第８染色体の領域（ｃｈｒ８：１０８６９４０１０～１０８７１２９０４）にアラインメントされた（図１５Ａ）、および７つの母体特異的対立遺伝子を担持した（図１５Ｂ）。それらのすべての母体特異的対立遺伝子が、母体および胎児ゲノムの深度配列決定（Ｉｌｌｕｍｉｎａ技術）から推定された対立遺伝子情報と一致していた（図１５Ｂ）。そのメチル化レベルは、本開示に記載の方法に従って７２．６％であると決定され（図１５Ｂ）、母体特異的断片のプールされたメチル化レベル（７２．７％）に匹敵することを示している。したがって、そのような分子は、母体起源の断片として分類される可能性がより高くなる。数キロベースほどの長さの無細胞ＤＮＡ分子の遺伝子情報およびエピジェネティック情報を、バイサルファイト配列決定（Ｉｌｌｕｍｉｎａ）などのショートリード配列決定を使用して簡単に特定することはできなかった。

上記の方法を使用して、この分子が胎盤に由来する確率が計算され得る。１９ｋｂの断片についての頻度分布プロットに基づいて、胎盤および母体血球に由来するＤＮＡ分子についての頻度はそれぞれ、０．６５％および０．２３％である。このＤＮＡ断片が胎盤に由来する確率は４３％であり、それが母体起源である尤度が高いことを示唆している。

Ｄ．臨床的ハプロタイプ決定用途
実施形態において、妊娠中の女性の血漿ＤＮＡ中の短いＤＮＡ分子および長いＤＮＡ分子の両方を分析する能力は、組織から取得された以前の父性または母体または胎児の遺伝子型情報を必要とすることなく、相対ハプロタイプ投与量（ＲＨＤＯ）分析を実行することを可能にする（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１、Ｈｕｉｅｔａｌ．ＣｌｉｎＣｈｅｍ．２０１７；６３：５１３－５２４）。この能力は、以前可能であったよりも費用効果が高く、臨床的に適用可能である。

図１６は、妊娠中の無細胞ＤＮＡを使用してＲＨＤＯ分析を実行する方法に関するこの原理を示す。無細胞ＤＮＡは、妊娠中の女性から単離され、段階１６０５でＳＭＲＴ配列決定に供される。長いおよび短いＤＮＡ分子を含む各分子についてのサイズ、対立遺伝子情報、およびメチル化状態は、本開示に記載の方法に従って決定され得る。段階１６１０では、サイズ情報に従って、配列決定された分子を２つのカテゴリー、すなわち、長いＤＮＡ分子および短いＤＮＡ分子に分割することができる。長いおよび短いＤＮＡカテゴリーを決定するために使用されるカットオフには、１５０ｂｐ、１８０ｂｐ、２００ｂｐ、２５０ｂｐ、３００ｂｐ、３５０ｂｐ、４００ｂｐ、４５０ｂｐ、５００ｂｐ、５５０ｂｐ、６００ｂｐ、６５０ｂｐ、７００ｂｐ、７５０ｂｐ、８００ｂｐ、８５０ｂｐ、９００ｂｐ、９５０ｂｐ、１ｋｂ、１．１ｋｂ、１．２ｋｂ、１．３ｋｂ、１．４ｋｂ、１．５ｋｂ、１．６ｋｂ、１．７ｋｂ、１．８ｋｂ、１．９ｋｂ、２ｋｂ、２．５ｋｂ、３ｋｂ、４ｋｂ、５ｋｂ、６ｋｂ、７ｋｂ、８ｋｂ、９ｋｂ、１０ｋｂ、１５ｋｂ、２０ｋｂ、３０ｋｂ、４０ｋｂ、５０ｋｂ、６０ｋｂ、７０ｋｂ、８０ｋｂ、９０ｋｂ、１００ｋｂ、２００ｋｂ、３００ｋｂ、４００ｋｂ、５００ｋｂ、または１Ｍｂが含まれ得るが、これらに限定されない。段階１６１５では、実施形態において、長いＤＮＡ分子中に存在する対立遺伝子情報は、母体ハプロタイプ、すなわち、ＨａｐＩおよびＨａｐＩＩを構築するために使用され得る。短いＤＮＡ分子は、対立遺伝子情報に従って母体ハプロタイプにアラインメントすることができる。したがって、母体ＨａｐＩおよびＨａｐＩＩに由来する無細胞ＤＮＡ分子（例えば、短いＤＮＡ）の数が決定され得る。

段階１６２０では、ハプロタイプの不均衡が分析され得る。不均衡は、分子数、分子サイズ、または分子メチル化状態であり得る。段階１６２５では、胎児の母性遺伝が推定され得る。母体血漿ＤＮＡ中のＨａｐＩの投与量が過剰表現されている場合、胎児は、母体ＨａｐＩを受け継ぐ可能性が高い。そうでない場合、胎児は、母体ＨａｐＩＩを受け継ぐ可能性が高い。逐次確率比検定（ＳＰＲＴ）、二項検定、カイ二乗検定、スチューデントのｔ検定、ノンパラメトリック検定（例えば、ウイルコクソン検定）、および隠れマルコフモデルが挙げられるがこれらに限定されない異なる統計的アプローチが、どの母体ハプロタイプが過剰表現されているかを決定するために使用される。

計数分析に加えて、実施形態において、短いＤＮＡ分子のメチル化およびサイズも決定され、母体ハプロタイプに割り当てられる。２つのハプロタイプ（すなわち、ＨａｐＩとＨａｐＩＩ）間のメチル化不均衡を使用して、胎児に受け継がれた母体ハプロタイプを決定することができる。胎児がＨａｐＩを受け継いだ場合、ＨａｐＩの対立遺伝子を担持する断片は、ＨａｐＩＩの対立遺伝子を担持するものと比較して、母体血漿中により多く存在する。胎児に由来するＤＮＡ断片の低メチル化は、ＨａｐＩＩのメチル化レベルと比較して、ＨａｐＩのメチル化レベルを低下させる。言い換えれば、ＨａｐＩのメチル化がＨａｐＩＩよりも低いメチル化レベルを示した場合、胎児は、母性ＨａｐＩを受け継ぐ可能性がより高くなる。そうでない場合、胎児は、母性ＨａｐＩＩを受け継ぐ可能性がより高くなる。別の実施形態において、個々の断片が胎児または母親に由来する確率は、上記のように計算され得る。ＨａｐＩにアラインメントするすべての断片について、これらの断片が胎児に由来する集計された確率は、ベイズの定理に基づいて決定され得る。同様に、これらの断片が胎児に由来する集計された確率は、ＨａｐＩＩについて演算され得る。次いで、ＨａｐＩまたはＨａｐＩＩが胎児によって受け継がれる尤度は、２つの集計された確率に基づいて推定され得る。

実施形態において、２つのハプロタイプ（すなわち、ＨａｐＩとＨａｐＩＩ）間のサイズ延長または短縮を使用して、胎児に受け継がれた母体ハプロタイプを決定することができる。胎児がＨａｐＩを受け継いだ場合、ＨａｐＩの対立遺伝子を担持する断片は、ＨａｐＩＩの対立遺伝子を担持するものと比較して、母体血漿中により多く存在する。胎児に由来するＤＮＡ断片は、ＨａｐＩＩに由来するものよりも比較的短くなる。言い換えれば、ＨａｐＩに由来する分子がＨａｐＩＩよりも短いＤＮＡを多く含む場合、胎児は、母性ＨａｐＩを受け継ぐ可能性がより高くなる。そうでない場合、胎児は、母性ＨａｐＩＩを受け継ぐ可能性がより高くなる。

いくつかの実施形態において、母体のＨａｐＩとＨａｐＩＩとの間のカウント、サイズ、およびメチル化の複合分析を実行して、胎児の母性遺伝を推定することができる。例えば、ロジスティック回帰を使用して、カウント、サイズ、メチル化状態を含む３つの測定基準を組み合わせることができる。

臨床試験において、カウント、サイズ、およびメチル化状態に関するハプロタイプベースの分析は、胎児が遺伝性障害、例えば限定されないが、脆弱Ｘ症候群、筋ジストロフィー、ハンチントン病、またはベータ－サラセミアと関連する母体ハプロタイプを受け継いでいるかどうかを決定することを可能にする。長い無細胞リードにおけるＤＮＡ配列の反復を含む障害の検出は、本開示において別個に記載される。

Ｅ．長い無細胞ＤＮＡ分子の標的化配列決定
本開示に記載の方法は、１つ以上の選択された長いＤＮＡ断片を分析するために適用され得る。実施形態において、目的の１つ以上の長いＤＮＡ断片は、最初に、目的の領域由来のＤＮＡ分子が相補的配列を有する合成オリゴヌクレオチドにハイブリダイズすることを可能にするハイブリダイゼーション法によって濃縮され得る。本明細書に記載の方法を使用して、サイズ、遺伝子情報、およびエピジェネティック情報をすべて一体になって解読するために、標的ＤＮＡ分子は、元のＤＮＡ分子の塩基修飾情報がＰＣＲ産物に伝達されないため、配列決定に供される前にＰＣＲによって増幅されないことが好ましい。

ＰＣＲ増幅を行わずにこれらの標的領域を濃縮するために、いくつかの方法が開発されている。別の実施形態において、１つ以上の標的の長いＤＮＡ分子は、クラスター化して規則的な配置の短い回文配列反復（ＣＲＩＳＰＲ）－ＣＲＩＳＰＲ関連タンパク質９（Ｃａｓ９）系の使用を通して濃縮され得る（Ｓｔｅｖｅｎｓｅｔａｌ．ＰＬＯＳＯｎｅ２０１９；１４（４）：ｅ０２１５４４１、Ｗａｔｓｏｎｅｔａｌ．ＬａｂＩｎｖｅｓｔ２０２０；１００：１３５－１４６）。そのようなＣＲＩＳＰＲ－Ｃａｓ９による切断が、元の長いＤＮＡ分子のサイズを変化させるにもかかわらず、それらの遺伝子情報およびエピジェネティック情報は、依然として保存されており、本開示に記載の方法を使用して取得されることが可能であり、塩基含有量、ハプロタイプ（すなわち、位相）情報、デノボ変異、塩基修飾（例えば、４ｍＣ（Ｎ４－メチルシトシン）、５ｈｍＣ（５－ヒドロキシメチルシトシン）、５ｆＣ（５－ホルミルシトシン）、５ｃａＣ（５－カルボキシルシトシン）、１ｍＡ（Ｎ１－メチルアデニン）、３ｍＡ（Ｎ３－メチルアデニン）、７ｍＡ（Ｎ７－メチルアデニン）、３ｍＣ（Ｎ３－メチルシトシン）、２ｍＧ（Ｎ２－メチルグアニン）、６ｍＧ（Ｏ６－メチルグアニン）、７ｍＧ（Ｎ７－メチルグアニン）、３ｍＴ（Ｎ３－メチルチミン）、４ｍＴ（Ｏ４－メチルチミン）、および８ｏｘｏＧ（８－オキソ－グアニン）が挙げられるが、これらに限定されない。実施形態において、ＤＮＡ試料中のＤＮＡ分子の末端は、最初に脱リン酸化され、そのためそれらを配列決定アダプターに直接連結しにくい状態にする。次いで、目的の長いＤＮＡ分子は、ガイドＲＮＡ（ｃｒＲＮＡ）を伴うＣａｓ９タンパク質によって誘導されて、二本鎖切断を作成する。次いで、両側で二本鎖切断と隣接する目的の長いＤＮＡ分子は、選択した配列決定プラットフォームによって指定された配列決定アダプターに連結される。別の実施形態では、Ｃａｓ９タンパク質と結合していないＤＮＡ分子が分解されるように、ＤＮＡをエキソヌクレアーゼで処理することができる（Ｓｔｅｖｅｎｓｅｔａｌ．ＰＬＯＳＯｎｅ２０１９；１４（４）：ｅ０２１５４４１）。これらの方法は、ＰＣＲ増幅を伴わないため、塩基修飾を含む元のＤＮＡ分子の配列を決定し、塩基修飾を決定することができる。

実施形態において、これらの方法を使用して、ヒト参照ゲノム（ｈｇ１９）などの参照ゲノム、例えば、長鎖散在核要素（ＬＩＮＥ）反復を参照してガイドＲＮＡを設計することによって、相同配列を共有する多数の長いＤＮＡ分子を標的にすることができる。一実施例では、そのような分析は、胎児の異数性の検出のために、母体血漿中の循環無細胞ＤＮＡの分析に使用することができる（Ｋｉｎｄｅｅｔａｌ．ＰＬＯＳＯｎｅ２０１２；７（７）：ｅ４１１６２）。実施形態において、非活性型または「死んだ」Ｃａｓ９（ｄＣａｓ９）およびそれに関連する一本鎖ガイドＲＮＡ（ｓｇＲＮＡ）が、二本鎖ＤＮＡ分子を切断することなく標的の長いＤＮＡを濃縮するために使用され得る。例えば、ｓｇＲＮＡの３’末端は、余分な普遍的な短い配列を有するように設計され得る。その普遍的な短い配列に相補的なビオチン化一本鎖オリゴヌクレオチドを使用して、ｄＣａｓ９によって結合されたそれらの標的の長いＤＮＡ分子を捕捉することができる。別の実施形態において、ビオチン化ｄＣａｓ９タンパク質もしくはｓｇＲＮＡ、または両方を使用して、濃縮を容易にすることができる。

実施形態において、化学的、物理的、酵素的、ゲルベース、および磁気ビーズベースの方法、または２つ以上のそのようなアプローチを組み合わせた方法を含むがこれらに限定されないアプローチを使用して、目的の１つ以上の特定のゲノム領域に限定することなく、長いＤＮＡ断片を濃縮するためにサイズ選択を実施し得る。他の実施形態において、免疫沈降は、抗メチルシトシン抗体およびメチル結合タンパク質の使用によって媒介されるように、特定のメチル化プロファイルのＤＮＡ断片を濃縮するために使用され得る。結合または捕捉されたＤＮＡのメチル化プロファイルは、非メチル化認識配列決定を使用して決定され得る。

Ｆ．長い血漿ＤＮＡ分子に基づく胎児遺伝分析の一般的な概念
図１７は、母体および胎児起源の情報を用いた血漿ＤＮＡ分子における遺伝性／エピジェネティック障害の決定を示す。長い血漿ＤＮＡ分子は、分子の全体または一部のＣｐＧ部位の遺伝子および／またはエピジェネティックプロファイルに従って、妊娠中の女性において胎児または母体起源であると決定され得る［すなわち、領域（ａ）］。遺伝子情報は、配列情報、一塩基多型、挿入、欠失、タンデム反復、サテライトＤＮＡ、マイクロサテライト、ミニサテライト、逆位などであり得るが、これらに限定されない。エピジェネティック情報は、血漿ＤＮＡ分子中の１つ以上のＣｐＧ部位のメチル化状態、ならびにそれらの相対的順序であり得る。他の実施形態において、エピジェネティック情報は、Ａ、Ｃ、Ｇ、またはＴのいずれかの修飾であり得る。組織起源情報を有する長い血漿ＤＮＡは、そのような長い血漿ＤＮＡ分子中の遺伝性／エピジェネティック障害の存在を決定することによって、非侵襲的出生前検査のために使用され得る［すなわち、領域（ｂ）］。

図１８は、胎児の異常な断片の特定を示す。一例として、本開示に従って、領域（ａ）のメチル化パターンに基づいて、長いＤＮＡ断片が胎児起源であることが特定された。そのような胎児起源の分子に基づいて、胎児が遺伝性またはエピジェネティック障害によって影響を受ける尤度を決定することができる。遺伝性障害は、一塩基バリアント、挿入、欠失、タンデム反復、サテライトＤＮＡ、マイクロサテライト、ミニサテライト、逆位などを含み得る。遺伝性障害の例としては、ベータ－サラセミア、アルファ－サラセミア、鎌状赤血球症、嚢胞性線維症、性関連遺伝性障害（例えば、血友病、デュシェンヌ型筋ジストロフィー）、脊髄性筋萎縮症、先天性副腎過形成などが挙げられるが、これらに限定されない。エピジェネティック障害は、異常なレベルのＤＮＡメチル化、例えば、メチル化の上昇（すなわち、高メチル化）または喪失（低メチル化）であり得る。エピジェネティック障害の例としては、脆弱Ｘ症候群、アンジェルマン症候群、プラダー・ウィリ症候群、顔面肩甲上腕型筋ジストロフィー（ＦＳＨＤ）、免疫不全、セントロメア不安定性および顔面異常（ＩＣＦ）症候群などが挙げられたが、これらに限定されない。遺伝性またはエピジェネティック障害は、領域（ｂ）内に存在することがわかる場合がある。

Ｇ．配列決定精度の改善
配列決定精度は、長い無細胞ＤＮＡ断片の配列リードによって改善し得る。図１１Ｂ中、長い胎児特異的ＤＮＡ分子中の７つの対立遺伝子の間で、ＰａｃＢｉｏ配列決定とＩｌｌｕｍｉｎａ配列決定との間で一貫していないように思われた対立遺伝子が１つあった。

図１９Ａ～１９Ｇは、ＰａｃＢｉｏ配列決定を使用した無細胞ＤＮＡ遺伝子型決定の誤差補正の図を示す。図１１Ｂのそれらの７つの部位についてのサブリードアライメントの結果を視覚化した。１行目は、ゲノム座標を示し、２行目は、参照配列である。３行目以降は、アラインメントされたサブリードを示す。例えば、図１９Ａ中、その領域を横切る８つのサブリードが存在する。「．」は、ワトソン鎖内の参照塩基と同一であることを表す。「，」は、クリック鎖内の参照塩基と同一であることを表す。「アルファベット文字」は、代替の対立遺伝子を表す。「＊」は、挿入欠失を表す。図１９Ｆに示される一貫性のない部位、主要な塩基が、コンセンサス配列において「Ｔ」と呼ばれたことがわかる。しかしながら、その部位（図１９Ｆ）の９つのサブリードの間で、９つのサブリードのうち５つ（すなわち、５６％の主要な対立遺伝子画分（ＭＡＦ））のみが、「Ｔ」であると決定された一方で、他は、「Ｃ」であると決定された。この部位（図１９Ｆ）の主要な対立遺伝子画分は、他の部位（図１９Ａ～Ｅおよび図１９Ｇ）（ＭＡＦの範囲：６７～８９％）よりも低かった。したがって、例えば、少なくとも６０％のＭＡＦを使用して、コンセンサス配列における各部位についての塩基組成を決定するための厳格な基準を設定した場合、この誤差部位は、下流解釈から除外される。一方、そのような誤った部位は、ホモポリマー（すなわち、一連の連続した同一の塩基、「ＴＴＴＴＴＴＴ」）内に偶然入った。実施形態において、ホモポリマー内のバリアントがＱＣ不合格としてフラグ付けされ、一時的に下流分析に使用されない基準を設定することができる。実施形態において、異なるマッピング品質および塩基品質を適用して、低品質の塩基またはサブリードを補正またはフィルタリングして、塩基組成分析を改善することができる。

ナノポア配列決定の配列決定精度がさらに改善されると、本発明の実施形態は、そのような改善された配列決定プラットフォームとともに使用され、それによって改善された精度をもたらすことができる。

Ｈ．例示的な方法
長い無細胞ＤＮＡ断片は、無細胞ＤＮＡ断片を有する妊娠中の女性から取得された生物学的試料から配列決定され得る。これらの長い無細胞ＤＮＡ断片は、胎児によるハプロタイプの遺伝を決定するために使用され得る。

１．長い無細胞ＤＮＡ断片の配列決定
図２０は、妊娠中の生物の生物学的試料を分析する方法２０００を示す。生物学的試料は、複数の無細胞核酸分子を含み得る。生物学的試料は、本明細書に記載の任意の生物学的試料であり得る。生物学的試料中の無細胞核酸分子の２０％超は、２００ｎｔ（ヌクレオチド）よりも大きいサイズを有する。

ブロック２０１０では、複数の複数の無細胞核酸分子が配列決定される。配列決定は、単一分子リアルタイム技術によるものであり得る。いくつかの実施形態において、配列決定は、ナノポアを使用することによるものであり得る。

配列決定された複数の無細胞核酸分子の２０％超は、２００ｎｔよりも大きい長さを有し得る。いくつかの実施形態において、配列決定された複数の無細胞核酸分子の１５～２０％、２０～２５％、２５～３０％、３０～３５％、または３５％超は、２００ｎｔよりも大きい長さを有し得る。

いくつかの実施形態では、配列決定された複数の無細胞核酸分子の１１％超は、４００ｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の５～１０％、１０～１５％、１５～２０％、２０～２５％、または２５％超は、４００ｎｔよりも大きい長さを有し得る。

いくつかの実施形態において、配列決定された複数の無細胞核酸分子の１０％超は、５００ｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の５～１０％、１０～１５％、１５～２０％、２０～２５％、または２５％超は、５００ｎｔよりも大きい長さを有し得る。

実施形態において、配列決定された複数の無細胞核酸分子の８％超は、６００ｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の５～１０％、１０～１５％、１５～２０％、２０～２５％、または２５％超は、６００ｎｔよりも大きい長さを有し得る。

いくつかの実施形態において、配列決定された複数の無細胞核酸分子の６％超は、１ｋｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の３～５％、５～１０％、１０～１５％、１５～２０％、２０～２５％、または２５％超は、１ｋｎｔよりも大きい長さを有し得る。

実施形態において、配列決定された複数の無細胞核酸分子の３％超は、２ｋｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の１～５％、５～１０％、１０～１５％、１５～２０％、２０～２５％、または２５％超は、２ｋｎｔよりも大きい長さを有し得る。

実施形態において、配列決定された複数の無細胞核酸分子の１％超は、３ｋｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の１～５％、５～１０％、１０～１５％、１５～２０％、２０～２５％、または２５％超は、３ｋｎｔよりも大きい長さを有し得る。

いくつかの実施形態において、配列決定された複数の無細胞核酸分子の少なくとも０．９％は、４ｋｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の０．５～１％、１～５％、５～１０％、１０～１５％、１５～２０％、または２０％超は、４ｋｎｔよりも大きい長さを有し得る。

いくつかの実施形態において、配列決定された複数の無細胞核酸分子の少なくとも０．０４％は、１０ｋｎｔよりも大きい長さを有し得る。実施形態において、配列決定された複数の無細胞核酸分子の０．０１～０．１％、０．１％～０．５％、０．５～１％、１～５％、５～１０％、１０～１５％、または１５％超は、４ｋｎｔよりも大きい長さを有し得る。

複数の第１の核酸分子は、少なくとも１０、５０、１００、または２００個の無細胞核酸分子を含み得る。複数の無細胞核酸分子は、複数の異なるゲノム領域からのものであり得る。例えば、複数の染色体腕または染色体は、無細胞核酸分子によってカバーされ得る。複数の無細胞核酸分子のうちの少なくとも２つは、重複しない領域に対応し得る。

長い無細胞ＤＮＡ断片を配列決定する方法は、本明細書に記載の任意の方法によって使用され得る。配列決定からのリードを使用して、胎児異数性、異常（例えば、コピー数異常）、遺伝子変異もしくは変化、または親のハプロタイプの遺伝を決定し得る。配列リードの量は、無細胞ＤＮＡ断片の量を表し得る。

２．ハプロタイプの遺伝
図２１は、胎児を妊娠中の女性から取得された生物学的試料を分析する方法２１００を示す。女性は、第１の染色体領域内に第１のハプロタイプおよび第２のハプロタイプを有し得る。生物学的試料には、胎児および女性からの複数の無細胞ＤＮＡ分子を含み得る。生物学的試料は、本明細書に記載の任意の生物学的試料であり得る。

ブロック２１０５では、複数の無細胞ＤＮＡ分子に対応するリードが受け取られ得る。リードは、配列リードであり得る。いくつかの実施形態において、方法は、配列決定を実施することを含み得る。

ブロック２１１０では、複数の無細胞ＤＮＡ分子のサイズが測定され得る。サイズは、ＤＮＡ分子の末端に対応する１つ以上の配列リードを参照ゲノムにアラインメントすることによって測定され得る。サイズは、ＤＮＡ分子の完全長配列決定、および完全長配列のヌクレオチド数のカウントによって測定され得る。最も外側のヌクレオチドのゲノム座標を使用して、ＤＮＡ分子の長さを決定し得る。

ブロック２１１５では、複数の無細胞ＤＮＡ分子からの無細胞ＤＮＡ分子の第１のセットが、カットオフ値以上のサイズを有するものとして特定され得る。カットオフ値は、長いＤＮＡと関連する任意のカットオフであり得る。例えば、カットオフは、１５０ｂｐ、１８０ｂｐ、２００ｂｐ、２５０ｂｐ、３００ｂｐ、３５０ｂｐ、４００ｂｐ、４５０ｂｐ、５００ｂｐ、５５０ｂｐ、６００ｂｐ、６５０ｂｐ、７００ｂｐ、７５０ｂｐ、８００ｂｐ、８５０ｂｐ、９００ｂｐ、９５０ｂｐ、１ｋｂ、１．５ｋｂ、２ｋｂ、２．５ｋｂ、３ｋｂ、４ｋｂ、５ｋｂ、６ｋｂ、７ｋｂ、８ｋｂ、９ｋｂ、１０ｋｂ、１５ｋｂ、２０ｋｂ、３０ｋｂ、４０ｋｂ、５０ｋｂ、６０ｋｂ、７０ｋｂ、８０ｋｂ、９０ｋｂ、１００ｋｂ、２００ｋｂ、３００ｋｂ、４００ｋｂ、５００ｋｂ、または１Ｍｂを含み得る。

ブロック２１２０では、無細胞ＤＮＡ分子の第１のセットに対応するリードからの第１のハプロタイプの配列および第２のハプロタイプの配列が、決定され得る。第１のハプロタイプの配列および第２のハプロタイプの配列を決定することは、無細胞ＤＮＡ分子の第１のセットに対応するリードを参照ゲノムに対応するリードを参照ゲノムにアラインメントすることを含み得る。

いくつかの実施形態において、第１のハプロタイプの配列および第２のハプロタイプの配列を決定することは、参照ゲノムを含まない場合がある。配列を決定することは、リードの第１のサブセットをリードの第２のサブセットにアラインメントして、リード内の遺伝子座において異なる対立遺伝子を特定することを含み得る。方法は、リードの第１のサブセットが遺伝子座に第１の対立遺伝子を有すると決定することを含み得る。方法はまた、リードの第２のサブセットが遺伝子座に第２の対立遺伝子を有すると決定することを含み得る。方法は、リードの第１のサブセットが第１のハプロタイプに対応すると決定することをさらに含み得る。さらに、方法は、リードの第２のサブセットが第２のハプロタイプに対応すると決定することを含み得る。アラインメントは、図１６で説明されるアラインメントと同様であり得る。

ブロック２１２５では、複数の無細胞ＤＮＡ分子からの無細胞ＤＮＡ分子の第２のセットは、第１のハプロタイプの配列にアラインメントされ得る。無細胞ＤＮＡ分子の第２のセットは、カットオフ値よりも小さいサイズを有し得る。無細胞ＤＮＡ分子の第２のセットは、第１のハプロタイプの短いＤＮＡ分子であり得る。

ブロック２１３０では、複数の無細胞ＤＮＡ分子からの無細胞ＤＮＡ分子の第３のセットは、第２のハプロタイプの配列にアラインメントされ得る。無細胞ＤＮＡ分子の第３のセットは、カットオフ値よりも小さいサイズを有し得る。無細胞ＤＮＡ分子の第３のセットは、第２のハプロタイプの短いＤＮＡ分子であり得る。

ブロック２１３５では、パラメータの第１の値が、無細胞ＤＮＡ分子の第２のセットを使用して測定され得る。パラメータは、無細胞ＤＮＡ分子のカウント、無細胞ＤＮＡ分子のサイズプロファイル、または無細胞ＤＮＡ分子のメチル化レベルであり得る。値は、生の値または統計値（例えば、平均、中央値、最頻値、パーセンタイル、最小、最大）であり得る。いくつかの実施形態において、値は、参照試料、別の領域、両方のハプロタイプ、または他のサイズ範囲についてのパラメータの値に正規化され得る。

ブロック２１４０では、パラメータの第２の値が、無細胞ＤＮＡ分子の第３のセットを使用して測定され得る。このパラメータは、無細胞ＤＮＡ分子の第２のセットと同じパラメータである。

ブロック２１４５では、第１の値は、第２の値と比較され得る。比較は、分離値を使用し得る。分離値は、第１の値および第２の値を使用して計算され得る。分離値は、カットオフ値と比較され得る。第１の分離値は、本明細書に記載の任意の分離値であり得る。カットオフ値は、正倍数性胎児を妊娠中の女性からの参照試料から決定され得る。他の実施形態において、カットオフ値は、異数性胎児を妊娠中の女性からの参照試料から決定され得る。いくつかの実施形態において、カットオフ値は、異数性胎児を仮定して決定され得る。例えば、正倍数性胎児を妊娠中の女性からの参照試料からのデータは、異数性についての染色体領域のコピー数の増加または減少を説明するために調整され得る。カットオフ値は、データを調整することから決定され得る。

２１５０では、胎児が第１のハプロタイプを遺伝する尤度は、第１の値と第２の値との比較に基づいて決定され得る。尤度は、分離値とカットオフ値との比較に基づいて決定され得る。パラメータが無細胞ＤＮＡ分子のサイズプロファイルであるとき、方法は、第１の値が第２の値よりも小さい場合、胎児が第２のハプロタイプよりも第１のハプロタイプを遺伝する尤度が高いと決定することを含み得、無細胞ＤＮＡ分子の第２のセットが無細胞ＤＮＡ分子の第３のセットよりも小さいサイズプロファイルによって特徴付けられることを示している。パラメータが無細胞ＤＮＡ分子のメチル化レベルであるとき、方法は、第１の値が第２の値よりも小さい場合、胎児が第２のハプロタイプよりも第１のハプロタイプを遺伝する尤度が高いと決定することを含み得る。

いくつかの実施形態において、方法は、無細胞ＤＮＡ分子の第１のセットに対応するリードの１つのリードにおける部分配列の反復数を特定することを含み得る。第１のハプロタイプの配列を決定することは、配列が部分配列の反復数を含むと決定することを含み得る。第１のハプロタイプは、本明細書に記載のいずれかであり得る反復関連疾患を含み得る。胎児が反復関連疾患を受け継ぐ尤度が決定され得る。胎児が反復関連疾患を受け継ぐ尤度は、胎児が第１のハプロタイプを受け継ぐ尤度に等しいか、またはそれと同様であり得る。配列の反復を特定することは、図１６を含む本開示の後半で説明される。

ＩＩ．メチル化を使用した起源組織の分析
長い無細胞ＤＮＡ分子は、いくつかのメチル化部位を有し得る。本開示で考察されるように、妊娠中の女性における長い無細胞ＤＮＡ分子のメチル化レベルは、起源組織を決定する際に使用され得る。さらに、長い無細胞ＤＮＡ分子上に存在するメチル化パターンを使用して、起源組織を決定し得る。

胎盤組織からの細胞は、白血球、および肝臓、肺、食道、心臓、膵臓、結腸、小腸、脂肪組織、副腎、脳などの組織からの細胞と比較して、独特のメチロームパターンを有する。（Ｓｕｎｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ５５０３－１２）。妊娠中の母親の血液中の循環胎児ＤＮＡのメチル化プロファイルは、胎盤のメチル化プロファイルに類似している可能性があり、したがって胎児の性別または遺伝子型に依存しない非侵襲的な胎児特異的バイオマーカーを開発する手段を模索する可能性を提供する。しかしながら、妊娠中の女性の母体血漿ＤＮＡのバイサルファイト配列決定（例えば、Ｉｌｌｕｍｉｎａ配列決定プラットフォームを使用）は、胎児起源と分子と母体起源の分子とを区別する能力を欠いている可能性があり、これは、多数の制限があるためである：（１）血漿ＮＤＡがバイサルファイト処理中に分解され得る、典型的には、長いＤＮＡ分子がより短い分子に分解される、（２）５００ｂｐよりも大きいＤＮＡ分子が、下流分析用のＩｌｌｕｍｉｎａ配列決定プラットフォームで効果的に配列決定されない場合がある（Ｔａｎｅｔａｌ，ＳｃｉＲｅｐ．２０１９；９：２８５６）。

メチル化に基づく起源組織に関する分析の場合、いくつかのメチル化可変領域（ＤＭＲ）に焦点を当て、単一分子のメチル化パターンの代わりに、ＤＭＲとなる組織関連する複数の分子からの集計されたメチル化シグナルを使用し得る（Ｓｕｎｅｔａｌ，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ５５０３－１２）。多数の研究が、メチル化感受性制限酵素ベース（Ｃｈａｎｅｔａｌ，ＣｌｉｎＣｈｅｍ．２００６；５２：２２１１－８）またはメチル化特異的ＰＣＲベースのアプローチ（Ｌｏｅｔａｌ，ＡｍＪＨｕｍＧｅｎｅｔ．１９９８；６２：７６８－７５）を使用して、胎盤から血漿ＤＮＡプールへの寄与を評価することを試みた。しかしながら、それらの研究は、１つまたはいくつかのマーカーの分析にのみ適しており、ゲノムワイドなスケールで分子を分析するために使用するのは困難であり得る。しかしながら、それらのリードは、増幅されたシグナル（すなわち、ＤＮＡライブラリ調製中のＰＣＲベースの増幅、およびフローセルでの配列決定クラスター生成中のブリッジ増幅）から推定された。そのような増幅ステップは、短いＤＮＡ分子を好むバイアスを生み出す可能性があり得、長いＤＮＡ分子に関連する情報の損失をもたらす。さらに、Ｌｉｅｔａｌ．は、事前にマイニングされたＤＭＲに関連するリードのみを分析した（Ｌｉｅｔａｌ．，ＮｕｃｌｅｉＡｃｉｄｓＲｅｓ．２０１８；４６：ｅ８９）。

本開示において、バイサルファイト処理およびＤＮＡ増幅なしの単一ＤＮＡ分子のメチル化パターンに基づいて、妊娠中の女性の血漿中の胎児ＤＮＡ分子と母体ＤＮＡ分子とを区別するための新しいアプローチを説明する。実施形態において、１つ以上の長い血漿ＤＮＡ分子が分析に使用される（例えば、サイズ選択のためのバイオインフォマティクスおよび／または実験的アッセイを使用する）。長いＤＮＡ分子は、少なくとも１００ｂｐ、２００ｂｐ、３００ｂｐ、４００ｂｐ、５００ｂｐ、６００ｂｐ、７００ｂｐ、８００ｂｐ、９００ｂｐ、１ｋｂ、２ｋｂ、３ｋｂ、４ｋｂ、５ｋｂ、１０ｋｂ、２０ｋｂ、３０ｋｂ、４０ｋｂ、５０ｋｂ、１００ｋｂ、２００ｋｂなどであるがこれらに限定されないサイズを有するＤＮＡ分子として定義され得る。母体血漿中のより長い無細胞ＤＮＡ分子の存在およびメチル化状態に関するデータは不足している。例えば、そのようなより長い無細胞ＤＮＡ分子のメチル化状態が、起源組織の細胞ＤＮＡのメチル化状態を反映するかどうかは不明であり、これは例えば、そのような長い断片が、体内で断片化後にメチル化状態が変化し得る部位をより多く有するためであり、そのような変化は、断片が血漿中を循環している間に生じ得る。例えば、ある研究は、循環ＤＮＡのメチル化状態がＤＮＡ断片のサイズと相関することを示している（Ｌｕｎｅｔａｌ．ＣｌｉｎＣｈｅｍ．２０１３；５９：１５８３－９４）。したがって、そのようなより長い無細胞ＤＮＡ分子から起源組織を推測するための実現可能性は不明である。したがって、組織関連のメチル化シグネチャーを特定するためにとられるアプローチ、ならびにそのような組織特異的なより長い無細胞ＤＮＡ分子の存在を決定および解釈するためにとられる方法論は、短い無細胞ＤＮＡ分析に適用されるものとは実質的に異なる。

本開示の実施形態によると、短いＤＮＡ分子および長いＤＮＡ分子を特定し、メチル化パターン、断片末端、サイズ、および塩基組成を含むがこれらに限定されない、それらの生物学的特性を決定することができる。短いＤＮＡ分子は、５０ｂｐ、６０ｂｐ、７０ｂｐ、８０ｂｐ、９０ｂｐ、１００ｂｐ、２００ｂｐ、３００ｂｐ未満などであるがこれらに限定されないサイズを有するＤＮＡ分子として定義され得る。短いＤＮＡ分子は、長いとみなされる範囲内にないＤＮＡ分子であり得る。妊娠中の女性の血漿中の循環ＤＮＡ分子について起源組織を推定するための新しいアプローチを説明する。この新しいアプローチは、血漿中の１つ以上の長いＤＮＡ分子のメチル化パターンを利用する。ＤＮＡ分子が長いほど、それが含有する可能性が高いＣｐＧ部位の数は大きくなる。血漿ＤＮＡ分子上の複数のＣｐＧ部位の存在は、任意の単一のＣｐＧ部位のメチル化状態が起源組織を決定するために有益ではない場合でも、起源組織情報を提供する。長いＤＮＡ分子中のそのようなメチル化パターンは、各ＣｐＧ部位についてのメチル化状態、メチル化状態の順序、および任意の２つのＣｐＧ部位間の距離を含み得る。２つのＣｐＧ部位間のメチル化状態は、２つのＣｐＧ部位間の距離に依存し得る。分子中の特定の距離内のＣｐＧ部位（例えば、ＣｐＧアイランド）が組織特異的パターンを示す場合、統計モデルは、起源組織分析中にそれらのシグナルにより多くの重みを割り当て得る。

図２２は、この原理を概略的に示す。図２２は、ＤＮＡ分子についてのメチル化パターンを示す。異なる組織（胎盤、肝臓、血球、結腸）についての７つのＣｐＧ部位、および６つの血漿ＤＮＡ断片Ａ～Ｅが示される。メチル化ＣｐＧ部位は赤色で示され、非メチル化ＣｐＧ部位は緑色で示される。一例として、胎盤、肝臓、血球、および結腸組織にわたって様々なメチル化状態を有する７つのＣｐＧ部位を考慮してみる。他の組織と比較して、単一のＣｐＧ部位が胎盤に特異的なメチル化状態を示さないというシナリオを考慮してみる。したがって、異なるサイズを有する血漿ＤＮＡ分子Ａ、Ｂ、Ｃ、Ｄ、およびＥについての起源組織を、単一のＣｐＧ部位でのメチル化状態のみに基づいて決定することができない。血漿ＤＮＡ分子ＡおよびＢの場合、それら２つの分子のサイズが比較的短いため、それぞれ３つおよび４つのＣｐＧ部位のみ含有している。実施形態において、２つ以上のＣｐＧ部位を含有するＤＮＡ分子中のメチル化パターンは、メチル化ハプロタイプとして定義され得る。図２２に示されるように、血漿ＤＮＡ分子ＡおよびＢは、胎盤および肝臓が分子Ａ（位置１、２、および３）ならびにＢ（位置１、２、３、および４）に対応するそれらのゲノム位置において同じメチル化ハプロタイプを共有したため、それらのメチル化ハプロタイプに基づいて胎盤または肝臓のいずれかによって寄与され得る。しかしながら、分子Ｃ、Ｄ、およびＥなどの血漿中の長いＤＮＡ分子を取得することができる場合、それらの分子Ｃ、Ｄ、およびＥは、メチル化ハプロタイプに基づいて胎盤に由来すると明確に決定され得る。

組織についての参照パターンは、参照組織からのメチル化パターンに基づき得る。いくつかの実施形態において、メチル化パターンは、いくつかのリードおよび／または試料に基づき得る。各ＣｐＧ部位についてのメチル化レベル（メチル化指数、ＭＩとも呼ばれ、以下で説明される）を使用して、部位がメチル化されているかどうかを決定し得る。

Ａ．メチル化パターンについての統計モデル
実施形態において、血漿ＤＮＡ分子が胎盤に由来する尤度は、単一ＤＮＡ分子のメチル化ハプロタイプを多数の参照組織におけるメチル化パターンと比較することによって決定され得る。長い血漿ＤＮＡ分子が、そのような分析に好まれ得る。長いＤＮＡ分子は、少なくとも１００ｂｐ、２００ｂｐ、３００ｂｐ、４００ｂｐ、５００ｂｐ、６００ｂｐ、７００ｂｐ、８００ｂｐ、９００ｂｐ、１ｋｂ、２ｋｂ、３ｋｂ、４ｋｂ、５ｋｂ、１０ｋｂ、２０ｋｂ、３０ｋｂ、４０ｋｂ、５０ｋｂ、１００ｋｂ、２００ｋｂなどであるがこれらに限定されないサイズを有するＤＮＡ分子として定義され得る。参照組織としては、胎盤、肝臓、肺、食道、心臓、膵臓、結腸、小腸、脂肪組織、副腎、脳、好中球、リンパ球、好塩基球、好酸球などが挙げられ得るが、これらに限定されない。実施形態において、単一分子リアルタイム配列決定によって決定された血漿ＤＮＡのメチル化ハプロタイプ、および参照組織の全ゲノムバイサルファイト配列決定に基づくメチロームデータを相乗的に分析することによって、血漿ＤＮＡ分子が胎盤に由来する尤度を決定し得る。一例として、全ゲノムバイサルファイト配列決定を使用して、胎盤およびバフィーコート試料を、それぞれ、ハプロイドゲノムの平均９４倍および７５倍のゲノムカバレッジに配列決定した。各ＣｐＧ部位のメチル化レベル（メチル化指数、ＭＩとも呼ばれる）を、以下の式を使用して、配列決定されたシトシン数（すなわち、メチル化、Ｃによって示される）および配列決定されたチミン数（すなわち、非メチル化、Ｔによって示される）に基づいて計算した：

ＣｐＧ部位を、胎盤ＤＮＡから推定されたＭＩ値に基づいて、３つのカテゴリーに階層化した：
１．ＭＩ値が７０以上であったカテゴリーＡＣｐＧ部位。
２．ＭＩ値が３０～７０であったカテゴリーＢＣｐＧ部位。
３．ＭＩ値が３０以下であったカテゴリーＣＣｐＧ部位。

同様に、バフィーコートＤＮＡから推定されたＣｐＧ部位のＭＩ値を使用して、ＣｐＧ部位を３つのカテゴリーに分類した：
１．ＭＩ値が７０以上であったカテゴリーＡＣｐＧ部位。
２．ＭＩ値が３０～７０であったカテゴリーＢＣｐＧ部位。
３．ＭＩ値が３０以下であったカテゴリーＣＣｐＧ部位。

カテゴリーは、３０および７０のＭＩカットオフを使用した。カットオフは、１０、２０、４０、５０、６０、８０、または９０を含む他の数値を含み得る。いくつかの実施形態において、これらのカテゴリーを使用して、参照組織の参照メチル化パターンを決定し得る（例えば、図２２で説明されるような使用のため）。カテゴリーＡ部位は、メチル化とみなされ得る。カテゴリーＣ部位は、非メチル化とみなされ得る。カテゴリーＢ部位は、無情報とみなされ、参照パターンに含まれない場合がある。

ｎ個のＣｐＧ部位を有する血漿ＤＮＡ分子の場合、各ＣｐＧ部位についてのメチル化状態を、我々の以前の開示（米国出願第１６／９９５，６０７号）に記載されるアプローチによって決定した。いくつかの実施形態において、メチル化状態は、バイサルファイト配列決定またはナノポア配列決定によって決定され得る。血漿ＤＮＡ分子が胎盤または母体背景に由来する尤度を決定するために、その分子のメチル化パターンを、胎盤および母体バフィーコートＤＮＡの以前のメチル化情報と併せて分析した。実施形態において、血漿ＤＮＡ断片においてメチル化されている（Ｍ）と決定されたＣｐＧ部位が胎盤におけるより高いメチル化指数と一致した場合、そのような観察が、この分子が胎盤に由来する可能性がより高かったことを示すという原理を利用した。血漿ＤＮＡ分子においてメチル化されている（Ｍ）と決定されたＣｐＧ部位が胎盤におけるより低いメチル化指数と一致した場合、そのような観察は、この分子が胎盤に由来する可能性がより低かったことを示し、血漿ＤＮＡにおいてメチル化されていない（Ｕ）と決定されたＣｐＧ部位が、胎盤におけるより低いメチル化指数と一致した場合、そのような観察は、この分子が胎盤に由来する可能性がより高かったことを示す。血漿ＤＮＡにおいてメチル化されていない（Ｕ）と決定されたＣｐＧ部位が胎盤におけるより高いメチル化指数と一致した場合、そのような観察は、この分子が胎盤に由来する可能性がより低かったことを示す。

以下のスコアリングスキームを実行した。血漿ＤＮＡ断片についての胎児起源の尤度を反映する初期スコア（Ｓ）を０に設定した。血漿ＤＮＡ分子のメチル化状態を胎盤ＤＮＡの以前のメチル化情報と比較した場合、
ａ．血漿ＤＮＡ分子上のＣｐＧ部位が「Ｍ」であると決定され、胎盤におけるその対応物がカテゴリーＡに属した場合、１のスコアがＳに追加される（すなわち、スコア単位が１増加する）。
ｂ．血漿ＤＮＡ分子上のＣｐＧ部位が「Ｕ」であると決定され、胎盤におけるその対応物がカテゴリーＡに属した場合、１のスコアがＳから差し引かれる（すなわち、スコア単位が１減少する）。
ｃ．血漿ＤＮＡ分子上のＣｐＧ部位が「Ｍ」であると決定され、胎盤におけるその対応物がカテゴリーＢに属した場合、０．５のスコアがＳに追加される。
ｄ．血漿ＤＮＡ分子上のＣｐＧ部位が「Ｕ」であると決定され、胎盤におけるその対応物がカテゴリーＢに属した場合、０．５のスコアがＳに追加される。
ｅ．血漿ＤＮＡ分子上のＣｐＧ部位が「Ｍ」であると決定され、胎盤におけるその対応物がカテゴリーＣに属した場合、１のスコアがＳから差し引かれる。
ｆ．血漿ＤＮＡ分子上のＣｐＧ部位が「Ｕ」であると決定され、胎盤におけるその対応物がカテゴリーＣに属した場合、１のスコアがＳに追加される。

上記のプロセスを「メチル化状態マッチング」と呼ぶ。

血漿ＤＮＡ分子中のすべてのＣｐＧ部位を処理した後、その血漿ＤＮＡ分子について最終的な集計スコアＳ（胎盤）を取得した。実施形態において、ＣｐＧ部位の数は、少なくとも３０である必要があり、血漿ＤＮＡ分子の長さは、少なくとも３ｋｂである必要があった。本明細書に記載のいずれかを含むがこれらに限定されない、ＣｐＧ部位の他の数および長さが使用され得る。

血漿ＤＮＡ分子のメチル化状態を対応する部位のバフィーコートＤＮＡのメチル化レベルと比較した場合、同様のスコアリングスキームが適用される。血漿ＤＮＡ分子中のすべてのＣｐＧ部位が処理した後、その血漿ＤＮＡ分子について最終的な集計スコアＳ（バフィーコート）を取得した。

Ｓ（胎盤）がＳ（バフィーコート）よりも大きい場合、血漿ＤＮＡ分子を胎児起源であると決定した。そうでない場合、血漿ＤＮＡ分子を母体起源であると決定した。

血漿ＤＮＡ分子についての胎児－母体起源を推定する性能を評価するために使用された胎児特異的ＤＮＡ分子および母体特異的ＤＮＡ分子は、１７個および４０５個あった。胎児特異的分子が、胎児特異的ＳＮＰ対立遺伝子を担持する血漿ＤＮＡ分子である一方で、母体特異的ＤＮＡ分子は、母体特異的ＳＮＰ対立遺伝子を担持するものであった。

図２３は、胎児起源および母体起源を決定するための受信者動作特性曲線（ＲＯＣ）を示す。ｙ軸は感度を示し、ｘ軸は特異度を示す。赤色の線は、本開示に存在するメチル化状態マッチングに基づいた方法を使用して、胎児起源および母体起源の分子を区別する性能を表す。青色の線は、単一分子のメチル化レベル（すなわち、ＤＮＡ分子においてメチル化されていると決定されたＣｐＧ部位の割合）を使用して、胎児起源および母体起源の分子を区別する性能を表す。図２３は、メチル化状態マッチングプロセスについての受信者動作特性曲線（ＡＵＣ）下面積（０．９４）が、単一分子のメチル化レベルに基づくもの（０．８６）よりも有意に高かったことを示す（Ｐ値＜０．０００１、ＤｅＬｏｎｇ検定）。長いＤＮＡ分子のメチル化パターンの分析が、胎児／母体の起源の決定に有用であることが示唆される。

実施形態において、血漿ＤＮＡが胎児起源であるか母体起源であるかを決定するとき、Ｓ（胎盤）とＳ（バフィーコート）との間の差の大きさ（ΔＳ）が考慮され得る。ΔＳの絶対値は、例えば、５、１０、２０、３０、４０、５０などであるがこれらに限定されない特定の閾値を超える必要がある場合がある。一例として、ΔＳの閾値として１０を使用した場合、胎児ＤＮＡ分子の検出における正の予測値（ＰＰＶ）は、１４．９５％から９１．６７％に改善された。

実施形態において、ＣｐＧ部位のメチル化状態は、その隣接するＣｐＧ部位のメチル化状態によって影響を受けるであろう。ＤＮＡ分子上の任意の２つのＣｐＧ部位間のヌクレオチド距離が近いほど、２つのＣｐＧ部位が同じメチル化状態を共有する可能性が高くなる。この現象は、共メチル化と称されている。多数の組織特異的なＣｐＧアイランドのメチル化が報告されている。したがって、起源組織分析のためのいくつかの統計モデルにおいて、同じメチル化状態を共有するＣｐＧ部位（例えば、ＣｐＧアイランド）の密集したクラスターに、より多くの重みが割り当てられる。シナリオ「ａ」および「ｆ」の場合、調査中の現在のＣｐＧ部位が前のＣｐＧ部位と比較して１００ｂｐ以下のゲノム距離内に位置し、メチル化状態マッチングプロセスの結果がこれら２つの連続したＣｐＧ部位について同一であった場合、さらなる１点が現在のＣｐＧ部位についてのスコアＳに追加される。シナリオ「ｂ」および「ｅ」の場合、調査中の現在のＣｐＧ部位が前のＣｐＧ部位と比較して１００ｂｐ以下のゲノム距離内に位置し、メチル化状態マッチングプロセスの結果がこれら２つの連続したＣｐＧ部位について同一であった場合、さらなる１点が現在のＣｐＧ部位についてのスコアＳから差し引かれる。しかしながら、調査中の現在のＣｐＧ部位が前のＣｐＧ部位と比較して１００ｂｐ以下のゲノム距離内に位置し、これら２つの連続したＣｐＧ部位についてのメチル化状態マッチングプロセスの結果が一貫していなかった場合、上記のデフォルトスコアリングスキームが使用される。一方、調査中の現在のＣｐＧ部位が前のＣｐＧ部位と比較して１００ｂｐよりも大きいゲノム距離内に位置する場合、デフォルトパラメータを用いた上記のスコアリングスキームが使用される。本明細書に記載のいずれかを含む１以外の点および１００ｂｐ以外の距離が使用され得る。

他の実施形態において、ＣｐＧ部位を、胎盤およびバフィーコートＤＮＡから推定されたＭＩ値に基づいて、４つ以上のカテゴリーに階層化した。参照組織の以前のメチル化情報は、単一分子リアルタイム配列決定（すなわち、ナノポア配列決定および／またはＰａｃＢｉｏＳＭＲＴ配列決定）から推定され得る。血漿ＤＮＡ分子の長さは、少なくとも１００ｂｐ、２００ｂｐ、３００ｂｐ、４００ｂｐ、５００ｂｐ、６００ｂｐ、７００ｂｐ、８００ｂｐ、９００ｂｐ、１ｋｂ、２ｋｂ、３ｋｂ、４ｋｂ、５ｋｂ、１０ｋｂ、２０ｋｂ、３０ｋｂ、４０ｋｂ、５０ｋｂ、１００ｋｂ、２００ｋｂなどである必要があり得るが、これらに限定されない。ＣｐＧ部位の数は、少なくとも３、４、５、６、７、８、９、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００などである必要があり得るが、これらに限定されない。

実施形態において、確率モデルを使用して、血漿ＤＮＡ分子のメチル化パターンを特徴付け得る。血漿ＤＮＡ分子上のｋ個のＣｐＧ部位（ｋ≧１）のメチル化状態を、Ｍ＝（ｍ_１、ｍ_２、…、ｍ_ｋ）として示し、ここで、ｍ_ｉは、血漿ＤＮＡ分子上のＣｐＧ部位ｉにおいて０（非メチル化状態の場合）または１（メチル化の場合）であった。実施形態において、胎盤に由来する血漿ＤＮＡ分子に関連するＭの確率は、胎盤組織における参照メチル化パターンに依存し得る。１、２、…、ｋのそれらの対応するＣｐＧ部位についての胎盤組織における参照メチル化パターンは、ベータ分布に従う。ベータ分布は、Ｂｅｔａ（α，β）によって示される２つの正のパラメータαおよびβによってパラメータ化される。ベータ分布から導出された値は、０～１の範囲である。目的の組織についての高深度バイサルファイト配列決定データに基づいて、パラメータαおよびβを、それぞれ、その特定の組織についての各ＣｐＧ部位において配列決定されたシトシン（メチル化）およびチミン（非メチル化）の数によって決定した。胎盤の場合、そのようなベータ分布をＢｅｔａ（α^Ｐ，β^ｐ）として示した。胎盤に由来する血漿ＤＮＡ分子の確率、Ｐ（Ｍ｜胎盤）は、以下によってモデル化される：

ここで、「ｉ」は、ｉ番目のＣｐＧ部位を示し、
は、胎盤におけるｉ番目のＣｐＧ部位のメチル化パターンに関連するベータ分布を示し、Ｐは、ｋ個のＣｐＧ部位にわたって所与のメチル化パターンを有する観察された血漿ＤＮＡ分子の同時確率であった。

バフィーコート（すなわち、白血球）に由来する血漿ＤＮＡ分子の確率、Ｐ（Ｍ｜バフィーコート）は、以下によってモデル化される：

ここで、「ｉ」は、ｉ番目のＣｐＧ部位を示し、
は、バフィーコートＤＮＡにおけるｉ番目のＣｐＧ部位のメチル化パターンに関連するベータ分布を示した。Ｐは、ｋ個のＣｐＧ部位にわたって所与のメチル化パターンを有する観察された血漿ＤＮＡ分子の同時確率であった。

は、それぞれ、胎盤ＤＮＡおよびバフィーコートＤＮＡの全ゲノムバイサルファイト配列決定の結果から決定され得る。

血漿ＤＮＡ分子について、Ｐ（Ｍ｜胎盤）がＰ（Ｍ｜バフィーコート）よりも大きいことが観察された場合、そのような血漿ＤＮＡ分子は、胎盤に由来する可能性が高い。そうでない場合、それはバフィーコートに由来する可能性が高い。このモデルを使用して、０．７９のＡＵＣを達成した。

Ｂ．機械学習モデル
さらに他の実施形態において、機械学習アルゴリズムを使用して、特定の血漿ＤＮＡ分子の胎児／母体起源を決定することができる。妊娠中の女性における胎児および母体のＤＮＡ分子を分類するための機械学習ベースのアプローチを使用することの実現可能性を試験するために、血漿ＤＮＡ分子についてのメチル化パターンのグラフ表示を開発した。

図２４は、一対メチル化パターンについての定義を示す。血漿ＤＮＡ分子上に９つのＣｐＧ部位が示されるメチル化ＣｐＧ部位は赤色で示され、非メチル化ＣｐＧ部位は緑色で示される。対の２つのＣｐＧ部位が同じメチル化状態を共有した場合（例えば、１番目のＣｐＧおよび５番目のＣｐＧ）、矢印「ａ」によって示される位置に示されるように、対は１としてコード化される。対の２つのＣｐＧ部位が異なるメチル化状態を有した場合（例えば、１番目のＣｐＧおよび２番目のＣｐＧ）、矢印「ｂ」によって示される位置に示されるように、対は０としてコード化される。ＤＮＡ分子上の任意の２つのＣｐＧ部位のすべての対に同じコード化規則が適用された。

一例として、９つのＣｐＧ部位を含有する血漿ＤＮＡ分子を使用した。この血漿ＤＮＡ分子についてのメチル化パターン、すなわち、Ｕ－Ｍ－Ｍ－Ｍ－Ｕ－Ｕ－Ｕ－Ｍ－Ｍ（ＵおよびＭは、それぞれ非メチル化ＣｐＧおよびメチル化ＣｐＧを表した）を、我々の以前の開示（米国出願第１６／９９５，６０７号）に記載されるアプローチによって決定した。任意の２つのＣｐＧ部位間のメチル化状態の一対比較は、機械学習または深層学習ベースの分析に有用であり得る。この例では、同じ規則が合計３６個の対に適用された。血漿ＤＮＡ分子上に合計ｎ個のＣｐＧ部位があった場合、ｎ＊（ｎ－１）／２個の対の比較がある。５、６、７、８、１０、１１、１２、１３など、異なる数のＣｐＧ部位が使用され得る。分子が機械学習モデルで使用される部位の数よりも大きい部位の数を含む場合、スライディングウィンドウを使用して、それらの部位を適切な数の部位に分割することができる。

胎盤ＤＮＡ試料およびバフィーコートＤＮＡ試料から、それぞれ１つ以上の分子を取得した。それらのＤＮＡ分子についてのメチル化パターンを、我々の以前の開示（米国出願第１６／９９５，６０７号）に記載されるアプローチに従って、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅ（ＰａｃＢｉｏ）Ｓｉｎｇｌｅ－ＭｏｌｅｃｕｌｅＲｅａｌ－Ｔｉｍｅ（ＳＭＲＴ）配列決定によって決定した。それらのメチル化パターンを、一対メチル化パターンに変換した。

胎盤ＤＮＡと関連する一対メチル化パターンおよびバフィーコートＤＮＡと関連する一対メチル化パターンを、胎児起源および母体起源である可能性がある分子を区別するための畳み込みニューラルネットワーク（ＣＮＮ）を訓練するために使用した。胎盤からのＤＮＡ断片についての各目標出力（すなわち、従属変数値に類似）を「１」として割り当てた一方で、バフィーコートからのＤＮＡ断片についての各目標出力を「０」として割り当てた。一対メチル化パターンを、ＣＮＮモデルのためのパラメータ（多くの場合、重みと呼ばれる場合が多い）を決定するように訓練するために使用した。シグモイド関数によって計算された出力スコアと所望の目標出力との間の全体的な予測誤差（２進値：０または１）が、モデルパラメータを反復的に調整することによって最小に達したとき、ＤＮＡ断片の胎児－母体起源を区別するためのＣＮＮの最適なパラメータが取得された。全体的な予測誤差を、深層学習アルゴリズム（ｈｔｔｐｓ：／／ｋｅｒａｓ．ｉｏ／）におけるシグモイドクロスエントロピー損失関数によって測定した。訓練データセットから学習したモデルパラメータを、ＤＮＡ分子（血漿ＤＮＡ分子など）を分析して、ＤＮＡ分子が胎盤またはバフィーコートに由来する尤度を示す確率スコアを出力するために使用した。血漿ＤＮＡ断片の確率スコアが特定の閾値を超えた場合、そのような血漿ＤＮＡ分子は、胎児起源であるとみなされた。そうでない場合、それは、母性起源であるとみなされる。閾値は、０．１、０．２、０．３、０．４、０．５、０．６、０．７、０．８、０．９、０．９５、０．９９などを含むが、これらに限定されない。一例では、このＣＮＮモデルを使用して、血漿ＤＮＡ分子が胎児起源であるか母体起源であるかを決定するための０．６３のＡＵＣを達成し、深層学習アルゴリズムを使用して母体血漿からＤＮＡ分子の起源組織を推定することが可能であることを示す。より多くの単一分子リアルタイム配列決定の結果を取得することによって、深層学習アルゴリズムの性能がさらに改善される。

いくつかの他の実施形態において、統計モデルとしては、線形回帰、ロジスティック回帰、深層再帰型ニューラルネットワーク（例えば、長・短期記憶、ＬＳＴＭ）、ベイズ分類器、隠れマルコフモデル（ＨＭＭ）、線形判別分析（ＬＤＡ）、ｋ平均クラスタリング、ノイズを伴う用途の密度ベースの空間クラスタリング（ＤＢＳＣＡＮ）、ランダムフォレストアルゴリズム、サポートベクトルマシン（ＳＶＭ）などが挙げられ得るが、これらに限定されない。二項分布、ベルヌーイ分布、ガンマ分布、正規分布、ポアソン分布などが挙げられるがこれらに限定されない異なる統計的分布が含まれる。

Ｃ．胎盤に特異的なメチル化ハプロタイプ
単一ＤＮＡ分子上の各ＣｐＧ部位のメチル化状態は、我々の以前の開示（米国出願第１６／９９５，６０７号）に記載されるアプローチまたは本明細書に記載の任意の技術を使用して決定され得る。単一分子、二本鎖ＤＮＡメチル化レベルに加えて、各ＤＮＡ分子の単一分子のメチル化パターンを決定することができ、これは、単一ＤＮＡ分子に沿った隣接するＣｐＧ部位のメチル化状態の配列であり得る。

異なるＤＮＡメチル化シグネチャーが、異なる組織および細胞型に見られ得る。実施形態において、単一分子のメチル化パターンに基づいて、個々の血漿ＤＮＡ分子の起源組織を推定することができる。

１０個のバフィーコート試料および６つの胎盤組織試料からのゲノムＤＮＡを、ＳＭＲＴ配列決定（ＰａｃＢｉｏ）を使用して配列決定した。各試料タイプからマッピングされた高品質の円形コンセンサス配列決定（ＣＣＳ）リードを一緒にプールすることによって、バフィーコートＤＮＡおよび胎盤ＤＮＡについて、それぞれ、５８．７倍および２８．７倍のカバレッジを達成することができた。

スライディングウィンドウアプローチを使用することによって、ゲノムを５つのＣｐＧ部位の約２，８２０万個の重複ウィンドウに分割した。他の実施形態において、２、３、４、５、６、７、および８個のＣｐＧ部位などであるがこれらに限定されない異なるウィンドウサイズが使用され得る。非重複ウィンドウアプローチを使用することができる。各ウィンドウを潜在的なマーカー領域とみなした。各潜在的なマーカー領域について、そのマーカー領域内の５つのＣｐＧ部位すべてをカバーするすべての配列決定された胎盤ＤＮＡ分子の間で、顕著な単一分子のメチル化パターンを特定した。血漿ＤＮＡ分子のＣｐＧ部位と参照組織の個々のＤＮＡ分子の対応するＣｐＧ部位との間で比較が行わる。次いで、その単一分子のメチル化パターンを胎盤における顕著な単一分子のメチル化パターンと比較することによって、同じマーカー領域内のすべてのＣｐＧ部位をカバーする各バフィーコートＤＮＡ分子の不一致スコアを計算した。
ここで、不一致のＣｐＧ部位の数は、胎盤における顕著な単一分子のメチル化パターンと比較して、バフィーコートＤＮＡ分子において異なるメチル化状態を示すＣｐＧ部位の数を指す。

より高い不一致スコアは、バフィーコートＤＮＡ分子のメチル化パターンが、胎盤における顕著な単一分子のメチル化パターンとはより異なることを示す。２，８２０万個の潜在的なマーカー領域から、以下の基準を使用して、胎盤およびバフィーコートからのＤＮＡ分子のプール間で単一分子のメチル化パターンの実質的な差を示した領域を選択した：ａ）胎盤ＤＮＡ分子の５０％超が、顕著な単一分子のメチル化パターンを有した、およびｂ）バフィーコートＤＮＡ分子の８０％超が、０．３よりも大きい不一致スコアを有した。これらの基準に基づいて、下流分析用に２８１，５６６個のマーカー領域を選択した。

図２５は、異なる染色体間の選択されたマーカー領域の分布の表である。１列目は、染色体番号を示す。２列目は、染色体内のマーカー領域の数を示す。

本開示で前述されたように胎児特異的対立遺伝子または母体特異的対立遺伝子のいずれかをカバーするＳＭＲＴ配列決定で配列決定された血漿ＤＮＡ分子を使用した、単一分子のメチル化パターンに基づく個々の血漿ＤＮＡ分子についての起源組織分類の概念をここに示す。胎盤における顕著な単一分子のメチル化パターンと同一のメチル化パターンを有する選択されたマーカー領域をカバーする任意の血漿ＤＮＡ分子は、胎盤特異的（すなわち胎児特異的）ＤＮＡ分子として分類される。対照的に、血漿ＤＮＡ分子の単一分子のメチル化パターンが胎盤における顕著な単一分子のメチル化パターンと同一ではない場合、この分子を胎盤に特異的ではないと分類する。この分析における正しい分類を、胎盤特異的メチル化ハプロタイプがその分子中に存在したかどうかによって、胎児特異的ＤＮＡ分子を胎児由来（すなわち、胎盤に特異的）であると特定し、母体ＤＮＡ分子を非胎児由来（すなわち、胎盤に非特異的）であると特定した方法で定義した。起源組織分析のための以前のメチル化ベースの方法は、典型的には、生物学的試料内の無細胞ＤＮＡの組織寄与因子の範囲のパーセンテージまたは比例寄与をデコンボリューションすることを含んだ。以前の方法に対する本方法の利点は、生物学的試料への組織の無細胞ＤＮＡ寄与の証拠、例えば、母体血漿中の胎盤由来ＤＮＡが、他の組織からの寄与の有無に関係なく決定され得ることである。さらに、任意の１つの無細胞ＤＮＡ分子の胎盤起源は、その組織からの無細胞ＤＮＡ分子の画分寄与に関係なく本方法で決定され得る。

胎児特異的対立遺伝子をカバーする２８個のＤＮＡ分子の間で、１７個（６１％）は、胎盤特異的と分類され、１１個（３９％）は、胎盤に特異的ではないと分類された。一方、母体特異的対立遺伝子をカバーする４６７個のＤＮＡ分子の間で、４３３個（９３％）は、胎盤に特異的ではないと分類され、３４個（７％）は、胎盤特異的と分類された。

実施形態において、閾値として０．３よりも大きい不一致スコアを有する異なるパーセンテージのバフィーコートＤＮＡ分子を使用することができ、６０％、７０％、７５％、８０％、８５％、および９０％よりも大きいものなどを含むがこれらに限定されない。マーカー領域の選択で使用される基準を調整することによって、妊娠中の対象における血漿ＤＮＡの胎盤起源または非胎盤起源についての全体的な分類精度を改善することができる。これは、疾患を引き起こす変異またはコピー数異常が胎児に存在するかどうかを決定しようとする非侵襲的出生前検査の設定において特に重要である。

図２６は、マーカー領域の選択基準として、０．３よりも大きい不一致スコア有するバフィーコートＤＮＡ分子の異なるパーセンテージを使用した、単一分子のメチル化パターンに基づく血漿ＤＮＡ分子の分類の表である。１列目は、０．３％よりも大きい不一致スコアを有するバフィーコートＤＮＡ分子のパーセンテージを示す。２列目は、ＤＮＡ分子を、胎児特異的対立遺伝子をカバーする分子および母体特異的対立遺伝子をカバーする分子に分割する。３列目および４列目は、単一分子のメチル化パターンに基づいた、ＤＮＡ分子の胎盤特異的または胎盤に特異的ではないとの分類を示す。５列目は、２列目の特異的対立遺伝子と同じく分類されたＤＮＡ分子のパーセンテージを示す。

図２７は、胎盤特異的メチル化ハプロタイプを使用して、非侵襲的方法で胎児遺伝を決定するためのプロセスフローを示す。図２７に示されるように、妊娠中の女性の血漿からの無細胞ＤＮＡを、単一分子リアルタイム配列決定のために抽出した。長い血漿ＤＮＡ分子を、本開示の実施形態に従って特定した。各長い血漿ＤＮＡ分子についての各ＣｐＧ部位でのメチル化状態を、本開示の実施形態に従って決定した。各長い血漿ＤＮＡ分子のメチル化ハプロタイプを、本開示の実施形態に従って決定した。長い血漿ＤＮＡ分子を、胎盤特異的メチル化ハプロタイプを担持するものとして特定した場合、その分子に関連する遺伝子情報およびエピジェネティック情報は、胎児によって受け継がれているとみなされる。実施形態において、妊娠中の女性によって担持される疾患を引き起こす変異と同じである疾患を引き起こす変異を含有する１つ以上の長い血漿ＤＮＡ分子を、本開示の実施形態によるメチル化ハプロタイプ情報に基づいて胎児起源であると決定した場合、胎児が母親からの変異を受け継いだことを示唆する。

実施形態は、ベータ－サラセミア、鎌状赤血球症、アルファ－サラセミア、嚢胞性線維症、血友病Ａ、血友病Ｂ、先天性副腎過形成、デュシェンヌ型筋ジストロフィー、ベッカー型筋ジストロフィー、軟骨無形成症、タナトフォリック骨異形成症、フォン・ヴィレブランド病、ヌーナン症候群、遺伝性難聴および聾唖、様々な先天性代謝異常（例えば、シトルリン血症Ｉ型、プロピオン酸血症、グリコーゲン蓄積症Ｉａ型（フォン・ギールケ病）、グリコーゲン蓄積症Ｉｂ／ｃ型（フォン・ギールケ病）、グリコーゲン蓄積症ＩＩ型（ポンペ病）、ムコ多糖症（ＭＰＳ）Ｉ型（ハーラー／ハーラー－シャイエ／シャイエ）、ＭＰＳＩＩ型（ハンター症候群）、ＭＰＳ、ＩＩＩＡ型（サンフィリポ症候群Ａ）、ＭＰＳＩＩＩＢ型（サンフィリポ症候群Ｂ）、ＭＰＳＩＩＩＣ型（サンフィリポ症候群Ｃ）、ＭＰＳＩＩＩＤ型（サンフィリポ症候群Ｄ）、ＭＰＳＩＶＡ型（モルキオ症候群Ａ）、ＭＰＳＩＶＢ型（モルキオ症候群Ｂ）、ＭＰＳＶＩ型（マロトー・ラミー症候群）、ＭＰＳＶＩＩ型（スライ症候群）、ムコリピドーシスＩＩ（Ｉ－細胞病）、異染性白質ジストロフィー、ＧＭ１ガングリオシドーシス、ＯＴＣ欠損症（Ｘ連鎖性オルニチントランスカルバミラーゼ欠損症）、副腎白質ジストロフィー（Ｘ連鎖性ＡＬＤ）、クラッベ病（グロボイド細胞白質ジストロフィー））などが挙げられるが、これらに限定されない遺伝性疾患に適用され得る。

他の実施形態において、胎児における遺伝性疾患は、親ゲノムには存在しなかった胎児ゲノム中のデノボＤＮＡメチル化と関連している可能性がある。一例は、脆弱Ｘ症候群を有する胎児におけるＦＭＲＰ翻訳調節因子１（ＦＭＲ１）遺伝子の高メチル化である。脆弱Ｘ症候群は、ＦＭＲ１遺伝子の５’非翻訳領域内のＣＧＧトリヌクレオチド反復の伸長によって引き起こされる。正常な対立遺伝子は、ＣＧＧ反復の約５～４４コピーを含有する。前変異対立遺伝子は、ＣＧＧ反復の５５～２００コピーを含有する。完全変異対立遺伝子は、ＣＧＧ反復の２００超のコピーを含有する。

図２８は、正常な対立遺伝子または前変異の対立遺伝子のいずれかを担持する罹患していない妊娠中の女性の男性胎児における脆弱Ｘ症候群の非侵襲的出生前検出の原理を示す。図２８中、「ｎ」は、母体ゲノム中のＣＧＧのコピーの数を表し、「ｍ」は、胎児ゲノム中のＣＧＧのコピー数を表す。罹患していない妊娠中の女性のゲノムは、２００コピー以下（すなわち、ｎ≦２００）のＣＧＧ反復を有し、メチル化されていないＦＭＲ１遺伝子を有する。対照的に、脆弱Ｘ症候群に罹患した男性胎児のゲノムは、ＣＧＧ反復の２００を超えるコピー（ｍ＞２００）を有し、メチル化されているＦＭＲ１遺伝子を有する。母体血漿ＤＮＡの単一分子配列決定を実施することによって、反復数およびメチル化状態が同時に決定され得る目的のゲノム領域（例えば、ＦＭＲ１遺伝子）から多数の長いＤＮＡ分子を特定することができる。罹患していない女性の血漿中で、ＣＧＧ反復の２００を超えるコピーを含有し、メチル化されているＦＭＲ１遺伝子をカバーする１つ以上のＤＮＡ分子を特定した場合、胎児が脆弱Ｘ症候群を有する可能性が高いことを示す。さらに別の実施形態において、本開示の実施形態による胎盤特異的メチル化ハプロタイプを使用して、そのような血漿ＤＮＡ分子の胎児起源をさらに確認することができる。胎盤特異的メチル化ハプロタイプを担持した分子内の１つ以上の領域を含有する１つ以上の分子を特定し、そのような分子が、ＣＧＧ反復の２００を超えるコピーを含有し、メチル化されていたＦＭＲ１遺伝子をカバーした場合、胎児が脆弱Ｘ症候群を有するとより確信を持って結論付けることができる。逆に、胎盤特異的メチル化ハプロタイプを有した１つ以上の分子を特定し、そのような分子が、ＣＧＧ反復の２００未満のコピーを含有し、メチル化されていなかったＦＭＲ１遺伝子をカバーした場合、胎児が罹患していない可能性が高いことを示す。脆弱Ｘ症候群では、完全変異（２００超の反復）により、実際には遺伝子全体がメチル化され、遺伝子機能がオフになる。したがって、特に脆弱Ｘの場合、（胎盤メチル化プロファイルを示すのではなく）メチル化された長い対立遺伝子の検出は、胎児がその疾患を有することを強く示唆する。

遺伝性障害の検出は、母親の以前の状態を知っているかどうかに関係なく実施され得る。前変異を有する女性は、任意の症状を有しない場合もあるが、軽度の症状を有する場合があり、多くの場合、後からしかわからない。母体の変異状態がわからない場合、１つのアプローチは、疾患を有するように思われない女性からの血漿中の長い対立遺伝子を検出することか、または母体のバフィーコートを分析し、そのような長い対立遺伝子を示さないと決定することである。別のアプローチとして、反復の長さとｃｆＤＮＡ分子のメチル化状態とを組み合わせることができる。メチル化状態が胎児パターン（メチル化ハプロタイプ）を示唆し、長い対立遺伝子を示す場合、胎児は、罹患している可能性が高い。このアプローチは、多くのトリヌクレオチド障害、例えば、ハンチントン病に適用できる。

Ｄ．長い血漿ＤＮＡ分子による胎児ゲノムの非侵襲的構築
メチル化パターンは、ハプロタイプの遺伝を決定するために使用され得る。メチル化パターンを用いた定性的アプローチを使用したハプロタイプ遺伝の決定は、特定の断片の量を特徴付ける定量的方法よりも効率的であり得る。メチル化パターンは、ハプロタイプの母性および父性遺伝を決定するために使用され得る。

１．胎児の母性遺伝
Ｌｏｅｔａｌ．は、親のハプロタイプの情報を使用して、ゲノムワイドな遺伝子マップを構築し、母体血漿ＤＮＡ配列から胎児の変異状態を決定する実現可能性を実証した（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１）。この技術は、相対ハプロタイプ投与量（ＲＨＤＯ）分析と呼ばれ、胎児の母性遺伝を解決するための１つのアプローチである。この原理は、胎児によって受け継がれた母体ハプロタイプが、胎児に受け継がれない他の母体ハプロタイプと比較して、妊娠中の女性の血漿ＤＮＡにおいて比較的過剰に表現されるという事実に基づいていた。したがって、ＲＨＤＯは、定量分析法である。

本開示に存在する実施形態は、その血漿ＤＮＡ分子の起源組織を決定するために、長い血漿ＤＮＡ分子におけるメチル化パターンを利用する。一実施形態において、本明細書の開示は、胎児の母性遺伝の定性分析を可能にする。

図２９は、胎児の母性遺伝を決定する一例を示す。ゲノム位置Ｐは、母体ゲノムにおいてヘテロ接合であった（Ａ／Ｇ）。塗りつぶされた丸は、メチル化部位を示し、塗りつぶされていない丸は、非メチル化部位を示す。胎盤におけるメチル化パターンは「－Ｍ－Ｕ－Ｍ－Ｍ－」であり、ここで、「Ｍ」は、ＣｐＧ部位でのメチル化シトシンを表し、「Ｕ」は、非メチル化シトシンを表す。一実施形態において、胎盤および関連する参照組織におけるメチル化パターンは、以前に配列決定（例えば、単一分子リアルタイム配列決定および／またはバイサルファイト配列決定）から生成されたデータから取得され得る。血漿ＤＮＡ中、その特定のゲノム遺伝子座にＡの対立遺伝子を担持する１つの非父性血漿ＤＮＡ（Ｚによって示される）が、他の組織のメチル化パターンとは対照的に、胎盤におけるメチル化パターンと適合するメチル化パターン（「－Ｍ－Ｕ－Ｍ－Ｍ－」）を示すことがわかった。胎盤におけるメチル化パターンと適合するメチル化パターンを示すＧの対立遺伝子を担持する分子は見つからなかった。したがって、対立遺伝子Ａおよび「－Ｍ－Ｕ－Ｍ－Ｍ－」メチル化パターンの存在に基づいて、胎児は、母体対立遺伝子Ａを受け継ぐと決定され得る。

図３０は、血漿ＤＮＡ分子の遺伝子情報およびエピジェネティック情報を使用した胎児の母性遺伝の定性分析を示す。図３０の上の分岐に示されるように、本開示の実施形態に従って、血漿ＤＮＡを抽出し、続いて長いＤＮＡのサイズ選択を行った。サイズ選択された血漿ＤＮＡ分子を、単一分子リアルタイム配列決定に供した（例えば、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓによって製造されたシステムを使用して）。遺伝子情報およびエピジェネティック情報を、本開示の実施形態に従って決定した。例示目的で、分子（Ｘ）を、染色体位置ａ（ｃｈｒ１：ａ）にＧの対立遺伝子、および染色体位置ｅ（ｃｈｒ１：ｅ）にＡの対立遺伝子を含有するヒト１番染色体にアラインメントした。分子Ｘは、染色体位置ｄにＣの対立遺伝子を有する。

この分子ＸのＣｐＧメチル化状態は、「－Ｍ－Ｕ－Ｍ－Ｍ－」であると決定され、ここで、「Ｍ」は、ＣｐＧ部位でのメチル化シトシンを表し、「Ｕ」は、非メチル化シトシンを表す。塗りつぶされた丸は、メチル化部位を示し、塗りつぶされていない丸は、非メチル化部位を示す。参照試料の分析の結果として、胎盤ＤＮＡは、位置ａとｅとの間の領域ないに「－Ｍ－Ｕ－Ｍ－Ｍ－」のメチル化パターンを有することがわかっている。胎盤ＤＮＡのメチル化パターンに一致する分子Ｘのメチル化パターンに基づいて、分子Ｘは、本開示の実施形態に従って胎盤起源であると決定された。

図３０の下の分岐に示されるように、母体白血球からのＤＮＡを単一分子リアルタイム配列決定に供した。母体白血球のエピジェネティック情報および遺伝子情報を、本開示の実施形態に従って取得した。遺伝子の対立遺伝子を、ＷｈａｔｓＨａｐ（Ｐａｔｔｅｒｓｏｎｅｔａｌ．ＪＣｏｍｐｕｔＢｉｏｌ．２０１５；２２：４９８－５０９）、ＨａｐＣＵＴ（Ｂａｎｓａｌｅｔａｌ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００８；２４：ｉ１５３－９）、ＨａｐＣＨＡＴ（Ｂｅｒｅｔｔａｅｔａｌ．ＢＭＣｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１８；１９：２５２）などが挙げられるがこれらに限定されない方法を使用して、２つのハプロタイプ、すなわち、母体ハプロタイプＩ（ＨａｐＩ）および母体ハプロタイプＩＩ（ＨａｐＩＩ）に段階化させた。ここで、母体ゲノム中の２つのハプロタイプ、すなわち、「－Ａ－Ｃ－Ｇ－Ｔ－」（ＨａｐＩ）および「－Ｇ－Ｔ－Ａ－Ｃ－」（ＨａｐＩＩ）を取得した。ＨａｐＩが野生型バリアントと関連していた一方で、ＨａｐＩＩは、疾患関連バリアントに関連していた。疾患関連バリアントとしては、一塩基バリアント、挿入、欠失、転座、逆位、反復伸長、および／または他の遺伝的構造変化が挙げられ得るが、これらに限定されない。

ゲノム位置ｅについて、母体遺伝子型は、ＡＡであると決定され、父性遺伝子型は、ＧＧであると決定された。メチル化パターンのため、血漿ＤＮＡ分子Ｘは、胎盤起源であると決定された。母体特異的対立遺伝子Ａが存在するが、父性特異的対立遺伝子Ｇが存在しないため、分子Ｘは、母体ハプロタイプのうちの１つから受け継がれると推定された。

どの母体ハプロタイプが胎児に受け継がれたかをさらに決定するために、この胎盤由来分子Ｘの位置ｃｈｒ１：ｅ以外のゲノム位置での対立遺伝子情報を母体ハプロタイプと比較した。一例として、分子Ｘは、位置ａに対立遺伝子Ｇ、および位置ｄに対立遺伝子Ｃを有する。分子Ｘにこれらの対立遺伝子のいずれかが存在することは、分子Ｘが同じ対立遺伝子を含む母体ＨａｐＩＩに割り当てられるべきであることを示す。

したがって、疾患関連バリアントに関連した母体ハプロタイプＩＩが胎児につけ継がれたと結論付けることができる。まだ生まれていない胎児は、この疾患に罹患するリスクがあると決定された。

胎児の母性遺伝についてのメチル化パターンベースの定性分析は、定量分析に基づくアプローチであったＲＨＤＯと比較して、どの母体ハプロタイプが胎児によって受け継がれたかについて結論を出すために必要な血漿ＤＮＡ分子がより少ない可能性がある。コンピューターシミュレーション分析を実施して、異なる数の血漿ＤＮＡ分子を分析に使用したゲノムワイドな方法で、胎児の母性遺伝の検出率を評価した。

ＲＨＤＯシミュレーション分析では、Ｎ個の血漿ＤＮＡ分子を、母体ゲノムのハプロタイプブロック内のＭ個のヘテロ接合ＳＮＰに集合的にアラインメントした。胎児ＤＮＡ画分は、ｆであった。それらの対応するＳＮＰの父性遺伝子型は、ホモ接合であり、胎児に受け継がれた母性ＨａｐＩと同一であった。Ｎ個の血漿ＤＮＡ分子の間で、母体ＨａｐＩにアラインメントされた血漿ＤＮＡ分子の平均が、Ｎ×（０．５＋ｆ／２）であった一方で、母体ＨａｐＩＩにアラインメントされた血漿ＤＮＡ分子の平均は、Ｎ×（０．５－ｆ／２）であった。ハプロタイプからサンプリングされた血漿ＤＮＡ分子が二項分布に従うと仮定した。

血漿ＤＮＡ分子の数を、以下の分布に従ってＨａｐＩ（すなわち、Ｘ）に割り当てた：
Ｘ～Ｂｉｎ（Ｎ，０．５＋ｆ／２）（１）、
ここで、「Ｂｉｎ」は、二項分布を示した。

血漿ＤＮＡ分子の数を、以下の分布に従ってＨａｐＩＩ（すなわち、Ｙ）に割り当てた：
Ｙ～Ｂｉｎ（Ｎ，０．５－ｆ／２）（２）。

したがって、母体ＨａｐＩに割り当てられた血漿ＤＮＡ分子は、母体ＨａｐＩＩと比較して、母体血漿中で比較的過剰に表現される。過剰表現が統計的に有意であったかどうかを決定するために、２つの母体ハプロタイプ間の血漿ＤＮＡカウントの差を、２つのハプロタイプ（Ｘ’およびＹ’によって示される）が血漿中で等しく表現されたという帰無仮説を用いて比較した。
Ｘ’～Ｂｉｎ（Ｎ，０．５）（３）、
Ｙ’～Ｂｉｎ（Ｎ，０．５）（４）。

２つのハプロタイプ間の相対投与量の差を以下のようにさらに定義した：
Ｄ＝（Ｘ－Ｙ）／Ｎ（５）、
Ｄ’＝（Ｘ’－Ｙ’）／Ｎ（６）。

一例では、相対ハプロタイプ投与量を反映する統計量Ｄを、以下のようにＤ’（ＳＤ）の標準偏差によって正規化されたＤ’（Ｍ）の平均（すなわち、ｚ－スコア）と比較した：
ｚ－スコア＝（Ｄ－Ｍ）／ＳＤ（７）。
３を超えるｚ－スコアは、ＨａｐＩが胎児に受け継がれたことを示した。

ＲＨＤＯ分析の場合、式（１）～（７）に基づいて、ＨａｐＩが胎児に受け継がれた全ゲノムにわたって３０，０００個のハプロタイプブロックをシミュレートした。ハプロタイプブロックの平均長は、１００ｋｂであった。各ハプロタイプブロックは、平均１００個のＳＮＰを含有し、そのうち１０個のＳＮＰは、ハプロタイプの不均衡に寄与するのに有益である。一例では、胎児のＤＮＡ画分は、１０％であり、断片サイズの中央値は、１５０ｂｐであった。ＲＨＤＯ分析に使用される血漿ＤＮＡ分子の数を１００万個～３億個の範囲で変化させることによって、本明細書において検出率と称される、３を超えるｚ－スコアを有するハプロタイプブロックのパーセンテージを計算した。本明細書の血漿ＤＮＡ分子の数を、ポアソン分布に従って、血漿ＤＮＡが有益なＳＮＰ部位をカバーする確率によって調整した。

胎児の母性遺伝についてのメチル化パターンベースの定性分析に関連するコンピューターシミュレーションの場合、例示目的で以下のように仮定した：
１）分析に使用された母体ゲノム中のハプロタイプブロックをカバーする血漿ＤＮＡ分子は、Ｎ個あった。
２）長さが少なくとも３ｋｂの起源組織分析に使用される血漿ＤＮＡ断片の確率をａによって示した。
３）１０を超えるＣｐＧ部位を担持する血漿ＤＮＡ分子の確率をｂによって示した。
４）３ｋｂを超えるそれらの断片の胎児ＤＮＡ画分をｆによって示した。

本開示の一実施形態に示されるように、少なくとも１０個のＣｐＧ部位を有する３ｋｂよりも大きいそれらの血漿ＤＮＡ分子についての起源組織の正確な推定を達成することができる。上記の基準（Ｚ）を満たす血漿ＤＮＡ分子の数を、λの平均値（すなわち、Ｎ×ａ×ｂ×ｆ）でポアソン分布に従うと仮定した。
Ｚ～Ｐｏｉｓｓｏｎ（λ）（８）。

一例では、式（８）に基づいて、ＨａｐＩが胎児に受け継がれた３０，０００個のハプロタイプブロックをシミュレートした。各ハプロタイプブロックの平均長は、１００ｋｂであった。各ハプロタイプブロックは、平均１００個のＳＮＰを含有し、そのうち２０個のヘテロ接合ＳＮＰは、２つの母体ハプロタイプに段階化される。胎児のＤＮＡ画分は、１％であった。サイズ選択後、３ｋｂを超えるサイズの血漿ＤＮＡ分子は、４０％存在した。少なくとも１０個のＣｐＧ部位を有する３ｋｂを超えるサイズの血漿ＤＮＡ分子は、８７．１％存在した。１以上のＺ値のハプロタイプブロックのパーセンテージは、検出率を示した。メチル化パターンによる起源組織分析に使用される血漿ＤＮＡ分子の数（Ｎ）を、１００万個～３億個の範囲で変化させることによって、コンピューターシミュレーションを複数回繰り返した。本明細書の血漿ＤＮＡ分子の数を、ポアソン分布に従って、血漿ＤＮＡがヘテロ接合ＳＮＰをカバーする確率によってさらに調整した。

図３１は、相対ハプロタイプ投与量（ＲＨＤＯ）分析と比較した、血漿ＤＮＡ分子の遺伝子情報およびエピジェネティック情報を使用したゲノムワイドな方法における胎児の母性遺伝についての定性分析の検出率を示す。分析に使用された分子の数は、ｘ軸上に示される。パーセントとしての児の母性遺伝の検出率は、ｙ軸上に示される。胎児の母性遺伝の検出率を、ＲＨＤＯと比較して、メチル化パターンに基づくアプローチを使用してより高かった。例えば、１億個の断片を使用して、メチル化パターンに基づく検出率が１００％であった一方で、ＲＨＤＯに基づく検出率は、わずか５５％であった。これらの結果は、メチル化パターンベースの方法を使用した胎児の母性遺伝の推定が、ＲＨＤＯに基づくものよりも優れていることを示唆した。

２．胎児の父性遺伝
分析のために長い血漿ＤＮＡ分子を取得する能力は、長いＤＮＡ分子の使用が、同数の短いＤＮＡ分子の使用と比較して全体的なゲノムカバレッジを増加させるため、妊娠中の女性の血漿ＤＮＡ中の父性特異的バリアントの検出率を改善するのに役立ち得る。以下の仮定に基づいてコンピューターシミュレーションをさらに実施した：
１）胎児ＤＮＡ画分は、血漿ＤＮＡの長さＬに応じてｆであった。これはｆ_Ｌとして書き直され、下付き文字Ｌは、Ｌｂｐの長さを有する血漿ＤＮＡ分子が分析に使用されたことを示した。
２）母体血漿ＤＮＡにおいて特定される必要があった父性特異的バリアントの数は、Ｖであった。
３）分析に使用された血漿ＤＮＡ分子の数は、Ｎであった。
４）特定のゲノム遺伝子座または領域に由来する血漿ＤＮＡ分子の数は、ポアソン分布に従った。

一例では、１５０ｂｐ、１ｋｂ、および３ｋｂのサイズを有するそれらの血漿ＤＮＡ分子の胎児ＤＮＡ画分は、それぞれ、１０％（ｆ_{１５０ｂｐ}＝０．１）、２％（ｆ_１ｋｂ＝０．０２）、および１％（ｆ_３ｋｂ＝０．０１）であった。父性特異的バリアントの数は、ゲノムにおいて２５０，０００個（Ｖ＝２５０，０００）であった。分析に使用された血漿ＤＮＡ分子の数（Ｎ）は、５，０００万個～５億個の範囲であった。

図３２は、ゲノムワイドな方法における父性特異的バリアントの検出率と、分析に使用された異なるサイズを有する配列決定された血漿ＤＮＡ分子の数との間の関係を示す。百万単位の分析に使用された配列決定された分子の数は、ｘ軸上に示される。検出された父性特異的バリアントのパーセンテージは、ｙ軸上に示される。異なる曲線は、分析に使用された異なるサイズのＤＮＡ断片を示し、上が３ｋｂ、中央が１ｋｂ、および下が１５０ｂｐである。分析に使用される血漿ＤＮＡ分子が長いほど、父性特異的バリアントのより高い検出率が達成され得る。例えば、４億個の血漿ＤＮＡ分子を使用すると、検出率は、１５０ｂｐ、１ｋｂ、および３ｋｂのサイズを有する分子に焦点を当てた場合、それぞれ８６％、９３％、および９８％であった。

他の実施形態において、ベルヌーイ分布、ベータ－正規分布、正規分布、コンウェイ－マクスウェル－ポアソン分布、幾何分布などが挙げられるがこれらに限定されない他の分布が使用され得る。いくつかの実施形態において、ギブスサンプリングおよびベイズの定理が、母体および父性遺伝分析に使用される。

３．脆弱Ｘ遺伝分析
実施形態において、胎児の母性遺伝のメチル化パターンベースの決定は、母体血漿ＤＮＡの単一分子リアルタイム配列決定を使用した脆弱Ｘ症候群の非侵襲的検出を容易にし得る。脆弱Ｘ症候群は、典型的には、Ｘ染色体上のＦＭＲ１（脆弱Ｘ精神遅滞１）遺伝子内のＣＧＧトリヌクレオチド反復の伸長によって引き起こされる遺伝性障害である。反復の伸長によって引き起こされる脆弱Ｘ症候群および他の障害は、本出願の他の箇所に記載されている。胎児における脆弱Ｘ症候群を検出するための方法は、本明細書に開示される反復の他の任意の伸長にも適用され得る。

ＦＭＲ１遺伝子においてＣＧＧ反復の５５～２００コピーを有すると定義される前変異を有する女性対象は、脆弱Ｘ症候群を有する子供を産むリスクがある。脆弱Ｘ症候群を有する胎児を妊娠する尤度は、ＦＭＲ１遺伝子に存在するＣＧＧ反復の数に依存する。母親における反復数が多いほど、胎児に受け継がれる際に前変異から完全変異に拡大するリスクが高くなる。１１５±２ＣＧＧ反復の脆弱Ｘ前変異対立遺伝子を担持することが以前に確認され、脆弱Ｘ症候群を有すると診断された息子（発端者）がいた女性から、１２週の在胎期間で母体漿試料を採取した。次いで、母体血漿を単一分子リアルタイム配列決定に供した。一例では、単一分子リアルタイム配列決定を使用して、ヒト参照ゲノムにアラインメントされた３３０万個の円形コンセンサス配列（ＣＣＳ）を取得し、サブリード深度の中央値は、ＣＣＳ当たり７５倍であった（四分位範囲：１４～２３７倍）。配列決定された各血漿ＤＮＡについての遺伝子情報およびエピジェネティック情報は、本開示の実施形態に従って決定され得る。Ｘ染色体の２つの母体ハプロタイプを取得するために、マイクロアレイ技術であるｉＳｃａｎＳｙｓｔｅｍ上のＩｎｆｉｎｉｕｍＯｍｎｉ２．５Ｅｘｏｍｅ－８Ｂｅａｄｃｈｉｐ（Ｉｌｌｕｍｉｎａ）を使用して、母体バフィーコートおよび発端者の口腔スワブから抽出された両方のＤＮＡについての染色体Ｘ上の２，０００個のＳＮＰの遺伝子型を決定した。２つの母体ハプロタイプ、すなわち、ＨａｐＩおよびＨａｐＩＩは、母体および発端者のゲノムの遺伝子型情報に基づいて推定され得る。

図３３は、脆弱Ｘ症候群の非侵襲的検出のワークフローを示す。母体バフィーコートＤＮＡのヘテロ接合ＳＮＰ部位にわたって、発端者の遺伝子型と同一の対立遺伝子を使用して、次の世代における完全変異の潜在的な前駆体である前変異対立遺伝子（すなわち、ＨａｐＩ）に関連したハプロタイプを定義した。一方、発端者の遺伝子型とは異なる対立遺伝子を使用して、対応する野生型対立遺伝子（ＨａｐＩＩ）に関連したハプロタイプを定義した。胎児を妊娠中の発端者の母親からの母体血漿ＤＮＡを、単一分子リアルタイム配列決定に供した。配列決定リードを、取得された遺伝子情報が調査中のそれらのゲノム遺伝子座にわたってＨａｐＩまたはＨａｐＩＩの対立遺伝子と同一であったかどうかに応じて、母体ＨａｐＩおよびＨａｐＩＩに割り当てた。本開示の実施形態に従って、血漿ＤＮＡ分子のメチル化パターンを使用して、特定の数のＣｐＧ部位を含有するそれらの血漿ＤＮＡ分子の起源組織を決定した（すなわち、メチル化パターン分析に基づいて胎盤起源であると特定されたＤＮＡ分子は、胎児由来であると決定される）。

シナリオＡにおいて、胎児（すなわち、胎盤）ＤＮＡ分子が、母体ＨａｐＩに割り当てられたそれらの血漿ＤＮＡ分子から検出可能であったが、母体ＨａｐＩＩに割り当てられたそれらの血漿ＤＮＡ分子では検出できなかった場合、ＨａｐＩは、まだ生まれていない胎児に受け継がれると決定される。胎児は、脆弱Ｘ症候群に罹患するリスクが高いと決定される。血漿ＤＮＡ分子の胎盤起源は、以下に考察されるように、分子のメチル化状態に基づいている。

シナリオＢにおいて、胎児ＤＮＡ分子が、母体ＨａｐＩＩに割り当てられたそれらの血漿ＤＮＡ分子から検出可能であったが、母体ＨａｐＩに割り当てられたそれらの血漿ＤＮＡ分子では検出できなかった場合、ＨａｐＩＩは、まだ生まれていない胎児に受け継がれると決定される。胎児は、脆弱Ｘ症候群に罹患していないと決定される。

実施形態において、胎児ＤＮＡ分子についての「検出可能」および「検出不能」の定義は、胎児（すなわち、胎盤）起源であると特定された血漿ＤＮＡ分子のパーセンテージのカットオフに依存し得る。「検出可能」のカットオフとしては、１％、２％、３％、４％、５％、１０％、１５％、２０％、３０％、４０％、５０％超などが挙げられるが、これらに限定されない。「検出不能」のカットオフとしては、１％、２％、３％、４％、５％、１０％、１５％、２０％、３０％、４０％、５０％未満などが挙げられるが、これらに限定されない。いくつかの実施形態において、ＨａｐＩとＨａｐＩＩとの間の胎児起源であると決定された血漿ＤＮＡ分子のパーセンテージの差は、１％、２％、３％、４％、５％、１０％、１５％、２０％、３０％、４０％、５０％よりも大きいものなどである必要があり得るが、これらに限定されない。他のいくつかの実施形態において、ハプロタイプ情報は、ロングリード配列決定技術（例えば、ＰａｃＢｉｏまたはナノポア配列決定）（Ｅｄｇｅｅｔａｌ．ＮａｔＣｏｍｍｕｎ．２０１９；１０：４６６０）、合成ロングリード（例えば、１０ＸＧｅｎｏｍｉｃｓからのプラットフォームを使用）（Ｈｕｉｅｔａｌ．ＣｌｉｎＣｈｅｍ．２０１７；６３：５１３－１４）、標的遺伝子座増幅（ＴＬＡ）ベースのフェージング（Ｖｅｒｍｅｕｌｅｎｅｔａｌ．ＡｍＪＨｕｍＧｅｎｅｔ．２０１７；１０１：３２６－３９）、および統計的フェージング（例えば、Ｓｈａｐｅ－ＩＴ）（Ｄｅｌａｎｅａｕｅｔａｌ．ＮａｔＭｅｔｈｏｄ．２０１１；９：１７９－８１）から取得され得る。

実施形態において、本出願に開示されるメチル化状態マッチングアプローチに従って、少なくとも２００ｂｐであり、少なくとも５つのＣｐＧ部位（または長いＤＮＡ分子の場合、任意の他のカットオフ）を含有したそれらの血漿ＤＮＡ分子の母体および胎児起源を決定し得る。ゲノム位置ｃｈｒＸ：１４３，７８２，２４５～１４３，７８２，７８６（ＦＭＲ１遺伝子から３．２Ｍｂ離れている）に位置し、対立遺伝子（位置：ｃｈｒＸ：１４３７８２４３４、ＳＮＰアクセッション番号：ｒｓ６６２６４８３、対立遺伝子の遺伝子型：Ｃ）が母体ＨａｐＩＩ上の対応する対立遺伝子と同一であるが、母体ＨａｐＩとは異なる、１つの血漿ＤＮＡ分子を特定した。

図３４は、胎盤およびバフィーコートＤＮＡのメチル化プロファイルと比較した血漿ＤＮＡのメチル化パターンを示す。血漿ＤＮＡ分子は、５つのＣｐＧ部位を含有した。メチル化パターンは、「Ｍ－Ｕ－Ｕ－Ｕ－Ｕ」であると決定された。単一分子リアルタイム配列決定から取得されたこのメチル化パターンを、本開示に記載のメチル化状態マッチングアプローチに従って、バイサルファイト配列決定から取得された胎盤組織およびバフィーコートＤＮＡ試料の参照メチル化プロファイルと比較した。胎盤に由来するこの分子についてのスコア［すなわち、Ｓ（胎盤）］は、２であり、－３のバフィーコート由来のスコア［すなわち、Ｓ（バフィーコート）］よりも大きかった。したがって、そのような血漿ＤＮＡ分子（ｃｈｒＸ：１４３，７８２，２４５～１４３，７８２，７８６）は、胎児起源であると決定された。しかしながら、胎児由来である母体ＨａｐＩからの対立遺伝子を担持する血漿ＤＮＡ分子は観察されなかった。したがって、胎児が母体ＨａｐＩＩを受け継ぎ、脆弱Ｘ症候群に罹患していなかったと結論付けた。

本明細書に記載のアプローチの性能は、以下の要因により、Ｘ染色体不活性化によって大きな影響を受けない可能性があると想定した。
１）Ｘ－不活性化は、ヒトにおいて完全ではない。Ｘ染色体上の遺伝子の１／３ほど多くが、Ｘ不活性化からの可変脱出を示した（Ｃｏｔｔｏｎｅｔａｌ．ＨｕｍＭｏｌＧｅｎｅｔ．２０１５；２５：１５２８－１５３９）。ＣｐＧアイランド外のＣｐＧ部位（すなわち、ＣｐＧ部位の大部分）は、両方の性別において同程度メチル化されており、Ｘ染色体におけるＣｐＧ部位のほとんどについてのメチル化状態が、Ｘ不活性化によって影響を受けない可能性があることを示唆している（Ｙａｓｕｋｏｃｈｉｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１０；１０７：３７０４－９）。
２）まだ生まれていない胎児に関して性別が一致した胎盤組織のメチル化プロファイルを使用した。この戦略は、男性の胎児を妊娠中の女性についての血漿ＤＮＡメチル化パターンを使用して、胎児の母性遺伝を検出するのに有用であり、これは、Ｘ－不活性化の影響を受けないはずであった男性の胎児を含む胎盤組織が、特定の領域についてＸ不活性化を多かれ少なかれ伴った他の母体組織とは異なる独特のメチル化パターンを有するためである。

単一分子リアルタイム配列決定を使用して、母体バフィーコート試料から抽出されたＤＮＡをさらに配列決定した。サブリード深度の中央値がＣＣＳ当たり５倍で、２３０万個のＣＣＳを取得した。結果は、母体ＨａｐＩが１２４個のＣＧＧ反復を有する前変異対立遺伝子を担持し、母体ＨａｐＩＩが４３個のＣＧＧ反復を有する野生型対立遺伝子を担持したことを確認した。さらに、胎児の絨毛膜絨毛サンプリングから抽出されたＤＮＡを、単一分子リアルタイム配列決定でさらに配列決定した。サブリード深度の中央値がＣＣＳ当たり４倍で、１１０万個のＣＣＳを取得した。結果は、まだ生まれていない胎児が野生型対立遺伝子を担持したことを確認した。

Ｅ．ヒトゲノム中のＣｐＧ部位の分布
ＤＮＡ断片が長いほど、断片が複数のＣｐＧ部位を有する確率は高くなる。これらの複数のＣｐＧ部位は、メチル化パターンまたは他の分析に使用され得る。

図３５は、ヒトゲノムにわたる５００ｂｐ領域内のＣｐＧ部位の分布を示す。１列目は、ＣｐＧ部位の数を示す。２列目は、ＣｐＧ部位の数を有する５００ｂｐ領域の数を示す。３列目は、特定の数のＣｐＧ部位を有する領域によって表されるすべての領域の割合を示す。例えば、５００ｂｐ領域の８６．１４％は、少なくとも１つのＣｐＧ部位を有する。さらに、５００ｂｐ領域の１１．０８％は、少なくとも１０個のＣｐＧ部位を有する。

図３６は、ヒトゲノムにわたる１ｋｂ領域内のＣｐＧ部位の分布を示す。１列目は、ＣｐＧ部位の数を示す。２列目は、ＣｐＧ部位の数を有する１ｋｂ領域の数を示す。３列目は、特定の数のＣｐＧ部位を有する領域によって表されるすべての領域の割合を示す。例えば、５００ｂｐ領域の９１．６７％は、少なくとも１つのＣｐＧ部位を有する。また、５００ｂｐ領域の３２．９１％は、少なくとも１０個のＣｐＧ部位を有する。

図３７は、ヒトゲノムにわたる３ｋｂ領域内のＣｐＧ部位の分布を示す。１列目は、ＣｐＧ部位の数を示す。２列目は、ＣｐＧ部位の数を有する３ｋｂ領域の数を示す。３列目は、特定の数のＣｐＧ部位を有する領域によって表されるすべての領域の割合を示す。例えば、３ｋｂ領域の９２．４５％は、少なくとも１つのＣｐＧ部位を有する。さらに、３ｋｂ領域の８７．０９％は、少なくとも１０個のＣｐＧ部位を有する。

いくつかの実施形態において、異なる数のＣｐＧ部位および異なるサイズのカットオフは、胎盤特異的マーカーの特定および起源組織分析の感度および特異度を最大化するために使用される。概して、ＣｐＧ部位は、ＳＮＰよりも頻繁に出現する。所与のサイズのＤＮＡ断片は、ＳＮＰよりも多くのＣｐＧ部位を有する可能性が高い。上に示された表は、同じサイズの領域内でＣｐＧ部位よりもＳＮＰが少ないため、ＣｐＧ部位と同じ数のＳＮＰを有する領域について、より低い割合を示し得る。結果として、ＣｐＧ部位を使用すると、ＳＮＰのみを使用するよりも多くの断片が使用されることを可能にし、より優れた統計を提供する。

Ｆ．起源組織分析の例
実施形態において、母体血漿中の起源組織分析を、Ｔ細胞、Ｂ細胞、好中球、肝臓、および胎盤を含む２つ以上の臓器／組織まで拡大し得る。単一分子リアルタイム配列決定を使用して、９つの母体ＤＮＡ試料を配列決定した。本開示に記載のメチル化状態マッチングアプローチに従って、血漿ＤＮＡメチル化パターンを使用して、母体血漿ＤＮＡへの胎盤の寄与を推定した。このメチル化状態マッチング分析の場合、一実施形態において、母体血漿ＤＮＡ試料における少なくとも５００ｂｐの長さで、少なくとも５つのＣｐＧ部位を含有した各ＤＮＡ分子のメチル化パターンを、バイサルファイト配列決定から取得された参照組織メチル化プロファイルと比較した。好中球、Ｔ細胞、Ｂ細胞、肝臓、および胎盤を含む５つの組織を参照組織として使用した。血漿ＤＮＡ分子は、その血漿ＤＮＡ分子についての最大メチル化状態マッチングスコアに対応する組織に割り当てられる。他の組織と比較した組織に割り当てられた血漿ＤＮＡ分子のパーセンテージは、その試料の母体血漿ＤＮＡに対するその組織の比例寄与とみなされる。実施形態において、母体血漿中の好中球、Ｔ細胞、およびＢ細胞の比例寄与の合計は、造血細胞の比例寄与の代用を提供した。

図３８は、メチル化状態マッチング分析を使用した、母体血漿中の異なる組織からのＤＮＡ分子の比例寄与を示す。１列目は、試料識別を示す。２列目は、造血細胞寄与をパーセントとして示す。３列目は、肝臓寄与をパーセントとして示す。４列目は、胎盤寄与をパーセントとして示す。図３８は、母体血漿ＤＮＡの主な寄与因子が造血細胞であることを示し（中央値：５５．９％）、これは、以前の報告（Ｓｕｎｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ５５０３－１２、Ｚｈｅｎｇｅｔａｌ．ＣｌｉｎＣｈｅｍ．２０１２；５８：５４９－５８）と一致していた。

図３９Ａおよび３９Ｂは、胎盤寄与とＳＮＰアプローチによって推定された胎児のＤＮＡ画分との間の関係を示す。ｘ軸は、ＳＮＰアプローチによって決定された胎児画分を示す。ｙ軸は、メチル化状態マッチング分析を使用することによって、母体血漿中の決定された胎盤寄与をパーセントとして示す。図３９Ａは、メチル化状態マッチング分析によって決定された胎盤寄与と、ＳＮＰによって推定された胎児ＤＮＡ画分との間の良好な相関関係を示す（ピアソンのｒ＝０．９５、Ｐ値＜０．０００１）。二次計画法（Ｓｕｎｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ５５０３－１２）に従って、単一分子リアルタイム配列決定によって決定された血漿ＤＮＡメチル化密度を、バイサルファイト配列決定から取得された様々な参照組織メチル化プロファイルと比較することによって、母体血漿ＤＮＡの組織デコンボリューション分析をさらに実施した。図３９Ｂは、メチル化密度ベースのアプローチを使用すると、胎盤寄与（Ｓｕｎｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ５５０３－１２）と胎児ＤＮＡ画分との間の相関関係が、メチル化状態マッチング分析を使用した場合と比較して低減されたことを示す（ピアソンのｒ＝０．６５、Ｐ値＝０．０５９）。

これらのデータは、母体血漿ＤＮＡ試料中の異なる組織によって寄与されたＤＮＡ分子の割合を推定することが実現可能であったことを示唆した。別の実施形態において、この方法を使用して、侵襲的固形組織生検後に取得された試料中の異なる細胞型もしくは組織からの、または手術後に取得された固形組織からのＤＮＡ分子を測定することもできる。いくつかの実施形態において、母体血漿ＤＮＡへの異なる組織の比例寄与を推定するために、単一ＤＮＡ分子レベルでのメチル化パターンを使用することは、ゲノムにわたるすべての配列決定された血漿ＤＮＡ分子からの集計されたメチル化密度に基づくアプローチよりも優れている。

Ｇ．例示的な方法
図４０は、胎児を妊娠中の女性から取得された生物学的試料を分析する方法４０００を示す。生物学的試料には、胎児および女性からの複数の無細胞ＤＮＡ分子を含み得る。

ブロック４０１０では、複数の無細胞ＤＮＡ分子に対応する配列リードが受け取られ得る。いくつかの実施形態において、方法４０００は、無細胞ＤＮＡ分子の配列決定を実施することを含み得る。

ブロック４０２０では、複数の無細胞ＤＮＡ分子のサイズが測定され得る。測定は、配列リードを参照ゲノムにアライメントすることを含み得る。いくつかの実施形態において、測定は、完全長配列決定および完全長配列中のヌクレオチドの数のカウントを含み得る。いくつかの実施形態において、測定は、生物学的試料からの複数の無細胞ＤＮＡ分子を、生物学的試料中の他の無細胞ＤＮＡ分子から物理的に分離することを含み得、他の無細胞ＤＮＡ分子は、カットオフ値よりも小さいサイズを有する。物理的分離には、ビーズの使用を含む本明細書に記載の任意の技術が含まれ得る。

ブロック４０３０では、複数の無細胞ＤＮＡ分子からの無細胞ＤＮＡ分子のセットが、カットオフ値以上のサイズを有するものとして特定され得る。カットオフ値は、２００ｎｔ以上であり得る。カットオフ値は、６００ｎｔ、７００ｎｔ、８００ｎｔ、９００ｎｔ、１ｋｎｔ、１．１ｋｎｔ、１．２ｋｎｔ、１．３ｋｎｔ、１．４ｋｎｔ、１．５ｋｎｔ、１．６ｋｎｔ、１．７ｋｎｔ、１．８ｋｎｔ、１．９ｋｎｔ、または２ｋｎｔを含み、少なくとも５００ｎｔであり得る。カットオフ値は、長い無細胞ＤＮＡ分子について本明細書に記載の任意のカットオフ値であり得る。サイズは、分子の長さではなくＣｐＧ部位の数であり得る。例えば、カットオフ値は、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、またはそれ以上のＣｐＧ部位であり得る。

ブロック４０４０では、無細胞ＤＮＡ分子のセットの１つの無細胞ＤＮＡ分子について、複数の部位の各部位でのメチル化状態が決定され得る。複数の部位は、少なくとも５、６、７、８、９、１０、１１、１２、１３、１４、１５、またはそれ以上のＣｐＧ部位を含み得る。複数の部位のうちの少なくとも１つは、メチル化され得る。複数の部位の２つの部位は、少なくとも１６０ｎｔ、１７０ｎｔ、１８０ｎｔ、１９０ｎｔ、２００ｎｔ、２５０ｎｔ、または５００ｎｔだけ分離し得る。方法は、複数の無細胞ＤＮＡ分子を配列決定して、配列リードを取得することと、部位のヌクレオチドおよび部位に隣接するヌクレオチドに対応する特性を測定することによって、部位のメチル化状態を決定することと、を含み得る。例えば、メチル化は、米国出願第１６／９９５，６０７号にあるように決定され得る。

ブロック４０５０では、メチル化パターンが決定され得る。メチル化パターンは、複数の部位の各部位でのメチル化状態を示し得る。

ブロック４０６０では、メチル化パターンが、１つ以上の参照パターンと比較され得る。１つ以上の参照パターンの各々は、特定の組織型について決定され得る。いくつかの実施形態において、比較は、参照パターンに一致する部位の数を決定することを含み得る。

１つ以上の参照パターンの参照パターンは、参照組織からのＤＮＡ分子を使用して、複数の参照部位の各参照部位のメチル化密度を測定することによって決定され得る。複数の参照部位の各参照部位のメチル化密度は、１つ以上の閾値メチル化密度と比較され得る。複数の参照部位の各参照部位は、メチル化密度を１つ以上の閾値メチル化密度と比較することに基づいて、メチル化、非メチル化、または無情報として特定され得、複数の部位は、メチル化または非メチル化として特定される複数の参照部位である。無情報部位は、メチル化密度が２つの閾値メチル化密度の間にあるものを含み得る。例えば、無情報部位のメチル化指数は、本明細書に記載されるように、３０～７０または他の任意の範囲であり得る。

ステップ４０７０では、無細胞ＤＮＡ分子の起源組織が、メチル化パターンを使用して決定され得る。起源組織は、胎盤であり得る。起源組織は、胎児または母体であり得る。方法が、図２２を用いた説明と同様に、メチル化パターンが参照パターンに一致する場合、起源組織が参照組織であると決定することをさらに含み得る。一致は、完全な一致を指し得る。いくつかの実施形態において、起源組織を参照組織であると決定することは、メチル化パターンが参照パターンの部位の特定のパーセンテージに一致する場合であり得る。例えば、メチル化パターンは、参照パターンの部位の少なくとも６０％、７０％、８０％、８５％、９０％、９５％、９７％、またはそれ以上に一致し得る。

方法は、メチル化パターンを複数の参照組織の第１の参照組織からの第１の参照メチル化パターンと比較することによって類似性スコアを決定することによって、起源組織を決定することを含み得る。類似性スコアは、本明細書に記載のメチル化状態マッチングプロセスまたはベータ分布確率モデルを用いて計算され得る。類似性スコアは、閾値と比較され得る。類似性スコアが閾値を超えた場合、起源組織は、第１の参照組織であると決定され得る。類似性スコアは、第１の類似性スコアであり得る。方法は、メチル化パターンを複数の参照組織の第２の参照組織からの第２の参照メチル化パターンと比較することによって第２の類似性スコアを決定することによって、閾値を計算することをさらに含み得る。第１の参照組織および第２の参照組織は、異なる組織であり得る。閾値は、第２の類似性スコアであり得る。第１の参照組織は、すべての他の参照組織と比較して最高の類似性スコアを有し得る。

第１の参照メチル化パターンは、第１の参照組織についてメチル化されている少なくとも第１の確率を有する部位の第１のサブセットを含み得る。例えば、部位の第１のサブセットは、メチル化されているか、または通常はメチル化されているとみなされる部位であり得る。第１の参照メチル化パターンは、第１の参照組織についてメチル化されている最大で第２の確率を有する部位の第２のサブセットを含み得る。例えば、部位の第２のサブセットは、メチル化されていないか、または通常はメチル化されていないとみなされる部位であり得る。類似性スコアを決定することは、複数の部位の１つの部位がメチル化され、複数の部位のその部位が、部位の第１のサブセット内にある場合、類似性スコアを増加させることと、複数の部位の１つの部位がメチル化され、複数の部位のその部位が、部位の第２のサブセット内にある場合、類似性スコアを減少させることと、を含み得る。類似性スコアは、本明細書に記載のメチル化状態マッチングアプローチと同様に決定され得る。

第１の参照メチル化パターンは、複数の部位を含み、複数の部位の各部位は、第１の参照組織についてメチル化されている確率およびメチル化されていない確率によって特徴付けられる。類似性スコアは、複数の部位の各部位について、無細胞ＤＮＡ分子中の部位のメチル化状態に対応する参照組織中の確率を決定することによって決定され得る。類似性スコアは、複数の確率の積を計算することによって決定され得る。積は、類似性スコアであり得る。確率は、本明細書に記載のアプローチと同様に、ベータ分布によって決定され得る。

方法４０００は、無細胞ＤＮＡ分子のセットの各無細胞ＤＮＡ分子についての起源組織を決定することをさらに含み得る。この決定は、複数のそれぞれの部位の各部位のメチル化状態を決定することを含み、複数のそれぞれの部位は、無細胞ＤＮＡ分子に対応する。起源組織の決定は、メチル化パターンを決定することをさらに含み得る。さらに、起源組織の決定はまた、メチル化パターンを、１つ以上の参照パターンの少なくとも１つの参照パターンと比較することを含み得る。いくつかの実施形態において、メチル化パターンの比較は、図２２および付随する説明と同様であり得る。図２２中、胎盤、肝臓、血球、および結腸は、示された参照パターンを有する参照組織の例である。図３８は、参照組織の別の例として造血細胞を示す。

いくつかの実施形態において、各起源組織に対応する無細胞ＤＮＡ分子の量が決定され得る。各起源組織は、複数の参照組織の各参照組織を含み得る。起源組織の画分寄与は、各起源組織に対応する無細胞ＤＮＡ分子の量を使用して決定され得る。例えば、起源組織は、胎盤であり得る。他の起源組織は、造血細胞および肝臓を含み得る。例えば、胎盤の画分寄与は、無細胞ＤＮＡ分子の量を、すべての起源組織に対応する無細胞ＤＮＡ分子の合計で割ったものから決定され得る。いくつかの実施形態において、無細胞ＤＮＡ分子の量を無細胞ＤＮＡ分子の合計で割ったものから計算された画分は、関数または較正データ点のセットを介した画分寄与に関連し得る。関数および較正データ点のセットは両方とも、起源組織の既知の画分寄与を有する複数の較正試料から決定され得る。各較正データ点は、画分の較正値に対応する画分寄与を指定し得る。関数は、較正データ点の線形または非線形の適合を表し得、画分寄与を起源組織の画分または起源組織を含む他のパラメータと関連付け得る。画分寄与を決定する実施形態は、図３９Ａおよび３９Ｂで説明されるものと同様であり得る。

機械学習モデルを使用して、起源組織を決定し得る。モデルは、複数の訓練メチル化パターンを受け取ることによって訓練され得、各訓練メチル化パターンは、複数の部位の１つ以上の部位にメチル化状態を有し、各訓練メチル化パターンは、既知の組織からのＤＮＡ分子から決定される。既知の組織からの各分子は、細胞ＤＮＡであり得る。訓練は、複数の訓練試料を保存することを含み得、各訓練試料は、複数の訓練メチル化パターンのうちの１つ、および訓練メチル化パターンに対応する既知の組織を示すラベルを含む。訓練は、複数の訓練試料を使用して、複数の訓練メチル化パターンがモデルに入力されたときに対応するラベルと一致するかまたは一致しないモデルの出力に基づいて、モデルのパラメータを最適化することを含み得る。パラメータは、複数の部位の１つの部位が複数の部位の別の部位と同じメチル化状態を有するかどうかを示す第１のパラメータを含み得る。例えば、モデルは、図２４の一対比較と同様であり得る。パラメータは、複数の部位の部位間の距離を示す第２のパラメータを含み得る。いくつかの実施形態において、機械学習モデルは、メチル化部位の参照ゲノムへのアラインメントを必要としない場合がある。モデルの出力は、入力されたメチル化パターンに対応する組織を指定し得る。

機械学習モデルは、畳み込みニューラルネットワーク（ＣＮＮ）または本明細書に記載の任意のモデルであり得る。モデルには、線形回帰、ロジスティック回帰、深層再帰型ニューラルネットワーク（例えば、長短期記憶、ＬＳＴＭ）、ベイズ分類器、隠れマルコフモデル（ＨＭＭ）、線形判別分析（ＬＤＡ）、ｋ平均クラスタリング、ノイズを伴う用途の密度ベースの空間クラスタリング（ＤＢＳＣＡＮ）、ランダムフォレストアルゴリズム、およびサポートベクトルマシン（ＳＶＭ）が含まれ得るが、これらに限定されない。

父子関係は、方法４０００によって決定され得る。起源組織は、胎児であり得る。方法は、複数の配列リードの１つの配列リードを参照ゲノムの第１の領域にアラインメントすることであって、第１の領域が対立遺伝子に対応する複数の部位を含み、複数の部位が閾値数の部位を含む、アラインメントすることと、複数の部位の各部位に存在するそれぞれの対立遺伝子を使用して、第１のハプロタイプを決定することと、第１のハプロタイプを、男性対象に対応する第２のハプロタイプと比較することと、比較を使用して、男性対象が胎児の父親である尤度の分類を決定することと、をさらに含み得る。男性対象は、ハプロタイプが一致する場合に父親である可能性が高い、またはハプロタイプが一致しない場合に父親である可能性が低いとみなされ得る。いくつかの実施形態において、第１のハプロタイプは、男性対象の両方のハプロタイプと比較され得る。

実施形態において、父子関係は、複数の配列リードの１つの配列リードを参照ゲノムの第１の領域にアラインメントすることによって、起源組織が胎児である場合に試験され得る。第１の領域は、対立遺伝子に対応する第１の複数の部位を含み得る。複数の部位は、閾値数の部位を含み得る。部位の閾値数は、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、またはそれ以上の部位であり得る。複数の部位の各部位の対立遺伝子は、男性対象のゲノム中の対応する部位の対立遺伝子と比較され得る。男性対象が胎児の父親である尤度の分類は、比較を使用して決定され得る。男性対象は、対立遺伝子の特定の数またはパーセンテージが一致する場合に父親である可能性が高い、またはその数またはパーセンテージ未満が一致する場合に父親である可能性が低いとみなされ得る。カットオフパーセンテージは、１００％、９０％、８０％、または７０％であり得る。

いくつかの実施形態において、ハプロタイプが決定され得る。方法は、無細胞ＤＮＡ分子のセットの各無細胞ＤＮＡ分子について、無細胞ＤＮＡ分子に対応する配列リードを参照ゲノムにアラインメントすることを含み得る。配列リードは、女性に存在するハプロタイプに対応するものとして特定され得る。女性に存在するハプロタイプは、女性の遺伝子型決定から知られ得る。いくつかの実施形態において、女性のハプロタイプは、女性からの生物学的試料中のハプロタイプのＤＮＡ断片の濃度を分析することによって知られ得る。起源組織は、メチル化パターンを使用して胎児として決定され得る。ハプロタイプは、母性遺伝の胎児ハプロタイプであると決定され得る。

ハプロタイプの遺伝は、インプリンティング遺伝子座と関連するような既知のメチル化プロファイルを使用するのではなく、参照組織のメチル化を使用して決定され得る。メチル化パターンと参照パターンに対する一致または類似性スコアは、所与の対立遺伝子または部位が、それが受け継がれた親に基づいてメチル化されているかどうかの知見を除外し得る。

ハプロタイプは、病気を引き起こす遺伝子変異または変化を担持するものとして特定され得る。疾患を引き起こす遺伝子変異を担持するものとしてハプロタイプを特定することは、第１の配列リードにおける遺伝子変異または変化を特定することを含み得る。遺伝子変異には、一塩基差異、欠失、または挿入が含まれ得る。第１の配列リードの第１の距離内の第１のゲノム位置に対応する、第２の配列リードにおける第１のメチル化レベルが測定され得る。第１の配列リードの第２の距離内の第２のゲノム位置に対応する、第３の配列リードにおける第２のメチル化レベルも測定され得る。第１の距離は、１００ｎｔ、２００ｎｔ、３００ｎｔ、４００ｎｔ、５００ｎｔ、６００ｎｔ、７００ｎｔ、８００ｎｔ、９００ｎｔ、１ｋｎｔ、２ｋｎｔ、５ｋｎｔ、または１０ｋｎｔであり得る。第２の配列リードおよび第３の配列リードは、第１の配列リードと同じ染色体腕上にあり得る。第１のメチル化レベルおよび第２のメチル化レベルは、遺伝子変異または変化と関連し得る。第１のメチル化レベルおよび第２のメチル化レベルは、遺伝子変異または変化と関連した１つまたは２つの閾値レベルよりも大きくなり得る。閾値レベルは、遺伝子変異または変化を有するか、または有しないことが知られている対象を使用して決定され得る。方法は、胎児が遺伝子変異または変化によって引き起こされる疾患を有する可能性が高いとを分類することを含み得る。

胎児特異的メチル化パターンが決定され得る。方法は、無細胞ＤＮＡ分子のセットの各無細胞ＤＮＡ分子について、無細胞ＤＮＡ分子に対応する配列リードを参照ゲノムにアラインメントすることを含み得る。方法は、領域に対応するものとして配列リードを特定することを含み得る。領域は、胎児組織からの複数の胎児ＤＮＡ分子に対応する複数の胎児配列リードを受け取ることによって決定され得る。方法は、複数の母体ＤＮＡ分子に対応する複数の母体配列リードを受け取ることを含み得る。方法は、複数の胎児配列リードの各胎児配列リードについて、領域内の複数のメチル化部位の各メチル化部位の胎児メチル化状態を決定することを含み得る。方法は、複数の母体配列リードの各母体配列リードについて、複数のメチル化部位の各メチル化部位の母体メチル化状態を決定することを含み得る。

胎児特異的メチル化パターンを決定するための方法は、胎児メチル化状態が母体メチル化状態と異なる部位の量を特徴付けるパラメータの値を決定することを含み得る。方法は、パラメータの値を閾値と比較することを含み得る。パラメータは、胎児ＤＮＡ分子と母体ＤＮＡ分子との間で異なる部位の割合であり得る。割合は、本明細書に記載の不一致スコアであり得る。閾値は、不一致スコアの最小レベルを示し得、０．３、０．４、０．５、０．６、０．７、０．８、０．９、またはそれ以上であり得る。いくつかの実施形態において、閾値は、母体または胎児ＤＮＡ分子の平均不一致スコアを表し得る。方法は、パラメータの値が閾値を超えると決定することを含み得る。いくつかの実施形態において、母体または胎児ＤＮＡ分子の特定のパーセンテージが、閾値を超えるパラメータの値を有する必要があり得る。例えば、パーセンテージは、５０％、６０％、７０％、８０％、９０％、またはそれ以上であり得る。いくつかの実施形態において、領域に対応する胎児ＤＮＡ分子の特定のパーセンテージが、胎児特異的メチル化パターンを有する必要があり得る。例えば、パーセンテージは、４０％、５０％、６０％、７０％、８０％、またはそれ以上であり得る。この方法は、図２５で説明される方法と同様であり得る。

方法は、起源組織からの無細胞ＤＮＡ分子のために生物学的試料を濃縮することを含み得る。生物学的試料を濃縮することは、無細胞ＤＮＡ分子のセットを選択および増幅することを含み得る。本明細書に記載されるように、濃縮は、サイズベースの選択を含み得る。いくつかの実施形態において、濃縮は、メチル化パターンベースの選択を含み得る。例えば、メチル－ＣｐＧ結合ドメイン（ＭＢＤ）ベースの捕捉および配列決定が使用され得る。無細胞ＤＮＡは、メチル化シトシンに結合することができるタグ付けされたＭＢＤタンパク質とインキュベートされ得る。次いで、タンパク質－ＤＮＡ複合体を、抗体結合磁気ビーズで沈殿させ得る。より多くのメチル化ＣｐＧ部位を有するＤＮＡ分子は、下流分析のために優先的に濃縮され得る。

ＩＩＩ．在胎期間に伴う長い無細胞ＤＮＡ断片の変化
長い無細胞ＤＮＡ断片の量は、在胎期間とともに変化し得る。長い無細胞ＤＮＡ断片は、在胎期間を決定するために使用され得る。さらに、長い無細胞ＤＮＡ断片は、短い無細胞ＤＮＡ断片と比較して、特定の末端モチーフにおいてより豊富であり得、特定の末端モチーフの相対量は、在胎期間とともに変化し得る。末端モチーフの量は、在胎期間を決定するためにも使用され得る。長い無細胞ＤＮＡ断片を使用して決定された在胎期間および他の臨床技術によって決定された在胎期間の偏差は、妊娠関連障害を示し得る。いくつかの実施形態において、長い無細胞ＤＮＡ断片を使用して、必ずしも在胎期間を決定することなく妊娠関連障害の尤度を決定し得る。

Ａ．胎児および母体ＤＮＡについてのサイズ分析
妊娠初期（在胎期間：１３週）の２人の妊娠中の女性、妊娠中期（在胎期間：２１～２２週）の２人、および妊娠後期（在胎期間：３８週）の５人の血漿ＤＮＡを、単一分子リアルタイム（ＳＭＲＴ）配列決定（ＰａｃＢｉｏ）を使用して配列決定した。各症例について、１億７，６００万の中央値（範囲：４９～６億８，５００万）のサブリードが取得され、そのうち１億２，８００万個（範囲：３５～５億７００万）のサブリードが、ヒト参照ゲノム（ｈｇ１９）にアラインメントされ得る。ＳＭＲＴウェル内の各分子を平均して１０７回配列決定した。９６５，３０８の中央値（範囲：２５１，６８６～２，８７１，５２５）の高品質循環コンセンサス配列（ＣＣＳ）リードは、少なくとも３つのサブリードを有するＣＣＳリードとして定義され、下流分析に使用され得る。

各妊娠期から取得された試料からのすべての配列決定された分子を、サイズ分析のために一緒にプールした。妊娠初期、妊娠中期、および妊娠後期の母体血漿試料について、それぞれ、合計１９４万個、５０９万個、および４４５万個の無細胞ＤＮＡ分子があった。

図４１Ａおよび４１Ｂは、０～５ｋｂのサイズ範囲内の妊娠初期、妊娠中期、および妊娠後期の母体血漿試料からの無細胞ＤＮＡ分子のサイズ分布を示す。ｘ軸は、サイズを示す。ｙ軸は、頻度を示す。サイズ分布は、図４１Ａの場合、ｙ軸の線形スケールで０～５ｋｂ、および図４１Ｂの場合、ｙ軸の対数スケールで０～５ｋｂの範囲でプロットされる。３つすべての妊娠期からの血漿ＤＮＡは、図４１Ａに示されるような１６６ｂｐでの期待された主要なピーク、および図４１Ｂに示されるような１ｋｂ～２ｋｂの範囲内の分子に及んだ周期的なパターンで生じる一連の主要なピークを示した。

図４２は、異なる妊娠期における長い血漿ＤＮＡ分子の割合を示す表である。１列目は、血漿試料と関連する在胎期間を示す。２列目は、５００ｂｐよりも長いＤＮＡ分子の割合を示す。３列目は、１ｋｂよりも長いＤＮＡ分子の割合を示す。妊娠初期および妊娠中期と比較して、妊娠後期は、５００ｂｐ以上の血漿ＤＮＡ分子の頻度の増加があった。５００ｂｐを超える長い血漿ＤＮＡ分子の割合は、妊娠初期、妊娠中期、および妊娠後期について、それぞれ１５．８％、１６．１％、および３２．３％であった。１ｋｂを超える長い血漿ＤＮＡ分子の割合は、妊娠初期、妊娠中期、および妊娠後期について、それぞれ１１．３％、１０．６％、および２１．４％であった。妊娠初期および妊娠中期の母体血漿は、同様の割合の長い無細胞ＤＮＡ分子を示したが、妊娠後期の母体血漿は、約２倍の割合の長いＤＮＡ分子を有した。

本開示のために分析されたすべての母体血漿ＤＮＡ試料について、それらの対の母体バフィーコートおよび胎児試料から抽出されたＤＮＡの遺伝子型を、アレイハイブリダイゼーションに基づく遺伝子型決定法であるｉＳｃａｎＳｙｓｔｅｍ上のＩｎｆｉｎｉｕｍＯｍｎｉ２．５Ｅｘｏｍｅ－８Ｂｅａｄｃｈｉｐ（Ｉｌｌｕｍｉｎａ）で決定した。胎児試料を、症例がそれぞれ妊娠初期、妊娠中期、または妊娠後期であったかに応じて、絨毛膜絨毛サンプリング、羊水穿刺、または胎盤のサンプリングによって取得した。母親がホモ接合であり、胎児がヘテロ接合であった２０３，６４７の中央値の有益な一塩基多型（ＳＮＰ）を、各症例について特定した。各妊娠期からのすべての症例についての配列決定されたＤＮＡ分子を一緒にプールした場合、妊娠初期、妊娠中期、および妊娠後期について、それぞれ、胎児特異的対立遺伝子をカバーする合計１，３６２個、２，９８４個、および６，０８２個のＤＮＡ分子を特定した。一方、母親がヘテロ接合であり、胎児がホモ接合体であった２１０，８２０の中央値の有益なＳＮＰを、各症例について特定した。妊娠初期、妊娠中期、および妊娠後期について、それぞれ、母体特異的対立遺伝子をカバーする合計３０，５７４個、６５，２５８個、および７８，３４６個のＤＮＡ分子を特定した。すべての母体血漿試料の間で、６００ｂｐ以下のＤＮＡ分子の配列決定データから決定された胎児ＤＮＡ画分の中央値は、１５．６％（範囲、７．６～２６．７％）であった。

図４３Ａおよび４３Ｂは、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。ｘ軸は、サイズを示す。ｙ軸は、頻度を示す。サイズ分布は、図４３Ａの場合、ｙ軸の線形スケールで０～３ｋｂ、および図４３Ｂの場合、ｙ軸の対数スケールで０～３ｋｂの範囲でプロットされる。

図４４Ａおよび４４Ｂは、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの母体特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。ｘ軸は、サイズを示す。ｙ軸は、頻度を示す。サイズ分布は、図４４Ａの場合、ｙ軸の線形スケールで０～３ｋｂ、および図４４Ｂの場合、ｙ軸の対数スケールで０～３ｋｂの範囲でプロットされる。

図４３Ａ～４４Ｂに示されるように、３つすべての妊娠期からの胎児および母体特異的対立遺伝子をカバーする血漿ＤＮＡ分子は、長い裾の分布を示し、３つすべての妊娠期における、胎児源および母体源の両方に由来する長いＤＮＡ分子の存在を示唆している。

図４５は、異なる妊娠期における長い胎児および母体血漿ＤＮＡ分子の割合の表である。１列目は、血漿試料と関連する在胎期間を示す。２列目は、５００ｂｐよりも長い胎児ＤＮＡ分子の割合を示す。３列目は、５００ｂｐよりも長い母体ＤＮＡ分子の割合を示す。４列目は、１ｋｂよりも長い胎児ＤＮＡ分子の割合を示す。５列目は、１ｋｂよりも長い母体ＤＮＡ分子の割合を示す。母体血漿中のＤＮＡ分子のプールの間で、胎児特異的対立遺伝子（胎盤起源）をカバーするものは、母体特異的対立遺伝子をカバーするものと比較して、長いＤＮＡ分子の割合がより小さかった。５００ｂｐを超えるサイズを有する胎児特異的対立遺伝子をカバーする長い血漿ＤＮＡ分子の割合は、妊娠初期、妊娠中期、および妊娠後期について、それぞれ１９．８％、２３．２％、および３１．７％であった。１ｋｂを超えるサイズを有する胎児特異的対立遺伝子をカバーする長い血漿ＤＮＡ分子の割合は、妊娠初期、妊娠中期、および妊娠後期について、それぞれ１５．２％、１６．５％、および１９．９％であった。

妊娠後期と比較して、妊娠初期および妊娠中期の母体血漿に存在する長い血漿ＤＮＡ分子の割合がより小さく、胎児ＤＮＡ分子が３つすべての妊娠期においてより少ない長いＤＮＡ分子を含有したという事実にもかかわらず、我々の以前の開示および本開示に記載の方法により、以前はショートリード配列決定技術で不可能であったかなりの割合の長い血漿ＤＮＡ分子の分析が可能になった。さらに、電気泳動、クロマトグラフィー、およびビーズベースの方法が挙げられるがこれらに限定されない異なるサイズ選択戦略を使用して、血漿試料中の長いＤＮＡ断片を濃縮することができる。

図４６Ａ、４６Ｂ、および４６Ｃは、異なる妊娠期にわたる特定のサイズ範囲の胎児特異的血漿ＤＮＡ断片の割合のプロットを示す。評価された妊娠症例の在胎期間を、週齢を確定する超音波検査によって検証した。図４６Ａは、１５０ｂｐ以下のＤＮＡ断片についての結果を示す。図４６Ｂは、１５０～６００ｂｐのＤＮＡ断片についての結果を示す。図４６Ｃは、６００以上のＤＮＡ断片についての結果を示す。グラフは、ｙ軸上に胎児特異的断片の割合、およびｘ軸上に在胎期間を有する。グラフに示されるように、１５０ｂｐよりも短い（図４６Ａ）および６００ｂｐよりも長い（図４６Ｃ）胎児特異的断片の割合は両方とも、１５０～６００ｂｐの範囲（図４６Ｂ）の胎児特異的断片の割合と比較して、妊娠後期試料と妊娠初期および妊娠中期試料とを区別する特定の識別力を達成する。６００ｂｐよりも長い胎児特異的断片の割合は、最良の識別力を提供し得る。この結論は、妊娠後期群と妊娠初期および妊娠中期の混合群との間の絶対最小距離が、１５０ｂｐよりも短い胎児特異的断片の割合を使用した場合に０．３８であった一方で、対応する値が、６００ｂｐよりも大きい胎児特異的断片の割合を使用した場合に３．７６であったという事実によって証明された。これらの結果は、病態生理学的状態を反映するための長いＤＮＡ分子の使用が、短いＤＮＡ分子の使用よりも優れていることを示唆した。

Ｂ．血漿ＤＮＡ末端分析
サイズに加えて、配列決定された各ＤＮＡ分子について、ワトソン鎖およびクリック鎖の両方の５’末端の第１のヌクレオチドを別々に決定した。この分析は、４タイプの末端、すなわち、Ａ末端、Ｃ末端、Ｇ末端、およびＴ末端からなった。各妊娠期から取得された母体血漿試料からの特定の末端を有する血漿ＤＮＡ分子のパーセンテージを計算した。各断片サイズでのＡ末端、Ｃ末端、Ｇ末端、およびＴ末端のパーセンテージをさらに分析した。

図４７Ａ、４７Ｂ、および４７Ｃは、０～３ｋｂの断片サイズの範囲にわたる、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの無細胞ＤＮＡ分子の５’末端の塩基含有量の割合のグラフを示す。図４７Ａは、妊娠初期の母体血漿を示す。図４７Ｂは、妊娠中期の母体血漿を示す。図４７Ｃは、妊娠後期の母体血漿を示す。パーセンテージとしての塩基含有量は、ｙ軸上に示される。塩基対の断片のサイズは、ｘ軸上に示される。グラフに見られるように、Ｃ末端は多くのサイズ範囲（ほとんどが１ｋｂ未満）で過剰に表現されており、妊娠初期、妊娠中期、および妊娠後期の試料について異なるサイズ範囲に応じて変化した。妊娠後期試料の血漿ＤＮＡ末端パターンは、妊娠初期および妊娠中期試料とは異なるように思えた。例えば、Ｔ末端曲線およびＧ末端曲線は、１０５～１７２ｂｐの範囲のサイズで混合されたが、妊娠初期および妊娠中期試料中では発散していた。より長い断片（例えば、約１ｋｂ超）の場合、Ｃ末端断片は、最も豊富な断片ではない。Ｇ末端断片は、約１ｋｂでＣ末端断片を追い越し、次いで、Ａ末端断片は、約２ｋｂでＧ末端断片よりも豊富になる。

図４８は、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子間での末端ヌクレオチド塩基の割合の表である。１列目は、分子の末端の塩基を示す。２列目は、期待される割合の点および種を示す。３列目は、妊娠初期の母体血漿についての５００ｂｐ以下の断片間の末端種の割合を示す。４列目は、妊娠初期の母体血漿についての５００ｂｐよりも大きい断片間の末端種の割合を示す。５列目および６列目は、妊娠中期の母体血漿を除いて、また妊娠初期の母体血漿の代わりに、それぞれ、３列目および４列目と同様である。７列目および８列目は、妊娠後期の母体血漿を除いて、また妊娠初期の母体血漿の代わりに、それぞれ、３列目および４列目と同様である。

無細胞ＤＮＡ断片化が完全にランダムであった場合、末端ヌクレオチド塩基の割合は、ヒトゲノムの組成を反映するはずであり、これは、図４８の２列目に示されるように、Ａが２９．５％、Ｔが２９．５％、Ｃが２０．５％、およびＧが２０．５％である。ランダム断片化とは対照的に、５００ｂｐ以下の短い無細胞ＤＮＡ分子の５’末端は、Ｃ末端の実質的な過剰発現（妊娠初期、妊娠中期、および妊娠後期の母体血漿について、それぞれ３０．４％、３０．４％、および３１．３％）、Ｇ末端のわずかな過剰表現（妊娠初期、妊娠中期、および妊娠後期について、それぞれ２７．４％、２６．９％、および２５．３％）、ならびにＡ末端の過小表現（妊娠初期、妊娠中期、および妊娠後期について、それぞれ１９．８％、１９．４％、および１９．３％）、およびＴ末端の過小表現（妊娠初期、妊娠中期、および妊娠後期について、それぞれ２２．４％、２３．３％、および２４．１％）を示した。

しかしながら、短い無細胞ＤＮＡ分子と比較して、５００ｂｐを超える長い無細胞ＤＮＡ分子は、Ａ末端の割合の大幅な増加（妊娠初期、妊娠中期、および妊娠後期の母体血漿について、それぞれ２９．６％、２６．０％、および２６．７％）、Ｇ末端の割合のわずかな増加（妊娠初期、妊娠中期、および妊娠後期について、それぞれ３１．０％、２９．５％、および２９．９％）、Ｔ末端の割合の大幅な減少（妊娠初期、妊娠中期、および妊娠後期について、それぞれ１３．９％、１６．９％、および１６．４％）、ならびにＣ末端の割合のわずかな減少（妊娠初期、妊娠中期、および妊娠後期について、それぞれ２５．５％、２７．５％、および２７．１％）を示した。

図４９は、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの胎児特異的対立遺伝子をカバーする短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子間での末端ヌクレオチド塩基の割合の表である。図５０は、妊娠初期、妊娠中期、および妊娠後期の母体血漿からの母体特異的対立遺伝子をカバーする短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子間での末端ヌクレオチド塩基の割合の表である。１列目は、分子の末端の塩基を示す。２列目は、期待される割合の点および種を示す。３列目は、妊娠初期の母体血漿についての５００ｂｐ以下の断片間の末端種の割合を示す。４列目は、妊娠初期の母体血漿についての５００ｂｐよりも大きい断片間の末端種の割合を示す。５列目および６列目は、妊娠中期の母体血漿を除いて、また妊娠初期の母体血漿の代わりに、それぞれ、３列目および４列目と同様である。７列目および８列目は、妊娠後期の母体血漿を除いて、また妊娠初期の母体血漿の代わりに、それぞれ、３列目および４列目と同様である。図４９および５０は、胎児および母体特異的対立遺伝子をカバーするＤＮＡ分子を別々に調べた場合でも、短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子間での末端ヌクレオチド塩基の割合のそのような差が変わらないままであったことを示す。

図５１は、２５６個の４ｍｅｒ末端モチーフを使用した短い血漿無細胞ＤＮＡ分子および長い血漿無細胞ＤＮＡ分子の階層的クラスタリング分析を示す。各列は、それぞれ、短い断片（１行目にシアン色によって示される）および長い断片（１行目に黄色によって示される）に基づいて、末端モチーフの頻度を分析するために使用される試料を示す。２行目から始まり、各行は、末端モチーフのタイプを示す。末端モチーフの頻度を、行で正規化された頻度（ｚ－スコア）に応じた一連のカラーグラデーションで示した（すなわち、試料にわたる平均頻度よりも下または上の標準偏差の数）。より赤い色は、末端モチーフの頻度がより高いことを示し、より青い色は、末端モチーフの頻度がより低いことを示す。

図５１中、４ｍｅｒ末端モチーフプロファイルを分析することによって、短い無細胞ＤＮＡ分子および長い無細胞ＤＮＡ分子を特徴付けた。各配列決定されたＤＮＡ分子について、ワトソン鎖およびクリック鎖の両方の５’末端の第１の４－ヌクレオチド配列（４ｍｅｒモチーフ）を別々に決定した。各母体血漿試料について、各血漿ＤＮＡ末端モチーフの頻度を、短い（５００ｂｐ以下）および長い（５００ｂｐ超）血漿ＤＮＡ分子について別々に計算した。２５６個の４ｍｅｒ末端モチーフの頻度に基づく階層的クラスタリング分析は、異なる母体血漿試料にわたる長いＤＮＡ分子の末端モチーフプロファイルが、短いＤＮＡ分子とは異なったクラスターを形成したことを示した。これらの結果は、長いＤＮＡおよび短いＤＮＡが異なる断片化特性を有したことを示唆した。実施形態において、長いＤＮＡ分子と短いＤＮＡ分子との間のこれらの末端モチーフの相対摂動を使用して、アポトーシスおよび壊死などであるがこれらに限定されない細胞死経路に由来する無細胞ＤＮＡの寄与を示す。これらの細胞死経路からの活性の増加は、妊娠関連および他の障害に関連し得る。

図５２Ａおよび５２Ｂは、分類分析のための４ｍｅｒ末端モチーフプロファイルを使用した主成分分析（ＰＣＡ）を示す。図５２Ａは、異なる妊娠期からの短い無細胞ＤＮＡ分子（５００ｂｐ以下）を示す。図５２Ｂは、異なる妊娠期からの母体血漿試料の長い無細胞ＤＮＡ分子（５００ｂｐ超）を示す。ｘ軸およびｙ軸上の括弧内のパーセンテージは、対応する成分によって説明される変動の量を表す。各青色の点は、妊娠初期の母体血漿試料を表す。各黄色の点は、妊娠中期の母体血漿試料を表す。各赤色の点は、妊娠後期の母体血漿試料を表す。楕円は、特定の妊娠期からのデータ点を群化するための９５％信頼水準を表す。短い無細胞ＤＮＡ分子（図５２Ａ）（米国出願第１５／７８７，０５０号にも記載される）と比較して、長い無細胞ＤＮＡ分子（図５２Ｂ）の４ｍｅｒ末端モチーフプロファイルは、妊娠初期、妊娠中期、および妊娠後期の母体血漿試料間でより明確な分離をもたらした。実施形態において、分子的在胎期間評価のために、長い血漿ＤＮＡ分子の末端モチーフプロファイルを単独で、またはメチル化レベルおよびサイズを含むがこれらに限定されない他の母体血漿ＤＮＡ特性と組み合わせて利用することができる。

例えば、ニューラルネットワークを使用して、２５６個の末端モチーフ、全体的なメチル化レベル、およびサイズが６００ｂｐ以上の断片の割合に基づいて在胎期間を予測するようにモデルを訓練した。出力変数は、１、２、および３であり、妊娠初期、妊娠中期、および妊娠後期を表す。入力変数は、２５６個の末端モチーフ、全体的なメチル化レベル、およびサイズが６００ｂｐ以上の断片の割合を含んだ。リーブワンアウトアプローチを使用して、在胎期間を予測する性能を評価した。９つの試料を含むデータセットの場合、リーブワンアウトアプローチを、１つの試料をテスト試料として選択し、残りの８つの試料をニューラルネットワークに基づくモデルを訓練するために使用する方法で実行した。そのようなテスト試料は、確立されたモデルに基づいて１、２、または３であると決定された。次いで、まだテストされていない他の試料に対してこのプロセスを繰り返した。そのような訓練およびテストのプロセスを合計９回繰り返した。それらのテスト結果を在胎期間に関する臨床情報と比較することによって、９つの試料のうち８つ（８９％）が、在胎期間に関して正しく予測された。別の実施形態において、そのような分析は、例えば限定されないが、ベイズの定理、ロジスティック回帰、重回帰およびサポートベクターマシン、ランダムフォレスト分析、分類および回帰ツリー（ＣＡＲＴ）、Ｋ近傍アルゴリズムを使用して実施され得る。

次に、各妊娠期から取得された試料からのすべての配列決定された分子を、下流末端モチーフ分析のために一緒にプールした。２５６個の末端モチーフを、短い血漿ＤＮＡ分子および長い血漿ＤＮＡ分子間でのそれらの頻度に従ってランク付けした。

図５３～５８は、特定の長さのＤＮＡ断片（５００ｂｐよりも短いまたは長い）についての、および異なる妊娠期についての、最高頻度を有する２５個の末端モチーフの表である。図５３、５４、および５５は、短い断片（５００ｂｐ未満）のそれらのランクでソートされた末端モチーフを含む表である。図５３～５５中、１列目は、末端モチーフを示す。２列目は、短い断片のモチーフの頻度ランクを示す。３列目は、長い断片のモチーフの頻度ランクを示す。４列目は、短い断片のモチーフの頻度を示す。５列目は、長い断片のモチーフの頻度を示す。６列目は、倍率変化（短い断片のモチーフの頻度を長い断片のモチーフの頻度で割ったもの）を示す。

図５６、５７、および５８は、長い断片（５００ｂｐ超）のそれらのランクでソートされた末端モチーフを含む表である。図５６～５８中、１列目は、末端モチーフを示す。２列目は、長い断片のモチーフの頻度ランクを示す。３列目は、短い断片のモチーフの頻度ランクを示す。４列目は、長い断片のモチーフの頻度を示す。５列目は、短い断片のモチーフの頻度を示す。６列目は、倍率変化（長い断片のモチーフの頻度を短い断片のモチーフの頻度で割ったもの）を示す。

図５３および５６は、妊娠初期試料からのものである。図５４および５７は、妊娠中期試料からのものである。図５５および５８は、妊娠後期試料からのものである。

短い血漿ＤＮＡ分子の間で最高頻度を有する上位２５個の末端モチーフの間で、そのうち１１個は、ＣＣジヌクレオチドで始まった。ＣＣで始まる末端モチーフは全体で、妊娠初期、妊娠中期、および妊娠後期の母体血漿中で、それぞれ短い血漿ＤＮＡ末端モチーフの１４．６６％、１４．６６％、および１５．１３％を占めた。長い血漿ＤＮＡ分子の間で最高頻度を有する上位２５個の末端モチーフの間で、ＴＴジヌクレオチドで終わる４ｍｅｒモチーフは、妊娠中期および妊娠後期の母体血漿中でそれらのうち９つ、ならびに妊娠初期の母体血漿中でそれらのうち１０つを占めた。

配列決定された各ＤＮＡ分子について、ワトソン鎖およびクリック鎖の両方の５’末端から第３のヌクレオチド（Ｘ）および第４のヌクレオチド（Ｙ）のジヌクレオチド配列を別々に決定した。ＸおよびＹは、ＤＮＡにおける４つのヌクレオチド塩基のうちの１つである。１６個の可能なＮＮＸＹモチーフ、すなわち、ＮＮＡＡ、ＮＮＡＴ、ＮＮＡＧ、ＮＮＡＣ、ＮＮＴＡ、ＮＮＴＴ、ＮＮＴＧ、ＮＮＴＣ、ＮＮＧＡ、ＮＮＧＴ、ＮＮＧＧ、ＮＮＧＣ、ＮＮＣＡ、ＮＮＣＴ、ＮＮＣＧ、およびＮＮＣＣがあった。

図５９Ａ、５９Ｂ、および５９Ｃは、短い血漿ＤＮＡ分子および長い血漿ＤＮＡ分子間での、１６個のＮＮＸＹモチーフのモチーフ頻度の散布図を示す。図５９Ａは、妊娠初期についての結果を示す。図５９Ｂは、妊娠中期についての結果を示す。図５９Ｃは、妊娠後期についての結果を示す。長い断片のモチーフ頻度は、ｙ軸上に示される。短い断片のモチーフ頻度は、ｘ軸上に示される。各円は、１６個のＮＮＸＹモチーフのうちの１つを表す。各散布図の点線の対は、短い血漿ＤＮＡ分子（５００ｂｐ以下）と比較した、長い血漿ＤＮＡ分子（５００ｂｐ超）のモチーフ頻度の１．５倍の増加（上の線）および減少（下の線）を示す。影付きの領域の外側に位置する円は、倍率変化が１．５を超えるモチーフを表す。

短い血漿ＤＮＡ分子の末端が、ＣＣジヌクレオチドで始まる４ｍｅｒモチーフ（ＣＣＮＮ）の高い頻度を示した（Ｊｉａｎｇｅｔａｌ．ＣａｎｃｅｒＤｉｓｃｏｖ２０２０；１０（５）：６６４－６７３、Ｃｈａｎｅｔａｌ．ＡｍＪＨｕｍＧｅｎｅｔ２０２０；１０７（５）：８８２－８９４）一方で、長い血漿ＤＮＡ分子の末端は、３つすべての妊娠期にわたってＴＴで終わる４マーモチーフ（ＮＮＴＴ）の頻度の１．５倍を超える増加を示した（図１１）。ＮＮＴＴモチーフは、妊娠初期、妊娠中期、および妊娠後期の母体血漿中で、それぞれ長い血漿ＤＮＡ末端モチーフの１８．９４％、１５．２２％、および１５．３０％を占めた。対照的に、ＮＮＴＴモチーフは、妊娠初期、妊娠中期、および妊娠後期の母体血漿中で、それぞれ短い血漿ＤＮＡ末端モチーフの９．５３％、９．２９％、および８．９１％しか占めなかった。

Ｈａｎｅｔａｌ．によって以前に報告されたように、死にかけている細胞から血漿に新たに放出された無細胞ＤＮＡは、１５０ｂｐを超えるＡ末端断片が濃縮されていた。アポトーシス中のＤＮＡ断片化に関与する主要な細胞内ヌクレアーゼであるＤＮＡ断片化因子ベータ（ＤＦＦＢ）は、そのような断片の生成に関与していることがわかった（Ｈａｎｅｔａｌ．ＡｍＪＨｕｍＧｅｎｅｔ２０２０；１０６：２０２－２１４）。本開示では、５００ｂｐを超える長い無細胞ＤＮＡ分子が、Ａ末端断片も濃縮されていることを示し、ＤＦＦＢがこれらの断片の生成にも関与している可能性があることを示唆している。正常な妊娠において、栄養膜アポトーシスは、在胎が進むにつれて増加する（Ｓｈａｒｐｅｔａｌ．ＡｍＪＲｅｐｒｏｄＩｍｍｕｎｏ２０１０；６４（３）：１５９－６９）。実際に、妊娠期が進むにつれて胎児特異的対立遺伝子をカバーする長いＤＮＡ分子の割合が増加するという我々の発見は、妊娠期が進むにつれて栄養膜アポトーシスが増加することを反映している可能性がある。

実施形態において、本明細書に記載の方法を使用して、子癇前症、子宮内胎児発育遅延（ＩＵＧＲ）、早期陣痛、および妊娠性絨毛性疾患を含むがこれらに限定されない胎盤関連妊娠合併症の予測、スクリーニング、および進行監視のために、母体血漿中の長い無細胞ＤＮＡ分子を分析することができる。子癇前症（Ｌｅｕｎｇｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２００１；１８４：１２４９－１２５０）、ＩＵＧＲ（Ｓｍｉｔｈｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ１９９７；１７７：１３９５－１４０１、Ｌｅｖｙｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２００２；１８６：１０５６－１０６１）、および妊娠性絨毛性疾患などの胎盤関連妊娠合併症では、栄養膜アポトーシスのレベルの上昇が報告されている。さらに、子癇前症（Ｌｏｅｔａｌ．ＣｌｉｎＣｈｅｍ１９９９；４５（２）：１８４－８、Ｓｍｉｄｅｔａｌ．ＡｎｎＮＹＡｃａｄＳｃｉ２００１；９４５：１３２－７）、ＩＵＧＲ（Ｓｅｋｉｚａｗａｅｔａｌ．ＡｍＪＯｂｓｔｅｔＧｙｎｅｃｏｌ２００３；１８８：４８０－４）、および早期陣痛（Ｌｅｕｎｇｅｔａｌ．Ｌａｎｃｅｔ１９９８；３５２（９１４４）：１９０４－５）では、母体血漿中の胎児ＤＮＡレベルの上昇が報告されている。胎盤関連妊娠合併症において、胎盤アポトーシスの増加により、母体血漿試料中の胎盤起源の長い無細胞ＤＮＡ分子の割合が増加すると仮定した。したがって、胎盤起源の長い無細胞ＤＮＡ分子自体、ならびにＡ末端断片およびＮＮＴＴモチーフを含むがこれらに限定されない長いＤＮＡシグネチャーは、胎盤アポトーシスのバイオマーカーとして役立つ可能性がある。

上記の分析では１－ヌクレオチドおよび４－ヌクレオチドのモチーフが使用されるが、他の実施形態において、他の長さ、例えば２、３、５、６、７、８、９、１０、またはそれ以上のモチーフが使用され得る。

Ｃ．例示的な方法
長い無細胞ＤＮＡ断片は、胎児を妊娠中の女性の在胎期間を決定するために使用され得る。長い無細胞ＤＮＡ断片の量は、在胎期間とともに変化し、在胎期間を決定するために使用され得る。無細胞ＤＮＡ断片の末端モチーフも、在胎期間とともに変化し、在胎期間を決定するために使用され得る。長い無細胞ＤＮＡ断片を使用して決定された在胎期間が、他の臨床技術によって決定された在胎期間から大幅に逸脱している場合、妊娠中の女性および／または胎児は、妊娠関連障害を有するとみなされる可能性がある。いくつかの実施形態において、妊娠関連障害の尤度を決定するために在胎期間を決定する必要がない場合がある。

１．在胎期間
図６０は、胎児を妊娠中の女性から取得された生物学的試料を分析する方法６０００を示す。在胎期間が決定され得、妊娠関連障害の尤度を分類するために使用され得る。生物学的試料には、胎児および女性からの複数の無細胞ＤＮＡ分子を含み得る。

複数の無細胞ＤＮＡ分子に対応する配列リードが受け取られ得る。いくつかの実施形態において、配列リードを取得するための配列決定が実施され得る。

ブロック６０２０では、複数の無細胞ＤＮＡ分子のサイズが測定され得る。サイズは、図２１で説明されるのと同様の方法で測定され得る。サイズは、配列リードを使用して測定され得る。

ブロック６０３０では、カットオフ値よりも大きいサイズを有する無細胞ＤＮＡ分子の第１の量が測定され得る。量は、無細胞ＤＮＡ分子の数、全長、または質量であり得る。

ブロック６０４０では、第１の量を使用した正規化パラメータの値が生成され得る。正規化パラメータの値は、無細胞ＤＮＡ分子の総数、胎児もしくは母親からの無細胞ＤＮＡ分子の数、または特定の領域からのＤＮＡ分子の数によって正規化された第１の量であり得る。例えば、正規化パラメータは、図４６Ａ～Ｃで説明されるように、胎児特異的断片の割合であり得る。

ブロック６０５０では、正規化パラメータの値は、１つ以上の較正データ点と比較され得る。各較正データ点は、正規化パラメータの較正値に対応する在胎期間を指定し得る。例えば、特定の妊娠期または特定の週数の在胎期間は、正規化パラメータの較正値に対応し得る。１つ以上の較正データ点は、既知の在胎期間を有し、カットオフ値よりも大きいサイズを有する無細胞ＤＮＡ分子を含む複数の較正試料から決定され得る。いくつかの実施形態において、較正データ点は、在胎期間を正規化パラメータの値と相関させる関数から決定される。

ブロック６０６０では、比較を使用した在胎期間が決定され得る。在胎期間は、正規化パラメータの値に最も近い較正値に対応する期間とみなされ得る。いくつかの実施形態において、在胎期間は、正規化パラメータの値が超える較正値に対応するための最も進んだ期間であるとみなされ得る。

方法は、超音波または女性の最後の月経期間の日を使用して、胎児の参照在胎期間を決定することをさらに含み得る。方法はまた、在胎期間を参照在胎期間と比較することを含み得る。方法はまた、在胎期間と参照在胎期間との比較を使用して、妊娠関連障害の尤度の分類を決定することをさらに含み得る。例えば、在胎期間と参照在胎期との間の相違は、妊娠関連障害を示し得る。相違は、異なる妊娠期、または最小の週数（例えば、１、２、３、４、５、６、７、もしくはそれ以上の週）だけの在胎期間の差であり得る。

方法は、末端モチーフを使用することをさらに含み得る。例えば、方法は、カットオフ値よりも大きいサイズを有する無細胞ＤＮＡ分子の少なくとも１つの末端に対応する第１の部分配列を決定することをさらに含み得る。第１の量は、カットオフ値よりも大きいサイズを有し、それぞれの無細胞ＤＮＡ分子の１つ以上の末端に第１の部分配列を有する無細胞ＤＮＡ分子のものであり得る。第１の部分配列は、１、２、３、４、５、または６ヌクレオチドであり得るか、またはそれらを含み得る。図５２Ａおよび５２Ｂで説明されるように、末端モチーフを使用して、ＰＣＡ分析を通して在胎期間を決定し得る。較正試料は、異なる末端モチーフおよび既知の在胎期間とともに使用され、ＰＣＡ分析に供され得る。線形判別分析、ロジスティック回帰、サポートベクターマシン、線形回帰、非線形回帰など、他の分類および回帰アルゴリズムが末端モチーフに使用され得る。分類および回帰アルゴリズムは、在胎期間を特定の末端モチーフおよび／または特定のサイズの断片に関連付け得る。

末端モチーフは、図４７～５９または９４で考察される任意のモチーフであり得る。末端モチーフのランクまたは頻度は、既知の在胎期間の対象からの較正試料における末端モチーフのランクまたは頻度と比較され得る。次いで、末端モチーフのランクまたは頻度を使用して、在胎期間を決定することができる。同じ在胎期間の参照試料から決定されたランクまたは頻度から逸脱しているランクまたは頻度に存在する末端モチーフは、妊娠関連障害を示し得る。

正規化パラメータの値を生成することは、（ａ）カットオフ値よりも大きいサイズを有する無細胞ＤＮＡ分子の総量によって、第１の量を正規化すること、（ｂ）カットオフ値よりも大きいサイズを有し、第２の部分配列で終わる無細胞ＤＮＡ分子の第２の量によって、第１の量を正規化することであって、第２の部分配列が、第１の部分配列とは異なる、正規化すること、または（ｃ）カットオフ値よりも小さいサイズを有する無細胞ＤＮＡ分子の第３の量によって、第１の量を正規化することを含み得る。

２．妊娠関連障害
図６１は、胎児を妊娠中の女性から取得された生物学的試料を分析する方法６１００を示す。実施形態は、必ずしも在胎期間を決定することなく、妊娠関連障害の尤度を分類することを含み得る。生物学的試料には、胎児および女性からの複数の無細胞ＤＮＡ分子を含み得る。

ブロック６１２０では、複数の無細胞ＤＮＡ分子のサイズが測定され得る。サイズは、図２１で説明されるのと同様の方法で取得され得る。サイズを測定することは、受け取られた配列リードを使用し得る。

ブロック６１３０では、カットオフ値よりも大きいサイズを有する無細胞ＤＮＡ分子の第１の量が測定され得る。カットオフ値は、２００ｎｔ以上であり得る。カットオフ値は、６００ｎｔ、７００ｎｔ、８００ｎｔ、９００ｎｔ、１ｋｎｔ、１．１ｋｎｔ、１．２ｋｎｔ、１．３ｋｎｔ、１．４ｋｎｔ、１．５ｋｎｔ、１．６ｋｎｔ、１．７ｋｎｔ、１．８ｋｎｔ、１．９ｋｎｔ、または２ｋｎｔを含み、少なくとも５００ｎｔであり得る。カットオフ値は、長い無細胞ＤＮＡ分子について本明細書に記載の任意のカットオフ値であり得る。第１の量は、数値または頻度であり得る。

ブロック６１４０では、第１の量を使用した正規化パラメータの第１の値が生成され得る。正規化パラメータの値を生成することは、カットオフ値よりも小さいサイズを含む無細胞ＤＮＡ分子の第２の量を測定することと、第１の量および第２の量の比率を計算することと、を含み得る。カットオフ値は、第１のカットオフ値であり得る。第２のカットオフ値は、第１のカットオフ値よりも小さくなり得る。第２の量は、第２のカットオフ値よりも小さいサイズを有する無細胞ＤＮＡ分子を含み得るか、または第２の量は、複数の無細胞ＤＮＡ分子中のすべての無細胞ＤＮＡ分子を含み得る。正規化パラメータは、長い無細胞ＤＮＡ分子の頻度の尺度であり得る。

ブロック６１５０では、健康な妊娠のための正規化パラメータの期待値に対応する第２の値が取得され得る。第２の値は、胎児の在胎期間に依存し得る。第２の値は、期待値であり得る。いくつかの実施形態において、第２の値は、異常値と区別するカットオフ値であり得る。

第２の値を取得することは、妊娠中の女性の測定値を正規化パラメータの較正値と関連付ける較正表から第２の値を取得することを含み得る。較正表は、在胎期間を妊娠中の女性対象の測定値と関連付ける第１の表を取得することによって生成され得る。在胎期間を正規化パラメータの較正値と関連付ける第２の表が取得され得る。第１および第２の表のデータは、同じ対象または異なる対象からのものであり得る。測定値を較正値と関連付ける較正表は、第１の表および第２の表から作成され得る。較正表は、較正値を測定値に関連付ける関数を含み得る。

妊娠中の女性対象の測定値は、最後の月経期間からの時間、または妊娠中の女性対象の画像の特性（例えば、超音波）であり得る。妊娠中の女性対象の測定値は、妊娠中の女性対象の画像の特性であり得る。例えば、画像の特性は、女性対象の胎児の長さ、サイズ、外観、または解剖学的構造を含み得る。特性は、生体測定値、例えば、頭殿長または大腿骨長を含み得る。四腔心臓または脊髄の椎骨の外観を含む、特定の臓器の外観が使用され得る。在胎期間は、医師によって超音波画像から決定され得る（例えば、ＣｏｍｍｉｔｔｅｅｏｎＯｂｓｔｅｔｒｉｃＰｒａｃｔｉｃｅｅｔａｌ．，“Ｍｅｔｈｏｄｓｆｏｒｅｓｔｉｍａｔｉｎｇｔｈｅｄｕｅｄａｔｅ，”ＣｏｍｍｉｔｔｅｅＯｐｉｎｉｏｎ，Ｎｏ．７００，Ｍａｙ２０１７）。

いくつかの実施形態において、機械学習モデルは、１つ以上の較正データ点を画像の特性と関連付け得る。モデルは、複数の訓練画像を受信することによって訓練され得る。各訓練画像は、妊娠関連障害がないことがわかっているか、または妊娠関連障害を有していないことがわかっている女性対象からのものであり得る。女性対象は、様々な在胎期間を有し得る。訓練は、女性対象からの複数の訓練試料を保存することを含み得る。各訓練試料は、訓練画像と関連付けられた正規化パラメータの既知の値を含み得る。モデルは、複数の訓練試料を使用して、画像を正規化パラメータの既知の値と一致させるかまたは一致させないモデルの出力に基づいて、モデルのパラメータを最適化することによって訓練され得る。モデルの出力は、画像に対応する正規化パラメータの値を指定し得る。正規化パラメータの第２の値は、女性の画像を機械学習モデルに入力することによって生成され得る。

ブロック６１６０では、正規化パラメータの第１の値と正規化パラメータの第２の値との間の偏差が決定され得る。偏差は、分離値であり得る。

ブロック６１７０では、妊娠関連障害の尤度の分類が、偏差を使用して決定され得る。偏差が閾値を超える場合、妊娠関連障害が起こり得る。閾値は、統計的に有意な差を示し得る。閾値は、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％の差を示し得る。

妊娠関連障害は、子癇前症、子宮内胎児発育遅延、侵襲的胎盤形成、早産、新生児溶血性疾患、胎盤機能不全、胎児水腫、胎児奇形、溶血、肝酵素の上昇、および低血小板数（ＨＥＬＬＰ）症候群、または全身性エリテマトーデスを含み得る。

ＩＶ．妊娠関連障害についてのサイズおよび末端分析
長いＤＮＡ分子のサイズおよび／または末端分析を使用して、子癇前症の尤度を決定した。そのような方法は、他の妊娠関連障害にも適用され得る。子癇前症と診断された４人の妊娠中の女性の母体血漿試料から抽出されたＤＮＡを、単一分子リアルタイム（ＳＭＲＴ）配列決定（ＰａｃＢｉｏ）に供した。

図６２は、４つの子癇前症の症例の臨床情報を示す表である。１列目は、症例番号を示す。２列目は、採血時の在胎期間を週単位で示す。３列目は、胎児の性別を示す。４列目は、子癇前症（ＰＥＴ）に関する臨床情報を示す。

Ｍ１２８０４は、重度の子癇前症（ＰＥＴ）および既存のＩｇＡ腎症の症例であった。Ｍ１２８７３は、混合型の軽度ＰＥＴを伴う慢性高血圧の症例であった。Ｍ１２８７６は、重度の遅発性ＰＥＴの症例であった。Ｍ１２９０３は、子宮内胎児発育遅延（ＩＵＧＲ）を伴う重度の遅発性ＰＥＴの症例であった。本開示における後続の分析のための対照として、５つの正常血圧の妊娠後期の母体血漿試料を使用した。

本開示のために分析された４つの子癇前症および５つの正常血圧の妊娠後期の母体血漿ＤＮＡ試料について、それらの対の母体バフィーコートおよび胎盤試料から抽出されたＤＮＡの遺伝子型を、ｉＳｃａｎＳｙｓｔｅｍ上のＩｎｆｉｎｉｕｍＯｍｎｉ２．５Ｅｘｏｍｅ－８Ｂｅａｄｃｈｉｐ（Ｉｌｌｕｍｉｎａ）で決定した。

各試料の血漿ＤＮＡ濃度を、ＱｕｂｉｔＦｌｕｏｒｏｍｅｔｅｒ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を用いたＱｕｂｉｔｄｓＤＮＡ高感度アッセイによって定量化した。子癇前症および妊娠後期の症例についての平均血漿ＤＮＡ濃度は、それぞれ９５．４ｎｇ／ｍＬ（範囲、５２．１～１５３．８ｎｇ／ｍＬ）の血漿および１０．７ｎｇ／ｍＬ（６．４～１９．１ｎｇ／ｍＬ）の血漿であった。子癇前症の症例の平均血漿ＤＮＡ濃度は、妊娠後期の症例よりも約９倍高かった。

母親がホモ接合であり、胎児がヘテロ接合であった有益な一塩基多型（ＳＮＰ）をカバーする６００ｂｐ以下のＤＮＡ分子の配列決定データから決定された平均胎児ＤＮＡ画分は、子癇前症および正常血圧の妊娠後期の母体血漿試料について、それぞれ２２．６％（範囲、１６．６～２５．７％）および２０．０％（範囲、１５．６～２６．７％）であった。

Ａ．サイズ分析
本開示の実施形態に従って、子癇前症および正常血圧の妊娠後期の母体血漿試料に対して、サイズ分析を実施した。図６３Ａ～６３Ｄおよび図６４Ａ～６４Ｄは、子癇前症および正常血圧の妊娠後期の症例からの血漿ＤＮＡ分子のサイズ分布を示す。ｘ軸は、サイズを示す。ｙ軸は、頻度を示す。サイズ分布は、図６３Ａ～６３Ｄの場合、ｘ軸の線形スケールで０～１ｋｂ、および図６４Ａ～６４Ｄの場合、ｘ軸の対数スケールで０～５ｋｂの範囲でプロットされる。図６３Ａおよび６４Ａは、試料Ｍ１２８０４を示す。図６３Ｂおよび６４Ｂは、試料Ｍ１２８７３を示す。図６３Ｃおよび６４Ｃは、試料Ｍ１２８７６を示す。図６３Ｄおよび６４Ｄは、試料Ｍ１２９０３を示す。

青色の線は、５つの正常血圧の妊娠後期の症例からプールされたすべての配列決定された血漿ＤＮＡ分子のサイズ分布を表す。赤色の線は、個々の子癇前症の症例からの配列決定された血漿ＤＮＡ分子のサイズ分布を表す。図６３Ａ～６３Ｄ中、青色の線は、２００ｂｐ未満のより短いピークの線および３００～４００ｂｐのより高いピークの線である。図６４Ａ～６４Ｄ中、青色の線は、１ｋｂでのより高い線に対応する。

概して、子癇前症患者の血漿ＤＮＡサイズプロファイルは、正常血圧の妊娠後期の妊娠中の女性よりも短く、１６６ｂｐのピークの高さの増加があり、１６６ｂｐよりも短いＤＮＡ分子の割合の増加があった（図６３Ａ～６３Ｄ）。これらの変化は、２つの重度の子癇前症の症例、Ｍ１２８７６およびＭ１２９０３でより顕著であった。子宮内胎児発育遅延（ＩＵＧＲ）を伴う子癇前症の症例Ｍ１２９０３では、変化はさらに劇的であった。

４つの子癇前症の血漿試料のうち３つは、２００～５０００ｂｐのサイズを有する長い血漿ＤＮＡ分子の割合の低減を示した（図６４Ｂ～６４Ｄ）。Ｍ１２８７３、Ｍ１２８７６、およびＭ１２９０３における５００ｂｐを超える長い血漿ＤＮＡ分子の割合は、それぞれ１１．７％、８．９％、および４．５％であったが、５つの正常血圧の妊娠後期症例からのプールされた配列決定データにおける長い血漿ＤＮＡ分子の割合は、３２．３％であった。既存のＩｇＡ腎症を伴う重度の子癇前症（ＰＥＴ）の症例（Ｍ１２８０４）からの血漿試料は、５つの正常血圧の妊娠後期症例からのプールされた配列決定データと比較して、２０００ｂｐ未満のより短いＤＮＡ分子の割合が減少したが、２０００ｂｐよりも大きいより長いＤＮＡ分子の割合が増加したことを示した（図２Ａ）。Ｍ１２８０４の長い血漿ＤＮＡ分子の割合は、３４．９％であった。

図６５Ａ～６５Ｄおよび図６６Ａ～６６Ｄは、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。Ａ～Ｄの図面の各々は、異なる子癇前症試料を示す。ｘ軸は、サイズを示す。ｙ軸は、図６５Ａ～６５Ｄの頻度および図６６Ａ～６６Ｄの累積頻度を示す。図６６Ａ～６６Ｄ中、サイズは、０～３５ｋｂになる。

各グラフの青色の線は、５つの正常血圧の妊娠後期の症例からプールされた胎児特異的対立遺伝子をカバーするすべての配列決定された血漿ＤＮＡ分子のサイズ分布を表す。各グラフの赤色の線は、個々の子癇前症の症例からの配列決定された胎児特異的対立遺伝子をカバーする血漿ＤＮＡ分子のサイズ分布を表す。図６５Ａ～６５Ｄ中、青色の線は、２００ｂｐ未満のより短いピークの線および３００～４００ｂｐのより高いピークの線である。図６６Ａ～６６Ｄ中、青色の線は、１００～１０００ｂｐのより低い線に対応する。

図６７Ａ～６７Ｄおよび図６８Ａ～６８Ｄは、子癇前症および正常血圧の妊娠後期の母体血漿試料からの胎児特異的対立遺伝子をカバーするＤＮＡ分子のサイズ分布を示す。Ａ～Ｄの図面の各々は、異なる子癇前症試料を示す。ｘ軸は、サイズを示す。ｙ軸は、図６７Ａ～６７Ｄの頻度および図６８Ａ～６８Ｄの累積頻度を示す。図６８Ａ～６８Ｄ中、サイズは、０～３５ｋｂになる。

各グラフの青色の線は、５つの正常血圧の妊娠後期の症例からプールされた母体特異的対立遺伝子をカバーするすべての配列決定された血漿ＤＮＡ分子のサイズ分布を表す。各グラフの赤色の線は、個々の子癇前症の症例からの配列決定された母体特異的対立遺伝子をカバーする血漿ＤＮＡ分子のサイズ分布を表す。図６７Ａ中、青色の線は、２００ｂｐ未満のより高いピークおよび３００～４００ｂｐのより高いピークの線である。図６７Ｂ～６７Ｄ中、青色の線は、２００ｂｐ未満のより短いピークの線である。図６８Ａ中、青色の線は、１０００～１００００ｂｐのより高い線に対応する。図６８Ｂ～６８Ｄ中、青色の線は、１００～１０００ｂｐのより低い線に対応する。

血漿ＤＮＡ短縮の現象は、正常血圧の妊娠後期の母体血漿試料と比較して、４つの子癇前症の血漿試料のうちの３つにおいて、胎児特異的対立遺伝子をカバーするＤＮＡ分子（図６５Ｂ～６５Ｄおよび図６６Ｂ～６６Ｄ）ならびに母体特異的対立遺伝子をカバーするＤＮＡ分子（図６７Ｂ～６７Ｄおよび図６８Ｂ～６８Ｄ）の両方で観察された。例外は、既存のＩｇＡ腎症を伴う重症ＰＥＴの症例Ｍ１２８０４であり、これは、胎児特異的対立遺伝子をカバーするそれらの血漿ＤＮＡ分子の間で、１ｋｂ未満のより短いＤＮＡ分子の割合が増加し、１ｋｂを超えるより長いＤＮＡ分子の割合が減少したことを示した（図６５Ａおよび６６Ａ）。実際に、症例Ｍ１２８０４における母体特異的対立遺伝子をカバーする血漿ＤＮＡ分子は、長くなったサイズプロファイルを示した（図６７Ａおよび６８Ａ）。

図６９Ａおよび６９Ｂは、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の（Ａ）胎児特異的対立遺伝子および（Ｂ）母体特異的対立遺伝子をカバーする短いＤＮＡ分子の割合のグラフである。ｙ軸は、１５０ｂｐ未満の短いＤＮＡ断片の割合を示す。ｘ軸は、正常な試料およびＰＥＴ試料を示す。

実施形態において、短いＤＮＡ分子の割合を、１５０ｂｐ未満のサイズを有する母体血漿ＤＮＡ分子のパーセンテージとして定義した。Ｍ１２８０４は既存のＩｇＡ腎症を有したが、他の試料は有しなかったため、この症例をこの分析から除外した。子癇前症の血漿試料の群は、胎児特異的対立遺伝子（Ｐ＝０．０３６、ウィルコクソンの順位和検定）および母体特異的対立遺伝子（Ｐ＝０．０３６、ウィルコクソンの順位和検定）をカバーする短いＤＮＡ分子の割合が、正常血圧の対照血漿試料の群と比較して有意に増加したことを示した。

図７０Ａおよび７０Ｂは、（Ａ）ＰａｃＢｉｏＳＭＲＴ配列決定および（Ｂ）Ｉｌｌｕｍｉｎａ配列決定で配列決定された子癇前症および正常血圧の母体血漿試料中の短いＤＮＡ分子の割合のグラフである。ｙ軸は、１５０ｂｐ未満の短いＤＮＡ断片の割合を示す。

実施形態において、短いＤＮＡ分子の割合を、１５０ｂｐ未満のサイズを有する母体血漿ＤＮＡ分子のパーセンテージとして定義した。Ｍ１２８０４は、おそらくこの症例に既存のＩｇＡ腎症があったため、このコホートの他の子癇前症の症例と比較して異なるサイズプロファイルを示したため、この症例をこの分析から除外した。子癇前症の血漿試料の群は、正常血圧の対照血漿試料の群（中央値：１２．１％、範囲：８．５～１５．８％）と比較して、短いＤＮＡ分子の割合が有意に増加したことを示した（中央値：２８．０％、範囲：２５．８～３５．１％）（Ｐ＝０．０３６、ウィルコクソンの順位和検定）。対照的に、バイサルファイト変換およびＩｌｌｕｍｉｎａ配列決定に供された４つの子癇前症および４つの在胎期間が一致した正常血圧の母体血漿ＤＮＡ試料の以前のコホートでは、子癇前症の血漿試料および対照血漿試料における短いＤＮＡ分子の割合に有意差はなかった（Ｐ＝０．３４０、ウィルコクソンの順位和検定）（図７０Ｂ）。

いくつかの実施形態において、妊娠が子癇前症を発症するリスクが高いか低いかを決定するために、ＰａｃＢｉｏＳＭＲＴ配列決定で配列決定された母体血漿試料中の短いＤＮＡ分子の割合に２０％のカットオフを使用することができる。短いＤＮＡ分子の割合が２０％を超える母体血漿試料が、子癇前症を発症するリスクが高いと決定される一方で、短いＤＮＡ分子の割合が２０％未満の母体血漿試料は、子癇前症を発症するリスクが低いと決定される。このカットオフを使用すると、感度および特異度の両方が１００％であった。いくつかの他の実施形態において、使用される短いＤＮＡ分子の割合のカットオフは、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％などを含み得るが、これらに限定されない。別の実施形態において、母体血漿試料中の短いＤＮＡ分子の割合は、妊娠中の子癇前症の重症度を監視および評価するために使用される。

実施形態において、短いＤＮＡ分子および長いＤＮＡ分子の相対的割合を示すサイズ比を、以下の方程式を使用して各試料について計算した。
式中、Ｐ（５０－１５０）は、５０ｂｐ～１５０ｂｐの範囲のサイズを有する配列決定された血漿ＤＮＡ分子の割合を示し、Ｐ（２００－１０００）は、２００ｂｐ～１０００ｂｐの範囲のサイズを有する配列決定された血漿ＤＮＡ分子の割合を示す。

図７１は、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の、短いＤＮＡ分子および長いＤＮＡ分子の相対的割合を示すサイズ比のグラフである。ｙ軸は、サイズ比を示す。ｘ軸は、正常な試料およびＰＥＴ試料を示す。子癇前症の血漿試料の群は、正常血圧の対照血漿試料の群と比較して、有意により高いサイズ比を示した（Ｐ＝０．０１６、ウィルコクソンの順位和検定）。

実施形態において、妊娠中の子癇前症の発症および重症度を予測するために、ＰａｃＢｉｏＳＭＲＴ配列決定およびＯｘｆｏｒｄＮａｎｏｐｏｒｅ配列決定を含むがこれらに限定されない、ロングリード配列決定プラットフォームから生成されたサイズプロファイルを利用し得る。いくつかの実施形態において、血漿ＤＮＡ分子のサイズプロファイルを分析することによって、子癇前症の進行、ならびに肝障害および腎障害を含むがこれらに限定されない重度の子癇前症の特徴の発症を監視し得る。いくつかの実施形態において、分析で使用されるサイズパラメータは、短いまたは長いＤＮＡ分子の割合、ならびに短いＤＮＡ分子および長いＤＮＡ分子の相対的割合示したサイズ比を含み得るが、これらに限定されない。短いＤＮＡカテゴリーおよび長いＤＮＡカテゴリーを決定するために使用されるカットオフ、１５０ｂｐ、１８０ｂｐ、２００ｂｐ、２５０ｂｐ、３００ｂｐ、３５０ｂｐ、４００ｂｐ、４５０ｂｐ、５００ｂｐ、５５０ｂｐ、６００ｂｐ、６５０ｂｐ、７００ｂｐ、７５０ｂｐ、８００ｂｐ、８５０ｂｐ、９００ｂｐ、９５０ｂｐ、１ｋｂなどを含み得るが、これらに限定されない。短い分子および長い分子のサイズ比を決定する際に使用されるサイズ範囲は、５０～１５０ｂｐ、５０～１６６ｂｐ、５０～２００ｂｐ、２００～４００ｂｐ、２００～１０００ｂｐ、２００～５０００ｂｐ、または他の組み合わせを含み得るが、これらに限定されない。

サイズ末端分析は、図６１の方法６１００で説明される方法を使用することを含み得る。

Ｂ．断片末端分析
本開示の実施形態に従って、子癇前症および正常血圧の妊娠後期の母体血漿試料に対して、断片末端分析を実施した。配列決定された各血漿ＤＮＡ分子について、ワトソン鎖およびクリック鎖の両方の５’末端の第１のヌクレオチドを決定した。Ｔ末端、Ｃ末端、Ａ末端、およびＧ末端断片の割合を、各血漿ＤＮＡ試料について決定した。

図７２Ａ～７２Ｄは、ＰａｃＢｉｏＳＭＲＴ配列決定を用いて配列決定された子癇前症および正常血圧の母体血漿試料中の血漿ＤＮＡ分子の異なる末端の割合を示す。ｘ軸は、正常な妊娠後期試料およびＰＥＴ試料を示す。ｙ軸は、所与の末端の割合を示す。図７２Ａは、Ｔ末端の割合を示す。図７２Ｂは、Ｃ末端の割合を示す。図７２Ｃは、Ａ末端の割合を示す。図７２Ｄは、Ｇ末端の割合を示す。子癇前症の血漿試料の群は、正常血圧の対照血漿試料の群と比較して、Ｔ末端血漿ＤＮＡ分子の割合が有意に増加し（Ｐ＝０．０１６、ウィルコクソンの順位和検定）、Ｇ末端血漿ＤＮＡ分子の割合が有意に低減されたことを示した（Ｐ＝０．０１６、ウィルコクソンの順位和検定）。

図７３は、４タイプの断片末端（各鎖の５’末端の第１のヌクレオチド）、すなわちＣ末端、Ｇ末端、Ｔ末端、およびＡ末端を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。各列は、血漿ＤＮＡ試料を示す。１行目は、各試料がどの群に属しているかを示し、シアン色は、正常血圧の妊娠後期の母体血漿ＤＮＡ試料を示し、オレンジ色は、子癇前症の血漿ＤＮＡ試料を示す。シアン色は、最初の５列をカバーする。オレンジ色は、最後の４列をカバーする。

２行目から始まり、各行は、断片末端のタイプを示す。末端モチーフの頻度を、行で正規化された頻度（ｚ－スコア）に応じた一連のカラーグラデーションで示した（すなわち、試料にわたる平均頻度よりも下または上の標準偏差の数）。より赤い色は、末端モチーフの頻度がより高いことを示し、より青い色は、末端モチーフの頻度がより低いことを示す。４タイプの断片末端の頻度に基づく階層的クラスタリング分析は、子癇前症の血漿ＤＮＡ試料の断片末端プロファイルが、正常血圧の妊娠後期の血漿ＤＮＡ試料とは異なるクラスターを形成したことを示した。

実施形態において、配列決定された各ＤＮＡ分子について、ワトソン鎖およびクリック鎖の両方の５’末端から第１のヌクレオチド（Ｘ）および第２のヌクレオチド（Ｙ）のジヌクレオチド配列を別々に決定し得る。ＸおよびＹは、ＤＮＡにおける４つのヌクレオチド塩基のうちの１つである。１６個の可能な２－ヌクレオチド末端モチーフＸＹＮＮ、すなわち、ＡＡＮＮ、ＡＴＮＮ、ＡＧＮＮ、ＡＣＮＮ、ＴＡＮＮ、ＴＴＮＮ、ＴＧＮＮ、ＴＣＮＮ、ＧＡＮＮ、ＧＴＮＮ、ＧＧＮＮ、ＧＣＮＮ、ＣＡＮＮ、ＣＴＮＮ、ＣＧＮＮ、およびＣＣＮＮがある。本開示の実施形態に従って、配列決定された各ＤＮＡ分子について、ワトソン鎖およびクリック鎖の両方の５’末端から第３のヌクレオチド（Ｘ）および第４のヌクレオチド（Ｙ）のジヌクレオチド配列を別々に決定することができる。１６個の可能な２－ヌクレオチドＮＮＸＹモチーフがある。各配列決定されたＤＮＡ分子について、ワトソン鎖およびクリック鎖の両方の５’末端の第１の４－ヌクレオチド配列（４ｍｅｒモチーフ）を別々に決定することもできる。

図７４は、１６個の２ヌクレオチドモチーフＸＹＮＮ（５’末端からの第１および第２のヌクレオチドのジヌクレオチド配列）を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。図７５は、１６個の２ヌクレオチドモチーフＮＮＸＹ（５’末端からの第３および第４のヌクレオチドのジヌクレオチド配列）を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。図７６は、２５６個の４ヌクレオチドモチーフ（５’末端からの第１～第４のヌクレオチドのジヌクレオチド配列）を使用した、子癇前症および正常血圧の妊娠後期の母体血漿ＤＮＡ試料の階層的クラスタリング分析を示す。

図７４～７６中、１行目は、各試料がどの群に属しているかを示し、シアン色は、正常血圧の妊娠後期の母体血漿ＤＮＡ試料を示し、オレンジ色は、子癇前症の血漿ＤＮＡ試料を示す。シアン色は、最初の５列をカバーする。オレンジ色は、最後の４列をカバーする。２行目から始まり、各行は、断片末端のタイプを示す。末端モチーフの頻度を、行で正規化された頻度（ｚ－スコア）に応じた一連のカラーグラデーションで示した（すなわち、試料にわたる平均頻度よりも下または上の標準偏差の数）。より赤い色は、末端モチーフの頻度がより高いことを示し、より青い色は、末端モチーフの頻度がより低いことを示す。

これらの結果は、子癇前症試料および非子癇前症試料中の血漿ＤＮＡが異なる断片化特性を有したことを示唆した。一実施形態において、妊娠中の子癇前症の発症を予測するために、ＰａｃＢｉｏＳＭＲＴ配列決定およびＯｘｆｏｒｄＮａｎｏｐｏｒｅ配列決定を含むがこれらに限定されない、ロングリード配列決定プラットフォームから生成された末端モチーフプロファイルを利用し得る。上記の分析では１－ヌクレオチド、２－ヌクレオチド、および４－ヌクレオチドのモチーフを使用したが、他の実施形態において、他の長さ、例えば３、５、６、７、８、９、１０、またはそれ以上のモチーフが使用され得る。

いくつかの実施形態において、子癇前症を含むがこれに限定されない妊娠関連状態の予測、検出、および監視の性能を改善するために、断片末端分析および起源組織分析を組み合わせることができる。最初に、各母体血漿試料の断片末端分析を実施して、血漿ＤＮＡ分子を４つの断片末端カテゴリー、すなわち、Ｔ末端、Ｃ末端、Ａ末端、およびＧ末端断片に分離することができる。次いで、本開示の実施形態によるメチル化状態マッチング分析を使用して、各母体血漿ＤＮＡ試料についての各断片末端カテゴリーからの血漿ＤＮＡ分子を使用して、起源組織分析を別々に実施することができる。断片末端カテゴリーの１つの間での異なる組織の比例寄与を、他の組織と比較して、対応する組織に割り当てられた対応する断片末端カテゴリーの血漿ＤＮＡ分子のパーセンテージとして定義した。

子癇前症があるおよびない妊娠中の女性からの３つおよび５つの血漿ＤＮＡ試料を、単一分子リアルタイム配列決定を使用して分析した。Ａ末端、Ｃ末端、Ｇ末端、およびＴ末端を有する血漿断片の６５８，７２２、８８９，９００、８５１，５０１、および６０７，５５４の中央値を取得した。Ａ末端を有する断片について、本開示に記載のメチル化状態マッチングアプローチに従って、少なくとも１０個のＣｐＧ部位を有する任意の断片のメチル化パターンを、好中球、Ｔ細胞、Ｂ細胞、肝臓、および胎盤の参照メチル化プロファイルと比較した。血漿ＤＮＡ断片は、それらの組織間で一致するメチル化状態の最大スコアに対応した組織に割り当てられる。この方法を使用して、分析されたすべての試料の間で、中央値２．４３％（範囲：０．７３～５．５０％）のＡ末端断片をＴ細胞に割り当てた（すなわち、Ｔ細胞寄与）。同様の方法で、それぞれＣ末端、Ｇ末端、およびＴ末端を有するそれらの断片をさらに分析した。Ｃ末端、Ｇ末端、およびＴ末端を有するそれらの断片について、それぞれ３．２０％（範囲：１．５５～５．１９％）、３．５２％（範囲：１．５３～６．２７％）、および２．２２％（０～７．７９％）のＴ細胞寄与の中央値が観察された。

図７７Ａ～７７Ｄは、子癇前症および正常血圧の母体血漿ＤＮＡ試料中の異なる断片末端カテゴリー、すなわち、（Ａ）Ｔ末端、（Ｂ）Ｃ末端、（Ｃ）Ａ末端、および（Ｄ）Ｇ末端に属するＤＮＡ分子間のＴ細胞寄与を示す。ｘ軸は、正常な妊娠後期試料およびＰＥＴ試料を示す。ｙ軸は、パーセントとしてのＴ細胞寄与を示す。結果は、Ｇ末端断片間で、Ｔ細胞寄与が、正常血圧の妊娠後期の血漿試料と比較して、子癇前症の血漿試料中で有意に低減されたことを示した（Ｐ＝０．０３６、ウィルコクソンの順位和検定）。実施形態において、母体血漿ＤＮＡ試料中のすべてのＧ末端断片間のＴ細胞寄与に３％のカットオフを使用して、妊娠が子癇前症を発症するリスクが高いか低いかを決定し得る。

Ｃ．例示的な方法
図７８は、胎児を妊娠中の女性から取得された生物学的試料を分析する方法７８００を示す。生物学的試料には、胎児および女性からの複数の無細胞ＤＮＡ分子を含み得る。方法は、妊娠関連障害の尤度の分類を生成し得る。妊娠関連障害は、子癇前症または本明細書に記載の任意の妊娠関連障害であり得る。

複数の無細胞ＤＮＡ分子に対応する配列リードが受け取られ得る。

ブロック７８１０では、複数の無細胞ＤＮＡ分子のサイズが測定され得る。サイズは、アラインメントもしくはヌクレオチド数のカウント、または図２１を含む本明細書に記載の任意の技術によって測定され得る。

ブロック７８２０では、カットオフ値よりも大きいサイズを有する無細胞ＤＮＡ分子のセットが特定され得る。カットオフ値は、５００ｎｔ、６００ｎｔ、７００ｎｔ、８００ｎｔ、９００ｎｔ、１ｋｎｔ、１．１ｋｎｔ、１．２ｋｎｔ、１．３ｋｎｔ、１．４ｋｎｔ、１．５ｋｎｔ、１．６ｋｎｔ、１．７ｋｎｔ、１．８ｋｎｔ、１．９ｋｎｔ、または２ｋｎｔを含む、長い無細胞ＤＮＡ断片についての任意のカットオフ値であり得る。カットオフ値は、長い無細胞ＤＮＡ分子について本明細書に記載の任意のカットオフ値であり得る。

ブロック７８３０では、第１の量を使用した末端モチーフパラメータの値が生成され得る。セット内の無細胞ＤＮＡ分子の１つ以上の末端に第１の部分配列を有するセット内の無細胞ＤＮＡ分子の第１の量が、測定され得る。いくつかの実施形態において、末端モチーフパラメータは、末端のすべての部分配列の総量によって正規化された第１の量であり得る。いくつかの実施形態において、末端は、３’末端であり得る。いくつかの実施形態において、末端は、５’末端であり得る。

第１の部分配列は、１、２、３、４、５、６、７、８、９、１０、またはそれ以上のヌクレオチド長であり得る。第１の部分配列は、それぞれの無細胞ＤＮＡ分子の末端に最後のヌクレオチドを含み得る。例えば、第１の部分配列は、図７４に示されるＸＹＮＮパターンであり得る。いくつかの実施形態において、第１の部分配列は、それぞれの無細胞ＤＮＡ分子の末端に最後のヌクレオチド（複数可）を含まない場合がある。例えば、第１の部分配列は、図７５のＮＮＸＹパターンを含み得る。

無細胞ＤＮＡ分子の１つ以上の末端に第１の部分配列とは異なる部分配列を有する無細胞ＤＮＡ分子の第２の量が、測定され得る。末端モチーフパラメータの値は、第２の量および第３の量の比率を使用して生成され得る。例えば、第２の量を第３の量で割ってもよいか、または第３の量を第２の量で割ってもよい。

ブロック７８４０では、末端モチーフパラメータの値が、参照値と比較され得る。閾値は、妊娠関連障害がない対象についての関連パラメータの値との統計的に有意な差を表す値であり得る。閾値は、正常な妊娠をしている１人以上の参照対象、または妊娠関連障害がある１人以上の参照対象から決定され得る。

いくつかの実施形態において、末端モチーフパラメータの値は、閾値と比較され得、第２の末端モチーフパラメータの値は、第２の閾値と比較され得る。無細胞ＤＮＡ分子の１つ以上の末端に第１の部分配列とは異なる第２の部分配列を有する無細胞ＤＮＡ分子の第２の量が、測定され得る。したがって、異なる末端モチーフの量が決定され得る。第２の量を使用した第２の末端モチーフパラメータの値が生成され得る。第２の末端モチーフパラメータの値は、第２の閾値と比較され得る。第２の閾値は、第１の閾値と同じであっても異なっていてもよい。追加の部分配列は、第１および第２の部分配列と同じ方法で使用され得る。いくつかの実施形態において、すべての可能な部分配列が、閾値との比較に使用され得る。

ブロック７８５０では、妊娠関連障害の尤度の分類が、比較を使用して決定され得る。サイズパラメータの値または末端モチーフパラメータの値が閾値を超える場合、妊娠関連障害が起こり得る。

いくつかの実施形態において、妊娠関連障害の尤度の分類を決定することは、第２の末端モチーフパラメータの値と第２のカットオフ値との比較を使用し得る。第１の末端モチーフパラメータの値が第１の閾値を超え、第２の末端モチーフパラメータの値が第２の閾値を超える場合、妊娠関連障害が起こり得る。

方法は、末端モチーフパラメータに加えてサイズパラメータを使用することを含み得る。第１のサイズ範囲のサイズを有する無細胞ＤＮＡ分子の第２のセットが特定され得る。第１のサイズ範囲は、カットオフ値よりも大きいサイズを含み得る。第１のサイズ範囲は、カットオフ値よりも大きくてもよいサイズを含む。第１のサイズ範囲は、５５０ｎｔ、６００ｎｔ、６５０ｎｔ、７００ｎｔ、７５０ｎｔ、８００ｎｔ、８５０ｎｔ、９００ｎｔ、９５０ｎｔ、１ｎｔ、１．５ｋｎｔ、２ｋｎｔ、３ｋｎｔ、５ｋｎｔ未満、またはそれ以上であってもよい。第２のセット内の無細胞ＤＮＡ分子の第２の量を使用したサイズパラメータの値が生成され得る。サイズパラメータの値は、第２の閾値と比較され得る。妊娠関連障害の尤度の分類を決定することは、サイズパラメータの値と第２の閾値との比較を使用し得る。第１の閾値および第２の閾値の一方または両方を超えると、分類は、妊娠関連障害を有する可能性が高くなり得る。

サイズパラメータは、正規化パラメータであり得る。例えば、第２のサイズ範囲の無細胞ＤＮＡ分子の第３の量が測定され得る。第２のサイズ範囲は、第１のカットオフ値未満のサイズを含み得る。第２のサイズ範囲は、すべてのサイズを含み得る。第２のサイズ範囲は、５０～１５０ｎｔ、５０～１６６ｎｔ、５０～２００ｎｔ、２００～４００ｎｔを含み得る。第２のサイズ範囲は、本明細書に記載の短い無細胞ＤＮＡ断片の任意のサイズを含み得る。第２のサイズ範囲は、第１のサイズ範囲のサイズを除外し得る。サイズパラメータの値は、第２の量および第３の量の比率を決定することによって生成され得る。例えば、第２の量を第３の量で割ってもよいか、または第３の量を第２の量で割ってもよい。

無細胞ＤＮＡ分子の量のいずれも、特定の起源組織からの無細胞ＤＮＡ分子であり得る。例えば、起源組織は、Ｔ細胞または本明細書に記載の別の起源組織であり得る。第２の量は、図７７Ａ～７７Ｄで説明されるＴ細胞寄与に類似し得る。起源組織からの寄与は、本開示に記載されるようなメチル化状態またはパターンを使用して決定され得る。

Ｖ．反復伸長関連疾患
妊娠中の女性から取得された長い無細胞ＤＮＡ断片は、遺伝子における反復の伸長を特定するために使用され得る。遺伝子における反復の伸長は、神経筋疾患をもたらし得る。タンデム反復の伸長は、脆弱Ｘ症候群、ハンチントン病、および脊髄小脳失調症などの神経変性障害を含むがこれらに限定されないヒトの疾患と関連している。これらのタンデム反復伸長は、遺伝子のタンパク質コード領域（マチャド・ジョセフ病、ホーリバー症候群、ハンチントン病）、または非コード領域（フリードリッヒ運動失調、筋強直性ジストロフィー、脆弱Ｘ症候群のいくつかの形態）で生じ得る。ミニサテライト、ペンタヌクレオチド、テトラヌクレオチド、および多数のトリヌクレオチド反復を含む伸長は、脆弱部位と関連している。これらの疾患と関連する伸長は、複製のずれ、非対称組換え、またはエピジェネティック異常によって引き起こされ得る。配列における反復の数は、部分配列が出現する合計回数を指す。例えば、「ＣＡＧＣＡＧ」には、２つの反復を含む。反復は、部分配列の少なくとも２つのインスタンスを含むため、反復の数は、１にはなり得ない。部分配列は、反復単位であると理解され得る。

実施形態において、妊娠中の女性における長い無細胞ＤＮＡ分析は、反復関連疾患の検出を容易にし得る。例えば、トリヌクレオチド反復は、ＤＮＡ配列における３ｂｐモチーフの反復ストレッチを表す。一例は、配列「ＣＡＧＣＡＧＣＡＧ」が３つの３ｂｐ「ＣＡＧ」モチーフを含むことである。マイクロサテライトの伸長、典型的には、トリヌクレオチド反復伸長は、神経障害において重要な役割を果たすことが報告されている（Ｋｏｖｔｕｎｅｔａｌ．ＣｅｌｌＲｅｓ．２００８；１８：１９８－２１３、ＭｃＭｕｒｒａｙｅｔａｌ．ＮａｔＲｅｖＧｅｎｅｔ．２０１０；１１：７８６－９９）。一例は、ＡＴＸＮ３遺伝子における５５を超えるＣＡＧ反復（合計１６５ｂｐ）が病原性であり、進行性の運動の問題を特徴とする脊髄小脳失調症３型（ＳＣＡ３）疾患をもたらすことである。この状態は、常染色体優性パターンで受け継がれる。したがって、変化した遺伝子の１つのコピーは、障害を引き起こすのに十分である。マイクロサテライトの反復数を決定するために、典型的には、ポリメラーゼ連鎖反応（ＰＣＲ）を使用して、目的のゲノム領域を増幅し、次いで、ＰＣＲ産物をキャピラリー電気泳動（Ｌｙｏｎｅｔａｌ．ＪＭｏｌＤｉａｇｎ．２０１０；１２：５０５－１１）、サザンブロット分析（Ｈｓｉａｏｅｔａｌ．ＪＣｌｉｎＬａｂＡｎａｌ．１９９９；１３：１８８－９３）、融解曲線分析（Ｌｉｍｅｔａｌ．ＪＭｏｌＤｉａｇｎ．２０１４；１７：３０２－１４）、および質量分析（Ｚｈａｎｇｅｔａｌ．ＡｎａｌＭｅｔｈｏｄｓ．２０１６；８：５０３９－４４）などの多数の異なる技術に供する。しかしながら、これらの方法は、労働集約的で時間がかかり、出生前検査などの実際の臨床診療におけるハイスループットスクリーニングに適用することは困難であった。サンガー配列決定は、手動検査を通して複雑な配列トレースから長い反復を推測することが非常に困難である。Ｉｌｌｕｍｉｎａ配列決定技術およびＩｏｎＴｏｒｒｅｎｔは、それらの反復を有するＧＣリッチ（またはＧＣプア）領域の配列決定が非常に困難であることがよく知られており（Ａｓｈｅｌｙｅｔａｌ．２０１６；１７：５０７－２２）、伸長したＤＮＡを含むＤＮＡの長さは、配列リードの長さを容易に超える（Ｌｏｏｍｉｓｅｔａｌ．ＧｅｎｏｍｅＲｅｓ．２０１３；２３：１２１－８）。

別の例は、ＤＭＰＫ遺伝子の近くにある５０～４０００のＣＴＧ反復の範囲のＣＴＧ反復の伸長によって引き起こされる筋強直性ジストロフィー、および常染色体優性障害でもある。ＤＭの分子診断は、胎児ゲノムＤＮＡ上のＣＴＧ数を侵襲的に分析することによって、出生前診断で日常的に実施される。

ショートリード配列決定（数百個の塩基）とは対照的に、本開示に記載の方法は、母体血漿ＤＮＡから長いＤＮＡ分子を取得することができる（数キロベース）。本開示に記載の方法を使用して、胎児が罹患した母親からこの疾患を受け継ぐかどうかを非侵襲的に決定し得る。

図７９は、リピート関連疾患についての胎児の母性遺伝を推定する図を示す。段階７９０５では、妊娠中の無細胞ＤＮＡを、単一分子リアルタイム（例えば、ＰａｃＢｉｏＳＭＲＴ）配列決定に供した。段階７９１０では、配列決定された結果を、本開示に従って長いＤＮＡカテゴリーおよび短いＤＮＡカテゴリーに分割した。段階７９１５では、長いＤＮＡ分子中に存在する対立遺伝子情報は、母体ハプロタイプ、すなわち、ＨａｐＩおよびＨａｐＩＩを構築するために使用され得る。ＨａｐＩおよびＨａｐＩＩは各々、トリヌクレオチド部分配列（例えば、ＣＴＧ）の伸長した反復を含み得る。段階７９２０では、図１６で説明されるのと同様に、ハプロタイプの不均衡が分析され得る。段階７９２５では、胎児の母性遺伝が推定され得る。本明細書に記載の方法は、本開示による長いＤＮＡ分子の配列情報を使用して、ハプロタイプ（例えば、ＨａｐＩおよびＨａｐＩＩ）を決定することだけでなく、障害を引き起こす伸長した反復（例えば、罹患したＨａｐＩ）を有するハプロタイプを決定することも可能にする。本明細書に記載の方法に従って、母体ＨａｐＩおよびＨａｐＩＩにわたって分布する短いＤＮＡ分子からのカウント、サイズ、またはメチル化状態を使用して、胎児がこの例において母体ＨａｐＩ（罹患）またはＨａｐＩＩ（非罹患）を受け継ぐかどうかを決定し得る。

図８０は、リピート関連疾患についての胎児の父性遺伝を推定する図を示す。妊娠中の無細胞ＤＮＡを使用して、胎児が罹患した父性ハプロタイプを受け継ぐかどうかを決定し得る。図８０に示されるように、夫が反復伸長病に罹患している（例えば、７０個のＣＴＧ反復）、罹患していない女性の妊娠中の無細胞ＤＮＡ（例えば、ＨａｐＩについては５つのＣＴＧ反復、およびＨａｐＩＩについては６つのＣＴＧ反復）を、ＰａｃＢｉｏＳＭＲＴ配列決定に供し、配列決定された長いＤＮＡ分子を特定し、ハプロタイプおよび反復数を決定するために使用した。ＣＴＧ反復の長いストレッチ（例えば、この例では７０個のＣＴＧ反復）を有するハプロタイプが、罹患していない妊娠中の女性の母体血漿中に存在する場合、胎児が罹患した父性ハプロタイプを受け継いだことを示唆する。いくつかの実施形態において、伸長した反復を含有するＤＮＡはまた、母体ゲノムには存在しない１つ以上の別の父性特異的対立遺伝子を担持する。この状況は、父性遺伝を確認するのに有用である。

別の実施形態において、妊娠中の無細胞ＤＮＡを使用して、胎児が罹患した父性ハプロタイプを受け継ぐかどうかを決定し得る。図８０に示されるように、夫が反復伸長病に罹患している（例えば、７０個のＣＴＧ反復）、罹患していない女性の妊娠中の無細胞ＤＮＡ（例えば、ＨａｐＩについては５つのＣＴＧ反復、およびＨａｐＩＩについては６つのＣＴＧ反復）を、ＰａｃＢｉｏＳＭＲＴ配列決定に供し、配列決定された長いＤＮＡ分子を特定し、ハプロタイプおよび反復数を決定するために使用した。ＣＴＧ反復の長いストレッチ（例えば、この例では７０個のＣＴＧ反復）を有するハプロタイプが、罹患していない妊娠中の女性の母体血漿中に存在する場合、胎児が罹患した父性ハプロタイプを受け継いだことを示唆する。いくつかの実施形態において、伸長した反復を含有するＤＮＡはまた、母体ゲノムには存在しない１つ以上の別の父性特異的対立遺伝子を担持する。この状況は、父性遺伝を確認するのに有用である。

図８１、８２、および８３は、反復伸長病の例を示す表である。１列目は、反復伸長関連疾患を示す。２列目は、反復部分配列を示す。３列目は、正常な対象における反復数を示す。４列目は、罹患した対象における反復数を示す。５列目は、反復に関連する遺伝的位置を示す。６列目は、遺伝子名を列挙する。７列目は、遺伝のパターンを列挙する。表は、ｏｍｉｃｓｌａｂ．ｇｅｎｅｔｉｃｓ．ａｃ．ｃｎ／ｄｒｅｄ／ｉｎｄｅｘ．ｐｈｐから得られる。

Ａ．反復伸長検出の例
父性遺伝の伸長したＣＡＧ反復は、ＰＣＲによる直接アプローチ、および後続の３１３０ＸＬＧｅｎｅｔｉｃＡｎａｌｙｚｅｒ上での断片分析を使用して、母体血漿中で検出され得ることが報告された（Ｏｅｖｅｒｅｔａｌ．ＰｒｅｎａｔＤｉａｇｎ．２０１５；３５：９４５－９）。伸長した対立遺伝子のサイズが、３５トリヌクレオチド超の反復［すなわち、反復に及ぶ長さが１０５ｂｐ（３５×３）以上のＤＮＡ領域］からのみ始まるため、ハンチントンの非侵襲的出生前検査は、ＰＣＲによって達成可能であった。多くの伸長した反復、特にほとんどのトリヌクレオチド反復障害（Ｏｒｒｅｔａｌ．Ａｎｎｕ．Ｒｅｖ．Ｎｅｕｒｏｓｃｉ．２００７；３０：５７５－６２１）は、短い胎児ＤＮＡ分子のサイズを超える長さが３００ｂｐ以上の反復を伴いまい、これは、以前の報告で文書化されている。大きい伸長した反復を有するＤＮＡは、ＰＣＲを困難にする（Ｏｒｒｅｔａｌ．Ａｎｎｕ．Ｒｅｖ．Ｎｅｕｒｏｓｃｉ．２００７；３０：５７５－６２１）。Ｏｅｖｅｒｅｔａｌ．の研究によって示唆されるように、長いＣＡＧ反復のシグナル強度は、より小さい反復のシグナルと比較してはるかに低いことが多く、この現象は、ゲノムＤＮＡおよび血漿ＤＮＡの両方で観察され、それらの長いＣＡＧ反復を検出するための感度をより低くする（Ｏｅｖｅｒｅｔａｌ．ＰｒｅｎａｔＤｉａｇｎ．２０１５；３５：９４５－９）。ＰＣＲのもう１つの制限は、増幅中にメチル化シグナルを保存することができないことである。一実施形態において、長いＤＮＡ分子の単一分子リアルタイム配列決定は、１つ以上の領域にわたるタンデム反復多型およびそれらに関連するメチル化レベルの決定を可能にする。

図８４は、胎児における反復伸長検出および反復関連メチル化決定の例を示す表である。１列目は、塩基対の数で反復のタイプを示す。２列目は、反復単位を示す。３列目は、ゲノム位置を示す。４列目は、参照塩基、ヒト参照ゲノムに存在する配列を示す。５列目は、父性遺伝子型を示す。６列目は、母体遺伝子型を示す。７列目は、胎児遺伝子型を示す。８列目は、父性対立遺伝子に関連した胎児ＤＮＡメチル化レベルを示す。９列目は、母体対立遺伝子に関連した胎児ＤＮＡメチル化レベルを示す。

図８４は、１ｂｐ、２ｂｐ、３ｂｐ、および４ｂｐのタンデム反復の多数の例を示す。例えば、ｃｈｒ３：１９２３８４７０５－１９２３８４７０６のゲノム位置では、「ＧＡＴＡ」タンデム反復が特定された。この遺伝子座での父親の遺伝子型は、Ｔ（ＧＡＴＡ）_３／Ｔ（ＧＡＴＡ）_５であり、対立遺伝子１は、３つの反復単位を有し、対立遺伝子２は、５つの反復単位を有した。参照対立遺伝子Ｔ（ＧＡＴＡ）_３と比較して、父性対立遺伝子２は、反復伸長を伴う遺伝的事象を示唆した。この遺伝子座での母親の遺伝子型は、Ｔ／Ｔであり、反復収縮を伴う遺伝的事象を示している。この遺伝子座での胎児の遺伝子型は、Ｔ（ＧＡＴＡ）_５／Ｔであり、胎児が父性対立遺伝子２（すなわち、Ｔ（ＧＡＴＡ）_５）および母体対立遺伝子Ｔを受け継いだことを示唆している。父性対立遺伝子および母体対立遺伝子と関連するメチル化レベルは、それぞれ５０．９８および６２．８であった。これらの結果は、タンデム反復多型の使用が胎児の母性および父性遺伝の決定を可能にすることを示唆した。この技術により、２つの対立遺伝子と関連する異なるメチル化パターンの特定が可能になる。別の例は、ｃｈｒ４：７３２３７１５７－７３２３７１５８のゲノム位置で、胎児が母親から反復伸長［（ＴＡＡＡ）_３］を受け継いだことを示す。母親から受け継いだ反復伸長を含有する胎児分子は、父性対立遺伝子を含有する胎児分子（６２．８４％）と比較して、より高いメチル化レベル（９５．６５％）を示した。これらのデータは、反復、反復構造、および関連するメチル化の変化を検出し得ることを示唆した。一実施形態において、母性遺伝と父性遺伝との間のメチル化の差が有意であったかどうかを決定するために、特定のカットオフを使用し得る。カットオフは、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、または９０％よりも大きいものなどであるがこれらに限定されない、メチル化レベルの絶対差である。母性遺伝の決定は、図２１の方法２１００で説明される方法と同様であり得る。

Ｂ．例示的な方法
部分配列反復を使用して、胎児の情報を決定し得る。例えば、部分配列反復の存在を使用して、分子が胎児起源であることを決定し得る。さらに、部分配列の反復は、遺伝性障害の尤度を示し得る。部分配列反復を使用して、母体および／または父性ハプロタイプの遺伝を決定することができる。さらに、胎児の父子関係は、部分配列反復を使用して決定され得る。

１．部分配列反復を使用した胎児起源分析
図８５は、胎児を妊娠中の女性から取得された生物学的試料を分析する方法８５００を示し、生物学的試料は、胎児および女性からの無細胞ＤＮＡ分子を含む。胎児における遺伝性障害の尤度が決定され得る。

ブロック８５１０では、無細胞ＤＮＡ分子の１つの無細胞ＤＮＡ分子に対応する第１の配列リードが受け取られ得る。無細胞ＤＮＡ分子は、カットオフ値よりも大きい長さを有し得る。カットオフ値は、２００ｎｔ以上であり得る。カットオフ値は、６００ｎｔ、７００ｎｔ、８００ｎｔ、９００ｎｔ、１ｋｎｔ、１．１ｋｎｔ、１．２ｋｎｔ、１．３ｋｎｔ、１．４ｋｎｔ、１．５ｋｎｔ、１．６ｋｎｔ、１．７ｋｎｔ、１．８ｋｎｔ、１．９ｋｎｔ、または２ｋｎｔを含み、少なくとも５００ｎｔであり得る。カットオフ値は、長い無細胞ＤＮＡ分子について本明細書に記載の任意のカットオフ値であり得る。

ステップ８５２０では、第１のリードは、参照ゲノムの領域にアラインメントされ得る。領域は、部分配列の反復を含む可能性があることが知られ得る。領域は、図８１～８３の位置または遺伝子のいずれかに対応し得る。部分配列は、本明細書に記載のいずれかを含むトリヌクレオチド配列であり得る。

ブロック８５３０では、無細胞ＤＮＡ分子に対応する第１の配列リードにおける部分配列の反復数が特定され得る。

ブロック８５４０では、部分配列の反復数が、閾値数と比較され得る。閾値数は、５５、６０、７５、１００、１５０、またはそれ以上であり得る。閾値数は、異なる遺伝性障害について異なり得る。例えば、閾値は、罹患した対象における最小反復数、正常な対象における最大反復数、またはこれらの２つの数の間の数を反映し得る（図８１～８３を参照）。

ブロック８５５０では、胎児が遺伝性障害を有する尤度の分類が、反復数と閾値数との比較を使用して決定され得る。反復数が閾値を超える場合、胎児が遺伝性障害を有する可能性が高いと決定され得る。遺伝性障害は、脆弱Ｘ症候群または図８１～８３に列挙される任意の障害であり得る。

いくつかの実施形態において、方法は、各々が部分配列の反復を有する可能性があることが知られている、いくつかの異なる標的遺伝子座について分類を繰り返すことを含み得る。無細胞ＤＮＡ分子に対応する複数の配列リードが受け取られ得る。複数の配列リードは、参照ゲノムの複数の領域にアラインメントされ得る。複数の領域は、部分配列の反復を含む可能性があることが知られ得る。複数の領域は、重複していない領域であり得る。複数の領域の各領域は、異なるＳＮＰを有し得る。複数の領域は、異なる染色体腕または染色体に由来し得る。複数の領域は、参照ゲノムの少なくとも０．０１％、０．１％、または１％をカバーし得る。部分配列の反復数は、複数の配列リードにおいて特定され得る。部分配列の反復数は、複数の閾値数と比較され得る。各閾値は、異なる遺伝性障害の存在または尤度を示し得る。複数の遺伝性障害の各々について、胎児がそれぞれの遺伝性障害を有する尤度の分類が、複数の閾値数の１つの閾値数との比較を使用して決定され得る。

無細胞ＤＮＡ分子は、胎児起源であると決定され得る。胎児起源の決定は、バフィーコートまたは妊娠前の女性の試料から取得された母体起源の無細胞ＤＮＡ分子に対応する第２の配列リードを受け取ることを含み得る。第２の配列リードは、参照ゲノムの領域にアラインメントされ得る。部分配列の第２の反復数は、第２の配列リードにおいて特定され得る。第２の反復数は、第１の反復数よりも少ないと決定され得る。

胎児起源の決定は、無細胞ＤＮＡ分子のメチル化および非メチル化部位を使用して、無細胞ＤＮＡ分子のメチル化レベルを決定することを含み得る。メチル化レベルは、参照レベルと比較され得る。方法は、メチル化レベルが参照レベルを超えると決定することを含み得る。メチル化レベルは、メチル化されている部位の数または割合であり得る。

胎児起源の決定は、無細胞分子の複数の部位のメチル化パターンを決定することを含み得る。類似性スコアは、メチル化パターンを母体または胎児組織からの参照パターンと比較することによって決定され得る。類似性スコアは、１つ以上の閾値と比較され得る。類似性スコアは、例えば、方法４０００で説明されるものを含む本明細書に記載の任意の類似性スコアであり得る。

２．部分配列反復を使用した父子関係分析
図８６は、胎児を妊娠中の女性から取得された生物学的試料を分析する方法８６００を示し、生物学的試料は、胎児および女性からの無細胞ＤＮＡ分子を含む。生物学的試料を分析して、胎児の父親を決定し得る。

ブロック８６１０では、無細胞ＤＮＡ分子の１つの無細胞ＤＮＡ分子に対応する第１の配列リードが受け取られ得る。方法は、無細胞ＤＮＡ分子が胎児起源であると決定することを含み得る。無細胞ＤＮＡ分子は、例えば、方法８５００で説明されるものを含む本明細書に記載の任意の方法によって、胎児起源であると決定され得る。無細胞ＤＮＡ分子は、カットオフ値よりも大きいサイズを有し得る。カットオフ値は、２００ｎｔ以上であり得る。カットオフ値は、６００ｎｔ、７００ｎｔ、８００ｎｔ、９００ｎｔ、１ｋｎｔ、１．１ｋｎｔ、１．２ｋｎｔ、１．３ｋｎｔ、１．４ｋｎｔ、１．５ｋｎｔ、１．６ｋｎｔ、１．７ｋｎｔ、１．８ｋｎｔ、１．９ｋｎｔ、または２ｋｎｔを含み、少なくとも５００ｎｔであり得る。カットオフ値は、長い無細胞ＤＮＡ分子について本明細書に記載の任意のカットオフ値であり得る。

ブロック８６２０では、第１のリードは、参照ゲノムの第１の領域にアラインメントされ得る。第１の領域は、部分配列の反復を有することが知られ得る。

ブロック８６３０では、無細胞ＤＮＡ分子に対応する第１の配列リードにおける第１の部分配列の第１の反復数が特定され得る。第１の部分配列は、対立遺伝子を含み得る。

ブロック８６４０では、男性対象から取得された配列データを分析して、第１の部分配列の第２の反復数が第１の領域内に存在するかどうかを決定し得る。第２の反復数は、第１の部分配列の少なくとも２つのインスタンスを含む。配列データは、男性対象から生物学的試料を抽出し、生物学的試料中のＤＮＡに対して配列決定を実施することによって取得され得る。

ブロック８６５０では、男性対象が胎児の父親である尤度の分類が、第１の部分配列の第２の反復数が存在するかどうかの決定を使用して決定され得る。分類は、第１の部分配列の第２の反復数が存在すると決定された場合、男性対象が父親である可能性が高いということであり得る。分類は、第１の部分配列の第２の反復数が存在しないと決定された場合、男性対象が父親ではない可能性が高いということであり得る。

方法は、第１の反復数を第２の反復数と比較することを含み得る。男性対象が父親である尤度の分類を決定することは、第１の反復数と第２の反復数との比較を使用することを含み得る。分類は、第１の反復数が第２の反復数の閾値内にある場合、男性対象が父親である可能性が高いということであり得る。閾値は、第２の反復数の１０％、２０％、３０％、または４０％以内であり得る。

方法は、反復の複数の領域を使用することを含み得る。例えば、無細胞ＤＮＡ分子は、第１の無細胞ＤＮＡ分子である。方法は、無細胞ＤＮＡ分子の第２の無細胞ＤＮＡ分子に対応する第２の配列リードを受け取ることを含み得る。方法はまた、第２の配列リードを参照ゲノムの第２の領域にアラインメントすることを含み得る。方法は、第２の無細胞ＤＮＡ分子に対応する第２の配列リードにおける第２の部分配列の第１の反復数を特定することをさらに含み得る。方法は、男性対象から取得された配列データを分析して、第２の部分配列の第２の反復数が第２の領域内に存在するかどうかを決定することを含み得る。男性対象が胎児の父親である尤度の分類を決定することは、第２の部分配列の第２の反復数が第２の領域内に存在するかどうかの決定を使用することをさらに含み得る。尤度の分類は、反復が男性対象の配列データにおける第１領域および第２領域の両方に存在する場合、男性対象が胎児の父親であるより高い尤度であり得る。

ＶＩ．長い血漿ＤＮＡ分子を濃縮するためのサイズ選択
実施形態において、分析（例えば、単一分子リアルタイム配列決定）の前に、１つ以上の所望のサイズ範囲を有するＤＮＡ分子を物理的に選択することができる。一例として、サイズ選択は、固相可逆的固定化技術を使用して実施され得る。他の実施形態において、サイズ選択は、電気泳動を使用して（例えば、ＣｏａｓｔａｌＧｅｎｏｍｉｃシステムまたはＰｉｐｐｉｎサイズ選択システムを使用して）実施され得る。我々のアプローチは、胎児ＤＮＡが母体ＤＮＡよりも短いことが当技術分野で知られているため（Ｃｈａｎｅｔａｌ．ＣｌｉｎＣｈｅｍ２００４；５０：８８－９２）、より短いＤＮＡに主に焦点を当てた以前の研究（Ｌｉｅｔａｌ．ＪＡＭＡ２００５；２９３：８４３－９）とは異なる。

サイズ選択技術は、本明細書に記載の方法のいずれかおよび本明細書に記載の任意のサイズに適用され得る。例えば、無細胞ＤＮＡ分子は、電気泳動、磁気ビーズ、ハイブリダイゼーション、免疫沈降、増幅、またはＣＲＩＳＰＲによって濃縮され得る。得られた濃縮試料は、濃縮前の生物学的試料よりも高い濃度または高い割合の特定のサイズの断片を有し得る。

Ａ．電気泳動によるサイズ選択
実施形態において、ＤＮＡサイズに応じてＤＮＡの電気泳動移動度を利用して、ゲル電気泳動ベースのアプローチを使用して、例えば、１００ｂｐ以上、２００ｂｐ以上、３００ｂｐ以上、４００ｂｐ以上、５００ｂｐ以上、６００ｂｐ以上、７００ｂｐ以上、８００ｂｐ以上、９００ｂｐ以上、１ｋｂ以上、２ｋｂ以上、３ｋｂ以上、４ｋｂ以上、５ｋｂ以上、６以上ｋｂ、７ｋｂ以上、８ｋｂ以上、９ｋｂ以上、１０ｋｂ以上、２０ｋｂ以上、３０ｋｂ以上、４０ｋｂ以上、５０ｋｂ以上、６０ｋｂ以上、７０ｋｂ以上、８０ｋｂ以上、９０ｋｂ以上、１００ｋｂ以上、２００ｋｂ以上、または本明細書に記載の任意のカットオフよりも大きいものを含むその他であるが、これらに限定されない、望ましいサイズ範囲を有する標的ＤＮＡ分子を選択し得る。例えば、ＤＮＡサイズ選択用の自動ゲル電気泳動システムであるＬｉｇｈｔＢｅｎｃｈ（ＣｏａｓｔａｌＧｅｎｏｍｉｃｓ）を使用した。原則として、ゲル電気泳動中、より短いＤＮＡがより長いＤＮＡよりも速く移動する。このサイズ選択技術を１つの血漿ＤＮＡ試料（Ｍ１３１９０）に適用し、５００ｂｐよりも大きいＤＮＡ分子を選択することを目標とした。「Ｉｎ－Ｃｈａｎｎｅｌ－Ｆｉｌｔｅｒ」（ＩＣＦ）収集デバイスを有する３％サイズ選択カセット、およびサイズ選択用の内部サイズマーカーを有するローディング緩衝液を使用した。ＤＮＡライブラリをゲルに装填し、電気泳動を開始した。目標サイズに達すると、５００ｂｐ未満の第１の画分をＩＣＦから回収した。実行を再開し、電気泳動を完了させて、５００ｂｐ以上の第２の画分を取得した。単一分子リアルタイム配列決定（ＰａｃＢｉｏ）を使用して、分子サイズが５００ｂｐ以上の第２の画分を配列決定した。１，４３４個の高品質の円形コンセンサス配列（ＣＣＳ）（すなわち、１，４３４個の分子）を取得した。それらの間で、配列決定された分子の９７．９％は、５００ｂｐよりも大きかった。５００ｂｐよりも大きいＤＮＡ分子のそのような割合は、サイズ選択なしの対応物（１０．６％）よりもはるかに高かった。これらの分子の全体的なメチル化は、７５．５％であると決定された。

図８７は、（Ｉ）分子Ｉおよび（ＩＩ）分子ＩＩにおけるサイズ選択後の２つの代表的な血漿ＤＮＡ分子についてのメチル化パターンを示す。分子Ｉ（ｃｈｒ２１：４０，８８１，７３１－４０，８８２，８１２）は、１．１ｋｂの長さであり、２５個のＣｐＧ部位を有した。分子Ｉの単一分子のメチル化レベル（すなわち、メチル化部位の数を部位の総数で割ったもの）は、我々の以前の開示（米国出願第１６／９９５，６０７号）に記載されたアプローチを使用して７２．０％であると決定された。分子ＩＩ（ｃｈｒ１２：６３，１０８，０６５－６３，１１１，６７４）は、３．６ｋｂの長さであり、３４個のＣｐＧ部位を有した。分子ＩＩの単一分子のメチル化レベルは、９４．１％であると決定された。サイズ選択ベースのメチル化分析により、長いＤＮＡ分子のメチル化を効率的に分析し、２つ以上の分子間のメチル化状態を比較することが可能になったことが示唆された。

Ｂ．ビーズによるサイズ選択
固相可逆的固定化技術は、常磁性ビーズを使用して、ＤＮＡ分子サイズに応じて核酸に選択的に結合した。そのようなビーズには、ポリスチレンコア、マグネタイト、およびカルボキシレート修飾ポリマーコーティングが含まれる。ＤＮＡ分子は、反応中のポリエチレングリコール（ＰＥＧ）および塩の濃度に応じて、ＰＥＧおよび塩の存在下でビーズに選択的に結合する。ＰＥＧにより、負に帯電したＤＮＡがビーズ表面上のカルボキシル基と結合し、これは、磁場の存在下で収集される。所望のサイズを有する分子を、溶出緩衝液、例えば、１０ｍＭＴｒｉｓ－ＨＣｌ、ｐＨ８緩衝液、または水を使用して磁気ビーズから溶出した。ＰＥＧ対ＤＮＡの体積比は、取得し得るＤＮＡ分子のサイズを決定する。ＰＥＧ：ＤＮＡの比率が低いほど、ビーズ上に保持される長い分子は多くなる。

１．試料処理
２人の妊娠後期の妊娠中の女性からの末梢血試料をＥＤＴＡ血液チューブに採取した。末梢血試料を採取し、１，６００×ｇで４℃において１０分間遠心分離した。血漿部分をさらに１６，０００×ｇで４℃において１０分間遠心分離して、残留細胞および破片を除去した。バフィーコート部分を５，０００×ｇで室温において５分間遠心分離して、残留血漿を除去した。分娩直後に胎盤組織を採取した。血漿ＤＮＡ抽出を、ＱＩＡａｍｐＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄＫｉｔ（Ｑｉａｇｅｎ）を使用して実施した。バフィーコートおよび胎盤組織ＤＮＡ抽出を、ＱＩＡａｍｐＤＮＡＭｉｎｉＫｉｔ（Ｑｉａｇｅｎ）を使用して実施した。

２．血漿ＤＮＡサイズ選択
抽出後の血漿ＤＮＡ試料を２つのアリコートに分割した。各患者からの１つのアリコートを、ＡＭＰｕｒｅＸＰＳＰＲＩビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ｉｎｃ．）を用いたサイズ選択に供した。抽出された各血漿ＤＮＡ試料５０μＬを、２５μＬのＡＭＰｕｒｅＸＰ溶液と完全に混合し、室温で５分間インキュベートした。ビーズを、磁石を用いて溶液から分離し、１８０μＬの８０％エタノールで洗浄した。次いで、ビーズを５０μＬの水に再懸濁し、１分間ボルテックスして、サイズ選択されたＤＮＡをビーズから溶出した。続いてビーズを除去して、サイズ選択されたＤＮＡ溶液を取得した。

３．一塩基多型の特定
胎児および母体ゲノムＤＮＡ試料の遺伝子型を、ｉＳｃａｎＳｙｓｔｅｍ（Ｉｌｌｕｍｉｎａ）を用いて決定した。一塩基多型（ＳＮＰ）と呼んだ。胎盤の遺伝子型を母親の遺伝子型と比較して、胎児特異的対立遺伝子および母体特異的対立遺伝子を特定した。胎児特異的対立遺伝子を、胎児ゲノムには存在するが母体ゲノムには存在しなかった対立遺伝子として定義した。一実施形態において、それらの胎児特異的対立遺伝子は、母親がホモ接合性であり、胎児がヘテロ接合性であったそれらのＳＮＰ部位を分析することによって決定され得る。母体特異的対立遺伝子を、母体ゲノムには存在するが胎児ゲノムには存在しなかった対立遺伝子によって定義した。一実施形態において、それらの胎児特異的対立遺伝子は、母親がヘテロ接合性であり、胎児がホモ接合性であったそれらのＳＮＰ部位を分析することによって決定され得る。

４．単一分子リアルタイム配列決定
２つのサイズ選択された試料を、それらの対応する選択されていない試料とともに、ＳＭＲＴｂｅｌｌＴｅｍｐｌａｔｅＰｒｅｐＫｉｔ１．０－ＳＰｖ３（ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）を使用して単一分子リアルタイム（ＳＭＲＴ）配列決定鋳型構築に供した。ＤＮＡを１．８×ＡＭＰｕｒｅＰＢビーズで精製し、ＴａｐｅＳｔａｔｉｏｎ機器（Ａｇｉｌｅｎｔ）を使用してライブラリサイズを推定した。配列決定プライマーのアニーリングおよびポリメラーゼ結合の条件を、ＳＭＲＴＬｉｎｋｖ５．１．０ソフトウェア（ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）を使用して計算した。簡単に、配列決定プライマーｖ３を配列決定鋳型にアニーリングし、次いでＳｅｑｕｅｌＢｉｎｄｉｎｇａｎｄＩｎｔｅｒｎａｌＣｏｎｔｒｏｌＫｉｔ２．１（ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）を使用して、ポリメラーゼを鋳型に結合させた。配列決定を、ＳｅｑｕｅｌＳＭＲＴＣｅｌｌ１Ｍｖ２上で実施した。配列決定の動画を、ＳｅｑｕｅｌＳｅｑｕｅｎｃｉｎｇＫｉｔ２．１（ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）を用いて、Ｓｅｑｕｅｌシステム上で２０時間収集した。

５．サイズ分析
図８８は、サイズ選択ありおよびなしの試料についての配列決定情報の表である。１列目は、試料識別子である。２列目は、サイズ選択ありおよびなしの試料の群を列挙する。３列目は、配列決定された分子の数を列挙する。４列目は、平均サブリード深度を列挙する。５列目は、断片サイズの中央値を列挙する。６列目は、５００ｂｐ以上の断片の割合を示す。

ビーズベースのサイズ選択ありおよびなしの２つの試料（２９９および３００）を分析した。図８８に示されるように、単一分子リアルタイム配列決定（例えば、ＰａｃＢｉｏＳＭＲＴ配列決定）を使用して、サイズ選択なしの試料２９９および３００について、それぞれ２５０万個および３１０万個の配列決定された分子を取得した。平均サブリード深度は、９１倍および６７倍であった。断片サイズの中央値は、１７６および５１２ｂｐであった。

５００ｂｐ以上のＤＮＡ断片を選択することを目標とした固相可逆的固定化ベースのサイズ選択を用いた対の試料（Ｂ２９９およびＢ３００）について、平均サブリード深度が１８倍および１９倍の、それぞれ４１０万個および２００万個の配列決定された分子を取得した。断片サイズの中央値は、試料Ｂ２９９およびＢ３００について、それぞれ２．５ｋｂおよび２．２ｋｂであることがわかった。平均断片サイズは、サイズ選択なしの場合の対応する試料よりも４～１４倍長かった。サイズ選択後の５００ｂｐ以上の断片の割合は、試料Ｂ２９９について２７．３％から９７．６％に、および試料Ｂ３００について５０．５％から９７．４％に増加した。

図８９Ａおよび８９Ｂは、ビーズベースのサイズ選択ありおよびなしの妊娠中の女性からのＤＮＡ試料についてのサイズ分布を示す。図８９Ａは、試料２９９を示し、図８９Ｂは、試料３００を示す。ｘ軸は、断片のサイズを示す。ｙ軸は、各断片サイズについての頻度を対数スケールで示す。ビーズベースのサイズ選択後、ＤＮＡ試料中の１ｋｂを超える長いＤＮＡ分子にわたってより高い頻度が存在した。これらのデータは、ビーズベースのサイズ選択が、下流分析のためにより多くの長いＤＮＡ分子を濃縮し得ることを示唆した。そのような濃縮は、配列決定実行ごとに配列決定される長いＤＮＡ分子の数を最大化することによって、分析をより費用効果が高いものにする。メチル化パターンマッチング分析のための各血漿ＤＮＡ分子のより多くのアクセス可能なＣｐＧ部位があるため、長いＤＮＡ分子のそのような濃縮は、各ＤＮＡ分子についての起源組織を分析する場合の有益性も改善する。一実施形態において、メチル化分析は、米国特許出願第１６／９９５，６０７号に記載の方法を使用して実施され得る。ヌクレオソームパターンは、サイズ選択ありの試料中で保存され、サイズ選択された血漿ＤＮＡ分子がヌクレオソーム構造の研究に適していることを示唆している。

試料２９９について、マイクロアレイ技術（ＩｎｆｉｎｉｕｍＯｍｎｉ２．５）を使用して、母体バフィーコートＤＮＡおよび胎盤ＤＮＡについての遺伝子型情報を取得した。配列決定された血漿ＤＮＡ分子を、遺伝子型情報に従って母体特異的ＤＮＡ分子および胎児特異的ＤＮＡ分子に区別した。

図９０Ａおよび９０Ｂは、胎児特異的ＤＮＡ分子と母体特異的ＤＮＡ分子との間のサイズ分布を示す。サイズは、ｘ軸上に示される。図９０Ａ中、頻度は、ｙ軸上に示される。図９０Ｂ中、累積頻度は、ｙ軸上に示される。図９０Ａ中、胎児ＤＮＡサイズ分布は、母体ＤＮＡサイズ分布と比較して、比較的より小さい分子においてより高い頻度を示した。図９０Ｂ中、胎児ＤＮＡ分子のそのようなサイズ短縮は、累積頻度プロットに示され、すなわち、胎児ＤＮＡ累積サイズ分布は、母体の左側に位置した。

Ｃ．サイズ選択ありの血漿ＤＮＡの有益性の強化。
実施形態において、有益なＳＮＰは、胎児または母体ゲノムに特異的な対立遺伝子を含有するそれらのＳＮＰによって定義され得る。それらのＳＮＰは、胎児ＤＮＡ分子と母体ＤＮＡ分子とを区別するための手段を提供した。４１９，５３９個の有益なＳＮＰを特定した。他の実施形態において、有益なＳＮＰは、母体ゲノム中でヘテロ接合であったそれらのＳＮＰによって定義され得る。他の実施形態において、有益なＳＮＰは、ヘテロ接合性であり、ハプロタイプの形態で一緒に群化された母体ゲノム中のそれらのＳＮＰによって定義され得る。

図９１は、サイズ選択ありおよびなしの試料間の有益なＳＮＰを担持する血漿ＤＮＡ分子の数についての統計表である。１列目は、試料識別および群を示す。２列目は、分析される血漿ＤＮＡ分子の総数を示す。３列目は、有益なＳＮＰを担持する血漿ＤＮＡ分子の数を示す。４列目は、有益なＳＮＰを担持する血漿ＤＮＡ分子のパーセンテージを示す。

図９１に示されるように、サイズ選択なしの試料中で有益なＳＮＰを担持する血漿ＤＮＡ分子が、わずか６．５％であったのに対して、有益なＳＮＰを担持する血漿ＤＮＡ分子の割合は、２０．６％まで増加した。したがって、サイズ選択を利用することは、本開示に存在する有用性に好適な長いＤＮＡ分子の収率を大幅に改善する。サイズ選択なしの試料２９９中で５００ｂｐを超える２６０個の胎児ＤＮＡ分子を同定したのに対して、サイズ選択ありの試料Ｂ２９９中では、５００ｂｐを超える９１８個の胎児ＤＮＡ分子を同定した。配列決定スループットを正規化することによって、これらのデータは、ビーズベースのサイズ選択を利用することによって、５００ｂｐを超える胎児特異的ＤＮＡ分子の取得において約３倍の濃縮があったことを示唆した。サイズ選択を通して、分析用の長い胎児ＤＮＡ分子の数を有意に増加させる。

Ｄ．メチル化
図９２は、サイズ選択された、およびサイズ選択されていない血漿ＤＮＡ試料中のメチル化レベルの表である。１列目は、試料識別を示す。２列は、群を示す。３列目は、メチル化ＣｐＧ部位の数を示す。４列目は、非メチル化ＣｐＧ部位の数を示す。５列目は、メチル化部位の数および部位の総数に基づくメチル化レベルを示す。図９２に示されるように、全体的なメチル化レベルは、対応する選択されていない試料と比較して、サイズ選択された試料中でより高いことが示された（すべてのＣｐＧ部位中の試料２９９およびＢ２９９について７１．５％対６９．１％、試料３００およびＢ３００について７１．４％対６９．３％）。

図９３は、母体または胎児特異的無細胞ＤＮＡ分子のメチル化レベルの表である。１列目は、試料識別を示す。２列は、群を示す。３列目は、メチル化ＣｐＧ部位の数を示す。４列目は、非メチル化ＣｐＧ部位の数を示す。５列目は、メチル化部位の数および部位の総数に基づくメチル化レベルを示す。

図９３に示されるように、メチル化レベルの増加が、サイズ選択なしの試料と比較して、サイズ選択ありの試料中で、胎児特異的血漿ＤＮＡ分子および母体特異的血漿ＤＮＡ分子の両方においても観察された。これらの胎児特異的断片は、サイズ選択された試料およびサイズ選択されていない試料の両方において、血漿中の母体特異的ＤＮＡ分子と比較して低メチル化される傾向がある。

Ｅ．末端モチーフ
図９４は、サイズ選択ありおよびなしの試料中の上位１０個の末端モチーフの表である。１列目は、ランクを示す。２列目～５列目は、サイズ選択なしの試料についてである。６列目～９列目は、サイズ選択ありの試料についてである。２行目は、試料識別を列挙する。２列目、４列目、６列目、および８列目は、末端モチーフを列挙する。３列目、５列目、７列目、および９列目は、末端モチーフの頻度を列挙する。

図９４に示されるように、サイズ選択がない場合、単一分子リアルタイム配列決定によって配列決定された血漿ＤＮＡ分子は、優先的にＣで始まる末端モチーフを提示し、ヌクレアーゼＤＮＡＳＥ１Ｌ３の切断シグネチャーを示唆している（Ｈａｎｅｔａｌ．，ＡｍＪＨｕｍＧｅｎｅｔ２０２０；１０６：２０２－２１４）。対照的に、サイズ選択ありのそれらの試料について、単一分子リアルタイム配列決定によって配列決定された血漿ＤＮＡは、主にＡまたはＧで始まる末端モチーフを担持し、ヌクレアーゼＤＦＦＢの切断シグネチャーを示唆している（Ｈａｎｅｔａｌ．ＡｍＪＨｕｍＧｅｎｅｔ２０２０；１０６：２０２－２１４）。これらのデータは、サイズ選択により、無細胞ＤＮＡの断片化における異なる酵素プロセスに由来する血漿ＤＮＡ分子を選択的に濃縮することが可能になることを示唆した。そのような選択的標的化は、１つ以上のヌクレアーゼの異常なレベルと関連する障害の分析、検出、または監視に有用である。一実施形態において、血漿ＤＮＡのサイズ選択は、ＤＦＦＢ活性またはＤＦＦＢ媒介性ＤＮＡ分解速度を監視するための性能を強化する。

いくつかの実施形態において、長い血漿ＤＮＡを濃縮するビーズに結合したＤＮＡ、および短い血漿ＤＮＡを濃縮する上清中に保持されたＤＮＡを配列決定した。長いＤＮＡは、ハプロタイプ情報を構築するのに有用である。短い血漿ＤＮＡは、ＤＮＡＳＥ１Ｌ３活性を監視するのに有用である。実施形態において、長いＤＮＡ分子および短いＤＮＡ分子の相乗的な組み合わせ分析を実施する。例えば、短いＤＮＡ血漿ＤＮＡを母体ハプロタイプ（すなわち、ＨａｐＩおよびＨａｐＩＩ）にアラインメントすると、より短いＤＮＡ、および／または、より多くの低メチル化、および／または比較的より高い投与量を示す１つの母体ハプロタイプが、他のハプロタイプと比較して胎児によって受け継がれる可能性が高い。

いくつかの実施形態において、サイズ選択は、ＰｉｐｐｉｎＨＴＤＮＡＳｉｚｅｓｅｌｅｃｔｉｏｎ、ＢｌｕｅＰｉｐｐｉｎＤＮＡＳｉｚｅＳｅｌｅｃｔｉｏｎ、ＰｉｐｐｉｎＰｒｅｐＤＮＡＳｉｚｅＳｅｌｅｃｔｉｏｎＳｙｓｔｅｍ、ＳａｇｅＥＬＦＷｈｏｌｅＳａｍｐｌｅＦｒａｃｔｉｏｎａｔｉｏｎＳｙｓｔｅｍ、ＰｉｐｐｉｎＰｕｌｓｅＥｌｅｃｔｒｏｐｈｏｒｅｓｉｓ、ＳａｇｅＨＬＳＨＭＷＬｉｂｒａｒｙＳｙｓｔｅｍなどのゲル電気泳動ベースの技術に基づき得るが、これらに限定されない。

Ｆ．長い血漿ＤＮＡ分子は、起源組織分析の性能を強化する。
図９５は、長い血漿ＤＮＡ分子が起源組織分析の性能を増強することを示す受信者動作特性（ＲＯＣ）グラフである。ｙ軸は、感度を示す。ｘ軸は、特異度を示す。異なる線は、異なるサイズの断片についての結果を示す。曲線下面積（ＡＵＣ）が最も高い赤色の線は、３，０００ｂｐよりも大きい断片についてである。

図９５に示されるように、妊娠中の女性の血漿中の胎児ＤＮＡ分子と母体ＤＮＡ分子とを区別する場合、本開示の実施形態による長い血漿ＤＮＡ分子（例えば３０００ｂｐ超）に基づく性能（ＡＵＣ：０．９４）は、１００～２００ｂｐ（ＡＵＣ：０．６６）および２００～５００ｂｐ（ＡＵＣ：０．６７）などの比較的短いＤＮＡ分子に基づく分析よりもはるかに高かった。これらのデータは、長い血漿ＤＮＡを使用すると、胎児ＤＮＡ分子と母体ＤＮＡ分子とを区別する際の精度が大幅に強化され、したがって非侵襲的方法で胎児の遺伝を決定する際の性能が高まることを示唆した。

ＶＩＩ．母体血漿ＤＮＡの長いＤＮＡ分析のためのナノポア配列決定
単一分子リアルタイム配列決定技術を使用することに加えて、ナノポア配列決定を使用して、母体血漿からの長い無細胞ＤＮＡ断片を配列決定し得る。メチル化およびＳＮＰ情報は、長い無細胞ＤＮＡ断片のナノポア配列決定の精度を改善し得る。

図９６は、妊娠中の女性から取得された血漿ＤＮＡのナノポア配列決定についての原理を示し、単一のＤＮＡ分子がナノメートルサイズの孔を通過する際の膜にわたるイオン電流の変化から核酸の配列が推測される。そのような孔は、例えば、タンパク質（例えば、アルファ溶血素、エロリジン、およびＭｙｃｏｂａｃｔｅｒｉｕｍｓｍｅｇｍａｔｉｓポリンＡ（ＭｓｐＡ））、またはシリコンもしくはグラフェンなどの合成材料によって作られ得るが、これらに限定されない（Ｍａｇｉｅｔａｌ，ＢｒｉｅｆＢｉｏｉｎｆｏｒｍ．２０１８；１９：１２５６－１２７２）。実施形態において、二本鎖血漿ＤＮＡ分子は、末端修復プロセスに供される。そのようなプロセスは、血漿ＤＮＡを平滑末端ＤＮＡに変換し、続いて、Ａテールを付加する。図９６に示されるように、各々がモータータンパク質を担持する配列アダプター（すなわち、モーターアダプター）は、血漿ＤＮＡ分子のいずれかの末端に連結される。配列決定のプロセスは、モータータンパク質が二本鎖ＤＮＡをほどくと開始し、第１の鎖がナノポアを通過することを可能にする。ＤＮＡ鎖がナノポアを通過するとき、センサーは、配列コンテキストおよび関連する塩基修飾（１Ｄリードと呼ばれる）に応じて、経時的なイオン電流の変化（ｐＡ）を測定する。他の実施形態において、ヘアピン配列アダプターが、第１の鎖および相補鎖を一緒に共有結合的に連結するために使用される。配列決定中に、二本鎖ＤＮＡ分子の鎖が配列決定され、続いて相補鎖（１Ｄ^２または２Ｄリードと呼ばれる）が配列決定され、これにより、配列決定の精度が改善する可能性があり得る。生の電流信号は、塩基呼び出しおよび塩基修飾分析に使用される。他の実施形態において、塩基呼び出しおよび塩基修飾分析は、例えば、リカレントニューラルネットワーク（ＲＮＮ）または隠れマルコフモデル（ＨＭＭ）であるがこれらに限定されない機械学習アプローチによって実行される。本開示において、ナノポア配列決定を使用して、分子カウント、塩基組成、分子サイズ、末端モチーフ、および塩基修飾を含むがこれらに限定されない、血漿ＤＮＡ分子の特性を特徴付けるための方法を提示した。

例示目的で、ナノポア配列決定（ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ）を使用して、３８週の在胎期間の妊娠中の女性の３つの母体血漿ＤＮＡ試料（Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９）を配列決定した。４ｍＬの母体血漿から抽出された血漿ＤＮＡを、ＬｉｇａｔｉｏｎＳｅｑｕｅｎｃｉｎｇＫｉｔ（ＯｘｆｏｒｄＮａｎｏｐｏｒｅ）を使用してライブラリ調製に供した。簡潔に、ＤＮＡをＦＦＰＥＲｅｐａｉｒＭｉｘ（ＮＥＢ）で修復し、次いで、ＮＥＢＮｅｘｔＥｎｄＰｒｅｐモジュール（ＮＥＢ）で末端修復およびＡテール化した。次いで、アダプターミックスを修復されたＤＮＡに添加し、平滑／ＴＡマスターミックスで連結した。ＡＭＰｕｒｅＸＰビーズ（Ｂｅｃｋｍａｎ）で浄化した後、アダプターが連結されたライブラリを配列決定緩衝液およびローディングビーズと混合し、ＰｒｏｍｅｔｈＩＯＮＲ９フローセル上に装填した。フローセルを、ＰｒｏｍｅｔｈＩＯＮベータデバイス（ＯｘｆｏｒｄＮａｎｏｐｏｒｅ）上で６４時間配列決定した。

Ａ．アラインメント
配列決定されたリードを、Ｍｉｎｉｍａｐ２（ＬｉＨ，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１８；３４（１８）：３０９４－３１００）を使用してヒト参照ゲノム（ｈｇ１９）にアラインメントした。いくつかの実施形態において、ＢＬＡＳＲ（ＭａｒｋＪＣｈａｉｓｓｏｎｅｔａｌ，ＢＭＣＢｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１２；１３：２３８）、ＢＬＡＳＴ（ＡｌｔｓｃｈｕｌＳＦｅｔａｌ，ＪＭｏｌＢｉｏｌ．１９９０；２１５（３）：４０３－４１０）、ＢＬＡＴ（ＫｅｎｔＷＪ，ＧｅｎｏｍｅＲｅｓ．２００２；１２（４）：６５６－６６４）、ＢＷＡ（ＬｉＨｅｔａｌ，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０；２６（５）：５８９－５９５）、ＮＧＭＬＲ（ＳｅｄｌａｚｅｃｋＦＪｅｔａｌ，ＮａｔＭｅｔｈｏｄｓ．２０１８；１５（６）：４６１－４６８）、およびＬＡＳＴ（ＫｉｅｌｂａｓａＳＭｅｔａｌ，ＧｅｎｏｍｅＲｅｓ．２０１１；２１（３）：４８７－４９３）が、配列決定されたリードを参照ゲノムにアラインメントするために使用され得る。試料Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９について、それぞれ１，１３１万個、１，２３０万個、および２，１２８万個の配列決定された分子を取得した。その間で、マッピングされた断片の数は、それぞれ３６７万個、２６３万個、および４３３万個であった。

Ｂ．サイズおよびメチル化
ナノポア配列決定によって決定された血漿ＤＮＡ分子のヌクレオチド数を、そのＤＮＡ分子のサイズを推定するために使用した。ＤＮＡ分子の電流信号は、塩基修飾を決定するために使用され得る。実施形態において、各ＣｐＧ部位についてのメチル化状態を、オープンソースソフトウェアＮａｎｏｐｏｌｉｓｈ（Ｓｉｍｐｓｏｎｅｔａｌ，ＮａｔＭｅｔｈｏｄｓ．２０１７；１４：４０７－４１０）によって決定した。別の実施形態において、メチル化状態は、ＤｅｅｐＭｏｄ（Ｌｉｕｅｔａｌ，ＮａｔＣｏｍｍｕｎ．２０１９；１０：２４４９）、Ｔｏｍｏ（Ｓｔｏｉｂｅｒｅｔａｌ，ＢｉｏＲｘｉｖ．２０１７：ｐ．０９４６７２）、ＤｅｅｐＳｉｇｎａｌ（Ｎｉｅｔａｌ，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１９；３５：４５８６－４５９５）、Ｇｕｐｐｙ（ｇｉｔｈｕｂ．ｃｏｍ／ｎａｎｏｐｏｒｅｔｅｃｈ）、Ｍｅｇａｌｏｄｏｎ（ｇｉｔｈｕｂ．ｃｏｍ／ｎａｎｏｐｏｒｅｔｅｃｈ／ｍｅｇａｌｏｄｏｎ）などを含むがこれらに限定されない、他のソフトウェアを使用することによって決定され得る。

図９７は、特定のサイズ範囲内の血漿のパーセンテージおよびそれらの対応するメチル化レベルの表である。３つの試料：Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９が示される。１列目は、断片サイズを示す。２列目は、その断片サイズの断片の数を示す。３列目は、断片サイズの頻度を示す。４列目は、断片サイズのメチル化ＣｐＧ部位の数を示す。５列目は、断片サイズの非メチル化ＣｐＧ部位の数を示す。６列目は、メチル化レベルをパーセンテージとして示す。

図９７に示されるように、５００ｂｐ以上のサイズを有するＤＮＡ分子の割合は、試料Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９について、それぞれ１６．６％、７．６％、および１２．６％であった。５００ｂｐ以上のサイズを有するＤＮＡ分子の割合は、Ｉｌｌｕｍｉｎａ配列決定によって生成されたデータ（０．２％）よりもはるかに高かった。５００ｂｐ以上のサイズを有するＤＮＡ分子のメチル化レベルは、試料Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９について、それぞれ６４．１２％、６５．０５％、および６３．３０％であった。さらに、メチル化レベルは、より多くの長い血漿ＤＮＡを有する集団において増加した。一例として、試料Ｍ１２９７０について、メチル化レベルは、２０００ｂｐ以上のサイズを有するそれらの分子において７０．７％であり、これは、５００ｂｐ以上のサイズを有するものと比較してメチル化レベルの１０．３％の増加に相当した。より多くの長いＤＮＡを有する集団における同様の増加傾向が、試料Ｍ１２９８５およびＭ１２９６９でも観察された。異なるサイズを有する血漿ＤＮＡ分子は、老化、アポトーシス、壊死、活発な分泌などであるがこれらに限定されない、無細胞ＤＮＡを血液循環に提供する異なる経路を反映する。長いＤＮＡ分子のメチル化状態により、それらの長いＤＮＡ分子の起源組織を推測することがさらに可能になる。したがって、長いＤＮＡ分子の断片化パターンおよびメチル化パターンの組み合わせ分析により、特定の臓器の老化、アポトーシス、壊死、および活発な分泌の相対比率を推測することが可能になる。異なる経路による無細胞ＤＮＡ生成の相対比率は、妊娠、子癇前症、早産、子宮内胎児発育遅延などの根本的な病態生理学的状態を反映する。

図９８は、異なるサイズにわたるサイズ分布およびメチル化パターンのグラフである。サイズは、ｘ軸上に示される。周波数は、左のｙ軸上に示される。メチル化レベルは、右のｙ軸上に示される。サイズ分布（頻度）データは、黒色の線として示される。示されるメチル化レベルは、黄色の線として示される。

図９８は、異なる断片サイズにわたるサイズ分布およびメチル化レベルを示す。サイズ分布は、１６４ｂｐ、３１３ｂｐ、および４７３ｂｐに複数のピークを有し、平均間隔は１５４ｂｐであった。サイズ分布のそのようなパターンは、ヌクレアーゼ切断されたヌクレオソームとよく似ており、血漿ＤＮＡ断片化の非ランダムプロセスがナノポア配列決定によって特定され得ることを示唆している。Ｉｌｌｕｍｉｎａ配列決定データに基づく１６６ｂｐに主要なピークがある血漿ＤＮＡサイズパターンとは対照的に、主要なピークは、３８０ｂｐにあった。これらのデータは、ナノポア配列決定がより多くの長いＤＮＡ断片を濃縮することを示した。血漿ＤＮＡのナノポア配列決定のそのような特徴は、ショートリード配列決定技術によって解決が困難であったそれらのバリアントを検出するのに特に有用である。実施形態において、ナノポア配列決定は、トリヌクレオチド反復伸長を分析するために有用である。トリヌクレオチド反復の数は、脆弱Ｘ症候群、ハンチントン病、脊髄小脳失調症、筋強直性ジストロフィー、およびフリードライヒ運動失調症などのトリヌクレオチド反復障害の進行、重症度、および発症年齢を予測するために使用される。図９８は、異なるサイズに応じて変化するメチル化レベルも示す。一連のメチル化ピーク値は、サイズ分布のピークと一致した。

Ｃ．胎児および母体ＤＮＡ
ｉＳｃａｎプラットフォーム（Ｉｌｌｕｍｉｎａ）を使用して母体バフィーコートおよび胎盤から抽出されたＤＮＡの遺伝子型を決定することによって、母親がホモ接合（ＡＡ）であり、胎児がヘテロ接合（ＡＢ）であった２０４，４１０の中央値の有益なＳＮＰ（範囲：１９９，４２０～２０５，５９７）を特定し、これを、胎児特異的対立遺伝子（Ｂ）および共有対立遺伝子（Ａ）を決定するために使用した。

図９９は、ナノポア配列決定を使用して決定された胎児ＤＮＡ画分の表である。１列目は、試料識別子を示す。２列目は、共有対立遺伝子を担持する分子の数を示す。３列目は、胎児特異的対立遺伝子を担持する分子の数を示す。４列目は、３列目の値に２を掛け、２列目および３列目の合計で割ったものによって計算された胎児ＤＮＡ画分を示す。図９９に示されるように、試料Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９について、それぞれ、共有対立遺伝子を担持する８４，９１１個、５２，０５９個、および９５，２７３個の分子、ならびに胎児特異的対立遺伝子を担持する１７，７７６個、７，３８５個、および１７，００７個の分子を特定した。胎児ＤＮＡ画分は、試料Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９について、それぞれ３４．６％、２４．９％、および３０．３％であると決定された。さらに、母親がヘテロ接合体（ＡＢ）であり、胎児がホモ接合体（ＡＡ）であった２１２，３３０の中央値の有益なＳＮＰ（範囲：２１０，４１１～２１４，７４４）を特定し、これを、母体特異的対立遺伝子（Ｂ）を決定するために使用した。試料Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９について、それぞれ、共有対立遺伝子を担持する６５，３４９個、３４，０１７個、および６５，４８１個の分子、ならびに母体特異的対立遺伝子を担持する４３，５９４個、２６，７０４個、および４８，３３７個の分子を特定した。

図１００は、胎児特異的ＤＮＡ分子と母体特異的ＤＮＡ分子との間のメチル化レベルの表である。１列目は、試料識別子を示す。２列目、３列目、および４列目は、胎児特異的ＤＮＡについての結果を示す。５列目、６列目、および７列目は、母体特異的ＤＮＡについての結果を示す。２列目および５列目は、メチル化ＣｐＧ部位の数を示す。３列目および６列目は、非メチル化ＣｐＧ部位の数を示す。４列目および７列目は、メチル化部位のパーセンテージに基づくメチル化レベルを示す。

本開示の実施形態によると、各胎児特異的ＤＮＡ分子についてのメチル化パターンを決定した。図１００に示されるように、メチル化されていると決定された、配列決定されたＣｐＧ部位の割合（すなわち、全体的なメチル化レベル）は、試料Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９について、それぞれ６２．４３％、６２．３９％、および６１．４８％であった。胎児特異的ＤＮＡのそのような全体的なメチル化レベルは、母体特異的ＤＮＡの対応物よりも平均して８％低かった。これらの結果は、ナノポア配列決定の結果を使用した本開示の実施形態に従って、胎児ＤＮＡ分子と母体ＤＮＡ分子との間の異なるメチル化パターンに基づいて、胎児ＤＮＡ分子と母体ＤＮＡ分子とを区別することができることを示唆した。

図１０１は、胎児および母体ＤＮＡ分子についての特定のサイズ範囲内の血漿ＤＮＡ分子のパーセンテージおよびそれらの対応するメチル化レベルの表である。３つの試料：Ｍ１２９７０、Ｍ１２９８５、およびＭ１２９６９が示される。１列目は、断片サイズを示す。２列目～６列目は、胎児特異的ＤＮＡについての結果を示す。７列目～１１列目は、母体特異的ＤＮＡについての結果を示す。２列目および７列目は、その断片サイズの断片の数を示す。３列目および８列目は、断片サイズの頻度を示す。４列目および９列目は、断片サイズのメチル化ＣｐＧ部位の数を示す。５列目および１０列目は、断片サイズの非メチル化ＣｐＧ部位の数を示す。６列目および１１列目は、メチル化レベルをパーセンテージとして示す。

図１０１に見られるように、胎児特異的および母体特異的ＤＮＡ分子の特性を、５００ｂｐ以上、６００ｂｐ以上、１０００ｂｐ以上、および２０００ｂｐ以上を含むがこれらに限定されない異なるサイズ範囲で分析した。母体ＤＮＡ分子と比較して、サイズが１ｋｂを超える比較的より小さい割合の胎児ＤＮＡ分子が得られた。しかしながら、妊娠中の女性の血漿中のそのような長い胎児ＤＮＡ分子（例えば、１０００ｂｐ以上）の量（範囲：４．９％～９．３％）は、Ｉｌｌｕｍｉｎａ配列決定による期待値（０．２％未満）よりも有意に高かった。そのような長い胎児ＤＮＡ断片は、Ｉｌｌｕｍｉｎａ配列決定プラットフォーム（例えば、ＭｉＳｅｑ、ＮｅｘｔＳｅｑ、ＨｉＳｅｑ、ＮｏｖａＳｅｑなどであるが、これらに限定されない）などの従来のショートリード配列決定技術では、ＤＮＡライブラリの挿入サイズが５５０ｂｐ未満に制限されているため、容易に明らかにされない（例えば、ＩｌｌｕｍｉｎａＮｅｘｔＳｅｑシステム、ｓｕｐｐｏｒｔ．ｉｌｌｕｍｉｎａ．ｃｏｍ／ｓｅｑｕｅｎｃｉｎｇ／ｓｅｑｕｅｎｃｉｎｇ＿ｉｎｓｔｒｕｍｅｎｔｓ／ｎｅｘｔｓｅｑ－５５０／ｑｕｅｓｔｉｏｎｓ．ｈｔｍｌ）。実施形態において、サイズおよびメチル化プロファイルを含むがこれらに限定されない、長い胎児ＤＮＡ断片および母体ＤＮＡ断片の分析は、異なる疾患を評価するための新しいツールを提供し得る。例えば、ＤＮＡＳＥ１Ｌ３欠損症は、単一遺伝子全身性エリテマトーデスを引き起こす。そのようなＤＮＡＳＥ１Ｌ３欠損症は、より多くの長いＤＮＡ分子の生成をもたらす（Ｃｈａｎｅｔａｌ，ＡｍＪＨｕｍＧｅｎｅｔ．２０２０；１０７：８８２－８９４）。したがって、本明細書に記載の実施形態は、それらの長いＤＮＡ分子の特性を分析することによって、妊娠中のそれらの患者の疾患重症度を監視し、胎児が同じ状態に罹患するかどうかを評価するのに特に高感度である。

図１０２Ａおよび１０２Ｂは、ナノポア配列決定によって決定された胎児および母体ＤＮＡ分子のサイズ分布のグラフである。断片のサイズは、ｘ軸上に示される。頻度は、図１０２Ａにおいて線形スケールで、図１０２Ｂにおいて対数スケールで、ｙ軸上に示される。母体ＤＮＡは、青色の線で示される。胎児ＤＮＡは、赤色の線で示される。

図１０２Ａおよび１０２Ｂに示されるように、母体および胎児の両方のＤＮＡ分子が、Ｉｌｌｕｍｉｎａショートリード配列決定プラットフォームで以前に報告されたもの（Ｌｏｅｔａｌ，ＳｃｉＴｒａｎｓｌＭｅｄ．２０２０；２：６１ｒａ９１）よりも多くの長いＤＮＡ分子を含有した。これらの結果は、ナノポア配列決定による血漿ＤＮＡの分析が、これまで評価されていなかった無細胞ＤＮＡの新しい特性のセットを明らかにしたことを示唆した。そのような特性は、非侵襲的出生前検査で使用され得る。

Ｄ．胎児および母体ＤＮＡ分子の決定のための精度の改善
ナノポア配列決定は、より高い配列決定誤差（約５％～４０％）を伴うため（Ｇｏｏｄｗｉｎｅｔａｌ，ＧｅｎｏｍｅＲｅｓ．２０１５；２５：１７５０－１７５６）、ＳＮＰ遺伝子型情報に基づく胎児および母体のＤＮＡ分子の不正確な分類を引き起こす可能性がある。実施形態において、２つ以上の有益なＳＮＰを使用して、断片をスコアリングし、その断片が胎盤に由来するかどうかを決定することができる。例えば、母親がホモ接合（ＡＡ）であり、胎児がヘテロ接合（ＡＢ）であった２つの有益なＳＮＰを担持する断片について、２つの有益なＳＮＰの両方が、そのような断片が胎児に由来するという結論を支持した場合のみ、それが胎児起源であると決定される。同様に、２つの有益なＳＮＰを担持する断片について、２つの有益なＳＮＰの両方が、そのような断片が母親に由来することを支持した場合のみ、それが母体起源であると決定される。

図１０３は、単一の有益なＳＮＰおよび２つの有益なＳＮＰに基づく、胎児ＤＮＡ分子と母体ＤＮＡ分子との間のメチル化レベルの差を示すグラフである。ｙ軸は、胎児ＤＮＡ分子と母体ＤＮＡ分子との間のメチル化レベルの差をパーセンテージとして示す。ｘ軸は、メチル化レベルの差について、単一の有益なＳＮＰを使用する場合および２つの有益なＳＮＰを使用する場合を示す。

図１０３に示されるように、胎児ＤＮＡ分子と母体ＤＮＡ分子とを区別するために２つの有益なＳＮＰを使用すると、胎児ＤＮＡ分子と母体ＤＮＡ分子との間のメチル化レベルの差は、１つの有益なＳＮＰに基づく結果よりもはるかに大きかった。胎児特異的分子と母体特異的分子との間のメチル化レベルの平均差は、５．４％から１１．３％に増加し、１０９％の増分に相当する。これらの結果は、複数のＳＮＰを使用すると、胎児特異的ＤＮＡ分子と母体特異的ＤＮＡ分子とを区別するための精度が大幅に改善されることを示唆した。

図１０４は、胎児ＤＮＡ分子と母体ＤＮＡ分子との間のメチル化レベルの差の表である。１列目は、試料識別子を示す。２列目、３列目、および４列目は、胎児特異的ＤＮＡについての結果を示す。５列目、６列目、および７列目は、母体特異的ＤＮＡについての結果を示す。２列目および５列目は、メチル化ＣｐＧ部位の数を示す。３列目および６列目は、非メチル化ＣｐＧ部位の数を示す。４列目および７列目は、メチル化部位のパーセンテージに基づくメチル化レベルを示す。

図１０４に見られるように、胎児特異的ＤＮＡのそのような全体的なメチル化レベルは、母体特異的ＤＮＡの対応物よりも平均して１６．３％低かった。実施形態において、メチル化シグナルの使用は、次に、胎児および母体ＤＮＡ分類の精度を強化する。例えば、推定上の胎児特異的対立遺伝子を担持する断片について、その断片のメチル化レベルが閾値よりも低いと決定された場合、そのような断片は、胎児に由来する尤度がより高くなる。そのような閾値は、６０％、５０％、４０％、３０％、２０％、１０％などであり得るが、これらに限定されない。推定上の母体特異的対立遺伝子を担持する断片について、その断片のメチル化レベルが閾値よりも高いと決定された場合、そのような断片は、母親に由来する尤度がより高くなる。そのような閾値は、９０％、８０％、７０％、６０％、５０％、４０％などであり得るが、これらに限定されない。

いくつかの他の実施形態において、有益なＳＮＰの総数は、少なくとも、例えば、３、４、５、６、７、８、９、１０などである必要があるが、これらに限定されない。胎児に由来する断片を支持する有益なＳＮＰの数は、少なくとも、例えば、３、４、５、６、７、８、９、１０などである必要があるが、これらに限定されない。母親に由来する断片を支持する有益なＳＮＰの数は、少なくとも、例えば、３、４、５、６、７、８、９、１０などである必要があるが、これらに限定されない。実施形態において、胎児に由来する断片を支持する有益なＳＮＰのパーセンテージは、特定の閾値、例えば、１％、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％に達する必要がある。母親に由来する断片を支持する有益なＳＮＰのパーセンテージは、特定の閾値、例えば、１％、５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％に達する必要がある。

他のいくつかの実施形態において、血漿ＤＮＡ分子を円形化し、続いてローリングサークル増幅を行うことができる。増幅されたＤＮＡは、ナノポア配列決定によって配列決定され得、したがって、鋳型ＤＮＡ情報は、複数回配列決定され得る。コンセンサス配列は、繰り返し配列決定された情報から推定され得る。

ＶＩＩＩ．例示的なシステム
図１０５は、本開示の実施形態による、測定システム１０５００を例示する。示されるようなシステムは、アッセイデバイス１０５１０内に無細胞ＤＮＡ分子などの試料１０５０５を含み、アッセイ１０５０８は、試料１０５０５に対して実施され得る。例えば、試料１０５０５をアッセイ１０５０８の試薬と接触させて、物理的特性１０５１５の信号を提供することができる。アッセイデバイスの一例は、アッセイのプローブおよび／もしくはプライマー、または液滴が（アッセイを含む液滴とともに）移動するチューブを含む、フローセルであり得る。試料からの物理的特性１０５１５（例えば、蛍光強度、電圧、または電流）は、検出器１０５２０によって検出される。検出器１０５２０は、データ信号を構成するデータ点を取得するために、間隔をおいて（例えば、周期的な間隔）測定し得る。一実施形態において、アナログ－デジタル変換器は、検出器からのアナログ信号をデジタル形態へと複数回変換する。アッセイデバイス１０５１０および検出器１０５２０は、アッセイシステム、例えば、本明細書に記載の実施形態に従って配列決定を実施する配列決定システムを形成し得る。データ信号１０５２５は、検出器１０５２０から論理システム１０５３０へ送信される。一例として、データ信号１０５２５を使用して、ＤＮＡ分子の参照ゲノムにおける配列および／または位置を決定することができる。データ信号１０５２５は、同時に行われる様々な測定、例えば、試料１０５０５の異なる分子について異なる色の蛍光染料または異なる電気信号を含むことができ、したがって、データ信号１０５２５は、複数の信号に対応することができる。データ信号１０５２５は、ローカルメモリ１０５３５、外部メモリ１０５４０、またはストレージデバイス１０５４５に記憶され得る。

論理システム１０５３０は、コンピュータシステム、ＡＳＩＣ、マイクロプロセッサ、グラフィックスプロセッシングユニット（ＧＰＵ）などであり得るか、またはそれらを含み得る。それはまた、ディスプレイ（例えば、モニタ、ＬＥＤディスプレイなど）、およびユーザ入力デバイス（例えば、マウス、キーボード、ボタンなど）を含み得るか、またはそれらに連結され得る。論理システム１０５３０および他の構成要素は、スタンドアローンもしくはネットワーク接続されたコンピュータシステムの一部であり得るか、または検出器１０５２０および／またはアッセイデバイス１０５１０を含むデバイス（例えば、配列決定デバイス）に直接取り付けられ得るか、もしくは組み込まれ得る。論理システム１０５３０はまた、プロセッサ１０５５０において実行するソフトウェアを含み得る。論理システム１０５３０は、本明細書に説明される方法のいずれかを実施するようにシステム１０５００を制御するための命令を保存するコンピュータ可読媒体を含み得る。例えば、論理システム１０５３０は、配列決定または他の物理的操作が実施されるように、アッセイデバイス１０５１０を含むシステムにコマンドを提供し得る。そのような物理的操作は、特定の順序で、例えば、試薬が特定の順序で追加および除去されるように、実施され得る。そのような物理的操作は、試料を取得してアッセイを実施するために使用され得るように、例えば、ロボットアームを含む、ロボットシステムによって実施され得る。

測定システム１０５００はまた、対象に治療を提供することができる治療デバイス１０５６０を含み得る。治療デバイス１０５６０は、治療を決定し得る、および／または治療を実施するために使用され得る。そのような治療の例には、手術、放射線療法、化学療法、免疫療法、標的療法、ホルモン療法、および幹細胞移植が含まれ得る。論理システム１０５３０は、例えば、本明細書に記載の方法の結果を提供するために、治療デバイス１０５６０に接続され得る。治療デバイスは、画像化デバイスおよびユーザ入力などの他のデバイスからの入力を受け取り得る（例えば、ロボットシステムの制御など、治療を制御するために）。

本明細書で言及されるコンピュータシステムのうちのいずれも、任意の好適な数のサブシステムを利用し得る。コンピュータシステム１０においてこのようなサブシステムの例を図１０６に示す。いくつかの実施形態において、コンピュータシステムは、単一のコンピュータ装置を含み、サブシステムは、コンピュータ装置の構成要素であり得る。他の実施形態において、コンピュータシステムは、各々がサブシステムであり、内部構成要素を備える、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップコンピュータおよびラップトップコンピュータ、タブレット、携帯電話、ならびに他の携帯装置を含み得る。

図１０６に示されるサブシステムは、システムバス７５を介して相互接続される。プリンタ７４、キーボード７８、記憶デバイス７９、ディスプレイアダプター８２に接続されたモニタ７６（例えば、ＬＥＤなどのディスプレイスクリーン）、およびその他などの追加のサブシステムが示されている。Ｉ／Ｏコントローラ７１に結合する周辺機器および入力／出力（Ｉ／Ｏ）デバイスは、入力／出力（Ｉ／Ｏ）ポート７７（例えば、ＵＳＢ、ＦｉｒｅＷｉｒｅ（登録商標））などの当技術分野において既知である任意の数の手段によって、コンピュータシステムに接続され得る。例えば、Ｉ／Ｏポート７７または外部インターフェース８１（例えば、Ｅｔｈｅｒｎｅｔ、Ｗｉ－Ｆｉなど）を使用して、Ｉｎｔｅｒｎｅｔなどの広域ネットワーク、マウス入力デバイス、またはスキャナに、コンピュータシステム１０を接続し得る。システムバス７５を介した相互接続は、中央プロセッサ７３が、各サブシステムと通信し、システムメモリ７２または記憶デバイス７９（例えば、ハードドライブまたは光ディスクなどの固定ディスク）からの複数の命令の実行、およびサブシステム間の情報交換を制御することを可能にする。システムメモリ７２および／または記憶デバイス７９は、コンピュータ可読媒体を具現化し得る。別のサブシステムは、カメラ、マイクロホン、および加速度計、ならびにこれらに類するものなどのデータ収集デバイス８５である。本明細書に言及されるデータのうちのいずれも、１つの構成要素から別の構成要素に出力されてもよく、ユーザに対して出力されてもよい。

コンピュータシステムは、例えば、外部インターフェース８１によって、内部インターフェースによって、または１つの構成要素から別の構成要素に接続され得る、もしくは取り外され得る記憶デバイスを介して、ともに接続された、複数の同じ構成要素またはサブシステムを含み得る。いくつかの実施形態において、コンピュータシステム、サブシステム、または装置は、ネットワーク上で通信し得る。そのような例において、１つのコンピュータをクライアント、別のコンピュータをサーバとみなすことができ、各々が、同じコンピュータシステムの一部であり得る。クライアントおよびサーバは各々、複数のシステム、サブシステム、または構成要素を含むことができる。

実施形態の態様は、制御ロジックの形態で、ハードウェア回路（例えば、特定用途向け集積回路もしくはフィールドプログラマブルゲートアレイ）を使用して、および／またはモジュール式もしくは集積様態で汎用プログラマブルプロセッサを有するコンピュータソフトウェアを使用して、実装され得る。本明細書で使用される場合、プロセッサは、シングルコアプロセッサ、同じ集積チップ上のマルチコアプロセッサ、または単一の回路基板もしくはネットワーク化された上の複数の処理ユニット、ならびに専用のハードウェアを含み得る。本開示および本明細書に提供される教示に基づいて、当業者は、ハードウェア、ならびにハードウェアおよびソフトウェアの組み合わせを使用して、本開示の実施形態を実装するための他の手段および／または方法を認識および理解するであろう。

本出願で説明されるソフトウェアコンポーネントまたは関数のうちのいずれも、例えば、Ｊａｖａ（登録商標）、Ｃ、Ｃ＋＋、Ｃ＃、Ｏｂｊｅｃｔｉｖｅ－Ｃ、Ｓｗｉｆｔなどの任意の好適なコンピュータ言語、または、例えば、従来の技術もしくは物体指向の技術を使用するＰｅｒｌもしくはＰｙｔｈｏｎなどのスクリプト言語を使用する、処理デバイスによって実行されるソフトウェアコードとして実装され得る。ソフトウェアコードは、記憶および／または伝送のためのコンピュータ可読媒体上に一連の命令またはコマンドとして記憶され得る。好適な非一時的コンピュータ可読媒体は、ランダムアクセスメモリ（ＲＡＭ）、リード専用メモリ（ＲＯＭ）、磁気媒体（ハードドライブもしくはフロッピーディスク等）、または光学媒体（コンパクトディスク（ＣＤ）もしくはＤＶＤ（デジタル多用途ディスク）等）、またはブルーレイディスクおよびフラッシュメモリ等を含み得る。コンピュータ可読媒体は、そのようなストレージまたは伝送デバイスの任意の組み合わせであってもよい。

そのようなプログラムはまた、コード化され、インターネットを含む様々なプロトコルに従う有線ネットワーク、光ネットワーク、および／または無線ネットワークを介した伝送に適合した搬送波信号を使用して伝送され得る。したがって、コンピュータ可読媒体は、そのようなプログラムでコード化されたデータ信号を使用して作成され得る。プログラムコードでコード化されたコンピュータ可読媒体は、互換性のあるデバイスでパッケージ化されてもよく、または（例えば、インターネットダウンロードを介して）他のデバイスとは別個に提供され得る。任意のそのようなコンピュータ可読媒体は、単一のコンピュータ製品（例えば、ハードドライブ、ＣＤ、もしくはコンピュータシステム全体）上もしくはその内部に存在し得、システムまたはネットワーク内の異なるコンピュータ製品上もしくはその内部に存在し得る。コンピュータシステムは、モニタ、プリンタ、または本明細書に記載の結果のうちのいずれかをユーザに提供するための他の好適なディスプレイを含み得る。

本明細書記載の方法のうちのいずれも、ステップを実施するように構成することができる１つ以上のプロセッサを含むコンピュータシステムを用いて全体的または部分的に実施され得る。したがって、実施形態は、本明細書に説明される方法のうちのいずれかのステップを実施するように構成されたコンピュータシステムを対象とし得、潜在的には異なるコンポーネントがそれぞれのステップまたはそれぞれのステップの群を実施する。番号付けされたステップとして提示されるが、本明細書の方法のステップは、同時にもしくは異なる時間に、または論理的に可能である異なる順序で実施され得る。加えて、これらのステップの部分は、他の方法からの他のステップの部分と併用され得る。また、あるステップのすべてまたは部分は、任意選択的であり得る。加えて、本方法のうちのいずれかの任意のステップは、これらのステップを実行するためのシステムのモジュール、ユニット、回路、または他の手段で実行することができる。

本開示を読むと当業者には明らかになるように、本明細書に記載および図示される個々の実施形態の各々は、本開示の範囲または趣旨から逸脱することなく、他のいくつかの実施形態のいずれかの特徴から容易に分離され得るか、またはそれと組み合わされ得る、別個の構成要素および特徴を有する。

本開示の例示的な実施形態の上の説明は、例示および説明の目的で提示されており、本開示の実施形態の作製および使用方法の完全な開示および説明を当業者に提供するために記載される。網羅的であること、もしくは本開示を記載された正確な形式に限定することを意図するものではなく、また、実験が実施されるすべてまたは唯一の実験であることを表すことを意図するものでもない。本開示は、理解を明確にする目的で例示および実施例によってある程度詳細に説明されてきたが、本開示の教示に照らして、添付の特許請求の範囲の趣旨または範囲から逸脱することなく、特定の変更および修正が本開示に行われ得ることが、当業者には容易に明らかである。

したがって、上記は単に、本発明の原理を例示しているにすぎない。当業者が、本明細書で明示的に説明または図示されていないが、本発明の原理を具現化し、その趣旨および範囲内に含まれる様々な配置を考案することができることが理解されるであろう。さらに、本明細書に列挙されるすべての実施例および条件付き言語は、主に、読者が、本開示の原理がそのような具体的に列挙された実施例および条件に限定されないことを理解するのを助けることを意図している。さらに、本発明の原理、態様、および実施形態、ならびにその具体的な実施例を列挙する本明細書のすべての記述は、その構造的および機能的等価物の両方を包含することを意図している。さらに、そのような等価物には、現在知られている等価物および将来開発される等価物の両方、すなわち、構造に関係なく同じ機能を実施する開発された任意の要素が含まれることが意図されている。したがって、本発明の範囲は、本明細書で図示および説明される例示的な実施形態に限定されることを意図するものではない。むしろ、本発明の範囲および趣旨は、添付の特許請求の範囲によって具現化される。

「ａ」、「ａｎ」、または「ｔｈｅ」の記述は、それとは反対に具体的に示されない限り、「１つ以上」を意味することが意図される。「または」の使用は、それとは反対に具体的に示されない限り、「排他的なまたは」ではなく「包括的なまたは」を意味することが意図される。「第１」の構成要素への言及は、第２の構成要素が提供されることを必ずしも必要としない。さらに、「第１」または「第２」の構成要素への言及は、明示的に述べられていない限り、言及される構成要素を特定の場所に限定するものではない。「～に基づいて」という用語は、「少なくとも一部に基づいて」を意味することを意図している。

請求項は、任意選択的であり得るいかなる要素も除外するように起草され得る。したがって、この記述は、請求項要素の列挙に関連する「単独で」、「のみ」などの排他的な用語の使用、または「否定的な」限定の使用についての先行詞として機能することを意図している。

本明細書で言及されるすべての特許、特許出願、刊行物、および説明は、あたかも各個々の刊行物または特許が参照により組み込まれることが具体的かつ個別に示されているかのように、あらゆる目的でそれらの全体が参照により本明細書に組み込まれ、かつ刊行物が引用されているものと関連する方法および／または材料を開示および説明するために、参照により本明細書に組み込まれる。いかなるものも、先行技術であるとは認められていない。

Claims

胎児を妊娠中の女性から取得された生物学的試料を分析する方法であって、前記女性が、第１の染色体領域内に第１のハプロタイプおよび第２のハプロタイプを有し、前記生物学的試料が、前記胎児および前記女性からの複数の無細胞ＤＮＡ分子を含み、前記方法が、
前記複数の無細胞ＤＮＡ分子に対応するリードを受け取ることと、
前記複数の無細胞ＤＮＡ分子のサイズを測定することと、
前記複数の無細胞ＤＮＡ分子からの無細胞ＤＮＡ分子の第１のセットを、カットオフ値以上のサイズを有するものとして特定することと、ここで、前記カットオフ値は少なくとも５００ｎｔである、
前記無細胞ＤＮＡ分子の第１のセットに対応するリードから、前記第１のハプロタイプの配列および前記第２のハプロタイプの配列を決定することと、
前記複数の無細胞ＤＮＡ分子からの無細胞ＤＮＡ分子の第２のセットを、前記第１のハプロタイプの前記配列にアラインメントすることであって、前記無細胞ＤＮＡ分子の第２のセットが、前記カットオフ値よりも小さいサイズを有する、アラインメントすることと、
前記複数の無細胞ＤＮＡ分子からの無細胞ＤＮＡ分子の第３のセットを、前記第２のハプロタイプの前記配列にアラインメントすることであって、前記無細胞ＤＮＡ分子の第３のセットが、前記カットオフ値よりも小さいサイズを有する、アラインメントすることと、
前記無細胞ＤＮＡ分子の第２のセットを使用して、パラメータの第１の値を測定することと、
前記無細胞ＤＮＡ分子の第３のセットを使用して、前記パラメータの第２の値を測定することと、
前記第１の値を前記第２の値と比較することと、
前記第１の値と前記第２の値との前記比較に基づいて、前記胎児が前記第１のハプロタイプを受け継ぐ尤度を決定することと、を含む、方法。
前記カットオフ値が、６００ｎｔである、請求項１に記載の方法。
前記カットオフ値が、１ｋｎｔである、請求項１に記載の方法。
前記無細胞ＤＮＡ分子の第１のセットに対応する前記リードから、前記第１のハプロタイプの前記配列および前記第２のハプロタイプの前記配列を決定することが、
前記無細胞ＤＮＡ分子の第１のセットに対応するリードを参照ゲノムにアラインメントすることを含む、請求項１に記載の方法。
前記無細胞ＤＮＡ分子の第１のセットに対応する前記リードから、前記第１のハプロタイプの前記配列および前記第２のハプロタイプの前記配列を決定することが、
前記リードの第１のサブセットを前記リードの第２のサブセットにアラインメントして、前記リード内の遺伝子座において異なる対立遺伝子を特定することと、
前記リードの前記第１のサブセットが前記遺伝子座に第１の対立遺伝子を有すると決定することと、
前記リードの前記第２のサブセットが前記遺伝子座に第２の対立遺伝子を有すると決定することと、
前記リードの前記第１のサブセットが前記第１のハプロタイプに対応すると決定することと、
前記リードの前記第２のサブセットが前記第２のハプロタイプに対応すると決定することと、を含む、請求項１に記載の方法。
前記パラメータが、無細胞ＤＮＡ分子のカウント、無細胞ＤＮＡ分子のサイズプロファイル、または無細胞ＤＮＡ分子のメチル化レベルである、請求項１に記載の方法。
前記パラメータが、無細胞ＤＮＡ分子の前記カウントであり、
前記方法は、
前記第１の値が前記第２の値よりも大きい場合、前記胎児が前記第２のハプロタイプよりも前記第１のハプロタイプを受け継ぐ尤度が高いと決定することをさらに含む、請求項６に記載の方法。
前記パラメータが、無細胞ＤＮＡ分子の前記サイズプロファイルであり、
前記方法は、
前記第１の値が前記第２の値よりも小さい場合、前記胎児が前記第２のハプロタイプよりも前記第１のハプロタイプを受け継ぐ尤度が高いと決定することをさらに含み、前記無細胞ＤＮＡ分子の第２のセットが前記無細胞ＤＮＡ分子の第３のセットよりも小さいサイズプロファイルによって特徴付けられることを示す、請求項６に記載の方法。
前記パラメータが、無細胞ＤＮＡ分子の前記メチル化レベルであり、
前記方法は、
前記第１の値が前記第２の値よりも小さい場合、前記胎児が前記第２のハプロタイプよりも前記第１のハプロタイプを受け継ぐ尤度が高いと決定することをさらに含む、請求項６に記載の方法。
前記第１の値および前記第２の値を使用して、分離値を計算することと、
前記分離値をカットオフ値と比較することと、
前記分離値と前記カットオフ値との前記比較に基づいて、胎児異数性の尤度を決定することと、をさらに含む、請求項１に記載の方法。
前記カットオフ値が、正倍数性胎児を妊娠中の女性からの参照試料から決定されるか、
前記カットオフ値が、異数性胎児を妊娠中の女性からの参照試料から決定されるか、または
前記カットオフ値が、異数性胎児を仮定して計算される、請求項１０に記載の方法。
前記無細胞ＤＮＡ分子の第１のセットに対応する前記リードの１つのリードにおける部分配列の反復数を特定することをさらに含み、
前記第１のハプロタイプの前記配列を決定することは、前記第１のハプロタイプの前記配列が前記部分配列の前記反復数を含むと決定することを含む、請求項１に記載の方法。
前記部分配列の前記反復が、反復関連疾患と関連しており、
前記方法は、前記胎児が前記反復関連疾患を受け継ぐ尤度を決定することをさらに含む、請求項１２に記載の方法。
妊娠中の生物の生物学的試料を分析する方法であって、前記生物学的試料が、複数の無細胞核酸分子を含み、前記方法が、
前記複数の無細胞核酸分子を配列決定することを含み、配列決定された前記複数の無細胞核酸分子の２０％超が、２００ｎｔよりも大きい長さを有する、請求項１に記載の方法。
電気泳動を用いて前記複数の無細胞ＤＮＡ分子を濃縮することを更に含む、請求項１４に記載の方法。
サイズに基づいて無細胞ＤＮＡ分子に選択的に結合するために、磁性ビーズを用いて前記複数の無細胞ＤＮＡ分子を濃縮することを更に含む、請求項１４に記載の方法。
ハイブリダイゼーション、免疫沈降、増幅またはＣＲＩＳＰＲを用いて前記複数の無細胞ＤＮＡ分子を濃縮することを更に含む、請求項１４に記載の方法。
濃縮が、６００ｎｔ、７００ｎｔ、８００ｎｔ、９００ｎｔ、または１ｋｎｔよりも大きいサイズのためのものである、請求項１６に記載の方法。
前記複数の無細胞ＤＮＡ分子が、前記生物学的試料と比較してメチル化プロファイルのために濃縮され、
前記方法が、
免疫沈降を使用して、前記複数の無細胞ＤＮＡ分子を濃縮することをさらに含む、請求項１に記載の方法。
前記複数の無細胞ＤＮＡ分子に対応するリードが、単一分子配列決定法によって得られる、請求項１に記載の方法。
前記単一分子配列決定法が、新規塩基を、前記複数の無細胞ＤＮＡ分子のうちの無細胞ＤＮＡ分子の相補鎖に組み込むＤＮＡポリメラーゼの光学的監視を含む、請求項２０に記載の方法。
請求項１～２１のいずれか１項に記載の方法を実施するコンピュータシステムを制御するための指示を保存するコンピュータ可読媒体。