JP2015534807A - 胎児の染色体異数性を検出するための非侵襲的方法 - Google Patents

胎児の染色体異数性を検出するための非侵襲的方法 Download PDF

Info

Publication number
JP2015534807A
JP2015534807A JP2015538513A JP2015538513A JP2015534807A JP 2015534807 A JP2015534807 A JP 2015534807A JP 2015538513 A JP2015538513 A JP 2015538513A JP 2015538513 A JP2015538513 A JP 2015538513A JP 2015534807 A JP2015534807 A JP 2015534807A
Authority
JP
Japan
Prior art keywords
sample
samples
chromosome
dna
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015538513A
Other languages
English (en)
Inventor
マグネ エステロース,
マグネ エステロース,
サーニュ, セシル デルーン
サーニュ, セシル デルーン
ナディン ヴィンセント,
ナディン ヴィンセント,
ベルナルド コンラッド,
ベルナルド コンラッド,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genesupport SA
Original Assignee
Genesupport SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genesupport SA filed Critical Genesupport SA
Publication of JP2015534807A publication Critical patent/JP2015534807A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本発明は、無細胞DNAを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞DNAを抽出するステップと;抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップと;サイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;試料ごとに得られた配列をヒトゲノムにマッピングするステップと;参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;参照試料のセット及び/又は参照パラメータのセットを得るステップとを含む方法に関する。【選択図】なし

Description

本発明は、無細胞DNA、特にサイズ選択無細胞DNAを使用する、胎児の異数性の非侵襲的出生前診断に関する。より詳細には、本発明は、極めて向上した感受性及び特異性を提供する外部参照試料のセットを用いることを特徴とする、胎児の異数性の診断方法に関する。本発明は、胎児の異数性の診断に用いられる参照試料並びに参照試料及び/又は参照パラメータのセットを含むキットを得るための方法にも関する。
胎児の染色体異数性の検出は、出生前診断で重要な処置である。いくつかの主要な疾患、例えばダウン症候群(21トリソミーとも呼ばれる)、18トリソミー、13トリソミーは染色体異数性によって引き起こされ、胎児がこれらの異常の1つによる影響を受けているかどうかできるだけ早く予測することが最も重要である。さらに、胎児が異数性に罹る危険は、母体の年齢と共に一般に増加する。したがって、ほとんどの先進国での妊娠女性の平均年齢の上昇は、胎児の染色体異数性を検出するための強力で安全な診断法の必要性をさらに高める。
胎児の染色体異数性の検出は、漿膜絨毛試料採取、羊水穿刺又は臍帯血試料採取などの侵襲的処置を通して一般に実施される。これらの方法は、核型分析のために必要な胎児の細胞を得るために、胎児の生体材料(羊水、絨毛膜絨毛、臍帯血)の収集物に頼ることにおいて共通する。これらの方法は、長い間日常的に実践されている。しかし、それらの侵襲性のために、それらは胎児及び母体にとって危険がないとは限らない。最も頻度の高い危険は流産の可能性であり、羊水穿刺の場合は1%近くである。他の危険、例えば感染症の危険、母体から胎児への疾患の伝染(例えばAIDS又はB型肝炎)、羊水漏出又は早産などが、これらの侵襲的処置と関連している。
超音波スキャン又は母体の血清生化学的マーカーの検出に基づく非侵襲的方法も開発されているが、これらの方法は随伴現象の検出に主に制限され、染色体異常の核心的病理を検出することに対する臨床有用性は限定されている。
1997年における母体血漿中の無細胞胎児核酸の発見は、新しい可能性を開いた。胎児の染色体量を評価するためのこれらの核酸を使用する第1の戦略は、SNPの対立遺伝子比率分析による胎児染色体量の評価に基づく、標的核酸(胎盤特異的DNAメチル化サインを有する胎盤mRNA及びDNA分子)でのSNPの対立遺伝子の比の分析をベースとしていた。ごく近年では、デジタルPCRを使用して、別の戦略が開発された(Loら、2007)。この技術は、母体血漿中の潜在的な異数性染色体(例えば第21染色体)の上の特定座位の全量を測定し、この量を参照染色体上のそれと比較することからなる。
2008年に、Chiuらは、母体血漿で胎児の21トリソミーを診断する方法において大量並行シーケンシングに成功した(Chiuら、2008)。彼らの方法は、血漿試料から抽出されたDNAで大量並行シーケンシングを実行することからなる。MPGSステップから得られた配列をヒトゲノムの参照配列と次に整列させ、ミスマッチなしでヒトゲノムの上に位置に固有にマッピングされた配列の数を各染色体について数え、MPGSの間に得られた配列の総数と比較する。この比は、母体血漿試料で見出されるDNA分子の「染色体表示」の指標を提供する。正倍数体として既知の参照試料セットと比較して、所与の試料での第21染色体の過剰表示は、胎児の21トリソミーの指標である。
ほぼ同時に、Fanらは、無細胞血漿のショットガンシーケンシングを使用して、胎児の21トリソミーの診断のための別の方法の開発に成功を収めた(Fanら、2008)。母体血漿試料から抽出された無細胞DNAを大規模にシーケンシングした後に、Fanらは、各配列をヒトゲノムにマッピングした。次にヒトゲノムの各染色体を50kbビンに分け、各ビンにつき、多くても1つのミスマッチを有するヒトゲノムに固有にマッピングされた配列タグの数を数えた。次にFanらは、各染色体にわたる配列タグのこのカウントの中間値を計算した。最後に、Fanらは、21トリソミーに罹った胎児を妊娠している母体に由来する血漿の第21染色体配列のタグ密度を、正倍数性の胎児を妊娠している母体に由来する血漿のそれと比較し、彼らは、21トリソミー配列タグ密度が99%信頼レベルで正倍数性試料のそれより高いことに気がついた。
これらの技術はいずれも、正倍数性参照試料と比較した所与の染色体の過剰表示の検出に依存する。それらは有益な「概念実証」を提供し、胎児の異数性の診断での次世代のシーケンシング技術の効率的利用のための道を開いた。しかし、日常の臨床場面でのその方法の実行は、先行技術で現在記載されているものより高いレベルの感度及び特異性を必要とする。
全ゲノム次世代シーケンシング(WG−NGS)で胎児の異数性を検出する非侵襲的出生前診断の感度は、母体血漿中の胎児DNAの割合及びシーケンシングの深度に依存する。胎児DNAの割合は一連のほぼ固有の生物学的変数に依存するが、実験上の改変を受ける技術的変数には、i)DNA抽出手順の効率、ii)NGSの精度及び処理量、すなわち、シーケンシングされたゲノムと整列させることができる固有の正確な一致を有する配列タグ(「ミスマッチのない固有同一配列(unique exact sequences)」又は「UES」と呼ばれる)の割合、及びシーケンシングされた分子の総数、iii)バイオインフォマティクアルゴリズムの性質、並びにiv)参照セットを提供する正常な胎児核型をもつ妊娠女性からの試料の対照群が含まれる。各単一の染色体についての個々の分子計数は全ての常染色体の中間配列タグ密度で標準化されるので、後者が最も重要である(Fanら、2008)。
本発明は、非侵襲的出生前診断のためにこれまで使用されておらず、標準方法より5倍大きな収率を有するDNA抽出法を、公表された参照より全体的に25〜30%多くのUES及び現行の標準より3倍高い15×10を超えるUESの平均総カウントによる厳しく品質管理されたNGSワークフローと一緒に実行する。試験の最終読み出しは、頑健な臨床試験の必要条件、すなわち主要な胎児の異数性について100%の感度及び100%の特異性に適合する。この手法は、例えば、偶然に誤った結果をもたらす≦1.1×10−5の事前確率で、21トリソミー又はダウン症候群を正常な雄及び雌の核型と区別する。基準は≦2.7×10−3なので、それは2桁の向上を表す。本発明は配列の高品質の参照セットの構築を可能にする方法の組合せを提供し、それはNGS手法の性能を規定するための鍵となるステップである。
したがって、本発明の第1の態様は、母体生体試料、好ましくは血液試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料、好ましくは血液試料のセットから無細胞DNAを抽出するステップと;
各試料のDNAの大量並行シーケンシングを実施するステップと;
試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
任意選択で参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む方法に関し、前記方法は以下の追加のステップ/機構の少なくとも1つを含む:
各生体試料からの無細胞DNAの抽出は、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップとを含む。
抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップ;
抽出ステップ又はDNA分子のサイズ分布に基づく選択ステップの後、各試料のDNAをプレシーケンスし、得られた配列をヒトゲノムにマッピングし、ヒトゲノムにマッピングした固有同一配列の量に基づいて試料のセットを選択するステップ;
大量並行シーケンシングから得られた配列をマッピングするステップの後、ヒトゲノムにマッピングした固有同一配列の数に基づいて試料のセットを選択するステップ。
本方法は、これらの追加のステップ若しくは機構のいずれか1つ、これらの追加のステップ若しくは機構の2つか3つの任意の組合せ、又は4つの追加のステップ及び機構を含むことができる。
本発明の方法は、特に抽出ステップの直後及び大量並行シーケンシングの前に、無細胞DNAのサイズ選択のステップを含むことが好ましい。この実施形態により、本発明は、無細胞DNAを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、
正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞DNAを抽出するステップと;
抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップと;
サイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む方法に関する。
サイズ選択ステップを含む参照試料のセットを得るためのそのような方法の好ましい例は、
a)正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセット、及び任意選択で異数性胎児を妊娠している正倍数性妊娠女性から得られたさらなる生体試料のセットから無細胞DNAを抽出するステップと;
b)特に200bpを超えるサイズを有する無細胞DNA分子を除去するために、抽出された無細胞DNAの試料をサイズ選択ステップにかけるステップと;
c)シーケンシングライブラリーの調製のために、ステップ(b)で得られたサイズ選択された抽出されたDNA試料を、例えばDNA分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと;
d)(c)で得られたサイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
e)試料ごとにステップ(d)で得られた配列をヒトゲノムにマッピングするステップと;
f)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
g)参照試料のセット及び/又は参照パラメータのセットを得るステップと
を含む。
試料の参照セットを得ることにおいて、無細胞DNAを抽出する生体試料のセットは、異数性胎児を妊娠している正倍数性の妊娠女性から得られた試料をさらに含むことが特に好ましい。この方法で、参照セットは、正倍数性と異数性の両方の試料の参照値を提供する。
代替実施形態では、無細胞DNAを含有する母体生体試料から胎児の異数性診断用参照試料のセットを得る方法は、大量並行シーケンシングの前に、サイズ選択された試料のサブセットのプレシーケンス及びマッピングのステップを含む。この代替実施形態により、本方法は、
(i)正倍数性胎児を妊娠している正倍数性妊娠女性のセットから得られた生体試料、好ましくは血液試料のセットから無細胞DNAを抽出するステップと;
(ii)各試料中のDNA分子のサイズ分布を分析するステップと;
(iii)前記試料中のDNA分子のサイズ分布に基づいて試料の第1のセットを選択するステップと;
(iv)試料の前記第1のセットからの各試料のDNAをプレシーケンスするステップと;
(v)ステップ(iv)で得られた配列をヒトゲノムにマッピングするステップと;
(vi)ステップ(v)でヒトゲノムにマッピングされた固有同一配列の量に基づいて試料の第2のセットを選択するステップと;
(vii)試料の前記第2のセットからの各試料のDNAを大量並行シーケンシングするステップと;
(viii)ステップ(vii)で得られた配列をヒトゲノムにマッピングするステップと;
(ix)ステップ(viii)でヒトゲノムにマッピングされた固有同一配列の数に基づいて参照試料のセットを選択するステップと
を含む。
具体的な実施形態では、ステップ(iii)は、DNA分子の少なくとも90重量%、好ましくは95重量%より多くが156bp〜176bpのサイズを有する試料を選択するステップを含む。
別の実施形態では、ステップ(iii)は、少なくとも0.88ng/μlの、サイズが156bp〜176bpのDNA分子を有する試料を選択するステップを含む。
別の実施形態では、ステップ(iv)は、各試料中の1000〜100000個の配列をシーケンシングするステップを含む。
別の実施形態では、ステップ(vi)は、ステップ(iv)で得られた配列の総数に対して少なくとも70%の固有同一配列を有する試料を選択するステップを含む。
別の実施形態では、ステップ(vii)は、試料ごとに少なくとも25,000,000個の配列をシーケンシングするステップを含む。別の実施形態では、ステップ(vii)は、試料ごとに少なくとも25,000,000個のフィルターを通過するリードを得るステップを含む。
別の実施形態では、ステップ(ix)は、15,000,000個を超える固有同一配列のリードを有する試料を選択するステップを含む。
本発明は、母体生体検査試料、好ましくは血液試料から胎児の異数性を診断する方法であって、
(a)妊娠女性から得られた母体生体検査試料から無細胞DNAを抽出するステップと;
(b)前記検査試料から抽出される無細胞DNAを大量並行シーケンシングするステップと;
(c)ステップ(b)で得られた配列をヒトゲノムにマッピングするステップと;
(d)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
(e)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば正倍数性参照試料のセット、例えば本発明により得られたセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
(f)ステップ(d)で計算された前記検査パラメータをステップ(e)で計算された参照パラメータの前記セットと比較するステップと;
(g)比較に基づいて胎児の異数性を診断するステップと
を含む方法にも関する。
胎児の異数性の診断の好ましい方法は、抽出ステップの後、前記試料中のDNA分子のサイズに基づくサイズ選択ステップが実施される、上記方法を含む。サイズ選択ステップは、サイズが200bpを超えるDNA分子を検査試料から実質的に排除する。このステップは、シーケンシングライブラリーの調製の前に実行されることが好ましい。この診断方法は、上記の無細胞DNAサイズ選択ステップも受けた参照試料と併用することが特に好ましい。実際、本発明により、検査試料が参照試料と同じ方法で処理されることが好ましい。
この好ましい実施形態により、母体生体検査試料、好ましくは血液試料から胎児の異数性を診断する方法は、
(a)妊娠女性から得られた血液などの母体生体検査試料から無細胞DNAを抽出するステップと;
(b)サイズが200bpを超えるDNA分子が試料から実質的に排除されるように、抽出された無細胞DNAに対してサイズ選択ステップを実施するステップと;
(c)シーケンシングライブラリーの調製のために、サイズ選択された抽出された無細胞DNAを、例えばDNA分子の末端修復及びシーケンシングアダプターのライゲート、それに続き任意選択でアダプターをライゲートした断片の増幅によって処理するステップと;
(d)ステップ(c)で得られた無細胞DNAを大量並行シーケンシングするステップと;
(e)ステップ(d)で得られた配列をヒトゲノムにマッピングするステップと;
(f)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
(g)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、参照試料のセット、例えば本発明のサイズ選択法により得られた正倍数性参照試料のセットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
(h)ステップ(f)で計算された前記検査パラメータをステップ(g)で計算された参照パラメータの前記セットと比較するステップと;
(i)比較に基づいて胎児の異数性を診断するステップと
を含む。
母体生体検査試料からの無細胞DNAの抽出は、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップと
を含むことが好ましい。
具体的な実施形態では、前記検査パラメータは、全ての常染色体の中間固有同一配列タグ密度に標準化した対象の染色体又は染色体領域の固有の配列タグ密度である。
別の実施形態では、前記検査パラメータは、全ての染色体にマッピングされた固有同一配列の総数に対する、又は全ての常染色体にマッピングされた固有同一配列の総数に対する、前記染色体又は染色体領域にマッピングされた固有同一配列の百分率である。
別の実施形態では、ステップ(f)の比較は、参照パラメータのセットに対する前記検査パラメータのzスコアの計算によって実行される。
別の実施形態では、検査パラメータは、対象の染色体若しくは染色体領域の絶対同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントである。
さらなる実施形態では、ステップ(f)の比較は、対象の染色体若しくは染色体領域の固有同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントが、参照セットの対象の染色体の固有同一配列カウントの正規分布に属する確率の計算によって実施される。
別の実施形態では、対象の染色体は、第21染色体、第18染色体、第16染色体、第11染色体又は第13染色体である。
別の実施形態では、対象の染色体は第21染色体であり、21トリソミー試料のzスコアは少なくとも4.4であるが、第21染色体の正倍数性試料のzスコアの絶対値は4.4未満である。
本発明は、胎児と母体の無細胞DNAを含有する母体生体試料から無細胞DNAを抽出する方法であって、
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
前記混合物から水相を抽出するステップと;
前記水相からDNAを沈殿させるステップと;
沈殿したDNAを任意選択で収集するステップと
を含む方法にも関する。
本発明は、胎児と母体の無細胞DNAを含有する母体生体試料から無細胞DNAを抽出するための、クロロホルム及びフェノール、好ましくはクロロホルム及びフェノールを含む組成物の使用にも関する。具体的な態様では、前記使用は、母体生体試料から胎児の異数性診断用参照試料のセットを得る方法におけるものである。
別の態様では、前記使用は、母体生体検査試料から胎児の異数性を診断するための方法におけるものである。
本発明は、本発明の方法により入手可能な参照試料のセットにも関する。
本発明は、母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するための、コンピュータプログラム製品にも関する。
本発明は、母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップ、例えばステップ(d)から(g)の1つ又は複数を実行するための、コンピュータプログラム製品にも関する。
本発明は、
無細胞DNAを抽出するための、例えばフェノール及びクロロホルムを含む組成物を含む、1つ又は複数の組成物及び/又はキット;
本発明の方法により入手可能な参照試料のセット;
コンピュータ可読媒体などの物理的支持体に任意選択で含まれる、本発明による方法で入手できる参照パラメータのセット;
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品;
母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
の1つ又は複数を含むキットにも関する。
好ましい実施形態により、胎児の異数性の診断のためのキットは、
本発明の方法により入手可能な参照試料のセット、例えばサイズが≦200bpの無細胞DNAのために試料を濃縮するためにサイズ選択を受け、200bpを超えるDNA分子を排除し、正倍数性胎児を妊娠している正倍数性妊娠女性からの試料に加えて異数性胎児を妊娠している正倍数性妊娠女性からの試料も含む試料のセット、
及び/又は参照パラメータのセットであって、ここで各参照パラメータは、任意選択で物理的支持体に含まれる本発明の方法により入手可能な参照セットの試料ごとの、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、参照パラメータのセットを含み、
そのようなキットは、
無細胞DNAを抽出するための、フェノール及びクロロホルムを含む組成物などの、1つ又は複数の組成物及び/又はキット;
母体生体試料からの胎児の異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品;
母体生体検査試料から胎児の異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
の少なくとも1つをさらに含むことができる。
キャピラリー電気泳動によって得られた3つの母体血漿試料のサイズ分布を示す図である。これらの試料中のDNA分子は、132bpシーケンシングアダプター/バーコードにライゲートされる。 91個の試料(正倍数性及び異数性)についてのNGSシーケンシングによって得られたフィルターを通過する配列リードの総数を示す図である。縦座標の軸凡例は、「Cnt+1e6」、すなわち100万単位の配列カウントと読む。 図2に示すのと同じ試料についての固有同一配列の数を示す図である。縦座標の軸凡例は、「Cnt+1e6」、すなわち100万単位の配列カウントと読む。 既知の健全個体(本発明の方法によって選択された参照試料)に対して1/100,000の信頼区間(zスコア=4.4)で第21染色体にマッピングされた全固有配列リードの百分率を示す図である。中央の水平点線は、参照試料の平均百分率に対応する。点線の上下の水平実線は、識別閾値(平均±4.4SD)に対応する。21トリソミー試料は、正に識別される。 既知の健全個体(本発明の方法によって選択された参照試料)に対して1/100,000の信頼区間(zスコア=4.4)で第18染色体にマッピングされた全固有配列リードの百分率を示す図である。中央の水平点線は、参照試料の平均百分率に対応する。点線の上下の水平実線は、識別閾値(平均±4.4SD)に対応する。18トリソミー試料は、正に識別される。 第2のスコアリングアルゴリズムを使用した第1染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。 第2のスコアリングアルゴリズムを使用した第19染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。 第2のスコアリングアルゴリズムを使用した第13染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。13トリソミー試料は、正に識別される。 第2のスコアリングアルゴリズムを使用した第18染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。18トリソミー試料は、正に識別される。 第2のスコアリングアルゴリズムを使用した第21染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。21トリソミー試料は、正に識別される。 第2のスコアリングアルゴリズムを使用した第22染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。22トリソミー試料は、正に識別される。 第2のスコアリングアルゴリズムを使用した第4染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。4p微小欠失(ウルフ−ハーシュホーン症候群)試料は、負に識別される。 第2のスコアリングアルゴリズムを使用した第5染色体のスコアを示す図である。識別閾値は、既知の健全個体(本発明の方法により選択された参照試料)に対する1/100,000,000,000の信頼区間に対応する。5p微小欠失/重複(ネコ鳴き症候群)試料は、正に識別される。 4p微小欠失症候群試料の第4染色体での配列タグ密度を示す図である。4p欠失位置で参照試料の平均密度からの負の偏差が明らかである。 5p微小欠失/重複症候群試料の第5染色体での配列タグ密度を示す図である。それぞれ5p微小欠失及び重複の位置で、参照試料の平均密度からの正及び負の偏差が明らかである。図2〜13に示すデータは、91個の試料の同じセットで全て得られ、各図において同じ順序で示す。10個の試料ごとのIDを、バーの下に示す。特定の試料(試料2、3、4、26、40、44、45、55、56、61、63、68、69、70、71、83、85、88、89、90、91)の核型を、対応するバーの中か上に示す。これらの核型は、表5にも掲載する(テキストは図のそれに同じ)。 サイズ選択:3つの検査試料GWX−351、−352及び−353についてAMPureビーズを使用した、抽出された無細胞DNAのサイズ選択の前(パネルA、左側)及び後(パネルB、右側)のバイオアナライザー結果を示す図である。113.00及び43.00のピークはサイズマーカーである([s]は秒で表す移動時間を意味し、塩基対に直接に変換することができる)。サイズ選択された試料(パネルB)では、>1000bpの大きな分子量のピークは精製工程によって消去され、150〜200bpの胎児無細胞DNAに対応するより低い分子量のピークは保持される。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第1染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第2染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第3染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第4染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第5染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第6染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第7染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第8染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第9染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第10染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第11染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第12染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第13染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第14染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第15染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第16染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第17染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第18染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第19染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第20染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第21染色体。 本発明のサイズ選択手法(TPR、y軸)及びサイズ選択なしの同じ手法(GW、x軸)を使用した全ての常染色体の異数性検出検査の結果の比較を示す図である。実施例3に記載されるプロトコルによって48個の検査試料を評価し、全ての常染色体について、サイズ選択の有り無しで6個の参照試料A1、A2、N1、N2、B1、B2と比較した。サイズ選択による胎児の濃縮が、13、16、18及び21トリソミーの検出のためのより強力なシグナルをもたらしたことは明らかである。第22染色体。 GWX−1137と命名された正倍数性試料で得られた、参照セットA1と比較した結果を示す図である。図39a〜39dでは、内部の微細な点線は1/1000の確率閾値を表し、外部のより太い点線は1/10000の確率閾値を表し、すなわち、これらの閾値の外側に存在する値は、それぞれ、1000に1つ未満が正常である可能性、又は10000に1つ未満が正常である可能性を有する: 図39a:検証された異数性T13試料を含む、第13染色体のための参照セットA1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1137の第13染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の中にある。 図39b:検証されたT16異数性試料を含む、第16染色体のための参照セットA1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1137の第16染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の中にある。 図39c:検証されたT18異数性試料を含む、第18染色体のための参照セットA1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1137の第18染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の中にある。 図39d:検証されたT21異数性試料を含む、第21染色体のための参照セットA1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1137の第21染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の中にある。 異数性試料で得られた、参照セットN1と比較した結果を示す図である。図40a〜40dでは、内部の微細な点線は1/1000の確率閾値を表し、外部のより太い点線は1/10000の確率閾値を表し、すなわち、これらの閾値の外側に存在する値は、それぞれ、1000に1つ未満が正常である可能性、又は10000に1つ未満が正常である可能性を有する。図40aは、検証された異数性T13試料を含む、第13染色体のための参照セットN1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1196 FDT8bの第13染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、10000に1つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦1×10−5である。13トリソミーが疑われる。 図40b:検証された異数性T16試料を含む、第16染色体のための参照セットN1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1420 FDT6bの第16染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、10000に1つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦1×10−5である。16トリソミーが疑われる。 図40c:検証された異数性T18試料を含む、第18染色体のための参照セットN1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1421 FDT5bの第18染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、10000に1つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦1×10−5である。18トリソミーが疑われる。 図40d:検証された異数性T21試料を含む、第21染色体のための参照セットN1の各試料のUEMから得られた値(灰色の点)と比較した、検査試料GWX−1470 FDT4bの第21染色体のUEMから得られた値(円形黒点)を示す図である。検査試料は、正常な核型を表す値の区間の外側にあり、10000に1つ未満が正常である可能性を有し、すなわち、そのような異常な結果が偶然に起こる確率は≦1×10−5である。21トリソミーが疑われる。 実施例5に記載の大量並行シーケンシングのための半導体ベースのNGSプラットホームを使用した、3つのトリソミー試料での本発明の異数性検出検査の結果を示す図である。太く黒いボックスは、問題の試料が半導体技術を使用する6つの異なる正常な参照セットに属する確率を表し、ここで6つの参照セットも、検査試料を扱うために使用したものに同じ半導体技術及び実験プロトコルを使用して生成した。同じ検査試料、及び合成プラットホームによるシーケンシングの使用によって生成された4つの参照セットで得られた結果の比較を示す(細いバー)。
定義
本明細書で用いるように、用語「次世代シーケンシング」(NGS)又は「大量並行シーケンシング」は同義語であり、何十万ものシーケンシング工程が並行実施されるハイスループットシーケンシング方法を指す。次世代シーケンシング方法は、一回の実行で数百万の配列を得るために有益である。これらの方法には、単一分子リアルタイムシーケンシング、イオン半導体シーケンシング、ピロシーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシングが含まれる。
本明細書で用いるように、用語「無細胞DNA」は、生体試料、例えば血液中で自由に循環するDNA分子又はDNA分子のセットを指す。同義語は、「循環DNA」である。無細胞DNAは細胞外にあり、この用語は、例えば細胞の核又はミトコンドリアで見出すことができる細胞内DNAと対照的に使用される。
本明細書で用いるように、異数性という用語は、1つの染色体の定量的量が二倍体ゲノムの定量的量と変動していることを指す。変動は、増加又は損失であってもよい。それは、染色体全体に関連する場合もあるし、又はその一部だけに関連する場合もあり、例えば染色体の所定領域のみに関連する場合もある。異数性は、モノソミー(1つの染色体の欠如)、部分的モノソミー(染色体の一部の転位又は欠失)、トリソミー(1つの余分の染色体の増加)、部分的トリソミー(染色体の一部の増加及び/又は重複)を含むことができる。本明細書において、正倍数性は異数性の反対を意味するために使用され、すなわち正倍数性試料は二倍体のゲノム、染色体又は染色体の一部を指す。例えば、第21染色体についての個々の正倍数体は、第21染色体の2つのコピーを有する。
モノソミー又は部分的モノソミーの例には、ウルフ−ハーシュホーン症候群、ネコ鳴き症候群、5q欠失症候群、ウィリアムズ症候群、ヤコブセン症候群、アンゲルマン症候群、プラダー−ビリ症候群、ミラー−ジーカー症候群、スミス−マゲニス症候群、18q欠失症候群、ディジョージ症候群が含まれる。
トリソミーの例には、1トリソミー、2トリソミー、3トリソミー、4トリソミー、5トリソミー、6トリソミー、7トリソミー、8トリソミー(ワーカニー症候群)、9トリソミー、10トリソミー、11トリソミー、12トリソミー、13トリソミー(パトー症候群)、14トリソミー、15トリソミー、16トリソミー、17トリソミー、18トリソミー(エドワーズ症候群)、19トリソミー、20トリソミー、21トリソミー(ダウン症候群)、22トリソミーが含まれる。1つ又はいくつかの染色体領域の損失(欠失)が関与する障害の他の例には、1p36欠失症候群、TAR欠失、1q21.1欠失、2q11.2欠失、2q11.2q13欠失、2q13欠失、2q37欠失、3q29欠失、ウルフ−ハーシュホーン欠失、ソトス症候群欠失、6q16欠失、ウィリアムズ症候群欠失、WBS遠位欠失、8p23.1欠失、9q34欠失、10q23欠失、ポトキ−シェーファー症候群、SHANK2 FGF欠失、12q14欠失症候群、13q12欠失、15q11.2欠失、プラダー−ビリ/アンゲルマン症候群、15q13.3欠失、15q24 BP0−BP1欠失、15q24 BP0−BP1欠失、15q24 BP2−BP3欠失、15q25.2欠失、ルービンスタイン−テービ症候群、16p13.11欠失、16p11.2p12.1欠失、16p12.1欠失、16p11.2遠位欠失、16p11.2欠失、17p13.3欠失、17p13.3欠失、HNPP、スミス−マゲニス症候群欠失、NF1欠失症候群、RCAD(腎嚢胞及び糖尿病)、17q21.31欠失、ディジョージ/VCFS欠失、22q11.2遠位欠失、フェラン−マクダーミド症候群が含まれる。
1つ又はいくつかの染色体領域の増加(重複)が関与する障害の他の例には、1p36重複、1q21.1重複、2q11.2重複、2q11.2q13重複、2q13重複、2q37重複、3q29重複、ウルフ−ハーシュホーン領域重複、5q35重複、6q16重複、ウィリアムズ症候群重複、WBS遠位重複、8p23.1重複、9q34重複、10q23重複、11p11.2重複、SHANK2 FGF重複、12q14重複、13q12重複、15q11.2重複、プラダー−ビリ/アンゲルマン領域重複、15q13.3重複、15q24 BP0−BP1重複、15q24 BP2−BP3重複、15q25.2重複、ルービンスタイン−テービ領域重複、16p13.11重複、16p11.2p12.1重複、16p12.1重複、16p11.2遠位重複、16p11.2重複、17p13.3重複、17p13.3重複、17p13.3重複、CMT1A、ポトキ−ルプスキ症候群、NF1重複、17q12重複、17q21.31重複、22q11.2重複、22q11.2遠位重複、22q13重複が含まれる。
10Mb未満の染色体の一部のコピー数変動が関与する異数性関連のゲノム障害の包括的レビューと一緒に、これらの障害に関する参考文献は、本明細書に参照により組み込まれているCooperら、2011、に見出すことができる。
本明細書で用いるように、用語「正倍数性試料」は、正倍数性の胎児を妊娠している正倍数性の母体から得られた試料を指す。用語「正倍数性」は相対的な意味で、すなわち対象の特定の染色体又は染色体領域に関して使用することができる。或いは、用語「正倍数性」は、絶対的な意味で、すなわち全ゲノムに関して使用することができる。この場合には、正倍数性試料は、その全ゲノムにわたっていかなる異数性によっても冒されない。
本明細書で用いるように、用語「異数性試料」は、異数性の胎児を妊娠している正倍数性の母体から得られた試料を指す。「正倍数性」と同様に、用語「異数性」は、対象の特定の染色体若しくは染色体領域に関して、又は全ゲノムに関して使用することができる。
本明細書で用いるように、用語「固有同一配列」は、いかなるミスマッチもなくヒトゲノムに固有にマッピングされた配列を指す。言い換えると、配列はヒトゲノムの単一の位置で整列しており、前記位置と正確に同じ配列を有し、すなわち、ヒトゲノムの前記位置で見出される配列に関していかなる欠失、付加又は突然変異もない。固有同一配列は、20〜100bp、好ましくは40〜70bp、さらに好ましくは50bpの長さを一般に有する。本明細書において、用語「固有同一配列」(UES)は、用語「固有の正確な一致」(UEM:unique exact match)と同義的に使用される。
本明細書で用いるように、「母体生体試料」などでの「母体試料」は、妊娠女性から得られた試料である。
本明細書で用いるように、「生体試料」は、好ましくは無細胞DNAを含有する生体試料を指し、より好ましくは全血、血漿、血清、尿又は母乳試料を指す。
本発明の第1の態様は、正倍数性の参照生体試料のセット、又は正倍数性と異数性の両方の参照試料のセットの構築に関し、ここで各参照試料は、胎児の異数性診断方法の統計的信頼度を高めるように慎重に選択される。この選択工程のワークフローは、いくつかの重要な選択ステップを含む:
試料中のDNAのサイズ分布に基づく選択(ステップ(ii)及び(iii));
試料をプレシーケンシングして、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択(ステップ(iv)〜(vi));
試料のシーケンシングを実施し、得られた配列をヒトゲノムにマッピングすることによって得られた固有同一配列の量に基づく選択(ステップ(vii)〜(ix));
本発明による方法は、3つの前述の選択ステップのいずれかを含むことができる。しかし、好ましい実施形態では、3つの選択ステップの全てが実施され、このように、参照試料の最終セットの品質を向上させる。
生体試料収集物
本発明による方法は、無細胞DNA、特に胎児と母体の無細胞DNAを見出すことができる任意の生体試料で一般に実施することができる。生体試料は、特に血液、尿、母乳などの体液であってもよい。血液試料が好ましい。本明細書で言及される場合、血液試料は全血試料、血漿試料又は血清試料を指す。生体試料は妊娠中の任意のときに回収されてもよいが、好ましくは妊娠7週以降、例えば妊娠7週〜20週、好ましくは妊娠7〜14週、なお好ましくは妊娠7〜10週に回収される。妊娠7週のように早く実施される診断は、妊娠を中絶する決定がとられる場合により多くの医療選択肢を保留する利点を提供する(例えば、国内法令に従い薬物又は薬物の組合せの使用を通しての中絶を可能にすることができる)。
生体試料は、漿膜絨毛試料採取、羊水穿刺又は臍帯血試料採取などの侵襲的出生前処置の後に収集することができる。それらは、侵襲的処置の後の任意の時間に、例えば侵襲的処置の少なくとも10分、20分又は30分後に収集することができる。生体試料は、侵襲的処置の少なくとも1日又は複数日後に、例えば侵襲的処置の2〜5日後にも収集することもできる。
或いは、生体試料は、侵襲的出生前処置をまだ受けていない女性から収集することができる。本方法の利点はまさにあらゆる侵襲的処置を回避することにあるので、この状況は診断される生体試料にとって好ましい。
参照セットの形成を意図する試料での胎児の異数性状態は、本発明による方法とは別に診断されてもよい。このことは、試料の参照セットを形成するために使用される試料が実際に正倍数性試料であること、言い換えると正倍数性の胎児を妊娠している正倍数性の母体から得られた試料であることを確かめるために有益であると予想される。試料の参照セットを得るために使用される正倍数性試料は、好ましくは上述した用語の「絶対的」定義に従って正倍数性であり、すなわち、それらは対象の特定の染色体についてだけでなくゲノム全体にわたり正倍数性である。上に示すように、本発明の好ましい変異形により、参照試料を構築する予定の試料は、異数性胎児、例えば21、18又は13トリソミーを有する胎児を妊娠している正倍数性の母体からの試料をさらに含むことができる。前と同じように、そのような試料での胎児の異数性状態は、本発明による方法とは別に診断されてもよい。
胎児の異数性状態を評価するための方法は、侵襲的出生前診断処置、例えば羊水穿刺、漿膜絨毛試料採取又は臍帯血試料採取によって母体から胎児の細胞材料を収集することを含むことができる。胎児の異数性状態は、以下の技術のいずれかによって次に評価することができる:核型分析、蛍光In Situハイブリダイゼーション(FISH)、ショートタンデムリピートの定量的ポリメラーゼ連鎖反応(PCR)、定量的蛍光PCR(QF−PCR)、定量的リアルタイムPCR(RT−PCR)量分析、一塩基多型の定量的質量分析及び比較ゲノムハイブリダイゼーション(CGH)。
ほとんどの場合、ほとんどの異数性関連の疾患は症候性なので、母体の異数性状態は既知である。しかし、必要ならば、母体の異数性状態は、母体から得られた細胞材料を用いて評価することもできる。前記の技術のいずれかを用いることができる。
無細胞DNA抽出
本発明による方法の重要なパラメータは、母体生体試料からの効率的なDNA抽出である。無細胞DNA抽出は、フェノール−クロロホルム抽出のプロトコルを通して実施されることが好ましい。抽出プロトコルは、一般的に以下のステップを含む:
前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップ;
前記混合物から水相を抽出するステップ;
前記水相から無細胞DNAを沈殿させるステップ;
任意選択で無細胞DNAを収集するステップ。
本発明は、生体試料、好ましくは血漿試料などの血液試料から無細胞DNAを抽出するための、フェノール/クロロホルムの使用を包含する。この方法は、既存の方法より頑健な胎児DNAシグナルを与えるので、入り混じった胎児及び母体の無細胞DNAを母体生体試料から抽出するために特に評価できる。本発明により、用語「フェノール/クロロホルム」は、フェノールとクロロホルムの混合物を指し、すなわちフェノール及びクロロホルムを含む組成物を指す。前記組成物は好ましくは水溶液であり、好ましくはイソアミルアルコールも含む。組成物のpHは、好ましくは7〜9、なお好ましくは7.8〜8.2である。好ましい組成物は、pHが7.8〜8.2のフェノール:クロロホルム:イソアミルアルコールの25:24:1の混合物である。組成物は、1つ又は複数の添加剤、例えば1つ又は複数の抗酸化剤及び/又は安定剤を含むことができる。
具体的な実施形態では、抽出方法は、プロテイナーゼKなどの1つ又は複数のプロテアーゼで生体試料を前処理するステップを含む。
水相の抽出は、クロロホルム及びフェノールと混合した生体試料を遠心分離し、水相を収集することを含むことができる。遠心分離は、主にフェノール、タンパク質又はタンパク質細片を含む下部の有機相、及び核酸を含む上部の水相への混合した生体試料の分離を提供する。
一実施形態では、水相からの無細胞DNAの沈殿は、以下のステップを含む:
少なくとも1つの沈殿剤を水相と混合するステップ;
前記混合された水相を遠心分離するステップ;及び
遠心分離ペレットを収集するステップ。
沈殿剤は、グリコーゲン、低級アルコール、例えばイソプロパノール若しくはエタノール、又はそれらの混合物から選択されることが好ましい。DNAを含有する遠心分離ペレットは、次に例えばエタノール及び/又はエーテルで、1回又は複数回洗浄することができる。最後に、懸濁緩衝液、例えばトリス緩衝液にDNAを再懸濁することができる。
フェノール−クロロホルム抽出プロトコルは、大量並行シーケンシングを使用する胎児の異数性の検出のために従来用いられてきたカラム方法の5倍の量のDNAを産出する(Chiuら、2008、Fanら、2008)。このプロトコルはさらに、より高い割合の156〜176bpのサイズのDNA、すなわち母体と胎児の無細胞DNAも与える。したがって、このプロトコルは、胎児DNAを起源とする配列リードの数を増加させるための重要なツールである。
シーケンシングライブラリーの調製
無細胞DNA抽出の後、抽出されたDNAを含有する試料は、シーケンシングライブラリーを調製するために任意選択で処理する。そのような処理は無細胞DNAの抽出直後に実施してもよく、又は、好ましくは、抽出された無細胞DNAのサイズ選択のステップの後に実施してもよい。
ライブラリー調製は、1つ又は複数の増幅ステップ、1つ又は複数のシーケンシングアダプターによるライゲート、及び/又はDNA分子のバーコード化を含むことができる。シーケンシングライブラリー調製の一般的なワークフローは、1つ又は複数のバーコード配列に任意選択で連結される1つ又は複数のアダプター配列の、試料中のDNA分子へのライゲートのステップ、続くアダプター/バーコードにライゲートされたDNA分子の増幅を含む。
シーケンシングアダプターは、現代のシーケンシング技術で一般的に使用される短いヌクレオチド配列である。アダプターは、シーケンシングをするDNA分子を固体表面、例えばフローセルに固着させるために使用される。したがって、これらのアダプターは、固体表面に連結される標的オリゴヌクレオチドとハイブリダイズするように設計される。アダプターのライゲートは、DNA分子の末端を修復することによって、すなわち、例えば1つ又は複数のエキソヌクレアーゼ及び/又はポリメラーゼの作用を通して抽出されたDNA分子のオーバーハングを取り去るか埋め合わせるかして、平滑末端のDNA分子を得ることによって実施することが好ましい。次に任意選択で、平滑末端のDNA分子の3’末端に、1つ又は複数の「A」塩基のオーバーハングを付加してもよい。次にそれらの3’末端に1つ又は複数の「T」塩基のオーバーハングを含有するアダプターを付加して、DNA分子の3’末端の1つ又は複数の「A」塩基のオーバーハングにライゲートする。アダプターは、平滑面でライゲートされてもよい。
試料中のDNA断片は、バーコード化されてもよい。バーコード化は、試料のDNA分子への、試料特異的タグのライゲートを指す。バーコード化は、1回のシーケンシング実行での数種の試料のシーケンシングを可能にすることから、時間及び資源が節約される。
試料中のDNA断片は、例えばPCRによる1つ又は複数の増幅サイクルにかけることもできる。10〜25の増幅サイクル、例えば18増幅サイクルを実行することができる。増幅は、DNA分子へのアダプター配列のライゲートの後に実行することが好ましい。PCR増幅はアダプター配列に対するプライマーを使用することが好ましく、このように、アダプターにライゲートした断片にライブラリーを濃縮する。
無細胞DNAのサイズ分布分析及び選択
無細胞DNA抽出の後に、各試料中のDNA分子のサイズ分布を分析することができる。この分析は、キャピラリー電気泳動によって実施することが好ましい。例えばそれは、市販のlab−on−a−chipキャピラリー電気泳動システムを用いて実行される。サイズ分布分析は、シーケンシングライブラリーの調製の前後に実行することができる。しかし、それはシーケンシングライブラリーの調製の前に実施することが好ましい。
本発明者らは、等しい総量の投入DNAに対して、NGSの後の未処理リードの総数に予想外の変動性があることを立証した。未処理の抽出物をキャピラリー電気泳動したところ、これの1つの可能な説明は、NGSに利用できる対象の胎児DNAを含有する低分子量画分の相対量を減少させる、高分子量(MW)DNA種(>1000bp)の存在であるかもしれないことが明らかになった。無細胞DNA抽出の直後及びライブラリー調製の前に高分子量種を除去するために実施した実験から、低分子量種(<200bp、特に150〜200bp)のサイズ選択及び高分子量種の除外がNGSの後に得られた未処理リードの数の変動性をほとんど除去することが確認された(図16を参照)。この技術ステップは、サイズ選択された分子だけがシーケンシングライブラリー調製のために処理され、大規模にシーケンシングされるという事実から生じるその経済的利益に加えて、アッセイの頑健性及び分解能も向上させる。具体的には、サイズ選択のこの処置は胎児画分、すなわち循環無細胞DNAの全量に占める無細胞循環胎児DNAの割合を増加させ、その使用を低い胎児画分の場合でのアッセイの頑健性のために決定的にする。ライブラリー調製の前のサイズ選択によってもたらされる胎児画分の増加は、トリソミーを確実に検出するために必要とされるリードの数を減少させる効果を有する。
サイズが200bpを超える無細胞DNA分子を除去するステップは、当技術分野で公知の任意の技術によって実行することができる。磁気ビーズ、例えば下の実施例に記載のAMPure XP(登録商標)ビーズの使用が特に好ましい。ゲル電気泳動を使用することもできる。本発明者は、本発明によるサイズ選択の有益効果は、大量並行シーケンシングステップのために使用される特定の技術にかかわりなく達成されることを実証した。例えば、それは、合成によるシーケンシング方法、並びに半導体ベースの次世代配列技術を使用して達成される。検査試料及び参照セットのために同じ大量並行シーケンシングプラットホームを使用することが最適であるが、それにもかかわらず、信頼できる結果は異なるプラットホームが試料及び参照セットに適用されるときに達成されることも実証された。
さらに、正倍数性の試料のセットでDNA分子のサイズ分布を分析することによって、本出願の発明者は、シーケンシングライブラリーの調製のために処理した無細胞DNA、すなわちアダプターにライゲートされた無細胞DNAのサイズ分布が、約298bpにサイズピークを有することを見出した(図1)。アダプター/バーコード配列の132bpのサイズを減算した後、ピークサイズは166bpに相当する。この値は、Fanら、2008、によって以前に提供されたデータと、及び無細胞DNAの主にモノヌクレオソーム起源の仮説とも一致する。
本発明により、試料中のDNAのサイズ分布は、胎児の異数性診断用参照試料の適切なセットを構成する過程において基準として使用することができる。この基準は、高レベルの無細胞DNAを有する試料の選択、及び低レベルの無細胞DNAを有する試料の排除を可能にする。
選択基準は、約166bpでのサイズピークの発生に存することができる。本明細書で用いるように、用語「約166bp」は、「151〜181bp」、又は「156〜176bp」、又は「161〜171bp」、又は「163〜169bp」、又は「165〜167bp」の意味を有し得る。或いは、この用語は「正確に166bp」の意味を有し得る。
適切な参照試料を選択するための別の基準は、ピークの高さが約166bpであること、又は言い換えればサイズが約166bpのDNA分子の画分に存する場合もある。したがって、具体的な実施形態では、ステップ(iii)は、試料を選択するサブステップであって、ここで試料中のDNA分子の少なくとも80重量%、なお好ましくは少なくとも90重量%、好ましくは少なくとも95重量%、なお好ましくは少なくとも97重量%が約166bp、好ましくは156〜176bpのサイズを有する、サブステップを含む。
その代わりに、又はそれに加えて、ステップ(iii)は、試料を選択するサブステップであって、ここでサイズが約166bp、好ましくは156〜176bpのDNA分子の濃度が、少なくとも0.88ng/μl、好ましくは少なくとも0.90ng/μl、なお好ましくは少なくとも0.95ng/μl、又は少なくとも1.00ng/μl、又は少なくとも1.05ng/μl、又は少なくとも1.10ng/μlである、サブステップを含む。
その代わりに、又はそれに加えて、ステップ(iii)は、試料を選択するサブステップであって、ここでサイズが約166bp、好ましくは156〜176bpのDNA分子の量が、少なくとも13ng、好ましくは少なくとも13.5ng、なお好ましくは少なくとも14.25ng、又は少なくとも15ng、又は少なくとも15.75ng、又は少なくとも16.5ngである、サブステップを含む。
ステップ(iii)で選択される試料のセットの中で、サイズが約166bp、好ましくは156〜176bpの抽出されるDNA分子の平均濃度は、少なくとも0.88ng/μl、好ましくは少なくとも0.90ng/μl、なお好ましくは少なくとも0.95ng/μl、又は少なくとも1.00ng/μl、又は少なくとも1.05ng/μl、又は少なくとも1.10ng/μlであることが好ましい。
ステップ(iii)で選択される試料のセットの中で、サイズが約166bp、好ましくは156〜176bpのDNA分子の平均量は、少なくとも13ng、好ましくは少なくとも13.5ng、なお好ましくは少なくとも14.25ng、又は少なくとも15ng、又は少なくとも15.75ng、又は少なくとも16.5ngであることが好ましい。
濃度及び/又は量は、シーケンシングステップのために調製されるDNAライブラリーで測定することができ、例えば、それはアダプター/バーコードとライゲートされるDNA分子、例えば132bpアダプター/バーコードとライゲートされるDNA分子で測定することができる。DNA分子はアダプター/バーコードのライゲートの後、18増幅サイクルを受けていることが好ましい。濃度及び/又は量は、投入材料として20ngのDNAを使用してIlluminaのChIPシーケンシングプロトコルを使用して調製されるDNAライブラリーで測定することがなお好ましい。濃度及び/又は量は、DNAライブラリーの調製の前に測定することもできる。
興味深いことに、本出願の発明者は、母体血漿試料中のDNA分子が約133〜143bpにより小さいサイズのショルダーを示すことも発見した(図1、右パネル)。このショルダーは胎児DNAを反映する可能性があり、胎児DNAの濃縮画分を有する試料の選択のための追加又は代替の品質管理基準として使用することができる。したがって、ステップ(iii)は、そのDNAサイズ分布が133〜143bpの間でピーク又はショルダーを明らかにする試料を選択することを含むこともできる。
上に示したサイズ値(166bpのピーク及び関連する値)は、アダプター又はバーコードにライゲートしていないDNA分子、すなわち母体血液に見出されるDNA分子に相当する。必要な場合は、アダプター、バーコード又はDNA分子の片方若しくは両方の末端の任意の配列タグの存在を考慮するために、これらの値を適合させることができる。
本明細書で用いるように、ピークは、試料中のDNA分子のサイズ分布を表す曲線での局所最大値を指す。ショルダーは、この曲線中の屈折点を指す。
プレシーケンシング
本発明により、プレシーケンシングは、より大きな規模の次世代シーケンシングの前に任意選択で実施することができる、小規模シーケンシングを指す。したがって、先行技術の方法に反して、本発明のこの変異形は、参照セットの各試料で連続して実施される2つのシーケンシングステップによって特徴付けられる。したがって、「プレシーケンシング」は、「第1のシーケンシング」と称することもできる。同様に、「大量並行シーケンシング」は「第2のシーケンシング」と称することができる。配列の小さいライブラリー中の固有同一配列の割合は、次世代のシーケンシングによって得られたフルスケールライブラリー中の固有同一配列の割合を代表すると発明者は仮定した。したがって、初期段階でDNA試料の小規模シーケンシングを実行することによって、不十分な量の固有同一配列しか有しない試料を早期に排除することが可能である。このプレシーケンシングステップは、その後実施される大量並行シーケンシングよりずっと少ない時間及び費用しか消費しない。したがって、本発明は、不十分な品質の試料を排除し、それによって向上した品質の参照セットを与えつつ、時間及び資源の節約を可能にする。
プレシーケンシングステップは、1試料につき1000〜100,000個の配列、なお好ましくは1試料につき5000〜50000個の配列のシーケンシングを含むことが好ましい。
各配列リードのサイズは、好ましくは20bp〜100bp、なお好ましくは40〜70bp、例えば50bpである。これらのサイズ、特に50bpは、ヒトゲノムの複数の位置にマッピングする可能性がより高い短すぎるリードと、配列中にSNPを有する可能性をもたらす長すぎるリードの間の優れた妥協である。
無細胞DNA抽出の後、及びライブラリー調製の前に上記のサイズ選択ステップが実行される場合は、プレシーケンシングのステップは通例必要でない。
配列マッピング
ヒトゲノムの上での配列のアラインメントは、例えばChiuら、2008又はFanら、2008に記載される任意の標準のアラインメントソフトウェアを用いて実行することができる。マッピングのために使用されるヒトゲノム配列は、NBCI(http://www.ncbi.nlm.nih.gov/assembly/2758/)又はUCSC(http://hgdownload.cse.ucsc.edu/downloads.html#human)によって確立された配列などの参照配列であることが好ましい。参照配列は、hg19とも称される2009年2月(hg19、GRCh37)であることが好ましい。
本発明による方法が2つのシーケンシングステップ(任意選択の変異形として)を含む場合は、それは2つのマッピングステップも含む:プレシーケンシングステップで得られた配列のマッピング、及び大量並行シーケンシングステップで得られた配列のマッピング。2つのマッピングステップは同じ方法で、すなわち同じヒトゲノム配列及び/又は同じアラインメントソフトウェアを用いて実施することが好ましい。
両方のマッピングステップは、ヒトゲノムの全配列にわたって、例えば全hg19参照配列にわたって行うことができる。
或いは、アラインメントは、ヒトゲノムの一部だけで、言い換えるとヒトゲノムの部分配列について行うことができる。一般的に言って、スコア計算で使用されるヒトゲノムの部分配列は、ヒトゲノムの所定の領域をマスキングすることによって得られる。マスキングされる領域は、以下を含むいくつかの異なるパラメータに基づいて選択することができる:領域のより低い品質のシーケンシング(これらの領域は「注釈不良領域」としても知られる);領域中での多数の反復の発生;ヒトゲノム内での領域の重複;複合体構造を有する領域。したがって、マスキングされる領域は、ヒトゲノムの注釈不良領域、ヒトゲノムの多コピー反復領域、ヒトゲノムの重複領域又は複合体構造を有する領域から選択されることが好ましい。
例えば、より低い品質のシーケンシングを有する領域又は「注釈不良」領域は、46,395,641未満の足場N50及び/又は38,508,932未満のコンティグN50及び/又は239,845,127/3,137,144,693を超える全アセンブリーギャップ長及び/又は少なくとも90%、好ましくは少なくとも95%のゲノムカバレージを有する領域である(Yandellら、2012)。注釈不良領域の例は、テロメア下領域及び動原体周囲領域である。
ゲノムアセンブリーは、足場及びコンティグで構成される。コンティグは、重複するリードの集合から得られた連続したコンセンサス配列である。足場は、シーケンシングリードのメイト対によってお互いに連結され、順序づけら、方向づけられるコンティグのセットである。コンティグN50は、先ず最も長いものから最も短いものにかけて、長さによってあらゆるコンティグを順序づけることによって計算される。次に、最も長いコンティグから出発して、この連続の合計がアセンブリー中の全てのコンティグの全長の2分の1に等しくなるまで、各コンティグの長さを合計する。アセンブリーのコンティグN50は、このリストで最も短いコンティグの長さである。足場N50は、コンティグではなく足場を使用すること以外は同じ方法で計算される。約800bpより短いコンティグ及び足場と同様に、単一のリード又はリード対−しばしば「シングルトン」と呼ばれる−だけを含む足場及びコンティグはこれらの計算から排除することができる。
ゲノムカバレージは、サイズ予想に基づくアセンブリーに含まれるゲノムの百分率を指し、これらは、細胞学的技術に通常基づく。例えば、複合構造を有する領域は、高度に変異した領域、例えば多数のCNV(コピー数変異形)及び/又はSNV(単一ヌクレオチド変異形)を有する領域である(Frazerら、2009)。例えば、ヒトゲノムの5%の推定値は、コピー数変異である。
プレシーケンシング後の固有同一配列の量に基づく品質管理
本発明による方法の任意選択のステップ(vi)は、前記試料で得られた固有同一配列の量に基づいて試料セットを選択することに存する。したがって、ステップ(vi)は、固有同一配列の最小限の量より多くを有する試料を選択すること、又は他の用語では、固有同一配列の最小限の量より少なく有する試料を排除することに存する。
本明細書で用いるように、用語「量」は、固有同一配列の絶対数、又は比を指すことができる。比は、プレシーケンシングステップで得られた配列リードの総数に対して計算することができる。しかし、比は、フィルターを通過するリードの数に対して計算することが好ましい。
フィルタリングは、アダプター配列に少なくとも部分的にマッピングされた配列を排除することに存することができる。フィルターを通過するリードの数は、アダプター配列に少なくとも部分的にマッピングされた配列リードの数を配列リードの総数から引いたものである。
好ましい実施形態では、ステップ(v)は、前記試料のプレシーケンシングステップで得られた配列リードの総数に対して少なくとも70%の固有同一配列、好ましくは少なくとも72%の固有同一配列、なお好ましくは少なくとも75%、又はなお好ましくは少なくとも77%、又はなお好ましくは少なくとも80%の固有同一配列を有する試料を選択することを含む。
無細胞DNA抽出の後、及びライブラリー調製の前に上記のサイズ選択ステップが実行される場合は、プレシーケンシングステップ及び続く前記試料で得られた固有同一配列の量に基づく試料セットの選択は通例必要でない。
大量並行シーケンシング
様々な大量並行シーケンシング技術及びプラットホームを、本発明で用いることができる。
例えば、大量並行シーケンシングプラットホームは、IlluminaのHiSeq2000プラットホームなどの「合成によるシーケンシング」システムに存することができる。このプラットホームは、成長するDNA鎖に単独塩基が組み込まれるときにそれらを検出する、可逆的ターミネーターベースの方法を使用する。「合成によるシーケンシング」システムでのシーケンシングワークフローは、3つの段階に要約することができる:
第1に、DNAライブラリーの調製:このステップは既に記載されており、上で指摘した通り、それは正倍数性の適切な参照試料を選択する全過程又は診断過程の初期に実行することができる。それは例えばDNA抽出の直後、又は抽出された無細胞DNAのサイズ選択の直後に実施される。この段階で、DNA分子は両末端でアダプターにライゲートされる。さらに、それらは、PCRによってライブラリーを増幅し、それをシーケンシングするために使用されるプライマー部位を含有する。
第2に、クラスター生成:この段階で、DNA分子はフローセル内の固体表面に連結されるオリゴヌクレオチドプローブとハイブリダイズされる。各DNA分子は固相ブリッジ増幅によって増幅され、同一の配列を有する分子のクラスターを形成する。
第3に、「合成によるシーケンシング」段階。各々蛍光標識ターミネーターを含有する4つのヌクレオチドの混合物をフローセルに導入する。各dNTPが成長するDNA鎖に組み込まれるときに蛍光標識ターミネーターを画像化し、次に切断して次の塩基の組込みを可能にする。全4つの可逆的ターミネーター結合dNTPが各シーケンシングサイクルに存在するので、天然の競合が組込みバイアスを最小にする。各サイクルで、強度シグナル測定からベースコールが直接実行される。
或いは、大量並行シーケンシングプラットホームは、例えば半導体をベースとした次世代配列技術に存することができる。
具体的な実施形態では、大量並行シーケンシングステップは、1試料につき少なくとも10,000,000個、好ましくは少なくとも20,000,000個、なお好ましくは少なくとも30,000,000個の配列をシーケンシングすることに存する。
その代わりに、又はそれに加えて、1試料につき少なくとも6,000,000個、好ましくは少なくとも8,000,000個、なお好ましくは少なくとも10,000,000個、又は少なくとも12,000,000個、又は少なくとも14,000,000個、又は少なくとも15,000,000個の固有同一配列がマッピングステップ(例えばステップ(viii))で得られる。その代わりに、又はそれに加えて、1試料につき少なくとも12,000,000個、好ましくは少なくとも15,000,000個、なお好ましくは少なくとも20,000,000個の平均数の固有同一配列がマッピングステップ(例えばステップ(viii))で得られる。
配列の総数及び/又は大量並行シーケンシングステップで得られた固有同一配列の数は、参照試料セットを形成する試料を選択する工程で品質管理基準として使用することもできる。
具体的な実施形態では、本発明による正倍数性の参照試料のセット又は正倍数性及び異数性の参照試料のセットを得る方法は、1試料につき少なくとも10,000,000個、好ましくは少なくとも20,000,000個、なお好ましくは少なくとも30,000,000個の総数の配列を有する試料を選択することを含む。
その代わりに、又はそれに加えて、本発明による正倍数性の参照試料のセット、又は正倍数性及び異数性の参照試料のセットを得る方法は、少なくとも6,000,000個、好ましくは少なくとも8,000,000個、なお好ましくは少なくとも10,000,000個、又は少なくとも12,000,000個、又は少なくとも14,000,000個、又は少なくとも15,000,000個の固有同一配列を有する試料を選択することを含む。正倍数性及び異数性の参照試料中の10,000,000〜12,500,000個の固有同一配列が特に好ましい。
その代わりに、又はそれに加えて、参照試料のセットは、大量並行シーケンシングステップで得られた少なくとも20,000,000個、好ましくは少なくとも25,000,000個、なお好ましくは少なくとも27,000,000個の平均総数の配列を有する。用語「配列総数」は、シーケンシングステップで得られた非フィルタリングリードの総数、又はシーケンシングプラットホームがフィルタリングを含む場合はフィルターを通過するリードの総数を指すことができる。そのような場合、用語「配列総数」は、好ましくはフィルターを通過するリードの総数を指す。
その代わりに、又はそれに加えて、参照試料セットは、少なくとも12,000,000個、好ましくは少なくとも15,000,000個、なお好ましくは少なくとも20,000,000個の平均数の固有同一配列を有する。
診断方法
本発明の第2の主要な態様は、母体生体試料から胎児の異数性を診断する方法に存し、診断する試料を上記の参照試料セットを得る方法で得られた試料の参照セットと比較することを特徴とする。
簡潔には、この方法のワークフローは以下の通りに要約することができる:
生体試料からの無細胞DNAの抽出;
抽出したDNA分子のNGS(大規模並行)シーケンシング;
ヒトゲノムに配列をマッピングすること;
前記試料について対象の染色体又は染色体領域のスコアを計算すること;
前記スコアを参照試料セットの同じ染色体又は染色体領域で得られたスコアのセットと比較すること;
比較の結果に基づいて胎児の染色体の異数性の有無を診断すること。
したがって、参照試料セットを得る方法の上記の実施形態と比較して、診断方法のワークフローは、ステップ(ii)、(iii)、(iv)、(v)及び(vi)、すなわちサイズ分布に基づく選択及びプレシーケンシング結果に基づく選択を必ずしも含むとは限らない。当然ながら、これは、診断する試料でサイズ分布分析/選択又はプレシーケンシングを実施することができないことを意味しない。実際、サイズが200bpを超えるDNA分子を排除するサイズ選択ステップを、検査試料からの無細胞DNAの抽出の後、及び大量並行シーケンシングの前、より詳細にはライブラリー調製の前に実施することが特に好ましい。
一般的に言って、参照試料セットを選択する方法での特定のステップに関する上記の特色及び実施形態は、胎児の異数性の診断方法での対応するステップにも適用される。
スコアリングアルゴリズム
所与の染色体又は染色体領域について計算したスコアは、所与の試料について前記染色体又は染色体領域にマッピングされた固有同一配列(UES又はUEM)カウントの指標であるパラメータである。スコアは、全ヒトゲノム配列について、又はヒトゲノムの部分配列について、又は他の用語では、一部の領域がマスキングされている配列について計算することができる。
ヒトゲノムの慎重に選択された一部だけについてスコアを計算することは、診断方法の統計的信頼度を高くする方法である。一般的に言って、スコア計算で使用されるヒトゲノムの部分配列は、ヒトゲノムの所定の領域をマスキングすることによって得られる。マスキングする領域を規定するために、領域のより低い品質のシーケンシング(他の用語では注釈不良領域とも規定される)、領域中での多数の反復の発生、ヒトゲノム内での領域の重複、複合体構造を有する領域を含む、いくつかのパラメータを考慮することができる。したがって、マスキングされる領域は、ヒトゲノムの注釈不良領域、ヒトゲノムの多コピー反復領域、ヒトゲノムの重複領域又は複合体構造を有する領域から選択されることが好ましい。
各染色体のスコアは、各染色体を所定の長さのビン、例えば50kbビンに分けることによって計算することができる。分割は、全ヒトゲノム配列で、又は部分的ヒトゲノム配列で、すなわち上で説明されるように一部の領域がマスキングされたヒトゲノム配列で実行することができる。所与のビンにマッピングされた固有同一配列(UES)の数を次にカウントし、各ビンのUESカウントを得る。
具体的な実施形態では、各ビンのUESカウントはバイアス修正され、すなわち、それはシーケンシング工程に関連するバイアスを考慮するように修正される。公知のバイアスは、ゲノム全体でのGC分布の変動によって引き起こされる。Fanら、2010、が記すように、ゲノム全体での配列タグの分布は均一でない。実際、染色体領域のGC含有量と前記領域にマッピングされた配列の数の間に正の相関が存在し、そのことは、GCに富む領域を起源とする配列がGC欠乏領域を起源とする配列よりも多く配列ライブラリーに現れる理由を説明する。このバイアスは、例えば前記ビンでのGC含有量に反比例する重みで各ビンでのUESカウントを重み付けすることによって補償することができる。
対象の染色体又は染色体領域での全てのビンの中間UESカウント値を、次に計算する。この値は染色体又は染色体領域全体でのUESカウントの代表であり、染色体又は染色体領域の配列タグ密度と称される。この中間値は、非加重UESカウントを使用することにより、又は、上に示すように各UESカウントをバイアス補正係数で重み付けすることによって計算することができる。別の実施形態では、染色体全体でのUESカウントを表すために中間値以外の他の値、例えば染色体中の全てのビンのUESカウントの合計が選択される。
最後に、対象の染色体又は染色体領域の配列タグ密度を、全ての染色体の中間配列タグ密度に標準化することができる。或いは、全ての常染色体の中間配列タグ密度にそれを標準化することができる。なお代わりに、所定の染色体セットの中間配列タグ密度にそれを標準化することができる。本明細書で用いるように、「染色体セット」は、第1染色体から第22染色体並びにX染色体及びY染色体から選択される染色体の任意の組合せを指す。なお代わりに、所定の染色体領域セットの中間配列タグ密度にそれを標準化することができる。なお代わりに、全ての染色体、又は全ての常染色体、又は所定の染色体セット、又は所定の染色体領域セットの配列タグ密度の合計にそれを標準化することができる。
染色体又は染色体領域の標準化配列タグ密度は、所与の試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標であるパラメータとして使用することができる。しかし、このパラメータは、他の値によって表すことができる:
対象の染色体又は染色体領域の配列タグ密度;
対象の前記染色体又は染色体領域にマッピングされたUESの数;
試料のUESの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたUESの数;
染色体又は染色体領域の所定のセットにマッピングされたUESの総数で標準化される対象の前記染色体又は染色体領域にマッピングされたUESの数。
図6〜13に例示されるように、異数性試料を正倍数性試料と区別し、このようにして対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である他のパラメータを得るために、他のスコアリングアルゴリズムを使用することができる。
対象の染色体は第21染色体であり、及び/又は胎児の異数性は21トリソミーであることが好ましい。或いは、対象の染色体は第18染色体であり、及び/又は胎児の異数性は18トリソミーである。或いは、対象の染色体は第13染色体であり、及び/又は胎児の異数性は13トリソミーである。或いは、対象の染色体は第22染色体であり、及び/又は胎児の異数性は22トリソミーである。或いは、対象の染色体は第4染色体であり、及び/又は胎児の異数性はウルフ−ハーシュホーン症候群である。
或いは、対象の染色体領域は、ウルフ−ハーシュホーン症候群の欠失領域を含む第4染色体の一部である。或いは、対象の染色体は第5染色体であり、及び/又は胎児の異数性はネコ鳴き症候群である。或いは、対象の染色体領域は、ネコ鳴き症候群の欠失及び/又は重複領域を含む第5染色体の一部であり、及び/又は胎児の異数性はネコ鳴き症候群である。或いは、対象の染色体は第19染色体である。或いは、対象の染色体は第1染色体である。前記の染色体又は染色体領域の任意の組合せを、具体的な実施形態として選択することもできる。
対象の染色体は第21染色体、第18染色体又は第13染色体であることがより好ましく、対象の染色体は第21染色体又は第18染色体であることがなお好ましい。
検査試料と参照試料セットの比較
検査試料の対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標として選択される検査パラメータがなんであれ、試料の参照セットの各試料について同じパラメータを計算し、このようにして参照パラメータのセットを得る(「同じパラメータ」は、検査試料のために使用したのと同じ方法を用いてパラメータが計算されるが、検査試料で得られるものの代わりに参照試料で得られたシーケンシングデータに適用されることを意味する)。
次に、検査試料で得られた検査パラメータを、参照試料で得られた参照パラメータのセットと比較する。
第1の方法では、式:
zスコア=(Ptest−平均(Pref))/(SD(Pref))
によって検査試料のzスコアを計算することによって比較を行うことができ、上式で、
testは、検査試料から計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータであり、
平均(Pref)及びSD(Pref)は、それぞれ、参照試料セットから計算される対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である参照パラメータのセットの平均及び標準偏差である。
対象の染色体又は染色体領域について異数性である試料のzスコアの絶対値は、4より上、なお好ましくは4.4より上であることが好ましい。
対象の染色体又は染色体領域について正倍数性である試料のzスコアの絶対値は、4.4より下、なお好ましくは4より下であることが好ましい。
参照試料セットの各試料のzスコアの絶対値は、4.4より下、なお好ましくは4より下であることが好ましい。
図4及び5に例示されるように、本発明による方法を使用することによる参照試料の適切なセットの選択は、4.4のzスコアをカットオフ値として、正倍数性試料からの21トリソミー及び18トリソミー試料の識別を可能にする。このzスコアは、偶然に誤った結果をもたらす≦1.1×10−5の事前確率に対応し、それは先行技術の対応するデータより極めて低い。
第2の方法では、確率に基づく計算を使用して、好ましくは正倍数性と異数性(トリソミー)の試料を含む参照セットを使用して比較を行うことができる。この方法により、工程は2つのステップを同様に含む。第1は、参照ヒトゲノムでの検査試料から得られた配列のアラインメントを含み、第2は、検査試料の各染色体で得られた結果を、参照セットの試料の対応する染色体で得られた結果と比較することを含む:
検証されたトリソミーを有する試料セットの所与の染色体についてのUESカウントから得られた値を、正常な参照試料のセットの同じ所与の染色体についてのUESカウントから得られた値と一緒にグラフに表す;
参照セットの正常な試料は、確率的に千に1つの正常な試料だけが超えるはずである値の区間を決定するために使用される。この区間を、グラフに示す。したがって、1染色体につき1つの「参照グラフ」が確立される。
次に、検査試料の所与の染色体についてUESカウントから得られた値も、臨床評価の基準として役立つ対応する参照グラフに示す。少なくとも50個、好ましくは少なくとも75個の参照試料を各々含む複数の参照セット、例えば少なくとも4つ、好ましくは6つの参照セット(例えば、図17〜38に例示する参照セットN1、N、B1、B2、A1及びA2)を、診断を確立するのに一貫して使用することにより、診断の確証を得る。
実施例1
母体血液からのDNA抽出及び品質管理アッセイ
地域の倫理委員会による承認が係属中の前向き臨床試験の状況で、100人の妊娠女性から血液試料を収集した。母体の妊娠年齢は、14.63±4.00週であった。
侵襲的出生前診断の30分後に、2つの7.5ml管(BDバキュテーナー採血管、Beckton Dickinson、NJ USA 07417、又はBCT管、Streck,Inc.、Omaha、NE 68128)を収集した。記載の通りに血漿を精製し(Chiuら2008;Fanら2008)、−20℃で直ちに冷凍した。ヌクレオスピン(nucleospin)血漿キット(Macherely Nagel、下記の通りに製造業者の指示による)、又は以下の通りのフェノール−クロロホルム方法による無細胞DNA抽出のために、2mlの一定分量の血漿を使用した。
ヌクレオスピン血漿キット(製造業者の指示による)
20μlのプロテイナーゼKを2mlの一定分量の血漿に加え、混合液を(撹拌せずに)37℃で10分の間加熱した。混合液血漿−プロテイナーゼKを5mL管に移し、次に緩衝液BBを加え(1.5×血漿容量)、それらを倒置により管を3回混合し、3秒間撹拌した。混合液をいくつかのカラムに加え(600μl/カラム)、2000g(320rpm)で30秒間、次に11000g(9600rpm)で5秒間遠心分離した。次に、カラムを1回目は500μlの緩衝液WBで洗浄して、11000g(9600rpm)で30秒間遠心分離し、2回目は250μlの緩衝液WBで洗浄して11000g(9600rpm)で3分の間遠心分離した。最後に、20μlの溶出緩衝液をカラムに加え、それを次に11000g(9600rpm)で30秒間遠心分離した。得られたDNA抽出物を単一の2mL管にプールした。
フェノール−クロロホルム方法
200μlの10%SDS、40μlの0.5M EDTA及び25μlのプロテイナーゼKを加えて、試料を58℃で2時間インキュベートした。室温で平衡化した2mlのビオフェノール(biophenol)を加えて試料を撹拌し、4000rpmで10分間遠心分離した。水相(1800ml)を新しい5ml管に移し、DNAを20μlのグリコーゲン/GlycoBlue、1/9容量の3M NaAc、及び0.7容の氷冷イソプロパノールで沈殿させた。激しく撹拌した後、2mlを新しい管に移し、最大速度の微量遠心管で10分の間遠心分離した。上清をデカントし、残りの量を加え、同じ条件下で管を遠心分離した。DNAペレットを先ず600μlのエタノール70%で、続いて600μlのエーテルで洗浄し、20μlの0.5mMトリスpH8.2に懸濁した。
PicoGreenでDNA濃度を測定し、雄胎児に対応する試料でTHO1及びSRYのqPCRアッセイを実施した。これらのアッセイの原理は、以下を数量化することである:
ヒトY染色体に存在するSRY遺伝子の137bp配列を増幅することによる雄DNA、すなわち胎児DNA;
ヒト第11染色体に存在するTHO1 STR(ショートタンデムリピート)を含む162bp配列を増幅することによる全ヒトDNA、すなわち胎児+母体のDNA。
マウス遺伝子GALTを内部対照として用いた。簡潔には、試料ごとに、12.5μlの絶対QPCRミックス(AB−1133/A、ABGene)、2.5μlのプライマー/プローブSRY/THO1/GALT混合物、及び0.4μlのAmpliTag Gold 5U/μl(N8080249、Applied Biosystems)を含有するマスターミックスを調製した。各々以下:HOに増幅する5μlのDNA試料、5μlのStd Galt10コピー/μl(GALTの標準配列)、15μlのマスターミックスを含有する25μlのPCRミックスを調製した。
各系列は、標準(10μl標準、細胞数200/10μl)を含む。50サイクルのRT−PCR(95℃/15秒;60℃/60秒)をRotorGene qPCR機器(Qiagen)で実行し、60℃でチャネルSRY(緑色)、THO1(黄色)、GALT(赤色)での獲得であった。
表1は、2つの方法、カラム及びフェノールに基づく方法で並行して抽出された雄胎児を妊娠している妊娠女性からの9つの血漿試料の比較結果を示す。見られるとおり、収量はフェノールに基づく抽出で有意により高く(p=2.2×10−5)、フェノールに基づく処置は、約5倍多くのDNA、及び最も重要なことにSRY、すなわち胎児DNAのより一貫して、より頑健なシグナルを与える(p<0.05)。表1では、「細胞数/μl」の値は標準を参照して計算され、6pgゲノムDNA/細胞の仮定に基づく細胞数でのゲノムDNAの量の等価を指す。
実施例2
染色質−免疫沈降(ChIP)に基づくショットガンシーケンシングNGSプロトコル
方法
ChIPシーケンシングプロトコル(Illumina)を指示通りに実施した。ライブラリー構築のために、20ngの無細胞DNAを使用した。全ライブラリー容量の1/15に相当する各ライブラリーの1μlを、サイズ分布分析及びピーク濃度の決定のために2100バイオアナライザー(Agilent)に流した。5個のライブラリーごとに、MiSeq(Illumina)でプレシーケンシングした。50bpの単一のリード及び50+7サイクルでライブラリーをHiSeq2000(Illumina)でシーケンシングをし、このように、指示(Illumina)に従ってTruSeq SBS v3キットを用いて1試料につき30×10個のリードをもたらした。
50個の試料で、上記の通り2つの抽出プロトコル(カラム抽出及びフェノール/クロロホルム抽出)を並行して実施した。残りの試料は、フェノール/クロロホルム方法だけで抽出した。
結果
無細胞DNAのサイズ決定は、アダプター/バーコード配列サイズの減算の後、ピークサイズはほぼ完全に予測された166bpのサイズの範囲内にあることを示す(図1;Loら2010)。ピークサイズ分布は、分析した全91個の試料で均一であり、1〜2bpの変動があった。右パネルで見られるより小さいサイズのショルダーは、胎児DNAをおそらく反映し、それは133〜143bpのピークサイズを有する。
フェノール/クロロホルム抽出プロトコルは、約166bpのピークサイズを有するDNA分子の極めてより高い濃度を与え、カラムライブラリーとフェノール/クロロホルムライブラリーの間に統計的有意差があった(p<10−25;表2、各抽出方法につき50個のライブラリーで測定したときのサイズが156bp〜176bpのDNA分子画分の濃度を示す)。
30個のプレシーケンシングライブラリー(表3)、及び91個の試料の最終出力配列(表4及び図2)の固有同一配列は、フィルターを通過するリードの75〜80%であった。
全体として、UESの中間数は20,000,000より多く、それは公表された異数性検査のための基準として使用されるそれぞれの数より4倍を超えて高い(Fanら、2008、Chiuら、2008、Stummら2012)。
各染色体を50kbビンに分け、各ビンにつき、前記ビンにマッピングされたUESの数をカウントした。ビンあたりのUESカウントの中間値を各染色体について計算し、全ての常染色体について配列タグ密度値を得た。
全91個の正倍数性及び異数性試料について図4に示すように、第21染色体の配列タグ密度を全ての常染色体の配列タグの中間密度に標準化し、このようにして、第21染色体の標準化配列タグ密度を得た。この値は、第21染色体に由来する胎児と母体のDNA断片の割合の指標である。
単一の染色体カウントを標準化するための基準を提供する参照セットを構築するために、正常な核型の試料を使用した。そのような参照セットで、本発明による診断方法は、4.4のzスコアを使用して非21トリソミー症例から21トリソミー症例を完全に識別することが可能である(図3)。
同様に、この研究で分析した全91個の正倍数性及び異数性試料について図5に示すように、第18染色体の配列タグ密度を全ての常染色体の配列タグの中間密度に標準化し、このようにして標準化配列タグ密度を得た。
図5から明らかなように、本発明による診断方法は、66個の正倍数性試料の同じ参照セットを用い、4.4のzスコアを使用することにより、非18トリソミー症例から18トリソミー症例を識別することも可能である。
全体として、本発明による方法は、偶然に誤った結果をもたらす≦1.1×10−5の事前確率で、第1世代アッセイ(Chiuら2008、Fanら2008、Stummら2012)の約2桁上のよりストリンジェントな識別を可能にする。
最後に、91個の試料から得られたデータを処理するために、別のアルゴリズムが使用されている。結果を、図6〜13に示す。この第2のアルゴリズム及び本発明の方法によって選択された参照試料のセットを用いることにより、診断方法は、偶然に誤った結果をもたらす≦1.1×10−11の事前確率で、正倍数性の試料から21トリソミー試料、13トリソミー試料、18トリソミー試料、22トリソミー試料、4p微小欠失試料、5p微小欠失−重複試料を識別することを可能にする。
実施例3:無細胞DNAのサイズ選択:
以前の研究は、血液中に存在する無細胞胎児DNAは200bpより小さく、平均でおよそ150bpであることが示されている。
規定量の血液から抽出されるDNAの量は、数ナノグラムから1マイクログラムを超える量(平均で血漿2mlに10〜50ng)まで変動することがある。DNAの分析は、おそらく細胞溶解、したがって母体起源の結果である大きなDNA断片(≧1kb)の有無によってこの変動性の大部分が引き起こされることを示している。
本発明者は、抽出した無細胞DNA試料から大きなDNA断片を排除し、このようにして胎児DNAを含有する小さいDNA断片(200bp以下)を「濃縮」し、それによって非侵襲的出生前診断検査の質を向上させたプロトコルを考案した。サイズ選択処置は、シーケンシングライブラリー調製などのいかなるさらなる処理の前に粗DNA抽出物で実行される。
サイズ選択のために、磁気ビーズ(AMPure(登録商標)Beckman Coulter)を使用した。この技術により、DNA断片を磁気ビーズに結合し、その後磁場を加えることによって汚染物質から分離する。結合したDNAをエタノールで洗浄し、その後磁気粒子から溶出させる。
実験及び結果
それらのサイズ分布を検査するために、いくつかの粗抽出無細胞DNA試料を高感度バイオアナライザーによって分析した。3つの粗DNA抽出物(GWX−351、GWX−352及びGWX−353と呼ぶ)からのDNAサイズ分布の例を、図16A(左パネル)に示す。
精製(サイズ選択)のために、20μLのDNA溶液(10ng)を試料GWX−351、−352及び−353から調製した。10μLのAMPureビーズを加え、試料を室温で数分インキュベートした。次に磁気スタンドでビーズを混合液から分離し、上清を新しい管に移した。
ビーズの分離をさらに数回実行した。最終回の精製の後、ビーズを再懸濁せずに、200μLの新鮮な80%エタノールでビーズを二回洗浄した。ビーズを次に10分間乾燥させ、10μLのEB緩衝液に再懸濁させた。
図16B(右パネル)は、AMPureビーズによる数回の連続した精製の後、試料GWX−351、−352及び−353についてのバイオアナライザーによる分析により得られた結果を示す。大分子量ピークは精製工程によって排除され、150〜200bpのより低い分子量のピークは保持される。他の試料でも、同等の結果が得られた。結果は、ビーズを使用することによって高分子量画分を除去することができ、およそ200bp以下のサイズの画分を生成することを確認する。
実施例4:サイズ選択された無細胞DNA試料での異数性の検出(1)
a)DNA抽出
血液試料を48人の妊娠女性から収集し、実施例1に記載のフェノール−クロロホルム方法で無細胞DNAを抽出した。
b)サイズが200bp未満の無細胞DNA断片の濃縮:サイズ選択
血液から抽出した無細胞DNAを、実施例3に記載の磁気ビーズ(AMPure XP(登録商標)、Beckman Coulter)でのサイズ選択の連続ステップにかけた。サイズ選択の有る無しでの異数性検出アッセイの感度の比較を可能にするために、試料の一部はサイズ選択処置にかけなかった。
c)ライブラリー調製(合成によるシーケンシング技術による大量並行シーケンシングのため)
i)末端修復:
この工程は、末端修復ミックスを使用して、dsDNAの断片化からもたらされるオーバーハングを平滑末端に変換する。このミックスの3’から5’へのエキソヌクレアーゼ活性は3’オーバーハングを除去し、ポリメラーゼ活性は5’オーバーハングを埋める。
試料DNAを含有するプレートの各ウェルに20μLの末端修復ミックス(ERP)を加え、混合液を十分に混ぜて短時間遠心分離した。次に、製造業者の指示に従ってプレートをサーマルサイクラーでインキュベートした。
試料をサーマルサイクラーから取り出し、精製ステップにかけた。
ii)アデニレート3’末端の付加
アダプターライゲート反応の過程でそれらがお互いにライゲートするのを防ぐために、及び、その3’末端に対応する単一のヌクレオチドを有する断片にアダプターをその後ライゲートするための相補的なオーバーハングを提供するために、単一の「A」ヌクレオチドを平滑dsDNA断片の3’末端に加えた。この戦略は、キメラ(連結された鋳型)形成率の低下を確かなものにする。
平滑DNA断片を含有するプレートの各ウェルに、12.5μLのAテーリングミックス(ATL)を加えた。混合と短時間の遠心分離の後、製造業者の指示に従ってプレートをサーマルサイクラーでインキュベートした。
iii)アダプターのライゲート
アデニレート3’末端の付加の直後に、PCR増幅を可能にする、Illuminaによって市販されるものなどの対末端アダプターをdsDNAの末端にライゲートする。
Aテーリングプレートの各ウェルに5μLのアダプタープレミックスを、続いて2.5μLのライゲートミックスを加えた。製造業者の指示に従ってプレートを短時間遠心分離し、サーマルサイクラーでインキュベートした。次に、ライゲートを不活性化するために、5μLの停止ライゲート緩衝液を各ウェルに加えた。精製ステップを次に実行した。
iv)DNA断片の濃縮
工程のこのステップは、各試料に特定のVINCI指数を加え、アダプター配列を完成させてフローセルでの以降のハイブリダイゼーションを可能にしつつ、両末端にアダプター分子を有するDNA断片を選択的に濃縮するためにPCRを使用する。アダプターを欠く断片はフローセルで表面結合プライマーとハイブリダイズすることができず、片方の末端だけにアダプターを有する断片は表面結合プライマーとハイブリダイズすることができるが、クラスターを形成することができない。
PCRプレートの各ウェルに34μLのPCRプレミックスを加え、続いて1μLの解凍したPCR P7指数プライマー(25μΜ)を加えた。PCRプレートの各ウェルに15μLの試料を移し、試料プレートの空のウェルに陰性対照として15μLの水を加えた。
以下のPCRプログラムを使用して、プレートをサーマルサイクラーでインキュベートした:
98℃で30秒間
以下を15サイクル:
98℃で10秒間
65℃で30秒間
72℃で30秒間
72℃で5分間
10℃で保持
増幅は、およそ280bpを中心とするスミアを生成した。約120bpでバンドを生成したあらゆる空のアダプターを、以降のAMPure精製ステップで除去した。
d)大量並行シーケンシング及びマッピング
実施例2に記載のHiSeq 2000(Illumina)でライブラリーをシーケンシングし、ヒトゲノムにマッピングした。
e)結果
各検査試料の各常染色体の固有同一配列(UES、UEMとも呼ぶ)カウントを決定し、確率スケールを用いて第1の参照セットの各試料の対応する染色体の値と比較した。この操作をさらなる5つの参照セットで繰り返し、合計6つの参照セット(A1、A2、B1、B2、N1、N2と命名)を得た。全ての参照セットは、検証された正倍数性及びトリソミーの試料を含み、上記の通り、≦200bpのDNA分子のサイズ選択ステップを含む本発明の方法に従って得られた。参照セットA1及びA2は合計267個の試料を含み;セットN1及びN2は合計167個の試料を含み:セットB1及びB2は合計100個の試料を含んだ。
具体的には、検証されたトリソミー及び検証された正倍数性を有する参照試料の第1のセット(例えば参照セットN1)中の所与の染色体のUESカウントから得られた値を、グラフにプロットした。確率的に千に1つの正常な試料だけが超えるはずである値の区間を決定するために、参照セットの正常な(正倍数性)試料を使用した。この区間を、グラフに示した。
このように、1参照セット及び1染色体につき1つの「参照グラフ」が確立された(すなわち1染色体につき6つの参照グラフ)。参照セットA1の第13、16、18及び21染色体のための「参照グラフ」は、それぞれ図39a〜39dで見ることができる(灰色のスポット)。確率区間も示す。類似の参照グラフ(灰色のスポット)は、それぞれ参照セットN1の第13、16、18及び21染色体について図40a〜40dで見ることができる。図39及び40では、内部の微細な点線は1/1000の確率閾値を表し、外部のより太い点線は1/10000の確率閾値を表す
各染色体及び各参照セットについて参照グラフが確立されたら、各検査試料の所与の染色体についてUESカウントから得られた値を、対応する参照グラフにプロットした。図39では、単一の検査試料の第13、16、18及び21染色体の値を、参照グラフにおいて円形黒点で示す。図40では、4つの異なる検査試料の第13、16、18及び21染色体の値を、参照グラフにおいて円形黒点で示す。全48個の検査試料について、この操作を全ての染色体及び全ての参照セットで実行した。
結果は、本発明の検査が胎児の異数性の検出を顕著な信頼性で可能にすることを明らかに確認した。図39a〜39dは、GWX−1137と命名された試料は第13、16、18及び21染色体が正常であることを示す。図40a〜40dは、GWX−1196、GWX−1420、GWX−1421及びGWX−1470と命名された試料は、それぞれ第13、16、18及び21染色体が正常である可能性が10000に1つ未満であることを示す。
サイズ選択処置で得られた結果、及びサイズ選択なしで得られた結果の比較は、サイズ選択が胎児画分を効果的に濃縮し、その結果、ほとんど常に存在する増加したシグナル強度が示す通り、特に低い胎児画分のより頑健な検出をもたらすことを明白に示した。全ての常染色体についてシグナル強度を評価した。全ての常染色体の比較を図17〜38に示すが、x軸「GWX」はサイズ選択なしであり、y軸「TPR」はサイズ選択ありである。サイズ選択の後のシグナル強度は、41/48又は85%の場合により強く、7/48又は15%の場合にはサイズ選択のない試料と同等であった。サイズ選択の後にシグナル強度が悪化した例は全くなかった。サイズ選択によって付与されたこの改善されたシグナル強度は、統計値を計算するために使用されたより少ないUESの存在下でさえ測定可能だった。実際、対応するサイズ選択されていない試料より少ないUESのサイズ選択された試料の25%の中で、より高いシグナル強度を有する画分はなお83%であった。シグナル強度比較の第13、16、18及び21染色体のパネルに示す通り、特に低い胎児画分で異数性はより頑健に検出された(図29、32、34及び37)。後者の実験は、サイズ選択処置によって常染色体の検出でバイアスが導入されないことも示した。
サイズ選択処置は、潜在的に偽陽性の結果も減少させた。使用した48個の試料のうち、9個は当初病的であると疑われた:7個は核型分析によって最終的に検証され、2個の境界例はサイズ選択後に正常な結果を有することがわかった。
全体として、サイズ選択処置は全般的にシグナル強度を改善することがわかり、それは、低い胎児画分を有するリスクのある試料に特に有益な、胎児画分のより頑健な検出につながった。
実施例5:サイズ選択された無細胞DNA試料での異数性の検出(2)
合成によるシーケンシングプラットホームの代わりに半導体ベースのNGSプラットホームでの使用のために、48個の検査試料を再び使用して、実施例4に記載されるプロトコルを構成した。サイズ選択及び半導体ベースのNGSプラットホームの使用を含む、検査試料の分析のために使用したのと同じ方法を使用して、6つの新しい参照セットを生成した。このプラットホームのためのライブラリー調製は、平滑末端アダプターライゲートを使用しており、dAテーリングは含まない。さらに、より少数のPCRサイクルを使用した(15回の代わりに8回)。サイズ選択ステップは、実施例4に記載のものと同一であった。
合成によるシーケンシングプラットホームを使用して生成された参照試料と一緒に、48個の試料に対して、半導体ベースのNGSプラットホームを使用した検査も実施した。この検査では、2つの実験群の間で参照試料の調製のために使用したシーケンシングプラットホームが唯一の違いであった。
3つの試料の結果を、図41a、b及びcに示す。太く黒いバーは、検査試料及び参照試料を同一のプロトコルを使用して調製したときに得られた結果を示す。より小さく細いバーは、試料を調製するために使用したシーケンシングプラットホームが参照セットを調製するために使用したものと異なったときに得られた結果を表す。検査試料及び参照セットを同じシーケンシングプラットホームで処理したときに最適な結果が得られるが、それにもかかわらず、検査試料のために使用したプラットホームが参照セットのために使用したものと異なるときにも結果が有益であり識別することがわかる。全体として、半導体技術による結果は、本発明による無細胞DNAのサイズ選択がより頑健なアッセイを提供することをさらに確認した。この実施例は、サイズ選択処置によってもたらされる利点が、大量並行シーケンシングプラットホームのタイプと無関係であることも確認する。
参考文献
Chiu RW, Chan KC, Gao Y, Lau VY, Zheng W,Leung TY, Foo CH, Xie B, Tsui NB, Lun
FM, Zee BC, Lau TK, Cantor CR, Lo YM.Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massivelyparallel genomic sequencing of DNA in maternal plasma. Proc Natl Acad Sci U SA. 2008 Dec 23;105(51 ):20458-63.
Cooper GM, Coe BP, Girirajan S, RosenfeldJA, Vu TH, Baker C, Williams C, Stalker H, Hamid R, Hannig V, Abdel-Hamid H,Bader P, McCracken E, Niyazov D, Leppig K, Thiese H, Hummel M, Alexander N,Gorski J, Kussmann J, Shashi V, Johnson K, Rehder C, Ballif BC, Shaffer LG,Eichler EE. A copy number variation morbidity map of developmental delay, NatGenet. 201 1 Aug 14;43(9):838-46
Fan HC, Blumenfeld YJ, Chitkara U, HudginsL, Quake SR. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencingDNA from maternal blood. Proc Natl Acad Sci U S A. 2008 Oct 21 ; 105(42):16266-71
Frazer KA, Murray SS, Schork NJ, Topol EJ.Human genetic variation and its contribution to complex traits. Nat Rev Genet.2009 Apr; 10(4):241-51.
Lo YM, Lun FM, Chan KC, Tsui NB, Chong KC,Lau TK, Leung TY, Zee BC, Cantor CR, Chiu RW. Digital PCR for the moleculardetection of fetal chromosomal aneuploidy. Proc Natl Acad Sci U S A. 2007 Aug7; 104(32):131 16-21.
Lo YM, Chan KC, Sun H, Chen EZ, Jiang P,Lun FM, Zheng YW, Leung TY, Lau TK, Cantor CR, Chiu RW. Maternal plasma DNAsequencing reveals the genome-wide genetic and mutational profile of the fetus.Sci Transl Med. 2010 Dec 8;2(61 ):61 ra91
Stumm M, Entezami M, Trunk N, Beck M,Locherbach J, Wegner RD, Hagen A, Becker R, Hofmann W. Noninvasive prenataldetection of chromosomal aneuploidies using different next generationsequencing strategies and algorithms. Prenat Diagn. 2012 Jun;32(6):569-77.
Yandell M, Ence D. A beginner's guide toeukaryotic genome annotation. Nat Rev Genet. 2012 Apr 18; 13(5):329-42.
Figure 2015534807

Figure 2015534807
Figure 2015534807

Figure 2015534807
Figure 2015534807
Figure 2015534807

Figure 2015534807

Figure 2015534807
Figure 2015534807

Claims (25)

  1. 無細胞DNAを含む母体生体試料から、胎児の異数性診断用参照試料のセット及び/又は参照パラメータのセットを得るための方法であって、
    正倍数性胎児を妊娠している正倍数性妊娠女性から得られた生体試料のセットから無細胞DNAを抽出するステップと;
    抽出ステップの後、各試料中のDNA分子のサイズ分布を分析して、前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップと;
    サイズ選択された各試料のDNAの大量並行シーケンシングを実施するステップと;
    試料ごとに得られた配列をヒトゲノムにマッピングするステップと;
    参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、試料ごとの対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
    参照試料のセット及び/又は参照パラメータのセットを得るステップと
    を含む方法。
  2. (i)正倍数性胎児を妊娠している正倍数性妊娠女性のセットから得られた生体試料のセットから無細胞DNAを抽出するステップと;
    (ii)各試料中のDNA分子のサイズ分布を分析するステップと;
    (iii)前記試料中のDNA分子のサイズ分布に基づいて試料の第1のセットを選択するステップと;
    (iv)試料の前記第1のセットからの各試料のDNAをプレシーケンシングするステップと;
    (v)ステップ(vi)で得られた配列をヒトゲノムにマッピングするステップと;
    (vi)ステップ(v)でヒトゲノムにマッピングされた固有同一配列の量に基づいて試料の第2のセットを選択するステップと;
    (vii)試料の前記第2のセットからの各試料のDNAを大量並行シーケンシングするステップと;
    (viii)ステップ(vii)で得られた配列をヒトゲノムにマッピングするステップと;
    (ix)ステップ(viii)でヒトゲノムにマッピングされた固有同一配列の数に基づいて参照試料のセットを選択するステップと
    を含む、請求項1に記載の方法。
  3. 生体試料のセットの各試料からの無細胞DNAの抽出が、
    前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
    前記混合物から水相を抽出するステップと;
    前記水相からDNAを沈殿させるステップと
    を含む、請求項1又は2に記載の方法。
  4. DNA分子のサイズ分布に基づいて試料のセットを選択するステップが、試料からサイズが200bpを超えるDNA分子を排除するステップを含む、請求項1〜3のいずれか一項に記載の方法。
  5. 前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップが、DNA分子の少なくとも90重量%、好ましくは95重量%より多くが200bp未満、好ましくは156bp〜176bpのサイズを有する試料を選択するステップを含む、請求項1〜3のいずれか一項に記載の方法。
  6. 前記試料中のDNA分子のサイズ分布に基づいて試料のセットを選択するステップが、少なくとも0.88ng/μLの、サイズが200bp未満、好ましくは156bp〜176bpのDNA分子を有する試料を選択するステップを含む、請求項1〜3のいずれか一項に記載の方法。
  7. サイズ選択がシーケンシングライブラリーの調製の前に実行される、請求項1〜6のいずれか一項に記載の方法。
  8. 参照試料のセットが10,000,000個を超える固有同一配列のリードを有する試料を含む、請求項1に記載の方法。
  9. ステップ(vi)が、ステップ(iv)で得られた配列の総数に対して少なくとも70%の固有同一配列を有する試料を選択するステップを含む、請求項2〜6のいずれか一項に記載の方法。
  10. ステップ(vii)が、各試料について少なくとも25,000,000個の配列をシーケンシングするステップを含む、請求項2〜6のいずれか一項に記載の方法。
  11. ステップ(ix)が、15,000,000個を超える固有同一配列のリードを有する試料を選択するステップを含む、請求項2〜6、8及び9のいずれか一項に記載の方法。
  12. 無細胞DNAを抽出する生体試料のセットが、異数性胎児を妊娠している正倍数性の妊娠女性から得られた試料をさらに含む、請求項1〜11のいずれか一項に記載の方法。
  13. 母体生体検査試料から胎児異数性を診断する方法であって、
    (a)妊娠女性から得られた母体生体検査試料から無細胞DNAを抽出するステップと;
    (b)前記検査試料から抽出された無細胞DNAを大量並行シーケンシングするステップと;
    (c)ステップ(b)で得られた配列をヒトゲノムにマッピングするステップと;
    (d)対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である検査パラメータを計算するステップと;
    (e)参照パラメータのセットを計算するステップであって、ここで各参照パラメータは、請求項1〜11で得られた参照試料のセットの試料の、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、ステップと;
    (f)ステップ(d)で計算された前記検査パラメータをステップ(e)で計算された参照パラメータの前記セットと比較するステップと;
    (g)比較に基づいて胎児異数性を診断するステップと
    を含む方法。
  14. 抽出ステップの後、前記試料中のDNA分子のサイズ分布に基づいてサイズ選択ステップを実行する、請求項13に記載の方法。
  15. サイズ選択がシーケンシングライブラリーの調製の前に実行される、請求項14に記載の方法。
  16. サイズ選択が、試料からサイズが200bpを超えるDNA分子を排除するステップを含む、請求項14又は15に記載の方法。
  17. 母体生体検査試料からの無細胞DNAの抽出が、
    前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
    前記混合物から水相を抽出するステップと;
    前記水相からDNAを沈殿させるステップと
    を含む、請求項13〜16のいずれか一項に記載の方法。
  18. 前記検査パラメータが、全ての常染色体の中間固有同一配列タグ密度に標準化した対象の染色体又は染色体領域の固有の配列タグ密度である、請求項13に記載の方法。
  19. ステップ(f)の比較が、参照パラメータのセットに対する前記検査パラメータのzスコアの計算によって実施される、請求項13に記載の方法。
  20. 前記検査パラメータが、対象の染色体若しくは染色体領域の絶対同一配列カウント、又は対象の染色体若しくは染色体領域の平均同一配列カウントである、請求項14〜16のいずれか一項に記載の方法。
  21. ステップ(f)の比較が、対象の染色体若しくは染色体領域の固有同一配列カウント、又は対象の染色体若しくは染色体領域の同一配列の平均カウントが、参照セットの対象の染色体の固有同一配列カウントの正規分布に属する確率の計算によって実施される、請求項20に記載の方法。
  22. 対象の染色体が、第21染色体、第16染色体、第18染色体、第13染色体又は第11染色体である、請求項13〜21のいずれか一項に記載の方法。
  23. 胎児と母体の無細胞DNAを含有する母体生体試料から無細胞DNAを抽出する方法であって、
    前記生体試料をクロロホルム及びフェノールを含む組成物と混合するステップと;
    前記混合物から水相を抽出するステップと;
    前記水相からDNAを沈殿させるステップと
    を含む方法。
  24. 胎児異数性の診断のためのキットであって、
    請求項1〜12のいずれか一項に記載の方法により入手可能な参照試料のセット;
    及び/又は参照パラメータのセットであって、ここで各参照パラメータは、任意選択で物理的支持体に含まれる請求項1〜11のいずれか一項に記載の方法により入手可能な参照セットの試料の、対象の染色体又は染色体領域にマッピングされた固有同一配列の数の指標である、参照パラメータのセット
    を含むキット。
  25. 無細胞DNAを抽出するための、フェノール及びクロロホルムを含む組成物を含む、1つ又は複数の組成物及び/又はキット;
    母体生体試料からの胎児異数性診断用参照試料のセットを得るための方法の1つ又は複数のステップを実施するためのコンピュータプログラム製品;
    母体生体検査試料から胎児異数性を診断するための方法の1つ又は複数のステップを実行するためのコンピュータプログラム製品
    の少なくとも1つをさらに含む、請求項24に記載のキット。
JP2015538513A 2012-10-31 2013-10-31 胎児の染色体異数性を検出するための非侵襲的方法 Pending JP2015534807A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP12190844.6 2012-10-31
EP12190844.6A EP2728014B1 (en) 2012-10-31 2012-10-31 Non-invasive method for detecting a fetal chromosomal aneuploidy
PCT/EP2013/072848 WO2014068075A1 (en) 2012-10-31 2013-10-31 Non-invasive method for detecting a fetal chromosomal aneuploidy

Publications (1)

Publication Number Publication Date
JP2015534807A true JP2015534807A (ja) 2015-12-07

Family

ID=47172444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015538513A Pending JP2015534807A (ja) 2012-10-31 2013-10-31 胎児の染色体異数性を検出するための非侵襲的方法

Country Status (10)

Country Link
US (1) US20150275290A1 (ja)
EP (3) EP3026124A1 (ja)
JP (1) JP2015534807A (ja)
CN (1) CN105074004A (ja)
AU (1) AU2013340795A1 (ja)
CA (1) CA2888906A1 (ja)
DK (1) DK2728014T3 (ja)
HK (1) HK1208708A1 (ja)
IL (1) IL238426A0 (ja)
WO (1) WO2014068075A1 (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
EP2854057B1 (en) 2010-05-18 2018-03-07 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
JP6153874B2 (ja) 2011-02-09 2017-06-28 ナテラ, インコーポレイテッド 非侵襲的出生前倍数性呼び出しのための方法
US20140100126A1 (en) 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
JP7451070B2 (ja) 2013-11-07 2024-03-18 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー ヒトミクロビオームおよびその成分の分析のための無細胞核酸
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
RU2699728C2 (ru) * 2014-07-25 2019-09-09 БиДжиАй Дженомикс Ко., Лтд. Способ и устройство для определения фракции внеклеточных нуклеиновых кислот в биологическом образце и их применение
EP3018213A1 (en) 2014-11-04 2016-05-11 Genesupport SA Method for determining the presence of a biological condition by determining total and relative amounts of two different nucleic acids
EP4428863A2 (en) 2015-05-11 2024-09-11 Natera, Inc. Methods and compositions for determining ploidy
CA2986036C (en) 2015-05-18 2022-07-26 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
WO2017093561A1 (en) 2015-12-04 2017-06-08 Genesupport Sa Method for non-invasive prenatal testing
SG11201804651XA (en) * 2015-12-04 2018-07-30 Green Cross Genome Corp Method for determining copy-number variation in sample comprising mixture of nucleic acids
GB201522665D0 (en) * 2015-12-22 2016-02-03 Premaitha Ltd Detection of chromosome abnormalities
BR112018069557A2 (pt) 2016-03-25 2019-01-29 Karius Inc spike-ins de ácido nucléico sintético
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
WO2018137496A1 (zh) * 2017-01-24 2018-08-02 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
US10697008B2 (en) 2017-04-12 2020-06-30 Karius, Inc. Sample preparation methods, systems and compositions
CN108342455B (zh) * 2017-06-25 2021-11-30 北京新羿生物科技有限公司 一种从母体外周血检测胎儿非整倍体染色体的方法及其试剂盒
EP4026915B1 (en) * 2017-09-28 2023-10-25 Grail, LLC Enrichment of short nucleic acid fragments in sequencing library preparation
US12084720B2 (en) 2017-12-14 2024-09-10 Natera, Inc. Assessing graft suitability for transplantation
WO2019178157A1 (en) 2018-03-16 2019-09-19 Karius, Inc. Sample series to differentiate target nucleic acids from contaminant nucleic acids
CA3090426A1 (en) 2018-04-14 2019-10-17 Natera, Inc. Methods for cancer detection and monitoring by means of personalized detection of circulating tumor dna
CN112292458A (zh) * 2018-05-03 2021-01-29 香港中文大学 测量无细胞混合物特性的尺寸标记的优选末端和识别方向的分析
WO2019227420A1 (zh) * 2018-05-31 2019-12-05 深圳华大临床检验中心 确定男性待测样本是否存在三倍体的方法、系统和计算机可读介质
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CN109584963A (zh) * 2018-09-30 2019-04-05 南京派森诺基因科技有限公司 一种高通量测序数据的多样化抽取方法
WO2020214547A1 (en) * 2019-04-15 2020-10-22 Natera, Inc. Improved liquid biopsy using size selection
RU2717023C1 (ru) * 2019-04-24 2020-03-17 Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" Способ определения кариотипа плода беременной женщины на основании секвенирования гибридных прочтений, состоящих из коротких фрагментов внеклеточной ДНК
WO2022035670A1 (en) * 2020-08-09 2022-02-17 Myriad Women's Health, Inc. Bayesian sex caller

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005508619A (ja) * 2001-08-03 2005-04-07 ディヴァーサ コーポレイション エポキシドヒドロラーゼ、それらをコードした核酸及びそれらの作製法と利用法
JP2007508017A (ja) * 2003-10-08 2007-04-05 ザ トラスティーズ オブ ボストン ユニバーシティ 染色体異常の出生前診断のための方法
JP2007515947A (ja) * 2003-10-30 2007-06-21 タフツ−ニュー イングランド メディカル センター 羊水中の無細胞胎児dnaを使用する出生前診断
JP2010534069A (ja) * 2007-07-23 2010-11-04 ザ チャイニーズ ユニバーシティー オブ ホンコン ゲノム配列決定を使用する胎児染色体異数性の診断
WO2011090556A1 (en) * 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
US20120270739A1 (en) * 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005508619A (ja) * 2001-08-03 2005-04-07 ディヴァーサ コーポレイション エポキシドヒドロラーゼ、それらをコードした核酸及びそれらの作製法と利用法
JP2007508017A (ja) * 2003-10-08 2007-04-05 ザ トラスティーズ オブ ボストン ユニバーシティ 染色体異常の出生前診断のための方法
JP2007515947A (ja) * 2003-10-30 2007-06-21 タフツ−ニュー イングランド メディカル センター 羊水中の無細胞胎児dnaを使用する出生前診断
JP2010534069A (ja) * 2007-07-23 2010-11-04 ザ チャイニーズ ユニバーシティー オブ ホンコン ゲノム配列決定を使用する胎児染色体異数性の診断
WO2011090556A1 (en) * 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
US20120270739A1 (en) * 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
AMERICAN JOURNAL OF OBSTETRICS & GYNECOLOGY, vol. V204 N3, JPN5015011418, 28 December 2010 (2010-12-28), pages 205 - 1, ISSN: 0003624246 *
ANNALS OF BIOLOGICAL RESEARCH [ONLINE], vol. V2 N6, JPN5015011414, 1 January 2011 (2011-01-01), pages 155 - 164, ISSN: 0003772967 *
BMJ, vol. 339, JPN6017031671, 18 July 2009 (2009-07-18), pages 161 - 165, ISSN: 0003624248 *
BMJ, vol. V342 N JAN11 1, JPN5015011416, 11 January 2011 (2011-01-11), pages 7401 - 1, ISSN: 0003624244 *
CLINICA CHIMICA ACTA, vol. 404, no. 2, JPN6017031670, 27 June 2009 (2009-06-27), pages 100 - 104, ISSN: 0003624247 *
EURASIAN JOURNAL OF BIOSCIENCES, vol. V5, JPN5015011413, 1 November 2011 (2011-11-01), pages 119 - 126, ISSN: 0003772966 *
PLOS ONE, vol. V6 N7, JPN5015011417, 6 July 2011 (2011-07-06), pages 21791 - 1, ISSN: 0003624245 *
PNAS, vol. V105 N42, JPN5015011419, 21 October 2008 (2008-10-21), pages 16266 - 16271, ISSN: 0003772969 *
PNAS, vol. V105 N51, JPN5015011415, 23 December 2008 (2008-12-23), pages 20458 - 20463, ISSN: 0003772968 *
SCIENCE TRANSLATIONAL MEDICINE, vol. V2 N61ra91, P1-13, JPN5015011420, 8 December 2010 (2010-12-08), US, ISSN: 0003772970 *

Also Published As

Publication number Publication date
CN105074004A (zh) 2015-11-18
EP3026124A1 (en) 2016-06-01
EP2728014A1 (en) 2014-05-07
IL238426A0 (en) 2015-06-30
AU2013340795A1 (en) 2015-05-14
US20150275290A1 (en) 2015-10-01
EP2914738A1 (en) 2015-09-09
WO2014068075A1 (en) 2014-05-08
DK2728014T3 (en) 2016-01-25
HK1208708A1 (en) 2016-04-15
EP2728014B1 (en) 2015-10-07
CA2888906A1 (en) 2014-05-08

Similar Documents

Publication Publication Date Title
JP2015534807A (ja) 胎児の染色体異数性を検出するための非侵襲的方法
JP7490219B2 (ja) ゲノム配列決定を使用する胎児染色体異数性の診断
JP7021148B2 (ja) 性染色体におけるコピー数変異を判定するための方法
JP6513622B2 (ja) 非侵襲的出生前診断に有用な母体試料由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物
KR102184868B1 (ko) 카피수 변이를 판정하기 위한 dna 단편 크기의 사용
JP6328934B2 (ja) 非侵襲性出生前親子鑑定法
JP6830094B2 (ja) 染色体異常を検出するための核酸及び方法
CN110800063B (zh) 使用无细胞dna片段大小检测肿瘤相关变体
JP6161607B2 (ja) サンプルにおける異なる異数性の有無を決定する方法
JP2017176181A (ja) 胎児の染色体異数性の診断
EP3018213A1 (en) Method for determining the presence of a biological condition by determining total and relative amounts of two different nucleic acids
JP2017506908A (ja) 対象シークエンスを有する核酸の量の減少または増加の検出方法
EP3666902B1 (en) Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
EP3662479A1 (en) A method for non-invasive prenatal detection of fetal sex chromosomal abnormalities and fetal sex determination for singleton and twin pregnancies
CN106029899A (zh) 确定染色体预定区域中snp信息的方法、系统和计算机可读介质
CN111321210B (zh) 一种无创产前检测胎儿是否患有遗传疾病的方法
WO2015042649A1 (en) A quantitative assay for target dna in a mixed sample comprising target and non-target dna
EP3149202A1 (en) Method of prenatal diagnosis
WO2024076469A1 (en) Non-invasive methods of assessing transplant rejection in pregnant transplant recipients

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170822

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180410