JP2020054400A - 高度多重pcr法および組成物 - Google Patents

高度多重pcr法および組成物 Download PDF

Info

Publication number
JP2020054400A
JP2020054400A JP2020005470A JP2020005470A JP2020054400A JP 2020054400 A JP2020054400 A JP 2020054400A JP 2020005470 A JP2020005470 A JP 2020005470A JP 2020005470 A JP2020005470 A JP 2020005470A JP 2020054400 A JP2020054400 A JP 2020054400A
Authority
JP
Japan
Prior art keywords
target
primer
dna
allele
primers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020005470A
Other languages
English (en)
Other versions
JP6997813B2 (ja
Inventor
ベルンハルト ツィマーマン,
Zimmermann Bernhard
ベルンハルト ツィマーマン,
マシュー エム. ヒル,
M Hill Matthew
マシュー エム. ヒル,
フィリップ ギルバート ラクルート,
Gilbert Lacroute Philippe
フィリップ ギルバート ラクルート,
マイケル ドッド,
Dodd Michael
マイケル ドッド,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Natera Inc
Original Assignee
Natera Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/683,604 external-priority patent/US20130123120A1/en
Application filed by Natera Inc filed Critical Natera Inc
Publication of JP2020054400A publication Critical patent/JP2020054400A/ja
Priority to JP2021204979A priority Critical patent/JP2022037145A/ja
Application granted granted Critical
Publication of JP6997813B2 publication Critical patent/JP6997813B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】本発明は、1反応体積で対象の複数の核酸領域を同時に増幅する方法、ならびに、このような増幅法に使用するプライマーライブラリーを選択する方法を提供する。また、本発明は、増幅プライマー二量体またはその他の非標的増幅産物の最小限の形成など所望の特性を有するプライマーライブラリーを提供する。【解決手段】例えば、核酸試料中の標的遺伝子座を増幅する方法であって、(a)少なくとも1,000個の異なる標的遺伝子座に同時にハイブリダイズする試験プライマーライブラリーと前記核酸試料を接触させ反応混合物を生成するステップと、(b)前記反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、を含む方法が提供される。【選択図】図29

Description

関連出願の相互参照
本出願は、2012年11月21日出願の米国実用新案出願第13/683,604号、および2012年7月24日出願の米国特許仮出願第61/675,020号の利益と優先権を主張する。米国実用新案出願第13/683,604号は、2011年5月18日出願の米国実用新案出願第13/110,685号の一部継続である2011年11月18日出願の米国実用新案出願第13/300,235号の一部継続であり、2012年7月24日出願の米国特許仮出願第61/675,020号の利益を主張する。米国実用新案出願第13/110,685号は、2010年5月18日出願の米国特許仮出願第61/395,850号;2010年6月21日出願の米国特許仮出願第61/398,159号;2011年2月9日出願の米国特許仮出願第61/462,972号;2011年3月2日出願の米国特許仮出願第61/448,547号;および2011年4月12日出願の米国特許仮出願第61/516,996号の利益を主張する。米国実用新案出願第13/300,235号は、2011年6月23日出願の米国特許仮出願第61/571,248号の利益を主張する。これら全ての特許出願の全体は、それらのすべての教示のために参照により本明細書中に組み込まれる。
連邦政府による資金提供を受けた研究開発の記載
本発明は、認可番号第5R44HD60423−3号による米国国立衛生研究所の支援によって行われた。米国政府は本出願に由来する全ての特許に対し権利を保有できる。
発明の分野
本発明は、一般に、複数の目的の核酸領域を1反応体積で同時に増幅する方法と組成物に関する。
アッセイスループットを高め、核酸試料のより効率的な使用を可能とするために、多くのオリゴヌクレオチドプライマーを試料と混合した後、当技術分野で多重PCRとして知られるプロセスでポリメラーゼ連鎖反応(PCR)条件に試料を供することにより、目的の試料中の多くの標的核酸の同時増幅を実行できる。多重PCRの使用は、非常に単純な実験手順であり、核酸分析および検出に要する時間を短縮できる。しかし、複数の対が同じPCR反応に加えられる場合、増幅されたプライマー二量体などの非標的増幅産物が生成されることがある。プライマーの数が増えるに伴いこのような産物生成の可能性が増加する。これらの非標的増幅産物は、その後の分析、および/またはアッセイでの増幅産物の使用を大きく制限する。従って、多重PCRの間の非標的増幅産物の形成を減らすように改善された方法が必要である。
改善された多重PCR法は、非侵襲的出生前遺伝子診断(NPD)などの様々な用途に有用となるであろう。具体的には、出生前診断の現行の方法により、医師および親に、成長している胎児の異常を警告することができる。出生前診断をしないと、50人に1人の乳児が重大な身体的または精神的ハンディキャップを持って生まれ、30人に1人もが先天性奇形のいくつかの形態を有する。残念ながら、標準の方法は、正確度が乏しいか、または流産のリスクを有する侵襲的な手順を伴う。母系の血中ホルモンレベルまたは超音波測定に基づく方法は非侵襲的であるが、同様に正確度が低い。羊水穿刺、絨毛膜絨毛生検および胎児の血液試料採取などの方法は正確度が高いが、侵襲的であり、著しいリスクを有する。米国では全妊娠のおよそ3%に対して羊水穿刺が実施されたが、その使用頻度は過去15年にわたって減少している。
正常なヒトは、健康な二倍体細胞の全てに23種の染色体を2組有し、1つのコピーが各親に由来する。多すぎる染色体および/または少なすぎる染色体を有する核細胞における状態である異数性が、着床の失敗、流産、および遺伝病の大部分に関与すると考えられる。染色体異常を検出することにより、とりわけ、妊娠成功の機会が増すことに加えて、ダウン症候群、クラインフェルター症候群、およびターナー症候群などの状態を有する個体または胚を同定することができる。染色体異常を検査することは、母親の年齢が35歳から40歳の間では胚の少なくとも40%が異常であり、40歳を超えると、胚の半分超が異常であるということが推定されるので、特に重要である。
最近、無細胞胎児DNAおよびインタクトな胎児細胞が母系の血液循環系に進入し得ることが発見された。したがって、この遺伝材料を分析することにより、早期のNPDが可能になると思われる。改善された方法では、感度および特異性が高められ、NPDに要する時間とコストが減らされるのが望ましい。
一態様では、本発明は、核酸試料中の標的遺伝子座を増幅する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)核酸試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズする試験プライマーライブラリーと接触させて反応混合物を生成するステップと、(ii)反応混合物をプライマー伸長反応条件に供し、標的増幅産物を含む増幅産物を生成するステップとを含む。いくつかの実施形態では、前記方法は、少なくとも1個の標的増幅産物(例えば、少なくとも、50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の存在の有無を判定するステップも含む。いくつかの実施形態では、前記方法は、少なくとも1種の標的増幅産物(例えば、少なくとも、50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の配列を決定するステップも含む。
本発明のいずれかの態様の種々の実施形態では、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。いくつかの実施形態では、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の増幅産物が標的増幅産物である。いくつかの実施形態では、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅される。種々の実施形態では、増幅産物の内の60、50、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満がプライマー二量体である。いくつかの実施形態では、試験プライマーのライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の試験プライマー対を含み、各プライマー対は、同じ標的遺伝子座にハイブリダイズするフォワード試験プライマーおよびリバース試験プライマーを含む。いくつかの実施形態では、試験プライマーのライブラリーは、異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の個別試験プライマーを含み、個別プライマーは、プライマー対の一部ではない。
本発明のいずれかの態様の種々の実施形態では、各試験プライマーの濃度は、100、75、50、25、10、5、2、または1nM未満である。種々の実施形態では、試験プライマーのGC含量は、30〜80%で、例えば、40〜70%または50〜60%である。いくつかの実施形態では、試験プライマーのGC含量の範囲(例えば、最大GC含量−最小GC含量、例えば、80%−60%=20%の範囲)は、30、20、10、または5%未満である。いくつかの実施形態では、試験プライマーの融解温度(T)は、40〜80℃、例えば、50〜70℃、55〜65℃、または57〜60.5℃である。いくつかの実施形態では、試験プライマーの融解温度の範囲は、20、15、10、5、3、または1℃未満の範囲である。いくつかの実施形態では、試験プライマーの長さは、15〜100ヌクレオチド、例えば、15〜75ヌクレオチド、15〜40ヌクレオチド、17〜35ヌクレオチド、18〜30ヌクレオチド、20〜65ヌクレオチドである。いくつかの実施形態では、試験プライマーは、標的特異的ではないタグ、例えば、内部ループ構造を形成するタグを含む。いくつかの実施形態では、タグは、2つのDNA結合領域の間に存在する。種々の実施形態では、試験プライマーは、標的遺伝子座に特異的な5’領域、標的遺伝子座に特異的でないループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。種々の実施形態では、3’領域の長さは、少なくとも7ヌクレオチドである。いくつかの実施形態では、3’領域の長さは、7〜20ヌクレオチド、例えば、7〜15ヌクレオチド、または7〜10ヌクレオチドである。種々の実施形態では、試験プライマーは、標的遺伝子座に特異的ではない5’領域(例えば、タグまたはユニバーサルプライマー結合部位)、それに続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的でないループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。いくつかの実施形態では、試験プライマーの長さの範囲は、50、40、30、20、10、または5ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さは、50〜100ヌクレオチド、例えば、60〜80ヌクレオチド、または60〜75ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、50、25、15、10、または5ヌクレオチド未満である。
本発明のいずれかの態様の種々の実施形態では、プライマー伸長反応条件は、ポリメラーゼ連鎖反応条件(PCR)である。種々の実施形態では、アニーリングステップの長さは、3、5、8、10、または15分超である。種々の実施形態では、伸長ステップの長さは、3、5、8、10、または15分超である。
本発明のいずれかの態様の種々の実施形態では、胎児染色体異常の存在の有無を判定するための胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅するために試験プライマーが使用される。種々の実施形態では、前記方法は、ユニバーサルプライマー結合部位を試料中のDNA分子にライゲーションするステップと、少なくとも1,000個の特異的プライマーおよびユニバーサルプライマーを使ってライゲーションしたDNA分子を増幅し、第1の増幅産物の集合を生成するステップと少なくとも1,000対の特異的プライマーを使って第1の増幅産物の集合を増幅して第2の増幅産物の集合を生成するステップとを含む。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマー対が使われる。
本発明のいずれかの態様の種々の実施形態では、試験プライマーを使って、胎児の父親とされる人由来のDNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅し、さらに胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の標的遺伝子座を同時に増幅して、父親とされる人が胎児の生物学上の父親であるかどうかが確定される。
本発明のいずれかの態様の種々の実施形態では、試験プライマーを使用して、胚由来の1個の細胞または複数の細胞中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅して染色体異常の存在の有無が判定される。種々の実施形態では、2個以上の胚の集合由来の細胞が分析され、インビトロ受精用に一個の胚が選択される。
本発明のいずれかの態様の種々の実施形態では、試験プライマーを使って、法医学核酸試料中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、アニーリングステップの長さは、3、5、8、10、または15分超である。
本発明のいずれかの態様の種々の実施形態では、前記方法は、試験プライマーを使って、対照核酸試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅して第1の標的増幅産物の集合を生成し、さらに試験核酸試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと第1と第2の標的増幅産物の集合を比較して、標的遺伝子座が1個の試料中に存在するがその他の試料中には存在しないかどうか、または標的遺伝子座が対照試料中と試験試料中で異なるレベルで存在するかどうかを判定するステップとを含む。種々の実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)であるか、または対象疾患もしくは表現型である危険性の増加が疑われる個体由来であり、さらに1個または複数個の標的遺伝子座が、対象疾患もしくは表現型の危険性の増加に関連する、または対象疾患もしくは表現型に関連する配列(例えば、多型または他の変異)を含む。種々の実施形態では、前記方法は、試験プライマーを使って、RNAを含む対照試料中の1,000個の異なる標的遺伝子座を同時に増幅して第1の標的増幅産物の集合を生成し、さらにRNAを含む試験試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと第1と第2の標的増幅産物の集合を比較し、対照試料と試験試料との間のRNA発現レベルの差異の有無を判定するステップとを含む。種々の実施形態では、RNAは、mRNAである。種々の実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)であることが疑われるか、または対象疾患もしくは表現型(例えば、癌)の危険性の増加が疑われる個体由来であり、1個または複数個の標的遺伝子座は、対象疾患もしくは表現型の危険性の増加に関連するか、または対象疾患もしくは表現型に関連する配列(例えば、多型または他の変異)を含む。いくつかの実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)と診断された個体由来であり、この場合、対照試料と試験試料との間のRNA発現レベルの差異は、標的遺伝子座が対象疾患もしくは表現型の危険性の増加または減少に関連する配列(例えば、多型または他の変異)を含むことを示す。
本発明のいずれかの態様のいくつかの実施形態では、試験プライマーは、本発明のいずれかの方法を使ったプライマーの選択などの1個または複数個のパラメータに基づく候補プライマーのライブラリーから選択される。いくつかの実施形態では、試験プライマーは、候補プライマーのプライマー二量体形成能力に少なくとも一部基づいて候補プライマーライブラリーから選択される。
一態様では、本発明は、候補プライマーライブラリーから試験プライマーを選択する方法を特徴とする。種々の実施形態では、選択は、(i)コンピュータを使ってライブラリー由来の2個の候補プライマーの大部分または全ての可能な組み合わせに対するアンデザイアラビリティスコア(undesirability score)を計算するステップであって、それぞれのアンデザイアラビリティスコアが、2個の候補プライマー間の二量体形成の尤度に少なくとも一部基づくステップと、(ii)最高のアンデザイアラビリティスコアを有する候補プライマーライブラリー由来の候補プライマーを除去するステップと、(iii)ステップ(ii)で除去された候補プライマーがプライマー対のメンバーである場合、候補プライマーライブラリー由来のプライマー対のもう一方のメンバーを除去するステップと、(iv)任意選択で、ステップ(ii)と(iii)を反復して試験プライマーライブラリーを選択するステップとを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て最小閾値以下になるまで行われる。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの数が所望の数まで減らされるまで行われる。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の候補プライマーの可能な組み合わせの少なくとも80、90、95、98、99、または99.5%に対し計算される。種々の実施形態では、ライブラリー中に残っている候補プライマーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅できる。種々の実施形態では、前記方法は、(v)標的遺伝子座を含む核酸試料をライブラリー中に残っている候補プライマーと接触させて反応混合物を生成するステップ;および(vi)反応混合物をプライマー伸長反応条件に供し、標的増幅産物を含む増幅産物を生成するステップも含む。
一態様では、本発明は、候補プライマーライブラリーから試験プライマーを選択する方法を特徴とする。種々の実施形態では、候補プライマーライブラリーからの試験プライマーの選択方法は、(i)コンピュータを使ってライブラリー由来の2個の候補プライマーの大部分または全ての可能な組み合わせに対するアンデザイアラビリティスコアを計算するステップであって、各アンデザイアラビリティスコアが、2個の候補プライマー間の二量体形成の尤度に少なくとも一部基づくステップと、(ii)候補プライマーライブラリーから第1の最小閾値を超えるアンデザイアラビリティスコアを有する2個の候補プライマーの組み合わせのうち最多数のもののの一部である候補プライマーを除去するステップと、(iii)ステップ(ii)で除去された候補プライマーがプライマー対のメンバーである場合、候補プライマーライブラリー由来のプライマー対の残りのメンバーを除去するステップと、(iv)任意選択で、ステップ(ii)と(iii)を反復し、試験プライマーライブラリーを選択するステップとを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが、全て第1の最小閾値以下となるまで行われる。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで行われる。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の可能な候補プライマー組み合わせの少なくとも80、90、95、98、99、または99.5%に対して計算される。種々の実施形態では、ライブラリー中に残っている候補プライマーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅できる。種々の実施形態では、前記方法は、(v)標的遺伝子座を含む核酸試料をライブラリー中に残っている候補プライマーと接触させて反応混合物を生成するステップ;および(vi)反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップも含む。
本発明のいずれかの態様の種々の実施形態では、選択法は、ステップ(ii)で使われる第1の最小閾値をより小さい第2の最小閾値に下げることによりライブラリー中に残っている候補プライマーの数をさらに減らすステップ、および任意選択で(ii)と(iii)を反復するステップ含む。いくつかの実施形態では、選択法は、ステップ(ii)で使われる第1の最小閾値をより大きい第2の最小閾値に高めるステップ、および任意選択で(ii)と(iii)を反復するステップを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て第2の最小閾値以下になるまで、またはライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで、実行される。
本発明のいずれかの態様の種々の実施形態では、前記方法は、ステップ(i)の前に、標的遺伝子座にハイブリダイズするプライマーを特定するか、または選択するステップを含む。いくつかの実施形態では、複数プライマー(またはプライマー対)が、同じ標的遺伝子座にハイブリダイズするが、1個または複数個のパラメータに基づく選択法を使って、この標的遺伝子座に対し1個のプライマー(または1個のプライマー対)が選択される。種々の実施形態では、前記方法は、ステップ(ii)の前に、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対をライブラリーから除去するステップを含む。種々の実施形態では、候補プライマーライブラリーから除去することを目的として、1個または複数個の他のパラメータに基づいて、同等のアンデザイアラビリティスコアを有する2個以上の候補プライマーの群から候補プライマーが選択される。いくつかの実施形態では、ライブラリー中に残っている候補プライマーは、本発明のいずれかの方法で試験プライマーライブラリーとして使用される。いくつかの実施形態では、得られた試験プライマーライブラリーは、本発明のプライマーライブラリーのいずれかを含む。
本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づく。
本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づき、また、試験プライマーを使って、胎児染色体異常の有無を判定するための胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、前記方法は、ユニバーサルプライマー結合部位を試料中のDNA分子にライゲーションするステップと、少なくとも1,000特異的プライマーおよびユニバーサルプライマーを使ってライゲーションしたDNA分子を増幅し第1の増幅産物の集合を生成するステップと、少なくとも1,000対の特異的プライマーを使って第1の増幅産物の集合を増幅して第2の増幅産物の集合を生成するステップとを含む。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマー対が使用される。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。
本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群から選択される1個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、胎児の父親とされる人由来のDNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座が増幅され、また、胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の標的遺伝子座が同時に増幅されて、父親とされる人が生物学上の胎児の父親であるかどうかが確定される。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。
本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、胚由来の1個の細胞または複数個の細胞中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅されて染色体異常の有無が判定される。種々の実施形態では、2個以上の胚の集合由来の細胞が分析され、1個の胚がインビトロ受精用に選択される。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。
本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、法医学核酸試料中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、アニーリングステップの長さは、3、5、8、10、または15分超である。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。
本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、前記方法は、試験プライマーを使って対照核酸試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅し、第1の標的増幅産物の集合を生成し、試験核酸試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと、第1と第2の標的増幅産物集合を比較して、標的遺伝子座が1つの試料中に存在し、他のものには存在しないかどうか、または、標的遺伝子座が対照試料と試験試料中で異なるレベルで存在するかどうかを判定するステップとを含む。種々の実施形態では、試験試料は、対象疾患もしくは表現型、または対象疾患もしくは表現型の危険性の増加が疑われる個人由来であり、この場合、1個または複数個の標的遺伝子座が、標的遺伝子座に対象疾患もしくは表現型の危険性の増加に関連するかまたは対象疾患もしくは表現型に関連する配列(例えば、多型)を含む。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。
本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、前記方法は、試験プライマーを使ってRNAを含む対照核酸試料中の1,000個の異なる標的遺伝子座を同時に増幅し、第1の標的増幅産物の集合を生成し、RNAを含む試験試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと、第1と第2の標的増幅産物の集合を比較して対照試料と試験試料との間のRNA発現レベルの差異の有無を判定するステップとを含む。種々の実施形態では、RNAは、mRNAである。種々の実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)または対象疾患もしくは表現型(例えば、癌)の危険性の増加が疑われる個体由来であり、この場合、1個または複数個の標的遺伝子座は、対象疾患もしくは表現型の危険性の増加に関連するかまたは対象疾患もしくは表現型に関連する配列(例えば、多型または他の変異)を含む。いくつかの実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)であると診断された個体由来であり、この場合、対照試料と試験試料との間のRNA発現レベルの差異は、標的遺伝子座が対象疾患もしくは表現型の増加または減少に関連する配列(例えば、多型または他の変異)を含むことを示す。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。
一態様では、本発明は、プライマーライブラリーを特徴とする。いくつかの実施形態では、プライマーは、本発明のいずれかの方法を使って候補プライマーライブラリーから選択される。いくつかの実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーを含む。いくつかの実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、60、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満の増幅産物がプライマー二量体となるように、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の増幅産物が標的増幅産物であるように、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座からの少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅されるように、標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、プライマーライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000プライマー対を含み、各プライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、各試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ、異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。
本発明のいずれかの態様の種々の実施形態では、各プライマーの濃度は、100、75、50、25、10、5、2、または1nM未満である。種々の実施形態では、プライマーのGC含量は、30〜80%で、例えば、40〜70%または50〜60%である。いくつかの実施形態では、プライマーのGC含量範囲は、30、20、10、または5%未満である。いくつかの実施形態では、プライマーの融解温度は、40〜80℃で、例えば、50〜70℃,55〜65℃,または57〜60.5℃である。いくつかの実施形態では、プライマーの融解温度の範囲は、15、10、5、3、または1℃未満である。いくつかの実施形態では、プライマーの長さは、15〜100ヌクレオチドで、例えば、15〜75ヌクレオチド、15〜40ヌクレオチド、17〜35ヌクレオチド、18〜30ヌクレオチド、または20〜65ヌクレオチドの長さである。いくつかの実施形態では、プライマーは、標的特異的ではないタグ、例えば、内部ループ構造を形成するタグを含む。いくつかの実施形態では、タグは、2個のDNA結合領域の間に存在する。種々の実施形態では、プライマーは、標的遺伝子座に対し特異的な5’領域、標的遺伝子座に特異的でなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。種々の実施形態では、3’領域の長さは、少なくとも7ヌクレオチドである。いくつかの実施形態では、3’領域の長さは、7〜20ヌクレオチドであり、例えば、7〜15ヌクレオチド、または7〜10ヌクレオチドである。種々の実施形態では、プライマーは、標的遺伝子座に対し特異的ではない5’領域(例えば、別のタグまたはユニバーサルプライマー結合部位)、続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的でなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。いくつかの実施形態では、プライマーの長さの範囲は、50、40、30、20、10、または5ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さは、50〜100ヌクレオチドであり、例えば、60〜80ヌクレオチド、または60〜75ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、50、25、15、10、または5ヌクレオチド未満である。
一態様では、本発明は、核酸試料中の標的遺伝子座を増幅するための本発明のプライマーライブラリーのいずれかを含むキットを提供する。いくつかの実施形態では、キットは、ライブラリーを使用して標的遺伝子座を増幅するための説明書を含む。
一態様では、本発明は、妊娠中の胎児の染色体の倍数性状態を決定する方法を特徴とする。いくつかの実施形態では、前記方法は、核酸試料を少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座に同時にハイブリダイズするプライマーライブラリーに接触させて反応混合物を生成するステップを含み、核酸試料は、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む。いくつかの実施形態では、反応混合物が、プライマー伸長反応条件に供されて増幅産物が生成され、増幅産物から、ハイスループットシーケンサーを使って配列決定データが生成され、配列決定データに基づきコンピュータで多形遺伝子座の対立遺伝子数が計算され、それぞれ異なる染色体の可能な倍数性状態に関連する複数の倍数性仮説がコンピュータにより作成され、それぞれの倍数性仮説に対し染色体の多形遺伝子座で予測される対立遺伝子数に対する同時分布モデルがコンピュータで構築され、それぞれの倍数性仮説の相対的確率が同時分布モデルおよび対立遺伝子数を使ってコンピュータで算出され、さらに、最大の確率を有する仮説に対応する倍数性状態を選択することにより胎児の倍数性状態がコールされる。
一態様では、本発明は、妊娠中の胎児の染色体の倍数性状態を決定する方法を特徴とする。ある実施形態では、妊娠中の胎児における染色体の倍数性状態を決定するための方法は、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む第1のDNAの試料を得るステップと、調製された試料が得られるようにDNAを単離することによって第1の試料を調製するステップと、染色体上の複数の多型遺伝子座における、調製された試料中のDNAを測定するステップと、調製された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子数をコンピュータで算出するステップと、それぞれが、染色体における可能性のある異なる倍数性状態に関する、複数の倍数性仮説をコンピュータで作製するステップと、各倍数性仮説について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数についての同時分布モデルをコンピュータで構築するステップと、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、倍数性仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールするステップとを含む。
一態様では、本発明は、母系および胎児DNAの混合物を含む試料中の染色体の異常分布を検査する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと試料を接触させて反応混合物を生成するステップであって、標的遺伝子座が複数個の異なる染色体由来であり、複数個の異なる染色体が試料中で異常分布を有すると疑われる少なくとも1個の第1の染色体、および試料中で正常に分布していると推定される少なくとも1個の第2の染色体を含むステップと、(ii)反応混合物をプライマー伸長反応条件に供して増幅産物を生成するステップと、(iii)増幅産物を配列決定して標的遺伝子座に整列した複数の配列タグを得るステップであって、配列タグが特定の標的遺伝子座に割り付けるのに十分な長さであるステップと、(iv)コンピュータで複数の配列タグをそれらの対応する標的遺伝子座に割り付けるステップと、(v)コンピュータで第1の染色体の標的遺伝子座に割り付ける配列タグの数および第2の染色体の標的遺伝子座に割り付ける配列タグの数を決定するステップと、(vi)コンピュータでステップ(v)からの数を比較して、第1の染色体の異常分布の有無を判定するステップとを含む。
一態様では、本発明は、胎児の異数性の存在の有無を検出する方法を提供する。いくつかの実施形態では、前記方法は、(i)母系と胎児DNAの混合物を含む試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる、複数の異なる染色体由来である非多形標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、(ii)反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、(iii)コンピュータで対象の第1と第2の染色体由来の標的増幅産物の相対度数を定量化するステップと、(iv)コンピュータで対象の第1と第2の染色体由来の標的増幅産物の相対度数を比較するステップと、(v)対象の第1と第2の染色体の比較した相対的度数に基づいて異数性の存在の有無を特定するステップとを含む。いくつかの実施形態では、第1の染色体は、正倍数体であると疑われる染色体である。いくつかの実施形態では、第2の染色体は、異数性であると疑われる染色体である。
一態様では、胎児のゲノムDNAおよび母系のゲノムDNAを含む母系の組織試料において胎児の異数性の存在または不在を決定するための方法であって、(a)前記母系の組織試料から、胎児のゲノムDNAと母系のゲノムDNAの混合物を得るステップと、(b)ステップ(a)の胎児のゲノムDNAと母系のゲノムDNAの混合物から無作為に選択されたDNA断片の大規模並行DNA配列決定を行って、前記DNA断片の配列を決定するステップと、(c)ステップ(b)で得られた配列が属する染色体を同定するステップと、(d)ステップ(c)のデータを用いて、前記母系のゲノムDNAと胎児のゲノムDNAの混合物中の少なくとも1つの第1の染色体の量を決定するステップであって、前記少なくとも1つの第1の染色体が、胎児において正倍数性であると推定されるステップと、(e)ステップ(c)のデータを用いて、前記母系のゲノムDNAと胎児のゲノムDNAの混合物中の第2の染色体の量を決定するステップであって、前記第2の染色体が、胎児において異数体であることが疑われるステップと、(f)胎児DNAと母系DNAの混合物中の胎児DNAの割合を算出するステップと、(g)第2の標的染色体が正倍数性である場合、ステップ(d)の数を用いて第2の標的染色体の量の予測される分布を算出するステップと、(h)第2の標的染色体が異数性である場合、ステップ(d)の第1の数およびステップ(f)で算出された、胎児DNAと母系DNAの混合物中の胎児DNAの割合を用いて第2の標的染色体の量の予測される分布を算出するステップと、(i)最尤法または最大事後法を用いて、ステップ(e)で決定された第2の染色体の量がステップ(g)で算出された分布またはステップ(h)で算出された分布の一部である可能性がより高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が開示されている。
本発明のいずれかの態様の種々の実施形態では、前記方法は、胎児の一方の親または両親から遺伝子型データを得るステップも包含する。いくつかの実施形態では、胎児の一方の親または両親から遺伝子型データを得るステップは、親由来のDNAを調製するステップであって、複数の多型遺伝子座におけるDNAを優先的に富化し、調製された親のDNAを得ることを含むステップと、必要に応じて、調製された親のDNAを増幅するステップと、複数の多型遺伝子座における、調製された試料中の親のDNAを測定するステップとを含む。
本発明のいずれかの態様の種々の実施形態では、染色体上の複数の多型遺伝子座における予測される対立遺伝子数の確率についての同時分布モデルを構築するステップを、一方の親または両親から得られた遺伝子データを用いて行う。いくつかの実施形態では、試料(例えば、第1の試料)を母系の血漿から単離し、母親から遺伝子型データを得るステップを、調製された試料に対して行ったDNA測定から母系の遺伝子型データを推定することによって行う。
一態様では、妊娠中の胎児における染色体の倍数性状態の決定に役立つ診断ボックス(diagnostic box)であって、本発明の方法のいずれかの調製および測定ステップを実行することができる診断ボックスが開示されている。
本発明のいずれかの態様の種々の実施形態では、対立遺伝子数は、バイナリーではなく確率的なものである。いくつかの実施形態では、複数の多型遺伝子座における、調製された試料中のDNAの測定値を、胎児が1つまたは複数の疾患連鎖ハプロタイプを有するか否かを決定するためにも用いる。
本発明のいずれかの態様の種々の実施形態では、対立遺伝子数の確率についての同時分布モデルを構築するステップを、染色体内の異なる場所における染色体乗換えの確率に関するデータを使用して、染色体上の多型対立遺伝子間の依存性をモデリングすることによって行う。いくつかの実施形態では、対立遺伝子数についての同時分布モデルを構築するステップおよび各仮説の相対的確率を決定するステップを、参照染色体を使用することを必要としない方法を用いて行う。
本発明のいずれかの態様の種々の実施形態では、各仮説の相対的確率を決定するステップに、調製された試料中の胎児DNAの推定される割合(estimated fraction)を使用する。いくつかの実施形態では、対立遺伝子数の確率を算出するステップおよび各仮説の相対的確率を決定するステップにおいて使用する、調製された試料からのDNA測定値は、一次遺伝子データを含む。いくつかの実施形態では、最大の確率を有する仮説に対応する倍数性状態を選択するステップを、最尤推定または最大事後推定を用いて行う。
本発明のいずれかの態様の種々の実施形態では、胎児の倍数性状態をコールするステップは、同時分布モデルおよび対立遺伝子数の確率を用いて決定される倍数性仮説のそれぞれの相対的確率と、リード数解析(read count analysis)、ヘテロ接合率の比較、親の遺伝子情報を使用する場合にのみ利用可能な統計量、特定の親の状況に対して正規化された遺伝子型シグナルの確率、試料(例えば、第1の試料)または調製された試料の推定される胎児画分を用いて算出される統計量、およびそれらの組み合わせからなる群から選択される統計学的技法を用いて算出される倍数性仮説のそれぞれの相対的確率とを組み合わせるステップも包含する。
本発明のいずれかの態様の種々の実施形態では、信頼度推定値は、コールされた倍数性状態に対し計算される。いくつかの実施形態では、前記方法は、コールされた胎児の倍数性状態に基づいて、妊娠中絶すること、または妊娠を維持することの一方から選択される臨床的措置をとるステップも包含する。
本発明のいずれかの態様の種々の実施形態では、前記方法は、妊娠4週から5週の間;妊娠5週から6週の間;妊娠6週から7週の間;妊娠7週から8週の間;妊娠8週から9週の間;妊娠9週から10週の間;妊娠10週から12週の間;妊娠12週から14週の間;妊娠14週から20週の間;妊娠20週から40週の間;妊娠初期;妊娠中期;妊娠後期;またはそれらの組み合わせにおいて、胎児に対して実施することができる。
本発明のいずれかの態様の種々の実施形態では、前記方法を用いて、妊娠中の胎児における決定された染色体の倍数性状態を示す報告を作製する。いくつかの実施形態では、本発明のいずれかの方法で使用するために設計された、妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットであって、複数の内側のフォワードプライマーおよび、必要に応じて複数の内側のリバースプライマーであって、該プライマーのそれぞれが標的染色体上の多型部位のうちの1つのすぐ上流および/または下流のDNAの領域とハイブリダイズするように設計されているプライマーと、必要に応じてさらに別の染色体であって、ハイブリダイズする領域が、少数の塩基によって該多型部位から隔てられており、前記少数が、1、2、3、4、5、6〜10、11〜15、16〜20、21〜25、26〜30、31〜60、およびそれらの組み合わせからなる群から選択される染色体とを含むキットが開示されている。
一態様では、本発明は、父親とされる人が妊娠中の母親が懐胎している胎児の生物学上の父親であるか否かを確定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)父親とされる人由来の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる遺伝物質上の多形遺伝子座を含む複数の多形遺伝子座を同時に増幅して第1の増幅産物の集合を生成するステップと、(ii)妊娠中の母親の血液試料由来の胎児DNAと母系DNAを含むDNAの混合試料の対応する複数の多形遺伝子座を同時に増幅して第2の増幅産物の集合を生成するステップと、(iii)コンピュータで、第1と第2の増幅産物の集合に基づく遺伝子型測定値を使って父親とされる人が生物学上の胎児の父親である確率を決定するステップと、(iv)父親とされる人が生物学上の胎児の父親であることの決定された確率を使って、生物学上の胎児の父親であるか否かを確定するステップとを含む。種々の実施形態では、前記方法は、母親由来の対応する複数の遺伝物質上の多形遺伝子座を同時に増幅して第3の増幅産物の集合を生成するステップをさらに含み、この場合、父親とされる人が生物学上の胎児の父親である確率が第1、第2、および第3の増幅産物の集合に基づいた遺伝子型測定値を使って決定される。
一態様では、本発明は、胚の集合由来のそれぞれの胚を所望の通り発生させる相対尤度を推定する方法が提供される。いくつかの実施形態では、前記方法は、それぞれの胚由来の試料を少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させてそれぞれの胚の反応混合物を生成するステップを含み、試料は1個または複数個の胚由来の細胞からそれぞれ得られる。いくつかの実施形態では、それぞれの反応混合物は、プライマー伸長反応条件に供され、増幅産物を生成する。いくつかの実施形態では、前記方法は、コンピュータで、それぞれの胚由来の少なくとも1個の細胞の1つまたは複数の特性を増幅産物に基づいて決定するステップと、コンピュータで、それぞれの胚の少なくとも1個の細胞の1つまたは複数の特性に基づいて、それぞれの胚を所望の通り発生させる相対尤度を推定するステップとを含む。
一態様では、本発明は、核酸試料中の2個以上の標的遺伝子座の量を測定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)PCRを使って、第1の基準遺伝子座、第2の基準遺伝子座、第1の標的遺伝子座、および第2の標的遺伝子座を含む核酸試料を増幅して増幅産物を形成するステップであって、第1の基準遺伝子座および第1の標的遺伝子座が同じ数のヌクレオチドであるが、1個または複数個のヌクレオチドの位置で異なる配列を有し、第2の基準遺伝子座および第2の標的遺伝子座が同じ数のヌクレオチドであるが、1個または複数個のヌクレオチドの位置で異なる配列を有するステップと、(ii)増幅産物を配列決定して増幅された第2の基準遺伝子座に比べて増幅された第1の基準遺伝子座の相対的量を比較する基準比率を決定するステップであって、基準比率が第1の基準遺伝子座および第2の基準遺伝子座の増幅に対するPCR効率の差異を示すステップと、(iii)増幅された第2の標的遺伝子座に比べて増幅された第1の標的遺伝子座の相対量を比較する標的比率を決定するステップと、(iv)ステップ(ii)からの基準比率に基づいてステップ(iii)からの標的比率を調節して試料中の第1の標的遺伝子座および第2の標的遺伝子座の相対量を決定するステップとを含む。種々の実施形態では、前記方法は、試料中の第1の標的遺伝子座および第2の標的遺伝子座の絶対量を決定するステップを含む。種々の実施形態では、前記方法は、試料中の標的遺伝子座(例えば、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座)の存在の有無を判定するステップをさらに含む。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するステップを含む。
一態様では、本発明は、分析用試料の複数の遺伝的標的を定量的に測定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)分析用試料由来の遺伝物質を、複数の標的特異的増幅試薬および標的特異的増幅試薬の標的に対応する複数の基準配列と混合するステップと、(ii)遺伝物質の標的領域および基準配列を増幅して標的増幅産物および基準配列増幅産物を生成するステップと、(iii)生成した標的増幅産物および基準配列増幅産物の量を測定するステップとを含む。いくつかの実施形態では、遺伝物質は、遺伝子ライブラリー中に存在する。いくつかの実施形態では、遺伝的標的は、多形遺伝子座(SNPなど)である。いくつかの実施形態では、量を測定するステップは、配列を計数することにより実現される。いくつかの実施形態では、前記方法は、遺伝子ライブラリーが由来する試料中の少なくとも1個の染色体の推定コピー数を測定するステップをさらに含み、測定は、標的増幅産物のシーケンスリード数を基準増幅産物のシーケンスリード数と比較するステップを含む。いくつかの実施形態では、基準配列および遺伝子ライブラリーは、同じプライマーによりプライミングできるユニバーサルプライミング部位を含む。いくつかの実施形態では、混合ステップは、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的特異的増幅試薬および少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の基準配列を含む。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、基準配列のそれぞれの相対量は既知である。いくつかの実施形態では、配列のそれぞれの相対量は、参照ゲノムに対し較正されている。いくつかの実施形態では、分析用試料は、胎児と母系ゲノムの混合物を含む。いくつかの実施形態では、分析用試料は、妊婦の血液由来であるか、または血漿由来である。いくつかの実施形態では、参照ゲノムは、染色体13、18、21、X、またはYの異数性などの少なくとも1つの異数性を有する。いくつかの実施形態では、参照ゲノムは、二倍体である。
一態様では、本発明は、複数の遺伝子基準配列を含む混合物を特徴とし、混合物中のそれぞれの遺伝子基準配列の相対量は、参照ゲノムに対する較正により決定されている。種々の実施形態では、混合物は、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の遺伝子基準配列を含む。種々の実施形態では、遺伝子基準配列は、第1のユニバーサルプライミング部位、第2のユニバーサルプライミング部位、第1の標的特異的プライミング部位、第2の標的特異的プライミング部位、および第1と第2の標的特異的プライミング部位の間に位置するマーカー配列を含み、第1の標的特異的部位および第2の標的特異的プライミング部位は、第1と第2のユニバーサルプライミング部位の間に位置する。種々の実施形態では、較正は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、較正は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは、染色体13、18、21、X、またはYの異数性などの少なくとも1個の異数性を有する。いくつかの実施形態では、参照ゲノムは二倍体である。
一態様では、本発明は、較正された遺伝子基準配列の集合を生成する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)参照ゲノムから調製された遺伝子ライブラリー、複数の標的特異的増幅プライマー試薬の集合、および標的特異的増幅試薬の集合に対応する複数の遺伝子基準配列を含む増幅反応混合物を形成するステップと、(ii)遺伝子ライブラリーおよび遺伝子基準配列を増幅して標的配列由来の増幅産物および遺伝子基準配列由来の増幅産物を生成するステップと、(iii)標的配列由来の増幅産物および遺伝子基準配列由来の増幅産物の量を測定するステップと、(iv)それぞれの遺伝子基準配列相互の相対量を決定し、それにより、複数の遺伝子基準配列が較正されるステップとを含む。種々の実施形態では、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の遺伝子基準配列が使用される。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、本発明は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる配列を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは、染色体13、18、21、X、またはYの異数性などの少なくとも1個の異数性を有する。いくつかの実施形態では、参照ゲノムは二倍体である。
一態様では、本発明は、本発明のいずれかの方法により較正されている遺伝子基準配列の集合を提供する。一態様では、本発明は、前記方法が実行される前、その間、その後に較正できる遺伝子基準配列の集合を提供する。
一態様では、本発明は、欠失を有する少なくとも1個の対立遺伝子を含む対象遺伝子のコピー数を測定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)分析用試料由来の遺伝物質を、対象の遺伝子に特異的で、対象の遺伝子の対立遺伝子を含む欠失を大きくは増幅できない増幅試薬、対象の遺伝子に対応する基準配列、参照配列に特定的な増幅試薬、および参照配列に対応する基準配列と混合するステップと、(ii)対象の遺伝子配列、対象の遺伝子に対応する基準配列、参照配列、および参照配列に対応する基準配列を増幅し、対象の遺伝子増幅産物、参照配列増幅産物、および基準配列増幅産物を生成するステップと、(iii)生成標的増幅産物および基準配列増幅産物の量を測定するステップとを含む。いくつかの実施形態では、量の測定は、シーケンスリードを計数することにより実現される。いくつかの実施形態では、前記方法は、少なくとも1個の遺伝子ライブラリーが由来する試料中の染色体の推定コピー数を算出するステップをさらに含み、算出ステップは、標的増幅産物の配列の数を、基準増幅産物の配列の数と比較するステップを含む。いくつかの実施形態では、基準配列および遺伝子ライブラリーは、同じプライマーによりプライミングできるユニバーサルプライミング部位を含む。いくつかの実施形態では、それぞれの配列の相対的量は、参照ゲノムに対して較正されている。種々の実施形態では、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の遺伝子基準配列が使われる。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは二倍体である。いくつかの実施形態では、分析用試料は、血液由来である。
本発明のいずれかの態様の種々の実施形態では、標的遺伝子座(例えば、複数の多型遺伝子座)における試料(例えば、第1の試料)中のDNAを優先的に富化するステップは、複数の環状化前プローブであって、それぞれのプローブが遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、好ましくは、該プローブの3’末端および5’末端が遺伝子座の多型部位から少数の塩基で隔てられているDNAの領域とハイブリダイズするように設計されており、前記少数が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21〜25、26〜30、31〜60、またはそれらの組み合わせであるプローブを得るステップと、環状化前プローブと試料(例えば、第1の試料)由来のDNAをハイブリダイズさせるステップと、ハイブリダイズしたプローブ末端間のギャップを、DNAポリメラーゼを用いて埋めるステップと、環状化前プローブを環状化するステップと、環状化されたプローブを増幅するステップとを含む。
本発明のいずれかの態様の種々の実施形態では、標的遺伝子座(例えば、複数の多型遺伝子座)におけるDNAを優先的に富化するステップは、複数のライゲーション媒介性PCRプローブであって、それぞれのPCRプローブが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、その上流および下流PCRプローブが、好ましくは、遺伝子座の多型部位から少数の塩基で隔てられているDNAの一方の鎖上のDNAの領域とハイブリダイズするように設計されており、前記少数が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21〜25、26〜30、31〜60、またはそれらの組み合わせであるPCRプローブを得るステップと、ライゲーション媒介性PCRプローブと試料(例えば、第1の試料)由来のDNAをハイブリダイズさせるステップと、ライゲーション媒介性PCRプローブ末端間のギャップを、DNAポリメラーゼを用いて埋めるステップと、ライゲーション媒介性PCRプローブをライゲーションするステップと、ライゲーションされたライゲーション媒介性PCRプローブを増幅するステップとを含む。
本発明の種々の態様のいくつかの実施形態では、標的遺伝子座(例えば、複数の多型遺伝子座)におけるDNAを優先的に富化するステップは、遺伝子座(例えば、多型遺伝子座)を標的とする複数のハイブリッド捕捉プローブを得るステップと、ハイブリッド捕捉プローブを、試料(例えば、第1の試料)中のDNAとハイブリダイズさせるステップと、DNAに関する試料(例えば、第1の試料)からハイブリダイズしていないDNAの一部または全部を物理的に除去するステップとを含む。
本発明のいずれかの態様のいくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位と隣接しているがオーバーラップはしていない領域とハイブリダイズするように設計されている。いくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位と隣接しているがオーバーラップはしていない領域とハイブリダイズするように設計されており、隣接捕捉プローブの長さは、約120塩基未満、約110塩基未満、約100塩基未満、約90塩基未満、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、および約25塩基未満からなる群から選択することができる。いくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位とオーバーラップする領域とハイブリダイズするように設計されており、複数のハイブリッド捕捉プローブは、各多型遺伝子座に対する少なくとも2つのハイブリッド捕捉プローブを含み、各ハイブリッド捕捉プローブが、一方の多型遺伝子座において別の対立遺伝子と相補的であるように設計されている。
本発明のいずれかの態様のいくつかの実施形態では、複数の多型遺伝子座のDNAを優先的に富化するステップは、複数の内側のフォワードプライマーであって、それぞれのプライマーが多型遺伝子座のうちの1つを標的とし、該内側のフォワードプライマーの3’末端が、多型部位の上流にあり、少数の塩基で多型部位から隔てられているDNAの領域とハイブリダイズするように設計されており、少数が、1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6〜10塩基対、11〜15塩基対、16〜20塩基対、21〜25塩基対、26〜30塩基対または31〜60塩基対からなる群から選択されるプライマーを得るステップと、必要に応じて、複数の内側のリバースプライマーであって、それぞれのプライマーが多型遺伝子座のうちの1つを標的とし、内側のリバースプライマーの3’末端が、多型部位の上流にあり、少数の塩基で多型部位から隔てられているDNAの領域とハイブリダイズするように設計されており、少数が、1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6〜10塩基対、11〜15塩基対、16〜20塩基対、21〜25塩基対、26〜30塩基対または31〜60塩基対からなる群から選択されるプライマーを得るステップと、内側のプライマーをDNAとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてDNAを増幅して増幅産物を形成するステップとを含む。
本発明のいずれかの態様のいくつかの実施形態では、前記方法は、複数の外側のフォワードプライマーであって、それぞれのプライマーが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、内側のフォワードプライマーの上流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、必要に応じて、複数の外側のリバースプライマーであって、それぞれのプライマーが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、内側のリバースプライマーのすぐ下流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、第1のプライマーをDNAとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてDNAを増幅するステップとをさらに含む。
本発明のいずれかの態様のいくつかの実施形態では、前記方法は、複数の外側のリバースプライマーであって、それぞれのプライマーが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、内側のリバースプライマーのすぐ下流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、必要に応じて、複数の外側のフォワードプライマーであって、それぞれのプライマーが多型遺伝子座のうちの1つを標的とし、内側のフォワードプライマーの上流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、第1のプライマーをDNAとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてDNAを増幅するステップとをさらに含む。
本発明のいずれかの態様のいくつかの実施形態では、試料(例えば、第1の試料)調整ステップは、ユニバーサルアダプタを試料(例えば、第1の試料)中のDNAに付加するステップおよびポリメラーゼ連鎖反応を使って試料(例えば、第1の試料)中のDNAを増幅するステップをさらに含む。いくつかの実施形態では、増幅された増幅産物の少なくとも一部分が100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満、または45bp未満であり、一部分とは10%、20%、30%、40%、50%、60%、70%、80%、90%または99%である。
本発明のいずれかの態様のいくつかの実施形態では、DNAを増幅するステップは、1つまたは複数の個々の反応容積で行われ、個々の反応容積のそれぞれは、100超の異なるフォワードプライマーとリバースプライマーの対、200超の異なるフォワードプライマーとリバースプライマーの対、500超の異なるフォワードプライマーとリバースプライマーの対、1,000超の異なるフォワードプライマーとリバースプライマーの対、2,000超の異なるフォワードプライマーとリバースプライマーの対、5,000超の異なるフォワードプライマーとリバースプライマーの対、10,000超の異なるフォワードプライマーとリバースプライマーの対、20,000超の異なるフォワードプライマーとリバースプライマーの対、50,000超の異なるフォワードプライマーとリバースプライマーの対、または、100,000超の異なるフォワードプライマーとリバースプライマーの対を含有する。
本発明のいずれかの態様のいくつかの実施形態では、試料(例えば、第1の試料)を調製するステップは、試料(例えば、第1の試料)を複数の部分に分割するステップであって、標的遺伝子座(例えば、複数の多型遺伝子座)のサブセットにおいて各部分内のDNAが優先的に富化されるステップをさらに含む。いくつかの実施形態では、望ましくないプライマー2重鎖を形成する可能性があるプライマー対を同定するステップ、および望ましくないプライマー2重鎖を形成する可能性があると同定されたプライマーの対の少なくとも1つを複数のプライマーから除去するステップによって内側のプライマーを選択する。いくつかの実施形態では、内側のプライマーは、標的の遺伝子座(例えば、多型遺伝子座)の上流または下流のいずれかとハイブリダイズするように設計された領域を含有し、必要に応じて、PCR増幅が可能になるように設計されたユニバーサルプライミング配列(priming sequence)を含有する。いくつかの実施形態では、プライマーの少なくとも一部は、個々のプライマー分子各々について異なるランダムな領域をさらに含有する。いくつかの実施形態では、プライマーの少なくとも一部は分子バーコードをさらに含有する。
本発明のいずれかの態様のいくつかの実施形態では、優先的な富化により、調製された試料と試料(例えば、第1の試料)との間に、2倍以下、1.5倍以下、1.2倍以下、1.1倍以下、1.05倍以下、1.02倍以下、1.01倍以下、1.005倍以下、1.002倍以下、1.001倍以下および1.0001倍以下からなる群から選択される係数の程度の、平均の対立遺伝子の偏りがもたらされる。いくつかの実施形態では、複数の多型遺伝子座はSNPである。いくつかの実施形態では、調製された試料中のDNAを測定するステップを配列決定によって行う。
本発明のいずれかの態様のいくつかの実施形態では、標的遺伝子座は、対照の同じ核酸(例えば、同じ染色体または染色体の同じ領域)上に存在する。いくつかの実施形態では、少なくともいくつかの標的遺伝子座は、対象の異なる核酸(例えば、異なる染色体)上に存在する。いくつかの実施形態では、核酸試料は、フラグメント化または消化核酸を含む。いくつかの実施形態では、核酸試料は、ゲノムDNA、cDNA、またはmRNAを含む。いくつかの実施形態では、核酸試料は、単一細胞由来のDNAを含む。いくつかの実施形態では、核酸試料は、実質的に細胞不含の血液または血漿試料である。いくつかの実施形態では、核酸試料は、血液、血漿、唾液、精液、精子、細胞培養上清、粘液分泌、歯垢、消化管組織、便、尿、毛、骨、体液、涙、組織、皮膚、爪、卵割球、胚、羊水、絨毛膜絨毛試料、胆汁、リンパ液、子宮頸管粘液、または法医学試料を含むか、またはそれら由来である。いくつかの実施形態では、標的遺伝子座は、ヒト核酸のセグメントである。いくつかの実施形態では、標的遺伝子座は、単一ヌクレオチド多型(SNP)を含むか、またはそれから構成される。いくつかの実施形態では、プライマーは、DNA分子である。
本発明のいずれかの態様のいくつかの実施形態では、試料(例えば、第1の試料)中のDNAは、母系血漿由来である。いくつかの実施形態では、試料(例えば、第1の試料)を調製するステップは、DNAを増幅するステップをさらに含む。いくつかの実施形態では、試料(例えば、第1の試料)を調製するステップは、標的遺伝子座(例えば、複数の多型遺伝子座)における試料(例えば、第1の試料)中のDNAを優先的に富化するステップをさらに含む。
種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、ポリメラーゼによる1個または複数個のヌクレオチドの付加を含む。種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、ライゲーション媒介性PCRを含まない。種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、リガーゼによる2個のプライマーの連結を含まない。種々の実施形態では、プライマーは、連結逆方向プローブ(LIP)を含まない。このプローブは、環状化前プローブ(pre−circularized probe)、環状化前プローブ(pre−circularizing probe)または環状化プローブ、環状化プローブ、Padlockプローブ、または分子反転プローブ(MIP)とも呼ばれる。
本明細書に記載される本発明のすべての態様および実施形態は、態様および実施形態「を含む(comprising)」、態様およ及び実施形態「からなる(consisting)」、および態様及び実施形態「から実質的になる(consisting essentially of)」を含むことが理解されよう。
定義
一塩基多型(SNP)とは、同じ種の2つのメンバーのゲノム間で異なる可能性がある一塩基を指す。この用語の使用は、各変異体が発生する頻度に対するいかなる限定も意味するべきではない。
配列とは、DNA配列または遺伝子配列を指す。配列とは、個体のDNA分子または鎖の一次の物理的構造を指し得る。配列とは、DNA分子またはDNA分子の相補鎖に見いだされるヌクレオチドの配列を指し得る。配列とは、インシリコで表示される、DNA分子に含有される情報を指し得る。
遺伝子座とは、個体のDNA上の対象の特定の領域を指し、可能性のある挿入もしくは欠失の部位またはいくつかの他の関連性のある遺伝的変異の部位である、SNPを指し得る。疾患連鎖SNPとは、疾患連鎖遺伝子座を指す場合もある。
多型対立遺伝子、同様に「多型遺伝子座」とは、所与の種内の個体間で遺伝子型が変動する対立遺伝子または遺伝子座を指す。多型対立遺伝子のいくつかの例としては、一塩基多型、短いタンデム反復、欠失、重複、および逆位が挙げられる。
多型部位とは、個体間で変動する多型領域に見いだされる特異的なヌクレオチドを指す。
対立遺伝子とは、特定の遺伝子座を占有する遺伝子を指す。
遺伝子データ、同様に「遺伝子型データ」とは、1個または複数個の個体のゲノムの態様を記載するデータを指す。これは、1つの遺伝子座または遺伝子座の集合、部分配列または全配列、染色体の部分もしくは染色体の全体、またはゲノム全体を指し得る。これは、1個または複数個のヌクレオチドの同一性を指してもよく、これは、逐次的なヌクレオチドの集合またはゲノム内の異なる場所由来のヌクレオチド、またはそれらの組み合わせを指してもよい。遺伝子型データは、一般にはインシリコであるが、化学的にコードされる遺伝子データとして配列内に物理的なヌクレオチドを考えることも可能である。遺伝子型データは、個体(複数可)「on(に関する)」、「of(の)」、「at(における)」、「from(からの)」または「on(に関する)」と言うことができる。遺伝子型データとは、これらの測定を遺伝物質に対して行う場合、遺伝子型決定プラットフォームからの出力測定値を指し得る。
遺伝物質、同様に「遺伝子試料」とは、DNAまたはRNAを含む1つまたは複数の個体由来の組織または血液などの物理的物質を指す。
ノイズを伴う遺伝子データとは、以下のいずれかを伴う遺伝子データを指す:対立遺伝子ドロップアウト、不確実な塩基対測定値、不正確な塩基対測定値、塩基対測定値の欠落、挿入または欠失の不確実な測定値、染色体セグメントコピー数の不確実な測定値、偽のシグナル、測定値の欠落、他のエラー、またはそれらの組み合わせ。
信頼度とは、コールされたSNP、対立遺伝子、対立遺伝子の集合、倍数性コールまたは決定された染色体セグメントコピーの数が個体の実際の遺伝子の状態を正確に示す統計学的尤度を指す。
倍数性コール、同様に「染色体コピー数コール」または「コピー数コール」(CNC)、とは、細胞内に存在する1個または複数個の染色体の量および/または染色体の同一性を決定する行為を指し得る。
異数性とは、細胞中の誤った数の染色体(例えば、誤った数の完全染色体または誤った数の染色体セグメント、例えば、染色体セグメントの欠失または複製の存在)が存在する状態を意味する。ヒト体細胞の場合には、異数性とは、細胞が、22対の常染色体および1対の性染色体を含有しない場合を指し得る。ヒト配偶子の場合には、異数性とは、細胞が、23種の染色体のそれぞれのうちの1つを含有しない場合を指し得る。単一染色体型の場合には、異数性とは、大体2つの相同であるが同一ではない染色体コピーが存在する場合、または同じ親を起源とする2つの染色体コピーが存在する場合を指し得る。いくつかの実施形態では、染色体セグメントの欠失は微小欠失である。
倍数性状態とは、細胞における1つまたは複数の染色体型の量および/または染色体の同一性を指す。
染色体とは、単一染色体コピーを指してもよく、これは正常な体細胞に46個存在するDNAの単一分子を意味し、その例は「母体由来の第18染色体」である。染色体とは、正常なヒト体細胞に23個存在する染色体型を指す場合もあり、例は「第18染色体」である。
染色体の同一性とは、指示対象の染色体数、すなわち染色体型を指し得る。正常なヒトは、22種類の番号が付された常染色体型、および2種類の性染色体を有する。染色体の同一性とは、親起源の染色体を指す場合もある。染色体の同一性とは、親から遺伝によって受け継がれる特定の染色体を指す場合もある。染色体の同一性とは、染色体の他の同定される形体(feature)を指す場合もある。
遺伝物質の状態または単に「遺伝子の状態」とは、DNA上のSNPの集合の同一性、相が特定された(phased)遺伝物質のハプロタイプ、および挿入、欠失、反復および変異を含めたDNAの配列を指し得る。これは、1個または複数個の染色体の倍数性状態、染色体セグメントまたは染色体セグメントの集合を指す場合もある。
対立遺伝子データとは、1個または複数個の対立遺伝子の集合に関する遺伝子型データの集合を指す。対立遺伝子データとは、相が特定されたハプロタイプデータを指し得る。対立遺伝子データとは、SNPの同一性を指してもよく、対立遺伝子データとは、挿入、欠失、反復および変異を含めたDNAの配列データを指してもよい。対立遺伝子データとは、親起源の各対立遺伝子を包含してもよい。
対立遺伝子の状態とは、1個または複数個の対立遺伝子の集合内の遺伝子の実際の状態を指す。対立遺伝子の状態とは、対立遺伝子データに記載されている遺伝子の実際の状態を指し得る。
対立遺伝子の比(allelic ratio)または対立遺伝子の比(allele ratio)とは、試料または個体に存在する遺伝子座における各対立遺伝子の量の間の比を指す。試料を配列決定によって測定した場合、対立遺伝子の比とは、遺伝子座における各対立遺伝子にマッピングされるシーケンスリードの比を指し得る。試料を強度に基づく測定方法によって測定した場合、対立遺伝子の比とは、測定方法によって推定される遺伝子座に存在する各対立遺伝子の量の比を指し得る。
対立遺伝子数とは、特定の遺伝子座にマッピングされる配列の数を指し、その遺伝子座が多型である場合、対立遺伝子数とは、対立遺伝子のそれぞれにマッピングされる配列の数を指す。各対立遺伝子がバイナリー様式でカウントされる場合は、対立遺伝子数は整数になる。対立遺伝子が確率的にカウントされる場合は、対立遺伝子数は分数であり得る。
対立遺伝子数確率とは、マッピングの確率と組み合わせた、特定の遺伝子座または多型遺伝子座における対立遺伝子の集合にマッピングされる可能性がある配列の数を指す。カウントされた配列のそれぞれについてのマッピングの確率がバイナリーである(0または1)対立遺伝子数は、対立遺伝子数の確率と等しいことに留意されたい。いくつかの実施形態では、対立遺伝子数の確率はバイナリーであってよい。いくつかの実施形態では、対立遺伝子数の確率は、DNA測定値と等しくなるように設定することができる。
対立遺伝子分布または「対立遺伝子数分布」とは、遺伝子座の集合内の各遺伝子座に存在する各対立遺伝子の相対量を指す。対立遺伝子分布は、個体、試料または試料に対して得た測定値の集合を指す場合がある。配列決定との関連において、対立遺伝子分布とは、多型遺伝子座の集合内の各対立遺伝子についての、特定の対立遺伝子にマッピングされるリード数または見込み数を指す。対立遺伝子測定値は、確率的に処理することができる、すなわち所与の対立遺伝子が所与のシーケンスリードを示す尤度は、0から1の間の分数である、または対立遺伝子測定値は、バイナリー様式で処理することができる、すなわち任意の所与のリードは、特定の対立遺伝子のちょうど0コピーまたは1コピーであると考えられる。
対立遺伝子分布パターンとは、異なる親の状況についての異なる対立遺伝子分布の集合を指す。特定の対立遺伝子分布パターンにより、特定の倍数性状態が示され得る。
対立遺伝子の偏りとは、ヘテロ接合性遺伝子座における測定された対立遺伝子の比が、元のDNAの試料に存在していた比と異なる程度を指す。特定の遺伝子座における対立遺伝子の偏りの程度は、その遺伝子座において観察された対立遺伝子比を測定し、その遺伝子座における元のDNA試料中の対立遺伝子の比で割ったものと等しい。対立遺伝子の偏りは1より大きいと定義することができ、したがって、対立遺伝子の偏りの程度の算出によって1未満の値xが生じる場合、対立遺伝子の偏りの程度は1/xと言い換えることができる。対立遺伝子の偏りは、増幅の偏り、精製の偏りまたは異なる対立遺伝子に違うように影響を及ぼすいくつかの他の現象に起因し得る。
プライマー、同様に「PCRプローブ」とは、単一のDNA分子(DNAオリゴマー)またはDNA分子(DNAオリゴマー)の集団を指し、DNA分子は同一またはほぼ同一であり、プライマーは、標的遺伝子座(例えば、標的多型遺伝子座または非多型遺伝子座)とハイブリダイズするように設計された領域を含有しており、PCR増幅が可能になるように設計されたプライミング配列を含有してよい。プライマーは、分子バーコードも含有してよい。プライマーは、個々の分子それぞれについて異なるランダムな領域を含有してよい。用語の「試験プライマー」および「候補プライマー」は、限定を意味するものではなく、本明細書開示のいずれかのプライマーを意味してもよい。
プライマーライブラリーは、2個以上のプライマーの集団を意味する。種々の実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマーを含む。種々の実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマー対を含み、それぞれのプライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、それぞれの試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。いくつかの実施形態では、ライブラリーは、(i)プライマー対、および(ii)プライマー対の一部ではない個別プライマー(例えば、ユニバーサルプライマー)の両方を含む。
ハイブリッド捕捉プローブとは、PCRまたは直接的な合成などの種々の方法によって生成され、試料中の特異的な標的DNA配列の一方の鎖と相補的であることが意図された、場合によっては改変された任意の核酸配列を指す。外因性のハイブリッド捕捉プローブを調製された試料に加え、変性−再アニーリングプロセスを通じてハイブリダイズさせて、外因性断片−内因性断片の2重鎖を形成することができる。次いで、これらの2重鎖を、種々の手段によって試料から物理的に分離することができる。
シーケンスリードとは、クローン配列決定法を用いて測定したヌクレオチド塩基の配列を示すデータを指す。クローン配列決定により、単一の1つの元のDNA分子または1つの元のDNA分子のクローンまたは1つの元のDNA分子のクラスターを示す配列データを生じることができる。シーケンスリードは、配列の各塩基の位置において、ヌクレオチドが正確にコールされている確率を示す関連する品質スコアも有し得る。
シーケンスリードのマッピングとは、特定の生物体のゲノム内配列におけるシーケンスリードの開始場所を決定するプロセスである。シーケンスリードの開始場所は、リードとゲノム配列のヌクレオチド配列の類似性に基づく。
一致コピーエラー、同様に「一致染色体異数性」(MCA)とは、1つの細胞が、2つの同一またはほぼ同一の染色体を含有する異数性の状態を指す。この種類の異数性は、減数分裂における配偶子形成の間に生じる可能性があり、減数分裂不分離エラーと称することができる。この種類のエラーは、有糸分裂において生じる可能性がある。一致トリソミーとは、所与の染色体の3つのコピーが個体に存在し、コピーのうちの2つが同一である場合を指し得る。
不一致コピーエラー、同様に「独自の染色体異数性(unique chromosome aneuploidy)」(UCA)とは、1つの細胞が同じ親由来であり、かつ相同であるが同一ではない可能性がある2つの染色体を含有する異数性の状態を指す。この種類の異数性は、減数分裂の間に生じる可能性があり、減数分裂エラーと称することができる。不一致トリソミーとは、所与の染色体の3つのコピーが個体に存在し、コピーのうちの2つが同じ親由来であり、かつ相同であるが同一ではない場合を指し得る。不一致トリソミーとは、一方の親由来の2つの相同染色体が存在し、染色体の一部のセグメントは同一であるが他のセグメントはただ単に相同なだけである場合を指し得ることに留意されたい。
相同染色体とは、通常は減数分裂の間に対合する同じ遺伝子の集合を含有する染色体コピーを指す。
同一染色体とは、同じ遺伝子の集合を含有する染色体コピーを指し、各遺伝子について、同一染色体は同一またはほぼ同一である同じ対立遺伝子の集合を有する。
対立遺伝子ドロップアウト(ADO)とは、所与の対立遺伝子における相同染色体由来の塩基対の集合内の塩基対の少なくとも一方が検出されない状況を指す。
遺伝子座ドロップアウト(LDO)とは、所与の対立遺伝子における相同染色体由来の塩基対の集合内の塩基対の両方が検出されない状況を指す。
ホモ接合性とは、対応する染色体の遺伝子座と同様の対立遺伝子を有することを指す。
ヘテロ接合性とは、対応する染色体の遺伝子座と同様でない対立遺伝子を有することを指す。
ヘテロ接合性率とは、集団内の個体が所与の遺伝子座においてヘテロ接合性対立遺伝子を有する率を指す。ヘテロ接合性率は、個体またはDNAの試料中の所与の遺伝子座における予測された対立遺伝子の比または測定された対立遺伝子の比を指す場合もある。
情報価値が高い一塩基多型(HISNP)とは、胎児が母親の遺伝子型には存在しない対立遺伝子を有するSNPを指す。
染色体領域とは、染色体のセグメントまたは完全な染色体を指す。
染色体のセグメントとは、1つの塩基対から染色体全体までサイズに幅があり得る染色体のセクションを指す。
染色体とは、完全な染色体または染色体のセグメントもしくはセクションのいずれかを指す。
コピーとは、染色体セグメントのコピーの数を指す。それは、染色体セグメントの同一のコピー、または同一ではない相同なコピーを指す場合があり、染色体セグメントの異なるコピーは実質的に類似した遺伝子座の集合を含有し、対立遺伝子のうちの1個または複数個が異なる。M2コピーエラーなどの異数性のいくつかの場合には、所与の染色体セグメントの同一であるいくらかのコピーならびに同じ染色体セグメントの同一ではないいくらかのコピーを有する可能性があることに留意されたい。
ハプロタイプとは、一般には、同じ染色体上で一緒に遺伝によって受け継がれる、複数の遺伝子座における対立遺伝子の組み合わせを指す。ハプロタイプとは、所与の遺伝子座の集合の間で起こった組換え事象の数に応じて、わずか2つの遺伝子座または染色体全体を指し得る。ハプロタイプとは、統計学的に関連する単一の染色分体上の一塩基多型(SNP)の集合も指す場合がある。
ハプロタイプデータ、同様に「相が特定されたデータ」または「順序づけられた遺伝子データ」とは、二倍体ゲノムまたは倍数体ゲノムの単一染色体、すなわち、二倍体ゲノムの染色体の分離された母系のコピーまたは父系のコピーのいずれかからのデータを指す。
相の特定(Phasing)とは、順序づけられていない、二倍体(または倍数性)遺伝子データを考慮して個体のハプロタイプ遺伝子データを決定する行為を指す。相の特定とは、1つの染色体上に見いだされる対立遺伝子の集合について、対立遺伝子の2つの遺伝子のどちらが、個体の2つの相同染色体のそれぞれと関連するかを決定する行為を指し得る。
相が特定されたデータとは、1個または複数個のハプロタイプが決定された遺伝子データを指す。
仮説とは、所与の染色体の集合における可能性のある倍数性状態または所与の遺伝子座の集合における可能性のある対立遺伝子の状態の集合を指す。可能性の集合は、1個または複数個のエレメントを含んでよい。
コピー数仮説、同様に「倍数性状態仮説」とは、個体の染色体のコピーの数に関する仮説を指す。これは、各染色体の起源となる親、および親の2つの染色体のどちらが個体に存在するかを含めた、染色体のそれぞれの同一性に関する仮説を指す場合もある。これは、もしあれば、関連する個体由来の染色体または染色体セグメントのいずれが、個体由来の所与の染色体に遺伝的に対応するかに関する仮説を指す場合もある。
標的個体とは、遺伝子の状態が決定される個体を指す。いくつかの実施形態では、限られた量のDNAのみが標的個体から入手可能である。いくつかの実施形態では、標的個体は胎児である。いくつかの実施形態では、2体以上の標的個体が存在し得る。いくつかの実施形態では、一対の親から生まれた胎児をそれぞれ標的個体とみなすことができる。いくつかの実施形態では、決定される遺伝子データは、1つの対立遺伝子のコールまたは対立遺伝子のコールの集合である。いくつかの実施形態では、決定される遺伝子データは、倍数性コールである。
関連する個体とは、標的個体と遺伝的に関連する、したがって、標的個体とハプロタイプブロックを共有する任意の個体を指す。ある状況では、関連する個体は、標的個体の遺伝学的な親、または親に由来する任意の遺伝物質、例えば、精子、極体、胚、胎児または子であってよい。関連する個体とは、同胞、親または祖父母を指す場合もある。
同胞とは、遺伝学的な親が問題の個体と同じである任意の個体を指す。いくつかの実施形態では、同胞とは、生まれた子、胚もしくは胎児、または生まれた子、胚もしくは胎児に由来する1個または複数個の細胞を指し得る。同胞とは、親の一方を起源とする一倍体個体、例えば、精子、極体または任意の他のハプロタイプの遺伝物質の集合を指す場合もある。個体は、それ自体を同胞とみなすことができる。
胎児の(fetal)とは、「胎児の(of the fetus)」、または「胎児と遺伝的に類似である胎盤の領域の(of the region of the placenta that is genetically similar to the fetus)」を指す。妊娠中の女性では、胎盤の一部は胎児と遺伝的に類似であり、母系の血液中に見いだされる浮動性胎児DNAは、遺伝子型が胎児と一致する胎盤の部分を起源とし得る。胎児の染色体の半分の遺伝子情報は、胎児の母親から遺伝によって受け継がれることに留意されたい。いくつかの実施形態では、胎児の細胞に由来するこれらの母系的に遺伝によって受け継がれた染色体からのDNAは、「母体起源の(of maternal origin)」ものではなく「胎児起源の(of fetal origin)」ものと考えられる。
胎児起源のDNAとは、元々は遺伝子型が基本的に胎児の遺伝子型と等しい細胞の一部であったDNAを指す。
母体起源のDNAとは、元々は遺伝子型が基本的に母親の遺伝子型と等しい細胞の一部であったDNAを指す。
子とは、胚、割球または胎児を指し得る。ここで開示されている実施形態では、記載されている概念は、生まれた子、胎児、胚またはそれら由来の細胞の集合である個体に同等に良好に当てはまることに留意されたい。子という用語の使用は、単に子と称される個体が親の遺伝学的子孫であることを内包することを意味する。
親とは、個体の遺伝学的母親または父親を指す。個体は、一般には、2体の親、母親および父親を有するが、これは、例えば、遺伝子または染色体のキメラ現象において、必ずしもそうではない。親は個体とみなすことができる。
親の状況とは、標的の2体の親の一方または両方について、2つの関連性のある染色体のそれぞれにおける所与のSNPの遺伝子の状態を指す。
所望の通り発生させる、同様に「正常に発生させる」とは、成長可能な胚を子宮内に着床させ、妊娠をもたらすこと、および/または、妊娠を継続し、出生をもたらすこと、および/または、生まれた子に染色体異常がないこと、および/または、生まれた子に他の望ましくない遺伝子の状態、例えば、疾患連鎖遺伝子がないことを指す。「所望の通り発生させる」という用語は、親または健康管理の補助者により所望され得るいかなるものも包含することを意味する。いくつかの場合には、「所望の通り発生させる」とは、医学的な研究または他の目的に有用である成長できない胚または成長可能な胚を指し得る。
子宮への挿入とは、インビトロでの受精との関連において胚を子宮腔に移入するプロセスを指す。
母系の血漿とは、妊娠中の女性由来の血液の血漿部分を指す。
臨床的決定とは、個体の健康または生存に影響を及ぼす転帰を有する措置を取るか取らないかの任意の決定を指す。出生前診断との関連において、臨床的決定とは、胎児を流産するか流産しないかの決定を指し得る。臨床的決定とは、さらなる検査を行うこと、望ましくない表現型を減ずるための措置を取ること、または異常を持つ子の誕生の準備をするための措置を取ることの決定を指す場合もある。
診断ボックスとは、本明細書に開示されている方法の1つまたは複数の態様を実施するために設計された1つの機械またはその機械の組み合わせを指す。ある実施形態では、診断ボックスは、患者をケアする所に置くことができる。ある実施形態では、診断ボックスにより、標的化増幅、その後の配列決定を実施することができる。ある実施形態では、診断ボックスは、単独で、または技師の補助で機能し得る。
インフォマティクスに基づく方法とは、大量のデータを解明するために、統計量に大きく依拠する方法を指す。出生前診断との関連において、インフォマティクスに基づく方法とは、1個または複数個の染色体における倍数性状態または1個または複数個の対立遺伝子における対立遺伝子の状態を、状態を直接物理的に測定することによってではなく、例えば、分子アレイまたは配列決定からの大量の遺伝子データを考慮して、最も可能性が高い状態を統計学的に推論することによって決定するために設計された方法を指す。本開示のある実施形態では、インフォマティクスに基づく技法は、本特許に開示されているものであってよい。本開示のある実施形態では、インフォマティクスに基づく技法はPARENTAL SUPPORT(商標)であってよい。
一次遺伝子データとは、遺伝子型決定プラットフォームから出力されるアナログの強度シグナルを指す。SNPアレイとの関連において、一次遺伝子データとは、いかなる遺伝子型コールも行われる前の強度シグナルを指す。配列決定との関連において、一次遺伝子データとは、いかなる塩基対の同一性も決定される前、および配列がゲノムにマッピングされる前にシーケンサーから生じる、クロマトグラムと類似しているアナログ測定値を指す。
二次遺伝子データとは、遺伝子型決定プラットフォームから出力される加工された遺伝子データを指す。SNPアレイとの関連において、二次遺伝子データとは、SNPアレイリーダーに付随するソフトウェアによって行われる対立遺伝子コールを指し、該ソフトウェアにより、試料中に所与の対立遺伝子が存在するか存在しないかのコールが行われる。配列決定との関連において、二次遺伝子データとは、配列の塩基対の同一性が決定されることを指し、場合によっては、同様に、配列がゲノムにマッピングされたことを指す。
非侵襲的な出生前診断(NPD)または、同様に「非侵襲的な出生前スクリーニング」(NPS)とは、母親の血液中に見いだされる遺伝物質を用いて、母親が妊娠中の胎児の遺伝子の状態を決定する方法を指し、遺伝物質は、母親の静脈内血液を抜き取ることによって得る。
遺伝子座に対応するDNAを優先的に富化すること、または遺伝子座におけるDNAを優先的に富化することは、その遺伝子座に対応する富化後のDNA混合物中のDNA分子の百分率を、その遺伝子座に対応する富化前のDNA混合物中のDNA分子の百分率よりも高くする任意の方法を指す。前記方法は、遺伝子座に対応するDNA分子の選択的増幅を包含し得る。前記方法は、遺伝子座に対応しないDNA分子を除去するステップを包含し得る。前記方法は、方法の組み合わせを包含し得る。富化の程度は、その遺伝子座に対応する富化後の混合物におけるDNA分子の百分率を、その遺伝子座に対応する富化前の混合物におけるDNA分子の百分率で割ったものと定義される。優先的な富化は、複数の遺伝子座において行うことができる。本開示のいくつかの実施形態では、富化の程度は20を超える。本開示のいくつかの実施形態では、富化の程度は200を超える。本開示のいくつかの実施形態では、富化の程度は2,000を超える。優先的な富化を複数の遺伝子座において行う場合、富化の程度とは、遺伝子座の集合内の全ての遺伝子座の平均の富化の程度を指し得る。
増幅とは、DNA分子のコピーの数を増加させる方法を指す。
選択的な増幅とは、特定のDNA分子またはDNAの特定の領域に対応するDNA分子のコピーの数を増加させる方法を指し得る。選択的な増幅とは、特定の標的のDNA分子または標的のDNAの領域のコピーの数を、DNAの標識していない分子または領域を増大させるよりも増加させる方法を指す場合もある。選択的な増幅は、優先的に富化する方法であってよい。
ユニバーサルプライミング配列とは、標的DNA分子の集団に、例えば、ライゲーション、PCRまたはライゲーション媒介性PCRによって付加することができるDNA配列を指す。標的分子の集団に付加した後、ユニバーサルプライミング配列に特異的なプライマーを用いて、増幅プライマーの単一の対を使用して標的集団を増幅することができる。ユニバーサルプライミング配列は、一般には、標的配列に関連しない。
ユニバーサルアダプタまたは「ライゲーションアダプタ」または「ライブラリータグ」
は、標的二本鎖DNA分子の集団の5’末端および3’末端に共有結合的に連結することができるユニバーサルプライミング配列を含有するDNA分子である。アダプタを付加することにより、そこからPCR増幅を行うことができる標的集団の5’末端および3’末端にユニバーサルプライミング配列がもたらされ、標的集団由来の全ての分子を、増幅プライマーの単一の対を使用して増幅する。
標的化とは、DNAの混合物中の遺伝子座の集合に対応するDNA分子を選択的に増幅する、または別の方法で優先的に富化するために使用される方法を指す。
同時分布モデルとは、複数のランダムな変数に関して定義済みの事象の確率を、変数の確率が関連づけられている、同じ確率空間に対して定義済みの複数のランダムな変数を考慮して、定義するモデルを指す。いくつかの実施形態では、変数の確率が関連づけられていない退化事例を用いることができる。
ここで開示されている実施形態は、添付図を参照してさらに説明され、同様の構造はいくつかの概観を通じて同様の数字で参照される。示されている図は必ずしも一定の縮尺ではなく、概して、ここで開示されている実施形態の原理の例示が強調されている。
直接多重mini−PCR法の模式図である。 セミネステッドmini−PCR法の説明図である。 完全ネステッドmini−PCR法の説明図である。 ヘミネステッドmini−PCR法の説明図である。 3重ヘミネステッドmini−PCR法の説明図である。 片側ネステッドmini−PCR法の説明図である。 片側mini−PCR法の説明図である。 逆セミネステッドmini−PCR法の説明図である。 セミネステッド法のいくつかの可能性のあるワークフロー図である。 ループライゲーションアダプタの説明図である。 内部にタグを付けたプライマーの説明図である。 内部のタグを有するいくつかのプライマーの例である。 ライゲーションアダプタ結合領域を有するプライマーを使用する方法の説明図である。 2つの異なる分析技法を用いた計数方法についてのシミュレートされた倍数性コールの正確度を示すグラフである。 実験4の細胞系における複数のSNPについての2個の対立遺伝子の比を示す図である。 染色体により分けた、実験4の細胞系における複数のSNPについての2つの対立遺伝子の比を示す図である。 図17A〜Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。 図17A〜Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。 図17A〜Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。 図17A〜Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。 データ補正の前後の二項分散によって説明することができるデータの割合を示すグラフである。 短いライブラリー調製プロトコール後の試料中の胎児DNAの相対的な富化を示すグラフである。 リード深度に関し直接PCRとセミネステッド法を比較したグラフである。 3種のゲノム試料の直接PCRのリード深度の比較を示すグラフである。 3種の試料のセミネステッドmini−PCRのリード深度の比較を示すグラフである。 1,200プレックス反応および9,600プレックス反応のリード深度の比較を示すグラフである。 6種の細胞について3つの染色体におけるリード数比率を示すグラフである。 3種の染色体における、2つの3細胞反応についての、および1ngのゲノムDNAに対して行った第3の反応についての対立遺伝子の比を示す図である。 3種の染色体における、2つの単一細胞反応についての対立遺伝子の比を示す図である。 2種のプライマー ライブラリーのそれぞれにより標的とされる特定のマイナー対立遺伝子頻度を有する遺伝子座の数を示す図である。 図28A:PCR産物の電気泳動のグラフである。 図28B〜28Mは、図28A中のそれぞれのレーン1〜12の電気泳動図である。 図28B〜28Mは、図28A中のそれぞれのレーン1〜12の電気泳動図である。 図28B〜28Mは、図28A中のそれぞれのレーン1〜12の電気泳動図である。 図29A〜29E:胎児の異数性の決定用の本発明の方法のイメージ表現である(図29A)。ハップマップデータベース由来の母系および父系遺伝子型データ(血液または頬スワブ由来)および乗換え頻度データを利用してそれぞれの可能な胎児倍数性状態に対する複数の独立仮説をインシリコにより生成する(図29B)。これらの仮説のそれぞれを異なる可能な乗換え点を考慮に入れた副次的仮説を含むように拡張する。データモデルにより、それぞれの仮説上の胎児の遺伝子型および異なる胎児のcfDNA割合に対して、生成しそうな配列決定データが予測され(予測対立遺伝子分布)、実際の配列決定データと比較される(図29C)。ベイズ統計学を使ってそれぞれの仮説に対する尤度が決定される。この仮説上の例で、最高尤度(正倍数性)を有する仮説が決定される(図29D)。図29Cのそれぞれのコピー数仮説ファミリー(モノソミー、ダイソミー、または三倍体性)の個別の尤度が合計される。最大尤度の仮説は、倍数性状態としてコールされ、胎児画分を明らかにし、試料特異的な計算精度(図29E)を示す。 図30A〜30H:正倍数性(図30A〜30C)、モノソミー(図30D)、およびトリソミー(図30E〜30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。 図30A〜30H:正倍数性(図30A〜30C)、モノソミー(図30D)、およびトリソミー(図30E〜30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。 図30A〜30H:正倍数性(図30A〜30C)、モノソミー(図30D)、およびトリソミー(図30E〜30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。 図30A〜30H:正倍数性(図30A〜30C)、モノソミー(図30D)、およびトリソミー(図30E〜30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。 性染色体異数性による複合出生有病率は、常染色体異数性による場合より高いことを示すグラフである。
上記の図は、ここで開示されている実施形態がについて説明しているが、考察において言及されている通り、他の実施形態も意図されている。本開示は、例示により実施形態を代表として示しており、限定として示しているのではない。当業者は、ここで開示されている実施形態の原理の範囲および趣旨の範囲内に入る多数の他の改変および実施形態を考案することができる。
本発明は、一部は、プライマーライブラリー中の相対的に少数に過ぎないプライマーが多重PCR反応中に形成される相当量の増幅プライマー二量体生成の原因である場合が多いという予期しない発見に基づいている。候補プライマーライブラリーから除去する目的で最も望ましくないプライマーを選択する方法が開発された。無視できる量(PCR産物の約0.1%)までプライマー二量体の量を減らすことにより、これらの方法は、生成したプライマーライブラリーを使ってただ1回の多重PCR反応で多数の標的遺伝子座を同時に増幅することを可能とする。プライマーは、標的遺伝子座にハイブリダイズし、他のプライマーにハイブリダイズして増幅されたプライマー二量体を形成することなく標的遺伝子座を増幅するので、増幅できる異なる標的遺伝子座の数が増加する。また、通常より低プライマー濃度およびかなり長いアニーリング時間を使うことにより、相互にハイブリダイズしてプライマー二量体を形成するのではなく、プライマーが標的遺伝子座にハイブリダイズする尤度が高まることも明らかになった。
PCR増幅およびゲノム試料中の19,488標的遺伝子座のシークエンシングの間に、これらの99.4〜99.7%のシークエンシングリードがゲノムにマップされ、99.99%が標的遺伝子座にマップされた。1000万シークエンシングリードを有する血漿試料に対しては、通常、19,488標的遺伝子座の内の少なくとも19,350(99.3%)が増幅され、配列決定された。このような多数の標的遺伝子座を一度に同時増幅できることにより、数千の標的遺伝子座の解析に必要な時間とDNAの量を大幅に減らせる。例えば、インビトロ受精の前の胚由来の単一細胞の遺伝子検査または小量のDNAを含む法医学試料の遺伝子検査などのDNAの量が少ない用途で重要である数千の標的遺伝子座を同時に解析するために、単1細胞由来のDNAで充分である。さらに、標的遺伝子座を複数の別の反応に試料を分割しないで1反応体積(例えば、1つの容器またはウェル)で解析できることにより、反応中に起こり得る変動を減らせる。さらに、前記方法は、参照基準を使用し、異なる標的遺伝子座の間で起こる得る増幅の偏りを補正するように開発されている。例えば、GC含量などの因子に起因する標的遺伝子座間の増幅効率の差異により、実際は同じ量で産生されるべき標的遺伝子座のPCR産物の量が、異なった量になってしまう場合がある。標的遺伝子座に類似の参照基準の使用により、このような増幅の偏りを検出して、それを標的遺伝子座の定量化の間に補正することができる。
PCR産物のシークエンシング中に、プライマー二量体などのアーチファクトが検出され、その結果、標的増幅産物の検出を阻害する。この制限のために、ハイブリダイゼーションプローブを備えたマイクロアレイが検出用に使用される場合が多い。理由は、プライマー二量体の干渉に対する感度が低いためである。現状達成できる最小限の非標的増幅産物を含む高レベルの多重化により、マイクロアレイの代替としてPCRとそれに引き続くシークエンシングが使用可能となる。
本発明の多重PCR法は、多様な用途に使用可能である。例えば、遺伝子型分析、染色体異常(例えば、胎児染色体異数性)の検出、遺伝子変異および多型(例えば、一塩基多型、SNP)分析、遺伝子欠失分析、父子鑑定、集団内の遺伝的差異分析、法医学分析、疾患に対する素因測定、mRNAの定量分析、および感染病原体(例えば、細菌、寄生虫、およびウイルス)の検出と特定に使用可能である。また、多重PCR法は、無侵襲的出生前遺伝学的検査、例えば、父子鑑定または胎児染色体異常の検出用にも使用できる。
代表的プライマー設計法
高度多重PCRにより、多くの場合、プライマー二量体形成などの非生産的な副反応がもたらす産物DNAが非常に高い割合で産生され得る。ある実施形態では、非生産的な副反応を引き起こす可能性が最も高い特定のプライマーを、プライマーライブラリーから除去して、ゲノムにマッピングされる増幅されたDNAを高い割合でもたらすプライマーライブラリーを得ることができる。問題のあるプライマー、すなわち、特に二量体を安定させる可能性があるプライマーを除去するステップにより、予想外に、その後の配列決定による分析のための非常に高いPCR多重化レベルが可能になった。プライマー二量体および/または他の悪影響を及ぼす産物によって性能が著しく低下する配列決定などの系では、他に記載されている多重化よりも10倍超、50倍超、および100倍超高度な多重化が実現された。これは、過剰なプライマー二量体が感知できるほど結果に影響を及ぼさないプローブに基づく検出方法、例えば、マイクロアレイ、TAQMAN、PCRとは対照的であることに留意されたい。当技術分野における一般的な考えでは、配列決定するための多重化PCRは、同じウェルでは約100アッセイに限られることにも留意されたい。FluidigmおよびRain Danceは、1つの試料について並行した反応で48または1000のPCRアッセイを実施するためのプラットフォームを提供する。
非マッピングプライマー二量体または他の悪影響を及ぼすプライマー産物の量を最小限にしたライブラリーのためのプライマーを選択するためのいくつもの方法が存在する。経験的なデータにより、少数の「悪い」プライマーは大量の非マッピングプライマー二量体副反応に関与することが示されている。これらの「悪い」プライマーを除去することにより、標的の遺伝子座に対して位置を決めるシーケンスリードのパーセントを上昇させることができる。「悪い」プライマーを同定するための1つの方法は、標的化増幅によって増幅されたDNAの配列決定データを調べることであり、最大の頻度で認められるプライマー二量体を除去して、ゲノムにマッピングされない副産物DNAをもたらす可能性が有意に低いプライマーライブラリーを生じることができる。種々のプライマーの組み合わせの結合エネルギーを算出することができる公的に入手可能なプログラムも存在し、結合エネルギーが最も高いプライマーの組み合わせを除去することにより、同様に、ゲノムにマッピングされない副産物DNAをもたらす可能性が有意に低いプライマーライブラリーが生じる。
プライマー選択のためのいくつかの実施形態では、初期の候補プライマーライブラリーは、候補標的遺伝子座に対する1個または複数個のプライマーまたはプライマー対を設計することにより作製される。候補標的遺伝子座(例えば、SNP)の集合は、標的集団内のSNPの頻度またはSNPのヘテロ接合率などの標的遺伝子座の所望のパラメータに関する公的に入手可能な情報に基づいて選択できる。一実施形態では、PCRプライマーは、Primer3プログラム(primer3.sourceforge.netのworldwide web;libprimer3 release 2.2.3、(参照によりその全体が本明細書に組み込まれる))を使って設計できる。必要に応じ、プライマーは、特定のアニーリング温度範囲内でアニールするように、特定の範囲のGC含量となるように、特定のサイズ範囲に入るように、特定のサイズ範囲の標的増幅産物を産生するように、および/または他のパラメータ特性を有するように設計できる。候補標的遺伝子座当たり複数プライマーまたはプライマー対から出発することにより、ライブラリー中にほとんどのまたは全ての標的遺伝子座に対するプライマーまたはプライマー対が残る尤度を高める。一実施形態では、選択基準は、標的遺伝子座当たり少なくとも1個のプライマー対がライブラリー中に残ることが必要であるということであってもよい。そのようにして、最終プライマーライブラリーを使うことにより、ほとんどまたは全ての標的遺伝子座が増幅されるであろう。これは、欠失の選別またはゲノム中の多数の部位での複製または疾患または疾患の危険性の増加に関連する多数の配列(例えば、多型または他の変異)の選別などの用途にとって望ましい。ライブラリー由来のプライマー対が別のプライマー対により生成された標的増幅産物と重複する標的増幅産物を生成する場合には、プライマー対の片方をライブラリーから取り除き、干渉を防止できる。
いくつかの実施形態では、「アンデザイアラビリティスコア」(より高いスコアが最小の望ましさを表す)が、候補プライマーライブラリー由来の2個のプライマーのほとんどまたは全ての可能な組み合わせに対し計算(コンピュータによる計算等で)される。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の候補プライマーの少なくとも80、90、95、98、99、または99.5%の可能な組み合わせに対して計算される。それぞれのアンデザイアラビリティスコアは、2個の候補プライマー間の二量体形成の尤度に少なくとも一部基づいている。必要に応じ、アンデザイアラビリティスコアはまた、標的遺伝子座のヘテロ接合率、標的遺伝子座での配列(例えば、多型)に関連する有病率、標的遺伝子座での配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群から選択される1個または複数個の他のパラメータに基づいてもよい。複数の因子を考慮する場合、アンデザイアラビリティスコアは、種々のパラメータの加重平均に基づいて計算してもよい。パラメータは、プライマーが使われる特定の用途に対する重要性に基づいて異なる加重を割り付けることができる。いくつかの実施形態では、最高のアンデザイアラビリティスコアを有するプライマーは、ライブラリーから取り除かれる。取り除かれたプライマーが1つの標的遺伝子座にハイブリダイズするプライマー対のメンバーである場合、プライマー対のもう一方のメンバーもライブラリーから取り除くことができる。プライマーと取り除くプロセスは、必要に応じ繰り返すことができる。いくつかの実施形態では、ライブラリー中に残っている候補プライマーの組み合わせのアンデザイアラビリティスコアが全て最小閾値以下になるまでその選択方法が実行される。いくつかの実施形態では、その選択方法は、ライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで実行される。
種々の実施形態では、アンデザイアラビリティスコアが計算された後で、第1の最小閾値を超えるアンデザイアラビリティスコアを有する2個の候補プライマーの組み合わせのうち最多数のもののの一部である候補プライマーがライブラリーから取り除かれる。このステップは、第1の最小閾値以下の相互作用を無視する。理由は、これらの相互作用は、重要性が低いからである。取り除かれたプライマーが1つの標的遺伝子座にハイブリダイズするプライマー対のメンバーの場合は、プライマー対のもう一方のメンバーをライブラリーから取り除くことができる。プライマーを取り除くプロセスは、必要に応じ繰り返すことができる。いくつかの実施形態では、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て第1の最小閾値以下になるまでその選択方法が実行される。ライブラリー中に残っている候補プライマーの数が必要数より多い場合は、第1の最小閾値を第2の最小閾値に下げ、プライマーを取り除くプロセスを繰り返すことによりプライマーの数を減らすことができる。ライブラリー中に残っている候補プライマーの数が必要数より少ない場合は、第1の最小閾値をより大きい第2の最小閾値に増やし、ことにより、元の候補プライマーライブラリーを使ってプライマーを取り除くプロセスを繰り返し、それにより、より多くの候補プライマーをライブラリー中に残すことにより前記方法を継続できる。いくつかの実施形態では、ライブラリー中に残っている補プライマーの組み合わせのアンデザイアラビリティスコアが全て第2の最小閾値以下になるか、またはライブラリー中に残っている候補プライマーの数が所望の数に減るまでその選択方法が実行される。
必要に応じ、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対は、別の増幅反応に分割できる。多重PCR増幅反応は、(重複する標的増幅産物のために分析から候補標的遺伝子座を除くのではなく)全ての候補標的遺伝子座を分析するのが望ましい用途への適用が好ましい場合もある。
これらの選択方法は、プライマー二量体の所望の低減を達成するためにライブラリーから取り除く必要のある候補プライマーの数を最小限化する。より少ない数の候補プライマーをライブラリーから取り除くことにより、得られたプライマーライブラリーを使ってより多くの(または全ての)標的遺伝子座を増幅できる。
多数のプライマーを多重化することにより、含めることができるアッセイにかなりの制約が課される。意図せずに相互作用するアッセイにより、偽の増幅産物がもたらされる。miniPCRのサイズの制約により、さらなる制約がもたらされ得る。ある実施形態では、非常に多数の潜在的なSNP標的(約500から100万超の間)で開始し、各SNPを増幅するためのプライマーを設計することを試みることが可能である。プライマーを設計することができる場合、可能性のあるプライマーの対の全ての間で偽のプライマー2重鎖が形成される尤度を、DNA2重鎖形成についての公開された熱力学的なパラメータを使用して評価することによって、偽の産物を形成する可能性があるプライマー対を同定することを試みることが可能である。プライマー相互作用は、相互作用に関連するスコア関数によって順位づけ、所望のプライマーの数に見合うまで相互作用スコアが最も悪いプライマーを排除することができる。ヘテロ接合性の可能性があるSNPが最も有用である場合には、同様にアッセイの一覧を順位付け、最もヘテロ接合性に適合するアッセイを選択することが可能である。実験により、相互作用スコアが高いプライマーが、プライマー二量体を形成する可能性が最も高いことが検証された。高度な多重化においては、全ての偽の相互作用を排除することは不可能であるが、インシリコで相互作用スコアが最も高いプライマーまたはプライマー対は、全体の反応の優位を占め、意図された標的からの増幅を著しく限定するので、これらを除去することが必須である。この手順を実施して、10,000プライマーにも達する、および、場合によってはそれを超える多重化プライマー集合を作製した。この手順による改善は、実質的なものであり、全てのPCR産物の配列決定によって決定された通り、最も悪いプライマーを除去しなかった反応からの10%と比較して、標的産物の80%超、90%超、95%超、98%超、およびさらには99%超の増幅を可能にする。以前に記載されている部分的なセミネステッド手法と組み合わせると、90%超、および95%超までもの増幅産物を標的の配列にマッピングすることができる。
どのPCRプローブが二量体を形成する可能性があるかを決定するための他の方法が存在することに留意されたい。ある実施形態では、最適化されていないプライマーの集合を使用して増幅したDNAのプールの分析が、問題のあるプライマーを決定するために十分であり得る。例えば、分析は配列決定を用いて行うことができ、最大の数で存在する二量体を、二量体を形成する可能性が最も高いものであると決定し、除去することができる。
この方法には、いくつもの潜在的な適用、例えば、SNP遺伝子型決定、ヘテロ接合性率決定、コピー数測定、および他の標的化配列決定への適用がある。ある実施形態では、プライマーを設計する方法を、本文書の他の箇所に記載されているmini−PCR法と組み合わせて用いることができる。いくつかの実施形態では、プライマーの設計方法を、大規模な多重PCR法の一部として用いることができる。
プライマーにタグを使用することにより、プライマー二量体産物の増幅および配列決定を減らすことができる。いくつかの実施形態では、プライマーは、タグを有するループ構造を形成する内部領域を含む。特定の実施形態では、プライマーは、標的遺伝子座に特異的な5’領域、標的遺伝子座に特異的ではないループ構造を形成する内部領域,および標的遺伝子座に特異的な3’領域を含む。いくつかの実施形態では、ループ領域は、2つの結合領域がテンプレートDNAの近接または隣接領域に結合するように設計されている2つの結合領域の間に位置してもよい。種々の実施形態では、3’領域の長さは、少なくとも7ヌクレオチドである。いくつかの実施形態では、3’領域の長さは、7〜20ヌクレオチドであり、例えば、7〜15ヌクレオチド,または7〜10ヌクレオチドである。種々の実施形態では、プライマーは、標的遺伝子座に特異的ではない5’領域(例えば、タグまたはユニバーサルプライマー結合部位)、続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的ではないループ構造を形成する内部領域,および標的遺伝子座に特異的な3’領域を含む。タグ−プライマーを用いて、必要な標的特異的配列を20塩基対未満、15塩基対未満、12塩基対未満、さらには10塩基対未満までに短縮することができる。これは、プライマー結合部位内で標的配列が断片化される場合に標準のプライマーの設計に伴って偶然発見され得る、または、または、プライマー設計へと企画することができる。この方法の利点としては、特定の最大の増幅産物の長さに対して設計することができるアッセイの数が増加すること、および「情報価値のない」プライマー配列の配列決定が短縮されることが挙げられる。前記方法は、内部のタグ付けと組み合わせて用いることもできる(本文書の他の箇所を参照されたい)。
ある実施形態では、多重標的PCR増幅における非生産的な産物の相対量を、アニーリング温度を上昇させることによって減少させることができる。標的特異的プライマーと同じタグを有するライブラリーを増幅する場合には、タグがプライマー結合に寄与するので、アニーリング温度をゲノムDNAと比較して増大させることができる。いくつかの実施形態では、以前報告されたものよりも相当低いプライマー濃度を用い、それと一緒に、他の箇所で報告されているものよりも長いアニーリング時間を用いる。いくつかの実施形態では、アニーリング時間は、3分超、5分超、8分超、10分超、15分超、20分超、30分超、60分超、120分超、240分超、480分超、およびさらには960分超であってよい。ある実施形態では、以前の報告よりも長いアニーリング時間を用い、これにより、より低いプライマー濃度が可能になる。種々の実施形態では、例えば、3,5,8,10,または15分を超える通常より長い伸長時間が使われる。いくつかの実施形態では、プライマー濃度は、50nM、20nM、10nM、5nM、1nM、および1μM未満までの低さである。驚いたことに、これにより、高度に多重化された反応、例えば、1,000プレックス反応、2,000プレックス反応、5,000プレックス反応、10,000プレックス反応、20,000プレックス反応、50,000プレックス反応、およびさらには100,000プレックス反応に対して頑強な性能がもたらされる。ある実施形態では、増幅には、長いアニーリング時間で実行する1サイクル、2サイクル、3サイクル、4サイクルまたは5サイクルを用い、その後、タグを付けたプライマーを用いて通常のアニーリング回数より多いPCRサイクルを行う。
標的場所を選択するために、候補となるプライマー対設計物のプールを用いて着手し、プライマー対間の潜在的に有害な相互作用の熱力学的モデルを作製し、次いで、このモデルを用いてプール内の他の設計物と適合しない設計物を排除することができる。
選択プロセス後、ライブラリー中に残っているプライマーは、本発明のいずれかの方法で使用できる。
代表的プライマーライブラリー
一態様では、本発明は、プライマー、例えば、候補プライマーライブラリーから本発明のいずれかの方法を使って選択されたプライマーのライブラリーを特徴とする。いくつかの実施形態では、ライブラリーは、1反応体積で、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズする(もしくは、同時にハイブリダイズ可能な)、または同時に増幅する(もしくは、同時に増幅可能な)プライマーを含む。種々の実施形態では、ライブラリーは、1,000〜2,000;2,000〜5,000;5,000〜7,500;7,500〜10,000;10,000〜20,000;20,000〜25,000;25,000〜30,000;30,000〜40,000;40,000〜50,000;50,000〜75,000;75,000〜100,000個の異なる標的遺伝子座を1反応体積で同時に増幅する(もしくは、同時に増幅可能な)プライマーを含む。種々の実施形態では、ライブラリーは、1反応体積で、1,000〜100,000個の異なる標的遺伝子座、例えば、1,000〜50,000;1,000〜30,000;1,000〜20,000;1,000〜10,000;2,000〜30,000;2,000〜20,000;2,000〜10,000;5,000〜30,000;5,000〜20,000;または5,000〜10,000個の異なる標的遺伝子座を同時に増幅する(もしくは、同時に増幅可能な)プライマーを含む。いくつかの実施形態では、ライブラリーは、標的遺伝子座を1反応体積で同時に増幅する(もしくは、同時に増幅可能な)プライマーを含み、それにより、増幅産物の60、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.5%未満がプライマー二量体となる。種々の実施形態では、プライマー二量体増幅産物の量は、0.5〜60%であり、例えば、0.1〜40%,0.1〜20%,0.25〜20%,0.25〜10%,0.5〜20%,0.5〜10%,1〜20%,または1〜10%である。いくつかの実施形態では、プライマーは、標的遺伝子座を1反応体積で同時に増幅し(もしくは、同時に増幅可能であり)、それにより、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の増幅産物が標的増幅産物である。種々の実施形態では、標的増幅産物である増幅産物の量は、50〜99.5%,例えば、60〜99%,70〜98%,80〜98%,90〜99.5%,または95〜99.5%である。いくつかの実施形態では、プライマーは、標的遺伝子座を1反応体積で同時に増幅し(もしくは、同時に増幅可能であり)、それにより、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅される。種々の実施形態では、増幅された標的遺伝子座の量は、50〜99.5%であり、例えば、60〜99%,70〜98%,80〜99%,90〜99.5%,95〜99.9%,または98〜99.99%である。いくつかの実施形態では、プライマーライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個のプライマー対を含み、それぞれの対のプライマーは、フォワード試験プライマーおよびリバース試験プライマーを含み、それぞれの試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。
種々の実施形態では、それぞれのプライマーの濃度は、100、75、50、25、20、10、5、2、もしくは1nM未満、または500、100、10、もしくは1uM未満である。種々の実施形態では、それぞれのプライマーの濃度は、1uM〜100nMであり、例えば、1uM〜1nM,1〜75nM,2〜50nMまたは5〜50nMである。種々の実施形態では、プライマーのGC含量は、30〜80%であり、例えば、40〜70%,または50〜60%である。いくつかの実施形態では、プライマーのGC含量の範囲は、30、20、10、または5%未満である。いくつかの実施形態では、プライマーのGC含量の範囲は、5〜30%であり、例えば、5〜20%または5〜10%である。いくつかの実施形態では、試験プライマーの融解温度(T)は、40〜80℃であり、例えば、50〜70℃,55〜65℃,または57〜60.5℃である。いくつかの実施形態では、Tは、組込みSantaLuciaパラメータ(primer3.sourceforge.netのworldwide web)を使ってprimer3プログラム(libprimer3 release 2.2.3)で計算される。いくつかの実施形態では、プライマーの融解温度の範囲は、15、10、5、3、または1℃未満である。いくつかの実施形態では、プライマーの融解温度の範囲は、1〜15℃であり、例えば、1〜10℃、1〜5℃、または1〜3℃である。いくつかの実施形態では、プライマーの長さは、15〜100ヌクレオチドであり、例えば、15〜75ヌクレオチド、15〜40ヌクレオチド、17〜35ヌクレオチド、18〜30ヌクレオチド、20〜65ヌクレオチドである。いくつかの実施形態では、プライマーの長さの範囲は、50、40、30、20、10、または5ヌクレオチド未満である。いくつかの実施形態では、プライマーの長さの範囲は、5〜50ヌクレオチドであり、例えば、5〜40ヌクレオチド、5〜20ヌクレオチド、または5〜10ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さは、50〜100ヌクレオチドであり、例えば、60〜80ヌクレオチド、または60〜75ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、50、25、15、10、または5ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さの範囲は、5〜50ヌクレオチドであり、例えば、5〜25ヌクレオチド、5〜15ヌクレオチド、または5〜10ヌクレオチドである。
これらのプライマーライブラリーは、本発明のいずれかの方法で使用可能である。
代表的プライマーキット
一態様では、本発明は、本発明のいずれかのプライマーライブラリーを含むキット(例えば、核酸試料中の標的遺伝子座を増幅するキット)を特徴とする。いくつかの実施形態では、本開示で記載の方法を実現するために設計された複数のプライマーを含むキットを処方することができる。プライマーは、本明細書に開示されている外側のフォワードプライマーおよびリバースプライマー、内側のフォワードプライマーおよびリバースプライマーであってよく、プライマーの設計のセクションに開示されている通り、キット内の他のプライマーに対する結合親和性が低いように設計されたプライマーであってよく、関連するセクションに記載のとおりハイブリッド捕捉プローブまたは環状化前プローブであるかまたはそのいくつかの組み合わせであってよい。ある実施形態では、本明細書に開示されている方法で使用するために設計された、妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットであって、複数の内側のフォワードプライマー、および必要に応じて複数の内側のリバースプライマー、および必要に応じて、外側のフォワードプライマーおよび外側のリバースプライマーであって、該プライマーのそれぞれが、標的染色体および必要に応じて、さらに別の染色体上の標的部位(例えば、多型部位)のうちの1つのすぐ上流および/または下流のDNAの領域とハイブリダイズするように設計されているプライマー、を含むキットを構築することができる。ある実施形態では、プライマーキットは、本文書の他の箇所に記載されている診断ボックスと組み合わせて用いることができる。いくつかの実施形態では、キットは、ライブラリーを使用して標的遺伝子座を増幅するための説明書を含む。
代表的多重PCR法
一態様では、本発明は、核酸試料中の標的遺伝子座を増幅する方法を特徴とし、前記方法は、(i)核酸試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップ、および(ii)反応混合物をプライマー伸長反応条件(例えば、PCR条件)に供し、標的増幅産物を含む増幅産物を生成するステップを含む。いくつかの実施形態では、前記方法はまた、少なくとも1種の標的増幅産物(例えば、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の存在の有無を判定するステップも含む。いくつかの実施形態では、前記方法はまた、少なくとも1種の標的増幅産物(例えば、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の配列を決定するステップも含む。いくつかの実施形態では、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅される。種々の実施形態では、60、50、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満の増幅産物がプライマー二量体である。
ある実施形態では、本明細書に開示されている方法は、非常に効率的な高度多重標的PCRを使用して、DNAを増幅し、その後ハイスループット配列決定を行って各標的遺伝子座における対立遺伝子頻度を決定する。約50または100を超えるPCRプライマーを1反応体積で、生じたシーケンスリードの大部分が、標的の遺伝子座にマッピングされるように多重化できることは、新規かつ非自明である。非常に効率的な様式で実施するための高度多重標的PCRを可能にする1つの技法は、互いとハイブリダイズする可能性が低いプライマーの設計を伴う。一般にはプライマーと称されるPCRプローブは、少なくとも500、少なくとも1,000、少なくとも2,000、少なくとも5,000、少なくとも7,500、少なくとも10,000、少なくとも20,000、少なくとも25,000、少なくとも30,000、少なくとも40,000、少なくとも50,000、少なくとも75,000、または少なくとも100,000の潜在的なプライマー対間の潜在的に有害な相互作用、または、プライマーと試料DNAの間の意図されたものではない相互作用の熱力学的モデルを作製し、次いで、このモデルを使用して、プール内の他の設計物と適合しない設計物を排除することによって選択する。非常に効率的な様式で実施するための高度多重標的PCRを可能にする別の技法は、部分的な、または完全なネスティング手法を用いて標的PCRを行うことである。これらの手法の1つまたはその組み合わせを用いることにより、単一のプール内の少なくとも300個、少なくとも800個、少なくとも1,200個、少なくとも4,000個または少なくとも10,000個のプライマーを多重化することが可能になり、生じた増幅されたDNAは、配列決定すると、標的の遺伝子座にマッピングされる大多数のDNA分子を含む。これらの手法の1つまたはその組み合わせを用いることにより、単一のプール内の多数のプライマーを多重化することが可能になり、生じた増幅されたDNAは、50%超、60%超、67%超、80%超、90%超、95%超、96%超、97%超、98%超、99%超、または99.5%超の、標的の遺伝子座にマッピングされるDNA分子を含む。
いくつかの実施形態では、標的遺伝物質の検出は多重様式で行うことができる。並行して実行することができる遺伝子の標的配列の数は、1〜10、10〜100、100〜1,000、1,000〜10,000、10,000〜100,000、100,000〜1,000,000または1,000,000〜10,000,000にわたり得る。プール当たり100個超のプライマーを多重化するための以前の試みでは、プライマーの二量体形成などの望ましくない副反応を伴う重大な問題が生じた。
標的PCR
いくつかの実施形態では、PCRを用いて、ゲノムの特定の場所を標的とすることができる。血漿試料において、元のDNAは高度に断片化されている(一般には、500bp未満、平均長200bp未満)。PCRでは、増幅を可能にするために、フォワードプライマーとリバースプライマーの両方が同じ断片とアニーリングする。したがって、断片が短い場合、PCRアッセイでは、同様に比較的短い領域を増幅しなければならない。MIPSのように、多型の位置がポリメラーゼ結合部位と近すぎると、異なる対立遺伝子からの増幅に偏りが生じる。現在、SNPを含有するものなどの多型領域を標的とするPCRプライマーは、一般には、プライマーの3’末端が1個または複数個の多型の塩基のすぐ隣の塩基とハイブリダイズするように設計される。本開示のある実施形態では、フォワードPCRプライマーおよびリバースPCRプライマーの両方の3’末端が、標的の対立遺伝子の変異の位置(多型部位)と1つまたは少数の位置だけ離れている塩基とハイブリダイズするように設計する。多型部位(SNPまたは他の種類のもの)と、プライマーの3’末端がハイブリダイズするように設計された塩基との間の塩基の数は、1塩基であってよい、2塩基であってよい、3塩基であってよい、4塩基であってよい、5塩基であってよい、6塩基であってよい、7〜10塩基であってよい、11〜15塩基であってよい、または、16〜20塩基であってよい。フォワードプライマーおよびリバースプライマーは、多型部位から離れた異なる数の塩基とハイブリダイズするように設計することができる。
PCRアッセイを多数生成することができるが、異なるPCRアッセイ間の相互作用により、約100アッセイを越えてそれらを多重化することが難しくなる。種々の複雑な分子的手法を用いて、多重化のレベルを上昇させることができるが、それでも反応当たり100未満、おそらく200、またはことによると500アッセイに限られ得る。多量のDNAを有する試料は、複数の副次反応に分割し、次いで配列決定の前に組み換えることができる。DNA分子の全体的な試料または一部の亜集団のいずれかが限られている試料については、試料を分割することにより統計学的なノイズが導入されることになる。ある実施形態では、少ないまたは限られた量のDNAとは、10pg未満、10pgから100pgの間、100pgから1ngの間、1ngから10ngの間または10ngから100ngの間の量を指し得る。この方法は、複数のプールに分割するステップを包含する他の方法では確率論的ノイズの導入に関連する重大な問題が引き起こされ得る少量のDNAに対して特に有用であるが、この方法は、いかなる量のDNAの試料に対して実行された場合でも、偏りを最小化する利益をもたらすことに留意されたい。これらの状況では、ユニバーサル前増幅ステップを使用して、全体的な試料の量を増大させることができる。理想的には、この前増幅ステップでは、対立遺伝子分布を感知できるほどには変えるべきでない。
ある実施形態では、本開示の方法により、体液由来の単一細胞またはDNAなどの限られた試料から、配列決定またはいくつかの他の遺伝子型決定方法によって遺伝子型決定するために、多数の標的の遺伝子座、詳細には1,000〜5,000の遺伝子座、5,000〜10,000の遺伝子座、または10,000超の遺伝子座に特異的なPCR産物を生成することができる。現在、5超〜10個の標的の多重PCR反応を実施することにより、大きな課題が示され、多くの場合、プライマー副産物、例えば、プライマー二量体、および他のアーチファクトが妨害となる。ハイブリダイゼーションプローブを用いたマイクロアレイを使用して標的配列を検出する場合、プライマー二量体および他のアーチファクトは検出されないので、これらは無視することができる。しかし、検出の方法として配列決定を用いる場合、シーケンシングリードの大部分は、そのようなアーチファクトを配列決定し、試料中の所望の標的配列は配列決定しない。1反応体積において50超または100の反応を多重化し、その後に配列決定するために用いられる先行技術に記載の方法により、一般には20%超、および多くの場合50%超、多くの場合80%超およびいくつかの場合には90%超のオフターゲットのシーケンスリードがもたらされる。
一般に、試料における多数の(n)標的(50超、100超、500超または1,000超)に対し標的化配列決定を実施するために、試料をいくつもの並行した反応物へと分割し、1つの個体標的を増幅することができる。これは、PCR多ウェルプレートにおいて実施されている、または商業的なプラットフォーム、例えば、FLUIDIGM ACCESS ARRAY(マイクロ流体チップにおいて試料当たり48の反応)またはRAIN DANCE TECHNOLOGYからのDROPLET PCR(100〜数千もの標的)において実行することができる。残念ながら、これらのスプリットアンドプール(split−and−pool)方法は、多くの場合、存在するゲノムのコピーが、各ウェル中にゲノムの各領域の1つのコピーが存在することを確実にするためには不十分であるので、DNAの量が限られている試料に対しては問題がある。これは、多型遺伝子座を標的とする場合に特に重大な問題であり、分割およびプールすることによって導入される確率論的ノイズにより、元のDNAの試料に存在していた対立遺伝子の割合の非常に不十分に正確な測定が引き起こされるので、多型遺伝子座における対立遺伝子の相対的な割合が必要である。限られた量のDNAのみが利用可能である場合に適用可能な、多くのPCR反応物を有効かつ効率的に増幅するための方法が本明細書に記載されている。ある実施形態では、単一細胞、体液、DNAの混合物、例えば、母系の血漿中に見いだされる浮動性DNA、生検材料、環境試料および/または法医学試料を分析するために前記方法を適用することができる。
ある実施形態では、標的シークエンシングは、1つの、複数の、または全ての次のステップを含んでもよい。a) DNA断片の両端にアダプタ配列を有するライブラリーを生成し、増幅する。b)ライブラリー増幅後、複数反応に分割する。c) DNA断片の両端にアダプタ配列を有するライブラリーを生成し、任意選択で、増幅する。d)標的当たり1個の標的特異的「フォワード」プライマーおよび1個のタグ特異的プライマーを使って、選択標的の1000〜10,000プレックス増幅を行う。e)「リバース」標的特異的プライマーおよび第1ラウンドで標的特異的フォワードプライマーの一部として導入されたユニバーサルタグ特異的1個(または2個以上)のプライマーを使ってこの産物から第2の増幅を行う。f)限定サイクル数で選択標的の1000プレックスプレ増殖を行う。g)産物を複数分割量に分け、標的のサブプールを個別反応で増幅する(例えば、50〜500プレックス(この方法は、単一プレックスまでの任意プレックスで使用できる))。h)並列サブプール反応の産物をプールする。i)これらの増幅の間、プライマーは、シークエンシング適合性タグ(部分長または全長)を保持でき、それにより、産物をシークエンシングできる。
高度多重PCR
本明細書には、血漿から得られるゲノムDNAなどの核酸試料由来の100〜数万をも超える標的配列(例えば、SNP遺伝子座)の標的化増幅を可能にする方法が開示されている。増幅された試料は、プライマー二量体産物を比較的含まず、標的遺伝子座における対立遺伝子の偏りが少ない。増幅の間または増幅後に、産物に配列決定適合性アダプタを付加する場合、これらの産物の分析を配列決定によって実施することができる。
当技術分野で公知の方法を用いて高度多重PCR増幅を実施することにより、所望の増幅産物が過剰であり、配列決定に適さないプライマー二量体産物が生成する。これらは、経験的に、これらの産物を形成するプライマーを排除することによって、またはプライマーのインシリコ選択を実施することによって減少させることができる。しかし、アッセイの数が多くなるほど、この問題はより困難になる。
1つの解法は、5,000プレックス反応をいくつかの低プレックス増幅、例えば、100回の50プレックス反応または50回の100プレックス反応に分割すること、またはマイクロフルイディクスを使用すること、または、さらには、試料を個々のPCR反応に分割することである。しかし、妊娠血漿からの非侵襲的な出生前診断においてなど試料DNAが限られている場合は、多数の反応間に試料を分割することは、これによりボトルネッキングが生じるので、回避するべきである。
本明細書には、まず試料の血漿DNAを全体的に増幅し、次いで試料を、反応当たり、より中程度の数の標的配列を伴う複数の多重化標的富化反応に分割するための方法が記載されている。ある実施形態では、本開示の方法は、DNA混合物を複数の遺伝子座で優先的に富化するために用いることができ、前記方法は以下のステップの1つまたは複数を含む:DNAの混合物からライブラリーを生成し、増幅するステップであって、ライブラリー内の分子がDNA断片の両末端にライゲーションされたアダプタ配列を有するステップ、増幅されたライブラリーを複数の反応に分割するステップ、選択された標的の多重増幅の第1ラウンドを、標的当たり1つの標的特異的「フォワード」プライマーおよび1個または複数個のアダプタ特異的なユニバーサル「リバース」プライマーを使用して実施するステップ。ある実施形態では、本開示の方法は、「リバース」標的特異的プライマー、および1個または複数個の、第1ラウンドにおいて標的特異的フォワードプライマーの一部として導入されたユニバーサルタグに特異的なプライマーを使用して第2の増幅を実施するステップをさらに含む。ある実施形態では、前記方法は、完全ネステッドPCR手法、ヘミネステッドPCR手法、セミネステッドPCR手法、片側完全ネステッドPCR手法、片側ヘミネステッドPCR手法または片側セミネステッドPCR手法を伴ってよい。ある実施形態では、DNA混合物を複数の遺伝子座において優先的に富化するために本開示の方法を用い、前記方法は、選択された標的の多重化前増幅を、限られたサイクル数で実施するステップと、産物を複数の一定分量に分けるステップと、個々の反応における標的のサブプールを増幅するステップと、並行サブプール反応の産物をプールするステップとを含む。この手法は、50〜500遺伝子座について、500〜5,000遺伝子座について、5,000〜50,000遺伝子座について、または、さらには50,000〜500,000遺伝子座について、対立遺伝子の偏りが低レベルになるように標的化増幅を実施するために用いることができることに留意されたい。ある実施形態では、プライマーは、部分長、または完全長の配列決定適合性タグを担持する。
ワークフローは、(1)血漿DNAなどのDNAを抽出するステップと、(2)断片の両末端にユニバーサルアダプタを有する断片ライブラリーを調製するステップと、(3)ライブラリーを、アダプタに特異的なユニバーサルプライマーを使用して増幅するステップと、(4)増幅された試料「ライブラリー」を複数の一定分量に分けるステップと、(5)一定分量に対して多重化(例えば、標的当たり1つの標的特異的プライマーおよびタグ特異的プライマーを用いた約100プレックス、1,000または10,000プレックス)増幅を実施するステップと、(6)1つの試料の一定分量をプールするステップと、(7)試料についてバーコーディングを行うステップと、(8)試料を混合し、濃度を調整するステップと、(9)試料について配列決定するステップとを伴ってよい。ワークフローは、列挙されているステップのうちの1つを含有する複数のサブステップを含んでよい(例えば、ステップ(2)のライブラリーを調製するステップは、3つの酵素的ステップ(平滑末端化、dAテーリングおよびアダプタライゲーション)および3つの精製ステップを伴ってよい)。ワークフローのステップは、組み合わせることができる、分けることができる、または異なる順序で実施することができる(例えば、試料のバーコーディングおよびプール)。
ライブラリーの増幅は、短い断片をより効率的に増幅することに偏りがあるように実施することができることに留意することが重要である。このように、より短い配列、例えば、モノヌクレオソームのDNA断片を妊娠中の女性の循環中に見いだされる無細胞の胎児DNA(胎盤起源の)として優先的に増幅することが可能である。PCRアッセイは、タグ、例えば配列決定タグ(通常15〜25塩基の切断形態)を有してよいことに留意されたい。多重化した後、試料のPCR多重化産物をプールし、次いで、タグ特異的PCRによって(ライゲーションによって行うこともできる)タグ付けを完了する(バーコーディングを含む)。また、多重化として完全な配列決定タグを同じ反応に加えることができる。第1のサイクルでは、標的を、標的特異的プライマーを用いて増幅することができ、その後、タグ特異的プライマーが優勢になって完全なSQアダプタ配列を完成させる。PCRプライマーはタグを担持しなくてよい。配列決定タグはライゲーションによって増幅産物に付加することができる。
ある実施形態では、高度多重PCR、その後クローン配列決定を用いて増幅された材料を評価することによって、胎児の異数性を検出などの種々の用途に使用することができる。従来の多重PCRでは最大で50遺伝子座を同時に評価するが、本明細書に記載の手法を使用して、50超の遺伝子座を同時に、100超遺伝子座を同時に、500超遺伝子座を同時に、1,000超遺伝子座を同時に、5,000超遺伝子座を同時に、10,000超遺伝子座を同時に、50,000超遺伝子座を同時に、および100,000超遺伝子座を同時に、同時評価することを可能にし得る。実験により、10,000まで、10,000を含めて、および10,000超の別個の遺伝子座を、単一反応において、十分に優良な効率および特異性で同時に評価して、非侵襲的な出生前異数性診断および/またはコピー数のコールを高い正確度で行うことができることが示された。アッセイは、単一反応において、母系の血漿から単離されたcfDNA試料などの試料全体、その画分またはcfDNA試料のさらに加工した誘導体と組み合わせることができる。試料(例えば、cfDNAまたは誘導体)は、複数の並行の多重反応に分割することもできる。最適な試料の分割および多重化を、種々の性能仕様のトレードオフによって決定する。材料の量が限られているので、試料を複数の画分に分割することにより、サンプリングノイズ、取扱い時間、およびエラーの可能性の増大がもたらされる可能性がある。逆に、高多重化の結果、偽の増幅の量が増え、増幅の不等性が増す可能性があり、どちらによっても検査性能が低下する。
本明細書に記載の方法の適用における2つの極めて重要な関連する考慮すべき事柄は、限られた量の元の試料(例えば、血漿)および対立遺伝子頻度または他の測定値を得る材料内の元の分子の数である。元の分子の数が特定のレベルを下回る場合、ランダムサンプリングノイズが著しくなり、検査の正確度に影響を及ぼす可能性がある。一般には、標的遺伝子座当たり500〜1000個の元の分子相当を含む試料に対して測定を行う場合、非侵襲的な出生前異数性診断を行うために十分な品質のデータを得ることができる。別個の測定値の数を増加させる、例えば、試料の体積を増加させるいくつもの方法が存在する。試料に適用される各操作によっても、潜在的に材料が損失する。検査の性能を低下させ得る損失を回避するために、種々の操作によって受けた損失を特徴付けること、および特定の操作を回避するまたは必要に応じてその収量を改善することが必須である。
ある実施形態では、元の試料(例えば、cfDNA試料)の全てまたはある割合を増幅することによって、その後のステップにおける潜在的な損失を減ずることが可能である。試料中の遺伝物質の全てを増幅し、それにより下流の手順のために利用可能な量を増大させるために、種々の方法が利用可能である。ある実施形態では、ライゲーション媒介性PCR(LM−PCR)DNA断片を、1つの別個のアダプタ、2つの別個のアダプタまたは多くの別個のアダプタのいずれかをライゲーションした後に、PCRによって増幅する。ある実施形態では、多置換増幅(MDA)phi−29ポリメラーゼを使用して、全てのDNAを等温的に増幅する。DOP−PCRおよびその変形では、ランダムプライミングを使用して元の材料DNAを増幅する。各方法は、特定の特性、例えば、代表的なゲノムの領域全てにわたる増幅の均一性、元のDNAの捕捉および増幅の効率、および断片の長さに応じた増幅性能を有する。
ある実施形態では、LM−PCRを、3’チロシンを有する単一のヘテロ二本鎖アダプタと一緒に使用することができる。ヘテロ二本鎖アダプタにより、PCRの第1ラウンドの間に元のDNA断片の5’末端および3’末端上の2つの別個の配列に変換することができる単一のアダプタ分子を使用することが可能になる。ある実施形態では、サイズ分離によって増幅されたライブラリー、またはAMPURE、TASS、もしくは他の同様の方法などの産物を分画することが可能である。ライゲーションの前に、試料DNAを平滑末端化し、次いで、単一のアデノシン塩基を3’末端に付加する。ライゲーションの前に、DNAを、制限酵素またはいくつかの他の切断方法を用いて切断することができる。ライゲーションの間、試料断片の3’アデノシンおよびアダプタの相補的な3’チロシンオーバーハングにより、ライゲーション効率が増強され得る。PCR増幅の伸長ステップは、約200bp、約300bp、約400bp、約500bpまたは約1,000bpより長い断片からの増幅を低下させるための時間の観点から、限られ得る。母系の血漿中に見いだされるより長いDNAはほぼ排他的に母系であるので、これにより、胎児DNAの10〜50%の富化および検査性能の改善がもたらされ得る。市販のキットによって規定されている条件を用いていくつもの反応を実行し、試料DNA分子の10%未満の上首尾のライゲーションがもたらされた。これに対する反応条件の一連の最適化により、ライゲーションがおよそ70%に改善された。
Mini−PCR
下記のMini−PCR法は、cfDNAなどの短い核酸,消化核酸,またはフラグメント化核酸を含む試料に好適する。従来のPCRアッセイ設計により、特徴的な胎児の分子の損失が大きいが、この損失は、mini−PCRアッセイと称される非常に短いPCRアッセイを設計することによって著しく低下させることができる。母系の血清中の胎児のcfDNAは高度に断片化されており、断片サイズはほぼガウス様式で分布しており、平均が160bpであり、標準偏差が15bpであり、最小サイズが約100bpであり、最大サイズが約220bpである。標的の多型に関する断片の開始位置および終了位置の分布は、必ずしもランダムではないが、個々の標的の間で、および集合的に全ての標的の間で広範に変動し、1つの特定の標的遺伝子座の多型部位は、その遺伝子座を起源とする種々の断片の中で開始から終了までの任意の位置を占有し得る。mini−PCRという用語は、さらなる制限または限定なく、通常のPCRを等しく良好に指し得ることに留意されたい。
PCRの間、増幅はフォワードプライマー部位とリバースプライマー部位の両方を含む鋳型DNA断片のみから起こる。胎児のcfDNA断片は短いので、両方のプライマー部位が存在する尤度であって、フォワードプライマー部位とリバースプライマー部位の両方を含む長さLの胎児の断片の尤度は、増幅産物の長さと断片の長さの比である。理想的な条件下では、増幅産物が45bp、50bp、55bp、60bp、65bpまたは70bpであるアッセイにより、それぞれ、利用可能な鋳型断片分子の72%、69%、66%、63%、59%または56%から首尾よく増幅される。増幅産物の長さは、フォワードプライミング部位およびリバースプライミング部位の5’末端の間の距離である。当業者により一般に使用されるものよりも短い長さの増幅産物により、必要な短いシーケンスリードのみによる所望の多型遺伝子座のより効率的な測定がもたらされ得る。ある実施形態では、増幅産物の実質的な画分は100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満、または45bp未満であるべきである。
先行技術で公知の方法において、本明細書に記載のものなどの短いアッセイは、必要ではなく、また、プライマーの設計に対して、プライマーの長さの限定、アニーリング特性、およびフォワードプライマーとリバースプライマーの間の距離によってかなりの制約を課すので、通常は回避されることに留意されたい。
いずれかのプライマーの3’末端が多型部位のおよそ1〜6塩基の範囲内である場合、増幅の偏りが潜在的に存在することにも留意されたい。最初にポリメラーゼが結合する部位におけるこの一塩基の差異により、一方の対立遺伝子の優先的な増幅がもたらされる可能性があり、これにより、観察される対立遺伝子頻度が変更され、性能が低下する可能性がある。これらの制約の全てにより、特定の遺伝子座を首尾よく増幅するプライマーを同定すること、およびそれに加えて、同じ多重化反応に適合するプライマーの大きな集合を設計することが非常に困難になる。ある実施形態では、内側のフォワードプライマーおよびリバースプライマーの3’末端を、多型部位の上流にあり、少数の塩基で多型部位から隔てられているDNAの領域とハイブリダイズするように設計する。理想的には、塩基の数は6塩基から10塩基の間であってよいが、同等に良好に、4塩基から15塩基の間、3塩基から20塩基の間、2塩基から30塩基の間または1塩基から60塩基の間であってよく、実質的に同じ結果が実現され得る。
多重PCRは、全ての標的が増幅される単回ラウンドのPCRを伴ってよい、または、1ラウンドのPCR、その後の1または複数のラウンドのネステッドPCRまたはネステッドPCRのいくつかの変形を伴ってよい。ネステッドPCRは、前のラウンドで使用されたプライマーよりも少なくとも1つの塩基対だけ内部に結合する1個または複数個の新しいプライマーを使用した、次の1または複数のラウンドのPCR増幅からなる。ネステッドPCRにより、正確な内部の配列を有する前の反応からの増幅産物のみを、その後の反応において、増幅することによって偽の増幅標的の数が減少する。偽の増幅標的が減少することにより、特に配列決定において得ることができる有用な測定値の数が改善される。ネステッドPCRは、一般には、前のプライマー結合部位よりも完全に内部のプライマーを設計することを伴い、必然的に、増幅のために必要な最小のDNAセグメントサイズが増大する。DNAが高度に断片化されている母系の血漿cfDNAなどの試料については、より大きなアッセイサイズにより、測定値を得ることができる別個のcfDNA分子の数が減少する。ある実施形態では、この影響を相殺するために、第2ラウンドのプライマーの一方または両方が、いくつかの数の塩基を内部に伸長させている第1の結合部位とオーバーラップしている部分的なネスティング手法を用いて、全アッセイサイズの拡大を最小限にしながらさらに別の特異性を実現することができる。
ある実施形態では、PCRアッセイの多重プールを、潜在的にヘテロ接合性である1個または複数個の染色体上のSNPまたは他の多型遺伝子座または非多型遺伝子座を増幅するように設計し、これらのアッセイを単一反応において用いてDNAを増幅する。PCRアッセイの数は、50回から200回の間のPCRアッセイ、200回から1,000回の間のPCRアッセイ、1,000回から5,000回の間のPCRアッセイまたは5,000回から20,000回の間のPCRアッセイ(50〜200プレックス、200〜1,000プレックス、1,000〜5,000プレックス、5,000〜20,000プレックス、20,000超プレックスそれぞれ)であってよい。ある実施形態では、約10,000PCRアッセイ(10,000プレックス)の多重プールを、X染色体、Y染色体、第13染色体、第18染色体、および第21染色体および第1染色体または第2染色体上の潜在的にヘテロ接合性であるSNP遺伝子座を増幅するように設計し、これらのアッセイを単一反応において用いて、材料血漿試料、絨毛膜絨毛試料、羊水穿刺試料、単一または少数の細胞、他の体液または組織、がんまたは他の遺伝物質から得られたcfDNAを増幅する。各遺伝子座のSNP頻度は、増幅産物の配列決定のクローンによる方法またはいくつかの他の方法によって決定することができる。対立遺伝子頻度分布の統計分析または全てのアッセイの比を使用して、試料が、検査に含まれる染色体のうちの1個または複数個のトリソミーを含有するかどうかを決定することができる。別の実施形態では、元のcfDNA試料を2つの試料に分割し、並行した5,000プレックスアッセイを実施する。別の実施形態では、元のcfDNA試料をn個の試料に分割し、並行した(約10,000/n)プレックスアッセイを実施し、ここでnは、2から12の間または12から24の間または24から48の間または48から96の間である。データを収集し、既に記載されているものと同様に分析する。この方法は、転座、欠失、重複、および他の染色体異常を検出することに同等に良好に適用可能であることに留意されたい。
ある実施形態では、標的ゲノムに対する相同性を有さない尾部をプライマーのいずれかの3’末端または5’末端に付加することもできる。これらの尾部により、その後の操作、手順または測定が容易になる。ある実施形態では、尾部配列は、標的特異的フォワードプライマーと標的特異的リバースプライマーに対して同じであってよい。ある実施形態では、標的特異的フォワードプライマーと標的特異的リバースプライマーのために異なる尾部を用いることができる。ある実施形態では、異なる遺伝子座または遺伝子座の集合に対して複数の異なる尾部を用いることができる。全ての遺伝子座の間で、または遺伝子座のサブセットの間で特定の尾部が共有されてよい。例えば、現行の配列決定プラットフォームのいずれかに必要なフォワード配列およびリバース配列に対応するフォワード尾部およびリバース尾部を用いて、増幅後の直接配列決定が可能になる。ある実施形態では、尾部を、全ての増幅された標的の間で、他の有用な配列を付加するために使用することができる一般的なプライミング部位として使用することができる。いくつかの実施形態では、内側のプライマーは、標的の遺伝子座(例えば、多型遺伝子座)の上流または下流のいずれかとハイブリダイズするように設計された領域を含有してよい。いくつかの実施形態では、プライマーは、分子バーコードを含有してよい。いくつかの実施形態では、プライマーは、PCR増幅が可能になるように設計されたユニバーサルプライミング配列を含有してよい。
ある実施形態では、10,000プレックスPCRアッセイプールを、フォワードプライマーおよびリバースプライマーが、ハイスループット配列決定計器、例えば、ILLUMINAから入手可能なHISEQ、GAIIXまたはMYSEQに必要な所要のフォワード配列およびリバース配列に対応する尾部を有するように作製する。さらに、配列決定尾部に対して5’側には、その後のPCRにおいて増幅産物にヌクレオチドバーコード配列を付加するためのプライミング部位として用いることができるさらに別の配列が含まれ、それにより、複数の試料をハイスループット配列決定計器の単一のレーンで多重化シークエンシングが可能になる。
ある実施形態では、10,000プレックスPCRアッセイプールを、リバースプライマーが、ハイスループット配列決定計器に必要な所要のリバース配列に対応する尾部を有するように作製する。第1の10,000プレックスアッセイで増幅した後、その後のPCR増幅を、全ての標的に対して部分ネステッドフォワードプライマー(例えば、6塩基ネステッド)、および第1ラウンドに含まれたリバース配列決定尾部に対応するリバースプライマーを有する別の10,000プレックスプールを使用して実施することができる。この、ただ1つの標的特異的プライマーおよびユニバーサルプライマーを用いた部分ネステッド増幅の次のラウンドでは、アッセイに必要なサイズが限られ、サンプリングノイズが低下するが、偽の増幅産物の数が著しく減少する。配列決定タグを、付加したライゲーションアダプタに、および/またはPCRプローブの一部として付加することができ、したがって、タグは最後の増幅産物の一部になる。
胎児画分は検査の性能に影響を及ぼす。母系の血漿中に見いだされるDNAの胎児画分を富化するためのいくつもの方法が存在する。胎児画分は、既に考察されている上記のLM−PCR法によって、ならびに長い母系断片の標的化除去によって増大させることができる。ある実施形態では、標的遺伝子座の多重PCR増幅の前に、追加の多重PCR反応を行って、その後の多重PCRにおいて標的とされる遺伝子座に対応する長くて大きい母系断片を選択的に除去することができる。追加のプライマーを、無細胞の胎児DNA断片の間に存在することが予想されるよりも多型からの距離が長い部位とアニーリングするように設計する。これらのプライマーは、標的多型遺伝子座の多重PCRの前の1サイクル多重PCR反応において用いることができる。これらの遠位プライマーには、タグを付けたDNAの小片の選択的な認識を可能にし得る分子または部分でタグ付けする。ある実施形態では、これらのDNAの分子は、1サイクルのPCR後に、これらのプライマーを含む新しく形成された二本鎖DNAを除去することを可能にするビオチン分子を用いて共有結合的に修飾することができる。その第1ラウンドの間に形成された二本鎖DNAは、母体起源であるようである。ハイブリッド材料の除去は、磁性ストレプトアビジンビーズを使用することにより実現することができる。同等に良好に機能し得るタグ付けの他の方法が存在する。ある実施形態では、サイズ選択法を使って、例えば、約800bp未満、約500bp未満、または約300bp未満のDNAなどのより短鎖のDNAのために試料を富化できる。次いで、短い断片の増幅を通常通り進める。
本開示に記載のmini−PCR法により、単一反応において、単一の試料から数百〜数千、またはさらに数百万もの遺伝子座の高度に多重化された増幅および分析が可能になる。同時に、増幅されたDNAの検出を多重化することができ、バーコーディングPCRを用いることによって、数十〜数百の試料を1つの配列決定レーンにおいて多重化することができる。この多重化検出は、最大49プレックスまで首尾よく試験されており、はるかに高い程度の多重化が可能である。事実上、これにより、単回の配列決定の実行で、数百の試料について数千ものSNPにおける遺伝子型決定することが可能になる。これらの試料について、前記方法により、遺伝子型およびヘテロ接合性率を決定すること、また、同時に、コピー数を決定することが可能になり、これらはどちらも異数性を検出するために用いることができる。この方法は、母系の血漿中に見いだされる浮動性DNAから妊娠中の胎児の異数性を検出することにおいて特に有用である。この方法は、胎児の性判別をし、かつ/または胎児の父系性を予測するための方法の一部として用いることができる。この方法は、変異量決定ための方法の一部として用いることができる。この方法は、任意の量のDNAまたはRNAに対して用いることができ、標的の領域はSNP、他の多型領域、非多型領域、およびそれらの組み合わせであってよい。
いくつかの実施形態では、断片化されたDNAのライゲーション媒介性ユニバーサルPCR増幅を用いることができる。ライゲーション媒介性ユニバーサルPCR増幅を用いて、血漿DNAを増幅することができ、次いで、それを複数の並行した反応へと分割することができる。ライゲーション媒介性ユニバーサルPCR増幅は、短い断片を優先的に増幅し、それにより、胎児画分を富化するためにも用いることができる。いくつかの実施形態では、ライゲーションによって断片にタグを付加することにより、より短い断片を検出すること、プライマーのより短い標的配列特異的部分を使用すること、および/または非特異的な反応を減少させるより高温でアニーリングすることを可能にし得る。
本明細書に記載の方法は、ある量の混入DNAと混在している標的DNAの集合が存在する場合の、いくつもの目的のために用いることができる。いくつかの実施形態では、標的DNAおよび混入DNAは、遺伝的に関連する個体由来であってよい。例えば、胎児(標的)における遺伝子の異常は、胎児(標的)のDNAおよび同様に母系の(混入)DNAを含有する母系の血漿から検出することができ、異常としては、全染色体異常(例えば、異数性)、部分的な染色体異常(例えば、欠失、重複、逆位、転座)、ポリヌクレオチド多型(例えば、STR)、一塩基多型、および/または他の遺伝子の異常または差異が挙げられる。いくつかの実施形態では、標的DNAおよび混入DNAは、同じ個体由来であってよいが、例えば、がんの場合には、標的DNAと混入DNAが1個または複数個の変異によって異なる (例えば、H.Mamon et al.Preferential Amplification of Apoptotic DNA from Plasma:Potential for Enhancing Detection of Minor DNA Alterations in Circulating DNA.Clinical Chemistry 54:9(2008)、を参照)。いくつかの実施形態では、DNAは、細胞培養物(アポトーシス性)上清中に見いだすことができる。いくつかの実施形態では、その後のライブラリーの調製、増幅および/または配列決定のために、生体試料(例えば、血液)においてアポトーシスを誘導することが可能である。この目的を実現するためのいくつもの可能となるワークフローおよびプロトコールが本開示の他の箇所に示されている。
いくつかの実施形態では、標的DNAは、単一細胞、標的ゲノムの1個に満たないコピーからなるDNA試料、小量のDNA、混合起源からのDNA(例えば、妊娠血漿:胎盤および母系DNA;癌患者血漿および腫瘍:健康および癌DNAの混合物、移植片、など)、他の体液,細胞培養物、培養上清、法医学DNA試料、古代DNA試料(例えば、琥珀中に捕捉された昆虫),他のDNA試料、およびこれらの組み合わせ由来であってよい。
いくつかの実施形態では、短い増幅産物サイズを用いることができる。短い増幅産物サイズは、断片化されたDNAに特に適している(例えば、A. Sikoraら、Detection of increased amounts of cell−free fetal DNA with short PCR amplicons.Clin Chem. 2010年1月;56巻(1号):136〜8頁を参照されたい)。
短い増幅産物サイズを用いることにより、いくつかの重要な利益がもたらされ得る。短い増幅産物サイズにより、最適化された増幅効率がもたされ得る。短い増幅産物サイズにより、一般には、より短い産物が生じ、したがって、非特異的なプライミングの見込みは少ない。より短い産物は、クラスターがより小さくなるほど、配列決定フローセル上により高密度にクラスター化することができる。本明細書に記載の方法は、より長いPCR増幅産物に対して同等に良好に機能し得ることに留意されたい。増幅産物の長さは、必要であれば、例えば、より大きな配列の範囲について配列決定する場合には増大させることができる。ネステッドPCRプロトコールの第1のステップとして100bp〜200bp長のアッセイを伴う146プレックス標的化増幅を用いた実験を、単一細胞およびゲノムDNAに対して行い、陽性の結果を得た。
いくつかの実施形態では、本明細書に記載の方法を用いて、SNP、コピー数、ヌクレオチドのメチル化、mRNAのレベル、他の種類のRNAの発現レベル、他の遺伝子の形体および/または後成的な形体を増幅し、かつ/または検出することができる。本明細書に記載のmini−PCR法は、次世代配列決定と一緒に用いることができ、前記方法は、他の下流の方法、例えば、マイクロアレイ、デジタルPCRによる計数、リアルタイムPCR、質量分析などと一緒に用いることができる。
いくつかの実施形態では、本明細書に記載のmini−PCR増幅方法は、少数集団を正確に定量化するための方法の一部として用いることができる。前記方法は、スパイク較正物質を使用した絶対的定量化のために用いることができる。前記方法は、超ディープシーケンシングによる、変異/微量な対立遺伝子の定量化のために用いることができ、高度に多重化された様式で実行することができる。前記方法は、ヒト、動物、植物または他の生き物における近親者または祖先の標準の父系性および同一性検査のために用いることができる。前記方法は、法医学的試験のために用いることができる。前記方法は、任意の種類の材料、例えば、羊水およびCVS、精子、受胎産物(POC)に対する迅速な遺伝子型決定およびコピー数解析(CN)のために用いることができる。前記方法は、胚からの生検試料に対する遺伝子型決定などの単一細胞分析のために用いることができる。前記方法は、min−PCRを用いた標的化配列決定による迅速な胚分析(生検から1日未満、1日、または2日以内)のために用いることができる。
いくつかの実施形態では、mini−PCR増幅方法は、腫瘍分析に使用できる:腫瘍生検は、健康と腫瘍細胞の混合物であることが多い。標的PCRにより、近くにバックグラウンド配列がないSNPおよび遺伝子座のディープシーケンシングが可能になる。前記方法は、腫瘍DNAに対するコピー数およびヘテロ接合性の損失の分析のために用いることができる。前記腫瘍DNAは、腫瘍患者の多くの異なる体液または組織に存在し得る。前記方法は、腫瘍の再発の検出および/または腫瘍スクリーニングのために用いることができる。前記方法は、種子の品質管理試験のために用いることができる。前記方法は、育種または漁業のために用いることができる。これらの方法はいずれも、倍数性コールのための非多型の遺伝子座の標的化に同等に良好に用いることができることに留意されたい。
本開示の基礎になるいくつかの基本的な方法を記載している一部の文献には、(1)Wang HY,Luo M,Tereshchenko IV,Frikker DM,Cui X,LiJ Y,Hu G,Chu Y,Azaro MA,Lin Y,Shen L,Yang Q,Kambouris ME,Gao R,Shih W,LiH.Genome Res.2005 Feb;15(2):276−83.Department of Molecular Genetics,Microbiology and Immunology/The Cancer Institute of New Jersey,Robert Wood Johnson Medical School,New Brunswick,New Jersey 08903,USA.(2)High−throughput genotyping of single nucleotide polymorphisms with high sensitivity.Li H,Wang HY,Cui X,Luo M,Hu G,Greenawalt DM,Tereshchenko IV,Li JY,Chu Y,Gao R.Methods Mol Biol.2007;396−PubMed PMID:18025699.(3)Nested Patch PCR enables highly multiplexed mutation discovery in candidate genes.Varley KE,Mitra RD.Genome Res.2008 Nov;18(11):1844−50.Epub 2008 Oct 10(この文献にはシーケンシング用の平均9種のアッセイの多重化を含む方法が記載されている)、が含まれる。本明細書に開示されている方法により、上記の参考文献におけるものよりも桁の大きい多重化が可能になることに留意されたい。
標的PCRの変形物−ネスティング
PCRを行う場合に可能である多くのワークフローが存在し、本明細書に開示されている方法に典型的ないくつかのワークフローが記載されている。本明細書において概説されているステップは、他の可能性のあるステップを排除することを意図しておらず、かつ、方法が適正に機能するために本明細書に記載のステップいずれかが必要であることも意味しない。多数のパラメータの変形または他の改変が文献において公知であり、本発明の核心に影響を及ぼすことなく行うことができる。1つの特定の一般的なワークフローが下に示され、その後にいくつもの可能性のある変形物(variant)が続く。変形物とは、一般には、可能性のある二次PCR反応、例えば、行うことができる異なる種類のネスティング(ステップ3)を指す。変形物は、本明細書に明確に記載されているものと違う時間において、または異なる順序で行うことができることに留意することが重要である。説明のために多形遺伝子座を使用している例は、必要に応じ、非多形遺伝子座の増幅に容易に適合させることができる。
1. 試料中のDNAには、多くの場合ライブラリータグまたはライゲーションアダプタタグ(LT)と称されるライゲーションアダプタを付加することができ、ライゲーションアダプタはユニバーサルプライミング配列を含有し、その後にユニバーサル増幅が続く。ある実施形態では、これは、断片化後に、配列決定ライブラリーを作製するために設計された標準のプロトコールを使用して行うことができる。ある実施形態では、DNA試料を平滑末端化し、次いで、Aを3’末端に付加することができる。T−オーバーハングを有するY−アダプタを付加し、ライゲーションすることができる。いくつかの実施形態では、AまたはTオーバーハング以外の他の粘着末端を使用することができる。いくつかの実施形態では、他のアダプタ、例えば、ループライゲーションアダプタを付加することができる。いくつかの実施形態では、アダプタは、PCR増幅のために設計されたタグを有してよい。
2. 特異的標的増幅(STA):数百、数千、数万、さらには数十万もの標的を1反応体積において前増幅で多重化することができる。STAは、一般には、10〜30サイクル実行されるが、5〜40サイクル、2〜50サイクル、およびさらには1〜100サイクル実行することができる。例えば、より単純なワークフローのため、または大部分の二量体の配列決定を回避するために、プライマーに尾部を付けることができる。一般には、同じタグを保有する両方のプライマーの二量体は効率的に増幅または配列決定されないことに留意されたい。いくつかの実施形態では、1サイクルから10サイクルの間のPCRを行うことができ、いくつかの実施形態では、10サイクルから20サイクルの間のPCRを行うことができ、いくつかの実施形態では、20サイクルから30サイクルの間のPCRを行うことができ、いくつかの実施形態では、30サイクルから40サイクルの間のPCRを行うことができ、いくつかの実施形態では、40サイクル超のPCRを行うことができる。増幅は、線形増幅であってよい。PCRサイクルの数を最適化して、最適なリード深度(DOR)プロファイルをもたらすことができる。異なるDORプロファイルは異なる目的のために望ましい場合がある。いいくつかの実施形態では、全てのアッセイ間のリードのより均一な分布が望ましい;いくつかのアッセイについてDORが非常に小さい場合、データが非常に有用であるためには確率論的ノイズが高すぎる可能性があるが、リード深度が非常に深い場合、各追加のリードの限界有用性は比較的小さい。
プライマー尾部により、普遍的にタグを付けたライブラリーからの断片化されたDNAの検出を改善することができる。ライブラリータグおよびプライマー尾部が相同な配列を含有する場合、ハイブリダイゼーションを改善することができ(例えば、融解温度(T)を下げる)、プライマー標的配列の一部が試料のDNA断片内にある場合にのみ、プライマーを伸長することができる。いくつかの実施形態では、13以上の標的特異的塩基対を用いることができる。いくつかの実施形態では、10〜12の標的特異的塩基対を用いることができる。いくつかの実施形態では、8〜9の標的特異的塩基対を用いることができる。いくつかの実施形態では、6〜7の標的特異的塩基対を用いることができる。いくつかの実施形態では、STAは、前増幅されたDNA、例えば、MDA、RCA、他の全ゲノム増幅またはアダプタ−媒介性ユニバーサルPCRに対して実施することができる。いくつかの実施形態では、STAは、例えば、サイズ選択、標的捕捉、指向性分解によって特定の配列および集団が富化された、または枯渇した試料に対して実施することができる。
3. いくつかの実施形態では、二次的な多重PCRまたはプライマー伸長反応を実施して、特異性を増大させ、望ましくない産物を減少させることが可能である。例えば、完全なネスティング、セミネスティング、ヘミネスティング、および/またはより小さなアッセイプールの並行した反応への細分化は、全て、特異性を増大させるために用いることができる技法である。実験により、試料を3回の400プレックス反応に分割することにより、正確に同じプライマーを用いた1回の1,200プレックス反応よりも高い特異性で産物DNAがもたらされることが示された。同様に、実験により、試料を4回の2,400プレックス反応に分割することにより、正確に同じプライマーを用いた1回の9,600プレックス反応よりも高い特異性で産物DNAがもたらされることが示された。ある実施形態では、同じ方向性および反対の方向性の標的特異的プライマーおよびタグ特異的プライマーを用いることが可能である。
4. いくつかの実施形態では、STA反応によって産生されるDNA試料(希釈、精製またはその他)をタグ特異的プライマーおよび「ユニバーサル増幅」を用いて増幅すること、すなわち、前増幅し、タグを付けた標的の多くまたは全てを増幅することが可能である。プライマーは、ハイスループット配列決定プラットフォームにおける配列決定に必要な追加の機能的な配列、例えば、バーコードまたは完全なアダプタ配列を含有してよい。
これらの方法は、任意のDNAの試料を分析するために用いることができ、DNAの試料が特に少ない場合、または、それが、DNAが2つ以上の個体を起源とするDNAの試料である場合、例えば、母系の血漿の場合に特に有用である。これらの方法は、単一または少数の細胞、ゲノムDNA、血漿DNA、増幅された血漿ライブラリー、増幅されたアポトーシス性の上清ライブラリーまたは他の混合DNAの試料などのDNA試料に対して用いることができる。ある実施形態では、これらの方法は、遺伝子の構成が異なる細胞が、単一の個体に存在する可能性がある場合、例えば、がんまたは移植片に用いることができる。
プロトコールの変形物(上記のワークフローに対する変形物および/または追加物)
直接多重mini−PCR:タグを付けたプライマーを用いた複数の標的配列の特異的標的増幅(STA)が図1に示されている。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、PCRプライマーがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、最終のPCR産物を示す。いくつかの実施形態では、STAは、100超、200超、500超、1,000超、2,000超、5,000超、10,000超、20,000超、50,000超、100,000超、または200,000超の標的に対して行うことができる。その後の反応において、タグ特異的プライマーにより全ての標的配列を増幅し、サンプリングインデックスを含めた、配列決定するために必要な全ての配列を含むタグを伸長する。ある実施形態では、プライマーにタグ付けしなくてよい、または特定のプライマーのみにタグを付けてよい。シーケンシングアダプタは、従来のアダプタライゲーションによって付加することができる。ある実施形態では、最初のプライマーはタグを担持してよい。
ある実施形態では、プライマーを、増幅されるDNAの長さが予想外に短くなるように設計する。先行技術により、当業者が一般には、100+bpの増幅産物を設計することが実証されている。ある実施形態では、増幅産物を、80bp未満になるように設計することができる。ある実施形態では、増幅産物を、70bp未満になるように設計することができる。ある実施形態では、増幅産物を、60bp未満になるように設計することができる。ある実施形態では、増幅産物を、50bp未満になるように設計することができる。ある実施形態では、増幅産物を、45bp未満になるように設計することができる。ある実施形態では、増幅産物を、40bp未満になるように設計することができる。ある実施形態では、増幅産物を、35bp未満になるように設計することができる。ある実施形態では、増幅産物を、40bpから65bpの間になるように設計することができる。
実験を、このプロトコールを使用して、1200プレックス増幅を用いて実施した。ゲノムDNAと妊娠血漿の両方を使用した;シーケンスリードの約70%が標的の配列にマッピングされた。詳細は本文書の他の箇所に示されている。アッセイの設計および選択を伴わない1042プレックスの配列決定により、配列の>99%がプライマー二量体産物となった。
逐次的なPCR:STA1の後、産物の複数の一定分量を、同じプライマーを有する複雑さが低下したプールを用いて並行して増幅することができる。第1の増幅により、分割するために十分な材料が生じ得る。この方法は、少ない試料、例えば、約6〜100pg、約100pg〜1ng、約1ng〜10ngまたは約10ng〜100ngの試料に対して特に優良である。1200プレックスを3回の400プレックスにしたプロトコールを実施した。シーケンシングリードのマッピングは、1200プレックス単独における約60〜70%から95%超まで増大した。
セミネステッドmini−PCR:(図2参照)STA1の後、内側のネステッドフォワードプライマー(103B、105b)の多重のセットおよび1つ(または少数)のタグ特異的リバースプライマー(103A)で構成される第2のSTAを実施する。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーBおよびリバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、103からのPCR産物を示す。105は、ハイブリダイズしたネステッドフォワードプライマーb、および既に103と104の間に生じたPCRからの分子の一部であるリバースタグAを有する104からの産物を示す。106は、最終のPCR産物を示す。このワークフローを用いると、通常、配列の95%超が意図された標的にマッピングされる。ネステッドプライマーは外側のフォワードプライマー配列とオーバーラップしてよいが、追加の3’末端塩基を導入する。いくつかの実施形態では、1から20個の間の余分の3’塩基を用いることが可能である。実験により、1200プレックス設計物において9個以上の余分の3’塩基を用いると良好に機能することが示された。
完全ネステッドmini−PCR:(図3参照)STAステップ1の後、第2の多重PCR(または複雑さが低下した並行のm.p.PCR)を、タグ(A、a、B、b)を保有する2つのネステッドプライマーを用いて実施することが可能である。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーBおよびリバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、103からのPCR産物を示す。105は、ネステッドフォワードプライマーbおよびネステッドリバースプライマーaがハイブリダイズした、104からの産物を示す。106は、最終のPCR産物を示す。いくつかの実施形態では、2つのプライマーの完全なセットを用いることが可能である。完全ネステッドmini−PCRプロトコールを使用した実験を用いて、単一細胞および3つの細胞に対して、ユニバーサルライゲーションアダプタを付加し、増幅するステップ102を伴わずに146プレックス増幅を実施した。
ヘミネステッドmini−PCR:(図4参照)断片の末端にアダプタを有する標的DNAを用いることが可能である。フォワードプライマー(B)の多重セットおよび1つ(または少数)のタグ特異的リバースプライマー(A)で構成されるSTAを実施する。第2のSTAを、ユニバーサルタグ特異的フォワードプライマーおよび標的特異的リバースプライマーを使用して実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、リバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、リバースプライマーAおよびライゲーションアダプタタグプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、フォワードプライマーBがハイブリダイズした、104からの産物を示す。106は、最終のPCR産物を示す。このワークフローでは、標的特異的フォワードプライマーおよびリバースプライマーを別々の反応において使用し、それにより、反応の複雑さが減少し、フォワードプライマーとリバースプライマーの二量体形成が防がれる。この例では、プライマーAおよびBを、第1のプライマーとみなすことができ、プライマー「a」および「b」を、内側のプライマーとみなすことができることに留意されたい。この方法は、直接PCRと同等に優良であるが、プライマー二量体を回避するので、直接PCRに対する大きな改善である。第1ラウンドのヘミネステッドプロトコールの後、一般には、約99%の非標的DNAが認められるが、第2ラウンドの後には一般には、大きく改善される。
三重ヘミネステッドmini−PCR:(図5参照)断片の末端にアダプタを有する標的DNAを用いることが可能である。フォワードプライマー(B)の多重セットおよび1つ(または少数)のタグ特異的なリバースプライマー(A)および(a)で構成されるSTAを実施する。第2のSTAを、ユニバーサルタグ特異的フォワードプライマーおよび標的特異的リバースプライマーを使用して実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、リバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、リバースプライマーAおよびライゲーションアダプタタグプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、フォワードプライマーBがハイブリダイズした、104からの産物を示す。106は、リバースプライマーAおよびフォワードプライマーBを使用して増幅した、105からのPCR産物を示す。107は、リバースプライマー「a」がハイブリダイズした、106からの産物を示す。108は、最終のPCR産物を示す。この例では、プライマー「a」およびBを、内側のプライマーとみなすことができ、Aを、第1のプライマーとみなすことができることに留意されたい。必要に応じて、AとBの両方を第1のプライマーとみなすことができ、「a」を、内側のプライマーとみなすことができる。リバースプライマーおよびフォワードプライマーの名称は切り換えることができる。このワークフローでは、標的特異的フォワードプライマーおよびリバースプライマーを別々の反応において使用し、それにより、反応の複雑さが減少し、フォワードプライマーとリバースプライマーの二量体形成が防がれる。この方法は、直接PCRと同等に優良であるが、プライマー二量体を回避するので、直接PCRに対する大きな改善である。第1ラウンドのヘミネステッドプロトコールの後、一般には、約99%の非標的DNAが認められるが、第2ラウンドの後には一般には、大きく改善される。
片側ネステッドmini−PCR:(図6参照)断片の末端にアダプタを有する標的DNAを用いることが可能である。STAを、ネステッドフォワードプライマーの多重セットを用い、リバースプライマーとしてライゲーションアダプタタグを使用して実施することもできる。次いで、ネステッドフォワードプライマーおよびユニバーサルリバースプライマーのセットを使用して第2のSTAを実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、フォワードプライマーAおよびライゲーションアダプタタグリバースプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、ネステッドフォワードプライマーがハイブリダイズした、104からの産物を示す。106は、最終のPCR産物を示す。この方法では、第1のSTAおよび第2のSTAにおいてオーバーラップしているプライマーを使用することにより、標準のPCRによるよりも短い標的配列を検出することができる。前記方法は、一般には、既に上記のSTAステップ1−ユニバーサルタグの付加および増幅を受けたDNAの試料を差し引いて実施し、2つのネステッドプライマーは一方の側にのみあり、他方の側にはライブラリータグを使用する。前記方法を、アポトーシス性の上清および妊娠血漿のライブラリーに対して実施した。このワークフローを用いると、配列の約60%が意図された標的にマッピングされた。リバースアダプタ配列を含有したリードはマッピングしておらず、したがって、リバースアダプタ配列を含有するリードをマッピングした場合にはこの数字は大きくなることが予想されることに留意されたい。
片側のみのmini−PCR:断片の末端にアダプタを有する標的DNAを用いることが可能である(図7参照)。STAを、フォワードプライマーの多重セットおよび1つ(または少数)のタグ特異的なリバースプライマーを用いて実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーAがハイブリダイズした一本鎖DNAを示す。104は、フォワードプライマーAおよびライゲーションアダプタタグリバースプライマーLTを使用して増幅した、103からのPCR産物を示し、これは最終のPCR産物である。この方法により、標準のPCRによるよりも短い標的配列を検出することができる。しかし、ただ1つの標的特異的プライマーを使用するので、比較的非特異的であり得る。このプロトコールの有効性は片側ネステッドminiPCRの半分である。
リバースセミネステッドmini−PCR:断片の末端にアダプタを有する標的DNAを用いることが可能である(図8参照)。STAを、フォワードプライマーの多重セットおよび1つ(または少数)のタグ特異的なリバースプライマーを用いて実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、リバースプライマーBがハイブリダイズした一本鎖DNAを示す。104は、リバースプライマーBおよびライゲーションアダプタタグフォワードプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、フォワードプライマーA、および内側のリバースプライマー「b」がハイブリダイズした、PCR産物104を示す。106は、フォワードプライマーAおよびリバースプライマー「b」を使用して105から増幅されたPCR産物を示し、これは最終のPCR産物である。この方法により、標準のPCRによるよりも短い標的配列を検出することができる。
上記の方法の単に反復または組み合わせであるさらなる変形物、例えば、プライマーの3つのセットを使用する二重ネステッドPCRも存在し得る。別の変形物は片側半ネステッドmini−PCRであり、STAをネステッドフォワードプライマーの多重セットおよび1つ(または少数)のタグ特異的なリバースプライマーを用いて実施することもできる。
これらの変形物の全てにおいて、フォワードプライマーおよびリバースプライマーの同一性は交換することができることに留意されたい。いくつかの実施形態では、ネステッド変形物は、アダプタタグを付加すること、およびユニバーサル増幅ステップを含む最初のライブラリーの調製を伴わずに同等に良好に実行することができることに留意されたい。いくつかの実施形態では、追加のフォワードプライマーおよび/またはリバースプライマーおよび増幅ステップを伴ってPCRの追加のラウンドを含めることができ、これらの追加のステップは、標的の遺伝子座に対応するDNA分子のパーセントをさらに増大させることが望ましい場合に特に有用であり得ることに留意されたい。
ネスティングワークフロー
異なる程度のネスティング、および異なる程度の多重化を伴って増幅を実施するための多くの方法が存在する。図9では、フローチャートが、可能性のあるワークフローのいくつかと共に示されている。10,000プレックスPCRの使用は単なる例であり、これらのフローチャートは他の多重化の程度に対しても同等に良好に機能することに留意されたい。
ループライゲーションアダプタ
例えば、配列決定するためのライブラリーを作出するためにユニバーサルタグを付けたアダプタを付加する場合、アダプタをライゲーションするためのいくつもの方法が存在する。1つの方法は、試料DNAを平滑末端化し、A−テーリングを実施し、T−オーバーハングを有するアダプタとライゲーションすることである。アダプタをライゲーションするための、いくつもの他の方法が存在する。ライゲーションすることができるアダプタもいくつも存在する。例えば、DNAの2つの鎖からなり、一方の鎖が二本鎖領域、およびフォワードプライマー領域によって指定される領域を有し、他方の鎖が第1の鎖上の二本鎖領域と相補的な二本鎖領域、およびリバースプライマーを伴う領域によって指定されるY−アダプタを使用することができる。アニーリングする場合、二本鎖領域は、Aオーバーハングを有する二本鎖DNAとライゲーションするために、T−オーバーハングを含有してよい。
ある実施形態では、アダプタは、末端領域が相補的であって、フォワードプライマーでタグを付けた領域(LFT)、リバースプライマーでタグを付けた領域(LRT)、およびその2つの間の切断部位を含有する、DNAのループであってよい(図10参照)。101は、二本鎖の平滑末端の標的DNAを指す。102は、A尾部をもつ標的DNAを指す。103は、Tオーバーハング「T」および切断部位「Z」を有するループライゲーションアダプタを指す。104は、ループライゲーションアダプタが付加された標的DNAを指す。105は、切断部位において切断された、ライゲーションアダプタが付加された標的DNAを指す。LFTはライゲーションアダプタフォワードタグを指し、LRTはライゲーションアダプタリバースタグを指す。相補的な領域はTオーバーハング、または標的DNAとライゲーションするために使用することができる他の形体で終わってよい。切断部位は、UNGに沿った切断のための一連のウラシルであり得るか、あるいは制限酵素もしくは他の切断方法または単に基本的な増幅によって認識され切断され得る配列であり得る。これらのアダプタは、例えば、配列決定するための任意のライブラリーを調製するために使用することができる。これらのアダプタは、本明細書に記載の他の方法のいずれか、例えば、mini−PCR増幅方法と組み合わせて用いることができる。
内部にタグを付けたプライマー
所与の多型遺伝子座に存在する対立遺伝子を決定するために配列決定を用いる場合、シーケンスリードは、一般には、プライマー結合部位(a)の上流で開始され、次いで、多型部位(X)が読まれる。タグは一般には、図11の左側に示されている通り配置される。101は、対象の多型遺伝子座「X」およびタグ「b」が付加されたプライマー「a」を有する一本鎖標的DNAを指す。非特異的なハイブリダイゼーションを回避するために、プライマー結合部位(「a」と相補的な標的DNAの領域)は、一般には、18〜30bpの長さである。配列タグ「b」は、一般には約20bpであり、理論上は、これらは約15bpより長い任意の長さであってよいが、多くの人々は配列決定プラットフォームの企業から販売されているプライマー配列を使用する。「a」と「X」の間の距離「d」は、対立遺伝子の偏りを回避するために少なくとも2bpであってよい。W多重PCR増幅を、過剰なプライマー間相互作用を回避するために慎重なプライマーの設計が必要である、本明細書に開示されている方法または他の方法を用いて実施する場合、許容できる「a」と「X」の間の距離「d」のウィンドウは、相当に変動し得る:2bp〜10bp、2bp〜20bp、2bp〜30bpまたは、さらには2bp〜30bp超。したがって、図11の左側に示されているプライマーの配置を用いる場合、シーケンスリードは、多型遺伝子座を測定するために十分に長いリードを得るために、最小の40bpでなければならず、また、「a」および「d」の長さに応じてシーケンスリードは60bpまたは75bpまでが必要になる場合がある。通常、シーケンスリードが長いほど、所与の数のリードについて配列決定するための費用および時間が増し、したがって、必要なリードの長さを最小化することにより、時間と金の両方を節約することができる。さらに、平均で、リードの初期の塩基のリードは、リード後期のリードよりも正確なリードであるので、必要なシーケンスリードの長さを減らすことにより、多型領域の測定の正確度を上げることもできる。
ある実施形態では、図11の103に示されている通り、内部にタグを付けたプライマーと称されるプライマー結合部位(a)を複数のセグメント(a’、a’’、a’’’....)に分割し、配列タグ(b)を、2つのプライマー結合部位の中央のDNAのセグメント上に置く。この配置により、シーケンサーがより短いシーケンスリードを行うことが可能になる。ある実施形態では、a’+a’’は少なくとも約18bpであるべきであり、30bp、40bp、50bp、60bp、80bp、100bp、または100bp超の長さであってよい。ある実施形態では、a’’は少なくとも約6bpであるべきであり、ある実施形態では、約8bpから16bpの間である。全ての他の因子も同等であり、内部にタグを付けたプライマーを使用することにより、必要なシーケンスリードの長さを、少なくとも6bp、8bp、10bp、12bp、15bpと同程度、さらには20bpまたは30bpと同程度に切り詰めることができる。この結果、かなりの金、時間および正確度の利点がもたらされ得る。内部にタグを付けたプライマーの例は図12に示されている。
ライゲーションアダプタ結合領域を有するプライマー
断片化されたDNAに伴う1つの問題は、その長さが短いので、多型がDNA鎖の末端の近くにある見込みが長い鎖よりも高いことである(例えば、101、図10)。多型をPCRによって捕捉するためには、多型の両側に適切な長さのプライマー結合部位が必要であるので、プライマーと標的の結合部位の間のオーバーラップが不十分であることに起因して、標的の多型を有するかなりの数のDNAの鎖が捕捉し損なわれる。ある実施形態では、標的DNA101にはライゲーションアダプタ102を付加することができ、標的プライマー103は、設計された結合領域(a)の上流に付加したライゲーションアダプタタグ(lt)と相補的な領域(cr)を有し得る(図13参照);したがって、結合領域(aと相補的な101の領域)が一般にハイブリダイゼーションのために必要な18bpよりも短い場合には、ライブラリータグと相補的なプライマーの領域(cr)により、PCRが進行することができるところまで結合エネルギーを増大させることができる。より短い結合領域に起因して失われる任意の特異性は、適切に長い標的結合領域を有する他のPCRプライマーによって補うことができることに留意されたい。この実施形態は、直接PCRまたは本明細書に記載の他の方法のいずれか、例えば、ネステッドPCR、セミネステッドPCR、ヘミネステッドPCR、片側ネステッドまたはセミネステッドまたはヘミネステッドPCRまたは他のPCRプロトコールと組み合わせて用いることができることに留意されたい。
配列決定データを用い、種々の仮説について、観察された対立遺伝子データと予測される対立遺伝子分布を比較することを伴う分析的な方法と組み合わせて倍数性を決定する場合、リード深度が低い対立遺伝子からの追加のリードのそれぞれにより、リード深度が高い対立遺伝子からのリードよりも多くの情報がもたらされる。したがって、理想的には、各遺伝子座が同様の数の代表的なシーケンスリードを有する均一なリード深度(DOR)が認められることが望まれる。したがって、DORの分散を最小限にすることが望ましい。ある実施形態では、アニーリング時間を増加させることによってDORの変動係数(これは、DORの標準偏差/平均DORと定義することができる)を減少させることが可能である。いくつかの実施形態では、アニーリング温度は、2分超、4分超、10分超、30分超、および1時間超またはさらに長くてよい。アニーリングは平衡プロセスであるので、アニーリング時間の増加に伴うDORの分散の改善に限界はない。ある実施形態では、プライマー濃度を増加させることにより、DORの分散が減少する。
代表的全ゲノム増幅法
いくつかの実施形態では、標的遺伝子座のみを増幅する前に、核酸試料を増幅するために全ゲノムアプリケーションなどのDNA増幅を含めることができる。DNAの増幅は、少量の遺伝物質を、同様の遺伝子データの集合を含む、より大量の遺伝物質に変換するプロセスであり、これに限定されないが、ポリメラーゼ連鎖反応(PCR)を含めた多種多様な方法によって行うことができる。DNAを増幅する1つの方法は、全ゲノム増幅(WGA)である。WGAに利用可能ないくつもの方法がある:ライゲーション媒介性PCR(LM−PCR)、縮重オリゴヌクレオチドプライマーPCR(DOP−PCR)、および多置換増幅(MDA)。LM−PCRでは、アダプタと称される短いDNA配列をDNAの平滑末端にライゲーションする。これらのアダプタはユニバーサル増幅配列を含有し、これを使用して、PCRによってDNAを増幅する。DOP−PCRでは、同様にユニバーサル増幅配列を含有するランダムプライマーが第1ラウンドのアニーリングおよびPCRにおいて使用されている。次いで、第2ラウンドのPCRを使用して、さらにユニバーサルプライマー配列を用いて配列を増幅する。MDAでは、DNAを複製する高度にプロセッシブかつ非特異的な酵素であり、単一細胞分析のために使用されているphi−29ポリメラーゼを用いる。単一細胞由来の材料の増幅に対する主要な限定は、(1)極度に希釈したDNA濃度または非常に小さな体積の反応混合物を使用する必要性、および(2)全ゲノムにわたってDNAをタンパク質から確実に解離することの難しさである。それにもかかわらず、単一細胞全ゲノム増幅は、何年にもわたる種々の適用のために首尾よく用いられてきた。DNAの試料からDNAを増幅する他の方法がある。DNA増幅では、最初のDNAの試料を、配列の集合が同様であるが、はるかに量が多いDNAの試料に変換する。いくつかの場合には、増幅は必要ない可能性がある。
いくつかの実施形態では、DNAを、ユニバーサル増幅、例えば、WGAまたはMDAを用いて増幅することができる。いくつかの実施形態では、DNAを、標的化増幅、例えば、標的PCRまたは環状化プローブを用いることによって増幅することができる。いくつかの実施形態では、DNAを、標的化増幅方法または所望のDNAと望ましくないDNAの完全なまたは部分的な分離をもたらす方法、例えば、ハイブリダイゼーション手法による捕捉を用いて、優先的に富化することができる。いくつかの実施形態では、DNAを、ユニバーサル増幅方法と優先的な富化方法の組み合わせを用いることによって増幅することができる。これらの方法のいくつかについてのより充実した記載は本文書の他の箇所に見いだすことができる。
代表的富化およびシークエンシング法
ある実施形態では、本明細書に開示されている方法は、元のDNAの試料中、標的遺伝子座(例えば、多型遺伝子座)の集合からの各標的遺伝子座(例えば、各多型遺伝子座)に存在する相対的な対立遺伝子頻度を保存する選択的富化技法を用いる。富化は多形遺伝子座の分析法として特に有益であるが、これらの富化方法は、必要に応じ、非多形遺伝子座に対しても容易に適合させることができる。いくつかの実施形態では、増幅および/または選択的富化技法は、ライゲーション媒介性PCRなどのPCR、ハイブリダイゼーションによる断片の捕捉、分子反転プローブまたは他の環状化プローブを伴い得る。いくつかの実施形態では、増幅または選択的な富化のための方法は、標的配列と正確にハイブリダイズした際に、ヌクレオチドプローブの3’末端または5’末端が、少数のヌクレオチドで対立遺伝子の多型部位から隔てられるようなプローブの使用を伴ってよい。この隔たりにより、対立遺伝子の偏りと称される、一方の対立遺伝子の優先的な増幅が減少する。
これは、正確にハイブリダイズしたプローブの3’末端または5’末端が対立遺伝子の多型部位と直接隣接する、またはそれと非常に近くなるようなプローブの使用を伴う方法よりも改善されている。ある実施形態では、ハイブリダイズ領域が、多型部位を含有する可能性がある、またはそれを確実に含有するプローブは排除される。ハイブリダイゼーションの部位に多型部位があることにより、一部の対立遺伝子において不均等なハイブリダイゼーションが引き起こされ得る、または、ハイブリダイゼーションが全体で阻害されてもよく、その結果、特定の対立遺伝子が優先的に増幅される。これらの実施形態は、試料が単一の個体由来の純粋なゲノム試料であろうが個体の混合物であろうが、試料の各多型遺伝子座における元の対立遺伝子頻度をより良好に保存するという点で、標的化増幅および/または選択的な富化を伴う他の方法よりも改善されている。
非侵襲的な出生前対立遺伝子コールまたは倍数性コールのための方法の一部としてDNAの試料を標的遺伝子座の集合において富化し、その後、配列決定する技法を使用することにより、いくつもの予想外の利点が付与され得る。本開示のいくつかの実施形態では、前記方法は、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)(PS)で使用するための遺伝子データを測定するステップを包含する。実施形態のいくつかの最終の転帰は、胚または胎児のすぐに使用可能な遺伝子データである。具体化された方法の一部として、個体および/または関連する個体の遺伝子データを測定するために用いることができる多くの方法が存在する。ある実施形態では、標的の対立遺伝子の集合の濃度を富化するための方法が本明細書に開示されており、前記方法は、以下のステップの1個または複数個を含む:遺伝物質を標的化増幅するステップ、遺伝子座に特異的なオリゴヌクレオチドプローブを添加するステップ、特定のDNA鎖をライゲーションするステップ、所望のDNAの集合を単離するステップ、反応の望ましくない構成成分を除去するステップ、ハイブリダイゼーションによって特定のDNAの配列を検出するステップ、およびDNAの配列決定方法によって1個または複数個のDNA鎖の配列を検出するステップ。いくつかの場合には、DNA鎖とは標的遺伝物質を指してもよく、いくつかの場合には、DNA鎖とはプライマーを指してもよく、いくつかの場合には、DNA鎖とは合成された配列、またはそれらの組み合わせを指してもよい。これらのステップは、いくつもの異なる順序で行うことができる。
例えば、標的化増幅の前のDNAのユニバーサル増幅ステップにより、いくつかの有利な点、例えば、ボトルネックのリスクの除去および対立遺伝子の偏りの低減が付与され得る。DNAを、標的配列の両側の2つの隣接する領域とハイブリダイズすることができるオリゴヌクレオチドプローブと混合することができる。ハイブリダイゼーション後、プローブの末端を、ライゲーションの手段であるポリメラーゼ、およびプローブの環状化を可能にするための任意の必要な試薬を加えることによって結びつけることができる。環状化した後、エキソヌクレアーゼを加えて環状化されていない遺伝物質を消化し、その後、環状化されたプローブを検出することができる。DNAを、標的配列の両側の2つの隣接する領域とハイブリダイズすることができるPCRプライマーと混合することができる。ハイブリダイゼーション後、プローブの末端を、ライゲーションの手段であるポリメラーゼ、およびPCR増幅を完了させるための任意の必要な試薬を加えることによって結びつけることができる。増幅されたDNAまたは増幅されなかったDNAは、遺伝子座の集合を標的とするハイブリッド捕捉プローブの標的であってもよく、ハイブリダイゼーション後、プローブを局在させ、混合物から分離して、標的配列で富化されたDNAの混合物をもたらすことができる。
対立遺伝子コールまたは倍数性コールの方法の一部として特定の遺伝子座を標的とし、その後配列決定する方法を用いることにより、いくつもの予想外の利点が付与され得る。DNAを標的とし得る、または優先的に富化することができるいくつかの方法は、環状化プローブ、連結逆方向プローブ(linked inverted probe)(LIP、MIP)、SURESELECTなどのハイブリダイゼーションによる捕捉方法、および標的PCRまたはライゲーション媒介性PCR増幅戦略を使用することを含む。
いくつかの実施形態では、本開示の方法は、インフォマティクスに基づく方法、例えば、本明細書でさらに説明されるPARENTAL SUPPORT(商標)(PS)で使用するための遺伝子データを測定するステップを包含する。PARENTAL SUPPORT(商標)は、遺伝子データを操作するためのインフォマティクスに基づく手法であり、その態様は本明細書に記載されている。実施形態のいくつかの最終の転帰は、胚または胎児のすぐに使用可能な遺伝子データ、その後のすぐに使用可能なデータに基づく臨床的決定である。PS法の背景のアルゴリズムは、標的個体、多くの場合は胚または胎児の測定された遺伝子データ、および関連する個体から測定された遺伝子データを取得し、標的個体の遺伝子の状態が分かる正確度を上昇させることができる。ある実施形態では、測定された遺伝子データを、出生前遺伝子診断の間に倍数性の決定を行う状況において使用する。ある実施形態では、測定された遺伝子データを、インビトロでの受精の間に胚に対して倍数性の決定または対立遺伝子コールを行う状況において使用する。上述の状況において個体および/または関連する個体の遺伝子データを測定するために用いることができる多くの方法が存在する。異なる方法は、いくつものステップを含み、これらのステップは、多くの場合、遺伝物質を増幅するステップ、オリゴヌクレオチドプローブを添加するステップ、特定のDNA鎖をライゲーションするステップ、所望のDNAの集合を単離するステップ、反応の望ましくない構成成分を除去するステップ、ハイブリダイゼーションによって特定のDNAの配列を検出するステップ、DNAの配列決定方法によって1個または複数個のDNA鎖の配列を検出するステップを伴う。ある場合には、DNA鎖とは標的遺伝物質を意味し、ある場合には、DNA鎖とはプライマーを意味し、ある場合には、DNA鎖とは合成された配列、またはそれらの組み合わせを意味する。これらのステップは、いくつもの異なる順序で行うことができる。
理論上はゲノム内の任意の数の遺伝子座、1個の遺伝子座から100万超までのいずれかの遺伝子座を標的とすることが可能であることに留意されたい。DNAの試料を標的化、次いで配列決定に供する場合、シーケンサーによって読み取られる対立遺伝子の割合は、それらが試料中に天然に存在する量に対して富化される。富化の程度は、1パーセント(またはさらに低い)から10倍、100倍、1,000倍またはさらに多く100万倍までのいずれであってもよい。ヒトゲノムには、およそ7,500万の多型遺伝子座を含む、およそ30億の塩基対、およびヌクレオチドが存在する。標的とされる遺伝子座が多いほど、より少ない富化の程度が可能である。標的とされる遺伝子座の数が少ないほど、より大きな富化の程度が可能であり、それらの遺伝子座において、所与の数のシーケンスリードに対してより大きなリード深度を実現することができる。
本開示のある実施形態では、標的化または優先(preferential)は、完全にSNPに焦点を当てることができる。ある実施形態では、標的化または優先は、任意の多型部位に焦点を当てることができる。エクソンを富化するためのいくつもの商業的な標的化産物が利用可能である。驚いたことに、排他的にSNPを、または排他的に多型遺伝子座を標的化することは、対立遺伝子分布に依拠するNPDのための方法を用いる場合に特に有利である。配列決定を用いるNPDのための公開された方法も存在し、例えば、米国特許第7,888,017号は、リード数が、所与の染色体にマッピングされるリード数をカウントすることに焦点が当てられるリード数解析を伴い、分析されたシーケンスリードは、多型のゲノムの領域には焦点を当てていない。多型対立遺伝子に焦点を当てないこれらの種類の方法体系は、対立遺伝子の集合を標的化または優先的に富化することほど役立たない。
本開示のある実施形態では、遺伝子試料をゲノムの多型領域において富化するためにSNPに焦点を当てる標的化方法を用いることが可能である。ある実施形態では、少数のSNP、例えば、1から100の間のSNP、またはそれよりも多数、例えば、100から1,000の間、1,000から10,000の間、10,000から100,000の間、または100,000超のSNPに焦点を当てることが可能である。ある実施形態では、生存するトリソミーでの出生と相関する1つまたは少数の染色体、例えば、第13染色体、第18染色体、第21染色体、X染色体およびY染色体またはそのいくつかの組み合わせに焦点を当てることが可能である。ある実施形態では、標的のSNPを小さな係数、例えば、1.01倍から100倍の間、またはそれよりも大きな係数、例えば、100倍から1,000,000倍の間、または1,000,000超倍まで富化することが可能である。本開示のある実施形態では、標的化方法を用いて、ゲノムの多型領域において優先的に富化されたDNAの試料を作製することが可能である。ある実施形態では、この方法を用いて、これらの特性のいずれかを有するDNAの混合物を作製することが可能であり、ここで、DNAの混合物は、母系DNAと、浮動性胎児DNAも含有する。ある実施形態では、この方法を用いて、これらの係数の任意の組み合わせを有するDNAの混合物を作製することが可能である。例えば、本明細書に記載の方法を用いて、母系DNAおよび胎児DNAを含み、200SNPであって、全てが第18染色体または第21染色体のいずれかに位置し、平均で1,000倍に富化される200SNPに対応するDNAにおいて優先的に富化されたDNAの混合物を生成することができる。別の例では、前記方法を用いて、10,000SNPであって、全てまたはほとんどが第13染色体、第18染色体、第21染色体、X染色体およびY染色体に位置し、遺伝子座当たりの平均の富化が500倍を超える10,000SNPにおいて優先的に富化されたDNAの混合物を作製することが可能である。本明細書に記載の標的化方法のいずれかを用いて、特定の遺伝子座において優先的に富化されたDNAの混合物を作製することができる。
いくつかの実施形態では、本開示の方法は、ハイスループットDNAシーケンサーを使用して混合画分中のDNAを測定するステップであって、混合画分中のDNAが、不相応な数の1個または複数個の染色体由来の配列を含有し、1個または複数個の染色体が第13染色体、第18染色体、第21染色体、X染色体、Y染色体およびそれらの組み合わせを含む群から選択されるステップをさらに含む。
本明細書には3つの方法、多重PCR、ハイブリダイゼーションによる標的化捕捉、および連結逆方向プローブ(LIP)が記載されており、それを用いて、胎児の異数性を検出するために、母系の血漿試料由来の十分な数の多型遺伝子座から測定値を得て解析することができる。これは、標的の遺伝子座を選択的に富化する他の方法を排除するものではない。前記方法の核心を変化させることなく他の方法を同等に良好に用いることができる。それぞれの場合において、アッセイされる多型は、一塩基多型(SNP)、小さな挿入欠失またはSTRを含んでよい。好ましい方法は、SNPの使用を伴う。各手法により、対立遺伝子頻度データが生じ、各標的の遺伝子座についての対立遺伝子頻度データおよび/またはこれらの遺伝子座からの同時対立遺伝子頻度分布を解析して、胎児の倍数性を決定することができる。各手法は、供給源材料が限られていること、および母系の血漿が母系DNAと胎児DNAの混合物からなるという事実に起因して、それ自体の考慮すべき事柄を有する。この方法は、より正確な決定をもたらすための他の手法と組み合わせることができる。ある実施形態では、この方法を、米国特許第7,888,017号に記載のものなどの配列計数手法と組み合わせることができる。記載されている手法は、胎児の父系性を非侵襲的に、母系の血漿試料から検出するために用いることもできる。さらに、各手法は、異数性染色体の存在または不在を検出するため、分解されたDNA試料由来の多数のSNPについて遺伝子型決定するため、セグメントに分かれたコピー数の変動(CNV)を検出するため、他の対象の遺伝子型の状態またはそのいくつかの組み合わせを検出するために、他のDNAの混合物または純粋なDNA試料に適用することができる。
試料中の対立遺伝子分布の正確な測定
現行の配列決定手法を用いて、試料中の対立遺伝子の分布を推定することができる。そのような方法の1つは、ショットガン配列決定と称される、プールDNAから配列を無作為にサンプリングするステップを包含する。配列決定データにおける特定の対立遺伝子の割合は、一般には、非常に低く、単純統計量によって決定することができる。ヒトゲノムは、およそ30億の塩基対を含有する。したがって、使用した配列決定方法により100bpのリードが生じた場合、特定の対立遺伝子は、およそ3,000万回のシーケンスリードごとに1回測定される。
ある実施形態では、本開示の方法を用いて、DNAの試料中の同じ遺伝子座の集合を含有する2種以上の異なるハプロタイプの存在または不在を、その染色体由来の遺伝子座の測定された対立遺伝子分布から決定する。異なるハプロタイプは、1つの個体由来の2つの異なる相同染色体、トリソミーの個体由来の3つの異なる相同染色体、母親および胎児由来の3つの異なる相同なハプロタイプであって、該ハプロタイプのうちの1つが母親と胎児の間で共有されるハプロタイプ、母親および胎児由来の3つまたは4つのハプロタイプであって、該ハプロタイプの1つまたは2つが母親と胎児の間で共有されるハプロタイプ、または他の組み合わせを示し得る。ハプロタイプ間で多型である対立遺伝子はより情報価値がある傾向があるが、母親および父親がどちらも同じ対立遺伝子についてホモ接合性ではない任意の対立遺伝子により、測定された対立遺伝子分布を通じて、単純リード数解析から入手可能である情報を越えた有用な情報がもたらされる。
しかし、そのような試料のショットガン配列決定は、それにより、試料中の異なるハプロタイプ間で多型ではない領域、または対象ではない染色体についての多くの配列がもたらされ、したがって、標的ハプロタイプの割合に関する情報を示さないので、非常に非効率的である。本明細書には、ゲノム内で多型である可能性がより高い、試料中のDNAのセグメントを特異的に標的とし、かつ/または優先的に富化して、配列決定によって得られる対立遺伝子の情報の収量を上昇させる方法が記載されている。標的個体に存在する実際の量を真に表すことになる富化された試料において測定された対立遺伝子分布について、標的のセグメント内の所与の遺伝子座における他の対立遺伝子と比較して1つの対立遺伝子の優先的な富化がわずかである、または存在しないことが重大であることに留意されたい。多型対立遺伝子を標的とするための現行の当技術分野で公知の方法は、存在する任意の対立遺伝子の少なくとも一部が検出されることが確実になるように設計されている。しかし、これらの方法は、元の混合物に存在する多型対立遺伝子の不偏の対立遺伝子分布を測定する目的では設計されていなかった。標的富化の任意の特定の方法により、富化された試料を生成することができ、測定された対立遺伝子分布が元の増幅されていない試料に存在する対立遺伝子分布を、任意の他の方法よりも良好に正確に示すことは自明ではない。理論上は、多くの富化方法がそのような目的を実現することが予測され得るが、当業者は、現行の増幅、標的化および他の優先的な富化方法には相当量の確率論的または決定論的な偏りがあることをよく理解している。本明細書に記載の方法の一実施形態により、ゲノム内の所与の遺伝子座に対応するDNAの混合物に見いだされる複数の対立遺伝子を、対立遺伝子のそれぞれの富化の程度がほぼ同じになるように増幅または優先的に富化することが可能になる。別の言い方では、前記方法により、各遺伝子座に対応する対立遺伝子間の比は元のDNAの混合物における比と基本的に同じままで、混合物に存在する対立遺伝子の相対的な量を全体として増大させることが可能になる。いくつかの報告されている方法では、1%超、2%超、5%超、さらには10%超の対立遺伝子の偏りがもたらされ得る。この優先的な富化は、ハイブリダイゼーション手法による捕捉を用いた場合の捕捉の偏り、または各サイクルに関しては小さい可能性があるが、20サイクル、30サイクルまたは40サイクルにわたって組み立てる(compounded)と大きくなり得る増幅の偏りに起因し得る。本開示の目的で、比が基本的に同じままであるとは、元の混合物における対立遺伝子の比を、生じた混合物における対立遺伝子の比で割ったものが、0.95から1.05の間、0.98から1.02の間、0.99から1.01の間、0.995から1.005の間、0.998から1.002の間、0.999から1.001の間、または0.9999から1.0001の間であることを意味する。本明細書で提示された対立遺伝子の比の算出は、標的個体の倍数性状態の決定には使用することができず、単に対立遺伝子の偏りを測定するために使用されるメトリックであり得ることに留意されたい。
ある実施形態では、混合物が標的遺伝子座の集合において優先的に富化されたら、クローン試料(単一分子から生成される試料;例としては、ILLUMINA GAIIx、ILLUMINA HiSeq、Life Technologies SOLiD、5500XLが挙げられる)について配列決定する、以前の、現行のまたは次世代の配列決定計器のうちの任意の1つを用いてシークエンシングができる。比は、標的の領域内の特定の対立遺伝子を通してシークエンシングによって評価することができる。これらのシーケンシングリードを、対立遺伝子の型、および、したがって決定される異なる対立遺伝子の割り当てに応じて分析し、カウントすることができる。1から数塩基の長さである変動について、対立遺伝子の検出は配列決定によって実施し、捕捉された分子の対立遺伝子の組成を評価するために、シーケンシングリードが問題の対立遺伝子にわたることが必須である。遺伝子型についてアッセイする捕捉された分子の総数は、シーケンシングリードの長さが増加することによって増加することができる。全ての分子の完全な配列決定により、富化されたプールにおいて利用可能な最大量のデータの収集が保証される。しかし、配列決定は、現在は費用がかかり、少数のシーケンスリードを用いて対立遺伝子分布を測定することができる方法は非常に価値がある。さらに、リードの長さが増加すると、可能性のあるリードの最大長に対する技術的な限界ならびに正確度の限界がでてくる。有用性が最大である対立遺伝子は、1〜数塩基の長さのものであるが、理論的には、シーケンシングリードの長さよりも短い任意の対立遺伝子を使用することができる。対立遺伝子の変動は全ての型で生じるが、本明細書において提供される実施例は、ほんの数個隣接する塩基対に含有されるSNPまたは変異体に焦点を当てる。より大きな変異体、例えば、セグメントに分かれたコピー数の変異体は、多くの場合、セグメントの内部のSNPの全体的な集団が重複しているので、これらのより小さな変動を総計することによって検出することができる。数塩基よりも大きな変異体、例えば、STRは、特別な考慮およびいくつかの標的化手法研究を必要とするが、他のものは必要としない。
ゲノム内の1個または複数個の変異体の位置を特異的に単離し、富化するために使用することができる複数の標的化手法が存在する。一般には、これらは、変異体配列に隣接している変異していない配列を利用することに依拠する。基質が母系血漿場合のシークエンシングにおける標的化に関連する他の研究者による報告がある(例えば、Liao et al.,Clin.Chem.2011;57(1):pp.92−101、を参照)。しかし、これらの手法は、エクソンを標的とする標的化プローブを使用し、ゲノムの多型領域を標的とすることには焦点を当てていない。ある実施形態では、本開示の方法は、多型領域に排他的またはほぼ排他的に焦点を当てた標的化プローブを使用するステップを包含する。ある実施形態では、本開示の方法は、SNPに排他的またはほぼ排他的に焦点を当てる標的化プローブを使用するステップを包含する。本開示のいくつかの実施形態では、標的の多型部位は、少なくとも10%のSNP、少なくとも20%のSNP、少なくとも30%のSNP、少なくとも40%のSNP、少なくとも50%のSNP、少なくとも60%のSNP、少なくとも70%のSNP、少なくとも80%のSNP、少なくとも90%のSNP、少なくとも95%のSNP、少なくとも98%のSNP、少なくとも99%のSNP、少なくとも99.9%のSNPまたは排他的にSNPからなる。
ある実施形態では、本開示の方法を用いて、遺伝子型(特定の遺伝子座におけるDNAの塩基組成)およびDNA分子の混合物由来のこれらの遺伝子型の相対的な割合を決定することができ、これらのDNA分子は、1つまたはいくつもの遺伝的に別個の個体を起源とし得る。ある実施形態では、本開示の方法を用いて、多型遺伝子座の集合における遺伝子型、およびこれらの遺伝子座に存在する異なる対立遺伝子の量の相対的な比を決定することができる。ある実施形態では、多型遺伝子座は、完全にSNPからなってよい。ある実施形態では、多型遺伝子座は、SNP、単一のタンデム反復、および他の多型を含んでよい。ある実施形態では、本開示の方法を用いて、DNAの混合物における多型遺伝子座の集合における対立遺伝子の相対的な分布を決定することができ、DNAの混合物は、母親を起源とするDNA、および胎児を起源とするDNAを含む。ある実施形態では、妊娠中の女性由来の血液から単離されたDNAの混合物について同時対立遺伝子分布を決定することができる。ある実施形態では、遺伝子座の集合における対立遺伝子分布を使用して、妊娠中の胎児について1個または複数個の染色体の倍数性状態を決定することができる。
ある実施形態では、DNA分子の混合物は、1つの個体の複数の細胞から抽出したDNAに由来してよい。ある実施形態では、個体がモザイク(生殖系列または体細胞)である場合、DNAが由来する元の細胞の集団は、同じ遺伝子型または異なる遺伝子型の二倍体細胞または一倍体細胞の混合物を含み得る。ある実施形態では、DNA分子の混合物は、単一細胞から抽出したDNAに由来してもよい。ある実施形態では、DNA分子の混合物は、同じ個体の2つ以上の細胞または異なる個体の2つ以上の細胞の混合物から抽出したDNAに由来してもよい。ある実施形態では、DNA分子の混合物は、無細胞DNAを含有することが公知である血漿などの、既に細胞から遊離した生物材料から単離されたDNAに由来してよい。ある実施形態では、この生物材料は、胎児DNAが混合物中に存在することが示されている妊娠中の場合と同様に、1つまたは複数の個体由来のDNAの混合物であってよい。ある実施形態では、生物材料は、母系の血液中に見いだされた細胞の混合物由来であってよく、細胞のいくつかは胎児を起源とする。ある実施形態では、生物材料は、胎児の細胞において富化された妊娠中の血液由来の細胞であってよい。
環状化プローブ
本開示のいくつかの実施形態は、以前文献に記載された「連結逆方向プローブ」(LIP)を使用し、本発明の多重PCR法でLIPではないプライマーを使って増幅する前または後で、標的遺伝子座を増幅することを含む。LIPとは、環状DNA分子を作製することを伴う技術を包含することを意味する総称であり、プローブは、標的の対立遺伝子の両側の標的のDNAの領域とハイブリダイズするように設計されており、したがって、適切なポリメラーゼおよび/もしくはリガーゼ、および適切な条件、緩衝液および他の試薬の添加により、標的の対立遺伝子をわたるDNAの相補的な逆方向領域が完成し標的の対立遺伝子に見いだされる情報を捕捉するDNAの環状ループを作製される。LIPは、環状化前プローブ(pre−circularized probe)、環状化前プローブ(pre−circularizing probe)または環状化プローブとも称される。LIPプローブは、長さが50ヌクレオチドから500ヌクレオチドの間の直鎖DNA分子であってよく、ある実施形態では、長さが70ヌクレオチドから100ヌクレオチドの間であってよく、いくつかの実施形態では、本明細書に記載されているよりも長くてよい、または短くてよい。本開示の他の複数の実施形態は、LIP技術の異なる具体化、例えば、Padlockプローブおよび分子逆方向プローブ(MIP)を伴う。
配列決定するために特定の場所を標的とする1つの方法は、プローブの3’末端および5’末端が標的DNAと、標的の領域に近接し、その両側の場所で、逆方向様式でアニーリングし、したがって、DNAポリメラーゼおよびDNAリガーゼを添加することにより、3’末端からの伸長がもたらされ、標的分子と相補的な一本鎖プローブに塩基が付加され(ギャップ充填)、その後、新しい3’末端が元のプローブの5’末端とライゲーションし、その結果、後でバックグラウンドDNAから単離することができる環状DNA分子がもたらされるようなプローブを合成することである。プローブ末端は、対象の標的の領域に隣接するように設計されている。Oこの手法の一態様は、一般に、MIPSと称され、充填される配列の性質を決定するために、アレイ技術と併せて用いられている。対立遺伝子の比を測定する状況においてMIPを用いることの1つの欠点は、ハイブリダイゼーションステップ、環状化ステップおよび増幅ステップが、同じ遺伝子座における異なる対立遺伝子について同等の率で起こらないことである。その結果、元の混合物に存在する実際の対立遺伝子の比を表さない対立遺伝子の比が測定される。
ある実施形態では、環状化プローブは、標的の多型遺伝子座の上流とハイブリダイズするように設計されているプローブの領域および標的の多型遺伝子座の下流とハイブリダイズするように設計されているプローブの領域が、非核酸骨格を通じ共有結合的に接続するように構築される。この骨格は、任意の生体適合性分子または生体適合性分子の組み合わせであってよい。可能性のある生体適合性分子のいくつかの例は、ポリ(エチレングリコール)、ポリカーボネート、ポリウレタン、ポリエチレン、ポリプロピレン、スルホンポリマー、シリコーン、セルロース、フルオロポリマー、アクリル化合物、スチレンブロック共重合体、および他のブロック共重合体である。
本開示のある実施形態では、この手法は、配列内の充填を調べる手段として配列決定を容易に受けられるように改変されている。元の試料の元の対立遺伝子の割合を保持するために、少なくとも1つの重要な考慮すべき事柄を考慮に入れなければならない。ギャップ充填領域内の異なる対立遺伝子の間の可変性の位置は、変異体の鑑別をもたらすDNAポリメラーゼによる開始の偏りがあり得るので、プローブ結合部位に近すぎないようにすべきである。別の考慮すべき事柄は、異なる対立遺伝子からの不均等な増幅をもたらし得るギャップ充填領域内の変異体と相関があるプローブ結合部位にさらなる変動が存在する可能性があることである。本開示のある実施形態では、環状化前プローブの3’末端および5’末端を、標的の対立遺伝子の変異の位置(多型部位)と1つまたは少数の位置だけ離れている塩基とハイブリダイズするように設計する。多型部位(SNPまたは他の種類のもの)と、環状化前プローブの3’末端および/または5’末端がハイブリダイズするように設計されている塩基との間の塩基の数は、1塩基であってよく、2塩基であってよく、3塩基であってよく、4塩基であってよく、5塩基であってよく、6塩基であってよく、7〜10塩基であってよく、11〜15塩基であってよく、または、16〜20塩基、20〜30塩基または30〜60塩基であってよい。フォワードプライマーおよびリバースプライマーは、多型部位から離れた異なる数の塩基とハイブリダイズするように設計することができる。現行のDNA合成技術を用いて環状化プローブを多数生成することができ、これにより、非常に多数のプローブを生成し、潜在的にプールすることが可能になり、多くの遺伝子座を同時に調べることができる。300,000超のプローブで作業することが報告されている。標的個体のゲノムのデータを測定するために使用することができる環状化プローブを伴う方法を考察している2つの論文としては、Porrecaら、Nature Methods、2007年、4巻(11号)、931〜936頁;および同様にTurnerら、Nature Methods、2009年、6巻(5号)、315〜316頁が挙げられる。これらの論文に記載されている方法は、本明細書に記載の他の方法と組み合わせて用いることができる。これらの2つの論文からの方法の特定のステップは、本明細書に記載の他の方法からの他のステップと組み合わせて用いることができる。
本明細書に開示されている方法のいくつかの実施形態では、標的個体の遺伝物質を、必要に応じて増幅し、その後、環状化前プローブとハイブリダイズさせ、ギャップ充填を実施してハイブリダイズしたプローブの2つの末端間の塩基を充填し、2つの末端をライゲーションして環状化されたプローブを形成し、環状化されたプローブを、例えば、ローリングサークル増幅を用いて増幅する。所望の標的対立遺伝子の遺伝子情報が適切に設計された環状化オリゴヌクレオチド性プローブ、例えば、LIP系において捕捉されたら、環状化されたプローブの遺伝子配列を測定して、所望の配列データをもたらすことができる。ある実施形態では、適切に設計されたオリゴヌクレオチドプローブを、増幅されなかった標的個体の遺伝物質において直接環状化し、その後増幅することができる。ローリングサークル増幅、MDAまたは他の増幅プロトコールを含めたいくつもの増幅手順を使用して、元の遺伝物質を増幅することまたはLIPを環状化することができることに留意されたい。異なる方法を用いて、例えば、ハイスループット配列決定、サンガー配列決定、他の配列決定方法、ハイブリダイゼーションによる捕捉、環状化による捕捉、多重PCR、他のハイブリダイゼーション方法、およびそれらの組み合わせを用いて、標的ゲノム上の遺伝子情報を測定することができる。
上記の方法の1つまたは組み合わせ、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)法を、適切な遺伝子測定と一緒に用いて個体の遺伝物質を測定したら、次いで、それを用いて、個体における1個または複数個の染色体の倍数性状態、および/または対立遺伝子の1つもしくは対立遺伝子の集合(詳細には、対象の疾患または遺伝子の状態と相関する対立遺伝子)の遺伝子の状態を決定することができる。遺伝子配列を多重化捕捉し、その後、配列決定を用いて遺伝子型決定するためのLIPの使用が報告されていることに留意されたい。しかし、LIPに基づく戦略によって生じる配列決定データを、単一細胞、少数の細胞または細胞外DNAにおいて見いだされる遺伝物質を増幅するために使用することは、標的個体の倍数性状態を決定するためには用いられていない。
ハイブリダイゼーションアレイ、例えば、ILLUMINA INFINIUMアレイまたはAFFYMETRIX遺伝子チップによって測定された遺伝子データから個体の倍数性状態を決定するためのインフォマティクスに基づく方法の適用は、本文書の他の箇所の参考文献に記載されている。しかし、本明細書に記載の方法は、以前に文献に記載された方法に対する改善を示す。例えば、LIPに基づく手法、その後のハイスループット配列決定により、この手法は、多重化についての能力がより優れ、捕捉特異性がより優れ、均一性がより優れ、対立遺伝子の偏りが少ないので、予想外に、より良好な遺伝子型データがもたらされる。多重化がより大きいことにより、より多くの対立遺伝子を標的とすることが可能になり、より正確な結果がもたらされる。均一性がより優れていることにより、より多くの標的の対立遺伝子が測定され、より正確な結果がもたらされる。対立遺伝子の偏りの率がより低いことにより、誤ったコールの率が低下し、より正確な結果がもたらされる。より正確な結果により、臨床転帰が改善され、より良い医療がもたらされる。
LIPを、配列決定以外の方法によって遺伝子型決定するために、DNAの試料における特定の遺伝子座を標的とするための方法として用いることができることに留意することが重要である。例えば、SNPアレイまたは他のDNAもしくはRNAに基づくマイクロアレイを用いて遺伝子型決定するために、LIPを用いてDNAを標的とすることができる。
ライゲーション媒介性PCR
ライゲーションされていないプライマーを使ってPCR増幅する前または後でライゲーション媒介性PCRを使って標的遺伝子座を増幅できる。ライゲーション媒介性PCRは、DNAの混合物における1個または複数個の遺伝子座を増幅することによってDNAの試料を優先的に富化するために用いるPCRの方法であり、前記方法は、プライマー対の集合を得るステップであって、対の各プライマーが標的特異的配列および非標的配列を含有し、好ましくは、標的特異的配列が、標的領域であって、1つが多型部位の上流、および1つが多型部位の下流である標的領域とアニーリングするように設計されており、該標的特異的配列が、多型部位から0、1、2、3、4、5、6、7、8、9、10、11〜20、21〜30、31〜40、41〜50、51〜100、または、100超隔てられていてよいステップと、上流のプライマーの3’末端からDNAを重合させて、それと、標的分子と相補的なヌクレオチドを有する下流のプライマーの5’末端との間の一本鎖領域を充填するステップと、上流のプライマーの最後の重合した塩基を、近接する下流のプライマーの5’塩基とライゲーションさせるステップと、重合し、ライゲーションした分子のみを、上流のプライマーの5’末端および下流のプライマーの3’末端を含有する非標的配列を使用して増幅するステップとを含む。別個の標的に対するプライマー対を同じ反応において混合することができる。非標的配列は、ユニバーサル配列としての機能を果たし、したがって、首尾よく重合し、ライゲーションした全てのプライマー対を、増幅プライマーの単一の対を用いて増幅することができる。
ハイブリダイゼーションによる捕捉
いくつかの実施形態では、本開示の方法は、多重PCRを使用して標的遺伝子座を増幅することに加えて、次のいずれかのハイブリダイゼーション法による捕捉を使用するステップを含むことができる。標的ゲノムにおける特異的な配列の集合を優先的に富化することは、いくつもの方法で実現することができる。本文書の他の箇所に、特異的な配列の集合を標的とするためにLIPをどのように用いることができるかについての記載があるが、これらの適用の全てにおいて、他の標的化および/または優先的な富化方法を、同じ目的のために同等に良好に用いることができる。別の標的化方法の1つの例はハイブリダイゼーション手法による捕捉である。商業的なハイブリダイゼーション技術による捕捉のいくつかの例としては、AGILENTのSURE SELECT、およびILLUMINAのTruSeqが挙げられる。ハイブリダイゼーションによる捕捉では、所望の標的の配列と相補的またはほぼ相補的なオリゴヌクレオチドの集合をDNAの混合物とハイブリダイズさせ、次いで混合物から物理的に分離することが可能になる。所望の配列が標的化オリゴヌクレオチドとハイブリダイズしたら、標的化オリゴヌクレオチドを物理的に取り出す作用により、標的の配列も取り出されることになる。ハイブリダイズしたオリゴを取り出したら、それらを、それらの融解温度を上回るまで加熱し、増幅することができる。標的化オリゴヌクレオチドを物理的に取り出すためのいくつかの方法は、標的化オリゴを固体支持体、例えば磁気ビーズまたはチップと共有結合させることによる。標的化オリゴヌクレオチドを物理的に取り出すための別の方法は、標的化オリゴヌクレオチドを、別の分子部分に対する強力な親和性を有する分子部分と共有結合させることによる。そのような分子対の例は、例えばSURE SELECTにおいて使用されるビオチンおよびストレプトアビジンである。したがって、その標的の配列をビオチン分子に共有結合的に付着させ、ハイブリダイゼーション後に、ストレプトアビジンを付加した固体支持体を使用して、標的の配列がハイブリダイズしたビオチン化オリゴヌクレオチドをプルダウンすることができる。
ハイブリッド捕捉は、対象の標的と相補的なプローブを標的分子とハイブリダイズさせることを伴う。ハイブリッド捕捉プローブはもともと、標的間に相対的な均一性を有するゲノムの大部分を標的とし、富化するために開発された。その適用では、増幅される全ての標的が、全ての領域を配列決定によって検出することができる十分な均一性を有することが重要であったが、元の試料における対立遺伝子の割合を保持することには注意が払われなかった。捕捉した後、試料中に存在する対立遺伝子を、捕捉された分子の直接配列決定によって決定することができる。これらのシーケンシングリードを、対立遺伝子の型に応じて分析し、カウントすることができる。しかし、現行の技術を用いると、測定された捕捉された配列の対立遺伝子分布は、一般には、元の対立遺伝子分布を表さない。
ある実施形態では、配列決定によって対立遺伝子の検出を実施する。多型部位における対立遺伝子の同一性を捕捉するために、捕捉された分子の対立遺伝子の組成を評価するために、シーケンシングリードが問題の対立遺伝子にわたることが必須である。捕捉分子は多くの場合、長さが変動するので、配列決定の際に、分子全体が配列決定されなければ、変異の位置がオーバーラップすることを保証することができない。しかし、最大の可能性のある長さおよびシーケンシングリードの正確度に関する費用検討ならびに技術的な限界により、分子全体の配列決定は実行できない。ある実施形態では、約30塩基から約50塩基または約70塩基まで増加させることができるリードの長さにより、標的の配列内の変異の位置とオーバーラップするリード数を著しく増加させることができる。
対象の位置を調べるリード数を増加させるための別の方法は、基礎をなす富化された対立遺伝子の偏りをもたらさない限りはプローブの長さを減少させることである。合成されたプローブの長さは、1つの遺伝子座において見いだされた2つの異なる対立遺伝子とハイブリダイズするように設計された2種のプローブが元の試料中の種々の対立遺伝子とほぼ同等の親和性でハイブリダイズするために十分な長さであるべきである。現在、当技術分野で公知の方法には、一般には120塩基より長いプローブが記載されている。現行の実施形態において、対立遺伝子が1つまたは少数の塩基である場合、捕捉プローブは、約110塩基未満、約100塩基未満、約90塩基未満、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、および約25塩基未満であってもよく、全ての対立遺伝子からの同等の富化を確実にするためにはこの量で十分である。ハイブリッド捕捉技術を用いて富化するDNAの混合物が、血液、例えば母系の血液から単離された浮動性DNAを含む混合物である場合、DNAの平均長はかなり短く、一般には、200塩基未満である。より短いプローブを使用することにより、ハイブリッド捕捉プローブが所望のDNA断片を捕捉する見込みが大きくなる。より大きな変動は、より長いプローブを必要とする場合がある。ある実施形態では、対象の変動は、1(SNP)〜数塩基の長さである。ある実施形態では、ゲノム内の標的の領域を、ハイブリッド捕捉プローブを使用して優先的に富化することができ、ここで、ハイブリッド捕捉プローブの長さは90塩基未満であり、80塩基未満、70塩基未満、60塩基未満、50塩基未満、40塩基未満、30塩基未満または25塩基未満であってよい。ある実施形態では、所望の対立遺伝子が配列決定される見込みを増大させるために、多型の対立遺伝子の場所に隣接している領域とハイブリダイズするように設計されているプローブの長さを、90塩基超から、約80塩基まで、または約70塩基まで、または約60塩基まで、または約50塩基まで、または約40塩基まで、または約30塩基まで、または約25塩基まで減少させることができる。
捕捉を可能にするために、合成されたプローブと標的分子の間に最小のオーバーラップが存在する。この合成されたプローブは、できるだけ短くすることができるが、それでもこの最小の必要なオーバーラップよりも大きい。多型領域を標的とするためにより短いプローブ長を用いることの効果は、より多くの分子が標的対立遺伝子領域とオーバーラップすることである。元のDNA分子の断片化の状態も、標的の対立遺伝子とオーバーラップするリード数に影響を及ぼす。血漿試料などの一部のDNA試料は、インビボで起こる生物学的プロセスに起因して既に断片化されている。しかし、より長い断片を有する試料には、配列決定ライブラリーの調製および富化の前の断片化が有益である。プローブと断片の両方が短い(約60〜80bp)場合、最大の特異性は、対象の重要な領域とオーバーラップできない比較的少ないシーケンスリードで実現することができる。
ある実施形態では、ハイブリダイゼーション条件を調整して、元の試料中に存在する異なる対立遺伝子の捕捉における均一性を最大にすることができる。ある実施形態では、対立遺伝子間のハイブリダイゼーションの偏りの差異を最小限にするためにハイブリダイゼーション温度を低下させる。当技術分野で公知の方法では、温度を低下させることには、プローブと、意図されたものではない標的とのハイブリダイゼーションを増大させる効果があるので、ハイブリダイゼーションのためにより低い温度を用いることを回避する。しかし、目的が、最大の忠実度で対立遺伝子の比を保存することである場合、現行技術の教示がこの手法を避けているという事実にもかかわらずより低いハイブリダイゼーション温度を用いる手法により、最適に正確な対立遺伝子の比がもたらされる。ハイブリダイゼーション温度は、標的の領域の実質的なオーバーラップを有する標的のみが捕捉されるように、標的と合成されたプローブとの間のより大きなオーバーラップを必要とするために上昇させることもできる。本開示のいくつかの実施形態では、ハイブリダイゼーション温度を、通常のハイブリダイゼーション温度から、約40℃まで、約45℃まで、約50℃まで、約55℃まで、約60℃まで、約65までまたは約70℃まで低下させる。
ある実施形態では、ハイブリッド捕捉プローブは、多型の対立遺伝子に隣接している領域に見いだされるDNAと相補的なDNAを有する捕捉プローブの領域が多型部位のすぐ隣ではないように設計することができる。その代わりに、捕捉プローブは、標的の多型部位に隣接しているDNAとハイブリダイズするように設計されている捕捉プローブの領域が、多型部位とファンデルワールスにより接触する捕捉プローブの部分と、1つまたは少数の塩基と等しい長さの小さな距離で隔てられているように設計することができる。ある実施形態では、ハイブリッド捕捉プローブは、多型の対立遺伝子と隣接しているが、それとは交差していない領域とハイブリダイズするように設計されており、これは、隣接捕捉プローブと称される。隣接捕捉プローブの長さは、約120塩基未満、約110塩基未満、約100塩基未満、約90塩基未満であってよく、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、または約25塩基未満であってよい。隣接捕捉プローブの標的となるゲノムの領域は、多型遺伝子座と1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6塩基対、7塩基対、8塩基対、9塩基対、10塩基対、11〜20塩基対、または、20超塩基対で隔てられていてよい。
標的化配列捕捉を用いる、標的化捕捉に基づく疾患スクリーニング検査についての記載。現在AGILENT(SURE SELECT)、ROCHE−NIMBLEGENまたはILLUMINAから提供されているものなどの特別注文の標的化配列捕捉。捕捉プローブは、種々の種類の変異の捕捉を確実にするために特別注文で設計することができる。点変異については、点変異とオーバーラップする1個または複数個のプローブが、変異を捕捉し、配列決定するために十分であるはずである。
小さな挿入または欠失については、変異とオーバーラップする1個または複数個のプローブが、変異を含む断片を捕捉し、配列決定するために十分であり得る。ハイブリダイゼーションは、一般には、ゲノム配列を参照するために設計されるプローブ限定捕捉効率の間で効率が低い可能性がある。変異を含む断片の捕捉を確実にするために、正常な対立遺伝子と一致するものと、変異対立遺伝子と一致するものの2種のプローブを設計することができる。より長いプローブにより、ハイブリダイゼーションを増強することができる。複数のオーバーラッププローブにより捕捉を増強することができる。最後に、プローブをすぐ隣であるがオーバーラップはしていないところに置くと、変異は、正常な対立遺伝子と変異対立遺伝子の比較的同様の捕捉効率が可能となり得る。
単純タンデム反復(STR)については、これらの高度に可変性の部位とオーバーラップしているプローブは、断片を上手く捕捉する可能性が低い。捕捉を増強するために、プローブを、可変性部位と近接しているがオーバーラップはしていないところに置くことができる。次いで、断片について通常通り配列決定して、STRの長さおよび組成を示すことができる。
大規模な欠失については、現在エクソン捕捉系において用いられている一般的な手法である一連のオーバーラッププローブが機能し得る。しかし、この手法を用いると、個体がヘテロ接合性であるか否かを決定することが難しい場合がある。捕捉された領域内のSNPを標的とし、評価することにより、個体が保有者であることを示す、その領域にわたるヘテロ接合性の損失を潜在的に示すことができる。ある実施形態では、非オーバーラッププローブまたはシングルトンプローブを、潜在的に欠失した領域にわたって置き、捕捉された断片の数をヘテロ接合性の尺度として使用することが可能である。個体が大規模な欠失を有する場合には、非欠失(二倍体)参照遺伝子座と比較して、断片の数の2分の1を捕捉のために利用可能であることが予測される。したがって、欠失した領域から得られたリード数は、正常な二倍体の遺伝子座から得られたリード数のおよそ半分であるはずである。潜在的に欠失した領域にわたる複数のシングルトンプローブからのシーケンシングリード深度を総計し、平均することにより、シグナルを増強し、診断の信頼度を改善することができる。2つの手法、SNPを標的として、ヘテロ接合性の損失を同定すること、および複数のシングルトンプローブを使用して、その遺伝子座から基礎をなす断片の量の定量的尺度を得ることを組み合わせることもできる。これらの戦略のいずれか、または両方を、他の戦略と組み合わせて、同じ結果をよりよく得ることができる。
試験の間に、同じ試験において捕捉され、配列決定されるY染色体断片の存在によって示される、男の胎児のcfDNAの検出、ならびに母親および父親が影響されないX連鎖優性変異または母親が影響されない優性変異のいずれかにより、胎児に対するリスクが高まることが示される。影響のない母親における同じ遺伝子内に2つの変異劣性対立遺伝子が検出されることは、胎児が、変異対立遺伝子を父親から、および潜在的に第2の変異対立遺伝子を母親から遺伝によって受け継いだことを意味する。全ての場合において、羊水穿刺または絨毛膜絨毛採取による追跡検査も示され得る。
標的化捕捉に基づく疾患スクリーニング検査は、異数性についての標的化捕捉に基づく非侵襲的な出生前診断検査と組み合わせることができる。リード深度(DOR)の変動性を減少させるためのいくつもの方法が存在する:例えば、プライマー濃度を上昇させることができる、より長い標的化増幅プローブを使用することができる、または、STAサイクルをより多く実行することができる(例えば、25超、30超、35超、または、さらには40超)。
試料中のDNA分子数の代表的決定方法
第1ラウンドのDNA増幅の間に試料中の元のDNA分子のそれぞれについて独自に同定された分子を生成することによって、試料中のDNA分子の数を決定するための方法が本明細書に記載されている。上記の目的を実現し、その後に単一分子配列決定法またはクローン配列決定法が続く手順が本明細書に記載されている。
該手法は、1個または複数個の特定の遺伝子座を標的とするステップ、および、各標的の遺伝子座が独特のタグを有し、このバーコードをクローン配列決定または単一分子配列決定を用いて配列決定した際に互いに区別することができるように元の分子のタグを付けたコピーを生成するステップを包含する。独特の配列決定されたバーコードのそれぞれは元の試料における独特の分子を示す。同時に、配列決定データを使用して、分子が由来する遺伝子座を確認する。この情報を使用して、各遺伝子座について、元の試料中の独特の分子の数を決定することができる。
この方法は、元の試料中の分子の数の定量的評価が必要な任意の適用のために用いることができる。さらに、1個または複数個の標的の独特の分子の数を、1個または複数個の他の標的に対する独特の分子の数に関連づけて、相対的なコピー数、対立遺伝子分布または対立遺伝子の比を決定することができる。あるいは、元の標的のコピーの最も可能性の高い数を同定するために、種々の標的から検出されたコピーの数を分布によってモデリングすることができる。適用としては、これらに限らないが、挿入および欠失、例えば、デュシェンヌ型筋ジストロフィーの保有者に見いだされるものの検出;染色体のセグメントの欠失または重複、例えば、コピー数変異体において観察されたものの定量;生まれた個体由来の試料の染色体コピー数;生まれていない個体、例えば、胚または胎児由来の試料の染色体コピー数が挙げられる。
前記方法は、配列による標的化に含有される同時に起こる変動の評価と組み合わせることができる。これを用いて、元の試料における各対立遺伝子を示す分子の数を決定することができる。このコピー数法は、SNPまたは他の配列の変動の評価と組み合わせて、生まれた個体および生まれていない個体の染色体コピー数を決定することができる;短い配列の変動を有するが、その中でPCRにより複数の標的領域から増幅することができる遺伝子座由来のコピーの識別および定量化、例えば、棘筋萎縮の保有者検出の目的で;異なる個体の混合物からなる試料由来の分子の種々の供給源のコピー数の決定、例えば、母系の血漿から得られた浮動性DNAからの胎児の異数性の検出の目的で。
ある実施形態では、単一の標的遺伝子座に関係する方法は、以下のステップの1つまたは複数を含んでよい:(1)特定の遺伝子座をPCR増幅するための、オリゴマーの標準の対を設計するステップ。(2)合成の間に、標的特異的オリゴマーのうちの1つの5’末端側に、標的遺伝子座またはゲノムに対する相補性を有さない、または最小の相補性を有する特定の塩基の配列を付加するステップ。尾部と称されるこの配列は既知の配列であって、その後の増幅のために用いられるものであり、ランダムなヌクレオチドの配列が後に続く。これらのランダムなヌクレオチドはランダムな領域を含む。ランダムな領域は、各プローブ分子間で確率的に異なる、ランダムに生成した核酸の配列を含む。したがって、合成した後、尾部を付けたオリゴマープールは、既知の配列から始まり、その後に分子間で異なる未知の配列が続き、その後に標的特異的配列が続くオリゴマーの集団からなる。(3)尾部を付けたオリゴマーのみを使用して1ラウンドの増幅(変性、アニーリング、伸長)を実施するステップ。(4)エキソヌクレアーゼを反応物に加え、PCR反応を有効に停止させ、反応物を適切な温度でインキュベートして、鋳型とアニーリングしなかったフォワード一本鎖オリゴを除去し、伸長させて二本鎖産物を形成するステップ。(5)反応物を高い温度でインキュベートして、エキソヌクレアーゼを変性させ、その活性を排除するするステップ(6)第1の反応において使用したオリゴマーの尾部と相補的な新しいオリゴヌクレオチドを他の標的特異的オリゴマーと一緒に反応物に加えて、PCRの第1ラウンドで生成した産物のPCR増幅を可能にするステップ。(7)増幅を継続して下流のクローン配列決定のために十分な産物を生成させるステップ。(8)十分な数の塩基を配列に結んだ、増幅されたPCR産物を、多数の方法、例えば、クローン配列決定によって測定するステップ。
ある実施形態では、本開示の方法は、多数の遺伝子座を並行してまたは別の方法で標的とするステップを包含する。異なる標的遺伝子座に対するプライマーを独立に生成し、混合して多重PCRプールを作製することができる。ある実施形態では、元の試料を、サブプールに分けることができ、各サブプールにおいて異なる遺伝子座を標的とした後に組み換え、シークエンシングができる。ある実施形態では、プールを細分する前にタグを付けるステップおよびいくつもの増幅サイクルを実施して全ての標的の効率的な標的化を確実にした後に、分割し、改善し、その後、細分されたプールにおけるより小さなプライマーの集合を使用して増幅を継続することによって増幅することができる。
この技術が特に有用になる適用の1つの例は、非侵襲的な出生前異数性診断であり、所与の遺伝子座における対立遺伝子の比またはいくつもの遺伝子座における対立遺伝子の分布を用いて、胎児に存在する染色体のコピーの数の決定に役立てることができる。この状況では、最初の試料中に存在するDNAを、種々の対立遺伝子の相対的な量を維持しながら増幅することが望ましい。一部の場合、特に、存在するDNAが非常に少量である、例えば、5,000未満のゲノムのコピー、1,000未満のゲノムのコピー、500未満のゲノムのコピー、および100未満のゲノムのコピーである場合には、ボトルネッキングと称される現象が起こり得る。これは、最初の試料中に任意の所与の対立遺伝子の少数のコピーが存在し、増幅の偏りの結果、増幅されたDNAのプールの有するそれらの対立遺伝子の比が最初のDNAの混合物におけるそれらの対立遺伝子の比とは有意に異なるということである。標準のPCR増幅の前に、各DNAの鎖にバーコードの独特のまたはほぼ独特の集合を適用することにより、同じ元の分子を起源とする配列決定されたDNAのn個の同一の分子の集合からDNAのn−1コピーを排除することが可能である。
例えば、個体のゲノム内のヘテロ接合性であるSNP、および元のDNAの試料中に各対立遺伝子が10分子存在する個体由来のDNAの混合物を考える。増幅した後、その遺伝子座に対応する100,000分子のDNAが存在し得る。確率論的なプロセスに起因して、DNAの比は1:2〜2:1のいずれであってもよいが、元の分子のそれぞれに独特のタグでタグを付けたので、増幅されたプール内のDNAが正確に各対立遺伝子由来の10分子のDNAを起源とすることを決定することが可能である。したがって、この方法により、この手法を用いない方法よりも正確な測度の相対的な各対立遺伝子の量がもたらされる。対立遺伝子の偏りの相対量を最小限にすることが望ましい方法に対して、この方法により正確なデータがもたらされる。
配列決定された断片と標的遺伝子座の関連づけは、いくつもの方法で実現することができる。ある実施形態では、標的配列に対応する分子バーコード、同様に、十分な数の独特の塩基を標的の断片に結んで十分な長さの配列を得て、標的遺伝子座を明白に同定することを可能にする。別の実施形態では、ランダムに生成した分子バーコードを含有する分子バーコーディングプライマーは、それが関連づけられる標的を同定する遺伝子座に特異的なバーコード(遺伝子座バーコード)も含有することができる。この遺伝子座バーコードは、個々の標的の各々に対する全ての分子バーコーディングプライマー間で、したがって、生じた増幅産物の全ての間で同一であるが、他の全ての標的とは異なる。ある実施形態では、本明細書に記載のタグ付け方法を、片側のネスティングプロトコールと組み合わせることができる。
ある実施形態では、分子バーコーディングプライマーの設計および生成は、以下の通り実施化することができる:分子バーコーディングプライマーは、標的配列と相補的でない配列、それに続くランダムな分子バーコード領域、それに続く標的特異的配列からなってよい。分子バーコードの5’の配列は部分配列PCR増幅ために用いることができ、配列決定するために増幅産物をライブラリーに変換することにおいて有用な配列を含み得る。ランダムな分子バーコード配列は多数の方法で生成することができる。好ましい方法では、分子タグを付けたプライマーを、バーコード領域を合成する間の反応のために4種の塩基全てを含むように合成する。塩基の全てまたは塩基の種々の組み合わせは、IUPACDNA多義コードを使用して明記することができる。このように、合成された分子の集団は、分子バーコード領域内の配列のランダムな混合物を含有する。バーコード領域の長さにより、どのくらい多くのプライマーが独特のバーコードを含有するかが決定される。独特の配列の数は、Nとしてバーコード領域の長さに関連づけられ、ここで、Nは塩基の数であり、一般には4であり、Lはバーコードの長さである。5塩基のバーコードにより、最大1024個の独特の配列をもたらすことができ、8塩基のバーコードにより、65536個の独特のバーコードをもたらすことができる。ある実施形態では、DNAを、配列決定方法によって測定することができ、配列データは単一分子の配列を示す。これは、単一分子について直接配列決定する方法、または単一分子を増幅して、配列決定計器によって検出可能なクローンを形成するが、なお単一分子を示す、本明細書ではクローン配列決定と称される方法を含むことができる。
増幅産物の定量化の代表的方法および試薬 対象の特異的核酸配列の定量化は、通常、TAQMAN(LIFE TECHNOLOGIES)、INVADERプローブ(THIRD WAVE TECHNOLOGIES)、などの定量的リアルタイムPCR技術により行われる。このような技術は、複数配列の並行同時分析(多重化)に対する限られた能力および増幅サイクルが可能な狭い範囲(例えば、PCR増幅産生量の対数対サイクル数が、直線範囲内)でのみ正確な定量データを生成する能力などの多くの短所がある。MYSEQ(ILLUMINA)、HISEQ(ILLUMINA)、ION TORRENT(LIFE TECHNOLOGIES)、GENOME ANALYZERILX(ILLUMINA)、GSFLEX+(ROCHE454)などで採用されるようなDNAシークエンシング技術、特に高スループット次世代シークエンシング技術(大量並列シーケンシング技術と呼ばれることも多い)を使って、試料中に存在する対象配列のコピー数の定量的測定ができ、それにより、出発物質に関する定量的情報、例えば、コピー数または転写レベルを得ることができる。高スループット遺伝子シーケンサーは、バーコーディング(すなわち、特徴的核酸配列を使った試料のタギング)を使用して、個別集団から特異的試料を特定し、それにより、DNAシーケンサーの1回の操作で複数試料の同時分析を可能とする。ライブラリー調製物(または他の対象核酸調製物)中の一定の領域のゲノムが配列決定される回数(リード数)は、対象ゲノム中のその配列のコピー数(または、cDNA含有調製物の場合は、発現レベル)に比例するであろう。しかし、遺伝子ライブラリーの調製およびシークエンシング(および、類似のゲノム由来の調製)は、対象の核酸配列の正確な定量的リードの取得と干渉する多くの偏りを持ち込む場合がある。例えば、核酸配列が異なると、遺伝子ライブラリー調製または試料調製の間に発生する核酸増幅ステップ中の増幅効率が異なる場合がある。
異なる増幅効率に関連する問題は、本発明の特定の実施形態を使うことにより緩和できる。本発明は、定量化の正確度を改善するために使用できる増幅プロセス中の含有物基準の使用に関連する種々の方法と組成物を含む。本明細書で記載し、また、特に、米国特許第8,008,018号;同7,332,277号;国際公開第WO2012/078792A2号;同WO2011/146632A1号に記載されているように、本発明は、母系血液中の浮動性胎児DNAを分析することによる胎児の異数性の検出の領域で特に有用である。これらの特許は、参照によりその全体が本明細書に組み込まれる。また、本発明の実施形態は、インビトロ生成胚中の異数性の検出にも有用である。商業的に重要な検出可能な異数性には、ヒト染色体13、18、21、XおよびYの異数性が含まれる。
本発明の実施形態は、ヒトまたは非ヒト核酸に対して使用でき、また、動物および植物由来核酸の両方に適用できる。また、本発明の実施形態を使って、欠失または挿入により特徴付けられる他の遺伝性障害に関連する対立遺伝子の検出、および/または定量化も可能である。欠失含有対立遺伝子が、対象対立遺伝子保持者と疑われる人から検出される場合がある。
本発明の一実施形態は、既知の量(相対的または絶対的)で存在する基準を含む。例えば、染色体8(遺伝子座Aを含む)は二倍体、および染色体21(遺伝子座Bを含む)は三倍体である遺伝源から作製される遺伝子ライブラリーを考える。遺伝子ライブラリーは、試料中に存在する染色体の数、例えば、200コピーの遺伝子座Aおよび300コピーの遺伝子座Bの関数となる量の配列を含む試料から生成できる。しかし、遺伝子座Aが遺伝子座Bよりはるかに高い効率で増幅される場合、PCR後には、60,000コピーのA増幅産物および30,000コピーのB増幅産物が存在する可能性があり、従って、高スループットDNAシークエンシング(または他の定量核酸検出技術)による分析の場合に、初期の真のゲノム試料の染色体コピー数を不明確にすることになる。この問題を軽減するために、遺伝子座Aに対する基準配列が採用され、この場合、基準配列は、実質的に遺伝子座Aと同じ効率で増幅される。同様に、遺伝子座Bの基準配列が形成され、この場合、基準配列は、遺伝子座Bと実質的に同じ効率で増幅される。PCR(または他の増幅技術)の前に遺伝子座Aの基準配列および遺伝子座Bの基準配列が混合物に加えられる。これらの基準配列は、相対量または絶対量としての既知の量で存在する。従って、同じ条件セット下で、基準配列Aと基準配列Bの1:1混合物が、前の例中の混合物に(増幅の前に)加えられた場合、3000コピーの基準A増幅産物が生成され、また、1000コピーの基準B増幅産物が生成され、遺伝子座Aは、遺伝子座Bより3倍効率的に増幅されることを示す。
対象SNP(または他の多型)を含むゲノムの1つまたは複数の選択領域に対し、特異的増幅およびその後の配列決定ができる。この標的特異的増幅は、シークエンシング用の遺伝子ライブラリー形成中に行わせることができる。ライブラリーは、多くの標的増幅領域を含むことができる。いくつかの実施形態では、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000の対象領域を含む。このようなライブラリーの例は、本明細書に記載され、また、2011年11月18日出願の米国特許公開第2012/0270212号で見出すことができる。この特許は、参照によりその全体が本明細書に組み込まれる。
多くの高スループットDNAシークエンシング技術は、ライブラリー形成に出発遺伝物質の改変、例えば、ユニバーサルプライミング部位および/またはバーコードのライゲーションが必要で、それにより、その後のシークエンシング反応を行う前に小さい核酸フラグメントのクローン増幅を促進する。いくつかの実施形態では、遺伝子ライブラリー形成中に1個または複数個の基準配列が付加されるか、またはライブラリーの増幅の前に遺伝子ライブラリーの前駆成分に付加される。基準配列は、高スループット遺伝子シークエンシング技術によりシークエンシング用に調製される標的ゲノムフラグメントを模倣する(それでも、ヌクレオチド塩基配列に基づいて区別できる)ように選択できる。一実施形態では、基準配列は、1、2、3、4〜10、または11〜20個のヌクレオチドを除いて標的ゲノムフラグメントと同じであってもよい。いくつかの実施形態では、標的遺伝子配列がSNPを含む場合、基準配列は、多形塩基のヌクレオチド以外のSNPと同じであってもよく、天然の部位には観察されない4個のヌクレオチドの内の1個であるように選択できる。基準配列は、複数標的遺伝子座(例えば、多形遺伝子座)の高度多重化分析に使用できる。基準配列は、ライブラリー形成(増幅前)のプロセス中に(相対的または絶対的)既知の量で付加されて分析試料中の対象標的配列の量の決定に際し、より高い正確度のための基準メトリックを提供できる。以前に特徴が明らかにされた倍数性レベル、例えば、全常染色体が二倍体であるとわかっているゲノムから形成されたシークエンシング用倍数性レベルライブラリー形成の情報と共に、使用された既知の量の基準配列の情報の組み合わせを使って、それぞれの基準配列のそれに対応する標的配列に関する増幅特性を較正でき、また、複数基準配列を含むバッチ混合物間の変動を考慮に入れることができる。大量の遺伝子座を同時に分析することが必要となる場合が多いことを考慮すれば、多くの基準配列セットを含む混合物を生成することは有用である。本発明の実施形態には、複数基準配列を含む混合物が含まれる。混合物中のそれぞれの基準配列の量が高精度で分かっていることが理想的である。しかし、この理想の達成は極めて困難である。理由は、実際問題として、混合物中のそれぞれの基準配列の量、特に、多数の異なる合成オリゴヌクレオチドを含む混合物の基準配列の量に大きな変動があるためである。この変動には多くの発生源、例えば、インビトロオリゴヌクレオチド合成反効率のバッチ間変動、体積測定の不正確さ、ピペット操作の変動が挙げられる。さらに、この変動は、理論的に正確に同じ量の正確に同じ基準配列セットを含むバッチ間でも起こる場合がある。従って、それぞれの基準配列バッチを独立に較正することは有意義である。基準配列バッチは、既知の染色体組成の参照ゲノムに対し較正できる。基準配列バッチは、シークエンシングプロトコール中に含まれる増幅ステップを最小限にして、または増幅ステップ無しで、基準配列バッチをシークエンシングすることにより較正できる。本発明の実施形態は、較正された種々の基準配列の混合物を含む。他の本発明の実施形態は、異なる基準配列の混合物を較正する方法および本方法により作製された較正された異なる基準配列の混合物を含む。
対象基準配列混合物およびそれらの使用方法の種々の実施形態は、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個以上の基準配列、ならびに、種々のこれらの中間の個数を含んでよい。基準配列の数は、DNAシークエンシング用標的ライブラリーの生成中に分析用に選択された標的配列の数と同じであってもよい。しかし、いくつかの実施形態では、構築されるライブラリー中の標的領域の数より少ない数の基準配列を使用するのが有利な場合がある。より少ない数を使って採用した高スループットDNAシーケンサーのシークエンシング能力の限界に達するのを避けるのが有利であろう。基準配列の数は、標的領域の数の50%以下、標的領域の数の40%以下、標的領域の数の30%以下、標的領域の数の20%以下、標的領域の数の10%以下、標的領域の数の5%以下、標的領域の数の1%以下、ならびに種々のこれらの中間の数であってよい。例えば、遺伝子ライブラリーが特異的SNP含有遺伝子座を標的とする15,000対のプライマーを使って作製される場合、15,000個の標的遺伝子座の内の1500個に対応する1500個の基準配列を含む適切な混合物を、ライブラリー構築の増幅ステップの前に添加できる。
ライブラリー構築中に添加される基準配列の量は、個別実施形態間で大きく変化してもよい。いくつかの実施形態では、それぞれの基準配列の量は、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の予測量とほぼ同じであってよい。他の実施形態では、それぞれの基準配列の量は、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の予測量よりも多くても、または少なくてもよい。標的配列および基準配列の初期の相対量は、本発明の目的にとって重大なものではないが、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の量より100倍多い量から100倍少ない量の範囲であるのが好ましい。過剰な量の基準配列は、装置の定められた操作回数でDNAシーケンサーのシークエンシング能力の多くを使い過ぎる可能性がある。あまりに少ない量の基準配列を使用した場合は、増幅効率の変動の分析に役立たせるにしては不充分なデータになるであろう。
基準配列は、増幅される対象領域に極めて類似したヌクレオチド塩基配列となるように選択でき、好ましくは、基準配列は、分析されるゲノム領域、すなわち、「標的配列」と正確に同じプライマー結合部位を有する。基準配列は、所与の遺伝子座の対応する標的配列とは区別できる必要がある。便宜上、この区別可能な基準配列の領域を「マーカー配列」と呼ぶ。いくつかの実施形態では、標的配列のマーカー配列領域は、多形領域、例えば、SNPを含み、プライマー結合領域が両側の位置に配置されていてもよい。基準配列は、対応する標的配列のGC含量に厳密に適合するように選択できる。いくつかの実施形態では、基準配列のプライマー結合領域は、ユニバーサルプライミング部位により両脇を挟まれている。これらのユニバーサルプライミング部位は、分析用ゲノムライブラリー中で使われるユニバーサルプライミング部位に適合するように選択される。他の実施形態では、基準配列は、ユニバーサルプライミング部位が無く、ユニバーサルプライミング部位は、ライブラリー形成中に付加される。基準配列は、通常、一本鎖型で提供される。基準配列は、対応する標的配列に対して定義され、配列特異的試薬を使用して標的配列が増幅される。いくつかの実施形態では、標的配列は、分析用の核酸試料中に存在する対象多型、例えば、SNP、欠失、または挿入を含む。基準配列は、ヌクレオチド塩基配列が標的配列と類似であるが、それでも、少なくとも1個のヌクレオチド塩基の差異のために標的配列とは区別でき、それにより、基準配列由来の増幅産物配列を、標的配列由来の増幅産物配列とは区別する機構を与える合成ポリヌクレオチドである。基準配列は、同じセットの増幅試薬、例えば、PCRプライマーと共に増幅される場合、対応する標的配列と実質的に同じ増幅特性を有するように選択される。いくつかの実施形態では、基準配列は、対応する標的配列と同じプライマー配列結合部位を有することができる。他の実施形態では、基準配列は、対応する標的配列とは異なるプライマー配列結合部位を持つことができる。いくつかの実施形態では、基準配列は、対応する標的配列由来の増幅産物の長さと同じ長さの増幅産物を生成するように選択できる。他の実施形態では、基準配列は、対応する標的配列由来の増幅産物の長さよりわずかに異なる長さの増幅産物を生成するように選択できる。
増幅反応が完了後、ライブラリーは、高スループットDNAシーケンサーで配列決定されるが、この場合、個別分子をクローン増幅して配列決定される。標的配列のそれぞれの対立遺伝子のシーケンスリード数が計数され、また、同様に、標的配列に対応する基準配列のシーケンスリード数も計数される。また、このプロセスは、少なくとももう一対の標的配列と対応する基準配列に対しても同様に行われる。例えば、遺伝子座Aに関し、遺伝子座Aの対立遺伝子1に対しXA1リード、遺伝子座Aの対立遺伝子2に対しXA2リードが生成され、基準配列Aに対しXACリードが生成されたとする。それぞれの対象遺伝子座に対し、XACに対する(XA1プラスXA2)の比率が決定される。前に考察のように、このプロセスは、参照ゲノム、例えば、全染色体が二倍体であるとわかっているゲノムで行うことができる。このプロセスは、多くの数のリード値を得て平均リード数およびリード数の標準偏差を測定するために多数回反復できる。このプロセスは、異なる遺伝子座に対応する多数の異なる基準配列を含む混合物で行われる。(1)XA1プラスXA2が、既知の数の染色体、例えば、通常のヒトの女性ゲノムに対しては2に対応すること、および(2)基準配列が、それらの対応する天然遺伝子座と類似の増幅(および検出)特性を有することを仮定することにより、多重基準混合物中の相対量の異なる基準配列が決定できる。その後、較正された多重基準配列混合物を使って、多重増幅反応における異なる遺伝子座間の増幅効率の変動を調節できる。
他の本発明の実施形態は、複製およびシークエンシングによる定量化と干渉する可能性のある大きな欠失が特徴の変異体遺伝子などの対象特異的遺伝子のコピー数を測定する方法と組成物を含む。シークエンシングでは、このような欠失を有する対立遺伝子の検出が難しい場合がある。基準配列を含む増幅プロセスを使用して、この問題を低減できる。
本発明の一実施形態では、分析用標的配列は、野性型(すなわち、機能型)および欠失が特徴の変異型の遺伝子である。代表的なこのような遺伝子は、遺伝疾患の脊髄性筋萎縮症(SMA)の原因である欠失を有する対立遺伝子のSMN1である。高スループット遺伝子シークエンシング技術によって変異型の遺伝子を保持する個人を検出することは有意義である。特に、シークエンシング中に配列の欠如が観察される(単純点変異またはSNPの検出とは対照的に)という理由で、欠失変異の検出へのこのような技術の応用は、問題がある場合がある。このような実施形態では、(1)対象の遺伝子(またはその一部)を増幅し、変異対立遺伝子を大きくは増幅しない、対象の遺伝子に特異的な一対の増幅プライマー、(2)対象の遺伝子(すなわち、標的配列)の野性型対立遺伝子に対応するが、少なくとも1個の検出可能ヌクレオチド塩基が異なる基準配列、(3)参照配列として機能する第2の標的配列に特異的な一対の増幅プライマー、および(4)参照配列に対応する基準配列、を用いる。
本発明の一実施形態では、対象の遺伝子のコピー数を測定する方法が提供され、対象の遺伝子は、欠失を含む1個の意図的対立遺伝子を有する。前記方法は、対象の遺伝子の欠失含有対立遺伝子を増幅しないで、少なくとも対象の遺伝子の一部、もしくは対象の全遺伝子、または対象の遺伝子に隣接する領域を増幅する点で対象の遺伝子に特異的な増幅試薬、例えば、PCRプライマーを採用できる。さらに、本方法は、対象の遺伝子に対応する基準配列を採用し、この場合、基準配列は、少なくとも1個のヌクレオチド塩基分だけ対象の遺伝子とは異なる(基準配列の配列が、対象の天然の遺伝子とは容易に区別できるように)。通常、基準配列は、対象の遺伝子と同じプライマー結合部位を含み、それにより、対象の遺伝子と、対象の遺伝子に対応する基準配列との間の全ての増幅時の差異を最小化する。また、反応は、参照配列に特異的な増幅試薬も含む。参照配列は、分析されるゲノム中の既知の(または少なくとも既知であると想定される)コピー数の配列である。反応は、参照配列に対応する基準配列をさらに含む。通常、参照配列に対応する基準配列は、参照配列と同じプライマー結合部位を含み、それにより、参照配列と、参照配列に対応する基準配列との間の全ての増幅時の差異を最小化する。
代表的核酸試料
いくつかの実施形態では、遺伝子試料を調製し、かつ/または精製することができる。そのような目的を実現するための当技術分野で公知のいくつもの標準の手順がある。いくつかの実施形態では、試料を遠心分離して、種々の層に分離することができる。いくつかの実施形態では、濾過を用いてDNAを単離することができる。いくつかの実施形態では、DNAの調製は、増幅、分離、クロマトグラフィーによる精製、液液分離、単離、優先的な富化、優先的な増幅、標的化増幅または当技術分野で公知であるか、または本明細書に記載されているいくつもの他の技法のいずれかを伴ってよい。
いくつかの実施形態では、本明細書に開示されている方法は、存在するDNAが非常に少量である状況において、例えば、インビトロでの受精または、1つまたは少数の細胞(一般には、細胞10個未満、細胞20個未満または細胞40個未満)が利用可能である法医学的な状況において用いることができる。これらの実施形態では、本明細書に開示されている方法は、他のDNAが混入していないが、DNAが少量であるので倍数性コールが非常に難しい場合に少量のDNAから倍数性コールを行うために役立つ。いくつかの実施形態では、本明細書に開示されている方法は、標的DNAに別の個体のDNAが混入している状況において、例えば、出生前診断、父子試験との関連における母系の血液または受胎検査の産物において用いることができる。これらの方法が特に有利になるいくつかの他の状況は、より大量の正常な細胞の中でただ1つまたは少数の細胞が存在するがん検査の場合である。これらの方法の一部として用いる遺伝子測定は、DNAまたはRNAを含む任意の試料、例えば、これらに限定されないが血液、血漿、体液、尿、毛髪、涙、唾液、組織、皮膚、指の爪、割球、胚、羊水、絨毛膜絨毛試料、糞便、胆汁、リンパ液、頸管粘液、精液または核酸を含む他の細胞または材料に対して行うことができる。ある実施形態では、本明細書に開示されている方法は、核酸検出方法、例えば、配列決定、マイクロアレイ、qPCR、デジタルPCRまたは核酸を測定するために用いられる他の方法と一緒に実行することができる。何らかの理由で望ましいことが見いだされた場合、遺伝子座における対立遺伝子数の確率の比を算出することができ、対立遺伝子の比を、本明細書に記載の方法のいくつかと、それらの方法に適合性がある限りにおいて組み合わせて用いて倍数性状態を決定することができる。いくつかの実施形態では、本明細書に開示されている方法は、加工された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子の比をコンピュータで算出するステップを包含する。いくつかの実施形態では、本明細書に開示されている方法は、本開示に記載の他の改善の任意の組み合わせと一緒に、加工された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子の比をコンピュータで算出するステップを包含する。
いくつかの実施形態では、この方法を用いて、単一細胞、少数の細胞、2〜5個の細胞、6〜10個の細胞、10〜20個の細胞、20〜50個の細胞、50〜100個の細胞、100〜1,000個の細胞または少量、例えば、1〜10ピコグラム、10〜100ピコグラム、100ピコグラム〜1ナノグラム、1〜10ナノグラム、10〜100ナノグラムまたは100ナノグラム〜1マイクログラムの細胞外DNAについて遺伝子型決定することができる。
代表的RNA発現調査
本発明の多重PCR法を使って、遺伝子発現プロファイリング実験中に評価できる標的遺伝子座の数を増やすことができる。例えば、数千の遺伝子の発現レベルを同時にモニターして、疾患(例えば、癌)または疾患の危険性の増加に関連する配列(例えば、多型または他の変異)を有するかどうかを判定できる。これらの方法を使って、患者由来の試料中の遺伝子発現(例えば、特定のmRNA対立遺伝子の発現)を疾患の有無と比較することにより、疾患、例えば、癌の危険性の増加または減少に関する配列(例えば、多型または他の変異)を特定できる。さらに、特定の治療、疾患、または発育段階が遺伝子発現に与える影響を決定できる。同様に、これらの方法を使って、感染および非感染細胞または組織中の遺伝子発現を比較することにより、病原体または他の生物に反応してどの遺伝子の発現が変化したかを特定できる。これらの方法では、シークエンシングリード数は、検出されるべき多型に対し十分なリードが実行されるように、その多型の頻度に基づいて調節できる(分析される多型が存在する場合)。
いくつかの実施形態では、RNA(例えば、mRNA)を含む試料は、逆転写酵素(RT)を使って増幅され、得られたDNA(例えば、cDNA)は、その後、DNAポリメラーゼ(PCR)を使って増幅される。RTとPCRステップは、同じ反応体積中でまたは別々に、順次行うことができる。本発明のプライマーライブラリーのいずれかを、このリバース転写ポリメラーゼ連鎖反応(RT−PCR)法で使用できる。種々の実施形態では、リバース転写は、オリゴdT、ランダムプライマー、オリゴdTとランダムプライマーの混合物、または標的遺伝子座特異的プライマーを使って行うことができる。混入ゲノムDNAの増幅を避けるために、RT−PCR用のプライマーは、1個のプライマーの一部が、1個のエキソンの3’末端にハイブリダイズし、他のプライマーの一部が隣接エキソンの5’末端にハイブリダイズするように設計できる。このようなプライマーは、スプライスされたmRNAから合成されたcDNAにアニールするが、ゲノムDNAにはアニールしない。混入DNAの増幅を検出するために、RT−PCRプライマー対を、少なくとも1個のイントロンを含む領域の側に配置されるように設計できる。cDNA(イントロン不含)から増幅された産物は、ゲノムDNA(イントロン含有)から増幅されたものより小さい。産物のサイズ差を使って混入DNAの存在が検出される。いくつかの実施形態では、mRNA配列のみが既知である場合、少なくとも300〜400塩基対離れているプライマーアニーリング部位が選択される。理由は、真核生物DNA由来のこのサイズのフラグメントは、スプライスジャンクションを含む可能性があるためである。あるいは、試料をDNA分解酵素で処理して混入DNAを分解できる。
代表的父子鑑定方法
非常に多くの標的遺伝子座を一度に分析できるために、(例えば、2011年12月22日出願の米国特許公開第2012/0122701号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)本発明の多重PCR法を使って父子鑑定の正確度を改善できる。例えば、多重PCR法は、数千の多形遺伝子座(例えば、SNP)を本明細書記載のPARENTAL SUPPORTアルゴリズム中で使用するために分析して父親とされる人が胎児の生物学上の父親であるかどうかを判定することを可能とする。いくつかの実施形態では、前記方法は、(i)父親とされる人由来の遺伝物質上の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座を含む複数の多形遺伝子座を同時に増幅して第1の増幅産物集合を生成するステップと、(ii)妊娠中の母親の血液試料由来の胎児DNAおよび母系DNAを含む混合DNA試料の対応する複数の多形遺伝子座を同時に増幅して第2の増幅産物集合を生成するステップと、(iii)第1および第2の増幅産物集合に基づく遺伝子型測定値を使って父親とされる人が胎児の生物学上の父親である確率をコンピュータで算出するステップと、(iv)父親とされる人が胎児の生物学上の父親であることに関する算出された確率を使って父親とされる人が胎児の生物学上の父親かどうかを確定するステップとを含む。種々の実施形態では、前記方法は、母親由来の遺伝物質上の対応する複数の多形遺伝子座を同時に増幅して第3の増幅産物集合を生成するステップをさらに含み、この場合、第1、第2、および第3の増幅産物集合に基づく遺伝子型測定値を使って父親とされる人が胎児の生物学上の父親である確率が算出される。
代表的胚キャラクタリゼーションおよび選択方法
本発明の多重PCR法を使って数千の標的遺伝子座を一度に分析可能とすることにより、インビトロ受精用の胚の選択を改善できる(例えば、2008年5月27日出願、2011年12月22日出願の米国特許公開第2011/0092763号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)。例えば、多重PCR法は、本明細書で記載のPARENTAL SUPPORTアルゴリズムで使用するための数千の多形遺伝子座(例えば、SNP)を分析可能として、胚の集合からインビトロ受精用の胚の選択を行うことができる。
いくつかの実施形態では、本発明は、胚集合由来のそれぞれの胚を所望の通り発生させる相対的尤度を推定する方法を提供する。いくつかの実施形態では、前記方法は、それぞれの胚由来の試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させてそれぞれの胚の混合物を生成するステップを含み、試料は、それぞれ、胚由来の1個または複数個の細胞から得られる。いくつかの実施形態では、それぞれの反応混合物は、プライマー伸長反応条件に供されて増幅産物を生成する。いくつかの実施形態では、前記方法は、コンピュータでそれぞれの胚由来の少なくとも1個の細胞の1つまたは複数の特性を増幅産物に基づいて決定するステップと、それぞれの胚を所望の通り発生させる相対的尤度をそれぞれの胚に対する少なくとも1個の細胞の1つまたは複数の特性に基づいてコンピュータで推定するステップとを含む。いくつかの実施形態では、前記方法は、インフォマティクスベースの方法を使用して少なくとも1つの特性、例えば、本明細書で記載のPARENTAL SUPPORTアルゴリズムを決定するステップを含む。いくつかの実施形態では、特性は、倍数性状態を含む。いくつかの実施形態では、特性は、異数体、正倍数体、モザイク、零染色体性、モノソミー、片親ダイソミー、トリソミー、テトラソミー、異数性のタイプ、不一致コピーエラートリソミー、一致コピーエラートリソミー、母体起源の異数性、父系起源の異数性、疾患連鎖遺伝子の存在の有無、全ての正倍数体染色体の染色体同一性、異常遺伝子状態、欠失または複製、特性の尤度、およびこれらの組み合わせからなる群より選択される。特性は、染色体1、染色体2、染色体3、染色体4、染色体5、染色体6、染色体7、染色体8、染色体9、染色体10、染色体11、染色体12、染色体13、染色体14、染色体15、染色体16、染色体17、染色体18、染色体19、染色体20、染色体21、染色体22、X染色体またはY染色体、およびこれらの組み合わせ、からなる群より選択される染色体に関連するものであってよい。
代表的出生前診断法
本発明の多重PCR法を使用して、胎児染色体の倍数性状態の判定などの出生前診断法を改善できる。同時に増幅される多数の標的遺伝子座を考慮すれば、より正確な判定を行うことが可能である。
ある実施形態では、本開示は、DNAの混合試料(すなわち、胎児の母親由来のDNA、および胎児由来のDNA)から測定された遺伝子型データから、および必要に応じて、母親由来の遺伝物質および場合によっては同様に父親由来の遺伝物質の試料から測定された遺伝子型データから、妊娠中の胎児における染色体の倍数性状態を決定するためのエクスビボ方法であって、前記決定を、同時分布モデルを用い、親の遺伝子型データを考慮して、胎児における可能性のある異なる倍数性状態についての予測される対立遺伝子分布の集合を作製し、予測される対立遺伝子分布と、混合試料において測定された実際の対立遺伝子分布とを比較し、予測される対立遺伝子分布パターンが観察された対立遺伝子分布パターンと最も厳密に一致する倍数性状態を選択することによって行う方法を提供する。ある実施形態では、混合試料は、母系の血液または母系の血清もしくは血漿に由来する。ある実施形態では、DNAの混合試料を、標的遺伝子座(例えば、複数の多型遺伝子座)で優先的に富化することができる。ある実施形態では、優先的な富化は、対立遺伝子の偏りが最小限になるように行う。ある実施形態では、本開示は、複数の遺伝子座において対立遺伝子の偏りが少なくなるように優先的に富化されたDNAの組成に関する。ある実施形態では、対立遺伝子分布(複数可)を、混合試料由来のDNAについてシークエンシングによって測定する。ある実施形態では、同時分布モデルにより、対立遺伝子が二項様式で分布することが仮定される。ある実施形態では、種々の供給源からの現存の組換え頻度を考慮して、例えば、International HapMap Consortiumからのデータを使用して、遺伝的に連鎖している遺伝子座について予測同時対立遺伝子分布の集合を作製する。
ある実施形態では、本開示は、非侵襲的な出生前診断(NPD)の方法、詳細には、DNA混合物について測定された遺伝子型データにおいて複数の多型遺伝子座における対立遺伝子測定値を観察することによって胎児の異数性状態を決定するための方法であって、ある特定の対立遺伝子測定値により異数体の胎児が示され、一方、他の対立遺伝子測定値により正倍数性の胎児が示される示す方法を提供する。ある実施形態では、遺伝子型データを、母系の血漿に由来するDNA混合物についてシークエンシングによって測定する。ある実施形態では、DNA試料を、対立遺伝子分布を算出する複数の遺伝子座に対応するDNA分子について優先的に富化することができる。ある実施形態では、母親由来の遺伝物質のみを含む、または、ほぼ母親由来の遺伝物質のみを含むDNAの試料を測定し、場合によっては、父親由来の遺伝物質のみを含む、または、ほぼ父親由来の遺伝物質のみを含むDNAの試料も測定する。ある実施形態では、一方の親または両親の遺伝子測定値を推定される胎児画分と一緒に使用して、胎児における可能性のある異なる基礎をなす遺伝子の状態に対応する複数の予測される対立遺伝子分布を作製し、前記予測される対立遺伝子分布は、仮説と称することができる。ある実施形態では、母系の遺伝子データは、天然で排他的またはほぼ排他的に母系のものである遺伝物質を測定することによって決定するのではなく、母系DNAと胎児DNAの混合物を含む母系の血漿に対して行われる遺伝子測定から推定する。いくつかの実施形態では、仮説は、1個または複数個の染色体における胎児の倍数性、胎児のどの染色体のどのセグメントがどちらの親から遺伝したか、およびそれらの組み合わせを含んでよい。いくつかの実施形態では、胎児の倍数性状態は、観察された対立遺伝子測定値と、異なる仮説であって、前記仮説の少なくとも一部が、異なる倍数性状態に対応する仮説を比較し、観察された対立遺伝子測定値を考慮して、真である可能性が最も高い仮説に対応する倍数性状態を選択することによって決定する。ある実施形態では、この方法は、遺伝子座がホモ接合性であるかヘテロ接合性であるかにかかわらず、測定されたSNPの一部または全部からの対立遺伝子測定データの使用を伴い、したがって、ヘテロ接合性のみである遺伝子座の対立遺伝子の使用は伴わない。この方法は、遺伝子データがただ1つの多型遺伝子座に関係する状況には適さない場合がある。この方法は、遺伝子データが、標的染色体に対して10超の多型遺伝子座、または20超の多型遺伝子座についてのデータを含む場合に特に有利である。この方法は、遺伝子データが、標的染色体に対して50超の多型遺伝子座、100超の多型遺伝子座、または標的染色体に対して200超の多型遺伝子座についてのデータを含む場合に特に有利である。いくつかの実施形態では、遺伝子データは、標的染色体に対して500超の多型遺伝子座、1,000超の多型遺伝子座、2,000超の多型遺伝子座、または、標的染色体に対して5,000超の多型遺伝子座についてのデータを含んでよい。
ある実施形態では、本明細書に開示されている方法は、多型遺伝子座の各対立遺伝子の独立した観察の数の定量的尺度を提供する。これは、マイクロアレイまたは定性的PCRなどの、2つの対立遺伝子の比に関する情報をもたらすが、いずれかの対立遺伝子の独立した観察の数を定量化しない大多数の方法とは異なる。独立した観察の数に関する定量的情報をもたらす方法では、倍数性の算出には比のみを利用し、一方、定量的情報はそれ自体では有用ではない。独立した観察の数に関する情報を保持することの重要性を例示するために、2つの対立遺伝子、AおよびBを有する試料の遺伝子座について考察する。第1の実験では20の対立遺伝子Aおよび20の対立遺伝子Bを観察し、第2の実験では200の対立遺伝子Aおよび200の対立遺伝子Bを観察する。どちらの実験でも、比(A/(A+B))は0.5と等しいが、第2の実験は、第1の実験よりも対立遺伝子AまたはBの頻度の確実性に関する多くの情報を伝える。別の研究者によるいくつかの方法は、個々の対立遺伝子からの対立遺伝子の比(チャネル比)(すなわちx/y)を平均または合計し、この比を、参照染色体と比較するか、またはこの比が特定の状況でどのように挙動すると予想されるかに関する規則を用いるかのいずれかで解析することを伴う。このような方法では、対立遺伝子の重み付けを伴わず、各対立遺伝子についてほぼ同じ量のPCR産物を確実にすることができること、および全ての対立遺伝子が同じように挙動するはずであることが想定される。このような方法にはいくつもの不都合があり、より重要なことに、本開示の他の箇所で記載されているいくつもの改善を用いることが妨げられる。
ある実施形態では、本明細書に開示されている方法は、ダイソミーにおいて予測される対立遺伝子頻度分布ならびに減数分裂Iの間の染色体不分離、減数分裂IIの間の染色体不分離、および/または胎児発生の初期の有糸分裂の間の染色体不分離によって生じるトリソミーの場合に予測され得る複数の対立遺伝子頻度分布を明確にモデリングする。なぜこれが重要であるかを例示するために、乗換えがない場合を考える:減数分裂Iの間の染色体不分離により、2つの異なる相同体が一方の親から遺伝によって受け継がれたトリソミーがもたらされ、対照的に、減数分裂IIの間、または胎児発生の初期の有糸分裂の間の染色体不分離により、一方の親由来の同じ相同体の2つのコピーがもたらされることになる。各筋書きにより、各多型遺伝子座において、また遺伝連鎖に起因して、共同して考えられる全ての遺伝子座において、予測される対立遺伝子の異なる頻度がもたらされることになる。相同体間での遺伝物質の交換をもたらす乗換えにより、遺伝様式がより複雑になり、ある実施形態では、当該方法は、遺伝子座間の物理的な距離に加えて、組換え率の情報を使用することによってこれに適応する。ある実施形態では、減数分裂I時の染色体不分離と減数分裂IIまたは有糸分裂時の染色体不分離との間の区別の改善を可能にするために、当該方法では、モデルに、セントロメアからの距離が増加するにつれて上昇する乗換えの確率を組み入れる。減数分裂IIおよび有糸分裂時の染色体不分離は、有糸分裂時の染色体不分離により、一般には、1つの相同体の同一またはほぼ同一のコピーがもたらされるが、一方、減数分裂II時の染色体不分離事象の後に存在する2つの相同体は、多くの場合、配偶子形成の間の1つまたは複数の乗換えに起因して異なるという事実によって区別することができる。
いくつかの実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子異数性に対応する理論的仮説と比較するステップを包含し、ヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップは包含しない。遺伝子座の数が約20未満の場合、ヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップを含む方法を用いて行った倍数性の決定と、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的な対立遺伝子分布の仮説と比較することを含む方法を用いて行った倍数性の決定は、同様の結果をもたらし得る。しかし、遺伝子座の数が50超である場合、これらの2つの方法は、有意に異なる結果をもたらす可能性があり、遺伝子座の数が400超、1,000超または2,000超である場合、これらの2つの方法は、ますます有意に異なる結果をもたらす可能性が高い。これらの差は、各対立遺伝子の大きさを独立に測定すること、および比を総計または平均することを伴わずにヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップを含む方法が、同時分布モデルを用いること、連鎖解析を実施すること、二項分布モデルを用いること、および/または他の高度な統計学的技法を含めた技法を用いることを妨げるが、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的な対立遺伝子分布の仮説と比較するステップを含む方法を用いると、決定の正確度を実質的に上昇させることができるこれらの技法を用いることができるという事実に起因する。
ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、同時分布モデルを用いて正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。同時分布モデルの使用は、方法であって、多型遺伝子座を独立に処理することによってヘテロ接合率を決定する方法とは、得られた決定の正確度が有意に高いという点で異なり、それよりも有意に改善されている。いかなる特定の理論にも縛られることなく、それらの正確度が高い1つの理由は、同時分布モデルでは、SNP間の連鎖、および成長して胎児になる胚を形成する配偶子を生じる減数分裂の間に起こった乗換えの尤度を考慮に入れることであると考えられる。1個または複数個の仮説について対立遺伝子測定値の予測される分布を作製する際に連鎖の概念を用いる目的は、それにより、連鎖を用いない場合よりも相当よい現実に対応する予測される対立遺伝子測定値分布の作製を可能にすることである。例えば、2つのSNPが存在し、1および2は、互いに近くに位置し、母親は、一方の相同体上のSNP1がAであり、SNP2がAであり、相同体2上のSNP1がBであり、SNP2がBであると考える。父親が、両方の相同体上の両方のSNPについてAであり、胎児のSNP1についてBが測定された場合、これは、相同体2を胎児が遺伝によって受け継いだこと、したがって、胎児のSNP2にBが存在する尤度がはるかに高いことを示す。連鎖を考慮に入れたモデルではこれが予測されるが、連鎖を考慮に入れないモデルでは予測されない。あるいは、母親のSNP1がABであり、近くのSNP2がABである場合、その場所における母系トリソミーに対応する2つの仮説−一致コピーエラー(減数分裂IIまたは胎児発生初期の有糸分裂における染色体不分離)を伴うもの、および不一致コピーエラー(減数分裂Iにおける染色体不分離)を伴うものを用いることができる。一致コピーエラートリソミーの場合には、胎児が、SNP1において母親からAAを遺伝によって受け継いだ場合、胎児は、SNP2において母親から、ABではなく、AAまたはBBのいずれかを遺伝によって受け継ぐ可能性がはるかに高い。不一致コピーエラーの場合には、胎児は、両方のSNPにおいて母親からABを遺伝によって受け継ぐことになる。連鎖を考慮に入れた、倍数性コール方法によって立てられた対立遺伝子分布の仮説により、これらの予測がなされ、したがって、連鎖を考慮に入れなかった倍数性コール方法よりも相当に大きな程度で、実際の対立遺伝子測定値に対応する。連鎖手法は、対立遺伝子の比を算出することおよびそれらの対立遺伝子の比を総計することに依拠する方法を用いる場合には不可能であることに留意されたい。
観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的仮説と比較するステップを含む方法を用いる倍数性の決定の正確度がより高いと考えられる1つの理由は、配列決定を使用して対立遺伝子を測定する場合、この方法では、リードの総数が他の方法よりも少ない場合に、対立遺伝子からのデータから、より多くの情報を収集することができることであり、例えば、対立遺伝子の比を算出することおよび総計することに依拠する方法では、不釣り合いに重み付けられた確率論的ノイズが生じる。例えば、配列決定を用いて対立遺伝子を測定することを伴う場合であって、各遺伝子座についてシーケンスリードが5つのみ検出された遺伝子座の集合が存在する場合を考える。ある実施形態では、対立遺伝子のそれぞれについて、データを、仮定された対立遺伝子分布と比較し、シーケンスリード数に従って重み付けることができ、したがって、これらの測定からのデータは、適切に重み付けられ、全体的な決定に組み入れられる。これは、ヘテロ接合性遺伝子座における対立遺伝子の比を定量することを伴う方法が、可能性のある対立遺伝子の比として0%、20%、40%、60%、80%または100%の比しか算出することができず、これらはいずれも予測される対立遺伝子の比には近づくことができないので、上記方法とは対照的である。この後者の場合、算出された対立遺伝子の比は、リードが不十分なので棄却しなければならないか、あるいは、不相応に重み付けされ、確率論的ノイズが決定に導入され、それにより、決定の正確度が低下する。ある実施形態では、個々の対立遺伝子測定を、独立した測定として処理することができ、この場合、同じ遺伝子座の対立遺伝子に対して行った測定間の関係が、異なる遺伝子座の対立遺伝子に対して行った測定間の関係と異ならない。
ある実施形態では、本明細書に開示されている方法は、任意のメトリックを、ダイソミーであることが予想される参照染色体において観察された対立遺伝子測定値と比較するステップ(RC法と称される)を包含せずに、観察された対立遺伝子測定値の分布により、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。これは、疑わしい染色体から無作為に配列決定された断片の割合を、1個または複数個の推測ダイソミー参照染色体と比較して評価することによって異数性を検出する、ショットガン配列決定を用いる方法などの方法に対する有意な改善である。このRC法では、推測ダイソミー参照染色体が実際にはダイソミーではない場合、不正確な結果がもたらされる。これは、異数性が、単一染色体のトリソミーより実質的である場合、または胎児が三倍体であり、全ての常染色体がトリソミーである場合に起こり得る。雌性三倍体(69、XXX)胎児の場合には、実際は、ダイソミー染色体は全く存在しない。本明細書に記載の方法は、参照染色体を必要とせず、雌性三倍体胎児におけるトリソミー染色体を正確に同定することができる。染色体、仮説、子の割合(child fraction)およびノイズレベルのそれぞれについて、同時分布モデルを、参照染色体のデータ、全体的な子の割合の見積もりまたは固定された参照仮説のいずれも伴わずに適合させることができる。
ある実施形態では、本明細書に開示されている方法は、観察されている多型遺伝子座における対立遺伝子分布をどのように使用して、先行技術の方法よりも高い正確度で胎児の倍数性状態を決定することができるかを実証している。ある実施形態では、前記方法は、標的化配列決定を用いて、複数のSNPにおける混合母体−胎児遺伝子型、および必要に応じて、母親の遺伝子型および/または父親の遺伝子型を得て、最初に異なる仮説の下での種々の予測される対立遺伝子頻度分布を確立すること、次いで、母体−胎児混合物において得られる定量的な対立遺伝子の情報を観察すること、および、どの仮説がデータに最もよく適合するかを評価することを用い、データに最もよく適合する仮説に対応する遺伝子の状態を正確な遺伝子の状態としてコールする。ある実施形態では、本明細書に開示されている方法は、コールされた遺伝子の状態が正確な遺伝子の状態であることの信頼度を生成するために、適合の程度も用いる。ある実施形態では、本明細書に開示されている方法は、親の状況が異なる遺伝子座に関して見いだされる対立遺伝子の分布を解析するアルゴリズムを使用するステップ、および異なる親の状況(異なる親の遺伝子型のパターン)についての、異なる倍数性状態について、観察された対立遺伝子分布を、予測される対立遺伝子分布と比較するステップを包含する。これは、母体−胎児混合試料中の各遺伝子座における各対立遺伝子の独立した事例の数を推定することができる方法を用いない方法とは異なり、それよりも改善されている。ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、母親がヘテロ接合性である遺伝子座において測定された、観察された対立遺伝子分布を用いて、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。これは、その特定の標的個体に対して情報価値が高いことが知られていない遺伝子座についてDNAが優先的に富化されていない場合、または優先的に富化されている場合、倍数性の決定において、配列データの集合から約2倍の遺伝子測定データを用いることが可能になり、それにより、より正確な決定がもたらされるので、母親がヘテロ接合性である遺伝子座における観察された対立遺伝子分布を用いない方法とは異なり、それよりも改善されている。
ある実施形態では、本明細書に開示されている方法は、天然では、各遺伝子座における対立遺伝子頻度が多項式(したがって、SNPが二対立遺伝子である場合は二項式)であると仮定する同時分布モデルを用いる。いくつかの実施形態では、同時分布モデルは、ベータ二項分布を使用する。各遺伝子座に存在する各対立遺伝子についての定量的尺度を提供する配列決定などの測定技法を用いる場合、二項モデルを、各遺伝子座に適用することができ、対立遺伝子頻度の基礎をなす程度およびその頻度の信頼度を確かめることができる。対立遺伝子の比から倍数性コールを生成する当技術分野で公知の方法または定量的な対立遺伝子情報が棄却される方法を用いて、観察された比の確実性を確かめることができない。当該方法は、特定の遺伝子座における対立遺伝子の比を算出し、次いでそれらの比を総計することを伴う任意の方法では、任意の所与の対立遺伝子または遺伝子座からのDNAの量を示す測定された強度または計数値がガウス様式で分布することを必ず仮定するので、対立遺伝子の比を算出し、それらの比を総計して倍数性コールを行う方法とは異なり、それよりも改善されている。本明細書に開示されている方法は、対立遺伝子の比を算出することを伴わない。いくつかの実施形態では、本明細書に開示されている方法は、複数の遺伝子座の各対立遺伝子の観察結果の数をモデルに組み入れるステップを包含し得る。いくつかの実施形態では、本明細書に開示されている方法は、予測される分布自体を算出するステップであって、それにより、対立遺伝子測定値のガウス分布を仮定するモデルのいずれよりも正確であり得る同時二項分布(joint binomial distribution)モデルを用いることが可能になるステップを包含し得る。二項分布モデルがガウス分布よりも有意に正確である尤度は、遺伝子座の数が増加するにつれて増大する。例えば、20未満の遺伝子座を調べる場合、二項分布モデルが有意にすぐれている尤度は低い。しかし、100超、または特に400超、または特に1,000超、または特に2,000超の遺伝子座を使用すると、二項分布モデルの、ガウス分布モデルよりも有意に正確である尤度は非常に高くなり、それにより、より正確な倍数性の決定がもたらされる。二項分布モデルがガウス分布よりも有意に正確である尤度は、同様に、各遺伝子座における観察結果の数が増加するにつれて増大する。例えば、各遺伝子座において10未満の別個の配列を観察する場合、二項分布モデルが有意にすぐれている尤度は低い。しかし、各遺伝子座について50超のシーケンスリード、または特に100超のシーケンスリード、または特に200超のシーケンスリード、または特に300超のシーケンスリードを使用すると、二項分布モデルの、ガウス分布モデルよりも有意に正確である尤度は非常に高くなり、それにより、より正確な倍数性の決定がもたらされる。
ある実施形態では、本明細書に開示されている方法では、配列決定を用いて、DNA試料中の各遺伝子座における各対立遺伝子の事例の数を測定する。シーケンシングリードのそれぞれは、特定の遺伝子座にマッピングし、バイナリーのシーケンスリードとして処理することができる、あるいは、リードおよび/またはマッピングの同一性の確率を、シーケンスリードの一部として組み入れることができ、その結果、確率的なシーケンスリード、すなわち所与の遺伝子座にマッピングされるシーケンスリードの推定の整数または分数がもたらされる。バイナリーの計数値または計数値の確率を使用すると、測定値の各集合について二項分布を用いることが可能であり、これにより、計数値の範囲の(around the number of counts)信頼区間を算出することが可能になる。二項分布を用いることができることにより、より正確な倍数性の推定およびより精度の高い信頼区間を算出することが可能になる。これは、存在する対立遺伝子の量を測定するために強度を用いる方法、例えば、マイクロアレイを用いる方法、または電気泳動のバンドにおいて蛍光性タグを付けたDNAの強度を測定するために蛍光リーダーを用いて測定を行う方法とは異なり、それよりも改善されている。
ある実施形態では、本明細書に開示されている方法では、本データの集合の態様を用いて、そのデータの集合についての推定される対立遺伝子頻度分布のパラメータを決定する。これは、本予測される対立遺伝子頻度分布または場合によっては予測される対立遺伝子の比のパラメータを設定するために、トレーニングデータ集合または事前データ集合を利用する方法よりも改善されている。これは、あらゆる遺伝子試料の収集および測定に関与する異なる状態の集合が存在することが原因であり、したがって、当該データの集合からのデータを使用して、その試料についての倍数性の決定に使用するためのものである同時分布モデルのパラメータを決定する方法がより正確になりやすい。
ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、最尤法を用いて、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。最尤法を用いることは、得られる決定の正確度が有意に高いという点で、単一仮説棄却法を用いる方法とは異なり、それよりも有意に改善されている。1つの理由は、単一仮説棄却法では、2つの測定値分布ではなく、ただ1つの測定値分布に基づいてカットオフ閾値が設定される、つまり、閾値が通常は最適ではないことである。別の理由は、最尤法では、個々の試料の各々の特定の特性にかかわらず全ての試料に対して使用されるカットオフ閾値を決定するのではなく、個々の試料の各々についてカットオフ閾値を最適化することが可能になることである。別の理由は、最尤法を用いることにより、各倍数性コールについて信頼度を算出することが可能になることである。各コールに対して信頼度の算出を行うことができることにより、実践者が、どのコールが正確であるか、およびどれが誤りである可能性がより高いかを知ることが可能になる。いくつかの実施形態では、多種多様な方法を最尤推定法と組み合わせて、倍数性コールの正確度を増強することができる。ある実施形態では、最尤法を、米国特許第7,888,017号に記載の方法と組み合わせて用いることができる。ある実施形態では、最尤法を、標的PCR増幅を用いて混合試料中のDNAを増幅し、その後、リード計数方法、例えば、2011年10月のMontrealでのInternational Congress of Human Genetics 2011年において発表されたTANDEM DIAGNOSTICSを用いて配列決定し分析する方法と組み合わせて用いることができる。ある実施形態では、本明細書に開示されている方法は、混合試料中のDNAの胎児画分を推定するステップ、およびその推定値を用いて倍数性コールと倍数性コールの信頼度の両方を算出するステップを包含する。これは、推定される胎児画分を十分な胎児画分のスクリーニングとして用い、その後、胎児画分を考慮に入れず、コールについての信頼度の算出も生じない単一仮説棄却法を用いて倍数性コールを行う方法とは異なり、かつその方法とは区別されることに留意されたい。
ある実施形態では、本明細書に開示されている方法は、各測定値に確率を付与することによってデータがノイズを伴い、エラーを含有する傾向を考慮に入れる。付与された確率的な推定値を伴う測定データを使用して立てられた仮説の集合から正確な仮説を選択するために最尤法を用いることにより、不正確な測定値が考慮に入れられない可能性が高くなり、倍数性コールを導く算出において正確な測定値が用いられる。より精度が高くあるために、この方法では、倍数性の決定において不正確に測定されたデータの影響を系統的に低下させる。これは、全てのデータが同等に正確であると仮定される方法または範囲外のデータが倍数性コールを導く算出から任意に排除される方法よりも改善されている。チャネル比測定値を用いる現行の方法は、個々のSNPチャネル比を平均することによってこの方法を多数のSNPに拡張することを主張する。SNPの質および観察されたリード深度に基づいて予測される測定値の分散によって個々のSNPに重み付けをしないことにより、生じた統計量の正確度が低下し、その結果、倍数性コールの正確度が、特に境界の場合に有意に低下する。
ある実施形態では、本明細書に開示されている方法は、胎児においてどのSNPまたは他の多型遺伝子座がヘテロ接合性であるかの知見を前提としない。この方法により、父系の遺伝子型の情報が入手不可能である場合に倍数性コールを行うことが可能になる。これは、標的とする遺伝子座を適切に選択するため、または混合胎児DNA/母系DNA試料に対して得た遺伝子測定値を解釈するために、どのSNPがヘテロ接合性であるかの知見が前もって知られていなければならない方法よりも改善されている。
本明細書に記載の方法は、利用可能なDNAが少量である試料、または胎児DNAのパーセントが低い試料に対して用いる場合に特に有利である。これは、少量のDNAしか利用可能でない場合に生じる、対立遺伝子ドロップアウト率が相応して高いこと、および/または胎児DNAと母系DNAの混合試料中の胎児DNAのパーセントが低い場合に胎児の対立遺伝子ドロップアウト率が相応して高いことに起因する。対立遺伝子ドロップアウト率が高いこと、つまり、標的個体について、対立遺伝子の大部分が測定されなかったことにより、不十分に正確な胎児画分の算出、および不十分に正確な倍数性の決定がもたらされる。本明細書に開示されている方法は、SNP間の遺伝様式における連鎖を考慮に入れた同時分布モデルを用いることができるので、有意により正確な倍数性の決定を行うことができる。本明細書に記載の方法により、混合物中の胎児性のDNA分子のパーセントが40%未満、30%未満、20%未満、10%未満、8%未満、さらには6%未満である場合に、正確な倍数性の決定を行うことが可能になる。
ある実施形態では、個体のDNAが関連する個体のDNAと混在している場合の測定値に基づいて個体の倍数性状態を決定することが可能である。ある実施形態では、DNAの混合物は、母系の血漿中に見いだされる浮動性DNAであり、これは、既知の核型および既知の遺伝子型を有する母親由来のDNAを含んでもよく、また、未知の核型および未知の遺伝子型を有する胎児DNAと混在してもよい。一方の親または両親からの既知の遺伝子型の情報を用いて、混合試料中のDNAの複数の潜在的な遺伝子の状態を、異なる倍数性状態、各親から胎児への異なる染色体の寄与、および必要に応じて、混合物中の異なる胎児DNAの割合について予測することが可能である。潜在的な組成のそれぞれは、仮説と称することができる。次いで、胎児の倍数性状態を、実際の測定値について調べ、観察されたデータを考慮してどの潜在的な組成が最も可能性が高いかを決定することによって決定することができる。
上記の点のさらなる考察は、本文書の他の箇所に見いだすことができる。
非侵襲的な出生前診断(NPD)
非侵襲的な出生前診断のプロセスは、いくつものステップを伴う。ステップのいくつかとしては、(1)胎児から遺伝物質を得るステップと、(2)混合試料中に存在する可能性がある胎児の遺伝物質をエクスビボで富化するステップと、(3)遺伝物質をエクスビボで増幅するステップと、(4)遺伝物質の特定の遺伝子座をエクスビボで優先的に富化するステップと、(5)遺伝物質をエクスビボで測定するステップと、(6)遺伝子型データを、エクスビボで、コンピュータで分析するステップとを挙げることができる。これらの6つおよび他の関連性のあるステップの実施を減少させるための方法が本明細書に記載されている。前記方法のステップの少なくとも一部は、直接体には適用されない。ある実施形態では、本開示は、体から単離され、分離された組織および他の生物材料に適用される処置および診断の方法に関する。前記方法のステップの少なくとも一部は、コンピュータで実行される。
本開示のいくつかの実施形態により、臨床医は母親が妊娠中の胎児の遺伝子の状態を非侵襲的に決定することが可能になり、それにより、胎児の遺伝物質を採取することによって乳児の健康が危険にさらされることがなく、また、母親が侵襲的手順を受ける必要がない。さらに、ある特定の態様では、本開示により、胎児の遺伝子の状態を、高い正確度、例えば、出生前ケアに広く用いられているトリプルテストの、非侵襲的な母系の血清分析物に基づくスクリーニングよりも有意に高い正確度で決定することが可能になる。
本明細書に開示されている方法の正確度が高いことは、本明細書に記載の、遺伝子型データを分析するためのインフォマティクス手法の結果である。現代の技術的な進歩により、ハイスループット配列決定および遺伝子型決定アレイなどの方法を用いて遺伝子試料から大量の遺伝子情報を測定することができるようになった。本明細書に開示されている方法により、臨床医は利用可能な大量のデータをより大きく活用すること、および胎児の遺伝子の状態のより正確な診断を行うことが可能になる。いくつもの実施形態の詳細が下に示されている。異なる実施形態は、上述のステップの異なる組み合わせを包含し得る。異なるステップの異なる実施形態の種々の組み合わせを互換的に用いることができる。
ある実施形態では、妊娠中の母親から血液試料を取得し、母体起源のDNA、および胎児起源のDNAの両方の混合物を含有する母親の血液の血漿中の浮動性DNAを単離し、胎児の倍数性状態を決定するために使用する。ある実施形態では、本明細書に開示されている方法は、多型対立遺伝子に対応するDNAの混合物中のDNA配列を、対立遺伝子の比および/または対立遺伝子分布が、富化に際してほとんど変わらないままであるように、優先的に富化するステップを包含する。ある実施形態では、本明細書に開示されている方法は、生じた分子の非常に高い百分率が、標的の遺伝子座に対応するように、非常に効率的な標的PCRに基づく増幅を伴う。ある実施形態では、本明細書に開示されている方法は、母体起源のDNA、および胎児起源のDNAの両方を含有するDNAの混合物について配列決定するステップを包含する。ある実施形態では、本明細書に開示されている方法は、測定された対立遺伝子分布を用いて、母親が妊娠中の胎児の倍数性状態を決定するステップを包含する。ある実施形態では、本明細書に開示されている方法は、決定された倍数性状態を臨床医に報告するステップを包含する。ある実施形態では、本明細書に開示されている方法は、臨床的措置をとるステップ、例えば、絨毛膜絨毛採取または羊水穿刺の侵襲的検査の経過観察を実施するステップ、トリソミーの個体の誕生の準備をするステップ、またはトリソミーの胎児の選択的中絶を包含する。
本出願は、2006年11月28日出願の米国実用新案出願第11/603,406号(米国特許出願公開第:20070184467);2008年3月17日出願の米国実用新案出願第12/076,348号(米国特許出願公開第:20080243398);2009年8月4日出願のPCT出願第PCT/US09/52730号(PCT公開第WO/2010/017214号);2010年9月30日出願のPCT出願第PCT/US10/050824号(PCT公開第WO/2011/041485号)、2011年5月18日出願の米国実用新案出願第13/110,685号、および2012年10月3日出願のPCT出願第PCT/US12/58578号を参照する。これらの特許は、その全体が参照により本明細書に組み込まれる。本出願において使用される語彙のいくつかは、これらの参考文献にその前例を有し得る。本明細書に記載の概念のいくつかは、これらの参考文献に見いだされる概念に照らして、よりよく理解することができる。
浮動性胎児DNAを含む母系の血液のスクリーニング
本明細書に記載の方法を用いて、標的の遺伝物質が、ある量の他の遺伝物質の存在下で見いだされる、子、胎児または他の標的個体の遺伝子型の決定を補助することができる。いくつかの実施形態では、遺伝子型とは、1個または複数個の染色体の倍数性状態を指してもよく、1つまたは複数の疾患連鎖対立遺伝子またはそのいくつかの組み合わせを指してもよい。本開示では、考察は、胎児DNAが母系の血液中に見いだされる場合に胎児の遺伝子の状態を決定することに焦点が当てられるが、この例は、この方法を適用することができる可能性のある状況に限定することを示していない。さらに、前記方法は、標的DNAの量が非標的DNAに対していかなる割合で存在する場合にも適用可能であり、例えば、標的DNAは、存在するDNAの0.000001%から99.999999%の間のいずれを構成してもよい。さらに、非標的DNAは、関連性のある非標的個体(複数可)の一部または全部からの遺伝子データが既知である限りは、必ずしも1つの個体由来である必要はなく、さらには関連する個体由来である必要はない。ある実施形態では、本明細書に開示されている方法を用いて、胎児DNAを含有する母系の血液から胎児の遺伝子型データを決定することができる。前記方法は、妊娠中の女性の子宮内に複数の胎児がいる場合、または他の混入DNA、例えば、他の既に生まれている同胞由来のDNAが試料に存在する可能性がある場合にも用いることができる。
この技法は、胎児の血液細胞が胎盤絨毛を通じて母系の循環に進入する現象を用いることができる。普通は、胎児の細胞の非常に少数のみが、このように母系の循環に入る(胎児母体間出血についてのKleihauer−Betke検査で陽性になるには不十分である)。胎児の細胞を選別し、さまざまな技法によって解析して特定のDNA配列を探すことができるが、侵襲的手順が本質的に有するリスクは伴わない。この技法は、問題の胎盤組織が胎児と同じ遺伝子型のDNAを含有する場合、胎盤組織のアポトーシス後のDNA放出によって浮動性胎児DNAが母系の循環に進入する現象も用いることができる。母系の血漿中に見いだされる浮動性DNAは、30〜40%の胎児DNAと同程度の割合で胎児DNAを含有することが示されている。
ある実施形態では、血液を妊娠中の女性から抜き取ることができる。研究により、母系の血液は、母体起源の浮動性DNAに加えて、胎児由来の少量の浮動性DNAを含有し得ることが示された。さらに、母体起源の多くの血液細胞に加えて、胎児起源のDNAを含む脱核胎児血液細胞も存在してよく、これは、一般には、核DNAを含有しない。胎児DNAを単離するまたは胎児DNAが富化された画分を作製するための当技術分野で公知の多くの方法が存在する。例えば、クロマトグラフィーにより、胎児DNAが富化された特定の画分が作製されることが示されている。
比較的非侵襲的に抜き取られ、ある量の胎児DNAを、細胞性または浮動性のいずれかで、その母系DNAに対する割合に富化されて、またはその元の比率のいずれかで含有する母系の血液、血漿または他の体液の試料を手にしたら、前記試料中に見いだされるDNAの遺伝子型を決定することができる。いくつかの実施形態では、血液は、血液を静脈、例えば、尺側皮静脈から回収するための針を使用して抜き取ることができる。本明細書に記載の方法を用いて、胎児の遺伝子型データを決定することができる。例えば、前記方法を用いて、1個または複数個の染色体における倍数性状態を決定することができ、前記方法を用いて、挿入、欠失、および転座を含め、1つのSNPまたはSNPの集合の同一性を決定することができる。前記方法を用いて、1個または複数個の遺伝子型の形体の起源である親を含めた1個または複数個のハプロタイプを決定することができる。
この方法は、任意の遺伝子型決定および/または配列決定方法、例えば、ILLUMINA INFINIUM ARRAYプラットフォーム、AFFYMETRIX GENECHIP、ILLUMINA GENOME ANALYZERまたはLIFE TECHNOLGIES’ SOLID SYSTEMに使用することができる任意の核酸を用いて機能する点に留意されたい。これは、血漿から抽出された浮動性DNAまたはその増幅物(例えば、全ゲノム増幅、PCR);他の細胞型(例えば、全血由来のヒトリンパ球)由来のゲノムDNAまたはその増幅物を含む。DNAを調製するために、これらのプラットフォームのうちの1つに適したゲノムDNAを生成する任意の抽出または精製方法も同様に機能する。この方法は、RNAの試料を用いて同等に良好に機能し得る。ある実施形態では、試料の保管は、分解が最小限になるように行ない得る(例えば、約−20℃またはそれよりも低い温度で凍結下)。
親支援
いくつかの実施形態は、PARENTAL SUPPORT(商標)(PS)法と組み合わせて用いることができ、PARENTAL SUPPORT(商標)(PS)法の複数の実施形態は、その全体が参照により本明細書に組み込まれる、米国特許出願第11/603,406号(米国特許出願公開第20070184467号)、米国特許出願第12/076,348号(米国特許出願公開第20080243398号)、米国特許出願第13/110,685号、PCT出願第PCT/US09/52730号(PCT公開第WO/2010/017214号)、およびPCT出願第PCT/US10/050824号(PCT公開第WO/2011/041485号)に記載されている。これらの特許は、その全体が参照により本明細書に組み込まれる。PARENTAL SUPPORT(商標)は、遺伝子データを解析するために使用することができる、インフォマティクスに基づく手法である。いくつかの実施形態では、本明細書に開示されている方法は、PARENTAL SUPPORT(商標)法の一部とみなすことができる。いくつかの実施形態では、PARENTAL SUPPORT(商標)法は、標的個体の遺伝子データを高い正確度で、その個体由来の1つまたは少数の細胞の遺伝子データ、または標的個体由来のDNAおよび1個または複数個の他の個体由来のDNAからなるDNAの混合物の遺伝子データを決定するため、詳細には、標的個体における疾患関連対立遺伝子、他の対象の対立遺伝子、および/または1個または複数個の染色体の倍数性状態を決定するために使用することができる方法の集合である。PARENTAL SUPPORT(商標)とは、これらの方法のいずれも指し得る。PARENTAL SUPPORT(商標)は、インフォマティクスに基づく方法の例である。PARENTAL SUPPORT(商標)法の代表的実施形態は、図29〜31Gに図示され、また、実験19に記載されている。
PARENTAL SUPPORT(商標)法では、既知の親の遺伝子データ、すなわち母親および/または父親のハプロタイプおよび/または二倍体の遺伝子データを、減数分裂の機構および標的DNAの不完全な測定、および場合によっては1つまたは複数の関連する個体の知見と共に、集団に基づく乗換え頻度と一緒に、インシリコで、複数の対立遺伝子における遺伝子型、および/または胚または任意の標的細胞(複数可)の倍数性状態、および重要な遺伝子座に対して位置を決める標的DNAを高い程度の信頼度で再構築するために使用する。PARENTAL SUPPORT(商標)法により、不十分に測定された一塩基多型(SNP)だけでなく、挿入および欠失、ならびに全く測定されなかったSNPまたはDNAの全領域も再構築することができる。さらに、PARENTAL SUPPORT(商標)法により、単一細胞から、複数の疾患連鎖遺伝子座の測定ならびに異数性についてのスクリーニングの両方を行うことができる。いくつかの実施形態では、PARENTAL SUPPORT(商標)法を用いて、1個または複数個の細胞の遺伝子の状態を決定するために、IVFサイクルの間に生検された胚由来の1個または複数個の細胞を特徴付けることができる。
PARENTAL SUPPORT(商標)法により、ノイズを伴う遺伝子データをクリーニングすることが可能になる。これは、関連する個体(親)の遺伝子型を参照として用いて、標的ゲノム(胚)における正確な遺伝子の対立遺伝子を推定することによって行ない得る。PARENTAL SUPPORT(商標)は、少量の遺伝物質しか利用可能でない場合(例えば、PGD)、および遺伝物質の量が限られていることに起因して遺伝子型の直接的な測定が本質的にノイズを伴う場合に特に適し得る。PARENTAL SUPPORT(商標)は、利用可能な遺伝物質のごく一部のみが標的個体由来である場合(例えば、NPD)、および別の個体由来の混入DNAシグナルに起因して遺伝子型の直接的な測定が本質的にノイズを伴う場合に特に適し得る。PARENTAL SUPPORT(商標)法により、従来の順序づけられていない二倍体測定値は対立遺伝子のドロップアウト、ドロップイン、可変性の増幅の偏りおよび他のエラーの率が高いことによって特徴付けることができるが、胚上に非常に正確な規則正しい二倍体の対立遺伝子配列を、染色体セグメントのコピー数と共に再構築することができる。前記方法では、基礎をなす遺伝子モデルおよび基礎をなす測定エラーのモデルの両方を使用することができる。遺伝子モデルにより、各SNPにおける対立遺伝子の確率およびSNP間の乗換え確率の両方を決定することができる。対立遺伝子の確率は、各SNPにおいて親から得られたデータに基づいてモデリングすることができ、International HapMap Projectにより開発されたHapMapデータベースから得られたデータに基づいてSNP間の乗換え確率をモデリングすることができる。適切な基礎をなす遺伝子モデルおよび測定エラーモデルを考慮すると、最大事後(MAP)推定を、計算的に効率的にするための改変を伴って用いて、正確な、胚の各SNPにおける規則正しい対立遺伝子値を推定することができる。
上で概説した技法により、いくつかの場合には、個体の遺伝子型を、その個体に由来する非常に少量のDNAを考慮して決定することができる。これは、1つまたは少数の細胞由来のDNAであってよい、または、母系の血液中に見いだされる少量の胎児DNA由来であってよい。
仮説
本開示との関連において、仮説とは、可能性のある遺伝子の状態を指す。仮説とは、可能性のある倍数性状態を指し得る。仮説とは、可能性のある対立遺伝子の状態を指し得る。仮説の集合とは、可能性のある遺伝子の状態の集合、可能性のある対立遺伝子の状態の集合、可能性のある倍数性状態の集合、またはそれらの組み合わせを指し得る。いくつかの実施形態では、仮説の集合は、集合からの1つの仮説が、任意の所与の個体の実際の遺伝子の状態に対応するように設計することができる。いくつかの実施形態では、仮説の集合は、あらゆる可能性のある遺伝子の状態が、集合からの少なくとも1つの仮説によって記載することができるように設計することができる。本開示のいくつかの実施形態では、方法の一態様は、どの仮説が問題の個体の実際の遺伝子の状態に対応するかを決定することである。
本開示の別の実施形態では、1つのステップは仮説を作製するステップを包含する。いくつかの実施形態では、仮説は、コピー数仮説であってよい。いくつかの実施形態では、仮説は、関連する個体のそれぞれ由来のどの染色体のセグメントが、もしあれば、他の関連する個体のどのセグメントに遺伝的に対応するかに関する仮説を包含する。仮説を作製することとは、変数の限度を、考慮中の可能性のある遺伝子の状態の全集合がそれらの変数に包含されるように設定する行為を指し得る。
「コピー数仮説」は、「倍数性仮説」または「倍数性状態仮説」とも称され、標的個体における所与の染色体コピー、染色体型または染色体のセクションについての可能性のある倍数性状態に関する仮説を指し得る。これは、個体の2種以上の染色体型における倍数性状態を指す場合もある。コピー数仮説の集合とは、仮説の集合を指してもよく、各仮説は、個体における可能性のある異なる倍数性状態に対応する。仮説の集合は、可能性のある倍数性状態の集合、可能性のある親のハプロタイプの寄与の集合、混合試料中の可能性のある胎児DNAの百分率の集合、またはそれらの組み合わせに関するものであってもよい。
正常な個体は、各親由来の各染色体型のうちの1つを含有する。しかし、減数分裂および有糸分裂におけるエラーに起因して、個体が、各親由来の所与の染色体型を0個、1個、2個、またはそれより多くを有する可能性がある。実際には、親由来の所与の染色体が3つ以上認められることはまれである。本開示では、いくつかの実施形態では、所与の染色体の0コピー、1コピーまたは2コピーが親に由来する、可能性のある仮説のみを考慮し、親を起源とするいくらか可能性のあるコピーを考慮することは自明の拡張である。いくつかの実施形態では、所与の染色体に対して、可能性のある仮説が9つある:母体起源の0個の染色体、1個の染色体または2個の染色体に関する3つの可能性のある仮説に父系起源の0個の染色体、1個の染色体または2個の染色体に関する3つの可能性のある仮説を掛け合わせたもの。(m,f)を、mが母親から遺伝によって受け継がれた所与の染色体の数であり、およびfが父親から遺伝によって受け継がれた所与の染色体の数である仮説を指すものとする。したがって、9つの仮説は、(0、0)、(0、1)、(0、2)、(1、0)、(1、1)、(1、2)、(2、0)、(2、1)、および(2、2)である。これらは、H00、H01、H02、H10、H12、H20、H21、およびH22と記載することもできる。.異なる仮説は、異なる倍数性状態に対応する。例えば、(1、1)とは、通常のダイソミー染色体を指し、(2、1)とは、母系トリソミーを指し、(0、1)とは、父系モノソミーを指す。いくつかの実施形態では、2つの染色体が一方の親から遺伝によって受け継がれ、1つの染色体が他方の親から遺伝によって受け継がれる場合は、2つの場合にさらに分けられ得る:2つの染色体が同一である場合(一致コピーエラー)と、2つの染色体が相同であるが同一ではない場合(不一致コピーエラー)。これらの実施形態では、可能性のある仮説が16ある。他の仮説の集合、および異なる数の仮説を使用することが可能であることが理解されるべきである。
本開示のいくつかの実施形態では、倍数性仮説とは、他の関連する個体由来の染色体のいずれが、標的個体のゲノムに見いだされる染色体に対応するかに関する仮説を指す。いくつかの実施形態では、方法の鍵となるのは、関連する個体がハプロタイプブロックを共有することが予測され得るという事実であり、関連する個体から測定された遺伝子データを、どのハプロタイプブロックが標的個体と関連する個体との間で一致するかの知見と一緒に用いると、標的個体の遺伝子測定値を単独で用いるよりも高い信頼度で標的個体についての正確な遺伝子データを推論することが可能である。従って、いくつかの実施形態では、倍数性仮説は、染色体の数だけでなく、関連する個体のどの染色体が、標的個体の1個または複数個の染色体と同一またはほぼ同一であるかに関し得る。
仮説の集合が定義されたら、アルゴリズムが入力遺伝子データに対して作動すると、考慮中の仮説のそれぞれについて、決定された統計学的な確率が出力され得る。種々の仮説の確率は、種々の仮説のそれぞれについて、専門技法、アルゴリズム、および/または本開示の他の箇所に記載されている方法のうちの1つまたは複数により示された確率が等しい値を、関連性のある遺伝子データを入力として用いて数学的に算出することによって決定することができる。
複数の技法によって決定された通り、異なる仮説の確率が推定されたら、それらを組み合わせることができる。これは、各仮説について、各技法によって決定された確率を掛け算することを必要とし得る。仮説の確率の積を正規化することができる。1つの倍数性仮説は、染色体についての1つの可能性のある倍数性状態を指す。
「確率の組み合わせ」プロセスは、「仮説の組み合わせ」または専門技法の結果の組み合わせとも称され、線形代数の当業者によく知られているはずの概念である。1つの可能性のある確率の組み合わせ方は以下の通りである:専門技法を用いて、遺伝子データの集合を考慮して仮説の集合を評価する場合、方法の出力は、仮説の集合内の各仮説と1対1で関連する確率の集合である。そのそれぞれが集合内の仮説のうちの1つと関連づけられる、第1の専門技法によって決定された確率の集合を、そのそれぞれが同じ仮説の集合と関連づけられる、第2の専門技法によって決定された確率の集合と組み合わせる場合、確率の2つの集合を掛け算する。これは、集合内の各仮説について、2つの専門方法によって決定された、その仮説と関連づけられる2つの確率を掛け合わせ、対応する積が出力確率であることを意味する。このプロセスは、任意の数の専門技法に拡大することができる。ただ1つの専門技法を用いる場合、出力確率は入力確率と同じである。3つ以上の専門技法を用いる場合、関連性のある確率を同時に掛け算することができる。積は、仮説の集合内の仮説の確率が合計で100%になるように正規化することができる。
いくつかの実施形態では、所与の仮説についての複合確率が他の仮説のいずれかについての複合確率を超える場合、その仮説が、最も可能性が高いと決定されるとみなすことができる。いくつかの実施形態では、正規化された確率が閾値を超えた場合、仮説を、最も可能性が高いと決定することができ、倍数性状態または他の遺伝子の状態をコールすることができる。ある実施形態では、これは、その仮説に関連づけられる染色体の数および同一性を、倍数性状態としてコールすることができることを意味し得る。ある実施形態では、これは、その仮説に関連づけられる対立遺伝子の同一性を、対立遺伝子の状態としてコールすることができることを意味し得る。いくつかの実施形態では、閾値は、約50%から約80%の間であり得る。いくつかの実施形態では、閾値は、約80%から約90%の間であり得る。いくつかの実施形態では、閾値は、約90%から約95%の間であり得る。いくつかの実施形態では、閾値は、約95%から約99%の間であり得る。いくつかの実施形態では、閾値は、約99%から約99.9%の間であり得る。いくつかの実施形態では、閾値は、約99.9%超であり得る。
親の状況
親の状況とは、標的の2体の親の一方または両方についての、2つの関連性のある染色体のそれぞれの所与の対立遺伝子の遺伝子の状態を指す。ある実施形態では、親の状況とは、標的の対立遺伝子の状態を指すのではなく、親の対立遺伝子の状態を指すことに留意されたい。所与のSNPについての親の状況は、父系の2つと母系の2つの、4塩基対からなってよく、これらは互いに同じであってよい、または異なってよい。「m|f」と書くことが一般的であり、ここでmおよびmは、2つの母系染色体上の所与のSNPの遺伝子の状態であり、fおよびfは2つの父系染色体上の所与のSNPの遺伝子の状態である。いくつかの実施形態では、親の状況は、「f|m」と書くことができる。下付き文字の「1」および「2」は、第1の染色体および第2の染色体の所与の対立遺伝子における遺伝子型を示すことに留意されたい。どの染色体を「1」とし、どの染色体を「2」とするかの選択は任意であることにも留意されたい。
本開示では、塩基対の同一性を一般的に示すために、多くの場合、AおよびBを使用することに留意されたい;AまたはBは、C(シトシン)、G(グアニン)、A(アデニン)またはT(チミン)を同等に上手く示すことができる。例えば、所与のSNPに基づく対立遺伝子において、母親の遺伝子型が1つの染色体上のそのSNPにおいてTであり、相同染色体上のそのSNPにおいてGであり、その対立遺伝子における父親の遺伝子型が、相同染色体の両方のそのSNPにおいてGであった場合、標的個体の対立遺伝子が親の状況AB|BBを有するということができ、対立遺伝子が親の状況AB|AAを有するということもできる。理論上、4種の可能性のあるヌクレオチドはいずれも所与の対立遺伝子に存在してもよく、したがって、例えば、所与の対立遺伝子において母親が遺伝子型ATを有し、父親が遺伝子型GCを有する可能性があることに留意されたい。しかし、経験的なデータにより、ほとんどの場合、所与の対立遺伝子において4種の可能性のある塩基対のうち2種のみが観察されることが示されている。例えば、単一のタンデム反復を用いた場合、2超、4超、さらには10超の親の状況を有する可能性がある。本開示の考察では、所与の対立遺伝子において2種の可能性のある塩基対のみが観察されると仮定するが、本明細書に開示されている実施形態は、この仮定が当てはまらない場合を考慮に入れるように改変することができる。
「親の状況」とは、同じ親の状況を有する標的SNPの集合またはサブセットを指し得る。例えば、標的個体の所与の染色体上の1000個の対立遺伝子を測定する場合、状況AA|BBとは、標的の母親の遺伝子型がホモ接合性であり、標的の父親の遺伝子型がホモ接合性であるが、その遺伝子座における母系の遺伝子型と父系の遺伝子型が同様でない、1,000個の対立遺伝子群内の全ての対立遺伝子の集合を示し得る。親のデータについて相が特定されない、したがって、AB=BAである場合は、可能性のある親の状況は9ある:AA|AA、AA|AB、AA|BB、AB|AA、AB|AB、AB|BB、BB|AA、BB|AB、およびBB|BB。親のデータについて相が特定される、したがって、AB≠BAである場合は、可能性のある異なる親の状況が16ある:AA|AA、AA|AB、AA|BA、AA|BB、AB|AA、AB|AB、AB|BA、AB|BB、BA|AA、BA|AB、BA|BA、BA|BB、BB|AA、BB|AB、BB|BA、およびBB|BB。性染色体上の一部のSNPを除いて、染色体上のあらゆるSNP対立遺伝子が、これらの親の状況のうちの1つを有する。一方の親についての親の状況がヘテロ接合性であるSNPの集合は、ヘテロ接合性の状況と称することができる。
NPDにおける親の状況の使用
非侵襲的な出生前診断は、非侵襲的に、例えば、妊娠中の母親に対する採血によって得られる遺伝物質から胎児の遺伝子の状態を決定するために用いることができる重要な技法である。血液を分離し、血漿単離し、その後血漿DNAを単離することができる。サイズ選択を用いて、適切な長さのDNAを単離することができる。DNAを遺伝子座の集合において優先的に富化することができる。次いで、このDNAを、遺伝子型決定アレイにハイブリダイズさせ、蛍光を測定することによって、またはハイスループットシーケンサーでシークエンシングによる、いくつもの手段によって測定することができる。
非侵襲的な出生前診断との関連において胎児の倍数性コールのために配列決定を使用する場合、配列データを使用するいくつもの方法がある。配列データを使用することができる最も一般的な方法は、単に所与の染色体にマッピングされるリード数をカウントすることである。例えば、胎児の第21染色体の倍数性状態を決定しようとすると考える。さらに、試料中のDNAの10%が胎児起源のDNAで構成され、90%が母体起源のDNAで構成されると考える。この場合、ダイソミーであることが予測され得る染色体、例えば、第3染色体のリードの平均の数を調べ、それを、リードを独特の配列の一部である染色体上の塩基対の数について調整した第21染色体上のリード数と比較する。胎児が正倍数性であった場合、ゲノムの単位当たりのDNAの量は全ての場所においてほぼ同等であることが予想される(確率的変動を受けやすい)。他方では、胎児が第21染色体においてトリソミーであった場合、第21染色体由来の遺伝単位当たりのDNAがゲノムの他の場所よりもわずかに多いことが予想される。詳細には、混合物中の第21染色体由来のDNAが約5%多いことが予想される。配列決定を使用してDNAを測定する場合、独特のセグメント当たりの第21染色体由来の独自にマッピング可能なリードが他の染色体由来のものよりも約5%多いことが予想される。ある特定の閾値よりも多い量の特定の染色体由来のDNAの観察を、その染色体に独自にマッピング可能な配列の数について調整した場合に、異数性を診断するための基礎として使用することができる。異数性を検出するために使用することができる別の方法は、親の状況を考慮に入れることができること以外は上記のものと同様である。
どの対立遺伝子を標的とするかを考える際、一部の親の状況が、他よりも情報価値がある可能性がある尤度を考慮に入れることができる。例えば、AA|BBおよび対称の状況BB|AAでは、胎児が母親とは異なる対立遺伝子を保有することが既知であるので、最も情報価値のある状況である。対称性の理由で、AA|BB状況とBB|AA状況はどちらもAA|BBと称することができる。情報価値のある親の状況の別の集合はAA|ABおよびBB|ABであり、これは、これらの場合、胎児が、母親が有さない対立遺伝子を保有する見込みが50%であるからである。対称性の理由で、AA|AB状況とBB|AB状況はどちらも、AA|ABと称することができる。情報価値のある親の状況の第3の集合はAB|AAおよびAB|BBであり、これは、これらの場合、胎児が既知の父系対立遺伝子を保有し、その対立遺伝子が母系ゲノムにも存在するからである。対称性の理由で、AB|AA状況とAB|BB状況は、AB|AAと称することができる。第4の親の状況はAB|ABであり、ここでは胎児は未知の対立遺伝子の状態を有し、対立遺伝子の状態がいかなるものでも、それは、母親が同じ対立遺伝子を有するものである。第5の親の状況はAA|AAであり、ここでは母親および父親がヘテロ接合性である。
ここで開示されている実施形態の異なる実行
標的個体の倍数性状態を決定するための方法が本明細書に開示されている。標的個体は、割球、胚または胎児であってよい。本開示のいくつかの実施形態では、標的個体における1個または複数個の染色体の倍数性状態を決定するための方法は、本文書に記載のステップのいずれか、およびそれらの組み合わせを包含し得る:
いくつかの実施形態では、胎児の遺伝子の状態を決定することにおいて使用する遺伝物質の供給源は、母系の血液から単離された胎児有核赤血球などの胎児の細胞であってよい。前記方法は、妊娠中の母親由来の血液試料を得るステップを包含し得る。前記方法は、視覚的な技法を用いて、色の特定の組み合わせは有核赤血球と独自に関連づけられ、色の同様の組み合わせは母系の血液中に存在する任意の他の細胞には関連づけられないというアイデアに基づいて胎児の赤血球を単離するステップを包含し得る。有核赤血球に関連づけられる色の組み合わせは、染色することによってより区別可能にすることができる核の周りのヘモグロビンの赤色、および、例えば青色に染色することができる核材料の色を含んでよい。母系の血液から細胞を単離し、それをスライドに広げ、次いで、赤色(ヘモグロビン由来)と青色(核材料由来)の両方が認められる点を同定することにより、有核赤血球の場所を同定することが可能となり得る。次いで、これらの有核赤血球を、マイクロマニピュレーターを使用して抽出し、遺伝子型決定および/または配列決定技法を用いて、これらの細胞の遺伝物質の遺伝子型の態様を測定することができる。
ある実施形態では、胎児のヘモグロビンの存在下でのみ蛍光を発し、母系のヘモグロビンの存在下では蛍光を発しない色素を用いて有核赤血球を染色し、したがって、有核赤血球が、母親に由来するかまたは胎児に由来するかの多義性を除くことができる。本開示のいくつかの実施形態は、染色または他の方法で核材料に印をつけることを伴ってよい。本開示のいくつかの実施形態は、胎児の細胞に特異的な抗体を使用して胎児核材料に特異的に印をつけることを伴ってよい。
胎児の細胞を母系の血液から単離するため、または胎児DNAを母系の血液から単離するため、または母系遺伝物質の存在下で胎児の遺伝物質の試料を富化するための多くの方法がある。これらの方法のいくつかがここに列挙されているが、これは網羅的な列挙を意図したものではない。便宜上、一部の適切な技法がここに列挙されている:蛍光で、または別の方法でタグを付けた抗体、サイズ排除クロマトグラフィー、磁気で、または他の方法で標識したアフィニティータグ、後成的な差異、例えば、特定の対立遺伝子における母系の細胞と胎児の細胞の間の示差的なメチル化、密度勾配遠心分離に続くCD45/14枯渇およびCD45/14陰性細胞からのCD71陽性選択、異なる重量オスモル濃度を用いた一重または二重のPercoll勾配またはガラクトース特異的レクチン法。
本開示のある実施形態では、標的個体は胎児であり、胎児由来の複数のDNA試料に対して異なる遺伝子型測定を行う。本開示のいくつかの実施形態では、胎児DNA試料は単離された胎児の細胞由来であり、その胎児の細胞は、母系の細胞と混在している可能性がある。本開示のいくつかの実施形態では、胎児DNA試料は浮動性胎児DNA由来であり、その胎児DNAは、浮動性母系DNAと混在している可能性がある。いくつかの実施形態では、胎児DNA試料は、母系DNAと胎児DNAの混合物を含有する母系の血漿または母系の血液から得ることができる。いくつかの実施形態では、胎児DNAは、母系DNAと、99.9:0.1%〜99:1%;99:1%〜90:10%;90:10%〜80:20%;80:20%〜70:30%;70:30%〜50:50%;50:50%〜10:90%;または10:90%〜1:99%;1:99%〜0.1:99.9%、の範囲の母体:胎児比で混在している可能性がある。
標的個体および/または関連する個体の遺伝子データは、これらに限定されないが、遺伝子型決定マイクロアレイ、およびハイスループット配列決定を含めた群から選択されるツールおよび、または技法を用いて適切な遺伝物質を測定することによって、分子的状態から電子的状態に変換することができる。いくつかのハイスループット配列決定方法としては、サンガーDNA配列決定、パイロシークエンシング、ILLUMINA SOLEXAプラットフォーム、ILLUMINAのGENOME ANALYZERまたはAPPLIED BIOSYSTEMの454配列決定プラットフォーム、HELICOSのTRUE SINGLE MOLECULE SEQUENCINGプラットフォーム、HALCYON MOLECULARの電子顕微鏡配列決定法または任意の他の配列決定法が挙げられる。これらの方法は全て、DNAの試料に保存されている遺伝子データを、一般には、途中でメモリデバイスに保存されて加工される遺伝子データの集合に物理的に変換する。
関連性のある個体の遺伝子データは、これらに限定されないが、個体のバルク二倍体組織、個体由来の1個または複数個の二倍体細胞、個体由来の1個または複数個の一倍体細胞、標的個体由来の1個または複数個の割球、個体において見いだされる細胞外遺伝物質、母系の血液中に見いだされる個体由来の細胞外遺伝物質、母系の血液中に見いだされる個体由来の細胞、関連する個体由来の配偶子(複数可)から作製される1個または複数個の胚、そのような胚から取得した1個または複数個の割球、関連する個体において見いだされる細胞外遺伝物質、関連する個体を起源とすることが既知である遺伝物質、およびそれらの組み合わせを含めた群から選択される物質を分析することによって測定することができる。
いくつかの実施形態では、標的個体の対象の染色体型のそれぞれについて、少なくとも1つの倍数性状態仮説の集合を作製することができる。倍数性状態仮説はそれぞれ、標的個体の染色体または染色体セグメントの1つの可能性のある倍数性状態を指し得る。仮説の集合は、標的個体の染色体が有すると予測することができる、可能性のある倍数性状態の一部または全部を含んでよい。可能性のある倍数性状態のいくつかは、零染色体性、モノソミー、ダイソミー、片親性ダイソミー、正倍数性、トリソミー、一致トリソミー、不一致トリソミー、母系トリソミー、父系トリソミー、テトラソミー、平衡(2:2)テトラソミー、不平衡(3:1)テトラソミー、ペンタソミー、ヘキサソミー、他の異数性、およびそれらの組み合わせを含んでよい。これらの異数性状態はいずれも、混在していてよい、または、部分的な異数性、例えば、不平衡転座、平衡転座、ロバートソン転座、組換え、欠失、挿入、乗換え、およびそれらの組み合わせであってよい。
いくつかの実施形態では、決定された倍数性状態の知見を使用して、臨床的決定を行うことができる。この知見は、一般には、事項の物理的配列としてメモリデバイスに保存され、次いで、報告に変換することができる。次いで、報告は実行され得る。例えば、臨床的決定は、妊娠中絶することであってよい、あるいは、臨床的決定は、妊娠を継続することであってよい。いくつかの実施形態では、臨床的決定は、遺伝的障害の表現型の発現の重症度を低下させるために設計された介入、または特別支援児(special needs child)に対する準備をするための関連性のあるステップを取る決定を伴ってよい。
本開示のある実施形態では、本明細書に記載の任意の方法は、複数の標的が、同じ標的個体、例えば、同じ妊娠中の母親からの複数の採血に由来することを可能にするために改変することができる。これにより、複数の遺伝子測定によって標的遺伝子型を決定することができるより多くのデータがもたらされ得るので、モデルの正確度を改善することができる。ある実施形態では、1つの標的遺伝子データの集合は、報告された一次データとしての機能を果たし、他の標的遺伝子データの集合は、一次標的遺伝子データを再確認するためのデータとしての機能を果たす。ある実施形態では、標的個体から取得した遺伝物質からそれぞれ測定された複数の遺伝子データの集合を並行して考慮し、したがって、両方の標的遺伝子データの集合は、高い正確度で測定された親の遺伝子データのどのセクションが胎児のゲノムを構成するかを決定するための助けとして機能する。
ある実施形態では、前記方法を、父子試験のために使用することができる。例えば、母親から、および遺伝学的父親である、またはそうでない可能性がある男性からのSNPに基づく遺伝子型の情報ならびに混合試料から測定された遺伝子型の情報を考慮すると、その男性の遺伝子型の情報が実際に妊娠中の胎児の実際の遺伝学的父親を表しているかどうかを決定することが可能である。これを行うための単純な方法は、単に、母親がAAであり、可能性のある父親がABまたはBBである状況について検査することである。これらの場合、それぞれ、父親が2分の1回(AA|AB)または常に(AA|BB)寄与することを予想することができる。予測ADOを考慮に入れると、観察される胎児のSNPが、可能性のある父親のSNPと相関するかどうかを決定することは簡単である。
本開示の一実施形態は以下の通りであってよい:妊娠中の女性が、自身の胎児がダウン症候群を患っているかどうか、および/または嚢胞性線維症を患っているかどうか知ることを望んでおり、その女性はこれらの状態のいずれかを患っている子を産むことを望んでいない。医師はその女性の血液を採り、ヘモグロビンを1つのマーカーではっきり赤色があらわれるように染色し、核材料を別のマーカーではっきり青色があらわれるように染色する。母系の赤血球は、一般には無核であるが、高い割合の胎児の細胞が核を含有することが公知であるので、医師は、赤色および青色の両方を示す細胞を同定することにより、いくつもの有核赤血球を視覚的に単離することができる。医師は、これらの細胞を、マイクロマニピュレーターでスライドから取り出し、検査室に送り、そこで10個の個々の細胞を増幅し、遺伝子型決定する。遺伝子測定を使用することによって、PARENTAL SUPPORT(商標)法で、細胞10個のうち6個が母系の血液細胞であり、細胞10個のうち4個が胎児の細胞であることを決定することができる。妊娠中の母親に既に子が生まれている場合、PARENTAL SUPPORT(商標)は、胎児の細胞に対して信頼できる対立遺伝子コールを行い、それらが生まれた子の対立遺伝子と同様でないことを示すことによって、胎児の細胞が生まれた子の細胞と別個のものであることを決定するためにも使用することができる。この方法は、本開示の父系検査実施形態と同様の概念であることに留意されたい。胎児の細胞から測定された遺伝子データは質が非常に悪い可能性があり、単一細胞の遺伝子型決定の難しさに起因して、多くの対立遺伝子ドロップアウトを含む。臨床医は、測定された胎児DNAを親の信頼できるDNA測定値と一緒に用い、PARENTAL SUPPORT(商標)を使用して胎児のゲノムの態様を高い正確度で推定し、それにより、胎児由来の遺伝物質に含有される遺伝子データを、コンピュータ上に保存される、予測される胎児の遺伝子の状態に変換することができる。臨床医は、胎児の倍数性状態と、複数の疾患連鎖対象遺伝子の存在または不在の両方とを決定することができる。胎児は正倍数性であり、嚢胞性線維症の保有者ではないことが分かり、母親は妊娠を継続することを決定する。
本開示のある実施形態では、妊娠中の母親は、自身の胎児がいずれかの全染色体異常を患っているかどうかを決定することを望んでいる。その女性は担当医師の所に行き、自身の血液の試料を提供し、また、その女性とその女性の夫は、頬スワブにより自身のDNAの試料を提供する。検査室の研究者は、親のDNAを増幅するためのMDAプロトコールを使用し、多数のSNPにおける親の遺伝子データを測定するためのILLUMINA INFINIUMアレイを使用して、親のDNAの遺伝子型決定を行う。次いで、研究者は血液を遠心沈澱し、血漿を採り、サイズ排除クロマトグラフィーを使用して浮動性DNAの試料を単離する。あるいは、研究者は、1個または複数個の蛍光抗体、例えば、胎児のヘモグロビンに特異的な抗体を使用して、胎児有核赤血球を単離する。次いで、研究者は、単離または富化された胎児の遺伝物質を取得し、それを、各オリゴヌクレオチドの2つの末端が標的対立遺伝子のいずれかの側の隣接配列に対応するように適切に設計された70−マー(mer)のオリゴヌクレオチドのライブラリーを使用して増幅する。ポリメラーゼ、リガーゼ、および適切な試薬を添加すると、オリゴヌクレオチドはギャップ充填環状化、所望の対立遺伝子の捕捉を受けた。エキソヌクレアーゼを加え、熱失活させ、産物を直接PCR増幅の鋳型として使用した。PCR産物について、ILLUMINA GENOME ANALYZERで配列決定した。シーケンスリードをPARENTAL SUPPORT(商標)法のための入力として使用し、次いで、それにより胎児の倍数性状態を予測した。
別の実施形態では、母親が妊娠中であり、高齢出産である夫婦が、妊娠中の胎児がダウン症候群、ターナー症候群、プラダーウィリー症候群またはいくつかの他の全染色体異常を有するかどうかを知ることを望んでいる。産科医は、母親および父親から採血を行う。血液を検査室に送り、そこで、技師が母体試料を遠心分離して血漿およびバフィーコートを単離する。バフィーコート内のDNAおよび父系の血液試料を増幅によって変換し、増幅された遺伝物質にコードされる遺伝子データを、遺伝物質をハイスループットシーケンサーにかけることによって、分子的に保存された遺伝子データから電子的に保存された遺伝子データにさらに変換して、親の遺伝子型を測定する。血漿試料を、5,000プレックスヘミネステッド標的PCR法を用いて、遺伝子座の集合において優先的に富化する。DNA断片の混合物を、配列決定に適したDNAライブラリーに調製する。次いで、DNAを、ハイスループット配列決定方法、例えば、ILLUMINA GAIIx GENOME ANALYZERを用いて配列決定する。配列決定により、DNA内に分子的にコードされている情報をコンピュータハードウェアに電子的にコードされる情報に変換する。ここで開示されている実施形態を含むインフォマティクスに基づく技法、例えば、PARENTAL SUPPORT(商標)を使用して、胎児の倍数性状態を決定することができる。これは、調製された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子数の確率をコンピュータで算出するステップと、それぞれが、染色体における可能性のある異なる倍数性状態に関連する、複数の倍数性仮説をコンピュータで作製するステップと、各倍数性仮説について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数についての同時分布モデルをコンピュータで構築するステップと、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、倍数性仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールするステップとを包含し得る。胎児がダウン症候群を有することが決定される。報告を印刷する、または妊娠中の女性の担当産科医に電子的に送信し、その産科医が診断をその女性に伝達する。その女性、その女性の夫、および医師は腰を据えて選択肢を議論する。夫婦は、胎児がトリソミーの状態を患っているという知見に基づいて、妊娠中絶することを決定する。
ある実施形態では、企業が、母系の採血から妊娠中の胎児における異数性を検出するために設計された診断技術を提供することを決定し得る。その産物により、母親が、該母親の血液を採取することができる担当産科医に来診することを必要とし得る。産科医は、胎児の父親からも遺伝子試料を収集することができる。臨床医は、母親の血液から血漿を単離し、血漿からDNAを精製することができる。臨床医は、母親の血液からバフィーコート層を単離し、バフィーコートからDNAを調製することもできる。臨床医は、父親の遺伝子試料からDNAを調製することもできる。臨床医は、本開示に記載の分子生物学技法を用いて、血漿試料に由来するDNAにおいてDNAにユニバーサル増幅タグを付加することができる。臨床医は、ユニバーサルタグが付けられたDNAを増幅することができる。臨床医は、ハイブリダイゼーションによる捕捉および標的PCRを含めたいくつもの技法によってDNAを優先的に富化することができる。標的PCRは、ネスティング、ヘミネスティングまたはセミネスティングまたは血漿由来DNAの効率的な富化をもたらす任意の他の手法を伴ってよい。標的PCRにより、例えば、1反応体積で10,000個のプライマーを用いて大規模に多重化することができ、ここで、プライマーは、第13染色体、第18染色体、第21染色体、X染色体上のSNPおよびXおよびYの両方に共通し、必要に応じて、他の染色体にも共通する遺伝子座を標的とする。選択的な富化および/または増幅は、個々の分子それぞれに、異なるタグ、分子バーコード、増幅用タグ、および/または配列決定用タグを用いてタグ付けすることを伴ってよい。次いで、臨床医は血漿試料について配列決定し、また、場合によっては、調製された母系DNAおよび/または父系DNAをシークエンシングができる。分子生物学的ステップを、診断ボックスによって完全にまたは部分的に実行することができる。配列データを、単一のコンピュータに、または別の種類の計算プラットフォーム、例えば、「クラウド」において見出すことができるものに供給することができる。計算プラットフォームにより、シーケンサーによって行われた測定から標的の多型遺伝子座における対立遺伝子数を算出することができる。計算プラットフォームにより、第13染色体、第18染色体、第21染色体、X染色体およびY染色体のそれぞれについての零染色体性、モノソミー、ダイソミー、一致トリソミー、および不一致トリソミーに関係する、複数の倍数性仮説を作製することができる。計算プラットフォームにより、調べられている5つの染色体のそれぞれに対して、各倍数性仮説に対して、染色体上の標的の遺伝子座における予測される対立遺伝子数についての同時分布モデルを構築することができる。計算プラットフォームにより、同時分布モデルおよび血漿試料に由来する優先的に富化されたDNAに対して測定された対立遺伝子数を用いて、倍数性仮説のそれぞれが真である確率を決定することができる。計算プラットフォームにより、第13染色体、第18染色体、第21染色体、X染色体およびY染色体のそれぞれについて、最大の確率を有する適切な仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールすることができる。コールされた倍数性状態を含む報告を作製することができ、それを産科医に電子的に送ること、出力デバイスに表示すること、または印刷した報告のハードコピーを産科医に送達することができる。産科医は、患者、および必要に応じて胎児の父親に知らせることができ、彼らは、どの臨床的な選択肢を受け入れられるか、およびどれが最も望ましいかを決定することができる。
別の実施形態では、以後「母親」と称される妊娠中の女性は、自身の胎児(複数可)がいずれかの遺伝子異常または他の状態を保有するか否か知りたいと決めることができる。母親は、いかなる全体的異常もないことを確実にしてから妊娠の継続を確信することを希望することができる。母親は、担当産科医のもとに行くことができ、担当産科医は、母親の血液の試料も採ることができる。担当産科医は、母親の頬からの頬スワブなどの遺伝子試料を採ることもできる。担当産科医は、胎児の父親からも遺伝子試料、例えば、頬スワブ、精子試料または血液試料を採ることができる。担当産科医は、試料を臨床医に送ることができる。臨床医は、母系の血液試料中の浮動性胎児DNAの画分を富化することができる。臨床医は、母系の血液試料中の脱核胎児血液細胞の画分を富化することができる。臨床医は、本明細書に記載の方法の種々の態様を用いて、胎児の遺伝子データを決定することができる。その遺伝子データは、胎児の倍数性状態、および/または胎児における1つまたはいくつもの疾患連鎖対立遺伝子の同一性を含み得る。出生前診断の結果が要約されている報告を作製することができる。報告は、医師に送達または郵送することができ、医師は、母親に胎児の遺伝子の状態を告げることができる。母親は、胎児が1個または複数個の染色体もしくは遺伝子の異常または望ましくない状態を有するという事実に基づいて、妊娠を中止することを決定することができる。母親は、同様に、胎児が、いかなる染色体全体もしくは遺伝子の異常またはいかなる対象の遺伝子の状態も有さないという事実に基づいて、妊娠を継続することを決定することができる。
別の例は、精子ドナーにより人工受精し、妊娠中である妊娠中の女性に関し得る。その女性は、自身が保有している胎児が遺伝病を有するリスクを最小限にすることを希望している。その女性は、静脈瀉血士による採血を受け、本開示に記載の技法を用いて、3つの胎児有核赤血球を単離し、組織試料も、母親および遺伝学的父親から採取する。胎児由来の遺伝物質ならびに母親および父親由来の遺伝物質を、必要に応じて増幅し、ILLUMINA INFINIUM BEADARRAYを用いて遺伝子型決定し、本明細書に記載の方法により親の遺伝子型および胎児の遺伝子型をきれいにし、高い正確度で相を特定し、ならびに、胎児についての倍数性コールを行う。胎児が正倍数性であることが見いだされ、再構築された胎児の遺伝子型から表現型による罹病性を予測し、報告を作製し、母親の担当医師に送り、したがって、彼らはどんな臨床的決定が最良であり得るかを決定することができる。
ある実施形態では、母親および父親の未処理の遺伝物質を、増幅によって、ある量の、配列は同様であるが量がより多いDNAに変換する。次いで、遺伝子型決定方法により、核酸によりコードされる遺伝子型データを、上記のものなどのメモリデバイスに物理的かつ/または電子的に保存することができる遺伝子測定値に変換する。PARENTAL SUPPORT(商標)アルゴリズムを構成する関連性のあるアルゴリズムを、プログラミング言語を用いてコンピュータプログラムに翻訳するが、そのアルゴリズムの関連性のある部分は本明細書において詳細に考察されている。次いで、物理的にコードされるビットおよびバイトではなく、生の測定データを示すパターンに整理されているコンピュータハードウェアでコンピュータプログラムを実行することにより、胎児の倍数性状態の高い信頼度の決定を示すパターンに変換される。この変換の詳細は、本明細書に記載の方法を実行するために使用するデータ自体およびコンピュータ言語およびハードウェアシステムに依拠する。次いで、高い質の胎児の倍数性の決定を示すように物理的に構成されたデータを、健康管理実践者に送ることができる報告に変換する。この変換は、プリンタまたはコンピュータディスプレイを使用して行うことができる。報告は、紙または他の適切な媒体に印刷されたコピーであってよい、あるいは、報告は、電子的なものであってよい。電子報告の場合は、伝達することができ、健康管理実践者が利用できるコンピュータに位置するメモリデバイス上に物理的に保存することができる。電子報告は、読み取ることができるようにスクリーン上に表示することもできる。スクリーン表示の場合には、データは、表示デバイス上でピクセルの物理的変換を引き起こすことによって可読の形式に変換することができる。変換は、リン光性スクリーンに電子を物理的に発射することによって、光子を放出または吸収する基材の前に置くことができるスクリーン上のピクセルの特定の集合の透明度を物理的に変化させる電気的な電荷を変更することによって実現することができる。この変換は、ピクセルの特定の集合において、液晶中のナノスケールの分子の配向を、例えば、ネマティック相からコレステリック相またはスメクチックな相に変化させることによって実現することができる。この変換は、意味のあるパターンに配置された複数の発光ダイオードで構成されたピクセルの特定の集合からの光子の放出を引き起こす電流によって実現することができる。この変換は、情報を表示するために使用される任意の他の方法、例えば、コンピュータスクリーンまたはいくつかの他の出力デバイスまたは情報伝達法によって実現することができる。次いで、健康管理実践者は、報告にあるデータを措置に変換するように、報告に基づいて行動することができる。措置は、妊娠を継続または中止することであってよく、その場合、遺伝子の異常を有する妊娠中の胎児は、非生存胎児に変換される。本明細書において列挙されている変換は、例えば、妊娠中の母親および父親の遺伝物質を、本開示において概説されているいくつものステップを通じて、遺伝子の異常を有する胎児を流産することからなる、または妊娠を継続することからなる医学的な決定に変換することができるように総計することができる。あるいは、遺伝子型の測定値の集合を、医師が妊娠中の患者を処置することに役立つ報告に変換することができる。
本開示のある実施形態では、本明細書に記載の方法を用いて、宿主母親、すなわち妊娠中の女性が、自身が保有している胎児の生物学的母親ではない場合にでも、胎児の倍数性状態を決定することができる。本開示のある実施形態では、本明細書に記載の方法を用いて、母系の血液試料のみを使用し、父系の遺伝子試料を必要とせずに胎児の倍数性状態を決定することができる。
ここで開示されている実施形態における数学のいくつかにより、限られた数の異数性の状態に関する仮説が立てられる。いくつかの場合には、例えば、0、1つまたは2つの染色体のみが、各親を起源とすることが予測される。本開示のいくつかの実施形態では、本開示の基本的な概念を変化させることなく、数学的な導出を拡大して異数性の他の形態、例えば、3つの染色体が一方の親を起源とするクアドロソミー(quadrosomy)、ペンタソミー、ヘキサソミーを考慮に入れることができる。同時に、より小さな数の倍数性状態、例えば、トリソミーおよびダイソミーのみに焦点を当てることが可能である。整数でない染色体を示す倍数性の決定は、遺伝物質の試料中のモザイク現象を示し得ることに留意されたい。
いくつかの実施形態では、遺伝子の異常は、ダウン症候群(または21トリソミー)、エドワーズ症候群(18トリソミー)、パトー症候群(13トリソミー)、ターナー症候群(45X)、クラインフェルター症候群(2つのX染色体を持つ男性)、プラダーウィリー症候群、およびディジョージ症候群(UPD15)などの異数性の一種である。前文に列挙されているものなどの先天性障害は、一般に望ましくなく、胎児が1つまたは複数の表現型の異常を患っているという知見により、妊娠中絶すること、特別支援児の誕生のための準備をするために必要な対策をとること、または染色体異常の重症度を減らすことを意図したいくつかの治療的手法をとることを決定するための基礎を提供することができる。
いくつかの実施形態では、本明細書に記載の方法を、非常に初期の妊娠期間、例えば、早ければ4週、早ければ5週、早ければ6週、早ければ7週、早ければ8週、早ければ9週、早ければ10週、早ければ11週、および早ければ12週において用いることができる。
いくつかの実施形態では、本明細書に開示されている方法を、インビトロでの受精の間に胚を選択するための着床前遺伝子診断(PGD)との関連において使用し、ここで、標的個体は胚であり、3日目の胚由来の単一細胞または2つの細胞の生検または5日目または6日目の胚の栄養外胚葉生検材料からの配列決定データから、胚に関する倍数性の決定を行うために、親の遺伝子型データを使用することができる。PGDの環境では、子のDNAのみを測定し、ほんの少数の細胞、一般に、1〜5個であるが、多くて10個、20個または50個を検査する。次いで、対立遺伝子AおよびB(SNPにおける)の開始時のコピーの総数が子の遺伝子型および細胞の数によって自明に決定される。NPDでは、開始時のコピーの数は非常に多く、したがって、PCRの後の対立遺伝子の比が開始時の比を正確に反映することが予想される。しかし、PGDにおける開始時のコピーが少数であることは、コンタミネーションおよび不完全なPCR効率が、PCR後の対立遺伝子の比に対する非自明の効果を有することを意味する。この効果は、配列決定後に測定された対立遺伝子の比における分散を予測することにおけるリード深度よりも重要であり得る。既知の子の遺伝子型を考慮して測定された対立遺伝子の比の分布は、PCRプローブの効率およびコンタミネーションの確率に基づいたPCRプロセスのMonteCarloシミュレーションによって作製することができる。可能性のある子の遺伝子型のそれぞれについて対立遺伝子の比の分布を考慮して、種々の仮説の尤度を、NIPDについて記載されているのと同様に算出することができる。
最尤推定
生物学的な現象または医学的状態の存在または不在を検出するための当技術分野で公知の大多数の方法は、状態と相関するメトリックを測定し、メトリックが所与の閾値の一方の側にあれば、その状態が存在し、メトリックが閾値の他方の側にあれば、その状態は存在しないという単一仮説棄却検定を用いることを包含する。単一仮説棄却検定では、帰無仮説と対立仮説の間の決定を行う際に帰無分布を調べるだけである。対立分布を考慮に入れなければ、観察されたデータを考慮して各仮説の尤度を推定することはできず、したがって、コールに対する信頼度を算出することができない。したがって、単一仮説棄却検定を用いて、特定の場合と関連する信頼度についての感受性を伴わずにyesまたはnoの答えを得る。
いくつかの実施形態では、本明細書に開示されている方法では、生物学的な現象または医学的状態の存在または不在を、最尤法を用いて検出することができる。最尤法は、状態の不在または存在をコールするための閾値をそれぞれの場合について適切に調整することができるので、単一仮説棄却法を用いる方法に対する実質的な改善である。これは、母系の血漿中に見いだされる浮動性DNAに存在する胎児DNAと母系DNAの混合物から入手可能な遺伝子データから、妊娠中の胎児における異数性の存在または不在を決定することを目的とする診断技法に特に関連性がある。これは、血漿中の胎児DNAの一部分により割合の変化(fraction change)が導かれると、異数性対正倍数性をコールするための最適な閾値が変化することに起因する。胎児画分が降下すると、異数性に関連づけられるデータの分布がますます正倍数性に関連づけられるデータの分布と同様になる。
最尤推定法では、各仮説に関連づけられる分布を使用して、各仮説に対して条件づけたデータの尤度を推定する。次いで、これらの条件的確率を、仮説コールおよび信頼度に変換することができる。同様に、最大事後推定法では、最尤推定と同じ条件的確率を使用するが、最良の仮説を選択し、信頼度を決定する際に前の母集団も組み入れる。
したがって、最尤推定(MLE)技法または密接に関連する最大事後(MAP)技法を用いることにより、2つの利点が生じ、まず、正確なコールの見込みが増大し、また、各コールに対して信頼度を算出することが可能になる。ある実施形態では、最大の確率を有する仮説に対応する倍数性状態を選択するステップを、最尤推定または最大事後推定を使用して行う。ある実施形態では、妊娠中の胎児の倍数性状態を決定するための方法であって、単一仮説棄却法を用いる現在当技術分野で公知の任意の方法をとり、それをMLE技法またはMAP技法を用いるように再公式化することを含む方法が開示されている。これらの技法を適用することによって有意に改善することができる方法のいくつかの例は、米国特許第8,008,018号、米国特許第7,888,017号または米国特許第7,332,277号に見いだすことができる。
ある実施形態では、胎児のゲノムDNAおよび母系のゲノムDNAを含む母系の血漿試料における胎児の異数性の存在または不在を決定するための方法であって、母系の血漿試料を得るステップと、血漿試料中に見いだされるDNA断片を、ハイスループットシーケンサーを用いて測定するステップと、配列を染色体にマッピングし、各染色体にマッピングされるシーケンスリード数を決定するステップと、血漿試料中の胎児DNAの割合を算出するステップと、第2の標的染色体が正倍数性である場合に存在すると予測される標的染色体の量の予測される分布、およびその染色体が異数性である場合に予測される1つまたは複数の予測される分布を、胎児画分および正倍数性であることが予測される1個または複数個の参照染色体にマッピングされるシーケンスリード数を使用して算出するステップと、MLEまたはMAPを用いて、どの分布が、正確である可能性が最も高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が記載されている。ある実施形態では、血漿由来のDNAを測定するステップは、大規模な並行のショットガン配列決定を行うことを包含し得る。ある実施形態では、血漿試料由来のDNAを測定するステップは、例えば、標的化増幅によって、複数の多型遺伝子座または非多型遺伝子座において優先的に富化されたDNAをシークエンシングを包含し得る。複数の遺伝子座を、1つまたは少数の異数性が疑わしい染色体および1つまたは少数の参照染色体を標的とするように設計することができる。優先的に富化することの目的は、倍数性を決定するために情報価値のあるシーケンスリード数を増加させることである。
倍数性コールのインフォマティクスによる方法
本明細書には、配列データを考慮して胎児の倍数性状態を決定するための方法が記載されている。いくつかの実施形態では、この配列データは、ハイスループットシーケンサーで測定することができる。いくつかの実施形態では、配列データは、母系の血液から単離された浮動性DNAを起源とするDNAについて測定することができ、ここで、浮動性DNAは、いくらかの母体起源のDNA、およびいくらかの胎児/胎盤起源のDNAを含む。このセクションでは、分析された混合物中の胎児DNAの割合は未知であり、データから推定されると仮定して胎児の倍数性状態を決定する本開示の一実施形態が記載される。混合物中の胎児DNAの割合(「胎児画分」)または胎児DNAの百分率を別の方法によって測定することができ、また、それが胎児の倍数性状態の決定において既知であると仮定される実施形態も記載される。いくつかの実施形態では、胎児DNAと母系DNAの混合物である母系の血液試料自体に対して行った遺伝子型決定測定値のみを使用して胎児画分を算出することができる。いくつかの実施形態では、測定されたか、または別の方法で既知である母親の遺伝子型および/または測定されたか、または別の方法で既知である父親の遺伝子型を用いてその割合を算出することもできる。別の実施形態では、胎児の倍数性状態は、単に、問題の染色体について算出された胎児DNAの割合に基づいて、ダイソミーであると仮定される参照染色体について算出された胎児DNAの割合と比較して決定することができる。
好ましい実施形態では、特定の染色体について、N個のSNPを観察し、解析する場合、
・NR個の浮動性DNA配列測定値の集合S=(s,...,sNR)となる。この方法では、SNP測定値を利用するので、非多型の遺伝子座に対応する配列データは全て無視することができる。単純化形では、各SNPに対して計数値(A,B)が得られ、AおよびBが、所与の遺伝子座に存在する2つの対立遺伝子に対応する場合、SはS=((a,b),...,(a,b))と書くことができ、式中、aはSNP i上のA計数値であり、bはSNP i上のB計数値であり、Σi=1:N(a+b)=NRであり、また
・親のデータは、
〇SNPマイクロアレイまたは他の強度に基づく遺伝子型決定プラットフォームからの
遺伝子型:母親M=(m,...,m)、父親F=(f,...,f)、m,f∈(AA,AB,BB)、および/または
〇配列データ測定値:NRM個の母親の測定値SM=(sm,...,smnrm)、NRF個の父親の測定値SF=(sf,...,sfnrf)から構成される。上記の単純化と同様、各SNPについて計数値(A,B)が得られる場合、SM=((am,bm),...,(am,bm))、SF=((af,bf),...,(af,bf))となる。
まとめて、母親、父親、子のデータはD=(M,F,SM,SF,S)で示される。親のデータの取得が望ましく、それによりアルゴリズムの正確度が上昇するが、親のデータ、特に父親のデータは必ずしも必要ではないことに留意されたい。これは、母親および/または父親のデータの不在下でさえ、非常に正確なコピー数の結果を得ることが可能であることを意味する。
データの対数尤度LIK(D|H)を、考えられる仮説(H)全てにわたって最大にすることによって最良のコピー数の推定値(H†*)を導くことが可能である。特に、倍数性仮説のそれぞれの相対的確率は、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、また、以下の通り正確である可能性が最も高い仮説を決定することが可能である:
同様に事後仮説尤度は、データを考慮すると:
と書くことができ、式中、priorprob(H)はモデル設計および以前の知見に基づいて各仮説Hに割り当てられた事前確率である。
事前確率を用いて最大事後推定値を得ることも可能である:
ある実施形態では、考慮に入れることができるコピー数仮説は、以下である:
・モノソミー:
○ 母系H10(母親由来の1つのコピー)
○ 父系H01(父親由来の1つのコピー)
・ダイソミー:H11(母親および父親それぞれにつき1つのコピー)
・単純なトリソミー、乗換えは考慮しない:
○ 母系:H21_一致(母親由来の2つの同一のコピー、父親由来の1つのコピー)、H21_不一致(母親由来の両方のコピー、父親由来の1つのコピー)
○父系:H12_一致(母親由来の1つのコピー、父親由来の2つの同一のコピー)、H12_不一致(母親由来の1つのコピー、父親由来の両方のコピー)
・複合トリソミー、乗換えを考慮する(同時分布モデルを用いる):
○ 母系H21(母親由来の2つのコピー、父親由来の1つのコピー)、
○ 父系H12(母親由来の1つのコピー、父親由来の2つのコピー)
他の実施形態では、他の倍数性状態、例えば、ゼロ染色体性(H00)、片親性ダイソミー(H20およびH02)、およびテトラソミー(H04、H13、H22、H31およびH40)を考慮することができる。
乗換えがない場合、起源が有糸分裂、減数分裂Iまたは減数分裂IIのいずれにしろ、各トリソミーは、一致トリソミーまたは不一致トリソミーのうちの一方になる。乗換えに起因して、真のトリソミーは通常、2つの組み合わせになる。まず、単純仮説について仮説の尤度を導く方法が記載されている。次に、個々のSNP尤度を乗換えと組み合わせた複合仮説について仮説の尤度を導く方法が記載されている。
単純仮説についてのLIK(D|H)
ある実施形態では、単純仮説について、以下の通りLIK(D|H)を決定することができる。単純仮説Hについて、染色体全体についての仮説Hの対数尤度LIK(H)を、既知のまたは導かれた子の割合cfを仮定して、個々のSNPの対数尤度の合計として算出することができる。ある実施形態では、データからcfを導くことが可能である。
この仮説では、いかなるSNP間の連鎖も仮定せず、したがって、同時分布モデルを利用しない。
いくつかの実施形態では、SNPごとに対数尤度を決定することができる。特定のSNP iについて、胎児の倍数性についての仮説Hおよびパーセント胎児DNA cfを仮定すると、観察されたデータDの対数尤度は、
と定義され、式中、mは可能性のある真の母親の遺伝子型であり、fは可能性のある真の父親の遺伝子型であり、m,f∈{AA,AB,BB}であり、cは、仮説Hを考慮した、可能性のある子の遺伝子型である。特に、モノソミーについてはc∈{A,B}であり、ダイソミーについてはc∈{AA,AB,BB}であり、トリソミーについてはc∈{AAA,AAB,ABB,BBB}である。
遺伝子型事前頻度:p(m|i)は、SNP Iにおける既知の母集団頻度に基づくSNP iにおける母親の遺伝子型mの一般的な事前確率であり、pAiで示される。具体的には、
p(AA|pA)=(pA,p(AB|pA)=2(pA)*(1−pA),p(BB|pA)=(1−pA
父親の遺伝子型の確率、p(f|i)も同様に決定することができる。
真の子の確率:p(c|m,f,H)は、親m、f、および仮定している仮説Hを考慮して真の子の遺伝子型=cが得られる確率であり、これは容易に算出することができる。例えば、H11、H21一致およびH21不一致についてのp(c|m,f,H)が以下に示されている。
データの尤度:P(D|m,f,c,H,i,cf)は、真の母親の遺伝子型m、真の父親の遺伝子型f、真の子の遺伝子型c、仮説Hおよび子の割合cfを考慮したSNP iにおける所与のデータDの確率である。これは、以下の通り母親、父親および子データの確率に分解することができる:
P(D|m,f,c,H,cf,i)=P(SM|m,i)P(M|m,i)P(SF|f,i)P(F|f,i)P(S|m,c,H、cf,i)
母親のSNPアレイデータの尤度:SNPアレイ遺伝子型が正確であると仮定して、真の遺伝子型mと比較した、SNP iにおける母親のSNPアレイ遺伝子型データの確率mは、単に、
である。
母親の配列データの尤度:SNP iにおける母親の配列データの確率は、計数値S=(am,bm)の場合には、余分のノイズまたは偏りを伴わず、P(SM|m,i)=PX|m(am)と定義される二項確率であり、ここで、X|m〜Binom(p(A),am+bm)であり、p(A)は下表に示す値である。
父親のデータの尤度:同様の式が父親のデータの尤度にも当てはまる。親のデータ、特に父親のデータを用いずに子の遺伝子型を決定することが可能であることに留意されたい。例えば、父親の遺伝子型データFが利用可能でない場合、単にP(F|f,i)=1を使用することができる。父親の配列データSFが利用可能でない場合、単にP(SF|f,i)=1を使用することができる。
いくつかの実施形態では、前記方法は、各倍数性仮説について、染色体上の複数の多型遺伝子座において予測される対立遺伝子数についての同時分布モデルを構築することを伴い、そのような目的を実現するための1つの方法がここに記載されている。遊離の胎児DNAデータの尤度:P(S|m,c,H,cf,i)は、SNP iにおける遊離の胎児DNA配列データの確率であり、真の母親の遺伝子型m、真の子の遺伝子型c、子のコピー数仮説Hを考慮し、子の割合cfを仮定する。これは、実際、SNP iにおけるA含量の真の確率μ(m,c,cf,H)を考慮したSNP Iにおける配列データSの確率P(S|m,c,H,cf,i)=P(S|μ(m,c,cf,H),i)である。
計数値に関しては、S=(a,b)であり、データに余分のノイズまたは偏りを伴わない場合、
P(S|μ(m,c,cf,H),i)=P(a
となり、式中、X〜Binom(p(A),a+b)であり、p(A)=μ(m,c,cf,H)である。正確なアラインメントおよびSNP当たりの(A,B)計数値が未知の、より複雑な場合には、P(S|μ(m,c,cf,H),i)は積分した二項式の組み合わせである。
真のA含量の確率:この母親/子混合物におけるSNP iにおけるA含量の真の確率μ(m,c,cf,H)は、真の母親の遺伝子型=m、真の子の遺伝子型=c、および全体的な子の割合=cfと仮定して、
と定義され、式中、#A(g)=遺伝子型gにおけるAの数であり、n=2は、母親のソミーであり、nは仮説Hの下での子の倍数性である(1はモノソミーであり、2はダイソミーであり、3はトリソミーである)。
同時分布モデルの使用:複合仮説についてのLIK(D|H)
いくつかの実施形態では、この方法は、各倍数性仮説について、染色体上の複数の多型遺伝子座において、予測される対立遺伝子数の同時分布モデルを構築することを伴い、そのような目的を実現するための1つの方法がここに記載されている。多くの場合、トリソミーは、通常、乗換えに起因して、純粋に一致または不一致ではなく、したがって、このセクションでは、可能性のある乗換えを考慮に入れて、一致トリソミーと不一致トリソミーが組み合わされた複合仮説H21(母系トリソミー)およびH12(父系トリソミー)についての結果が導かれる。
トリソミーの場合には、乗換えがなければ、トリソミーは単に一致トリソミーまたは不一致トリソミーになる。一致トリソミーとは、子が一方の親由来の同一染色体セグメントの2つのコピーを遺伝によって受け継ぐ場合である。不一致トリソミーとは、子が親由来の各相同染色体セグメントの1つのコピーを遺伝によって受け継ぐ場合である。乗換えにより、染色体の一部のセグメントが一致トリソミーを有する場合もあり、他の部分が、不一致トリソミーを有してもよい。このセクションには、対立遺伝子の集合について、ヘテロ接合率について、すなわち、1個または複数個の仮説について、いくつもの遺伝子座における予測される対立遺伝子数の同時分布モデルをどのように構築するかが記載されている。
SNP iに対し、LIK(D|Hm,i)は、一致仮説Hに対する適合であり、LIK(D|Hu,i)は、不一致仮説Hに対する適合であり、pc(i)=SNP i−1とSNP iの間の乗換えの確率であると仮定する。このとき、完全な尤度を以下の通り算出することができる:
式中、LIK(D|E,1:N)は、SNP 1:Nについての仮説Eの最終尤度である。E=最後のSNPの仮説であり、E∈(Hm,Hu)である。再帰的に、以下を算出することができる:
式中、〜EはE以外の仮説(非E)であり、考慮される仮説はHおよびHである。詳細には、1:i SNPの尤度を、1から(i−1)までのSNPの尤度に基づいて、同じ仮説で乗換えなしか、または逆の仮説で乗換えありのいずれかを用い、SNP iの尤度を乗じて算出することができる:
SNP 1に対し、i=1、LIK(D|E,1:1)=LIK(D|E,1)、
SNP 2に対し、i=2、LIK(D|E,1:2)=LIK(D|E,2)+log(exp(LIK(D|E,1))*(1−pc(2))+exp(LIK(D|〜E,1))*pc(2))、
また、i=3:Nについても同様である。
いくつかの実施形態では、子の割合(fraction)を決定することができる。子の割合とは、DNAの混合物における子を起源とする配列の割合(proportion)を指してもよい。非侵襲的な出生前診断との関連において、子の割合とは、母系の血漿における、胎児または胎児の遺伝子型を有する胎盤の部分を起源とする配列の割合を指してもよい。子の割合とは、母系の血漿から調製したDNAの試料中の子の画分を指してもよく、胎児DNAに関して富化されていてよい。DNAの試料中の子の割合を決定する1つの目的は、胎児に関して倍数性コールを行うことができるアルゴリズムにおいて使用するためであり、したがって、子の割合とは、非侵襲的な出生前診断のために配列決定によって分析したいかなるDNAの試料を指してもよい。
非侵襲的な出生前異数性診断の方法の一部である本開示において示されているアルゴリズムのいくつかは、既知の子の割合を仮定するが、これはいつでもこのようになるわけではない。ある実施形態では、親のデータの存在を含めて、または含めずに、選択された染色体上のダイソミーの尤度を最大にすることによって、最も可能性が高い子の割合を見いだすことが可能である。
詳細には、ダイソミー仮説について、および染色体chr上の子の割合cfについて、上記の通りLIK(D|H11,cf,chr)=対数尤度と仮定する。正倍数性であると仮定した、Csetにおいて選択された染色体(通常、1:16)についての完全な尤度は:
である。
最も可能性が高い子の割合(cf†*)は、cf=argmaxcfLIK(cf)として導かれる。
染色体の任意の集合を使用することが可能である。参照染色体における正倍数性を仮定せずに子の割合を導くことも可能である。この方法を用いて、以下の状況のいずれかについて子の割合を決定することが可能である:(1)親に関するアレイデータおよび母系の血漿に関するショットガン配列決定データを有する;(2)親に関するアレイデータおよび母系の血漿に関する標的化配列決定データを有する;(3)親と母系の血漿の両方に関する標的化配列決定データを有する;(4)母親と母系の血漿画分の両方に関する標的化配列決定データを有する;(5)母系の血漿画分に関する標的化配列決定データを有する;(6)親の画分および子の画分の測定値の他の組み合わせ。
いくつかの実施形態では、インフォマティクスによる方法により、データドロップアウトを組み入れることができる。これにより、より正確度が高い倍数性の判定結果を得ることができる。本開示の他の箇所において、Aが生じる確率は、真の母親の遺伝子型、真の子の遺伝子型、混合物中の子の割合、および子のコピー数の一次関数であると仮定されている。例えば、混合物中の真の子ABを測定する代わりに、母親または子の対立遺伝子がドロップアウトする可能性もあり、これは対立遺伝子Aにマッピングされる配列のみを測定する場合に起こり得る。ゲノムのイルミナデータについての親のドロップアウト率をdpg、配列データについての親のドロップアウト率をdpsおよび配列データについての子のドロップアウト率をdcsで示すことができる。いくつかの実施形態では、母親のドロップアウト率を0、子のドロップアウト率を比較的低いと仮定することができ、この場合、結果はドロップアウトの影響を大きくは受けない。いくつかの実施形態では、対立遺伝子ドロップアウトの可能性は、それにより予測される倍数性コールに有意な影響がもたらされるのに十分に大きい場合がある。そのような場合、対立遺伝子ドロップアウトをここでアルゴリズムに組み入れる:
親のSNPアレイデータドロップアウト:母親のゲノムのデータMについて、ドロップアウト後の遺伝子型をmとすると、
で、式中、上記と同様に、
であり、P(m|m)は、ドロップアウト率dについて以下の通り定義される真の遺伝子型mを考慮した可能性のあるドロップアウト後の遺伝子型mの尤度である
同様の式が父親のSNPアレイデータにも当てはまる。
親の配列データドロップアウト:母親の配列データSMに対し、
式中、P(m|m)は前のセクションで定義された通りであり、二項分布からのPx|md(am)確率は、親のデータの尤度セクションにおいて上記の通り定義される。同様の式が父系の配列データにも適用できる。
浮動性DNA配列データドロップアウト:
式中、P(S|μ(m,c,cf,H),i)は浮動性のデータの尤度に関するセクションにおいて定義されている通りである。
ある実施形態では、p(m|m)は、真の母親の遺伝子型mを考慮し、ドロップアウト率dpsを仮定した、観察された母親の遺伝子型mの確率であり、p(c|c)は、真の子の遺伝子型cを考慮し、ドロップアウト率dcsを仮定した、観察された子の遺伝子型cの確率である。nA=真の遺伝子型cにおける対立遺伝子Aの数であり、nA=観察された遺伝子型cにおける対立遺伝子Aの数であり、nA≧nAであり、同様に、nB=真の遺伝子型cにおける対立遺伝子Bの数であり、nB=観察された遺伝子型cにおける対立遺伝子Bの数であり、nB≧nBであり、d=ドロップアウト率であるとすると、
である。
ある実施形態では、インフォマティクスによる方法により、ランダムな偏りおよび一貫した偏りが組み入れられる可能性がある。理想的に言えば、配列計数値にSNP当たりの一貫したサンプリングの偏りまたはランダムなノイズ(二項分布の変動に加えて)は存在しない。詳細には、SNP iにおいて、母親の遺伝子型m、真の子の遺伝子型cおよび子の割合cf、およびX=SNP iにおける(A+B)リードの集合内のAの数に対して、XはX〜Binomial(p,A+B)として作用し、p=μ(m,c,cf,H)=A含量の真の確率である。
ある実施形態では、インフォマティクスによる方法により、ランダムな偏りが組み入れられる可能性がある。大抵の場合、測定値に偏りがあると仮定し、したがってこのSNPにおいてAが生じる確率は、上で定義されたpとは少し異なるqに等しい。pとqがどのくらい異なるかは、測定プロセスの正確度および他の因子の数に左右され、pから離れたqの標準偏差によって定量化することができる。ある実施形態では、qを、ベータ分布を有するとしてpに集中したその分布の平均に応じたパラメータα、β、および一部の特定の標準偏差sを用いてモデリングすることが可能である。詳細には、これによりX|q〜Bin(q,D)がもたらされ、q〜Beta(α,β)である。E(q)=p、V(q)=sとすれば、パラメータα、βはα=pN、β=(1−p)Nとして導くことができ、
である。
これはベータ二項分布の定義であり、可変性のパラメータqを伴う二項分布からサンプリングし、qは平均のpを有するベータ分布に従う。したがって、偏りがないセットアップでは、SNP iにおいて、真の母親の遺伝子型(m)を仮定し、SNP i上の母親の配列A計数値(am)およびSNP i上の母親の配列B計数値(bm)を考慮した親の配列データ(SM)確率を以下の通り算出することができる:P(SM|m,i)=PX|m(am)、ここで、X|m〜Binom(p(A),am+bm)である。
ここで、標準偏差sを有するランダムな偏りを含めると、以下になる:
X|m〜BetaBinom(p(A),am+bm,s)。
偏りがない場合には、真の母親の遺伝子型(m)、真の子の遺伝子型(c)、子の割合(cf)を仮定し、子の仮説Hを仮定し、SNP i上の浮動性DNA配列A計数値(ai)およびSNP i上の浮動性配列B計数値(bi)を考慮した母系の血漿DNA配列データ(S)確率を以下の通り算出することができる:
P(S|m,c,cf,H,i)=Px(a
式中、X〜Binom(p(A),a+b)、p(A)=μ(m,c,cf,H)。
ある実施形態では、標準偏差sを有するランダムな偏りを含めると、これはX〜BetaBinom(p(A),a+b、s)になり、余分の変動の量は偏差パラメータsまたは同等にNによって指定される。sの値が小さいほど(またはNの値が大きいほど)この分布は標準的な二項分布に近づく。偏りの量を推定すること、すなわち上記のNを、明白な状況AA|AA、BB|BB、AA|BB、BB|AAから、上記の確率における推定:
を用いて推定することが可能である。データの挙動に応じて、Nを、リード深度a+bまたはa+bの関数に関係なく一定になるようにし、これにより、より大きなリード深度に対して偏りをより小さくすることができる。
ある実施形態では、インフォマティクスによる方法により、一貫したSNPごとの偏りが組み入れられる可能性がある。配列決定プロセスのアーチファクトに起因して、一部のSNPは、真のA含量に関係なく、一貫して低いまたは高い計数値を有し得る。SNP iが一貫してA計数値に対してwパーセントの偏りを加えると仮定する。いくつかの実施形態では、この偏りを、同じ条件で導かれたトレーニングデータの集合から推定し、以下のように親の配列データ推定値に戻すことができる:
P(SM|m,i)=PX|m(am)<ここで、X|m〜BetaBinom(p(A)+w,am+bm,s)>、
また、浮動性DNA配列データ確率推定値は:
P(S|m,c,cf,H,i)=P(a)<ここで、X〜BetaBinom(p(A)+w,a+b,s)>
となる。
いくつかの実施形態では、前記方法は、特にさらに別のノイズ、示差的な試料の質、示差的なSNPの質、およびランダムサンプリングの偏りを考慮に入れて書くことができる。この例はここに示されている。この方法は、データを大規模に多重化されたmini−PCRプロトコールを使用して生成した状況において特に有用であることが示されており、これを実験7〜13において用いた。前記方法は、それぞれが最終のモデルに異なる種類のノイズおよび/または偏りを導入するいくつかのステップを伴う:
(1)母系DNAと胎児DNAの混合物を含む第1の試料は、サイズ=N分子、通常、1,000〜40,000の範囲、p=真の%refの元のDNAの量を含有すると仮定する。
(2)ユニバーサルライゲーションアダプタを使用した増幅において、N分子がサンプリングされると仮定する;通常、サンプリングに起因してN〜N/2分子およびランダムサンプリングの偏りが導入される。増幅された試料は、いくつもの分子Nを含有してよく、N>>Nである。XはNサンプリングされた分子のうちの参照遺伝子座の量(SNPごと)を示し、プロトコールの残り全体を通してランダムサンプリングの偏りを導入するp=X/Nの変動を伴うとする。このサンプリングの偏りを、単純な二項分布モデルを使用する代わりにベータ二項(BB)分布を使用することによってモデルに含める。ベータ二項分布のパラメータNを後で、試料ごとに、0<p<1のSNPについて漏れおよび増幅の偏りを調整した後に、トレーニングデータから推定することができる。漏れは、SNPが不正確に読み取られる傾向である。
(3)増幅ステップにより、対立遺伝子のあらゆる偏りが増幅され、したがって、可能性のある一様でない増幅によって増幅の偏りが導入される。遺伝子座における一方の対立遺伝子がf倍に増幅され、その遺伝子座における他方の対立遺伝子がg倍に増幅されると仮定すると、f=geであり、b=0は偏りがないことを示す。偏りパラメータbは0に集中し、特定のSNPにおいて対立遺伝子Aが対立遺伝子Bと対照的にどのくらい多くまたは少なく増幅されたかを示す。パラメータbは、SNPによって異なってよい。偏りパラメータbは、SNPごとに、例えば、トレーニングデータから推定することができる。
(4)配列決定ステップは、増幅された分子の試料について配列決定するステップを包含する。このステップでは、漏れが存在する可能性があり、漏れとは、SNPが不正確に読み取られる状況である。漏れは、様々な問題に起因する可能性があり、漏れの結果、SNPは、正確な対立遺伝子Aとして読み取られないが、その遺伝子座において見いだされる別の対立遺伝子Bとして、または一般にはその遺伝子座において見いだされない対立遺伝子CまたはDとして読み取られる。配列決定により、サイズN、N<Nの増幅された試料からいくつものDNA分子の配列データが測定されると仮定する。いくつかの実施形態では、Nは、20,000〜100,000;100,000〜500,000;500,000〜4,000,000;4,000,000〜20,000,000;または20,000,000〜100,000,000の範囲内であってよい。サンプリングされた各分子は正確に読み取られた確率pを有し、その場合、正確に対立遺伝子Aとして示される。試料は、確率1−pgで元の分子と無関係の対立遺伝子として不正確に読み取られ、確率prで対立遺伝子Aのようであり、確率pで対立遺伝子Bのようであり、または確率pで対立遺伝子Cまたは対立遺伝子Dのようであり、p+p+p=1である。パラメータp、p、p、pは、SNPごとに、トレーニングデータから推定する。
異なるプロトコールは、同様のステップを包含し、分子生物学的ステップに変動を伴ってよく、その結果、異なる量のランダムサンプリング、異なるレベルの増幅および異なる漏れによる偏りがもたらされる。以下のモデルを、これらの場合のそれぞれに同等に良好に適用することができる。サンプリングされたDNAの量のモデルは、SNPごとに、以下によって示される:
〜BetaBinomial(L(F(p,b),p,p)、N*H(p,b))
式中、p=参照DNAの真の量であり、b=SNP当たりの偏りであり、上記のように、pは正確なリードの確率であり、pは、上記の通り、悪いリードの場合、不正確に読み取られたが、偶然に正確な対立遺伝子に見えるリードの確率であり:
F(p,b)=pe/(pe+(1−p))、H(p,b)=(ep+(1−p))/e、L(p,p,p)=p*p+p*(1−p)である。
いくつかの実施形態では、前記方法では単純な二項分布の代わりにベータ二項分布を使用する。これは、ランダムサンプリングの偏りに対処する。ベータ二項分布のパラメータNは、試料ごとに、必要に応じて推定する。単にpの代わりに偏り補正F(p,b)、H(p,b)を用いて、増幅の偏りに対処する。偏りのパラメータbは、前もって、SNPごとに、トレーニングデータから推定する。
いくつかの実施形態では、前記方法では、単にpの代わりに漏れ補正L(p,p,p)を用い、これは漏れによる偏り、すなわちSNPおよび試料の質の変動に対処する。いくつかの実施形態では、パラメータp、p、pは、前もって、SNPごとに、トレーニングデータから推定する。いくつかの実施形態では、パラメータp、p、pは、実行されている現行の試料を用いて更新して、試料の質の変動を明らかにすることができる。
本明細書に記載のモデルは、かなり一般的であり、示差的な試料の質と示差的なSNPの質の両方を明らかにすることができる。異なる試料およびSNPは、いくつかの実施形態では平均および分散が元のDNAの量、ならびに試料およびSNPの質の関数であるベータ二項分布を用いるという事実によって例証されるように、異なって処理される。
プラットフォームのモデリング
血漿中に存在する予測される対立遺伝子の比がrである(母系の遺伝子型および胎児の遺伝子型に基づいて)単一のSNPを考慮に入れる。予測される対立遺伝子の比は、母系DNAと胎児DNAの組み合わせにおいて、予測される対立遺伝子Aの割合と定義される。母系の遺伝子型gおよび子の遺伝子型gについて、予測される対立遺伝子の比は、遺伝子型が同様に対立遺伝子の比で示されると仮定して、式1によって示される。
r=fg+(1−f)g (1)
SNPにおける観察は、存在する各対立遺伝子でマッピングされたリード数、nおよびnからなり、合計してリード深度dになる。閾値が既にマッピング確率およびphredスコアに適用されており、したがって、マッピングおよび対立遺伝子の観察を正確であるとみなすことができると仮定する。phredスコアとは、特定の塩基における特定の測定値が誤りである確率に関する数値尺度である。ある実施形態では、塩基を配列決定によって測定した場合、phredスコアは、コールされた塩基に対応する色素の強度と他の塩基の色素の強度の比から算出することができる。尤度を観察するための最も単純なモデルは、dリードのそれぞれが、対立遺伝子の比rを有する大規模なプールからそれぞれ独立に抜き取られたと仮定する二項分布である。式2によりこのモデルが説明される。
二項式モデルは、いくつもの方法で拡張することができる。母系の遺伝子型および胎児の遺伝子型が全てAであるかまたは全てBであるかのいずれかの場合、血漿における予測される対立遺伝子の比は0または1になり、二項確率は明確に定義されない。実際には、時には実施において予想外の対立遺伝子が観察される。ある実施形態では、補正した対立遺伝子の比
を用いて、予想外の対立遺伝子を少数にすることが可能である。ある実施形態では、トレーニングデータを用いて、各SNP上に現れる予想外の対立遺伝子の比率をモデリングすること、およびこのモデルを使用して予測される対立遺伝子の比を補正することが可能である。予測される対立遺伝子の比が0または1ではない場合、観察された対立遺伝子の比は、増幅の偏りまたは他の現象に起因して、予測される対立遺伝子の比に十分に高いリード深度に収束し得ない。次いで、対立遺伝子の比を、予測される対立遺伝子の比に集中したベータ分布としてモデリングし、二項分布よりも分散が大きいP(n,n|r)についてのベータ二項分布を得ることができる。
単一のSNPにおける応答についてのプラットフォームモデルは、F(a,b、g,g,f)と定義される(3)、または観察されているn=aおよびn=bの確率は、母系の遺伝子型および胎児の遺伝子型を考慮すると、同様に式1による胎児画分に左右される。Fの関数形式は、二項分布、ベータ二項分布または上記と同様の関数であってよい。
F(a,b,g,g,f)=P(n=a,n=b|g,g,f)=P(n=a,n=b|r(g,g,f)) (3)
ある実施形態では、子の割合を以下の通り決定することができる。出生前検査のための胎児画分fの最尤推定値は、父系の情報を使用することなく導くことができる。これは、父系の遺伝子データが入手不可能である場合、例えば、記録の父親が実際には胎児の遺伝学的父親ではない場合に関連性があり得る。胎児画分は、母系の遺伝子型が0または1である場合にSNPの集合から推定し、その結果、可能性のある胎児の遺伝子型2つのみの集合がもたらされる。Sを、母系の遺伝子型が0であるSNPの集合と定義し、Sを、母系の遺伝子型が1であるSNPの集合と定義する。Sにおける可能性のある胎児の遺伝子型は0および0.5であり、可能性のある対立遺伝子の比の集合R(f)={0,f/2}がもたらされる。同様に、R(f)={1−f/2,1}である。この方法は、母系の遺伝子型が0.5であるSNPを含むように自明に拡張され得るが、これらのSNPは、可能性のある対立遺伝子の比のより大きな集合に起因して情報価値が低い。
a0およびNb0を、SにおけるSNPについてnasおよびnbsによって形成されるベクトルと定義し、Na1およびNb1を同様にSについて定義する。fの最尤推定値
は式4によって定義される。
各SNPにおける対立遺伝子数をSNPの血漿対立遺伝子の比に対して独立して条件づけたと仮定して、確率は、各集合内のSNPに関する積として表すことができる(5)。
fへの依存は、可能性のある対立遺伝子の比の集合R(f)およびR(f)による。SNP確率P(nas,nbs|f)は、fに対して条件づけた最尤遺伝子型を仮定することによって概算することができる。合理的に高い胎児画分およびリード深度における最尤遺伝子型の選択は信頼度が高くなる。例えば、胎児画分10パーセントおよびリード深度1000において、母親が遺伝子型ゼロを有するSNPを考慮する。予測される対立遺伝子の比は0パーセントおよび5パーセントであり、これは十分に高いリード深度において容易に区別可能である。推定される子の遺伝子型を式5に代入することにより、胎児画分を推定するための完全な式(6)が得られる。
胎児画分は、範囲[0,1]でなければならず、したがって、条件付き一次元検索によって最適化を容易に実行することができる。
低いリード深度の場合または高いノイズレベルの存在下では、不自然に高い信頼度をもたらし得る最尤遺伝子型を仮定しないことが好ましい場合がある。別の方法では、各SNPにおける可能性のある遺伝子型にわたって合計し、その結果、SにおけるSNPについてのP(n,n|f)について以下の式(7)が得られる。事前確率P(r)は、R(f)にわたって一様であると仮定することができ、または母集団頻度に基づいてよい。群Sへの拡大は自明である。
いくつかの実施形態では、確率を以下の通り導くことができる。2つの仮説HおよびHのデータ尤度から信頼度を算出することができる。各仮説の尤度を、応答モデル、推定される胎児画分、母親の遺伝子型、対立遺伝子の母集団頻度、および血漿対立遺伝子数に基づいて導く。
以下の表記を定義する:
、G 真の母系の遺伝子型および子の遺伝子型
af、Gtf 父親とされる人の真の遺伝子型および真の父親の真の遺伝子型
G(g,g,gtf)=P(G=g|G=g,Gtf=gtf) 遺伝形質確率
P(g)=P(Gtf=g) 特定のSNPにおける遺伝子型gの母集団頻度
各SNPにおける観察は血漿対立遺伝子の比に対して独立して条件づけられると仮定して、父系性仮説の尤度はSNPにおける尤度の積である。以下の式により、単一のSNPについての尤度が導かれる。式8は、任意の仮説hの尤度についての一般的な表現であり、次いで、HおよびHの特定の場合に分解される。
の場合には、父親とされる人は真の父親であり、胎児の遺伝子型は、式9に従って母系の遺伝子型および父親とされる人の遺伝子型から遺伝によって受け継がれる。
の場合には、父親とされる人は真の父親ではない。真の父親の遺伝子型の最良の推定値は、各SNPにおける母集団頻度によって生じる。したがって、子の遺伝子型の確率を、式10の場合と同様に既知の母親の遺伝子型および母集団頻度によって決定する。
正確な父系性に対する信頼度Cを、ベイズの法則(11)を用いて、2つの尤度のSNPに関する積から算出する。
パーセントによる胎児画分を用いた最尤モデル
母系の血清中に含有される浮動性DNAを測定することによって、または任意の混合試料中の遺伝子型の材料を測定することによって胎児の倍数性状態を決定することは、非自明の作業である。いくつもの方法があり、例えば、推測が、胎児が特定の染色体においてトリソミーである場合は、母系の血液中に見いだされるその染色体由来の全体的なDNAの量が参照染色体に対して上昇するというものであるリード数解析を実施する方法が存在する。そのような胎児においてトリソミーを検出するための1つの方法は、各染色体について予測されるDNAの量を、例えば、所与の染色体に対応する分析集合内のSNPの数に従って、または染色体の独自にマッピング可能な部分の数に従って正規化することである。測定値が正規化されたら、特定の閾値を超えるDNAの量が測定された任意の染色体をトリソミーであると決定する。この手法は、FanらPNAS、2008年;105巻(42号);16266〜16271頁に記載されており、ChiuらBMJ 2011年;342巻:c7401頁にも記載されている。Chiuらの論文では、正規化は、以下の通りZスコアを算出することによって実現された:
検査例における第21染色体の百分率についてのZスコア=((検査例における第21染色体の百分率)−(参照対照における第21染色体の百分率の平均))/(参照対照における第21染色体の百分率の標準偏差)。
これらの方法では、単一仮説棄却法を用いて胎児の倍数性状態を決定する。しかし、これらは、いくつかの著しい欠点を被る。胎児における倍数性を決定するためのこれらの方法は試料中の胎児DNAの百分率に従って不変であるので、1つのカットオフ値を使用し、その結果、決定の正確度は最適ではなく、混合物中の胎児DNAの百分率が比較的低い場合は、正確度が最も悪くなる。
ある実施形態では、胎児の倍数性状態を決定するために用いる本開示の方法は、試料中の胎児DNAの割合を考慮に入れるステップを包含する。本開示の別の実施形態では、前記方法は、最尤推定の使用を包含する。ある実施形態では、本開示の方法は、試料中の胎児起源または胎盤起源のDNAのパーセントを算出するステップを包含する。ある実施形態では、異数性をコールするための閾値は、算出されたパーセント胎児DNAに基づいて適応調整する。いくつかの実施形態では、DNAの混合物中の胎児起源のものであるDNAの百分率を推定するための方法は、母親由来の遺伝物質、および胎児由来の遺伝物質を含む混合試料を得るステップと、胎児の父親由来の遺伝子試料を得るステップと、混合試料中のDNAを測定するステップと、父親の試料中のDNAを測定するステップと、混合試料のDNA測定値、および父親の試料のDNA測定値を使用して、混合試料中の胎児起源のものであるDNAの百分率を算出するステップとを含む。
本開示のある実施形態では、混合物中の胎児DNAの割合または胎児DNAの百分率を測定することができる。いくつかの実施形態では、胎児DNAと母系DNAの混合物である母系の血漿試料自体に対して行った遺伝子型決定の測定値のみを使用して割合を算出することができる。いくつかの実施形態では、測定されたか、または別の方法で既知である母親の遺伝子型および/または測定されたか、または別の方法で既知である父親の遺伝子型を用いてその割合を算出することもできる。いくつかの実施形態では、母系DNAと胎児DNAの混合物に対して得た測定値を親の状況の知見と一緒に使用して、パーセント胎児DNAを算出することができる。ある実施形態では、特定の対立遺伝子測定値についての確率についてのモデルを調整するために母集団頻度を使用して胎児DNAの割合を算出することができる。
本開示のある実施形態では、胎児の倍数性状態の決定の正確度について信頼度を算出することができる。ある実施形態では、最大の尤度(Hmajor)の仮説の信頼度を(1−Hmajor)/Σ(全てのH)として算出することができる。仮説の全ての分布が既知である場合、仮説の信頼度を決定することが可能である。親の遺伝子型情報が既知である場合、仮説の全ての分布を決定することが可能である。正倍数性の胎児についての予測されるデータの分布および異数性の胎児についての予測されるデータの分布の知見が既知である場合、倍数性の決定の信頼度を算出することが可能である。親の遺伝子型データが既知である場合、これらの予測される分布を算出することが可能である。ある実施形態では、正常な仮説の周りの検定統計量の分布および異常な仮説の周りの検定統計量の分布の知見を用いて、コールの信頼性を決定すること、ならびに閾値を改良してより信頼できるコールを行うことができる。これは、混合物中の胎児DNAの量および/またはパーセントが低い場合に特に有用である。これは、Z統計量などの検定統計量が、胎児DNAが高いパーセントで存在する場合に対して最適化された閾値に基づいて設けた閾値を超えないことが原因で、実際には異数性である胎児が正倍数性であると見いだされる状況を回避するために役立つ。
ある実施形態では、本明細書に開示されている方法を用いて、母系の遺伝物質と胎児の遺伝物質の混合物中の母系の標的染色体および胎児の標的染色体のコピーの数を決定することによって胎児の異数性を決定することができる。この方法は、母系の遺伝物質と胎児の遺伝物質の両方を含む母系の組織を得るステップを伴ってよく、いくつかの実施形態では、この母系の組織は、母系の血液から単離された母系の血漿または組織であってよい。この方法は、上述の母系の組織を加工することによって、前記母系の組織から母系の遺伝物質と胎児の遺伝物質の混合物を得るステップも伴ってよい。この方法は、標的染色体由来の標的配列を含む個々の反応試料および標的染色体由来の標的配列を含まない個々の反応試料を無作為にもたらすために、得られた遺伝物質を複数の反応試料に分配するステップ、例えば、試料に対してハイスループット配列決定を実施するステップも伴ってよい。この方法は、前記個々の反応試料中に存在するまたは存在しない遺伝物質の標的配列を分析して、反応試料中の正倍数性であると推測される胎児の染色体の存在または不在を示すバイナリーの結果の第1の数、および反応試料中の異数性である可能性がある胎児の染色体の存在または不在を示すバイナリーの結果の第2の数をもたらすステップを伴ってよい。例えば、特定の染色体、染色体の特定の領域、特定の遺伝子座または遺伝子座の集合にマッピングされるシーケンスリードをカウントするインフォマティクス技法によってバイナリーの結果の数のいずれかを算出することができる。この方法は、集団内の染色体の長さ、染色体の領域の長さまたは遺伝子座の数に基づいてバイナリーの事象の数を規格化するステップを包含し得る。この方法は、反応試料中の正倍数性であると推測される胎児の染色体について、第1の数を用いてバイナリーの結果の数の予測される分布を算出するステップを伴ってよい。この方法は、反応試料中の異数性であることが推測される胎児の染色体についてのバイナリーの結果の数の予測される分布を算出するステップであって、第1の数、および混合物において見いだされる胎児DNAの推定される割合を、例えば、正倍数性であると推測される胎児の染色体についてのバイナリーの結果の数の予測リード数分布に(1+n/2)(nは推定される胎児画分である)を掛けることによって用いて算出するステップを伴ってよい。いくつかの実施形態では、シーケンスリードを、バイナリーの結果ではなく、確率的なマッピングで処理することができ、この方法では、より高い正確度がもたらされるが、さらなる計算能力が必要である。胎児画分は、複数の方法によって推定することができ、そのいくつかは、本開示の他の箇所に記載されている。この方法は、最尤手法を用いて、第2の数が、正倍数性であるまたは異数性である、異数性である可能性がある胎児の染色体に対応するかどうかを決定するステップを伴ってよい。この方法は、測定されたデータを考慮して、正確である尤度が最大である仮説に対応する倍数性状態である胎児の倍数性状態をコールするステップを包含し得る。
最尤モデルを用いて、胎児の倍数性状態を決定する任意の方法の正確度を上昇させることができることに留意されたい。同様に、胎児の倍数性状態を決定する任意の方法について信頼度を算出することができる。最尤モデルを用いることにより、単一仮説棄却法を用いて倍数性の決定を行う任意の方法の正確度が改善される。最尤モデルは、正常な場合と異常な場合の両方について尤度分布を算出することができる任意の方法に用いることができる。最尤モデルを用いることは、倍数性コールについての信頼度を算出する能力を意味する。
方法のさらなる考察
ある実施形態では、本明細書に開示されている方法では、多型遺伝子座の各対立遺伝子の独立した観察の数の定量的尺度を利用し、ここで、これには対立遺伝子の比を算出するステップは包含されない。これは、遺伝子座の2つの対立遺伝子の比に関する情報をもたらすが、いずれかの対立遺伝子の独立した観察の数を定量化しない、一部のマイクロアレイに基づく方法などの方法とは異なる。当技術分野で公知のいくつかの方法では、独立した観察の数に関する定量的情報がもたらされ得るが、倍数性の決定をもたらす算出には対立遺伝子の比のみを利用し、定量的情報は利用しない。独立した観察の数に関する情報を保持することの重要性を例示するために、2つの対立遺伝子、AおよびBを有する試料の遺伝子座について考察する。第1の実験では20の対立遺伝子Aおよび20の対立遺伝子Bを観察し、第2の実験では200の対立遺伝子Aおよび200の対立遺伝子Bを観察する。どちらの実験でも、比(A/(A+B))は0.5と等しいが、第2の実験は、第1の実験よりも対立遺伝子AまたはBの頻度の確実性に関する多くの情報を伝える。当該方法では、対立遺伝子の比を利用するのではなく、定量的データを使用して、各多型遺伝子座における最も可能性が高い対立遺伝子頻度をより正確にモデリングする。
ある実施形態では、当該方法では、複数の多型遺伝子座からの測定値を総計するための遺伝子モデルを構築して、トリソミーとダイソミーをよりよく区別し、トリソミーの種類も決定する。さらに、当該方法では、遺伝連鎖情報を組み入れて、方法の正確度を増強する。これは、対立遺伝子の比を染色体上の多型遺伝子座の全てにわたって平均する、当技術分野で公知のいくつかの方法とは対照的である。本明細書に開示されている方法により、ダイソミーにおいて予測される対立遺伝子頻度分布、ならびに、減数分裂Iの間の染色体不分離、減数分裂IIの間の染色体不分離、および胎児発生の初期の有糸分裂の間の染色体不分離によって生じるトリソミーが明確にモデリングされる。なぜこれが重要であるかを例示すると、乗換えがなければ、減数分裂Iの間の染色体不分離により、2つの異なる相同体が一方の親から遺伝によって受け継がれたトリソミーがもたらされ、減数分裂IIの間、または胎児発生の初期の有糸分裂の間の染色体不分離により、一方の親由来の同じ相同体の2つのコピーがもたらされることになる。各筋書きにより、各多型遺伝子座において、および、一緒に考慮に入れたすべの物理的に連鎖した遺伝子座(すなわち同じ染色体上の遺伝子座)においても予測される対立遺伝子の異なる頻度がもたらされる。相同体間での遺伝物質の交換をもたらす乗換えにより、遺伝様式がより複雑になるが、当該方法は、遺伝連鎖情報、すなわち組換え率の情報および遺伝子座間の物理的な距離を使用することによってこれに対して適応する。減数分裂I時の染色体不分離と減数分裂IIまたは有糸分裂時の染色体不分離をよりよく区別するために、当該方法では、乗換えの確率の上昇をセントロメアからの距離の増加としてモデルに組み入れる。減数分裂IIおよび有糸分裂時の染色体不分離は、有糸分裂時の染色体不分離により、一般には、1つの相同体の同一またはほぼ同一のコピーがもたらされるが、一方、減数分裂II時の染色体不分離事象の後に存在する2つの相同体は、多くの場合、配偶子形成の間の1つまたは複数の乗換えに起因して異なるという事実によって区別することができる。
ある実施形態では、本開示の方法では、ダイソミーを仮定する場合、親のハプロタイプを決定することができない。ある実施形態では、トリソミーの場合、当該方法により、血漿が一方の親由来の2つのコピーを取り、親の相情報は、2つのコピーが問題の親から遺伝によって受け継がれたいずれによっても決定することができないという事実を用いることによって、一方の親または両親のハプロタイプに関する決定を行うことができる。詳細には、子は、親の2つの同じコピー(一致トリソミー)または親の両方のコピー(不一致トリソミー)のいずれかを遺伝によって受け継ぐことができる。各SNPにおいて、一致トリソミーの尤度および不一致トリソミーの尤度を算出することができる。乗換えを考慮している連鎖モデルを使用しない倍数性コール方法では、トリソミーの全体的な尤度を、染色体全体にわたって一致トリソミーおよび不一致トリソミーの単純な重み付けられた平均として算出する。しかし、乗換えが存在する場合にのみ、分離エラーおよび乗換えをもたらす生物学的な機構に起因して、トリソミーは、染色体上で一致から不一致に変化し得る(および逆もまた同じ)。当該方法は、確率的に、乗換えの尤度を考慮に入れ、その結果、乗換えの尤度を考慮に入れない方法よりも正確度が高い倍数性コールがもたらされる。
ある実施形態では、参照染色体を使用して子の割合およびノイズレベルの量または確率分布を決定する。ある実施形態では、子の割合、ノイズレベル、および/または確率分布を、倍数性の状態が決定される染色体から入手可能な遺伝子情報のみを使用して決定する。当該方法は、参照染色体を伴わずに、ならびに特定の子の割合またはノイズレベルの固定を伴わずに機能する。これは、子の割合および染色体の挙動を較正するために参照染色体由来の遺伝子データが必要な、当技術分野で公知の方法の有意な改善であり、また、それと異なる点である。
胎児画分を決定するために参照染色体を必要としないある実施形態では、仮説の決定を以下の通り行う:
参照染色体を用いるアルゴリズムでは、一般には、参照染色体はダイソミーであると仮定し、次いで、(a)最も可能性が高い子の割合およびランダムなノイズレベルNを、この仮定および参照染色体のデータに基づいて固定し:
とし、次いで、LIK(D|H)=LIK(D|H,cfr,N)として換算するか、または、
(b)この仮定および参照染色体のデータに基づいて、子の割合およびノイズレベルの分布を推定する。詳細には、cfrおよびNについてただ1つの値に固定しないが、確率p(cfr,N)を可能性のあるcfr、N値の広い範囲に割り当てる:
p(cfr,N)〜LIK(D(ref.chrom)|H11,cfr,N)*priorprob(cfr,N)
式中、priorprob(cfr,N)が特定の子の割合およびノイズレベルの事前確率であり、以前の知見および実験によって決定される。場合によっては、cfr,Nの範囲にわたって一様にする。次いで、
と書くことができる。上記のどちらの方法も良好な結果をもたらす。
いくつかの場合には、参照染色体を使用することは望ましくない、可能でない、または実行可能でないことがあることに留意されたい。そのような場合には、各染色体について最良の倍数性コールを別々に導くことが可能である。詳細には:
p(cfr,N|H)は、各染色体について別々に、単に参照染色体についてダイソミーであると仮定するのではなく、仮説Hを仮定して、上記の通り決定することができる。この方法を用いて、固定されたノイズのパラメータと子の画分のパラメータ両方を保持すること、いずれかのパラメータを固定すること、または両方のパラメータを各染色体および各仮説について確率的な形態で保持することが可能である。
DNAの測定、特にDNAの量が少ない場合、またはDNAが混入DNAと混在している場合の測定は、ノイズが入りかつ/または誤りがちである。このノイズにより、正確度が低い遺伝子型データ、および正確度が低い倍数性コールが得られる。いくつかの実施形態では、プラットフォームのモデリングまたはいくつかの他のノイズモデリングの方法を用いて、倍数性の決定に対するノイズの有害作用をカウントすることができる。当該方法では、両チャネルの同時モデル(joint model)を用い、入力DNAの量、DNAの質、および/またはプロトコールの質に起因するランダムなノイズを考慮する。
これは、遺伝子座における対立遺伝子の強度の比を用いて倍数性の決定を行う、当技術分野で公知のいくつかの方法とは対照的である。この方法は、正確なSNPノイズモデリングを妨げる。詳細には、測定におけるエラーは、一般には、測定されたチャネル強度比に特異的に依存せず、モデルを、一次元の情報を使用するように縮小する。ノイズ、チャネルの質およびチャネルの相互作用の正確なモデリングには、対立遺伝子の比を用いてモデリングすることができない2次元の同時モデルが必要である。
詳細には、2つのチャネル情報を、f(x,y)がr=x/yである比rに投影すること自体は、正確なチャネルノイズおよび偏りのモデリングに役立たない。特定のSNPにおけるノイズは、比率の関数ではない、すなわちノイズ(x,y)≠f(x,y)であるが、実際には、両方のチャネルの同時関数(joint function)である。例えば、二項式モデルでは、測定された比率のノイズはr(1−r)/(x+y)の分散を有し、これは、純粋にrの関数ではない。任意のチャネルの偏りまたはノイズが包含されるモデルでは、SNPiにおいて、観察されたチャネルX値はx=aX+bであると仮定し、ここで、Xは真のチャネル値であり、bは余分のチャネルの偏りおよびランダムなノイズである。同様に、y=cY+dと仮定する。(aX+b)/(cY+d)はX/Yの関数ではないので、観察された比r=x/yでは、真の比率X/Yを正確に予測することまたは残りのノイズをモデリングすることができない。
本明細書に開示されている方法には、個々の測定チャネルの全ての同時二項分布を使用したノイズおよび偏りの有効なモデリングの方法が記載されている。関連性のある式は、文書の他の箇所、SNPの挙動を有効に調整するSNP当たりの一貫した偏り、P(good)およびP(ref|bad)、P(mut|bad)について記載されているセクションに見いだすことができる。ある実施形態では、本開示の方法では、対立遺伝子の比のみに依拠する、実施による限定を回避し、その代わりに、挙動を両方のチャネル計数値に基づいてモデリングするベータ二項分布を使用する。
ある実施形態では、本明細書に開示されている方法により、全ての利用可能な測定値を使用することによって、母系の血漿中に見いだされる遺伝子データから妊娠中の胎児の倍数性をコールすることができる。ある実施形態では、本明細書に開示されている方法により、親の状況のサブセットのみからの測定値を使用することによって、母系の血漿中に見いだされる遺伝子データから妊娠中の胎児の倍数性をコールすることができる。当技術分野で公知のいくつかの方法では、親の状況がAA|BB状況からのものである場合、すなわち所与の遺伝子座において親がどちらもホモ接合性であるが、対立遺伝子が異なる場合に測定された遺伝子データのみを使用する。この方法に伴う1つの問題は、AA|BB状況からの多型遺伝子座の割合が小さく、一般には、10%未満であることである。本明細書に開示されている方法のある実施形態では、方法は、親の状況がAA|BBである遺伝子座において行われた母系の血漿の遺伝子測定値を使用しない。ある実施形態では、当該方法では、親の状況がAA|AB、AB|AA、およびAB|ABである多型遺伝子座についてのみ血漿測定値を使用する。
当技術分野で公知のいくつかの方法は、両親の遺伝子型が存在するAA|BB状況におけるSNPからの対立遺伝子の比を平均し、これらのSNPにおける平均の対立遺伝子の比から倍数性コールの決定を主張するステップを包含する。この方法は、示差的なSNPの挙動に起因して著しく不正確である。この方法では、両親の遺伝子型が既知であることを仮定することに留意されたい。対照的に、いくつかの実施形態では、当該方法では、親のいずれかの存在を仮定せず、均一なSNPの挙動を仮定しない、同時チャネル分布モデルを使用する。いくつかの実施形態では、当該方法では、異なるSNPの挙動/重み付けを考慮に入れる。いくつかの実施形態では、当該方法は、一方の親または両親の遺伝子型の知見を必要としない。当該方法がどのようにこれを実現するかの例は以下の通りである:
いくつかの実施形態では、仮説の対数尤度をSNPごとに決定することができる。特定のSNPiについて、胎児の倍数性についての仮説Hおよびパーセント胎児DNAcfを仮定すると、観察されたデータDの対数尤度は:
と定義され、式中、mは可能性のある真の母親の遺伝子型であり、fは可能性のある真の父親の遺伝子型であり、m,f∈{AA,AB,BB}であり、cは、仮説Hを考慮した、可能性のある子の遺伝子型である。詳細には、モノソミーについてはc{A,B}であり、ダイソミーについてはc∈{AA,AB,BB}であり、トリソミーについてはc∈{AAA,AAB,ABB,BBB}である。親の遺伝子型データを含めることにより、一般には、より正確な倍数性の決定がもたらされるが、当該方法が良好に機能するために親の遺伝子型データは必須ではないことに留意されたい。
当技術分野で公知のいくつかの方法は、母親がホモ接合性であるが、血漿において異なる対立遺伝子が測定される(AA|ABまたはAA|BBの状況)SNPからの対立遺伝子の比を平均し、これらのSNPにおける平均の対立遺伝子の比から倍数性コールの決定を主張するステップを包含する。この方法は、父系の遺伝子型が入手不可能である場合を意図している。ホモ接合性で反対の父親BBの存在を伴わずに、血漿が特定のSNPにおいてヘテロ接合性であることをどのくらい正確に主張することができるかどうかは疑問であることに留意されたい:子の割合が少ない場合、対立遺伝子Bが存在するように見えるのは、単にノイズの存在である場合があり、さらに、Bが存在しないように見えるのは、胎児の測定値のうちの単純対立遺伝子のドロップアウトである場合もある。さらには、血漿のヘテロ接合性を実際に決定することができる場合であっても、この方法では、父系トリソミーを区別することができない。詳細には、母親がAAであるSNP、および血漿においていくらかのBが測定されるSNPについて、父親がGGである場合、生じた子の遺伝子型はAGGであり、平均の比は33%のAになる(子の割合=100%)。しかし、父親がAGである場合には、生じた子の遺伝子型は、一致トリソミーについてはAGGであってもよく、33%のAの比を与える、または不一致トリソミーについてはAAGであってもよく、平均の比についてさらに66%に近いAが得られる。多くのトリソミーが乗換えを伴って染色体上にあるとすれば、全体的な染色体は、不一致トリソミーが全くないところと全てが不一致トリソミーであるところとの間のいずれの場合もあり、この比率は、33〜66%の間のいずれにも変動し得る。通常のダイソミーについては、比率は約50%であるはずである。連鎖モデルまたは平均の正確なエラーモデルを使用しないと、この方法では多くの場合、父系トリソミーが見落とされる。対照的に、本明細書に開示されている方法では、利用可能な遺伝子型の情報および母集団頻度に基づいて、各親の遺伝子型の候補に対して親の遺伝子型の確率を割り当て、親の遺伝子型を明確に必要としない。さらに、本明細書に開示されている方法により、親の遺伝子型データの不在下または存在下でさえもトリソミーを検出することができ、また、連鎖モデルを使用して可能性のある一致トリソミーから不一致トリソミーへの乗換えの点を同定することによって補償することができる。
当技術分野で公知のいくつかの方法は、母系の遺伝子型も父系の遺伝子型も未知であるSNPからの対立遺伝子の比を平均するため、および、これらのSNPにおける平均の比から倍数性コールを決定するための方法を主張する。しかし、これらの目的を実現する方法は開示されていない。本明細書に開示されている方法により、そのような状況において正確な倍数性コールを行うことができ、同時確率最尤法を用い、必要に応じて、SNPノイズおよび偏りのモデル、ならびに連鎖モデルを利用する実施化が本文書の他の箇所に開示されている。
当技術分野で公知のいくつかの方法は、対立遺伝子の比を平均し、1つまたは少数のSNPにおける平均の対立遺伝子の比からの倍数性コールの決定を主張するステップを包含する。しかし、そのような方法では、連鎖の概念を利用しない。本明細書に開示されている方法にはこれらの欠点がない。
DNAの起源を決定するための事前として配列の長さを使用すること
配列の長さの分布は母系DNAと胎児DNAで異なり、胎児の方が一般に短いことが報告されている。本開示のある実施形態では、以前の知見を経験的なデータの形態で用い、母親のDNA(P(X|母系))と胎児DNA(P(X|胎児))の両方の予測される長さの事前分布を構築することが可能である。長さxの新しい未確認のDNA配列を考慮すると、母系または胎児のいずれかを考慮したxの事前尤度に基づいて、DNAの所与の配列が母系DNAまたは胎児DNAのいずれかである確率を定めることが可能である。詳細には、P(x|母系)>P(x|胎児)である場合は、DNA配列を母系に分類することができ、P(x|母系)=P(x|母系)/[(P(x|母系)+P(x|胎児)]であり、p(x|母系)<p(x|胎児)である場合は、DNA配列を胎児に分類することができ、P(x|胎児)=P(x|胎児)/[(P(x|母系)+P(x|胎児)]である。本開示のある実施形態では、その試料に対して特異的である母系の配列の長さおよび胎児の配列の長さの分布を、高い確率で母系または胎児に割り当てることができる配列を考慮に入れることによって決定することができ、次いで、その試料に特異的な分布を、その試料についての予測されるサイズ分布として用いることができる。
配列決定の費用を最小限にするための可変性のリード深度
診断薬に関する多くの臨床試験、例えば、ChiuらBMJ、2011年:342巻:c7401頁では、いくつものパラメータを用いるプロトコールを設定し、次いで、試験における患者のそれぞれに対して同じパラメータを用いて同じプロトコールを実行する。遺伝物質を測定するための方法として配列決定を用いて母親が妊娠中の胎児の倍数性の状態を決定する場合には、1つの関係するパラメータはリード数である。リード数とは、実際のリード数、意図されたリード数、シーケンサーの分割レーン、完全なレーンまたは完全なフローセルを指し得る。これらの試験では、リード数は、一般には、全てまたはほぼ全ての試料が正確度の所望のレベルを実現することを確実にするレベルで設定する。配列決定は、現在のところ費用のかかる技術であり、マッピング可能な500万リード当たりおよそ$200の費用がかかり、一方価格が下がると、同様のレベルの正確度で作動するがリードが少ない配列決定に基づく診断を可能にする任意の方法により、かなりの量の金が必ず節約される。
倍数性の決定の正確度は、一般には、リード数および混合物中の胎児DNAの割合を含めたいくつもの因子に左右される。正確度は、一般には、混合物中の胎児DNAの割合がより多いほどより高い。同時に、正確度は、一般には、リード数がより多いほどより高い。匹敵する正確度で倍数性の状態を決定する2つの場合を伴う状況を有することが可能であり、第1の場合には第2の場合よりも混合物中の胎児DNAの割合がより少なく、第1の場合には第2の場合よりも多くのリードが配列決定される。混合物中の胎児DNAの推定される割合を、所与のレベルの正確度を実現するために必要なリード数を決定することにおけるガイドとして使用することが可能である。
本開示のある実施形態では、試料の集合を、集合内の異なる試料が異なるリード深度に配列決定される場合に実行することができ、試料のそれぞれに対して実行されるリード数は、各混合物において算出された胎児DNAの割合を考慮して、所与のレベルの正確度が実現されるように選択する。本開示のある実施形態では、これは、混合物中の胎児DNAの割合を決定するために混合試料の測定を行うことを伴ってよく、この胎児画分の推定は、配列決定を用いて行うことができ、TAQMANを用いて行うことができ、qPCRを用いて行うことができ、SNPアレイを用いて行うことができ、所与の遺伝子座における異なる対立遺伝子を区別することができる任意の方法を用いて行うことができる。胎児画分を推定することの必要性は、実際の測定データと比較する際に考慮される仮説の集合内の全てのまたは選択された胎児画分の集合を包含する仮説を含めることによって排除することができる。混合物中の胎児DNAの割合を決定した後、各試料について読み取られる配列の数を決定することができる。
本開示のある実施形態では、妊娠中の女性100人が各人のOBに来診し、抗lysant(anti−lysant)および/またはDNAアーゼを不活化するものが入った血液チューブ中に各人の血液を採取する。該女性はそれぞれ、自身が妊娠中の胎児の父親が唾液試料を提供するためのキットを家に持ち帰る。100組の夫婦全てについての両者の遺伝物質の集合を検査室に送り返し、そこで母親の血液を遠心沈澱させ、血漿だけでなくバフィーコートも単離する。血漿は、母系DNAならびに胎盤に由来するDNAの混合物を含む。母系のバフィーコートおよび父系の血液についてSNPアレイを使用して遺伝子型決定し、母系の血漿試料中のDNAを、SURESELECTハイブリダイゼーションプローブを用いて標的とする。プローブを用いてプルダウンされたDNAを使用して、母体試料のそれぞれに対するものであり、各試料に異なるタグでタグ付けした、タグ付けしたライブラリーを100個生成する。各ライブラリーからの一部分を取り出し、それらの一部分のそれぞれを一緒に混合し、ILLUMINA HISEQ DNAシーケンサーの2つのレーンに多重様式で加え、各レーンからおよそ5,000万のマッピング可能なリードがもたらされ、100の多重化混合物においておよそ1億のマッピング可能なリード、または試料当たりおよそ100万のリードがもたらされた。シーケンスリードを使用して、各混合物中の胎児DNAの割合を決定した。50の試料が、混合物中15%超の胎児DNAを有し、100万のリードが、99.9%の信頼度で胎児の倍数性の状態を決定するために十分であった。
残りの混合物のうち、25個が10%から15%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる200万のリードを生成した。10%から15%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた試料当たり300万のリードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。
残りの混合物のうち、13個が6%から10%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの画分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる400万のリードを生成した。6%から10%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた混合物当たり500万の総リードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。
残りの混合物のうち、8つが4%から6%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる600万のリードを生成した。4%から6%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた混合物当たり700万の総リードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。
残りの4つの混合物のうちの全てが2%から4%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる1200万のリードを生成した。2%から4%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた混合物当たり1300万の総リードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。
この方法では、試料100個にわたって99.9%の正確度を実現するために、HISEQ機械で配列決定するための6レーンが必要であった。あらゆる試料に対して同じ数の実行が必要である場合、あらゆる倍数性の決定が99.9%の正確度で行われることを確実にするためには、配列決定に25レーンが取られ、4%のコールなしの比または誤差率を許容する場合、14レーンの配列決定で実現することができた。
未加工の遺伝子型決定データの使用
母系の血液中に見いだされる胎児DNAにおいて測定された胎児の遺伝子情報を使用してNPDを実現できるいくつもの方法が存在する。これらの方法のいくつかは、SNPアレイを使用して胎児DNAの測定を行うことを包含し、いくつかの方法は非標的化配列決定を包含し、いくつかの方法は標的化配列決定を包含する。標的化配列決定ではSNPを標的とすることができ、STRを標的とすることができ、他の多型遺伝子座を標的とすることができ、非多型の遺伝子座またはそのいくつかの組み合わせを標的とすることができる。これらの方法のいくつかは、測定を行う機械のセンサーによってもたらされる強度データから対立遺伝子の同一性をコールする、商業的なまたは専有の対立遺伝子コーラーを使用することを含めてよい。例えば、ILLUMINA INFINIUMシステムまたはAFFYMETRIX GENECHIPマイクロアレイシステムは、DNAの相補的なセグメントとハイブリダイズすることができるDNA配列を付着させたビーズまたはマイクロチップを含み、ハイブリダイゼーションすると、センサー分子の蛍光性が変化し、それを検出することができる。配列決定方法、例えば、ILLUMINA SOLEXA GENOME SEQUENCERまたはABI SOLID GENOME SEQUENCERもあり、これは、DNAの断片の遺伝子配列について配列決定し、配列決定される鎖と相補的なDNAの鎖が伸長すると、伸長したヌクレオチドの同一性が、一般には、相補的なヌクレオチドに付加した蛍光性タグまたは放射性タグを介して検出される。これらの方法の全てにおいて、遺伝子型データまたは配列決定データは、一般には、蛍光もしくは他のシグナルまたはそれがないことに基づいて決定される。これらのシステムは、一般には、蛍光または他の検出デバイスのアナログ出力(一次遺伝子データ)から特定の対立遺伝子のコール(二次遺伝子データ)を行う低レベルのソフトウェアパッケージと組み合わせる。例えば、SNPアレイ上の所与の対立遺伝子の場合には、該ソフトウェアにより、蛍光強度がある特定の閾値を上回る、または下回る量である場合に、特定のSNPが存在するまたは存在しないというコールを行う。同様に、シーケンサーの出力は、色素のそれぞれについて検出された蛍光のレベルを示すクロマトグラムであり、該ソフトウェアにより、特定の塩基対が、AもしくはTまたはCもしくはGであるというコールを行う。ハイスループットシーケンサーにより、一般には、リードと称される一連のそのような測定が行われ、配列決定された、最も可能性が高いDNA配列の構造が示される。クロマトグラムの直接的なアナログ出力は、本明細書では一次遺伝子データであると定義され、該ソフトウェアによって行われる塩基対/SNPのコールは、本明細書では二次遺伝子データとみなされる。ある実施形態では、一次データとは、遺伝子型決定プラットフォームの加工されていない出力である生の強度データを指し、遺伝子型決定プラットフォームとは、SNPアレイまたは配列決定プラットフォームを指し得る。二次遺伝子データとは、加工された遺伝子データであって、対立遺伝子のコールが行われている、または配列データが塩基対に割り当てられている、かつ/またはシーケンスリードがゲノムにマッピングされているデータを指す。
多くのより高レベルの適用では、これらの対立遺伝子のコール、SNPのコールおよびシーケンスリード、すなわち遺伝子型決定ソフトウェアにより生じる二次遺伝子データを活用する。例えば、DNA NEXUS、ELANDまたはMAQでシーケンシングリードを取得し、それらをゲノムにマッピングする。例えば、非侵襲的な出生前診断との関連において、複雑なインフォマティクス、例えば、PARENTAL SUPPORT(商標)は、個体の遺伝子型を決定するための多数のSNPのコールに影響を及ぼし得る。また、着床前遺伝子診断との関連において、ゲノムにマッピングされるシーケンスリードの集合を取得することが可能であり、各染色体または染色体のセクションにマッピングされる正規化されたリード数を取得することにより、個体の倍数性の状態を決定することが可能であり得る。非侵襲的な出生前診断との関連において、母系の血漿中に存在するDNAにおいて測定されたシーケンスリードの集合を取得し、それらをゲノムにマッピングすることが可能であり得る。次いで、各染色体または染色体のセクションにマッピングされる正規化されたリード数を取得し、そのデータを使用して、個体の倍数性の状態を決定することができる。例えば、不釣り合いに多数のリードを有する染色体は、血液を抜き取った母親が妊娠中の胎児においてトリソミーであると結論づけることが可能であり得る。
しかし、実際には、測定計器からの最初の出力は、アナログシグナルである。特定の塩基対を、配列決定ソフトウェアに関連するソフトウェア、例えば、塩基対Tをコールすることができるソフトウェアによってコールする場合、実際には、そのコールは、該ソフトウェアにより可能性が最も高いと考えられるコールである。しかし、いくつかの場合には、コールは低信頼度であってもよく、例えば、アナログシグナルにより、特定の塩基対が、Tである可能性が90%だけであり、Aである可能性が10%であることが示される場合もある。別の例では、SNPアレイリーダーに付随する遺伝子型コールソフトウェアにより、特定の対立遺伝子がGであることがコールされる場合もある。しかし、実際には、基礎をなすアナログシグナルにより、対立遺伝子がGである可能性が70%だけであり、対立遺伝子がTである可能性が30%であることが示される場合もある。これらの場合には、より高レベルの適用においてより低レベルのソフトウェアによって行った遺伝子型のコールおよび配列のコールを用いる場合、一部の情報が失われる。すなわち、遺伝子型決定プラットフォームによって直接測定される一次遺伝子データは、添付のソフトウェアパッケージによって決定される二次遺伝子データよりも厄介であり得るが、それはより多くの情報を含有する。二次遺伝子データ配列のゲノムへのマッピングにおいて、一部の塩基が十分に明瞭に読み取られていないので、または、マッピングが明瞭ではないので、多くのリードが捨てられる。一次遺伝子データシーケンスリードを使用する場合、二次遺伝子データシーケンスリードに最初に変換された際に捨てられた可能性があるリードの全てまたはその多くを、リードを確率的に処理することによって使用することができる。
本開示のある実施形態では、より高レベルのソフトウェアは、より低いレベルのソフトウェアによって決定される対立遺伝子のコール、SNPのコールまたはシーケンスリードに依拠しない。その代わりに、より高レベルのソフトウェアは、遺伝子型決定プラットフォームから直接測定されたアナログシグナルにその算出の基礎を置く。本開示のある実施形態では、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)を、胚/胎児/子の遺伝子データを再構築するその能力が、遺伝子型決定プラットフォームによって測定された一次遺伝子データを直接使用するように工学的に操作されるように改変する。本開示のある実施形態では、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)では、一次遺伝子データを使用し、二次遺伝子データを使用せずに、対立遺伝子のコール、および/または染色体コピー数のコールを行うことができる。本開示のある実施形態では、遺伝子のコール、SNPのコール、すべてのシーケンスリード、配列マッピングを、一次遺伝子データを二次的な遺伝子のコールに変換するのではなく、遺伝子型決定プラットフォームによって直接測定された生の強度データを使用することによって確率的に処理する。ある実施形態では、対立遺伝子数の確率を算出するステップおよび各仮説の相対的確率を決定するステップにおいて使用する調製された試料からのDNA測定値は、一次遺伝子データを含む。
いくつかの実施形態では、前記方法により、少なくとも1つの関連する個体の遺伝子データを組み入れる、標的個体の遺伝子データの正確度を上昇させることができ、前記方法は、標的個体のゲノムに特異的な一次遺伝子データおよび関連する個体(複数可)のゲノム(複数可)に特異的な遺伝子データを得るステップと、関連する個体(複数可)由来のどの染色体のセグメントが、標的個体のゲノム内のそれらのセグメントに対応する可能性があるかに関する1個または複数個の仮説の集合を作製するステップと、標的個体の一次遺伝子データおよび関連する個体(複数可)の遺伝子データを考慮して仮説のそれぞれの確率を決定するステップと、各仮説に関連する確率を用いて、実際の標的個体の遺伝物質の最も可能性が高い状態を決定するステップとを含む。いくつかの実施形態では、前記方法により、標的個体のゲノム内の染色体のセグメントのコピーの数を決定することができ、前記方法は、どのくらいの染色体セグメントのコピーが標的個体のゲノム内に存在するかに関するコピー数についての仮説の集合を作製するステップと、標的個体からの一次遺伝子データおよび1つまたは複数の関連する個体からの遺伝子情報をデータ集合に組み入れるステップと、データ集合に関連するプラットフォームの応答の特性を推定するステップであって、プラットフォームの応答が、ある実験と別の実験で変動し得るステップと、データ集合およびプラットフォームの応答特性を考慮して、コピー数についての仮説のそれぞれの相対的確率を計算するステップと、最も可能性の高いコピー数についての仮説に基づいて染色体セグメントのコピー数を決定するステップとを含む。ある実施形態では、本開示の方法は、標的個体の少なくとも1つの染色体の倍数性の状態を決定することができ、前記方法は、標的個体から、および1つまたは複数の関連する個体から、一次遺伝子データを得るステップと、標的個体の染色体のそれぞれについて、少なくとも1つの倍数性の状態についての仮説の集合を作製するステップと、1つまたは複数の専門技法を用いて、集合内の倍数性の状態についての仮説のそれぞれの統計的確率を決定するステップと、使用した専門技法のそれぞれについて、得られた遺伝子データを考慮して、倍数性の状態についての仮説のそれぞれについて、1つまたは複数の専門技法によって決定された統計的確率を組み合わせるステップと、標的個体の染色体のそれぞれについて、倍数性の状態についての仮説のそれぞれについての複合統計確率に基づいて倍数性の状態を決定するステップとを含む。ある実施形態では、本開示の方法は、対立遺伝子の集合において、標的個体において、および標的個体の一方の親または両親から、および必要に応じて、1つまたは複数の関連する個体から、対立遺伝子の状態を決定することができ、前記方法は、標的個体から、および一方の親または両親から、および任意の関連する個体から一次遺伝子データを得るステップと、標的個体について、および一方の親または両親について、および必要に応じて、1つまたは複数の関連する個体について、少なくとも1つの対立遺伝子についての仮説の集合を作製するステップであって、仮説が対立遺伝子の集合における可能性のある対立遺伝子の状態を記載するステップと、仮説の集合内の各対立遺伝子についての仮説について統計的確率を、得られた遺伝子データを考慮して決定するステップと、対立遺伝子の集合内の対立遺伝子のそれぞれについて、標的個体について、および一方の親または両親について、および必要に応じて、1つまたは複数の関連する個体について、対立遺伝子についての仮説のそれぞれの統計的確率に基づいて対立遺伝子の状態を決定するステップとを含む。
いくつかの実施形態では、混合試料の遺伝子データは、配列データを含んでよく、ここで、配列データは、ヒトゲノムに独自にマッピングされない場合がある。いくつかの実施形態では、混合試料の遺伝子データは、配列データを含んでよく、ここで、配列データは、ゲノム内の複数の場所にマッピングされ、ここで、可能性のあるマッピングのぞれぞれは、所与のマッピングが正確である確率を伴う。いくつかの実施形態では、シーケンスリードは、ゲノム内の特定の位置に関連づけられると仮定されない。いくつかの実施形態では、シーケンスリードは、ゲノム内の複数の位置に関連づけられ、付随する確率はその位置に属する。
染色体コピー数を決定する計数法
一態様では、本発明は、異なる染色体に整列させた配列タグの数を比較することにより、胎児染色体の異常分布を検査する方法を特徴とする(例えば、2012年4月20日出願の米国特許第8,296,076号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)。当技術分野で知られているように、用語の「配列タグ」は、例えば、染色体またはゲノム領域または遺伝子にマップされる一定のより大きな配列を特定するために使用できる比較的短い(例えば、15〜100)核酸配列を意味する。いくつかの実施形態では、前記方法は、(i)母系および胎児DNAの混合物を含む試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップであって、標的遺伝子座が複数の異なる染色体由来であり、複数の異なる染色体が試料中で異常分布を有すると疑われる少なくとも1個の第1の染色体および試料中で正常分布であると推定される少なくとも1個の第2の染色体を含むステップと、(ii)反応混合物をプライマー伸長反応条件に供して増幅産物を生成するステップと、(iii)増幅産物をシークエンシングして標的遺伝子座に整列した複数の、特異的標的遺伝子座を割り付けるのに十分な長の配列タグを得るステップと、(iv)コンピュータで複数の配列タグをそれらの対応する標的遺伝子座に割り付けるステップと、(v)第1の染色体の標的遺伝子座に整列した配列タグの数および第2の染色体の標的遺伝子座に整列した配列タグの数をコンピュータで決定するステップと、(vi)ステップ(v)からの数を比較して第1の染色体の異常分布の存在の有無を判定するステップとを含む。
一態様では、本発明は、染色体間の標的増幅産物の相対度数を比較することにより、胎児の異数性の存在の有無を検出する方法を提供する(例えば、2012年1月23日出願の国際公開第WO2012/103031号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)。いくつかの実施形態では、前記方法は、(i)母系および胎児DNAの混合物を含む試料を、複数の異なる染色体由来の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる非多形標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、(ii)反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、(iii)第1と第2の対象染色体由来の標的増幅産物の相対度数をコンピュータで定量化するステップと、(iv)第1と第2の対象染色体由来の標的増幅産物の相対度数をコンピュータで比較するステップと、(v)第1と第2の対象染色体の比較結果の相対度数に基づいて異数性の存在の有無を特定するステップとを含む。いくつかの実施形態では、第1の染色体は、正倍数体と疑われる染色体である。いくつかの実施形態では、第2の染色体は、異数性であると疑われる染色体である。
出生前診断の組み合わせ方法
異数性または他の遺伝的欠陥を出生前診断または出生前スクリーニングするために用いることができる多くの方法が存在する。本文書の他の箇所、ならびに、2006年11月28日に出願された米国実用新案出願第11/603,406号;2008年3月17日に出願された米国実用新案出願第12/076,348号、およびPCT出願第PCT/S09/52730号に、関連する個体の遺伝子データを使用して、胎児などの標的個体の遺伝子データが公知であるまたは推定される正確度を上昇させる方法の1つが記載されている。出生前診断のために用いる他の方法は、母系の血液中の、種々の遺伝子の異常と相関する特定のホルモンのレベルを測定するステップを包含する。この例はトリプルテストと称される、母系の血液中のいくつか(一般に、2つ、3つ、4つまたは5つ)の異なるホルモンのレベルを測定する検査である。複数の方法を用いて所与の転帰の尤度を決定し、どの方法もそれ自体が決定的でない場合には、これらの方法によって生じる情報を組み合わせて、個々の方法のいずれよりも正確な予測を行うことが可能である。トリプルテストでは、3つの異なるホルモンから生じる情報を組み合わせることにより、個々のホルモンレベルにより予測され得るよりも正確な遺伝子の異常の予測がもたらされ得る。
本明細書には、胎児の遺伝子の状態、詳細には、胎児における遺伝子の異常の可能性に関してより正確な予測を行うための方法であって、種々の方法を用いて行った胎児における遺伝子の異常の予測を組み合わせること含む方法が開示されている。「より正確な」方法とは、所与の偽陽性率において、偽陰性率がより低い、異常を診断するための方法を指し得る。好ましい本開示の実施形態では、予測のうちの1つまたは複数を、胎児に関する公知の遺伝子データに基づいて行い、遺伝子の知見はPARENTAL SUPPORT(商標)法を使用して決定した、すなわち、胎児に関連する個体の遺伝子データを使用して、胎児の遺伝子データをより高い正確度で決定した。いくつかの実施形態では、遺伝子データは、胎児の倍数性の状態を含んでよい。いくつかの実施形態では、遺伝子データとは、胎児のゲノムにおける対立遺伝子のコールの集合を指し得る。いくつかの実施形態では、予測のいくつかは、トリプルテストを用いて行われた。いくつかの実施形態では、予測のいくつかを、母系の血液中の他のホルモンレベルの測定値を用いて行った。いくつかの実施形態では、診断を考慮する方法によって行われる予測を、スクリーニングを考慮する方法によって行われる予測と組み合わせることができる。いくつかの実施形態では、前記方法は、アルファ−フェトプロテイン(AFP)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、コンジュゲートしていないエストリオール(UE)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、ベータヒト絨毛性ゴナドトロピン(ベータ−hCG)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、浸潤性トロホブラスト抗原(ITA)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、インヒビンの母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、妊娠関連血漿タンパク質A(PAPP−A)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、他のホルモンまたは母系の血清マーカーの母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、予測のいくつかは、他の方法を用いて行なわれてもよい。いくつかの実施形態では、予測のいくつかは、完全に組み込まれた検査、例えば、妊娠の約12週における超音波検査および血液検査ならびに約16週における第2の血液検査を組み合わせた検査を用いて行なわれてもよい。いくつかの実施形態では、前記方法は、胎児の項部浮腫(NT)を測定するステップを包含する。いくつかの実施形態では、前記方法は、予測を行うために、測定された上述のホルモンのレベルを使用するステップを包含する。いくつかの実施形態では、前記方法は、上述の方法の組み合わせを包含する。
予測を組み合わせるための多くの方法が存在し、例えば、ホルモンの測定値を、中央値の倍数(multiple of the median)(MoM)に変換し、次いで、尤度比(LR)に変換することができる。同様に、他の測定値を、NT分布の混合モデルを使用してLRに変換することができる。NTおよび生化学的マーカーについてのLRに、年齢および妊娠に関連するリスクを掛けて、21トリソミーなどの種々の状態に対するリスクを導くことができる。検出率(DR)および偽陽性率(FPR)を、所与のリスク閾値を上回るリスクを有する割合を取ることによって算出することができる。
ある実施形態では、倍数性の状態をコールするための方法は、同時分布モデルおよび対立遺伝子数の確率を用いて決定される倍数性についての仮説のそれぞれの相対的確率と、これらに限定されないが、リード数解析、ヘテロ接合率の比較、親の遺伝子情報を使用する場合にのみ利用可能な統計量、特定の親の状況に対して正規化された遺伝子型シグナルの確率、第1の試料または調製された試料における推定される胎児画分を用いて算出される統計量、およびそれらの組み合わせを含めた、胎児がトリソミーであるリスクスコアを決定する他の方法から選択される統計学的技法を用いて算出された倍数性についての仮説のそれぞれの相対的確率とを組み合わせるステップを包含する。
別の方法は、4つの測定されたホルモンレベルを伴う状況であって、これらのホルモンのまわりの確率分布が既知である状況を包含し得:正倍数性の場合はp(x、x、x、x|e)、異数性の場合はp(x、x、x、x|a)である。次いで、DNA測定値についての確率分布を測定することができ、正倍数性の場合および異数性の場合、それぞれg(y|e)およびg(y|a)である。これらは、正倍数性/異数性の仮定を考慮して、独立していると仮定すると、p(x、x、x、x|a)g(y|a)およびp(x、x、x、x|e)g(y|e)として組み合わせ、次いで、母系の年齢を考慮して、それぞれに事前p(a)およびp(e)を掛けることができる。次いで、最も高いものを選択することができる。
ある実施形態では、中心極限定理を惹起して、g(y|aまたはe)の分布がガウス分布であると仮定し、多数の試料について調べることによって平均値および標準偏差を測定することが可能である。別の実施形態では、転帰を考慮して、これらが独立していないと仮定し、同時分布p(x、x、x、x|aまたはe)を推定するために十分な試料を収集することができる。
ある実施形態では、標的個体が倍数性の状態であると決定されるための倍数性の状態は、最大の確率を有する仮説に関連づけられる。いくつかの場合には、1つの仮説は、90%超の正規化された複合確率を有する。各仮説は1つの倍数性の状態または倍数性の状態の集合に関連づけられ、その正規化された複合確率が90%超であるかまたはいくつかの他の閾値、例えば、50%、80%、95%、98%、99%または99.9%を超えている仮説に関連づけられる倍数性の状態を、決定された倍数性の状態として仮説がコールされるのに必要な閾値として選択することができる。
母系の血液中の、以前の妊娠由来の子由来のDNA 非侵襲的な出生前診断の1つの難しさは、現行の妊娠由来の胎児の細胞と以前の妊娠由来の胎児の細胞を鑑別することである。一部では、前の妊娠由来の遺伝物質(genetic matter)はいくらかの時間の後に消えると考えられているが、決定的な証拠は示されていない。本開示のある実施形態では、PARENTAL SUPPORT(商標)(PS)法、および父系のゲノムの知見を使用して、母系の血液中に存在する父系起源の胎児DNA(すなわち胎児が父親から遺伝によって受け継いだDNA)を決定することが可能である。この方法では、相が特定された親の遺伝子情報を利用することができる。相が特定されていない遺伝子型の情報から、祖父母の遺伝子データ(例えば、祖父の精子から測定された遺伝子データ)を使用して、または、他の生まれた子からの遺伝子データ、または流産の試料から親の遺伝子型の相を特定することが可能である。父系の細胞のHapMapに基づく相の特定またはハプロタイピングによって、相が特定されていない遺伝子情報の相を特定することもできる。上首尾のハプロタイピングは、染色体が緊密な束である有糸分裂の相にある細胞を静止させ、マイクロフルイディクスを使用して別々の染色体を別々のウェルに入れることによって実証されている。別の実施形態では、相が特定された親のハプロタイプデータを使用して、父親由来の2種以上の相同体の存在を検出することが可能であり、これは、2人以上の子由来の遺伝物質が血液中に存在することを意味する。胎児において正倍数性であることが予測される染色体に焦点を当てることにより、胎児がトリソミーを患っている可能性を除外することができる。また、胎児DNAが現在の父親由来でないかどうかを決定することが可能であり、その場合、他の方法、例えば、トリプルテストを用いて遺伝子の異常を予測することができる。
採血以外の方法によって入手可能な、胎児の遺伝物質の他の供給源があり得る。母系の血液において入手可能な胎児の遺伝物質の場合には、2つの主要なカテゴリー:(1)胎児の細胞全体、例えば、胎児有核赤血球または赤芽球、および(2)浮動性胎児DNAがある。胎児の細胞全体の場合には、胎児の細胞が母系の血液中で長期間存続することができ、したがって、妊娠中の女性から、前の妊娠由来の子または胎児由来のDNAを含有する細胞を単離することが可能であるといういくつかの証拠が存在する。浮動性胎児DNAは、数週間のうちに系から取り除かれるという証拠も存在する。1つの難題は、その遺伝物質が細胞に含有される個体の同一性をどのように決定するか、すなわち、測定された遺伝物質が前の妊娠由来の胎児由来でないことをどのように確実にするかである。本開示のある実施形態では、母系遺伝物質の知見を用いて、問題の遺伝物質が母系遺伝物質ではないことを確実にすることができる。本文書または本文書において参照されているいずれかの特許に記載の通り、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)を含めた、この目的を実現するためのいくつもの方法が存在する。
本開示のある実施形態では、妊娠中の母親から抜き取った血液を、浮動性胎児DNAを含む画分、および有核赤血球を含む画分に分離することができる。浮動性DNAは必要に応じて富化することができ、DNAの遺伝子型の情報を測定することができる。浮動性DNAから測定された遺伝子型の情報から、母系の遺伝子型の知見を使用して、胎児の遺伝子型の態様を決定することができる。これらの態様は、倍数性の状態、および/または対立遺伝子の集合の同一性を指し得る。次いで、個々の有核赤血球について、本文書の他の箇所および他の参考特許に記載されている方法、特に本文書の最初のセクションに記載の方法を用いて遺伝子型決定することができる。母系ゲノムの知見により、任意の所与の単一の血液細胞が遺伝的に母系かどうかを決定することが可能になる。また、上記の通り決定された胎児の遺伝子型の態様により、単一の血液細胞が、現在妊娠中の胎児に遺伝的に由来するかどうかを決定することが可能になる。本質的に、本開示のこの態様により、母親の遺伝子の知見、および場合によっては他の関連する個体、例えば、父親からの遺伝子情報を、母系の血液中に見いだされる浮動性DNAから測定された遺伝子情報と一緒に使用して、母系の血液中に見いだされる単離された有核細胞が、(a)遺伝的に母系であるか、(b)遺伝的に現在妊娠中の胎児由来であるか、または(c)遺伝的に前の妊娠由来の胎児由来であるかのいずれかを決定することが可能になる。
出生前の性染色体異数性の決定
当技術分野で公知の方法では、妊娠中の胎児の性別を、母親の血液からを決定することを試みる人は、胎児の浮動性DNA(fffDNA)が母親の血漿中に存在するという事実を用いている。母系の血漿中のY特異的遺伝子座を検出することができれば、これは、妊娠中の胎児が男であることを意味する。しかし、当技術分野で既知の方法を用いる場合、いくつかの場合には、fffDNAの量が、男の胎児の場合にY特異的遺伝子座が検出されることを確実にするには低すぎるので、血漿中のY特異的遺伝子座が検出されないことでは、妊娠中の胎児が女であることは必ずしも保証されない。
本明細書では、Y特異的核酸、すなわち排他的に父系的に由来する遺伝子座由来であるDNAを測定することを必要としない新規の方法が提示される。以前に開示されたParental Support方法では、乗換え頻度データ、親の遺伝子型データ、および妊娠中の胎児の倍数性の状態を決定するためのインフォマティクス技法を用いる。胎児の性別は、単に性染色体における胎児の倍数性の状態である。XXである子は女であり、およびXYは男である。本明細書に記載の方法により、胎児の倍数性の状態を決定することもできる。性判別は性染色体の倍数性の決定と有効に同義であることに留意されたい;性判別の場合には、仮定は、多くの場合、子が正倍数性であるとして立てられ、したがって、可能性のある仮説が少ない。
本明細書に開示されている方法は、X染色体とY染色体の両方に共通する遺伝子座について調べて、胎児について予測される存在する胎児DNAの量に関するベースラインを作製するステップを包含する。次いで、X染色体のみに特異的な領域を調べて、胎児が女であるか男であるかを決定することができる。男の場合には、X染色体に特異的な遺伝子座由来の胎児DNAが、XとYの両方に特異的な遺伝子座由来の胎児DNAよりも少ないと認められることが予想される。対照的に、女の胎児では、これらの群のそれぞれのDNAの量が同じであることが予想される。問題のDNAは、試料に存在するDNAの量を定量することができる任意の技法、例えば、qPCR、SNPアレイ、遺伝子型決定アレイまたは配列決定によって測定することができる。排他的に1個体に由来するDNAについては、以下が認められることが予想される:
胎児由来のDNAが母親由来のDNAと混在しており、混合物中の胎児DNAの割合がFであり、混合物中の母系DNAの割合がMであり、したがってF+M=100%である場合、以下が認められることが予想される:
FおよびMが既知である場合には、予測比を計算することができ、観察されたデータを、予測データと比較することができる。MおよびFが未知である場合には、閾値を過去のデータに基づいて選択することができる。どちらの場合でも、XとYの両方に特異的な遺伝子座において測定されたDNAの量をベースラインとして用いることができ、胎児の性別の検査は、X染色体のみに特異的な遺伝子座において観察されたDNAの量に基づいてよい。その量がベースラインよりも、およそ1/2Fと等しい量だけ低い、またはそれが予め定義された閾値未満になる量だけ低ければ、胎児は男であることが決定され、その量がベースラインとほとんど等しい、またはそれが予め定義された閾値未満になる量だけ低くなければ、胎児は女であることが決定される。
別の実施形態では、多くの場合Z染色体と称される、X染色体とY染色体に共通である遺伝子座のみを調べることができる。Z染色体上の遺伝子座のサブセットは、一般には、常にX染色体上のA、およびY染色体上のBである。Z染色体由来のSNPがB遺伝子型を有することが見いだされた場合は、胎児は男であるとコールされ、Z染色体由来のSNPがA遺伝子型のみを有することが見いだされた場合には、胎児は女であるとコールされる。別の実施形態では、X染色体においてのみ見いだされる遺伝子座を調べることができる。AA|Bなどの状況は、Bが存在することにより、胎児が父親由来のX染色体を有することが示されるので、特に情報価値がある。AB|Bなどの状況も、女の胎児の場合には、男の胎児と比較して、多くの場合、Bが半分しか存在しないことが認められると予想されるので、情報価値がある。別の実施形態では、対立遺伝子AとBの両方がX染色体とY染色体の両方に存在し、どのSNPが父系のY染色体由来であるか、およびどれが父系のX染色体由来であるかが既知であるZ染色体上のSNPを調べることができる。
ある実施形態では、Y染色体とX染色体によって共有される相同な非組換え(HNR)領域間で変動することが公知の一塩基位置を増幅することが可能である。このHNR領域内の配列は、X染色体とY染色体の間でほとんど同一である。この同一の領域内に、母集団内のX染色体の間およびY染色体の間では不変であるが、X染色体とY染色体の間では異なる一塩基位置がある。各PCRアッセイによりX染色体とY染色体の両方に存在する遺伝子座由来の配列を増幅することができる。増幅された配列のそれぞれの内部に、配列決定またはいくつかの他の方法を用いて検出することができる単一の塩基がある。
ある実施形態では、胎児の性別を、母系の血漿中に見いだされる胎児の浮動性DNAから決定することができ、方法は以下のステップの一部または全部を含む:1)HNR領域内のX/Y変異体一塩基位置を増幅するPCR(通常のPCRまたはmini−PCRのいずれか、所望であればそれに加えて多重化)プライマーを設計するステップ、2)母系の血漿を得るステップ、3)母系の血漿由来の標的を、HNRX/Y PCRアッセイを用いてPCR増幅するステップ、4)増幅産物について配列決定するステップ、5)配列データを、増幅された配列のうちの1個または複数個の内部のY対立遺伝子の存在について検査するステップ。1個または複数個の存在により、男の胎児が示される。全ての増幅産物由来の全てのY対立遺伝子が存在しないことにより、女の胎児が示される。
ある実施形態では、標的化配列決定を用いて、母系の血漿中のDNAおよび/または親の遺伝子型を測定することができる。ある実施形態では、父系的に供給されたDNAを起源とすることが明白な配列を全て無視することができる。例えば、状況AA|ABでは、A配列の数を計数し、B配列の全てを無視することができる。上記のアルゴリズムについてヘテロ接合性率を決定するために、所与のプローブについて、観察されたA配列の数と総配列の予測数を比較することができる。試料ごとに各プローブについて配列の予測数を算出することができる多くの方法がある。ある実施形態では、過去のデータを使用して、全てのシーケンスリードのどの画分が特異的なプローブのそれぞれに属するかを決定し、次いで、この経験的な画分をシーケンスリードの総数と組み合わせて使用して、各プローブにおける配列の数を推定することが可能である。別の手法では、一部の公知のホモ接合性の対立遺伝子を標的とし、次いで、過去のデータを使用して、各プローブにおけるリード数と既知のホモ接合性の対立遺伝子におけるリード数を関連づけることができる。次いで、各試料について、ホモ接合性の対立遺伝子におけるリード数を測定し、次いで、この測定値を経験的に導かれた関連性と一緒に使用して、各プローブにおけるシーケンスリード数を推定することができる。
いくつかの実施形態では、複数の方法によって行われた予測を組み合わせることによって胎児の性別を決定することが可能である。いくつかの実施形態では、複数の方法は、本開示に記載の方法から選択される。いくつかの実施形態では、複数の方法の少なくとも1つは本開示に記載の方法から選択される。
いくつかの実施形態では、本明細書に記載の方法を用いて、妊娠中の胎児の倍数性の状態を決定することができる。ある実施形態では、倍数性コール方法では、X染色体に特異的な遺伝子座またはX染色体とY染色体の両方に共通する遺伝子座を使用するが、いかなるY特異的遺伝子座も使用しない。ある実施形態では、倍数性コール方法では、以下の1つまたは複数を使用する:X染色体に特異的な遺伝子座、X染色体とY染色体の両方に共通する遺伝子座、およびY染色体に特異的な遺伝子座。ある実施形態では、性染色体の比が同様である場合、例えば、45,X(ターナー症候群)、46,XX(正常な女性)および47,XXX(Xトリソミー)、鑑別は、種々の仮説に従って対立遺伝子分布と予測される対立遺伝子分布とを比較することによって実現することができる。別の実施形態では、これは、性染色体についてのシーケンスリードの相対的な数と、正倍数性であることが仮定される1個または複数個の参照染色体とを比較することによって実現することができる。これらの方法は、異数性の場合を含むように拡大することができることにも留意されたい。
単一遺伝子疾患スクリーニング
ある実施形態では、胎児の倍数性の状態を決定するための方法は、単一遺伝子障害についての同時検査が可能になるように拡張することができる。単一遺伝子疾患の診断は、異数性試験のために用いる同じ標的化手法に影響を及ぼし、さらなる特異的な標的を必要とする。ある実施形態では、単一遺伝子NPD診断は連鎖解析による。多くの場合、cfDNA試料の直接的な試験は、母系DNAが存在することにより、胎児が母親の変異を遺伝によって受け継いだかどうかを決定することが実質的に不可能になるので、信頼できない。独自の父系的に由来する対立遺伝子を検出することは困難が少ないが、疾患が優性であり、父親が保有する場合にのみ完全に情報価値があり、それによりこの手法の有用性が限定される。ある実施形態では、前記方法は、PCRまたは関連する増幅手法を包含する。
いくつかの実施形態では、前記方法は、親において、周囲に非常にしっかりと連鎖したSNPがある異常な対立遺伝子について、第一度近親者からの情報を用いて相を特定するステップを包含する。次いで、これらのSNPから得られた標的化配列決定データに対してParental Supportを実行して、正常な相同体または異常な相同体のいずれを、両親から胎児が遺伝によって受け継いだかを決定することができる。SNPが十分に連鎖している限りは、胎児の遺伝子型の遺伝を非常に確実に決定することができる。いくつかの実施形態では、方法は、(a)日常病の特定の集合を密に隣接させるためのSNP遺伝子座の集合を、異数性を試験するための本発明者らの多重プールに付加するステップと;(b)正常な対立遺伝子および異常な対立遺伝子を有する、付加したこれらのSNPから、種々の近親者からの遺伝子データに基づいて、対立遺伝子について確実に相の特定をするステップと、(c)疾患遺伝子座の周囲の領域内の遺伝によって受け継がれた母系の相同体および父系の相同体における胎児のハプロタイプまたは相が特定されたSNP対立遺伝子の集合を再構築して、胎児の遺伝子型を決定するステップとを含む。いくつかの実施形態では、疾患連鎖遺伝子座に確実に結合するさらなるプローブを、異数性試験のために用いる多型遺伝子座の集合に加える。
試料は母系DNAと胎児DNAの混合物であるので、胎児のディプロタイプを再構築することは困難である。いくつかの実施形態では、前記方法では、近親者の情報を組み入れて、SNPおよび疾患対立遺伝子の相を特定し、次いで、場所特異的な組換え尤度からのSNPおよび組換えデータと母系の血漿の遺伝子測定値から観察されたデータの物理的な距離を考慮に入れて、最も可能性が高い胎児の遺伝子型を得る。
ある実施形態では、疾患連鎖遺伝子座あたりいくつものさらなるプローブを標的の多型遺伝子座の集合に含める;疾患連鎖遺伝子座あたりのさらなるプローブの数は、4個から10個の間、11個から20個の間、21個から40個の間、41個から60個の間、61個から80個の間、またはそれらの組み合わせであってよい。
親由来の二倍体データの相の特定が困難な場合があり、これを行うことができる多くの方法がある。いくつかは本開示で考察されており、他のものは、別の開示でさらに詳細に記載されている(例えば、2009年2月9日出願の国際公開第WO2009105531号、および2009年8月4日出願の同WO2010017214号を参照。これらの特許は、参照によりその全体が本明細書に組み込まれる)。一実施形態では、親由来の半数体組織を測定することにより、例えば、1個または複数個の精子または卵子を測定することにより、親の相を推測して特定できる。一実施形態では、第一度近親者、例えば、親の親または同胞の測定遺伝子型データを使って推測して親の相を特定できる。一実施形態では、それぞれのウェル中に約1個以下のそれぞれのハプロタイプのコピーとなることが予測されるまで1個または複数個のウェル中でDNAを希釈し、その後、1個または複数個のウェル中のDNAを測定することにより親の相を特定できる。一実施形態では、集団ベースハプロタイプ頻度を使用して最も可能性のある相を推測するコンピュータプログラムを使って親の遺伝子型の相の特定ができる。一実施形態では、親の遺伝学的子孫の1個または複数個の相の未特定遺伝子データに加えて、相の特定がなされたハロタイプデータがもう一方の親で既知である場合、親の相の特定ができる。いくつかの実施形態では、親の遺伝学的子孫は、1個または複数個の胚、1人または複数人の胎児、および/または産まれた子供であってもよい。一方の親または両親の相の特定に関するいくつかのこれらの方法のおよび他の方法は、例えば、2010年8月19日出願の米国特許公開第2011/0033862号;2011年2月3日出願の同2011/0178719号;2006年11月22日出願の同2007/018446号;2008年3月17日出願の同2008/0243398号、にさらに詳細に開示されている。これらの特許は、参照によりその全体が本明細書に組み込まれる。
胎児のゲノム再構築
一態様では、本発明は、胎児のハプロタイプを決定する方法を特徴とする。種々の実施形態では、前記方法は、どの多形遺伝子座(例えば、SNP)が胎児に遺伝したか判定し、胎児中に存在する相同体を再構築(組換えイベントを含む)すること(および、それにより、多形遺伝子座間の配列を補間すること)を可能とする。必要に応じ、実質的に胎児の全ゲノムを再構築できる。胎児のゲノムにいくつかの曖昧さ(例えば、乗換え間隔)が残されている場合、この曖昧さは、必要に応じ、追加の多形遺伝子座を解析することにより最小化できる。種々の実施形態では、所望レベルに対する全ての曖昧さを減らすために、多形遺伝子座は、1個または複数個の染色体の範囲にわたり一定の密度になるように選択される。前記方法は、胎児ゲノム中の対象多型または他の変異の直接検出ではなく連鎖(例えば、胎児ゲノム中に連鎖多形遺伝子座の存在)に基づくそれらの検出を可能とするために、胎児における対象の多型または他の変異の検出に関し重要な用途がある。例えば、親が嚢胞性線維症(CF)に関連する変異の保持者である場合、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む核酸試料を分析して、胎児DNAがCF変異を有するハプロタイプを含むかどうかを判定できる。特に、胎児DNA中のCF変異それ自体を検出することを必要とせずに、多形遺伝子座を分析して、胎児DNAがCF変異を有するハプロタイプを含むかどうかを判定できる。
いくつかの実施形態では、前記方法は、親のハプロタイプ(例えば、胎児の母および父のハプロタイプ)を決定するステップを含む。いくつかの実施形態では、この決定は、母親または父親の親類由来のデータを使うことなく行われる。いくつかの実施形態では、本明細書および別の文献で記載(例えば、2010年8月19日出願の米国特許公開第2011/0033862号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)のように、親のハプロタイプは、希釈手法に続くSNP遺伝子型解析またはシークエンシングを使って決定される。DNAが希釈されるために、1個超のハプロタイプが同じ部分(またはチューブ)中に存在することはないであろう。これにより、事実上チューブ中にDNA単一分子が存在し得る状態となり、単一DNA分子上のハプロタイプを決定できる。いくつかの実施形態では、前記方法は、DNA試料を複数の部分に分割して、少なくとも1つの部分が染色体対由来の1個の染色体または1個の染色体セグメントを含み、少なくとも1つの部分中のDNA試料の遺伝子型解析を行い(例えば、2個以上の多形遺伝子座の存在の決定)、それにより、親のハプロタイプを決定するステップを含む。いくつかの実施形態では、遺伝子型解析は、シークエンシング(例えば、ショットガンシークエンシング)を行うステップを含む。いくつかの実施形態では、遺伝子型解析は、SNPアレイを使用して、多形遺伝子座、例えば、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座を検出するステップを含む。いくつかの実施形態では、遺伝子型解析は、多重PCRを使用するステップを含む。いくつかの実施形態では、前記方法は、分割試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座(例えば、SNP)に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、反応混合物をプライマー伸長反応条件に供して、ハイスループットシーケンサーで測定して配列決定データを生成する増幅産物を得るステップとを含む。
いくつかの実施形態では、母親のハプロタイプは、母親の親類由来のデータを使って本明細書で記載の方法のいずれかにより決定される。いくつかの実施形態では、父親のハプロタイプは、父親の親類由来のデータを使って本明細書で記載の方法のいずれかにより決定される。いくつかの実施形態では、父親と母親の両方に対するハプロタイプが決定される。いくつかの実施形態では、SNPアレイを使って、母親(または父親)および母親(または父親)の親類由来のDNA試料中の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座の存在が決定される。いくつかの実施形態では、前記方法は、母親(または父親)および/または母親(または父親)の親類由来のDNA試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座(例えば、SNP)に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、反応混合物をプライマー伸長反応条件に供し、ハイスループットシーケンサーで測定して配列決定データを生成する増幅産物を得るステップとを含む。親のハプロタイプは、SNPアレイまたは配列決定データに基づいて決定できる。いくつかの実施形態では、本文書で記載されているか、または本文書の他の場所で参照されている方法により親のデータの相の特定を行うことができる。
この親のハプロタイプデータを使って、胎児が親のハプロタイプを受け継いでいるかどうかを判定できる。いくつかの実施形態では、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む核酸試料がSNPアレイを使って分析されて、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座が検出される。いくつかの実施形態では、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む核酸試料は、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座(例えば、SNP)に同時にハイブリダイズするプライマーライブラリーと試料を接触させて反応混合物を生成することにより分析される。いくつかの実施形態では、反応混合物は、プライマー伸長反応条件に供されて増幅産物を生成する。いくつかの実施形態では、増幅産物は、ハイスループットシーケンサーで測定され、配列決定データが生成される。種々の実施形態では、SNPアレイまたは配列決定データを使って、染色体中の種々の部位での染色体乗換え確率に関するデータを使うことにより(例えば、ハップマップデータベース中で見つけることができるような組換えデータを使って任意の間隔に対する組換えリスクスコアを生成することにより)染色体上の多形対立遺伝子間の依存性をモデル化することにより親のハプロタイプが決定される。いくつかの実施形態では、多形遺伝子座での対立遺伝子数は、配列決定データに基づいてコンピュータで計算される。いくつかの実施形態では、それぞれ異なる可能な染色体の倍数性状態に関する複数の倍数性仮説がコンピュータで生成され、染色体上の多形遺伝子座で予測される対立遺伝子数に対するモデル(例えば、同時分布モデル)がそれぞれの倍数性仮説に対しコンピュータで構築され、同時分布モデルおよび対立遺伝子数を使って、それぞれの倍数性仮説の相対的確率がコンピュータで算出され、最大確率を有する仮説に対応する倍数性状態を選択することにより胎児の倍数性状態がコールされる。いくつかの実施形態では、対立遺伝子数についての同時分布モデルを構築するステップおよび各仮説の相対的確率を決定するステップを、参照染色体を使用することを必要としない方法を用いて行う。
いくつかの実施形態では、胎児のハプロタイプが、染色体13、18、21、X、およびYからなる群より選択される1個または複数個の染色体に対し決定される。いくつかの実施形態では、胎児のハプロタイプは、全ての胎児染色体に対し決定される。種々の実施形態では、前記方法は、実質的に胎児の全ゲノムを決定する。いくつかの実施形態では、ハプロタイプは、少なくとも30、40、50、60、70、80、90、または95%の胎児のゲノムに対し決定される。いくつかの実施形態では、胎児のハプロタイプ決定は、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座に対しどの対立遺伝子が存在するかに関する情報を含む。
DNAの組成
胎児に関するゲノムの情報、例えば、胎児の倍数性状態を決定するために、胎児の血液と母系の血液の混合物について測定された配列決定データに対してインフォマティクス分析を実施する場合、対立遺伝子の集合における対立遺伝子分布を測定することが有利であり得る。残念ながら母系の血液試料の血漿において見いだされるDNA混合物から胎児の倍数性状態を決定することを試みる場合などの多くの場合、利用可能なDNAの量は、混合物において優良な忠実度で対立遺伝子分布を直接測定するためには十分でない。これらの場合には、DNA混合物を増幅することにより、所望の対立遺伝子分布を優良な忠実度で測定することができる十分な数のDNA分子がもたらされる。しかし、配列決定するためのDNAの増幅に一般に用いられる増幅の現行の方法は、多くの場合、非常に偏りがある、つまり、多型遺伝子座の両方の対立遺伝子が同じ量で増幅されない。偏りのある増幅の結果、元の混合物における対立遺伝子分布とかなり異なる対立遺伝子分布がもたらされ得る。ほとんどの目的のためには、多型遺伝子座に存在する対立遺伝子の相対的な量を非常に正確に測定することは必要とされない。対照的に、本開示のある実施形態では、多型対立遺伝子を特異的に富化し、対立遺伝子の比を保存する増幅または富化方法は有利である。
対立遺伝子の偏りが最小限になるようにDNAの試料を複数の遺伝子座で優先的に富化するために用いることができるいくつもの方法が本明細書に記載されている。いくつかの例では、複数の遺伝子座を標的とするために環状化プローブを使用し、環状化前プローブの3’末端および5’末端が、標的の対立遺伝子の多型部位から1つまたは少数の位置離れた塩基とハイブリダイズするように設計されている。別の例は、3’末端PCRプローブが標的の対立遺伝子の多型部位から1つまたは少数の位置離れた塩基とハイブリダイズするように設計されているPCRプローブを使用するというものである。別の例は、スプリットアンドプール手法を用いて、優先的に富化された遺伝子座が、対立遺伝子の偏りが少なく、直接的な多重化の欠点を伴わずに富化されているDNAの混合物を作製するというものである。別の例は、標的の多型部位に隣接しているDNAとハイブリダイズするように設計されている捕捉プローブの領域が、多型部位と1つまたは少数の塩基で隔てられるように捕捉プローブが設計されているハイブリッド捕捉手法を用いるというものである。
多型遺伝子座の集合における測定された対立遺伝子分布を使用して個体の倍数性状態を決定する場合には、遺伝子測定のためにDNAの試料が調製されるとき該DNA試料における対立遺伝子の相対的な量を保存することが望ましい。この調製は、WGA増幅、標的化増幅、選択的富化技法、ハイブリッド捕捉法、環状化プローブまたはDNAの量を増幅し、かつ/または特定の対立遺伝子に対応するDNA分子の存在を選択的に増強することを意図した他の方法を包含し得る。
本開示のいくつかの実施形態では、マイナー対立遺伝子頻度が最大である遺伝子座を標的とするように設計されたDNAプローブの集合が存在する。本開示のいくつかの実施形態では、胎児がそれらの遺伝子座において情報価値が高いSNPを有する尤度が最大である遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが所与の母集団サブグループに対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが母集団サブグループの所与の混合物に対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが、異なるマイナー対立遺伝子頻度プロファイルを有する異なる母集団サブグループに由来する所与の親の対に対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、胎児起源のDNAの一部分とアニーリングした少なくとも1つの塩基対を含む環状化DNA鎖が存在する。本開示のいくつかの実施形態では、胎盤起源のDNAの一部分とアニーリングした少なくとも1つの塩基対を含む環状化DNA鎖が存在する。本開示のいくつかの実施形態では、環状化し、その一方でヌクレオチドの少なくとも一部が胎児起源のDNAとアニーリングした環状化DNA鎖が存在する。本開示のいくつかの実施形態では、環状化し、その一方でヌクレオチドの少なくとも一部が胎盤起源のDNAとアニーリングした環状化DNA鎖が存在する。本開示のいくつかの実施形態では、いくつかが単一のタンデム反復を標的とし、いくつかが一塩基多型を標的とするプローブの集合が存在する。いくつかの実施形態では、非侵襲的な出生前診断のために遺伝子座を選択する。いくつかの実施形態では、非侵襲的な出生前診断のためにプローブを使用する。いくつかの実施形態では、環状化プローブ、MIP、ハイブリダイゼーションプローブによる捕捉、SNPアレイ上のプローブ、またはそれらの組み合わせを含んでよい方法を用いて遺伝子座を標的とする。いくつかの実施形態では、プローブを環状化プローブ、MIP、ハイブリダイゼーションプローブによる捕捉、SNPアレイ上のプローブ、またはそれらの組み合わせとして使用する。いくつかの実施形態では、非侵襲的な出生前診断のために遺伝子座について配列決定する。
配列の相対的(relative)情報価値が、関連する親の状況と組み合わせるとより大きくなる場合には、親の状況が既知であるSNPを含有するシーケンスリード数を最大にすることにより、混合試料についてのシーケンシングリードの集合の情報価値が最大になり得る。ある実施形態では、親の状況が既知であるSNPを含有するシーケンスリード数は、qPCRを用いて特定の配列を優先的に増幅することによって増強することができる。ある実施形態では、親の状況が既知であるSNPを含有するシーケンスリード数を、環状化プローブ(例えば、MIP)を用いて特定の配列を優先的に増幅することによって増強することができる。ある実施形態では、親の状況が既知であるSNPを含有するシーケンスリード数を、ハイブリダイゼーション法による捕捉(例えば、SURESELECT)を用いて特定の配列を優先的に増幅することによって増強することができる。異なる方法を用いて、親の状況が既知であるSNPを含有するシーケンスリード数を増強することができる。ある実施形態では、標的化は、伸長ライゲーション、伸長を伴わないライゲーション、ハイブリダイゼーションによる捕捉またはPCRによって実現することができる。
断片化されたゲノムDNAの試料において、DNA配列のある一部分(fraction)が個々の染色体に独自にマッピングされ、他のDNA配列は異なる染色体上に見いだされる。血漿中に見いだされるDNAは、母体起源であろうと胎児起源であろうと、一般には、多くの場合、500bpを下回る長さに断片化されていることに留意されたい。典型的なゲノム試料では、マッピング可能な配列のおよそ3.3%が第13染色体にマッピングされ、マッピング可能な配列の2.2%が第18染色体にマッピングされ、マッピング可能な配列の1.35%が第21染色体にマッピングされ、女性ではマッピング可能な配列の4.5%がX染色体にマッピングされ、マッピング可能な配列の2.25%がX染色体にマッピングされ(男性では)、マッピング可能な配列の0.73%がY染色体にマッピングされる(男性では)。これらは胎児において異数性である可能性が最も高い染色体である。また、dbSNPに含まれるSNPを使用すると、短い配列の中では20配列のうちおよそ1つがSNPを含有する。この割合は、発見されていない多くのSNPが存在し得るとすれば、より高くなり得る。
本開示のある実施形態では、標的化方法を用いて、所与の染色体にマッピングされるDNAの試料中のDNAの一部分を、その一部分が、上に列挙されているゲノム試料に典型的な百分率を有意に超えるように増強することができる。本開示のある実施形態では、標的化方法を用いて、DNAの試料中のDNAの一部分を、SNPを含有する配列の百分率が、ゲノム試料に典型的に見出され得る百分率を有意に超えるように増強することができる。本開示のある実施形態では、出生前診断のために、標的化方法を用いて、母系DNAと胎児DNAの混合物中の染色体由来のDNAまたはSNPの集合由来のDNAを標的とすることができる。
疑わしい染色体にマッピングされるリード数を計数し、それを、参照染色体にマッピングされるリード数と比較し、疑わしい染色体上のリードの存在量が過剰であることは、その染色体における胎児の三倍体性に対応するという仮定を用いることによって胎児の異数性を決定するための方法が報告されていることに留意されたい(米国特許第7,888,017号)。これらの出生前診断のための方法では、いかなる種類の標的化も使用されず、また、出生前診断のための標的化の使用については記載されていない。
混合試料の配列決定において標的化手法を用いることにより、少ないシーケンスリードを用いて特定のレベルの正確度を実現することが可能であり得る。正確度とは感度を指す場合があり、正確度とは特異度を指す場合があり、または正確度はそのいくつかの組み合わせを指す場合がある。正確度の所望のレベルは、90%から95%の間であってもよく、正確度の所望のレベルは、95%から98%の間であってもよく、正確度の所望のレベルは、98%から99%の間であってもよく、正確度の所望のレベルは、99%から99.5%の間であってもよく、正確度の所望のレベルは、99.5%から99.9%の間であってもよく、正確度の所望のレベルは、99.9%から99.99%の間であってもよく、正確度の所望のレベルは、99.99%から99.999%の間であってもよく、正確度の所望のレベルは、99.999%から100%の間であってもよい。95%を上回る正確度のレベルを、高い正確度と称することができる。
母系DNAと胎児DNAの混合試料からどのように胎児の倍数性状態を決定することができるかについて実証している、いくつもの公開された先行技術の方法、例えば:G.J. W. LiaoらClinical Chemistry 2011年;57巻(1号)92〜101頁が存在する。これらの方法は、各染色体に沿った数千もの場所に焦点を当てる。標的とすることができ、一方ではNAの混合試料から、所与の数のシーケンスリードについて、胎児における倍数性の決定を高い正確度でもたらす染色体に沿った場所の数は予想外に少ない。本開示のある実施形態では、任意の標的化の方法、例えば、qPCR、リガンド媒介性PCR、他のPCR法、ハイブリダイゼーションによる捕捉または環状化プローブを用いた標的化配列決定を用いることによって正確な倍数性の決定を行うことができ、ここで、標的とする必要がある染色体に沿った遺伝子座の数は、5,000個から2,000個の間の遺伝子座であってもよく、2,000個から1,000個の間の遺伝子座であってもよく、1,000個から500個の間の遺伝子座であってもよく、500個から300個の間の遺伝子座であってもよく、300個から200個の間の遺伝子座であってもよく、200個から150個の間の遺伝子座であってもよく、150個から100個の間の遺伝子座であってもよく、100個から50個の間の遺伝子座であってもよく、50個から20個の間の遺伝子座であってもよく、20個から10個の間の遺伝子座であってもよい。最適には、標的とする必要がある染色体に沿った遺伝子座の数は、100個から500個の間の遺伝子座であり得る。高レベルの正確度は、少数の遺伝子座を標的とし予想外に少数のシーケンスリードを実行することによって実現することができる。リード数は、1億個から5000万個の間のリードであってもよく、リード数は、5000万個から2000万個の間のリードであってもよく、リード数は、2000万個から1000万個の間のリードであってもよく、リード数は、1000万個から500万個の間のリードであってもよく、リード数は、500万個から200万個の間のリードであってもよく、リード数は、200万個から100万個の間であってもよい;リード数は、100万個から500,000個の間であってもよい;リード数は、500,000個から200,000個の間であってもよく、リード数は、200,000個から100,000個の間であってもよく、リード数は、100,000個から50,000個の間であってもよく、リード数は、50,000個から20,000個の間であってもよく、リード数は、20,000個から10,000個の間であってもよく、リード数は、10,000個未満であってもよい。より大量の入力DNAに対してはより少数のリードが必要である。
いくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、第13染色体に独自にマッピングされる配列のパーセントが4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、第18染色体に独自にマッピングされる配列のパーセントが3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、第21染色体に独自にマッピングされる配列のパーセントが2%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、独自にX染色体にマッピングされる配列のパーセントが6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、独自にY染色体にマッピングされる配列のパーセントが1%超、2%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。
いくつかの実施形態では、組成物は、胎児起源のDNAと母体起源のDNAの混合物を含むと記載され、ある染色体に独自にマッピングされ少なくとも1つの一塩基多型を含有する配列のパーセントは、0.2%超、0.3%超、0.4%超、0.5%超、0.6%超、0.7%超、0.8%超、0.9%超、1%超、1.2%超、1.4%超、1.6%超、1.8%超、2%超、2.5%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超または20%超であり、染色体は13、18、21、XまたはYの群から選択される。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、ある染色体に独自にマッピングされ一塩基多型の集合からの少なくとも1つの一塩基多型を含有する配列のパーセントは0.15%超、0.2%超、0.3%超、0.4%超、0.5%超、0.6%超、0.7%超、0.8%超、0.9%超、1%超、1.2%超、1.4%超、1.6%超、1.8%超、2%超、2.5%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超または20%超であり、染色体は第13染色体、第18染色体、第21染色体、X染色体およびY染色体の集合から選択され、一塩基多型の集合内の一塩基多型の数は、1個から10個の間、10個から20個の間、20個から50個の間、50個から100個の間、100個から200個の間、200個から500個の間、500個から1,000個の間、1,000個から2,000個の間、2,000個から5,000個の間、5,000個から10,000個の間、10,000個から20,000個の間、20,000個から50,000個の間、および50,000個から100,000個の間である組成物が存在する。
理論上は、増幅の各サイクルにより、存在するDNAの量が倍増するが、実際には、増幅の程度は2倍よりわずかに低い。理論上は、標的化増幅を含めた増幅により、偏りのないDNA混合物の増幅がもたらされるが、実際には、異なる対立遺伝子は他の対立遺伝子と異なる程度で増幅される傾向がある。DNAを増幅する場合、対立遺伝子の偏りの程度は、一般には増幅ステップの数に伴って上昇する。いくつかの実施形態では、本明細書に記載の方法は、低レベルの対立遺伝子の偏りでDNAを増幅するステップを包含する。対立遺伝子の偏りはさらに別のサイクルのそれぞれで複合されるので、全体的な偏りのn乗根を算出することによってサイクル当たりの対立遺伝子の偏りを決定することができ、ここで、nは富化の程度の、底を2とする対数である。いくつかの実施形態では、第2のDNAの混合物を含む組成物が存在し、該第2のDNAの混合物は、第1のDNAの混合物からの複数の多型遺伝子座に優先的に富化されており、富化の程度は、少なくとも10、少なくとも100、少なくとも1,000、少なくとも10,000、少なくとも100,000または少なくとも1,000,000であり、第2のDNAの混合物での各遺伝子座における対立遺伝子の比は、第1のDNAの混合物でのその遺伝子座における対立遺伝子の比とは、平均で、1,000%未満、500%、200%、100%、50%、20%、10%、5%、2%、1%、0.5%、0.2%、0.1%、0.05%、0.02%または0.01%の係数だけ異なる。いくつかの実施形態では、第2のDNAの混合物を含む組成物が存在し、第2のDNAの混合物は、第1のDNAの混合物からの複数の多型遺伝子座に優先的に富化されており、ここで、サイクル当たりの複数の多型遺伝子座についての対立遺伝子の偏りは、平均で、10%未満、5%、2%、1%、0.5%、0.2%、0.1%、0.05%または0.02%である。いくつかの実施形態では、複数の多型遺伝子座は、少なくとも10個の遺伝子座、少なくとも20個の遺伝子座、少なくとも50個の遺伝子座、少なくとも100個の遺伝子座、少なくとも200個の遺伝子座、少なくとも500個の遺伝子座、少なくとも1,000個の遺伝子座、少なくとも2,000個の遺伝子座、少なくとも5,000個の遺伝子座、少なくとも10,000個の遺伝子座、少なくとも20,000個の遺伝子座、または少なくとも50,000個の遺伝子座を含む。
いくつかの実施形態
いくつかの実施形態では、妊娠中の胎児における染色体についての決定された倍数性の状態が開示されている報告を作製するための方法が本明細書に開示されており、前記方法は、胎児の母親由来のDNAおよび胎児由来のDNAを含有する第1の試料を得るステップと、胎児の一方の親または両親から遺伝子型データを得るステップと、調製された試料が得られるようにDNAを単離することによって第1の試料を調製するステップと、複数の多型遺伝子座において調製された試料中のDNAを測定するステップと、調製された試料に対して得たDNA測定値から、対立遺伝子数または複数の多型遺伝子座における対立遺伝子数の確率をコンピュータで算出するステップと、染色体における可能性のある異なる倍数性の状態について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数の確率に関する、倍数性についての複数の仮説をコンピュータで作製するステップと、倍数性についての仮説のそれぞれについて、胎児の一方の親または両親からの遺伝子型データを使用して、染色体上の各多型遺伝子座の対立遺伝子数確率についての同時分布モデルをコンピュータで構築するステップと、調製された試料についての同時分布モデルおよび算出された対立遺伝子数の確率を用いて、倍数性についての仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性の状態を選択することによって胎児の倍数性の状態をコールするステップと、決定された倍数性の状態が開示されている報告を作製するステップとを含む。
いくつかの実施形態では、前記方法を用いて、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性の状態を決定し、前記方法は、調製された試料のそれぞれにおける胎児起源のDNAのパーセントを決定するステップをさらに含み、ここで、調製された試料中のDNAを測定するステップは、各調製された試料中のいくつものDNA分子についてシークエンシングによって行い、より大きな胎児DNAの画分を有する調製された試料よりも、より小さな胎児DNAの画分を有する調製された試料由来のDNA分子について多く配列決定する。
いくつかの実施形態では、前記方法を用いて、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性の状態を決定し、ここで、調製された試料中のDNAを測定するステップは、各胎児に対して、DNAの調製された試料の第1の画分について配列決定して第1の測定値の集合を得ることによって行い、前記方法は、第1のDNA測定値の集合を考慮して、各胎児の倍数性についての仮説のそれぞれに対して第1の相対的確率の決定を行うステップと、倍数性についての仮説のそれぞれに対する第1の相対的確率の決定が、異数体の胎児に対応する倍数性についての仮説が有意であるが決定的ではない確率を有することを示す、その胎児からの調製された試料の第2の画分について再び配列決定して、第2の測定値の集合を得るステップと、第2の測定値の集合および必要に応じて、第1の測定値の集合も使用して、胎児の倍数性についての仮説に対して第2の相対的確率の決定を行うステップと、第2の相対的確率の決定によって決定された通り最大の確率を有する仮説に対応する倍数性の状態を選択することによって第2の試料を再び配列決定した、その胎児の倍数性の状態をコールするステップとをさらに含む。
いくつかの実施形態では、優先的に富化されたDNAの試料を含む組成物であって、優先的に富化されたDNAの試料が、第1のDNAの試料からの複数の多型遺伝子座において優先的に富化されており、第1のDNAの試料が母系の血漿に由来する母系DNAと胎児DNAの混合物からなり、富化の程度が少なくとも2倍であり、第1の試料と優先的に富化された試料の間の対立遺伝子の偏りが、平均で、2%未満、1%未満、0.5%未満、0.2%未満、0.1%未満、0.05%未満、0.02%未満、および0.01%未満からなる群から選択される組成物が開示されている。いくつかの実施形態では、そのような優先的に富化されたDNAの試料を作製するための方法が開示されている。
いくつかの実施形態では、胎児のゲノムDNAおよび母系のゲノムDNAを含む母系の組織試料において胎児の異数性の存在または不在を決定するための方法であって、(a)前記母系の組織試料から、胎児のゲノムDNAと母系のゲノムDNAの混合物を得るステップと、(b)胎児DNAと母系DNAの混合物を複数の多型対立遺伝子において選択的に富化するステップと、(c)ステップaにおける胎児のゲノムDNAと母系のゲノムDNAの混合物から選択的に富化された断片を分布させて、単一のゲノムDNA分子または単一のゲノムDNA分子の増幅産物を含む反応試料をもたらすステップと、(d)ステップc)における反応試料中の選択的に富化されたゲノムDNAの断片についての大規模並行DNA配列決定を行って、前記選択的に富化された断片の配列を決定するステップと、(e)ステップd)において得られた配列が属する染色体を同定するステップと、(f)ステップd)からのデータを分析して、i)母親および胎児の両方において二倍体であると推測される、少なくとも1つの最初の標的の染色体に属する、ステップd)からのゲノムDNAの断片の数、およびii)胎児において異数体であることが疑われる第2の標的染色体に属する、ステップd)からのゲノムDNAの断片の数を決定するステップと、(g)第2の標的染色体が正倍数性である場合、第2の標的染色体について、ステップf)パートi)において決定された数を使用してステップd)からのゲノムDNAの断片の数の予測される分布を算出するステップと、(h)第2の標的染色体が異数体である場合、第2の標的染色体について、ステップf)パートi)である第1の数およびステップb)の混合物において見いだされる胎児DNAの推定される割合を用いてステップd)からのゲノムDNAの断片の数の予測される分布を算出するステップと、(i)最尤法または最大事後法を用いて、ステップf)パートii)において決定されたゲノムDNAの断片の数が、ステップg)で算出された分布またはステップh)で算出された分布のどちらの一部である可能性がより高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が開示されている。
代表的癌診断法
宿主において生存しているがんを起源とするDNAを、宿主の血液中に見いだすことができることが実証されていることに留意されたい。母系の血液中に見いだされる混合DNAを測定することによって遺伝子診断を行うことができるのと同様に、宿主血液中に見いだされる混合DNAを測定することによって同等に良好に遺伝子診断を行うことができる。遺伝子診断は、異数性状態または遺伝子変異を含み得る。母系の血液に対して行った測定からの胎児の倍数性状態または遺伝子の状態を決定することにおいて読み取る当該開示における任意の主張は、宿主血液に対する測定からがんの倍数性状態または遺伝子の状態を決定することにおいて、同等に良好に読み取ることができる。
いくつかの実施形態では、本開示の方法により、がんの倍数性状態を決定することが可能になり、前記方法は、宿主由来の遺伝物質を含有する混合試料、およびがん由来の遺伝物質を得るステップと、混合試料中のDNAを測定するステップと、混合試料中のがん起源のDNAの割合を算出するステップと、混合試料に対して得た測定値および算出された割合を用いてがんの倍数性状態を決定するステップとを含む。いくつかの実施形態では、前記方法は、がんの倍数性状態の決定に基づいてがん治療を施すステップをさらに含んでよい。いくつかの実施形態では、前記方法は、がんの倍数性状態の決定に基づいてがん治療を施すステップをさらに含んでよく、がん治療は、医薬品、生物学的治療薬、および抗体に基づく治療およびそれらの組み合わせを含む群から選択される。
代表的実装方法
本明細書に開示されている実施形態はいずれも、デジタル電子回路、集積回路、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェアにおいて、またはそれらの組み合わせにおいて実行することができる。ここで開示されている実施形態の装置は、プログラム可能なプロセッサによって実行するための機械可読記憶デバイスに実体的に具体化されたコンピュータプログラム産物において実行することができ、ここで開示されている実施形態の方法のステップは、入力データを操作し、出力を生成することによってここで開示されている実施形態の機能を実施するための命令のプログラムを実行するプログラム可能なプロセッサによって実施することができる。ここで開示されている実施形態は、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステムにおいて実行可能かつ/または解釈可能な1つまたは複数のコンピュータプログラムで有利に実行することができ、該少なくとも1つのプログラム可能なプロセッサは、特別または汎用であり得る、データおよび命令を受け、データおよび命令を伝達するための記憶システム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスと連結している。各コンピュータプログラムは、所望であれば、高レベルの手続き型のまたはオブジェクト指向のプログラミング言語で、またはアセンブリ言語または機械語で実装することができ、どんな場合でも、言語はコンパイラ型言語またはインタープリタ型言語であってよい。コンピュータプログラムは、独立型プログラムとして、またはモジュール、コンポーネント、サブルーチンまたはコンピュータ環境において使用するために適した他のユニットとしてのものを含めた、任意の形態で展開することができる。コンピュータプログラムは、1か所の、または複数か所にわたって分布した、および通信網により相互接続された1台のコンピュータまたは複数のコンピュータで実行または解釈されるように展開することができる。
コンピュータ可読の記憶媒体とは、本明細書で使用される場合、物理的なまたは有形の記憶装置(シグナルとは対照的に)を指し、これらに限定することなく、情報の有形の記憶装置、例えば、コンピュータ可読の命令、データ構造、プログラムモジュールまたは他のデータの任意の方法または技術において実装される揮発性のおよび不揮発性の、取り外し可能なおよび取り外し不可能な媒体を指す。コンピュータ可読の記憶媒体としては、これらに限定されないが、所望の情報またはデータまたは命令を実体的に保存するために使用することができ、コンピュータまたはプロセッサがアクセスすることができるRAM、ROM、EPROM、EEPROM、フラッシュメモリまたは他のソリッドステート記憶技術、CD−ROM、DVDまたは他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶デバイスまたは任意の他の物理的なまたは有形の媒体が挙げられる。
本明細書に記載の方法のいずれかは、コンピュータスクリーンまたは紙への印刷などの物理的形式でデータを出力するステップを含んでよい。本文書の他の箇所の任意の実施形態の記載では、記載されている方法を、医師がそれに基づいて行動することができる形式のすぐに使用可能なデータを出力するステップと組み合わせることができることが理解されるべきである。さらに、記載されている方法を、臨床処置、または措置を行わないという臨床的決定の実行をもたらす臨床的決定の実際の実行と組み合わせることができる。標的個体に関係する遺伝子データを決定するための本文書に記載の実施形態のいくつかを、IVFとの関連において、1個または複数個の胚を移入するために選択する決定と組み合わせ、必要に応じて、胚を将来の母親の子宮に移入するプロセスと組み合わせることができる。標的個体に関係する遺伝子データを決定するための本文書に記載の実施形態のいくつかを、潜在的な染色体異常またはそれがないことの医療専門家による通知と組み合わせ、必要に応じて、出生前診断との関連において、胎児を流産するか流産しないかの決定と組み合わせることができる。本明細書に記載の実施形態のいくつかを、すぐに使用可能なデータを出力すること、および臨床処置、または措置を行わないという臨床的決定の実行をもたらす臨床的決定を実行することと組み合わせることができる。
代表的診断ボックス
ある実施形態では、本開示は、本開示に記載の方法のいずれかを部分的にまたは完全に実行することができる診断ボックスを含む。ある実施形態では、診断ボックスは、診察室、病院の検査室または患者をケアする場所に合理的に近い任意の適切な場所に置かれてよい。ボックスは、方法全体を完全に自動化された様式で実行することを可能にし得る、またはボックスは、技師が手動で完了するための、1つまたはいくつものステップを必要とする場合がある。ある実施形態では、ボックスは、少なくとも母系の血漿について測定された遺伝子型データを解析することを可能にし得る。ある実施形態では、ボックスは、診断ボックスで測定された遺伝子型データを、次いで遺伝子型データを解析し、場合によっては報告の作製も行う外部の計算設備に伝達する手段と連結することができる。診断ボックスは、水性試料または液体試料を1つの容器から別の容器に移すことができるロボットユニットを含んでよい。診断ボックスは、固体と液体の両方のいくつもの試薬を含んでよい。診断ボックスは、ハイスループットシーケンサーを含んでよい。診断ボックスは、コンピュータを含んでよい。
実験セクション
ここで開示されている実施形態は、以下の実施例に記載されており、これらは本開示の理解を補助するために記載され、その後に続く特許請求の範囲において定義されている本開示の範囲をいかなる形でも限定するものと解釈されるべきではない。以下の実施例は、当業者に、本記載した実施形態をどのように用いるかについての完全な開示および記載を提供するために提示されており、本開示の範囲を限定するものではなく、以下の実験が、実施した全ての実験または唯一の実験であることを示すものでもない。使用される数字(例えば、量、温度など)に関して正確さを確実にするための試みが行われているが、いくらかの実験的な誤差および偏差が考慮されるべきである。別段の指定のない限り、部分は体積による部分であり、温度は摂氏度である。記載されている方法の変形は、実験が例示することを意味する基本的な態様を変化させることなく行うことができることが理解されるべきである。
実験1
目的は、親の遺伝子型を使用して胎児画分を算出するベイズ最尤推定(MLE)アルゴリズムにより、公開された方法と比較して非侵襲的な出生前トリソミー診断の正確度が改善されることを示すことであった。
母系のcfDNAについてシミュレートされた配列決定データを、21トリソミーおよびそれぞれの母親の細胞系において得られたリードをサンプリングすることによって作製した。正確なダイソミーおよびトリソミーのコールの率を、公開された方法(ChiuらBMJ2011年:342巻:c7401頁)および本発明者らのMLEに基づくアルゴリズムについての種々の胎児画分における500のシミュレーションから決定した。IRBに承認されたプロトコールの下で収集した、4人の妊娠中の母親およびそれぞれの父親由来の500万のショットガンリードを得ることによってシミュレーションを検証した。親の遺伝子型を290KSNPアレイで得た(図14参照)。
シミュレーションでは、MLEに基づく手法により、9%の低さの胎児画分に対して99.0%の正確度が実現され、全体的な正確度によく対応した信頼度が報告された。本発明者らは、これらの結果を、4つの実際の試料を用いて検証し、全て正確なコールが得られ、計算された信頼度は99%を超えた。対照的に、Chiuらの公開されたアルゴリズムを実行したところ、99.0%の正確度を実現するためには18%の胎児画分が必要であり、9%の胎児DNAでは87.8%の正確度しか実現されなかった。
MLEに基づく手法と併せて、親の遺伝子型から胎児画分を決定することにより、妊娠初期および妊娠中期の早期に予測される胎児画分において、公開されているアルゴリズムよりも高い正確度が実現される。さらに、本明細書に開示されている方法は、結果の信頼性の決定において、特に倍数性の検出がより難しい低胎児画分において、極めて重要な信頼度メトリックを生じる。公開された方法では、偽陽性率を予め定義する手法である、ダイソミートレーニングデータの大きな集合に基づく、倍数性をコールするための正確度が低い閾値方法を用いる。さらに、信頼度メトリックなしでは、公開された方法でコールを行うには胎児のcfDNAが不十分である場合に、偽陰性の結果を報告する危険性がある。いくつかの実施形態では、コールされた倍数性状態について信頼度推定値を算出する。
実験2
目的は、ベイズ最尤推定(MLE)アルゴリズムにおいて、標的化配列決定手法を親の遺伝子型およびHapmapデータと組み合わせて用いることによって、特に低胎児画分からなる試料における、胎児の18トリソミー、21トリソミー、およびXトリソミーの非侵襲的な検出を改善することであった。
4つの正倍数性妊娠および2つのトリソミー陽性妊娠由来の母体試料およびそれぞれの父系の試料を、IRBに承認されたプロトコールの下で、胎児の核型が既知である患者から得た。母系のcfDNAを血漿から抽出し、標的の特定のSNPを優先的に富化した後、およそ1,000万のシーケンスリードを得た。親試料について同様に配列決定して、遺伝子型を得た。
記載されているアルゴリズムにより、正倍数性の試料および異数性の試料の正常な染色体の全てについて第18染色体ダイソミーおよび第21染色体ダイソミーが正確にコールされた。18トリソミーおよび21トリソミーのコールは正確であり、男の胎児および女の胎児におけるX染色体コピー数も正確であった。アルゴリズムによって生じる信頼度は、全ての場合において98%を超えた。
記載されている方法により、妊娠初期の試料および妊娠中期の早期の試料のおよそ30%を占める、12%未満の胎児DNAで構成される試料を含めた、6つの試料由来の試験した染色体の全てについて倍数性が正確に報告された。当該MLEアルゴリズムと公開された方法の間の極めて重要な差異は、MLEアルゴリズムでは親の遺伝子型およびHapmapデータを活用して、正確度を改善し、信頼度メトリックを生成することである。低胎児画分では、全ての方法の正確度が低くなる;十分な胎児のcfDNAがない試料を正確に同定して、信頼できるコールを行うことが重要である。他のものは男の胎児の胎児画分を推定するためにY染色体特異的プローブを使用したが、同時に親の遺伝子型決定を行うことにより、両方の性について胎児画分を推定することができる。非標的化ショットガン配列決定を用いた公開された方法の別の固有の限界は、GCリッチなどの因子が異なることにより、倍数性コールの正確度が染色体間で変動することである。当該標的化配列決定手法は、そのような染色体規模の変動とはほとんど無関係であり、染色体間でより一貫した性能をもたらす。
実験3
目的は、母系の血漿中の浮動性胎児DNAのSNP遺伝子座を解析するための新規のインフォマティクスを用いて、三倍体の胎児においてトリソミーが高い信頼度で検出可能であるかどうかを決定することであった。
超音波異常の後に、血液20mLを妊娠中の患者から抜き取った。遠心分離した後、母系DNAをバフィーコートから抽出し(DNEASY、QIAGEN)、無細胞DNAを血漿から抽出した(QIAAMP QIAGEN)。両方のDNA試料において、第2染色体、第21染色体、およびX染色体上のSNP遺伝子座に標的化配列決定を適用した。最尤ベイズ推定により、全ての可能性のある倍数性の状態の集合から、最も可能性が高い仮説を選択した。前記方法により、胎児DNA割合、倍数性の状態および倍数性の決定における明確な信頼度を決定する。参照染色体の倍数性に関する仮定は行わない。診断では、現在の技術水準である、シーケンスリード数と無関係の検定統計量を使用する。
当前記方法により、第2染色体および第21染色体のトリソミーが正確に診断された。子の割合は11.9%[CI11.7〜12.1]と推定された。胎児は、第2染色体および第21染色体の1つの母系のコピーおよび2つの父系のコピーを有することが見いだされ、信頼度は有効に1(エラー確率<10−30)であった。これは、第2染色体および第21染色体のそれぞれ92,600リードおよび258,100リードを用いて実現された。
これは、中期の核型によって確認されるように、母系の血液に由来するトリソミー染色体であって、その胎児が三倍体であるという非侵襲的な出生前診断の最初の実証である。非侵襲的な診断の現存の方法では、この試料において異数性は検出されない。現行の方法は、ダイソミー参照染色体と比較した、トリソミー染色体における余剰なシーケンスリードに依拠するが、三倍体の胎児はダイソミー参照を有さない。さらに、現存の方法では、この胎児DNAの割合およびシーケンスリード数を用いては同様に信頼度が高い倍数性の決定は実現されない。該手法を24の染色体全てに拡張することは簡単である。
実験4
正倍数性の妊娠由来の母系の血漿から単離されたDNA、および同様に21三倍体性細胞系由来のゲノムDNAの、標準のPCR(ネスティングを使用しなかったことを意味する)を使用した800プレックス増幅のために以下のプロトコールを使用した。ライブラリーの調製および増幅は、単一チューブ平滑末端化、その後のA−テーリングを伴った。AGILENT SURESELECTキットに見いだされるライゲーションキットを使用してアダプタライゲーションを実行し、PCRを7サイクル実行した。次いで、第2染色体、第21染色体およびX染色体上のSNPを標的とする800の異なるプライマー対を使用して、STAを15サイクル行った(95℃で30秒間;72℃で1分間;60℃で4分間;65℃で1分間;72℃で30秒間)。12.5nMのプライマー濃度で反応を実行した。次いで、ILLUMINA IIGAXシーケンサーを用いてDNAについて配列決定した。シーケンサーにより190万のリードが出力され、その92%がゲノムにマッピングされ、ゲノムにマッピングされたリードのうち99%超が、標的のプライマーにより標的とされた領域のうちの1つにマッピングされた。数は血漿DNAとゲノムDNAの両方で基本的に同じであった。図15は、第21染色体において既知のトリソミーを有する細胞系から取得したゲノムDNAにおける、シーケンサーによって検出された約780SNPについての2つの対立遺伝子の比を示す。対立遺伝子分布は視覚的に読み取ることが簡単ではないので、ここでは可視化を容易にするために対立遺伝子の比がプロットされていることに留意されたい。丸印はダイソミー染色体上のSNPを示し、星印はトリソミー染色体上のSNPを示す。図16は、図Xの場合と同様に、同じデータの別の表示であり、Y軸は各SNPについて測定されたAとBの相対的な数であり、X軸は染色体によってSNPを分けたSNP数である。図16では、SNP1〜312は、第2染色体上に見いだされ、SNP313〜605は、トリソミーである第21染色体上に見いだされ、SNP606〜800はX染色体上に見出される。第2染色体およびX染色体からのデータは、相対的な配列計数値が3つのクラスター内にあるとおり、ダイソミー染色体を示す:グラフの一番上がAAであり、グラフの一番下がBBであり、グラフの中央がABである。トリソミーである第21染色体からのデータは4つのクラスターを示す:グラフの一番上がAAAであり、0.65の線(2/3)の周辺がAABであり、.35の線(1/3)の周囲がABBであり、グラフの一番下がBBBである。
図17A〜Dは、同じ800プレックスプロトコールについてのデータであって、妊娠中の女性由来の4つの血漿試料から増幅したDNAに対して測定されたデータを示す。これらの4つの試料について、点について7つのクラスターが認められることが予想される:(1)グラフの一番上に沿っているのは、母親および胎児がどちらもAAである遺伝子座であり、(2)グラフの一番上のわずかに下は、母親がAAであり、胎児がABである遺伝子座であり、(3)0.5の線のわずかに上は、母親がABであり、胎児がAAである遺伝子座であり、(4)0.5の線に沿っているのは、母親および胎児がどちらもABである遺伝子座であり、(5)0.5の線のわずかに下は、母親がABであり、胎児がBBである遺伝子座であり、(6)グラフの一番下のわずかに上は、母親がBBであり、胎児がABである遺伝子座であり、(1)グラフの一番下に沿っているのは、母親および胎児がどちらもBBである遺伝子座である。胎児画分が小さいほど、クラスター(1)と(2)の間、クラスター(3)、(4)および(5)の間、ならびにクラスター(6)と(7)の間の分離が小さくなる。分離は、胎児起源のDNAの画分の半分であることが予想される。例えば、DNAの20%が胎児性であり、80%が母系である場合、(1)〜(7)は、それぞれ1.0、0.9、0.6、0.5、0.4、0.1および0.0に集中することが予想される;例えば、図17D、POOL1_BC5_ref_rateを参照されたい。その代わりに、DNAの8%が胎児性であり、92%が母系である場合、(1)〜(7)は、それぞれ1.00、0.96、0.54、0.50、0.46、0.04および0.00に集中することが予想される;例えば、図17B、POOL1_BC2_ref_rateを参照されたい。胎児DNAが検出されない場合は、(2)、(3)、(5)または(6)が認められることは予想されない;あるいは、分離は0であると言える、したがって(1)および(2)は互いに一番上にあり、(3)、(4)および(5)、ならびに、同様に(6)および(7)も同様である;例えば、図17C、POOL1_BC7_ref_rateを参照されたい。図17A、POOL1_BC1_ref_rateについて胎児画分は約25%であることに留意されたい。
実験5
DNAの増幅および測定の大多数の方法により、一般に遺伝子座において見いだされる2つの対立遺伝子が、DNAの試料中の対立遺伝子の実際の量を表さない強度または計数値で検出される、いくらかの対立遺伝子の偏りが生じる。例えば、単一の個体について、ヘテロ接合性遺伝子座において、ヘテロ接合性遺伝子座について予測される理論的な比である、2つの対立遺伝子の1:1の比が認められることが予想されるが、対立遺伝子の偏りに起因して、55:45または、さらには60:40が認められ得る。配列決定との関連において、リード深度が低い場合には、単純な確率論的ノイズにより、有意な対立遺伝子の偏りがもたらされる可能性があることにも留意されたい。ある実施形態では、各SNPの挙動をモデリングすることが可能であり、したがって、特定の対立遺伝子について一貫した偏りが観察される場合、この偏りを補正することができる。図18は、偏り補正の前後の、二項分散によって説明することができるデータの割合を示す。図18では、星印は、800プレックス実験について、生の配列データにおいて観察された対立遺伝子の偏りを示し、丸印は、補正後の対立遺伝子の偏りを示す。対立遺伝子の偏りが全くない場合には、データがx=yの線に沿うことが予想されることに留意されたい。150プレックス標的化増幅を用いてDNAを増幅することによって生じる同様のデータの集合により、偏り補正後に1:1の線のごく近傍に包含されるデータが生じた。
実験6
プライマーのアニーリングおよび伸長の時間が数分に限られている、アダプタタグに特異的なプライマーとライゲーションしたアダプタを使用したDNAのユニバーサル増幅は、より短いDNA鎖の割合を富化する効果を有する。配列決定に適したDNAライブラリーを作製するために設計された大多数のライブラリープロトコールはそのようなステップを含み、プロトコールの例は公開されており、当業者に周知である。本発明のいくつかの実施形態では、ユニバーサルタグを有するアダプタを血漿DNAにライゲーションし、アダプタタグに特異的なプライマーを使用して増幅する。いくつかの実施形態では、ユニバーサルタグは、配列決定のために用いるものと同じタグであってよく、それはPCR増幅のためだけのユニバーサルタグであってよい、またはそれはタグの集合であってよい。胎児DNAは一般には、天然では短く、一方、母系DNAは天然では短いものと長いものの両方であり得るので、この方法は、混合物中の胎児DNAの割合を富化する効果を有する。アポトーシス性の細胞由来のDNAであると考えられ、胎児DNAと母系DNAの両方を含有する浮動性DNAは短く、大部分は200bp未満である。静脈切開後の一般的な現象である細胞溶解によって放出される細胞性DNAは、一般には、ほぼ排他的に母系であり、同様にかなり長く、大部分が500bpを超える。したがって、数分超放置した血液試料は、短い(胎児性+母系)DNAおよびより長い(母系)DNAの混合物を含有する。母系の血漿に対してユニバーサル増幅を比較的短い伸長時間で実施し、その後、標的化増幅することにより、胎児DNAの相対的な割合が、標的化増幅を単独で用いて増幅した血漿と比較して増大する傾向がある。これは、入力が血漿DNA(垂直方向の軸)である場合に測定された胎児のパーセント対入力DNAがILLUMINA GAIIxライブラリー調製プロトコールを用いて調製したライブラリーを有する血漿DNAである場合に測定された胎児のパーセントを示す図19において認めることができる。線の下に入る点は全て、ライブラリーの調製ステップにより胎児起源のDNAの割合(fraction)が富化されることを示す。赤色であった2つの血漿の試料は溶血を示し、したがって、細胞溶解によって存在する長い母系DNAの量が増大したことを示し、これは、標的化増幅の前にライブラリーの調製を実施した場合に、胎児画分(fetal fraction)が特に有意に富化されることを示す。本明細書に開示されている方法は、溶血があるまたは比較的長い鎖の混入DNAを含む細胞が溶解し、短いDNAと長いDNAが混合した試料に混入するいくつかの他の状況が生じている場合に特に有用である。一般には、比較的短いアニーリング時間および伸長時間は30秒間から2分間の間であるが、5秒または10秒以下の短さであってよく、または5分間または10分間の長さであってよい。
実験7
正倍数性の妊娠由来の母系の血漿から単離されたDNA、および同様に21三倍体性細胞系由来のゲノムDNAの、直接PCRプロトコール、および同様にセミネステッド手法を用いた1,200プレックス増幅のために以下のプロトコールを使用した。ライブラリーの調製および増幅は、単一チューブ平滑末端化、その後のA−テーリングを伴った。AGILENT SURESELECTキットに見いだされるライゲーションキットの改変を用いてアダプタライゲーションを実行し、PCRを7サイクル実行した。標的のプライマープールでは、第21染色体由来のSNPについての550のアッセイ、ならびに第1染色体およびX染色体のそれぞれ由来のSNPについての325のアッセイを行った。どちらのプロトコールも、16nMのプライマー濃度を用いてSTAの15サイクルを伴った(95℃で30秒間;72℃で1分間;60℃で4分間;65℃で30秒間;72℃で30秒間)。セミネステッドPCRプロトコールは、29nMの内側のフォワードタグ濃度、および1μMまたは0.1μMのリバースタグ濃度を用いたSTA15サイクルの第2の増幅を伴った(95℃で30秒間;72℃で1分間;60℃で4分間;65℃で30秒間;72℃で30秒間)。次いで、ILLUMINA IIGAXシーケンサーを用いてDNAについて配列決定した。直接PCRプロトコールについては、リードの73%がゲノムにマッピングされ、セミネステッドプロトコールについては、シーケンスリードの97.2%がゲノムにマッピングされる。したがって、セミネステッドプロトコールにより、およそ30%多くの情報がもたらされ、これは、主に、プライマー二量体を引き起こす可能性が最も高いプライマーが排除されたことに起因すると推測される。
リード深度の変動性は、セミネステッドプロトコールを使用した場合、直接PCRプロトコールを使用した場合よりも高い傾向があり(図20参照)、ひし形はセミネステッドプロトコールを用いて実行した遺伝子座についてのリード深度を指し、四角はネスティングなしで実行した遺伝子座についてのリード深度を指す。SNPは、ひし形についてリード深度によって配置されており、したがって、ひし形は全て曲線上に置かれ、一方四角は、ゆるく相関するようである;SNPの配置は任意であり、リード深度を指すのは、ドットの左から右への場所ではなく、ドットの高さである。
いくつかの実施形態では、本明細書に記載の方法により、優れたリード深度(DOR)の分散を実現することができる。例えば、1,200アッセイの、ゲノムDNAの1,200プレックス直接PCR増幅を用いたこの実験の1つのバージョン(図21)において、1186アッセイでは、DORが10超であり、平均のリード深度が400であり、1063アッセイ(88.6%)では、リード深度が200から800の間であり、各対立遺伝子についてのリード数は、意味のあるデータを得るために十分に高いが、各対立遺伝子についてのリード数は、これらのリードの限界使用が特に小さい場合、それほど高くない、理想的なウィンドウを有した。12の対立遺伝子のみが、高いリード深度を有し、1035のリードが一番深かった。DORの標準偏差は290であり、平均DORは453であり、DORの変動係数は64%であり、950,000の総リードが存在し、およびリードの63.1%がゲノムにマッピングされた。1,200プレックスセミネステッドプロトコールを使用した別の実験(図22)では、DORはより高かった。DORの標準偏差は583であり、平均DORは630であり、DORの変動係数は93%であり、870,000の総リードが存在し、リードの96.3%がゲノムにマッピングされた。これらの場合のどちらにおいても、SNPは母親についてのリード深度によって配置され、したがって、曲線は母系のリード深度を示すことに留意されたい。子と父親の間の鑑別は重要でなく、それは単にこの説明のために重要であるトレンドである。
実験8
実験において、セミネステッド1,200プレックスPCRプロトコールを用いて、1つの細胞由来のDNAおよび3つの細胞由来のDNAを増幅した。この実験は、母系の血液から単離された胎児の細胞を使用した出生前異数性試験と関連する、または生検割球または栄養外胚葉試料を使用した着床前遺伝子診断のためのものである。条件ごとに2個体(46XYおよび47XX+21)由来の1つの細胞および3つの細胞の3つの複製物が存在した。アッセイは、第1染色体、第21染色体およびX染色体を標的とした。3つの異なる溶解方法を使用した:ARCTURUS、MPERv2およびアルカリ溶解。1つの配列決定レーンにおいて多重化48試料に配列決定を実行した。アルゴリズムにより、3つの染色体のそれぞれについて、および複製物のそれぞれについての正確な倍数性コールが生じた。
実験9
1つの実験では、4つの母系の血漿試料を調製し、ヘミネステッド9,600プレックスプロトコールを使用して増幅した。試料を以下のように調製した:母系の血液最大40mLを遠心分離して、バフィーコートおよび血漿を単離した。母系試料のゲノムDNAをバフィーコートから調製し、父系のDNAを血液試料または唾液試料から調製した。母系の血漿中の無細胞DNAを、QIAGEN CIRCULATING NUCLEIC ACIDキットを使用して単離し、TE緩衝液45μLで製造者の指示に従って溶出した。ユニバーサルライゲーションアダプタを、精製された血漿DNA35μLの各分子の末端に付加し、ライブラリーを、アダプタ特異的プライマーを使用して7サイクルにわたって増幅した。ライブラリーを、AGENCOURT AMPUREビーズを使用して精製し、水50μlで溶出した。
9,600個の標的特異的タグを付けたリバースプライマーのプライマー濃度14.5nMおよび1つのライブラリーアダプタ特異的フォワードプライマーの500nMを使用し、15サイクルのSTAを用いて、3μlのDNAを増幅した(最初のポリメラーゼ活性化のために95℃で10分間、次いで、95℃で30秒間;72℃で10秒間;65℃で1分間;60℃で8分間;65℃で3分間および72℃で30秒間;を15サイクル、および72℃で2分間の最終の伸長)。
ヘミネステッドPCRプロトコールは、第1のSTA産物の希釈物の、1000nMのリバースタグ濃度、および9,600個の標的特異的フォワードプライマーのそれぞれについて16.6u nMの濃度を用いたSTAを15サイクルにわたる第2の増幅を伴った(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;65℃で1分間;60℃で5分間;65℃で5分間および72℃で30秒間;の15サイクル、および72℃で2分間の最終の伸長)。
次いで、STA産物の一定分量を、標準のPCRによって、1μMのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて10サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。
このように、単一ウェル反応において9,600個のプライマーを使用した;プライマーは、第1染色体、第2染色体、第13染色体、第18染色体、第21染色体、X染色体およびY染色体上に見いだされるSNPを標的とするように設計した。次いで、増幅産物について、ILLUMINA GAIIXシーケンサーを用いて配列決定した。試料当たり、およそ390万のリードがシーケンサーによって生成され、370万のリードがゲノムにマッピングされ(94%)、それらのうち、290万のリード(74%)が標的のSNPにマッピングされ、平均のリード深度は344であり、リード深度の中央値は255であった。4つの試料についての胎児画分は、9.9%、18.9%、16.3%、および21.2%であることが見いだされた。
関連性のある母系のゲノムDNA試料および父系のゲノムDNA試料を、セミネステッド9600プレックスプロトコールを使用して増幅し、配列決定した。セミネステッドプロトコールは、第1のSTAにおいて9,600個の外側のフォワードプライマーおよびタグを付けたリバースプライマーを7.3nMで適用するという点で異なる。サーモサイクリング条件および第2のSTAの組成、およびバーコーディングPCRはヘミネステッドプロトコールについてのものと同じであった。
配列決定データを、本明細書に開示されているインフォマティクス方法を用いて解析し、DNAが4つの母系の血漿試料中に存在した胎児について、6つの染色体において倍数性の状態をコールした。集団内の28個の染色体全てについての倍数性コールは正確にコールされ、信頼度は、正確にコールされたが、信頼度が83%であった1つの染色体以外は99.2%を超えた。
図23は、9,600プレックスヘミネスティング手法のリード深度を、実験7に記載の1,200プレックスセミネステッド手法のリード深度と一緒に示すが、リード深度が100超、200超および400超であるSNPの数は1,200プレックスプロトコールにおけるそれよりも有意に多かった。第90パーセンタイルにおけるリード数を第10パーセンタイルにおけるリード数で割って、無次元のメトリックを得ることができ、それにより、リード深度の均一性が示され;その数が小さいほど、リード深度がより均一である(狭い)。平均の第90パーセンタイル/第10パーセンタイル比は、実験9において行った方法では11.5であるが、実験7において行った方法では5.6である。特定のリードの百分率がリード数の閾値を超えることを確実にするために、より少ないシーケンスリードが必要であるので、配列決定効率のためには、所与のプロトコールプレキシティ(plexity)に対してより狭いリード深度がより良い。
実験10
1つの実験では、4つの母系の血漿試料を調製し、セミネステッド9,600プレックスプロトコールを使用して増幅した。実験10の詳細は実験9と非常に類似しており、例外はネスティングプロトコールであること、および4つの試料の同一性を含めたことであった。集団内の28個の染色体全てについての倍数性コールは正確にコールされ、信頼度は99.7%を超えた。760万(97%)のリードがゲノムにマッピングされ、リードの630万(80%)が標的のSNPにマッピングされた。平均のリード深度は751であり、リード深度の中央値は396であった。
実験11
1つの実験では、3つの母系の血漿試料を5つの均等な部分に分割し、各部分を、2,400個の多重化プライマー(4つの部分)または1,200個の多重化プライマー(1つの部分)のいずれかを使用して増幅し、合計10,800個のプライマーについて、セミネステッドプロトコールを使用して増幅した。増幅した後、配列決定するために該部分を一緒にプールした。実験11の詳細は実験9と非常に類似しており、例外は、ネスティングプロトコール、およびスプリットアンドプール手法であった。集団内の21個の染色体の全てについて、倍数性コールは正確にコールされ、信頼度は、信頼度83%でコールが上手く行かなかった1つ以外は99.7%を超えた。340万のリードが標的のSNPにマッピングされ、平均のリード深度は404であり、リード深度の中央値は258であった。
実験12
1つの実験では、4つの母系の血漿試料を、4つの均等な部分に分割し、各部分を、2,400個の多重化プライマーを使用して増幅し、合計9,600個のプライマーについて、セミネステッドプロトコールを使用して増幅した。増幅した後、配列決定するために該部分を一緒にプールした。実験12の詳細は実験9と非常に類似しており、例外は、ネスティングプロトコール、およびスプリットアンドプール手法であった。集団内の28個の染色体全てについての倍数性コールは正確にコールされ、信頼度は、信頼度78%でコールが上手く行かなかった1つ以外は97%を超えた。450万のリードが標的のSNPにマッピングされ、平均のリード深度は535であり、リード深度の中央値は412であった。
実験13
1つの実験では、4つの母系の血漿試料を調製し、合計9,600個のプライマーについて、9,600プレックス3重ヘミネステッドプロトコールを使用して増幅した。実験12の詳細は実験9と非常に類似しており、例外は、増幅の3つのラウンドを伴うネスティングプロトコールであり;該3つのラウンドは、それぞれ15サイクルのSTA、10サイクルのSTAおよび15サイクルのSTAを伴った。集団内の28個の染色体のうち27個についての倍数性コールは正確にコールされ、信頼度は、94.6%で正確にコールされた1つ、および信頼度80.8%でコールが上手く行かなかった1つ以外は99.9%を超えた。350万のリードが標的のSNPにマッピングされ、平均のリード深度は414であり、リード深度の中央値は249であった。
実験14 1つの実験では、細胞の集合45個を、1,200プレックスセミネステッドプロトコールを使用して増幅し、配列決定し、倍数性の決定を3つの染色体において行った。この実験は、3日目の胚由来の単一細胞生検材料または5日目の胚由来の栄養外胚葉生検材料において着床前遺伝子診断を実施する条件をシミュレートすることを意図していることに留意されたい。個々の単一細胞15個および3つの細胞の集合30個を、合計45の反応のために、45個の個々の反応チューブに入れ、各反応は、ただ1つの細胞系由来の細胞を含有したが、異なる反応は異なる細胞系由来の細胞を含有した。細胞を洗浄バッファー5μl中に調製し、ARCTURUS PICOPURE溶解緩衝液(APPLIED BIOSYSTEMS)5μlを加えることによって溶解させ、56℃で20分間、95℃で10分間インキュベートした。
単一の細胞/3つの細胞のDNAを、1200個の標的特異的フォワードプライマーおよびタグを付けたリバースプライマーを50nMのプライマー濃度を使用して、25サイクルのSTAを用いて増幅した(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;72℃で10秒間;65℃で1分間;60℃で8分間;65℃で3分間および72℃で30秒間;を25サイクル、および72℃で2分間の最終の伸長)。
セミネステッドPCRプロトコールは、1000nMの濃度のリバースタグ特異的プライマー、および、それぞれ60nMの濃度の400個の標的特異的ネステッドフォワードプライマーを使用したSTAの20サイクル(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;65℃で1分間;60℃で5分間;65℃で5分間および72℃で30秒間;を15サイクル、および72℃で2分間の最終の伸長)にわたる、第1のSTA産物の希釈物の3つの並行した第2の増幅を伴った。したがって、3つの並行400プレックス反応では、第1のSTAにおいて増幅された合計1200個の標的が増幅された。
次いで、STA産物の一定分量を、標準のPCRによって、1μMのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて15サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。
このように、単一細胞反応において1,200個のプライマーを使用した;プライマーは、第1染色体、第21染色体およびX染色体上に見いだされるSNPを標的とするように設計した。次いで、増幅産物について、ILLUMINA GAIIXシーケンサーを用いて配列決定した。試料当たりおよそ390万のリードがシーケンサーによって生成され、5000億〜8000億のリードがゲノムにマッピングされた(試料当たりの全てのリードの74%〜94%)。
細胞系由来の関連性のある母系のゲノムDNA試料および父系のゲノムDNA試料を、同じセミネステッド1200プレックスアッセイプールを使用して、同様のプロトコールを用い、より少ないサイクルおよび1200プレックスの第2のSTAを用いて解析し、配列決定した。
配列決定データを、本明細書に開示されているインフォマティクス方法を用いて解析し、試料について3つの染色体において倍数性の状態をコールした。
図24は、6つの試料について、3つの染色体(1=第1染色体;2=第21染色体;3=X染色体)における正規化されたリード深度の比(垂直方向の軸)を示す。比は、その染色体にマッピングされるリード数と等しくなるように設定し、正規化し、それぞれが3つの46XY細胞を含む3つのウェルにわたって平均した、その染色体にマッピングされるリード数で割った。46XY反応に対応する3つのデータ点の集合は、1:1の比を有することが予測される。47XX+21細胞に対応する3つのデータ点の集合は、第1染色体については1:1、第21染色体については1.5:1、およびX染色体については2:1の比を有することが予測される。
図25は、3つの反応に関して3つの染色体(1、21、X)についてプロットした対立遺伝子の比を示す。左下の反応は、3つの46XY細胞における反応を示す。左側の領域は第1染色体についての対立遺伝子の比であり、中央の領域は第21染色体についての対立遺伝子の比であり、右側の領域はX染色体についての対立遺伝子の比である。46XY細胞に関して、第1染色体については、SNP遺伝子型AA、ABおよびBBに対応する1、0.5および0の比が認められることが予想される。46XY細胞に関して、第21染色体については、SNP遺伝子型AA、ABおよびBBに対応する1、0.5および0の比が認められることが予想される。46XY細胞に関して、X染色体については、SNP遺伝子型A、およびBに対応する1および0の比が認められることが予想される。右下の反応は、3つの47XX+21細胞における反応を示す。対立遺伝子の比は、左下のグラフの場合と同様に染色体によって分離される。47XX+21細胞に関して、第1染色体については、SNP遺伝子型AA、ABおよびBBに対応する1、0.5および0の比が認められることが予想される。47XX+21細胞に関して、第21染色体については、SNP遺伝子型AAA、AAB、ABBおよびBBBに対応する1、0.67、0.33および0の比が認められることが予想される。47XX+21細胞に関して、X染色体については、SNP遺伝子型AA、AB、およびBBに対応する1、0.5および0の比が認められることが予想される。右上のプロットは、47XX+21細胞系由来のゲノムDNAを1ng含む反応に対して行われた。図26は、図25と同じグラフを示すが、ただ1つの細胞に対して実施された反応についてのものである。左側のグラフは、47XX+21細胞を含有する反応についてのグラフであり、右側のグラフは46XX細胞を含有する反応についてのグラフであった。
図25および図26に示されているグラフから、1および0の比が認められることが予想される染色体については点のクラスターが2つあること、1、0.5、および0の比が認められることが予想される染色体については点のクラスターが3つあること、および1、0.67、0.33および0の比が認められることが予想される染色体については点のクラスターが4つあることが視覚的に明白である。parental supportアルゴリズムにより、45反応全ての3つの染色体の全てについて正確なコールを行うことができた。
実験15
1つの実験では、母系の血漿試料を調製し、ヘミネステッド19,488プレックスプロトコールを使用して増幅した。試料を以下のように調製した:母系の血液最大20mLを遠心分離して、バフィーコートおよび血漿を単離した。母系試料のゲノムDNAをバフィーコートから調製し、父系のDNAを血液試料または唾液試料から調製した。母系の血漿中の無細胞DNAを、QIAGEN CIRCULATING NUCLEIC ACIDキットを使用して単離し、TE緩衝液50μLで製造者の指示に従って溶出した。ユニバーサルライゲーションアダプタを、精製された血漿DNA40μLの各分子の末端に付加し、ライブラリーを、アダプタ特異的プライマーを使用して9サイクルにわたって増幅した。ライブラリーを、AGENCOURT AMPUREビーズを使用して精製し、50μlのでDNA懸濁緩衝液で溶出した。
19,488個の標的特異的タグを付けたリバースプライマーのプライマー濃度7.5nMおよび1つのライブラリーアダプタ特異的フォワードプライマーの500nMを使用し、15サイクルのSTAR1を用いて、6μlのDNAを増幅した(最初のポリメラーゼ活性化のために95℃で10分間、次いで、96℃で30秒間;65℃で1分間;58℃で6分間;60℃で8分間;65℃で4分間および72℃で30秒間;を15サイクル、および72℃で2分間の最終の伸長)。
ヘミネステッドPCRプロトコールは、第1のSTAR1産物の希釈物の、1000nMのリバースタグ濃度、および19,488個の標的特異的フォワードプライマーのそれぞれについて20nMの濃度を用いた15サイクル(STAR2)の第2の増幅を伴った(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;65℃で1分間;60℃で5分間;65℃で5分間および72℃で30秒間;の15サイクル、および72℃で2分間の最終の伸長)。
次いで、STAR2産物の一定分量を、標準のPCRによって、1μMのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて12サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。
このように、単一ウェル反応において19,488個のプライマーを使用した。プライマーは、第1染色体、第2染色体、第13染色体、第18染色体、第21染色体、X染色体およびY染色体上に認められるSNPを標的とするように設計した。次いで、増幅産物について、ILLUMINA GAIIXシーケンサーを用いて配列決定した。血漿試料に対し、およそ1000万のリードがシーケンサーによって生成され、940〜960万のリードがゲノムにマッピングされ(94〜96%)、それらのうち、99.95%が標的のSNPにマッピングされ、平均のリード深度は460であり、リード深度の中央値は350であった。比較のために計算してみると、完全に均等な分布は、1000万リード/19,488個の標的=513リード/標的となる。プライマー二量体に対しては、30,000リード(シーケンサーにより生成されたリードの0.3%)が配列決定されたプライマー二量体由来であった。ゲノム試料に対しては、99.4〜99.7%のリードがゲノムにマップされ、この内の99.99%が標的SNPにマップされ、シーケンサーにより生成されたリードの0.1%がプライマー二量体であった。
1000万シークエンシングリードの血漿試料に対しては、通常、少なくとも19,488個の標的SNPの内の19,350個(99.3%)が増幅および配列決定される。200万シークエンシングリードのDNA試料に対しては、通常、少なくとも19,000標的SNP(97.5%)が増幅および配列決定される。数字が小さいのは、ランダムサンプリングノイズに起因する可能性がある。理由は、リード数が小さく、シーケンサーが一部の増幅産物を見逃すためである。必要があれば、シークエンシングリード数を多くして、増幅および配列決定される標的SNPの数を増やすことができる。
関連性のある母系および父系ゲノムDNA試料を、STAR1中の7.5nMのセミネステッド19,488外側フォワードプライマーおよびタグ付加リバースプライマーを使って増幅した。サーモサイクリング条件およびSTAR2の組成、およびバーコーディングPCRはヘミネステッドプロトコールについてのものと同じであった。
407個の試料に対する平均胎児画分は、14.8%であることが明らかになった。配列決定データを本明細書で開示のインフォマティクス法を使って解析し、407個の母系血漿試料の378個中にDNAが存在していた胎児の4個の染色体(13、18、21、Y)、および407個の母系血漿試料の375個中の染色体Xの倍数性状態をコールした。集団内の1,887個の染色体全てについての倍数性コールは正確にコールされ、信頼度は90%を超えた。1887コールの内の1882は、95%を超える信頼度であり、1,887コールの内の1,862は99%を超える信頼度であった。
血漿から抽出したDNAの代わりに水を使って、血漿PCRプロトコールにより類似の対照実験を行った。6種のこのような試行実験では、5〜6%の配列決定リードがプライマー二量体であった。他の配列決定リードは、バックグラウンドノイズによるものであった。この実験は、プライマーがハイブリダイズする標的遺伝子座を有する核酸試料が存在しない場合であっても、(他のプライマーにハイブリダイズして増幅プライマー二量体が形成されないで)少量のプライマー二量体が形成されることを示す。
実験16
次の実験は、本発明のいずれかの多重PCR法で使うことができるプライマーライブラリーの代表的設計および選択方法を示す。目的は、ただ1回の反応で大量の標的遺伝子座(または標的遺伝子座のサブセット)を同時に増幅するために使用できるプライマーを初期の候補プライマーライブラリーから選択することである。初期の候補標的遺伝子座集合に対しては、それぞれの標的遺伝子座に対するプライマーを設計または選択する必要はない。できるだけ多くの望ましい標的遺伝子座に対しプライマーが設計、選択されるの好ましい。
ステップ1
候補標的遺伝子座(例えば、SNP)の集合を、標的遺伝子座の望ましいパラメータ例えば、標的集団内のSNP頻度またはSNPのヘテロ接合率(ncbi.nlm.nih.gov/projects/SNP/のworldwide web;Sherry ST,Ward MH,Kholodov M,et al.dbSNP:遺伝的変異のNCBIデータベース、Nucleic Acids Res.2001 Jan 1;29(1):308−11。これらのそれぞれは、参照によりその全体が本明細書に組み込まれる)に関する公的に入手可能な情報に基づいて選択した。それぞれの候補遺伝子座に対し、Primer3プログラム(primer3.sourceforge.netのworldwide web;libprimer3 release 2.2.3。これらは、参照によりその全体が本明細書に組み込まれる)を使って、1個または複数個のPCRプライマー対が設計された。特定の標的遺伝子座のPCRプライマーに対する実行可能な設計が存在しなかった場合は、その標的遺伝子座をその後の検討から除外した。
必要に応じ、ほとんど、または全ての標的遺伝子座に対し「標的遺伝子座スコア」(高いスコアは、高い望ましさを表す)、例えば、種々の標的遺伝子座に望ましいパラメータの加重平均をベースにして計算した標的遺伝子座スコアを計算してもよい。パラメータは、プライマーが使われる特定の用途に対するそれらの重要性に応じて異なる加重を割り付けることができる。代表的パラメータには、標的遺伝子座のヘテロ接合率、標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、標的遺伝子座の増幅に使われる候補プライマーの特異性、標的遺伝子座の増幅に使われる候補プライマーのサイズ、および標的増幅産物のサイズが含まれる。
ステップ2
それぞれのプライマーと、ステップ1からの全てのその他の標的遺伝子座に対する全てのプライマーとの間で熱力学的相互作用スコアを計算した(例えば、Allawi,H.T.& SantaLucia,J.,Jr.(1998),「Thermodynamics of Internal C−T Mismatches in DNA」,Nucleic Acids Res.26,2694−2701;Peyret,N.,Seneviratne,P.A.,Allawi,H.T.& SantaLucia,J.,Jr.(1999),「Nearest−Neighbor Thermodynamics and NMR of DNA Sequences with Internal A−A,C−C,G−G,and T−T Mismatches」,Biochemistry 38,3468−3477;Allawi,H.T.& SantaLucia,J.,Jr.(1998),「Nearest−Neighbor Thermodynamics of Internal A−C Mismatches in DNA:Sequence Dependence and pH Effects),Biochemistry 37,9435−9444.;Allawi,H.T.& SantaLucia,J.,Jr.(1998),「Nearest Neighbor Thermodynamic Parameters for Internal G−A Mismatches in DNA」,Biochemistry 37,2170−2179;およびAllawi,H.T.& SantaLucia,J.,Jr.(1997),「Thermodynamics and NMR of Internal G−T Mismatches in DNA」,Biochemistry 36,10581−10594;MultiPLX2.1(Kaplinski L,Andreson R,Puurand T,Remm M.MultiPLX:automatic grouping and evaluation of PCR primers.Bioinformatics.2005 Apr 15;21(8):1701−2、を参照。これらの文献は参照によりその全体が本明細書に組み込まれる)。このステップは、相互作用スコアの2D行列を生成する。相互作用スコアにより、2個の相互作用プライマーを含むプライマー二量体の尤度を予測した。スコアは、下式のように計算された:
相互作用_スコア=max(−deltaG_2,0.8*(−deltaG_1))
式中、
deltaG_2=PCRにより両端で伸長可能な、すなわち、それぞれのプライマーの3’末端が他のプライマーにアニールする二量体に対するギブズエネルギー(二量体を破断するのに要するエネルギー);および
deltaG_1=少なくとも一端でPCRにより伸長可能な二量体に対するギブズエネルギー、である。
ステップ3:
それぞれの標的遺伝子座に対し、2個以上のプライマー対設計が存在する場合、下記の方法を使って1個の設計が選択される:
1 遺伝子座のそれぞれのプライマー対設計に対し、その設計の2個のプライマーおよびその他の全ての標的遺伝子座に対する全ての設計による全てのプライマーに対し、最悪の(最高の)相互作用スコアを見つける。
2 最悪相互作用スコア中で最良の(最低の)スコアを有する設計を選択する。
ステップ4
それぞれのノードが1個の遺伝子座およびその関連するプライマー対設計(例えば、最大クリーク問題)を表すようにグラフが構築された。それぞれのノード対間に1個のエッジをを形成した。それぞれのエッジに、エッジにより連結された2つのノードに関連するプライマーの内の最悪の(最高の)相互作用スコアに等しい加重を割り付けた。
ステップ5
必要に応じ、1つの設計による1個のプライマーと、別の設計による1個のプライマーが重複する標的領域にアニールすると思われる2個の異なる標的遺伝子座の全ての設計対に対して、2個の設計に対するノード間に追加のエッジを加えた。これらのエッジの加重を、ステップ4で割りつけられた最高加重と同じに設定した。従って、ステップ5は、重複する標的領域にアニールし、従って、多重PCR反応中に相互に干渉すると思われるプライマーがライブラリーに含まれるのを防ぐ。
ステップ6
初期の相互作用スコア閾値は、次式で計算された:
加重_閾値=max(エッジ_加重)−0.05*(max(エッジ_加重)−min(エッジ_加重))
式中、
max(エッジ_加重)は、グラフ中の最大エッジ加重であり、
min(エッジ_加重)は、グラフ中の最小エッジ加重である。
閾値の開始点は、下記のように設定された:
max_加重_閾値=max(エッジ_加重)
min_加重_閾値=min(エッジ_加重)
ステップ7
加重_閾値を超える加重のエッジのみを有し、ステップ5のグラフと同じ設定のノードからなる新規グラフを構築した。従って、このステップは、加重_閾値以下のスコアの相互作用を無視している。
ステップ8
残存エッジが無くなるまで、ノード(および除去されたノードに連結された全てのエッジ)をステップ7のフラグから除去した。それぞれ以下の手順を反復適用して、ノードを除去した:
1 最高角度の(最高数のエッジを持つ)ノードを見つける。2個以上ある場合は、任意の1個を選択する。
2 上記で選択したノードからなるノードおよびそれに連結した全てのノードの集合を定める(但し、上記で選択したものより小さい角度のノードは除く)。
3 ステップ1由来の最小標的遺伝子座スコア(より小さいスコアは、より低い望ましさを表す)を有する集合からノードを選択する。そのノードをグラフから除去する。
ステップ9
グラフに残っているノードの数が多重PCRプール用として必要な標的遺伝子の数を満たす場合は(許容可能な誤差内で)、前記方法をステップ10で継続した。
グラフに残っているのが多すぎるか、または少なすぎる場合は、二分探索を行って何の閾値がグラフ中に残っている望ましい数のノードを生成したかを判定した。グラフ中に多すぎるノードがあった場合、加重閾値境界を下式のように調節した:
max_加重_閾値=加重_閾値
そうでない場合(グラフ中に少なすぎるノードしかない場合)、加重閾値境界を下式のように調節した:
min_加重_閾値=加重_閾値
次に、加重閾値を下式のように調節した:
加重_閾値=(max_加重_閾値+min_加重_閾値)/2
ステップ7〜9を繰り返した。
ステップ10
グラフ中に残っているノードに関連するプライマー対設計をプライマーライブラリー用に選択した。このプライマーライブラリーを本発明のいずれかの方法で使用できる。
必要に応じ、このプライマー設計および選択方法は、1個のみのプライマー(プライマー対ではなく)が標的遺伝子座の増幅に使用されるプライマーライブラリーに対しても実行できる。この場合には、ノードは、(プライマー対ではなく)1個のプライマー当たりの標的遺伝子座を示す。
実験17
図27は、本発明の方法を使って設計された2種のプライマーライブラリーを比較するグラフである。このグラフは、それぞれのプライマーライブラリーの標的となる特定のマイナー対立遺伝子頻度を有する遺伝子座の数を示す。「新規プール」ライブラリーの選択中、より多くのプライマーが保持された。このライブラリーは、より多くの標的遺伝子座、特に、より多くの比較的大きなマイナー対立遺伝子頻度を有する標的遺伝子座(これは、本発明の一部の方法、例えば、胎児の染色体異常の検出に対しより高い情報価値のある対立遺伝子である)の増幅を可能とする。
これらのプライマーライブラリーを次の多重PCR法で使用した。血液(20〜40mL)をそれぞれの対象から2個〜4個のCELL−FREE(商標)DNAチューブ(Streck)中に採取した。血漿(最低限7mL)を、2,000gで20分間、続けて3,220gで30分間の二重遠心分離プロトコールによりそれぞれの試料から単離し、第1回目の遠心分離後に上清を移した。QIAGEN QIAamp Circulating Nucleic Acidキットを使ってcfDNAを7〜20mLの血漿から単離し、45uLのTE緩衝剤で溶出した。純母系ゲノムDNAを第1回目の遠心分離後に得られたバフィーコートから単離し、純父系ゲノムDNAを血液,唾液または頬側試料から同様にして調製した。
11,000標的特異的アッセイを使って、母系cfDNA、母系ゲノムDNA、および父系ゲノムDNA試料を15サイクル前増幅し、一定分量をネステッドプライマーを使った15サイクルの第2のPCR反応に移した。最終的に、第3の12サイクルラウンドのPCRでバーコード化タグを付加することにより試料をシークエンシング用に調製した。従って、1回の反応で11,000標的を増幅し、標的は、13、18、21、X、およびY染色体上に認められるSNPを含んでいた。その後、ILLUMINA GAIIxまたはHISEQシーケンサーを使って増幅産物を配列決定した。胎児の遺伝子型より浅いリード深度(cfDNAのリード深度の約20%)で親の遺伝子型を配列決定した。
実験18
必要に応じ、標準的な方法、例えば、Agilent Technologies 2100 Bioanalyzer(図28A−M)を使ってPCR産物のサイズと量を分析できる。例えば、2,400プレックス(図28B−28G)および19,488プレックス実験(図28H〜28M)に本明細書で記載のネスティングなしの直接PCR法を使用した。図28B〜28Dと28H〜28J用のプライマーの量は10nMであった。図28E〜28Gと28K〜28Mのプライマーの量は1nMであった。図28B、28E、28H、および28Kでは、入力DNAの量は24ng;図28C、28F、28I、および28Lでは、80ng;ならびに、図28D、28G、28J、および28Mでは250ngであった。より多くの入力DNAでは、より大きな比率の所望の180塩基対産物が生成した。140塩基対の位置のピークは、プライマー二量体産物である。
実験19
原理証明調査は、全染色体にわたり等しく高い正確度でのT13,T18,T21,45,X,および47,XXYの検出を実証した。
患者
地域法に準じて施設内審査委員会により承認されたプロトコールに基づいて、妊娠中の夫婦を特殊出生前ケアセンター(specific prenatal care center)に登録した。選択規準は、少なくとも18才の年令、少なくとも9週間の妊娠期間、単胎妊娠、およびインフォームドコンセントへのサインであった。血液試料を妊娠中の母親から採取し、血液または頬側試料を父親から集めた。2例のT13(パトー症候群)を有する妊娠、2例のT18(エドワーズ症候群)を有する妊娠、2例のT21(ダウン症候群)を有する妊娠、2例の45,Xを有する妊娠、2例の47,XXYを有する妊娠、および90例の正常妊娠、由来の試料を、試験前に約500人の女性のコホートから選択し、その方法がどの染色体異常を検出するかを試験した。誕生後の子供組織が入手可能な場合、その試料に対し、正常胎児の核型を分子核型分析により確認した。低リスク女性の侵襲的検査の前に正倍数体試料を採取した。正倍数体試料を、侵襲的検査後少なくとも7日間採取し、別々の研究所での細胞遺伝学的核型分析または蛍光インサイツハイブリダイゼーションにより異数性を確認した。
試料調製および多重PCR
図30A〜E、30G、30H、および31A−31G中のデータに対しては、実験15で記載のように試料調製および19,488プレックスPCRを行った。図30F中のデータに関しては、実験17で記載のように試料調製および11,000プレックスPCRを行った。
方法およびデータ解析
アルゴリズムは、親の遺伝子型および乗換え頻度データ(例えば、ハップマップデータベース由来のデータ)を考慮して、極めて多数の可能な胎児の倍数性状態、および、種々の胎児のcfDNA画分に対する19,488多形遺伝子座での予測される対立遺伝子分布を計算する(図29A〜29C)。対立遺伝子比に基づく方法と異なり、アルゴリズムは、連鎖不平衡も考慮に入れ、非ガウス分布データモデルを使って、観察プラットフォーム特性および増幅の偏りを有するSNPに対する対立遺伝子測定の予測分布を示す。その後、アルゴリズムは、種々の予測対立遺伝子分布を、cfDNA試料で測定した実際の対立遺伝子分布と比較し(図29C)、配列決定データに基づいてそれぞれの仮説(モノソミー,ダイソミー,またはトリソミー、これらに対しては、種々の可能な乗換えに基づいて多くの仮説が存在する)の尤度を計算する。アルゴリズムは、それぞれの個別のモノソミー,ダイソミー,またはトリソミー仮説の尤度を合計し(図29D)、コピー数および胎児画分として最大合計尤度を有する倍数性状態をコールする(図29E)。研究室の研究者は、試料核型に対し盲検方式ではなかったが、アルゴリズムは、ヒトの介入なしに倍数性状態をコールするので、真実に対し盲検性が維持されている。
データの解釈
生成データのグラフ表示
対象染色体の倍数性状態を決定するために、アルゴリズムは、染色体当たり3,000〜4,000個のSNP位置のそれぞれの2個の可能な対立遺伝子の配列数の分布を考慮する。アルゴリズムは、可視化には役立たない手法を使って倍数性コールを行うことに留意することは重要である。従って、説明のために、本明細書では、データは単純化された方式で、AとBとして標識される2個の最も可能性のある対立遺伝子の比率として示され、それにより、関連する傾向がより容易に可視化できる。この単純化図示は、アルゴリズムの一部の特徴を考慮していない。例えば、対立遺伝子比率を提示する可視化の方法では説明できない2つの重要なアルゴリズムの側面は、1)連鎖不平衡、すなわち、1個のSNPでの測定が隣接するSNPの可能な固有の特性に与える影響を活用する能力、および、2)プラットフォーム特性および増幅偏りを有するSNPに対する予測される対立遺伝子測定値の分布を説明する非ガウス分布データモデルの使用である。また、アルゴリズムは、それぞれのSNP位置で2つの、最も頻度の高い対立遺伝子を考慮するのみで、他の可能な対立遺伝子を無視することにも留意されたい。
図30A〜30Hのグラフ表示は、2個、1個、または3個の胎児染色体が存在する試料を含む。通常、これらは、正倍数性(図30A〜30C)、モノソミー(図30D)、およびトリソミー(図30E〜30H)をそれぞれ示す。全てのプロットで、それぞれのスポットは、単一SNPを示し、標的SNPは、1個の染色体に対し左から右へ水平軸に沿って順次プロットされる。垂直軸は、A対立遺伝子に対するリード数を、そのSNPに対するAとB両方の対立遺伝子の合計リード数に対する比率として示す。測定は、母系血液から単離された合計cfDNAに対し行われ、cfDNAは、母系と胎児両方のcfDNAを含み、従って、それぞれのスポットは、そのSNPに対する胎児と母系DNAの寄与の組み合わせを表すことに留意されたい。従って、母系cfDNAの0%〜100%の比率の増加は、いくつかのスポットを、母系と胎児の遺伝子型に応じてプロット内で徐々にに上下に移動させることになるであろう。
可視化を容易にすることが必要な場合には、母系遺伝子型はそれぞれのスポットの局在化に多く寄与し、大部分のトリソミーは、母系遺伝であるため、母系遺伝子型に応じてスポットを色分けでき、これは倍数性状態の可視化に有用である。具体的には、母系遺伝子型がAAであるSNPは、赤色で示すことができ、母系遺伝子型がABであるSNPは緑色で示すことができ、母系遺伝子型がBBであるSNPは青色で示すことができる。
全てのケースで、A対立遺伝子に対し母親と胎児の両方由来のホモ接合(AA)であるSNPは、B対立遺伝子が存在しないはずのためA対立遺伝子リード比率が高いので、プロットの上限にぴったりと張り付いているのが認められる。逆に、B対立遺伝子に対し母親と胎児の両方由来のホモ接合であるSNPは、B対立遺伝子のみが存在するはずなのでA対立遺伝子リード比率が小さいために、プロットの下限にぴったりと張り付いているのが認められる。プロットの上限にも下限にもぴったりと張り付かないスポットは、母親、胎児、または両方がヘテロ接合であるSNPを示す。これらのスポットは、胎児の倍数性を特定するのに有用であるが、父系対母系遺伝の判定に対し情報価値のある場合もある。これらのスポットは、母系と胎児の遺伝子型および胎児画分の両方に基づいて分離し、従って、それぞれのy軸に沿った個別のスポットの詳細な位置は、化学量論および胎児画分の両方に依存する。例えば、母がAAで胎児がABである遺伝子座は、異なるA対立遺伝子リード比率を有し、従って、胎児画分に応じてy軸に沿った異なる位置を取ると予測される。
2個の染色体の存在
図30A〜30Cは、試料が完全に母系の場合(胎児のcfDNAが存在しない場合:図30A)、中程度の胎児のcfDNA画分を含む場合(図30B)、または高い胎児のcfDNA画分を含む場合(図30C)の2個の染色体の存在を示すデータである。
図30Aは、非妊婦の血液から単離したcfDNAから得たデータを示す。胎児のcfDNAが存在せず、試料が母系cfDNAのみを含む場合、プロットは、純粋に正倍数体母系遺伝子型を表し、ホールマークパターンは、スポットの「クラスター」を含み、赤色クラスターがプロットの上端にぴったりと張り付いており(母系遺伝子型がAAであるSNP)、青色クラスターがプロットの下端にぴったりと張り付いており(母系遺伝子型がBBであるSNP)、さらに、単一の緑色クラスターが中央に存在する(母系遺伝子型がABであるSNP)(図では色を示さず)。
胎児のcfDNAが存在する場合は、スポットの位置は、クラスターが離散的「バンド」に分離するように移動する。0%の胎児画分の試料に対して、ひとまとまりのスポットは、「クラスター」と呼ばれ(図30Aのように)、また、0%を超える胎児画分の全ての試料に対しては、ひとまとまりのスポットは、「バンド」(図30B〜30Jのように)と呼ばれることに留意されたい。胎児画分が十分大きい場合、これらの離散的バンドは、容易に目視可能となろう。具体的には、図30Bと30Cは、中程度および高い胎児画分がそれぞれ存在する2個の胎児染色体に関連する特徴的パターンを示す。このパターンは、母親中でヘテロ接合であるSNPに対応する3つの中央緑色バンド、および母親中でホモ接合であるSNPに対応するそれぞれプロットの上端(赤)および下端(青)の両方にある2つの「周辺」バンドを含む(図では色を示さず)。
図30Bは、正倍数体胎児保有女性由来で、12%胎児のcfDNA画分を含む血漿試料から単離したcfDNA由来のデータを示す。ここで、プロットの上端および下端にぴったり張り付いたスポットのクラスターは、それぞれ:プロットの上端または下端にぴったり張り付いたまま残っている1つの赤色および1つの青色外側周辺バンド、ならびにプロットの端部から離れた1つの赤色および1つの青色内側周辺バンド、の2つの離散的バンドに分離する(図では色を示さず)。これらの0.92と0.08近傍を中心とする内側周辺バンドは、母系遺伝子型がAAで胎児の遺伝子型がAB(赤色で示す)であるSNP、および母系遺伝子型がBBで胎児の遺伝子型がABであるSNP(青色で示す)をそれぞれ表す。緑色のスポットの中央クラスターは広がっているが、この胎児画分では、明確なバンドへの分離は容易には視認できない。
高い胎児のcfDNA画分では、2個の染色体の存在を示す典型的パターン(3組の緑色のバンド、ならびに2つの赤色および2つの青色周辺バンド)が容易に見てとれる(図では色を示さず)。図30Cは、26%の胎児のcfDNA画分の場合の、正倍数体胎児を保有する女性由来の血漿試料から得たデータを示す。ここで、周辺バンドは、増加した胎児のcfDNA画分由来の変化したB対立遺伝子のレベルに起因して、内側バンドが分離してプロットの中心部へ向かって移動する。高い胎児画分で中央の緑色クラスターの3つの別々のバンドへの分離は、この時点でかなり容易に見てとれるのは意義深いことである。この中央の3組のバンドは、この場合、0.37、0.50および0.63近傍にクラスター化し、母系遺伝子型がABで、それぞれ、胎児の遺伝子型がBB(下部)、AB(中央)およびAA(上部)であるSNPに対応する。
これらのホールマークパターン、すなわち、3つの緑色バンドおよび四つの周辺バンド(2つの赤色および2つの青色)は、常染色体正倍数性の場合、または女性(XX)胎児中のX染色体の場合のように、2個の染色体の存在を示す。
1個の染色体の存在
胎児が単一染色体のみを受け継ぎ、従って、単一の対立遺伝子のみを受け継ぐ場合、胎児のヘテロ接合性は、不可能である。従って、唯一の可能な胎児のSNPの識別情報は、AまたはBである。従って、母系遺伝モノソミー染色体は、母親がヘテロ接合であるSNPを示す2つの中央緑色バンド、および母親がホモ接合であるSNPを示し、プロットの上端および下端にぴったり張り付いたまま残っているそれぞれ唯一の赤色および青色周辺バンド(1と0のリード比率)(図30D)(図では色を示さず)の特徴的パターンを有する。内側周辺バンドが存在しないことに留意されたい。このパターンは、母系遺伝常染色体モノソミーの場合、または男性(XY)胎児のX染色体の場合のように、1個の染色体の存在を示す。
3個の染色体の存在
トリソミー染色体は、3つの特徴的パターンを有する。第1のパターンは、母系遺伝減数分裂トリソミー(減数分裂エラー)を示し、胎児は相同性の、同一でない2個の染色体を母親から受け継いでいる(図30E)。このパターンは、それぞれ2つの赤色および青色周辺バンドを有する2つの中央緑色バンドを含む(図では色を示さず)。第2のパターンは、父親から受け継いでいる減数分裂トリソミーを示し、胎児は、2個の相同性の、同一でない父親由来染色体を受け継いでいる(図30F)。このパターンは、4つの中央緑色バンドおよびそれぞれ3つの赤色および青色周辺バンドを含む(図では色を示さず)。第3のパターンは、母親から(図30G)または父親から受け継いでいる(図30H)有糸分裂トリソミー(有糸分裂エラー)を示し、胎児は、2個の同一の母親または父親由来の染色体を受け継いでいる。このパターンは、それぞれ2つずつ赤色および青色周辺バンドを有する4つの中央緑色バンド含む。母親からおよび父親から受け継いだ有糸分裂トリソミーは、赤色および青色バンドに隣接した配置により識別できる。父親から受け継いでいる有糸分裂トリソミーでは、赤色および青色内側周辺バンド(プロットの端に張り付いていないバンド)が中央により近くなる(図では色を示さず)。これは、同一染色体の父系寄与が原因である。我々の以前の結果から、卵割球段階で、66.7%の母系遺伝トリソミーが減数分裂であり、10.2%のトリソミーのみが父系遺伝であることが示されることに留意されたい。
Y染色体に関しては、PS法は、別々の仮説セット:ゼロ個、1個、または2個の染色体の存在を考慮している。それぞれの遺伝子座でのシーケンスリードに母系の寄与が無い場合、ヘテロ接合遺伝子座は可能ではないので(2個のY染色体のケースは、必ず2個の同一染色体を含む)、バンドは、プロットの上端(A対立遺伝子)または下端(B対立遺伝子)にぴったり張り付いたまま残り(データは図示せず)、解析は極めて単純となり、定量的対立遺伝子数データに依存する。前記方法はSNPを調べるので、Y染色体由来の相同非組換え型SNPを使用し、従って、1個のプローブ対に対してXとYの両方上のデータを取得することに留意されたい。
異数性の特定
上述のように、このプロットベース可視化法を使った常染色体異数性の特定は、直接的に十分な胎児画分が与えられ、異常な数の染色体が存在するプロットを特定することが必要でなだけである。XとY染色体のコピー数の情報を合計することにより、性染色体異数性が存在するか否かが特定される。具体的には、47,XXX遺伝子型を有する胎児を表すプロットは、典型的な「3染色体」パターンを有し、47,XXY遺伝子型を有する胎児を表すプロットは、X染色体に対し典型的な「2染色体」パターンを有するが、また、1個のY染色体の存在を示す対立遺伝子リードも有する。同様に、前記方法は、47,XYYをコールすることもでき、この場合、「1染色体」パターンは、単一X染色体の存在を示し、また、対立遺伝子リードは、2個のY染色体の存在を示す。45,X遺伝子型を有する胎児は、X染色体に対して典型的な「1染色体」パターンを有し、データは、ゼロY染色体を示す。
胎児画分の影響
上記で考察のように、胎児由来シーケンスリード数は、プロットのy軸に沿ったそれぞれのスポットの正確な位置を与える。胎児画分は、胎児および母親由来のリードの比率に影響を与えるので、それぞれのスポットの位置取りにも影響を与える。図30C〜30Eおよび図30Gと30Hの胎児のcfDNAの高い比率(通常約20%)では、スポットクラスターは、主に母系遺伝子型に基づいているが、遺伝子型が母系遺伝子型と異なる対立遺伝子由来の胎児DNAの存在により、クラスターが複数の別個のバンドに変化することが容易に見てとれる。しかし、胎児画分が減少するに伴い(図30Bおよび30Fの場合のように)、スポットは、プロットの両端および中心の方に戻り、より詰まったクラスターを生じる。具体的には、母系遺伝子型がAAである赤色周辺バンドの集合は、プロットの上端の方向に戻り、母系遺伝子型がBBの青色周辺バンドの集合は、下端の方向に戻り、母親がヘテロ接合の緑色中央バンドの集合は、プロット中心部の単一クラスターに圧縮される(図30Bと30Cとを比較されたい)(図では色を示さず)。低胎児画分の場合に対しこの可視化手法を使った場合には、異数性は容易に視認できないが、アルゴリズムは、非常に小さい胎児画分、例えば、3%胎児画分の場合の倍数性状態を特定できる。統計的技術を使って所与の試料パラメータセット(例えば、コピー数、親の遺伝子型、および胎児画分、など)に対し、観察データを、対立遺伝子分布を予測する極めて正確なデータモデルと比較することにより、これが可能となる。小胎児画分の場合には、異なる倍数性状態に対する対立遺伝子分布間の差異は胎児画分に比例するので、データモデル精度が重要である。さらに、アルゴリズムは、データセットに信頼性のある胎児の倍数性決定を行うために十分なデータが含まれない場合を判定できる。
結果
標的SNPのマッピングされたシークエンシングリードは、情報価値があると見なされ、アルゴリズムで使用された。シークエンシング結果で、95%超の標的遺伝子座が観察された。重要な倍数性コールを可視化するプロットを、図31A〜31Gに示す。図31Aは、正倍数体試料を示す。ここでは、染色体13、18、および21は、典型的な「2染色体」パターン(本明細書で記載のように)を有する。これは、3組の緑色中央バンド、および2つの赤色バンドおよび2つの青色周辺バンドを含む。これは、X染色体に対する2つの緑色中央バンドおよびプロットの端部に沿ったY染色体バンドの存在と一緒に、正倍数体XY遺伝子型を示す(図では色を示さず)。
最も一般的な常染色体トリソミーのT13、T18、およびT21は、図31B、31C、および31D中のプロットでそれぞれ示されている。具体的には、図31Bは、T13試料を示す。ここで、染色体18と21は典型的な「2染色体」パターンを示し、染色体Xは典型的な「1染色体」パターンを示し、Y染色体由来のリードが存在する。全体で、これは、染色体18および21でダイソミーを示し、胎児のXY遺伝子型を識別する。しかし、具体的には、染色体13は、典型的な「3染色体」パターンを示す。同様に、図31CはT18試料を示し、図31DはT21試料を示す。
また、前記方法は、45,X(図31E),47,XXY(図31F),および47,XYY(図31G)を含む性染色体異数性を検出することができる。前記方法は、染色体13、18、21、X、およびYでのコピー数をコールしており、全体の染色体数は、残っている染色体にダイソミーを仮定して報告されていることに留意されたい。プロットの45、X試料を示すX染色体領域は、単一染色体の存在を示す。しかし、染色体13、18、および21に対する「2染色体」パターンに加えて、Y染色体由来のリードの欠如は、45,X遺伝子型を指し示す。逆に、47,XXY試料は、2X染色体の存在を示すプロットを生成する。また、データは、Y染色体由来の対立遺伝子のリードを示した。染色体13、18、および21の2コピーに加えて、これは、47,XXY遺伝子型を指し示す。47,XYY遺伝子型は、X染色体に対する「1染色体」パターン、および2個のY染色体の存在を表すリードの存在により示される。
考察
前記方法は、母系血液からT13、T18、T21、45,X、47,XXY、および47,XYYを非侵襲的に検出した。前記方法は、19,488個のSNPの標的多重PCR増幅および高スループットシークエンシングにより母系血漿からcfDNAを調べる。前記方法は、胎児画分およびDNA品質を含む親の遺伝子型情報および多くの試料パラメータを考慮に入れる前記方法の高度インフォマティクス解析と組み合わせて、より確実に胎児の前兆を検出し、7種の最も良く見られるタイプの出生時異数性(T13、T18、T21、45,X、47,XXX、47,XXY、および47,XYY)に関連する5個の染色体の全てで高度に正確な倍数性コールを行う。前記方法は、以前の方法に比べて、顕著に大きな臨床的適用範囲および高い試料特異的計算精度(個別化されたリスクスコアと同様に)などの多くの臨床的利点を提供する。
臨床的適用範囲の拡大
常染色体トリソミーおよび性染色体異数性を正確に検出する能力を考慮すれば、前記方法は、臨床的に利用可能なNIPT法に比べて異数性適用範囲を2倍程度増加させる。本明細書で提示された方法は、性染色体の倍数性を高正確度でコールする非侵襲的検査に過ぎない。以前のDNA混合実験および我々の実験的アッセイで解析された別の血漿試料は、前記方法により47,XXXを含むより大きな性染色体異常コホートを検出できることを示唆している。また、本明細書で提示の方法により、染色体13、18、および21の異数性を高感度および高特異性で検出でき、また、適切なプライマー設計を行えば、残りの染色体でも同様にコピー数を検出できることが期待される。
試料特異的精度の計算
特に意味があるのは、前記方法がそれぞれの試料中のそれぞれの染色体の倍数性コールに関する試料特異的正確度を計算することである。前記方法で計算された正確度は、低い正確度の検定結果を生じる可能性のある悪い品質のDNAまたは低胎児画分を有する個別試料を特定し、印を付けることにより、間違ったコールの比率を大きく低減させることが期待される。対照的に、大規模ショットガンシークエンシング(MPSS)に基づく方法は、単一仮説棄却検定を使ったポジティブまたはネガティブコールを行い、それらの正確度推定は、個別試料の特徴ではなく、公表された調査コホートに基づいており、正確度がコホートと同じ正確度を有すると仮定されている。しかし、コホート分布の裾にあるパラメータを有する試料に対する個別の正確度は大きく異なる場合がある。早期妊娠期間の場合のような低胎児画分では、または低DNA品質の試料に対しては、この現象は悪化する。これらの試料は、通常、追跡観察用として特定およびタグ付けされず、この結果、コールが見逃される可能性がある。しかし、本発明は、胎児画分および多くのDNA品質尺度などの多くのパラメータを考慮に入れてそれぞれの染色体コピー数コールを行い、そのコールに対し試料特異的正確度を計算する。これにより、前記方法を使って、低い正確度を有する個別試料を追跡用として特定し、フラグ付加が可能となる。これにより、特に、胎児画分が通常少ない妊娠早期段階で、ほとんどのコールの見逃しがなくなることが期待される。この前提は、コールの無い場合には単に再採血と再分析をすればよいので、コールの見逃しよりもコールのない方がはるかに好ましいということである。
計算された正確度の従来のリスクスコアへの変換
前記方法は、高リスク妊娠女性に対する異数性のリスクの調製済みリスクを提供でき、この場合、調製済みリスクには、事前リスクが考慮されている(BennP,Cuckle H,Pergament E.Non−invasive prenatal diagnosis for Down syndrome:the paradigm will shift,but slowly. Ultrasound Obstet Gynecol 2012;39:127−130。この文献は参照によりその全体が本明細書に組み込まれる)。前記方法は、それぞれの患者に合わせた計算正確度を提供するが、臨床用途に対しては、これらの正確度を従来のリスクスコアに変化できる。これは正倍数体妊娠のリスクも意味するが、割合として表される。従来のリスクスコアは、母体年齢関連性リスクおよび血清レベルの生化学マーカーなどの種々のパラメータを考慮してリスクスコアが提供され、その値を超えると母親は高リスクと見なされ、該当する母親に対して、追跡観察のための侵襲的診断手順が薦められる。前記方法は、このリスクスコアを大幅に正確化し、従って、擬陽性および偽陰性割合の両方を減らし、個別の母系リスクのより正確な評価を与える。本明細書で使われる計算正確度は、倍数性コールが正確である尤度であり、パーセントで表されるが、実験19で使われる計算正確度は、年齢関連リスクを含まない。リスクスコアの計算は、通常、年齢関連リスクを含むために、計算正確度および従来のリスクスコアは、互換性がなく、従来のリスクスコアに変換するためにそれらを組み合わせる必要がある。年齢関連リスクを計算正確度と組み合わせる式は:
であり、式中、Rは前記方法により計算したリスクスコアで、Rは第1期スクリーニング(first trimester screening)により計算したリスクスコアである。
SNPベースの方法は増幅変動に関する問題を解消する
他の一部の方法により使われる計数法の固有の欠点は、参照染色体にマッピングされるリード数に対する対象染色体(例えば、染色体21)にマッピングされるリード数の比率を測定することにより胎児の倍数性状態を決定することである。染色体13、X、およびYを含む高または低GC含量の染色体の増幅で大きな変動がある。これにより、胎児のcfDNA信号と同程度の大きさの信号変動を生ずる場合があり、この結果、参照染色体由来リードに対する対象染色体由来対立遺伝子リードの比率を変えることによるコピー数コールを間違える可能性がある。これが染色体13、X、およびYに対し低い正確度を生じる場合がある。重要なのは、この問題は、早期妊娠期間で起こりやすい低胎児cfDNA割合の場合に悪化することである。
対照的に、SNPベースの方法は、染色体間の一貫性のある増幅レベルに依存せず、従って、全染色体にわたり等しい精度の結果を与えることが期待される。前記方法は、定義によりただ一個のヌクレオチドが異なる多形遺伝子座にある別の対立遺伝子の相対数を検査するといった理由から、前記方法は参照染色体の使用を必要とせず、これにより、定量化リード数に依存する方法に固有の染色体間増幅変動に関する問題を防ぐ。正倍数体の参照染色体を必要とする定量的方法とは異なり、前記方法は、三倍体性、ならびに片親性ダイソミーのようなコピー数の変化を伴わない異常を検出できることが期待される。
早期検出の重要性
重大なのは、性染色体異数性の複合出生有病率が、最も一般的な常染色体異数性の場合より高いことである(図32)。しかし、信頼性良く性染色体異常を検出できるルーチン非侵襲的選別法は現状存在しない。従って、性染色体異常は、通常、ダウン症候群または他の常染色体異数性用のルーチン検査の副次的効用として出生前に検出され、大部分の症例が全く見逃される。早期治療介入により臨床的転帰が改善されるこれら内の多くの障害にとって、早期の正確な検出が非常に重要である。例えば、ターナー症候群の全体複合出生有病率は、2,500人の女性に1人であるが、ターナー症候群は、青年期まで診断されない場合が多い。成長ホルモン療法は、その障害が原因の低身長を防ぐことが知られているが、4才前に開始すれば、治療は顕著に高い効果がある。さらに、エストロゲン補充療法は、ターナー症候群の患者の第二次性徴を刺激可能であるが、この場合も、症候群が通例の通り検出される前の思春期直前に治療を開始すべきである。これらは全て、早期のルーチン的で安全な性染色体異数性の検出の重要性を強調するものである。前記方法は、性染色体異常に対するルーチンスクリーニングとして役立つ可能性を秘めた最初の手法を提供する。
追加の用途
前記方法は、標的増幅を利用するために、超顕微鏡的異常、例えば、微小欠失および微細重複を独特な方法で検出する準備ができた状態である。MPSSのような非標的方法により、ディジョージ微小欠失症候群を検出できることが明らかにされているが、前記方法は、実行困難な手法を行うために、十分に高いレベルの遺伝子カバレッジを必要とする。
これが、非常に少ない比率のシークエンシングリードが情報価値のあると思われる場合に、超顕微鏡的領域に対して、非標的増幅で効率が数桁悪い理由である。さらに、最近利用可能な方法は、性染色体に対して倍数性状態を正確に特定することに関し問題があるという事実は、より小さい染色体セグメントに対して、それらの方法も同様に変動性増幅問題に直面していることを示唆している。
同様に、SNPベースの方法は、計数依存の現状の非侵襲的方法または羊水穿刺のような従来の侵襲的方法および細胞遺伝学的核型分析および/または蛍光インサイチューハイブリダイゼーションに依存するCVSでは検出できない、コピー数の変化を伴わない異常であるUPD障害を検出できる。これは、臨床的に利用可能なMPSSベースの標的化方法が非多形遺伝子座を増幅し、従って、例えば、対象染色体が同じ親由来であるかどうかを判定できない一方で、SNPベースの方法が個別ハプロタイプを特異的に識別できることが理由である。このことは、これらのプラダー・ウィリ、アンジェルマン、およびベックウィズ・ヴィーデマン症候群などの微小欠失/微細重複およびUPD症候群は、通常、出生前に診断されず、出生後の初期に誤診される場合が多いことを意味する。この結果、治療介入を著しく遅らせる。さらに、前記方法がSNPを標的とするために、前記方法はまた、親のハプロタイプの再構築を促進し、個別疾患連鎖遺伝子座の胎児遺伝の検出を可能とする(Kitzman JO,Snyder MW,Ventura M,et al.Noninvasive whole−genome sequencing of a human fetus.Sci Transl Med 2012;4:137ra76、この文献は、参照によりその全体が本明細書に組み込まれる)。
本明細書で提示の結果は、出生前異数性特定のために前記方法の範囲を拡大できることを立証している。具体的には、19,488個のSNPの増幅およびシークエンシングにより、前記方法は、染色体13、18、21、X、およびYのコピー数を決定でき、他の染色体異常、例えば、いずれか他の臨床的に利用可能な非侵襲的方法では検出されない三倍体性およびUPDを特異的に検出することが期待される。臨床的適用範囲の増加および強力な試料特異的計算正確度は、前記方法が、胎児の染色体異数性検出のために、侵襲的検査に対する有用な補助的手法を提供できることを示唆する。
本明細書において引用されている全ての特許、特許出願および刊行参考文献は、その全体が参照により本明細書に組み込まれる。本開示の方法はその特定の実施形態とともに記載されているが、さらに改変することができることが理解されよう。さらに、本出願は、本開示の方法が関する当技術分野における公知または通例の実施の範囲内に入る、および添付の特許請求の範囲の範囲内に入る本開示からの逸脱を含めた、本開示の方法の任意の変動、使用または適応を包含するものとする。例えば、本明細書でDNA用に開示されたいずれの方法も、リバース転写ステップを導入してRNAをDNAに変換することにより容易にRNAに適合させることができる。例示のために多形遺伝子座を使用する実施例は、必要に応じ、容易に非多形遺伝子座の増幅に適合させることができる。

Claims (33)

  1. 核酸試料中の標的遺伝子座を増幅する方法であって、
    (a)少なくとも1,000個の異なるプライマー対を含む試験プライマーライブラリーを、標的遺伝子座を含む前記核酸試料と接触させ、反応混合物を生成し、ここで各プライマー対は、同じ標的遺伝子座に結合するフォワード試験プライマー及びリバース試験プライマーを含むステップと、
    (b)前記反応混合物をポリメラーゼ連鎖反応(PCR)条件に供して標的増幅産物を含む増幅産物を生成し、ここで、各試験プライマーの濃度が10nM未満であり、反応条件のアニーリングステップの長さが10分超であり、少なくとも1,000の異なる標的遺伝子座が同時に増幅されるステップと、
    を含み、
    ここで、(i)前記増幅産物の20%未満が試験プライマー二量体であり、(ii)前記増幅産物の少なくとも80%が標的増幅産物であり、(iii)前記標的遺伝子座の少なくとも80%が増幅される、方法。
  2. 少なくとも5,000個の異なる標的遺伝子座が増幅される請求項1に記載の方法。
  3. 少なくとも10,000個の異なる標的遺伝子座が増幅される請求項1に記載の方法。
  4. 少なくとも20,000個の異なる標的遺伝子座が増幅される請求項1に記載の方法。
  5. 少なくとも30,000個の異なる標的遺伝子座が増幅される請求項1に記載の方法。
  6. 少なくとも90%の前記増幅産物が標的増幅産物である請求項1に記載の方法。
  7. 少なくとも95%の前記増幅産物が標的増幅産物である請求項1に記載の方法。
  8. 少なくとも99%の前記増幅産物が標的増幅産物である請求項1に記載の方法。
  9. 少なくとも90%の前記標的遺伝子座が増幅される請求項1に記載の方法。
  10. 少なくとも95%の前記標的遺伝子座が増幅される請求項1に記載の方法。
  11. 少なくとも99%の前記標的遺伝子座が増幅される請求項1に記載の方法。
  12. 前記増幅産物の20%未満が試験プライマー二量体である請求項1に記載の方法。
  13. 前記増幅産物の10%未満が試験プライマー二量体である請求項1に記載の方法。
  14. 前記増幅産物の1%未満が試験プライマー二量体である請求項1に記載の方法。
  15. 前記増幅産物の0.1%未満が試験プライマー二量体である請求項1に記載の方法。
  16. 前記候補プライマーのプライマー二量体形成能力に少なくとも一部基づいて前記試験プライマーが候補プライマーライブラリーから選択される請求項1に記載の方法。
  17. 試験プライマーのライブラリーが候補プライマーのライブラリーから選択され、前記選択を行う方法が、
    (i)前記ライブラリー由来の候補プライマー2個のほとんどまたは全ての可能な組み合わせに対してコンピュータでアンデザイアラビリティスコアを計算するステップであって、それぞれのアンデザイアラビリティスコアが、前記2個の候補プライマー間の二量体形成の尤度に少なくとも一部基づいているステップと、
    (ii)第1の最小閾値を超えるアンデザイアラビリティスコアを有する候補プライマー2個の組み合わせのうち最多数のものの一部である前記候補プライマーを、前記候補プライマーライブラリーから除去するステップと、
    (iii)ステップ(ii)で除去された前記候補プライマーがプライマー対のメンバーである場合、前記プライマー対のもう一方のメンバーを前記候補プライマーライブラリーから除去するステップと、
    (iv)任意選択で、ステップ(ii)および(iii)を繰り返すステップと、
    により、試験プライマーのライブラリーを選択することを含む、請求項1に記載の方法。
  18. ステップ(ii)で使われる前記第1の最小閾値をより小さい第2の最小閾値に引き下げ、前記ライブラリーに残る前記候補プライマーの組み合わせのアンデザイアラビリティスコアが全て前記第2の最小閾値以下になるまで、または前記ライブラリー中に残る候補プライマーの数が所望の数に減らされるまで、ステップ(ii)および(iii)を繰り返すことにより前記ライブラリー中に残る候補プライマーの数を減らすステップをさらに含む請求項17に記載の方法。
  19. ステップ(ii)で使われる前記第1の最小閾値をより大きい第2の最小閾値に引き上げるステップと、前記ライブラリー中に残る前記候補プライマーの組み合わせの前記アンデザイアラビリティスコアが全て前記第2の最小閾値以下になるまで、または前記ライブラリー中に残る候補プライマーが所望の数に減らされるまで、ステップ(ii)および(iii)を繰り返すステップとを含む請求項17に記載の方法。
  20. 核酸試料が単一細胞由来DNAを含む請求項1に記載の方法。
  21. 前記アンデザイアラビリティスコアが、前記標的遺伝子座のヘテロ接合率、前記標的遺伝子座の多型または変異に関連する有病率、前記標的遺伝子座の多型または変異に関連する疾患浸透度、前記候補プライマーの前記標的遺伝子座に対する特異性、前記候補プライマーのサイズ、前記標的増幅産物の融解温度、前記標的増幅産物のグアニン−シトシン(GC)含量、前記標的増幅産物の増幅効率、および前記標的増幅産物のサイズからなる群から選択される1個または複数個のパラメータに少なくとも一部基づいている請求項18に記載の方法。
  22. ステップ(b)の前に、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対を前記ライブラリーから除去するステップをさらに含む請求項18に記載の方法。
  23. 前記方法が、少なくとも1,000個の異なる試験プライマーのライブラリーを選択することと、選択された少なくとも1,000個の異なる前記試験プライマーを用いて、少なくとも1,000個の異なる標的遺伝子座を同時に増幅することとを含む、請求項17に記載の方法。
  24. 前記プライマー対のプライマーの融解温度が55℃〜65℃である、請求項1に記載の方法。
  25. 前記プライマー対のプライマーの融解温度が57℃〜60.5℃である、請求項1に記載の方法。
  26. アニーリング温度を昇温することを含む、請求項1に記載の方法。
  27. PCRがネステッドPCRである、請求項1に記載の方法。
  28. 標的増幅産物の長さが100ヌクレオチド未満である、請求項1に記載の方法。
  29. 標的増幅産物の長さが50〜100ヌクレオチドである、請求項1に記載の方法。
  30. 前記プライマー対が、X染色体、Y染色体、第13染色体、第18染色体、及び第21染色体上の潜在的にヘテロ接合性であるSNP遺伝子座を増幅するように設計されると共に、これらのアッセイを単一反応において用いて、母体血漿試料から得られたcfDNAを増幅する、請求項1に記載の方法。
  31. 前記試料が、胎児の母親たる妊婦由来の母系DNA及び胎児DNAを含むと共に、前記方法が、配列データに基づいて胎児染色体異常の存在の有無を決定することを含む、請求項1に記載の方法。
  32. 前記標的遺伝子座が、ヒトゲノムに存在するか、ヒト一塩基多型を含む、請求項1に記載の方法。
  33. 前記核酸試料が、腫瘍、移植片又は胎児由来のDNAを含む、請求項1に記載の方法。
JP2020005470A 2012-07-24 2020-01-16 高度多重pcr法および組成物 Active JP6997813B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021204979A JP2022037145A (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261675020P 2012-07-24 2012-07-24
US61/675,020 2012-07-24
US13/683,604 US20130123120A1 (en) 2010-05-18 2012-11-21 Highly Multiplex PCR Methods and Compositions
US13/683,604 2012-11-21

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018153048A Division JP6916153B2 (ja) 2012-07-24 2018-08-16 高度多重pcr法および組成物

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021204979A Division JP2022037145A (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物

Publications (2)

Publication Number Publication Date
JP2020054400A true JP2020054400A (ja) 2020-04-09
JP6997813B2 JP6997813B2 (ja) 2022-02-10

Family

ID=49997695

Family Applications (10)

Application Number Title Priority Date Filing Date
JP2015524243A Active JP6392222B2 (ja) 2012-07-24 2012-11-21 高度多重pcr法および組成物
JP2018153048A Active JP6916153B2 (ja) 2012-07-24 2018-08-16 高度多重pcr法および組成物
JP2020005462A Active JP7027468B2 (ja) 2012-07-24 2020-01-16 高度多重pcr法および組成物
JP2020005502A Active JP6997815B2 (ja) 2012-07-24 2020-01-16 高度多重pcr法および組成物
JP2020005470A Active JP6997813B2 (ja) 2012-07-24 2020-01-16 高度多重pcr法および組成物
JP2020005493A Active JP6997814B2 (ja) 2012-07-24 2020-01-16 高度多重pcr法および組成物
JP2021204979A Pending JP2022037145A (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物
JP2021204905A Active JP7343563B2 (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物
JP2021205050A Pending JP2022027975A (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物
JP2022020146A Active JP7348330B2 (ja) 2012-07-24 2022-02-14 高度多重pcr法および組成物

Family Applications Before (4)

Application Number Title Priority Date Filing Date
JP2015524243A Active JP6392222B2 (ja) 2012-07-24 2012-11-21 高度多重pcr法および組成物
JP2018153048A Active JP6916153B2 (ja) 2012-07-24 2018-08-16 高度多重pcr法および組成物
JP2020005462A Active JP7027468B2 (ja) 2012-07-24 2020-01-16 高度多重pcr法および組成物
JP2020005502A Active JP6997815B2 (ja) 2012-07-24 2020-01-16 高度多重pcr法および組成物

Family Applications After (5)

Application Number Title Priority Date Filing Date
JP2020005493A Active JP6997814B2 (ja) 2012-07-24 2020-01-16 高度多重pcr法および組成物
JP2021204979A Pending JP2022037145A (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物
JP2021204905A Active JP7343563B2 (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物
JP2021205050A Pending JP2022027975A (ja) 2012-07-24 2021-12-17 高度多重pcr法および組成物
JP2022020146A Active JP7348330B2 (ja) 2012-07-24 2022-02-14 高度多重pcr法および組成物

Country Status (10)

Country Link
JP (10) JP6392222B2 (ja)
KR (1) KR101890466B1 (ja)
CN (1) CN104685064A (ja)
AU (1) AU2012385961B9 (ja)
CA (1) CA2877493C (ja)
HK (1) HK1211058A1 (ja)
IL (1) IL236435A0 (ja)
RU (1) RU2650790C2 (ja)
SG (1) SG11201408813VA (ja)
WO (1) WO2014018080A1 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
CA2731991C (en) 2008-08-04 2021-06-08 Gene Security Network, Inc. Methods for allele calling and ploidy calling
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
JP6328934B2 (ja) 2010-12-22 2018-05-23 ナテラ, インコーポレイテッド 非侵襲性出生前親子鑑定法
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
CA2835942C (en) 2011-05-19 2019-01-22 Sequenom, Inc. Products and processes for multiplex nucleic acid identification
KR101890466B1 (ko) * 2012-07-24 2018-08-21 내테라, 인코포레이티드 고도의 다중 pcr 방법 및 조성물
WO2015048535A1 (en) 2013-09-27 2015-04-02 Natera, Inc. Prenatal diagnostic resting standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
WO2015164432A1 (en) * 2014-04-21 2015-10-29 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
CN113774132A (zh) * 2014-04-21 2021-12-10 纳特拉公司 检测染色体片段中的突变和倍性
HUE046643T2 (hu) 2014-11-28 2021-11-29 Uniqure Ip Bv DNS szennyezõdések parvovirális virionokat tartalmazó készítményben
US20170349926A1 (en) * 2014-12-22 2017-12-07 DNAe Group Holdings LTD. Bubble primers
AU2016250841A1 (en) 2015-04-24 2017-11-02 Agena Bioscience, Inc. Multiplexed method for the identification and quantitation of minor alleles and polymorphisms
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
GB2539675B (en) * 2015-06-23 2017-11-22 Cs Genetics Ltd Libraries of multimeric barcoding reagents and kits thereof for labelling nucleic acids for sequencing
WO2017044843A1 (en) 2015-09-11 2017-03-16 The General Hospital Corporation Full interrogation of nuclease dsbs and sequencing (find-seq)
CN108699595B (zh) 2016-02-25 2022-11-04 豪夫迈·罗氏有限公司 引物延伸期间引物-引物相互作用的消除
ES2913468T3 (es) * 2016-04-15 2022-06-02 Natera Inc Métodos para la detección del cáncer de pulmón.
EP3827812A1 (en) * 2016-07-29 2021-06-02 The Regents of the University of California Adeno-associated virus virions with variant capsid and methods of use thereof
EP3521444A1 (en) * 2016-09-30 2019-08-07 FUJIFILM Corporation METHOD FOR DETERMINING ORIGIN OF HUMAN GENOMIC DNA OF 100 pg OR LESS THEREFROM, METHOD FOR PERSONAL IDENTIFICATION, AND METHOD FOR ANALYZING DEGREE OF ENGRAFTMENT OF HEMATOPOIETIC STEM CELL
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
CA3049139A1 (en) 2017-02-21 2018-08-30 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
WO2019010456A1 (en) * 2017-07-07 2019-01-10 Stephen Quake NON-INVASIVE PRENATAL DIAGNOSIS OF SINGLE GENE DISORDERS USING DIGITAL DROPLET PCR
KR101977976B1 (ko) * 2017-08-10 2019-05-14 주식회사 엔젠바이오 앰플리콘 기반 차세대 염기서열 분석기법에서 프라이머 서열을 제거하여 분석의 정확도를 높이는 방법
CA3073448A1 (en) 2017-08-23 2019-02-28 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
EP3694993A4 (en) * 2017-10-11 2021-10-13 The General Hospital Corporation METHOD OF DETECTING A SITE-SPECIFIC AND UNDESIRED GENOMIC DESAMINATION INDUCED BY BASE EDITING TECHNOLOGIES
CN108334745B (zh) * 2018-03-19 2022-02-08 青岛理工大学 一种聚合酶链反应过程非线性混杂系统建模方法
AU2019256287A1 (en) 2018-04-17 2020-11-12 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CA3107376A1 (en) 2018-08-08 2020-02-13 Inivata Ltd. Method of sequencing using variable replicate multiplex pcr
CN112080558B (zh) * 2019-06-13 2024-03-12 杭州贝瑞和康基因诊断技术有限公司 同时检测hba1/2和hbb基因突变的试剂盒和方法
EP4004927A4 (en) * 2019-07-22 2023-08-02 Mission Bio, Inc. USING MACHINE LEARNING TO OPTIMIZE ASSAYS FOR UNICELLULAR TARGETED DNA SEQUENCING
US20230018079A1 (en) * 2019-12-16 2023-01-19 Agilent Technologies, Inc. Genomic scarring assays and related methods
JP7320468B2 (ja) 2020-03-10 2023-08-03 Ntn株式会社 操舵機能付ハブユニットおよびこれを備えた車両
CN113979895B (zh) * 2020-07-08 2023-03-24 中国科学技术大学 一种精确序列可控的自降解聚合物及其制备方法和应用
WO2022076574A1 (en) * 2020-10-08 2022-04-14 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
EP4292825A1 (en) 2021-03-18 2023-12-20 Canon Kabushiki Kaisha Liquid injection method, liquid injection device, and liquid cartridge
AU2022339791A1 (en) 2021-09-01 2024-03-14 Natera, Inc. Methods for non-invasive prenatal testing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521252A (ja) * 2000-02-07 2003-07-15 イルミナ インコーポレイテッド ユニバーサルプライミングを用いる核酸検出方法
US20070059700A1 (en) * 2003-05-09 2007-03-15 Shengce Tao Methods and compositions for optimizing multiplex pcr primers

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US300235A (en) 1884-06-10 Chaeles b
US6479235B1 (en) * 1994-09-30 2002-11-12 Promega Corporation Multiplex amplification of short tandem repeat loci
US6251604B1 (en) * 1999-08-13 2001-06-26 Genopsys, Inc. Random mutagenesis and amplification of nucleic acid
US7582420B2 (en) * 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
JP2004511210A (ja) * 2000-05-23 2004-04-15 バリアジェニックス インコーポレーテッド 配列変動を検出する、dnaを遺伝分析するための方法
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
ES2338654T5 (es) * 2003-01-29 2017-12-11 454 Life Sciences Corporation Amplificación de ácidos nucleicos en emulsión de perlas
WO2005071078A1 (en) * 2004-01-12 2005-08-04 Nimblegen Systems Inc. Method of performing pcr amplification on a microarray
US7618777B2 (en) * 2005-03-16 2009-11-17 Agilent Technologies, Inc. Composition and method for array hybridization
US8515679B2 (en) 2005-12-06 2013-08-20 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US7888017B2 (en) 2006-02-02 2011-02-15 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
US20070231823A1 (en) * 2006-03-23 2007-10-04 Mckernan Kevin J Directed enrichment of genomic DNA for high-throughput sequencing
JP2008125471A (ja) 2006-11-22 2008-06-05 Olympus Corp マルチプレックスな核酸増幅方法
EA015913B1 (ru) * 2007-01-17 2011-12-30 Учреждение Российской Академии Наук Институт Молекулярной Биологии Им. В.А. Энгельгардта Ран (Имб Ран) Способ генетической идентификации личности на основе анализа однонуклеотидного полиморфизма генома человека с использованием олигонуклеотидного биологического микрочипа (биочипа)
WO2008093098A2 (en) * 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
US20090023190A1 (en) 2007-06-20 2009-01-22 Kai Qin Lao Sequence amplification with loopable primers
WO2009032779A2 (en) * 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
FR2925480B1 (fr) * 2007-12-21 2011-07-01 Gervais Danone Sa Procede d'enrichissement d'une eau en oxygene par voie electrolytique, eau ou boisson enrichie en oxygene et utilisations
EP2077337A1 (en) 2007-12-26 2009-07-08 Eppendorf Array Technologies SA Amplification and detection composition, method and kit
US20110033862A1 (en) 2008-02-19 2011-02-10 Gene Security Network, Inc. Methods for cell genotyping
WO2009146335A1 (en) 2008-05-27 2009-12-03 Gene Security Network, Inc. Methods for embryo characterization and comparison
CA2731991C (en) 2008-08-04 2021-06-08 Gene Security Network, Inc. Methods for allele calling and ploidy calling
SI2334812T1 (sl) 2008-09-20 2017-05-31 The Board of Trustees of the Leland Stanford Junior University Office of the General Counsel Building 170 Neinvazivna diagnoza fetalne anevploidije s sekvenciranjem
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
CA2779750C (en) * 2009-11-06 2019-03-19 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US20110312503A1 (en) * 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
US8574832B2 (en) * 2010-02-03 2013-11-05 Massachusetts Institute Of Technology Methods for preparing sequencing libraries
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
WO2013052557A2 (en) 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
EP2426217A1 (en) * 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
CN103620055A (zh) 2010-12-07 2014-03-05 利兰·斯坦福青年大学托管委员会 在全基因组规模非侵入性确定亲本单倍型的胎儿遗传
EP3564392B1 (en) * 2010-12-17 2021-11-24 Life Technologies Corporation Methods for nucleic acid amplification
JP6328934B2 (ja) * 2010-12-22 2018-05-23 ナテラ, インコーポレイテッド 非侵襲性出生前親子鑑定法
AU2011352070A1 (en) * 2010-12-30 2013-07-18 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
WO2012103031A2 (en) 2011-01-25 2012-08-02 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
KR101890466B1 (ko) 2012-07-24 2018-08-21 내테라, 인코포레이티드 고도의 다중 pcr 방법 및 조성물

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521252A (ja) * 2000-02-07 2003-07-15 イルミナ インコーポレイテッド ユニバーサルプライミングを用いる核酸検出方法
US20070059700A1 (en) * 2003-05-09 2007-03-15 Shengce Tao Methods and compositions for optimizing multiplex pcr primers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PLOS ONE, vol. 7, no. 1, JPN6021008187, 2012, pages 22900, ISSN: 0004460430 *

Also Published As

Publication number Publication date
AU2012385961B9 (en) 2017-05-18
KR20150038216A (ko) 2015-04-08
JP7027468B2 (ja) 2022-03-01
JP2022027975A (ja) 2022-02-14
AU2012385961A1 (en) 2015-02-12
JP7348330B2 (ja) 2023-09-20
AU2012385961B2 (en) 2017-04-13
JP2015526073A (ja) 2015-09-10
RU2014152883A (ru) 2016-09-10
SG11201408813VA (en) 2015-02-27
JP2022027971A (ja) 2022-02-14
JP2022037145A (ja) 2022-03-08
HK1211058A1 (en) 2016-05-13
CA2877493A1 (en) 2014-01-30
CN104685064A (zh) 2015-06-03
RU2650790C2 (ru) 2018-04-17
JP6997813B2 (ja) 2022-02-10
JP7343563B2 (ja) 2023-09-12
IL236435A0 (en) 2015-02-26
KR101890466B1 (ko) 2018-08-21
CA2877493C (en) 2020-08-25
JP2022051949A (ja) 2022-04-01
JP2020054401A (ja) 2020-04-09
JP2020054402A (ja) 2020-04-09
JP6997814B2 (ja) 2022-02-10
JP2018183189A (ja) 2018-11-22
JP6916153B2 (ja) 2021-08-11
WO2014018080A1 (en) 2014-01-30
JP6997815B2 (ja) 2022-02-10
JP2020058388A (ja) 2020-04-16
JP6392222B2 (ja) 2018-09-19

Similar Documents

Publication Publication Date Title
JP7348330B2 (ja) 高度多重pcr法および組成物
US11390916B2 (en) Methods for simultaneous amplification of target loci
JP6153874B2 (ja) 非侵襲的出生前倍数性呼び出しのための方法
US20190284623A1 (en) Methods for non-invasive prenatal ploidy calling
US20190323076A1 (en) Methods for non-invasive prenatal ploidy calling
US20190309358A1 (en) Methods for non-invasive prenatal ploidy calling
US20170051355A1 (en) Highly multiplex pcr methods and compositions
EP2847347B1 (en) Highly multiplex pcr methods and compositions

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211217

R150 Certificate of patent or registration of utility model

Ref document number: 6997813

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150