JP6830094B2 - 染色体異常を検出するための核酸及び方法 - Google Patents

染色体異常を検出するための核酸及び方法 Download PDF

Info

Publication number
JP6830094B2
JP6830094B2 JP2018503647A JP2018503647A JP6830094B2 JP 6830094 B2 JP6830094 B2 JP 6830094B2 JP 2018503647 A JP2018503647 A JP 2018503647A JP 2018503647 A JP2018503647 A JP 2018503647A JP 6830094 B2 JP6830094 B2 JP 6830094B2
Authority
JP
Japan
Prior art keywords
mip
target
sequence
sequencing
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018503647A
Other languages
English (en)
Other versions
JP2018524993A (ja
JP2018524993A5 (ja
Inventor
マン,トバイアス
ワン,ヘン
エイチ. キム,ジュン
エイチ. キム,ジュン
セケダット,マシュー
Original Assignee
プロジェニティ, インコーポレイテッド
プロジェニティ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by プロジェニティ, インコーポレイテッド, プロジェニティ, インコーポレイテッド filed Critical プロジェニティ, インコーポレイテッド
Publication of JP2018524993A publication Critical patent/JP2018524993A/ja
Publication of JP2018524993A5 publication Critical patent/JP2018524993A5/ja
Application granted granted Critical
Publication of JP6830094B2 publication Critical patent/JP6830094B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Description

発明の詳細な説明
関連出願の相互参照
本出願は、2015年7月29日に出願された米国特許仮出願第62/198,654号の利益を主張するものであり、その全体は本明細書に参照として組み込まれる。
[技術分野]
本発明は、検出を必要とする対象における、とりわけ、異数性及び染色体異常を検出するためのシステム及び方法に関する。
[背景技術]
主な染色体異常は、生産数のほぼ140分の1で検出されており、満期に達しない胎児、または、死産になる胎児において、はるかに高い比率で検出されている。Hsu(1998)「Prenatal diagnosis of chromosomal abnormalities through amniocentesis.」(In:Milunsky A,editor.Genetic Disorders and the Fetus.4 ed.Baltimore:The Johns Hopkins University Press.179−180;Staebler et al.(2005))、「Should determination of the karyotype be systematic for all malformations detected by obstetrical ultrasound?」(Prenat Diagn 25:567−573.)。最も一般的な異数性は21トリソミー(ダウン症候群)であり、現時点における生産数の730分の1で発生している(Hsu;Staebler et al.)。21トリソミーより一般的ではないが、18トリソミー(エドワーズ症候群)及び13トリソミー(パトー症候群)はそれぞれ、生産数の5,500分の1、生産数の17,200分の1で発生している(Hsu.)。多種多様な先天性欠損症、発育不全症、及び、知的障害は、染色体の異数性を有する小児に見られるが、これらは、家族及び社会に、生涯にわたる課題を提示している(Jones(2006)「Smith’s recognizable patterns of human malformation.」(Philadelphia:Elsevier Saunders.))。胎児異数性リスクの大きさを示すことが可能である様々な出生前検査法があり、例えば、羊水穿刺または絨毛採取などの侵襲的な診断検査法が挙げられる。これらは現時点におけるゴールドスタンダードとなっているが、無視できないほどの胎児の死亡リスクを伴う(American College of Obstetricians and Gynecologists(2007) ACOG Practice Bulletin No.88,December 2007.「Invasive prenatal testing for aneuploidy.」Obstet Gynecol 110:1459−1467.)。それゆえ、胎児異数性に関する、より信頼性が高く非侵襲的な検査法が長きにわたり求められている。これらのうち最も有望な検査法は、母体血漿中に存在する胎児DNAを検出することに基づいている。母体血漿から作製したライブラリに対して超並列シークエンシングを行うことにより、21番染色体の異常を確実に検出可能であることが示されてきた(Chiu et al.,(2008)「Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma.」(Proc Natl Acad Sci USA 105:20458−20463;Fan et al.,(2008))、及び、「Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood.」 (Proc Natl Acad Sci USA 105:16266−16271.) )。
現在の異数性スクリーニング法、例えば、超並列ショットガンシークエンシングなどは、多くの時間を要するか、費用が多くかかるか、または、広範囲にわたるバイオインフォマティクス解析を必要とする。
それゆえ、経済性に優れかつ効率的な、高感度及び高特異性を有する検査法の開発が求められている。
[発明の概要]
本開示における一部の実施形態は以下のとおりである。
1.胎児における異数性を検出するための方法であって、
a)母体血液試料から単離した核酸試料を得ることと、
b)分子反転プローブ(MIP)の1つまたは複数の集団を用いることにより、工程a)で得た前記核酸試料中における複数の目的の標的配列を捕捉して、複数のレプリコンを作製することと、
前記MIP集団内の前記MIPのそれぞれは、以下の構成要素、
第1の標的ポリヌクレオチドアーム−第1の固有分子タグ−ポリヌクレオチドリンカー−第2の固有分子タグ−第2の標的ポリヌクレオチドアームを配列内に含み、
前記MIPのそれぞれにおける前記一対の第1及び第2の標的ポリヌクレオチドアームは、同一であり、前記複数の目的の標的配列内におけるそれぞれの配列に隣接する、前記核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的であり、
前記MIPのそれぞれにおける前記第1及び第2の固有標的分子タグの組み合わせは、前記MIPのそれぞれにおいて異なっており、
c)工程b)で得た前記レプリコンから増幅した複数のMIPアンプリコンをシークエンスすることと、
d)レプリコンを増幅したそれぞれのMIPにおける前記固有分子タグの数に基づいて、工程c)で得た前記複数のアンプリコンにおける第1のアンプリコン集団のそれぞれの捕捉現象の数を測定することと、前記第1のアンプリコン集団は、前記目的の標的配列の前記シークエンスにより同定され、
e)レプリコンを増幅したそれぞれのMIPにおける前記固有分子タグの数に基づいて、工程c)で得た前記複数のアンプリコンにおける第2のアンプリコン集団のそれぞれの捕捉現象の数を測定することと、前記第2のアンプリコン集団は、前記目的の標的配列の前記シークエンスにより同定され、
f)工程d)で測定した捕捉現象の数の少なくとも一部に基づいて、そこから前記第1のアンプリコン集団を作製した、それぞれの目的の標的配列の部位捕捉基準を決定することと、
g)少なくとも1つの判定基準を満たす、工程f)で決定した前記部位捕捉基準の第1のサブセットを同定することと、
h)工程e)で測定した捕捉現象の数の少なくとも一部に基づいて、そこから前記第2のアンプリコン集団を作製した、それぞれの目的の標的配列の部位捕捉基準を決定することと、
i)前記少なくとも1つの判定基準を満たす、工程h)で決定した前記部位捕捉基準の第2のサブセットを同定することと、
j)工程g)で同定した部位捕捉基準の前記第1のサブセットから求めた第1の指標を、工程i)で同定した部位捕捉基準の前記第2のサブセットから求めた第2の指標で正規化して、検査比率を得ることと、
k)前記検査比率を、正倍数性または異数性を示すことが既知である参照対象から単離した参照核酸試料に基づいて計算した、複数の参照比率と比較することと、
l)工程k)の前記比較に基づいて、異数性が前記胎児において検出されるかどうかを判定することと、
を含む、前記方法。
2.前記核酸試料はDNAまたはRNAである、実施形態1に記載の方法。
3.前記核酸試料はゲノムDNAである、実施形態2に記載の方法。
4.前記血液試料は、全血試料、血漿試料、または、血清試料である、実施形態1から実施形態3のいずれか1つに記載の方法。
5.前記血液試料は血漿試料である、実施形態4に記載の方法。
6.前記第1の標的ポリヌクレオチドアームの長さは、14〜30塩基対である、実施形態1から実施形態5のいずれか1つに記載の方法。
7.前記第2の標的ポリヌクレオチドアームの長さは、14〜30塩基対である、実施形態1から実施形態6のいずれか1つに記載の方法。
8.前記標的ポリヌクレオチドアームのそれぞれは、45℃〜80℃の融解温度を有する、実施形態1から実施形態7のいずれか1つに記載の方法。
9.前記標的ポリヌクレオチドアームのそれぞれは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態1から実施形態8のいずれか1つに記載の方法。
10.前記第1の固有分子タグの長さは、4〜15塩基対である、実施形態1から実施形態9のいずれか1つに記載の方法。
11.前記第2の固有分子タグの長さは、4〜15塩基対である、実施形態1から実施形態10のいずれか1つに記載の方法。
12.前記固有分子タグのそれぞれは、45℃〜80℃の融解温度を有する、実施形態1から実施形態11のいずれか1つに記載の方法。
13.前記固有分子タグのそれぞれは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態1から実施形態12のいずれか1つに記載の方法。
14.前記ポリヌクレオチドリンカーは、前記対象における任意のゲノム領域に対して実質的に相補的ではない、実施形態1から実施形態13のいずれか1つに記載の方法。
15.前記ポリヌクレオチドリンカーは、14〜30塩基対の長さを有する、実施形態1から実施形態14のいずれか1つに記載の方法。
16.前記ポリヌクレオチドリンカーは、45℃〜80℃の融解温度を有する、実施形態1から実施形態15のいずれか1つに記載の方法。
17.前記ポリヌクレオチドリンカーは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態1から実施形態16のいずれか1つに記載の方法。
18.前記ポリヌクレオチドリンカーは、少なくとも1種の増幅用プライマーを含む、実施形態1から実施形態17のいずれか1つに記載の方法。
19.前記ポリヌクレオチドリンカーは、増幅用フォワードプライマー及び増幅用リバースプライマーを含む、実施形態18に記載の方法。
20.前記増幅用フォワードプライマーの前記配列は、5´−CTTCAGCTTCCCGATTACGG−3´(配列番号:1)のヌクレオチド配列を含む、実施形態19に記載の方法。
21.前記増幅用リバースプライマーの前記配列は、5´−GCACGATCCGACGGTAGTGT−3´(配列番号:2)のヌクレオチド配列を含む、実施形態19に記載の方法。
22.前記ポリヌクレオチドリンカーは、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)のヌクレオチド配列を含む、実施形態1から実施形態21のいずれか1つに記載の方法。
23.前記第1の標的ポリヌクレオチドアームは、5´−CACTGCACTCCAGCCTGG−3´(配列番号:4)のヌクレオチド配列を含む、実施形態1から実施形態22のいずれか1つに記載の方法。
24.前記第2の標的ポリヌクレオチドアームは、5´−GAGGCTGAGGCAGGAGAA−3´(配列番号:5)のヌクレオチド配列を含む、実施形態1から実施形態23のいずれか1つに記載の方法。
25.前記MIPは、5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:6)のヌクレオチド配列を含み、(N1−6)は前記第1の固有分子タグを表し、(N7−12)は前記第2の固有分子タグを表す、実施形態1から実施形態24のいずれか1つに記載の方法。
26.前記MIPは、MIP 001〜MIP 008(配列番号:7〜14)のいずれか1つのヌクレオチド配列を含む、実施形態1から実施形態24のいずれか1つに記載の方法。
27.前記MIP集団は、10fM〜100nMの濃度を有する、実施形態1から実施形態26のいずれか1つに記載の方法。
28.前記MIPレプリコンのそれぞれは、一本鎖環状核酸分子である、実施形態1から実施形態27のいずれか1つに記載の方法。
29.前記部位捕捉基準は、部位捕捉性能指標(SCE)である、実施形態1から実施形態28のいずれか1つに記載の方法。
30.前記部位捕捉基準は、部位捕捉密度指標(SCC)である、実施形態1から実施形態29のいずれか1つに記載の方法。
31.工程b)で提供した前記MIPレプリコンのそれぞれは、
i)前記第1及び第2の標的ポリヌクレオチドアームをそれぞれ、前記核酸試料中の対応する前記第1及び第2の領域にハイブリダイズすることと、前記第1及び第2の領域は目的の標的配列に隣接し、
ii)前記ハイブリダイゼーション後、ライゲーション/伸長用混合液を用いて、前記2つの標的ポリヌクレオチドアーム間に存在するギャップ領域を伸長及びライゲートし、一本鎖環状核酸分子を作製することと、
により作製される、実施形態1から実施形態30のいずれか1つに記載の方法。
32.前記MIPレプリコンのそれぞれは、一本鎖環状核酸分子である、実施形態1から実施形態31のいずれか1つに記載の方法。
33.c)の前記シークエンシング工程は、次世代シークエンシング法を含む、実施形態1から実施形態32のいずれか1つに記載の方法。
34.前記次世代シークエンシング法は、超並列シークエンシング法、または、超並列ショートリードシークエンシング法を含む、実施形態33に記載の方法。
35.実施形態1から実施形態34のいずれか1つに記載の方法であって、前記方法は、c)の前記シークエンシング工程の前に、シークエンシング用の前記MIPレプリコンを増幅するためのPCR反応を含む、前記方法。
36.前記PCR反応はインデックスPCR反応である、実施形態35に記載の方法。
37.前記インデックスPCR反応は、以下の構成要素、一対のインデックスプライマー、固有試料バーコード、及び、一対のシークエンシングアダプターを、前記MIPアンプリコンのそれぞれに導入する、実施形態36に記載の方法。
38.前記バーコード化MIPアンプリコンは、以下の構成要素、第1のシークエンシングアダプター−第1のシークエンシングプライマー−前記第1の固有標的分子タグ−前記第1の標的ポリヌクレオチドアーム−捕捉核酸−前記第2の標的ポリヌクレオチドアーム−前記第2の固有標的分子タグ−固有試料バーコード−第2のシークエンシングプライマー−第2のシークエンシングアダプター、を配列内に含む、実施形態37に記載の方法。
39.前記第1の複数の目的の標的配列は、単一染色体上に存在する、実施形態1から実施形態38のいずれか1つに記載の方法。
40.前記第2の複数の目的の標的配列は、複数の染色体上に存在する、実施形態1から実施形態39のいずれか1つに記載の方法。
41.工程f)で決定した前記部位捕捉基準は、工程d)で測定した捕捉現象の数であり、工程h)で決定した前記部位捕捉基準は、工程e)で測定した捕捉現象の数である、実施形態1から実施形態40のいずれか1つに記載の方法。
42.特定の部位における複数の部位捕捉基準の変動係数を計算することを更に含み、前記複数の部位捕捉基準中のそれぞれの部位捕捉基準は、異なる対象由来の核酸試料から求められ、工程g)及び工程h)で用いた前記少なくとも1つの判定基準は、前記特定の部位における前記変動係数が閾値未満であるという必要条件を含む、実施形態1から実施形態41のいずれか1つに記載の方法。
43.工程j)で求めた前記第1の指標は、部位捕捉基準の前記第1のサブセットの合計であり、目的の染色体に対応し、工程j)で求めた前記第2の指標は、部位捕捉基準の前記第2のサブセットの合計であり、前記目的の染色体以外の染色体に対応する、実施形態1から実施形態42のいずれか1つに記載の方法。
44.工程l)で行った前記判定は、統計的検定を行い、工程j)で得た前記検査比率が前記複数の参照比率とは統計的に異なるかどうかを判定することを含む、実施形態1から実施形態43のいずれか1つに記載の方法。
45.前記第1のアンプリコン集団は、目的の染色体に対応する、実施形態1から実施形態44のいずれか1つに記載の方法。
46.前記第2のアンプリコン集団は、前記目的の染色体以外の染色体に対応する、実施形態45に記載の方法。
47.前記検査比率及び前記参照比率は、染色体比率である、実施形態1から実施形態46のいずれか1つに記載の方法。
48.前記染色体比率は、目的の染色体由来の全固有捕捉現象の合計(S1)と、全ての染色体由来の全固有捕捉現象の合計(S1+S2)との比率により定義される、実施形態47に記載の方法。
49.前記MIPレプリコンのサイズは、80〜90塩基対である、実施形態1から実施形態48のいずれか1つに記載の方法。
50.前記シークエンシング工程は、6〜8百万リードの読み取り深度を有する、実施形態1から実施形態49のいずれか1つに記載の方法。
51.前記目的の標的配列は、Alu因子内に位置する、実施形態1から実施形態50のいずれか1つに記載の方法。
52.前記目的の標的配列は、Alu因子のライトアーム内に位置する、実施形態51に記載の方法。
53.前記異数性は常染色体異数性であり、工程d)及び工程e)で測定した捕捉現象の数は、性染色体由来の任意の捕捉現象を除外する、実施形態1から実施形態52のいずれか1つに記載の方法。
54.前記異数性は性染色体異数性であり、工程d)及び工程e)で測定した捕捉現象の数は、少なくとも1つの性染色体由来の捕捉現象を含む、実施形態1から実施形態52のいずれか1つに記載の方法。
55.胎児における異数性を検出するための方法であって、
a)母体血液試料由来のゲノムDNA試料を得ることと、
b)前記ゲノムDNA試料を、マルチウェルプレートのそれぞれのウェルへと加えることと、前記マルチウェルプレートのそれぞれのウェルはプローブ混合液を含み、前記プローブ混合液は分子反転プローブ(MIP)集団及び緩衝液を含み、
前記MIP集団内のそれぞれのMIPは、以下の構成要素、
第1の標的ポリヌクレオチドアーム−第1の固有分子タグ−ポリヌクレオチドリンカー−第2の固有分子タグ−第2の標的ポリヌクレオチドアームを配列内に含み、
前記MIPのそれぞれにおける前記一対の第1及び第2の標的ポリヌクレオチドアームは、同一であり、複数の目的の標的配列内におけるそれぞれの配列に隣接する、前記核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的であり、
前記MIPのそれぞれにおける前記第1及び第2の固有標的分子タグの組み合わせは、前記MIPのそれぞれにおいて異なっており、
c)前記MIPの前記プローブ混合液を含む前記ゲノムDNA試料をインキュベートして、前記複数の目的の標的配列を捕捉することと、
d)伸長/ライゲーション用混合液を、前記MIP及び前記複数の目的の標的配列を含むc)の前記試料へと加えて、複数のMIPアンプリコンを作製することと、前記伸長/ライゲーション用混合液は、ポリメラーゼ、複数のdNTP、リガーゼ、及び、緩衝液を含み、
e)エキソヌクレアーゼ混合液を、前記標的及び対照MIPアンプリコンへと加えて、過剰プローブまたは過剰ゲノムDNAを除去することと、
f)インデックスPCR用混合液をe)の前記試料へと加えて、一対のインデックスプライマー、固有試料バーコード、及び、一対のシークエンシングアダプターを、前記複数のアンプリコンへと加えることと、
g)超並列シークエンシング法を用いて、前記固有標的分子タグの数に基づいて、工程f)で提供したバーコード化アンプリコンの第1の集団におけるシークエンシングリードの数を測定することと、バーコード化アンプリコンの前記第1の集団は、前記目的の標的配列の前記シークエンスにより同定され、
h)超並列シークエンシング法を用いて、前記固有標的分子タグの数に基づいて、工程f)で提供したバーコード化アンプリコンの第2の集団におけるシークエンシングリードの数を測定することと、バーコード化アンプリコンの前記第2の集団は、前記目的の標的配列の前記シークエンスにより同定され、
i)工程g)で測定した第1のシークエンシングリードの数の少なくとも一部に基づいて、部位捕捉基準を計算し、工程h)で測定した第2のシークエンシングリードの数の少なくとも一部に基づいて、複数の対照プローブ捕捉基準を計算することと、
j)少なくとも1つの判定基準を満たす対照プローブ捕捉基準を有する前記MIPアンプリコンの前記集団における部位捕捉基準のサブセットを同定することと、
k)前記部位捕捉基準を、前記少なくとも1つの判定基準を満たす対照プローブ捕捉基準の前記サブセットから計算した係数で正規化して、検査正規化部位捕捉基準を得ることと、
l)工程b)〜工程h)における同一の標的部位及び対照部位、標的集団、対照集団のサブセットを用いて、前記検査正規化部位捕捉基準を、既知の遺伝子型を示す参照対象から得た参照ゲノムDNA試料に基づいて計算した複数の参照正規化部位捕捉基準と比較することと、
m)工程l)の前記比較、及び、参照対象の前記既知の遺伝子型に基づいて、異数性が前記胎児において検出されるかどうかを判定することと、
を含む、前記方法。
56.前記血液試料は、全血試料、血漿試料、または、血清試料である、実施形態55に記載の方法。
57.前記血液試料は血漿試料である、実施形態56に記載の方法。
58.前記第1の標的ポリヌクレオチドアームの長さは、14〜30塩基対である、実施形態55から実施形態57のいずれか1つに記載の方法。
59.前記第2の標的ポリヌクレオチドアームの長さは、14〜30塩基対である、実施形態55から実施形態58のいずれか1つに記載の方法。
60.前記標的ポリヌクレオチドアームのそれぞれは、45℃〜80℃の融解温度を有する、実施形態55から実施形態59のいずれか1つに記載の方法。
61.前記標的ポリヌクレオチドアームのそれぞれは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態55から実施形態60のいずれか1つに記載の方法。
62.前記第1の固有分子タグの長さは、4〜15塩基対である、実施形態55から実施形態61のいずれか1つに記載の方法。
63.前記第2の固有分子タグの長さは、4〜15塩基対である、実施形態55から実施形態62のいずれか1つに記載の方法。
64.前記固有分子タグのそれぞれは、45℃〜80℃の融解温度を有する、実施形態55から実施形態63のいずれか1つに記載の方法。
65.前記固有分子タグのそれぞれは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態55から実施形態64のいずれか1つに記載の方法。
66.前記ポリヌクレオチドリンカーは、前記対象における任意のゲノム領域に対して実質的に相補的ではない、実施形態55から実施形態65のいずれか1つに記載の方法。
67.前記ポリヌクレオチドリンカーは、20〜1,000塩基対の長さを有する、実施形態55から実施形態66のいずれか1つに記載の方法。
68.前記ポリヌクレオチドリンカーは、45℃〜80℃の融解温度を有する、実施形態55から実施形態67のいずれか1つに記載の方法。
69.前記ポリヌクレオチドリンカーは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態55から実施形態68のいずれか1つに記載の方法。
70.前記ポリヌクレオチドリンカーは、少なくとも1種の増幅用プライマーを含む、実施形態55から実施形態69のいずれか1つに記載の方法。
71.前記ポリヌクレオチドリンカーは、増幅用フォワードプライマー及び増幅用リバースプライマーを含む、実施形態70に記載の方法。
72.前記増幅用フォワードプライマーの前記配列は、5´−CTTCAGCTTCCCGATTACGG−3´(配列番号:1)のヌクレオチド配列を含む、実施形態71に記載の方法。
73.前記増幅用リバースプライマーの前記配列は、5´−GCACGATCCGACGGTAGTGT−3´(配列番号:2)のヌクレオチド配列を含む、実施形態72に記載の方法。
74.前記ポリヌクレオチドリンカーは、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)のヌクレオチド配列を含む、実施形態55から実施形態73のいずれか1つに記載の方法。
75.前記第1の標的ポリヌクレオチドアームは、5´−CACTGCACTCCAGCCTGG−3´(配列番号:4)のヌクレオチド配列を含む、実施形態55から実施形態74のいずれか1つに記載の方法。
76.前記第2の標的ポリヌクレオチドアームは、5´−GAGGCTGAGGCAGGAGAA−3´(配列番号:5)のヌクレオチド配列を含む、実施形態55から実施形態75のいずれか1つに記載の方法。
77.前記MIPは、5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:6)のヌクレオチド配列を含み、(N1−6)は前記第1の固有分子タグを表し、(N7−12)は前記第2の固有分子タグを表す、実施形態55から実施形態76のいずれか1つに記載の方法。
78.前記MIP集団は、10fM〜100nMの濃度を有する、実施形態55から実施形態77のいずれか1つに記載の方法。
79.前記MIPレプリコンのサイズは、80〜90塩基対である、実施形態55から実施形態78のいずれか1つに記載の方法。
80.前記シークエンシング工程は、6〜8百万リードの読み取り深度を有する、実施形態55から実施形態79のいずれか1つに記載の方法。
81.対象内の異数性を検出するのに用いる分子反転プローブ(MIP)を、複数の候補MIPから選択するための方法であって、前記方法は、
a)前記複数の候補MIPの核酸配列を受信することと、
b)前記複数の候補MIP中のそれぞれの対応するMIPについて、
i)前記対応するMIPにより捕捉されると予測される、目的の染色体上におけるミスマッチのない固有部位の第1の数(A)を計算することと、
ii)前記対応するMIPにより捕捉されると予測される、前記目的の染色体上におけるミスマッチが1つある固有部位の第2の数(C)を計算することと、
iii)前記対応するMIPにより捕捉されると予測される、ゲノムの全体にわたるミスマッチのない固有部位の第3の数(E)を計算することと、
iv)前記対応するMIPにより捕捉されると予測される、前記ゲノムの全体にわたるミスマッチが1つある固有部位の第4の数(G)を計算することと、
v)前記対応するMIPにより捕捉されると予測される、前記ゲノムの全体にわたるミスマッチのない非固有部位の第5の数(F)を計算することと、
vi)前記対応するMIPにより捕捉されると予測される、前記ゲノムの全体にわたるミスマッチが1つある非固有部位の第6の数(H)を計算することと、
vii)前記第1の、第2の、第3の、第4の、第5の、及び、第6の数の少なくとも一部に基づいて、前記対応するMIPの性能測定基準を計算することと、
c)工程b)vii)で前記複数の候補MIP中のそれぞれのMIPについて計算した前記性能測定基準の少なくとも一部に基づいて、MIPを選択することと、
を含む、前記方法。
82.固有部位は、前記対応するMIPにより1回だけ捕捉される部位に相当する、実施形態81に記載の方法。
83.非固有部位は、前記対応するMIPにより2回以上捕捉される部位に相当する、実施形態81から実施形態82のいずれか1つに記載の方法。
84.前記非固有部位は、同一染色体上で、異なる染色体上で、または、その両方において、前記対応するMIPにより2回以上捕捉される、実施形態83に記載の方法。
85.前記ゲノムは、全ての常染色体、X染色体、及び、Y染色体を含む、実施形態81から実施形態84のいずれか1つに記載の方法。
86.工程c)の前記MIPは、前記第1の数(A)と前記第5の数(F)との第1の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態81から実施形態85のいずれか1つに記載の方法。
87.工程c)の前記MIPは、前記第1の数(A)と前記第3の数(E)との第2の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態81から実施形態86のいずれか1つに記載の方法。
88.工程c)の前記MIPは、前記第1の数(A)と前記第2の数(C)との第3の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態81から実施形態87のいずれか1つに記載の方法。
89.工程c)の前記MIPは、前記第1の数(A)及び前記第2の数(C)の第1の合計と、前記第3の、第4の、第5の、及び、第6の数(E、F、G、H)の第2の合計との第4の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態81から実施形態88のいずれか1つに記載の方法。
90.工程c)の前記MIPは、前記第1の数(A)及び前記第2の数(C)の第1の加重和と、前記第3の、第4の、第5の、及び、第6の数(E、F、G、H)の第2の加重和との第5の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態81から実施形態89のいずれか1つに記載の方法。
91.前記第1の加重和と前記第2の加重和との前記第5の比率(P1)は、
Figure 0006830094
で表される、実施形態81から実施形態90のいずれか1つに記載の方法。
92.前記第1の加重和と前記第2の加重和との前記第5の比率(P)は、
Figure 0006830094
で表される、実施形態81から実施形態91のいずれか1つに記載の方法。
93.工程c)で前記MIPを選択することは、前記性能測定基準を既定閾値と比較することを含む、実施形態81から実施形態92のいずれか1つに記載の方法。
94.工程c)で選択した前記MIPは、6超の第5の比率(P)を有する、実施形態93に記載の方法。
95.工程c)の前記MIPは、前記第1の数(A)と前記第2の数(C)との第3の加重和が、前記候補MIPの残りの集合の当量の加重和よりも大きくなるように選択される、実施形態81から実施形態94のいずれか1つに記載の方法。
96.前記第3の加重和は、
Figure 0006830094
で表される、実施形態81から実施形態95に記載の方法。
97.工程c)の前記MIPは、前記第5の比率(P1)と前記第3の加重和(P2)の積が、前記候補MIPの残りの集合の当量積よりも大きくなるように選択される、実施形態81から実施形態96のいずれか1つに記載の方法。
98.前記性能測定基準は、前記目的の染色体由来の有効リード総数に基づいて計算される、実施形態81から実施形態97のいずれか1つに記載の方法。
99.工程c)の前記MIPは、ミスマッチが1つの部位(K)の平均捕捉係数と、ミスマッチが0の部位(K)の平均捕捉係数との比率(K)、
Figure 0006830094
に基づいて選択され、式中、前記比率(K)は実験により概算する、実施形態81から実施形態98のいずれか1つに記載の方法。
100.工程c)の前記MIPは、
Figure 0006830094
として定義される、総分子タグカウント(TMTC)に基づいて選択される、実施形態81から実施形態99のいずれか1つに記載の方法。
101.対象内の異数性を検出するのに用いる分子反転プローブ(MIP)を、複数の候補MIPから選択するための方法であって、前記方法は、
a)前記複数の候補MIPの核酸配列を受信することと、
b)前記複数の候補MIP中のそれぞれの対応するMIPについて、
i)前記対応するMIPにより捕捉されると予測される、目的の染色体上におけるミスマッチのない固有部位の第1の数(A)を計算することと、
ii)前記対応するMIPにより捕捉されると予測される、前記目的の染色体上におけるミスマッチが1つある固有部位の第2の数(C)を計算することと、
iii)前記第1及び第2の数の少なくとも一部に基づいて、前記対応するMIPの性能測定基準を計算することと、
c)工程b)iii)で前記複数の候補MIP中のそれぞれのMIPについて計算した前記性能測定基準の少なくとも一部に基づいて、MIPを選択することと、
を含む、前記方法。
102.固有部位は、前記対応するMIPにより1回だけ捕捉される部位に相当する、実施形態101に記載の方法。
103.非固有部位は、前記対応するMIPにより2回以上捕捉される部位に相当する、実施形態101から実施形態102のいずれか1つに記載の方法。
104.前記非固有部位は、同一染色体上で、異なる染色体上で、または、その両方において、前記対応するMIPにより2回以上捕捉される、実施形態103に記載の方法。
105.工程c)の前記MIPは、前記第1の数(A)と前記第2の数(C)との第1の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態101から実施形態104のいずれか1つに記載の方法。
106.対象内の異数性を検出するのに用いる分子反転プローブ(MIP)を、複数の候補MIPから選択するための方法であって、前記方法は、
a)前記複数の候補MIPの核酸配列を受信することと、
b)前記複数の候補MIP中のそれぞれの対応するMIPについて、
i)前記対応するMIPにより捕捉されると予測される、目的の染色体上におけるミスマッチのない固有部位の第1の数(A)を計算することと、
ii)前記対応するMIPにより捕捉されると予測される、前記ゲノムの全体にわたるミスマッチのない非固有部位の第2の数(F)を計算することと、
iii)前記第1及び第2の数の少なくとも一部に基づいて、前記対応するMIPの性能測定基準を計算することと、
c)工程b)iii)で前記複数の候補MIP中のそれぞれのMIPについて計算した前記性能測定基準の少なくとも一部に基づいて、MIPを選択することと、
を含む、前記方法。
107.固有部位は、前記対応するMIPにより1回だけ捕捉される部位に相当する、実施形態106に記載の方法。
108.非固有部位は、前記対応するMIPにより2回以上捕捉される部位に相当する、実施形態106から実施形態107のいずれか1つに記載の方法。
109.前記非固有部位は、同一染色体上で、異なる染色体上で、または、その両方において、前記対応するMIPにより2回以上捕捉される、実施形態108に記載の方法。
110.工程c)の前記MIPは、前記第1の数(A)と前記第2の数(F)との第1の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態106から実施形態109のいずれか1つに記載の方法。
111.前記ゲノムは、全ての常染色体、X染色体、及び、Y染色体を含む、実施形態106から実施形態110のいずれか1つに記載の方法。
112.対象内の異数性を検出するのに用いる分子反転プローブ(MIP)を、複数の候補MIPから選択するための方法であって、前記方法は、
a)前記複数の候補MIPの核酸配列を受信することと、
b)前記複数の候補MIP中のそれぞれの対応するMIPについて、
i)前記対応するMIPにより捕捉されると予測される、目的の染色体上におけるミスマッチのない固有部位の第1の数(A)を計算することと、
ii)前記対応するMIPにより捕捉されると予測される、ゲノムの全体にわたるミスマッチのない固有部位の第2の数(E)を計算することと、
iii)前記第1及び第2の数の少なくとも一部に基づいて、前記対応するMIPの性能測定基準を計算することと、
c)工程b)iii)で前記複数の候補MIP中のそれぞれのMIPについて計算した前記性能測定基準の少なくとも一部に基づいて、MIPを選択することと、
を含む、前記方法。
113.固有部位は、前記対応するMIPにより1回だけ捕捉される部位に相当する、実施形態112に記載の方法。
114.非固有部位は、前記対応するMIPにより2回以上捕捉される部位に相当する、実施形態112から実施形態113のいずれか1つに記載の方法。
115.前記非固有部位は、同一染色体上で、異なる染色体上で、または、その両方において、前記対応するMIPにより2回以上捕捉される、実施形態114に記載の方法。
116.工程c)の前記MIPは、前記第1の数(A)と前記第2の数(E)との第1の比率が、前記候補MIPの残りの集合の当量比よりも大きくなるように選択される、実施形態112から実施形態115のいずれか1つに記載の方法。
117.前記ゲノムは、全ての常染色体、X染色体、及び、Y染色体を含む、実施形態112から実施形態116のいずれか1つに記載の方法。
118.5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:6)のヌクレオチド配列を含む核酸分子であって、式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、前記核酸分子。
119.前記第1の固有分子タグの長さは、4〜15塩基対である、実施形態118に記載の核酸。
120.前記第2の固有分子タグの長さは、4〜15塩基対である、実施形態118から実施形態119のいずれか1つに記載の核酸。
121.前記固有標的分子タグのそれぞれは、45℃〜80℃の融解温度を有する、実施形態118から実施形態120のいずれか1つに記載の核酸。
122.前記固有標的分子タグのそれぞれは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態118から実施形態121のいずれか1つに記載の核酸。
123.5´−A−(N)x−B−(N)y−C−3´のヌクレオチド配列を含む核酸分子であって、
式中、(N)xは第1の固有分子タグを表し、(N)yは第2の固有分子タグを表し、式中、X及びYは4〜15塩基対であり、
式中、Aは、i)5´−TGCACTCCAGCCTG−3´(配列番号:15)の配列、または、5´−TGCACTCCAGCCTG−3´(配列番号:15)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有し、
式中、Cは、i)5´−GAGGCTGAGGCAGGA−3´(配列番号:16)の配列、または、5´−GAGGCTGAGGCAGGA−3´(配列番号:16)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有する、
前記核酸分子。
124.5´−A−(N)x−B−(N)y−C−3´のヌクレオチド配列を含む核酸分子であって、
式中、(N)xは第1の固有分子タグを表し、(N)yは第2の固有分子タグを表し、式中、X及びYは4〜15塩基対であり、
式中、Aは、i)5´−TCCTGCCTCAGCCTC−3´(配列番号:17)の配列、または、5´−TCCTGCCTCAGCCTC−3´(配列番号:17)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有し、
式中、Cは、i)5´−AGGCTGGAGTGC−3´(配列番号:18)の配列、または、5´−AGGCTGGAGTGC−3´(配列番号:18)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有する、
前記核酸分子。
125.式中、Bは、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)の配列、または、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)の配列に少なくとも85%類似した配列を含む、実施形態123または実施形態124に記載の核酸分子。
126.式中、AまたはCは、45℃〜80℃の融解温度を有する、実施形態123から実施形態125のいずれか1つに記載の核酸分子。
127.式中、AまたはCは、30%〜80%の、または、30%〜70%のGC含有量を有する、実施形態123から実施形態126のいずれか1つに記載の核酸分子。
128.5´−CCACTGCACTCCAGCCTG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N1−6)GAGGCTGAGGCAGGAGAA−3´(配列番号:19)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
129.5´−TCTCCTGCCTCAGCCTCC(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)AGGCTGGAGTGCAGTGGC−3´(配列番号:20)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
130.5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:21)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
131.5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:22)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
132.5´−CCACTGCACTCCAGCCTG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GGAGGCTGAGGCAGGAGA−3´(配列番号:23)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
133.5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)CAGGAGGCTGAGGCAGGA−3´(配列番号:24)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
134.5´−ACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GGAGGCTGAGGCAGGAG−3´(配列番号:25)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
135.5´−TGCACTCCAGCCTGGGCA(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:26)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
136.5´−CTGCACTCCAGCCTGGGC(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:27)のヌクレオチド配列を含む核酸分子であって、
式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、
前記核酸分子。
137.前記MIPは、実施形態123から実施形態136のいずれか1つに記載の核酸分子を含む、実施形態1から実施形態80のいずれか1つに記載の方法。
[図面の簡単な説明]
[図1]本開示の方法に従い記載されるプロセスのいずれかを実行するコンピュータデバイスにおける、例示的な実施形態を示す図である。
[図2]本開示における一部の方法に従い、プローブを設計及び選択するための例示的なプロセスを示すフローチャートである。
[図3]本開示における一部の方法に従い、検査対象の異数性状態を予測するための例示的なプロセスを示すフローチャートである。
[図4]本開示における一部の方法に従い、検査対象の異数性状態を予測するための、より詳細な別の例示的なプロセスを示すフローチャートである。
[図5]本開示における一部の方法に用いる、例示的な分子反転プローブ(MIP)の配列を示す図である。MIPは、以下の構成要素、第1の標的ポリヌクレオチドアーム(「ライゲーションアーム」と記載)、ポリヌクレオチドリンカー(「主鎖」と記載)、及び、第2の標的ポリヌクレオチドアーム(「伸長アーム」と記載)を配列内に含み、またそのリンカーは、第1の固有標的分子タグ(「6N」と記載)、PCR用フォワードプライマー、PCR用リバースプライマー、及び、第2の固有標的分子タグ(こちらも「6N」と記載)を含む。MIPのそれぞれにおける第1及び第2の標的ポリヌクレオチドアームは、目的の部位に隣接する、核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的である。固有分子タグは、ランダムなポリヌクレオチド配列である。一部の実施形態では、「実質的に相補的」とは、両方のアームにおいてミスマッチが0であること、または、一方のアームのみにおいてミスマッチがせいぜい1であることを意味する(例えば、標的ポリヌクレオチドアームが、目的の部位に隣接する、核酸内の第1及び第2の領域にそれぞれハイブリダイズする場合)。一部の実施形態では、「実質的に相補的」とは、両方のアームにおいてミスマッチの数が少ないこと、例えば、せいぜい1、2、3、3、5、6、7、または、8であることを意味する。
[図6]本開示の方法における、プローブによるハイブリダイゼーション及び伸長/ライゲーションを示す図である。第1の標的ポリヌクレオチドアーム(「ライゲーションアーム」と記載)及び第2の標的ポリヌクレオチドアーム(「伸長アーム」と記載)を、DNA鋳型にハイブリダイズするのに好適な条件下で、DNAにMIPを添加する。ハイブリダイゼーション後、伸長/ライゲーション条件下で、ポリメラーゼ及びリガーゼを添加してから、ライゲーションアームと伸長アームとの間に固有ギャップ配列を含む目的の標的配列全体にわたりDNA合成を行うことにより、環状オリゴヌクレオチド(「捕捉済みプローブ」)を作製する。アンプリコン及びcsDNAが融解すると、捕捉済みプローブを増幅する準備が整う。
[図7]捕捉済みプローブの増幅及びシークエンシングを示す図である。シークエンシングアダプター及びPCR用フォワードプライマーまたはPCR用リバースプライマーを含む核酸分子を環状アンプリコンの主鎖に結合させてから、MIPにより作製された全ての環状オリゴヌクレオチドをPCRを用いて増幅する。その後、例えば、次世代シークエンシング(NGS)を用いてアンプリコンのシークエンスを行ってから、それぞれのアンプリコン内に存在する固有分子タグの数をカウントすることにより、得られたアンプリコンのリード数を測定する。
[図8]21番染色体トリソミー(ダウン症候群)検査の結果を示す図である。検査した48点の試料のうち46点がダウン症候群に対して陰性であった一方、2点の試料がダウン症候群に対して陽性であった。2点の陽性試料を、Z値が6超の上部右側に示す。
[図9]本開示の実施形態における、Alu因子へのプローブのハイブリダイゼーションを示す図である。
[図10]トリソミー13を検出するためのMIP実施例において評価した、検査性能を示す図である。
[図11]トリソミー18を検出するためのMIP実施例において評価した、検査性能を示す図である。
[図12]トリソミー21を検出するためのMIP実施例において評価した、検査性能を示す図である。
本開示では、異数性を検出するためのシステム及び方法を提供する。
本明細書に記載の本開示を完全に理解できるように、以下に詳細な説明を記載する。
本明細書において特に明示しない限り、本出願で用いる科学用語及び専門用語は、本開示が属する技術分野の当業者に一般に理解される意味を有するものとする。一般的に、本明細書に記載する、細胞及び組織培養技術、分子生物学技術、細胞生物学技術、がん生物学技術、神経生物学技術、神経化学技術、ウイルス学技術、免疫学技術、微生物学技術、遺伝学技術、タンパク質及び核酸化学技術、化学技術、薬理学技術と関連させて用いる専門用語は、当該技術分野において周知かつ一般的に使用されるものである。本明細書に記載する本開示のそれぞれの実施形態は、単独で用いてもよく、または、本開示の1つまたは複数のその他実施形態と組み合わせて用いてもよい。
本開示の方法及び技術は通常、特に指示がない限り、当該技術分野において周知の分子生物学的方法、細胞生物学的方法、生化学的方法、マイクロアレイ及びシークエンシング技術、ならびに、本明細書全体にわたり列挙及び説明する各種概要及びより具体的な言及の記載に従い行われる。例えば、Motulsky,「Intuitive Biostatistics」,Oxford University Press,Inc.(1995);Lodish et al.,「Molecular Cell Biology,4th ed.」,W.H.Freeman & Co.,New York(2000);Griffiths et al.,「Introduction to Genetic Analysis,7th ed.」,W.H.Freeman & Co.,N.Y.(1999);Gilbert et al.,「Developmental Biology,6th ed.」,Sinauer Associates,Inc.,Sunderland,MA(2000)を参照されたい。
本明細書で用いる化学用語は、「The McGraw−Hill Dictionary of Chemical Terms」,Parker S.,Ed.,McGraw−Hill,San Francisco,C.A.(1985)により例示されるような、当該技術分野における通常の用法に従って用いられる。
上記の全て、ならびに、本出願において参照する任意のその他刊行物、特許及び公開特許出願は明示的に、参照により本明細書に組み込まれる。矛盾が生じた場合には、本明細書(その具体的な定義を含む)が優先される。
本明細書の全体にわたり、用語「含む(comprise)」、またはその変形形態「含む(comprises)」もしくは「含む(comprising)」は、明示した整数(または構成要素)または整数(または構成要素)の群を包含するが、任意のその他の整数(または構成要素)または整数(または構成要素)の群を除外しないことを意味するものと理解されたい。
単数形「a」、「an」、及び「the」は、文脈上明確に指示しない限り、複数形を含む。
用語「含む(including)」は、「含むがこれらに限定されない」を意味するように用いられる。「含む(including)」及び「含むがこれらに限定されない」は、同じ意味で用いられる。
定義
本開示を更に明示するために、本明細書において、以下の用語及び定義を提供する。
本発明で使用する場合、用語「異数性」とは、例えば、半数体染色体数の正確な倍数ではない、染色体数の異常変異に特徴付けられる染色体異常のことを意味する。例えば、nが半数体個体の染色体数である場合、正倍数性の個体は、2nに等しい数の染色体を有している。ヒトにおける半数体数は23である。それゆえ、二倍体個体は46の染色体を有することになる。異数性の個体は、染色体の余分な複製(その染色体のトリソミー)を有する場合があり、または、染色体の複製を欠損(その染色体のモノソミー)している場合がある。異常変異は、それぞれの個々の染色体を基準としている。それゆえ、トリソミー及びモノソミーの両方を有している個体は、46本の染色体を有するにもかかわらず異数体である。異数性による疾患または状態の例としては、ダウン症候群(21番染色体のトリソミー)、エドワーズ症候群(18番染色体のトリソミー)、パトー症候群(13番染色体のトリソミー)、ターナー症候群(女性におけるX染色体のモノソミー)、及び、クラインフェルター症候群(男性におけるX染色体の余分な複製)が挙げられるが、これらに限定されない。異数体ではないその他の染色体異常としては、転座(ある染色体のあるセグメントが、別の染色体へと移行していること)、欠失(染色体の一部が失われていること)、及び、他の種類の染色体損傷(例えば、脆弱X症候群であり、それは異常に壊れやすいX染色体により引き起こされる)が挙げられる。
本開示におけるその他の実施形態では、本方法を用いてコピー数多型を検出することができる。本発明で使用する場合、「コピー数多型」とは通常、遺伝的変異または染色体異常の分類または種類のことである。コピー数多型は、欠失(例えば、微小欠失)、重複(例えば、微小重複)、または、挿入(例えば、微小挿入)であり得る。特定の実施形態では、本発明で使用する接頭辞「微小」とは、長さ5塩基対未満の核酸セグメントのことを意味し得る。コピー数多型としては、染色体セグメントにおける、1つまたは複数の欠失(例えば、微小欠失)、重複及び/または挿入(例えば、微小重複、微小挿入)を挙げることができる。特定の実施形態では、重複は挿入を含む。特定の実施形態では、挿入とは重複のことである。特定の実施形態では、挿入は重複のことではない。例えば、ある部位において配列が重複すると、重複が見つかる部位のカウントが増加する。多くの場合、ある部位において配列が重複すると、エレベーションまたはレベルが増加する。特定の実施形態では、第1のエレベーションまたはレベルを構成する部位に存在する重複は、重複が存在しない第2のエレベーションまたはレベルと比較して、エレベーションまたはレベルを増加させる。特定の実施形態では、挿入はある部位のカウントを増加させ、挿入を示す配列は同一部位内の別の位置に存在(すなわち、重複)する。特定の実施形態では、挿入は、ある部位のカウント、すなわち、エレベーションまたはレベルを有意には増加させず、挿入された配列は同一部位内における配列の重複ではない。特定の実施形態では、挿入は検出されないか、または、重複としては示されず、挿入を示す重複配列は同一部位には存在しない。一部の実施形態では、コピー数多型は、胎児のコピー数多型である。多くの場合、胎児のコピー数多型は、胎児のゲノム内におけるコピー数多型である。一部の実施形態では、コピー数多型は、母体及び/または胎児のコピー数多型である。特定の実施形態では、母体及び/または胎児のコピー数多型は、妊娠している女性(例えば、胎児を身籠もっている女性の対象)の、出産した女性の対象の、または、胎児を身籠もることが可能な女性のゲノム内におけるコピー数多型である。コピー数多型は、変異(例えば、重複または欠失)がゲノムの片方の対立遺伝子に存在する、ヘテロ接合性のコピー数多型であり得る。コピー数多型は、変異がゲノムの両方の対立遺伝子に存在する、ホモ接合性のコピー数多型であり得る。一部の実施形態では、コピー数多型は、ヘテロ接合性またはホモ接合性の、胎児のコピー数多型である。一部の実施形態では、コピー数多型は、ヘテロ接合性またはホモ接合性の、母体及び/または胎児のコピー数多型である。コピー数多型は、母体のゲノム及び胎児のゲノム内に存在する場合があり、母体のゲノム内に存在して胎児のゲノム内には存在しない場合があり、または、胎児のゲノム内に存在して母体のゲノム内には存在しない場合がある。
本発明で使用する場合、用語「対象」及び「患者」とは、任意の動物、例えば、イヌ、ネコ、トリ、家畜類など、特に哺乳類、好ましくはヒトのことを意味する。用語「参照対象」及び「参照患者」とは、既知の遺伝子型(例えば、既知の正倍数性または異数性)を示す、任意の対象または患者のことを意味する。
本発明で使用する場合、用語「ポリヌクレオチド」、「核酸」、及び、「核酸分子」は同じ意味で用いられ、DNA分子(例えば、cDNAまたはゲノムDNA)、RNA分子(例えば、mRNA)、DNA−RNAハイブリッド、及び、ヌクレオチドのアナログを用いて作製したDNAまたはRNAのアナログのことを意味する。核酸分子は、ヌクレオチド、オリゴヌクレオチド、二本鎖DNA、一本鎖DNA、多本鎖DNA、相補DNA、ゲノムDNA、非コードDNA、メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)、核小体低分子RNA(snoRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、低分子干渉RNA(siRNA)、ヘテロ核RNA(hnRNA)、または、低分子ヘアピンRNA(shRNA)であってもよい。
本発明で使用する場合、用語「試料」とは、体液、細胞、組織、器官、または、生体に通常由来する試料のことを意味し、試料としては、例えば、異数性またはその他染色体異常のスクリーニングを実施する少なくとも1つの核酸配列を含む、核酸または核酸の混合物が挙げられる。一部の実施形態では、試料は、全血試料、血清試料、または、血漿試料などの血液試料である。一部の実施形態では、試料は、ゲノムが変異を起こしていると推測される、少なくとも1つの核酸配列を含む。このような試料としては、痰/唾液、羊水、血液、血液画分、または、細針生検検体(例えば、外科生検、細針生検など)、尿、腹腔液、胸水などが挙げられるが、これらに限定されない。試料は多くの場合、ヒト対象(例えば、患者)から採取するが、アッセイを用いて、任意の哺乳類(イヌ、ネコ、ウマ、ヤギ、ヒツジ、ウシ、ブタなどを含むがこれらに限定されない)に由来する試料から異数性を検出してもよい。生物源から得た試料を直接用いてもよく、または、前処理を施してから試料の特性を調整してもよい。このような前処理としては、例えば、血液から血漿を調製すること、粘性流体を希釈することなどを挙げてもよい。前処理の方法としては更に、濾過、沈殿、希釈、蒸留、混合、遠心分離、凍結、凍結乾燥、濃縮、増幅、核酸の断片化、干渉する構成要素の不活性化、試薬の添加、溶解などを挙げてもよいが、これらに限定されない。試料に対してこのような前処理方法を採用する場合、このような前処理方法は通常、目的の核酸(複数可)が検査用試料中に残存するように行われ、好ましくは、未処理の検査用試料(例えば、つまり、このような前処理方法(複数可)を行わない試料)の濃度と釣り合う濃度で行われる。用いる試料の種類にもよるが、追加の処理及び/または精製工程を実施して、適切な純度またはサイズの核酸断片を得てもよい。用いる処理方法としては、超音波処理、噴霧化、ゲル精製、PCR精製システム、ヌクレアーゼによる切断、サイズ特異的な捕捉または排除、標的捕捉、またはこれら方法の組み合わせが挙げられるが、これらに限定されない。更なる解析を行う前に、任意選択的に、無細胞DNAを試料から単離してもよい。一部の実施形態では、試料は、本開示のシステム及び方法を用いて正倍数性または異数性の同定を行う対象由来のものであり、それら試料もまた「検査試料」と呼ばれる。
本発明で使用する場合、用語「MIP」とは、分子反転プローブ(環状捕捉プローブとしても周知)のことを意味する。本発明で使用する場合、用語「プライマー」または「プローブ」もまた、MIPを意味していてもよい。分子反転プローブは、2つの標的ポリヌクレオチドアーム、1つまたは複数の固有分子タグ(固有分子識別子としても周知)、及び、ポリヌクレオチドリンカー(例えば、一般的な主鎖リンカー)を有する核酸分子である。例えば、図5を参照のこと。一部の実施形態では、MIPは、2つ以上の固有分子タグ、例えば、2つの固有分子タグ、3つの固有分子タグ、またはそれ以上を含んでいてもよい。一部の実施形態では、それぞれのMIP内における固有ポリヌクレオチドアームがMIPの5´末端及び3´末端に位置する一方で、固有分子タグ(複数可)及びポリヌクレオチドリンカーは中央部に位置する。例えば、本開示で用いるMIPは、以下の構成要素、第1の標的ポリヌクレオチドアーム−第1の固有分子タグ−ポリヌクレオチドリンカー−第2の固有分子タグ−第2の標的ポリヌクレオチドアームを配列内に含む。一部の実施形態では、MIP内におけるポリヌクレオチドリンカー(または主鎖リンカー)は、本開示の方法に用いる全てのMIPにおいて共通である。
MIP内において、固有ポリヌクレオチドアームは、ゲノム核酸試料中の目的とする特定の標的配列(または部位)の上流及び下流に直接ハイブリダイズするように設計されている。本発明で使用する場合、用語「目的の標的配列」及び「目的の標的部位」は同じ意味で用いられ、MIPがそれを捕捉するように設計された、ゲノム核酸分子の一部のことを意味する。一部の実施形態では、固有ポリヌクレオチドアームは、ゲノム核酸試料中における1つまたは複数の目的の配列(または目的の部位)に隣接する上流及び下流に対して相補的である。一部の実施形態では、これら固有ポリヌクレオチドアームは、ゲノム核酸試料中における1つまたは複数の目的の配列(または目的の部位)に対して相補的である。一部の実施形態では、標的ポリヌクレオチドアームは、ライゲーション配列及び伸長配列を含む。DNA試料中における複数の目的の配列に対して相補的な、標的ポリヌクレオチドアームを含むMIPは、「再犯者(repeat offender)−MIP」または「RO−MIP」と呼ばれることもある。例えば、RO−MIPは、DNA試料(例えば、ヒトゲノムを含む試料)中における、数百の、数千の、数十万の、または、数百万の目的の配列を標的とすることができる。一部の実施形態では、RO−MIPは、例えば、1,000超の、10,000超の、20,000超の、30,000超の、40,000超の、50,000超の、60,000超の、70,000超の、80,000超の、90,000超の、100,000超の、200,000超の、300,000超の、400,000超の、500,000超の、600,000超の、700,000超の、800,000超の、900,000超の、及び/または、1,000,000超の、目的の配列を標的とする。一部の実施形態では、RO−MIPは、例えば、100,000超の、110,000超の、120,000超の、130,000超の、140,000超の、150,000超の、160,000超の、170,000超の、180,000超の、190,000超の、及び/もしくは、200,000超の、または、100,000〜200,000の任意の範囲の、目的の配列を標的とする。一部の実施形態では、RO−MIPは、140,000〜160,000の、目的の配列を標的とする。これら目的の配列は、標的ポリヌクレオチドアームがそこにハイブリダイズする反復配列に隣接していてもよい。特定の実施形態では、反復配列は、標的ポリヌクレオチドアームとハイブリダイズする上で、0、1、2、3、4、またはそれ以上のミスマッチを有している。特定の実施形態では、反復配列は、標的ポリヌクレオチドアームとハイブリダイズする上で、0または1のミスマッチを有している。一部の実施形態では、RO−MIPは、ゲノム中の長鎖散在反復配列(LINE)とは結合しない。
一部の実施形態では、固有分子タグは、ランダムに生成された短いヌクレオチド配列である。特定の実施形態では、固有分子タグは、ゲノム核酸断片上またはゲノム核酸試料中に位置する、任意の配列または部位とはハイブリダイズしない。特定の実施形態では、固有分子タグは、核酸(例えば、ポリヌクレオチド)に組み込み可能または結合可能な、好適な検出可能標識を有する任意のタグであり、それらタグにより、タグを含む核酸またはタグと結合した核酸の検出及び/または同定が可能となる。一部の実施形態では、タグは、シークエンシング法(例えば、ポリメラーゼによる)を行う最中に、核酸に組み込まれるか、または、核酸と結合する。タグの非限定例としては、核酸タグ、核酸インデックスまたは核酸バーコード、放射能標識(例えば、同位元素)、金属標識、蛍光標識、化学発光標識、リン光標識、蛍光体−消光剤、染料、タンパク質(例えば、酵素、抗体またはその一部、リンカー、結合対の構成要素)など、またはこれらの組み合わせが挙げられる。一部の実施形態では、タグ(例えば、核酸インデックスまたは核酸バーコード)は、ヌクレオチドまたはヌクレオチドアナログにおける、固有の配列、周知の配列、及び/または、識別可能な配列である。一部の実施形態では、タグは、6個またはそれ以上の隣接ヌクレオチドである。様々な異なる励起スペクトル及び発光スペクトルを持つ多数の蛍光体が利用可能である。任意の適切な種類及び/または数の蛍光体をタグとして用いることができる。一部の実施形態では、本明細書に記載する方法(例えば、核酸検出法及び/またはシークエンシング法)に、1個以上の、2個以上の、3個以上の、4個以上の、5個以上の、6個以上の、7個以上の、8個以上の、9個以上の、10個以上の、20個以上の、30個以上の、50個以上の、100個以上の、500個以上の、1000個以上の、10,000個以上の、または、100,000個以上の異なるタグを利用することができる。一部の実施形態では、1種または2種のタグ(例えば、蛍光標識)を、ライブラリ内のそれぞれの核酸と連結させる。一部の実施形態では、染色体に特異的なタグを用いることで、染色体のカウントをより速くまたはより容易にする。タグの検出及び/または定量化は、適切な方法、装置、または、機器を用いて実施可能であり、その非限定例としては、フローサイトメトリー、定量的ポリメラーゼ連鎖反応(qPCR)、ゲル電気泳動、照度計、蛍光光度計、分光光度計、適切なジーンチップもしくはマイクロアレイ解析、ウェスタンブロット、質量分析、クロマトグラフィー、細胞蛍光測定分析、蛍光顕微鏡、適切な蛍光画像処理法もしくはデジタル画像処理法、共焦点レーザー走査顕微鏡、レーザー走査サイトメトリー、アフィニティークロマトグラフィー、手動によるバッチ様式の分離、電界懸濁、適切な核酸シークエンシング法、及び/または、核酸シークエンシング装置など、ならびに、これらの組み合わせが挙げられる。特定の実施形態では、タグは、マイクロアレイ解析と共に用いるのに適している。
核酸(例えば、核酸断片)にMIPを導入して、核酸試料(例えば、ゲノムDNA)上に位置する標的配列または標的部位の捕捉を行う。一部の実施形態において、例えば、ゲノムDNAが試料中に存在している場合、断片化させることが、分子反転プローブによる標的核酸の捕捉に役立ち得る。本明細書において更に詳細に記載するとおり、目的の標的配列(例えば、遺伝子座)を捕捉した後、標的配列の複製を環に組み込むように、捕捉した標的に対して、酵素によるギャップフィリング工程及びライゲーション工程を更に実施してもよい。MIPによる核酸断片上の標的配列の捕捉性能は、ハイブリダイゼーション及びギャップフィリングのためのインキュベーション時間を長くすることにより、向上させることができる(例えば、Turner E H,et al.,Nat Methods.2009 Apr.6:1−2を参照されたい)。
MIP技術を用いて、複合混合液中の特定の核酸配列を検出または増幅してもよい。MIP技術を用いることによる利点の1つは、その高度な多重化能力であり、それにより、数千ものMIPを含有する単一の反応液中で、数千もの標的配列を捕捉することが可能となる。MIP技術の様々な態様については、例えば、Hardenbol et al.,「Multiplexed genotyping with sequence−tagged molecular inversion probes」(Nature Biotechnology,21(6):673−678(2003))、Hardenbol et al.,「Highly multiplexed molecular inversion probe genotyping:Over 10,000 targeted SNPs genotyped in a single tube assay」(Genome Research,15:269−275(2005))、Burmester et al.,「DMET microarray technology for pharmacogenomics−based personalized medicine」(Methods in Molecular Biology,632:99−124(2010))、Sissung et al.,「Clinical pharmacology and pharmacogenetics in a genomics era:the DMET platform」(Pharmacogenomics,11(1):89−103(2010))、Deeken,「The Affymetrix DMET platform and pharmacogenetics in drug development」(Current Opinion in Molecular Therapeutics,11(3):260−268(2009))、Wang et al.,「High quality copy number and genotype data from FFPE samples using Molecular Inversion Probe(MIP) microarrays」(BMC Medical Genomics,2:8(2009))、Wang et al.,「Analysis of molecular inversion probe performance for allele copy number determination」(Genome Biology,8(11):R246(2007))、Ji et al.,「Molecular inversion probe analysis of gene copy alternations reveals distinct categories of colorectal carcinoma」(Cancer Research,66(16):7910−7919(2006))、及び、Wang et al.,「Allele quantification using molecular inversion probes(MIP)」(Nucleic Acids Research,33(21):e183(2005))に記載されている(それぞれの記載内容全体は、あらゆる目的において参照として本明細書に組み込まれる)。米国特許番号6,858,412、5,817,921、6,558,928、7,320,860、7,351,528、5,866,337、6,027,889、及び、6,852,487もまた参照されたい(それぞれの開示内容全体は、あらゆる目的において参照として本明細書に組み込まれる)。
MIP技術は以前より、がんのバイオマーカーの新規同定及び分類を含むその他の研究領域に、うまく応用されている。例えば、Brewster et al.,「Copy number imbalances between screen− and symptom−detected breast cancers and impact on disease−free survival」(Cancer Prevention Research,4(10):1609−1616(2011))、Geiersbach et al.,「Unknown partner for USP6 and unusual SS18 rearrangement detected by fluorescence in situ hybridization in a solid aneurysmal bone cyst」(Cancer Genetics,204(4):195−202(2011))、Schiffman et al.,「Oncogenic BRAF mutation with CDKN2A inactivation is characteristic of a subset of pediatric malignant astrocytomas」(Cancer Research,70(2):512−519(2010))、Schiffman et al.,「Molecular inversion probes reveal patterns of 9p21 deletion and copy number aberrations in childhood leukemia」(Cancer Genetics and Cytogenetics,193(1):9−18(2009))、Press et al.,「Ovarian carcinomas with genetic and epigenetic BRCA1 loss have distinct molecular abnormalities」(BMC Cancer,8:17(2008))、及び、Deeken et al.,「A pharmacogenetic study of docetaxel and thalidomide in patients with castration−resistant prostate cancer using the DMET genotyping platform」(Pharmacogenomics,10(3):191−199(2009))を参照されたい(それぞれの記載内容全体は、あらゆる目的において参照として本明細書に組み込まれる)。
MIP技術はまた、新規薬剤に関連したバイオマーカーの同定に応用されている。例えば、Caldwell et al.,「CYP4F2 genetic variant alters required warfarin dose」(Blood,111(8):4106−4112(2008))、及び、McDonald et al.,「CYP4F2 Is a Vitamin K1 Oxidase:An Explanation for Altered Warfarin Dose in Carriers of the V433M Variant」(Molecular Pharmacology,75:1337−1346(2009))を参照されたい(それぞれの記載内容全体は、あらゆる目的において参照として本明細書に組み込まれる)。MIPのその他の応用法としては、薬物開発及び安全性研究が挙げられる。例えば、Mega et al.,「Cytochrome P−450 Polymorphisms and Response to Clopidogrel」(New England Journal of Medicine,360(4):354−362(2009))、Dumaual et al.,「Comprehensive assessment of metabolic enzyme and transporter genes using the Affymetrix Targeted Genotyping System」(Pharmacogenomics,8(3):293−305(2007))、及び、Daly et al.,「Multiplex assay for comprehensive genotyping of genes involved in drug metabolism,excretion,and transport」(Clinical Chemistry,53(7):1222−1230(2007))を参照されたい(それぞれの記載内容全体は、あらゆる目的において参照として本明細書に組み込まれる)。MIP技術の更なる応用としては、遺伝子型及び表現型のデータベース化が挙げられる。例えば、Man et al.,「Genetic Variation in Metabolizing Enzyme and Transporter Genes:Comprehensive Assessment in 3 Major East Asian Subpopulations With Comparison to Caucasians and Africans」(Journal of Clinical Pharmacology,50(8):929−940(2010))を参照されたい(その記載内容全体は、あらゆる目的において参照として本明細書に組み込まれる)。
本発明で使用する場合、用語「捕捉する」または「捕捉」とは、分子反転プローブと対応する標的部位との間の結合反応またはハイブリダイゼーション反応のことを意味する。
本発明で使用する場合、用語「感度」とは、アッセイ(例えば、方法、検査法)の性能における統計指標のことを意味し、真陽性の数を、真陽性と偽陰性との合計で割ることにより算出される。
本発明で使用する場合、用語「特異度」とは、アッセイ(例えば、方法、検査法)の性能における統計指標のことを意味し、真陰性の数を、真陰性と偽陽性との合計で割ることにより算出される。
本発明で使用する場合、用語「MIPレプリコン」または「環状レプリコン」とは、捕捉反応(例えば、MIPとその標的配列との間の結合反応またはハイブリダイゼーション反応)により生成された環状核酸分子のことを意味する。一部の実施形態では、MIPレプリコンは一本鎖環状核酸分子である。一部の実施形態では、標的MIPは、標的配列または標的部位を捕捉、または、標的配列または標的部位にハイブリダイズする。捕捉反応またはハイブリダイゼーションの後に、ライゲーション/伸長用混合液を導入して、2つの標的ポリヌクレオチドアーム間に存在するギャップ領域を伸長及びライゲートし、一本鎖環状ヌクレオチド分子、すなわち、標的MIPレプリコンを作製する。ポリメラーゼ連鎖反応(PCR)によりMIPレプリコンを増幅させて、二本鎖ヌクレオチド分子である、複数の標的MIPアンプリコンを作製してもよい。
本発明で使用する場合、用語「アンプリコン」とは、増幅反応により生成された核酸のことを意味する。一部の実施形態では、アンプリコンは一本鎖核酸分子である。一部の実施形態では、アンプリコンは一本鎖環状核酸分子である。一部の実施形態では、アンプリコンは、二本鎖核酸分子である。例えば、MIP(例えば、RO−MIP)は、標的配列または標的部位を捕捉、または、標的配列または標的部位にハイブリダイズする。捕捉反応またはハイブリダイゼーションの後に、ライゲーション/伸長用混合液を導入して、2つの標的ポリヌクレオチドアーム間に存在するギャップ領域を伸長及びライゲートし、一本鎖環状ヌクレオチド分子、すなわち、MIPレプリコンを作製する。ポリメラーゼ連鎖反応(PCR)によりMIPレプリコンを増幅させて、二本鎖ヌクレオチド分子である、複数のMIPアンプリコンを作製してもよい。第1の複数の目的の標的配列(例えば、異数性を検査する染色体)及び第2の複数の目的の標的配列(例えば、ゲノム全体に分布する標的配列)から、MIPレプリコン及びMIPアンプリコンを作製することができる。
本発明で使用する場合、用語「シークエンシング」は、広範な意味で用いられ、また、少なくとも核酸の一部における少なくとも一部の連続したヌクレオチドの順番を同定することを可能とする、当該技術分野において周知である任意の技術のことを意味することができ、制限はないが、伸長産物またはベクターインサートの少なくとも一部を含む。シークエンシングは更に、核酸配列におけるヌクレオチド塩基間の違いの検出を可能とする技術のことを意味し得る。例示的なシークエンシング技術としては、以下のものが挙げられる。標的シークエンシング、1分子リアルタイムシークエンシング、電子顕微鏡ベースのシークエンシング、トランジスタを用いたシークエンシング、ダイレクトシークエンシング、ランダムショットガンシークエンシング、サンガージデオキシ末端シークエンシング、標的シークエンシング、エキソンシークエンシング、全ゲノムシークエンシング、ハイブリダイゼーション(例えば、マイクロアレイなどのアレイ)によるシークエンシング、パイロシークエンシング、キャピラリ電気泳動、ゲル電気泳動、二重鎖シークエンシング、サイクルシークエンシング、1塩基伸長シークエンシング、固相シークエンシング、ハイスループットシークエンシング、超並列シグネチャーシークエンシング、エマルションPCR、低変性温度の同時増幅PCR(COLD−PCR)、マルチプレックスPCR、可逆染色末端によるシークエンシング、ペアエンドシークエンシング、近接末端シークエンシング、エキソヌクレアーゼシークエンシング、ライゲーションによるシークエンシング、ショートリードシークエンシング、1分子シークエンシング、合成によるシークエンシング、リアルタイムシークエンシング、リバースターミネーターシークエンシング、イオン半導体シークエンシング、ナノボールシークエンシング、ナノポアシークエンシング、454シークエンシング、Solexa Genome Analyzerによるシークエンシング、miSeq(Illumina)、HiSeq 2000(Illumina)、HiSeq 2500(Illumina)、Illumina Genome Analyzer(Illumina)、Ion Torrent PGM(商標)(Life Technologies)、MinION(商標)(Oxford Nanopore Technologies)、リアルタイムSMRT(商標)技術(Pacific Biosciences)、Probe−Anchor Ligation(cPAL(商標))(Complete Genomics/BGI)、SOLiD(登録商標)シークエンシング、MS−PETシークエンシング、質量分析、及びこれらの組み合わせ。一部の実施形態では、シークエンシングは、装置(限定するわけではないが、例えば、ABI PRISM(登録商標)377 DNA Sequencer、ABI PRISM(登録商標)310、3100、3100−Avant、3730、もしくは、373OxI Genetic Analyzer、ABI PRISM(登録商標)3700 DNA Analyzer、または、Applied Biosystems SOLiD(商標)System(全てApplied Biosystems製)、Genome Sequencer 20 System(Roche Applied Science)、または、質量分析計)を用いて、シークエンシング産物を検出することを含む。特定の実施形態では、シークエンシングはエマルションPCRを含む。特定の実施形態では、シークエンシングは、ハイスループットシークエンシング技術、限定するわけではないが、例えば、超並列シグネチャーシークエンシング(MPSS)を含む。
本明細書に記載する方法及び装置においては、RO−MIP産物を定量するためにマイクロアレイ技術を代わりに採用してもよい。「マイクロアレイ」または「アレイ」とは、表面を有する固相支持体のことを意味し、その表面は、限定するわけではないが、好ましくは、平坦な表面、または実質的に平坦な表面であり、アレイのそれぞれの部位が、実質的に同一または同一のオリゴヌクレオチドまたはポリヌクレオチドの複製を含み、空間的に分けられ、アレイ上のその他構成要素の部位と重なり合わない(つまり、部位が空間的に分離している)ように、核酸を含む部位のアレイを備える。アレイまたはマイクロアレイは更に、ビーズまたはウェルなどの表面を有する、信号を送ることが可能な平坦ではない構造体を含んでいてもよい。アレイ上のオリゴヌクレオチドまたはポリヌクレオチドは、固相支持体と共有結合していてもよく、または、非共有結合していてもよい。通常のマイクロアレイ技術については、例えば、Schena,Ed.,「Microarrays:A Practical Approach」(IRL Press,Oxford(2000))で考察されている。「アレイ解析」、「アレイによる解析」、または、「マイクロアレイによる解析」とは、例えば、マイクロアレイを用いた1つまたは複数の生体分子の配列解析などの解析のことを意味する。一部の実施形態では、それぞれの試料は、個別に単一のマイクロアレイへとハイブリダイズされる。その他の実施形態では、複数のマイクロアレイを、簡便なハイスループット処理用の単一マルチマイクロアレイプレート上に物理的に接続させることにより、処理のスループットを向上させることができる。特定の実施形態では、とりわけRO−MIPアッセイの産物を定量するための、カスタムDNAマイクロアレイ(例えば、Affymetrix Inc.(Santa Clara,Calif.,USA)製)を作製することができる。
本明細書に記載する組成物及び方法が出願に適したように脚色または修正可能であること、本明細書に記載する組成物及び方法をその他の適切な用途に採用可能であること、及び、このようなその他の追加及び修正が本発明の範囲から逸脱しないということを、当業者は理解するであろう。
本開示は、以下に続く実験の詳細からより理解されよう。しかしながら、その後に続く実施形態でより完全に説明するように、記載する特定の方法及び結果は本開示を例示するに過ぎないということを、当業者は容易に理解するであろう。
疾患または状態を検出するための方法
現行のシークエンシング法は、有効な変動係数を得るのに数千万ものリードを必要とする面倒なシークエンシングライブラリ調製工程を採用しており、試料中における胎児由来の比率が4%未満に下がる場合、その有効性が失われることがある。非標的「ショットガン」法は、ヒト異数性に関連する染色体における適切な領域のカバレッジを得るのに、本質的に多数のリードを必要とする。標的法は、多数のPCR用プライマー操作、及び多重化を必要とする。ライブラリ調製において、反復領域のPCR増幅に1種類のプライマーペアを用いる方法では、生成配列に不明瞭さ(干渉)を生じさせるPCRアーティファクトの悪影響を受ける場合があり、特徴的なマッピングリードの比率、及び、全体効率が低下してしまう。
本開示の実施形態では、異数性を検出するための現行シークエンシング法が抱える課題に対する解決策を提供する。これらの実施形態では、従来のライブラリ調製法を、少数のオリゴヌクレオチドMIPを用いた捕捉方法に置き換えているが、そのMIPは、反復配列にハイブリダイズする標的ポリヌクレオチドアームを含み、そのアームは、高性能で一般的な主鎖構造に結合したアームである。これらのMIPは、ヒトゲノム全体にわたり固有にアラインした配列に隣接して一体化するように設計されているが、それら配列には、一般的な異数性(例えば、21、18、または、13番染色体のトリソミー)の検出に関連する標的が豊富に存在している。捕捉分子の選択について検討する方法では、定量化を行うために、適切な領域における固有配列を選択する必要性に言及しているが、増幅に好都合な反復配列においては、一部の固有配列の存在に依存することはない。
最適化した捕捉方法において反復配列(すなわち、「再犯者」)を用いることにより、ライブラリ調製中における1分子運動のバーコード化標的作製において、類似配列による干渉がほとんどまたは全くない状態での、標的領域の高密度配置が可能となる。1分子解析により、優れた定量化及び染色体カウントが可能となる。また代わりに、リード数をカウントしてもよい。しかし、1分子解析には偏りがないため、定量化にも影響を及ぼし難い。本明細書に記載の方法では、分子タグをカウントすることにより、オリジナルDNA試料中に比較的豊富に存在するそれぞれの配列について、より精度の高い状態を把握する。本開示は更に、従来の方法と比較して経済的にメリットのある方法を提供する。詳細には、本方法は、ゲノムワイドなインデックスをなおも検査可能な少量の捕捉用試薬(プライマー)を用いることにより、節約をもたらす。方法は更に、容易に多重化可能なアッセイを用いた、リード数の少ない迅速な解析を提供する。例えば、本方法では、固有分子タグ及び/または固有分子バーコードの複数の層を用いて、特定のプライマー種を同定することができ、またそれに加えて、多重化データを読み解いて個々の試料までシグナルを追跡することができる。更に、本方法を、100%胎児性試料(受胎産物など)または非胎児性診断用試料中のトリソミーを検出することなど、カバレッジが極端に低い用途に用いることができる。また、試料を混合してもよく(例えば、胎児対母体、または、疾患対非疾患)、または、混合しなくてもよい(例えば、異数性を有すると疑われる小児)。この場合、シグナルが強力であるため、「カバレッジ」または読み取り深度が非常に低い(例えば、20,000未満の読み取り深度)場合がある。方法はまた、全ゲノムシークエンシング、全エキソームシークエンシング、及び、超並列ショットガンシークエンシングと比較して、迅速である。
本開示の方法は、遺伝子解析分野に関する。一般に、これらの方法は、遺伝的機能の欠失及び重複を検出及び定量するための迅速かつ経済的な手法として利用可能である。その欠失及び重複は、完全な染色体及び染色体のアームから、微細欠失及び微細重複、極微細欠失及び極微細欠失、更には、一塩基多型、一塩基欠失、及び、一塩基挿入を含む一ヌクレオチド機能までの範囲を含む。特定の実施形態では、本開示の方法を用いて、サブ染色体の遺伝的損傷、例えば、微細欠失を検出することができる。本方法の例示的な応用としては、小児の異数性診断、受胎産物の検査または早期流産リスクの検査、非侵襲的出生前検査(定性的及び定量的両方の遺伝子検査、例えば、メンデル病、挿入/欠失、及び、染色体不均衡の検出など)、着床前遺伝子検査、腫瘍特性解析、細胞遺伝学を含む出生後検査、及び、突然変異原の影響のモニタリングが挙げられる。
本開示が提供する核酸分子(例えば、MIP)は更に、同一分子の一部ではない通常のPCR用プライマーペアと比較して、結合安定性が高いという利点を有している。特定の実施形態では、標的アーム配列の長さは、PCR用プライマーの長さと比較して、厳密にはやや短い。それゆえ、PCRに関して言えば、標的アーム配列の融解温度は非常に低くなる。しかしながら、MIP構成において、プライマーは、共同して相互作用を安定させることによりその結合特異性を高める。一方のアームの結合能が高い場合、反対側のアームの結合能が低かったとしても、捕捉性は向上する。ペアの長さを長くすることにより、捕捉における「オン/オフ」のバランスが向上する。その理由としては、MIP内において結合能の低いアームが、遊離PCRプライマーとしてよりも、その標的により近接する場合が多いためである。
本開示が提供する方法には、標的シークエンシングと比較して、いくつかの利点がある。特定の実施形態では、本明細書に記載の方法は、捕捉位置における2つの配列因子による同時認識を利用しているが、それら2つのアームの近接性には制限がある。対照的に、通常の標的シークエンシング法では、ポリメラーゼは、単一部位において反応を開始する。通常のシークエンシングを用いて生成したランオン産物は結合不能をもたらすが、更に、第2のプライマーとの内部のまたは「適切でないプライミング」をもたらし得る。本開示の核酸(例えば、RO−MIP)に固有の「デュアル認識」は、ストリンジェンシー(MIP構造体内の分子識別子因子による定量化にもたらされる影響)を高める。固有分子タグをMIP主鎖の片側部位に配置してもよいが、分子識別子を用いる標準的な標的シークエンシングでは、両方のプライマーにランダム配列を用いる。更に、本開示が提供する方法では、標的シークエンシングが必要とする数百または数千もの多重化PCR用プライマーと比較して、非常に少ないRO−MIPでゲノムワイドなカバレッジを得ることが可能であるため、試薬コストの削減が可能となっている。それでもなお、本開示の方法は、標的シークエンシングがショットガン法により示す経済上の利点及び性能上の利点のほとんど(全てではない)を有している。
本開示の方法及び核酸は、上記の遺伝学的方法と比較して、明らかな利点を提供する。例えば、全ゲノムシークエンシング及び超並列ショットガンシークエンシングは通常、大規模で情報を持たないゲノム部位に関するコストの高い解析を必要とするのに対し、本方法では、ゲノムの一部を用いて同様の解析結果を得ることが可能であるため、アッセイコストを抑えて時間を短縮させることができる。その他の手法は、情報を有するゲノム部位の選択的なアッセイに依存している。本開示における特定の態様は一定の類似性を共有しているが、本方法は、反復したプライマー結合部位を同定するための新規の包括的な手法を用いている。その手法は、優れたアッセイ設計パラメータ(配列の曖昧さ、限定するわけではないが、例えば、反復LINE因子)、より多くの候補プライマー(例えば、可能性のある全てのプライマーを数え上げるため)、臨床に十分有用なほど特異的で高感度なシンプルで低コストなアッセイ、及び、優れた多重化能力を可能とする。
本明細書に記載する方法及び核酸は、反復領域を含むゲノム全体にわたり目的の標的部位を同定するための別の方法(例えば、目的の標的部位(または目的の標的配列)の捕捉にプライマーを用いて染色体異数性を検出する方法)と比較して、明らかな利点を有している。特定の実施形態では、本開示の方法は、目的の標的部位(または目的の標的配列)を捕捉するのにMIPを用いる。特定の実施形態では、本明細書に記載する方法で生成したMIPレプリコン(またはアンプリコン)は、50〜120bps(例えば、50、55、60、65、70、75、80、85、90、95、100、105、110、もしくは、115bps、または50〜120bpsの間の任意のサイズ、または、50〜120bpsの間の任意のサイズ範囲)のサイズを有している。一部の実施形態では、MIPレプリコン(またはアンプリコン)は、80〜90bps、80〜100bps、80〜110bps、80〜120bps、70〜90bps、70〜100bps、70〜110bps、または、70〜120bpsのサイズを有している。一部の実施形態では、MIPレプリコン(またはアンプリコン)は、80〜90bpsのサイズを有している。プライマー捕捉法では、本明細書に記載する方法で生成するMIPレプリコン(またはアンプリコン)よりも長いレプリコン(またはアンプリコン)を生成する。血漿試料由来の環状DNAは多くの場合、断片化される。このようなDNAを鋳型として用いる場合、短いレプリコン(またはアンプリコン)は、長いものと比較して明らかな利点を提供する。その理由としては、短いレプリコン(またはアンプリコン)が、短い断片の捕捉可能性を高めるからである。アンプリコンが長い場合、短い断片が、このような長いアンプリコンの両方の結合部位を有する可能性はほとんどない。更に、周知のプライマー捕捉法における試料あたりの読み取り深度は、本明細書に記載の方法の読み取り深度よりも高い。これが、周知のプライマー捕捉法における1つの欠点である。特定の実施形態では、本明細書に記載の方法は、試料あたり20百万リード未満の、試料あたり19百万リード未満の、試料あたり18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、または、3百万リード未満の、試料あたり2百万リードを下回らない数の、試料あたり2〜20百万リードの任意の範囲、または、試料あたり3〜20百万リードの任意の範囲の、読み取り深度を提供する。一部の実施形態では、本明細書に記載の方法は、試料あたり6〜8百万リードの、例えば、試料あたり6、7、または、8百万リードの、読み取り深度を提供する。更に、プライマー捕捉法と比較した場合、本明細書に記載の方法は、ゲノムワイドでより多くの目的の部位(または目的の配列)を標的とし、及び/または、プライマー捕捉法よりも目的の染色体(例えば、21番染色体)上を標的とする。特定の実施形態では、本明細書に記載の方法は、ゲノム全体にわたる50k〜250kの範囲の(または、50k〜250kの間の任意の数または範囲の)、結合部位の総数を有する。一部の実施形態では、ゲノム全体にわたる結合部位の総数は、50k超、60k超、70k超、80k超、90k超、100k超、110k超、120k超、130k超、140k超、150k超、160k超、170k超、180k超、190k超、200k超、210k超、220k超、230k超、または、240k超である。一部の実施形態では、ゲノム全体にわたる結合部位の総数は、125k〜175kである。特定の実施形態では、本明細書に記載の方法は、目的の染色体(例えば、21番染色体)上に、500〜3000部位の範囲の(または、500〜3000部位の間の任意の数または範囲の)結合部位の総数を有している。一部の実施形態では、目的の染色体上における結合部位の総数は、500超の、600超の、700超の、800超の、900超の、1000超の、1100超の、1200超の、1300超の、1400超の、1500超の、1600超の、1700超の、1800超の、1900超の、2000超の、2100超の、2200超の、2300超の、2400超の、2500超の、2600超の、2700超の、2800超の、2900超の、または、3000超の部位である。一部の実施形態では、固有のアライメント率は、35%超、36%超、37%超、38%超、39%超、40%超、41%超、42%超、43%超、44%超、45%超、46%超、47%超、48%超、49%超、もしくは、50%超、または、それ以上である。本発明で使用する場合、用語「固有のアライメント率」とは、対象ゲノム(例えば、ヒトゲノム)上の1つの染色体位置に固有にアラインする、総シークエンシングリード数の比率のことを意味する。
特定の実施形態では、本明細書に記載の方法は、目的の標的部位(または目的の標的配列)を捕捉するのに、または、目的の標的部位(または目的の標的配列)と結合するのに、MIPではないプライマーペアを用いる。一部の実施形態では、MIPではないプライマーペアは、直線状または環状に調製される。本発明で使用する場合、用語「目的の標的配列」及び「目的の標的部位」は同じ意味で用いられ、プライマーペアがそれを捕捉または結合するように設計された、ゲノム核酸分子の一部のことを意味する。一部の実施形態では、1つまたは複数のプライマーペアは、ゲノム核酸試料中の目的とする特定の標的配列(または部位)の上流及び下流に直接ハイブリダイズするように設計されている。一部の実施形態では、1つまたは複数のプライマーペアは、ゲノム核酸試料中における1つまたは複数の目的の配列(または目的の部位)に対して相補的な配列を含む。
一部の実施形態では、本開示は、検出を必要とする個体または胎児において、異数性を検出するための方法、または、異数性がないことを検出するための方法を提供する。一部の実施形態では、本開示は、検出を必要とする個体または胎児において、異数性を検出するための方法、または、異数性がないことを検出するための方法を提供する。一部の実施形態では、本開示は、胎児の異数性を検出するための方法を提供し、以下の内容を含む。
a)母体血液試料から単離した核酸試料を得ることと、
b)分子反転プローブ(MIP)の1つまたは複数の集団を用いることにより、工程a)で得た核酸試料中における複数の目的の標的配列を捕捉して、複数のレプリコンを作製することと、
MIP集団内のMIPのそれぞれは、以下の構成要素、
第1の標的ポリヌクレオチドアーム、及び、第2の標的ポリヌクレオチドアームを、配列内に含み、
MIPのそれぞれにおける一対の第1及び第2の標的ポリヌクレオチドアームは、同一であり、第1の複数の目的の標的配列内におけるそれぞれの配列に隣接する、核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的であり、
c)目的の標的配列を増幅することと、
d)目的の標的配列をシークエンスすることと、
e)遺伝子座において、目的の標的配列をインシリコでゲノム配列にマッチさせることと、
f)個々の遺伝子座においてマッチするアンプリコンの数をカウントし、検査染色体上の遺伝子座にマッチするアンプリコンの数を、参照染色体上の遺伝子座にマッチするアンプリコンの数と比較すること。
一部の実施形態では、本開示は、胎児の異数性を検出するための方法を提供し、以下の内容を含む。
a)母体血液試料から単離した核酸試料を得ることと、
b)分子反転プローブ(MIP)の1つまたは複数の集団を用いることにより、工程a)で得た核酸試料中における複数の目的の標的配列を捕捉して、複数のレプリコンを作製することと、
MIP集団内のMIPのそれぞれは、以下の構成要素、
第1の標的ポリヌクレオチドアーム−第1の固有分子タグ−ポリヌクレオチドリンカー−第2の固有分子タグ−第2の標的ポリヌクレオチドアームを配列内に含み、
MIPのそれぞれにおける一対の第1及び第2の標的ポリヌクレオチドアームは、同一であり、複数の目的の標的配列内におけるそれぞれの配列に隣接する、核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的であり、
MIPのそれぞれにおける第1及び第2の固有標的分子タグの組み合わせは、MIPのそれぞれにおいて異なっており、
c)工程b)で得たレプリコンから増幅した複数のMIPアンプリコンをシークエンスすることと、
d)レプリコンを増幅したそれぞれのMIPにおける固有分子タグの数に基づいて、工程c)で得た複数のアンプリコンにおける第1のアンプリコン集団のそれぞれの捕捉現象の数を測定することと、第1のアンプリコン集団は、目的の標的配列のシークエンスにより同定され、
e)レプリコンを増幅したそれぞれのMIPにおける固有分子タグの数に基づいて、工程c)で得た複数のアンプリコンにおける第2のアンプリコン集団のそれぞれの捕捉現象の数を測定することと、第2のアンプリコン集団は、目的の標的配列のシークエンスにより同定され、
f)工程d)で測定したシークエンシングリードの数の少なくとも一部に基づいて、そこから第1のアンプリコン集団を作製した、それぞれの目的の標的配列の部位捕捉基準を決定することと、
g)少なくとも1つの判定基準を満たす、工程f)で決定した部位捕捉基準の第1のサブセットを同定することと、
h)工程e)で測定した捕捉現象の数の少なくとも一部に基づいて、そこから第2のアンプリコン集団を作製した、それぞれの目的の標的配列の部位捕捉基準を決定することと、
i)少なくとも1つの判定基準を満たす、工程h)で決定した部位捕捉基準の第2のサブセットを同定することと、
j)工程g)で同定した部位捕捉基準の第1のサブセットから求めた第1の指標を、工程i)で同定した部位捕捉基準の第2のサブセットから求めた第2の指標で正規化して、検査比率を得ることと、
k)検査比率を、正倍数性または異数性を示すことが既知である参照対象から単離した参照核酸試料に基づいて計算した、複数の参照比率と比較することと、
l)工程k)の比較に基づいて、異数性が胎児において検出されるかどうかを判定すること。あるいは、この方法を用いて、胎児ではない対象内における異数性を検出することも可能である。特定の実施形態では、異数性の検出に代えて、本開示の方法を用いて、染色体のアーム内における遺伝的機能の欠失及び重複に加えて、微細欠失及び微細重複、極微細欠失及び極微細欠失、及び、一塩基多型、一塩基欠失、及び、一塩基挿入を含む一ヌクレオチド機能を検出及び定量することができる。
特定の実施形態では、本開示の方法を、DNAまたはRNAなどの核酸試料、例えば、ゲノムDNAに対して実施することができる。当業者に周知の任意の方法(例えば、遠心分離)を用いて、核酸試料を単離してもよい。当業者は、対象が任意のヒトであり得るということを理解するであろう。正倍数性、異数性、または、疾患もしくは状態が胎児において検出された場合、その対象は妊娠している女性である。
一部の実施形態において、本開示の方法では、1種類のMIPを用いる。別の実施形態では、方法は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、または、それ以上の種類のMIPを用いる。例えば、複数種のMIPを用いて、単一試料から異なる疾患または状態(例えば、異数性などの染色体異常)を検出することができる。特定の実施形態では、1種類のMIPを用いて、単一試料から異なる疾患または状態(例えば、異数性などの染色体異常)を検出することができる。
当業者は、標的ポリヌクレオチドアームと核酸試料との間の効率的なハイブリダイゼーションを提供するために、第1及び第2の標的ポリヌクレオチドアームの長さが必要に応じて様々であることを理解するであろう。例えば、第1及び/または第2の標的ポリヌクレオチドアームは、14〜30塩基対、例えば、18〜21塩基対であってもよい。特定の実施形態では、第1及び/または第2の標的ポリヌクレオチドアームの長さは、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、もしくは、30塩基対、または、14〜30塩基対の任意の範囲である。特定の実施形態では、標的ポリヌクレオチドアームは、45℃〜80℃(例えば、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、もしくは、80℃、または、45℃〜80℃の任意の範囲)の融解温度(T)、及び/または、30%〜80%(例えば、約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、もしくは、80%、または、30%〜80%の任意の範囲)のGC含有量を有する。特定の実施形態では、標的ポリヌクレオチドアームは、45℃〜80℃(例えば、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、もしくは、80℃、または、45℃〜80℃の任意の範囲)の融解温度(T)、及び/または、30%〜70%(例えば、約30%、35%、40%、45%、50%、55%、60%、65%、もしくは、70%、または、30%〜70%の任意の範囲)のGC含有量を有する。特定の実施形態では、標的ポリヌクレオチドアームは、60℃〜70℃のT、及び/または、30%〜70%のGC含有量を有する。特定の実施形態では、標的ポリヌクレオチドアームは、以下、1)14〜30のヌクレオチド長、2)45℃〜80℃のT、及び、3)30%〜70%のGC含有量、のうち少なくとも1つまたは複数を有する。特定の実施形態では、標的ポリヌクレオチドアームは、捕捉後の増幅のために、同一の主鎖配列(すなわち、同一のポリヌクレオチドリンカー)を有する。一部の実施形態では、第1の標的ポリヌクレオチドアームの配列は、CACTGCACTCCAGCCTGGである。一部の実施形態では、第2の標的ポリヌクレオチドアームの配列は、GAGGCTGAGGCAGGAGAAである。一部の実施形態では、標的ポリヌクレオチドアームは、例えば、1,000超の、10,000超の、20,000超の、30,000超の、40,000超の、50,000超の、60,000超の、70,000超の、80,000超の、90,000超の、100,000超の、200,000超の、300,000超の、400,000超の、500,000超の、600,000超の、700,000超の、800,000超の、900,000超の、及び/または、1,000,000超の、目的の配列(または目的の部位)を標的とする。一部の実施形態では、目的の標的配列(または目的の部位)は、50〜150bp(例えば、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、もしくは、150bp、または、50〜150bpの任意の範囲)のサイズを有する。一部の実施形態では、RO−MIPは、ゲノム中の長鎖散在反復配列(LINE)とは結合しない。
特定の実施形態では、本明細書に記載するMIPは、ゲノム中の複数のAlu因子を捕捉、または、ゲノム中の複数のAlu因子と結合する。Alu因子は、ヒト対象内に存在する最も豊富な転移因子であり、ゲノム全体に分散した1百万超の複製を有している。Alu因子は反復配列であり、約300塩基対の長さを有している(図9を参照されたい)。一部の実施形態では、MIPは、Alu因子のライトアームを捕捉、または、Alu因子のライトアームと結合する。一部の実施形態では、MIPは、Alu因子のレフトアームを捕捉、または、Alu因子のレフトアームと結合する。一部の実施形態では、MIPは、Alu因子のライトアーム上の、31ntの挿入領域を捕捉、または、31ntの挿入領域と結合する(図9を参照のこと)。
固有分子タグは、任意のアンプリコンにおける捕捉現象の数を測定するための方法を提供する。MIPは、1つまたは複数の固有分子タグ、例えば、1、2、3、4、または、5つの固有分子タグを含んでいてもよい。特定の実施形態では、第1及び/または第2の固有分子タグの長さは、4〜15塩基対、例えば、4、5、6、7、8、9、10、11、12、13、14、または、15塩基対である。特定の実施形態では、固有分子タグのそれぞれは、45℃〜80℃の融解温度(例えば、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、または、65℃)、及び/または、30%〜80%(例えば、約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、もしくは、80%、または、30%〜80%の任意の範囲、例えば、30%〜70%)のGC含有量を有する。
ポリヌクレオチドリンカーは、2つの標的ポリヌクレオチドアーム間のギャップを埋める。一部の実施形態では、ポリヌクレオチドリンカーは、第1の固有分子タグと第2の固有分子タグとの間に直に位置している。特定の実施形態では、ポリヌクレオチドリンカーは、対象における任意のゲノム領域に対して実質的に相補的ではない。特定の実施形態では、ポリヌクレオチドリンカーは、20〜1,000塩基対(例えば、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または、40塩基対)の長さ、及び/または、45℃〜80℃(例えば、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、または、65℃)の融解温度、及び/または、30%〜80%(例えば、約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、もしくは、80%、または、30%〜80%の任意の範囲、例えば、30%〜70%)のGC含有量を有する。特定の実施形態では、ポリヌクレオチドリンカーは、少なくとも1種の増幅用プライマー、例えば、増幅用フォワードプライマー及び増幅用リバースプライマーを含む。例えば、増幅用フォワードプライマーの配列は、5´−CTTCAGCTTCCCGATTACGG−3´(配列番号:1)のヌクレオチド配列を含んでいてもよく、及び/または、増幅用リバースプライマーの配列は、5´−GCACGATCCGACGGTAGTGT−3´(配列番号:2)のヌクレオチド配列を含んでいてもよい。したがって、ポリヌクレオチドリンカーのヌクレオチド配列は、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)のヌクレオチド配列を含んでいてもよい。
特定の実施形態では、MIPは、5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:6)のヌクレオチド配列を含み、式中、(N1−6)は第1の固有分子タグを表し、また(N7−12)は第2の固有分子タグを表す。
特定の実施形態では、本明細書の本開示は、5´−A−(N)x−B−(N)y−C−3´のヌクレオチド配列を含む核酸分子を提供し、式中、(N)xは第1の固有分子タグを表し、(N)yは第2の固有分子タグを表し、式中、X及びYは4〜15塩基対であり、式中、Aは、i)5´−TGCACTCCAGCCTG−3´(配列番号:15)の配列、または、5´−TGCACTCCAGCCTG−3´(配列番号:15)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有し、式中、Cは、i)5´−GAGGCTGAGGCAGGA−3´(配列番号:16)の配列、または、5´−GAGGCTGAGGCAGGA−3´(配列番号:16)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有する。一部の実施形態では、Aは、i)5´−TGCACTCCAGCCTG−3´(配列番号:15)の配列に少なくとも90%、または、95%類似した配列を含み、ii)30塩基対以下の長さを有する。一部の実施形態では、Cは、i)5´−GAGGCTGAGGCAGGA−3´(配列番号:16)の配列に少なくとも90%、または、95%類似した配列を含み、ii)30塩基対以下の長さを有する。一部の実施形態では、Bは、i)5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)の配列、または、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)の配列に少なくとも85%(または90%もしくは95%)類似した配列を含む。一部の実施形態では、AまたはCは、45℃〜80℃の融解温度を有する。一部の実施形態では、AまたはCは、30%〜80%の、または、30%〜70%のGC含有量を有する。
特定の実施形態では、本明細書の本開示は、5´−A−(N)x−B−(N)y−C−3´のヌクレオチド配列を含む核酸分子を提供し、式中、(N)xは第1の固有分子タグを表し、(N)yは第2の固有分子タグを表し、式中、X及びYは4〜15塩基対であり、式中、Aは、i)5´−TCCTGCCTCAGCCTC−3´(配列番号:17)の配列、または、5´−TCCTGCCTCAGCCTC−3´(配列番号:17)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有し、式中、Cは、i)5´−AGGCTGGAGTGC−3´(配列番号:18)の配列、または、5´−AGGCTGGAGTGC−3´(配列番号:18)の配列に少なくとも85%類似した配列を含み、ii)30塩基対以下の長さを有する。一部の実施形態では、Aは、i)5´−TCCTGCCTCAGCCTC−3´(配列番号:17)の配列に少なくとも90%、または、95%類似した配列を含み、ii)30塩基対以下の長さを有する。一部の実施形態では、Cは、i)5´−AGGCTGGAGTGC−3´(配列番号:18)の配列に少なくとも90%、または、95%類似した配列を含み、ii)30塩基対以下の長さを有する。一部の実施形態では、Bは、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)の配列、または、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)の配列に少なくとも85%(または90%もしくは95%)類似した配列を含む。一部の実施形態では、AまたはCは、45℃〜80℃の融解温度を有する。一部の実施形態では、AまたはCは、30%〜80%の、または、30%〜70%のGC含有量を有する。
一部の実施形態では、記載した方法に用いたMIPは以下のとおりであり、A、B、C、D、E、F、G、及び、Hに対応する数値は、表1及び表2に関連させて記載しており、スコアに対応する数値は、式9に関連させて記載している。
Figure 0006830094
Figure 0006830094
一部の実施形態では、本開示の方法に用いるMIP集団は、10fM〜100nMの濃度、例えば、0.5nMの濃度を有している。特定の実施形態では、本開示の方法に用いるMIPの濃度は標的にする配列の数と共に変化し、その数は、例えば、反応液中における目的の標的配列の数にゲノム当量の数を掛けることにより算出される(「総標的数」)。特定の実施形態では、MIP分子数と総標的数とのおおよその比率は、1:50、1:100、1:150、1:200、1:250、1:300、1:350、1:400、1:450、1:500、1:550、1:600、1:650、1:700、1:750、1:800、1:850、1:900、1:950、または、1:1,000である。特定の実施形態では、MIPレプリコン及び/またはMIPアンプリコンのそれぞれは、一本鎖環状核酸分子である。
一部の実施形態では、i)第1及び第2の標的ポリヌクレオチドアームをそれぞれ、核酸試料中の対応する第1及び第2の領域にそれぞれハイブリダイズすること(第1及び第2の領域は目的の標的配列に隣接する)、及び、ii)ハイブリダイゼーション後、ライゲーション/伸長用混合液を用いて、2つの標的ポリヌクレオチドアーム間に存在するギャップ領域を伸長及びライゲートし一本鎖環状核酸分子を作製すること、により、MIPレプリコンを作製する。特定の実施形態では、例えば、PCRを用いて、MIPレプリコンを増幅することにより、MIPアンプリコンを作製する。
一部の実施形態では、シークエンシング工程は、次世代シークエンシング法、例えば、超並列シークエンシング法またはショートリードシークエンシング法を含む。一部の実施形態では、シークエンシングは、当該技術分野において周知の任意の方法、例えば、標的シークエンシング、1分子リアルタイムシークエンシング、電子顕微鏡ベースのシークエンシング、トランジスタを用いたシークエンシング、ダイレクトシークエンシング、ランダムショットガンシークエンシング、サンガージデオキシ末端シークエンシング、標的シークエンシング、エキソンシークエンシング、全ゲノムシークエンシング、ハイブリダイゼーションによるシークエンシング、パイロシークエンシング、キャピラリ電気泳動、ゲル電気泳動、二重鎖シークエンシング、サイクルシークエンシング、1塩基伸長シークエンシング、固相シークエンシング、ハイスループットシークエンシング、超並列シグネチャーシークエンシング、エマルションPCR、低変性温度の同時増幅PCR(COLD−PCR)、マルチプレックスPCR、可逆染色末端によるシークエンシング、ペアエンドシークエンシング、近接末端シークエンシング、エキソヌクレアーゼシークエンシング、ライゲーションによるシークエンシング、ショートリードシークエンシング、1分子シークエンシング、合成によるシークエンシング、リアルタイムシークエンシング、リバースターミネーターシークエンシング、ナノポアシークエンシング、454シークエンシング、Solexa Genome Analyzerによるシークエンシング、SOLiD(登録商標)シークエンシング、MS−PETシークエンシング、質量分析、及びこれらの組み合わせにより行われてもよい。一部の実施形態では、シークエンシングは、装置(限定するわけではないが、例えば、ABI PRISM(登録商標)377 DNA Sequencer、ABI PRISM(登録商標)310、3100、3100−Avant、3730、もしくは、373OxI Genetic Analyzer、ABI PRISM(登録商標)3700 DNA Analyzer、または、Applied Biosystems SOLiD(商標)System(全てApplied Biosystems製)、Genome Sequencer 20 System(Roche Applied Science)、または、質量分析計)を用いて、シークエンシング産物を検出することを含む。特定の実施形態では、シークエンシングはエマルションPCRを含む。特定の実施形態では、シークエンシングは、ハイスループットシークエンシング技術、限定するわけではないが、例えば、超並列シグネチャーシークエンシング(MPSS)を含む。
本開示の方法において使用可能なシークエンシング技術としては、例えば、Illuminaシークエンシングが挙げられる。Illuminaシークエンシングは、フォールドバックPCR及びアンカープライマーを用いた固体表面上でのDNA増幅に基づいている。ゲノムDNAを断片化し、その断片の5´末端及び3´末端にアダプターを付加する。フローセルチャネル表面上に結合させたDNA断片を、伸長及びブリッジ増幅させる。断片を二本鎖にし、その二本鎖分子を変性させる。複数サイクルの固相増幅に続いて変性を行うことにより、それぞれのフローセルチャネル内に、同一鋳型から複製した約1,000個の一本鎖DNA分子からなる数百万ものクラスターを形成することができる。プライマー、DNAポリメラーゼ、及び、4色蛍光標識した可逆ターミネーターヌクレオチドを用いて、連続シークエンシングを行う。ヌクレオチドに組み込んだ後、レーザーを用いて蛍光体を励起させてから画像をキャプチャし、第1の塩基の識別を記録する。3´末端及び蛍光体をそれぞれの組み込み塩基から除去し、組み込み、検出、及び、同定からなる工程を繰り返す。この技術に従ったシークエンシング法は、米国特許第7,960,120号、米国特許第7,835,871号、米国特許第7,232,656号、米国特許第7,598,035号、米国特許第6,911,345号、米国特許第6,833,246号、米国特許第6,828,100号、米国特許第6,306,597号、米国特許第6,210,891号、米国特許公開第2011/0009278号、米国特許公開第2007/0114362号、米国特許公開第2006/0292611号、及び、米国特許公開第2006/0024681号に記載されている(それぞれの開示内容全体は、参照として本明細書に組み込まれる)。
一部の実施形態では、本開示の方法は、シークエンシング(例えば、上記のシークエンシング工程d))前にPCR反応を行い、シークエンシングのためのMIPアンプリコンを増幅することを含む。このPCR反応は、インデックスPCR反応であってもよい。特定の実施形態において、インデックスPCR反応では、以下の構成要素、一対のインデックスプライマー、固有試料バーコード、及び、一対のシークエンシングアダプターを、MIPアンプリコンのそれぞれに導入する。特定の実施形態では、バーコード化標的MIPアンプリコンは、以下の構成要素、第1のシークエンシングアダプター−第1のシークエンシングプライマー−第1の固有標的分子タグ−第1の標的ポリヌクレオチドアーム−捕捉核酸−第2の標的ポリヌクレオチドアーム−第2の固有標的分子タグ−固有試料バーコード−第2のシークエンシングプライマー−第2のシークエンシングアダプターを、配列内に含む。
一部の実施形態では、第1の複数の目的の標的配列は、単一染色体上に存在する。一部の実施形態では、第2の複数の目的の標的配列は、複数の染色体上に存在する。単一MIP配列を用いてゲノム全体にわたる目的の配列を標的とすることが可能であるため、特定の実施形態では、本開示の方法は、2つ以上の染色体上の異数性を一度に検出可能であるという利点を提供する。例えば、第1の複数の標的配列を21番染色体上の配列と定義してもよく、第2の複数の標的配列を残りの染色体上の配列と定義してもよい。しかしながら、同一反応を用いて、第1の複数の標的配列を13番染色体上の配列と定義してもよく、第2の複数の標的配列を残りの染色体上の配列と定義してもよい。それゆえ、同一反応から得たシークエンシングデータを用いて、ダウン症候群(21トリソミー)及びパトー症候群(13トリソミー)の両方を検出することができる。同様に、MIPを設計して、またデータを解析して、異数性、または、他の種類の染色体異常もしくはサブ染色体異常に関連する、1、2、3、4、5、6、7、8、9、10、またはそれ以上の状態を検出することも可能である。
一部の実施形態では、本開示は、胎児の異数性を検出するための方法を提供し、以下の内容を含む。
a)母体血液試料由来のゲノムDNA試料を得ることと、
b)ゲノムDNA試料を、マルチウェルプレートのそれぞれのウェルへと加えることと、マルチウェルプレートのそれぞれのウェルはプローブ混合液を含み、プローブ混合液は分子反転プローブ(MIP)集団及び緩衝液を含み、
MIP集団内のそれぞれのMIPは、以下の構成要素、
第1の標的ポリヌクレオチドアーム−第1の固有分子タグ−ポリヌクレオチドリンカー−第2の固有分子タグ−第2の標的ポリヌクレオチドアームを配列内に含み、
MIPのそれぞれにおける一対の第1及び第2の標的ポリヌクレオチドアームは、同一であり、複数の目的の標的配列内におけるそれぞれの配列に隣接する、核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的であり、
MIPのそれぞれにおける第1及び第2の固有標的分子タグの組み合わせは、MIPのそれぞれにおいて異なっており、
c)MIPのプローブ混合液を含むゲノムDNA試料をインキュベートして、複数の目的の標的配列を捕捉することと、
d)伸長/ライゲーション用混合液を、MIP及び複数の目的の標的配列を含むc)の試料へと加えて、複数のMIPアンプリコンを作製することと、伸長/ライゲーション用混合液は、ポリメラーゼ、複数のdNTP、リガーゼ、及び、緩衝液を含み、
e)エキソヌクレアーゼ混合液を、標的及び対照MIPアンプリコンへと加えて、過剰プローブまたは過剰ゲノムDNAを除去することと、
f)インデックスPCR用混合液をe)の試料へと加えて、一対のインデックスプライマー、固有試料バーコード、及び、一対のシークエンシングアダプターを、複数のアンプリコンへと加えることと、
g)超並列シークエンシング法を用いて、固有標的分子タグの数に基づいて、工程f)で提供したバーコード化アンプリコンの第1の集団におけるシークエンシングリードの数を測定することと、バーコード化アンプリコンの第1の集団は、目的の標的配列のシークエンスにより同定され、
h)超並列シークエンシング法を用いて、固有標的分子タグの数に基づいて、工程f)で提供したバーコード化アンプリコンの第2の集団におけるシークエンシングリードの数を測定することと、バーコード化アンプリコンの第2の集団は、目的の標的配列のシークエンスにより同定され、
i)工程g)で測定した第1のシークエンシングリードの数の少なくとも一部に基づいて、部位捕捉基準を計算し、工程h)で測定した第2のシークエンシングリードの数の少なくとも一部に基づいて、複数の対照プローブ捕捉基準を計算することと、
j)少なくとも1つの判定基準を満たす対照プローブ捕捉基準を有するMIPアンプリコンの集団における部位捕捉基準のサブセットを同定することと、
k)部位捕捉基準を、少なくとも1つの判定基準を満たす対照プローブ捕捉基準のサブセットから計算した係数で正規化して、検査正規化部位捕捉基準を得ることと、
l)工程b)〜工程h)における同一の標的部位及び対照部位、標的集団、対照集団のサブセットを用いて、検査正規化部位捕捉基準を、既知の遺伝子型を示す参照対象から得た参照ゲノムDNA試料に基づいて計算した複数の参照正規化部位捕捉基準と比較することと、
m)工程l)の比較、及び、参照対象の既知の遺伝子型に基づいて、異数性が胎児において検出されるかどうかを判定すること。
一部の実施形態では、本開示は、対象内の異数性を検出するのに用いる分子反転プローブ(MIP)を、複数の候補MIPから選択するための方法を提供し、方法は、以下の内容を含む。
a)複数の候補MIPの核酸配列を受信することと、
b)複数の候補MIP中のそれぞれの対応するMIPについて、
i)対応するMIPにより捕捉されると予測される、目的の染色体上におけるミスマッチのない固有部位の第1の数(A)を計算することと、
ii)対応するMIPにより捕捉されると予測される、目的の染色体上におけるミスマッチが1つある固有部位の第2の数(C)を計算することと、
iii)対応するMIPにより捕捉されると予測される、ゲノムの全体にわたるミスマッチのない固有部位の第3の数(E)を計算することと、
iv)対応するMIPにより捕捉されると予測される、ゲノムの全体にわたるミスマッチが1つある固有部位の第4の数(G)を計算することと、
v)対応するMIPにより捕捉されると予測される、ゲノムの全体にわたるミスマッチのない非固有部位の第5の数(F)を計算することと、
vi)対応するMIPにより捕捉されると予測される、ゲノムの全体にわたるミスマッチが1つある非固有部位の第6の数(H)を計算することと、
vii)第1の、第2の、第3の、第4の、第5の、及び、第6の数の少なくとも一部に基づいて、対応するMIPの性能測定基準を計算することと、
c)工程b)vii)で複数の候補MIP中のそれぞれのMIPについて計算した性能測定基準の少なくとも一部に基づいて、MIPを選択すること。
特定の実施形態では、工程c)のMIPは、第1の数(A)と第5の数(F)との第1の比率が候補MIPの残りの集合の当量比よりも大きくなるように選択される。特定の実施形態では、工程c)のMIPは、第1の数(A)と第3の数(E)との第2の比率が候補MIPの残りの集合の当量比よりも大きくなるように選択される。特定の実施形態では、工程c)のMIPは、第1の数(A)と第2の数(C)との第3の比率が候補MIPの残りの集合の当量比よりも大きくなるように選択される。特定の実施形態では、工程c)のMIPは、第1の数(A)及び第2の数(C)の第1の合計と、第3の、第4の、第5の、及び、第6の数(E、F、G、H)の第2の合計との第4の比率が、候補MIPの残りの集合の当量比よりも大きくなるように選択される。特定の実施形態では、工程c)のMIPは、第1の数(A)及び第2の数(C)の第1の加重和と、第3の、第4の、第5の、及び、第6の数(E、F、G、H)の第2の加重和との第5の比率が、候補MIPの残りの集合の当量比よりも大きくなるように選択される。特定の実施形態では、第1の加重和と第2の加重和との第5の比率(P1)は、
Figure 0006830094
で表される。特定の実施形態では、工程c)のMIPは、第1の数(A)と第2の数(C)との第3の加重和が、候補MIPの残りの集合の当量の加重和よりも大きくなるように選択される。特定の実施形態では、第3の加重和は、
Figure 0006830094
で表される。特定の実施形態では、工程c)のMIPは、第5の比率(P1)と第3の加重和(P2)の積が、候補MIPの残りの集合の当量積よりも大きくなるように選択される。特定の実施形態では、性能測定基準は、目的の染色体由来の有効リード総数に基づいて計算される。特定の実施形態では、工程c)のMIPは、ミスマッチが1つの部位(K)の平均捕捉係数と、ミスマッチが0の部位(K)の平均捕捉係数との比率(K)、
Figure 0006830094
に基づいて選択される。特定の実施形態では、比率(K)は、実験により概算する。特定の実施形態では、工程c)のMIPは、
Figure 0006830094
として定義される、総分子タグカウント(TMTC)に基づいて選択される。
一部の実施形態では、本開示は更に、5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:6)のヌクレオチド配列を含み、式中、(N1−6)は第1の固有分子タグを表し、(N7−12)は第2の固有分子タグを表す、核酸分子を提供する。特定の実施形態では、第1の固有分子タグの長さは4〜15塩基対である。特定の実施形態では、第2の固有分子タグの長さは4〜15塩基対である。特定の実施形態では、固有標的分子タグのそれぞれは、45℃〜80℃の融解温度を有する。特定の実施形態では、固有標的分子タグのそれぞれは、30%〜80%の、または、30%〜70%のGC含有量を有する。本開示は更に、本明細書に記載する核酸分子のいずれかを含む組成物を提供する。
MIPの同定方法
図1は、本明細書に記載するプロセス(プロセス200、プロセス300、及び、プロセス500を含む)のいずれかを実行するためのコンピュータデバイス100のブロック図である。本発明で使用する場合、用語「プロセッサ」または「コンピュータデバイス」とは、本明細書に記載のコンピュータ技術の1つまたは複数を実行するように構成された、1つまたは複数のコンピュータ、マイクロプロセッサ、論理回路、サーバ、または、ハードウェア、ファームウェア、及び、ソフトウェアを備えたその他のデバイスのことを意味する。プロセッサ及び処理デバイスは更に、入力、出力、及び、処理中データを格納するための、1つまたは複数のメモリデバイスを含んでいてもよい。コンピュータデバイス100としては、1つまたは複数の入力デバイス(例えば、キーパッド、タッチスクリーン、トラックボール、音声認識システムなど)、及び/または、1つまたは複数の出力デバイス(例えば、表示装置、スピーカー、触感ディスプレイ、印刷装置など)の任意の適切な組み合わせが挙げられるがこれらに限定されない、「ユーザインターフェース」を挙げてもよい。コンピュータデバイス100としては、本明細書に記載のコンピュータ技術の1つまたは複数を実行するように構成された、1つまたは複数のハードウェア、ファームウェア、及び、ソフトウェアの任意の適切な組み合わせを挙げてもよいが、これらに限定されない。本明細書に記載する構成部材のそれぞれは、1つまたは複数のコンピュータデバイス100上に実装されてもよい。特定の態様では、これらシステムにおける複数の構成部材は、1つのコンピュータデバイス100内に含まれていてもよい。特定の実施形態では、構成部材及び格納デバイスは、いくつかのコンピュータデバイス100にわたり実装されていてもよい。
コンピュータデバイス100は、少なくとも1つの通信インターフェースユニット108、入力/出力制御装置110、システムメモリ、及び、1つまたは複数のデータ格納デバイスを備える。システムメモリは、少なくとも1つのランダムアクセスメモリ(RAM102)、及び、少なくとも1つの読み取り専用メモリ(ROM104)を含む。これら部材の全ては、コンピュータデバイス100の演算を円滑化するために、中央演算処理装置(CPU106)と通信する。コンピュータデバイス100は、多くの異なる様式で構成されていてもよい。例えば、コンピュータデバイス100は通常のスタンドアロンコンピュータであってもよく、あるいは、コンピュータデバイス100の機能は、多数のコンピュータシステム及びコンピュータアーキテクチャにわたり分散していてもよい。図1において、コンピュータデバイス100は、ネットワークまたはローカルネットワークを介して、その他のサーバまたはシステムと接続している。
コンピュータデバイス100は分散アーキテクチャで構成されていてもよく、その場合、データベース及びプロセッサは別々のユニットまたは場所に収容される。一部のユニットは、主要な処理機能を実行し、また、最低限の全体制御装置またはプロセッサ、及び、システムメモリを含む。分散アーキテクチャの実施形態では、これらユニットのそれぞれは、通信インターフェースユニット108を介して、その他のサーバ、クライアントコンピュータまたはユーザコンピュータ、及び、その他関連装置との主要な通信リンクとして機能する、通信ハブまたは通信ポート(図示せず)と接続していてもよい。通信ハブまたは通信ポートはそれ自体、主に通信ルータとして機能する、最小限の処理能力を有していてもよい。様々な通信プロトコルがシステムの一部であってもよく、それら通信プロトコルとしては、イーサネット(商標)、SAP、SAS(商標)、ATP、BLUETOOTH(商標)、GSM(商標)、及び、TCP/IPが挙げられるが、これらに限定されない。
CPU106は、CPU106からのワークロードを転送するためのプロセッサ、例えば、1つまたは複数の通常のマイクロプロセッサ、及び、1つまたは複数の補助的なコプロセッサ(例えば、数値演算コプロセッサ)を含む。CPU106は、通信インターフェースユニット108及び入力/出力制御装置110と通信し、それを介して、CPU106は、その他のデバイス、例えば、その他のサーバ、ユーザ端末、または、デバイスと通信する。通信インターフェースユニット108及び入力/出力制御装置110は、例えば、その他のプロセッサ、サーバ、または、クライアント端末と同時に通信するための、複数の通信チャネルを含んでいてもよい。
CPU106は更に、データ格納デバイスと通信する。データ格納デバイスは、磁気メモリ、光学メモリ、または、半導体メモリの適切な組み合わせを含んでいてもよく、例えば、RAM102、ROM104、フラッシュドライブ、光ディスク(例えば、コンパクトディスク)、または、ハードディスクもしくはハードドライブを挙げてもよい。CPU106及びデータ格納デバイスはそれぞれ、例えば、単一コンピュータまたはその他のコンピュータデバイス内に完全に収容されていてもよく、あるいは、USBポート、シリアルポートケーブル、同軸ケーブル、イーサネットケーブル、電話線、無線周波数トランシーバー、もしくは、その他の類似無線メディアもしくは有線メディア、または、上記の組み合わせなどの通信メディアにより、互いに接続していてもよい。例えば、CPU106は、通信インターフェースユニット108を介して、データ格納デバイスと接続していてもよい。CPU106は、1つまたは複数の特定の処理機能を実行するように構成されていてもよい。
データ格納デバイスは、例えば、(i)コンピュータデバイス100のオペレーティングシステム112、(ii)本明細書に記載するシステム及び方法に従い、とりわけCPU106に関し詳細に記載するプロセスに従い、CPU106に命令するように構成された、1つまたは複数のアプリケーション114(例えば、コンピュータプログラムコードまたはコンピュータプログラムプロダクト)、または、(iii)プログラムが必要とする情報を格納するのに利用可能な情報を格納するように構成された、データベース(複数可)116、を格納してもよい。
オペレーティングシステム112及びアプリケーション114は、例えば、圧縮形式、アンコンパイル形式、及び、暗号化形式で格納されていてもよく、コンピュータプログラムコードを含んでいてもよい。プログラムの命令は、データ格納デバイス以外のコンピュータ可読媒体から、例えば、ROM104またはRAM102から、プロセッサのメインメモリへと読み込まれてもよい。プログラム内の命令シーケンスを実行することにより、CPU106に本明細書に記載のプロセス工程を実行させるのだが、本開示のプロセスの実施形態において、ソフトウェア命令の代わりに、または、ソフトウェア命令と組み合わせて、配線回路を用いてもよい。したがって、記載するシステム及び方法は、ハードウェア及びソフトウェアの特定の組み合わせに何ら限定されない。
適切なコンピュータプログラムコードは、本明細書に記載する1つまたは複数の機能を実行するために提供されてもよい。プログラムは更に、オペレーティングシステム112、データベース管理システム、及び、入力/出力制御装置110を介して、プロセッサに、コンピュータの周辺機器(例えば、ビデオディスプレイ、キーボード、コンピュータマウスなど)とインターフェースさせる「デバイスドライバ」、などのプログラム要素を含んでいてもよい。
本発明で使用する場合、用語「コンピュータ可読媒体」とは、コンピュータデバイス100のプロセッサ(または、本明細書に記載するデバイスの任意のその他プロセッサ)へと実行のための命令を提供するか、または、命令の提供に関与する、任意の非一過性媒体のことを意味する。このような媒体は多くの形態をとってもよく、例えば、非揮発性媒体及び揮発性媒体が挙げられるが、これらに限定されない。非揮発性媒体としては、例えば、光学ディスク、磁気ディスク、もしくは、光学磁気ディスク、または、集積回路メモリ(フラッシュメモリなど)が挙げられる。揮発性媒体としては、ダイナミックランダムアクセスメモリ(DRAM)が挙げられ、それは通常、メインメモリを構成する。コンピュータ可読媒体の一般的な形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意のその他磁気媒体、CD−ROM、DVD、任意のその他光学媒体、パンチカード、紙テープ、せん孔パターンを備えた任意のその他物理媒体、RAM、PROM、EPROMもしくはEEPROM(電気的に消去可能なプログラマブル読み取り専用メモリ)、FLASH−EEPROM、任意のその他メモリチップもしくはメモリカートリッジ、または、そこからコンピュータが読み取り可能な任意のその他非一過性媒体が挙げられる。
コンピュータ可読媒体の様々な形態は、実行のための1つまたは複数の命令の1つまたは複数のシーケンスを、CPU106(または、本明細書に記載のデバイスにおける任意のその他プロセッサ)へと伝えることに関与してもよい。例えば、命令は、最初にリモートコンピュータ(図示せず)の磁気ディスク上に伝えられてもよい。リモートコンピュータは、命令をそのダイナミックメモリへとロードすることが可能であり、また、モデムを用いて、イーサネット接続、ケーブル線、または更に、電話線を介して、その命令を送信することも可能である。コンピュータデバイス100にローカル接続された通信デバイス(例えば、サーバ)は、対応する通信回線上でデータを受信し、そのデータを、プロセッサのシステムバス上に配置することが可能である。システムバスはデータをメインメモリへと伝える(プロセッサは、そのメインメモリから命令を取り出して実行する)。メインメモリが受信した命令を、任意選択的に、プロセッサにより実行される前または後のいずれかにて、メモリ内に格納してもよい。加えて、命令を、通信ポートを介して、電気信号、電磁信号、または、光信号として受信してもよく、それらは、様々な種類の情報を伝える無線通信またはデータストリームの例示的な形態である。
図2は、例示的な実施形態に従い、プローブ(例えば、MIP)を設計及び選択するための、プロセス200のフローチャートである。プロセス200は、制約条件集合を決定する工程(工程202)、制約条件集合を用いてプライマーを同定する工程(工程204)、最適化手法を行い、標的染色体上における分子捕捉比率及び有効部位数を最大化させる工程(工程206)、及び、最適化手法に基づいてプローブを選択する工程(工程208)を含む。
工程202では、制約条件集合を決定する。例えば、CPU106上に実装されたソフトウェアまたはアプリケーション(複数可)を用いて、制約条件集合を決定してもよい。一部の実施形態では、CPU106上のソフトウェアまたはアプリケーション(複数可)を用いて、更に、プロセス200の続く工程のいずれか1つまたは複数を実行してもよい。例えば、CPU106上のソフトウェア及びアプリケーション(複数可)を用い、決定した制約条件に基づいて、任意の参照ゲノム(例えば、HG19)内の豊富なプライマーペアを検索してもよく、また、ゲノムファイルの接尾辞配列インデックスを自動的に作成してもよい。
一部の実施形態では、制約条件集合を、代わりにアルゴリズムフラグと呼んでもよい。例えば、制約条件(またはアルゴリズムフラグ)としては、レフトプライマーの長さ、プライマーペアの最低頻度、プライマー間の最大長(例えば、アンプリコンの長さ)、プライマーの総最低頻度及び/または総最高頻度、プライマーあたりの最低GC含有量(%)、異なるアンプリコンの最低量(%)、ゲノム内におけるプライマーの分布、またはこれらの任意の適切な組み合わせを挙げてもよい。例示的な実施形態では、以下の制約条件を用いてプライマーペアを設計してもよい。
・レフトプライマーの長さ:18、19、20、21塩基対(bp)
・プライマーペアの頻度:100、250、500、2500、5000、10000
・アンプリコンの長さ:50〜150bp、例えば、85bp未満
・プライマーあたりの最低GC含有量:40%
・アンプリコンの固有性(目的の標的配列が固有であるパーセント):80%超
・ゲノム内におけるプライマーの分布:反復ラン、それぞれのバケットサイズ(bs)が1〜50%の範囲、バケットフィル(bf)が1〜bs−1(バケットサイズ(bs)とは、ゲノム長のbs%のことを意味し、それぞれのバケットは全ヒットのbf%を含む必要がある)
工程204では、工程202で決定した制約条件集合を用いて、プライマー集合を同定する。詳細には、それぞれのプライマー設計において、以下のパラメータの任意の組み合わせを提供してもよい。レフトプライマーの配列(例えば、ゲノムのプラス鎖及びマイナス鎖上におけるそれらの存在数と同様に)、ライトプライマーの配列(例えば、ゲノムのプラス鎖及びマイナス鎖上におけるそれらの存在数と同様に)、固有ペア及び非固有ペアの両方を含むペアの頻度(例えば、制約条件により制限されたアンプリコン長とペアをなすレフトプライマー配列及びライトプライマー配列)、固有に生成されるアンプリコンの頻度及び比率、ならびに、固有ペア由来のアンプリコン配列及び非固有ペア由来のアンプリコン配列。一部の実施形態では、ゲノム上の複数の領域(例えば、数百超、数千超、数万超、数十万超、または、数百万超)において、それぞれのプライマーペアを増幅させることができる。
一部の実施形態では、生成したプライマーペアは、レフトプライマー配列内またはライトプライマー配列内(すなわち、レフトアームまたはライトアーム)のいずれにもミスマッチがないアンプリコン部位を同定または予測し得る。あるいは、別のアンプリコン部位を同定または予測するためには、以下に示すような少数のミスマッチが許容され得る。
レフトアーム内に1つのミスマッチがあり、ライトアーム内に0のミスマッチがある
レフトアーム内に0のミスマッチがあり、ライトアーム内に1つのミスマッチがある
レフトアーム内に1つのミスマッチがあり、ライトアーム内に1つのミスマッチがある
レフトアーム内に2つのミスマッチがあり、ライトアーム内に0のミスマッチがある、または、
レフトアーム内に0のミスマッチがあり、ライトアーム内に2つのミスマッチがある
一部の実施形態では、上記のアンプリコン予測スキームは、予測したアンプリコンのゲノム座標を提供する。しかしながら、一部の実施形態において、ミスマッチのないアンプリコン部位を同定するスキームで、予測したアンプリコンのゲノム座標を更に提供することは、集中的な計算となる場合がある。このような場合、スキームを2つのパートに分けてもよい。第1のパートでは、ミスマッチのないアンプリコン部位を同定するが、同定したアンプリコン部位のゲノム座標は提供しない。第2のパートでは、少数のミスマッチ(例えば、上で列挙したミスマッチの組み合わせ)を含むアンプリコン部位を同定し、また、これらアンプリコン部位のゲノム座標に加え、ミスマッチのないアンプリコン部位のゲノム座標を提供する。スキームを2つのモジュールパートに分けることにより、計算の複雑さが軽減され得る。しかしながら、一般的に、2つのパートを組み合わせ、単一関数を用いて、ミスマッチのないアンプリコン部位、ミスマッチのあるアンプリコン部位、及び、それらのゲノム座標からなるセットを提供可能であることを理解されたい。
一部の実施形態では、工程204において同定したアンプリコン部位の1つまたは複数を除去してもよい(例えば、フィルタリング操作)。例えば、レフトプライマーの5´末端及びライトプライマーの3´末端から少なくとも3塩基対(bp)に存在しないミスマッチがアンプリコン部位にある場合、その部位を除去してもよい。フィルタリング操作を通過したこれらプライマー(以下、「候補プライマー」と呼ぶ)のアンプリコン部位は、参照ゲノム中の複数の領域(例えば、通常、2500またはそれ以上)を標的とするが、目的の染色体を濃縮させるはずである。更に、一部の実施形態では、候補プライマーのレフトアーム配列及びライトアーム配列の両方は、DNA結合安定性の最近傍モデルを用いて計算する場合、60℃台前半〜60℃台後半の範囲の融解温度(T)を有するはずである(核酸配列に従い、実験的な安定性パラメータを合計する)。例えば、Santa Lucia and Hicks(2004)を参照されたい。最後に、候補プライマーは、レフトアームの5´上及びライトアームの3´上3bpsに存在するミスマッチに対して広い許容範囲を有するはずである。
除去(またはフィルタリング)操作を行った後、それぞれの候補プライマーのパラメータ値セットを生成するために、残ったアンプリコン部位に対して更なる処理を行う。一部の実施形態では、目的の染色体由来のアンプリコン部位の数と、フィルタリング操作を通過したアンプリコン部位の総数との比率を計算する。それぞれの候補プライマーに関する、拡充情報(例えば、計算した比率)、関連するアンプリコン部位情報、及び、任意のその他パラメータ値を、データベース116などのデータベース内に保存してもよい。
工程206では、最適化手法を行い、最適な予測性能を有するプライマーを同定する。最適化手法は、それぞれの候補プライマーの目的関数を求めることを含む。特に、その他の染色体上の捕捉部位数と比較して、目的の染色体上の捕捉部位の比率を最大化する目的関数を用いることが望ましい場合がある。その上、目的関数は更に、目的の染色体由来部位の数を最大化し得る。一部の実施形態では、候補プライマーは任意選択的に、その予測したアンプリコン部位に高頻度で一塩基多型(SNP)を有するプライマーを含んでいてもよい。類似反復配列を標的とする高ランクプライマーの存在により、一部の実施形態では、大きなオーバーラップを有するプライマーの中から、目的の染色体由来部位の比率が最も高い候補プライマーのサブセットのみを同定することができ、残った候補プライマーを将来の使用のため取っておいてもよい。
一部の実施形態では、以下のマトリックスに基づいて、それぞれの候補MIPの目的関数を設定してもよい。
Figure 0006830094
Figure 0006830094
上記のプローブマトリックスにおいて、「0のミスマッチ」と記載する行は、両方のアームにおいて完璧にマッチしているMIPのことを示し、「1つのミスマッチ」と記載する行は、そのアームの一方にせいぜい1つのミスマッチを許容するプライマーのことを示す。表1において、「固有」と記載する列は、対応するMIPに1回だけアラインする、目的の染色体上の部位数に相当する(アライメントは、目的の染色体上に存在し、その他の染色体上には存在しない)。表1において、「非固有」と記載する列は、対応するMIPに2回以上アラインする、目的の染色体上の部位数に相当する(アライメントは、目的の染色体上に、複数の染色体上に、またはそれらの両方に複数存在する)。表2において、「固有」と記載する列は、対応するMIPに1回だけアラインする、全染色体(例えば、第1〜第22染色体、X染色体、及び、Y染色体の全てを含む)にわたる部位数に相当する。言い換えれば、値Eは、複数のAにわたる合計を含み、それは、i番目の染色体上における、ミスマッチがゼロの固有部位の数を示す。同様に、表2において「非固有」と記載する列は、対応するMIPに2回以上アラインする、全染色体にわたる部位数に相当する(例えば、同一染色体上に、複数の染色体上に、またはそれらの両方に複数存在するアライメントを含む)。
直観的ないくつかの目的関数を、これらプローブマトリックスから容易に推論することが可能である。通常、アーム配列にマッチする部位の比率が高い(または、せいぜい少数のミスマッチ、例えば、1つのミスマッチを有する)MIPを選択することが望ましい場合がある。更に、固有部位の比率が高いMIPを選択することが望ましい場合がある。これは、B、D、F、または、H(またはこれらの任意の適切な組み合わせ)と比べて、A、C、E、または、G(またはこれらの任意の適切な組み合わせ)に比較的大きな値を有するMIPを選択することにより表してもよい。更に、目的の染色体上にある部位の比率が高いMIPを選択することが望ましい場合がある。これは、E、F、G、または、H(またはこれらの任意の適切な組み合わせ)と比べて、A、B、C、または、D(またはこれらの任意の適切な組み合わせ)に比較的大きな値を有するMIPを選択することにより表してもよい。
例えば、A/Fを最大化または増加する目的関数を用いて、0のミスマッチを許容する候補プライマーにおける不明瞭なリードをより少なく生成することができる。2つ目の例では、A/Eを最大化または増加する目的関数を用いて、標的染色体(例えば、21番染色体)に特異的なリードを生成することができる。3つ目の例では、A/Cを最大化または増加する目的関数を用いて、1つのミスマッチを有するプライマーよりも著しく完璧にマッチする部位を有するプライマーを選択することにより、結果として、効率的な捕捉を実現させる。4つ目の例では、Aを最大化または増加する目的関数とは、多数の部位が目的の染色体に固有にアラインすることを意味する。5つ目の例では、(A+C)/(E+F+G+H)の目的関数を最大化するために、最適なプライマーを選択することができる。このコンセプトを更に説明するために、3つの例示的な目的関数について以下で詳細に説明する。
A.目的の染色体由来の有効リード総数(P1)
それぞれの候補プライマーまたは候補プローブ用の例示的な目的関数を、目的の染色体(例えば、21番染色体)由来の有効リード総数として定義してもよい。
Figure 0006830094
式中、Kは、ミスマッチが0の部位の平均捕捉係数であり、Kは、ミスマッチが1つの部位の平均捕捉係数である。より具体的には、
Figure 0006830094
Figure 0006830094
と表され、式中、TMTCは総分子タグカウントである。
以下の式、
Figure 0006830094
において、Kの値は実験データから推定可能であり、表1及び表2のプローブマトリックスから抽出した値を用いて、式(2)を、
Figure 0006830094
に書き換えることができる。本明細書において、式(5)の分子は、有効部位(目的の染色体上の)の調整数を意味し得る。本明細書において、式(5)の分母は、ゲノム上の部位数を意味し得る。本明細書において、式(5)が定義するP1の値は、有効率または有用率のことを意味し得る。
B.目的の染色体上の有効部位総数(P2)
それぞれの候補プライマーまたは候補プローブ用の別の例示的な目的関数を、目的の染色体(例えば、21番染色体)上の有効部位総数として定義してもよい。
Figure 0006830094
式中、K及びKは、式(1)で定義したとおりである。より具体的には、P2を以下の式、
Figure 0006830094
と定義してもよく、式中、Kは、式(4)で定義したとおりである。Pと同様に、Pの値もまた、表1及び表2のプローブマトリックスから抽出した値を用いて計算することができる。Pの値は、有効部位の調整数を意味し得る。
C.包括的なプローブ性能関数
それぞれの候補プライマーまたは候補プローブ用の目的関数を求めるための包括的な手法においては、以下の式を用いる。
Figure 0006830094
式(5)及び式(7)を組み合わせて、式(8)を、
Figure 0006830094
に書き換えることができる。式(4)と関連させて上記したとおり、実験データを用いてKの値を推定可能であることに留意されたい。より具体的には、以下の式を用いる。
Figure 0006830094
式(9)で定義したPの値を複合スコアとして用い、候補プライマーまたは候補プローブについての総合的な予測性能を表してもよく、またPの値は、有効部位の調整数と有効率(または有用率)との積のことを意味し得る。1つの例においては、式(9)で定義したPの値を既定閾値と比較して、更なる検査または診断用に、関連する候補プライマーまたは候補プローブを選択するかどうかを判定してもよい。例えば、既定閾値は、1、2、3、4、5、6、7、8、9、10、または、その他適切な数などの値であってもよい。
上記の例のいずれか、及び、それら例の任意の組み合わせを、本開示の範囲を逸脱することなく、目的関数として用いてもよい。このように目的関数を最適化してプライマーを選択することには、十分な有効リード数を得るのに必要な読み取り深度が低くなるという利点がある。原則的に、読み取り深度の向上は、不明瞭さ低減の改善に比例して変化する。
工程208では、工程206で行った最適化手法に基づいて、候補プライマー集合からプライマーを選択する。例えば、選択したプライマーは、最適な予測性能を有するプライマー、すなわち、工程206に関連させて記載した目的関数を最大化したプライマーに相当していてもよい。
例示的な実施形態では、多数のプライマー(例えば、MIP)を、設計、合成、及び、試験する。プライマーを試験するために、それぞれの目的の染色体上の、及び、ゲノム全体にわたる(例えば、常染色体及び性染色体を含む)、固有部位及び非固有部位(ミスマッチがない、または、ミスマッチが1つ)の検索及びカウントプロセスに基づいて、表1及び表2の1つまたは複数の予測部位カウント数のそれぞれに対して値を生成する。上記の例または上記の例の組み合わせのいずれかを目的関数として用いて、それぞれのプライマーに割り振られプライマーの性能を示すスコアを表してもよい。プライマー同士をその性能に基づいて比較してもよく、最も性能の良いプライマーを選択してもよい。1つの例としては、プライマーのスコアを既定閾値と比較して、プライマーを選択するかしないかを判定する。詳細には、式(9)で表される目的関数を用いてそれぞれのプライマースコアを表す場合、閾値は、2、3、4、5、6、7、8、9、または、10などの数に設定され得る。
例示的な実施形態では、更なる解析のため、ハイスコアのプライマー(例えば、上記表内のMIP 003)が選択された。更なる解析の結果については、実施例3と関連させて以下で説明する。式(9)に従い判定したスコアが高い値であったため、MIP 003が選択された。詳細には、MIP 003は8.557のスコアを有していた。以下の表3は、MIP 003にアラインした、異なる染色体上のミスマッチのない固有部位(A)及びミスマッチが1つある固有部位(C)の予測数についてまとめたものである。
Figure 0006830094
プロセス200の工程または記載を、本開示における任意のその他実施形態と共に用いてもよいということが考えられる。更に、図2と関連させて説明した工程及び記載を、別の順番でまたは同時に実施して、本開示の目的を進めてもよい。例えば、任意の順番で、同時に、または、ほぼ同時に、これら工程のそれぞれを実施して、システムまたは方法のラグを軽減してもよく、または、システムまたは方法のスピードを増加させてもよい。更に、コンピュータデバイス100、より詳細には、コンピュータデバイス100のCPU106を用いて、プロセス200を実施してもよいという点に留意すべきである。
図3は、例示的な実施形態に従い、検査対象の異数性状態を予測するためのプロセス300のフローチャートである。プロセス300は、検査対象のシークエンシングデータを受信する工程(工程302)、検査対象の部位捕捉基準を計算する工程(工程304)、参照対象集合の部位捕捉基準を受信する工程(工程306)、及び、検査対象の部位捕捉基準と参照対象の部位捕捉基準との比較に基づいて、検査対象の異数性状態を予測する工程(工程308)を含む。一部の実施形態では、部位捕捉基準は部位捕捉性能指標(SCE)であり、それは、個々のそれぞれの部位における、固有分子識別子タグ数とリード数との比率のことである。一部の実施形態では、部位捕捉基準は部位捕捉密度指標(SCC)であり、それは、個々のそれぞれの部位における、SCEの変動係数として計算される。例えば、染色体1:1〜100は、100のアラインしたリード、及び、99の固有分子識別子タグを有することを意味する。それゆえ、SCEは99%となる。別の例では、染色体1:1〜100のうち100の試料において、全100試料が90%超のSCEを有するのに対し、染色体3:500〜600のうち100の試料では、50の試料のみが90%超のSCEを有し、残る50の試料は90%未満のSCEを有する。それゆえ、SCCは、染色体3:500〜600と比較して、染色体1:1〜100が、よりばらつきの少ない部位であることを示している。
工程302では、検査対象のシークエンシングデータを受信する。詳細には、検査対象は未知の異数性状態を有しており、受信したシークエンシングデータは、検査対象から核酸試料を採取して、再犯者分子反転プローブ(RO−MIP)などのプライマー集団を用い、核酸試料中の部位集団を捕捉することにより得られる。図5と関連させて詳細に記載しているように、それぞれのRO−MIPは、第1の標的ポリヌクレオチドアーム、第1の固有標的分子タグ、ポリヌクレオチドリンカー、第2の固有標的分子タグ、及び、第2の標的ポリヌクレオチドアームを配列内に含む。第1及び第2の標的ポリヌクレオチドアームが、集団内のMIP全体にわたり同一である一方、第1及び第2の固有標的分子タグは、集団内のMIP全体にわたり異なっている。RO−MIPアンプリコンは部位の捕捉により得られ、そのアンプリコンをシークエンスして、シークエンシングデータを取得する。
工程304では、目的の染色体由来の全固有捕捉現象の合計(S1)と、全ての染色体由来の全固有捕捉現象の合計(S1+S2)との比率を求めるために、検査対象の染色体比率を計算する。。染色体比率は、任意の試料中における目的の染色体の比率指標(すなわち、目的の染色体由来のリードの比率)を提供する。図4の工程426、工程428、及び、工程430と関連させて、染色体比率を計算する1つの例示的な方法を記載する。
工程306では、参照対象集合の染色体比率集合を受信する。詳細には、参照対象は、既知の正倍数性状態を示す人々の集団に相当し得る。例えば、対象は、特定の目的の染色体におけるモノソミー、二染色体性、または、トリソミーを示していてもよい。工程304に関連させて行った説明と同じように(しかし、それぞれの参照対象について)、参照対象の染色体比率を計算する。図4と関連させてより詳細に記載しているように、染色体比率とは、選択したRO−MIPが、その他の染色体と比較して目的の染色体上の配列を捕捉する性能のことを表している。
工程308では、検査対象の染色体比率(工程304で計算した)を参照対象の染色体比率(工程306で得た)と比較して、その比較に基づき検査対象の正倍数性状態を予測する。詳細には、統計的検定を用いて、検査染色体比率を参照染色体比率の集団と比較し、検査染色体比率が、同一の正倍数性状態に関連する参照染色体比率のクラスターのいずれかに属するかどうかを判定してもよい。本発明で使用する場合、「検査比率」は染色体比率を含み得る。
図4は、例示的な実施形態に従い、検査対象の正倍数性状態を予測するためのプロセス400のフローチャートである。1つの例においては、プロセス400を用いて、図3と関連させて示し説明したプロセス300における工程308を実施してもよい。図3と関連させて説明したように、染色体比率を用いて、未知の正倍数性状態を有する検査対象における正倍数性状態を予測してもよい。
プロセス400は、既知の遺伝子型を有するS試料から記録したデータを受信する工程(工程402)、及び、試料の反復パラメータsを1に初期化する工程(工程404)を含む。それぞれの試料sにおいて、プロセス400は、シークエンシングリードをフィルタリングし既知のアーティファクトを除去する工程(工程406)、リードをヒトゲノムにアラインする工程(工程408)、部位の反復パラメータkを1に設定する工程(工程412)、及び、k番目の部位における捕捉現象の数を測定する工程(工程414)を含む。全K部位及び全S試料を判定する場合、プロセス400は更に、少なくとも1つの判定基準を満たすK部位のサブセットを同定する工程(工程424)、S試料中における検査試料tにおいて、目的の染色体由来のタグカウントの第1の合計S1を計算する工程(工程426)、検査試料tにおいて、目的の染色体以外の染色体由来のタグカウントの第2の合計S2を計算する工程(工程428)、検査試料tにおいて、染色体比率をS1/(S1+S2)として計算する工程(工程430)、及び、検査試料tの染色体比率を参照染色体比率集合と比較することにより、検査試料tにおける正倍数性状態を選択する工程(工程432)を含む。
工程402では、S試料集合から記録したデータを受信する(S試料はそれぞれ、異なる対象から採取)。S試料の少なくとも1つは、正倍数性状態が未知であり得る検査対象から採取する。試料は対象から単離した核酸試料であってもよく、データは核酸試料から得たシークエンシングデータを含んでいてもよい。1つの例においては、RO−MIP集団を用いて核酸試料中の部位集団を増幅し、RO−MIPアンプリコン集団を作製することにより、シークエンシングデータを取得する。その後、RO−MIPアンプリコンをシークエンスして、工程402で受信したシークエンシングデータを取得してもよい。
工程404では、試料の反復パラメータsは1に初期化される。S試料を処理する際、S試料のそれぞれを処理して、それぞれの部位における捕捉現象の数を測定するまで、試料の反復パラメータsをインクリメントする。
工程406では、試料sのシークエンシングリードをフィルタリングして既知のアーティファクトを除去する。1つの例においては、工程402で受信したデータを処理して、プローブ−プローブ間の相互作用の影響を除去してもよい。一部の実施形態では、全RO−MIPのライゲーション標的アーム及び伸長標的アームは、ペアエンドシークエンスリードにマッチする。RO−MIPの両方のアームにマッチしないリードは、無効と判定され棄却される。残りの有効リードのアーム配列を除去し、更に、ライゲーション末端及び伸長末端の両方にある分子タグをリードから除去してもよい。工程414における更なる処理のために、除去した分子タグを別々に保管しておいてもよい。
工程408では、トリミングして得たリードをヒトゲノムにアラインする。一部の実施形態では、アライメントツールを用いて、リードを参照ヒトゲノムにアラインしてもよい。詳細には、参照に対して特定のリードがどの程度良好にアラインを示すかで、アライメントスコアを判定してもよい。閾値超のアライメントスコアを有するリードは、本明細書において主要なアライメントであることを意味してもよく、保持しておく。それに対し、閾値未満のアライメントスコアを有するリードは、本明細書において派生的なアライメントであることを意味してもよく、棄却される。参照ゲノムに沿い複数の位置にアラインした任意のリードは、本明細書においてマルチアライメントであることを意味し、棄却される。
工程412では、部位の反復パラメータkを1に初期化する。工程414では、k番目の部位における捕捉現象の数を測定し、また、全てのK部位が判定されるまで、工程418で部位の反復パラメータkをインクリメントする。
全てのK部位が判定されると、プロセス400は、少なくとも1つの判定基準を満たすK部位のサブセットを同定するための工程424に進む。例えば、S試料全体にわたる捕捉現象の数の変動係数として部位捕捉密度指標を求めてもよく、高い変動係数を有するこれら部位を棄却してもよい。
工程426では、検査試料において、目的の染色体由来のタグカウントの合計S1を計算し、工程428では、検査試料において、目的の染色体以外の染色体由来のタグカウントの合計S2を計算する。工程430では、染色体比率をS1/(S1+S2)として計算する。それから、工程432で、検査試料における染色体比率を参照染色体比率集合(既知の正倍数性状態を有する参照対象から計算した)と比較して、検査対象における予測正倍数性状態を選択するために統計的検定を行う。
図4における工程の順番は例証目的のみのために示しており、本発明を何ら制限するものではない。
本明細書に記載する組成物及び方法が出願に適したように脚色または修正可能であること、本明細書に記載する組成物及び方法をその他の適切な用途に採用可能であること、及び、このようなその他の追加及び修正が本発明の範囲から逸脱しないということを、当業者は理解するであろう。
本開示は、以下に続く実験の詳細からより理解されよう。しかしながら、以下に続く実施形態でより完全に説明を行うが、記載する特定の方法及び結果は本開示を例示するに過ぎないということを、当業者は容易に理解するであろう。
[実施例]
実施例1:
MIP設計、及び、目的の標的配列を捕捉するための方法
プローブの構築
図5に示すように、80〜105bpのサイズ範囲の単一オリゴヌクレオチド(第1及び第2の標的ポリヌクレオチドアームの長さによる)を合成する。6Nボックスとは、それぞれの目的の標的配列における捕捉現象を定量するために用いる分子タグ配列のことを意味する。この特定の実施形態では、リードをカウントする代わりに、捕捉部位あたりの固有配列の数をカウントする。
部位捕捉反応
第1及び第2の標的ポリヌクレオチドアーム(実験で決めた濃度の)を、20uL緩衝反応液中の1〜2mL血漿から抽出したcsDNAと混合した。混合液を、サーモサイクラー内で、プローブを鋳型へとアニールするのに最適化した温度でインキュベートした(98℃で3分間→85℃で30分間→66℃で15分間)。このインキュベーションの間に、プローブ分子は、プローブ配列に対して相補的な特定の染色体位置において、csDNA鋳型にアニールする(図6の中央)。最も容易に予測される部位は、第1及び第2の標的ポリヌクレオチドアームに対して正確に相補的な配列を有する部位(不変部位)であるが、一方のアームに1つまたは複数の変異を有する部位もまた、やや効率は低くなるが標的となる。それぞれの反応液中における最適量のMIPは、以下の3つの変動要因によって決まる。1)鋳型として用いるゲノム数(個体により幅広く変動し得る)、2)特定のプローブが標的とする総部位数、及び、3)不変部位と変異部位の比率。
ハイブリダイゼーションプログラムの完了後、酵素と試薬の混合液(5uL)を加えてから、その混合液を66℃で1時間、そして72℃で30分間インキュベートし、その後、4℃まで冷却した。本発明者は、ハイブリダイゼーション温度及び伸長温度の両方を66℃まで上げることによって、特異度が劇的に上昇することを確認した。この工程中、ギャップがDNAポリメラーゼで埋められ、MIPは、DNAリガーゼにより共有結合して環状になる(図Eの下部)。この工程中、鋳型にアニールしたプローブだけが環状となり、直線状のプローブは、プライマー結合部位間にギャップが存在するために増幅されない。
捕捉部位の増幅
捕捉済みMIPの混合液(20uL)を、反応用混合液(耐熱性ポリメラーゼ、dNTPS、PCR緩衝液、及び、プローブ主鎖に対して相補的なユニバーサルプライマーを含有)(50uL)へと加えた(図Fの上部)。プールした試料ライブラリのマルチプレックスシークエンシングを可能とする、異なる「バーコード」配列を有するプライマーを用いて、それぞれの試料を増幅させた。電気泳動できれいなアンプリコンバンドが観察されるまで、反応液を実験で決めた数のPCRサイクルに供した。Ampureビーズを用いてPCR産物を精製してから、Qubitフルオロメーターを用いて定量した。
捕捉部位のシークエンシング
全ての試料が等しい濃度となり、リードの割り当てが試料全体にわたり確実に均一となるように、精製したPCR産物をライブラリにプールした。部位特異的なギャップの完全配列を決定するために、シングルエンドシークエンシングまたはペアエンドシークエンシングのいずれかを用いて、75〜100サイクルでライブラリをシークエンスした。シングルエンドシークエンシングを用いる場合、リードは、ライゲーションアームに続き、分子タグ、及び、伸長/ライゲーション工程中に埋められた固有ギャップ配列からなる。伸長アームのシークエンシングは、プローブから配列が判明しているため不要である。
実施例2:
シークエンスデータ解析、及び、対象内の異数性検出
異数性検出に有用とするために、シークエンシングの生データを処理する必要がある。まず最初に、シークエンシングリードをフィルタリングし、既知のアーティファクト(プローブ−プローブ間の相互作用、主鎖配列、または、アダプター配列など)を除去する。それから、MIPのライゲーションアーム及び伸長アーム(すなわち、第1及び第2の標的ポリヌクレオチドアーム)を、それぞれのアーム内に最大1塩基対のミスマッチを許容として、シークエンスリードにマッチさせる。この基準に適合しないリードを無効として扱い棄却する。有効リードのアーム配列をトリミングし、続く処理工程で使用するリードファイルからシークエンスを削除することにより、シークエンスデータから非ゲノム部分を除去する。同時に、ライゲーション末端及び伸長末端の両方にある分子タグは、後の工程にて捕捉現象をカウントするために別々に残す。bowtie2ソフトウェアプログラムを用いて、トリミングしたリードをヒトゲノム(hg19)にアラインする。それから、samtoolsソフトウェアプログラムを用いて、アラインしたリードに対してフィルタリングを行い、有効ペアとしてアラインしないリード、または、非固有にアラインするリードを除去する。固有にアラインしたリードのみを残すように、アライメントパラメータ及びフィルタリングパラメータを慎重に選択する。アラインしフィルタリングしたリード(bam形式ファイル)を調査し、固有MIPギャップ配列を有するそれぞれの標的部位(すなわち、固有な目的の標的配列)の固有分子タグをカウントする。これらのカウントは、次世代シークエンシングプラットフォーム(例えば、Illumina HiSeq 2500フローセル)を用いてシークエンスしたMIP−標的ハイブリダイゼーション現象における、初期の数である。個々のそれぞれの部位における部位捕捉性能指標(SCE)を計算する。個々のそれぞれの部位における部位捕捉密度指標(SCC)を、SCEの変動係数として計算する。実験データから得た部位捕捉性能の変動指標に基づいて、これら部位の一部を棄却する。この工程には、染色体比率における試料−試料間のばらつきを抑え、後の工程で計算する陽性試料のZ値を上昇させる働きがある。任意の試料について、目的の染色体(例えば、21番染色体)上における残りの部位由来の固有分子タグカウントの合計(S1)を計算し保存する。残りの参照部位における合計(S2)を計算し保存する。2つの合計間の比率(染色体比率 = S1/(S1+S2))を、任意の試料における目的の染色体の比率指標として計算する。それぞれの検査試料について、正常な胎児染色体カウント(すなわち、正常核型の胎児)を有する参照試料集合と対照させて、染色体比率指標を用いて目的の染色体(例えば、21番染色体)のZ値を計算する。任意の試料におけるZ値の絶対値が所定の閾値を超えた場合に、異数性(例えば、トリソミー及びモノソミー)または正倍数性の同定を行う。
上記方法を用いて、妊娠している女性由来の48点の試料について、ダウン症候群(21番染色体のトリソミー)の検査を行った。2点の試料がダウン症候群に対して陽性である一方で、46点の試料が陰性であることをアッセイで確認した。陽性試料と陰性試料との間の境界線は非常にはっきりしており、陽性試料は両方とも、6超のZ値を示した。図8を参照されたい。
実施例3:
妊娠している対象内における13トリソミー、18トリソミー、及び、21トリソミーの検出
本実施例では、本明細書に記載の方法を用いて、13トリソミー、トリソミー18、及び、トリソミー21を有する妊娠女性と、健康な妊娠女性とを識別(または分類)することについて説明する。
13トリソミー、18トリソミー、及び、21トリソミーを検出するためのZ値カットオフの決定
妊娠女性由来の血漿試料(48点)の訓練事例集合(治験審査委員会承認済みの研究)を用いて、13トリソミー、18トリソミー、及び、21トリソミーを検出するためのZ値カットオフを決定した。血漿試料のそれぞれは、異なる妊娠女性から採取した。48点の血漿試料には、40点の健康な試料、4点の21トリソミー試料、3点の18トリソミー試料、及び、1点の13トリソミー試料が含まれていた。CVS(絨毛採取)または羊水穿刺で採取した胎盤細胞または胎児細胞の核型解析により、トリソミー症例を確認した。
部位捕捉反応
48人の妊娠女性のそれぞれから抽出した血漿DNAに対して、以下の部位捕捉反応を実施した。抽出した血漿DNAを、実験で決めたプローブ濃度で、水、Ampligase緩衝液(1x)、及び、RO−MIPと混合した。部位捕捉反応用混合液を、サーマルサイクラー内で、98℃で3分間、85℃で30分間、そして66℃で15分間インキュベートした。インキュベート後、dNTP(0.6mM)、NAD(0.4x)、ベタイン(0.3M)、Ampligase緩衝液(1x)、水、Ampligase(5ユニット)、及び、Phusion HFポリメラーゼ(0.4ユニット)を含有するマスターミックスを、部位捕捉反応用混合液に加えた。それから、混ぜ合わせた混合液を、サーマルサイクラー内で、66℃で60分間、そして、72℃で30分間インキュベートしてから、4℃で保持した。
捕捉部位の増幅
インキュベート後、混ぜ合わせた混合液(20μL)を、フォワードインデックスプライマー(500nM)及びリバースインデックスプライマー(500nM)、Phusion HF緩衝液(1x)、dNTP(0.2mM)、水、ならびに、Phusion HSポリメラーゼ(0.4ユニット)を含有するPCRマスターミックスに加えた。固有のリバースプライマーインデックスを用いて、それぞれの試料にバーコードを付加した。PCR反応用混合液を、サーマルサイクラー内で、98℃で3分間、98℃で10秒間を20サイクル、65℃で20秒間、そして72℃で30秒間インキュベートした。それから、PCR反応用混合液を72℃で5分間保持後、4℃で保持した。
シングルエンドシークエンシング
PCR増幅したライブラリをAmpureXPビーズで精製し、試料を等しい濃度で共にプールした(プールあたり試料48点)。マルチプレックスライブラリのそれぞれを、シングルSRフローセルにロードし、HiSeq 2500のRapid Runモードで106サイクル、シークエンスした。
データ解析:
シークエンシングデータをフィルタリングしアラインした。それぞれの染色体(すなわち、13番染色体、18番染色体、または、21番染色体)に固有にアラインしたリード由来の固有分子タグ/識別子の数(この分子は「A」と「C」との合計に類似)を、1番染色体〜22番染色体に固有にアラインしたリード由来の固有分子タグ/識別子の総数(この分母は「A」、「C」、「E」及び「G」の合計に類似)で割ることにより、13番染色体、18番染色体、及び、21番染色体の染色体比率(P)を計算した。しかしながら、表2の値(E〜H)がゲノム全体(1番染色体〜22番染色体、X染色体、及び、Y染色体を含む)にわたる全ての染色体を含む一方で、ここでの分母は、X染色体またはY染色体にアラインするリードを含まない場合がある。詳細には、X染色体またはY染色体にアラインするリードの数は、その他の染色体(目的の染色体を含む)にアラインするリードの数よりも著しく多い場合がある。この場合、分母内に、X染色体またはY染色体にアラインするリードを含むことは、結果として得られる比率を著しく下げる場合があり、Z統計値の計算にノイズ及びひずみが生じる恐れがある。それゆえ、目的の染色体がX染色体でもY染色体でもない場合(例えば、常染色体異数性を検出する場合)、X染色体またはY染色体にアラインするリードは、分子及び分母の両方から除外され得る。あるいは、目的の染色体が性染色体である場合(例えば、性染色体異数性を検出する場合)、X染色体及び/またはY染色体にアラインするリードは、分子及び分母に含まれ得る。
結果として得られた比率を元に、変異のない試料の平均値(x)及び標準偏差(s)を計算し、また、それら平均値及び標準偏差を用いて、それぞれの試料のZ値([P−x]s)を計算する。Z値の解析により、全ての健康な試料が、13番染色体、18番染色体、及び、21番染色体に対して、<3.0のZ値を有する一方で、陽性試料が、13番染色体、18番染色体、及び、21番染色体に対して、>3.0のZ値を有することが明らかとなった。それゆえ、>3.0のZ値を有する試料を、13トリソミー、18トリソミー、及び、21トリソミーに対して陽性とみなすことにした。<3.0のZ値を有する試料を、13トリソミー、18トリソミー、及び、21トリソミーに対して陰性とみなす。
13トリソミー、18トリソミー、及び、21トリソミーを検出するための感度及び特異度の測定
妊娠女性由来の試料(422点)のテスト事例集合(治験審査委員会承認済みの研究)を用いて、テストの感度及び特異度を測定した。それぞれの試料は、異なる妊娠女性から採取した。これら422点の試料には、387点の健康な試料、21点のT21試料、9点のT18試料、及び、5点のT13試料が含まれていた。CVSまたは羊水穿刺で採取した胎盤細胞または胎児細胞の核型解析により、トリソミー症例を確認した。
部位捕捉反応
422人の妊娠女性のそれぞれから抽出した血漿DNAに対して、以下の部位捕捉反応を実施した。抽出した血漿DNAを、実験で決めたプローブ濃度で、水、Ampligase緩衝液(1x)、及び、RO−MIPと混合した。捕捉反応用混合液を、サーマルサイクラー内で、98℃で3分間、85℃で30分間、そして66℃で15分間インキュベートした。インキュベート後、dNTP(0.6mM)、NAD(0.4x)、ベタイン(0.3M)、Ampligase緩衝液(1x)、水、Ampligase(5ユニット)、及び、Phusion HFポリメラーゼ(0.4ユニット)を含有するマスターミックスを、部位捕捉反応用混合液に加えた。それから、混ぜ合わせた反応用混合液を、サーマルサイクラー内で、66℃で60分間、そして、72℃で30分間インキュベートしてから、4℃で保持した。
捕捉部位の増幅:
インキュベート後、混ぜ合わせた混合液(20μL)を、フォワードインデックスプライマー(500nM)及びリバースインデックスプライマー(500nM)、Phusion HF緩衝液(1x)、dNTP(0.2mM)、水、ならびに、Phusion HSポリメラーゼ(0.4ユニット)を含有するPCRマスターミックスに加えた。固有のリバースプライマーインデックスを用いて、それぞれの試料にバーコードを付加した。PCR反応用混合液を、サーマルサイクラー内で、98℃で3分間、98℃で10秒間を20サイクル、65℃で20秒間、そして72℃で30秒間インキュベートした。それから、PCR反応用混合液を72℃で5分間保持後、4℃で保持した。
シングルエンドシークエンシング:
増幅ライブラリをAmpureXPビーズで精製し、試料を等しい濃度で共にプールした(プールあたり試料48点)。全体で9つのプールがあり、最初の8つのプールは、プールあたり47点の検査試料及び1点の対照試料を含み、9つ目のプールは、46点の検査試料及び1点の対照試料を含んでいた。マルチプレックスライブラリのそれぞれを、シングルSRフローセルにロードし、HiSeq 2500のRapid Runモードで106サイクル、シークエンスした。
データ解析:
訓練事例集合と同様に、422人の妊娠女性それぞれに由来するDNAに対して、部位捕捉反応、捕捉部位の増幅、及び、106サイクルのシングルエンドシークエンシングを実施した。それぞれの試料から得たシークエンスデータを用いて、13番染色体、18番染色体、及び、21番染色体のZ値を計算した(図10〜図12)。訓練事例集合により決定したカットオフを用いると、特異度(例えば、真陰性率、または、真陰性数を真陰性と偽陽性との合計で割ったもの)は、13トリソミーで5/5、18トリソミーで9/9、及び、21トリソミーで21/21となり、>99.9%となった。感度(例えば、真陽性率、または、真陽性数を真陽性と偽陰性との合計で割ったもの)は、13番染色体で>99.2%となり、18番染色体で>99.9%となり、また、21番染色体で>99.5%となった。
図10のグラフは、13トリソミーを検出するためのプライマー検査性能を示す。図10のy軸はZ統計値を表し、x軸は、左側に5点の13トリソミー試料(順不同)、及び、右側に残りの545点の試料(Z統計値が低下する順)を表している。図10に示すとおり、全5つの13トリソミー試料は、3.0超のZ統計値を有しており、プライマーを用い、陽性試料として正確に同定され、5/5の感度となった。健康な試料のうち少数が3.0超のZ統計値を有し、99.2%の特異度となった。
図11は、図11が18トリソミーを検出するためのプライマー検査性能を示すこと以外は、図10と類似している。全9つの18トリソミー試料は、3.0超のZ統計値を有しており、プライマーを用い、陽性試料として正確に同定され、9/9の感度となった。更に、ほぼ全ての健康な試料が陰性試料として正確に同定され、99.9%超の特異率となった。図12もまた、図12が21トリソミーを検出するためのプライマー検査性能を示すこと以外は、図10と類似している。全21の21トリソミー試料は、プライマーを用い、陽性試料として正確に同定され、21/21の感度となった。更に、ほぼ全ての健康な試料が陰性試料として正確に同定され、99.8%超の特異率となった。
図10〜図12に示す結果は、本開示のシステム及び方法が、異数性検出において高感度及び高特異度を有するプライマーを選択するのに有効な手段を提供することを示している。その他の方法もまた、同じような水準の性能(例えば、感度及び/または特異度を測定することによる)を有していてもよい。例えば、ショットガンシークエンシングを用いて、同様の性能を達成してもよい。しかしながら、本開示は、その他の手法に優るいくつかの利点を有している。その理由としては、本開示では1種類のプライマーだけを用いているため、その他の手法と比べて、よりコストを抑え、よりシンプルに、かつより効率的となり得るからである。
本開示で提供する実施例は主に、例証の目的のため、コピー数多型、染色体異常、または、微小欠失を同定するためのシステム及び方法に関する、多数の異なる例示的な実施形態に焦点を合わせている。しかしながら、本開示の機能及び操作を著しく変更することなく、1つまたは複数の実施形態における全般的な様式及び設計を変更可能であることを理解されたい。更に、任意の1つの実施形態に記載する特徴及び制限を、本明細書における任意のその他実施形態へと適用してもよく、また、1つの実施形態に関連する記載及び例を、適切な方法で任意のその他実施形態と組み合わせてもよい、という点に留意すべきである。その上、本開示で提供する図面及び例は、例示のみを意図するものであり、本開示を何ら制限するものではない。更に、上記のシステム及び/または方法を、その他のシステム及び/または方法へと適用してもよく、または、その他のシステム及び/または方法に従い用いてもよい(その他のシステム及び/または方法は、コピー数多型の同定に直接関連していてもよいシステム及び/または方法を含む)という点に留意すべきである。
本開示の方法に従い記載されるプロセスのいずれかを実行するコンピュータデバイスにおける、例示的な実施形態を示す図である。 本開示における一部の方法に従い、プローブを設計及び選択するための例示的なプロセスを示すフローチャートである。 本開示における一部の方法に従い、検査対象の異数性状態を予測するための例示的なプロセスを示すフローチャートである。 本開示における一部の方法に従い、検査対象の異数性状態を予測するための、より詳細な別の例示的なプロセスを示すフローチャートである。 本開示における一部の方法に用いる、例示的な分子反転プローブ(MIP)の配列を示す図である。MIPは、以下の構成要素、第1の標的ポリヌクレオチドアーム(「ライゲーションアーム」と記載)、ポリヌクレオチドリンカー(「主鎖」と記載)、及び、第2の標的ポリヌクレオチドアーム(「伸長アーム」と記載)を配列内に含み、またそのリンカーは、第1の固有標的分子タグ(「6N」と記載)、PCR用フォワードプライマー、PCR用リバースプライマー、及び、第2の固有標的分子タグ(こちらも「6N」と記載)を含む。MIPのそれぞれにおける第1及び第2の標的ポリヌクレオチドアームは、目的の部位に隣接する、核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的である。固有分子タグは、ランダムなポリヌクレオチド配列である。一部の実施形態では、「実質的に相補的」とは、両方のアームにおいてミスマッチが0であること、または、一方のアームのみにおいてミスマッチがせいぜい1であることを意味する(例えば、標的ポリヌクレオチドアームが、目的の部位に隣接する、核酸内の第1及び第2の領域にそれぞれハイブリダイズする場合)。一部の実施形態では、「実質的に相補的」とは、両方のアームにおいてミスマッチの数が少ないこと、例えば、せいぜい1、2、3、3、5、6、7、または、8であることを意味する。 本開示の方法における、プローブによるハイブリダイゼーション及び伸長/ライゲーションを示す図である。第1の標的ポリヌクレオチドアーム(「ライゲーションアーム」と記載)及び第2の標的ポリヌクレオチドアーム(「伸長アーム」と記載)を、DNA鋳型にハイブリダイズするのに好適な条件下で、DNAにMIPを添加する。ハイブリダイゼーション後、伸長/ライゲーション条件下で、ポリメラーゼ及びリガーゼを添加してから、ライゲーションアームと伸長アームとの間に固有ギャップ配列を含む目的の標的配列全体にわたりDNA合成を行うことにより、環状オリゴヌクレオチド(「捕捉済みプローブ」)を作製する。アンプリコン及びcsDNAが融解すると、捕捉済みプローブを増幅する準備が整う。 捕捉済みプローブの増幅及びシークエンシングを示す図である。シークエンシングアダプター及びPCR用フォワードプライマーまたはPCR用リバースプライマーを含む核酸分子を環状アンプリコンの主鎖に結合させてから、MIPにより作製された全ての環状オリゴヌクレオチドをPCRを用いて増幅する。その後、例えば、次世代シークエンシング(NGS)を用いてアンプリコンのシークエンスを行ってから、それぞれのアンプリコン内に存在する固有分子タグの数をカウントすることにより、得られたアンプリコンのリード数を測定する。 21番染色体トリソミー(ダウン症候群)検査の結果を示す図である。検査した48点の試料のうち46点がダウン症候群に対して陰性であった一方、2点の試料がダウン症候群に対して陽性であった。2点の陽性試料を、Z値が6超の上部右側に示す。 本開示の実施形態における、Alu因子へのプローブのハイブリダイゼーションを示す図である。 トリソミー13を検出するためのMIP実施例において評価した、検査性能を示す図である。 トリソミー18を検出するためのMIP実施例において評価した、検査性能を示す図である。 トリソミー21を検出するためのMIP実施例において評価した、検査性能を示す図である。

Claims (22)

  1. 胎児における異数性をスクリーニングするための方法であって、
    a)母体血液試料から単離した核酸試料を得ることと、
    b)分子反転プローブ(MIP)の1つまたは複数の集団を用いることにより、工程a)で得た前記核酸試料中における複数の目的の標的配列を捕捉して、複数のレプリコンを作製することと、
    前記MIP集団内の前記MIPのそれぞれは、
    i)一対の第1及び第2の標的ポリヌクレオチドアームであって、前記MIPのそれぞれにおける前記第1及び第2の標的ポリヌクレオチドアームの対は、同一であり、且つ、前記複数の目的の標的配列におけるそれぞれの配列に隣接する、前記核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的である、前記一対の第1及び第2の標的ポリヌクレオチドアーム;
    ii)1つまたは複数の固有分子タグ;及び
    iii)ポリヌクレオチドリンカー;
    を含み、
    )工程b)で得た前記レプリコンから増幅した複数のMIPアンプリコンをシークエンスすることと、
    d)レプリコンを増幅したそれぞれのMIPにおける前記固有分子タグの数に基づいて、工程c)で得た前記複数のアンプリコンにおける第1のアンプリコン集団のそれぞれの捕捉現象の数を測定することと、前記第1のアンプリコン集団は、前記目的の標的配列の前記シークエンスにより同定され、
    e)レプリコンを増幅したそれぞれのMIPにおける前記固有分子タグの数に基づいて、工程c)で得た前記複数のアンプリコンにおける第2のアンプリコン集団のそれぞれの捕捉現象の数を測定することと、前記第2のアンプリコン集団は、前記目的の標的配列の前記シークエンスにより同定され、
    f)工程d)で測定した捕捉現象の数の少なくとも一部に基づいて、そこから前記第1のアンプリコン集団を作製した、それぞれの目的の標的配列の部位捕捉基準を決定することと、
    g)少なくとも1つの判定基準を満たす、工程f)で決定した前記部位捕捉基準の第1のサブセットを同定することと、
    h)工程e)で測定した捕捉現象の数の少なくとも一部に基づいて、そこから前記第2のアンプリコン集団を作製した、それぞれの目的の標的配列の部位捕捉基準を決定することと、
    i)前記少なくとも1つの判定基準を満たす、工程h)で決定した前記部位捕捉基準の第2のサブセットを同定することと、
    j)工程g)で同定した部位捕捉基準の前記第1のサブセットから求めた第1の指標を、工程i)で同定した部位捕捉基準の前記第2のサブセットから求めた第2の指標で正規化して、検査比率を得ることと、
    k)前記検査比率を、正倍数性または異数性を示すことが既知である参照対象から単離した参照核酸試料に基づいて計算した、複数の参照比率と比較し、前記胎児における異数性を示す検査比率の有無を判定することと、
    を含む、前記方法。
  2. 前記1つまたは複数の固有分子タグが、前記配列内の少なくとも2つの固有分子タグ:
    第1の標的ポリヌクレオチドアーム−第1の固有分子タグ−ポリヌクレオチドリンカー−第2の固有分子タグ−第2の標的ポリヌクレオチドアーム;
    であり、
    前記MIPのそれぞれにおける前記第1及び第2の固有分子タグの組み合わせは、前記MIPのそれぞれにおいて異なっている、請求項1に記載の方法。
  3. 前記核酸試料はDNAまたはRNAである、請求項1または請求項2に記載の方法。
  4. 前記部位捕捉基準は、部位捕捉性能指標(SCE)または部位捕捉密度指標(SCC)である、請求項1から請求項3のいずれか1項に記載の方法。
  5. 工程b)で提供した前記MIPレプリコンのそれぞれは、
    iii)前記第1及び第2の標的ポリヌクレオチドアームをそれぞれ、前記核酸試料中の対応する前記第1及び第2の領域にそれぞれハイブリダイズすることと、前記第1及び第2の領域は目的の標的配列に隣接し、
    iv)前記ハイブリダイゼーション後、ライゲーション/伸長用混合液を用いて、前記2つの標的ポリヌクレオチドアーム間に存在するギャップ領域を伸長及びライゲートし、一本鎖環状核酸分子を作製することと、
    により作製される、請求項1から請求項のいずれか1項に記載の方法。
  6. 請求項1から請求項のいずれか1項に記載の方法であって、前記方法は、c)の前記シークエンシング工程の前に、インデックスPCR反応を含み、前記インデックスPCR反応は、以下の構成要素、一対のインデックスプライマー、固有試料バーコード、及び、一対のシークエンシングアダプターを、前記MIPアンプリコンのそれぞれに導入する、前記方法。
  7. 前記バーコード化MIPアンプリコンは、以下の構成要素、第1のシークエンシングアダプター−第1のシークエンシングプライマー−前記第1の固有分子タグ−前記第1の標的ポリヌクレオチドアーム−捕捉核酸−前記第2の標的ポリヌクレオチドアーム−前記第2の固有分子タグ−固有試料バーコード−第2のシークエンシングプライマー−第2のシークエンシングアダプター、を配列内に含む、請求項6に記載の方法。
  8. 前記検査比率及び前記参照比率は、染色体比率である、請求項1から請求項7のいずれか1項に記載の方法。
  9. 前記染色体比率は、目的の染色体由来の全固有捕捉現象の合計(S1)と、全ての染色体由来の全固有捕捉現象の合計(S1+S2)との比率により定義される、請求項8に記載の方法。
  10. 胎児における異数性をスクリーニングするための方法であって、
    a)母体血液試料由来のゲノムDNA試料を得ることと、
    b)前記ゲノムDNA試料を、マルチウェルプレートのそれぞれのウェルへと加えることと、前記マルチウェルプレートのそれぞれのウェルはプローブ混合液を含み、前記プローブ混合液は分子反転プローブ(MIP)集団及び緩衝液を含み、
    前記MIP集団内のそれぞれのMIPは、
    i)一対の第1及び第2の標的ポリヌクレオチドアームであって、前記MIPのそれぞれにおける前記第1及び第2の標的ポリヌクレオチドアームの対は、同一であり、且つ、前記複数の目的の標的配列におけるそれぞれの配列に隣接する、前記核酸内の第1及び第2の領域に対して、それぞれ実質的に相補的である、前記一対の第1及び第2の標的ポリヌクレオチドアーム;
    ii)1つまたは複数の固有分子タグ;及び
    iii)ポリヌクレオチドリンカー;
    を含み、
    前記MIPのそれぞれにおける前記第1及び第2の固有分子タグの組み合わせは、前記MIPのそれぞれにおいて異なっており、
    c)前記MIPの前記プローブ混合液を含む前記ゲノムDNA試料をインキュベートして、前記複数の目的の標的配列を捕捉することと、
    d)伸長/ライゲーション用混合液を、前記MIP及び前記複数の目的の標的配列を含むc)の前記試料へと加えて、複数のMIPアンプリコンを作製することと、前記伸長/ライゲーション用混合液は、ポリメラーゼ、複数のdNTP、リガーゼ、及び、緩衝液を含み、
    e)エキソヌクレアーゼ混合液を、前記標的及び対照MIPアンプリコンへと加えて、過剰プローブまたは過剰ゲノムDNAを除去することと、
    f)インデックスPCR用混合液をe)の前記試料へと加えて、一対のインデックスプライマー、固有試料バーコード、及び、一対のシークエンシングアダプターを、前記複数のアンプリコンへと加えることと、
    g)超並列シークエンシング法を用いて、前記固有分子タグの数に基づいて、工程f)で提供したバーコード化アンプリコンの第1の集団におけるシークエンシングリードの数を測定することと、バーコード化アンプリコンの前記第1の集団は、前記目的の標的配列の前記シークエンスにより同定され、
    h)超並列シークエンシング法を用いて、前記固有分子タグの数に基づいて、工程f)で提供したバーコード化アンプリコンの第2の集団におけるシークエンシングリードの数を測定することと、バーコード化アンプリコンの前記第2の集団は、前記目的の標的配列の前記シークエンスにより同定され、
    i)工程g)で測定した第1のシークエンシングリードの数の少なくとも一部に基づいて、部位捕捉基準を計算し、工程h)で測定した第2のシークエンシングリードの数の少なくとも一部に基づいて、複数の対照プローブ捕捉基準を計算することと、
    j)少なくとも1つの判定基準を満たす対照プローブ捕捉基準を有する前記MIPアンプリコンの前記集団における部位捕捉基準のサブセットを同定することと、
    k)前記部位捕捉基準を、前記少なくとも1つの判定基準を満たす対照プローブ捕捉基準の前記サブセットから計算した係数で正規化して、検査正規化部位捕捉基準を得ることと、
    l)工程b)〜工程h)における同一の標的部位及び対照部位、標的集団、対照集団のサブセットを用いて、前記検査正規化部位捕捉基準を、既知の遺伝子型を示す参照対象から得た参照ゲノムDNA試料に基づいて計算した複数の参照正規化部位捕捉基準と比較し、前記胎児における異数性を示す検査正規化部位捕捉基準の有無を判定することと、
    を含む、前記方法。
  11. 前記1つまたは複数の固有分子タグが、前記配列内の少なくとも2つの固有分子タグ:
    第1の標的ポリヌクレオチドアーム−第1の固有分子タグ−ポリヌクレオチドリンカー−第2の固有分子タグ−第2の標的ポリヌクレオチドアーム;
    であり、
    前記MIPのそれぞれにおける前記第1及び第2の固有分子タグの組み合わせは、前記MIPのそれぞれにおいて異なっている、請求項10に記載の方法。
  12. 前記血液試料は、全血試料、血漿試料、または、血清試料である、請求項1から請求項11のいずれか1項に記載の方法。
  13. 前記血液試料は、血漿試料である、請求項12に記載の方法。
  14. a)前記第1及び/または第2の標的ポリヌクレオチドアームの長さは、14〜30塩基対であり、及び/または、前記標的ポリヌクレオチドアームのそれぞれは、45℃〜80℃の融解温度を有し、及び/または、前記標的ポリヌクレオチドアームのそれぞれは、30%〜80%のGC含有量を有する;及び/または
    b)前記第1及び/または第2の固有分子タグの長さは、4〜15塩基対であり、及び/または、前記固有分子タグのそれぞれは、45℃〜80℃の融解温度を有する;及び/または
    c)前記ポリヌクレオチドリンカーは、20〜1,000塩基対の長さを有し、及び/または、前記ポリヌクレオチドリンカーは、45℃〜80℃の融解温度を有し、及び/または、前記ポリヌクレオチドリンカーは、30%〜80%のGC含有量を有する、請求項1から請求項13のいずれか1項に記載の方法。
  15. 前記標的ポリヌクレオチドアームのそれぞれは、30%〜70%のGC含有量を有する;及び/または、前記ポリヌクレオチドリンカーは、30%〜70%のGC含有量を有する、請求項14に記載の方法。
  16. 記ポリヌクレオチドリンカーは、少なくとも1種の増幅用プライマーを含む、請求項1から請求項15のいずれか1項に記載の方法。
  17. 前記ポリヌクレオチドリンカーは、増幅用フォワードプライマー及び増幅用リバースプライマーを含む、請求項16に記載の方法。
  18. 前記増幅用フォワードプライマーの前記配列は、5´−CTTCAGCTTCCCGATTACGG−3´(配列番号:1)のヌクレオチド配列を含む;及び/または、
    前記増幅用リバースプライマーの前記配列は、5´−GCACGATCCGACGGTAGTGT−3´(配列番号:2)のヌクレオチド配列を含む、請求項17に記載の方法。
  19. 前記ポリヌクレオチドリンカーは、5´−CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT−3´(配列番号:3)のヌクレオチド配列を含む、請求項1から請求項18のいずれか1項に記載の方法。
  20. 前記第1の標的ポリヌクレオチドアームは、5´−CACTGCACTCCAGCCTGG−3´(配列番号:4)のヌクレオチド配列を含む;及び/または、
    前記第2の標的ポリヌクレオチドアームは、5´−GAGGCTGAGGCAGGAGAA−3´(配列番号:5)のヌクレオチド配列を含む、請求項1から請求項19のいずれか1項に記載の方法。
  21. 前記MIPは、5´−CACTGCACTCCAGCCTGG(N1−6)CTTCAGCTTCCCGATTACGGGCACGATCCGACGGTAGTGT(N7−12)GAGGCTGAGGCAGGAGAA−3´(配列番号:6)のヌクレオチド配列を含み、(N1−6)は前記第1の固有分子タグを表し、(N7−12)は前記第2の固有分子タグを表す、請求項1から請求項20のいずれか1項に記載の方法。
  22. 前記シークエンシング工程は、6〜8百万リードの読み取り深度を有する、請求項1から請求項21のいずれか1項に記載の方法。
JP2018503647A 2015-07-29 2016-07-29 染色体異常を検出するための核酸及び方法 Active JP6830094B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562198654P 2015-07-29 2015-07-29
US62/198,654 2015-07-29
PCT/US2016/044914 WO2017020023A2 (en) 2015-07-29 2016-07-29 Nucleic acids and methods for detecting chromosomal abnormalities

Publications (3)

Publication Number Publication Date
JP2018524993A JP2018524993A (ja) 2018-09-06
JP2018524993A5 JP2018524993A5 (ja) 2019-09-05
JP6830094B2 true JP6830094B2 (ja) 2021-02-17

Family

ID=56610036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018503647A Active JP6830094B2 (ja) 2015-07-29 2016-07-29 染色体異常を検出するための核酸及び方法

Country Status (8)

Country Link
US (3) US10465245B2 (ja)
EP (2) EP3608420B1 (ja)
JP (1) JP6830094B2 (ja)
CN (1) CN108350500A (ja)
CA (1) CA2993347A1 (ja)
ES (1) ES2745556T3 (ja)
HK (1) HK1256543A1 (ja)
WO (1) WO2017020023A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2760439A1 (en) 2009-04-30 2010-11-04 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
WO2016040446A1 (en) 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
WO2016112073A1 (en) * 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
ES2745556T3 (es) * 2015-07-29 2020-03-02 Progenity Inc Acidos nucleicos y métodos para detectar anomalías cromosómicas
CA3005101A1 (en) * 2015-11-16 2017-05-26 Progenity, Inc. Nucleic acids and methods for detecting methylation status
US10787699B2 (en) * 2017-02-08 2020-09-29 Microsoft Technology Licensing, Llc Generating pluralities of primer and payload designs for retrieval of stored nucleotides
US11535886B2 (en) 2017-06-02 2022-12-27 Affymetrix, Inc. Array-based methods for analysing mixed samples using different allele-specific labels, in particular for detection of fetal aneuploidies
WO2018223053A1 (en) * 2017-06-02 2018-12-06 Affymetrix, Inc. Array-based methods for analysing mixed samples using differently labelled allele-specific probes
WO2018223055A1 (en) * 2017-06-02 2018-12-06 Affymetrix, Inc. Array-based methods for analysing mixed samples using differently labelled allele-specific probes
AU2019247652A1 (en) 2018-04-02 2020-10-15 Enumera Molecular, Inc. Methods, systems, and compositions for counting nucleic acid molecules
CN112739828B (zh) * 2018-06-11 2024-04-09 深圳华大生命科学研究院 确定待测样本类型的方法及系统
WO2020206170A1 (en) 2019-04-02 2020-10-08 Progenity, Inc. Methods, systems, and compositions for counting nucleic acid molecules
CN112063690A (zh) * 2020-09-18 2020-12-11 北京求臻医学检验实验室有限公司 单分子探针多重靶向捕获文库的构建方法及应用
EP4214243A1 (en) 2020-09-21 2023-07-26 Progenity, Inc. Compositions and methods for isolation of cell-free dna
CN112266948A (zh) * 2020-11-06 2021-01-26 中山大学孙逸仙纪念医院 一种高通量靶向建库的方法和应用
CN112458085A (zh) * 2020-12-10 2021-03-09 北京求臻医学检验实验室有限公司 一种新型分子捕获优化探针及其文库构建方法
WO2022140579A1 (en) * 2020-12-24 2022-06-30 Progenity, Inc. Methods of preparing assays, systems, and compositions for determining fetal fraction

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5866337A (en) 1995-03-24 1999-02-02 The Trustees Of Columbia University In The City Of New York Method to detect mutations in a nucleic acid using a hybridization-ligation procedure
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
SE9601676D0 (sv) 1996-04-30 1996-04-30 Ulf Landegren Improved probing of specific mucleic acids
WO1997045559A1 (en) 1996-05-29 1997-12-04 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US5817921A (en) 1996-07-12 1998-10-06 Advanced Technology Materials, Inc. Piezoelectric enviromental fluid monitoring assembly and method
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
WO1999049079A1 (en) 1998-03-25 1999-09-30 Ulf Landegren Rolling circle replication of padlock probes
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
FR2784683B1 (fr) * 1998-10-15 2002-12-13 Genset Sa Sondes fluorescentes de peinture chromosomique
GB9901475D0 (en) 1999-01-22 1999-03-17 Pyrosequencing Ab A method of DNA sequencing
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
WO2001023610A2 (en) 1999-09-29 2001-04-05 Solexa Ltd. Polynucleotide sequencing
EP1366192B8 (en) 2000-10-24 2008-10-29 The Board of Trustees of the Leland Stanford Junior University Direct multiplex characterization of genomic dna
GB2378245A (en) 2001-08-03 2003-02-05 Mats Nilsson Nucleic acid amplification method
WO2005014846A2 (en) * 2003-07-24 2005-02-17 Sequenom, Inc. Methods for identifying risk of breast cancer and treatments thereof
ATE510024T1 (de) 2003-10-31 2011-06-15 Advanced Genetic Analysis Corp Ab Verfahren zur herstellung eines gepaarten tag aus einer nukleinsäuresequenz sowie verfahren zur verwendung davon
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US7329860B2 (en) 2005-11-23 2008-02-12 Illumina, Inc. Confocal imaging methods and apparatus
US8828661B2 (en) 2006-04-24 2014-09-09 Fluidigm Corporation Methods for detection and quantification of nucleic acid or protein targets in a sample
WO2007147076A2 (en) * 2006-06-14 2007-12-21 Living Microsystems, Inc. Methods for the diagnosis of fetal abnormalities
EP4108780A1 (en) * 2006-06-14 2022-12-28 Verinata Health, Inc. Rare cell analysis using sample splitting and dna tags
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
CN101652780B (zh) 2007-01-26 2012-10-03 伊鲁米那股份有限公司 核酸测序系统以及方法
US20080269068A1 (en) 2007-02-06 2008-10-30 President And Fellows Of Harvard College Multiplex decoding of sequence tags in barcodes
CA2760439A1 (en) * 2009-04-30 2010-11-04 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
EP2504448B1 (en) * 2009-11-25 2016-10-19 Bio-Rad Laboratories, Inc. Methods and compositions for detecting genetic material
CA2767028A1 (en) * 2009-11-25 2011-06-03 Quantalife, Inc. Methods and compositions for detecting genetic material
WO2011085491A1 (en) * 2010-01-15 2011-07-21 The University Of British Columbia Multiplex amplification for the detection of nucleic acid variations
US8759036B2 (en) * 2011-03-21 2014-06-24 Affymetrix, Inc. Methods for synthesizing pools of probes
US10227635B2 (en) * 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
US10497461B2 (en) * 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
KR102393608B1 (ko) 2012-09-04 2022-05-03 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
CN105074007A (zh) * 2013-03-12 2015-11-18 考希尔股份有限公司 用于产前遗传分析的系统和方法
MX2015012733A (es) * 2013-03-15 2016-06-21 Immucor Gti Diagnostics Inc Metodos y composiciones para evaluar el estado renal usando adn libre de celulas de la orina.
US20150141257A1 (en) 2013-08-02 2015-05-21 Roche Nimblegen, Inc. Sequence capture method using specialized capture probes (heatseq)
WO2017020024A2 (en) 2015-07-29 2017-02-02 Progenity, Inc. Systems and methods for genetic analysis
ES2745556T3 (es) 2015-07-29 2020-03-02 Progenity Inc Acidos nucleicos y métodos para detectar anomalías cromosómicas

Also Published As

Publication number Publication date
EP3329010A2 (en) 2018-06-06
EP3329010B1 (en) 2019-07-10
EP3608420A1 (en) 2020-02-12
ES2745556T3 (es) 2020-03-02
US20170183731A1 (en) 2017-06-29
CA2993347A1 (en) 2017-02-02
WO2017020023A2 (en) 2017-02-02
US10947595B2 (en) 2021-03-16
CN108350500A (zh) 2018-07-31
US20200032344A1 (en) 2020-01-30
JP2018524993A (ja) 2018-09-06
EP3608420B1 (en) 2021-05-19
US10465245B2 (en) 2019-11-05
US20200354792A1 (en) 2020-11-12
WO2017020023A3 (en) 2017-03-09
HK1256543A1 (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
JP6830094B2 (ja) 染色体異常を検出するための核酸及び方法
US20220127683A1 (en) Detecting mutations for cancer screening
TWI661049B (zh) 使用不含細胞之dna片段大小以測定複製數變異之方法
JP6328934B2 (ja) 非侵襲性出生前親子鑑定法
EP3117011B1 (en) Methods and processes for non-invasive assessment of genetic variations
JP6161607B2 (ja) サンプルにおける異なる異数性の有無を決定する方法
EP3377647B1 (en) Nucleic acids and methods for detecting methylation status
US20190309352A1 (en) Multimodal assay for detecting nucleic acid aberrations
US20210130900A1 (en) Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
EP3827095A1 (en) Cell-free dna damage analysis and its clinical applications
Ishida et al. Molecular genetics testing
AU2018298437A1 (en) Target-enriched multiplexed parallel analysis for assessment of fetal DNA samples
US20220145368A1 (en) Methods for noninvasive prenatal testing of fetal abnormalities

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190729

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210125

R150 Certificate of patent or registration of utility model

Ref document number: 6830094

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350