CN103958696B - 多重核酸分析 - Google Patents

多重核酸分析 Download PDF

Info

Publication number
CN103958696B
CN103958696B CN201280001947.3A CN201280001947A CN103958696B CN 103958696 B CN103958696 B CN 103958696B CN 201280001947 A CN201280001947 A CN 201280001947A CN 103958696 B CN103958696 B CN 103958696B
Authority
CN
China
Prior art keywords
probe
nucleic acid
primer
target
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280001947.3A
Other languages
English (en)
Other versions
CN103958696A (zh
Inventor
姜正文
余锋
李才华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianhao gene technology (Suzhou) Co.,Ltd.
Original Assignee
Shanghai Genesky Bio-Tech Co Ltd
Tian Hao Biomedical Technology (suzhou) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Genesky Bio-Tech Co Ltd, Tian Hao Biomedical Technology (suzhou) Co Ltd filed Critical Shanghai Genesky Bio-Tech Co Ltd
Publication of CN103958696A publication Critical patent/CN103958696A/zh
Application granted granted Critical
Publication of CN103958696B publication Critical patent/CN103958696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6862Ligase chain reaction [LCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Abstract

本发明提供一种多重核酸分析方法。所述方法包括步骤:将探针组与样本中的目标核酸杂交;连接杂交的探针;扩增连接的探针;和检测扩增产物以确定样本中目标核酸是否存在或量。多重性的实现可部分通过在引物中添加可检测基团和插入填充序列以致于可以基于可检测基团和片段大小鉴定扩增产物。本发明还提供检测拷贝数小变化的灵敏方法,该方法通过检测测试样本中核酸上多个目标位点的拷贝数与对照样本比较,接着基于数个目标位点的检测拷贝数确定核酸的拷贝数。此外,本发明提供用于多重核酸分析和用于拷贝数小变化测定的试剂盒。

Description

多重核酸分析
技术领域
本发明总体涉及生物样本中的核酸分析领域,特别是利用基于多重连接的方法检测遗传变异。
背景技术
样本中的核酸分析在基础研究和临床中均有许多应用。例如,核酸分析可以用来识别患者血液样本中的遗传变异。遗传变异引起大量病理状态,包括综合征病症(如唐氏综合征)和疾病(如乳腺癌)。遗传变异可能是,但不限于,单核苷酸多态性(SNP),基因拷贝数变异(CNV现象),染色体重排(例如,插入、删除和复制),基因突变(例如,单核苷酸改变、插入和缺失)、核酸修饰(例如,甲基化、乙酰化和磷酸化),基因过表达(例如,致癌基因,如RAS)、或基因表达不足(例如,肿瘤抑制基因,如p53等)。此外,核酸分析可以用来识别病原体和转基因生物体。
为分析核酸,已经开发了很多技术。举例来说,诸如寡核苷酸连接试验(OLA)和连接酶链式反应(LCR)等技术已经用来检测SNP。参见,例如以下技术,Abravaya等,1995,“利用修饰连接酶链式反应检测点突变(GAP-LCR)”(Detection of point mutations with amodified ligase chain reaction(Gap-LCR)),Nucleic Acids Res.23:675-82;Landegren等,1988,“连接酶介导的基因检测技术”(A ligase-mediated gene detectiontechnique),Science.241:1077-80;Schwartz等,2009,“通过聚合酶链式反应/寡核苷酸连接试验识别囊性纤维化变种”(Identification of cystic fibrosis variants bypolymerase chain reaction/oligonucleotide ligation assay),J Mol Diagn.11:211-5。再例如,微阵列和高通量DNA测序可以用来检测染色体重排和基因拷贝数。参见,如,安捷伦人类基因组比较基因组杂交微阵列(安捷伦科技公司,圣克拉拉,加利福尼亚州)和“Illumina公司HiSeq DNA测序检测(Illumina公司,圣地亚哥,加利福尼亚州)。然而,利用这些已知技术分析核酸或者不易多重(如OLA和LCR方法),或者 费时、昂贵和/或不精确(例如,微阵列和高通量DNA测序)。
因此,需要新的技术使得核酸分析易于多重(multiplex)且有效。本发明的目的在于提供多重和有效地分析样本中核酸的方法和试剂盒。本发明的方法和试剂盒适合调整并整合到一体化装置或仪器以便在实验室或临床环境或现场应用。
背景技术中引用的参考文献不应视为“承认”它们是现有技术。申请人明确保留权利以证明,在适当的地方,根据适用的法律规定本文中引用的参考文献不构成现有技术。
发明概述
本概述简要介绍一组精选的本发明概念。发明详述部分提供了这些概念的详细描述。本概述并非要指出要求保护主题的关键或基本特征,也不用于限制要求保护主题的范围。从本发明的全部内容(包括背景技术、发明概述、发明详述、附图和权利要求书)中可以明白要求保护主题的其他特征、细节、用途和优势。
在一方面,本发明提供样本中多重核酸分析的方法。在一实施方式中,采用以下方法检测样本中的核酸:将一组探针加入到样本中形成混合物;使所述混合物中的核酸变性;将该组探针杂交到目标核酸的互补区域;在杂交的探针上实施连接反应以形成第三探针;用一组引物扩增所述第三探针以获得扩增产物;和通过测定所述扩增产物中所述第三探针的存在与否或量来检测所述样本中目标核酸的存在与否或量。
在每组探针中,至少具有第一探针和第二探针,所述第一探针具有第一部分和第二部分,所述第一部分与样本中目标核酸的第一区域至少部分互补,所述第二部分形成第一引物结合位点(本文中也称为引物结合序列),所述第二探针具有第一部分和第二部分,所述第一部分与样本中目标核酸的第二区域至少部分互补,所述第二部分用于形成第二引物结合位点。当两个探针均杂交到所述目标核酸时,所述第一探针的5’端基本上毗邻所述第二探针的3’端。
用于扩增连接产物的引物组包括与所述第一引物结合位点至少部分互补的第一引物;和与所述第二引物结合位点至少部分互补的第二引物。
在一些实施方式中,以多重方式使用该方法检测多种目标核酸。例如,可以多 重方式检测样本中多于约48、96、192、384或更多的目标核酸的存在与否或量。可以将与所有目标核酸相应的探针添加到样本中,实施单个连接反应以获得所有目标核酸的连接产物。
待检测的样本可以是动物的体液样本、活检组织样本或石蜡包埋组织样本。体液可以是源自动物(如人)的血液、血浆、血清、尿液、痰、脊髓液、脑脊液、胸水、乳头抽吸液、淋巴液、源自呼吸、肠道或泌尿生殖系统的液体、泪液、唾液、母乳、源自淋巴系统的液体、精液、脑脊液、器官内部系统液体、腹水、肿瘤囊液、羊水、或它们的组合。
在一些实施方式中,先从样本中提取核酸,再与探针组形成混合物。所述的目标核酸可以是DNA、RNA、或cDNA。可先将RNA逆转录成cDNA,再与探针组形成混合物。
在一些实施方式中,引物组的至少一种引物采用可检测的基团(如寡核苷酸标签或荧光染料)进行标记。荧光染料可以是FAM(5-或6-羧基荧光素)、VIC、NED、PET、荧光素(Fluorescein)、FITC、IRD-700/800、CY3、CY5、CY3.5、CY5.5、HEX、TET、TAMRA、JOE、ROX、BODIPYTMR、俄勒冈绿(Oregon Green)、罗丹明绿(Rhodamine Green)、罗丹明红(RhodamineRed)、德克萨斯红(Texas Red)或雅基马黄(Yakima Yellow)。在其他实施方式中,引物组中的至少一个引物包含填充序列(stuffer sequence)。一些引物中的填充序列可能有约10到约500个核苷酸。其他引物中的填充序列可能是约10到约60个核苷酸。在一些优选实施方式中,引物不多于约125个核苷酸,优选约75个核苷酸。还有的其他实施方式中,引物组的至少一种引物包括含有序列GTTTCTT的寡核苷酸或含有序列GTTTCTT的寡核苷酸的同功变异体。
在进一步的实施方式中,探针组的至少一种探针包含填充序列。在某些实例中,填充序列可能有约1到约200个核苷酸。在其它实例中,填充序列有约1到约55个核苷酸。在一些优选实施方式中,第三探针不超过约250个核苷酸。在其他优选实施方式中,第三探针不超过约140个核苷酸。在还有的一些优选实施方式中,探针不超过约125个核苷酸。在还有的一些其他优选实施方式中,探针不超过约70个核苷酸。在一些进一步优选的实施方式中,探针不超过约60个核苷酸。
在一些实施方式中,核酸分析的多重性可能是以下改进所致:引物组的至少一 种引物用可检测基团标记;且引物组的至少一种引物包含填充序列。在其他实施方式中,核酸分析的多重性可能是以下改进所致:引物组的至少一种引物用可检测基团标记;且探针组的至少一种探针包含填充序列。在还有的其他实施方式中,核酸分析的多重性可能是以下改进所致:,引物组的至少一种引物包含填充序列;且探针组的至少一个探针包含填充序列。在一些优选的实施方式中,核酸分析的多重性可能是以下改进所致:引物组的至少一种引物用可检测基团标记;引物组的至少一种引物包含填充序列;且探针组的至少一种探针包含填充序列。在这些实施方式中,可通过依据可检测基团和/或片段大小检测扩增产物中第三探针的存在与否或量来测定扩增产物中第三探针的存在、缺失或量。可以利用毛细管电泳进行该检测。
本发明方法可以应用在很多核酸测定中。第一个例子,可以使用该方法检测目标核酸中的单核苷酸多态性。为该目的,可设计与单核苷酸多态性相应的等位基因特异性探针。此外,在等位基因特异性探针中远离多态核苷酸的一个或多个位置,例如,第二、第三或第四核苷酸引入错配以增强探针结合的特异性。
第二个例子,可以使用该方法检测目标核酸中的拷贝数变异。在一实例中,使用选自SEQ ID No:158-541中的一个或多个探针对检测抗肌营养不良蛋白(dystrophin)基因中一个或多个外显子的缺失。
第三个例子,可以使用该方法筛选核苷酸中未知点突变、插入或缺失。在一实例中,使用选自SEQ ID No:158-541中的一个或多个探针对筛选抗肌营养不良蛋白基因中的点突变。
第四个例子,该方法可以用来检测信使RNA、甲基化DNA、病原体或转基因生物的存在与否或相对量。病原体可能是病毒或细菌。转基因生物可能是转基因植物(如转基因玉米、转基因水稻、转基因大豆或转基因棉花)或转基因动物(如转基因奶牛、转基因猪、转基因绵羊和转基因狗)。
在一些实施方式中,变性、杂交和连接步骤可重复约1到约100次。变性步骤可在约90℃到约99℃进行约5秒到约30分钟,杂交和连接步骤可在约4℃到约70℃同时进行约1分钟到约48小时。在优选实施方式中,变性步骤在约95℃进行约30秒,杂交和连接步骤在约58℃同时进行约4小时,且变性、杂交和连接步骤重复4次。
在本发明的另一个方面,提供检测拷贝数小变化的方法。在一实施方式中,为 检测目标核酸的拷贝数小变化,利用两组或多组探针杂交到相同目标核酸的两个或多个靶位,其中各组探针杂交不同的靶位。例如,拷贝数小变化可能是两个样本间目标核酸在量上的差异。在一些实例中,目标核酸在量上的差异是约0.1%到约30%。
在一些实施方式中,对于杂交到同一目标核酸中各靶位的各组探针,使用一组或多组参照探针杂交到一个或多个参照靶位,其中各组参照探针杂交到不同的参照靶位。例如,单个的靶位使用约1到约100组参照探针。在一些实例中,单个的靶位使用约6组参照探针。
在一些实施方式中,相同的引物组用于扩增一组连接产物(也称为第三探针)。由杂交到一个或多个靶位的一组或多组探针和由杂交到一个或多个参照靶位的一组或多组参照探针形成连接产物。例如,在一组连接产物中,可能有由杂交到目标基因靶位的约1到约100组探针和由杂交到参照靶位的约1到100组参照探针形成的连接产物。
在其他实施方式中,利用杂交到目标核酸上约50到约500个靶位的约50到500组探针来检测样本中目标核酸的拷贝数小变化。在该例中,可以获得由数个靶位的探针和参照位点的探针形成的数组连接产物。对于每组连接产物,可以使用同样的引物对扩增该组中的连接产物。
在一些优选实施方式中,目标核酸来自人类21号染色体、人类18号染色体、人类13号染色体、人类染色体22q11.2区、或人类X或Y染色体的伪体染色体区(pseudoautosomalregion)。因此,本发明的方法可以用于在母体血液或尿液样本中检测21号染色体、18号染色体、13号染色体、X染色体、Y染色体和染色体22q11.2区的胎儿非整倍性。在一实例中,利用选自SEQ ID NOs:559-942中的一个或多个探针对,采用该方法在母体血液或尿液样本中检测胎儿唐氏综合征。
在本发明的其他方面,提供测定样本中核酸的试剂盒。在一实施方式中,该试剂盒包括与目标核酸相应的一组或多组探针;扩增第三探针的一组或多组引物;任选的试剂,包括连接酶、连接反应缓冲液、DNA聚合酶、聚合酶链式反应缓冲液或它们的组合;以及任选的含有试剂盒使用说明的手册。
在一些实施方式中,探针组包括第一探针和第二探针,所述第一探针具有与样本中目标核酸的第一区域至少部分互补的第一部分和形成第一引物结合位点的第 二部分;所述第二探针具有与样本中目标核酸的第二区域至少部分互补的第一部分和用于形成第二引物结合位点的第二部分。当两个探针均杂交到目标核酸时,第一探针的5'端基本上与第二探针的3'端毗邻,进而第一和第二探针可能连接形成第三探针。在一些实例中,探针组中的至少一种探针包括填充序列。填充序列可能有约1到约200个核苷酸。
在其他实施方式中,引物组包括与第一引物结合位点至少部分互补的第一引物和与第二引物结合位点至少部分互补的第二引物。在一些实例中,引物组中至少一种引物用可检测基团(例如,寡核苷酸标签或荧光染料)标记。荧光染料可以是FAM(5-或6-羧基荧光素)、VIC、NED、PET、荧光素(Fluorescein)、FITC、IRD-700/800、CY3、CY5、CY3.5、CY5.5、HEX、TET、TAMRA、JOE、ROX、BODIPYTMR、俄勒冈绿(Oregon Green)、罗丹明绿(Rhodamine Green)、罗丹明红(Rhodamine Red)、德克萨斯红(Texas Red)或雅基马黄(Yakima Yellow)。还有的其他实施方式中,引物组的至少一种引物包括填充序列。填充序列含有约10到约500个核苷酸。
在一些实施方式中,该试剂盒是用于检测杜氏肌营养不良症,其包括含有选自SEQID NO:158-541的探针对的一组或多组探针。在其他实施方式中,该试剂盒是用于在母体的血液样本中检测胎儿唐氏综合征,其包括含有选自SEQ ID NO:559-942的探针对的一组或多组探针。
附图简述
图1是一流程图,描述了通过使用荧光染料标记的引物扩增连接产物来提高多重性的方法。
图2是一流程图,描述了通过使用含填充序列的引物扩增连接产物来提高多重性的方法。
图3是一流程图,描述了通过使用荧光染料标记的引物和含填充序列的引物扩增连接产物来提高多重倍数的方法。
图4是描述多重检测中示例性分析48个SNP的流程图,其中为扩增连接产物,使用荧光染料标记的引物和含填充序列的引物。X和Y指探针上的引物结合位点。LSHS指基因座(locus)特异性杂交序列。填充A指2个核苷酸长的等位基因特异性填 充序列。填充L1和填充L2是指用于调整连接探针大小的填充序列。ASHS指等位基因特异性杂交序列。F1、F2、F3和F4指分别用蓝色、绿色、黄色和红色荧光染料标记的正向引物。R1和R2指具有不同填充序列的反向引物。F1/R1(6)是指根据6个SNP基因座的12个连接产物,利用F1和R1引物对得到的12个扩增产物,其中各SNP基因座具有两个SNP等位基因。类似的解释适用于F2/R1(6)、F3/R1(6)、F4/R1(6)、F1/R2(6)、F2/R2(6)、F3/R2(6)和F4/R2(6)。
图5是描述多重检测中示例性分析96个CNV的流程图,其中为扩增连接产物,使用荧光染料标记的引物和含填充序列的引物。X和Y是指探针上的引物结合位点。LSHS指基因座特异性杂交序列。填充L1和填充L2是指用于调整连接探针大小的填充序列。F1、F2、F3和F4指分别用蓝色、绿色、黄色和红色荧光染料标记的正向引物。R1和R2指具有不同填充序列的反向引物。F1/R1(12)是指根据12个CNV的12个连接产物,利用F1和R1引物对得到的12个扩增产物。类似的解释适用于F2/R1(12)、F3/R1(12)、F4/R1(12)、F1/R2(12)、F2/R2(12)、F3/R2(12)和F4/R2(12)。
图6是描述多重检测中在靶区重叠分布的96个片段的示例性突变筛选分析的流程图,其中同时使用荧光染料标记的引物和含填充序列的引物扩增连接产物。标记所指组分同图5中详细描述的相似。
图7是描述多重检测中96个信使RNA的示例性基因表达分析的流程图,其中同时使用荧光染料标记的引物和含填充序列的引物扩增连接产物。标记所指组分同图5中详细描述的相似。
图8是描述多重检测中病原体或转基因植物/动物中的96个目标核酸的示例性分析的流程图,其中同时使用荧光染料标记的引物和含填充序列的引物扩增连接产物。标记所指组分同图5中详细描述的相似。
图9是描述多重检测中96个甲基化靶位的示例性分析的流程图,其中同时使用荧光染料标记的引物和含填充序列的引物扩增连接产物。标记所指组分同图5中详细描述的相似。
图10A、10B、10C、10D和10E是描述在48个SNP的多重检测中扩增产物的电泳模式的电泳谱图。图10A是全部96个扩增产物的电泳谱图。图10B、10C、10D和10E分别是用蓝色、绿色、黄色和红色荧光染料标记的引物产生的24个扩增产物的电泳谱图。
图11A、11B、11C、11D、11E、11F、11G和11H描述在192个拷贝数变体的多重检测中扩增产物的电泳模式的电泳谱图。图11A和11B分别是对照样本组A和组B的全部扩增产物的电泳谱图。图11C和11D分别是患者样本组A和组B的全部扩增产物的电泳谱图。图11E和11F分别是对照组和患者组样本用蓝色荧光染料标记的扩增产物的电泳谱图。图11G和11H分别是对照组和患者组样本用绿色荧光染料标记的引物产生的扩增产物的电泳谱图。图11F和11H内的箭头是指对应基因靶位的缺失峰。
图12A示出描述抗肌营养不良蛋白基因中全部基因靶位的计算的拷贝数的图表。X轴是指每个基因靶位的名字。Y轴是指每个基因靶位的计算的拷贝数。图12B是部分图12A图标的放大图,示出靶位E01A到E16B。图12C示出包括DMD_E07B基因靶位峰的两个谱图,其中一个源自健康对照,另一个源自男性DMD患者。图12D示出了DMD_07EB基因靶位周围区域的DNA测序结果的谱图。
图13A、13B、13C、13D、13E、13F、13G、13H、13I和13J是描述用于检测对照DNA样本中人类21号染色体拷贝数的扩增产物的电泳模式的电泳谱图。图13A和13F分别是对照样本组A和组B的全部96个扩增产物的电泳谱图。图13B、13C、13D和13E分别是用蓝色、绿色、黄色和红色荧光染料标记的对照样本组A获得的24个扩增产物的电泳谱图。图13G、13H、13I和13J分别是用蓝色、绿色、黄色和红色荧光染料标记的对照样本组B获得的24个扩增产物的电泳谱图。
图14示出描述计算的5个DNA样本中人类染色体21的拷贝数的图表。X轴是指五个样本:M0、M2、M4、M8和M16。Y轴是指计算的拷贝数。每个DNA样本重复测试三次。p值由T检验(斯式(Student)t检验)得出,用M0DNA样本的平均拷贝数作为参比。
图15示出了5个DNA样本的计算拷贝数和预期拷贝数的线性关系图。
发明详述
I.多重核酸分析
在一个方面,本发明提供多重核酸分析的方法。在一实施方式中,用于样本中目标核酸的多重分析方法包括以下步骤:制备与样本中多种目标核酸定量和定性相关的核酸;以及定量和定性检测由此制备的核酸。
如本文所用,用语“多重”(multiphex)或语法上的同义词指定量和定性测定样本中多于一种的目的核酸。在一实施方式中,“多重”指至少约48种不同的靶序列。在另一实施方式中,“多重”指至少约96种不同的靶序列。在其他实施方式中,“多重”指至少约192种不同的靶序列。在还有的其他实施方式中,“多重”指至少约384种不同的靶序列。在还有的其他实施方式中,“多重”是指至少约500到约100000种不同的靶序列。
如本文所用,存在有目标核酸的样本可能是源自对象的样本,包括,但并不限于,体液(例如,血液、血浆、血清、尿液、痰、脊髓液、脑脊液、胸水、乳头抽吸液、淋巴液、源自呼吸、肠道或泌尿生殖系统的液体、泪液、唾液、母乳、源自淋巴系统的液体、精液、脑脊液、器官内部系统液体、腹水、肿瘤囊液、羊水、或它们的组合);环境样本(例如,空气、农业的水和土壤样本);生物战剂样本;研究样本;纯化样本,如纯化的基因组DNA、RNA、蛋白质等;自然样本(细菌、病毒、基因组DNA等)。
术语“对象”应包括所有的动物。在具体的实施方式中,对象是哺乳动物、人或非人灵长类动物、狗、猫、马、牛、其他农场动物;或啮齿动物(如小鼠,大鼠,豚鼠等)。人对象可以是没有可观察异常如疾病的正常人。人对象可以是具有可观察异常如疾病的人。可观察到的异常可以是由人本人或由医疗专业人员观察到。术语“对象”、“患者”和“个体”在本文中可互换使用。
在一个方面,本发明提供与样本中多种目标核酸定量和定性相关的核酸的制备方法。该相关性通过以下一些机制实现,包括但并不限于:1)互补的核酸之间的特异性杂交;2)特异性酶识别,例如连接反应以连接基本上相邻的核苷酸,和聚合酶反应以基于模板序列将特定的核苷酸添加到已有的多核苷酸上。
如本文所用,“核酸”、“多核苷酸”和“寡核苷酸”可互换地使用,以表示共价连接在一起的至少两个核苷酸。可以通过例如化学合成、质粒或噬菌体DNA的限制性核酸内切酶消化、DNA复制、反转录或它们的组合产生寡核苷酸。核苷酸中的一个或多个可以经修饰,例如,引入甲基、生物素或地高辛部分、荧光标签,或使用放 射性核苷酸。
本发明中的核酸可以含有磷酸二酯键,虽然在一些实例中,包括的核酸类似物可具有任选的主链,包括,例如,磷酰胺,硫代磷酸酯,二硫代磷酸酯,O-甲基磷酰胺键,以及肽核酸主链和键。见例如,Pauwels等,1986年,CHEMICA Scripta 26:141-9;美国专利号5644048;Briu等,1989年,J.Am.Chem.Soc.111:2321和Carlsson等,1996,Nature380:207。其他核酸类似物包括具有正电主链(positive backbone)、非离子主链和非-核糖主链的那些。参见,例如,Denpcy等,1995年,Proc.Natl.Acad.Sci.USA92:6097;Jeffs等,1994,J.Biomolecular NMR34:17;美国专利号5,386,023、5,235,033和5,034,506。所有这些文献通过引用明确地并入本文。可修饰核糖-磷酸主链以便于添加标签,或增加该分子在生理环境下的稳定性和半衰期。
在一些实施方式中,肽核酸(PNA)可以用作本发明的核酸。在中性条件下,与天然存在核酸的高电荷磷酸二酯主链相反,PNA主链基本上是非离子的。这具有两个优点。首先,PNA主链显示出改善的杂交动力学特性。与完全匹配的碱基对相比,PNA的错配解链温度(Tm)有较大的变化。对于内部错配,DNA和RNA通常表现出Tm降低2-4℃。对于非离子的PNA主链,降低接近至7-9℃。从而能更好地检测错配。同样地,由于它们的非离子性质,连接于这些主链的碱基的杂交对盐浓度较不敏感。
如指出的那样,核酸可以是单链或双链的,或同时含有双链或单链序列的部分。核酸可以是DNA、基因组DNA、cDNA、RNA或杂合物。核酸可以包含脱氧核糖-和核糖-核苷酸的所有组合,碱基的所有组合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤(xanthanine)、次黄嘌呤、异胞嘧啶、异鸟嘌呤等。在一实施方式中,在设计与其他探针互补的核酸而非靶序列中,核酸利用异胞嘧啶和异鸟嘌呤,因为这会减少非特异性杂交,如美国专利号5,681,702中概述的。如本文所用,术语“核苷”包括核苷酸以及核苷和核苷酸类似物,修饰的核苷,如氨基修饰的核苷。此外,“核苷”包括非天然存在的类似物结构。因此,例如,本文将各含碱基的肽核酸的各个单元称为核苷。
在一些实施方式中,本发明的方法涉及目标核酸的多重检测。本文中,术语“目 标核酸”或语法上的等同物是指待分析的样本中待检测和/或定量的特定核酸序列。目标核酸可以是部分基因、调控序列、基因组DNA、cDNA或RNA,包括mRNA和rRNA。
互补核酸能够在常规的杂交条件下彼此杂交。术语“互补”是指两个核酸链的诸区域之间或同一核酸链的两个区域之间的序列互补性。已知第一核酸区域的腺嘌呤残基能够与和所述第一区域反向平行的第二核酸区域的残基(如果残基是胸腺嘧啶或尿嘧啶)形成特定的氢键(“碱基配对”)。同样,已知第一核酸链的胞嘧啶残基能够与和所述第一链反向平行的第二核酸链的残基(如果残基是鸟嘌呤)碱基配对。当核酸的第一区域与同一或不同的核酸的第二区域以反平行方式排列时,如果第一区域的至少一个核苷酸残基能够与第二区域的残基碱基配对,所述两个区域互补。在某些实施方式中,所述第一区域包括第一部分,第二区域包括第二部分,由此,当第一和第二部分以反平行方式排列,第一部分的至少约50%、至少约75%、至少约90%或至少约95%的核苷酸残基能够与所述第二部分的核苷酸残基碱基配对。在其它实施方式中,第一部分的所有核苷酸残基能够与第二部分中的核苷酸残基碱基配对。如本文所用,互补核酸的配对用术语“杂交”(hybridization)或“使杂交”(hybridizing)表示。
通过连接反应将基本毗邻的核苷酸进行连接、或通过DNA或RNA聚合酶反应基于模板序列将特定的核苷酸加入现有的多核苷酸,来实现特异性的酶识别。
连接酶是众所周知的,可以用于特异性的酶识别。参见,例如,Lehman,1974,Science,186:790-797;Engler等,DNA连接酶(DNA Ligases),第3-30页,刊于Boyer,《酶》(The Enzymes),第15B卷(学术出版社(Academic Press),纽约,1982)。优选的连接酶包括T3DNA连接酶、T4DNA连接酶、T7DNA连接酶、大肠杆菌DNA连接酶、Taq DNA酶、Pfu连接酶和Tth连接酶。他们的使用方案是众所周知的。参见,例如,Green和Sambrook,《分子克隆:实验手册(第四版)》(Molecular Cloning:ALaboratory Manual):3卷集,冷泉港实验室出版社,第4版(2012年6月15日)等。通常,连接酶需要存在5'磷酸基团以便与相邻链的3'羟基连接。
在一些实施方式中,优选的连接酶是具有最少错配连接的连接酶。可以通过用较大特异性的NAD+依赖连接酶(如大肠杆菌连接酶和(热稳定的)Taq连接酶)代 替较小特异性的T4DNA连接酶来提高连接酶的特异性。在连接反应中使用NAD类似物进一步提高连接反应的特异性。参见,例如,美国专利号5,508,179。
DNA或RNA聚合酶可以在模板存在下通过添加核苷酸延长核酸序列。正如本领域公知的,有各种各样合适的聚合酶。合适的聚合酶包括,但不限于,DNA聚合酶(包括DNA聚合酶I的Klenow片段、测序酶1.0(SEQUENASE1.0)和测序酶2.0(SEQUENASE2.0)(美国生化))、T5DNA聚合酶、phi29DNA聚合酶和各种RNA聚合酶,如来自栖热菌属(Thermus sp.)的、来自噬菌体的Qβ复制酶、或SP6、T3、T4和T7、RNA聚合酶。
在一些实施方式中,优选的聚合酶是基本上没有5'到3'核酸外切酶活性的那些,以保证第一探针不会延长超过第二探针的5'末端。缺乏5'到3'核酸外切酶活性的示例性酶包括DNA聚合酶的Klenow片段和Taq DNA聚合酶的Stoffel片段。(见例如,Lawyer等,1989年,J.Biol.Chem.,264:6427-6437和Lawyer等,1993年,PCR Meth.Appl.,2:275-287)。已经产生了衍生自百里香(T.vulgaris)的聚合酶的缺乏5'至3'核酸外切酶活性的其他突变型聚合酶。参见美国6,632,645。
在其他实施方式中,优选的聚合酶是缺乏3'到5'核酸外切酶活性的那些,这常称为校正活性,它在引物模板双链体的3'末端删除错配的碱基。虽然存在3'到5'核酸外切酶活性提高链合成的准确度,但在热稳定的DNA聚合酶,如Tma(包括缺乏5'到3'核酸外切酶活性的Tma突变体形式)中发现的3'至5'核酸外切酶活性也会降解单链DNA,如PCR中所用引物,单链模板和单链PCR产物。用于引物延伸过程中的寡核苷酸引物的3'末端的完整性是非常关键的,因为新生链是从该末端开始延伸。3'末端的降解生成缩短的寡核苷酸,这可能导致PCR反应丧失特异性。
还在其它实施方式中,更优选的聚合酶是热稳定的聚合酶。热稳定的酶是在最佳条件下在40°C一小时后能保留大部分活性的酶。缺乏5'至3'核酸外切酶和3'至5'核酸外切酶(活性)的热稳定聚合酶的例子包括Taq DNA聚合酶的Stoffel片段。由于遗传操作,该聚合酶缺乏5'到3'核酸外切酶活性,由于Taq聚合酶天然缺乏3'至5'核酸外切酶活性,因此不存在3'至5'活性。
在探针的3'末端添加一个或多个核苷酸的操作条件将取决于所使用的特定酶,通常会按照所用酶的制造商推荐的条件。
在一些实施方式中,通过不同的机制的组合实现相关性,例如互补核酸间的特异性杂交和连接基本上相邻核苷酸的连接反应的组合,或互补核酸间的特异性杂交和连接基本上相邻核苷酸的连接反应以及基于模板序列将特异性核苷酸加到现有多核苷酸上的聚合酶反应的组合。
在一些实施方式中,联用互补核酸间的特异性杂交和连接基本上相邻核苷酸的连接反应来制备与样本中的目标核酸定量和定性相关的核酸。因此,从样本中制备核酸的方法包括步骤:1)将探针与样本中的目标核酸杂交;和2)连接所述杂交的探针以获得与样本中的目标核酸定量和定性相关的核酸制品。
在其他实施方式中,联用互补核酸间的特异性杂交和连接基本上相邻核苷酸的连接反应以及基于模板序列将特异性核苷酸加到现有多核苷酸上的聚合酶反应来制备与样本中的目标核酸定量和定性相关的核酸。因此,从样本中制备核酸的方法包括步骤:1)将探针与样本中的目标核酸杂交;2)延伸所述探针之一以封闭所述探针之间的间隙,从而所述延伸的探针可以与相邻的探针连接;和3)连接所述杂交的和延伸的探针以获得与样本中的目标核酸定量和定性相关的核酸制品。
在一些实施方式中,可先从样本中提取目标核酸,再与探针杂交。本领域公知的核酸提取方法包括:使用的苯酚/氯仿、使用盐析过程、使用离液序列高的盐和二氧化硅树脂,使用亲和树脂,离子交换色谱法和使用磁珠。参见,例如,美国专利号5,0574,26和4,923,978、EP专利0512767、WO95/13368、WO97/10331和WO96/18731。本领域的分子生物学、生物化学、遗传学常规技术在文献中有完整的解释。参见,例如,Green和Sambrook,《分子克隆:实验手册》(第四版):3卷集,冷泉港实验室出版社,第4版(2012年6月15日);Carson,Miller和Witherow,《分子生物学技术》(Molecular Biology Techniques),第三版:《课堂教学实验室手册》(AClassroom Laboratory Manual),科学出版社;3版(11月21日,2011年);Cheng和Zhang,《分子遗传病理学》(Molecular Genetic Pathology),Humana出版社(4月15日,2008年)。
此外,当目标核酸优选切成便于处理和与探针杂交的尺寸时,特别是对于基因组DNA,可通过机械力(如超声处理)剪切核酸、通过用限制性核酸内切酶切割核酸或通过使用本领域中已知的任何其他方法来完成。
如本文所用,“探针”指能够选择性结合目标核酸的已知核酸序列。更具体地说,“探针”指这样一种寡核苷酸,其设计为与待检测核酸的一条链的序列充分互补,从而所述探针和所述核酸链会在选择的严格条件下杂交。此外,“探针”也指通过连接与核酸的基本上相邻区段杂交的一个或多个基本上相邻的寡核苷酸衍生的终产物。例如,“连接探针”是指一对探针间的连接反应的终产物。
如本文所用,术语“基本上相邻(毗邻)的”用于指彼此紧密接近的核酸分子。该术语也指两核酸分子之间足够的接近,使得一核酸5'端与第二核酸的3'端并列,从而他们可由连接酶连接。当第一探针的3'末端和第二探针的5'末端彼此充分靠近使得两个探针的末部连接,其中第一探针与一个区段杂交和第二探针与另一区段杂交,核酸区段定义为基本上相邻的。因此,当两个探针的末端彼此充分接近,从而两探针的末端能彼此连接时,该两个探针是基本上相邻的。
因此,在本发明的一些实施方式中,设计包括2种或多种探针的探针组与目标核酸杂交。目标核酸可包含数个目标区域,例如,目标核酸的第一目标区域可与第一探针或第一探针的部分杂交,目标核酸的第二目标区域可与第二探针或第二探针的部分杂交。此外,两个目标区域可以是相邻的或分离的。当两个区域是相邻的,例如,第一探针与第一目标区域杂交和第二探针与第二目标区域杂交,所述第一和第二杂交的探针可以是相邻的从而连接反应可连接两个探针形成第三探针。因此,第三探针能够与目标核酸的第一区域和第二区域杂交。当该两个区域被一个或多个核苷酸隔开,使用聚合酶和dNTP填充该第一和第二杂交探针之间的间隙以延伸探针中的一个,使得延伸探针和其他杂交探针可基本上相邻以形成第三探针。
术语“第一”和“第二”并不意味着所述序列根据目标序列的5'-3'方向而定向。例如,假定互补目标核酸是5'-3'方向,第一目标区域可以位于第二区域的5',或第二区域的3'。
因此,在一实施方式中,将本发明的探针设计为与目标核酸互补,使得探针与目标核酸杂交。这种互补性无需是完美的,可以有会干扰目标核酸和单链探针序列之间杂交的任意数目的碱基对错配。但是,如果错配的数目太多以致在某些杂交条件下不发生杂交,那么该序列不是互补靶序列。
此外,这些探针可以采用各种构型,并且可以具有各种结构组成。在一些实施 方式中,探针可以是等位基因特异性探针或基因座特异性探针。等位基因特异性探针包括等位基因特异性的杂交序列(ASHS)部分,其与目标核酸杂交并区分等位基因,或与目标核酸杂交并以等位基因特异性的方式修饰。基因座特异性探针包括基因座特异性杂交序列(LSHS)部分,其以基因座特异性方式与目标核酸杂交,但不一定要区分等位基因。基因座特异性探针也可被修饰,即延伸为如下文所述,使得它包含有关特定等位基因的信息,但基因座特异性引物本身不区分等位基因。可设计ASHS或LSHS的长度以赋予探针足够的特异性以便与目标核酸杂交。通常认为ASHS或LSHS序列越长,它们与目标核酸结合的特异性越强,本领域技术人员为了获得他/她的测试目标,掌握改变和确定ASHS或LSHS长度的知识,如本文详述的,例如实施例中。
在其它实施方式中,探针可以包括一个或多个除了ASHS或LAHS外的区段。在一些实例中,探针的其他区段可以是在聚合酶链式反应中引物结合于其上的引物结合位点。在其他实例中,探针的其他区段可以是填充序列,这使得连接产物具有不同的长度,并由此基于区段大小加以区分。本领域技术人员可设计引物结合位点和填充序列的长度以适合他/她的测试目标。例如,探针的引物结合位点可以是约15-20个核苷酸长,特别优选18个。对于另一实施例,根据区分不同的目标核酸的需要,探针的填充序列可以为约2-100个核苷酸。因此,对于目标序列,填充序列通常是非天然核酸,但其在探针序列中添加或插入。优选的填充序列是基因组(例如,人类基因组)中未发现的那些,并且它们不具有不期望的结构,如发夹环。
在一些实施方式中,双链目标核酸变性使它们为单链,从而目标核酸可与探针杂交。在其它合适方式中,利用热和/或碱可以实现变性。参见,例如,Green和Sambrook,《分子克隆实验手册》(第四版):3卷集,冷泉港实验室出版社,第4版(2012年6月15日)。在一些实施方案中,变性可在温度约90℃到约99℃进行约5秒到30分钟。在优选的实施方式中,变性可在约98℃进行5分钟。
可以使用不同的严格条件如改变杂交温度和缓冲组成以确定单链目标核酸和探针之间是否存在错配。对于温度,与完美匹配和错配之间碱基配对呈现函数关系的氢键数目中的差异可用作它们不同Tm的结果。在限定的离子强度、pH和核酸浓度下,Tm是平衡时50%与靶标互补的探针与靶序列杂交的温度。因此,包含完美 互补性的杂交核酸与包含至少一个错配(其他参数相同)的核酸相比,在较高的温度解链。其他参数包括杂交核酸的长度,主链(即天然存在的或核酸类似物)的性质,测定溶液的组成,和核酸的组成,例如,G-C含量。
高严格条件是导致杂交复合物中保留完美匹配,而不含不完美匹配的那些条件。在另一方面,低严格条件是允许形成具有完美和不完美匹配的杂交复合物的那些条件。严格条件依赖于序列,在不同的情况下将是不同的。较长的序列在较高的温度下特异性杂交。
核酸杂交指南可在Tssen,生物化学与分子生物学技术-核酸探针杂交(Techniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes),“杂交原理和核酸检测策略综述”(Overview of principlesofhybridization and the strategy ofnucleic acid assays)(1993年)中找到。一般而言,对于具体的序列,严格条件的选择是在规定的离子强度和pH条件下,比解链温度Tm低约5-10℃。严格条件可以是以下条件:pH为7.0至8.3,盐浓度小于约1.0M钠离子,通常约0.01-1.0M钠离子浓度(或其它盐),短探针(例如10至50个核苷酸)的温度(比解链温度低)至少约3℃,而长探针(例如大于50个核苷酸)的温度(比解链温度低)至少约6℃。严格条件下也可加入去稳定剂,如甲酰胺来实现。在另一实施方式中,可采用较低严格杂交条件,例如,中或低的严格条件,如本领域中已知的。参见,例如,Tijssen,同上。
同样地,缓冲组成的变化可以用来阐明在检测位置是否存在错配。合适的条件包括但不限于,甲酰胺浓度。因此,例如,“低的”或“容许的”严格条件包括0~10%的甲酰胺浓度,而“高的”或“严格的”条件使用40%的甲酰胺浓度。低严格条件包括1M的NaCl浓度,而高严格条件包括0.3M的浓度。此外,低严格条件包括10mM的氯化镁浓度,中等严格条件为1~10mM,而高严格条件包括1mM浓度。
连接酶催化两个彼此相邻的核苷酸之间的共价结合。通过互补链维持两个核苷酸接近来促进连接反应,所述两个核苷酸包含两个多核苷酸的3'和5'末端并且在两个末端之间没有间隙。此外,连接反应需要5'末端暴露有磷酸基或3'末端暴露有羟基团。
可以使用能够连接核苷酸的任何酶进行连接。在一些实施方式中,使用Taq DNA连接酶连接与目标核酸杂交的两个相邻寡核苷酸探针。Taq DNA连接酶催化两个相邻寡核苷酸探针的并列5'磷酸和3'羟基末端之间的磷酸二酯键形成,其中所述探针与互补目标DNA杂交。只要寡核苷酸与互补目标DNA完全配对,他们之间没有间隙,就发生连接,因此,如果没有连接产物生成,可以检测单碱基取代。
连接反应的条件取决于使用何种连接酶。对于热稳定连接酶,连接酶在升高的温度下保持活性。例如,Taq DNA连接酶在45-65℃保持活性。对于非热稳定连接酶,连接酶在较低温度有活性。例如,T4DNA连接酶在16℃左右有活性。因此,在一实施方式中,根据使用的连接酶,连接反应的温度可以从约4℃至约70℃。
连接酶的量和连接反应的持续时间可能取决于探针和目标核酸的量。本领域技术人员可以调整反应中连接酶的加入量和反应时间,从而可以获得需要的连接产物。例如,在本发明的一些实施方式中,40单位的Taq DNA连接酶用于20μl的连接反应。一个单位定义为在45℃、15分钟内、50微升总反应体积中,1微克BstEⅡ-消化的λDNA的12个碱基对粘性末端获得50%的连接所需要的酶量。
在一些实施方式中,连接反应的持续时间是约1分钟~48小时。在其它实施方式中,连接反应的持续时间是约16小时。在其它实施方式中,变性、杂交和连接步骤重复数次,使更多探针与目标核酸杂交或与新连接的探针杂交。例如,探针和目标核酸的混合物可以在约90℃至约99℃保持约5秒至约30秒进行变性,然后在约4℃至约58℃保持约1分钟至48小时以便杂交和连接,该循环可以重复100次。在一些优选的实施方式中,例如,探针和目标核酸的混合物可以在约95℃保持约30秒进行变性,然后在58℃保持约4小时以便杂交和连接,该循环可以重复4次。
在其他实施方式中,目标核酸上杂交的探针之间有间隙。在一些实例中,该间隙可以用与目标核酸中该间隙互补的另一探针填充。设计该间隙填充探针,使得当它与核酸杂交时,它的两个末端与其他两个探针基本上相邻。在其他实例中,可通过延伸与目标核酸杂交的探针之一来填充该间隙。可以使用DNA聚合酶和dNTP进行此探针延伸。DNA聚合酶的说明如上文所述。对于这两种间隙填充方法,均要进行连接反应以连接基本上相邻的间隙填充探针与其他两个探针或连接基本上相邻的延伸探针与另一探针,从而获得连接产物。可以在合适的参数下进行连接反应,包括但不限于,连接酶的类型、连接酶的量和连接反应的持续时间,如上文所述。
在一些实施方式中,随后可直接分析连接产物以确定样本中目标核酸是否存在或含量。在其它实施方式中,随后扩增连接产物以得到扩增产物,分析该扩增产物以测定样本中目标核酸是否存在或含量。
如本文所用,“扩增”指特定核酸的拷贝数增加。扩增反应中制成的特定核酸的拷贝称为“扩增子”或“扩增产物”。
核酸扩增方法包括不限于,聚合酶链式反应(PCR)(美国专利号4,683,195,4,683,202,4,800,159和5,219,727)和它的变体,如原位聚合酶链式反应(美国专利号5,538,871),定量聚合酶链式反应(美国专利号5,219,727)和巢式聚合酶链反应(美国专利号5,556,773)。上述参考文献中对这些方法的教导通过引用并入本文。
在一些实施方式中,通过PCR实施扩增。PCR扩增过程导致离散的DNA片段(它们的长度通过寡核苷酸引物的5'末端限定)指数增加。
在一些实施方式中,探针中包括通用的引物结合位点,利用通用引物扩增全部目标核酸的连接产物。或者,通用引物结合位点“组”包含在相应探针“组”中,通用引物“组”用于同时或顺序扩增连接产物“组”,以获得用于进一步分析的扩增产物“组”。
因此,本发明的一些实施方式中,为多重核酸分析提供探针“组”,各探针“组”包括第一探针和第二探针。根据测定、样本和测试目的,本文中多重指至少两种目标核酸,优选超过10种。在一些实施方式中,多重是指超过48、96、192或384种目标核酸。
如本文所用,术语“引物”指寡核苷酸(有时合成制得),当置于诱导与模板核酸链互补的引物延伸产物合成的条件下(即在适当的缓冲液中、在合适的温度下,存在不同的核苷三磷酸酯和聚合酶),该寡核苷酸能够作为核酸序列合成的起始点。引物序列不必反映模板的确切序列。例如,非互补的核苷酸片段可连接到的引物的5'末端,引物序列的其余部分与模板基本上互补。
在一些实施方式中,引物序列的5'部分包括寡核苷酸GTTTCTT。当聚合酶如Taq聚合酶用于PCR时,加入寡核苷酸GTTTCTT可能有助于在PCR产物的3'末端上非模板化添加腺苷酸。参见,例如,Brownstein等,通过Taq DNA聚合酶调节非模板核苷酸的添加:促进基因分型的引物修饰(Modulation of Non-Templated Nucleotide Addition by TaqDNAPolymerase:Primer Modifications that Facilitate Genotyping),BioTechniques20:1004-1010(1996年6月)。持续加入腺苷酸可能有助于具有大部分或全部PCR产物一致具有腺苷酸末端。因此,这些PCR产物的基因分型结果是一致的。如果不持续加入腺苷酸,PCR产物可能不会有一个碱基对长度的变异,PCR产物的基因分型结果可能不一致。在一些实施方式中,用于扩增连接产物的反向引物包括寡核苷酸GTTTCTT或它的功能等同物,例如,GTTTCTTG。
在一些实施方式中,通过添加可检测的基团(例如,甲基、生物素或地高辛部分,或荧光标签)修饰引物的一个或多个核苷酸。对于某些实例,所述部分是荧光染料,染料可以是但不限于,FAM(5-或6-羧基荧光素)、VIC、NED、PET、荧光素(Fluorescein)、FITC、IRD-700/800、CY3、CY5、CY3.5、CY5.5、HEX、TET、TAMRA、JOE、ROX、BODIPY TMR、俄勒冈绿(OregonGreen)、罗丹明绿(Rhodamine Green)、罗丹明红(Rhodamine Red)、德克萨斯红(TexasRed)或雅基马黄(Yakima Yellow)。参见,例如,美国专利公开号20110151459中可以用在本发明中标记引物的荧光染料,,美国专利公开号20110151459的相关教导通过引用纳入本文。
在一实施方式中,添加可检测基团到用于扩增连接产物的引物来增强核酸分析的多样性。在一实施例中,用于标记引物的部分是FAM-蓝、VIC-绿、NED-黄和PET-红(生命科技“Life Technologies”公司)。如图1所示,根据本发明的一实施方式,为分析样本中目标核酸T01、T02、T03和T04,设计各目标位点的两探针(这里称为右探头和左探针,如它们在图中呈现的),使得各探针包含基因座特异性杂交序列(LSHS)和引物结合位点。右探针包含引物结合位点Y。所有的目标核酸的右探针可共享引物结合位点Y。相反,各目标核酸的左探针包含独特的引物结合序列(X1,X2,X3和X4)。引物结合序列并入连接产物。为扩增连接产物,为对应于各目标位点的各连接产物设计一对引物。由于左探针具有四个独特的引物结合位点,分别设计对应四个独特的引物结合位点的四个独特的正向引物(F1,F2,F3和F4)。在该实施例中,正向引物F1用FAM-蓝色荧光染料、F2用VIC-绿、F3用NED-黄、F4用PET-红标记。反向引物R结合到引物结合位点Y。因此,目标T01的扩增产物用FAM-蓝色荧光染料标记。目标T02、T03和T04的扩增产物分别用VIC-绿、NED-黄和PET-红标记。然后,基于用于标记各产物的不同荧光染料,可通过毛细管电泳分析荧光标记的扩增产物。即使不同目标核酸的扩增产物具有相同长度,用荧光染料差异标记的扩增产物仍可以区分。
在另一实施方式中,通过改变用于扩增连接产物的引物的长度来增强核酸分析的多重性。在一实施例中,为改变引物的长度,引物中插入填充序列。PCR反应期间,填充序列可掺入扩增产物,即,引物可延伸以形成扩增产物从而合并填充序列。因此,加入填充序列助于依据片段大小区分扩增产物。在图2中所示的一个实施方式中,填充序列插入引物R2,使目标T02的扩增产物相比于目标T01的产物,具有更大的片段。如图2所示,根据本发明的一实施方式,为检测样本中目标核酸T01和T02,为各目标核酸设计两个探针(在这里称为右探针和左探针,如它们在图中显示),使各探针包含基因座特异性杂交序列和引物结合序列。左探针包含两目标位点的左探针共享的引物结合序列X。相反,右探针包含独特的引物结合序列(Y1或Y2)。引物结合序列可掺入连接产物。为扩增连接产物,为对应各目标位点的各连接产物设计一对引物。正向引物结合到两连接产物共享的引物结合位点X。设计与独特的引物结合位点Y1和Y2结合的引物,使之具有插入5'部分的填充序列。在一实施例中,如果两目标位点的连接产物长度相同,反向引物R2包含填充序列,使得R2比R1长,F/R2的扩增产物比F/R1的扩增产物长。在一些实施方式中,填充序列可具有约10至约500个核苷酸。在其它实施方式中,填充序列可具有约10至约60个核苷酸。在一些优选实施方式中,各引物的长度不超过125个核苷酸。在其它优选实施方式中,各引物的长度不超过75个核苷酸。然后,可以依据不同片段的大小,通过毛细管电泳分析扩增产物。即使扩增产物用相同的荧光染料标记,不同目标核酸的连接产物长度相同,仍可区分如此得到的扩增产物。
在还有其它实施方式中,通过联用荧光染料标记的引物和插入有填充序列的引物来增强核酸分析的多重性。例如,如图3所示,正向引物用四种荧光染料标记:F1-FAM-蓝、F2-VIC-绿色、F3-NED-黄色和F4-PET红色。此外,反向引物R2包含填充序列,但R1不包含填充序列。因此,该组合可能导致检测连接产物的多重性增加八倍;依据片段大小和荧光标记物,可以通过检测相应扩增产物区分八种相同长度的连接产物。
在还有其它实施方式中,可以通过在与目标核酸杂交且连接形成连接产物的探针中插入填充序列来提高本发明核酸分析的多重性。探针中插入填充序列可以生成连接产物,其具有对应于特定目标核酸的独特序列长度。例如,按照本发明的一实施方式,要区分样本中16个目标核酸T01-T16,为各目标核酸设计两个基因座特异性探针(在这里称为右探针和左探针,如它们在图中显示)。左探针包含基因座特异性杂交序列和通用引物结合序列X。各目标核酸的右探针包含基因座特异性杂交序列、填充序列和通用引物结合序列Y。各目标核酸的填充序列的长度可变,例如,对于T01,右探针没有填充序列;对于T02,右探针有2个核苷酸的填充序列;对于T03,有4个核苷酸;对于T04,有6个核苷酸;对于T05,有8个核苷酸;对于T06,有10个核苷酸;……对于T16,有30个核苷酸。因此,各目标核酸的连接产物具有独特的片段大小,因为探针中的填充序列并入连接产物。任选用与通用引物结合位点X和Y结合的一对通用引物进一步扩增连接产物。因此,扩增产物的片段大小与连接产物的片段大小匹配,由此可基于片段大小进行检测。因此,如果探针中没有填充序列,连接产物长度相同,探针中加入填充序列就可能依据片段大小区分各目标核酸的连接产物和/或扩增产物。在此实施例中,目标核酸分析的多重性增加16倍。因此,如在本实施方式中所示例,多重性倍数增加可能取决于插入基因座特异性探针内不同长度的填充序列数。如果不同长度的12种填充序列插入各目标核酸的基因座特异性探针,目标核酸分析的多重性可以增加12倍。
因此,根据本发明,通过在探针中插入填充序列提高多重性的方法可以与通过用可检测的部分标记引物和/或在引物中插入填充序列提高多重性的方法联用。例如,通过荧光染料标记引物同时在探针中插入填充序列,可以依据荧光染料和片段大小,通过毛细管电泳区分对应于64个目标核酸的64个扩增产物(参见图1,下图)。再例如,通过同时在引物和探针中插入填充序列,可以依据片段大小,通过毛细管电泳区分对应于24个目标核酸的24个扩增产物(参见图2,下图)。再例如,通过荧光染料标记引物和在引物及探针中插入填充序列,可以依据荧光染料和片段大小,通过毛细管电泳区分对应于64个目标核酸的64个扩增产物(参见图3,下图)。
可以通过依据大小、质量、荧光部分或其他可测性能来分离DNA片段的任何方法分析扩增产物。这些方法包括但不限于,琼脂糖凝胶电泳后进行毛细管电泳(CE)、DNA测序、溴化乙锭或DNA染色、微阵列和流式细胞分析。
例如,毛细管电泳可以依据荧光部分和片段大小鉴定DNA片段。在一些实施方式中,通过将DNA片段注入填充有聚合物的毛细管中进行毛细管电泳。通过应用电场牵引DNA通过管,进行片段分离,如此更小的片段更快地通过毛细管度。然后依据附着在PCR所用引物上的荧光染料检测片段。这样能扩增许多片段,并以多重方式同时运行。使用加入各样本的标记DNA大小标准品指定大小。在毛细管电泳中,扩增产物的信号强度是其相应峰的相对荧光单位(rfu)数。强度值与标记的扩增产物量相关。
在一些实施方式中,毛细管电泳是分析本发明的扩增产物的优选方法。毛细管电泳装置是本领域中已知的。可用于本发明的毛细管电泳装置包括但不限于,美国应用生物系统公司(加利福尼亚福斯特市)的ABI3130XL基因分析仪;安发玛西亚生物技术公司(Amersham Pharmacia Biotech,新泽西州皮斯卡塔韦)的MegaBACE1000芯片毛细管电泳系统;贝克曼库尔特公司的CEQTM8000遗传分析系统(加利福尼亚州富勒顿);Caliper技术公司(Caliper Technologies加利福尼亚山景城)安捷伦2100生物分析仪和汇聚生物科技有限公司(Convergent Bioscience Ltd.加拿大多伦多)的iCE280系统。
在本发明通篇中,包括背景、概述、详述和权利要求在内,“左”探针和“右”探针的指定是任意的和可互换的。例如,左探针具有所述右探针的特征,右探针具有所述左探针的特征。此外,“第一”引物和“第二”引物,或“正向”引物和“反向”引物的指定也是任意的、可互换的。另外,当PCR扩增反应中寡聚引物与模板DNA上的引物结合位点结合时,表示该寡聚引物与模板DNA的正链或负链结合。当引物与单链DNA的相对链互补时,引物与单链DNA的结合位点反向互补。本领域熟知,要成功进行PCR反应,正向引物和反向引物不结合DNA模板的同一链。相反,如果需要指数扩增,正向引物和反向引物结合DNA模板的不同链。
II.多重核酸分析的应用
本发明的多重核酸分析方法可以用于检测各种遗传变异,包括但不限于,单核苷酸多态性(SNP),基因拷贝数变异(CNV),染色体异常(例如,插入,删除和复制),基因突变(如单核苷酸的变化,插入和删除),核酸修饰(如甲基化,乙酰化和磷酸化)和基因表达异常。有些变异可以是定性的变化,例如,SNP是否存在。 其他变异可能是定量的,例如,基因拷贝数的变化。量上的变化可以大或可以小。例如,在唐氏综合征患者的基因组DNA样本中,21号染色体的拷贝数增加50%。相比之下,怀有唐氏综合征胎儿的孕妇血液样本中,21号染色体拷贝数的增加小于10%。
术语“分析”、“检测”、“测量”、“评价”、“测定”、“评估”和任何语法上的同义词可互换使用,指任何形式的定量或定性测定,包括检测特性、性状或特征的存在与否。核酸分析可以是相对的或绝对的。例如,可以相对于参考样本中核酸的拷贝数测量样本中核酸拷贝数的增加。
多重SNP检测。
近期人类基因组学的研究表明,在任何两个人之间,基因组构成具有99.9%以上的相似性。个体之间较少量的DNA变化产生表型性状差异,可能与许多人类疾病,对各种疾病的易感性,或疾病治疗的反应相关。个体之间的DNA变化发生在编码和非编码区,包括单核苷酸的变化,以及核苷酸的插入和缺失。在基因组中单核苷酸的变化称为“单核苷酸多态性”或“SNP”。基因组中SNP的发生与各种疾病和症状的存在和/或易感性相关。由于获得这些相关性和人类基因遗传学的其它进步,总体上医药和个人健康正朝向定制化方案发展,其中考虑患者的基因组信息等因素,为他/她作出适当的医疗和其他选择。因此,为提供个性化的医学和其他决策,需要为个人和他们的照顾者提供个体的自身基因组特定的信息。
本发明的多重SNP检测方法在图4中示出。在该示例中,48个SNP位点同时在单次检测中确定。为了说明目的,一个SNP在多态位点具有C或T核苷酸。设计一组探针(本文称为右探针和左探针,如它们在图中显示)。左探针包含在一末端含有SNP识别核苷酸“C”或“T”的等位基因特异性杂交序列(ASHS),引物结合位点X,在ASHS和引物结合位点之间的填充A序列,和在填充A序列和引物结合位点之间的填充L1序列。填充A序列有助于区分每个SNP位点的等位基因。右探针包含基因座特异性杂交序列(LSHS),引物结合位点Y,和在LSHS和引物结合位点之间的填充L2序列。通过改变填充L1和L2序列的长度,可实现连接产物的六倍多重性;依据片段的大小可区分6个SNP位点的连接产物。在一些实例中,在远离SNP识别位点的2,3或4位核苷酸处将错配引入探针。这些错配可能有助于提高ASHS与目标位点杂交的特异性。参见,例如,Luo等,提高嗜热菌DNA连接酶的精确度“Improving the fidelity ofThermus thermophilus DNA ligase”Nucleic Acids Res.1996年8月1日;24(15):3071-8,作为参考引入本文。
此外,通过用FAM-蓝色、VIC-绿、NED-黄和PET-红标记正向引物,并在反向引物R2中插入填充序列,SNP分析的多重性增加至96(=6×2×4×2)。因此,多重SNP的检测方法可以同时分析48个SNP位点,其中各SNP位点具有两个等位基因。本领域技术人员可以通过改变参数,如,在更多探针中插入填充系列、用更多荧光标签标记引物或在更多引物中插入填充序列来提高SNP检测的多重性。因此,如果需要,多重性可能会增加至192、384、768或更多。
多重CNV检测
如本文所用,CNV指与参照样本中存在的核酸序列的拷贝数相比,测试样本中包含2个或更多个核苷酸的核酸序列的拷贝数的变化。CNV可以包括缺失、微缺失、插入、微插入、复制、倍增、倒位、易位和复杂的多点变化。CNV还可以包含可导致许多遗传疾病的染色体非整倍性和部分非整倍性,所述遗传疾病有,例如唐氏综合征、特纳氏(Turner’s)综合征、狄乔治(diGeorge)综合征、安格尔(Angelman)曼综合征、猫叫综合征(Cri-du-chat)、卡曼氏(Kallmann)综合征、Miller-Dieker综合征、普拉德-威利综合征(Prader-Willisyndrome,PWS)、史密斯-马盖尼斯(Smith-Magenis)综合征、类固醇硫酸酯酶缺乏症(X-连锁鱼鳞病)、威廉斯(Williams)综合征和沃尔夫-赫塞豪恩(Wolf-Hirschhorn)综合征。
图5中示出示例性的本发明多重CNV检测方法。在该示例中,在单次检测中同时测定96个CNV。对于每个CNV,设计一组探针(本文称为右探针和左探针,如它们在图中显示)。左探针包含基因座特异性杂交序列(LSHS),引物结合位点X,和位于LSHS和引物结合位点X之间的填充L1序列。右探针包含基因座特异性杂交序列(LSHS),引物结合位点Y,和位于LSHS和引物结合位点Y之间的填充L2序列。通过改变填充L1和L2序列的长度,连接产物可实现12倍多重性,根据片段大小可区分12个CNV的连接产物。此外,通过用FAM-蓝、VIC-绿、NED-黄和PET-红标记正向引物和在反向引物R2中的一个插入填充序列,CNV分析的多重性可以增加至96(=12×4×2)。因此,多重CNV检测方法可以同时分析96个CNV。本领域技术人员 可以通过改变参数,例如,在更多的探针中插入填充序列,用更多的荧光标签标记引物或在更多的引物内插入填充序列来增加CNV检测的多重性。因此,如果需要,多重性可以增加至192、384、768或更多。
在一些实施方式中,每个峰的荧光强度与标准值进行比较以确定每个CNV位点的拷贝数。例如,如果与标准值相比强度降低一半,可以认为拷贝数降低一半。在另一方面,如果与标准值相比强度增加50%,可以认为拷贝数增加50%。标准值可以是测试系统特定的荧光强度值。测试系统是指整个实验系统,包括用于检测CNV的试剂、引物、探针、步骤和设备。如果除了待检测的初始DNA不同,整个测试系统是相同的,一个测试样本被认为与另一测试样本共享相同的测试系统。因此,可以基于CNV位点拷贝数已知的在先DNA样本的检测结果获得特定测试系统的标准值。
在其它实施方式中,对照样本用来产生相同CNV位点的对照荧光强度值。对照样本的各CNV位点的拷贝数已知。当测试样本中CNV位点的峰强度与对照样本中相同CNV位点的峰强度相比较时,可以确定CNV位点的拷贝数。例如,如图5底部图所示,箭头1指出一CNV位点,对于该位点,测试样本中的拷贝数是对照样本中拷贝数的约50%,因当与对照样本中相同CNV位点的峰强度相比,峰强度降低约50%。再例如,箭头2指出一CNV位点,对于该位点,测试样本中的拷贝数是对照样本中拷贝数的约150%,因当与对照样本中相同CNV位点的峰相比,峰荧光强度增加约50%。
在其它优选的实施方式中,各CNV位点的峰值相对于一个或多个参照目标位点的峰值进行标准化。通过比较测试样本中CNV位点的标准化峰值与测试系统中相同CNV位点的标准化的标准值,或与对照样本中相同CNV位点的标准化的峰值相比较可确定CNV拷贝数的变化。标准化可以校正不同样本之间和/或不同CNV位点之间的峰值获得期间的偏差,如用于探针杂交的DNA模板量、用于探针杂交的连接探针量、用于扩增连接产物的PCR引物量、各组探针的连接效率和用于PCR扩增的连接产物量。
为了获得参照目标位点的峰值,以相似的方式设计用于参照目标位点的探针,与用于CNV位点的探针同时用于杂交和连接反应。此外,参照目标位点的探针和 CNV位点的探针可以共享相同的引物结合位点,使得可利用同组引物扩增参照位点和CNV位点的连接产物。
如在某些实例中,数个参照目标位点的峰值与数个CNV位点的峰值平行获得,从而可依照使得数个参照目标位点中各自的峰值标准化数个CNV位点中各自的峰值。例如,6个参照目标位点的峰值可以与6个CNV位点的峰值同时获得。在该例中,将6个参照目标位点的6组探针和6个CNV位点的6组探针加入样本,在杂交和连接反应后获得连接产物。可利用单一一组引物扩增连接产物,通过毛细管电泳分析扩增产物来测定峰值。
在一些实施方式中,样本中CNV位点峰值的标准化是为获得CNV位点的峰值与参照目标位点的峰值的比例(这里称为R)。因此,通过测试样本中CNV位点的比例(这里称为Rtest)和测试系统中相同CNV位点的标准比例(这里称为Rstandard)或和对照样本中相同CNV位点的比例(这里称为Rcontrol)相比较,可以检测测试样本中CNV位点的拷贝数。
在一些实例中,通过测试样本中CNV位点的比例(Rtest)和测试系统中相同CNV位点的标准比例(Rstandard)相比较,可以检测测试样本中CNV位点的拷贝数。测试系统中CNV位点的拷贝数已知(这里称为Cstandard)。在这种情况下,测试样本中CNV位点的拷贝数(这里称为Ctest)可以采用下式计算:Ctest=Cstandardx Rtest/Rstandard
在其它实例中,通过测试样本中CNV位点的比例(Rtest)和对照样本中相同CNV位点的比例(Rcontrol)相比较,可以检测测试样本中CNV位点的拷贝数。测试系统中CNV位点的拷贝数已知(这里称为Ccontrol)。在这种情况下,测试样本中CNV位点的拷贝数(这里称为Ctest)可以采用下式计算:Ctest=CcontrolxRtest/Rcontrol
因此,当引入6个参照目标位点以标准化CNV位点峰值时,在6个参照目标位点的6个峰值的基础上可以得到CNV位点的6个拷贝数测量(Ctest)。基于6个Ctest测量,根据特定的统计分析获得CNV位点的拷贝数。在一个实施方式中,6个Ctest测量的中位值被视为CNV位点的拷贝数。在另一实施方式中,6个Ctest测量的平均值被视为CNV位点的拷贝数。
在多重CNV分析方法中,可以在单管PCR反应中使用多组引物以扩增连接产物。在该例中,各组引物用于扩增CNV位点和参照目标位点的一组连接产物,从而 能相对于同组中参照目标位点的峰值标准化CNV位点的峰值。根据探针设计,各组中CNV位点或参照目标位点数可以从1到24有所不同。在一些实施方式中,各组有6个CNV位点和6个参照目标位点。在其它实施方式中,各组有12个CNV位点和12个参照目标位点。在还有的其它实施方式中,各组有9个CNV位点和3个参照目标位点。在另外的其它实施方式中,各组有16个CNV位点和8个参照目标位点。
有时,参照目标位点的选择是基于以下标准,包括但不限于:每个参照目标位点的拷贝数在不同样本中是稳定的,参照目标位点的序列是独特的且不易干扰目标CNV的反应。此外,当多个参照目标位点用于一组,优选各参照目标位点源自不同的染色体。在一些实施方式中,可通过增加参照目标位点数提高检测拷贝数变化的质量。
在一些实施方式中,当进行标准化并获得测试样本和对照样本的各CNV位点的标准化峰值时,可比较测试样本中标准化峰值与对照样本中的值以检测各CNV位点的拷贝数的任何变化。例如,如果测试样本中CNV位点的标准化峰值是1.0,对照样本中相同CNV位点(CNV位点的拷贝数已知为2)的标准化峰值是2.0,则测试样本中CNV位点的拷贝数被测定为1,约为对照样本中拷贝数的一半。再例如,如果测试样本中CNV位点的标准化峰值是1.0,测试系统(CNV位点的拷贝数已知为2)中标准化峰值是2.0,则测试样本中CNV位点的拷贝数被测定为2,约与对照样本中拷贝数相同。
突变筛选
DNA突变是指与野生型基因组相比,基因组中的核苷酸变化。“野生型”是指某种基因或基因产物,当从天然来源分离时,它们具有该基因或基因产物的特性。野生型的基因是群体中最常观察到的那些,因此随意设计基因的“正常”或“野生型”形式。相反,“突变体”是指某种基因或基因产物,当与野生型基因或基因产物相比时,它们在一个或多个位点上具有不同的核酸序列。
在一些实施方式中,可通过本发明方法筛选基因突变。图6中示出本发明的示例性多重突变筛选方法。在该示例中,在单次检测中同时筛选96个目标位点。对于各目标位点,设计一组探针(本文称为右探针和左探针,如它们在图中显示)。左探针包含基因座特异性杂交序列(LSHS),引物结合位点X和在LSHS和引物结合位 点X之间的填充L1序列。右探针包含基因座特异性杂交序列(LSHS),引物结合位点Y和在LSHS和引物结合位点Y之间的填充L2序列。通过改变填充序列的长度,连接产物可实现12倍多重性,根据片段大小可区分12个目标位点的连接产物。此外,通过用FAM-蓝、VIC-绿、NED-黄和PET-红标记正向引物和在反向引物R2中的一个插入填充序列,突变筛选的多重性可以增加至96(=12×4×2)。因此,多重突变筛选方法可以同时分析96个目标位点。本领域技术人员会考虑通过改变参数,例如,在更多的探针中插入填充序列,用更多的荧光标签标记引物或在更多的引物内插入填充序列来增加突变筛选的多重性。因此,如果需要,多重性可以增加至192、384、768或更多。
如图6所示,探针组设计成彼此重叠。探针可以靶向正链、负链或正链和负链。在所有情况下,类似于图5中的基本原理,各目标位点的峰强度与对照样本中相同目标位点的峰强度或标准值进行比较。可以采用图5中描述的类似方式获得标准值。如图6底部图所示,箭头指向的峰具有对照样本中相同目标位点的约一半强度。峰强度降低表明目标位点可能含有突变。这是因为对应于目标位点的两个探针覆盖突变,因此不能与目标位点杂交形成合适的连接产物,最终导致没有扩增产物。该示例性的突变筛选方法提供目标核酸中的突变位置的初步结果。这可能有助于进一步测序分析,以确定确切的突变。
多重RNA分析
在一些实施方式中,样本中的目标核酸是RNA,该目标核酸的分析是为确定样本中RNA是否存在或数量。在本发明的某些实例中,直接使用RNA进行探针杂交、探针连接、连接产物扩增和扩增产物分析。在其他实例下,将RNA反转录成互补DNA(cDNA),然后进行探针杂交和进一步的步骤。正如本领域中已知的,可以使用逆转录酶完成RNA反转录为cDNA。如果RNA是基因反转录产物,RNA的分析可能有助于确定基因表达水平。
因此,在一些实施方式中,可以使用本发明的多重方法分析目标RNA。图7示出本发明的示例性多重目标RNA分析方法。在该示例中,在单次检测中同时分析96个目标RNA或它的反转录cDNA。对于各目标RNA或cDNA,设计探针组(本文称为右探针和左探针,如它们在图中显示)。左探针包含基因座特异性杂交序列 (LSHS),引物结合位点X和在LSHS和引物结合位点X之间的填充L1序列。右探针包含基因座特异性杂交序列(LSHS),引物结合位点Y和在LSHS和引物结合位点Y之间的填充L2序列。通过改变填充序列的长度,连接产物可实现12倍多重性;基于片段大小可区分12个目标位点的连接产物。此外,通过用FAM-蓝、VIC-绿、NED-黄和PET-红标记正向引物和在反向引物R2中的一个插入填充序列,突变筛选的多重性可以增加至96(=12×4×2)。因此,多重基因表达分析可以同时检测96个目标RNA。本领域技术人员会考虑通过改变参数,例如,在更多的探针中插入填充序列,用更多的荧光标签标记引物或在更多的引物内插入填充序列来增加目标RNA分析的多重性。因此,如果需要,多重性可以增加至192、384、768或更多。
在一些实施方式中,如图7所示,类似于图5中的基本原理,先相对于参照目标位点标准化各目标RNA的峰值,再检测不同样本间RNA拷贝数变化是否存在、或量。参照目标位点可以是任何RNA,例如管家基因的RNA,包括但不限于,组蛋白、β-肌动蛋白、甘油醛-3-磷酸脱氢酶(GAPDH)或次黄嘌呤-鸟嘌呤磷酸核糖转移酶(HPRT)基因。在多重RNA分析中,可同时分析多组目标RNA和参照目标位点。相同的引物组用于扩增各组内目标RNA和参照目标位点的连接产物。通过比较测试样本中目标RNA的标准化峰值和对照样本中目标RNA的标准化峰值确定目标RNA的拷贝数。如果该值增加两倍,目标RNA的拷贝数增加两倍,峰值标准化和拷贝数检测方法的其他方面与描述相对于参照目标位点的峰值标准化CNV位点的那些相似,因此,此处不再重复。
病原体和转基因生物的多重检测
本发明的多重核酸分析方法可以用于检测病原体和转基因生物体的核酸,从而鉴定病原体和转基因生物。病原体(包括但不限于,细菌、病毒、原生动物、寄生虫、霉菌或真菌)可能会导致动物疾病或其他症状。已经开发一些方法(包括细菌分析、病毒分离和培养、组织病理学和酶联免疫吸附试验(ELISA)(Adams和Thompson,2008,Rev.Sci.Technol.27,197-209))用于表型特征和鉴定病原体。或者,利用特定引物组扩增核酸的依据聚合酶链式反应(PCR)、RT-PCR(Dhar等,2002年,J.Virol.Methods.104,69-82;Nishizawa等,1995年,J.Gen.Virol.76,1563-1569)或定量实时PCR(DallaValle等,2005年,Vet.Microbiol.110,167-179) 的分子诊断已证明可用于诊断疾病。开发新的多重、快速、准确、灵敏的诊断方法来鉴定病原体可能有助于治疗、控制、或甚至消除很多病原体有关的疾病。此外,有时可能需要鉴定转基因生物,包括转基因植物(如玉米、水稻、大豆和棉花)和转基因动物(如牛、猪、羊和狗)。
本发明的一方面提供病原体和转基因生物体的多重检测。在一些实施方式中,获得病原体或转基因生物的特异性目标核酸以供多重分析。在某些实例下,病原体或转基因生物的特异性核酸可以是病原体或转基因生物的独特DNA或病原体或转基因生物家族的独特DNA。病原体或转基因生物可以有很多来源。例如,在筛选血液和其他体液和组织中的致病和非致病性细菌、病毒、寄生虫,真菌等,或转基因的基因时,来源可以是可从活的动物或死的动物获得的血液和其他体液或组织样本。在其他实例中,病原体或转基因生物的特异性核酸可以是病原体或转基因生物的独特RNA或病原体或转基因生物体家族的独特RNA。例如,RNA病毒(如HIV、HBV和HCV病毒)包含独特的RNA分子,检测这些独特的RNA分子有助于确定这些RNA病毒是否存在或量。
在一些实施方式中,先扩增目标核酸,再作多重分析。当从病原体或转基因生物体获得的目标核酸量有限时,需要这种扩增。在其它实施方式中,当目标核酸是RNA时,可任选进行逆转录步骤以先将RNA转换成cDNA再作多重分析。
本发明用于检测病原体或转基因生物的示例性多重目标核酸分析方法示于图8。在该示例中,在单次检测中同时分析96个目标核酸。对于各目标核酸,设计一组探针(本文称为右探针和左探针,如它们在图中显示)。左探针包含基因座特异性杂交序列(LSHS),引物结合位点X和在LSHS和引物结合位点X之间的填充L1序列。右探针包含基因座特异性杂交序列(LSHS),引物结合位点Y和在LSHS和引物结合位点Y之间的填充L2序列。通过改变填充序列的长度,连接产物可实现12倍多重性;基于片段大小可区分12个目标核酸的连接产物。此外,通过用FAM-蓝、VIC-绿、NED-黄和PET-红标记正向引物和在反向引物R2中的一个插入填充序列,多元病原体或转基因生物体检测的多重性可以增加至96(=12×4×2)。因此,多重病原体或转基因生物检测分析可以同时检测96个目标核酸。本领域技术人员会考虑通过改变参数,例如,在更多的探针中插入填充序列,用更多的荧光标签标记引物或在 更多的引物内插入填充序列来增加目标核酸分析的多重性以便检测病原体和转基因生物。因此,如果需要,多重性可以增加至192、384、768或更多。
如本领域技术人员在本发明内容基础上所理解的,存在对应于目标核酸的峰表明存在相应病原体或转基因生物体。正如图8底部图所示,箭头指向对应于两目标核酸的两个峰,表明存在两种相应的病原体。而不存在对应于剩余86个目标核酸的峰表明不存在86种相应的病原体。以圆圈示出的峰为阳性对照,它的存在表明测试系统是有功能的。
在其它实施方式中,本发明的方法可以用于定量检测病原体和转基因生物的量。为该目的,此应用过程背后的基本原理与上文多重RNA分析部分为定量检测RNA表达水平所描述的那些类似,除了外源性的核酸可以用作参照目标位点。在一些实施方式中,将一定量的外源DNA或RNA片段加入样本,用作参照目标位点。例如,在测定血浆样本中HIV病毒负荷时,先将相同量的外源RNA片段与各样本的相同量的血浆混合,再提取RNA。可以根据外源性参照RNA片段标准化HIV RNA的峰值来定量检测HIV RNA水平,从而定量评估HIV负荷。
多重DNA甲基化分析
基因组DNA的表观遗传修饰(epigenetic modification),如DNA甲基化模式的变化与许多疾病或其他健康状况相关。正常非甲基化的CpG富集区,也被称为CpG-岛的异常甲基化与许多疾病基因,例如抑癌基因、DNA修复基因、转移抑制基因的转录失活相关。参见,例如,Jain PK,表观遗传学:甲基化在抑癌基因的作用机制中的作用“Epigenetics:therole of methylation in the mechanism of action of tumor suppressor genes”,AnnN YAcad Sci.2003年3月983:71-83。需要多重、快速、准确地检测DNA甲基化模式的方法,这可能有助于潜在的疾病或其他健康状况的诊断、预后、预测和评估治疗计划。
图9中示出了本发明的示例性多重DNA甲基化检测方法。在该示例中,在单次的检测中同时分析96个目标甲基化位点。在某些实例下,用甲基化敏感的限制性核酸内切酶,如HpaII或HhaI处理测试样本中具有目标甲基化位点的DNA,使得在接近或靠近甲基化位点的位置上切割未甲基化的DNA。甲基化敏感的限制性核酸内切酶的处理可以在探针杂交步骤之前、同时或之后进行。在一些实施方式中,该处理 在探针杂交步骤之前进行。在这种情况下,如果测试样本中的DNA被切割,设计与接近或靠近目标DNA上的甲基化位点杂交的探针可能不连接,从而可能没有扩增产物产生。相反,如果测试样本中的DNA在甲基化位点是甲基化的,因此可以不被甲基化敏感的限制性核酸内切酶切割,设计与接近或靠近目标DNA上的甲基化位点杂交的探针可以连接,从而产生相应的扩增产物。在其它实施方式中,该处理在探针杂交步骤同时或之后进行。在这种情况下,探针可与接近或靠近甲基化位点的目标DNA杂交,如果目标DNA不是甲基化的,甲基化敏感的核酸内切酶可切割杂交的探针/目标DNA双链体,因此没有扩增产物生成。相反,如果目标DNA是甲基化的,甲基化敏感的核酸内切酶不切割杂交的探针/目标DNA双链体,因此生成扩增产物。
如图9所示,在两种情况下,在本发明的示例性多重甲基化检测方法中,为各目标甲基化位点设计一组探针(本文称为右探针和左探针,如它们在图中显示)。左探针包含基因座特异性杂交序列(LSHS),引物结合位点X和在LSHS和引物结合位点X之间的填充L1序列。右探针包含基因座特异性杂交序列(LSHS),引物结合位点Y和在LSHS和引物结合位点Y之间的填充L2序列。通过改变填充L1和L2序列的长度,连接产物可实现12倍多重性;基于片段大小可区分12个目标甲基化位点的连接产物。此外,通过用FAM-蓝、VIC-绿、NED-黄和PET-红标记正向引物和在反向引物R2中的一个插入填充序列,甲基化检测的多重性可以增加至96(=12×4×2)。因此,多重甲基化检测可以同时测量96个目标甲基化位点。本领域技术人员可以通过改变参数,例如,在更多的探针中插入填充序列,用更多的荧光标签标记引物或在更多的引物内插入填充序列来增加甲基化检测的多重性。因此,如果需要,多重性可以增加至192、384、768或更多。
在其它实例中,测试样本中的DNA用亚硫酸氢盐处理,使非甲基化的胞嘧啶(本文称为“C”)被转换为尿嘧啶。因此,亚硫酸氢盐处理使得非甲基化位点的核苷酸变化,将目标DNA中非甲基化的“C”转变为“U”。相反,在亚硫酸氢盐处理后,甲基化的“C”保持为“C”。因此,设计特异性探针结合试验DNA的甲基化等位基因或非甲基化等位基因:在甲基化的C位点含“C”和在未甲基化的C位点含“U”的甲基化等位基因,在所有C位点含“U”的未甲基化等位基因。根据需要检测的等位基因,下文简述这些特异性探针的设计。
如图9所示,当先对目标DNA作亚硫酸氢盐处理时,可在单次检测中同时检测96个甲基化位点。为了说明的目的,设计一组探针(本文称为右探针和左探针,如它们在图中显示)。左探针包含具有甲基化位点识别核苷酸“G”的甲基化特异性杂交序列(MSHS),引物结合位点X和在MSHS和引物结合位点X之间的填充L1序列。右探针包含具有甲基化位点识别核苷酸“G”的甲基化特异性杂交序列(MSHS),引物结合位点Y和在MSHS和引物结合位点Y之间的填充L2序列。通过改变填充L1和L2序列的长度,连接产物可实现12倍多重性,基于片段大小可区分12个甲基化位点的连接产物。此外,通过用FAM-蓝、VIC-绿、NED-黄和PET-红标记正向引物和在反向引物中的一个插入填充序列,甲基化检测的多重性可以增加至96(=12×4×2)。因此,多重甲基化检测可以同时检测96个目标甲基化位点。本领域技术人员可以通过改变参数,例如,在更多的探针中插入填充序列,用更多的荧光标签标记引物或在更多的引物内插入填充序列来增加甲基化检测的多重性。因此,如果需要,多重性可以增加至192、384、768或更多。在一些实施方式中,当仅需检测非甲基化的等位基因时,使用非甲基化特异性探针而非甲基化特异性的杂交探针。在其它实施方式中,当既需要检测甲基化又需要检测非甲基化的等位基因时,既使用甲基化又使用非甲基化特异性探针。设计甲基化和非甲基化特异性探针的基本原理与上文所述的那些相似,因此,此处不再重复。
在使用甲基化敏感的限制酶和使用亚硫酸氢盐处理的两种方法中,扩增产物的分析可以确定目标DNA中甲基化核苷酸是否存在。在使用甲基化敏感的限制酶的方法中,只有DNA被甲基化才出现扩增峰。在使用亚硫酸氢盐处理和具有甲基化位点识别核苷酸“G”的MSHS探针的方法中,只有DNA被甲基化才出现扩增峰。因此,在这两种方法中,存在峰表明目标DNA中存在甲基化核苷酸,不存在峰表明目标DNA中不存在甲基化核苷酸。如图9底部图所示,箭头指向扩增产物中的峰,表明测试样本中相应的甲基化位点包含甲基化的核苷酸。不存在对应于其他甲基化位点的峰表明测试样本中那些其它的甲基化位点不包含甲基化的核苷酸。以圆圈示出的峰是阳性对照,它的存在表示测试系统是有功能的。
在一些实施方式中,多重DNA甲基化分析可以检测样本中甲基化DNA的相对量。为了检测样本中甲基化DNA的相对量,首先根据参照目标位点的峰值标准化测 试样本中各目标甲基化位点的峰值,然后与对照样本中标准化的峰值比较。有时,参照目标位点的选择基于以下标准,包括但不限于,不同样本中甲基化敏感的限制酶消化或亚硫酸氢盐处理后各参照目标位点的拷贝数是稳定的,参照目标位点的序列是独特的且不易干扰目标甲基化位点的反应。此外,当多个参照目标位点成组使用时,优选各参照目标位点来自不同的染色体。在多重DNA甲基化分析中,可以同时分析多组目标甲基化位点和参照目标位点。在各组内,相同组的引物用于扩增目标甲基化位点和参照目标位点的连接产物。通过将测试样本中目标甲基化位点的标准化峰值与对照样本中目标甲基化位点的标准化峰值相比较,确定目标甲基化位点中甲基化DNA的相对量。如果该值增加两倍,目标甲基化位点中甲基化DNA的相对量增加两倍。标准化方法的其他方面与相对于参照目标位点的CNV位点的峰值标准化所述的那些相似,因此此处不再重复。
III.拷贝数小变化的检测
在另一个方面,本发明提供检测两个样本之间核酸的小量变化的方法。核酸的小量变化可能是核酸(例如,基因、部分染色体或全部染色体)拷贝数的小变化。如本文所用,核酸的小量变化是指低于50%的任何拷贝数变化。事实上,在本发明的一些实施方式中,该方法可以检测约0.1%至约30%的拷贝数小变化。在其它实施方式中,该方法可以检测约8%、6%、4%、2%、1%或0.1%的拷贝数小变化。
例如,如果胎儿具有不同拷贝数的人21号染色体、人18号染色体、人13号染色体、人22q11.2染色体区或人X或Y染色体的拟常染色体区,母体血液中这些染色体区的拷贝数可以在小范围变化。在一实例中,如果胎儿有唐氏综合征,母体血液中21号染色体的拷贝数可能会小范围增加。增加通常小于10%。因此,本发明的方法可以用于检测母体血液中人21号染色体、人18号染色体、人13号染色体、人22q11.2染色体区或人X或Y染色体的拟常染色体区的拷贝数小变化。人X或Y染色体的拟常染色体区(PAR1和PAR2)不以严格的伴性遗传方式继承,可以用于检测人X或Y染色体对的拷贝数。参见,例如,Mangs和Morris,人的拟常染色体区(PAR):起源、功能与未来“The Human Pseudoautosomal Region(PAR):Origin,Function and Future”,Curr Genomics,2007年4月,8(2):129-136,通过引用纳入本文。
在一实施方式中,用于检测测试样本中核酸的拷贝数小变化的方法包括步骤: 检测测试样本中核酸内多个目标位点的拷贝数,通过统计分析多个目标位点中各自的测得拷贝数来确定核酸的拷贝数。
根据本发明,为检测核酸的拷贝数小变化,选择核酸中多个目标位点用于分析,从而获得统计学显著的结果来定量确定核酸的拷贝数变化。如本文所用,多个目标位点是指超过约5个目标位点,优选超过约10个目标位点,更优选超过100目标位点。如果需要更灵敏的检测,目标位点的数量可以增加至约100-500。本领域技术人员可以基于本发明的内容或根据在先测试结过凭经验决定目标位点的数量。
可以通过许多技术,包括与上文描述的CNV检测方法类似的多重核酸分析方法、采用DNA测序技术的多重核酸分析和实时PCR完成多个核酸位点中各自拷贝数的测量。
在一示例中,使用与上文描述的CNV检测方法类似的多重核酸分析方法。与图5中所示的方案相似,在单次检测中同时检测96个目标位点的拷贝数。此处不再重复描述探针、引物和测试过程的设计,除了下文描述了峰强度的统计分析。
在一些实施方式中,检测测试样本中各目标位点的荧光峰强度,并与测试系统中相同目标位点的标准峰值进行相比,以确定目标位点的拷贝数。标准值可以是特定测试系统中对应于目标位点的荧光强度值。测试系统是指整个实验系统,包括用于检测拷贝数变化的试剂、引物、探针、步骤和设备。如果除待测的原始DNA样本外,整个实验系统是相同的,则认为某测试样本与另一测试样本共享相同的测试系统。因此,可以基于先前的DNA样本测试结果获得特定测试系统的标准值。如果DNA样本来源于正常或野生型的对象,标准值是正常的或野生型的标准值。如果DNA样本来源于异常的对象,标准值是异常的标准值。
在其它实施方式中,利用对照样本生成目标位点的对照荧光峰强度值。对于对照样本,各目标位点的拷贝数已知。当获得测试样本中目标位点的荧光峰值并与对照样本中相同的目标位点的峰值进行比较时,可以确定目标位点的拷贝数。
在一些优选的实施方式中,与上文为CNV拷贝数变化检测所描述的标准化和拷贝数检测方法相似,各基因目标位点(如感兴趣的目标DNA,不一定在基因中但可以在非编码基因组DNA中)的峰值相对于一个或多个参照目标位点标准化。通过将测试样本中各基因目标位点的标准化峰值与测试系统中相同基因目标位点的标准 化的标准值,或与对照样本中相同基因目标位点的标准化的峰值进行比较,确定拷贝数变化。标准化可以校正不同样本之间和/或不同基因目标位点之间的峰值获得期间的偏差,如用于探针杂交的DNA模板量、连接探针和PCR引物的量、各组探针的连接效率和用于PCR扩增的DNA量。为获得参照目标位点的峰值,用于参照目标位点的探针可以以相似的方式进行设计,与基因目标位点的探针同时用于杂交和连接反应。此外,用于参照目标位点的探针和用于基因目标位点的探针可以共享相同的引物结合位点,从而可利用同组引物来扩增参照位点和基因目标位点的连接产物。
因此,在一些实例中,多个参照目标位点的峰值和多个基因目标位点的峰值平行获得,使得所述多个基因目标位点各自的峰值相对于所述多个参照目标位点各自的峰值标准化。参照目标位点的数量可以是约1至约100,基因目标位点的数量可以是约1至约100。例如,可以同时获得6个参照目标位点的峰值和6个基因目标位点的峰值。在该例中,将6个参照目标位点的6组探针和6个基因目标位点的6组探针加入样本,在杂交和连接反应后获得连接产物。再例如,可以同时获得100个参照目标位点的峰值和100个基因目标位点的峰值。在该例中,将100个参照目标位点的100组探针和100个基因目标位点的100组探针加入样本,在杂交和连接反应后获得连接产物。两个实例中,可以使用单组探针扩增连接产物,通过毛细管电泳分析扩增产物确定峰值。
在一些实施方式中,用于基因目标位点的参照目标位点数量可影响检测基因目标位点的拷贝数变化的灵敏度。使用越多参照目标位点,可以检测到的基因目标位点的拷贝数变化越小。因此,当期望检测更多的拷贝数变化,例如,0.1%的癌症细胞相关拷贝数变异的变化,优选各基因目标位点使用较多的参照目标位点。当明显需要更灵敏地检测拷贝数变化时,本领域技术人员可以增加参照目标位点的数量。
在一些实施方式中,样本中基因目标位点的峰值的标准化是为获得基因目标位点的峰值与参照目标位点的峰值的比例(这里称为R)。因此,通过将测试样本中基因目标位点的比例(这里称为Rtest)和测试系统中相同基因目标位点的标准比例(这里称为Rstandard)作比较或和对照样本中相同基因目标位点的比例(这里称为Rcontrol)的比较可检测测试样本中基因目标位点的拷贝数。
在一些实例中,通过将测试样本中基因目标位点的比例(Rtest)和测试系统中相同基因目标位点的标准比例(Rstandard)作比较可检测测试样本中基因目标位点的拷贝数。测试系统中基因目标位点的拷贝数是已知的(这里称为Cstandard)。在这种情况下,测试样本中基因目标位点的拷贝数(这里称为Ctest)可以采用下式计算:Ctest=CstandardxRtest/Rstandard
在其它实例中,通过将测试样本中基因目标位点的比例(Rtest)和对照样本中相同基因目标位点的比例(Rcontrol)作比较可检测测试样本中基因目标位点的拷贝数。测试系统中基因目标位点的拷贝数已知(这里称为Ccontrol)。在这种情况下,测试样本中基因目标位点的拷贝数(这里称为Ctest)可以采用下式计算:Ctest=Ccontrolx Rtest/Rcontrol
因此,当引入6个参照目标位点以便标准化基因目标位点的峰值时,可依据6个参照目标位点的6个峰值得到基因目标位点的6个拷贝数测量值(Ctest)。基于该6个Ctest测量值,可按照某一统计分析获得基因目标位点的拷贝数。在一个实施方式中,6个Ctest测量值的中位值视作基因目标位点的拷贝数。在另一实施方式中,6个Ctest测量值的平均值视作基因目标位点的拷贝数。
根据多个目标位点中各自的拷贝数,采用以下方法测得核酸的拷贝数,包括但不限于,取所有目标位点的拷贝数的平均值或所有目标位点的拷贝数的中位值,或者如果需要,在放弃一些异常值后取所有目标位点的拷贝数的平均值或所有目标位点的拷贝数的中位值。
在一些实施方式中,可以重复测试核酸中的各基因目标位点,以便获得多个拷贝数计算结果。例如,测试核酸中各基因目标位点的测试可重复三次,获得三个拷贝数计算结果。三个拷贝数计算结果的平均值或中位值可视作核酸的拷贝数。因此,测试的重复数也可影响该方法的灵敏度。如果需要更灵敏地检测拷贝数变化,可以重复测试多次。如果本领域技术人员需要检测较小的拷贝数变化如,0.1%,他/她可以增加重复测试的次数。
因此,样本中核酸的拷贝数小变化的检测灵敏度可能受到许多因素影响,包括但不限于,核酸内基因目标位点的数量,用于各基因目标位点的参照目标位点的数量,以及各基因目标位点检测的重复次数。核酸内基因目标位点数量的增加,用于 各基因目标位点的参照目标位点数量增加,和/或各基因目标位点检测重复次数的增加可以提高检测的灵敏度。如果需要更灵敏地检测样本中目标核酸的很小的拷贝数变化,本领域技术人员可以调整本发明的数量。
基于实验结果,可以采用各种不同的统计方法来计算各目标位点的拷贝数,并基于计算的各目标位点的拷贝数确定核酸的拷贝数。以下实施例4(21号染色体拷贝数变化的检测)中详述了拷贝数小变化的统计学分析的具体实施例。
再例如,本领域已知可采用实时PCR检测多个选择的目标位点中各自的拷贝数。实时PCR可以单重(monoplex)或多重方式测定目标位点的拷贝数。根据所述多个目标位点中各自的拷贝数,可通过以下方法测定核酸的拷贝数,所述方法包括但不限于:取所有目标位点的拷贝数的平均值或取所有目标位点的拷贝数的中位值,或者如果需要,在舍弃一些异常值后取所有目标位点的拷贝数的平均值或所有目标位点的拷贝数的中位值。
IV.用于多重核酸分析和拷贝数小变化检测的试剂盒
在本发明还有的另一方面,提供用于多重核酸分析和拷贝数小变化检测的试剂盒。在一实施方式中,用于测定样本中核酸的试剂盒装有对应于目标核酸的一组或多组探针,使得当与目标核酸杂交时,各组中的探针可以连接形成第三探针。在另一实施方式中,所述试剂盒还装有一组或多组用于扩增第三探针的引物。
各组探针可以包括第一探针和第二探针,所述第一探针具有与目标核酸的第一区域至少部分互补的第一部分和作为第一引物结合位点的第二部分,所述第二探针具有与目标核酸的第二区域至少部分互补的第一部分和作为第二引物结合位点的第二部分。在一些实例中,第一探针的5’端基本上毗邻所述第二探针的3’端,第一探针和第二探针可连接形成第三探针。在其他实例中,第一探针的5’端与所述第二探针的3’端不相邻,不填充间隙,则第一探针和第二探针不能连接形成第三探针。可以通过能够与目标核酸上的间隙杂交的另一探针或在聚合酶反应中延伸两探针中的一个实现间隙填充。例如,可延伸第二探针的3’端以填充间隙,直到延伸的3’端基本上毗邻第一探针的5’端。
在一些实施方式中,该试剂盒还可装有试剂,包括但不限于,连接酶(例如TaqDNA连接酶或T4DNA连接酶),连接反应的缓冲液,DNA聚合酶(例如Taq DNA 聚合酶),聚合酶链式反应的缓冲液,或它们的组合。
在一些实施方式中,试剂盒内的引物组可以包括与第一引物结合位点至少部分互补的第一引物和与第二引物结合位点至少部分互补的第二引物。在一些实例中,引物组中至少一个引物用可检测基团标记。所述部分可以是寡核苷酸标签或荧光染料,如荧光素荧光团。荧光团可以是FAM(5-或6-羧基荧光素)、VIC、NED、PET、荧光素(Fluorescein)、FITC、IRD-700/800、CY3、CY5、CY3.5、CY5.5、HEX、TET、TAMRA、JOE、ROX、BODIPY TMR、俄勒冈绿(Oregon Green)、罗丹明绿(Rhodamine Green)、罗丹明红(Rhodamine Red)、德克萨斯红(Texas Red)或雅基马黄(Yakima Yellow)。
在一些实施方式中,至少一种引物的5’部分包含寡核苷酸GTTTCTT。在一些优选的实施方式中,用于扩增连接产物的反向引物包含寡核苷酸GTTTCTT或它的功能等价物,如GTTTCTTG。
在一些实施方式中,引物组中的至少一种引物包括约10-500个核苷酸长的填充序列。一些引物中的填充序列可能有约10到约500个核苷酸。其他引物中的填充序列可能是约10到约60个核苷酸。在一些优选实施方式中,引物不多于约125个核苷酸。在其他优选的实施方式中,引物不多于约75个核苷酸。
在其他实施方式中,探针组的至少一种探针包含约1到约200个核苷酸长的填充序列。在其他实例中,填充序列有约1到约55个核苷酸。在一些优选实施方式中,第三探针不超过约250个核苷酸。在其他优选实施方式中,第三探针不超过约140个核苷酸。在还有的一些优选实施方式中,探针不超过约125个核苷酸。在还有的一些其他优选实施方式中,探针不超过约70个核苷酸。在一些进一步优选的实施方式中,探针不超过约60个核苷酸。
在一些实施方式中,目标核酸是抗肌营养不良蛋白基因,试剂盒用于检测杜氏肌营养不良症。试剂盒内探针组包括选自SEQ ID NO:158-541的一个或多个探针对。
在其它实施方式中,目标核酸在人21号染色体上,试剂盒用于在母体血液中检测胎儿唐氏综合症。试剂盒内探针组包括选自SEQ ID NO:559-942的一个或多个探针对。
V.实施例
应该理解,本发明并不限定于本文所描述的特定的方法,方案和试剂。本文使用的术语仅为描述特定实施方式,并不意在限制本发明的范围。
此外,如本领域技术人员所理解的,可以采用各种不同的方式完成下述反应。下述优选的实施方式中,反应的组分可以同时、连续或以不同顺序添加。此外,反应可以包括各种不同的、可以用于检测中的其他试剂。这些包括试剂如盐、缓冲液、中性蛋白质(例如白蛋白)、洗涤剂等,这些试剂可以用于促进最佳的杂交和检测,和/或减少非特异性或背景相互作用。根据样本的制备方法和靶标的纯度,还可利用提高检测效率的其他试剂,如蛋白酶抑制剂、核酸酶抑制剂、抗菌剂等。
尽管参照某些实施方式公开了本发明,但可能对所述实施方式作出各种修饰、替换和改变而不脱离随附说明书和权利要求书中描述的本发明的完整范围。基于详述、附图、实施例和权利要求,可以明白所公开的主题的其他特征、目的和优势。可利用与本文所述那些基本上类似或等同的方法和材料来实施或测试本发明公开的主题。
实施例1:多重SNP检测
本实施例示出本发明的多重SNP检测方法。在本实施例中,利用荧光染料标记的正向引物并根据图4所示方案通过添加填充序列改变反向引物的长度,同时检测血液样本中48个SNP。
48个SNP是rs1056893、rs1058588、rs10790286、rs10791649、rs11107、rs11155787、rs11161732、rs1249950、rs12719860、rs1359185、rs1572983、rs2161916、rs2231926、rs2241280、rs2241571、rs2241802、rs2279072、rs2294092、rs2297129、rs2304035、rs2304102、rs2305150、rs2306331、rs2401751、rs2779500、rs2986014、rs3182535、rs3731631、rs3736582、rs3749877、rs3809806、rs3816800、rs4141253、rs4362、rs4371677、rs469783、rs4829830、rs4920098、rs624821、rs625372、rs639225、rs6784322、rs6892205、rs894344、rs934472、rs938883、rs9389034、和rs9791113。在国家生物技术信息中心dbSNP数据库中可以找到所有SNP名称和其他信息。对于各SNP,设计三个探针:3'探针(右探针)和对应于两个等位基因的两个5'探针(左探针)。设计3'和5'探针,使得在适当条件下两者都杂交目标序列时,两探针之间没有间隙。探针由生命技术公司(LifeTechnologies Corporation)合成。144(3x48)个探 针的名称、序列ID号、引物结合序列和填充序列如表1所示。
对于3'探针,5'末端核苷酸被磷酸化以提供能与5'探针的3'末端核苷酸上的羟基连接的磷酸基团。各3'探针包含5′部分的基因座特异性杂交序列(LSHS),其后是填充L2序列,以及3′部分的引物结合序列Y。在一些3'探针中,使用SNP_Y1序列,SEQ ID NO:155。在其他3'探针中,使用SNP-Y2序列,SEQ ID NO:156。
为各SNP设计两个不同的5'探针,各5'探针对应不同的等位基因。各5'探针的3'部分是等位基因特异性杂交序列(ASHS),3'末端核苷酸对应于各单独的等位基因的特定核苷酸。各5'探针的5′部分具有引物结合序列X。在本实施例中,5'探针内使用4个引物结合序列X:SNP_X1,SEQ ID NO:151、SNP_X2,SEQ ID NO:152、SNP_X3,SEQ ID NO:153、SNP_X4,SEQID NO:154。在一些5'探针中,在5'探针的3′部分和5′部分之间插入填充A序列。此外,在一些5'探针中,在5′部分和填充A序列之间插入填充L1序列。填充A和填充L1序列的位置可互换。
此外,为扩增连接产物设计4个正向引物和两个反向引物。4个正向引物(SNP_F1,SEQ ID NO:145、SNP_F2,SEQ ID NO:146、SNP_F3,SEQ ID NO:147、SNP_F4,SEQ ID NO:148)具有分别与4个引物结合序列X(SNP_X1,SEQID NO:151、SNP_X2,SEQ ID NO:152、SNP_X3,SEQ ID NO:153、SNP_X4,SEQ ID NO:154)一致的独特序列。用4种不同的荧光染料:FAM-蓝、VIC-绿、NED-黄和PET-红分别标记4个正向引物(SNP_F1,SNP_F2,SNP_F3和SNP_F4)的5'末端。两个反向引物(SNP_R1,SEQ ID NO:149、SNP_R2,SEQ ID NO:150)具有与引物结合序列Y(SNP_Y1序列,SEQ ID NO:155和SNP-Y2序列,SEQ ID NO:156)反向互补的独特序列。SNP_R引物在5′部分也有填充序列SNP_R_Stuffer,SEQID NO:157。所有引物和探针由生命技术公司合成。
为实施48重SNP检测,首先生成连接产物。简言之,使用经典的酚:氯仿法从2毫升全血样本提取基因组DNA。在中国上海瑞金医院,从健康志愿者收集血液样本。将提取的基因组DNA中的100-200微克(μg)DNA溶解于10微升(μl)1xTE缓冲液中(10mM Tris.Cl,pH8.0,1mM EDTA,西格玛-奥德里奇公司)。溶解的基因组DNA在98℃变性5分钟,然后立即在冰上冷却。同时,按照下述配方制备2x连接预混溶液:将新英格兰生物实验室公司的1微升40U/μl的Taq连接酶、2微升10x Taq连接酶缓冲液、1微升探针混合物“ProbeMix”(1xTE中,各探针最终浓度为0.005微摩尔)和6微升双蒸水(密理博公司(Millipore)的Milli-Q AdvantageA10的蒸馏Milli-Q水)制成的10微升2x连接预混物。10微升2x连接预混物与变性的10微升基因组DNA混合,混合物在以下条件下经历4轮的变性、杂交和连接:95℃30秒,然后58℃4小时。由此得到的连接产物可以存储在冰上以供同天使用,或在-20℃冷冻以供将来使用。
然后对连接产物实施扩增步骤获得扩增产物。简言之,使用扩增产物作为模板进行PCR反应。PCR反应混合物的制备如下:将2微升10x PCR缓冲液(凯杰Qiagen,德国)、2微升2.5mM dNTP混合物(dATP、dTTP、dCTP和dGTP各2.5mM,Takara Bio Inc.)、2微升引物混合物(SNP_F1、SNP_F2、SNP_F3、SNP_F4、SNP_R1和SNP_R2,终浓度分别为1μM、1μM、1μM、1μM、2μM和2μM)、1微升连接产物、0.2微升5U/微升HotStarTaq Plus Taq DNA聚合酶(凯杰,德国)和12.8微升双蒸水混合制得20微升反应体系。PCR混合物在以下条件进行聚合酶链式反应:95℃2分钟,随后94℃20秒,57℃40秒,72℃1.5分钟进行35个循环,第35个循环后,反应混合物在60℃温育1小时。为分析扩增产物,首先用双蒸水将1微升的扩增产物稀释10倍到10微升。然后从10微升稀释的扩增产物中取出1微升,与0.1微升GeneScanTM500大小标样(生命技术公司)和8.9微升Hi-Di甲酰胺(生命技术公司)混合。混合物在95℃变性5分钟,根据制造商的使用手册,采用毛细管电泳利用ABI3130XL进行分析。使用GeneMapper4.0处理毛细管电泳数据。
表1用于多重SNP检测的探针的名称、序列ID号、引物结合位点和填充序列。3'探针的名称是以下格式:SNP名称_3,例如,rs1056893_3是指SNP rs1056893的3'探针。5'探针的名称是以下格式:SNP名称多态性核苷酸,例如,rs1056893_C是指SNP rs1056893等位基因C的5'探针;类似地,rs1056893_T是指SNP rs1056893等位基因T的5'探针。
如图10A-E所示,可分离测定中获得的扩增产物,通过毛细管电泳法可分别鉴定对应于各SNP等位基因的峰。所有的扩增产物源自相同的PCR反应。图10A示出用四种不同的荧光染料标记的所有扩增产物的色谱图。各峰代表对应于各SNP等位基因的一种扩增产物。各自源于图10A的图10B、10C、10D和10E示出分别用蓝色、绿色、黄色和红色标记的扩增产物的色谱图。从图10B、10C、10D和10E中可以看出,可以分别基于不同的片段大小鉴定用相同荧光染料标记的扩增产物的峰。根据约2个核苷酸的片段大小差异分离各SNP的两个等位基因。
例如,SNP rs3816800分别含G和C的两个等位基因。A1等位基因的连接探针大小为95个碱基对(bp),A2等位基因的连接探针大小为97bp;A1等位基因的CE参照大小为92.46和A2等位基因的CE参照大小为94.56。图10B示出了两个峰,其中一个峰的片段大小为约93bp,另一个峰的片段大小约95bp。因此,确定SNP rs3816800的基因型为杂合的G/C。
如下所述获得SNP等位基因的CE参照大小:首先,采用相应的探针组在具有SNP等位基因的DNA样本中实施杂交、连接和扩增;然后利用毛细管电泳分析扩增产物,在大小标样存在的情况下获得用于SNP等位基因的CE参照大小。例如,利用探针组rs11161732_3,SEQID NO:19和rs11161732_A,SEQ ID NO:20获得rs11161732_A等位基因的CE参照大小,CE参照大小被确定为114.64。
再例如,SNP rs1249950分别具有含T和C的两个等位基因。A1等位基因的连接探针大小为100个碱基对(bp),A2等位基因的连接探针大小为102bp;A1等位基因的CE参照大小为97.82和A2等位基因的CE参照大小为100.11。图10B示出一个峰,片段大小为约100bp。因此,SNP rs1249950的基因型测定为纯合的T/T。
因此,根据毛细管电泳结果(见表2)确定所有的48个SNP的基因型。这些结果都与直接DNA测序获得的结果一致。
表248个SNP的基因型和连接产物大小的毛细管电泳结果。A1是指等位基因#1,A2是指等位基因#2,A1LP是指等位基因#1连接产物大小,A2LP是指等位基因#2连接产物大小,REF是指参考,CE是指毛细管电泳。
实施例2:拷贝数变异的多重检测
本实施例示出本发明的多重CNV检测方法。本实施例具有192个目标序列,包括杜氏肌营养不良症(DMD)基因中的129个目标位点,染色体X、Y、2-12、14、 16-20上的63个目标参照位点。DMD是隐性X-连锁形式的肌营养不良症,这会导致肌肉退化。该病症由人类X染色体上编码抗肌营养不良蛋白的抗肌营养不良蛋白基因突变引起,其中抗肌营养不良蛋白是为细胞膜的抗肌营养不良蛋白聚糖复合物(DGC)提供结构稳定性的肌肉组织内重要的结构组分。约三分之二的DMD基因突变是抗肌营养不良蛋白基因内一个或多个外显子的拷贝数变化。根据图5所示方案,示例性的多重CNV检测方法采用荧光染料标记的正向引物和具有填充序列的反向引物。
具体地,设计探针以覆盖192个目标位点,其中DMD基因的79个外显子中各有至少一个目标位点。外显子22-42、58-60和62-79包含一个目标位点。外显子1、3-15、18-20、47、49、54-57和61包含两个目标位点。外显子2、16-17、21、43-46、48和50-53包含三个目标位点。为各目标位点设计包括3'探针(左探针)和5'探针(右探针)的探针对。以这样的方式设计3'和5'探针,使得两者在适当条件下都与目标序列杂交,两探针之间不存在间隙。由生命科技公司合成探针。192个目标位点的384个探针(192探针对)的名称、序列ID号、引物结合位点和填充序列如表3所示。
对于各3'探针,5'末端核苷酸被磷酸化以提供能与5'探针的3'末端核苷酸上的羟基连接的磷酸基团。各3'探针包括5'部分的基因座特异性杂交序列(LSHS),其后是填充L2序列以及3′部分的引物结合序列Y。在本实施例中,3'探针中使用4个引物结合序列Y(MDM_Y1,SEQ ID NO:554;MDM_Y2,SEQ ID NO:555;MDM_Y3,SEQ ID NO:556;MDM_Y4,SEQ ID NO:557)。
各5'探针包括3′部分的基因座特异性杂交序列(LSHS),其后是填充L1序列以及5'部分的引物结合序列X。在本实施例中,5'探针中使用4个引物结合序列X(MDM_X1,SEQ IDNO:550;MDM_x2,SEQ ID NO:551;MDM_X3,SEQ ID NO:552;MDM_X4,SEQ ID NO:553)。
此外,设计4个正向引物和4个反向引物用于扩增连接产物。4个正向引物(DMD_F1,SEQ ID NO:542;DMD_F2,SEQ ID NO:543;DMD_F3,SEQ ID NO:544;DMD_F4和SEQ ID NO:545)分别具有与四个引物结合序列X(MDM_X1,SEQ ID NO:550;MDM_x2,SEQ ID NO:551;MDM_X3,SEQ ID NO:552;MDM_X4,SEQ ID NO:553)一致的独特序列。用4种不同的荧光染料:FAM-蓝、 VIC-绿、NED-黄和PET-红分别标记四个正向引物:DMD_F1、DMD_F2、DMD_F3和DMD_F4的5'末端。四个反向引物(DMD_R1,SEQ ID No:546;DMD_R2,SEQ ID No:547;DMD_R3,SEQID No:548;DMD_R4,SEQ ID No:549)分别具有与四个引物结合序列Y(MDM_Y1,SEQ ID NO:554;MDM_Y2,SEQ ID NO:555;MDM_Y3,SEQ ID NO:556;MDM_Y4,SEQ ID NO:557)反向互补的独特序列。DMD_R2和DMD_R4反向引物在5′部分还有填充序列DMD_R_Stuffer,SEQ ID No:558。所有的引物和探针由生命技术公司合成。
表3用于DMD基因的多重CNV分析的探针的名称、序列ID号、引物结合位点和填充序列。X1、X2、X3和X4分别指MDM_X1,SEQ ID NO:550;MDM_x2,SEQ ID NO:551;MDM_X3,SEQ IDNO:552;MDM_X4,SEQ ID NO:553。Y1,Y2,Y3和Y4分别指MDM_Y1,SEQ ID NO:554;MDM_Y2,SEQID NO:555;MDM_Y3,SEQ ID NO:556;MDM_Y4,SEQ ID NO:557。
为实施192重CNV检测,首先生成连接产物。简言之,使用经典的酚:氯仿法从2毫升全血样本提取基因组DNA。在中国上海瑞金医院,从男性DMD患者和健康的男性志愿者收集血液样本。从男性DMD患者收集的血液样本是测试样本。健康志愿者的基因组DNA是对照样本。将提取的基因组DNA中100-200微克(μg)DNA溶解于10微升(μl)的1xTE缓冲液中(10mMTris.Cl,pH8.0,1mM EDTA,西格玛-奥德里奇公司)。溶解的基因组DNA在98℃变性5分钟,然后立即在冰上冷却。同时,按照下述配方制备2x连接预混溶液:新英格兰生物实验室公司的1微升40U/μl的Taq连接酶、2微升10x Taq连接酶缓冲液、1微升探针混合物“ProbeMix”(1xTE中,每个探针最终浓度为0.005微摩尔)和6微升双蒸水(来自密理博公司的Milli-QAdvantage A10的蒸馏Milli-Q水)制成10微升2x连接预混物。10微升2x连接预混物与变性的10微升基因组DNA混合,混合物在以下条件下经历4轮的变性、杂交和连接:95℃30秒,然后58℃4小时。由此得到的连接产物可以存储在冰上以供同天使用,或在-20℃冷冻以供将来使用。
然后对连接产物实施扩增步骤获得扩增产物。简言之,使用相同扩增产物作为模板进行两个PCR反应。一个PCR反应使用DMD_F1、DMD_F2、DMD_F3、DMD_F4、DMD_R1和DMD_R2作为引物。另一PCR反应使用DMD_F1、DMD_F2、 DMD_F3、DMD_F4、DMD_R3和DMD_R4作为引物。PCR反应混合物的制备如下:将2微升10x PCR缓冲液(凯杰Qiagen,德国)、2微升2.5mM dNTP混合物(dATP、dTTP、dCTP和dGTP各2.5mM,塔卡拉生物公司“Takara Bio Inc.”)、2微升引物混合物(DMD_F1、DMD_F2、DMD_F3、DMD_F4、DMD_R1和DMD_R2,终浓度分别为1μM、1μM、1μM、1μM、2μM和2μM;或DMD_F1、DMD_F2、DMD_F3、DMD_F4、DMD_R3和DMD_R4,终浓度分别为1μM、1μM、1μM、1μM、2μM和2μM),1微升连接产物,0.2微升5U/微升HotStarTaq Plus Taq DNA聚合酶(凯杰,德国)和12.8微升双蒸水混合制得20微升反应体系。PCR混合物在以下条件进行聚合酶链式反应:95℃2分钟,随后94℃20秒,57℃40秒,72℃1.5分钟进行35个循环,35个循环后,反应混合物在60℃温育1小时。为分析扩增产物,首先用双蒸水将1微升的扩增产物稀释10倍到10微升。然后从10微升稀释的扩增产物中取出1微升,与0.1微升GeneScanTM500大小标样(生命技术公司)和8.9微升Hi-Di甲酰胺(生命技术公司)混合。混合物在95℃变性5分钟,根据制造商的使用手册,采用毛细管电泳利用ABI3130XL进行分析。两个PCR反应的色谱图分别标记为集合(panel)A和集合B。使用GeneMapper4.0处理毛细管电泳数据为各扩增产物获得峰强度值。
如图11A-H所示,测定中得到的扩增产物可以通过毛细管电泳分离,可以单独鉴定色谱图上的峰。图11A和11B分别示出对照样本集合A和集合B所有扩增产物的色谱图。各集合代表一个PCR反应的扩增产物的分析。图11C和11D分别示出患者样本集合A和集合B所有扩增产物的色谱图。各峰代表对应于各目标位点的一种扩增产物。
图11E及11F分别示出对照样本和患者样本用蓝色荧光染料标记的扩增产物的色谱图。图11G和11H分别示出对照样本和患者样本用绿色荧光染料标记的扩增产物的色谱图。如图11E-11H所示,可以基于不同的片段大小鉴定采用相同荧光染料标记的扩增产物的峰。通过比较对照样本和患者样本的色谱图,可测定片段大小相似的峰是否存在。例如,比较图11E和11F的色谱图,患者样本的色谱图缺少目标位点E22A、E41A、E40A、E29A、E21A和E34A的峰,表明对应于这些目标位点的DMD基因中有序列缺失。再例如,比较图11G和11H的色谱图,患者样本的色谱图缺少 目标位点E18A和E20A的峰,表明对应于这些目标位点的DMD基因中有序列缺失。
或者,在分析电泳数据的另一方法中,通过将相同组中基因目标位点的峰强度值除以各参照目标位点的峰强度值获得各DMD,染色体X和Y染色体目标位点(本文也称作基因目标位点)的测试样本比例(Rtest)。相同的PCR引物对用于同组中的各基因目标位点和参照目标位点。例如,如表4所示,在共享相同引物对DMD_F1/DMD_R1的一组中,有的12个探针基因座(本文也称作探针目标位点)的扩增产物,该12个探针位包括8个基因目标基因座:DMD_E04A、DMD_E14B、DMD_E45B、DMD_E45C、DMD_E49A、DMD_E52B、DMD_E66A和DMD_E67A,和4个参照目标基因座:REF18p_A、REF3p_D、REF5q_A和REF8q_B。为了获得测试样本中基因座DMD_E04A的比例(Rtest),将基因座DMD_E04A的峰强度除以各参照目标位点REF18p_A、REF3p_D、REF5q_A和REF8q_B的峰强度,从而得到4个比例(Rtest)。
类似地,获得对照样本中各基因目标位点的比例(Rcontrol)。假设对照样本中的目标核酸的拷贝数(Ccontrol)是1,然后根据下式计算各基因目标位点的拷贝数(Ctest):Ctest=Ccontrol×Rtest/Rcontrol
假定对照样本中目标核酸的拷贝数是1(例如,男性患者有一个X染色体),测试样本中的基因目标位点的拷贝数等于Rtest与Rcontrol之比。由于为各基因目标位点引入四个对照目标位点,获得各基因目标位点的四个Rtest和由此获得的四个Ctest。四个Ctest的中位值视为测试样本中该基因目标位点的拷贝数。这样计算出的各基因目标位点的拷贝数示于表4。对应于外显子18-41的基因目标位点的拷贝数是零,表明这些外显子在DMD患者样本中缺失。
表4基于各基因目标位点的峰强度的拷贝数计算结果。LP大小是指连接产物大小,REF是指参照,CE指毛细管电泳法,非-PAR是指非-拟常染色体区域。
实施例3.多重点突变筛选
该实施方式提供本发明多重点突变筛选的示例性方法。该实施例中,与实施例2一样,有192个目标序列,包括杜氏肌营养不良(DMD)基因的129的位点,染色体X、Y、2-12、14、16-20上的63个参照位点。导致DMD的一些突变是抗肌营养不良蛋白基因的点突变。根据图6所示方案,DMD基因上多重点突变筛选使用荧光染料标记的正向引物和具有填充序列的反向引物。
在此示例性的突变筛选方法中,除了从另一男性DMD患者获得试验基因组 DNA外,与实施例2中设计和使用的那些相同的探针和引物用于杂交、连接和扩增反应。通过毛细管电泳分析扩增产物,得到峰强度,如实施例2中所描述计算各目标位点的拷贝数。为了简洁,在本实施例中不重复描述探针、引物、连接反应、扩增反应、数据采集和拷贝数计算。
由此计算的所有基因目标位点的拷贝数示于图12A,部分示于图12B中。E07B(抗肌营养不良蛋白基因内的外显子E07B基因目标位点)的拷贝数是零,提示该位点的探针不能完全与目标位点匹配。在另一方面,E07A的拷贝数为约1,意味着测试DNA样本中部分外显子7有正常的拷贝数,外显子7没有全部缺失。色谱图(图12C)中还可以看出缺少E07B基因目标位点的扩增产物,表明当与对照集合(上图)比较时,DMD试验集合(下图)缺少对应于E07B基因目标位点的峰。然后进行E07B基因目标位点测序,发现E07B探针区域中有腺苷(“A”)插入。参见图12D中箭头指示的腺苷位置。由于抗肌营养不良蛋白基因的外显子7内插入腺苷,DMD_07B_5探针SEQ ID NO:294无法与目标位点退火,导致对应外显子07B目标位点的峰消失。
因此,多重突变筛选方法可以鉴定可能存在突变的基因区域。筛选可以与CNV检测同时进行,如实施例2和3中所示,其中使用相同探针组和引物组,按照相同的程序获得电泳数据。
实施例4.人类21号染色体拷贝数变化的检测
本实施例示出本发明检测人类21号染色体拷贝数变化的方法。在该例中,可以检测到样本中人类21号染色体拷贝数的仅2%的增加。根据图5所示方案,该方法使用荧光染料标记的正向引物和具有填充序列的反向引物。
在该示例性的方法中,设计探针覆盖192个目标位点,包括人类21号染色体上的96个位点,和人类染色体2-12、14、和16-20上的96个参照位点。对于各目标位点,设计包括3'探针(右探针)和5'探针(左探针)的探针对。以这样的方式设计3'和5'探针,使得两者在适当条件下都杂交目标序列,两探针之间不存在间隙。生命科技公司合成探针。384个探针(192探针对)的名称、序列ID号、引物结合序列和填充序列如表5所示。21号染色体上目标位点的探针对序列号为SEQ ID NO:559-750。参照位点的探针对序列号为:SEQ ID NO:751-942。
与实施例2的设计类似,各3'探针的5'末端被磷酸化,提供与5'探针的3'末端核苷酸的羟基连接的磷酸基团。各3'探针包括5'部分的基因座特异性杂交序列(LSHS),其后是填充L2序列以及3′部分的引物结合序列Y。在本实施例中,3'探针使用四个引物结合序列Y:Chr21_Y1,SEQ ID NO:955;Chr21_Y2,SEQ ID NO:956;Chr21_Y3,SEQ ID NO:957;和Chr21_Y4,SEQ ID NO:958。
与实施例2的设计类似,各5'探针包括3'部分的基因座特异性杂交序列(LSHS),其后是填充L1序列以及5′部分的引物结合序列X。在本实施例中,5'探针使用4个引物结合序列X:Chr21_X1,SEQ ID NO:951;Chr21_X2,SEQ ID NO:952;Chr21_X3,SEQ ID NO:953和Chr21_X4,SEQ ID NO:954。
此外,与实施例2的设计类似,设计四个正向引物和四个反向引物用于扩增连接产物。四个正向引物(Chr21_F1,SEQ ID NO:943;Chr21_F2,SEQ ID NO:944;Chr21_F3,SEQ IDNO:945和Chr21_F4,SEQ ID NO:946)具有与四个引物结合序列X(Chr21_X1,SEQ ID NO:951;Chr21_X2,SEQ ID NO:952;Chr21_X3,SEQ ID NO:953和Chr21_X4,SEQ ID NO:954)一致的独特序列。用四种不同的荧光染料:FAM-蓝、VIC-绿、NED-黄和PET-红分别标记四个正向引物:Chr21_F1,Chr21_F2,Chr21_F3和Chr21_F4的5'末端。四个反向引物(Chr21_R1,SEQID NO:947;Chr21_R2,SEQ ID NO:948;Chr21_R3,SEQ ID NO:949和Chr21_R4,SEQID NO:950)分别具有与四个引物结合序列Y(Chr21_Y1,SEQ ID NO:955;Chr21_Y2,SEQ ID NO:956;Chr21_Y3,SEQ ID NO:957和Chr21_Y4,SEQ ID NO:958)反向互补的独特序列。Chr21_R2和Chr21_R4反向引物在5′部分还有填充序列Chr21_R_Stuffer,SEQ ID NO:959。所有的引物由生命技术公司合成。
表5.用于人21号染色体拷贝数变化检测的探针的名称、序列ID号、引物结合序列和填充序列。X1、X2、X3和X4分别是指Chr21_X1,SEQ ID NO:951;Chr21_X2,SEQ ID NO:952;Chr21_X3,SEQ ID NO:953和Chr21_X4,SEQ ID NO:954。Y1、Y2、Y3和Y4分别指Chr21_Y1,SEQID NO:955;Chr21_Y2,SEQ ID NO:956;Chr21_Y3,SEQ ID NO:957和Chr21_Y4,SEQ ID NO:958。
在该实施例中,制备人21号染色体拷贝数不同的五个DNA样本。具体地,按照DNA总量比为100:0,98:2,96:4,92:8和84:16将健康志愿者的基因组DAN提取物试样和唐氏综合症患者的基因组DNA提取物试样混合,使得五个DNA样本中人21号染色体的拷贝数分别增加0%、1%、2%、4%和8%,从而制备五个DNA样本(M0、M2、M4、M8和M16)。将M0、M2、M4、M8和M16DNA样本中21号 染色体的拷贝数分别设计为2.00、2.02、2.04、2.08和2.16。使用本发明示例性的方法实施该实施例以检测M0、M2、M4、M8和M16DNA样本中人21号染色体的拷贝数。
为检测五个DNA样本中21号染色体的拷贝数,对各样本实施以下详述的探针杂交、探针连接、连接产物扩增和毛细管电泳并重复三次。
首先用表5中列出的384个探针生成各DNA样本的连接产物。简言之,将约100-200微克(μg)基因组DNA溶解于10微升(μl)1xTE缓冲液(10mM Tris.Cl,pH8.0,1mM EDTA,西格玛-奥德里奇公司)中。溶解的基因组DNA在98℃变性5分钟,然后立即在冰上冷却。根据以下配制方法制备2x连接预混物溶液:混合新英格兰生物实验室公司的1微升40U/μl的Taq连接酶、2微升10x Taq连接酶缓冲液、1微升探针混合物“ProbeMix”(1xTE中,384个探针中各探针最终浓度为0.005微摩尔)和6微升双蒸水(来自Millipore公司的Milli-Q AdvantageA10的蒸馏的Milli-Q水)制成10微升2x连接预混物。10微升2x连接预混物与变性的10微升基因组DNA混合,混合物在以下条件下经历4轮的变性、杂交和连接:95℃30秒,然后58℃4小时。由此得到的连接产物可以存储在冰上以供同天使用,或在-20℃冷冻以供将来使用。
然后对连接产物实施扩增步骤获得扩增产物。简言之,使用同一连接产物的试样作为模板进行两个PCR反应。一个PCR反应用Chr21_F1、Chr21_F2、Chr21_F3和Chr21_F4、Chr21_R1和Chr21_R2作为引物。另一个PCR反应用Chr21_F1、Chr21_F2、Chr21_F3、Chr21_F4、Chr21_R3和Chr21_R4作为引物。PCR反应混合物的制备如下:将2微升10x PCR缓冲液(凯杰,德国)、2微升2.5mMdNTP混合物(dATP、dTTP、dCTP和dGTP各2.5mM,Takara Bio Inc.)、2微升引物混合物(Chr21_F1、Chr21_F2、Chr21_F3和Chr21_F4、Chr21_R1和Chr21_R2,终浓度分别为1μM、1μM、1μM、1μM、2μM和2μM;Chr21_F1、Chr21_F2、Chr21_F3、Chr21_F4、Chr21_R3和Chr21_R4,终浓度分别为1μM、1μM、1μM、1μM、2μM和2μM),1微升连接产物,0.2微升5U/微升HotStarTaq Plus Taq DNA聚合酶(凯杰,德国)和12.8微升双蒸水混合制得20微升反应体系。PCR混合物在以下条件进行聚合酶链式反应:95℃2分钟,随后94℃20秒,57℃40秒,72℃1.5分钟进行35个循环,35个循环后,反应混合物在60℃温育1小时。
为分析扩增产物,首先用双蒸水将1微升的扩增产物稀释10倍到10微升。然后从10微升稀释的扩增产物中取出1微升,与0.1微升GeneScanTM500大小标样(生命技术公司)和8.9微升Hi-Di甲酰胺(生命技术公司)混合。混合物在95℃变性5分钟,根据制造商的使用手册,采用毛细管电泳利用ABI3130XL进行分析。使用GeneMapper4.0处理毛细管电泳数据获得各扩增产物的峰强度值。
两个PCR反应的色谱图分别标记为集合A和集合B。在每个集合中,扩增产物分为八组。用相同的引物对扩增每组中的扩增产物。这样,集合A的八组对应八个引物对:F1/R1、F1/R2、F2/R1、F2/R2、F3/R1、F3/R2、F4/R1和F4/R2;集合B的八组对应八个引物对:F1/R3、F1/R4、F2/R3、F2/R4、F3/R3、F3/R4、F4/R3和F4/R4。设计各引物对扩增12个目标位点,包括人21号染色体的6个目标位点和6个参照目标位点。
可分离各DNA样本得到的扩增产物,通过毛细管电泳可以分别鉴定对应于各目标位点的峰。例如,图13A和13F示出健康对照样本(即,集合A和集合B中各自的人21号染色体增加0%的M0样本)所有扩增产物的色谱图。对照样本集合A的图13B、13C、13D和13E分别示出用蓝色、绿色、黄色和红色荧光染料标记的扩增产物的色谱图。同样地,对照样本集合B的图13G、13H、13I和13J分别示出用蓝色、绿色、黄色和红色荧光染料标记的扩增产物的色谱图。如图13B-13E和13H-13J所示,可以依据片段大小鉴定相同荧光染料标记的扩增产物的峰。参见表6的对照样本中192个目标位点的扩增产物的大小。获得各峰的荧光强度。这些峰强度值用于确定样本中21号染色体拷贝数的变化。
表6.对照样本中192个目标位点的扩增产物的片段大小。LP大小是指连接产物大小,REF是指参照,CE是指毛细管电泳。
为了确定21号染色体拷贝数的变化,采用以下示例性的统计方法。计算21号染色体上96个目标位点各自的拷贝数。通过将21号染色体目标位点的峰强度值除以同组中六个参照目标位点中各自的峰强度值获得测试样本中21号染色体目标位点的比例(Rtest)。如此,获得21号染色体目标位点的六个比例(Rtest)。同样地,获得对照样本中21号染色体目标位点的比例(Rcontrol)。已知对照样本M0中21号染色体的拷贝数(Ccontrol)为2。通过下式计算测试样本中21号染色体的拷贝数(Ctest):Ctest=Ccontrol×Rtest/Rcontrol。由于各21号染色体目标位点有6个参照目标位点,各21号染色体目标位点算出六个Ctest值。然后,将六个Ctest值的中位值视为测试样本中21号染 色体目标位点的拷贝数。
例如,参考表6,如下获得目标位点Chr21_01的Rtest和Rcontrol。Chr21_01在12个21号染色体目标位点组成的组中:Chr21_01、Chr21_05、Chr21_37、Chr21_53、Chr21_71、Chr21_75和六个参照目标位点:REF10q_A、REF20p_A、REF2p_D、REF4q_C、REF5p_C和REF6q_A。将Chr21_01目标位点的峰强度除以六个参照目标位点(REF10q_A、REF20p_A、REF2p_D、REF4q_C、REF5p_C和REF6q_A)各自的峰强度获得测试样本中Chr21_01目标位点的六个Rtest值。同样地,获得对照样本(即M0DNA样本)中Chr21_01目标位点的六个Rtest值。对于六个参照目标位点(REF10q_A、REF20p_A、REF2p_D、REF4q_C、REF5p_C和REF6q_A)中的每一个,获得Chr21_01目标位点的Ctest。因此,总共获得测试样本中Chr21_01目标位点的总共六个Ctest。六个Ctest的中位值视为测试样本中Chr21_01目标位点的拷贝数。
如此计算96个21号染色体目标位点各自的拷贝数。因为各DNA样本重复测试三次,因此可以从各样本的测试结果获得96个21号染色体目标位点各自的三个R值。R值见表7。每个试验中96个21号染色体目标位点的拷贝数中位值认为是试验中21号染色体的拷贝数,列在表7中的最后一行。此外,各DNA样本中的21号染色体的拷贝数来自三次重复实验的三个中位值的平均值。例如,M4DNA样本的拷贝数为2.037,是2.04、2.03和2.04的平均值。
表7.人类21号染色体的拷贝数检测值。
R1、R2和R3是指各DNA样本三次重复测试的计算拷贝数
这种示范性的方法足够灵敏,从而能检测21号染色体拷贝数低至约2%的增量。使用M0作为对照样本进行斯氏t检验对五个DNA样本的拷贝数进行统计学分析。如图14所示,M2与M0的拷贝数之间并没有统计学显著差异(P=0.1008<0.01),提示该示例性的方法对检测样本M2和样本M0之间的拷贝数差异不够灵敏。但是M4与M0的拷贝数之间有统计学显著差异(P=0.0065<0.01),提示该示例性的方法对检测样本M4和样本M0的拷贝数之间的差异足够灵敏。M8和M0之间、M16和M0之间是同样的,因为P值分别为0.0028和0.0001。由于M4样本中设计的21号染色体的拷贝数是2.04,从正常的拷贝数2.00增加2%,该示例性的方法能够统计学显著地检测低至2%的增加。
事实上,五个DNA样本的计算或测量拷贝数和设计拷贝数之间具有很强的相关性。通过绘制五个DNA样本中测量拷贝数和设计拷贝数的关系图,可以看出很强的相关性。如图15所示,两相应值之间的线性相关性达到R2为0.9977。
因此,本发明示例性方法可以用于检测拷贝数小变化。示例性方法足够灵敏,从而能检测2%的拷贝数变化。如果21号染色体上有更多的区域用作目标位点,如果更多的参照目标位点用于21号染色体上的某些目标位点,或如果样本测试重复更多次数,灵敏度可以增加。因此,本领域技术人员可以为21号染色体上的更多目标位点,如,21号染色体上100-500个目标位点设计和使用探针,为更多参照目标位点,如,50个参照目标位点设计和使用探针,和/或重复测试样本更多次数,如,6-10次,并通过这样做可以增加检测21号染色体的拷贝数小变化的灵敏度,从而可以获得小于2%的变化。

Claims (54)

1.一种非诊断性的、多重测定样本中核酸的方法,其特征在于,包括以下步骤:
a、将多个探针组添加到样本中以形成混合物,各探针组包括:
i、第一探针,所述第一探针具有与样本中目标核酸的第一区域至少部分互补的第一部分和形成第一引物结合位点的第二部分;
ii、第二探针,所述第二探针具有与样本中目标核酸的第二区域至少部分互补的第一部分和用于形成第二引物结合位点的第二部分,其中,当两个探针均与所述目标核酸杂交时,所述第一探针的5’端基本上毗邻所述第二探针的3’端;
并且所述探针组中的至少一种探针包括填充序列,所述填充序列由1到200个核苷酸构成;
b、将所述混合物中的核酸变性;
c、将所述探针组与所述目标核酸的互补区域杂交;
d、在杂交的探针组上实施连接酶连接反应以连接基本上毗邻的所述第一探针的5’端和所述第二探针的3’端,从而形成第三探针,其中步骤b-d重复1-100次;
e、用多个引物组扩增所述第三探针,从而获得扩增产物,各引物组包括:
i、第一引物,所述第一引物与所述多个探针组的一个或多个第一探针内的所述第一引物结合位点至少部分互补;
ii、第二引物,所述第二引物与所述多个探针组的一个或多个第二探针内的所述第二引物结合位点至少部分互补;
f、通过测得扩增产物中所述第三探针是否存在或量,来测定所述样本中目标核酸是否存在或量;
其中,所述各引物组中的至少一种引物用可检测基团标记;并且
所述多引物组中的至少一种引物包括填充序列;
所述至少一种引物包括的填充序列由10到500个核苷酸构成。
2.根据权利要求1所述的方法,其特征在于,使用超过48、96、192或384组探针分别测定样本中超过48、96、192或384种目标核酸是否存在或量。
3.根据权利要求1所述的方法,其特征在于,所述样本是源自动物的选自下组的样本:血液、血浆、血清、尿液、痰、脊髓液、脑脊液、胸水、乳头抽吸液、淋巴液、源自呼吸、肠道或泌尿生殖系统的液体、泪液、唾液、母乳、源自淋巴系统的液体、精液、脑脊液、器官内部系统液体、腹水、肿瘤囊液、羊水、活检组织、石蜡包埋组织或它们的组合。
4.根据权利要求1所述的方法,其特征在于,先从所述样本中提取所述目标核酸,再与所述探针组形成混合物。
5.根据权利要求1所述的方法,其特征在于,所述目标核酸是DNA、RNA或cDNA。
6.根据权利要求1所述的方法,其特征在于,先将所述目标核酸变性,再与所述探针组形成混合物。
7.根据权利要求1所述的方法,其特征在于,所述可检测基团标记是寡核苷酸标签或荧光染料。
8.根据权利要求7所述的方法,其特征在于,所述可检测基团是选自下组的荧光染料:FAM、VIC、NED、PET、荧光素、FITC、IRD-700/800、CY3、CY5、CY3.5、CY5.5、HEX、TET、TAMRA、JOE、ROX、BODIPY TMR、俄勒冈绿、罗丹明绿、罗丹明红、德克萨斯红或雅基马黄。
9.根据权利要求1所述的方法,其特征在于,所述多重测定样本中核酸的方法为多重CNV检测方法。
10.根据权利要求9所述的方法,其特征在于,所述至少一种引物包括的填充序列由10到60个核苷酸构成。
11.根据权利要求1所述的方法,其特征在于,所述引物不超过125个核苷酸。
12.根据权利要求11所述的方法,其特征在于,所述引物不超过75个核苷酸。
13.根据权利要求1所述的方法,其特征在于,所述引物组的至少一种引物包括含有序列GTTTCTT的寡核苷酸或含有序列GTTTCTT的寡核苷酸的同功变异体。
14.根据权利要求1所述的方法,其特征在于,所述探针组中的至少一种探针包括填充序列,所述填充序列由2到100个核苷酸构成。
15.根据权利要求14所述的方法,其特征在于,所述填充序列由1到55个核苷酸构成。
16.根据权利要求1所述的方法,其特征在于,所述第三探针不超过250个核苷酸。
17.根据权利要求1所述的方法,其特征在于,所述探针不超过125个核苷酸。
18.根据权利要求1所述的方法,其特征在于,通过基于可检测基团和/或片段大小检测所述扩增产物中所述第三探针是否存在或量,进行所述扩增产物中所述第三探针是否存在或量的检测。
19.根据权利要求18所述的方法,其特征在于,使用毛细管电泳进行检测。
20.根据权利要求1所述的方法,其特征在于,所述目标核酸具有单核苷酸多态性。
21.根据权利要求20所述的方法,其特征在于,所述第一或第二探针是对应所述单核苷酸多态性的等位基因特异性探针。
22.根据权利要求21所述的方法,其特征在于,所述等位基因特异性探针上远离所述多态性核苷酸的第二、第三或第四核苷酸与所述目标区域相应的核苷酸不匹配。
23.根据权利要求1所述的方法,其特征在于,所述目标核酸具有多核苷酸的插入、重复或缺失。
24.根据权利要求23所述的方法,其特征在于,所述目标核酸是具有一个或多个外显子缺失的抗肌营养不良蛋白基因,用于检测抗肌营养不良蛋白基因的所述探针组包括一个或多个选自SEQ ID NO:158-541的探针对。
25.根据权利要求1所述的方法,其特征在于,所述目标核酸包含一个或多个核苷酸的未知点突变、插入或缺失。
26.根据权利要求25所述的方法,其特征在于,所述一个或多个核苷酸的未知的点突变、插入或缺失是在抗肌营养不良蛋白基因内,用于检测抗肌营养不良蛋白基因的所述探针组包括一个或多个选自SEQ ID NO:158-541的探针对。
27.根据权利要求1所述的方法,其特征在于,所述目标核酸是信使RNA。
28.根据权利要求1所述的方法,其特征在于,所述目标核酸包含一个或多个甲基化核苷酸。
29.根据权利要求1所述的方法,其特征在于,所述目标核酸源自包括病毒和细菌在内的病原体。
30.根据权利要求1所述的方法,其特征在于,所述目标核酸源自转基因生物,所述转基因生物包括转基因植物和转基因动物,所述转基因植物选自下组:转基因玉米、转基因水稻、转基因大豆和转基因棉花,所述转基因动物选自下组:转基因牛、转基因猪、转基因绵羊和转基因狗。
31.根据权利要求1所述的方法,其特征在于,所述变性步骤在90℃到99℃进行5秒到30分钟,所述杂交和连接步骤同时在4℃到70℃进行1分钟到49小时。
32.根据权利要求31所述的方法,其特征在于,所述变性步骤在95℃进行30秒,所述杂交和连接步骤同时在58℃进行4小时。
33.根据权利要求32所述的方法,其特征在于,所述变性、杂交和连接步骤重复4次。
34.根据权利要求1所述的方法,其特征在于,利用两组或多组探针与目标核酸中两个或多个目标位点杂交,其中各组探针与不同的目标位点杂交。
35.根据权利要求34所述的方法,其特征在于,所述目标核酸在两个样本间的量变为0.1%到30%。
36.根据权利要求35所述的方法,其特征在于,所述目标核酸的量变为2%、4%或8%。
37.根据权利要求36所述的方法,其特征在于,对于与目标核酸上的目标位点杂交的各组探针,利用一组或多组参照探针与一个或多个参照目标位点杂交,其中各组参照探针与不同的参照目标位点杂交。
38.根据权利要求37所述的方法,其特征在于,采用1到100组参照探针。
39.根据权利要求38所述的方法,其特征在于,采用6到12组参照探针。
40.根据权利要求37所述的方法,其特征在于,采用多组引物扩增第三探针组,所述第三探针组包含与一个或多个目标位点杂交的一组或多组探针和与一个或多个参照目标位点杂交的一组或多组参照探针形成的多个第三探针。
41.根据权利要求40所述的方法,其特征在于,该组的所述多个第三探针由与目标位点杂交的48到100组探针和由1到100组参照探针形成。
42.根据权利要求34所述的方法,其特征在于,采用50到500组探针与所述目标核酸上的50到500个目标位点杂交。
43.根据权利要求34所述的方法,其特征在于,所述目标核酸对应于母体血液或尿液样本中至少部分人21号染色体、人18号染色体、人13号染色体、人染色体区域22q11.2、或人X或Y染色体的拟常染色体区。
44.根据权利要求43所述的方法,其特征在于,所述目标核酸对应于部分人21号染色体,用于检测该部分人21号染色体的探针组包括选自SEQ ID NO:559-942的探针对。
45.根据权利要求34所述的方法,其中,所述多重测定样本中核酸的方法为多重CNV检测方法,每个CNV位点的拷贝数通过以下步骤测定:
通过测试样本中CNV位点的比例,即Rtest,和试验系统中相同CNV位点的标准比例,即Rstandard,或和对照样本中相同CNV位点的比例,即Rcontrol,相比较,来检测试验样本中CNV位点的拷贝数;或者
通过试验样本中CNV位点的比例,即Rtest,和试验系统中相同CNV位点的标准比例,即Rstandard相比较,可以检测试验样本中CNV位点的拷贝数,其中试验系统中CNV位点的拷贝数已知,即Cstandard,试验样本中CNV位点的拷贝数,即Ctest,采用下式计算:Ctest=CstandardxRtest/Rstandard;或者
通过试验样本中CNV位点的比例,即Rtest,和对照样本中相同CNV位点的比例,即Rcontrol,相比较,检测试验样本中CNV位点的拷贝数;试验系统中CNV位点的拷贝数已知,即Ccontrol,试验样本中CNV位点的拷贝数,即Ctest,采用下式计算:Ctest=CcontrolxRtest/Rcontrol
46.根据权利要求34所述的方法,还包括以下步骤:根据多个目标位点中各自的拷贝数,采用以下方法测得核酸的拷贝数,取所有目标位点的拷贝数的平均值或所有目标位点的拷贝数的中位值,或者,在放弃一些异常值后取所有目标位点的拷贝数的平均值或所有目标位点的拷贝数的中位值。
47.一种用于检测样本中核酸的试剂盒,其特征在于,所述试剂盒装有:
a.对应于目标核酸的多组探针,各组探针包括:
i、第一探针,所述第一探针具有与样本中目标核酸的第一区域至少部分互补的第一部分和形成第一引物结合位点的第二部分;
ii、第二探针,所述第二探针具有与样本中所述目标核酸的第二区域至少部分互补的第一部分和用于形成第二引物结合位点的第二部分,其中,当两探针均与所述目标核酸杂交时,所述第一探针的5’端基本上毗邻所述第二探针的3’端,所述第一和第二探针可以连接形成第三探针;
并且所述探针组中的至少一种探针包括填充序列,所述填充序列由1到200个核苷酸构成;
b、用于扩增所述第三探针的多组引物,其中多组引物中的各组引物包括:
i、第一引物,所述第一引物与所述多组探针的一个或多个第一探针内的所述第一引物结合位点至少部分互补;
ii、第二引物,所述第二引物与所述多组探针的一个或多个第二探针内的所述第二引物结合位点至少部分互补;
c、试剂,所述试剂包括连接酶、连接反应的缓冲液、DNA聚合酶、聚合酶链式反应的缓冲液或它们的组合;和
d、任选的包含试剂盒使用说明的手册;
其中,所述各组引物中的至少一种引物用可检测基团标记;
所述多组引物中的至少一种引物包括填充序列;
所述至少一种引物包括的填充序列由10到500个核苷酸构成。
48.根据权利要求47所述的试剂盒,其特征在于,所述多组引物中各组包括:
a.与所述第一引物结合位点至少部分互补的第一引物;
b.与所述第二引物结合位点至少部分互补的第二引物。
49.根据权利要求48所述的试剂盒,其特征在于,所述多组引物中各组的至少一种引物用可检测基团标记。
50.根据权利要求49所述的试剂盒,其特征在于,所述基团是选自下组的荧光染料:FAM(5-或6-羧基荧光素)、VIC、NED、PET、荧光素、FITC、IRD-700/800、CY3、CY5、CY3.5、CY5.5、HEX、TET、TAMRA、JOE、ROX、BODIPY TMR、俄勒冈绿、罗丹明绿、罗丹明红、德克萨斯红或雅基马黄。
51.根据权利要求48所述的试剂盒,其特征在于,所述样本中核酸为样本中CNV。
52.根据权利要求47所述的试剂盒,其特征在于,各组探针中至少一种探针包含由1到200个核苷酸构成的填充序列。
53.根据权利要求47所述的试剂盒,其特征在于,所述目标核苷酸是抗肌营养不良蛋白基因,所述试剂盒装有用于检测杜氏肌营养不良的一组或多组探针,所述探针包括选自SEQID NO:158-541的探针对。
54.根据权利要求47所述的试剂盒,其特征在于,所述目标核酸在人21号染色体上,所述试剂盒装有用于检测母体血液或尿液样本中的胎儿唐氏综合征的一组或多组探针,所述探针包括选自SEQ ID NO:559-942的探针对。
CN201280001947.3A 2012-09-10 2012-09-10 多重核酸分析 Active CN103958696B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/081212 WO2014036743A1 (en) 2012-09-10 2012-09-10 Method for multiplex nucleic acid analysis

Publications (2)

Publication Number Publication Date
CN103958696A CN103958696A (zh) 2014-07-30
CN103958696B true CN103958696B (zh) 2017-10-13

Family

ID=50236480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280001947.3A Active CN103958696B (zh) 2012-09-10 2012-09-10 多重核酸分析

Country Status (5)

Country Link
US (1) US10059983B2 (zh)
EP (1) EP2893034B9 (zh)
JP (1) JP6234463B2 (zh)
CN (1) CN103958696B (zh)
WO (1) WO2014036743A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9856521B2 (en) * 2015-01-27 2018-01-02 BioSpyder Technologies, Inc. Ligation assays in liquid phase
CN105803055A (zh) * 2014-12-31 2016-07-27 天昊生物医药科技(苏州)有限公司 一种基于多重循环延伸连接的靶基因区域富集新方法
EP3279339B1 (en) 2015-03-31 2020-08-26 FUJIFILM Corporation Method for determining gene state of fetus
CN105112508A (zh) * 2015-07-31 2015-12-02 上海捷瑞生物工程有限公司 一种基于连接的dna甲基化快速荧光法高通量检测方法
CN105543370B (zh) * 2016-01-14 2019-06-04 中南大学湘雅医院 新的综合性耳聋相关基因突变检测体系及试剂盒
CN106834452A (zh) * 2017-01-13 2017-06-13 天昊生物医药科技(苏州)有限公司 微量基因组dna的探针连接扩增检测方法
CN110079592B (zh) * 2018-01-26 2021-02-12 厦门艾德生物医药科技股份有限公司 用于检测基因突变和已知、未知基因融合类型的高通量测序靶向捕获目标区域的探针和方法
EP3814521A4 (en) 2018-06-29 2022-07-27 The Jackson Laboratory SPLICING VARIANTS FOR BREAST CANCER
CN115125305A (zh) * 2021-03-25 2022-09-30 华中农业大学 一组可提高绵羊乳头数的snp分子标记及其应用
CA3225271A1 (en) * 2021-07-28 2023-02-02 Atsena Therapeutics, Inc. Aav transfer plasmids

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102449169A (zh) * 2009-04-01 2012-05-09 德克斯特里蒂诊断公司 化学连接依赖性的探针扩增(clpa)

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5869252A (en) 1992-03-31 1999-02-09 Abbott Laboratories Method of multiplex ligase chain reaction
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
EP1736554B1 (en) 1996-05-29 2013-10-09 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US6312892B1 (en) 1996-07-19 2001-11-06 Cornell Research Foundation, Inc. High fidelity detection of nucleic acid differences by ligase detection reaction
US6949370B1 (en) 1998-10-30 2005-09-27 Cornell Research Foundation, Inc. High fidelity thermostable ligase and uses thereof
US6506594B1 (en) 1999-03-19 2003-01-14 Cornell Res Foundation Inc Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
EP1130113A1 (en) 2000-02-15 2001-09-05 Johannes Petrus Schouten Multiplex ligation dependent amplification assay
EP1319718A1 (en) * 2001-12-14 2003-06-18 Keygene N.V. High throughput analysis and detection of multiple target sequences
US20070092883A1 (en) * 2005-10-26 2007-04-26 De Luwe Hoek Octrooien B.V. Methylation specific multiplex ligation-dependent probe amplification (MS-MLPA)
ES2446927T3 (es) 2006-03-01 2014-03-10 Keygene N.V. Detección rápida de SNP basada en secuencias utilizando ensayos de ligación
EP2014774A1 (en) 2007-07-11 2009-01-14 Pathofinder B.V. Assay for the simulataneous detection of multiple nucleic acid sequences in a sample
US20100105032A1 (en) 2008-10-23 2010-04-29 Tao Pan Highly sensitive multiplex single nucleotide polymorphism and mutation detection using real time ligase chain reaction microarray
EP2980226A1 (en) 2011-07-08 2016-02-03 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
US9208809B2 (en) * 2013-05-01 2015-12-08 International Business Machines Corporation Magnetic head and system having offset arrays

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102449169A (zh) * 2009-04-01 2012-05-09 德克斯特里蒂诊断公司 化学连接依赖性的探针扩增(clpa)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Modulation of Non-Templated Nucleotide Addition by TaqDNA Polymerase:Primer Modifications that Facilitate Genotyping;Brownstein MJ, Carpten JD and Smith JR;《Biotechniques》;19960630;1004 *

Also Published As

Publication number Publication date
US10059983B2 (en) 2018-08-28
EP2893034B1 (en) 2018-02-14
EP2893034B9 (en) 2018-04-18
WO2014036743A1 (en) 2014-03-13
JP6234463B2 (ja) 2017-11-22
JP2015527072A (ja) 2015-09-17
CN103958696A (zh) 2014-07-30
EP2893034A4 (en) 2016-04-13
EP2893034A1 (en) 2015-07-15
US20150218626A1 (en) 2015-08-06

Similar Documents

Publication Publication Date Title
CN103958696B (zh) 多重核酸分析
CN101641452B (zh) 限制性核酸内切酶增强的多态序列检测
CN103328654B (zh) 立足点引物双链体的组合物及其使用方法
CN105934523B (zh) 核酸的多重检测
US8936912B2 (en) Method for multiplexed nucleic acid patch polymerase chain reaction
US11319589B2 (en) Methods of determining the presence or absence of a plurality of target polynucleotides in a sample
EP2276858A2 (en) Restriction endonuclease enhanced polymorphic sequence detection
CN110628891B (zh) 一种对胚胎进行基因异常筛查的方法
EP1483404A2 (en) Methods for detecting genome-wide sequence variations associated with a phenotype
US20220364169A1 (en) Sequencing method for genomic rearrangement detection
US20130109023A1 (en) Method and composition for nucleic acid amplification
JP2020536525A (ja) プローブ及びこれをハイスループットシーケンシングに適用するターゲット領域の濃縮方法
CN109715798A (zh) Dna文库的制作方法和使用dna文库的基因组dna分析方法
US11111514B2 (en) Method for multiplexed nucleic acid patch polymerase chain reaction
CN110468179A (zh) 选择性扩增核酸序列的方法
JP5687414B2 (ja) 多型の識別方法
KR20170058780A (ko) 염기서열상의 다형성을 검출할 수 있는 방법 및 키트
JP2010246400A (ja) 多型の識別方法
WO2009098998A1 (ja) 核酸検出方法及び核酸検出用キット
Ladas Hybridization enrichment of subgenomic targets for next generation sequencing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211229

Address after: 215123 unit 501, C13 building, bio nano Park, 218 Xinghu street, Suzhou Industrial Park, Suzhou area, China (Jiangsu) pilot Free Trade Zone, Suzhou, Jiangsu

Patentee after: Tianhao gene technology (Suzhou) Co.,Ltd.

Address before: 215123 unit 428, building A2, biological nano Park, 218 Xinghu street, Suzhou Industrial Park, Suzhou, Jiangsu Province

Patentee before: GENESKY DIAGNOSTICS (SUZHOU) Inc.

Patentee before: Shanghai Tianhao Biotechnology Co., Ltd

TR01 Transfer of patent right