CN103562407A - 核酸的分析 - Google Patents

核酸的分析 Download PDF

Info

Publication number
CN103562407A
CN103562407A CN201280017616.9A CN201280017616A CN103562407A CN 103562407 A CN103562407 A CN 103562407A CN 201280017616 A CN201280017616 A CN 201280017616A CN 103562407 A CN103562407 A CN 103562407A
Authority
CN
China
Prior art keywords
nucleic acid
approximately
target nucleic
sample
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280017616.9A
Other languages
English (en)
Inventor
约翰·弗雷德里克·里根
瑟奇·萨克森诺夫
迈克·卢塞罗
本·辛德森
菲尔·贝尔格莱德
斯曼特·杜布
奥斯汀·苏
杰弗里·克拉克·梅伦
尼古拉斯·杰克·赫雷迪亚
凯文·奈斯
比尔·科尔斯顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bio Rad Laboratories Inc
Original Assignee
Bio Rad Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bio Rad Laboratories Inc filed Critical Bio Rad Laboratories Inc
Publication of CN103562407A publication Critical patent/CN103562407A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/125Allele specific primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)

Abstract

本发明提供了用于核酸分析的改进的方法、组合物和试剂盒。这些改进的方法、组合物和试剂盒可实现对样品中核酸拷贝数的估计。本发明还提供了用于确定样品中靶核酸的两个或多个拷贝的连接(例如,这两个或多个拷贝是在相同染色体上还是在不同染色体上)或用于对等位基因进行定相的方法、组合物和试剂盒。

Description

核酸的分析
交叉引用
本申请要求提交于2011年2月9日的美国临时专利申请61/441,209;提交于2011年2月18日的61/444,539;提交于2011年3月18日的61/454,373;提交于2011年4月15日的61/476,115;提交于2011年4月25日的61/478,777;提交于2011年5月9日的61/484,197和提交于2011年5月25日的61/490,055的权益,所有这些申请均通过引用整体并入本文。
背景技术
确定受试者样品中靶核酸的拷贝数可以为多种临床应用提供有用的信息。然而,如果样品中靶核酸的多个拷贝在同一多核苷酸上,那么一些用于确定靶核酸拷贝数的试验可能会低估靶核酸的拷贝数。例如,在数字聚合酶链反应(dPCR)中,可能会将包含两个靶序列拷贝的空间上分离的多核苷酸计数为只含有一个靶核酸拷贝。需要用于在实验如dPCR试验中对核酸靶序列进行拷贝数估计的改进的方法、组合物和试剂盒,其考虑了靶核酸序列的连接(如,样品中多个靶核酸序列拷贝是否在同一多核苷酸上)。
对单元型或相邻多态性的定相(phasing)的了解在许多情况下可能是有用的。人类是二倍体生物,因为在人的每个体细胞中每种染色体类型都作为一对单个染色体而双份存在。该染色体对的一个拷贝遗传自此人的父亲,而另一个拷贝遗传自此人的母亲。因此,在每个二倍体细胞中大多数基因以两个拷贝存在。然而,这些拷贝通常具有许多基因座,其中在拷贝之间发生序列变异从而形成被称为等位基因的独特的序列。
通常,了解染色体对中的每个单个染色体的等位基因的模式,即单元型,可能是有用的。例如,如果人在基因中的两个不同基因座处具有失活突变,若该突变一起存在于同一单个染色体上,那么突变的后果可能是有限的,但是若突变分布在染色体对的两个单个染色体上,那么就可能会产生很大影响。在第一种情况下,基因的一个拷贝在两个不同的基因座上失活,但另一个拷贝能够提供有活性的基因产物。在第二种情况下,基因的每个拷贝上都有一个失活突变,所以两个基因拷贝都无法提供有活性的基因产物。取决于所讨论的基因,两个基因拷贝的突变可能会导致多种生理结果,包括非存活的表型、疾病风险性增加或者无法代谢一类药物等。
关于单元型的信息对于生命科学应用、医学领域和诸如法医的应用市场会是很有用的信息。在许多人类(和非人类)遗传学环境中出现了单元型确定的问题。例如,许多遗传相关性依赖于单元型,并因此通过单元型进行预测。HLA(人白细胞抗原)区域是一个显著的实例,其中特定的遗传性疾病与主要组织相容性复合体的多种单元型有关。
常规基因分型技术探询彼此分离的、诸如SNP(单核苷酸多态性)的序列变异的不同基因座。因此,这些技术可以确信地确定遗传物质样品中一对独特的等位基因存在于两个相连的基因座中的每一个上。然而,这些技术无法识别来自两个基因座的等位基因的哪种组合位于同一染色体拷贝上。需要一种新的确定单元型的方法来克服这个困难。
类似地,需要新的方法来确定样品中两个靶核酸序列之间的断裂概率,测定核酸(例如DNA、RNA)样品中的降解水平,评估可变剪接,或检测倒位、易位或缺失。
发明内容
在一些方面,本发明提供了一种检测靶核酸的拷贝数变异的方法,包括:a.使包含多种多核苷酸的样品与至少一种试剂接触,其中该多核苷酸包含第一和第二靶核酸;b.使样品经受以下条件:当所述两种靶核酸位于同一多核苷酸上时,该条件使得所述试剂能够切割这两种靶核酸之间特别选择的靶位点,从而分离这两种靶核酸;c.将与试剂接触的样品分成多个空间上分离的分区;d.计算包含靶核酸的空间上分离的分区数;和e.基于所述计算,确定靶核酸的拷贝数。在一些实施方案中,空间上分离的分区为乳液内的小滴。在一些实施方案中,靶核酸以每个小滴少于约五个拷贝、每个小滴少于约四个拷贝、每个小滴少于约三个拷贝、每个小滴少于约两个拷贝或每个小滴少于约一个拷贝的平均浓度存在。在一些实施方案中,特别选择的靶位点位于第一和第二靶核酸之间。在一些实施方案中,该方法还包括使第一和第二靶核酸经历扩增反应。
在该方面的一些实施方案中,第一和第二靶核酸的序列相同或接近相同。在一些实施方案中,第一和第二靶核酸具有不同的序列。在一些实施方案中,特别选择的靶位点是能够用限制酶消化的位点。在一些实施方案中,所述试剂为一种或多种限制酶。在一些实施方案中,特别选择的位点和第一靶核酸位于同一基因内。在一些实施方案中,靶核酸与疾病或病症相关。在一些实施方案中,该方法还包括计算(或计数)包含参考核酸的、空间上分离的分区的数目。在一些实施方案中,参考核酸在样品所来源于的基因组中以固定拷贝数存在。在一些实施方案中,参考核酸为管家基因。在一些实施方案中,参考核酸在样品所来源于的每个二倍体基因组中以两个拷贝存在。在一些实施方案中,确定靶核酸的拷贝数包括将已计算的靶核酸数除以已计算的参考核酸数。
在该方面的一些实施方案中,所述试剂不切割靶核酸的序列。在一些实施方案中,该试剂不切割参考核酸序列。在一些实施方案中,靶核酸以多个拷贝存在于单一多核苷酸上。在一些实施方案中,一种或多种限制酶在两个靶序列之间具有超过一个识别序列。在一些实施方案中,一种或多种限制酶不展现出显著的星号活性。在一些实施方案中,一种或多种限制酶包含两种或更多种限制酶。在一些实施方案中,使用软件来选择一种或多种限制酶。在一些实施方案中,一种或多种限制酶在消化多核苷酸后被热灭活。在一些实施方案中,为了保持靶片段的双链性质,热灭活的温度低于限制酶切的靶片段的解链温度。在一些实施方案中,进行对照限制酶消化来测定用一种或多种限制酶消化核酸的效率。在一些实施方案中,确定样品中断裂的(fragmented)相连靶序列的百分比。
另一方面,本发明提供了一种检测核酸的拷贝数变异的方法,包括:a.提供包含多种多核苷酸的样品,所述多种多核苷酸包含位于多种多核苷酸中的至少一种内的第一和第二靶核酸;b.当第一和第二靶核酸存在于同一多核苷酸内时,切割第一与第二靶核酸之间的至少一种多核苷酸以形成切割样品;c.将切割样品分离成多个空间上分离的区域;d.计算包含靶核酸的、空间上分离的区域的数目;和e.基于所述计算,确定靶核酸的拷贝数;其中至少两种靶核酸中的两种位于同一多核苷酸的同一区域内。
在一些实施方案中,两种靶核酸相距少于一兆碱基。在一些实施方案中,两种靶核酸相距少于一千碱基。在一些实施方案中,用限制酶完成切割。在一些实施方案中,多个空间上分离的区域为乳液内的小滴。在一些实施方案中,该方法还包括在步骤d的计算之前进行PCR反应。在一些实施方案中,该方法不包括测序反应。
另一方面,该方法包括一种检测靶核酸的拷贝数变异的方法,包括:a.获得样品,该样品包含(i)多种多核苷酸,其中至少一种多核苷酸包含第一靶核酸和第一靶核酸的拷贝;(ii)用于检测靶核酸的带有荧光标记物的探针;和(iii)能够进行PCR反应的试剂;b.将样品分离成多个空间上分离的分区(partitions),其中空间上分离的分区平均含有少于五种靶核酸;c.使样品经历PCR扩增反应以检测靶核酸;d.在用于PCR反应的任何试剂变为限制性的之前,检测荧光标记物的荧光强度,其中分区内的较高荧光强度指示多核苷酸上存在超过一种靶核酸;e.计算具有高于指示一个靶核酸拷贝的阈值的荧光强度的分区数;f.计算具有高于指示多个靶核酸拷贝的阈值的荧光强度的分区数;和g.或者(i)基于在步骤e和步骤f中得到的数值,计算靶核酸的拷贝数,或者(ii)确定两种靶核酸是否存在于同一多核苷酸上。
在一些实施方案中,靶核酸拷贝数的增加与疾病或病症相关。
再一方面,本发明提供了一种确定多种靶核酸存在于同一多核苷酸上的方法,包括,a.将包含多种多核苷酸的样品分成至少两个子样品,其中该多核苷酸包含第一和第二靶核酸;b.使第一子样品与能够将第一靶核酸与第二靶核酸(如果它们存在于同一多核苷酸上)物理分离的试剂相接触;c.在步骤b之后,将第一子样品分成第一组分区;d.确定第一组分区中包含靶核酸的分区的数目;e.将第二子样品分成第二组分区;f.确定第二组分区中包含靶核酸的分区的数目;和g.将步骤d中得到的值与步骤f中得到的值进行比较,以确定第一和第二靶核酸是否存在于同一多核苷酸内。
在一些实施方案中,第一和第二靶核酸包含相同的序列。在一些实施方案中,所述试剂为限制酶。在一些实施方案中,当步骤d中得到的值显著高于步骤f中得到的值时,指示第一和第二靶核酸的连接。在一些实施方案中,限制酶识别第一与第二靶核酸之间的位点。在一些实施方案中,第一和第二靶序列位于彼此相距小于一兆碱基内。在一些实施方案中,在样品与一种或多种限制酶接触后,在分离子样品之前将样品储存不到24小时。在一些实施方案中,在第二子样品中靶序列不物理分离。在一些实施方案中,该方法还包括确定第一和第二靶核酸是在相同染色体上还是在不同染色体上。在一些实施方案中,第一靶核酸的序列与第二靶核酸的序列不同。在一些实施方案中,第一靶核酸的序列是第二靶核酸的遗传变异。在一些实施方案中,遗传变异是单核苷酸多态性。在一些实施方案中,其中第一和第二靶核酸在同一基因内。在一些实施方案中,至少两种多核苷酸为染色体。在一些实施方案中,第一和第二靶核酸位于单独的染色体上。在一些实施方案中,第一和第二靶核酸位于同一染色体上。在一些实施方案中,至少一条染色体包含第一靶核酸的两个拷贝。在一些实施方案中,至少一条染色体包含第一靶核酸的至少三个拷贝。在其它实施方案中,染色体包含第一靶核酸的至少1、2、3、4、5、6、7、8、9或10个拷贝。在一些实施方案中,一种或多种限制酶为甲基敏感的限制酶。
再一方面,本发明提供了一种用于确定样品中多核苷酸的断裂(fragmentation)概率的方法,包括:a.获取样品,该样品包含(i)多种多核苷酸,其中至少一种多核苷酸包含第一靶核酸和第二靶核酸;(ii)用于检测第一靶核酸的第一标记探针;(iii)用于检测第二靶核酸的第二标记探针;和(iii)能够进行PCR反应的试剂;b.将样品分成多个空间上分离的分区,其中空间上分离的分区平均包含少于五种靶多核苷酸;c.使样品经历PCR扩增反应以便检测第一和第二靶核酸;d.检测分区中的标记探针;e.基于步骤d,计算同时包含第一和第二靶核酸的分区的数目;和f.将同时包含第一和第二靶核酸的分区的数目与样品的断裂程度相关联。在一些实施方案中,第一和第二靶核酸相距一兆碱基之内。在一些实施方案中,在正常受试者中,第一和第二靶核酸相距大于一千碱基。在一些实施方案中,如果靶核酸为物理连接的,该方法还包括计算同时含有第一和第二靶核酸的分区的期望数。在一些实施方案中,断裂概率与同时含有第一和第二靶核酸的分区数的减少呈正相关。
在另一不同但相关的方面,本发明提供了一种用于确定多核苷酸样品中两个遗传连锁基因座的断裂概率的方法,包括:a.对所述样品进行数字PCR(dPCR),其中dPCR包括将多核苷酸分离成单独的单元;b.确定具有指示存在第一基因座的信号的单位数和具有指示存在第一基因座和第二基因座的信号的单位数的第一总和;c.确定具有指示存在第二基因座的信号的单位数和具有指示存在第一基因座和第二基因座的信号的单位数的第二总和;和d.将第一和第二总和输入算法,以确定样品中断裂的两个遗传连锁基因座的百分比。
在一些实施方案中,样品中的多核苷酸部分降解。在一些实施方案中,多核苷酸为DNA。在一些实施方案中,多核苷酸为RNA。在一些实施方案中,多核苷酸包含DNA和RNA的混合物。
本发明还提供了一种用于确定第一靶核酸与第二靶核酸存在于同一多核苷酸上的概率的方法,包括:a)将多核苷酸样品分成至少两个子样品;b)在第一子样品中,利用短周期PCR预扩增第一和第二靶核酸;c)将第一子样品分成第一组分区;d)计算同时包含第一和第二靶核酸的第一子样品的分区数;e)将第二子样品分成第二组分区;f)计算同时包含第一和第二靶核酸的第二子样品的分区数;和g)将步骤f的值与步骤d的值进行比较,以确定第一和第二靶核酸连接在同一多核苷酸上的概率。
在一些实施方案中,短周期PCR包括小于24个PCR反应循环。在一些实施方案中,该方法进一步包括使用算法来确定第一和第二靶核酸定相或存在于同一多核苷酸上的概率。
另一方面,本发明提供了一种确定靶核酸从染色体上缺失的概率的方法,包括:(a)将样品细分成多个分区,其中样品包含:(i)一对染色体,使得至少一条染色体含有第一靶核酸,并且其中两条染色体都含有相同的标记核酸;(ii)用于检测第一靶核酸的第一标记探针;(iii)用于检测标记核酸的第二标记探针;和(iii)能够进行PCR反应的试剂;(b)进行扩增反应,以检测分区内的第一靶核酸和标记核酸;(c)计算含有标记核酸而不含靶核酸的分区数;和(d)基于步骤c的值确定靶核酸从至少一条染色体上缺失的概率,其中步骤c中的较高值与靶核酸从染色体对中的一条染色体上缺失的概率的增加有关。
在一些实施方案中,靶核酸疑似以多个拷贝存在于至少一条染色体上。在一些实施方案中,标记核酸和靶核酸在至少一条染色体上彼此相距很近。在一些实施方案中,标记核酸和靶核酸相距5000个碱基对以内。在一些实施方案中,标记核酸包含单核苷酸多态性。在一些实施方案中,该方法进一步包括进行单独的测定以确定不同多核苷酸的断裂。在一些实施方案中,该方法进一步包括使用单独测定的结果来辅助步骤d的确定,其中通过确定不同多核苷酸已断裂来加强对高缺失概率的确定。在一些实施方案中,该方法进一步包括进行单独的测定以确定样品中高分子量DNA的存在。
再一方面,本发明提供了一种确定靶区域从多核苷酸上缺失或易位的概率的方法,包括:(a)将样品细分成多个分区,其中样品包含:(i)疑似包含第一标记核酸和第二标记核酸的多核苷酸,其中第一和第二标记核酸相隔至少一兆碱基,并且其中靶区域疑似位于第一和第二标记核酸之间;(ii)用于检测第一标记核酸的第一标记探针;(iii)用于检测第二标记核酸的第二标记探针;和(iii)能够进行PCR反应的试剂;(b)进行扩增反应,以检测分区内的第一和第二标记核酸;(c)计算分区内同时含有第一和第二标记核酸的分区数;和(d)基于步骤c的值,确定靶区域缺失或易位的概率,其中步骤c中的较高值与靶核酸从多核苷酸上缺失的概率的增加相关。在一些实施方案中,多核苷酸为染色体。在一些实施方案中,靶区域为已知存在于野生型受试者中的染色体的特定区域。在一些实施方案中,该方法进一步包括进行单独的实验以确定不同多核苷酸的断裂。在一些实施方案中,该方法进一步包括使用单独测定的结果来辅助步骤d的确定,其中通过确定不同的多核苷酸未断裂来加强对高缺失或易位概率的确定。
一方面,本发明提供了单元型分析方法,包括:(a)将含有核酸的水相分成多个离散(discrete)体积;(b)在这些体积中,扩增来自展示出核酸中序列变异的第一多态基因座和第二多态基因座中每一个的至少一个等位基因序列;(c)确定相同体积中来自两个基因座的等位基因序列的共扩增的至少一个测量值(measure);和(d)基于共扩增的至少一个测量值来选择第一和第二基因座的单元型。
在该方面的一些实施方案中,第一和第二基因座包含于核酸的靶区域中,其中分区步骤产生每体积少于数个靶区域拷贝的平均浓度。在一些实施方案中,分区步骤产生每体积少于约一个靶区域拷贝的平均浓度。
在该方面的一些实施方案中,确定至少一个测量值的步骤包括针对与来自相同体积的第二基因座的等位基因特异性扩增数据相关的第一基因座的等位基因特异性扩增数据,确定至少一个相关系数的步骤。在一些情况下,确定至少一个测量值的步骤包括针对分别与来自相同体积的第二基因座的等位基因特异性扩增数据相关的第一基因座的第一等位基因序列和第二等位基因序列的等位基因特异性扩增数据,确定第一相关系数和第二相关系数的步骤,并且其中选择单元型的步骤是基于将第一和第二相关系数相互比较的步骤。在一些情况下,确定至少一个测量值的步骤包括确定展示出第一基因座的特定等位基因序列与第二基因座的特定等位基因序列共扩增的体积数的步骤,并且其中选择单元型的步骤是基于展示共扩增的体积数。确定体积数的步骤可进一步包括确定展示出第一基因座的第一等位基因序列或第二等位基因序列与第二基因座的特定等位基因序列分别共扩增的第一体积数和第二体积数的步骤,并且其中选择单元型的步骤基于第一和第二体积数。
在一些实施方案中,确定至少一个测量值的步骤包括从单个体积收集每个基因座的等位基因特异性扩增数据,并且将第一基因座的等位基因特异性扩增数据与来自相同体积的第二基因座的等位基因特异性扩增数据相关联。
在该方面的一些实施方案中,分区步骤包括形成乳液的步骤,其中体积为小滴。在一些实施方案中,收集步骤可包括从乳液的单个小滴收集等位基因特异性扩增数据。
在一些实施方案中,形成乳液的步骤包括使水相通过孔口以便产生水相的单分散小滴的步骤。在一些实施方案中,分区步骤包括形成约10-1000微米直径的小滴的步骤。在一些实施方案中,分区步骤包括形成至少约1000个体积的步骤。在一些情况下,分区步骤包括将包括能够与扩增的每个等位基因序列特异性杂交的光学可辨别的荧光探针的水相进行分区的步骤。
在一些实施方案中,核酸获自或来源于二倍体受试者。在一些情况下,核酸是从受试者获得的遗传物质。在一些情况下,核酸包括通过从受试者获得的RNA的逆转录而得到的cDNA。在一些情况下,受试者是多细胞生物。在一些情况下,受试者是人。
在一些实施方案中,扩增步骤包括从第一基因座扩增一对不同的等位基因序列的步骤,并且收集数据的步骤包括收集区分单个小滴中等位基因序列对中每个等位基因序列的扩增的数据的步骤。
在一些实施方案中,关联步骤包括分别将第一基因座的每个等位基因序列的等位基因特异性扩增数据与第二基因座的等位基因序列的等位基因特异性扩增数据进行关联的步骤。
在一些情况下,关联步骤包括对等位基因特异性扩增数据应用阈值以将其转化成二进制形式(binary form),并且关联步骤利用数据的二进制形式进行。在一些情况下,关联步骤还包括确定展示来自两个基因座的特定等位基因序列的共扩增的体积数的步骤。在一些情况下,关联步骤还包括确定展示第二基因座等位基因序列与来自第一基因座的第一等位基因序列共扩增的第一体积数和展示第二基因座等位基因序列与来自第一基因座的第二等位基因序列共扩增的第二小滴数的第一步骤,以及将第一和第二体积数进行比较的第二步骤。
在一些实施方案中,选择单元型的步骤基于第一基因座的哪些等位基因特异性扩增数据展示出更高的与第二基因座的这些等位基因特异性扩增数据的相关性。在一些实施方案中,选择单元型的步骤基于与从第一基因座扩增的各自不同等位基因序列相对应的相关系数。在一些实施方案中,选择单元型的步骤基于关联步骤是指示相同体积中第一和第二基因座的特定等位基因序列的共扩增呈负相关还是正相关。
另一方面,本发明提供了一种用于单元型分析的系统,包括:(a)小滴发生器,其配置用于形成包含核酸的水相小滴;(b)检测器,其配置用于从单个小滴收集每个基因座的等位基因特异性扩增数据;和(c)处理器,其配置用于使第一基因座的等位基因特异性扩增数据与来自相同体积的第二基因座的等位基因特异性扩增数据相关联,并且基于等位基因特异性扩增数据的相关性选择第一和第二基因座的核酸的单元型。
在一些方面,本发明提供了一种确定基因组DNA样品内的CpG岛的甲基化程度的方法,包括:a.获得基因组DNA样品,其中基因组DNA包含通过CpG岛与第二靶核酸分隔的第一靶核酸;b.在适于使基因组DNA内未甲基化的核酸能够被消化的条件下,使基因组DNA样品与甲基敏感的限制酶接触;c.使样品与检测第一靶核酸的存在的探针接触;d.使样品与检测第二靶核酸的存在的探针接触;e.将样品分成多个空间上分离的分区;f.在分区内,进行适合于检测第一和第二靶核酸的扩增反应;g.确定同时包含第一和第二靶核酸的分区数;h.将步骤g中得到的数值与包含第一或第二靶核酸的分区数进行比较;和i.由步骤h中的比较,确定基因组DNA样品内CpG岛的甲基化程度。在一些实施方案中,基因组DNA为人类基因组DNA。在一些实施方案中,基因组DNA包含母体DNA和胎儿DNA。在一些实施方案中,基因组DNA包含胎儿DNA。
援引并入
本说明书中提到的所有出版物、专利和专利申请均通过引用而以相同程度并入本文,犹如特别地和单独地指出每个单独的出版物、专利或专利申请通过引用而并入。
附图说明
本发明的新特征在随附的权利要求书中具体阐述。通过参考以下对在其中利用到本发明原理的说明性实施方式加以阐述的详细描述和附图,将会获得对本发明的特征和优点的更好的理解,在附图中:
图1图示了用于估计靶序列的拷贝数的流程图。
图2图示了两个靶序列在母本染色体上的实例和一个靶序列在母本染色体上而另一个在父本染色体上的实例。
图3a图示了用于确定靶序列的连接的流程图。
图3b图示了用于确定靶序列的连接的备选工作流程。
图4是根据本发明的方面的流程图,列出了在样品分区中使用扩增进行单元型分析的示例性方法中可以进行的步骤。
图5是根据本发明的方面,用于进行图4的方法的示例性系统的选定方面的示意图。
图6是根据本发明的方面,可由位于受试者的遗传物质中相同染色体类型上的一对SNP创建的示例性单元型的示意图。
图7是根据本发明的方面,阐述执行图4方法的示例性版本的流程图的示意图,其以小滴作为分区,并且分析来自图6受试者的遗传物质以区分图6中呈现的潜在的单元型。
图8是根据本发明的方面,阐述关联图7的扩增数据的备选方法的图。
图9图示了用于预测两个靶标之间的断裂的流程图。
图10图示了连接的和未连接的靶标。图10A图示了未连接的靶标T1和T2。图10B图示了连接的T1和T2与未连接的T1和T2的混合物。图10C图示了T1和T2之间的不同间距。
图11图示了用于分析甲基化程度(burden)的流程图。
图12图示了甲基化程度分析的实施方案。
图13和14图示了在选择限制酶时可考虑的信息。
图15A和图15B图示了可输入数据库的分析信息。
图16图示了ddPCR实验的工作流程实例。
图17图示了小滴产生中的最大拉伸。
图18图示了作为样品流速的函数的最大拉伸。
图19描述了未消化的样品1-10和已消化的样品11-20的小滴性质。
图20A和图20B图示了储存的、已消化的DNA的CNV值的漂移。
图21图示了个体间淀粉酶基因拷贝数的高变异性。
图22图示了CCL3L1的拷贝数变异。
图23A和图23B图示了MRGPRX1的拷贝数变异。
图24A和图24B图示了CYP2D6的拷贝数变异。
图25图示了使用简单梯度板确定的最佳共同退火温度。
图26图示了使用简单梯度板确定的最佳共同退火温度。
图27图示了SM1和SMN2拷贝数。
图28图示了SMN1和SMN2的拷贝数变异。
图29图示了HER2的分析。
图30图示了连接实验的结果。六个样品经历或不经历限制酶切消化,并确定靶序列的拷贝数。数据提示样品4和5在同一染色体上具有两个靶序列。
图31图示了对于MRGPRX1和RPP30,在25个循环后实时PCR实验中的荧光强度分析。
图32图示了在实时PCR实验中,4个样品的一式三份测量的平均荧光。疑似在一条染色体上具有两个靶标而在另一染色体上具有0个靶标的样品(18853和19108)比疑似在染色体上具有一个靶标拷贝的样品(反式构型)(18507和BC106)具有更强的荧光。
图33图示了对于MRGPRX1和RPP30,在28个循环后实时PCR实验中的荧光强度分析。
图34图示了ddPCR浓度和拷贝数变异的比较。在样品18853和19108中,在28次循环时观察到未切割的样品的CNV下降。
图35图示了28次循环后,ddPCR实验中4个样品的一式三份测量的平均荧光。疑似在一条染色体上具有两个靶标而在另一染色体上具有0个靶标的样品(18853和19108)比疑似在两条染色体的每一条上具有一个靶标拷贝的样品(反式构型)(18507和BC106)具有更强的荧光。
图36图示了在31、34和40次循环后,ddPCR实验中4个样品的一式三份测量的平均荧光。在第31次循环时,疑似在一条染色体上具有两个靶标而在另一染色体上具有0个靶标的样品(18853和19108)比疑似在两条染色体的每一条上具有一个靶标拷贝的样品(反式构型)(18507和BC106)具有更强的荧光,但是第34次和40次循环时却不是这样。
图37图示了用于长片段(long range)PCR实验的实验设置。对于情形A和B,预计长片段PCR失败,因为引物之间的距离太大。然而,对于含有具有MRGPRX1缺失的染色体的情形C,PCR应该成功。箭头指示引物。
图38图示了使用6个样品的长片段PCR实验。在1500处迁移的条带指示来自MRGPRX1内部引物的PCR产物,而在略低于3000处迁移的条带指示来自处于MRGPRX1基因侧翼的引物的PCR产物。
图39图示了6个样品的长片段PCR产物和MRGPRX1CNV结果,进一步通过限制酶切消化分析区分了在相同染色体上具有一个或两个MRGPRX1拷贝的样品。
图40图示了与具有估计的拷贝数的已消化样品的百分比差异。
图41是图示相隔1K、10K或100K个碱基的、由FAM和VIC探针识别的序列的示意图。
图42图示了核酸片段。T1和T2为靶序列。图42A图示了T1和T2总是处于单独的核酸上的情形(完全断裂)。图42B图示了T1和T2总是在核酸上连接的情形(无断裂)。图42C图示了T1和T2在一些核酸上连接,并且也处于单独的核酸上的情形(部分断裂)。
图43图示了DNA质量评估。
图44图示了血浆中的大DNA污染影响CNV值。
图45图示了用于滴定以进行CNV分析的限制酶。
图46图示了用于CNV分析的限制酶滴定。
图47图示了用于优化具有挑战性的ddPCR CNV试验的方案的开发。
图48图示了利用ddPCR对限制酶活性的测量。
图49A和图49B图示了通过共定位(collocation)的单元型分析。
图50图示了可利用共定位试验分析的基因重排的实例。
发明详述
概述
通常,本文提供了用于分析核酸序列的方法、组合物和试剂盒,例如数字分区。例如,本文提供了用于估计样品如基因组中靶核酸序列的拷贝数的方法、组合物和试剂盒。本文还提供了用于确定样品如基因组中一种或多种靶序列的连接或单元型信息的方法、组合物和试剂盒。单元型分析信息可以是关于一个靶序列的多个拷贝是否在一条或多条染色体上的信息。利用在相同分区内不同靶序列共定位的概念,可以切实可行地推断相位,即一个突变或SNP的特定等位基因是否与另一个突变或SNP的等位基因物理连接。另一方面,本文提供了用于通过例如数字化分析共定位信号来确定核酸样品(例如,基因组DNA样品、RNA样品、mRNA样品、DNA样品、cRNA样品、cDNA样品、miRNA样品、siRNA样品)中断裂或降解程度的方法、组合物和试剂盒。另一方面,本文提供了用于分析核酸甲基化状态,可变剪接,发现倒位、易位和缺失的方法。
拷贝数变异的估计
一种或多种靶序列的拷贝数变异可在许多疾病和病症中发挥作用。一种分析靶序列拷贝数变异的方法是通过数字分析,如数字PCR或小滴数字PCR。然而,如果样品中靶核酸序列的多个拷贝在同一多核苷酸上,那么靶序列拷贝数的数字分析可能会低估样品中靶核酸序列的拷贝数。例如,在具有多个区室(例如,分区,空间上分离的区域)的数字PCR试验中,可将样品中的核酸进行分区,以使每个区室平均接收约0、1、2个或数个靶多核苷酸。每个分区(例如,小滴)可平均具有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)具有0个靶核酸拷贝。可计算含有多核苷酸的区室的数目。然而,如果靶核酸序列的两个拷贝在单一多核苷酸上,那么可能将含有该多核苷酸的区室计数为只具有一个靶序列。
本文提供了用于物理分离靶核酸序列的方法。通常,本文提供的方法避免由于在单一多核苷酸上存在靶序列的多个拷贝而低估靶序列的拷贝数。图1图示了拷贝数估计方法的实施方案的概述(101);该图和本公开内容中提供的其余附图仅用于说明性目的,并非意在限制本发明。图1中的步骤可以任何合适的顺序和组合进行,并且可与本公开内容的任何其它步骤结合。获得多核苷酸的第一样品(121);第一样品可以是,例如,基因组DNA样品。可将第一样品中的靶核酸序列进行物理分离(例如,通过使第一样品与一种或多种限制酶接触)(141)。可将第一样品分成多个分区(161)。可计算具有靶序列的分区数(181)。然后可对靶序列的拷贝数进行估计(201)。
靶核酸可以是相同的;或者,在其它情况下,靶核酸可以是不同的。在一些情况下,靶核酸位于同一基因内。在一些情况下,靶核酸各自位于基因的不同拷贝(相同或接近相同的拷贝)中。在其它情况下,靶序列位于内含子内,或者位于基因之间的区域中。有时,一个靶序列位于基因中;而第二靶序列位于该基因外。在一些情况下,靶序列位于外显子内。
在一些情况下,基因组包含一个靶序列。在一些情况下,基因组包含两个或更多个靶序列。当基因组包含两个或更多个靶序列时,靶序列可以大约或大于约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%相同。
物理分离两个靶序列可包括通过切割核酸序列上的特定位点将靶序列进行物理分离。在一些情况下,物理分离靶核酸序列可包括使第一样品与一种或多种限制酶接触。物理分离靶核酸序列可包括在位于靶核酸序列之间的位点消化多核苷酸。在一些情况下,靶核酸序列各自位于基因内。在一些情况下,消化所针对的位点位于两个基因之间。在一些情况下,为消化选定的位点位于基因中;并且,在一些情况下,该基因是与含有靶序列的基因相同的基因。在其它情况下,为消化选定的位点位于与靶序列的基因不同的基因中。在一些情况下,靶序列和消化所针对的位点位于同一基因中;并且靶序列位于消化所针对的位点的上游。在其它情况下,靶序列和消化所针对的位点位于同一基因中;但是靶序列位于消化所针对的位点的下游。在一些情况下,可通过用一种或多种限制酶处理核酸样品而将靶核酸进行分离。在一些情况下,可通过剪切将靶核酸分离。在一些情况下,可通过超声处理将靶核酸分离。
物理分离步骤(例如,利用一种或多种限制酶进行消化)后,样品可分为多个分区。多个分区中的每一个可包含约0、1、2个或数个靶多核苷酸。每个分区(例如,小滴)可平均具有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个小滴具有0个靶核酸拷贝。
通常,在分区中扩增靶核酸。在一些情况下,扩增包括使用一种或多种TaqMan探针。
在另一实施方案中,该方法进一步包括计算包含参考核酸序列的分区数的步骤。可知参考核酸序列在每个基因组中以特定拷贝数存在,并且可用于估计样品中靶核酸序列的基因组拷贝数。在另一实施方案中,估计拷贝数可包括将含有靶序列的分区数与含有参考核酸序列的分区数进行比较。在另一实施方案中,CNV的估计是通过靶核酸序列与参考序列的浓度比来确定的。
在另一实施方案中,该方法进一步包括分析第二样品的步骤,其中第二样品和第一样品来源于相同的样品(例如,将核酸样品分成第一样品和第二样品)。该方法可进一步包括不使第二样品与一种或多种限制酶接触。在一些情况下,该方法进一步包括将第二样品分成多个分区。该方法可进一步包括计算含有靶序列的第二样品的分区数。在另一实施方案中,该方法进一步包括计算含有参考序列的第二样品的分区数。在另一实施方案中,该方法包括估计第二样品中靶序列的拷贝数。在另一实施方案中,估计第二样品中靶序列的拷贝数包括比较具有靶序列的第二样品的分区数和具有参考序列的第二样品的分区数。
可以将第一样品中靶序列的拷贝数与第二样品中靶序列的拷贝数进行比较,以确定是否低估了第二样品中靶序列的拷贝数。拷贝数被低估的程度可指示所探询的拷贝是否全部在一条染色体上,或者是否至少一个拷贝在一条同源染色体上,而至少一个拷贝在另一条同源染色体上。如果每个二倍体基因组的值接近1,可说明是第一种情况,而值接近2,可说明是第二种情况。
例如,在公开号为20100203538的美国专利申请中描述了另外的通过扩增来确定拷贝数差异的方法。在美国专利6,180,349和Taylor等人(2008)PLoS One3(9):e3179中描述了用于确定拷贝数变异的方法。
当使用本文所述的方法时,可考虑许多特征:
样品制备:将要考虑的核酸的性质可包括二级结构、扩增子长度和断裂程度。可以进行分析来确定核酸样品的断裂程度。如果核酸样品的断裂程度太高,那么可将该样品从分析中舍弃。可以采取措施来消除样品中核酸的二级结构。可调整核酸的二级结构,例如,通过调节样品的温度或通过向样品中加入添加剂。可以确定潜在的扩增子是否太大而不能有效地扩增。在一个实施方案中,使用生物分析仪来评估核酸(如,DNA)的断裂。在另一实施方案中,使用大小排阻色谱法来评估核酸(如,DNA)的断裂。
动态范围:增加分区或空间上分离的区域的数目可增大方法的动态范围。可将模板核酸稀释至动态范围内。
准确度:如果使用同源样品,预期CNV值落在整数值(自我参考)上。漏码扩增(Drop-out amplification)可能会导致不准确的浓度测量,并因此导致不准确的CNV测定。可将添加剂(如,DMSO)加入到富含GC的试验中。
多路复用(multiplexing):实验可以是多路复用的。例如,在本文提供的方法中可以使用两种颜色:FAM:BHQ和NFQ-MGB试验;VIC:NFQ-MGB,TAMRA。HEX:BHQ。可以使用5’和3’标记,并且可以使用内部标记染料。在一些情况下,在本文提供的方法中使用的颜色数多于2种,如多于3、4、5、6、7、8、9或10种颜色。
精度:可以多种方式实现精度的提高。在一些情况下,增加dPCR实验中的小滴数可以提高分辨靶核酸和参考核酸之间的小浓度差异的能力。软件可以通过合并来自单个孔的重复物实现“元孔(metawell)”分析。在一些情况下,本文提供的方法能够检测小于30%、20%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的拷贝数差异。
试验概貌(assay landscape):本文所述的靶基因试验可与可购买到的或定制设计的靶基因试验相结合。
本文所述的拷贝数变异可包括核酸序列的减少或增加。拷贝数变异可能是遗传的或可能是由新生(de novo)突变引起的。CNV可为一个或多个不同的级别。参见,例如,Redon等人,(2006)Global variationin copy number in the human genome.Nature444pp.444-454。CNV可由简单新生缺失、简单新生重复或缺失和重复两者引起。CNV可由多等位基因变异的组合引起。CNV可以是具有新生增加的复杂CNV。CNV可包括大约或多于约0、1、2、3、4、5、6、7、8、9或10个连续基因。CNV可包括约1个至约10个、约1个至约5个、约1个至约4个、约1个至约3个、约1个至约2个、约0个至约10个、约0个至约5个或约0个至约2个连续基因。拷贝数变异可包括大约或大于约100、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、500,000、750,000、一百万、五百万或一千万碱基对的增加或减少。在一些情况下,拷贝数变异可包括约1,000至约10,000,000、约10,000至约10,000,000、约100,000至约10,000,000、约1,000至约100,000或约1,000至约10,000个核酸序列碱基对的增加或减少。拷贝数变异可能是核酸序列的缺失、插入或重复。在某些情况下,拷贝数变异可为串联重复。
在另一实施方案中,可由通过分区样品的实时PCR或ddPCR产生的荧光信号评估CNV单元型。在实时PCR或ddPCR实验后期之前,当试剂可能变为限制性的时,具有较高靶序列拷贝数的分区可比具有较低靶序列拷贝数的分区具有更强的信号。在一个实施方案中,可将样品(例如,在连接实验中使用的样品的子样品)进行分区,并且可对分区(例如,小滴)进行PCR。由于分区经历了靶核酸序列和/或参考核酸序列的指数扩增,所以可确定分区的平均荧光强度。平均强度可对应于靶序列的起始拷贝数。如果多个靶序列沿着单一多核苷酸链进行连接,那么捕获该链的分区(如,小滴)中的强度可高于捕获仅具有单一靶序列拷贝的链的分区(例如,小滴)的强度。具有较高平均振幅的阳性小滴的过量存在可提示存在具有多个CNV拷贝的单元型。相反,仅具有低平均振幅的阳性小滴的存在可提示在样品中仅存在具有单一CNV拷贝的单元型。在另一实施方案中,可基于分区的大小和分区中的试剂量来优化用于估计CNV的循环数。例如,具有较少试剂量的较小分区比预期具有较高试剂量的较大分区可能需要更少的扩增循环。
该方法可以是有用的,因为其甚至可用于分析多核苷酸上彼此接近的,例如,相距小于约10、9、8、7、6、5、4、5、2、1、0.7、0.5、0.3、0.2、0.1、0.05或0.01兆碱基的靶序列拷贝;或多核苷酸上彼此非常接近的,例如,相距小于约10、9、8、7、6、5、4、3、2或1千碱基的靶序列拷贝。在一些情况下,该方法可用于分析多核苷酸上彼此非常接近的,例如,相距在约1、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或950个碱基对以内的靶序列拷贝。在一些情况下,该方法可用于分析相隔零(0)个碱基对的靶序列拷贝。在一些情况下,该方法可用于相同、近似相同和完全不同的靶序列。
本文描述了用于估计一种或多种靶序列的拷贝数的方法的其它实施方案。
测定靶序列的连接
本文所述的方法可以指示两个或多个靶序列是否连接在多核苷酸上(例如,该方法可用于测定靶序列的连接)。在一个实施方案中,提供了一种方法,该方法包括物理分离靶序列拷贝(例如,使用一种或多种限制酶),以便可将拷贝独立地分配至分区中用于数字读出,并且使用未消化的DNA的读数和已消化DNA的读数来估计靶序列拷贝是如何连接的。例如,本文所述的方法可用于确定靶序列是否存在于同一染色体上或者它们是否存在于不同染色体上(参见例如图2)。图2图示了细胞核(左),其中母本染色体包含靶序列的两个拷贝,但是相应的父本染色体不包含拷贝;在右边的细胞核中,母本染色体和相应的父本染色体各包含靶序列的一个拷贝。
图3a图示了一种方法的实施方案的工作流程,不限制于步骤的任何顺序。一方面,提供了一种方法(320),其包括a)将包含多种多核苷酸的样品分成至少两个子样品(322);b)物理分离第一子样品中物理连接的靶序列(324);c)将第一子样品分成第一组多个分区(326);d)估计第一子样品中靶序列的拷贝数(328);e)将第二子样品分成第二组多个分区(330);f)估计第二子样品中靶序列的拷贝数(332);g)比较第一子样品中估计的靶序列的拷贝数和第二子样品中估计的靶序列的拷贝数,以确定样品中靶序列的单元型(334)。
在一个实施方案中,物理分离第一子样品中物理连接的靶序列包括使第一子样品与一种或多种限制酶接触。在另一实施方案中,使包含多核苷酸的样品与一种或多种限制酶接触包括在至少两个靶核酸序列之间消化核酸序列。在一些情况下,物理连接的靶核酸可通过使核酸样品与一种或多种限制酶接触而分离。在一些情况下,物理连接的靶核酸可通过剪切而分离。在一些情况下,物理连接的靶核酸可通过超声处理而分离。
在另一实施方案中,第一和第二子样品的多个分区中的每一个都包含约0、1、2个或若干靶多核苷酸。每个分区(如,小滴)可平均具有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)具有0个靶核酸拷贝。
在另一实施方案中,在分区中扩增靶序列。
在另一实施方案中,估计第一子样品中靶序列的拷贝数包括计算包含靶序列的第一子样品的分区数。在另一实施方案中,估计第一子样品中靶序列的拷贝数包括计算包含参考核酸序列的第一子样品的分区数。在另一实施方案中,估计第一子样品中靶序列的拷贝数包括比较包含靶序列的第一子样品的分区数和第一子样品中包含参考核酸序列的分区数。
在另一实施方案中,该方法进一步包括不使第二子样品与一种或多种限制酶接触。在另一实施方案中,估计第二子样品中靶序列的拷贝数包括计算包含靶序列的第二子样品的分区数。在另一实施方案中,估计第二子样品中靶序列的拷贝数包括计算包含参考序列的第二子样品的分区数。在另一实施方案中,估计第二子样品中靶序列的拷贝数包括比较具有靶序列的第二子样品的分区数和具有参考序列的第二子样品的分区数。在另一实施方案中,第一和第二子样品的参考序列为相同序列或不同序列。
在另一实施方案中,确定靶序列的单元型包括比较第一子样品中估计的靶序列的拷贝数和第二子样品中估计的靶序列的拷贝数。在另一实施方案中,单元型包含在单一多核苷酸上的靶序列的两个拷贝,并且在同源多核苷酸上无拷贝。在另一实施方案中,单元型分析包含第一多核苷酸上的靶序列的一个拷贝和第二(也许同源的)多核苷酸上的靶序列的第二拷贝。
通常,第一子样品和第二子样品中拷贝数之间的差异越大,一条染色体不携带靶序列拷贝的可能性越大。
图3b图示了一种方法的另一实施方案的工作流程,不限制于步骤的任何顺序。一方面,提供了一种方法(336),其包括a)获取包含多种多核苷酸的多核苷酸样品(338),将其分成至少两个子样品(340);b)用短周期PCR预扩增第一子样品中的靶序列(342);c)将第一子样品分成第一组多个分区(344);d)估计第一子样品中靶序列的拷贝数(346);e)将未预扩增的第二子样品(348)分成第二组多个分区(350);f)估计第二子样品中靶序列的拷贝数(352);g)比较第一子样品中估计的靶序列的拷贝数和第二子样品中估计的靶序列的拷贝数,以确定样品中靶序列的连接(354)。
在一些情况下,用来分离靶序列的预扩增是特定靶序列扩增(STA)(Qin等人(2008)Nucleic Acids Research36e16),其需要进行简短的预扩增步骤,以产生针对靶核酸的单独的未连接的扩增子。
在一个实施方案中,在第一子样品中预扩增靶序列包括使第一子样品与包含DNA聚合酶、核苷酸和靶序列特异性引物的反应混合物接触,以及将靶序列扩增有限次循环。任选地,该方法还包括使用参考序列的引物,并且任选地将参考序列扩增有限次循环。在一些实施方案中,循环数的数值可为4-25次循环。在一些情况下,循环数少于25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5或4次循环。循环数可根据小滴大小和可用试剂的量而变化。例如,对于较小大小的分区(如,小滴)可能需要较少的循环。
可将预扩增的第一子样品分成多个分区,每个分区平均包含少于一个靶多核苷酸。每个分区(如,小滴)可能平均具有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)具有0个靶核酸拷贝。
在另一实施方案中,估计第一子样品中靶序列的拷贝数包括计算包含参考核酸序列的第一子样品的分区数。在另一实施方案中,估计第一子样品中靶序列的拷贝数包括比较包含靶序列的第一子样品的分区数和第一子样品中包含参考核酸序列的分区数。
在另一实施方案中,该方法进一步包括不使第二子样品经历预扩增步骤。在另一实施方案中,将第二子样品分为多个分区,每个分区平均含有约0、1、2个或若干靶多核苷酸。每个分区(如,小滴)可平均具有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)具有0个靶核酸拷贝。在另一实施方案中,估计第二子样品中靶序列的拷贝数包括计算包含靶序列的第二子样品的分区数。在另一实施方案中,估计第二子样品中靶序列的拷贝数包括计算包含参考序列的第二子样品的分区数。在另一实施方案中,估计第二子样品中靶序列的拷贝数包括比较具有靶序列的第二子样品的分区数和具有参考序列的第二子样品的分区数。在另一实施方案中,第一和第二子样品的参考序列为相同序列或不同序列。
在另一实施方案中,确定靶序列的单元型包括比较第一子样品中估计的靶序列的拷贝数和第二子样品中估计的靶序列的拷贝数。在另一实施方案中,单元型包括单一多核苷酸上的靶序列的两个拷贝,而同源多核苷酸上无拷贝。在另一实施方案中,单元型包含第一多核苷酸上的靶序列的一个拷贝和第二(可能为同源的)多核苷酸上的靶序列的第二拷贝。
第一子样品和第二子样品中拷贝数之间的差异越大,一条染色体上不携带靶序列拷贝的可能性越大。
又一方面,本发明提供了一种确定多种靶核酸存在于同一多核苷酸上的方法,包括:a.将包含多种多核苷酸的样品分成至少两个子样品,其中多核苷酸包含第一和第二靶核酸;b.使第一子样品与能够将第一靶核酸与第二靶核酸(如果它们存在于同一多核苷酸上)进行物理分离的试剂接触;c.步骤b后,将第一子样品分成第一组分区;d.确定第一组分区中包含靶核酸的分区数;e.将第二子样品分成第二组分区;f.确定第二组分区中包含靶核酸的分区数;和g.将步骤d中得到的值和步骤f中得到的值进行比较,以确定第一和第二靶核酸是否存在于同一多核苷酸内。
样品可具有足够高的分子量,使得如果一对靶序列位于同一染色体上,它们在溶液中也可大部分连接。如果样品中的核酸(如,DNA)完全未断裂,读数可能为0、1或2个靶序列拷贝(整数)。然而,由于核酸(如,DNA)可能部分降解,拷贝数可跨越非整数值以及大于2的数值。可进行另一步骤以评估样品的核酸断裂,例如,通过使用凝胶、生物分析仪、大小排阻色谱法或数字PCR共定位方法(里程碑(milepost)试验)。如果发现核酸样品过度断裂,那么这就降低了可收集有关连接的信息的可能性。
该方法可用于确定较小拷贝数状态,如2、3、4。
在另一实施方案中,提供了一种确定靶核酸序列的连接的方法,利用具有两种不同标记物(如VIC和FAM)的探针检测相同的靶序列。例如,可将核酸序列分成多个空间上分离的分区,可扩增分区中的靶序列,并且可使用两种不同的探针检测靶序列。可将核酸样品分区,使得在每个分区中平均具有约0、1、2个或若干靶多核苷酸。每个分区(如,小滴)平均可具有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)具有零个靶核酸拷贝。
如果分区包含连接在多核苷酸上的两个靶序列,那么分区可具有仅VIC(VIC/VIC)、仅FAM(FAM/FAM)或VIC和FAM的信号。与FAM和VIC靶序列随机分布所预期的相比,在分区中具有VIC和FAM信号的分区的过多存在可指示样品含有多核苷酸,该多核苷酸具有连接在多核苷酸上的至少两个靶序列。同时具有VIC和FAM信号的分区没有过多存在可指示样品中两个靶核酸序列不连接。
共定位(Collocalization)
样品分区和分析分区中多个靶序列的能力可允许检测样品中的靶序列何时空间上聚集在一起。这可通过评估与如果靶序列随机分布在分区中所预期的相比,具有靶序列特定组合的分区数是否处于统计学过量来完成。这种分区的过量程度可用于估计靶序列组合的浓度。
例如,可使用数字PCR(如,ddPCR)来测量两个靶序列:A和B。例如,将有四种类型的小滴:对两种靶序列均为阴性的小滴,对A为阳性的小滴,对B为阳性的小滴,和对两种均为阳性的小滴。在随机分布下,双阳性小滴的数目应该接近于(小滴总数)*(至少具有B的小滴的分数)*(至少具有A的小滴的分数)。如果双阳性小滴数显著超过期望值,则可推断两个靶序列在样品中是彼此接近的。该结果可意味着靶序列A和B凭借例如处于同一多核苷酸上而物理连接,它们是同一蛋白质/核酸复合物的一部分,它们是同一外体的一部分,或者它们是同一细胞的一部分。
作为基于探针的TaqMan试验方案的一部分,分区中特定靶序列的存在可通过使用该靶序列特异性的荧光团进行评估。例如,当测量两个靶序列A和B时,可使用FAM测量A,使用VIC测量B。在一些实施方案中,可利用终点荧光,使用相同荧光团或嵌入染料评价不同靶序列,以将含有A的分区与含有B的分区以及含有A和B的分区区别开来。
可变剪接
可变剪接是真核生物的普遍特征。通常根据细胞类型、细胞状态或外部信号,通过使用不同构型的外显子,当由相同的基因组区域构建不同转录物时发生这种现象。例如,特定基因可具有两个外显子:外显子A和外显子B,和三种可能的转录物:只含有A的转录物1,只含有B的转录物2,含有A和B的转录物3。能够说明实际上表达了哪些转录物及其水平可对我们理解基础生物学、疾病、诊断学和治疗具有多重启示。
共定位可用来通过测定具有两个或更多个目标外显子的RNA分子的浓度而检测和量化可变剪接。例如,一个试验可针对一个外显子,而另一个试验可针对另一个外显子。两个试验的统计学上显著的共定位可提示含有这两个外显子的RNA分子的存在。可以这种方式针对并评估其它的外显子和在潜在的转录物分子上的位置。
重排
在另一实施方案中,可构建在多核苷酸上通常彼此相距甚远(例如,在染色体上相隔数百万bp的两个基因)的两种分析(扩增子)。一种分析在一个通道上(如,FAM),另一种在另一个通道上(如,VIC)。在数字扩增方法如dPCR或ddPCR中,通常不应该在基线统计期望之上观察到在同一分区(如,小滴)中的共定位。如果发生FAM和VIC的共定位(例如,本文所述的连接分析所测定的),那么可能指示两个基因座在基因组上彼此邻近。该结果可指示倒位或易位,这取决于基因座通常位于哪里。如果分析的终点荧光足够不同,分析也可以在同一通道上多路复用。可多路复用超过两种分析以捕捉多个倒位/易位事件或解释给定的易位可呈现不同断点的事实。
重排的检测可用于诊断或预测多种病状,包括癌症和胎儿缺陷。重排的检测可用于为受试者选择一种或多种治疗性治疗。例如,t(9;22)(q34.1;q11.2)易位的检测可导致与慢性髓细胞性白血病(CML)相关的BCR-ABL融合蛋白的产生。可使用伊马替尼(Gleevec)治疗表达BCR-ABL的CML患者。
可用本文所述的方法检测的重排包括,例如,倒位、易位、重复或缺失(参见例如图50)。
确认由数字实验产生的连接(单元型)信息
在另一实施方案中,用样品的数字分析和限制酶消化所确定的连接信息可通过一种或多种其它试验来确认。在一个实施方案中,本文所述分区样品的实时PCR或ddPCR实验期间的信号产生可用于确认连接信息。在一个实施方案中,可将样品(例如,在连接实验中使用的样品的子样品)进行分区,并在分区(如,小滴)上进行PCR。由于分区经历了靶核酸序列和/或参考核酸序列的指数扩增,所以可确定分区的平均荧光强度。含有具有靶核酸序列的多个(例如2个)连接拷贝的多核苷酸的分区比仅含有一个拷贝的靶核酸序列的小滴可具有更高的荧光强度。
在另一实施方案中,长片段PCR可用于确认连接信息。例如,PCR可用于检测同一染色体上两个串联排列的靶核酸序列拷贝(顺式构型)的存在,并且其可用于检测另一条染色体上靶核酸序列的缺失。在一个实施方案中,可以使用扩增区域(疑似具有靶序列串联拷贝的区域)之外的引物。在另一实施方案中,可将DNA多核苷酸分区成小滴。将DNA多核苷酸分区成小滴可能是有利的,因为这可允许检测两种类型的DNA物质:a)具有串联排列的靶序列的DNA区段,和b)靶序列缺失的DNA区段。如果整体(in bulk)(例如,不对多核苷酸进行分区)进行类似的反应,那么代表靶序列缺失的DNA的较小PCR产物可超过代表具有串联排列的靶序列的DNA区段的PCR产物。因此,只能产生一种PCR产物。这些PCR产物的大小差别可使用例如凝胶电泳或生物分析仪进行估计。
在一些情况下,具有串联排列的靶核酸序列拷贝的DNA可能太大而不能成功地被PCR扩增(例如,大小>20KB)。在这些情况下,通常只扩增代表靶核酸序列缺失的DNA区段的较小PCR产物。如果靶核酸序列太长而不允许产生PCR产物,那么可在含有靶核酸序列缺失的染色体上进行PCR。在这种情况下,如果PCR在该序列缺失的区域上进行,则可产生产物,但是如果由于引物之间的距离太大而出现靶序列,则不会产生产物。
在一些实施方案中,长片段PCR可用于分辨连接或确定拷贝数估计值。在一些情况下,长片段PCR与本文提供的方法联合使用。在一些情况下,可(单独或与本文提供的方法联合)使用亲本或其它亲属的基因型来推断目标个体的拷贝数状态。
在一些情况下,该方法可包括用重组DNA技术对染色体区域进行克隆,并对该染色体区域的单个拷贝进行测序。在一些实施方案中,该方法包括(a)使用下一代测序技术来鉴定与排列紧密的(例如,相距小于约2000核苷酸、小于约1000核苷酸、小于约500核苷酸、小于约200核苷酸或小于约100核苷酸)和一起存在于同一测序读取中的多态性相关的信息,和(b)使用本文提供的方法来鉴定与相距较远的(例如,相距大于约5、10、50、100、150、200、250、300、400、450、500、550、600、650、700、750、800、850、900、950、1000、1250、1500、1750、2000、2500、3000、3500、4000、4500或5000个核苷酸)多态性相关的信息。在一些实施方案中,该方法包括使用本文提供的方法来鉴定与相距较远的(例如,相距大于约5、10、50、100、150、200、250、300、400、450、500、550、600、650、700、750、800、850、900、950、1000、1250、1500、1750、2000、2500、3000、3500、4000、4500或5000个核苷酸)多态性相关的信息。在一些情况下,该方法包括使用本文提供的方法联合使用受试者双亲或其它近亲属的基因型信息来使用孟德尔遗传规律推断相位信息。然而,该方法不能对每个多态性进行定相。一些实施方案包括结合使用本文提供的方法和统计学方法来确定连接。
单元型
单元型可指同时存在于或连接在单一染色体上(例如,在同一染色体拷贝上)和/或同一片核酸和/或遗传物质上的两个或更多个等位基因。定相可以是确定等位基因是否同时存在于同一染色体上的过程。确定基因组中哪些等位基因是相连的对于考虑基因是如何遗传的可能是有用的。本发明通过扩增分区的样品为单元型分析提供了包括方法和装置的系统。
图4示出了列有可在单元型分析的示例性方法(20)中进行的步骤的流程图。这些步骤可以任何合适的顺序和组合进行,并且可与本发明的任何其它步骤结合。通常,可从具有二倍体或更高染色体互补物的受试者获得样品(22)。可将样品进行分区(24)。将样品进行分区可包括将样品的包含核酸的水相分区或分开。可扩增一对(或更多)多态基因座(26)。可收集每个多态基因座的等位基因特异性扩增数据(28)。可将多态基因座的扩增数据与来自相同体积的扩增数据进行关联(30)。可选择多态基因座的单元型(32)。
一种单元型分析方法可利用从受试者如人获得的样品来进行。可将样品的含有核酸的水相分区为多个离散体积,如小滴。每个体积可平均含有少于约一个基因组当量的核酸,使得每个体积平均含有少于约一个拷贝的第一多态基因座的等位基因和连接的第二多态基因座的等位基因。可扩增核酸中来自第一多态基因座和第二多态基因座中每一个的至少一个等位基因序列。可从单个体积收集每个基因座的可辨别的等位基因特异性扩增数据。第一基因座的等位基因特异性扩增数据可与来自相同体积的第二基因座的等位基因特异性扩增数据相关联。可基于等位基因特异性扩增数据的相关性来选择第一和第二基因座中每一个的核酸的单元型。总之,若等位基因序列构成了受试者的单元型,则该方法可依靠相同体积中来自不同基因座的等位基因序列的共扩增,而相反地,若等位基因序列不构成受试者的单元型,则不进行共扩增。
用于单元型分析的系统能够执行本文公开的方法。该系统可包含配置用于形成包含核酸的水相小滴的小滴发生器。该系统还可包含配置用于从单个小滴收集每个基因座的等位基因特异性扩增数据的检测器。该系统还可包含处理器。该处理器可配置用于将第一基因座的等位基因特异性扩增数据与来自相同体积的第二基因座的等位基因特异性扩增数据进行关联,并基于等位基因特异性扩增数据的相关性选择核酸的单元型。
任选地,可将样品分为子样品。任选地,可使第一子样品与切割多态基因座之间位点的限制酶接触;并且可任选地使第二子样品与限制酶接触。任选地,可将来自第一子样品的等位基因特异性扩增数据与来自第二子样品的等位基因特异性扩增数据进行关联。
本发明的其它方面在以下章节中呈现:(I)定义,(II)系统概述,(III)由连接的SNP创建的示例性潜在单元型,(IV)利用在小滴中扩增的示例性单元型分析,和(V)选定的实施方案。
I.定义
本公开内容中使用的技术术语具有本领域技术人员公认的含义。然而,下列术语可能具有如下所述的附加含义。
序列变异可以是在群体成员之间或受试者和/或样品的染色体类型的拷贝之间发现的基因组序列的任何趋异。序列变异也可称为多态性。
基因座可为基因组的特定区域,通常为小于约一千碱基或小于约一百核苷酸的相对较短区域。
多态基因座可为群体中和/或受试者和/或样品中在此处存在序列变异的基因座。多态基因座可由共同存在于基因组的同一位置上的两种或更多种不同序列产生。不同的序列可由于一个或多个核苷酸的置换、缺失/插入和/或任何数目的核苷酸(通常为相对少量的核苷酸,如少于约50、10或5个核苷酸)的重复而彼此不同。在示例性实施方案中,多态基因座由单核苷酸多态性(“SNP”)即在群体内变化的单核苷酸位置而创建。
等位基因可为在多态基因座上共存的两种或多种形式之一。等位基因还可称为变体。等位基因可为多态基因座处存在的主要或优势形式,或者次要或甚至极罕见的形式。因此,来自同一多态基因座的一对等位基因可在群体中以任何合适的比例存在,如约1:1、2:1、5:1、10:1、100:1、1000:1等。
等位基因序列可为表征、包含和/或重叠等位基因一串核苷酸。可利用等位基因序列的扩增来确定相应等位基因是否存在于样品分区中的多态基因座上。
单元型可为同时存在于或连接在单一染色体上(例如,在同一染色体拷贝上)和/或在同一片核酸和/或遗传物质上的两个或更多个等位基因;单元型也可指同时存在于或连接在单一染色体上的两个或更多个靶核酸。靶核酸可以是相同的或不同的。
连接可以是来自不同多态基因座的等位基因之间的连接,也可以是相同的或几乎相同的靶核酸之间的连接。显示连接(和/或已连接)的多态基因座通常包括同时存在于同一染色体拷贝上的各自的等位基因,并且可在同一拷贝上彼此相对靠近,如尤其在约10、1或0.1兆碱基以内。
II.用于单元型分析的系统概述
图4示出了列有可在单元型分析的示例性方法20中进行的步骤的流程图。这些步骤可以任何合适的顺序和组合进行,并且可与本发明的任何其它步骤结合。
如22所示,可获得样品。可从受试者,通常为具有二倍体或更高染色体互补物的受试者获得样品。换句话说,受试者通常有至少两套染色体,且受试者细胞中有至少一对每种类型的染色体。例如,人的每个体细胞含有两个拷贝的染色体1、2、3等,得到23对染色体(两套染色体),总共46条染色体。
如24所示,可将样品分区。将样品分区可包括将样品的含有核酸的水相分区或分开。分区将水相分成多个离散的且分开的体积,也可称为分区。体积可通过流体如连续相(例如,油)彼此分离。或者,体积可通过壁如样品架的壁彼此分离。可连续地或平行地形成体积。在一些实施方案中,体积为形成乳液的分散相的小滴。
如26所示,可扩增一对(或更多)多态基因座。更特别地,可扩增来自每个多态基因座的至少一个等位基因序列。每个等位基因序列是基因座的相应等位基因所特有的。在一些实施方案中,仅可从每个基因座扩增一个等位基因序列,或可从至少一个基因座扩增一对等位基因序列。特定等位基因序列和扩增的不同等位基因序列的数目可由水相分区前水相中包含的特定引物组来确定。
如28所示,可收集每个多态基因座的等位基因特异性扩增数据。该数据可与单个体积中每个等位基因序列的可分辨扩增(或其缺乏)相关。数据可由对应于并且能够特异性杂交每个扩增的等位基因序列的可分辨探针来检测。可平行地或连续地从体积收集数据。在示例性实施方案中,可通过扩增信号的光学检测收集数据。例如,光学检测可包括检测代表每个等位基因序列的可分辨扩增的荧光信号。
如30所示,可将多态基因座的扩增数据和来自相同体积的扩增数据进行关联。关联通常确定哪些等位基因序列最有可能同时存在于单个体积中,因此最初在受试者遗传物质中的同一染色体拷贝上彼此连接。关联可包括确定与相同体积中不同等位基因序列的共扩增相对应的至少一个相关系数。在一些情况下,关联可包括确定与相同基因座的一对等位基因序列中的每一个与另一基因座的等位基因序列共扩增相对应的一对相关系数。关联还可包括将相关系数进行相互比较和/或与阈值进行比较,或者可包括确定相关系数是负还是正。在一些实施方案中,可用已经通过应用可区分扩增阳性信号和扩增阴性信号的阈值而转化为二进制形式的扩增数据进行关联。关联还可或备选地可包括比较展示出不同组等位基因序列共扩增的体积数,和/或比较展示出一组等位基因序列共扩增的体积数与仅展示出一个等位基因序列扩增的体积数。
在一些实施方案中,28和30所示的一个或两个步骤可替换为确定相同体积中来自两个基因座的等位基因序列共扩增的至少一个测量值的步骤。可使用共扩增的任何合适的测量值,如通过来自相同体积的多态基因座的等位基因特异性扩增数据的关联而获得的至少一个相关系数。在其它实例中,共扩增的测量值可以是代表来自每个基因座的等位基因序列共扩增的至少一个数值或频率的至少一个值。关联扩增数据和确定共扩增测量值的其它方面在本公开内容的其它地方如在第IV部分中描述。
在一些实施方案中,可将含有多核苷酸的样品分为两个或更多个子样品。可使第一子样品与切割两个多态基因座之间的位点的限制酶接触。然后可将第一子样品分成多个分区。而后可收集如本文所述的每个多态基因座的等位基因特异性扩增数据。可将尚未与切割两个多态基因座之间的位点的限制酶接触的第二子样品分成多个分区。而后可收集每个多态基因座的等位基因特异性扩增数据。可将来自第一和第二子样品的扩增数据进行关联以确定多态基因座的单元型。
如32所示,可选择多态基因座的单元型。选择可基于扩增数据的相关性和/或基于共扩增的至少一个测量值。单元型可从正在研究的多态基因座的一组潜在单元型中进行选择。选定的单元型通常包括指定在受试者的相同染色体拷贝上可能彼此连接的至少一对特定等位基因。
图5示出了用于执行图4的方法20的示例性系统40的选定方面的示意图。该系统可包括小滴发生器(DG)42、热循环仪(TC)44、检测器(DET)46和处理器(PROC)48。箭头50-54在系统组件间延伸,分别指示小滴(50和52)和数据(54)的移动。
小滴发生器42可形成含有核酸的水相的小滴。小滴可连续地或平行地形成。
热循环仪44可使小滴经受多次加热和冷却循环从而驱动等位基因序列的扩增,如PCR扩增。热循环仪可以是间歇式热循环仪,其可平行地扩增所有小滴,或者可以是基于流动的热循环仪,其可连续地扩增小滴。
检测器46收集扩增数据,如小滴的等位基因特异性扩增数据。检测器可以是,例如,荧光检测器,并且可连续地或平行地检测小滴。
处理器48,又可称为控制器,可与检测器46通讯,并可程序化以处理来自检测器的扩增数据。处理器(可以是数字处理器)可以程序化以处理来自检测器的原始数据,如减去背景和/或基于小滴大小将小滴数据标准化。处理器另外或备选地可以程序化以应用阈值将数据转化为二进制形式,从而进行扩增数据的关联,以计算和/或比较共扩增的一个或多个测量值,从而基于相关性和/或测量值或其任意组合选择单元型。
小滴发生器、热循环仪、检测器和控制器的其它方面在2010年7月8日公开的、公开号为2010/0173394A1的美国专利申请中有所描述,其通过引用并入本文。
III.由连接的SNP创建的示例性潜在单元型
图6示意性地图示了由连接的SNP创建的单元型分析的情况,其中二倍体受试者60的遗传物质在两个不同的基因座的每一个中都有两种不同的核苷酸。单元型分析的目的在于确定在每个染色体拷贝上第一基因座处的哪种核苷酸与第二基因座处的哪种核苷酸结合。
受试者60可具有由一对单核苷酸多态性66、68创建的两种备选单元型构型62、64中的任一种。每种构型代表两种单元型:构型62具有单元型(G,C)和(A,T),而构型64具有单元型(G,T)和(A,C)。受试者的细胞70包括一对相同类型的染色体拷贝72、74。(未示出细胞中可能存在的其它染色体类型。)染色体拷贝72、74在序列上可能彼此大部分相同,但这些拷贝通常也具有许多序列变异的基因座,如多态基因座76、78,这两个染色体拷贝在此处的序列是不同的。基因座76、78包含在基因组区域或靶区域80中,该区域在细胞70的细胞核中用虚线框勾画出,并且作为代表基因座76、78的基因型82的复合序列邻近细胞放大示出。(为简化描述,图6(和图7)中只示出了每个染色体拷贝和靶区域的一条链。)
基因型82可通过任何适当的基因分型技术在单元型分析之前或作为单元型分析的一部分来确定。基因型82显示,基因座76的单一多态性核苷酸在染色体拷贝72和74上为“G”和“A”(反之亦然),而对于基因座78则为“C”和“T”。然而,基因型并没有指示两个基因座的单个核苷酸是如何结合在染色体拷贝72、74上的。因此,基因型可由备选的、潜在的单元型构型62、64产生。本文所公开的单元型分析允许确定受试者的遗传物质中存在哪些潜在单元型。
IV.在小滴中使用扩增进行的示例性单元型分析
图7示意性地图示了图4方法的示例性版本88的执行。在此,分析来自图6的受试者的遗传物质,从而区分前述部分中所述的备选的、潜在的单元型构型。
如92所示,获得样品90。将该样品在包含受试者的核酸96的水相94中进行处理。在该视图中,为简便起见,只描述含有基因组区域80的片段98。片段98足够长以致只有少数(例如,不完整片段100、102)未包括来自两个基因座76、78(也参见图6)的等位基因序列104-110。水相可配置用于等位基因序列104-110的PCR扩增。
如114所示,形成小滴112。小滴可以是包含将小滴彼此分离的连续相118的乳液116的一部分。小滴可以是单分散的,即,基本上大小相同。可能合适的示例性单分散性程度在2010年7月8日公开的公开号为2010/0173394A1的美国专利申请中有所描述,其通过引用并入本文。
片段98可在其形成时随机分配至小滴中。在片段98在分区的水相中适当稀释下,并且通过恰当选择小滴大小,每个小滴中平均含有靶区域80的少于约一个拷贝或分子。因此,一些小滴如120所示的空小滴不含靶标的拷贝,许多只含有靶区域的一个拷贝,一些含有靶标的两个或更多个拷贝(如122所示的小滴),并且一些只含有靶区域的一个等位基因序列(如124所示的小滴)。
如126所示,可扩增等位基因序列。在此,从基因座76扩增两个等位基因序列104和108,并且只从基因座78扩增等位基因序列110(也参见图6)。扩增的每个等位基因的拷贝标记为104′、108′和110′。在其它实施方案中,仅可从每个基因座扩增一个等位基因序列,或者尤其是,可从每个基因座扩增至少两个等位基因序列。(例如,可用与扩增等位基因110相同的引物扩增等位基因序列106,但是为简化描述,此处未示出等位基因序列106的扩增。)
如130所示,可从小滴收集等位基因特异性扩增数据。在该实例中,收集荧光数据,其中使用各自包含在不同等位基因特异性探针中的不同的、可辨别的荧光染料,为每个等位基因序列104′、108′、110′提供扩增信号。特别是,染料FAM、VIC和ROX发射分别与等位基因序列104、108和110的扩增相关的FAM-、VIC-和ROX信号132-136。在其它实施方案中,可检测所有四个等位基因序列104-110或仅两个等位基因序列(每个基因座上一个)的等位基因特异性扩增。
如140所示,将扩增数据进行关联,和/或确定相同小滴中等位基因序列共扩增的至少一个测量值。图142、144示意性地示出了关联和/或确定共扩增测量值的方法。图142将单个小滴(由图中的点表示)的FAM和ROX信号强度作图,而图144将单个小滴的VIC和ROX信号强度作图。对于给定信号类型(因此给定的等位基因序列)代表扩增阴性(“-”)和扩增阳性(“+”)小滴的信号值在邻近图的各坐标轴处示出。
线146、148代表每幅图的扩增数据与线性关系的最佳拟合。然而,这两种拟合具有相关联的相反极性的相关系数。图142中的扩增数据提供了负相关系数,因为相同小滴中等位基因序列104(由FAM信号报告)和等位基因序列110(由ROX信号报告)的共扩增为负相关。相反,图144中的扩增数据提供了正相关系数,因为相同小滴中等位基因序列108(由VIC信号报告)和等位基因序列110(由ROX信号报告)的共扩增为正相关。可相互比较相关系数从而选择单元型。例如,可基于哪个相关系数更大(例如,更接近1.0)和/或哪个为正(如果只有一个为正)来选择单元型。在此,可基于VIC和ROX信号的正相关来选择包含等位基因序列104和106的第一单元型和包含等位基因序列108和110的第二单元型。在一些实施方案中,可仅基于一种相关性来选择单元型,如基于相关系数是负还是正,或基于相关系数与预先确定的值的比较。
图8示出了柱状图160,该柱状图图示了用于关联图7的扩增数据的备选方法。通过将每种类型的小滴信号(FAM、VIC和ROX)与可区分每个等位基因序列的扩增阳性小滴(指定为“1”)和扩增阴性小滴(指定为“0”)的阈值进行比较,已将图7的扩增数据转化成二进制形式。图160列出了数据的二进制形式,以单独或组合地呈现各种等位基因序列的扩增阳性小滴数。如162所示的左侧两个柱允许比较只含有等位基因序列104(FAM)的小滴数与同时含有等位基因104(FAM)和110(ROX)的小滴数。左侧的数据显示等位基因序列104的扩增与等位基因序列110的扩增相关性不好。换句话说,等位基因序列104和110在相同小滴中不倾向于共扩增。如164所示的右侧两个柱允许比较只含等位基因序列108(VIC)的小滴数和同时含有等位基因序列108(VIC)和110(ROX)的小滴数。右侧数据显示等位基因序列108的扩增与等位基因110的扩增相关性很好。换句话说,等位基因序列108和110在相同小滴中倾向于共扩增。将左侧的一对柱和右侧的一对柱分开考虑或共同考虑,指示了其中等位基因序列108与等位基因序列110相关联的单元型。
在用本文所述的方法、组合物或试剂盒分析前,可使包含遗传连锁基因座的样品经受断裂。包含遗传连锁基因座的样品可通过,例如,机械剪切、使样品通过注射器、超声处理、热处理(例如,90℃下30分钟)和/或核酸酶处理(例如,用DNA酶、RNA酶、核酸内切酶、核酸外切酶、限制酶)进行断裂。在分析之前,包含遗传连锁基因座的样品可不经处理或经过有限处理。
在另一实施方案中,使用小滴数字PCR(ddPCR),可进行针对两个基因组基因座如共同染色体上的两个基因的双重反应(duplexreaction)。根据它们的荧光,小滴可分类为四个群体。例如,如果FAM-标记的探针用于检测一个基因座,而VIC-标记的探针用于检测另一基因座,则四个群体可以是FAM+/VIC+、FAM+/VIC-、FAM-/VIC+和FAM-/VIC-。通过比较具有这些群体中的每一个的小滴的数目,可以确定基因座共分离至同一小滴中的频率。利用泊松统计学,可以估计与两个分离的基因座碰巧在同一小滴中的情况相比,彼此实际连接的种类的百分比。
可使用本文所述的方法、组合物和试剂盒检查以确定其在样品中是否仍连接或在样品中已分离的遗传连锁基因座的数目可以是大约、至少约或大于约2、3、4、5、6、7、8、9或10。可使用本文所述的方法、组合物和试剂盒检查以确定其在样品中是否仍连接或在样品中已分离的遗传连锁基因座的数目可以是约2至约10、约2至约8、约2至约6、约2至约4、约3至约10、约3至约8、约3至约6、约4至约10或约4至约6。
每个遗传连锁基因座之间的碱基对的数目可以为大约、至少约、或小于约10bp、25bp、50bp、75bp、100bp、250bp、500bp、750bp、1000bp、2000bp、3000bp、4000bp、5000bp、6000bp、7000bp、8000bp、9000bp、10,000bp、15,000bp、20,000bp、33,000bp、50,000bp、75,000bp、100,000bp、250,000bp、500,000bp、750,000bp、1,000,000bp、1,250,000bp、1,500,000bp、2,000,000bp、5,000,000bp或10,000,000bp。每个遗传连锁基因座之间的碱基对的数目可以为约10到约10,000,000bp、约100到约10,000,000bp、约1,000到约10,000,000bp、约1,000到约1,000,000bp、约1,000到约500,000bp、约1,000到约100,000bp、约3000到约100,000bp、约1000到约33,000bp、约1,000到约10,000bp,或约3,000到约33,000bp。每个遗传连锁基因座之间的碱基对的数目可以为0bp。
在一些实施方案中,单元型分析方法包括检查两个不同基因座上的两个等位基因是否共定位于同一空间上分离的分区。在一个实施方案中,可分析两个基因座上额外的等位基因。例如,如果在数字实验中两个不同基因座上的两个等位基因没有共定位,那么可以分析两个基因座上的一个或多个其它等位基因,从而为共定位提供阳性对照。例如,假设母本遗传的染色体在基因座1上具有等位基因A,而在与基因座1相距2100bp的基因座2上具有等位基因Y。在相应的父本遗传的染色体上,假定等位基因B在基因座1上,而等位基因Z在基因座2上。如果将包含这些核酸的核酸样品分成空间上分离的分区,并对等位基因A和等位基因Z进行扩增,那么等位基因A和等位基因Z的扩增信号应该很少或从不共定位于单一分区中,因为等位基因A和等位基因Z不相连。可进行数字分析来确认等位基因A和等位基因Y连接在母本遗传的染色体上,或等位基因B和等位基因Z连接在父本遗传的染色体上。
利用两种颜色进行的单元型分析
虽然本文示出的实施方案展示的是使用三色系统来测量定相,但是也可使用两色系统测量定相。例如,如果需要对两种杂合SNP(Aa和Bb)进行定相,则可以设计针对A的FAM试验和针对B的VIC试验。同时含有A和B的分区的过量将指示A和B之间连接,这提示两种单元型为A-B和a-b。缺乏这种过量可能提示单元型的备选组合:A-b和a-B。可以确定DNA具有足够高的分子量,从而作出后一推断。为了确认单元型的备选组合,可能需要在单独的孔中运行另一双重试验,其中针对等位基因的不同组合。例如,可运行针对A的FAM试验和针对b的VIC试验。同时含有A和b的分区的过量将指示A与b之间连接,提示两种单元型为A-b和a-B。
参考序列
在涉及拷贝数分析(或本文所述的其它应用)的方法中,计数例如在给定的基因组中发现特定序列(如,靶序列)的次数是有用的。在一些实施方案中,该分析是通过评估(或比较)已知在每个基因组中以一定固定拷贝数存在的靶核酸序列和参考核酸序列的浓度来完成的。对于参考序列,可以使用在每个二倍体基因组中以两个拷贝存在的管家基因(例如,维持细胞基本功能所需的基因)。将靶序列的浓度或量除以参考序列的浓度或量可以得到每个基因组的靶序列拷贝数的估计值。也可使用一种或多种参考序列确定靶序列的连接。
可在本文所述的方法中用作参考序列的管家基因可包括编码以下的基因:转录因子、转录阻抑物、RNA剪接基因、翻译因子、tRNA合成酶、RNA结合蛋白质、核糖体蛋白质、RNA聚合酶、蛋白质加工蛋白质、热激蛋白质、组蛋白、细胞周期调节物、细胞凋亡调节剂、癌基因、DNA修复/复制基因、碳水化合物代谢调节物、三羧酸循环调节物、脂类代谢调节物、氨基酸代谢调节物、核苷酸合成调节物、NADH脱氢酶、细胞色素c氧化酶、ATP酶、线粒体蛋白质、溶酶体蛋白质、变幻虫蛋白质、核糖核酸酶、氧化酶/还原酶、细胞骨架蛋白质、细胞粘着蛋白、通道或转运蛋白、受体、激酶、生长因子、组织坏死因子等。可用于所述方法中的管家基因的具体实例包括,例如,HSP90、β-肌动蛋白、tRNA、rRNA、ATF4、RPP30和RPL3。
为了确定靶序列的连接,与另一个基因座遗传连锁的基因座之一可以是共同参照物,例如,RPP30。任何遗传连锁基因座可用于本文所述的方法中。
可使用单拷贝参考核酸(例如,基因)来确定拷贝数变异。可使用多拷贝参考核酸(例如,基因)来确定拷贝数,从而扩大动态范围。例如,多拷贝参考基因可包含基因组中大约或大于约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000或100,000个拷贝。多种不同核酸(例如,多种不同基因)可用作参考。
确定核酸断裂的概率
可以进行数字分析来确定核酸样品中两个标记之间的断裂程度。图9图示了工作流程(900)。图9中的步骤可以任何合适的顺序和组合进行,并且可与本公开内容中的任何其它步骤结合。可获得多核苷酸样品(920)。可将该样品分成多个分区(940),使得每个分区平均只含有约0、1、2个或数个靶多核苷酸。每个分区(如,小滴)可平均具有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)具有0个靶核酸拷贝。
可对分区进行分析以计数含有第一靶序列和第二靶序列的分区(960),并且可使用算法预测第一和第二靶序列之间的断裂(980)。
如果两个不同的基因座(T1和T2)在不同的多核苷酸上,那么含有多核苷酸的样品(920)将包含只含有T1和只含有T2的多核苷酸(参见图10A)。然而,如果T1和T2在同一多核苷酸上,则包含含有T1和T2的多核苷酸的样品可以有三种:含有T1的断裂多核苷酸、含有T2的断裂多核苷酸和含有T1和T2的断裂多核苷酸(图10B)。T1和T2之间的距离越长,T1和T2之间断裂的概率就越高。可将样品分区(图9:940)。可进行数字分析,如数字PCR或小滴数字PCR,并且可计数具有T1、T2以及T1和T2的信号的分区(960)。可开发算法并用其确定T1和T2之间的断裂概率(980)。该算法可利用T1和T2之间的碱基或碱基对的数目(若已知)。该方法可用来确定DNA样品的断裂程度。如果含有T1和T2信号的分区数大于T1和T2在同一分区中所预期的分区数,那么该观察结果可以指示T1和T2是连接的。
对核酸(例如DNA)样品使用上述方法来确保DNA具有足够高的分子量从而将连接信息保留在样品中是有益的。
在本文所述的利用DNA的任何方法中,可进行试验来估计样品中DNA的断裂,并且该方法可引入有关DNA断裂的信息。在另一实施方案中,可基于样品中DNA的断裂程度将试验结果标准化。
还可通过例如凝胶、生物分析仪或大小排阻色谱法测定核酸的断裂。
甲基化程度的测定
可使用里程碑试验来确定CpG岛的甲基化状态。在一个实施方案中,本文提供了一种方法,其包括使用可通过ddPCR(里程碑试验)测量的扩增子的连接。扩增子之间的距离可跨越大于10kb,完全覆盖对于CpG岛所观察到的大小范围。
CpG岛可常见于人类基因的5’区域,包括在启动子序列中。在X-染色体失活和印刻过程中,CpG岛的甲基化可能在基因沉默中发挥作用。启动子区域CpG岛的异常甲基化可能与瘤形成中肿瘤抑制基因的转录失活有关。例如,已观察到肿瘤抑制基因p16、hMLH1和THBS1的异常甲基化。微卫星不稳定性和启动子相关CpG岛的甲基化之间存在关联。甲基化状态的确定可在测定母体血浆中的胎儿DNA负载中起作用。CpG序列的甲基化可以是癌症的标记。
图11图示了确定CpG岛甲基化状态的方法的工作流程(1100)。图11中的步骤可以任何合适的顺序和组合进行,并且可与本公开内容的任何其它步骤结合。可获得多核苷酸样品(1110)。可用甲基化敏感酶处理该多核苷酸样品(1120)。可将样品分成多个分区(1130),使得每个分区平均只含有约0、1、2个或数个靶多核苷酸。每个分区(如,小滴)可平均含有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)具有零个靶核酸拷贝。可扩增位于CpG岛5’和3’端侧翼的核酸序列(1140)。可对分区进行分析以确定在CpG岛侧翼的序列是在相同分区中还是在不同分区中(1150),从而确定甲基化状态(1160)。如果CpG是甲基化的,那么它就不会被甲基化敏感酶切割,并且侧翼序列(里程碑)可在同一分区中。如果CpG不是甲基化的,那么CpG岛可被甲基化敏感酶切割,并且侧翼序列(里程碑)可在不同分区中。在另一实施方案中,甲基化的CpG岛可被能切割甲基化序列但不能切割未甲基化序列的甲基化敏感酶切割。在另一实施方案中,甲基化的CpG岛可被能识别(例如,结合)甲基化序列而不识别未甲基化序列的甲基化敏感酶切割。
在另一实施方案中,里程碑(标记)可在CpG岛内。在另一实施方案中,里程碑(标记)可在单一CpG序列侧翼。在另一实施方案中,里程碑(标记)可在大约或至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400或500个CpG的侧翼(例如,一个标记在CpG的5’,而另一个标记在CpG的3’)。
在另一实施方案中,可确定CpG岛的脱甲基化。CpG岛的甲基化状态可在一段时间内进行测定(例如,在不同时间点如日、月、年采集的样品中)。可以比较来自不同个体的样品之间的CpG岛的甲基化状态。
CpG可以是通过磷酸二酯键与鸟嘌呤连接的胞嘧啶,且CpG岛可以是一簇这样的二核苷酸序列。CpG岛,或CG岛,可以是含有高频CpG位点的基因组区域。CpG岛的长度可为大约、少于约或多于约100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900或6000个碱基对。CpG岛可为约100到约6000bp、约100到约5000bp、约100到约4000bp、约100到约3000bp、约100到约2000bp、约100到约1000bp、约300到约6000bp、约300到约5000bp、约300到约4000bp、约300到约3000bp、约300到约2000bp或约300到约1000bp。在一个实施方案中,CpG岛可以是长度为至少200bp的一段DNA,其中C+G含量至少为50%,且观察到的CpG/预期CpG的比例至少为0.6(Gardiner-Garden,M.和Frommer M.(1987)J.Mol.Biol.196:261-282)。在另一实施方案中,CpG岛可以是大于500bp的一段DNA,其中C+G含量等于或大于55%,且观察到的CpG/预期CpG的比例至少为0.65(Takai D.和JonesP.(2001)PNAS99:3740-3745)。
在一种鉴定甲基化胞嘧啶的方法中,利用亚硫酸氢盐处理将胞嘧啶转化为尿嘧啶;然而,甲基化胞嘧啶受到保护。随后的PCR将尿嘧啶转化成胸腺嘧啶,导致相同的目标区域产生不同的序列输出。或者,通过亚硫酸氢盐处理导致的C->T转化可改变扩增子的解链温度,该解链温度可通过扩增后的熔解曲线分析来测量。然而,这种方法的灵敏限度约为1-5%。此外,完全转化需要大量的亚硫酸氢盐处理,这可导致DNA的降解。
在该方法的一个实施方案中,在目标CpG岛的侧翼设计两种扩增子(如FAM和VIC标记的)。DNA样品用一种或多种甲基化敏感的限制酶消化,并且可通过数字PCR如ddPCR分析消化的和未消化的样品。未消化的样品应显示出FAM和VIC扩增子100%连接,而消化的样品将显示出FAM和VIC扩增子0%连接,从而指示甲基化状态的差异。该系统的扩展精度可检测两个样品之间至少约1/10、1/50、1/100、1/200、1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/2000、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10,000的甲基化状态差异。图12图示了该方法的一个实施方案。
待扩增区域可在CpG岛5’或3’端的大约或至少约1、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450或500bp以内。
一种或多种甲基化敏感的限制酶可用于本文提供的方法、组合物和试剂盒中。一种或多种甲基化敏感的限制酶可包括,例如,DpnI、Acc65I、KpnI、ApaI、Bsp120I、Bsp143I、MboI、BspOI、NheI、Cfr9I、SmaI、Csp6I、RsaI、Ecl136II、SacI、EcoRII、MvaI、HpaII、MSpJI、LpnPI、FsnEI、DpnII、McrBc或MspI。在一个实施方案中,甲基化敏感的限制酶可切割未甲基化的核酸,但不能切割甲基化的核酸。一种或多种甲基化敏感的限制酶可以是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种甲基化敏感酶。
在一些实施方案中,细胞核经历Dam甲基化和/或Dcm甲基化。
表1包括其限制酶切割DNA的能力可被CpG甲基化阻断或阻碍的限制酶的列表。
表1.其切割能力可被CpG甲基化阻断或阻碍的限制酶的列表。
Figure BDA0000393004600000451
Figure BDA0000393004600000461
Figure BDA0000393004600000481
Figure BDA0000393004600000491
Figure BDA0000393004600000501
在另一实施方案中,包含CpG序列或CpG岛的核酸与一种或多种DNA甲基转移酶(MTases)接触,并且进行本文所述的分析CpG序列的甲基化的方法。DNA甲基转移酶可将甲基从S-腺苷甲硫氨酸转移到胞嘧啶或腺嘌呤残基。该甲基转移酶可以是,例如,CpGMTase。DNA MTase可以是m6a MTase(可产生N6-甲基腺嘌呤的MTase);m4C MTase(可产生N4-甲基胞嘧啶的MTase);或m5C MTase(可产生C5-甲基胞嘧啶的MTase)。MTase可以是,例如,DNMT1、DNMT3A和DNMT3B。
分离
靶序列的物理分离可以序列特异性或非序列特异性的方式发生。分离靶序列的非序列特异性手段包括使用注射器、超声处理、热处理(例如,90℃30分钟)和某些类型的核酸酶处理(例如,用DNA酶、RNA酶、核酸内切酶、核酸外切酶)。
限制酶
分离核酸序列的序列特异性方法可涉及一种或多种限制酶的使用。一种或多种限制酶可用于本文所述的任何方法中。例如,除了其它方法外,可以使用限制酶分离靶序列拷贝,以便准确估计拷贝数状态、评估定相、产生单元型或确定连接。可以选择一种或多种酶,以便对靶核酸序列之间的核酸(例如,DNA或RNA)进行限制酶切,但不限制酶切待扩增或分析的区域。在一些实施方案中,可选择限制酶,使得限制酶在靶序列内,例如,在靶序列的5’或3’末端内进行切割。例如,如果靶序列没有间隔序列而串联排列,那么靶序列的物理分离可包括靶序列内序列的切割。在数字分析(例如,ddPCR)反应中可使用已消化的样品进行拷贝数估计、连接测定、单元型分析、检查RNA或DNA降解或确定例如CpG岛的甲基化程度。
可选择限制酶,并且可为了广泛应用而在大量样品和试验类型中确定和验证最佳条件,例如用于确定CNV的数字PCR(例如,ddPCR)和本文所述的任何其它方法。
可利用计算机软件为本文所述的方法、组合物和/或试剂盒选择一种或多种限制酶。例如,该软件可以是Qtools软件。
在本文所述的方法、组合物和/或试剂盒中使用的一种或多种限制酶可以是任何限制酶,包括可从New England
Figure BDA0000393004600000511
Inc.(参见www.neb.com)获得的限制酶。限制酶可以是,例如,限制性内切核酸酶、寻靶内切核酸酶、切口内切核酸酶或高保真(HF)限制酶。限制酶可为I型、II型、III型或IV型酶或寻靶内切核酸酶。在一些情况下,限制酶切消化在高星号活性条件下发生。在一些情况下,限制酶切消化在低星号活性条件下发生。
I型酶可在远离识别位点的位点处进行切割;可能需要ATP和S-腺苷-L-甲硫氨酸来发挥作用;并且可以是既有限制酶切活性又有甲基化酶活性的多功能蛋白质。I型限制性内切核酸酶的识别序列可以是二分的(bipartite)或中断的。限制性内切核酸酶的亚单位构型可以是五聚复合物。I型限制性内切核酸酶的共活化剂和活化剂包括,例如,镁、AdoMet(S-腺苷甲硫氨酸;SAM、SAMe、SAM-e)和ATP。I型限制性内切核酸酶可在远离识别位点并且可变的切割位点处进行切割。I型限制性内切核酸酶的实例可包括,例如,EcoKI、EcoAI、EcoBI、CfrAI、StyLTII、StyLTIII和StySPI。
II型酶可在识别位点内或与识别位点相距特定短距离处进行切割;可能需要镁;并且可不依赖于甲基化酶而起作用。II型限制性内切核酸酶的识别序列可为回文序列或中断的回文序列。II型限制性内切核酸酶的亚单位结构可为同源二聚体。用II型限制性内切核酸酶对切割位点进行切割可导致具有3’突出端、5’突出端或平端的片段。II型限制性内切核酸酶的实例包括,例如,EcoRI、BamHI、KpnI、NotI、PstI、SmaI和XhoI。
II型限制酶存在几种亚型,包括IIb型、IIs型和IIe型。
IIb型限制性内切核酸酶可具有二分的或中断的识别序列。IIb型限制性内切核酸酶的亚单位结构可以是异源三聚体。IIb型限制性内切核酸酶的辅因子和活化剂可包括镁和AdoMet(用于甲基化)。IIb型限制性内切核酸酶可在两条链上的切割位点处,在确定的、对称的、相隔短距离的识别位点的两侧切割,并且产生3’突出端。IIb型限制性内切核酸酶的实例包括,例如BcgI、Bsp24I、CjeI和CjePI。
IIe型限制性内切核酸酶可具有回文的、具有不明确性的回文的或非回文的识别位点。IIe型限制性内切核酸酶的亚单位结构可为同源二聚体或单体。IIe型限制性内切核酸酶的辅因子和活化剂可包括镁,并且可以顺式或反式作用于核酸内切酶的第二识别位点可以充当别构影响因素。IIe型限制酶能以限定的方式在具有识别序列或相隔短距离的切割位点处切割。可使用活化剂DNA完成切割。IIe型限制酶的实例包括,例如,NaeI、NarI、BspMI、HpaII、SaII、EcoRII、Eco57I、AtuBI、Cfr9I、SauBMKI和Ksp632I。
IIs型限制酶可具有非回文的识别序列。识别序列可以是连续的且没有不明确性。IIs型限制性内切核酸酶的亚单位结构可为单体。可以与IIs型限制酶共同使用的辅因子可为镁。IIs型限制酶可以限定的方式在切割位点处切割,其中至少一个切割位点在识别序列之外。IIs型限制酶的实例包括,例如,FokI、Alw26I、BbvI、BsrI、EarI、HphI、MboII、SfaNI和Tth111I。
III型酶可在距识别位点较短距离处切割,且可能需要ATP。S-腺苷-L-甲硫氨酸可刺激利用III型酶的反应,但不是必要的。III型酶可作为与修饰甲基化酶的复合物的一部分而存在。III型限制性内切核酸酶的识别序列可为非回文的。可与III型限制性内切核酸酶共同使用的辅因子和活化剂包括,例如,镁、ATP(未水解的)和相反方向的、相隔可变距离的第二未修饰位点。III型限制性内切核酸酶的实例包括,例如,EcoP15I、EcoPI、HinfIII和StyLTI。
IV型酶可针对甲基化的DNA。IV型限制酶的实例包括,例如,大肠杆菌(E.coli)的McrBC和Mrr系统。
限制酶可为寻靶内切核酸酶。寻靶内切核酸酶可为双链DNA酶。寻靶内切核酸酶可具有大的、非对称的识别位点(例如,12-40个碱基对)。寻靶内切核酸酶的编码序列可嵌入内含子或内含肽中。内含肽可为“蛋白质内含子”,它可自我切除并利用肽键重新连接其余的部分(外显肽)。寻靶内切核酸酶可容忍其识别序列内的某些序列简并。寻靶内切核酸酶的特异性可为10-12个碱基对。寻靶内切核酸酶的实例包括I-CeuI、I-SceI、I-Ppol、PI-SceI、PI-PspI和PI-SceI。
在本文的方法、组合物和/或试剂盒中使用的限制酶可为二聚体、三聚体、四聚体、五聚体、六聚体等。
在本文所述的方法、组合物和/或试剂盒中使用的一种或多种限制酶可为杂合蛋白或嵌合蛋白的组分。例如,含有酶活性(例如,内切核酸酶活性)的限制酶的结构域可与另一蛋白质如DNA结合蛋白质融合。DNA结合蛋白质可将杂合蛋白靶向至DNA上的特定序列。具有酶活性的结构域的核酸切割活性可以是序列特异性的或非序列特异性的。例如,IIs型限制性内切核酸酶FokI的非特异性切割结构域可用作杂合核酸酶的酶促(切割)结构域。具有酶活性的结构域可切割的序列可受限于杂合体经由DNA结合域与DNA的物理束缚。DNA结合域可来自真核或原核转录因子。DNA结合域可以识别连续核酸序列的大约或至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基对。在一些情况下,限制酶为4-碱基切割酶(cutter)、6-碱基切割酶或8-碱基切割酶。DNA结合域可识别序列的约9到约18个碱基对。DNA结合域可为,例如,锌指DNA结合域。杂合体可为锌指核酸酶(例如,锌指核酸酶)。杂合蛋白质可作为多聚体(例如,二聚体、三聚体、四聚体、五聚体、六聚体等)起作用。
可在本文所述的方法、组合物和/或试剂盒中使用的特定限制酶的实例包括AaaI、AagI、AarI、AasI、AatI、AatII、AauI、AbaI、AbeI、AbrI、AccI、AccII、AccIII、Acc16I、Acc36I、Acc65I、Acc113I、AccB1I、AccB2I、AccB7I、AccBSI、AccEBI、AceI、AceII、AceIII、AciI、AclI、AclNI、AclWI、AcpI、AcpII、AcrII、AcsI、AcuI、AcvI、AcyI、AdeI、AeuI、AfaI、Afa22MI、Afa16RI、AfeI、AflI、AflII、AflIII、AgeI、AgeI-HF、AglI、AhaI、AhalI、AhalII、AhaB8I、AhdI、AhlI、AhyI、AitI、AjnI、AjoI、AleI、AlfI、AliI、AliAJI、AloI、AluI、AlwI、Alw21I、Alw26I、Alw44I、AlwNI、AlwXI、Ama87I、AcoI、AocII、AorI、Aor13HI、Aor51HI、AosI、AosII、ApaI、ApaB1、ApaCI、ApaLI、ApaORI、ApeKI、ApiI、ApoI、ApyI、AquI、AscI、AseI、AselII、AsiSI、AvaI、AvaII、AvrII、BaeGI、BaeI、BamHI、BamHI-HF、BanI、BanII、BbsI、BbvCI、BbvI、BccI、BceAi、BcgI、BciVI、BclI、BcoDI、BfaI、BfuAI、BfuCI、BglI、BglII、BlpI、BmgBI、BmrI、BmtI、BpmI、Bpu10I、BpuEI、BsaAI、BsaBI、BsaHI、BsaI、BsaI-HF、BsaJI、BsaWI、BsaXI、BseRI、BseYI、BsgI、BsiEI、BsiHKAI、BsiWI、BslI、BsmAI、BSmBI、BsmFI、BsmI、BsoBI、Bsp1286I、BspCNI、BspDI、BspEI、BspHI、BspMI、BspQI、BsrBI、BsrDI、BsrFI、BsrGI、BsrI、BssHII、BssKI、BssSI、BstAPI、BstBI、BsteII、BstNI、BstUI、BstXI、BstYI、BstZ17I、Bsu36I、BtgI、BtgZI、BtsCI、BtsI、BtsIMutI、Cac8I、ClaI、CspCI、CviAII、CviKI-1、CviQI、DdeI、DpnI、DpnII、DraI、DraIII、DraIII-HFTM、DrdI、EaeI、EagI、EagI-HFTM、EarI、EciI、Eco53kI、EcoNI、EcoO109I、EcoP15I、EcoRI、EcoRI-HFTM、EcoRV、EcoRV-HFTM、FatI、FauI、Fnu4HI、FokI、FseI、FspEI、FspI、HaeII、HaeIII、HgaI、HhaI、HincII、HindIII、HindIII-HFTM、HinfI、HinP1I、HpaI、HpaII、HphI、Hpy166II、Hpy188I、Hpy188III、Hpy99I、HpyAV、HpyCH4III、HpyCH4IV、HpyCH4V、I-CeuI、I-SceI、KasI、KpnI、KpnI-HFTM、LpnPI、MboI、MboII、MfeI、MfeI-HFTM、MluCI、MluI、MlyI、MmeI、MnlI、MscI、MseI、MslI、MspA1I、MspI、MspJI、MwoI、NaeI、NarI、Nb.BbvCI、Nb.BsmI、Nb.BsrDI、Nb.BtsI、NciI、NcoI、NcoI-HFTM、NdeI、NgoMIV、NheI、NheI-HFTM、NlaIII、NlaIV、NmeAIII、NotI、NotI-HFTM、NruI、NsiI、NspI、Nt.AlwI、Nt.BbvCI、Nt.BsmAI、Nt.BspQI、Nt.BstNBI、Nt.CviPII、PacI、PaeR7I、PciI、PflFI、PflMI、PhoI、PI-PspI、PI-SceI、PleI、PmeI、PmlI、PpuMI、PshAI、PsiI、PspGI、PspOMI、PspXI、PstI、PstI-HFTM、PvuI、PvuI-HFTM、PvuII、PvuII-HFTM、RsaI、RsrII、SacI、SacI-HFTM、SacII、SalI、SalI-HFTM、SapI、Sau3AI、Sau96I、SbfI、SbfI-HFTM、ScaI、ScaI-HFTM、ScrFI、SexAI、SfaNI、SfcI、SfiI、SfoI、SgrAI、SmaI、SmlI、SnaBI、SpeI、SphI、SphI-HFTM、SspI、SspI-HFTM、StuI、StyD4I、StyI、StyI-HFTM、SwaI、TaqαI、TfiI、TliI、TseI、Tsp45I、Tsp509I、TspMI、TspRI、Tth111I、XbaI、XcmI、XhoI、XmaI、XmnI和ZraI。
在本文所述的方法、组合物和/或试剂盒中使用的一种或多种限制酶可来源于多种来源。例如,一种或多种限制酶可由重组核酸产生。一种或多种限制酶可由异源宿主(例如,细菌、酵母、昆虫或哺乳动物细胞)中的重组核酸产生。一种或多种限制酶可由异源宿主中的重组核酸产生并从异源宿主中纯化。一种或多种限制酶可从天然宿主如细菌或古细菌纯化而来。如果使用了超过一种限制酶,那么至少一种限制酶可来自重组来源,且超过一种限制酶中的至少一种可来自天然来源。
一种或多种限制酶的识别位点可为多种序列中的任何一种。例如,一种或多种限制酶的识别位点可为回文序列。一种或多种限制酶的识别位点可为部分回文序列。在一些实施方案中,一种或多种限制酶的识别位点不是回文序列。一种或多种限制酶的识别位点可为大约或大于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碱基或碱基对。限制酶的识别位点可为约2到约20、约5到约20、约5到约15、约5到约10、约7到约20、约7到约15或约7到约10个碱基或碱基对。
可用两种或更多种限制酶来消化多核苷酸。该两种或更多种限制酶可识别相同或不同的识别位点。在单一多核苷酸上的两个靶核酸序列之间可存在单一限制酶的一个或多个识别位点。在单一多核苷酸上的两个靶核酸序列之间可存在单一限制酶的大约或至少约1、2、3、4、5、6、7、8、9、10个或更多个识别位点。在单一多核苷酸上的两个靶核酸序列之间可存在两个或更多个不同的限制酶识别位点。在单一多核苷酸上的两个靶核酸序列之间可存在大约或至少约1、2、3、4、5、6、7、8、9、10个或更多个不同的限制酶识别位点。在单一多核苷酸的两个靶核酸序列之间可存在一个或多个不同的限制酶限制酶切位点。在单一多核苷酸上的两个靶核酸序列之间可存在大约或至少约1、2、3、4、5、6、7、8、9、10个或更多个限制酶限制酶切位点。
限制酶消化可包含一种或多种同裂酶(isoschizomer)。同裂酶是识别相同序列的限制性内切核酸酶。同裂酶可具有不同的切割位点;这些酶称为异裂酶(neoschizomer)。
在一些实施方案中,用限制酶切割产生平端。在一些实施方案中,用限制酶切割不产生平端。在一些实施方案中,用限制酶切割产生两个片段,每个片段具有一个5’突出端。在一些实施方案中,用限制酶切割产生两个片段,每个片段具有一个3’突出端。
可设计用于一种或多种扩增反应的引物以扩增限制酶切割位点的上游和下游序列。
在一个实施方案中,限制酶不切割靶核酸序列或参考扩增子。可使用参考序列,例如,基因组序列,来预测限制酶是否会切割核酸序列。在另一实施方案中,限制酶确实切割靶核酸序列。切割可发生在靶序列的5’或3’端附近(在约5、10、15、25、50或100bp内)、靶序列内。
在另一实施方案中,限制酶不切割靶核酸序列或参考核酸序列或扩增子,即使该序列或扩增子含有一个或多个SNP。SNP信息可从几个数据库获得,最容易从dbSNP(www.ncbi.nlm.nih.gov/projects/SNP/)获得。
一种或多种甲基化敏感的限制酶可用于本文提供的方法、组合物和试剂盒中。所述一种或多种甲基化敏感酶可包括,例如,DpnI、Acc65I、KpnI、ApaI、Bsp120I、Bsp143I、MboI、BspOI、NheI、Cfr9I、SmaI、Csp6I、RsaI、Ecl136II、SacI、EcoRII、MvaI、HpaII或MspI。在一个实施方案中,甲基化敏感的限制酶可切割未甲基化的核酸,但不能切割已甲基化的核酸。
可对本发明中使用的限制酶进行选择,从而特异性地消化核酸序列的选定区域。在一个实施方案中,所述一种或多种限制酶在靶核酸序列或靶扩增子之间进行切割。可选择其识别序列在靶核酸序列或靶扩增子附近出现例如一次或多次的一种或多种酶。在一个实施方案中,需要注意要确保这些识别序列不受SNP的存在的影响。
在一个实施方案中,限制酶是有效的但特异性(无星号活性)的切割酶。可通过进行适当的酶滴定实验预先确定这种性质与消化时间和酶浓度。在一个实施方案中,限制酶可以具有星号活性。星号活性可以是与限定的识别序列相似但不相同的序列的切割。
限制酶的“单位”数与核酸(例如,DNA或RNA)量的比值可以是,例如,大约,或至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、300、350、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、12,000、14,000、15000、16,000、18,000或20,000单位/μg核酸。限制酶的单位数与核酸量的比值可为约1到约20,000、约1到约10,000、约1到约5,000、约100到约10,000、约100到约1,000、约50到约500或约50到约250单位/μg。
一种或多种限制酶可与包含多核苷酸的样品孵育大约或超过约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60分钟。一种或多种限制酶可与包含多核苷酸的样品孵育大约或超过约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47或48小时。一种或多种限制酶可与包含多核苷酸的样品孵育约1min到约60min、约1min到约48hr、约1min到约24hr、约1min到约20hr、约1min到约16hr、约0.5hr到约6hr、约0.5hr到约3hr、约1hr到约10hr、约1hr到约5hr或约1hr到约3hr。
限制酶消化可在大约或高于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64或65℃的温度下进行。限制酶消化可在约10到约65℃、约20到约65℃、约30到约65℃、约37到约65℃、约40到约65℃、约50到约65℃、约25到约37℃或约30到约37℃的温度下进行。
使用一种或多种限制酶的限制酶消化的pH可以是约2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、6.6、6.7、6.8、6.9、7、7.1、7.2、7.3、7.4、7.5、7.5、7.6、7.7、7.8、7.9、8、8.1、8.2、8.3、8.4、8.5、8.6、8.7、8.8、8.9、9、9.5、10、10.5、11、11.5、12或12.5。限制酶消化的pH可以是约5到约9、约5到约8、约5到约7、约6到约9或约6到约8。
限制酶消化可包含一种或多种缓冲液。所述一种或多种缓冲溶液可为,例如,tris-HCl、双-tris-丙烷-HCl、TAP、N-二甘氨酸、tris、tris-乙酸盐、tris-HCl、三甲基甘氨酸、TAPSO、HEPES、TES、MOPS、PIPES、甲次胂酸盐、SSC、磷酸盐缓冲液、可力丁、乙酸佛罗拿、MES.、ADA、ACES、氯化胆胺、乙酰氨基甘氨酸、甘氨酰胺、马来酸盐、CABS、哌啶、甘氨酸、柠檬酸盐、甘氨酰甘氨酸、苹果酸盐、甲酸盐、琥珀酸盐、乙酸盐、丙酸盐、吡啶、哌嗪、组氨酸、双-tris、乙醇胺、碳酸盐、MOPSO、咪唑、双-TRIS丙烷、BES、MOBS、三乙醇胺(TEA)、HEPPSO、POPSO、肼、氨基丁三醇(tris)、EPPS、HEPPS、N-二甘氨酸、HEPBS、AMPSO、牛磺酸(AES)、硼酸盐、CHES、2-氨基-2-甲基-1-丙醇(AMP)、氢氧化铵或甲胺。溶液中缓冲液的浓度可以是,例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100mM。溶液中缓冲液的浓度可以是约10到约100mM、约10到约75mM、约25到约75mM或约10到约50mM。
使用一种或多种限制酶的限制酶消化可包含牛血清白蛋白(BSA)。限制酶切消化中BSA的浓度可以是大约或大于约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、3、4、5、6、7、8、9或10mg/ml。限制酶切消化中BSA的浓度可以是约0.01到约10mg/ml、约0.01到约1mg/ml、约0.05到约1mg/ml或约0.05到约0.5mg/ml。
使用一种或多种限制酶的限制酶消化可包含甘油。甘油的浓度(体积/体积)可以是大约或至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25%。限制酶消化中甘油的浓度可以是约1到约25%、约1到约20%、约1到约15%、约1到约10%或约1到约5%。
限制酶消化可包含一种或多种有机溶剂,例如,DMSO、乙醇、乙二醇、二甲基乙酰胺、二甲基甲酰胺或suphalane。限制酶消化可不含一种或多种有机溶剂。
限制酶消化可包含一种或多种二价阳离子。该一种或多种二价阳离子可以是,例如,Mg2+、Mn2+、Cu2+、Co2+或Zn2+
限制酶切消化可包含一种或多种盐。该一种或多种盐可包括,例如,乙酸钾、氯化钾、乙酸镁、氯化镁、乙酸钠或氯化钠。一种或多种盐中每一种的浓度可以是,例如,大约或大于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245或250mM。一种或多种盐中每一种的浓度可以是约5到约250、约5到约200、约5到约150、约5到约100、约10到约100、约10到约90、约10到约80、约10到约70、约10到约60或约10到约50mM。
限制酶切消化可以包含一种或多种还原剂。该一种或多种还原剂可以抑制蛋白质中二硫键的形成。还原剂可为,例如,二硫苏糖醇(DTT)、2-巯基乙醇(BME)、2-巯基乙胺-HCl、三(2-羧乙基)膦(TCEP)或半胱氨酸-HCl。在限制酶消化中一种或多种还原剂的浓度可以是大约或大于约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或25mM。在限制酶消化中一种或多种还原剂的浓度可以是约0.01到约25mM、约0.01到约15mM、约0.01到约10mM、约0.01到约5mM、约0.1到约5mM或约0.5到约2.5mM。
在核酸的限制酶消化中可以使用多于一种限制酶。例如,如果一种或多种限制酶不能有效切割核酸,或者如果它们不能全部很好地普遍作用于所有样品(例如,由于SNP),那么可采用多重消化。在限制酶切消化中可使用的不同限制酶的数目可以是大约或至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在限制酶消化中可使用的不同限制酶的数目可以是,例如,约1到约20、约1到约15、约1到约10、约1到约7、约1到约6、约1到约5、约1到约4、约1到约3或约1到约2。
有一些证据表明,当含有扩增子或靶序列的片段的大小相对较小时,PCR表现更好。因此,选择切割位点在扩增子或靶序列附近的限制酶可能是理想的。例如,限制酶识别位点或切割位点可以在距多核苷酸上一个靶序列的5’端或3’端大约或小于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、300、350、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、12,000、14,000、15000、16,000、18,000或20,000个碱基对之内。限制酶识别位点或切割位点可以在距靶核酸序列的5’端或3’端约1到约10,000、约1到约5,000、约1到约2,500、约1到约1,000、约1到约100、约100到约1000、约100到约500或约100到约250bp之内。
可分析单一样品的多个CNV。在这种情况下,选择对整套CNV有效的最小消化数可能是理想的。在一个实施方案中,可发现单一限制酶混合物在任何扩增子或靶核酸序列内都不切割,但在其中每一个附近都有识别位点或切割位点。限制酶识别位点或切割位点可以在距多核苷酸上一个靶序列的5’端或3’端大约或小于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、300、350、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、12,000、14,000、15000、16,000、18,000或20,000个碱基对之内。限制酶识别位点或切割位点可以在距多核苷酸上一个靶序列的5’端或3’端约1到约20,000、约10到约20,000、约100到约20,000、约1000到约20,000、约10到约10,000、约10到约1000、约10到约100、约50到约20,000、约50到约1000、约50到约500、约50到约250、约50到约150或约50到100个碱基对之内。
可以编写和/或使用合适的软件,从而使限制酶选择的过程自动化,并为用户如实验生物学家呈现界面,以考虑以上标准选择最合适的酶。软件可采用其它考虑因素,如酶的成本、酶的效率、限制酶的缓冲液相容性、甲基化敏感性、核酸区段中切割位点的数目或实用性。软件可在计算机上使用。可在计算机可读介质上生成算法,并用该算法选择用于消化核酸的一种或多种限制酶。计算机可与因特网连接,并且可用于访问能允许选择限制性内切核酸酶的网站。可使用网络工具来选择将在扩增子周围切割的限制酶,以便分离相连的基因拷贝以供CNV估计。例如,可将酶和分析存储于数据库中,并且限制酶的选择可以是自动化的。可以考虑的其它统计学包括,例如,最短片段的长度、%GC含量、在扩增子周围(或在其内)切割的频率和酶的成本。可使用QTools来辅助一种或多种限制酶的选择。图13和图14图示了选择限制酶时可考虑的信息。
对于用于数据分析的分析储存,研究者可按照位置或引物序列输入分析。QTools可自动检索和储存扩增子序列及已知的SNP,并计算热力学参数。随着研究者使用更多的分析,他们可以输入额外的数据,包括已确认的样品的CNV和退火温度。
在单一试管中使用多于一种酶连续或一起进行的消化可以帮助确保对困难靶标的完全切割。一个样品的一系列限制酶消化可用不同的酶进行,例如约1、2、3、4、5、6、7、8、9或10种酶。
在限制酶消化之后,可将消化物中的一种或多种限制酶灭活。在一些实施方案中,暴露于热不能将所述一种或多种限制酶灭活。在限制之后,通过升高限制反应的温度,可以将大多数限制酶热灭活。热灭活温度可以是,例如,大约或高于约50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100摄氏度。热灭活温度可以是约50到约100、约50到约90、约60到约90、约65到约90、约65到约85或约65到约80摄氏度。热灭活持续时间可以是,例如,大约或大于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、65、70、80、90、100、110、120、180、240或300分钟。热灭活持续时间可以是约5到约300、约5到约200、约5到约150、约5到约100、约5到约75、约5到约50、约5到约40、约5到约30、约5到约35、约5到约25、约5到约20或约10到约20分钟。热灭活温度可低于限制酶切靶片段的解链温度,以便保持双链模板拷贝。
可通过向限制酶消化物中加入一种或多种螯合剂来停止限制酶消化。所述一种或多种螯合剂可以是,例如,EDTA、EGTA、柠檬酸或磷酸盐。限制酶消化物中的一种或多种螯合剂的浓度可以是,例如,大约或至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100mM。所述一种或多种螯合剂的浓度可以是约1到约100mM、约1到约75mM或约25到约75mM。
可使用对照试验和模板来测量限制酶消化步骤的效率。
样品
将要用本文提供的方法、组合物和试剂盒分析的样品,可来自于包含核酸的非细胞实体(如,病毒)或来自于基于细胞的生物(如,古细菌、细菌或真核生物域的成员)。在一些情况下,样品可从医院、实验室、临床或医学实验室获得。样品可包含核酸,例如,RNA或DNA。样品可包含无细胞核酸。在一些情况下,样品从表面如门或工作台顶部的拭子获得。
样品可来自受试者,例如,植物、真菌、真细菌、古细菌、原生生物(protest)或动物。受试者可以是生物体,单细胞生物体或多细胞生物体。受试者可以是培养的细胞,该细胞尤其可以是原代细胞或者来自已确立的细胞系的细胞。样品最初可以任何适当形式从多细胞生物分离。动物可以是鱼,如斑马鱼。动物可以是哺乳动物。哺乳动物可以是,例如,狗、猫、马、牛、小鼠、大鼠或猪。哺乳动物可以是灵长类动物,如人、黑猩猩、猩猩或大猩猩。人可以是男性或女性。样品可来自人类胚胎或人类胎儿。人可以是婴儿、儿童、青少年、成年人或老年人。女性可以是怀孕的、可以是疑似怀孕的或计划怀孕的。
样品可以来自健康受试者(例如,人类受试者)。在一些实施方案中,样品取自妊娠至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或2周的受试者(例如,待产孕妇)。在一些实施方案中,受试者受遗传疾病的影响,是遗传疾病的携带者,或者有遗传或发展遗传疾病的危险,其中遗传疾病是任何可能与诸如突变、插入、添加、缺失、易位、点突变、三核苷酸重复疾病和/或单核苷酸多态性(SNP)等遗传变异相关的疾病。在其它实施方案中,样品取自生育年龄的女性患者,并且,在一些情况下,女性患者未怀孕或怀孕状态未知。在另外其它的情况下,受试者为男性患者、男性准父亲或处于特定遗传异常危险中、诊断有或患有该遗传异常的男性患者。在一些情况下,已知女性患者受遗传疾病或遗传变异的影响,或者是其携带者,或处于特定遗传异常的危险中、诊断有或患有该遗传异常。在一些情况下,女性患者有关遗传疾病或遗传变异的状态可能是未知的。在进一步的实施方案中,样品取自基因序列拷贝数变异状态已知或未知的任何儿童或成人患者。在一些情况下,已知儿童或成年患者受遗传疾病或遗传变异的影响,或者是其携带者。
样品可以取自患有特定疾病、病症或病状的受试者,或疑似患有特定疾病、病症或病状(或处于患病危险中)的受试者。例如,样品可来自癌症患者,疑似患有癌症的患者,或者处于患癌症危险中的患者。癌症可以是,例如,急性成淋巴细胞性白血病(ALL)、急性髓性白血病(AML)、肾上腺皮质癌、卡波西肉瘤、肛门癌、基底细胞癌、胆管癌、膀胱癌、骨癌、骨肉瘤、恶性纤维组织细胞瘤、脑干胶质瘤、脑癌、颅咽管瘤、室管膜母细胞瘤、室管膜瘤、髓母细胞瘤、髓上皮瘤(medulloeptithelioma)、松果体实质瘤、乳腺癌、支气管瘤、伯基特淋巴瘤、非霍奇金淋巴瘤、类癌瘤、宫颈癌、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性髓性白血病(CML)、结肠癌、结直肠癌、皮肤T-细胞淋巴瘤、原位导管癌、子宫内膜癌、食管癌、尤因肉瘤、眼癌、眼内黑素瘤、视网膜母细胞瘤、纤维性组织细胞瘤、胆囊癌、胃癌、神经胶质瘤、毛细胞白血病、头颈癌、心脏癌、肝细胞(肝)癌、霍奇金淋巴瘤、下咽癌、肾癌、喉癌、唇癌、口腔癌、肺癌、非小细胞癌、小细胞癌、黑素瘤、口腔癌、骨髓增生异常综合征、多发性骨髓瘤、髓母细胞瘤、鼻腔癌、鼻窦癌、神经母细胞瘤、鼻咽癌、口腔癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、乳头瘤病、副神经节瘤、甲状旁腺癌、阴茎癌、咽癌、垂体肿瘤、浆细胞肿瘤、前列腺癌、直肠癌、肾细胞癌、横纹肌肉瘤、唾液腺癌、赛泽里综合征、皮肤癌、非黑素瘤、小肠癌、软组织肉瘤、鳞状细胞癌、睾丸癌、喉癌、胸腺瘤、甲状腺癌、尿道癌、子宫癌、子宫肉瘤、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或肾母细胞瘤。样品可来自癌症患者的癌组织和/或正常组织。
样品可来自已知患有遗传疾病、病症或病状的受试者。在一些情况下,已知受试者的基因,或基因的一部分,例如CFTR、因子VIII(F8基因)、β珠蛋白、血色病、G6PD、神经纤维瘤病、GAPDH、β淀粉样蛋白或丙酮酸激酶基因为野生型或基因突变型。在一些情况下,受试者的状态为已知或未知的,并检测受试者基因如CFTR、因子VIII(F8基因)、β珠蛋白、血色病、G6PD、神经纤维瘤病、GAPDH、β淀粉样蛋白或丙酮酸激酶基因的突变或遗传变异的存在。
样品可以是房水、玻璃体液、胆汁、全血、血清、血浆、乳汁、脑脊液、耵聍、内淋巴(enolymph)、外淋巴、胃液、粘液、腹膜液、唾液、皮脂、精液、汗液、眼泪、阴道分泌物、呕吐物、粪便或尿。样品可从医院、实验室、临床或医学实验室获得。样品可取自受试者。样品可包含核酸。核酸可以是,例如,线粒体DNA、基因组DNA、mRNA、siRNA、miRNA、cRNA、单链DNA、双链DNA、单链RNA、双链RNA、tRNA、rRNA或cDNA。样品可包含无细胞核酸。样品可为细胞系、基因组DNA、无细胞血浆、福尔马林固定石蜡包埋的(FFPE)样品或急骤冻结的样品。福尔马林固定石蜡包埋的样品可在提取核酸之前脱石蜡。样品可来自器官,例如,心脏、皮肤、肝脏、肺、乳腺、胃、胰腺、膀胱、结肠、胆囊、脑等。
当核酸为RNA时,RNA的来源可为本文所述的任何来源。例如,RNA可以是无细胞mRNA,可以来自组织活检、中心活检、细针抽出物、急骤冻结的或福尔马林固定石蜡包埋的(FFPE)样品。FFPE样品可在提取RNA之前脱石蜡。分析前可将提取的RNA加热到约30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99℃。可将提取的RNA加热到任何前述温度,持续大约或至少约15min、30min、45min、60min、1.5hr、2hr、2.5hr、3hr、3.5hr、4hr、4.5hr、5hr、5.5hr、6hr、6.5hr、7hr、7.5hr、8hr、8.5hr、9hr、9.5hr或10hr。
RNA可用于多种下游应用。例如,可利用逆转录酶将RNA转化成cDNA,且cDNA可任选地经受PCR,如实时PCR。可在等温扩增反应如等温线性扩增反应中使用RNA或cDNA。RNA、产生的cDNA或由此扩增的分子可用于微阵列实验、基因表达实验、Northern分析、Southern分析、测序反应、下一代测序反应等。可对特定RNA序列进行分析,或可对RNA序列进行全面分析。
可通过本领域普通技术人员可利用的手段从样品中提取核酸。
可处理样品以使其能够扩增。示例性的样品处理可包括,裂解样品的细胞以释放核酸,纯化样品(例如,将核酸与可能抑制扩增的其它样品组分分离),稀释/浓缩样品,和/或将样品与用于扩增的试剂结合,该试剂如DNA/RNA聚合酶(例如,用于PCR扩增的热稳定DNA聚合酶)、dNTPs(例如,dATP、dCTP、dGTP和dTTP(和/或dUTP))、用于每个待扩增的等位基因序列或多态基因座的引物组、能够与每个待扩增的等位基因序列特异性杂交的探针(例如荧光探针,尤其如TAQMAN探针或分子信标探针)、Mg2+、DMSO、BSA、缓冲液或其任意组合。在一些实例中,样品可以与限制酶、尿嘧啶-DNA糖苷酶(UNG)、逆转录酶或核酸处理的任何其它酶结合。
靶多核苷酸
本文所述的方法可用来分析或检测一种或多种靶核酸分子。术语多核苷酸,或其语法等同物,可以指共价连接在一起的至少两个核苷酸。本文所述的核酸可以含有磷酸二酯键,尽管在如下所示的一些情况中(例如在引物和探针如标记探针的构建中),包括可能具有交替骨架的核酸类似物,包含,例如,磷酰胺(Beaucage等人,Tetrahedron49(10):1925(1993)和其中的参考文献;Letsinger,J.Org.Chem.35:3800(1970);Sprinzl等人,Eur.J.Biochem.81:579(1977);Letsinger等人,Nucl.Acids Res.14:3487(1986);Sawai等人,Chem.Lett.805(1984);Letsinger等人,J.Am.Chem.Soc.110:4470(1988);和Pauwels等人,Chemica Scripta26:14191986))、硫代磷酸酯(Mag等人,NucleicAcids Res.19:1437(1991);和美国专利5,644,048)、二硫代磷酸酯(Briu等人,J.Am.Chem.Soc.111:2321(1989))、O-甲基亚磷酰胺连接(参见Eckstein,Oligonucleotides and Analogues:A Practical Approach,OxfordUniversity Press)和肽核酸(此处又称“PNA”)骨架和连接(参见Egholm,J.Am.Chem.Soc.114:1895(1992);Meier等人,Chem.Int.Ed.Engl.31:1008(1992);Nielsen,Nature,365:566(1993);Carlsson等人,Nature380:207(1996),均通过引用并入)。其它核酸类似物包括具有双环结构的核酸类似物,包括锁定核酸(此处又称“LNA”),Koshkin等人,J.Am.Chem.Soc.120.132523(1998);阳性骨架(positivebackbone)(Denpcy等人,Proc.Natl.Acad.Sci.USA92:6097(1995);非离子骨架(美国专利5,386,023、5,637,684、5,602,240、5,216,141和4,469,863;Kiedrowshi等人,Angew.Chem.Intl.Ed.English30:423(1991);Letsinger等人,J.Am.Chem.Soc.110:4470(1988);Letsinger等人,Nucleoside&Nucleotide13:1597(1994);ASC SymposiumSeries580,第2章和第3章,“Carbohydrate Modifications in AntisenseResearch”,Y.S.Sanghui和P.Dan Cook编;Mesmaeker等人,Bioorganic&Medicinal Chem.Lett.4:395(1994);Jeffs等人,J.Biomolecular NMR34:17(1994);Tetrahedron Lett.37:743(1996))和无核糖骨架,包括美国专利5,235,033和5,034,506以及ASC SymposiumSeries580,第6章和第7章,“Carbohydrate Modifications in AntisenseResearch”,Ed.Y.S.Sanghui和P.Dan Cook中描述的那些骨架。包含一个或多个环碳糖的核酸也包括在核酸的定义内(参见Jenkins等人,Chem.Soc.Rev.(1995)169-176页)。在Rawls,C&E News,1997年6月2日,第35页中描述了几种核酸类似物。“锁定核酸”也包含在核酸类似物的定义中。LANs是其中核糖环由连接2’-氧原子和4’-碳原子的亚甲基桥“锁定”的一类核酸类似物。所有这些参考文献均通过引用特定地并入本文。可对核糖-磷酸骨架进行这些修饰以增加这类分子在生理环境下的稳定性和半衰期。例如,PNA:DNA和LNA-DNA杂合体可显示出更高的稳定性,并因此可以在一些实施方案中使用。如所说明的,靶核酸可以是单链的或双链的,或者同时含有双链或单链序列的部分。取决于应用,核酸可以是DNA(包括,例如,基因组DNA、线粒体DNA和cDNA)、RNA(包括,例如mRNA和rRNA)或杂合体,其中核酸包含脱氧核糖核苷酸和核糖核苷酸的任意组合,以及包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤(xathanine)、次黄嘌呤(hypoxathanine)、异胞嘧啶、异鸟嘌呤等在内的碱基的任意组合。
本文提供的方法和组合物可用于评估多核苷酸(例如,DNA、RNA、线粒体DNA、基因组DNA、mRNA、siRNA、miRNA、cRNA、单链DNA、双链DNA、单链RNA、双链RNA、tRNA、rRNA、cDNA等)的量。所述方法和组合物可用来评估与第二多核苷酸的量相比的第一多核苷酸的量。所述方法可用来分析溶液中合成质粒的量;检测从受试者或环境中获得的样品中的致病生物(例如,微生物、细菌、病毒、寄生虫、逆转录病毒、慢病毒、HIV-1、HIV-2、流感病毒等)。所述方法也可用于在较大的多核苷酸群体中存在罕见的多核苷酸群体的其它应用中。
在使用本文提供的方法、组合物和试剂盒所分析的受试者的样品(如基因组)中,靶核酸序列的拷贝数可以是0,或者大约或至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、5000、10,000、20,000、50,000或100,000。在使用本文提供的方法、组合物和试剂盒分析其样品的受试者的基因组中,靶核酸序列的拷贝数可以是约1到约20、约1到约15、约1到约10、约1到约7、约1到约5、约1到约3、约1到约1000、约1到约500、约1到约250、约1到约100、约10到约1000、约10到约500、约10到约250、约10到约100、约10到约50、约10到约20、约0到约100、约0到约50、约0到约25或约0到约10。
靶核酸序列可在一条染色体上。如果靶核酸在来源于人类受试者的样品中,那么靶核酸序列可在染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X或Y中的一条或多条上。靶核酸可以在大约或多于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23条染色体上。靶核酸序列的两个或更多个拷贝可以在相同或不同染色体上。在人类受试者中,靶核酸序列的两个或更多个拷贝可在染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X或Y上。靶核酸序列的两个或更多个拷贝可以在受试者的一条多核苷酸(例如,染色体)上,但由于样品处理(例如,通过断裂)可将靶核酸在取自受试者的样品中进行分离。
当靶核酸的两个拷贝在同一多核苷酸如同一染色体上时,两个拷贝在多核苷酸上可相距大约、大于约或小于约1、2、3、4、5、6、7、8、9、10、25、50、75、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1百万、2百万、3百万、4百万、5百万、6百万、7百万、8百万、9百万、1千万、2千万、3千万、4千万、5千万、6千万、7千万、8千万、9千万或1亿个碱基或碱基对。两个靶核酸可相距约100到约100,000、约100到约10,000、约100到约1,000、约10到约10,000或约10到约1,000个碱基或碱基对。
靶序列可以是基因。例如,基因可以是ERBB2、EGFR、BRCA1、BRCA2、APC、MSH2、MSH6、MLH1、CYP2D6、富含低拷贝重复(LCR)的序列(参见例如Balikova等人(2008)Am J.Hum Genet.82:181-187)、TAS1R1、GNAT1、IMPDH1、OPN1SW、OR2A12、OR2A14、OR2A2、OR2A25、OR2A5、OR2A1、OR2A42、OR2A7、OR4F21、OR4F29、OR4C6、OR4P4、OR4S2、OR5D13、ROM1、TASR14、TAS2R44、TAS2R48、TAS2R49、TAS2R50、OR6C2、OR6C4、OR6C68、OR6C70、OR4M1、OR4Q3、OR4K1、OR4K2、OR4K5、OR4N2、OR4K13、OR4K14、OR4K15、OR4M2、OR4N4、OR1F1、ACTG1、FSCN2、OR2Z1、OR11H1、MYH9、SKI、TP73、TNFRSF25、RAB3B、VAV3、RALB、BOK、NAT6、TUSC2、TUSC4、TAB33B、C6orf210、ESR1、MAFK、MAD1L1、MYC、VAV2、MAP3K8、CDKN1C、WT1、WIT-1、C1QTNF4、MEN1、CCND1、ORAOV1、MLL2、C13orf10、TNFAIP2、AXIN1、BCAR1、TAX1BP3、NF1、PHB、MAFG、C1QTNF1、YES1、DCC、SH3GL1、TNFSF9、TNFSF7、TNFSF14、VAV1、RAB3A、PTOV1、BAX、RRAS、BCAS4、HIC2、NROB2、TTN、SGCB、SMA3、SMA4、SMN1、LPA、PARK2、GCK、GPR51、BSCL2、A2M、TBXA2R、FKRP或COMT。
靶序列可以编码微小RNA,例如,hsa-let-7g、hsa-mir-135a-1、hsa-mir-95、hsa-mir-218-1、hsa-mir-320、has-let-7a-1、has-let-7d、has-let-7f-1、has-mir-202、has-mir-130a、has-mir-130a、has-mir-338、has-mir-199a-1、has-mir-181c、has-mir-181d、has-mir-23a、has-mir-24-2、has-mir-27a、has-mir-150、has-mir-499、has-mir-124a-3或has-mir-185。
靶序列可以是Wong等人(2007)Am J of Hum Genetics80:91-104中所列的任何序列。
扩增和检测
本文所述的方法可利用核酸扩增。靶核酸的扩增可通过本领域已知的任何方法进行。扩增可通过热循环或等温进行。在示例性实施方案中,扩增可以通过聚合酶链反应(PCR)来完成。
可使用的PCR技术的实例包括,但不限于,定量PCR、定量荧光PCR(QF-PCR)、多重荧光PCR(MF-PCR)、实时PCR(RT-PCR)、单细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、PCR-RFLP/RT-PCR-RFLP、热启动PCR、巢式PCR、原位聚合酶群落(polony)PCR、原位滚环扩增(RCA)、桥式PCR、picotiter PCR、数字PCR、小滴数字PCR和乳液PCR。其它合适的扩增方法包括连接酶链反应(LCR)、转录扩增、分子倒置探针(MIP)PCR、自动维持序列复制、靶多核苷酸序列的选择性扩增、共有序列引物聚合酶链反应(CP-PCR)、任意引物聚合酶链反应(AP-PCR)、简并寡核苷酸引物PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)。本文可使用的其它扩增方法包括美国专利5,242,794、5,494,810、4,988,617和6,582,938中描述的那些方法。靶核酸的扩增可在珠上发生。在其它实施方案中,扩增不在珠上发生。扩增可通过等温扩增,例如,等温线性扩增。可进行热启动PCR,其中在加入聚合酶之前将反应加热到95℃维持两分钟,或者可在循环1中的第一加热步骤之前一直保持聚合酶无活性。可使用热启动PCR使非特异性扩增最小化。扩增的其它策略和方面在2010年7月8日公布的公开号为2010/0173394A1的美国专利申请中有所描述,其通过引用并入本文。
靶序列和参考序列的扩增技术是本领域已知的,并且包括在美国专利7,048,481中描述的方法。简单地说,所述技术可包括将样品分成小滴的方法和组合物,在一些情况下,每个小滴平均含有少于约5、4、3、2或1个靶核酸分子(多核苷酸),在每个小滴中扩增核酸序列,并检测靶核酸序列的存在。在一些情况下,扩增的序列存在于针对基因组DNA的探针上,而不是基因组DNA本身上。在一些情况下,至少200、175、150、125、100、90、80、70、60、50、40、30、20、10或0个小滴含有零个靶核酸拷贝。
可将有关扩增反应的信息输入数据库中。例如,图15A和图15B图示了可输入数据库的试验信息。
引物
可根据已知的参数设计引物以避免产生二级结构和自杂交。不同引物对可在大致相同的温度退火和解链,例如,与另一引物对相差约1、2、3、4、5、6、7、8、9或10℃之内。在一些情况下,起初使用大于约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、100、200、500、1000、5000、10,000个或更多的引物。这类引物可能够与本文所述的遗传靶标杂交。在一些实施方案中,使用约2到约10,000、约2到约5,000、约2到约2,500、约2到约1,000、约2到约500、约2到约100、约2到约50、约2到约20、约2到约10或约2到约6个引物。
引物可以通过许多方法制备,包括但不限于适当序列的克隆和使用本领域熟知的方法的直接化学合成(Narang等人,MethodsEnzymol.68:90(1979);Brown等人,Methods Enzymol.68:109(1979))。引物也可以从商业来源获得,如Integrated DNA Technologies、OperonTechnologies、Amersham Pharmacia Biotech、Sigma和LifeTechnologies。引物可具有相同的解链温度。引物的解链温度可以是约30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、81、82、83、84或85℃。在一些实施方案中,引物的解链温度是约30到约85℃、约30到约80℃、约30到约75℃、约30到约70℃、约30到约65℃、约30到约60℃、约30到约55℃、约30到约50℃、约40到约85℃、约40到约80℃、约40到约75℃、约40到约70℃、约40到约65℃、约40到约60℃、约40到约55℃、约40到约50℃、约50到约85℃、约50到约80℃、约50到约75℃、约50到约70℃、约50到约65℃、约50到约60℃、约50到约55℃、约52到约60℃、约52到约58℃、约52到约56℃或约52到约54℃。
引物的长度可在5'端或3'端延长或缩短,从而生产有期望的解链温度的引物。引物对中的一个引物可以比另一个引物长。引物对内引物的3'退火长度可以不同。另外,可以设计每个引物对的退火位置,以使引物对的序列和长度产生期望的解链温度。用于确定小于25个碱基对的引物的解链温度的方程为Wallace规则(Td=2(A+T)+4(G+C))。还可以使用计算机程序设计引物对,包括但不限于阵列设计软件(Array Designer Software)(Arrayit Inc.)、用于遗传分析的寡核苷酸探针序列设计软件(Oligonucleotide Probe SequenceDesign Software for Genetic Analysis)(Olympus Optical Co.)、NetPrimer和来自Hitachi Software Engineering的DNAsis。可使用软件程序,如Net Primer(免费的基于网络的程序,http://www.premierbiosoft.com/netprimer/index.html)来计算每个引物的TM(解链温度或退火温度)。引物的退火温度可在任何扩增循环后重新计算并升高,所述任何扩增循环包括但不限于约1、2、3、4、5次循环、约6次循环到约10次循环、约10次循环到约15次循环、约15次循环到约20次循环、约20次循环到约25次循环、约25次到约30次循环、约30次到约35次循环或约35次循环到约40次循环。在初始扩增循环后,可将引物的5'一半引入来自每个目标基因座的产物中;因此可基于每个引物的5'一半和3'一半的序列重新计算TM。
引物的退火温度可以在任何扩增循环后重新计算并升高,所述任何扩增循环包括但不限于约1、2、3、4、5次循环、约6次循环到约10次循环、约10次循环到约15次循环、约15次循环到约20次循环、约20次循环到约25次循环、约25次到约30次循环、约30次到约35次循环或约35次循环到约40次循环。在初始扩增循环后,可将引物的5'一半引入来自每个目标基因座的产物中,因此可基于每个引物的5'一半和3'一半的序列重新计算TM。
DNA聚合酶
可使用任何催化引物延伸的DNA聚合酶,包括但不限于大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶1的Klenow片段、T7DNA聚合酶、T4DNA聚合酶、Taq聚合酶、Pfu DNA聚合酶、Pfx DNA聚合酶、Tth DNA聚合酶、Vent DNA聚合酶、噬菌体29、REDTaqTM、基因组DNA聚合酶或测序酶。可使用热稳定的DNA聚合酶。DNA聚合酶可具有3’到5’外切核酸酶活性。DNA聚合酶可具有5’到3’外切核酸酶活性。DNA聚合酶可同时具有3’到5’外切核酸酶活性和5’到3’外切核酸酶活性。
热循环
可用任何数目的PCR循环来扩增DNA,例如,大约、大于约或小于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45次循环。扩增循环数可以是约1到约45、约10到约45、约20到约45、约30到约45、约35到约45、约10到约40、约10到约30、约10到约25,约10到约20、约10到约15、约20到约35、约25到约35、约30到约35或约35到约40。
热循环反应可以对包含于小滴中的样品进行。小滴可在热循环期间保持完整。小滴可在热循环期间以大于约10,000小滴/mL、100,000小滴/mL、200,000小滴/mL、300,000小滴/mL、400,000小滴/mL、500,000小滴/mL、600,000小滴/mL、700,000小滴/mL、800,000小滴/mL、900,000小滴/mL或1,000,000小滴/mL的密度保持完整。在其它情况下,两个或更多小滴可在热循环期间合并。在其它情况下,多于100或多于1,000个小滴可在热循环期间合并。
探针
可通过本领域已知的方法设计通用探针。在一些实施方案中,探针为随机序列。可选择通用探针以确保它在试验中不结合靶多核苷酸或结合样品中可能存在的其它非靶多核苷酸(例如,由靶多核苷酸占据的区域外的基因组DNA)。
在本文所述的方法中用于检测靶核酸序列或参考核酸序列的探针(例如,Taqman探针)上使用的标记物(荧光团、染料)可以是,例如,6-羧基荧光素(FAM)、四氯荧光素(TET)、4,7,2′-三氯-7′-苯基-6-羧基荧光素(VIC)、HEX、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、四甲基罗丹明、ROX和JOE。标记物可为Alexa Fluor染料,例如,Alexa Fluor350、405、430、488、532、546、555、568、594、633、647、660、680、700和750。标记物可为级联蓝(Cascade Blue)、海蓝(Marina Blue)、俄勒冈绿(Oregon Green)500、俄勒冈绿514、俄勒冈绿488、俄勒冈绿488-X、太平洋蓝(Pacific Blue)、罗丹明绿、对甲氨基酚绿(RhodolGreen)、罗丹明绿-X、罗丹明红-X和德克萨斯红-X。标记物可处于探针的5’端、探针的3’端、探针的5’端和3’端,或在探针内部。实验中可使用独特的标记物检测每个不同的基因座。
探针,如Taqman探针,可包含猝灭剂,例如,3’猝灭剂。3’猝灭剂可以是,例如,TAMARA、DABCYL、BHQ-1、BHQ-2或BHQ-3。在一些情况下,在本文提供的方法中使用的猝灭剂是黑洞猝灭剂(BHQ)。在一些情况下,猝灭剂是小沟结合物(MGB)。在一些情况下,猝灭剂是荧光猝灭剂。在其它情况下,猝灭剂是非荧光猝灭剂(NFQ)。
探针可以是大约或至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个碱基长。探针可以是约8到约40、约10到约40、约10到约35、约10到约30、约10到约25、约10到约20、约15到约40、约15到约35、约15到约30、约15到约25、约15到约20、约18到约40、约18到约35、约18到约30、约18到约25或约18到22个碱基。
试剂和添加剂
用于进行PCR反应的溶液和试剂可包括缓冲液。所述缓冲溶液可包含大约、大于约或小于约1、5、10、15、20、30、50、100或200mM Tris。在一些情况下,氯化钾的浓度可以是大约、大于约或小于约10、20、30、40、50、60、80、100、200mM。缓冲溶液可包含约15mM Tris和50mM KCl。核苷酸可包含脱氧核苷酸三磷酸分子,包括dATP、dCTP、dGTP、dTTP,各自的浓度是大约、大于约或小于约50、100、200、300、400、500、600或700μM。在一些情况下,将非标准核苷酸如dUTP加入到扩增反应中达到大约、大于约或小于约50、100、200、300、400、500、600或700、800、900或1000μM的浓度。在一些情况下,将氯化镁(MgCl2)以大约、大于约或小于约1.0、2.0、3.0、4.0或5.0mM的浓度加入到扩增反应中。MgCl2的浓度可为约3.2mM。
可使用非特异性封闭剂如BSA或来自牛皮的明胶,其中明胶或BSA以约0.1到约0.9%w/v的浓度范围存在。其它可能的封闭剂可包括β乳球蛋白、酪蛋白、乳粉或其它常见封闭剂。在一些情况下,BSA和明胶的优选浓度为约0.1%w/v。
在一些实施方案中,扩增反应还可以包含一种或多种添加剂,包括但不限于,非特异性背景/封闭核酸(如,鲑精DNA)、生物防腐剂(如,叠氮钠)、PCR增强剂(如,甜菜碱、海藻糖等)和抑制剂(如,RNA酶抑制剂)。一种或多种添加剂可包括,例如,2-吡咯烷酮、乙酰胺、N-甲基吡咯烷酮(NMP)、B-羟乙基吡咯烷酮(HEP)、丙酰胺、NN-二甲基乙酰胺(DMA)、N-甲基甲酰胺(MMP)、NN-二甲基甲酰胺、甲酰胺、N-甲基乙酰胺(MMA)、二甲亚砜(DMSO)、聚乙二醇、甜菜碱、四甲基氯化铵(TMAC)、7-脱氮-2’-脱氧鸟苷、牛血清白蛋白(BSA)、T4基因32蛋白质、甘油或非离子型去污剂(Triton X-100、吐温20、Nonidet P-40(NP-40)、吐温40、SDS(例如,约0.1%SDS)、鲑精DNA、叠氮钠、甜菜碱(N,N,N-三甲基甘氨酸;[羧甲基]三甲基铵)、甲酰胺、海藻糖、二硫苏糖醇(DTT)、β-巯基乙醇、植物多糖或RNA酶抑制剂。
在一些实施方案中,扩增反应包含一种或多种缓冲液。所述一种或多种缓冲液可以包含,例如,TAPS、N-二甘氨酸、Tris、三甲基甘氨酸、TAPSO、HEPES、TES、MOPS、PIPES、甲次胂酸盐、SSC、ADA、ACES、氯化胆胺、乙酰氨基甘氨酸、甘氨酰胺、马来酸盐、磷酸盐、CABS、哌啶、甘氨酸、柠檬酸盐、双甘氨肽、苹果酸盐、甲酸盐、琥珀酸盐、乙酸盐、丙酸盐、吡啶、哌嗪、组氨酸、双-tris、乙醇胺、碳酸盐、MOPSO、咪唑、双-TRIS丙烷、BES、MOBS、三乙醇胺(TEA)、HEPPSO、POPSO、肼、氨基丁三醇(tris)、EPPS、HEPPS、N-二甘氨酸、HEPBS、AMPSO、牛磺酸(AES)、硼酸盐、CHES、2-氨基-2-甲基-1-丙醇(AMP)、氢氧化铵、甲胺或MES。
在一些情况下,以约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%或1.0%的浓度,向扩增反应中加入非离子型环氧乙烷/环氧丙烷嵌段共聚物。常用的生物表面活性剂包括非离子型表面活性剂,如Pluronic F-68、Tetronics、Zonyl FSN。Pluronic F-68可以约0.5%w/v的浓度存在。
在一些情况下,硫酸镁可以以相似的浓度替代氯化镁。来自不同供应商的众多常用的商业化PCR缓冲液可以替代缓冲的溶液。
检测
荧光检测可使用多种检测器装置完成,该检测器装置配备有用于产生可被荧光剂吸收的激发光的模块以及用于检测由荧光剂发射的光的模块。在一些情况下,可以整体检测样品(如小滴)。例如,可将样品分配到置于检测器中的塑料管中,该检测器可测量来自塑料管的本体荧光(bulk fluorescence)。在一些情况下,可将一个或多个样品(如小滴)分配到板如96-孔板或384孔板的一个或多个孔中,并且可使用荧光板读取器检测单个孔的荧光。
在一些情况下,检测器进一步包含对小滴样品的处理能力,单个小滴输入检测器、进行检测、然后离开检测器。例如,流式细胞术装置可适用于检测来自小滴样品的荧光。在一些情况下,配备有控制小滴运动的泵的微流体装置用于依次检测来自小滴的荧光。在一些情况下,小滴排列在二维表面上,并且检测器相对于表面移动,在每个包含一个小滴的位置检测荧光。
计算机
获得荧光检测数据之后,可以使用计算机存储和处理数据。可使用计算机可执行逻辑行使诸如扣除背景荧光、靶序列和/或参考序列的分配和数据定量的功能。计算机可用于显示、存储、检索或计算来自分子谱分析的诊断结果;显示、存储、检索或计算来自基因组或核酸表达分析的原始数据;或显示、存储、检索或计算在本发明方法中有用的任何样品信息或患者信息。
数字分析
通过将样品中的靶序列进行分区和鉴定含有靶序列的分区,可利用数字读取试验如数字PCR计数靶序列(如,靶核酸序列)。数字读取是一种“全或无”的分析,因为它指定了给定分区是否含有目标靶序列,但不一定指示分区中有多少靶序列拷贝。例如,含有两个靶序列的单一多核苷酸可处于分区中,但是在正常分析条件下,该分区将只被认为含有一个靶序列。如果在同一多核苷酸上的靶序列被大量碱基对隔开,那么在样品纯化期间一些靶核酸序列可通过断裂而分离——一些连接的靶核酸序列在样品制备后可能不会保持物理连接。数字PCR通常,例如,在Vogelstein和Kinzler(1999)PNAS96:9236-9241中有所描述。该技术的应用包括,例如,高分辨率CNV测量、跟进(follow-up)至全基因组关联研究、细胞遗传学分析、癌组织中的CNV改变和CNV连锁分析。
通常,dPCR可包括将来自样品的单个多核苷酸进行空间分离(或分区),并对每个分区进行聚合酶链反应。分区可以是,例如,孔(例如,微孔板的孔)、毛细管、乳液的分散相、室(例如,小型化室阵列中的室)、小滴或核酸结合表面。可分配样品,使得每个分区含有约0、1或2个靶多核苷酸。每个分区(如,小滴)可平均含有少于5、4、3、2或1个靶核酸拷贝。在一些情况下,至少0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175或200个分区(如,小滴)含有零个靶核酸拷贝。PCR扩增后,可计算含有或不含PCR产物的分区数。分区的总数可以是大约或大于约500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、150,000、200,000、500,000、750,000或1,000,000。分区的总数可以是约500到约1,000,000、约500到约500,000、约500到约250,000、约500到约100,000、约1000到约1,000,000、约1000到约500,000、约1000到约250,000、约1000到约100,000、约10,000到约1,000,000、约10,000到约100,000或约0,000到约50,000。
在一个实施方案中,数字PCR为小滴数字PCR。在小滴数字PCR实验的一些实施方案中,可检测少于约0.00001、0.00005、0.00010、0.00050、0.001、0.005、0.01、0.05、0.1、0.5、1、2、2.5、3、3.5、4、4.5、5、6、7、8、9或10个靶多核苷酸拷贝。在一些情况下,可检测少于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450或500个靶多核苷酸拷贝。在一些情况下,本文所述的小滴以大于1、2、3、4、5、10、50、100、200、300、400、500、600、700、800、900或1000小滴/秒的速度产生。
小滴数字PCR(ddPCRTM)可提供用于验证由下一代测序仪和微阵列鉴定的拷贝数变异的实际方案。使用ddPCRTM的方法可以允许筛选许多样品,例如数百个样品,用于在单一工作班次中进行CNV分析。在一个实施方案中,提供了ddPCRTM的工作流程,该工作流程涉及在组装包括用来检测靶核酸序列(例如,第一基因)和单拷贝参考核酸序列(例如,第二基因)的试剂的双重试验之前,使用一种或多种限制酶分离靶核酸序列的串联拷贝。当使用ddPCR时,反应混合物然后可分成大约、少于约或多于约500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、150,000、200,000、500,000、750,000、1,000,000、2,000,000、3,000,000、4,000,000、5,000,000、6,000,000、7,000,000、8,000,000、9,000,000或10,000,000个纳升小滴,在分析前可将这些纳升小滴热循环到终点。在一些情况下,小滴大于一纳升;在其它情况下,小滴小于一纳升(例如,皮升)。每个反应的小滴数可为约1000到约1,000,000、约1000到约750,000、约1000到约500,000、约1000到约250,000、约1000到约100,000、约1000到约50,000、约1000到约30,000、约1000到约10,000、约10,000到约1,000,000、约10,000到约750,000、约10,000到约500,000、约10,000到约250,000、约10,000到约100,000、约10,000到约50,000或约10,000到约30,000。每个反应的小滴数可以是约20,000到约1,000,000、约20,000到约750,000、约20,000到约500,000、约20,000到约250,000、约20,000到约200,000、约20,000到约50,000、约50,000到约100,000、约50,000到约200,000或约50,000到约300,000。
分析可在双色读取器上发生。正计数的小滴的分数可以使靶核酸序列和参考核酸序列(例如基因)的绝对浓度能够得到测定。可使用该信息来确定相对拷贝数。例如,每孔至少20,000个PCR重复可提供分辨高阶拷贝数差异的统计功效。这种低成本的方法可以可靠地产生具有95%置信区间且跨越整数而无相邻拷贝数状态重叠的拷贝数测量值。这种技术能够确定拷贝数变体的连接,并且可用于确定基因拷贝是在相同染色体上还是在不同染色体上。
体积可具有任何合适的大小。在一些实施方案中,体积可具有约10到1000微米的直径或特征横截面尺寸。
被分区的核酸可具有任何合适的特征。核酸尤其可包括受试者的遗传物质(例如,受试者的基因组DNA和/或RNA)、受试者的信使RNA和/或来源于受试者RNA的cDNA等。核酸可具有任何合适的平均长度。通常,平均长度基本上大于染色体上待分析的多态基因座之间的距离。因为该平均长度,在受试者中连接的等位基因也常常连接在分离的核酸中,因此当对水相进行分区时,等位基因倾向于一起分布至相同体积中。在一些实施方案中,每个引物组能够从多态基因座扩增至少一对不同的等位基因。
可将每个体积进行分区,从而含有任何合适的平均核酸浓度。通常,分区的过程,结合水相中核酸的合适起始浓度,产生每体积含有平均少于约数个基因组当量的核酸的体积。虽然可利用每体积平均多于一个基因组当量(例如,每体积约两个基因组当量)执行该方法,但通过将浓度限制到每体积平均少于约一个基因组当量,因而具有较低的背景,分析通常会变得更加有效和可靠。因此,每个体积可含有包括每个多态基因座的靶区域的平均少于约一个拷贝或分子,和/或每个多态基因座的任意等位基因序列的平均少于约一个拷贝。
本文所述的方法中可使用集成的、快速、流通型热循环仪装置。参见,例如,2009年9月23日提交的国际申请PCT/US2009/005317。在这样的集成装置中,毛细管缠绕在保持2、3或4个温度区的圆柱体上。当小滴流经毛细管时,它们经过不同温度区实现热循环。随着小滴进入每个温度区,每个小滴的小体积会导致非常快速的温度转变。
供本文所述的方法、组合物和试剂盒使用的数字PCR装置(例如,小滴数字PCR装置)可检测多种信号(参见,例如,2011年3月18日提交的美国临时专利申请61/454,373,其通过引用整体并入本文)。
小滴数字PCR可涉及每秒数千个离散的、稳健的微滴反应器的产生。ddPCR可涉及使用安装的基础仪器的标准热循环,其可使研究者立即获取数字数据。对每个小滴的快速探询可以产生初始样品中存在的靶分子的计数。
图16图示了ddPCR实验的一般工作流程的实例。如图16中所示,该过程可从将样品分成多个分区(如,小滴)开始,然后在热循环仪中对样品进行热循环。然后可用读取器(例如,光学读取器)检测小滴的荧光。
小滴产生
本发明包括使用小滴数字PCR的组合物和方法。本文所述的小滴包括在美国专利7,622,280中描述的乳液组合物(或两种或更多种不混溶流体的混合物),和由在2009年9月23日提交的国际申请PCT/US2009/005317中所述的装置产生的小滴。本文所用的术语乳液可指不混溶液体(如油和水)的混合物。油相和/或油包水乳液允许水性小滴内反应混合物的区室化。乳液可包含连续油相内的水性小滴。本文提供的乳液可以是水包油乳液,其中小滴为在连续水相中的油滴。本文提供的小滴设计为防止区室之间的混合,其中每个区室防止其内容物蒸发,以及防止其内容物与其它区室的内容物聚结(coalescing)。
本文所述的混合物或乳液可以是稳定的或不稳定的。乳液可以是相对稳定的且具有最小的聚结。当小的小滴结合逐渐形成较大的小滴时会发生聚结。在一些情况下,少于约0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%或10%的由小滴发生器产生的小滴与其它小滴聚结。乳液还可具有有限的絮凝,通过该过程分散相从悬浮液中呈片状析出。
如本文所述将样品分成小反应体积可以实现使用减少量的试剂,从而降低分析的材料成本。由于在不同的区室中较高丰度的分子与较低丰度的分子相分离,所以通过分区减少样品的复杂性也提高了检测的动态范围,从而使较低丰度的分子有更高的比例与反应试剂接触,这转而增强较低丰度分子的检测。
可产生平均直径为大约、小于约或大于约0.001、0.01、0.05、0.1、1、5、10、20、30、40、50、60、70、80、100、120、130、140、150、160、180、200、300、400或500微米的小滴。小滴可具有约0.001到约500、约0.01到约500、约0.1到约500、约0.1到约100、约0.01到约100或约1到约100微米的平均直径。已知使用微通道错流聚焦或物理搅拌产生乳液小滴的微流体方法产生单分散或多分散的乳液。小滴可以是单分散小滴。可产生小滴,使得所述小滴的大小变化不超过所述小滴的平均大小的±5%。在一些情况下,产生小滴,使得所述小滴的大小变化不超过所述小滴的平均大小的±2%。小滴发生器可从单一样品产生小滴群体,其中小滴的大小变化均不超过小滴总群的平均大小的±约0.1%、0.5%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%或10%。
较高机械稳定性对于微流体操作和较高剪切流体处理(例如,在微流体毛细管中或在流体路径中经过90度弯折部分,如阀门)可能是有用的。预先或后续热处理的小滴或胶囊对标准移液管操作和离心可能是机械稳定的。
可通过使油相流过含水样品而形成小滴。水相可包含用于进行PCR反应的缓冲的溶液和试剂,包括用于荧光检测的核苷酸、引物、探针,模板核酸、DNA聚合酶和任选的逆转录酶。
水相可包含本文所述的一种或多种缓冲液和/或添加剂。
水相中用于扩增的引物可具有大约、大于约或小于约0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、1.7或2.0μM的浓度。水相中引物的浓度可以是约0.05到约2、约0.1到约1.0、约0.2到约1.0、约0.3到约1.0、约0.4到约1.0或约0.5到约1.0μM。引物的浓度可以是约0.5μM。水相可包含一种或多种用于荧光检测的探针,其浓度为大约、大于约或小于约0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.4、1.6、1.8或2.0μM。水相可包含一种或多种用于荧光检测的探针,其浓度为约0.05到约2.0、约0.1到约2.0、约0.25到约2.0、约0.5到约2.0、约0.05到约1、约0.1到约1或约0.1到约0.5μM。用于荧光检测的探针的浓度可以是约0.25μM。在PCR中,合适的靶核酸浓度范围为约1pg到约500ng。
油相可包含氟化基础油(base oil),该基础油可通过与氟化表面活性剂如全氟化聚醚组合而额外得到稳定。在一些情况下,基础油可以是HFE7500、FC-40、FC-43、FC-70的一种或多种或另一种常用氟化油。在一些情况下,阴离子型表面活性剂为Krytox铵(Krytox-AM)、Krytox FSH的铵盐或Krytox-FSH的吗啉衍生物。Krytox-AS可以大约、大于约或小于约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、2.0%、3.0%或4.0%w/w的浓度存在。在一些优选的实施方案中,Krytox-AS的浓度为1.8%。在其它优选的实施方案中,Krytox-AS的浓度为1.62%。Krytox-FSH的吗啉衍生物可以约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、2.0%、3.0%或4.0%w/w的浓度存在。Krytox-FSH的吗啉衍生物的浓度可为约1.8%。Krytox-FSH的吗啉衍生物的浓度可为约1.62%。
油相可进一步包含用于调节油的性质如蒸汽压或粘度或表面张力的添加剂。非限制性实例包括全氟辛醇和1H,1H,2H,2H-全氟癸醇。可加入1H,1H,2H,2H-全氟癸醇至大约、大于约或小于约0.05%、0.06%、0.07%、0.08%、0.09%、1.00%、1.25%、1.50%、1.75%、2.00%、2.25%、2.50%、2.75%或3.00%w/w的浓度。可加入1H,1H,2H,2H-全氟癸醇至约0.18%w/w的浓度。
可配制乳液以产生高度单分散的、具有液体样界面膜的小滴,这些小滴可通过加热转变成具有固体样界面膜的微胶囊;这些微胶囊能像生物反应器一样表现,在整个反应过程如PCR扩增中能够保持其内容物。加热时可发生向微胶囊形式的转变。例如,这种转变可在大于约50、60、70、80、90或95摄氏度的温度下发生。在一些情况下,使用热循环仪进行这种加热。在加热过程中,流体或矿物油覆盖层可用于防止蒸发。在加热前,可除去或不除去过多的连续相油。在众多的热处理和机械处理中,生物相容性胶囊可抵抗聚结和/或絮凝。
转变之后,可将胶囊储存在大约、高于约或低于约3、4、5、6、7、8、9、10、15、20、25、30、35或40摄氏度。这些胶囊在生物医学应用中可能是有用的,如大分子的稳定、数字化封装,尤其是含有核酸或蛋白质或二者的混合物的水性生物流体;载药和疫苗递送;生物分子文库;临床成像应用等。
微胶囊可含有一种或多种多核苷酸并且可以抗聚结,尤其是在高温下。因此,PCR扩增反应可在非常高的密度下(例如,每单位体积的反应数)发生。在一些情况下,每毫升可发生多于约100,000、500,000、1,000,000、1,500,000、2,000,000、2,500,000、5,000,000或10,000,000个单独反应。在一些情况下,反应发生在单一孔内,例如,微量滴定板的孔,无需反应体积之间的相互混合。微胶囊还可含有使PCR反应能够发生的其它必需组分,例如,引物、探针、dNTPs、DNA或RNA聚合酶等。这些胶囊在众多热处理和机械处理中显示出对聚结和絮凝的抗性。
在一个实施方案中,当通过例如消化、热处理或剪切使DNA的大小减小后,小滴的生成可得到改善。
图17展示了小滴的几个图像,其显示a)随着油从侧面流入将小滴压缩而形成小滴,和b)随着小滴从本体流体中脱离而伸长或收缩。
图18示出了增加DNA负载的效果。图18将最大拉伸相对于流速作图。从截面的中心到小滴刚好破裂时的最远范围测量拉伸。一定的小滴拉伸是可容许的,但是如果拉伸变得过度,会拉出将小滴与本体流体连接起来的长“线”。随着小滴破裂,该线可塌缩成微滴,从而导致不期望的多分散性。在极端情况下,小滴不破裂;相反水相作为连续相从通道中心流下,而油相沿着通道壁流动,并且没有小滴形成。
减小拉伸的一个方法是降低流速。降低流速可具有较低的通量以及增加的小滴大小的不期望的副作用。紫色(B)、青色(E)和绿色(A)曲线具有零DNA。这些样品可容忍高流速而不会显著增加它们向通道内的拉伸。
蓝色(D)、橙色(F)和红色(C)曲线具有较高的DNA负载。在这些情况下,较高流速会导致小滴向通道内拉伸。可使用低流速来避免小滴的过度拉伸。
图19示出了在研究小滴性质的实验中未消化的样品1-10和已消化的样品11-20。DNA负载在最右边的列中示出;压力(大致与流速成正比)在第二行中示出。该表是用颜色与字母编码的:J(红色)表示喷射,E(黄色)表示拉伸,而N(绿色)表示正常(无喷射或拉伸)小滴产生。可以看出,甚至在高DNA负载和高流速下,消化(用限制酶)导致改善的小滴产生。
应用
本文所述的方法可以用来诊断或预测病症或疾病。
本文提供的方法和组合物对于人类和非人类受试者都是有用的。本文提供的方法和组合物的应用众多,例如,高分辨率CNV测量、跟进至全基因组关联研究、细胞遗传学分析、癌组织中的CNV改变、CNV连锁分析以及单元型分析。
本文提供的应用包括用于诊断、预测、确定或评估胎儿或胚胎的遗传特征的应用。在一些情况下,这些应用可用来诊断、预测、确定或评估通过体外受精或其它辅助生殖技术产生的胚胎中的核酸。此外,本文提供的方法可用于为未来父母(如,孕妇)提供信息,以便评估在发育中胎儿的基因组中的CNV或遗传定相。在其它情况下,本文提供的方法可用于帮助在关于未来后代的可能遗传特性方面给患者以建议。在一些情况下,这些方法可以与辅助生殖技术结合使用。例如,该信息可用于评估取自通过体外受精产生的胚胎的样品中的CNV或遗传定相。
可在癌细胞中发现一种或多种CNV。例如,在非小细胞肺癌中,EGFR的拷贝数可能会增加。CNV可以和治疗效果相关联。例如,在非小细胞肺癌晚期,增加的HER2基因拷贝数可以增强对吉非替尼治疗的响应。参见Cappuzzo F.等人(2005)J.Clin.Oncol.23:5007-5018。EGFR基因的高拷贝数可以预测提高的对拉帕替尼和卡培他滨的敏感性。参见Fabi等人(2010)J.Clin.Oncol.28:15s(2010年ASCO年会)。EGFR基因的高拷贝数与提高的对西妥昔单抗和帕尼单抗的敏感性有关。
在一个实施方案中,提供了一种方法,该方法包括使用本文所述的方法测定靶序列的拷贝数,以及基于所述测定设计疗法。在一个实施方案中,靶标是EGFR,并且疗法包括施用西妥昔单抗、帕尼单抗、拉帕替尼和/或卡培他滨。在另一实施方案中,靶标是ERBB2,并且疗法包含曲妥单抗(赫赛汀)。
拷贝数变异可促进人类中的遗传变异。参见,例如,Shebat J.等人(2004)Science305:525-528。
与拷贝数变异有关的疾病可包括,例如,DiGeorge/腭-心-面综合征(22q11.2缺失)、Prader-Willi综合征(15q11-q13缺失)、Williams-Beuren综合征(7q11.23缺失)、Miller-Dieker综合征(MDLS)(17p13.3微缺失)、Smith-Magenis综合征(SMS)(17p11.2微缺失)、1型多发性神经纤维瘤(NF1)(17q11.2微缺失)、Phelan-McErmid综合征(22q13缺失)、Rett综合征(染色体Xq28上MECp2的功能缺失突变)、Merzbacher病(PLP1的CNV)、脊髓性肌萎缩(SMA)(5q13染色体上端粒SMN1的纯合缺乏)、Potocki-Lupski综合征(PTLS,17p.11.2染色体的重复)。PMP22基因的额外拷贝可能与IA型Charcot-Marie-Tooth神经病(CMT1A)和易发生压迫性麻痹的遗传性神经病有关。本文所述的检测CNV的方法可用于诊断本文所述的以及通过引用而并入的出版物中所述的CNV病症。该疾病可以是在Lupski J.(2007)NatureGenetics39:S43-S47中描述的疾病。
非整倍性,例如,胎儿非整倍性,可包括,例如,三体性13、三体性18、三体性21(唐氏综合征)、克莱恩费尔特综合征(XXY)、一条或多条染色体的单体性(X染色体单体性、特纳综合征)、三体性X、一条或多条染色体的三体性、一条或多条染色体的四体性或五体性(例如,XXXX、XXYY、XXXY、XYYY、XXXXX、XXXXY、XXXYY、XYYYY和XXYYY)、三倍性(每种染色体有三条,例如,在人类中的69条染色体)、四倍性(每种染色体有四条,例如,在人类中的92条染色体)和多倍性。在一些实施方案中,非整倍性可以是节段性非整倍性。节段性非整倍性可包括,例如,1p36重复、重复(17)(p11.2p11.2)综合征、唐氏综合征、Pelizaeus-Merzbacher病、重复(22)(q11.2q11.2)综合征和猫眼综合征。在一些情况下,异常基因型,例如,胎儿基因型,起因于性染色体或常染色体的一个或多个缺失,这会导致以下病状,如猫叫综合征、Wolf-Hirschhorn综合征、Williams-Beuren综合征、Charcot-Marie-Tooth病、易发生压迫性麻痹的遗传性神经病、Smith-Magenis综合征、多发性神经纤维瘤、Alagille综合征、腭-心-面综合征、DiGeorge综合征、类固醇硫酸酯酶缺乏症、Kallmann综合征、与线性皮肤缺陷相关的小眼畸形、肾上腺发育不全、甘油激酶缺乏症、Pelizaeus-Merzbacher病、Y染色体上的睾丸决定因子、精子缺乏(因子a)、精子缺乏(因子b)、精子缺乏(因子c)或1p36缺失。在一些实施方案中,染色体数的减少导致了XO综合征。
在Li-Fraumeni癌症倾向综合征中发现过多的基因组DNA拷贝数变异(Shlien等人(2008)PNAS105:11264-9)。CNV与畸形综合征有关,包括CHARGE(缺损、心脏异常、鼻后孔闭锁、阻滞、生殖器(gential)和耳异常)、Peters-Plus、Pitt-Hopkins和血小板减少-桡骨缺失综合征(参见,例如,Ropers HH(2007)Am J of Hum Genetics81:199-207)。拷贝数变异与癌症之间的关系例如在Shlien A.和Malkin D.(2009)Genome Med.1(6):62中有述。拷贝数变异与例如孤独症、精神分裂症和先天学习障碍有关。参见,例如,Sebat J.等人(2007)Science316:445-9;Pinto J.等人(2010)Nature466:368-72;Cook E.H.和Scherer S.W.(2008)Nature455:919-923。
拷贝数变异可与癌症患者对某些治疗的抗性有关。例如,胸苷酸合酶的扩增可导致转移性结直肠癌患者对5-氟尿嘧啶治疗的抗性。参见Wang等人(2002)PNAS USA,vol.99,pp.16156-61。
CCL3L1的高拷贝数与对HIV感染的较低敏感性相关(GonzalezE.等人(2005)Science307:1434-1440)。FCGR3B(CD16细胞表面免疫球蛋白受体)的低拷贝数可以增加对系统性红斑狼疮的敏感性(AitmanT.J.等人(2006)Nature439:851-855)。发现常染色体显性小耳畸形与在染色体4p16上的拷贝数变异区域的五个串联拷贝相关(Balikova I.(2008)Am J.Hum Genet.82:181-187)。本文所述的方法、组合物和试剂盒可用来研究任何这些病状。
来自高淀粉饮食群体的个体通常比来自低淀粉饮食群体的个体具有更多的淀粉酶基因(AMY1)拷贝(Perry H.等人(2007)NatureGenetics39:1256-1260)。因此,在进化过程中拷贝数可经历正选择。本文所述的方法、组合物和试剂盒可用来研究进化。
与疾病相关的拷贝数变异的其它实例包括,例如,三体性21(唐氏综合征)、三体性18(爱德华兹综合征)和三体性13(帕塔综合征)。
确定核酸是连接的还是分开的(断裂的)可以为多种应用提供有用的信息。例如,本文所述的方法可用来诊断或预测病症或疾病,例如,遗传性障碍。本文所述的方法可用来诊断和预测胎儿病症,例如,胎儿非整倍性。
本文所述的方法对于评估感染如病毒或细菌感染可能是有用的。例如,这些方法可用于确定两个或多个突变是否位于单一病毒或细菌中,或两个或多个突变是否在不同的单个病毒或细菌中。
本文所述的方法对于监测转基因小鼠的产生可能是有用的。例如,这些方法可用于确定转基因是否已被一次或多次地引入到转基因生物的基因组中。
细胞凋亡
确定核酸是连接的还是分离的(断裂的)可用来研究细胞凋亡或诊断或预测与细胞凋亡有关的疾病。细胞凋亡是程序性细胞死亡的过程。细胞凋亡的指征可以包括,例如,起泡、细胞膜非对称性和粘附性的丧失、细胞收缩、核断裂、染色质凝聚和染色体DNA断裂。在细胞凋亡过程中,内源性内切核酸酶(例如,Ca2+和Mg2+依赖型内切核酸酶)可将染色质DNA切成约180-200个碱基对或约180-200个碱基对的倍数的核小体间片段。使用本文所述的方法、组合物和/或试剂盒可确定不同细胞凋亡阶段的不同形式的遗传物质的断裂状态。本文所述的方法可与一种或多种其它方法一起使用来分析细胞凋亡,包括,例如,流式细胞术、荧光分析或(TUNEL)(末端脱氧核苷酸转移酶dUTP缺口末端标记)。
细胞凋亡可包括外源的或死亡受体途径,或者内源的或线粒体途径,和/或涉及T细胞介导的细胞毒性和细胞的穿孔蛋白-粒酶依赖性死亡的途径。死亡受体途径可涉及死亡配体与死亡受体的结合(例如,FasL(脂肪酸合成酶配体、TNFSF6、Apo1、细胞凋亡抗原配体1、CD95L、CD178、APT1LG1)/FasR(脂肪酸合成酶受体、TNFRSF6、ATP1、CD95);TNF-α(肿瘤坏死因子α、TNF配体、TNFA、恶病质素)/TNFR1(肿瘤坏死因子受体1、TNF受体、TNFRSF1A、p55TNFR、CD120a);Apo3L(Apo3配体,TNFSF12、Apo3配体、TWEAK、DR3LG)/DR3(死亡受体3,TNFRSF12、Apo3、WSL-1、TRAMP、LARD、DDR3);Apo2L(Apo2配体、TNFSF10、TRAIL、TNF相关细胞凋亡诱导配体)/DR4(死亡受体4,TNFRSF10A、TRAILR1、APO2);和Apo2L/DR5(死亡受体5,TNFRS10B、TRAIL-R2、TRICK2、KILLER、ZTNFR9)。TNF受体可包含富含半胱氨酸的胞外结构域和细胞质“死亡结构域”。Fas结合在Fas受体上可导致FADD衔接蛋白的结合。TNF配体与TNF受体的结合可导致TRADD(TNF受体相关死亡结构域)衔接蛋白的结合以及FADD(Fas相关死亡结构域,MORT1)和RIP(受体相互作用蛋白质,RIPK1)的募集。通过与死亡效应结构域二聚化以形成死亡诱导信号复合体(DISC),FADD然后可与胱天蛋白酶原-8关联。该作用可导致胱天蛋白酶原-8的自动催化激活。胱天蛋白酶-8的激活可导致如下所述的细胞凋亡的“执行阶段”。
死亡受体介导的细胞凋亡可受到c-FLIP(Casper、I-FLICE、FLAME-1、CASH、CLARP、MRIT)的抑制,c-FLIP可与FADD和胱天蛋白酶-8(FLICE、FADD样Ice、Mach-1、Mch5)结合。通过抑制胱天蛋白酶-8的加工,Toso可以阻断T细胞中Fas诱导的细胞凋亡。
在穿孔蛋白/粒酶途径中,细胞毒性T淋巴细胞(CTL)可通过分泌穿孔蛋白(一种跨膜成孔分子)杀死肿瘤细胞和病毒感染的细胞,随后通过该孔释放胞质颗粒并进入到靶细胞中。丝氨酸蛋白酶粒酶A和粒酶B可以是颗粒的组分。粒酶B可切割胱天蛋白酶原-10从而将其激活,并且可以切割ICAD(胱天蛋白酶激活的DNA酶的抑制剂)。粒酶B可通过切割Bid和诱导细胞色素c释放而在线粒体途径中发挥作用。粒酶B还可直接激活胱天蛋白酶-3。粒酶A可通过DNA酶NM23-H1激活DNA切口形成,DNA酶NM23-H1可被SET复合物抑制。粒酶A可以切割SET复合物从而释放NM23-H1的抑制。
内源性细胞凋亡途径可具有非受体介导的刺激,并且该刺激可以正面或负面的方式起作用。例如,某些因子(例如,生长因子、激素、细胞因子)的缺乏可诱导细胞凋亡。能以正面方式起作用的刺激包括,例如,辐射、自由基、病毒感染、毒素、低氧和过热。这些刺激可以引起线粒体渗透性转变(MPT)孔的打开、线粒体跨膜电位的损失和促凋亡蛋白质从膜间隙向胞质溶胶中的释放。一组释放的蛋白质包括细胞色素c、Smac/DIABLO和丝氨酸蛋白酶HtrA2/Omi,它们可以激活胱天蛋白酶依赖的线粒体途径。细胞色素c可以结合并激活Apaf-1和胱天蛋白酶原-9从而形成凋亡体,并且可激活胱天蛋白酶-9。Smac/DIABLO和HtrA2/Omi可通过抑制IAP(细胞凋亡蛋白质的抑制剂)来促进细胞凋亡。在细胞凋亡过程中,线粒体可以释放第二组促凋亡蛋白质,AIF、内切核酸酶G和CAD。AIF可移动到细胞核并可导致DNA断裂成约50到约300kb的片段。AIF可以引起外围核染色质的凝聚(“阶段I”凝聚)。内切核酸酶G可移动到细胞核,在细胞核内它可切割核染色质以形成寡核小体DNA片段。AIF和内切核酸酶G可以不依赖胱天蛋白酶起作用。CAD可由线粒体释放并且移动到细胞核,在细胞核内CAD可导致寡核小体DNA断裂和晚期的核染色质凝聚(“阶段II”凝聚)。
Bcl-2家族的蛋白质可调节线粒体膜的通透性。Bcl-2家族蛋白质可以是促凋亡的或抗凋亡的。抗凋亡蛋白质包括Bcl-2、Bcl-x、Bcl-XL、Bcl-XS、Bcl-2和BAG。促凋亡蛋白质包括,例如,Bcl-10、Bax、Bak、Bid、Bad、Bim、Bik和Blk。Bcl-2家族的蛋白质可以通过改变线粒体膜的通透性来调节细胞色素c从线粒体的释放。蛋白质14-3-3可以基于Bad的磷酸化状态来调节Bad。
Bad可以与Bcl-XI或Bcl-2进行异二聚化,这可以中和它们的保护效应并促进细胞死亡。当Bcl-2和Bcl-XI未被Bad隔离时,Bcl-2和Bcl-XI可以防止细胞色素c从线粒体中释放。Aven与Bcl-XI和Apaf-1的结合可以防止胱天蛋白酶原-9的激活。
其它Bcl2家族的成员包括Puma和Noxa。Puma和Noxa可在p53介导的细胞凋亡中起作用。而且MYC可以p53依赖型或非依赖型方式调节细胞凋亡。
死亡受体途径(外源途径)和线粒体途径(内源途径)可在执行阶段终止。胱天蛋白酶-3、胱天蛋白酶-6和胱天蛋白酶-7可以作为执行胱天蛋白酶起作用,并且可切割底物,包括PARP、细胞角蛋白、胞衬蛋白、NuMA、凝溶胶蛋白等。胱天蛋白酶-3可由引发剂胱天蛋白酶如胱天蛋白酶-8、胱天蛋白酶-9或胱天蛋白酶-10激活。胱天蛋白酶-3可通过切割其抑制剂ICAD来激活内切核酸酶CAD。CAD可以降解细胞核中的染色体DNA,并引起染色质凝聚。细胞凋亡可包括凋亡细胞的吞噬摄取,后者可包括磷脂不对称性的识别和磷脂酰丝氨酸的外化(externalization)。
细胞凋亡的概述可见例如Elmore S.(2007)Apoptosis:A Reviewof Programmed Cell Death.Toxicologic pathology35:495-516,其通过引用整体并入本文。
本文所述的方法、组合物和试剂盒可用来分析自体吞噬过程中DNA的断裂。
检查点、DNA损伤和细胞周期
确定基因座是连接的还是分离的(断裂的)可以用来研究DNA损伤的修复、双链断裂修复、同源重组、微同源性介导的末端连接、单链退火(SSA)、断裂诱导的复制或非同源末端连接(NHEJ)。本文所述的方法可以用来诊断和预测与这些过程相关的疾病。
DNA损伤可由环境因素和内源或正常代谢过程引起。可损伤DNA的内源因素包括,例如,活性氧和复制错误。生理双链DNA断裂可包括V(D)J重组断裂和类别转换断裂。病理性双链DNA断裂可由电离辐射、氧化自由基、跨越切口的复制、脆性位点处的无意酶作用、拓扑异构酶失效和机械应力引起。可引起DNA损伤的环境或内源因素包括紫外辐射、X-射线、γ射线、DNA嵌入剂、某些植物毒素、病毒、热破坏和化学治疗。减数分裂细胞可具有额外的DSB来源,包括酶Spo11。
双链DNA断裂可通过例如NHEJ进行修复。可参与NHEJ的因子包括,例如,Ku70/86、DNA-PKcs、Artemis、polμ和λ、XRCC4、DNA连接酶IV、XRC44和XLF-Cernunnos。在双链DNA断裂形成后,Ku可结合到该断裂形成DNA复合物。DNA末端复合物可以募集核酸酶、聚合酶和连接酶活性。在DNA末端的Ku可与DNA-PKcs形成稳定复合物。DNA-PKcs可包含5’内切核酸酶活性、3’内切核酸酶活性和发夹打开活性。Artemis可包含5’外切核酸酶活性。PALF(APLF)的3’外切核酸酶可在NHEJ中发挥作用。聚合酶μ和λ可通过其BRCT结构域结合Ku:DNA复合物。DNA连接酶IV可跨越切口连接、连接不相容DNA末端以及连接单链DNA。NHEJ可包括链切除。XRCC4可以四聚化,并且PNK(多核苷酸激酶)、APTX(aprataxin,一种可在中止连接产物的脱腺苷化中发挥作用的蛋白质)和PALF可与XRCC4相互作用。通过NHEJ进行的双链DNA断裂修复在例如Lieber,M(2011)Annu.Rev.Biochem.79:181-211中进行了综述,其通过引用整体并入本文。NHEJ可在细胞周期的任何时间发生。
NHEJ蛋白质在V(D)J重组中发挥作用。蛋白质RAG1和RAG2可在V(D)J重组中发挥作用。在完成V(D)J重组后,在B细胞中可发生类别转换重组,并且其可用于改变免疫球蛋白重链基因。该过程可涉及激活诱导脱氨酶(AID)、RNA酶H、尿嘧啶糖基化酶、APE1和Exo1。
双链DNA酶断裂可通过同源性指导的修复(例如,同源重组或单链退火)来进行修复。这些过程中可能涉及的因子的实例包括RAD50、MRE11、Nbs1(合称为MRN复合物);RAD51(B、C、D)、XRCC2、XRCC3、RAD52、RAD54B和BRCA2。在细胞周期的S和G2期过程中,存在两个离得很近的姐妹染色单体,所以在这些阶段中同源性指导的修复可能更常见。
ATM和ATR激酶可识别受损的DNA。这些激酶与DNA-PK一起可以使H2AX磷酸化并产生γH2AX灶。ATR可被由复制叉停工(stalling)或大损伤处理产生的单链DNA区域激活。ATR可与ATRIP相互作用。9-1-1复合物(Rad9、Hus1和Rad1)可在ATR引起的底物磷酸化中发挥作用。RPA可结合ssDNA,并可在ATR引起的底物磷酸化中发挥作用。
ATM可通过MRN识别DNA末端。磷酸化的H2AX可募集MDC1、泛素连接酶RNF8和RNF168以及53BP1。ATM可使Chk2和p53磷酸化。
还可使用本文所述的方法、组合物和试剂盒分析检查点和细胞周期调控。细胞可经历细胞周期,且细胞周期可包含G1期、S期(DNA合成)、G2期和M期(有丝分裂)。停止分裂的细胞可处在G0期(静止期)。检查点可用于使细胞周期停止,并且在允许细胞周期继续前允许对DNA损伤的修复。DNA损伤检查点可发生在G1和S期的边界以及G2和M期的边界。另一检查点为S期内检查点。
其它过程
确定核酸是连接的还是分离的(断裂的)可用来研究在诸如DNA复制和转录的过程中的聚合酶(例如,DNA聚合酶、RNA聚合酶、逆转录酶)。例如,可确定聚合酶的持续合成能力(例如,以便确定新生链的百分比,即全长相对于部分长度,可以通过计数基因的前一半拷贝数对比后一半拷贝数来测量存在多少截短形式的基因)。因为合成以5’到3’发生,所以预期会产生比待合成产物的后一半(3’端)更多的前一半(5’端)。
确定样品中基因座是连接的还是分离的(断裂的)可用于研究一种或多种限制酶、RNA酶、DNA酶、外切核酸酶、内切核酸酶、RNA酶、DNA酶等,从而确定这些酶的切割效率(例如,分离成两个连接的靶序列)。
确定样品中基因座是连接的还是分离的(断裂的)对研究RNA剪接、基因重排、基因定位和癌症中的DNA重排可能是有用的。基因重排可以是,例如,染色体易位。易位可以是相互的(非罗伯逊易位),其可涉及非同源染色体之间的物质交换。易位可以是罗伯逊易位。罗伯逊易位可涉及靠近着丝粒融合的两条近端着丝粒染色体的重排。与疾病相关的易位包括,例如,t(8;14)(q24;a32)(伯基特淋巴瘤;c-myc与IGH的融合);t(11;14)(q13;q32)(套细胞淋巴瘤;细胞周期蛋白D1与IGH的融合);t(14;18)(q32;q21)(滤泡型淋巴瘤;IGH与Bcl-2的融合);t(10;(各种))(q11;(各种))(乳头状甲状腺癌;涉及染色体10上的RET原癌基因);t(2;3)(q13;p25)(滤泡性甲状腺癌;PAX8与PPARγ1的融合);t(8;21)(q22;q22)(急性髓母细胞白血病);t(9;22)(q34;q11)费城染色体(慢性髓性白血病;急性淋巴细胞白血病;ETO与AML1的融合);t(15;17)(急性早幼粒细胞白血病;PML与RAR-α的融合);t(12;15)(p13;q25)(急性髓性白血病、先天性纤维肉瘤、分泌性乳腺癌;TEL与TrkC受体的融合);t(9;12)(p24;p13)(CML、ALL;JAK与TEL的融合);t(12;21)(p12;q22)(ALL;TEL与AML1的融合);t(11;18)(q21;q21)(MALT淋巴瘤;Bcl-2与MLT的融合);和t(1;11)(q42.1;q14.3)(精神分裂症)。
本文所述的拷贝数变异分析可用来诊断产前状况,例如胎儿非整倍性,如三倍性13、三倍性18或三倍性21。
确定法医用遗传物质的降解(断裂)程度可以帮助在浪费宝贵的样品之前确定什么样的分析可以成功进行。确定核酸是连接的还是分离的(断裂的)对于从完美整数值拷贝数估计中确定由于DNA的随机剪切引起的预期缺陷可能是有用的。
物质的共定位(collocation)
本文提供了用于确定微小RNA和其它RNA的共定位的方法。例如,可将微小RNA和其它类型的RNA包裹在血液中的外体中。外体可以是可包含蛋白质和RNA的30-90nm的囊泡。RNA,包括例如微小RNA,可一起包装在蛋白质复合物中。在一个实施方案中,提供了一种用于确定转录物是共定位于外体中还是蛋白质复合物中的方法。
在一个实施方案中,以保护感兴趣的外体或蛋白质复合物的方式,例如通过与甲醛交联,处理血浆或血浆的衍生物,然后将血浆分成多个空间上分离的分区。在分区内可破坏外体,可消化蛋白质,并且可进行PCR反应(与逆转录结合)(如,ddPCR)。PCR反应可扩增至少2、3、4、5、6、7、8、9、10种或更多的靶核酸序列。如果靶核酸序列共定位于同一分区,那么靶序列转录可在同一蛋白质复合物中。在另一实施方案中,进行对照实验,其中样品没有经过保护外体或蛋白质复合物的过程。在一个实施方案中,外体的裂解(断裂)可通过温度调节来完成。在另一实施方案中,外体的裂解(断裂)可通过在携带外体或蛋白质复合物断裂剂的分区中释放内部乳液来完成。
在另一实施方案中,提供了一种确定两种或多种无细胞DNA物质的共定位的方法。无细胞DNA分子可在血液或血浆样品中聚集。可将含有聚集的无细胞DNA分子的样品分成空间上分离的区域,可破坏聚集,可进行两种或多种不同无细胞DNA分子的扩增,并且可对分区进行分析以确定无细胞DNA分子是否在相同或不同分区中。
本文提供的方法允许确定特定的RNA、DNA或蛋白质靶标是否一起在血浆中移动。附加的荧光通道可允许两种或多种(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多种)靶标的同时共定位测量。例如,使用具有三种不同荧光团的探针可确定在三个靶核酸序列间的共定位频率。
检测靶序列的缺失
提供了一种用于通过共定位获得连接信息的方法。该方法可用来确定是否存在靶核酸序列的缺失,或用于CNV拷贝的单元型分析。在拷贝数变异区域,标记序列(例如用VIC标记探针检测)可在靶序列(例如用FAM标记探针检测)之外,但靠近靶序列。可将包含核酸的样品分区成多个空间上分离的区域,且可检测标记核酸序列和靶核酸序列(例如,通过扩增和用探针检测)。如图49中所示,可分析VIC(标记序列)和FAM(靶序列)的共定位。如果VIC和FAM总是共定位于分区中,那么很可能没有靶序列的缺失(图49B)。如果存在只含有不与FAM共定位的VIC的分区,那么该结果提示靶序列的缺失(图49A)。
已消化的核酸的储存
已消化的核酸(如,DNA)的储存时间长度可影响拷贝数变异测量值。延长存储可引起估计的拷贝数的减少。例如,延长存储可导致核酸降解。已消化的核酸样品的储存时间长度可以是大约,或小于约,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100小时。已消化的核酸样品的储存时间长度可以是大约,或小于约,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100天。已消化的核酸样品的储存时间长度可以是大约,或小于约,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100年。
图20A和图20B图示了储存的、已消化的DNA的MRGPRX1CNV值的漂移。图20A中,已消化的样品显示CNV值始终低于整数。图20B中,CNV值更接近于整数(参见实施例20)。
在一个实施方案中,已消化的DNA在4℃长时间储存会影响CN估计的质量(例如,随着时间的推移,拷贝数估计值会变得更小,例如,估计CNV为6.0的含有靶序列的样品,如果在4℃储存3周,可得到5.7的CNV)。
核酸样品(例如,已消化的核酸样品)的储存温度可以是大约或小于约4、0、-10、-20、-30、-40、-50、-60、-70、-80、-90、-100、-110、-120、-130、-140、-150、-160、-170、-180、-190或-200℃。
在一个实施方案中,已消化的DNA可储存在缓冲溶液(例如,10mMtris,pH8.0)中。
核酸长度对CNV分析的影响
样品中长核酸的存在可影响拷贝数变异数值,即使靶核酸序列不相连(例如,若它们在不同染色体上)。通过例如限制酶切消化、热处理、剪切、超声处理、过滤等使样品中的核酸大小减小,可以改善拷贝数变异实验的结果。核酸长度的减小还可提高靶序列对于PCR的可及性。
在高核酸负载时,核酸长度的减小可用于确保小滴数字PCR实验中一致的小滴形成。在具有长核酸的高核酸负载下,会减少或阻止小滴的形成,从而可产生细流。可通过例如超声处理、热处理、限制酶消化、过滤或剪切来减小核酸长度。
小滴数字PCR可用于测量限制酶的效率和特异性。
本申请出于所有目的通过引用整体并入以下材料:2006年5月9日授予的美国专利7,041,481;2010年7月8日公开的公开号为2010/0173394A1的美国专利申请;和Joseph R.Lakowicz,PRINCIPLES OF FLUORESCENCE SPECTROSCOPY(1999年第二版)。
试剂盒
本文提供了用于实施本发明提供的方法的试剂盒。试剂盒可包含一种或多种限制酶、装置、缓冲液、试剂和使用说明书。试剂盒可包含限制酶、缓冲液、盐和使用说明书。试剂盒可包含一种或多种引物和一种或多种探针。在一个实施方案中,试剂盒包含至少一种限制酶、四种引物和两种探针。在另一实施方案中,试剂盒包含至少一种限制酶、至少四种引物和至少一种探针。在另一实施方案中,试剂盒包含至少一种限制酶、至少四种引物和至少两种探针。
相关技术
本文所述的方法中可以使用常规技术。这些常规技术可见于标准实验室手册,如Genome Analysis:A Laboratory Manual Series(Vols.I-IV),Using Antibodies:A Laboratory Manual,Cells:A LaboratoryManual,PCR Primer:A Laboratory Manual,和Molecular Cloning:ALaboratory Manual(均来自Cold Spring Harbor Laboratory Press);Stryer,L.(1995)Biochemistry(第4版)Freeman,New York;Gait,“Oligonucleotide Synthesis:A Practical Approach”1984,IRL Press,London,Nelson and Cox(2000),Lehninger,(2004)Principles ofBiochemistry第4版,W.H.Freeman Pub.,New York,N.Y.,和Berg等人(2006)Biochemistry,第6版,W.H.Freeman Pub.,New York,N.Y.,全部出于所有目的通过引用整体并入本文。
拷贝数变异可通过多种手段进行检测,例如,荧光原位杂交、比较基因组杂交、阵列比较基因组杂交、使用SNP阵列的虚拟核型分析和下一代测序。例如,在公开号为20090239308的美国专利申请中描述了通过数字PCR确定拷贝数变异的方法。可通过稀释核酸由数字PCR检测拷贝数变异。可通过使用可将单个DNA分子分成单独反应室的纳米流体芯片(数字阵列)(例如,Fluidigm纳米流体芯片),由数字PCR检测拷贝数变异。可通过小滴数字PCR检测拷贝数变异。本文所述的方法可用于确认用一种或多种上述技术进行的拷贝数变异分析的结果。
可用于确定拷贝数变异的下一代测序技术包括,例如,DNA纳米球测序(使用滚环复制将基因组DNA的小片段扩增成DNA纳米球)(例如,Complete Genomics使用的),纳米孔测序(例如,OxfordNanopore Technologies使用的)(Soni G.V.和Meller A.(2007)Clin.Chem.53:1996-2001),离子半导体测序(Ion Torrent Systems)(公开号为20090026082的美国专利申请),SOLiD测序(连接测序;例如,AppliedBiosystems使用的),Illumina(Solexa)测序(使用桥式扩增),454焦磷酸测序(例如,Roche Diagnostics使用的)(Margulies,M.等人2005Nature,437:376-380),真正单分子测序(例如,Helicos使用的)(HarrisT.D.等人(2008)Science320:106-109),或由Pacific Biosciences使用的单分子实时测序(SMRT)。本文所述的方法、组合物和/或试剂盒可用来追踪通过这些方法中的一种方法进行的CNV分析。
范围在本文中可以表示为从“大约”一个特定值,和/或到“大约”另一个特定值。当表示这种范围时,另一实施方案包括从一个特定值和/或到另一特定值。同样,当通过使用先行词“约”将数值表示为近似值时,将理解成该特定值形成了另一实施方案。应当进一步理解,每个范围的端点有关于另一端点以及独立于另一端点都是有意义的。本文所用的术语“约”是指在特定使用环境内规定数值±15%的范围。例如,约10包括从8.5到11.5的范围。
除非另外限定,本文所用的所有技术和科学术语都具有与本发明所属领域普通技术人员通常理解的相同的含义。虽然与本文所述的方法和材料相似或相当的任何方法和材料也可用于本发明的实施或测试中,但现在对代表性示例性方法和材料进行描述。
实施例
实施例1:淀粉酶CNV分析
本文所述的方法可用来确定淀粉酶基因的拷贝数变异。淀粉酶是可以水解多糖的键的酶。组间拷贝数变异提示基于饮食的进化变化。淀粉酶试验产生了对应于不同CNV状态的离散估计值。使用15个Coriell参考DNA样品获得的结果证明了人类该基因拷贝数的高变异性。参见图21。
使用来自Coriell医学研究所的样品。用10U/μg DNA的AluI在37℃消化样品DNA1小时。将约20-100μg已消化的DNA加载到每个ddPCR反应中。一式三份处理每个样品,并且将数据合并得到如图21所示的数值。用于淀粉酶试验的正向引物的序列为5’-TTCTGAGATTTATCTAGAGGCTGGGA-3',反向引物为5'-CCCTGACAGACCGACAAGAC-3',且探针为5'-6FAM-CTGGTTCAGGAGCCCT-MGB-NFQ-3'。将该试验双链体化于(duplexed to)RPP30:正向引物:5'-GATTTGGACCTGCGAGCG-3',反向引物5'-GCGGCTGTCTCCACAAGT-3'及探针5'-VIC-CTGACCTGAAGGCTCT-MGB-NFQ-3'。使用下述热循环条件:95℃10分钟,(94℃30秒+60℃1分钟)55个循环。
实施例2:CCL3L1CNV分析
本文所述的方法可用来确定CCL3L1基因的拷贝数变异。CCL3L1的拷贝数变异已与HIV-1易感性相关,但是由于使用标准qPCR对拷贝数评估的不准确性,这些关联出现不一致。CCL3L基因簇包括5个假基因,它们会使特异性扩增变得困难。基于整数的CNV分析增加了正确定量的信心。Alkan等人((2009)Nat.Genetics.41:1061-1067)发现NA18507具有5.7个CCL3L1拷贝。在此处的分析中,发现了5.94个拷贝,误差棒越过了“6”。参见图22。本文所述的方法提供了特别设计试验以针对基因和特别选择限制酶以释放该基因的能力,同时也切割假基因以降低抬高拷贝数估计的假阳性的可能性。
使用57℃的退火温度可导致一些假基因被扩增,且CNV值比预期值约大1。
对于CCL3L1,将各815ng纯化的人类基因组DNA样品(Coriell)用7.5单位的MseI(NEB)在10μL中在37℃下消化1小时。将上述消化物用TE缓冲液稀释3.5倍达到35μL,然后每20μL ddPCR反应分析69ng(3μL)。经修饰的CCL3L1分析序列19是(正向引物)5'-GGGTCCAGAAATACGTCAGT-3';(反向引物)5'-CATGTTCCCAAGGCTCAG-3';和(探针)6FAM-TTCGAGGCCCAGCGACCTCA-MGBNFQ。将所有CNV试验都用RPP30参考试验双链体化(正向引物)5'-GATTTGGACCTGCGAGCG-3';(反向引物)5'-GCGGCTGTCTCCACAAGT-3';和(探针)VIC-CTGACCTGAAGGCTCT-MGBNFQ。热循环条件为95℃10分钟(1个循环),94℃30秒和60℃60秒(40个循环),98℃10分钟(1个循环),和12℃保持。也参见Sudmant,P.H.;Kitzman,J.O.;Antonacci,F.;Alkan,C.;Malig,M.;Tsalenko,A.;Sampas,N.;Bruhn,L.;Shendure,J.;Eichler,E.E.Science2010,330,641–646。
实施例3:MRGPRX1CNV分析
本文所述的方法可用来确定MRGPRX1基因的拷贝数变异。与Mas相关的G蛋白偶联受体成员X1是由MRGPRX1基因编码的人类蛋白质。MRGPRX1是与痒和痛觉有关的感觉神经元特异性受体。据认为MRGPRX1蛋白质参与阻断疼痛,因此它的缺失与慢性疼痛有关。图23A和图23B图示了MRGPRX1基因的拷贝数变异。
对于MRGPRX1,各4.4μg纯化的人类基因组DNA样品(Coriell)用10单位的RsaI(NEB)在50μL中在37℃消化1小时。将消化物用TE缓冲液(pH8.0)稀释8倍到400μL,然后每20μL ddPCR反应分析33ng(3μL)。MRGPRX1分析序列是(正向引物)5′-TTAAGCTTCATCAGTATCCCCCA-3′,(反向引物)5′-CAAAGTAGGAAAACATCATCACAGGA-3′,和(探针)6FAM-ACCATCTCTAAAATCCT-MGBNFQ。将CNV试验用RPP30参考试验双链体化(正向引物)5′-GATTTGGACCTGCGAGCG-3′,(反向引物)5′-GCGGCTGTCTCCACAAGT-3′,和(探针)VIC-CTGACCTGAAGGCTCT-MGBNFQ。热循环条件为95℃×10分钟(1个循环),94℃×30秒和60℃×60秒(40个循环),98℃×10分钟(1个循环),和12℃保持(也参见Hindson B等人(2011)Anal.Chem.83:8604-8610)。
实施例4:CYP2D6CNV分析
本文所述的方法可以用来确定CYP2D6基因的拷贝数变异。细胞色素P4502D6(CYP2D6),即细胞色素P450混合功能氧化酶体系的一个成员,参与体内生物异源物质的代谢。CYP2D6的拷贝数与代谢药物有关。CYP2D6功能过低至无功能会导致药物代谢不良。高水平的CYP2D6功能会导致大量的药物代谢。CYP2D6基因的多个拷贝可以表达并导致高于正常水平的CYP2D6功能(超速代谢型)。图24A和图24B图示了CYP2D6的拷贝数变异。
对于CYP2D6,各4.4μg纯化的人类基因组DNA样品(Coriell)用10单位的RsaI(NEB)在50μL中37℃消化1小时。将消化物用TE缓冲液(pH8.0)稀释8倍到400μL,然后每20μL ddPCR反应分析33ng(3μL)。购买CYPD2D6(Hs00010001_cn)作为20×引物预混合物和FAM-MGBNFQ探针(Applied Biosystems)。将CNV试验用RPP30参考试验双链体化(正向引物)5′-GATTTGGACCTGCGAGCG-3′,(反向引物)5′-GCGGCTGTCTCCACAAGT-3′,和(探针)VIC-CTGACCTGAAGGCTCT-MGBNFQ。热循环条件为95℃×10分钟(1个循环),94℃×30秒和60℃×60秒(40个循环),98℃×10分钟(1个循环),和12℃保持。(也参见Hindson B等人(2011)Anal.Chem.83:8604-8610)。
实施例5:脊髓性肌萎缩CNV分析
脊髓性肌萎缩(SMA)可能是由脊髓区域的运动神经元损失引起的,该运动神经元损失归因于生存运动神经元蛋白的低含量,该运动神经元蛋白由SMN1和SMN2编码。SMN1和SMN2经历缺失和扩增。除了一个核苷酸之外,这些基因是相同的,而这个核苷酸降低了由SMN2转录的全长转录物的水平。SMA可能是由SMN1拷贝的损失引起的。疾病严重度可能与SMN2补偿SMN1损失的程度相关。可以设计试验用于等位基因特异性基因检测和区别(例如,包括ddPCR)。
遗传可以是常染色体隐性的。出生人数的1/6,000可能受到SMA的影响;1/40的人是缺陷SMN1的携带者。0和1型可导致2岁前死亡。2-4型可导致2岁后发病(重度至轻度的无力)。
图25和图26图示了用简单梯度板确定的最佳共同退火温度。图27图示了SM1和SMN2的拷贝数。
独立双链体(SMN1/Her2和SMN2/Tert)可用来确定SMN1和SMN2的拷贝数。来自双链体的SMN1/SMN2拷贝的比值可用来确认测定的拷贝数的值。可通过三角测量法进行验证(例如,参见图28中的上方示意图)。三角测量法可意味着可通过使用两种不同的参照物评估CNV来验证靶序列的CNV。例如,可通过使两种不同的参照物一起形成双链体来测定它们的比值(CNV),从而避免使用不含预期的两个拷贝/二倍体基因组的参照物来估计CNV的可能性。在确定CNV的过程中可评估三种不同靶序列的拷贝数,从而使得CNV估计中产生错误的可能性大大降低。
对于该实验,使用用Her2(FAM)试验双链体化的SMN1(VIC)来评估SMN1的拷贝数。用CviQI消化约50ng/试验的DNA。执行标准PCR方案。使用用与试验双链体化的SMN2(FAM)来确定SMN2的拷贝数,从而检测TERT(VIC)。SMN1/SMN2的比值是通过进行SMN1(VIC)和SMN2(FAM)的双链体化来确定的。使用大致50ng/试验,用CviQI消化DNA。热循环条件为95℃10分钟(1个循环),94℃30秒和60℃60秒(40个循环),98℃10分钟(1个循环),和12℃保持。
图28图示了SMN1和SMN2的拷贝数变异。
通过使用相同的引物对并改变探针,可进行SMN基因的检测。常用引物对为正向引物:5'-ATAGCTATTTTTTTTAACTTCCTTTATTTTCC-3';反向引物5'-TGAGCACCTTCCTTCTTTTTGA-3'。SMN1探针序列是:5'-VIC-TTGTCTGAAACCCTG-MGB-NFQ-3',而SMN2探针序列是:5'-6FAM-TTTTGTCTAAAACCC-3'。Tert参考基因的正向引物是5'-GGCACACGTGGCTTTTCG-3';反向引物是5'-GGTGAACCTCGTAAGTTTATGCAA-3'。探针是5'-VIC-TCAGGACGTCGAGTGGACACGGTG-MGB-NFQ-3'。Her2分析序列是正向引物5'-CCCTGAGCAAAGAGTCACAGATAAA-3',反向引物5'-TGCCAGGGTCTGAGTCTCT-3',探针:5'-6FAM-ACTGCGTTTGTCCTGG-MGB-NFQ-3'。
实施例6:Her2CNV分析
30%的乳腺癌具有Her2扩增。Her2+癌是极富侵袭性的,但可对赫塞汀有响应。对HER2水平进行了广泛测试,但是现有技术存在许多缺点。Her2,又称为ERBB2,距GRB720KB,GRB7在数种癌症中也经常过度表达。针对两个临床相关基因的试验可以验证每个拷贝数的测定结果。不出所料,一个样品只对Her2扩增,而另一个展示出镶嵌现象。参见图29。
从每个正常和肿瘤乳腺组织样品(D8235086-1,Biochain)纯化的DNA(20ng)用0.2单位的NlaIII在10μL中37℃消化1小时。将限制酶切的DNA以每20μL ddPCR反应8.8ng(4.4μL)直接加入到ddPCR主混合物中。ERBB2(Hs02803918_cn)和GRB7(Hs02139994_cn)分析作为20×引物的预混合物和FAM-MGBNFQ探针(AppliedBiosystems)购买,并用上述的RPP30参考试验双链体化。热循环条件为95℃×10分钟(1个循环),94℃×30秒和60℃×60秒(40个循环),98℃×10分钟(1个循环),和12℃保持(也参见Hindson B等人(2011)Anal.Chem.83:8604-8610)。
实施例7:连锁分析
如果对于消化后的特定分析,靶核酸序列的拷贝数(CN)是2.0,那么不确定是(A)在一条染色体上存在2个靶序列拷贝,而另一条上为0个;还是(B)在两条不同染色体的每一条上有1个靶核酸序列拷贝。用未消化的DNA进行的试验可用来分辨这两种可能。使用未消化的DNA,原则上,如果排列是(A)(两个靶核酸序列拷贝在一条染色体上),那么应该获得的CN值是1,如果排列是(B)(两条不同染色体的每一条上有一个拷贝),那么CN值为2。因为样品中的DNA可能是断裂的,所以结果可能不准确——(A)可能得到CN高于1.0的读数,但可能显著小于2.0;(B)应该精确地得到2.0。
起始材料的更高断裂会使得(A)中的CN读数更接近2.0。作为一个例子,对于给定的试验,预测连接的拷贝相距约10kb,并且基于我们的断裂分析,10kb区段的30%是断裂的。在这种情况下,情形(A)应该产生1.3的读数,而情形(B)应该产生2.0的读数。
实施例8:连锁分析
如果消化后的CN读数是3.0,那么不确定是(A)在一条染色体上存在3个拷贝,而另一条上有0个拷贝;还是(B)一条上有2个拷贝,而另一条上有1个拷贝。如果对未消化的DNA进行相同的试验,并且如上假设相距10kb和30%断裂的相同参数,那么情形(A)会得到1.6个拷贝(=0.7*0.3*2+0.7*0.3*1+0.3*0.7*2+0.3*0.3*3)的读数,而(B)会得到2.3个拷贝的读数。
对于数字PCR-实时杂合形式(例如,Life’s Biotrove阵列),可尝试从未消化的DNA中提取额外的连接信息。例如,通过分析每个分区内的实时曲线,可以估计有多少分区含有两个、三个等靶序列拷贝。
可以检查终点荧光,来确定含有两个靶核酸序列拷贝的区段是否比含有一个靶核酸序列拷贝的区段具有更高的振幅。在情形(A)下,应该有较少的阳性值,但是这些阳性值应该平均具有更高的荧光。
可以调整循环数来获得最佳的分离(例如,通过使得携带一个拷贝的区段不能到达终点)。
实施例9:确认ddPCR可用于对CNV=2的样品进行单元型分析(例如,区分顺式和反式构型的基因拷贝)
染色体单元型分析的策略是1)比较已消化样品和未消化样品的CNV(例如使用ddPCR);2)当小滴经历指数扩增时(在任何试剂变为限制性的之前—这可能在PCR后期循环中发生),检测其平均荧光强度;和3)进行长片段PCR以检测相同染色体上(顺式构型)两个基因(或靶序列)拷贝的存在,或者,如果基因(或靶序列,或重复区域)过长,那么检查另一条染色体以确认目标基因(或靶序列)的缺失(例如,跨越缺失部分的PCR应该工作,但是基因(或靶序列)在适当位置的PCR却不会工作,因为引物之间的距离太大)。
总方案指南
1)ddPCR:将限制酶消化的样品与未消化的样品进行比较,检查结果发现,在具有顺式构型拷贝的样品中,对于未消化的样品来说估计的CNV显著下降。DNA可包含在泊松统计的最有效点(sweet spot)中(在该点,泊松校正因子有最小的统计误差)。对于20,000个小滴,最有效点可以是~1.6cpd(cpd:每个小滴的拷贝数)。
2)基于荧光的确认:在适当的一个循环或多个循环时(可凭经验确定,且根据试验效率每个试验可不同),可以检查含有顺式构型样品的小滴的平均强度是否高于含有反式构型样品的小滴的平均强度,如果在相同小滴中含有两个相连的拷贝则会发生这种情况。对于该实验,可以使用低cpd。可以以0.1cpd为目标以使两个不相连的拷贝存在于同一小滴中的可能性最小化。使用良好的光学仪器,可以观察到荧光强度的条带(含有两个拷贝的小滴应该比仅含有一个拷贝的小滴明亮两倍)。可在例如约第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50次循环时检测荧光。可在多于一次循环时检测荧光。例如,可在2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50次不同的循环时检测荧光。例如,可在第25、28、31和40次循环时测定荧光。
3)通过长片段PCR对连接的确认。通常,CNV中扩增区域的大小可能太大而不允许两个串联定位的基因(或靶序列)的PCR扩增;因此,可能较容易检测基因(或靶序列)缺失而不是两个并排的靶序列拷贝的存在。对于该分析,可选择处于疑似被扩增的区域之外的彼此相对的引物。可以使用长片段聚合酶。可使用适当长度的延伸时间(注意时间太长或太短都会导致反应失败)进行PCR。该长片段PCR可整体进行或在小滴中进行。
图30图示了6个样品的拷贝数估计,每个用限制酶切割和不切割。数据提示样品4和5有两个靶序列连接在同一染色体上,而其它样品在两条染色体上各含有一个靶序列。
样品D1234090(结肠)、D1234106(食道)和D1234152(肺)来自BioChain Institute Inc。样品NA18853、NA19108和NA18507来自Coriell医学研究所。Coriell的样品包含B-淋巴细胞DNA。
每微克DNA使用约10U的RsaI,并且在37℃下持续消化1小时。在40个循环后用小滴读取器读取小滴的荧光。
MRGPRX1分析序列可为(正向引物)5′-TTAAGCTTCATCAGTATCCCCCA-3′;(反向引物)5′-CAAAGTAGGAAAACATCATCACAGGA-3′;和(探针)6FAM-ACCATCTCTAAAATCCT-MGBNFQ。CNV试验可用RPP30参考试验双链体化(正向引物)5′-GATTTGGACCTGCGAGCG-3′,(反向引物)5′-GCGGCTGTCTCCACAAGT-3′,和(探针)VIC-CTGACCTGAAGGCTCT-MGBNFQ。热循环条件可以是95℃×10分钟(1个循环),94℃×30秒和60℃×60秒(40个循环),98℃×10分钟(1个循环),和12℃保持(也参见Hindson B等人(2011)Anal.Chem.83:8604-8610)。
图31图示了在25个循环后,ddPCR实验中对MRGPRX1和RPP30的荧光强度的分析。事件数指的是小滴计数。
图32图示了在第25次循环时,ddPCR实验中4个样品的一式三份测量的平均荧光。疑似在一条染色体上具有两个靶序列而在另一条上具有0个靶序列的样品(NA18853和NA19108)比疑似在一条染色体上具有一个靶序列拷贝的样品(反式构型)(NA18507和D1234106)具有更强的荧光。
图33图示了在28次循环后,ddPCR实验中对MRGPRX1和RPP30荧光强度的分析。
图34图示了ddPCR浓度和拷贝数变异的比较。在样品NA18853和NA19108中,在第28次循环时观察到未切割的样品的CNV下降。示出了VIC(RPP30)浓度、FAM(MRGPRX1)浓度和MRGPRX1拷贝数的信号。
图35图示了在28次循环后,ddPCR实验中4个样品的一式三份测量的平均荧光。疑似在一条染色体上具有两个靶序列而在另一条上具有0个靶序列的样品(18853和19108)比疑似在两条染色体中的每一条上具有一个靶序列拷贝的样品(反式构型)(18507和BC106)具有更强的荧光。
图36图示了在31、34和40次循环后,ddPCR实验中4个样品的一式三份测量的平均荧光。在第31次循环时,而不是在第34或40次循环时,疑似在一条染色体上具有两个靶序列而在另一条上具有0个靶序列的样品(NA18853和NA19108)比疑似在两条染色体中的每一条上具有一个靶序列拷贝的样品(反式构型)(NA18507和D1234106)具有更强的荧光。
总之,ddPCR实验支持了这样的观点,即样品18853和19108在单一染色体上具有两个相连的MRGPRX1的拷贝。
还进行了长片段PCR实验来支持从小滴数字PCR实验中得到的有关靶序列连接的发现。CN=1的样品可作为缺失区域扩增的对照。
图37图示了用于长片段PCR实验的实验设置。对于情形A和B,预计长片段PCR会失败,因为引物之间的距离太大。然而,对于含有具有MRGPRX1缺失的染色体的情形C,PCR应该会成功。箭头指示引物。
图38图示了长片段PCR实验的生物分析仪图像,该实验利用6个样品通过ddPCR来确认连接(设置示意图参见图39)。每个泳道中在约1500处的条带是MRGPRX1PCR产物(MRGPRX1序列的内部引物)。引物也设计为在MRGPRX1序列外部退火。样品11994和18573具有拷贝数1:一条染色体含有一个MRGPRX1拷贝,而另一条含有缺失。3000和1500之间的PCR产物可能来自于从具有缺失的染色体的扩增。样品19239和18507在不同染色体上具有两个MRGPRX1拷贝。这些样品在3000到1500之间没有条带,这可能是因为MRGPRX1基因的存在使得PCR太长而不能生成产物(25KB)。样品19108和18553在相同染色体和具有MRGPRX1缺失的染色体上具有两个MRGPRX1拷贝。3000和1500之间的PCR产物可能来自从具有缺失的染色体的扩增。这些数据确认了小滴数字PCR实验的结果。
图39图示了6个样品的长片段PCR结果和MRGPRX1拷贝数结果。顶端的示意图图示了PCR引物的位置和PCR产物的预期长度。样品S1和S2在一条染色体上具有一个MRGPRX1拷贝,而在另一条上具有缺失。引物在MRGPRX1基因的内部并且可以产生约1.6kb的产物。引物还在MRGPRX1基因的外部退火。样品S3和S4有两个反式的MRGPRX1拷贝(在不同的染色体上)。来自最外层引物的PCR产物估计约为24kb。样品S5和S6在一条染色体上具有两个MRGPRX1拷贝,而在另一条染色体上具有MRGPRX1缺失。使用具有缺失的染色体上的最外层引物产生的PCR产物的长度约为2.7kb。在PCR设置示意图的下方是长片段PCR结果的图示。所有样品都含有PCR产物,该产物相当于在1.6kb由内部MRGPRX1引物得到的产物。样品S1、S2、S5和S6具有从具有染色体缺失的样品得到的约2.7kb的PCR产物。样品S3和S4不具有约2.7kb的PCR产物。使用包含一个或两个MRGPRX1拷贝的染色体上最外层引物的PCR,由于引物之间的距离而失败。在长片段PCR图示下方是在使用或不使用限制酶消化的情况下通过ddPCR确定的MRGPRX1拷贝数的图示(RE=限制酶消化;ND=未消化)。估计样品S1和S2具有1个MRGPRX1拷贝,无论样品是否用限制酶消化。估计样品S3和S4具有约2个MRGPRX1拷贝,不论样品是否被消化。如果样品被消化,那么估计样品S5和S6具有约2个MRGPRX1拷贝,但是如果样品未被消化,那么小于两个拷贝。在S5和S6中,拷贝数估计的差异取决于样品是否被消化,这提示两个MRGPRX1拷贝在同一染色体上。
长片段PCR的方案如下:用下面的热循环条件来使用AgilentPfuUltraII Fusion HS DNA聚合酶:2分钟95℃(1个循环),20秒95℃,20秒60℃,75秒72℃(40个循环),3分钟72℃(1个循环)。在50μL反应体积中包括200nM的引物、250uM的dNTPs、100ng的DNA、1uL PfuUltraII fusion HS DNA聚合酶、Agilent提供的1X主混合物。正向引物的序列为5’-GATCTAGCTAAGAGACAGAGATAGACACATG-3’,反向引物的序列为5’-cagtatttttgcactgctttcctcat-3’。
图40图示了与具有估计的拷贝数的已消化样品的百分比差异。
实施例10:用于确定断裂的算法
在该实施例中,分析了两种不同类型的靶核酸。一种利用FAM探针进行检测,一种利用VIC进行检测。假设两个靶核酸序列在同一多核苷酸上。在一个样品中,可以存在三种类型的DNA片段:1)连在一起的Fam-Vic(未断裂),2)Fam片段,和3)Vic片段。观察到一些可能性(在FAM-VIC交会图中的计数),并且目的是推断浓度。首先完成正向。给定浓度,计算计数。然后进行反向,尝试不同的浓度值,并选择给出实际计数的一个。
N=20000;
A=10000;
B=20000;
AB=10000;%连接起来
cA=A/N;
cB=B/N;
cAB=AB/N;
fprintf(1,'%f%f%f\n',cAB,cA,cB);
pA=1-exp(-cA);
pB=1-exp(-cB);
pAB=1-exp(-cAB);
%在交会图中A是X且B是Y
p(2,1)=(1-pA)*(1-pB)*(1-pAB);%左下
p(2,2)=pA*(1-pB)*(1-pAB);%右下
p(1,1)=(1-pA)*pB*(1-pAB);%左上
p(1,2)=1-p(2,1)-p(2,2)-p(1,1);%右上
disp(round(p*N));
%也直接计算边际值(marginals)
cAorAB=(A+AB)/N;%=c_A+c_AB;
cBorAB=(B+AB)/N;%=c_B+c_AB;
pAorAB=1-exp(-cAorAB);%也可由p计算
pBorAB=1-exp(-cBorAB);
%反向
H=p*N;%我们得到一些命中(hits)
%H=[08000;20000];
%计算prob
estN=sum(H(:));
i_p=H/estN;
i_pAorAB=i_p(1,2)+i_p(2,2);
i_pBorAB=i_p(1,1)+i_p(1,2);
i_cAorAB=-log(1-i_pAorAB);
i_cBorAB=-log(1-i_pBorAB);
maxVal=min(i_cAorAB,i_cBorAB);
delta=maxVal/1000;
errArr=[];
gcABArr=[];
对于gcAB=0:delta:maxVal
gcA=i_cAorAB–gcAB;
gcB=i_cBorAB–gcAB;
gpA=1-exp(-gcA);
gpB=1-exp(-gcB);
gpAB=1-exp(-gcAB);
gp(2,1)=(1-gpA)*(1-gpB)*(1-gpAB);%左下
gp(2,2)=gpA*(1-gpB)*(1-gpAB);%右下
gp(1,1)=(1-gpA)*gpB*(1-gpAB);%左上
gp(1,2)=1-gp(2,1)-gp(2,2)-gp(1,1);%右上
gH=gp*estN;
err=sqrt(sum((H(:)-gH(:)).^2));
errArr=[errArr;err];
gcABArr=[gcABArr;gcAB];
end
figure,plot(gcABArr,errArr);
minidx=find(errArr==min(errArr(:)));
minidx=minidx(1);
estAB=gcABArr(minidx);
estA=i_cAorAB–estAB;
estB=i_cBorAB–estAB;
fprintf(1,'%f%f%f\n',estAB,estA,estB);
gpA=1-exp(-estA);
gpB=1-exp(-estB);
gpAB=1-exp(-estAB);
gp(2,1)=(1-gpA)*(1-gpB)*(1-gpAB);%左下
gp(2,2)=gpA*(1-gpB)*(1-gpAB);%右下
gp(1,1)=(1-gpA)*gpB*(1-gpAB);%左上
gp(1,2)=1-gp(2,1)-gp(2,2)-gp(1,1);%右上
gH=gp*estN;
disp(round(gH));
%使用模拟确认结果
numMolA=round(estA*estN);
numMolB=round(estB*estN);
numMolAB=round(estAB*estN);
A=unique(randsample(estN,numMolA,1));
B=unique(randsample(estN,numMolB,1));
AB=unique(randsample(estN,numMolAB,1));
U=1:estN;
notA=setdiff(U,A);
notB=setdiff(U,B);
notAB=setdiff(U,AB)
AorBorAB=union(A,union(B,AB));
none=setdiff(U,AorBorAB);
simcount(2,1)=length(none);
simcount(2,2)=length(intersect(A,intersect(notB,notAB)));
simcount(1,1)=length(intersect(B,intersect(notA,notAB)));
simcount(1,2)=length(AorBorAB)-simcount(2,2)-simcount(1,1);
disp(simcount);
实施例11:里程碑试验分析—断裂概率
问题陈述
如果两个不同的基因座位于不同的分子上,那么可能存在两种物质(对应于FAM和VIC探针)。如果不同的基因座位于同一分子上,那么可能存在三种物质—断裂的FAM、断裂的VIC和连接的FAM-VIC。(参见图411。
由于存在两种染料,所以可能存在不明确性。需要计算所有三种物质的浓度。
算法:获得FAM和VIC计数的2x2表格。犹如存在一种物质一样,计算断裂的FAM和连接的FAM-VIC的浓度。犹如存在一种物质一样,计算断裂的VIC和连接的FAM-VIC的浓度。试用不同浓度的连接的FAM-VIC(从中可以得出断裂的FAM和VIC的浓度),并且找到概率表与观察到的计数的最佳拟合:
FAM- FAM+
VIC+ (1-f)V(1-c) 1一其它的总和
VIC- (1-f)(1-V)(1-c) f(1-V)(1-c)
断裂概率(%)
1k未切割 6 6
10K未切割 29.4 29.8 29.5
100K未切割 98.7 97.7 99.9
1K注射器 11-4 11-1 11
10K注射器 87.2 89.9 91.7
100K注射器 100 100 100
1K Hae III 100 100 100
接下来的步骤可包括观察是否可容易地推导出闭公式和/或与OTools集成。
实施例12:断裂分析
使用ddPCR,可进行针对两个基因组基因座例如在共同染色体上的两个基因的双重反应。根据小滴的荧光,可将小滴分成四个群体(FAM+/VIC+、FAM+/VIC-、FAM-/VIC+和FAM-/VIC-1。通过比较这些群体的小滴数,可能确定靶序列共同分离至同一小滴中的频率。使用泊松统计学,可以估计与两个分离的拷贝恰巧在同一小滴中的情况相比,彼此实际相连的种类的百分比。
设计试验,其中基因座与共同的参照物(RPP30)相距1K、3K、10K、33K和100K。已经进行了两个基因座相距1K、10K和100K的研究。通过用这三种双链体(或仅一种双链体)处理未切割(未经限制酶消化)的DNA,并且计数四种不同的小滴群体,可使用统计分析来评估遗传物质的断裂状态。这些数据可用来帮助解释为什么拷贝数变异研究中的95%置信界限不总是跨越整数值。
实施例13:用于DNA断裂计算或用于数字PCR多路复用的算法
靶序列之间的完全断裂
两个DNA靶序列T1和T2分别对应于两种染料FAM和VIC。在该实施例中,T1和T2总是在单独的DNA片段上。具有T1和T2靶序列的DNA片段数分别是M1和M2。参见图42A。
在具有多个分区的数字PCR实验中,FAM和VIC阳性分区的计数分别为N1和N2。N1和N2将分别小于M1和M2,因为在分区中可能存在多个DNA片段。分区总数为N。预计的分区计数在表2中示出。
表2.分区计数
VIC阴性 VIC阳性 总计
FAM阳性 N1*(N-N2)/N N1*N2/N N1
FAM阴性 (N-N1)*(N-N2)/N (N-N1)*N2/N N-N1
总计 N-N2 N2 N
如果将观察到FAM阳性分区的概率表示为p1=N1/N,并且将观察到VIC阳性分区的概率表示为p2=N2/N,那么相应的概率表为表3。
表3.概率表
VIC阴性 VIC阳性 概率
FAM阳性 p1*(1-p2) p1*p2 p1
FAM阴性 (1-p1)*(1-p2) (1-p1)*p2 1-p1
总计 1-p2 P2 1
在这种情况下,T1和T2之间存在100%的断裂。
可分别如下计算T1和T2分子的数目M1和M2:
M1=-N log(1-p1)
M2=-N log(1-p2)
(如果N个数字分区中P个为阳性,那么分子数为M=-Nlog(1-P/N))
靶序列之间没有断裂
如果T1和T2总是在同一DNA片段上,那么它们是相连的(可能由于它们的基因座在染色体的相同部分上彼此距离很近,并且限制酶消化不在T1和T2之间进行消化)。参见图42B。因此,N1=N2。
表4.分区计数
VIC阴性 VIC阳性 总计
FAM阳性 0 N1 N1
FAM阴性 N-N1 0 N-N1
总计 N-N1 N1 N
表5概率表
VIC阴性 VIC阳性 概率
FAM阳性 0 p1 p1
FAM阴性 1-p1 0 1-p1
总计 1-p1 p1 1
在这种情况下,存在0%的断裂。
可如下计算T1和T2分子的数目,其中p1=N1/N:
M1=-N log(1-p1)
M2=-N log(1-p1)
部分断裂
在中间情况下,T1和T2在一些片段上连接,但有时也恰巧在单独的片段上。参见图42C。
如果存在M3个连接的T1和T2片段的分子、M1个单独T1片段分子和M2个单独T2片段分子,那么可制成以下分区计数表:
表6.分区计数
VIC阴性 VIC阳性 总计
FAM阳性 N01 N11 N1
FAM阴性 N00 N10 N-N1
总计 N-N2 N2 N
如果M1=M2=M3,那么存在50%的断裂,因为50%的相连的分子断裂成单独的片段,而其余50%保持完整。
实施例14:用里程碑试验评估血浆中的DNA质量
似乎在具有较高DNA产率的样品中,额外的DNA的大小显著较大。如图43所示,当DNA产率在2kGE(基因组当量)/ml左右时,约半数DNA的大小小于1Kb;当产率极高(10kGE/ml或更高)时,90%的DNA大于1Kb。这提示小DNA的浓度相对恒定。这进一步提示较高的DNA产率是由于细胞DNA的污染。
实施例15:血浆中的大DNA的污染影响CNV值
大尺寸DNA污染会抑制测量的CNV值。顶部的图(图44)显示了测量的CNV值与DNA大小之间的良好相关性。通过对DNA进行预处理,可以大大消除这种大小影响(底部的图,菱形)。初步的数据已显示,在CNV测量之前适当的DNA断裂,使得在不同物质之间测量的CNV值是相同的(此处数据未示出)。
实施例16:用于CNV分析的限制酶滴定
在测试试验中,可对限制酶(RE)进行滴定来确定它们在CNV分析中的应用。分析了17种限制酶(主要是4-切割酶)。参见图45。限制酶浓度包含4倍稀释系列:20、5、1.25、0.31、0.08、0.02和0.005U/μg DNA;未消化的对照+缓冲液;每个浓度4个重复的ddPCR;DNA输入:0.5cpd。在低至0.02U/μg DNA的浓度下,可达到有效/完全的限制酶切消化。有效的RE浓度范围可随着靶序列和酶而变化。对于大部分限制酶来说,5U/μg DNA似乎能给出最高ddPCR浓度,从而允许用于CNV分析的更加普遍的消化方案。测试的所有17种限制酶在20U RE/μgDNA浓度下都未观察到非特异性RE活性。参见图46。
实施例17:用于优化具有挑战性的ddPCR CNV试验的方案的开发
使用温度梯度可允许确定最佳退火温度。使用GC添加剂可以减少二级结构,该二级结构会以其它方式阻断聚合酶活性或导致竞争性非特异性扩增产物的形成。添加剂的实例是富含GC的增强子溶液(5X)(Roche)。参见图47。
实施例18:用ddPCR测定限制酶的活性
Alu I和Mse I在宽浓度范围上可接受地运行。在应该发生完全切割的酶浓度下,仍有少量的残存靶序列。NEB和Fermentas酶都表现良好,但是Fermentas酶稍微更加有效。Fermentas酶具有易于使用的优点。
图48的左区显示了使用从NEW购买的Alu I和Fermentas的试验。该试验中所用的引物可以是:正向引物5'-GGCCCTCATCCACCATAACAC-3',反向引物5'-GGCCCTCATCCACCATAACAC-3'。探针可以是5'-6FAM-TCCGAAAGAGCTGGTC-MGB-NFQ-3';Alu I切割该扩增子序列两次。图48的右区显示了使用Mse I的试验。该试验中所用的引物可以是:5'-CTCCCTCTCCATAGCTACTTAAGGA-3',反向引物5'-CAAGGAGCCCTAACCAATGGA-3',而探针可以是5'-6FAM-AAGGCAGAGATTAAAG-MGB-NFQ-3'。Mse I切割该扩增子序列两次。如图48中所示,用Alu I或MseI切割参考基因。在该实验中,对加入到样品中的RE的量进行滴定。当RE以高水平存在时,其应该消化该实验设计用于扩增的靶序列。随着靶序列被消化,阳性小滴数减少。如果靶序列被消化,那么很少有或没有阳性小滴出现。参见图48。
实施例19:通过共定位的单元型分析
提供了一种通过共定位获取单元型分析信息的方法。该方法可用来确定是否存在靶核酸序列的缺失。在拷贝数变异区域中,标记序列(例如,用VIC标记的探针检测的)可在靶序列(如,用FAM标记的探针检测的)外部但要在其附近。可将包含核酸的样品分成多个空间上分离的区域,并且可检测标记序列和靶核酸序列(例如,通过扩增和用探针检测)。如图49中所示,可对VIC(标记序列)和FAM(靶序列)的共定位进行分析。如果VIC和FAM总是共定位于分区中,那么很可能不存在靶序列的缺失(图49B)。如果存在只含有不与FAM共定位的VIC的分区,那么该结果提示靶序列的缺失(图49A)。
实施例20:DNA样品的储存
图20A和图20B图示了储存的已消化的DNA的MRGPRX1CNV值的漂移。在图20A中,已消化的样品显示始终在整数以下的CNV值。在图20B中,CNV值更接近整数。分析的样品包括Coriell纯化的DNA样品:NA11994、NA18507、NA18502、NA19221、NA19205、NA18916和NA19108。图20A中显示的样品与图20B中的样品在不同的日期进行分析。简言之,使用RsaI来消化样品,使用标准ddPCR热循环条件:95℃10分钟(1个循环),94℃30秒和60℃1分钟(40个循环),98℃10分钟(1个循环),12℃保持。
MRGPRX1分析序列为(正向引物)5′-TTAAGCTTCATCAGTATCCCCCA-3′,(反向引物)5′-CAAAGTAGGAAAACATCATCACAGGA-3′,和(探针)6FAM-ACCATCTCTAAAATCCT-MGBNFQ。将样品双链体化于RRP30(VIC标记的);RPP30参考试验:(正向引物)5′-GATTTGGACCTGCGAGCG-3′,(反向引物)5′-GCGGCTGTCTCCACAAGT-3′,和(探针)VIC-CTGACCTGAAGGCTCT-MGBNFQ。立即(在消化的24小时内)处理DNA。
虽然本文已经显示和描述了本发明的优选实施方案,但对于本领域中技术人员显而易见的是,这些实施方案仅通过举例的方式提供。在不偏离本发明的情况下,本领域技术人员现将想到众多更改、改变和替换。应当理解,在实施本发明的过程中可采用本文所述的本发明实施方案的各种替代方案。以下权利要求旨在限定本发明的范围,从而涵盖这些权利要求的范围内的方法和结构及其等效方案。

Claims (116)

1.一种检测靶核酸拷贝数变异的方法,包括:
a.使包含多种多核苷酸的样品与至少一种试剂接触,其中所述多核苷酸包括第一和第二靶核酸;
b.使所述样品经受以下条件:当所述两种靶核酸位于同一多核苷酸上时,该条件使得所述试剂能够切割所述两种靶核酸之间特别选择的靶位点,从而分离所述两种靶核酸;
c.将与所述试剂接触的样品分成多个空间上分离的分区;
d.计算包含所述靶核酸的空间上分离的分区数;和
e.基于所述计算,确定所述靶核酸的拷贝数。
2.根据权利要求1所述的方法,其中所述空间上分离的分区为乳液内的小滴。
3.根据权利要求2所述的方法,其中所述靶核酸以小于约五个拷贝/小滴的平均浓度存在。
4.根据权利要求1所述的方法,其中所述特别选择的靶位点位于所述第一与第二靶核酸之间。
5.根据权利要求1所述的方法,进一步包括使所述第一和第二靶核酸经历扩增反应。
6.根据权利要求1所述的方法,其中所述第一和第二靶核酸具有相同的序列。
7.根据权利要求1所述的方法,其中所述第一和第二靶核酸具有不同的序列。
8.根据权利要求1所述的方法,其中所述特别选择的靶位点是能够用限制酶消化的位点。
9.根据权利要求1所述的方法,其中所述试剂为一种或多种限制酶。
10.根据权利要求1所述的方法,其中所述特别选择的位点和所述第一靶核酸位于同一基因内。
11.根据权利要求1所述的方法,其中所述靶核酸与疾病或病症相关。
12.根据权利要求1所述的方法,进一步包括计算含有参考核酸的空间上分离的分区数。
13.根据权利要求12所述的方法,其中所述参考核酸在所述样品所来源于的基因组中以固定拷贝数存在。
14.根据权利要求12所述的方法,其中所述参考核酸为管家基因。
15.根据权利要求12所述的方法,其中所述参考核酸在所述样品所来源于的每个二倍体基因组中以两个拷贝存在。
16.根据权利要求12所述的方法,其中所述确定所述靶核酸的拷贝数包括将计算的靶核酸数除以计算的参考核酸数。
17.根据权利要求1所述的方法,其中所述试剂不切割所述靶核酸的序列。
18.根据权利要求12所述的方法,其中所述试剂不切割所述参考核酸的序列。
19.根据权利要求1所述的方法,其中所述靶核酸以多个拷贝存在于单一多核苷酸上。
20.根据权利要求9所述的方法,其中所述一种或多种限制酶在所述两个靶序列之间具有超过一个识别序列。
21.根据权利要求9所述的方法,其中所述一种或多种限制酶不展现出显著的星号活性。
22.根据权利要求9所述的方法,其中所述一种或多种限制酶包含两种或更多种限制酶。
23.根据权利要求9所述的方法,其中使用软件选择所述一种或多种限制酶。
24.根据权利要求9所述的方法,其中所述一种或多种限制酶在消化所述多核苷酸后被热灭活。
25.根据权利要求24所述的方法,其中所述热灭活温度低于经限制酶切的靶片段的解链温度以便保持所述靶片段的双链性质。
26.根据权利要求9所述的方法,其中进行对照限制酶消化来测定所述一种或多种限制酶消化核酸的效率。
27.根据权利要求1所述的方法,其中确定所述样品中断裂的相连靶序列的百分比。
28.一种检测核酸的拷贝数变异的方法,包括:
a.提供包含多种多核苷酸的样品,所述多种多核苷酸包含位于多种多核苷酸中的至少一种内的第一和第二靶核酸;
b.当所述第一和第二靶核酸存在于同一多核苷酸内时,在所述第一与第二靶核酸之间切割至少一种多核苷酸以形成切割样品;
c.将所述切割样品分成多个空间上分离的区域;
d.计算包含所述靶核酸的、空间上分离的区域的数目;和
e.基于所述计算,确定所述靶核酸的拷贝数;
其中所述至少两种靶核酸中的两种位于同一多核苷酸的同一区域内。
29.根据权利要求28所述的方法,其中所述两种靶核酸相距小于一兆碱基。
30.根据权利要求28所述的方法,其中所述两种靶核酸相距小于一千碱基。
31.根据权利要求28所述的方法,其中利用限制酶完成所述切割。
32.根据权利要求28所述的方法,其中所述多个空间上分离的区域为在乳液内的小滴。
33.根据权利要求28所述的方法,进一步包括在步骤d的计算之前进行PCR反应。
34.根据权利要求28所述的方法,其中所述方法不包括测序反应。
35.一种检测靶核酸的拷贝数变异的方法,包括:
a.获得样品,该样品包含(i)多种多核苷酸,其中至少一种所述多核苷酸包含第一靶核酸和该第一靶核酸的拷贝;(ii)用于检测所述靶核酸的带有荧光标记物的探针;和(iii)能够进行PCR反应的试剂;
b.将所述样品分成多个空间上分离的分区,其中所述空间上分离的分区平均包含少于五个靶核酸;
c.使样品经历PCR扩增反应以检测所述靶核酸;
d.在用于PCR反应的任何所述试剂变为限制性的之前,检测所述荧光标记物的荧光强度,其中分区中的较高荧光强度指示在多核苷酸上存在超过一种靶核酸;
e.计算具有高于指示一个靶核酸拷贝的阈值的荧光强度的分区数;
f.计算具有高于指示多个靶核酸拷贝的阈值的荧光强度的分区数;和
g.或者(i)基于在步骤e和步骤f中得到的数值,计算所述靶核酸的拷贝数,或者(ii)确定两种靶核酸是否存在于同一多核苷酸上。
36.根据权利要求35所述的方法,其中所述靶核酸的拷贝数的增加与疾病或病症相关。
37.一种确定多种靶核酸存在于同一多核苷酸上的方法,包括,
a.将包含多种多核苷酸的样品分成至少两个子样品,其中所述多核苷酸包含第一和第二靶核酸;
b.使所述第一子样品与如果所述第一靶核酸和所述第二靶核酸存在于同一多核苷酸上的话能够物理分离它们的试剂相接触;
c.在步骤b之后,将所述第一子样品分成第一组分区;
d.确定所述第一组分区中包含所述靶核酸的分区数;
e.将第二子样品分成第二组分区;
f.确定所述第二组分区中包含靶核酸的分区数;和
g.将步骤d中获得的值与步骤f中获得的值进行比较,从而确定所述第一和第二靶核酸是否存在于同一多核苷酸内。
38.根据权利要求37所述的方法,其中所述第一和第二靶核酸包含相同的序列。
39.根据权利要求37所述的方法,其中所述试剂为限制酶。
40.根据权利要求37所述的方法,其中当步骤d中获得的数值显著高于步骤f中获得的数值时,指示所述第一和第二靶核酸的连接。
41.根据权利要求39所述的方法,其中所述限制酶识别所述第一与第二靶核酸之间的位点。
42.根据权利要求37所述的方法,其中所述第一和第二靶序列定位于彼此相距小于一兆碱基以内。
43.根据权利要求39所述的方法,其中在使所述样品与一种或多种限制酶接触后,在分离所述子样品之前,将所述样品储存少于24小时。
44.根据权利要求37所述的方法,其中所述靶序列在所述第二子样品中在物理上不分离。
45.根据权利要求37所述的方法,进一步包括确定所述第一和第二靶核酸是在相同的染色体上还是在不同的染色体上。
46.根据权利要求37所述的方法,其中所述第一靶核酸的序列与所述第二靶核酸的序列不同。
47.根据权利要求46所述的方法,其中所述第一靶核酸的序列是所述第二靶核酸的序列的遗传变异。
48.根据权利要求47所述的方法,其中所述遗传变异是单核苷酸多态性。
49.根据权利要求46所述的方法,其中所述第一和第二靶核酸位于同一基因内。
50.根据权利要求35所述的方法,其中至少两种多核苷酸为染色体。
51.根据权利要求50所述的方法,其中所述第一和第二靶核酸位于单独的染色体上。
52.根据权利要求50所述的方法,其中第一和第二靶核酸位于同一染色体上。
53.根据权利要求50所述的方法,其中至少一条所述染色体包含所述第一靶核酸的两个拷贝。
54.根据权利要求50所述的方法,其中至少一条所述染色体包含所述第一靶核酸的至少三个拷贝。
55.根据权利要求39所述的方法,其中一种或多种所述限制酶为甲基敏感的限制酶。
56.一种确定样品中多核苷酸的断裂概率的方法,包括:
a.获取样品,该样品包含(i)多种多核苷酸,其中至少一种所述多核苷酸包含第一靶核酸和第二靶核酸;(ii)用于检测所述第一靶核酸的第一标记探针;(iii)用于检测所述第二靶核酸的第二标记探针;和(iii)能够进行PCR反应的试剂;
b.将所述样品分成多个空间上分离的分区,其中所述空间上分离的分区平均包含少于五个靶多核苷酸;
c.使样品经历PCR扩增反应以便检测所述第一和第二靶核酸;
d.检测所述分区中的所述标记探针;
e.基于步骤d,计算同时包含所述第一和第二靶核酸的分区数;和
f.将同时包含所述第一和第二靶核酸的分区数与所述样品的断裂程度相关联。
57.根据权利要求56所述的方法,其中所述第一和第二靶核酸相距一兆碱基之内。
58.根据权利要求56所述的方法,其中,在正常受试者中,所述第一和第二靶核酸相距大于一千碱基。
59.根据权利要求56所述的方法,如果所述靶核酸是物理连接的,那么该方法进一步包括计算同时含有第一和第二靶核酸的分区的预期数目。
60.根据权利要求56所述的方法,其中所述断裂概率与同时包含所述第一和第二靶核酸的分区数的减少呈正相关。
61.一种用于确定多核苷酸样品中两个遗传连锁基因座的断裂概率的方法,包括:
a.对所述样品进行数字PCR(dPCR),其中所述dPCR包括将多核苷酸分成单独的单元;
b.确定具有指示存在第一基因座的信号的单元数与具有指示存在所述第一基因座和第二基因座的信号的单元数的第一总和;
c.确定具有指示存在所述第二基因座的信号的单元数与具有指示存在所述第一基因座和所述第二基因座的信号的单元数的第二总和;和
d.将所述第一和第二总和输入算法,从而确定样品中断裂的两个遗传连锁基因座的百分比。
62.根据权利要求56或61所述的方法,其中所述样品中的所述多核苷酸部分降解。
63.根据权利要求56或61所述的方法,其中所述多核苷酸为DNA。
64.根据权利要求56或61所述的方法,其中所述多核苷酸为RNA。
65.根据权利要求56或61所述的方法,其中所述多核苷酸包含DNA和RNA的混合物。
66.一种单元型分析方法,包括:(A)将含有核酸的水相分成多个离散体积;(B)在所述体积中,扩增来自展示出所述核酸中序列变异的第一多态基因座和第二多态基因座中每一个的至少一个等位基因序列;(C)确定相同体积中来自两个基因座的等位基因序列的共扩增的至少一个测量值;和(D)基于所述共扩增的至少一个测量值,选择所述第一和第二基因座的单元型。
67.根据权利要求66所述的方法,其中所述第一和第二基因座包含于所述核酸的靶区域内,并且其中所述分区步骤产生每体积小于数个靶区域拷贝的平均浓度。
68.根据权利要求67所述的方法,其中所述分区步骤产生每体积小于约五个靶区域拷贝的平均浓度。
69.根据权利要求66所述的方法,其中所述核酸获自或者来源于二倍体受试者。
70.根据权利要求66所述的方法,其中所述确定至少一个测量值的步骤包括针对与来自相同体积的所述第二基因座的等位基因特异性扩增数据相关的所述第一基因座的等位基因特异性扩增数据,确定至少一个相关系数的步骤。
71.根据权利要求66所述的方法,其中所述确定至少一个测量值的步骤包括针对分别与来自相同体积的所述第二基因座的等位基因特异性扩增数据相关的所述第一基因座的第一等位基因序列和第二等位基因序列的等位基因特异性扩增数据,确定第一相关系数和第二相关系数的步骤,并且其中所述选择单元型的步骤基于将所述第一和第二相关系数彼此进行比较的步骤。
72.根据权利要求66所述的方法,其中所述确定至少一个测量值的步骤包括确定展示出所述第一基因座的特定等位基因序列与所述第二基因座的特定等位基因序列共扩增的体积数的步骤,并且其中所述选择单元型的步骤基于所述体积数。
73.根据权利要求66所述的方法,其中所述确定体积数的步骤包括确定展示出所述第一基因座的第一等位基因序列或第二等位基因序列与所述第二基因座的特定等位基因序列分别共扩增的第一体积数和第二体积数的步骤,并且其中所述选择单元型的步骤基于第一和第二体积数。
74.根据权利要求66所述的方法,其中所述分区步骤包括形成乳液的步骤,在该乳液中所述体积为小滴。
75.一种单元型分析方法,包括:(A)将含有核酸的水相分成多个离散体积;(B)在所述体积中,扩增来自包含在所述核酸的靶区域中的第一多态基因座和第二多态基因座中每一个的至少一个等位基因序列;(C)从单个体积收集每个基因座的等位基因特异性扩增数据;(D)将所述第一基因座的等位基因特异性扩增数据与来自相同体积的所述第二基因座的等位基因特异性扩增数据进行关联;和(E)基于所述关联步骤,选择所述第一和第二基因座的靶区域的单元型。
76.根据权利要求75所述的方法,其中所述分区步骤包括形成乳液的步骤,并且其中所述收集步骤包括从所述乳液的单个小滴收集数据的步骤。
77.根据权利要求75所述的方法,其中所述形成乳液的步骤包括使所述水相通过孔口以便产生水相的单分散小滴的步骤。
78.根据权利要求75所述的方法,其中所述分区步骤平均处理每个体积中少于约一个靶区域拷贝。
79.根据权利要求75所述的方法,其中所述分区步骤平均处理每个体积中少于约一个基因组当量的所述核酸。
80.根据权利要求75所述的方法,其中所述分区步骤包括形成至少约1000个体积的步骤。
81.根据权利要求75所述的方法,其中所述分区步骤包括形成直径约为10-1000微米的小滴的步骤。
82.根据权利要求75所述的方法,其中所述分区步骤包括对水相进行分区的步骤,该水相包括能够与扩增的每个等位基因序列特异性杂交的光学可辨别的荧光探针。
83.根据权利要求75所述的方法,其中所述核酸是从受试者获得的遗传物质。
84.根据权利要求83所述的方法,其中所述受试者是多细胞生物。
85.根据权利要求83所述的方法,其中所述受试者是人。
86.根据权利要求75所述的方法,其中所述核酸包括通过逆转录从受试者获得的RNA而得到的cDNA。
87.根据权利要求75所述的方法,其中所述扩增步骤包括扩增来自所述第一基因座的一对不同等位基因序列的步骤,并且其中所述收集数据的步骤包括收集以下数据的步骤,该数据区分单个小滴中这一对的每个等位基因序列的扩增。
88.根据权利要求75所述的方法,其中所述关联步骤包括分别将所述第一基因座的每个等位基因序列的等位基因特异性扩增数据与所述第二基因座的等位基因序列的等位基因特异性扩增数据进行关联的步骤。
89.根据权利要求75所述的方法,其中所述选择单元型的步骤是基于所述第一基因座的哪些等位基因特异性扩增数据展示出更高的与所述第二基因座的这些等位基因特异性扩增数据的相关性。
90.根据权利要求75所述的方法,其中所述收集步骤包括从所述体积连续收集数据的步骤。
91.根据权利要求75所述的方法,其中所述关联步骤包括确定所述第一和第二基因座的扩增数据的至少一个相关系数的步骤,并且其中所述选择单元型的步骤是基于所述至少一个相关系数。
92.根据权利要求91所述的方法,其中所述选择单元型的步骤基于与从所述第一基因座扩增的各自不同等位基因序列相对应的相关系数。
93.根据权利要求75所述的方法,进一步包括对所述等位基因特异性扩增数据应用阈值以将其转化成二进制形式的步骤,其中所述关联步骤利用所述数据的二进制形式进行。
94.根据权利要求93所述的方法,其中所述关联步骤包括确定展示出来自两个基因座的特定等位基因序列共扩增的体积数的步骤。
95.根据权利要求94所述的方法,其中所述关联步骤包括(1)确定展示出所述第二基因座等位基因序列与来自所述第一基因座的第一等位基因序列共扩增的第一体积数和展示出所述第二基因座等位基因序列与来自第一基因座的第二等位基因序列共扩增的第二小滴数的步骤,和(2)比较所述第一和第二体积数的步骤。
96.根据权利要求75所述的方法,其中所述选择单元型的步骤是基于所述关联步骤指示相同体积中所述第一和第二基因座的特定等位基因序列的共扩增是呈负相关还是呈正相关。
97.一种单元型分析方法,包括:(A)将含有核酸的水相分成多个离散体积;(B)在所述体积中,扩增来自所述核酸中第一多态基因座和第二多态基因座中每一个的等位基因序列;(C)收集单个体积中每个等位基因序列的等位基因特异性扩增数据;和(D)至少部分地基于所述扩增数据指示相同体积中等位基因序列的扩增是呈负相关还是呈正相关来选择所述核酸的单元型。
98.一种单元型分析方法,包括:(A)将含有核酸的水相分成多个小滴,使得所述核酸的靶区域以每小滴少于约一个拷贝的平均浓度存在;(B)在所述小滴中,扩增来自展示出所述核酸中的序列变异以及包含在所述靶区域中的第一多态基因座和第二多态基因座中每一个的至少一个等位基因序列;(C)确定相同小滴中来自两个基因座的等位基因序列的共扩增的至少一个测量值;和(D)基于所述共扩增的至少一个测量值选择所述第一和第二基因座的靶区域的单元型。
99.根据权利要求98所述的方法,其中所述扩增步骤包括扩增来自所述第一基因座的第一等位基因序列和第二等位基因序列的步骤,并且其中所述确定步骤包括确定所述第一等位基因序列的共扩增的第一测量值和所述第二等位基因序列的共扩增的第二测量值的步骤,并且其中选择单元型的步骤是基于所述共扩增的第一和第二测量值的比较。
100.一种用于单元型分析的系统,包含:
小滴发生器,其配置用于形成包含核酸的水相的小滴;
检测器,其配置用于从单个小滴收集每个基因座的等位基因特异性扩增数据;和
处理器,其配置用于将所述第一基因座的等位基因特异性扩增数据与来自相同体积的所述第二基因座的等位基因特异性扩增数据进行关联,并且基于所述等位基因特异性扩增数据的相关性,选择所述第一和第二基因座的核酸的单元型。
101.一种用于确定第一靶核酸与第二靶核酸存在于同一多核苷酸上的概率的方法,包括:
a)将多核苷酸样品分成至少两个子样品;
b)在第一子样品中,用短周期PCR预扩增所述第一和第二靶核酸;
c)将所述第一子样品分成第一组分区;
d)计算来自所述第一子样品的、同时含有所述第一和第二靶核酸的分区数;
e)将所述第二子样品分成第二组分区;
f)计算来自所述第二子样品的、同时含有所述第一和第二靶核酸的分区数;和
g)比较步骤f的值与步骤d的值,从而确定所述第一和第二靶核酸连接在同一多核苷酸上的概率。
102.根据权利要求101所述的方法,其中所述短周期PCR包含少于24次PCR反应循环。
103.根据权利要求101所述的方法,进一步包括使用算法来确定所述第一和第二靶核酸定相于同一多核苷酸上的概率。
104.一种鉴定靶核酸从染色体上缺失的概率的方法,包括:
(a)将样品细分成多个分区,其中所述样品包含:(i)一对染色体,使得至少一条染色体含有第一靶核酸,并且其中两条染色体含有相同的标记核酸;(ii)用于检测所述第一靶核酸的第一标记探针;(iii)用于检测所述标记核酸的第二标记探针;和(iii)能够进行PCR反应的试剂;
(b)进行扩增反应以检测所述分区中的所述第一靶核酸和所述标记核酸;
(c)计算含有所述标记核酸而不含靶核酸的分区数;和
(d)基于步骤c的值确定至少一条染色体上靶核酸缺失的概率,其中步骤c中的较高值与靶核酸从所述染色体对中的一条染色体上缺失的概率的增加有关。
105.根据权利要求104所述的方法,其中所述靶核酸疑似以多个拷贝存在于至少一条染色体上。
106.根据权利要求104所述的方法,其中所述标记核酸和所述靶核酸在至少一条染色体上彼此相距很近。
107.根据权利要求106所述的方法,其中所述标记核酸和所述靶核酸相距5000个碱基对以内。
108.根据权利要求104所述的方法,其中所述标记核酸包含单核苷酸多态性。
109.根据权利要求104所述的方法,进一步包括进行单独的实验以确定不同多核苷酸的断裂。
110.根据权利要求109所述的方法,进一步包括使用所述单独实验的结果来辅助步骤d的所述确定,其中通过确定所述不同多核苷酸已断裂来加强对高缺失概率的确定。
111.根据权利要求104所述的方法,进一步包括进行单独的实验以确定所述样品中高分子量DNA的存在。
112.一种确定靶区域从多核苷酸上缺失或易位的概率的方法,包括:
(a)将样品细分成多个分区,其中所述样品包含:(i)疑似包含第一标记核酸和第二标记核酸的多核苷酸,其中所述第一和第二标记核酸相距至少一兆碱基,并且其中疑似所述靶区域位于所述第一和第二标记核酸之间;(ii)用于检测所述第一标记核酸的第一标记探针;(iii)用于检测所述第二标记核酸的第二标记探针;和(iii)能够进行PCR反应的试剂;
(b)进行扩增反应以检测所述分区内的所述第一和第二标记核酸;
(c)计算所述分区内同时包含所述第一和第二标记核酸的分区数;和
(d)基于步骤c的值,确定所述靶区域缺失或易位的概率,其中步骤c中的较高值与所述靶核酸从多核苷酸上缺失的概率的增加有关。
113.根据权利要求112所述的方法,其中所述多核苷酸为染色体。
114.根据权利要求112所述的方法,其中所述靶区域是已知存在于野生型受试者中的染色体的特定区域。
115.根据权利要求112所述的方法,进一步包括进行单独的实验以确定不同多核苷酸的断裂。
116.根据权利要求116所述的方法,进一步包括使用所述单独实验的结果以辅助步骤d的所述确定,其中通过确定所述不同多核苷酸未断裂来加强对高缺失或易位概率的确定。
CN201280017616.9A 2011-02-09 2012-02-09 核酸的分析 Pending CN103562407A (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US201161441209P 2011-02-09 2011-02-09
US61/441,209 2011-02-09
US201161444539P 2011-02-18 2011-02-18
US61/444,539 2011-02-18
US201161454373P 2011-03-18 2011-03-18
US61/454,373 2011-03-18
US201161476115P 2011-04-15 2011-04-15
US61/476,115 2011-04-15
US201161478777P 2011-04-25 2011-04-25
US61/478,777 2011-04-25
US201161484197P 2011-05-09 2011-05-09
US61/484,197 2011-05-09
US201161490055P 2011-05-25 2011-05-25
US61/490,055 2011-05-25
PCT/US2012/024573 WO2012109500A2 (en) 2011-02-09 2012-02-09 Analysis of nucleic acids

Publications (1)

Publication Number Publication Date
CN103562407A true CN103562407A (zh) 2014-02-05

Family

ID=46639213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280017616.9A Pending CN103562407A (zh) 2011-02-09 2012-02-09 核酸的分析

Country Status (7)

Country Link
US (4) US9127312B2 (zh)
EP (3) EP3483285B1 (zh)
JP (1) JP2014506465A (zh)
CN (1) CN103562407A (zh)
AU (1) AU2012214312A1 (zh)
CA (1) CA2826748C (zh)
WO (1) WO2012109500A2 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104745718A (zh) * 2015-04-23 2015-07-01 北京嘉宝仁和医疗科技有限公司 一种检测人类胚胎染色体微缺失和微重复的方法
CN105368957A (zh) * 2015-12-14 2016-03-02 无锡药明康德生物技术股份有限公司 Cho细胞基因拷贝数的微滴数字pcr定量检测方法
CN105969762A (zh) * 2016-04-21 2016-09-28 奥美德诺(北京)基因科技有限公司 用于高gc含量的基因组扩增反应试剂及其应用、试剂盒
CN108431232A (zh) * 2015-12-04 2018-08-21 10X 基因组学有限公司 用于核酸分析的方法和组合物
CN108603228A (zh) * 2015-12-17 2018-09-28 夸登特健康公司 通过分析无细胞dna确定肿瘤基因拷贝数的方法
CN111349692A (zh) * 2013-06-25 2020-06-30 C.威特沃 进行聚合酶链式反应的方法及其相关应用
CN112639122A (zh) * 2018-09-19 2021-04-09 英芙勒玛提克斯公司 利用等温扩增和相对丰度评估宿主rna
CN113825836A (zh) * 2019-04-09 2021-12-21 阿克生物公司 用于基于核苷酸修饰的耗竭的组合物和方法
CN114514326A (zh) * 2019-05-27 2022-05-17 国家科学研究中心 数字化多路复用检测和/或定量生物分子的方法及其用途
CN114728256A (zh) * 2019-11-14 2022-07-08 生物辐射实验室股份有限公司 通过非终点扩增进行的单细胞的靶标拷贝数的分区型确定

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2021113A2 (en) 2006-05-11 2009-02-11 Raindance Technologies, Inc. Microfluidic devices
WO2008097559A2 (en) 2007-02-06 2008-08-14 Brandeis University Manipulation of fluids and reactions in microfluidic systems
US8592221B2 (en) 2007-04-19 2013-11-26 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
WO2010009365A1 (en) 2008-07-18 2010-01-21 Raindance Technologies, Inc. Droplet libraries
US12038438B2 (en) 2008-07-18 2024-07-16 Bio-Rad Laboratories, Inc. Enzyme quantification
US9921154B2 (en) 2011-03-18 2018-03-20 Bio-Rad Laboratories, Inc. Multiplexed digital assays
CA2760439A1 (en) 2009-04-30 2010-11-04 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US9399797B2 (en) 2010-02-12 2016-07-26 Raindance Technologies, Inc. Digital analyte analysis
EP2534267B1 (en) 2010-02-12 2018-04-11 Raindance Technologies, Inc. Digital analyte analysis
WO2012034013A2 (en) 2010-09-10 2012-03-15 Bio-Rad Laboratories, Inc. Detection of rna-interacting regions in dna
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
EP3483285B1 (en) 2011-02-09 2021-07-14 Bio-Rad Laboratories, Inc. Analysis of nucleic acids
US20120208193A1 (en) 2011-02-15 2012-08-16 Bio-Rad Laboratories, Inc. Detecting methylation in a subpopulation of genomic dna
EP2675819B1 (en) 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
EP3709018A1 (en) 2011-06-02 2020-09-16 Bio-Rad Laboratories, Inc. Microfluidic apparatus for identifying components of a chemical reaction
US8658430B2 (en) 2011-07-20 2014-02-25 Raindance Technologies, Inc. Manipulating droplet size
US8728987B2 (en) 2011-08-03 2014-05-20 Bio-Rad Laboratories, Inc. Filtering small nucleic acids using permeabilized cells
EP2768983A4 (en) 2011-10-17 2015-06-03 Good Start Genetics Inc METHODS OF IDENTIFYING MUTATIONS ASSOCIATED WITH DISEASES
US20130217071A1 (en) 2011-12-30 2013-08-22 Luz Montesclaros Methods and compositions for performing nucleic acid amplification reactions
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US8812422B2 (en) 2012-04-09 2014-08-19 Good Start Genetics, Inc. Variant database
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
CN103571825B (zh) * 2012-08-09 2016-03-16 财团法人工业技术研究院 用于生物样本处理之组合物及使用其之核酸扩增方法
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20140155295A1 (en) 2012-08-14 2014-06-05 10X Technologies, Inc. Capsule array devices and methods of use
US9422602B2 (en) * 2012-08-15 2016-08-23 Bio-Rad Laboratories, Inc. Methods and compositions for determining nucleic acid degradation
US9970052B2 (en) 2012-08-23 2018-05-15 Bio-Rad Laboratories, Inc. Digital assays with a generic reporter
US9157124B2 (en) 2012-09-18 2015-10-13 Institute For Cancer Research Systems and methods for diagnosing a predisposition to develop colon cancer
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2014093714A1 (en) 2012-12-14 2014-06-19 Bio-Rad Laboratories, Inc. Methods and compositions for using oils for analysis and detection of molecules
US9217175B2 (en) 2013-02-01 2015-12-22 Bio-Rad Laboratories, Inc. Multiplexed digital assay with specific and generic reporters
US20140221218A1 (en) * 2013-02-05 2014-08-07 Bionano Genomics, Inc. Methods for single-molecule analysis
CN108753766A (zh) * 2013-02-08 2018-11-06 10X基因组学有限公司 多核苷酸条形码生成
WO2014152421A1 (en) 2013-03-14 2014-09-25 Good Start Genetics, Inc. Methods for analyzing nucleic acids
US10385394B2 (en) * 2013-03-15 2019-08-20 The Translational Genomics Research Institute Processes of identifying and characterizing X-linked disorders
US9458511B2 (en) 2013-03-15 2016-10-04 Bio-Rad Laboratories, Inc. Multiplexed digital assay for variant and normal forms of a gene of interest
US9347095B2 (en) 2013-03-15 2016-05-24 Bio-Rad Laboratories, Inc. Digital assays for mutation detection
WO2014146025A1 (en) * 2013-03-15 2014-09-18 Bio-Rad Laboratories, Inc. Digital assays with associated targets
US20140303005A1 (en) * 2013-04-05 2014-10-09 Raindance Technologies, Inc. Rare cell analysis after negative selection
US9328384B2 (en) 2013-05-13 2016-05-03 Elitechgroup B.V. Droplet digital PCR with short minor groove probes
EP3005200A2 (en) 2013-06-03 2016-04-13 Good Start Genetics, Inc. Methods and systems for storing sequence read data
CN105555972B (zh) 2013-07-25 2020-07-31 伯乐生命医学产品有限公司 遗传测定
WO2015048571A2 (en) * 2013-09-26 2015-04-02 Bio-Rad Laboratories, Inc. Methods and compositions for chromosome mapping
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
EP3058100A4 (en) 2013-10-18 2017-04-19 California Institute of Technology Enhanced nucleic acid identification and detection
US11041203B2 (en) 2013-10-18 2021-06-22 Molecular Loop Biosolutions, Inc. Methods for assessing a genomic region of a subject
WO2015080966A1 (en) * 2013-11-26 2015-06-04 Bio-Rad Laboratories, Inc. Methods for detecting nucleic acid proximity
US9944977B2 (en) 2013-12-12 2018-04-17 Raindance Technologies, Inc. Distinguishing rare variations in a nucleic acid sequence from a sample
WO2015175530A1 (en) 2014-05-12 2015-11-19 Gore Athurva Methods for detecting aneuploidy
WO2015200893A2 (en) 2014-06-26 2015-12-30 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
WO2016040446A1 (en) 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
EP3224595A4 (en) 2014-09-24 2018-06-13 Good Start Genetics, Inc. Process control for increased robustness of genetic assays
WO2016085632A2 (en) 2014-11-05 2016-06-02 California Institute Of Technology Microfluidic measurements of the response of an organism to a drug
EP4095261A1 (en) 2015-01-06 2022-11-30 Molecular Loop Biosciences, Inc. Screening for structural variants
GB201513492D0 (en) 2015-07-30 2015-09-16 Arcis Biotechnology Holdings Ltd Method and composition
WO2017017457A1 (en) * 2015-07-30 2017-02-02 Arcis Biotechnology Holdings Limited Method and composition using a quaternary ammonium compound
US10724100B2 (en) 2015-09-16 2020-07-28 Institute For Cancer Research Systems and methods for treating patients having a genetic predisposition to develop prostate cancer
EP3405574A4 (en) * 2016-01-22 2019-10-02 Grail, Inc. VARIANTS-BASED SICKNESS DIAGNOSTICS AND PURSUIT
JP7064665B2 (ja) 2016-03-07 2022-05-11 ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル 非侵襲的分子対照
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
CN111051511A (zh) * 2017-08-04 2020-04-21 十亿至一公司 用于与生物靶相关的表征的靶相关分子
CN111433372B (zh) 2017-10-19 2024-01-26 生物辐射实验室股份有限公司 具有光致发光的非常规和/或反向变化的数字扩增试验
CA3147297A1 (en) * 2019-07-16 2021-01-21 Meliolabs Inc. Methods and devices for single-cell based digital high resolution melt
US11427874B1 (en) 2019-08-26 2022-08-30 Epi One Inc. Methods and systems for detection of prostate cancer by DNA methylation analysis
WO2021211758A1 (en) * 2020-04-15 2021-10-21 Enumerix, Inc. Systems and methods for generation of emulsions with suitable clarity with applications of use
CN112481371A (zh) * 2020-12-11 2021-03-12 长沙金域医学检验实验室有限公司 一种检测plp1基因拷贝数变异的试剂盒
EP4294410A1 (en) * 2021-02-16 2023-12-27 Bio-Rad Laboratories, Inc. Sars cov-2 infectivity determination assay
CN117241878A (zh) 2021-03-05 2023-12-15 伊努梅里斯公司 用于生成微滴和执行数字分析的系统和方法
CN117794646A (zh) 2021-06-04 2024-03-29 伊努梅里斯公司 用于单细胞条形码化和测序的组合物、方法和系统
WO2023010131A1 (en) * 2021-07-30 2023-02-02 Ultima Genomics, Inc. Methods and systems for obtaining and processing sequencing data
SE2450504A1 (en) 2021-10-20 2024-05-10 Tataa Biocenter Ab Methods and compositions for detection of mutant nucleic acid sequences
US11834714B2 (en) 2021-12-20 2023-12-05 Enumerix, Inc. Detection and digital quantitation of multiple targets
WO2023249949A1 (en) * 2022-06-21 2023-12-28 Materials and Machines Corporation of America Sample extraction tube for method for detection of rna or dna
WO2024133475A1 (en) * 2022-12-23 2024-06-27 Qiagen Gmbh Method of nucleic acid quantification used to increase dynamic range in digital pcr

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090035762A1 (en) * 2007-07-30 2009-02-05 Nicholas Michael Sampas Allele-specific copy number measurement using single nucleotide polymorphism and DNA arrays
US20110015084A1 (en) * 2007-10-25 2011-01-20 Monsanto Technology Llc Methods for Identifying Genetic Linkage

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4437975A (en) 1977-07-20 1984-03-20 Mobil Oil Corporation Manufacture of lube base stock oil
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US4683194A (en) * 1984-05-29 1987-07-28 Cetus Corporation Method for detection of polymorphic restriction sites and nucleic acid sequences
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
IL86724A (en) 1987-06-19 1995-01-24 Siska Diagnostics Inc Methods and kits for amplification and testing of nucleic acid sequences
JP2774121B2 (ja) 1987-07-31 1998-07-09 ザ ボード オブ トラスティーズ オブ ザ リーランド スタンフォード ジュニア ユニバーシティ 標的ポリヌクレオチド配列の選択的増幅
JP2650159B2 (ja) 1988-02-24 1997-09-03 アクゾ・ノベル・エヌ・ベー 核酸増幅方法
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
CA2005589C (en) 1988-12-16 2001-02-06 Thomas Raymond Gingeras Self-sustained, sequence replication system
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5386023A (en) 1990-07-27 1995-01-31 Isis Pharmaceuticals Backbone modified oligonucleotide analogs and preparation thereof through reductive coupling
JPH06500471A (ja) 1990-08-24 1994-01-20 ザ・ユニバーシティ・オブ・テネシー・リサーチ・コーポレーション Dna増幅フィンガープリント法
WO1992007095A1 (en) 1990-10-15 1992-04-30 Stratagene Arbitrarily primed polymerase chain reaction method for fingerprinting genomes
US5426180A (en) 1991-03-27 1995-06-20 Research Corporation Technologies, Inc. Methods of making single-stranded circular oligonucleotides
US5644048A (en) 1992-01-10 1997-07-01 Isis Pharmaceuticals, Inc. Process for preparing phosphorothioate oligonucleotides
US5593826A (en) 1993-03-22 1997-01-14 Perkin-Elmer Corporation, Applied Biosystems, Inc. Enzymatic ligation of 3'amino-substituted oligonucleotides
ATE246702T1 (de) 1993-04-12 2003-08-15 Univ Northwestern Verfahren zur darstellung von oligonukleotiden
US5432054A (en) 1994-01-31 1995-07-11 Applied Imaging Method for separating rare cells from a population of cells
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5637684A (en) 1994-02-23 1997-06-10 Isis Pharmaceuticals, Inc. Phosphoramidate and phosphorothioamidate oligomeric compounds
US5952481A (en) * 1994-03-31 1999-09-14 The University Of Leeds DNA encoding ubiquitin conjugating enzymes
US5866337A (en) 1995-03-24 1999-02-02 The Trustees Of Columbia University In The City Of New York Method to detect mutations in a nucleic acid using a hybridization-ligation procedure
SE506908C2 (sv) 1995-09-08 1998-03-02 Ulf Landegren Inst F Medicinsk Medicinsk användning av padlockprober
US6953663B1 (en) 1995-11-29 2005-10-11 Affymetrix, Inc. Polymorphism detection
US7256020B2 (en) 1996-11-29 2007-08-14 Third Wave Technologies, Inc. Methods and compositions for detecting target sequences
SE9601676D0 (sv) 1996-04-30 1996-04-30 Ulf Landegren Improved probing of specific mucleic acids
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US6143496A (en) 1997-04-17 2000-11-07 Cytonix Corporation Method of sampling, amplifying and quantifying segment of nucleic acid, polymerase chain reaction assembly having nanoliter-sized sample chambers, and method of filling assembly
WO1998056952A1 (en) 1997-06-09 1998-12-17 University Of Southern California A cancer diagnostic method based upon dna methylation differences
DK1997909T3 (da) 1998-03-25 2012-04-23 Olink Ab Rullende cirkel-replikation af cirkulariserede målnukleinsyrefragmenter
US6203989B1 (en) 1998-09-30 2001-03-20 Affymetrix, Inc. Methods and compositions for amplifying detectable signals in specific binding assays
US6143504A (en) 1998-10-27 2000-11-07 Arch Development Corporation Methods and compositions for the diagnosis of fragile X syndrome
US6331393B1 (en) 1999-05-14 2001-12-18 University Of Southern California Process for high-throughput DNA methylation analysis
US6180349B1 (en) 1999-05-18 2001-01-30 The Regents Of The University Of California Quantitative PCR method to enumerate DNA copy number
EP1226282A2 (en) 1999-07-09 2002-07-31 Uab Research Foundation Retroviral recombination assays and uses thereof
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
US6586177B1 (en) 1999-09-08 2003-07-01 Exact Sciences Corporation Methods for disease detection
US7060499B1 (en) * 1999-09-30 2006-06-13 Izumu Saito DNA containing variant FRT sequences
US7668658B2 (en) 1999-10-13 2010-02-23 Sequenom, Inc. Methods for generating databases and databases for identifying polymorphic genetic markers
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
AU2001232805A1 (en) 2000-01-12 2001-07-24 Ut-Battelle, Llc A microfluidic device and method for focusing, segmenting, and dispensing of a fluid stream
US20020151040A1 (en) 2000-02-18 2002-10-17 Matthew O' Keefe Apparatus and methods for parallel processing of microvolume liquid reactions
AU2001293336A1 (en) 2000-04-11 2001-10-23 Ulf Landegren Nucleic acid detection medium
US7659054B1 (en) * 2000-05-23 2010-02-09 Nuvelo, Inc. Methods for genetic analysis of DNA to detect sequence variances
US6475736B1 (en) * 2000-05-23 2002-11-05 Variagenics, Inc. Methods for genetic analysis of DNA using biased amplification of polymorphic sites
CA2419529C (en) 2000-08-15 2013-02-12 The John Hopkins University School Of Medicine Diagnosis and treatment of tumor-suppressor associated disorders
JP3353149B2 (ja) 2000-08-28 2002-12-03 ホーコス株式会社 工作機械の主軸装置
ATE380883T1 (de) 2000-10-24 2007-12-15 Univ Leland Stanford Junior Direkte multiplex charakterisierung von genomischer dna
US7767881B2 (en) * 2001-07-02 2010-08-03 Banyu Pharmaceutical Co., Ltd. Utilization of histamine receptor h3 gene participating in body weight or food intake control
KR20040036900A (ko) 2001-07-15 2004-05-03 켁크 그래주에이트 인스티튜트 닉킹제를 사용한 핵산 단편의 증폭
US6632611B2 (en) * 2001-07-20 2003-10-14 Affymetrix, Inc. Method of target enrichment and amplification
GB2378245A (en) 2001-08-03 2003-02-05 Mats Nilsson Nucleic acid amplification method
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US20040014067A1 (en) 2001-10-12 2004-01-22 Third Wave Technologies, Inc. Amplification methods and compositions
CA2463420A1 (en) 2001-10-24 2003-05-01 Singulex, Inc. Methods for detecting genetic haplotypes by interaction with probes
GB0127564D0 (en) 2001-11-16 2002-01-09 Medical Res Council Emulsion compositions
CN100396788C (zh) 2001-11-19 2008-06-25 帕拉里勒生物科学公司 多重寡核苷酸添加和目标扩增
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US20040005710A1 (en) 2002-03-09 2004-01-08 Ho-Sun Son Method for producing recombinant viruses using site-specific recombination
AU2003279697A1 (en) 2002-05-17 2004-02-16 Nugen Technologies, Inc. Methods for fragmentation, labeling and immobilizaton of nucleic acids
WO2004003173A2 (en) 2002-07-01 2004-01-08 Cleveland State University Method for detecting mutated polynucleotides within a large population of wild-type polynucleotides
US9740817B1 (en) * 2002-10-18 2017-08-22 Dennis Sunga Fernandez Apparatus for biological sensing and alerting of pharmaco-genomic mutation
JP2006519977A (ja) 2002-11-11 2006-08-31 アフィメトリックス インコーポレイテッド Dnaコピー数変化を同定するための方法
US7822555B2 (en) 2002-11-11 2010-10-26 Affymetrix, Inc. Methods for identifying DNA copy number changes
US10229244B2 (en) 2002-11-11 2019-03-12 Affymetrix, Inc. Methods for identifying DNA copy number changes using hidden markov model based estimations
CA2513302C (en) * 2003-01-17 2013-03-26 The Trustees Of Boston University Haplotype analysis
US7041481B2 (en) 2003-03-14 2006-05-09 The Regents Of The University Of California Chemical amplification based on fluid partitioning
US7718364B2 (en) 2003-03-25 2010-05-18 John Wayne Cancer Institute DNA markers for management of cancer
US20060078893A1 (en) 2004-10-12 2006-04-13 Medical Research Council Compartmentalised combinatorial chemistry by microfluidic control
US7288373B2 (en) 2003-05-02 2007-10-30 Human Genetic Signatures Pty Ltd. Treatment of methylated nucleic acid
US7300755B1 (en) * 2003-05-12 2007-11-27 Fred Hutchinson Cancer Research Center Methods for haplotyping genomic DNA
KR20060029276A (ko) 2003-07-04 2006-04-05 존슨 앤드 존슨 리서치 피티와이 리미티드 Dna 중의 알킬화 사이토신의 검출방법
EP2918595B1 (en) 2003-07-05 2019-12-11 The Johns-Hopkins University Method and compositions for detection and enumeration of genetic variations
US20050112636A1 (en) 2003-09-23 2005-05-26 Atom Sciences Polymeric nucleic acid hybridization probes
ES2326811T3 (es) 2003-10-09 2009-10-20 Epigenomics Ag Conversion mejorada de adn con bisulfito.
EP2292795B1 (en) 2003-10-21 2015-01-07 Orion Genomics, LLC Differential enzymatic fragmatation
GB0327909D0 (en) 2003-12-02 2004-01-07 Babraham Inst Methods
WO2005098050A2 (en) 2004-03-26 2005-10-20 Sequenom, Inc. Base specific cleavage of methylation-specific amplification products in combination with mass analysis
WO2005111242A2 (en) 2004-05-10 2005-11-24 Parallele Bioscience, Inc. Digital profiling of polynucleotide populations
EP1756307A1 (en) 2004-05-20 2007-02-28 Trillion Genomics Limited Use of mass labelled probes to detect target nucleic acids using mass spectrometry
DE102004029700A1 (de) 2004-06-15 2006-02-09 Epigenomics Ag Verfahren zur Quantifizierung methylierter DNA
US7695941B2 (en) 2005-06-16 2010-04-13 The United States Of America As Represented By The Secretary Of The Navy Multiplexed polymerase chain reaction for genetic sequence analysis
EP1645640B1 (en) 2004-10-05 2013-08-21 Affymetrix, Inc. Method for detecting chromosomal translocations
US20090317798A1 (en) 2005-06-02 2009-12-24 Heid Christian A Analysis using microfluidic partitioning devices
US7368242B2 (en) 2005-06-14 2008-05-06 Affymetrix, Inc. Method and kits for multiplex hybridization assays
US20060292585A1 (en) 2005-06-24 2006-12-28 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
WO2007008605A1 (en) 2005-07-08 2007-01-18 Niman Henry L Identifying and predicting influenza variants and uses thereof
DE602006011486D1 (de) 2005-09-29 2010-02-11 Keygene Nv Screening mutagenisierter populationen mit hohem durchsatz
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
PL3002338T3 (pl) 2006-02-02 2019-12-31 The Board Of Trustees Of The Leland Stanford Junior University Nieinwazyjne badania przesiewowe płodu poprzez analizę cyfrową
EP1996728B1 (en) 2006-02-28 2011-05-04 University of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
CN101395280A (zh) 2006-03-01 2009-03-25 凯津公司 基于测序的高通量SNPs连接检测技术
US20100092981A1 (en) 2006-04-03 2010-04-15 Genzyme Corporation Methods of detecting hypermethylation
US8828661B2 (en) * 2006-04-24 2014-09-09 Fluidigm Corporation Methods for detection and quantification of nucleic acid or protein targets in a sample
US7754428B2 (en) 2006-05-03 2010-07-13 The Chinese University Of Hong Kong Fetal methylation markers
EP2021113A2 (en) 2006-05-11 2009-02-11 Raindance Technologies, Inc. Microfluidic devices
JP5346801B2 (ja) 2006-05-12 2013-11-20 セフィード Dna組換え接合部の検出
CN101675169B (zh) 2006-06-14 2018-01-02 维里纳塔健康公司 使用样品拆分和dna标签进行稀有细胞分析
EP2024512A4 (en) 2006-06-14 2009-12-09 Artemis Health Inc METHODS FOR THE DIAGNOSIS OF ABNORMAL F CHARACTERS
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
WO2008021123A1 (en) 2006-08-07 2008-02-21 President And Fellows Of Harvard College Fluorocarbon emulsion stabilizing surfactants
WO2008045158A1 (en) * 2006-10-10 2008-04-17 Illumina, Inc. Compositions and methods for representational selection of nucleic acids fro complex mixtures using hybridization
US20090068648A1 (en) 2006-10-13 2009-03-12 Zohar Yakhini Method and system for determining a quality metric for comparative genomic hybridization experimental results
BRPI0718322A2 (pt) * 2006-10-27 2013-11-26 Decode Genetics Métodos para diagnosticar uma suscetibilidade para câncer em um indivíduo humano, para identificar um marcador para o uso na avaliação da suscetibilidade para câncer, para genotipar uma amostra de ácido nucléico, para avaliar um inidivíduo quanto a probabilidade de resposta a um agente terapêutico, para predizer o prognóstico e para monitorar o progresso de um tratamento de um indivíduo, kit para avaliar a suscetibilidade para câncer em um indivíduo, uso de uma sonda de oligonucleotídeo, meio legível por computador, e, aparelho para determinar um indicador genético para câncer em um indivíduo.
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US9290803B2 (en) 2007-04-12 2016-03-22 University Of Southern California DNA methylation analysis by digital bisulfite genomic sequencing and digital methylight
WO2008134153A1 (en) * 2007-04-23 2008-11-06 Advanced Liquid Logic, Inc. Bead-based multiplexed analytical methods and instrumentation
JP2010528628A (ja) * 2007-06-07 2010-08-26 シモンズ ハプロミクス リミテッド エピジェネティック方法
CN102083575B (zh) 2007-06-25 2014-09-17 阿费梅特里克斯公司 刻印的微码
US20090053719A1 (en) * 2007-08-03 2009-02-26 The Chinese University Of Hong Kong Analysis of nucleic acids by digital pcr
EP2198293B1 (en) 2007-09-07 2012-01-18 Fluidigm Corporation Copy number variation determination, methods and systems
US8518640B2 (en) 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
US20090286286A1 (en) 2007-11-06 2009-11-19 Ambergen , Inc. Methods for controlling amplification
WO2009105531A1 (en) * 2008-02-19 2009-08-27 Gene Security Network, Inc. Methods for cell genotyping
US9487822B2 (en) 2008-03-19 2016-11-08 Fluidigm Corporation Method and apparatus for determining copy number variation using digital PCR
WO2010009365A1 (en) 2008-07-18 2010-01-21 Raindance Technologies, Inc. Droplet libraries
US9631230B2 (en) 2008-08-12 2017-04-25 Stokes Bio Ltd Methods and devices for digital PCR
WO2010030929A1 (en) 2008-09-12 2010-03-18 Navigenics, Inc. Methods and systems for incorporating multiple environmental and genetic risk factors
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US20120252015A1 (en) 2011-02-18 2012-10-04 Bio-Rad Laboratories Methods and compositions for detecting genetic material
US20120171683A1 (en) 2010-03-02 2012-07-05 Ness Kevin D Analysis of fragmented genomic dna in droplets
US9156010B2 (en) 2008-09-23 2015-10-13 Bio-Rad Laboratories, Inc. Droplet-based assay system
US9598725B2 (en) 2010-03-02 2017-03-21 Bio-Rad Laboratories, Inc. Emulsion chemistry for encapsulated droplets
EP2347245B1 (en) 2008-09-23 2021-11-03 Bio-Rad Laboratories, Inc. Droplet-based assay method
US8450063B2 (en) 2009-01-28 2013-05-28 Fluidigm Corporation Determination of copy number differences by amplification
DE102009027370A1 (de) 2009-07-01 2011-01-05 Robert Bosch Gmbh Verfahren zur Herstellung eines Elektromotors
US8563242B2 (en) 2009-08-11 2013-10-22 The Chinese University Of Hong Kong Method for detecting chromosomal aneuploidy
EP4170043A1 (en) 2009-11-05 2023-04-26 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
JP2013511991A (ja) 2009-11-25 2013-04-11 クアンタライフ, インコーポレイテッド 遺伝子材料を検出する方法および組成物
US9494520B2 (en) 2010-02-12 2016-11-15 Raindance Technologies, Inc. Digital analyte analysis
EP2534267B1 (en) * 2010-02-12 2018-04-11 Raindance Technologies, Inc. Digital analyte analysis
SG10201509766YA (en) * 2010-11-30 2015-12-30 Univ Hong Kong Chinese Detection of genetic or molecular aberrations associated with cancer
EP2649199A2 (en) * 2010-12-07 2013-10-16 Stanford University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
EP3483285B1 (en) * 2011-02-09 2021-07-14 Bio-Rad Laboratories, Inc. Analysis of nucleic acids
EP2675819B1 (en) * 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
JP2014507164A (ja) 2011-02-25 2014-03-27 イルミナ,インコーポレイテッド ハプロタイプ決定のための方法およびシステム
EP2689029A1 (en) 2011-03-22 2014-01-29 Life Technologies Corporation Identification of linkage using multiplex digital pcr
WO2013049443A1 (en) 2011-09-30 2013-04-04 Life Technologies Corporation Methods and systems for visualizing and evaluating data
HU229967B1 (hu) 2011-12-20 2015-03-30 Kps Diagnosztika Zrt Eljárás töredezett nukleinsavak szekvenciájának meghatározására
WO2013109731A1 (en) 2012-01-18 2013-07-25 Singular Bio Inc. Methods for mapping bar-coded molecules for structural variation detection and sequencing
WO2014089368A1 (en) * 2012-12-05 2014-06-12 Bio-Rad Laboratories, Inc Methods for polymerase chain reaction copy number variation assays
CN105555972B (zh) 2013-07-25 2020-07-31 伯乐生命医学产品有限公司 遗传测定
WO2015048571A2 (en) 2013-09-26 2015-04-02 Bio-Rad Laboratories, Inc. Methods and compositions for chromosome mapping
US9670530B2 (en) * 2014-01-30 2017-06-06 Illumina, Inc. Haplotype resolved genome sequencing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090035762A1 (en) * 2007-07-30 2009-02-05 Nicholas Michael Sampas Allele-specific copy number measurement using single nucleotide polymorphism and DNA arrays
US20110015084A1 (en) * 2007-10-25 2011-01-20 Monsanto Technology Llc Methods for Identifying Genetic Linkage

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349692A (zh) * 2013-06-25 2020-06-30 C.威特沃 进行聚合酶链式反应的方法及其相关应用
CN111349692B (zh) * 2013-06-25 2023-10-13 C.威特沃 进行聚合酶链式反应的方法及其相关应用
CN104745718A (zh) * 2015-04-23 2015-07-01 北京嘉宝仁和医疗科技有限公司 一种检测人类胚胎染色体微缺失和微重复的方法
CN108431232B (zh) * 2015-12-04 2022-10-14 10X 基因组学有限公司 用于核酸分析的方法和组合物
CN108431232A (zh) * 2015-12-04 2018-08-21 10X 基因组学有限公司 用于核酸分析的方法和组合物
CN105368957A (zh) * 2015-12-14 2016-03-02 无锡药明康德生物技术股份有限公司 Cho细胞基因拷贝数的微滴数字pcr定量检测方法
CN108603228A (zh) * 2015-12-17 2018-09-28 夸登特健康公司 通过分析无细胞dna确定肿瘤基因拷贝数的方法
CN108603228B (zh) * 2015-12-17 2023-09-01 夸登特健康公司 通过分析无细胞dna确定肿瘤基因拷贝数的方法
CN105969762A (zh) * 2016-04-21 2016-09-28 奥美德诺(北京)基因科技有限公司 用于高gc含量的基因组扩增反应试剂及其应用、试剂盒
CN112639122A (zh) * 2018-09-19 2021-04-09 英芙勒玛提克斯公司 利用等温扩增和相对丰度评估宿主rna
CN113825836A (zh) * 2019-04-09 2021-12-21 阿克生物公司 用于基于核苷酸修饰的耗竭的组合物和方法
CN114514326A (zh) * 2019-05-27 2022-05-17 国家科学研究中心 数字化多路复用检测和/或定量生物分子的方法及其用途
CN114728256A (zh) * 2019-11-14 2022-07-08 生物辐射实验室股份有限公司 通过非终点扩增进行的单细胞的靶标拷贝数的分区型确定

Also Published As

Publication number Publication date
AU2012214312A1 (en) 2013-08-22
US20190241947A1 (en) 2019-08-08
US11499181B2 (en) 2022-11-15
US9127312B2 (en) 2015-09-08
EP2673380A4 (en) 2015-05-20
WO2012109500A3 (en) 2012-10-11
CA2826748A1 (en) 2012-08-16
US10167509B2 (en) 2019-01-01
CA2826748C (en) 2020-08-04
EP3483285A1 (en) 2019-05-15
EP2673380B1 (en) 2018-12-12
EP2673380A2 (en) 2013-12-18
US20160076099A1 (en) 2016-03-17
JP2014506465A (ja) 2014-03-17
US20120322058A1 (en) 2012-12-20
WO2012109500A2 (en) 2012-08-16
EP3483285B1 (en) 2021-07-14
EP3940084A1 (en) 2022-01-19
US20230287486A1 (en) 2023-09-14

Similar Documents

Publication Publication Date Title
US11499181B2 (en) Analysis of nucleic acids
US20240271125A1 (en) Methods and compositions for nucleic acid analysis
JP5386357B2 (ja) 核酸サイズ検出法
CN102985552B (zh) 用于检测遗传物质的方法和组合物
US20160362729A1 (en) Methods and compositions for chromosome mapping
US20120208183A1 (en) Methods for determination of haplotype dissection
US20230313281A1 (en) Methods and Compositions For Preparing Nucleic Acids For Genetic Analysis
JP2024113001A (ja) デザイナヌクレアーゼを用いる修飾の特徴付け方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140205