CN110914449A - 构建测序文库 - Google Patents

构建测序文库 Download PDF

Info

Publication number
CN110914449A
CN110914449A CN201780090660.5A CN201780090660A CN110914449A CN 110914449 A CN110914449 A CN 110914449A CN 201780090660 A CN201780090660 A CN 201780090660A CN 110914449 A CN110914449 A CN 110914449A
Authority
CN
China
Prior art keywords
nucleic acid
sequencing
target
sequence
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780090660.5A
Other languages
English (en)
Other versions
CN110914449B (zh
Inventor
杨亮
冯骏
张海川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celula Inc
Original Assignee
Celula Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celula Inc filed Critical Celula Inc
Publication of CN110914449A publication Critical patent/CN110914449A/zh
Application granted granted Critical
Publication of CN110914449B publication Critical patent/CN110914449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了制备测序文库的方法和成分。该方法和成分能够使用多重PCR,制备二代测序文库,并减少引物二聚体的形成。

Description

构建测序文库
技术领域
本发明涉及测序文库的构件,尤其涉及一种采用多重PCR构建二代测序文库的技术,该技术同时可减少引物二聚体的形成。
背景技术
二代测序(NGS)或大规模平行测序所使用的文库是由多重聚合酶链反应(PCR)构建而成的。测序文库的构建过程会显著影响测序数据的质量和输出。现有的二代测序文库构建方法存在耗时、易于丢失大量样本和形成引物二聚体等缺点,从而导致对待测序遗传物质的低覆盖率。
因此,需要更好的构建测序文库的方法。由其需要一种能够减少引物二聚体形成地、以多重PCR为基础的文库构建方法。
提供本背景信息的目的是阐明申请人认为已知的信息与本发明可能有关,不必认为也不应解释为上述任何信息是依照本发明推衍的现有技术。
发明内容
本发明通过改进二代测序建库实验流程减少了超高重PCR引物二聚体形成。本发明的方法和成分降低了与NGS文库制备、DNA样本利用率相关的成本。
在某些实施方案中,本发明提供了一种构建二代测序文库的方法,该方法包括:a)提供包含核酸的样本,该样本所含部分核酸中应具有靶核酸序列;b)富集步骤a)所述的靶核酸序列;c)针对靶核酸序列进行第一次多重PCR以获得扩增子;d)对步骤c)所得样品进行富集以获得目标扩增子;e)对所述目标扩增子、测序接头和barcode进行第二次多重PCR以获得带有barcode的目标扩增子,从而构建二代测序文库。
在某些实施例中,本发明提供的构建二代测序文库的方法包括:a)提供包含核酸的样本,该样本所含部分核酸中应具有靶核酸序列;b)富集步骤a)所述的靶核酸序列;c)针对靶核酸序列进行第一次多重PCR以获得扩增子;d)对步骤c)所得样品进行富集以获得目标扩增子;e)对所述目标扩增子、测序接头和barcode进行第二次多重PCR以获得带有barcode的目标扩增子;f)富集步骤e)所述的带有barcode的目标扩增子,从而构建二代测序文库。
在某些实施例中,靶核酸序列包括1~300个核苷酸。在某些实施例中,富集步骤包括使样本与磁珠接触,其中所述磁珠结合到样本中的靶核酸序列;以及从剩余样本中分离结合到所述磁珠的靶核酸序列。在某些实施例中,第一次或第二次多重PCR包括多个引物对和热启动聚合酶。在某些实施例中,引物对包括通用序列和目标序列。在某些实施例中,扩增子包括通用序列和目标序列。在某些实施例中,富集步骤包括将扩增子应用到过滤器上,其中过滤器保留大量扩增子,但允许未消耗引物和引物二聚体通过过滤器。在某些实施例中,过滤器是PCR产物过滤器。在某些实施例中,富集步骤包括将扩增子、引物二聚体和/或未消耗引物应用到过滤器上,以提供过滤纯化扩增子、引物二聚体和/或未消耗引物,并使所述过滤纯化扩增子、引物二聚体和/或未消耗引物与磁珠接触,其中所述磁珠结合到所述过滤纯化扩增子;以及从未结合到所述磁珠的引物二聚体和/或未消耗引物中分离结合到所述磁珠的过滤纯化扩增子。
在某些实施例中,第二次多重PCR采用正向引物和下游引物。在特定实施例中,下游引物具有测序接头和通用序列。在某些实施例中,下游引物具有测序接头、barcode和通用序列。在某些实施例中,正向引物包括测序接头和通用序列。在某些实施例中,正向引物具有测序接头、barcode和通用序列。在某些实施例中,富集操作所采用的方法包括使用磁珠在含有带有barcode的目标扩增子、引物二聚体和/或未消化引物的样品中结合所述带有barcode的目标扩增子后自剩余物中分离。
在某些实施例中,富集操作所采用的方法包括使用磁珠在核酸和靶核酸中结合所述核酸而使所述核酸与所述靶核酸分离。在某些实施例中,富集操作所采用的方法包括采用过滤器处理含有靶核酸、引物二聚体、dNTP和/或引物的样品,其中,过滤器仅截留靶核酸。在某些实施例中,过滤器为PCR产物过滤器。在某些实施例中,富集操作所采用的方法还包括对靶核酸进行凝胶电泳、醇沉或柱层析。在某些实施例中,多重PCR包括至少100个靶核酸序列、500个靶核酸序列或1,000个靶核酸序列。在某些实施例中,第一次或第二次多重PCR在低于40次PCR循环、30次PCR循环、20次PCR循环或15次PCR循环中进行。在某些实施例中,第一次多重PCR或第二次多重PCR中使用了磷酸钾。在某些实施例中,多重PCR中磷酸钾的浓度至少为5mM、10mM或15mM。在某些实施例中,多重PCR所采用的引物浓度至少为10nM、20nM或40nM。
在某些实施例中,本发明的方法还包括测序以检测基因变异。在某些实施例中,基因变异为染色体非整倍性。在某些实施例中,染色体非整倍性是胎儿染色体非整倍性。在某些实施例中,靶核酸来自胎儿、儿童和/或成人。
本发明还公开了所构建的测序文库用于测序的用途。在某些实施例中,测序采用第二代测序技术或第三代测序技术。在某些实施例中,测序包括基因组DNA测序、目标片段捕获测序、单链DNA片段测序、化石DNA测序和对生物样本游离DNA进行的测序。在某些实施例中,生物样本包括血液、血浆、尿液或唾液。
本发明公开后,熟悉本领域的普通技术人员很容易理解本发明的相关实施例和某些实施例。
参考引用
本说明书中提及的所有出版物、专利和专利申请的全部内容将通过参考引用纳入本文,等同于每个单独出版物、专利或专利申请经具体和单独指示通过参考引用纳入本文。
附图说明
图1 列出显示了文库PCR产物的大小和数量的数据。该图说明了使用本发明的过滤器和磁珠在多重PCR后去除未消耗引物和引物二聚体的过程。
图2 A-2B列出了表明多重PCR过度扩增会导致NGS文库定量不足的数据。
图3 显示了PCR进程中磷酸钾浓度对靶基因扩增的作用。
图4 显示了PCR引物浓度对靶基因碎片率的作用。
图5 显示了应用本发明对短片段靶基因进行的富集。
图6 显示了不同PCR聚合酶的引物-二聚体和目标DNA测序数据的读取长度直方图。
图7 A-7B显示了文库PCR产物的大小和数量。图7A显示了使用本发明磁珠制备的文库PCR产物的大小和数量。图7B显示了使用本发明过滤器和磁珠制备的文库PCR产物的大小和数量。
具体实施方式
本发明的每项技术特征均可包括多种实施例。因此,在对本发明进行理解时,应认为其所涉及的各项技术特征均包括任一要素或由要素组成的任一组合而构成的多种方式。本发明的应用不限于下述的具体结构和要素组成。本发明可具有某些实施例,并由多种方式实现或执行。此外,本说明书中使用的措辞和术语仅为描述性的,不应视为具有限制性。
发明中“包含”、“包括”或“具有”、“具备”、“涉及”及其它类似用语是指包含其后所列项目、对等项目以及附加项目。
除非上下文另有明确说明,否则如本文和所附权利要求中使用的名词均包含单数及复数含义。例如,“核酸”也暗指技术人员熟知的多种类似核酸或等同物等等。
“大约”一词意味着正负百分之五的偏差,特别是与给定数量有关时。
本发明中所使用的“细胞”是指从原核生物、真核生物或古核生物中分离的任何类型的细胞,包括细菌、古生菌、真菌、原生生物、植物和动物,包括取自组织、器官和活检的细胞、重组细胞、体外培养细胞系中的细胞,以及含有核酸的细胞碎片、细胞成分或细胞器官。该术语还包括人造细胞,例如纳米颗粒、脂质体、聚合物或包裹核酸的微胶囊。细胞也指固定细胞或活细胞。
正向引物本发明中所使用的“细胞”是指从原核生物、真核生物或古核生物中分离的任何类型的细胞,包括细菌、古生菌、真菌、原生生物、植物和动物,包括取自组织、器官和活检的细胞、重组细胞、体外培养细胞系中的细胞,以及含有核酸的细胞碎片、细胞成分或细胞器官。该术语还包括人造细胞,例如纳米颗粒、脂质体、聚合物或包裹核酸的微胶囊。细胞也指固定细胞或活细胞。
术语“核酸”、“核酸分子”、“多核苷酸”和“寡核苷酸”是指包括任何长度的核苷酸聚合形式,核糖核苷酸或脱氧核糖核苷酸。该术语仅指分子的一级结构,因此涉及了三链、双链和单链DNA,以及三链、双链和单链RNA。它还涉及修饰,例如经过甲基化和/或帽化及未经修饰的多核苷酸形式。术语“核酸”、“核酸分子”、“多核苷酸”和“寡核苷酸”在长度上没有预想的区别,这些术语可互换使用。
术语“靶核酸区域”或“靶核酸”是指“靶序列”有待扩增的核酸分子。靶核酸可以是单链或双链,也可以包括靶序列之外的其他序列,这些序列可能不会扩增。术语“靶序列”是指有待扩增靶核酸的特定核苷酸序列。靶序列可以包括包含在靶分子内的探针杂交区域,探针将在适当条件下与该区域形成稳定的杂交体。“靶序列”还可以包括寡核苷酸引物复合的络合序列,可通过作为模板的靶序列延伸。靶核酸原先为单链状态时,术语“靶序列”还指与靶核酸中“靶序列”互补的序列。“靶核酸”原先为单链状态时,“靶序列”还指的是正(+)负(-)链(或正义链和反义链)。
术语“引物”或“寡核苷酸引物”是指与核酸模板链杂交并在诱导合成引物延伸产物的条件下(即在核苷酸和DNA或RNA聚合酶之类聚合诱导剂存在的情况下,以及在适当的温度、pH、金属浓度和盐浓度条件下)合成与模板链互补的核酸链寡核苷酸和聚合诱导剂。为了获取到最高的扩增效率,引物可以优选单链,当然也可以选择双链。选择双链时,引物在制备延伸产物前,可预先分离其链。这种变性步骤一般会受到热的影响,但也可以用碱完成,然后再进行中和。因此,“引物”是对模板的补充,通过氢键或与模板杂交形成引物/模板复合物,然后再由聚合酶合成化合物,该复合物在DNA或RNA合成过程中通过在其3'端加入与模板互补的共价键合碱基来延伸。一般情况下至少使用一组寡核苷酸引物来扩增核酸,寡核苷酸引物含有至少一个正向引物和一个反向引物,可杂交到所要扩增核酸部分两侧的核酸区域。
术语“扩增子”是指PCR反应或其它核酸扩增过程(如连接酶链式反应(LGR)、基于核酸序列的扩增(NASBA)、转录介导扩增(TMA)、Q-β扩增、链置换扩增或靶向扩增等)的扩增核酸产物。RNA可通过RT-PCR生成DNA扩增子。
术语“探针”或“寡核苷酸探针”是指上述定义的多核苷酸,包含与靶核酸分析物中核酸序列互补的核酸序列。探针的多核苷酸区域可以由DNA、RNA和/或合成核苷酸类似物组成。为检测靶序列,探针可以标记。这种标记可以放在5'端、3'端、5'端和3'端以及内部。“寡核苷酸探针”可包含至少一个荧光剂和一个猝灭剂。荧光团荧光的猝灭可通过寡核苷酸中荧光团的核酸外切酶完成(例如,TaqMan分析)或通过寡核苷酸探针与核酸靶序列(例如,分子信标)杂交来完成。另外,用于核酸扩增时,寡核苷酸探针通常将从位于正义和反义引物之间的序列中获得。
值得注意的是杂交序列不需要以完美的互补性来确保稳定的杂交体。许多情况下,10%以下的碱基不匹配时,就会形成稳定的杂交体,从而忽略了4个或更多核苷酸的环。因此文中所用术语“互补”是指某些条件下通过“互补”方式形成稳定双链的寡核苷酸,通常情况下,其同源性约为90%或更高。
术语“杂交”和“杂交操作”是指在核苷酸序列之间形成的复合物,核苷酸序列之间的互补性足以通过Watson-Crick碱基配对形成复合物。一个引物与靶(模板)“杂交”时,该复合物(或杂交体)的稳定性足以满足进行DNA合成生成DNA聚合酶之类所需的功能。
双链DNA的“解链温度”或“Tm”是指由于碱基对之间氢键结合的加热或其他解离作用造成DNA螺旋结构的一半丢失的温度,例如通过酸或碱处理等。DNA分子的Tm取决于其长度和碱基组成。就Tm而言,富含GC碱基对的DNA分子比富含AT碱基对的DNA分子高。温度低于Tm时,分离的互补DNA链会重新自发结合或退火形成双链DNA。核酸最高杂交率出现在低于Tm约25摄氏度的地方。Tm可通过下面关系式估算:Tm=69.3+0.41(GC)%(Marmur等(1962)《分子生物学杂志》5:109-118)。
文中所用的“生物样本”是指受试者分离的细胞、组织或流体样本,包括但不限于血液、血浆、血清、粪便物质、尿液、骨髓、胆汁、脊髓液、淋巴液、皮肤样本、皮肤、呼吸道、肠道和泌尿生殖道外部分泌物、泪液、唾液、牛奶、细胞、肌肉、关节、器官、活检以及体外细胞培养成分的样本,包括但不限于培养基中细胞和组织生长产生的条件培养液,例如,重组细胞、人造细胞和细胞成分。
术语“受试者”是指任何无脊椎动物或脊椎动物受试者,包括但不限于人类和其他灵长类动物,包括非人类灵长类动物,如黑猩猩和其他猿类和猴类;农场动物,如牛、绵羊、猪、山羊和马;家养哺乳动物,如狗、猫;实验室动物,包括啮齿动物,如小鼠、大鼠和豚鼠;鸟类,包括家养、野生和猎用鸟类,如鸡、火鸡和其他鸡类、鸭、鹅等;昆虫,线虫、鱼、两栖动物和爬行动物。该术语不暗指特定的年龄,因此成人和新生儿都均包括在内。
本发明并不限于所述可能会改变的特定方法、指南、细胞系、分析和试剂。另外,文中术语是用来描述本发明特定实施例的,不会限制所附权利要求中本发明的范围。
除非另有定义,否则本文使用的所有科学技术术语的含义均与本发明所属领域普通技术人员通常理解的相同。尽管本发明实施或测试中可以使用与本文所述相似或等效的任何方法和材料,但本文仍然介绍了优选的方法、设备和材料。参考的所有出版物内容均已纳入本文,用以描述和公开可能与本发明相关的出版物所报告的方法、试剂和工具。本文中提到的内容均不能理解为本发明因为先前的发明而不可以提前公开。
除非另有说明,否则本发明的实践将采用本领域技术范围内的计算机科学、统计学、化学、生物化学、分子生物学、细胞生物学、遗传学、免疫学和药理学的常规方法。此类技术在文献中有充分解释。例如,请参见Gennaro,A.R.编辑(1990)《雷明登药学大全》第18版,Mack Publishing Co.;Colowick,S.等人编辑《酶学方法》,美国学术出版社;《实验免疫学手册》第I-IV卷(D.M.Weir和C.C.Blackwell编辑,1986,Blackwell ScientificPublications);Maniatis,T.等人编辑(1989)《分子克隆:实验室手册》第2版,第I-III卷,Cold Spring Harbor Laboratory Press;Ausubel,F.M.等人编辑(1999)《精编分子生物学实验指南》第4版,John Wiley&Sons;Ream等人编辑(1998)《分子生物学技术:强化实验室课程》,美国学术出版社;M.R.Green和J.Sambrook等人(2012)《分子克隆:实验室手册》第4版,Cold Spring Harbor Laboratory Press;Newton&Graham编辑(1997)《PCR(生物技术系列导论)》第2版,Springer Verlag;J.Xu编辑(2014)《二代测序:当前技术和应用》,CaisterAcademic Press;Y.M.Kwon和S.C.Ricke编辑(2011)《高通量二代测序:方法和应用(分子生物学方法)》,Humana Press;L.C.Wong编辑(2013)《二代测序:转换成临床诊断》,Springer。
本发明涉及构建测序文库的方法和该方法的用途。本说明书提供的技术方案能够使用具有减少引物二聚体形成的多重PCR构建二代测序文库(参见实施例)。本发明提供的测序文库构建方法可降低测序成本、提高样本DNA利用率以及节省时间。使用本发明的方法和成分产生的测序文库可用于检测生物样本中的基因状况,例如母体血浆中的胎儿三体性。
样本/核酸
本发明的方法可用于通过核酸的多重扩增(如多重PCR)生成测序文库。在某些实施例中,核酸(如DNA或RNA)是从含有多种其他成分的生物样本中分离得出,如蛋白质、脂质和其他(如非目标)核酸。核酸分子可从在动物、植物、细菌、古细菌、真菌或任何其他生物体中获得的任何物质(如细胞物质(活细胞或死细胞)、细胞外物质、病毒物质、环境样本(如meia基因组样本)、合成物质(如通过PCR或其他扩增技术提供的扩增子))中获得。本发明中使用的生物样本包括病毒颗粒或其制剂,在某些实施例中,核酸从样本中分离出以用作扩增反应中的模板(如制备扩增子文库或片段化文库以进行测序)。在某些实施例中,核酸从样本中分离出以用于构建扩增子文库。
核酸分子可直接从生物体或从生物体中获得的生物样本中获得,例如从血液、尿液、脑脊液、精液、唾液、痰、粪便、毛发、汗液、眼泪、皮肤和组织中获得。实施例性样本包括但不限于全血、母体血液、淋巴液、血清、血浆、口腔细胞、汗液、泪液、唾液、痰、毛发、皮肤、活检、脑脊液(CSF)、羊水、精液、阴道排泄物、浆液、滑液、心包液、腹膜液、胸膜液、渗出液、分泌物、囊液、胆汁、尿液、胃液、小肠液、粪便样本和拭子、吸出物(如骨髓、细针等)、洗液(如口腔、鼻咽、支气管、支气管肺泡、视神经、直肠、肠道、阴道、表皮等)和/或其他标本。
任何组织或体液标本均可用作技术中使用的核酸来源,包括法医标本、存档标本、保存标本和/或长期保存标本,如新鲜冷冻、甲醇/乙酸固定或福尔马林固定石蜡包埋(FFPE)标本和样本。核酸模板分子也可从培养细胞中分离出来,如原代细胞培养或细胞系。从中获得模板核酸的细胞或组织可能遭到病毒或其他细胞内病原体感染。样本还可以是从生物标本中提取的总RNA、cDNA库、病毒或基因组DNA。样本还可以是非细胞来源的分离DNA,例如已储存在冰箱中的扩增/分离DNA。
核酸分子可通过采用多项技术从生物样本中提取获得,例如Maniatis等人(1982)《分子克隆:实验室手册》中所述的技术,Cold Spring Harbor,纽约(例如,参见第280-281页)。
在某些实施例中,此项技术能够选择核酸的大小,例如去除非常短的片段或非常长的片段。在不同实施例中,核酸大小为1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、600、700、800、1,000、5,000、10,000bp或更长。在某些实施例中,本发明的核酸大小选择方法可用于核酸的阳性或阴性选择。在某些实施例中,阴性选择用于从靶核酸与非靶核酸的混合物中去除非靶核酸,在某些实施例中,阳性选择用于从靶核酸与非靶核酸的混合物中捕获和分离靶核酸。
在不同实施例中,在对核酸进行扩增时可使用本领域已知的任何扩增技术。这些技术包括但不限于:PCR、多重PCR、定量PCR、定量荧光PCR(QF-PCR)、多重荧光PCR(MF-PCR)、实时定量PCR(RT-PCR)、单细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、热启动PCR、巢式PCR、原位聚合酶PCR、原位滚环扩增(RCA)、桥式PCR、微效价PCR和乳液PCR。其他合适的扩增方法包括连接酶链反应(LGR)、转录扩增、自我持续序列复制、目标多核苷酸序列的选择性扩增、共有序列引物聚合酶链反应(CP-PCR)、随机引物聚合酶链反应(AP-PCR)、兼并寡核苷酸引物PCR(DOP-PCR)以及核酸序列依赖性扩增(NABSA)。本说明书中可使用的其他扩增方法包括第5,242,794号;第5,494,810号;第4,988,617号;以及第6,582,938号美国专利中所述的此类方法。
在某些实施例中,使用购自Bioline的MyTaq DNA聚合酶进行扩增以生成扩增子。在某些实施例中,使用商业试剂盒(如可购自Epicentre Biotechnologies(威斯康星州麦迪逊市)的试剂盒)进行端修复以生成钝端5'磷酸化核酸端。
在某些实施例中,本发明的方法可用于构建标准化的扩增子panel,例如一套扩增子panel文库。扩增子panel是与疾病(如多基因病)、疾病恶化、发育缺陷、体质病(如取决于基因因素的病因学状态,如遗传性(非肿瘤性)异常或疾病)、代谢途径、药物基因组特征、特性、生物体(如用于物种鉴定)、生物体群、地理位置、器官、组织、样本、环境(如用于宏基因组和/或核糖体RNA(如核糖体小亚基(SSU)、核糖体大亚基(LSU)、5S、1.6S、18S、23S、28S、内转录间隔区序列(ITS)rRNA)研究)、基因、染色体等相关的扩增子集合,例如,癌症突变位点包括与特定癌症表现型有既定相关性的特异基因或基因突变(如一个或多个ABL.1、AKT1、AKT2、ATM、PDGFRA、EGFR、FGFR(如FGFR1、FGFR2、FGFR3)、BRAF(如包含V600处的突变,如V600E突变)、RUNX1、TET2、CBL、EGFR、FLT3、JAK2、JAK3、KIT、RAS(如KRAS(如包含G12、GI3或A146处的突变,如G12A、G12S、G12C、G12D、G13D或A146T突变),HRAS(如包含G12处的突变,如G12V突变)、NRAS(如包含Q6 L处的突变,如Q61R或Q61K突变)、MET、PIK3CA(如包含H1047处的突变,如aH1047 L、H1047 L或I-11047R突变)、PTEN、TP53(如包含R248、YI26、G245或A159处的突变,如R248W、G245S或A159D突变)、VEGFA、BR.CA、RET、PTPN11、HNHF1A、RBI、CDH1ERBB2、ERBB4、SMAD4,SKT11(如包含Q37处的突变)、ALK、IDH1、IDH2、SRC、GNAS、SMARCB1、VHL、MLH1、CTNNB1、KDR、FBXW7、AFC、CSF1R、NPMI、MPL、SMO、CDKN2A、NOTCH1、CDK4、CEBPA、CREBBP、DNMT3A、FES、FOXL2、GATA1、GNA11、GNAQ、HIF1A、IKBKB、MENNLF2、PAX5、PIK3R1、PTCH1、STK11等)。一些扩增子panel针对特定“癌症热点”,即基因组中含有已知突变的区域,这类突变与癌症恶化和治疗耐药性相关。
在某些实施例中,单个基因的扩增子panel包括用于基因外显子(如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多外显子)的扩增子。在某些实施例中,用于物种(或菌株、亚种、类型、亚型、属或其他分类水平和/或基于种族发生间距的操作分类单位(QTU))鉴定的扩增子panel可包括对应于一系列基因或基因座的扩增子,此类基因或基因座共同提供相对于其他物种(或菌株、亚种、类型、亚型、属或其他分类水平)的一种或多种物种(或菌株、亚种、类型、亚型、属或其他分类水平)的特异性鉴定(如用于细菌(如MRSA)、病毒(如HIV、HCV、HBV、呼吸道病毒等)),或者用于确定耐药性和/或药物敏感性(如用于细菌(如MRSA)、病毒(HIV、HCV、HBV、呼吸道病毒等))。
panel中的扩增子通常包含50至1000个碱基对,例如,在某些实施例中,panel中的扩增子大约包含50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975或1000个碱基对。在某些实施例中,扩增子panel包括横跨基因组的扩增子集合,如提供基因组序列。
扩增子panel通常通过寡核苷酸的扩增(如从样本中产生扩增子panel)和/或寡核苷酸探针测序疾病相关基因(如评定基因组中是否存在特定的突变和/或等位基因)而产生。在某些实施例中,10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000或更多的基因、基因座、区域等被用于制备10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000或更多的扩增子。在某些实施例中,采用高通量单管扩增反应(如超过1000通道的PCR)制备扩增子。
在一些优选实施例中,尽量减少扩增(如热)循环的次数(例如,在某些实施例中,少于常规技术中使用的循环次数),以保持扩增子均匀覆盖靶序列,以便在扩增子中提供靶序列的精确再现,和/或尽量减少和/或消除偏差,例如在扩增的中后期内引入扩增样本的偏差。在某些实施例中,扩增循环的次数少于40次循环、少于30次循环、少于20次循环或少于15次循环。待扩增和测序的核酸可以是基因组DNA或cDNA(即,通过逆转录在RNA中获得)。根据本发明方法,游离DNA或RNA可扩增并用于构建测序文库。核酸分子的来源包括但不限于细胞器、细胞、组织、器官和生物体。例如包含待分析核酸的生物样本可以是从原核、古生菌或真核生物体中分离的任何细胞、组织或液体样本(包括但不限于例如血液、唾液、口腔拭子细胞、粪便、尿液、骨髓、胆汁、脊髓液、淋巴液、痰液、腹水、支气管灌洗液、滑液、皮肤样本、皮肤、呼吸道、肠道和泌尿生殖道的外部分泌物、泪液、唾液、母乳、器官、活组织检查)、细胞样本(包括来自细菌、古细菌、真菌、原生生物、植物和动物的细胞)以及体外细胞培养成分(包括在培养基中培养的重组细胞和组织)。生物样本还可能包含来自病毒的核酸。在某些实施例中,核酸(例如DNA或RNA)均从单个细胞或感兴趣的选定细胞群体中获得。细胞可以是活细胞或固定细胞。在某些实施例中,细胞是无脊椎动物细胞、脊椎动物细胞、酵母细胞、哺乳动物细胞、啮齿动物细胞、灵长类细胞或人类细胞。此外,细胞可以是遗传异常细胞、稀有血细胞或癌细胞。靶核酸可以来自胎儿、儿童或成人。
富集方法
本发明方法和成分可以用于富集测序文库的靶核酸或扩增子。本发明所使用的富集方法可能包括过滤器磁珠的使用。
在某些实施例中,使用PCR过滤器富集靶核酸或扩增子。此类PCR过滤器包括使用尺寸排阻膜和真空过滤的PCR板。该方法通常包括将包含核酸和/或扩增子的样本装载到包含尺寸排阻膜的孔中,真空过滤孔中的样本,然后向孔中加入缓冲溶液以回收核酸和/或扩增子。在某些实施例中,样本包含通过滤膜并与靶核酸和/或扩增子分离的引物二聚体和/或未消耗引物。
缓冲溶液和试剂
在本发明方法中,将包含核酸(例如扩增子)和磁珠的混合物维持在适合核酸与磁珠上的官能团结合的条件下。在某些实施例中,本说明书所述的方法和试剂(药剂)与涉及核酸与磁珠(例如固相载体)结合的多种过滤技术(例如核酸过滤技术)一起使用,包括其内容均通过参考引用纳入本说明书的第5,705,628号、第5,898,071号、第6,534,262号、第WO99/58664号美国专利;申请公开第2002/0094519号美国专利、第5,047,513号、第6,623,655号和第5,284,933号美国专利所述的技术。
如本说明书所述,使用一种或多种试剂(例如缓冲溶液、酶)结合磁珠或从磁珠中去除核酸(例如扩增子)。在不同实施例中,促进靶核酸与磁珠联合(例如结合)和/或分离的试剂成分存在于一种试剂或多种试剂(例如第一种试剂、第二种试剂、第三种试剂等)中。因此,当在本发明方法中使用一种以上的试剂时,实施例规定需要同时或按顺序使用此类试剂。根据本说明书所述方法的使用目的,该领域技术人员可确定本发明方法所使用的试剂数量和顺序。
在某些实施例中,本发明方法使用试剂使混合物中的核酸(例如扩增子)沉淀或吸附到磁珠(核酸沉淀剂)表面的官能团上,在一个实施例中,使用足够浓度的核酸沉淀剂,将混合物中的核酸沉淀到磁珠上。
“核酸沉淀试剂”或“核酸沉淀剂”是一种将核酸从溶液中分离的成分。适用沉淀剂包括醇(例如短链醇:乙醇或异丙醇等)和聚羟基化合物(例如聚亚烷基二醇)。核酸沉淀试剂可以包含一种或多种此类试剂。核酸沉淀试剂具备足够浓度,非特异性且可逆地将核酸结合到磁珠上。根据所使用的浓度,可使用此类核酸沉淀剂(例如)非特异性或特异性地将核酸结合到磁珠(例如包含COOH作为官能团的磁珠)上。
在一个实施例中,使用了羧基磁珠,这涉及使用各种核酸沉淀试剂或拥挤试剂[例如醇、乙二醇(例如亚烷基、聚亚烷基二醇、乙烯、聚乙二醇)和聚乙烯吡咯烷酮(PVP)(例如聚乙烯吡咯烷酮40)],将核酸结合到羧化固相载体(例如磁性和/或顺磁性微粒)。在某些实施例中,对此类沉淀和/或拥挤试剂的分子量进行调节,以制备具有显著沉淀能力的低粘度溶液,在某些实施例中,通过调整沉淀和/或拥挤试剂的浓度、沉淀和/或拥挤试剂的分子量或通过调节溶液的盐、pH、极性或疏水性,进行特定尺寸的核酸分离。大核酸分子在低浓度盐、沉淀和/或拥挤试剂下沉淀和/或从溶液中挤出,而小核酸分子在高浓度沉淀和/或拥挤试剂下沉淀和/或吸附。例如请参见第5,705,628号、第5,898,071号、第6,534,262号美国专利和公开申请第2002/0106686号ITS,所有内容通过参考引用纳入。
本发明方法所使用的适用醇(例如乙醇、异丙醇)浓度(最终浓度)约5%至100%、从约40%至60%、约45%至55%以及约50%至54%(按体积描述:体积比)。
适用聚亚烷基二醇包括聚乙二醇(PEG)和聚丙二醇。适用PEG可从Sigma处获得(Sigma Chemical Co.、St.Louis Mo.,分子量8000,不含Dnase和Rnase,目录号25322-68-3)。聚乙二醇(PEG)分子量可介于约250至约10,000、约1000至约10,000、约2500至约10000、约6000至约10,000、约6000至约8000、约7000至约9000以及约8000至约10,000。通常,PEG的存在提供了使亲水核酸分子从溶液分离的疏水溶液。在一个实施例中,PEG浓度为大约5%至20%。在某些实施例中,PEG浓度介于约7%至约18%、约9%至约16%以及约10%至约15%(按重量描述:体积比)。
可选择性地向试剂中加入盐,使混合物中的核酸沉淀到磁珠上。有利于促进以分离为目标的核酸分子吸附到磁响应微粒上的适用盐包括氯化钠(NaCl)、氯化锂(LiCl)、氯化钡(BaCl2)、氯化钾(KCl)、氯化钙(CaCl2)、氯化镁(MgCl2)和氯化铯(CsCl)。在某些实施例中,使用了氯化钠。通常,盐会使核酸分子的负电荷排斥最小化。适用于这种方法的各种盐表明还可使用其他许多种盐,并且可以由该领域普通技术人员凭经验确定适用浓度。盐浓度可介于约0.005M至5M、约0.1M至0.5M、约0.15M至0.4M以及约2M至4M。
在实施例中,其官能团与混合物中的一种或多种核酸互补并因此杂交的序列,杂交缓冲溶液可用于结合。适用于这一方法的缓冲溶液是该领域技术人员所知的缓冲溶液。一个适用缓冲溶液实施例是包含NaCl(例如大约0.1M至0.5M)、三羟甲基氨基甲烷盐酸盐(例如10mM)、EDTA(例如0.5mM)、柠檬酸钠(SSC)及其组合的缓冲溶液。
适用于本发明方法的“洗脱缓冲溶液”是从磁珠官能团中(例如选择性地)洗脱靶核酸的缓冲溶液。在某些实施例中,洗脱缓冲溶液是水或水溶液。例如,适用缓冲溶液包括但不限于三羟甲基氨基甲烷盐酸盐(例如10mM,pH 7.5)、三氨基甲烷醋酸盐、蔗糖(20%w/v)、EDTA和甲酰胺(例如90%至100%)溶液。在某些实施例中,洗脱缓冲溶液是包含例如钠、锂、钾和/或铵等单价(一种或多种)阳离子(例如约0.1M至0.5M)的缓冲盐溶液。当使用适用低离子强度洗脱缓冲溶液时,核酸可快速从固相载体中洗脱(例如在三十秒或更短时间内)。
此外,在从磁珠分离磁珠结合靶物种之前,可通过洗涤核酸结合到其上的磁珠(例如通过使用适当的洗涤缓冲溶液接触磁珠),从磁珠中去除杂质[例如蛋白质(例如酶)]、代谢物、化学物质、未合并的核苷酸和/或引物或细胞碎片)。如本说明书所使用的术语,“洗涤缓冲溶液”是一种能够溶解或去除可能结合到微粒、与吸附的核酸相关联或存在于本体溶液中的杂质,但不溶解吸附到磁珠上靶核酸的成分。洗涤缓冲溶液的pH、溶质成分和浓度可因预期存在的杂质类型而异。例如乙醇[例如70%(v/v)]是一种适用于去除过量PEG和盐的首选洗涤缓冲溶液。在一个实施例中,洗涤缓冲溶液包含NaCl(例如0.1M)、Iris(例如10mM)和EDTA(例如0.5mM)。还可使用一种以上的洗涤缓冲溶液,洗涤具有结合核酸的磁珠。可根据需要,经常洗涤磁珠(例如一次、两次、三次或更多次,例如,三到五次)以去除预期杂质。但洗涤次数最好限制在能够最大程度降低结合靶物种产量损失。
适用洗涤缓冲溶液具有若干特性。首先,洗涤缓冲溶液必须具备足够高的盐浓度(足够高的离子强度),使结合到磁珠上的核酸不会从磁珠上洗脱,并保持结合到微粒上。适用盐浓度约为0.1M以上,首选约0.5M。其次,选择使结合到核酸或微粒上的杂质溶解的缓冲溶液。缓冲溶液的pH、溶质成分和浓度可因预期存在的杂质类型而异。适用洗涤溶液包含以下:0.5×柠檬酸钠盐缓冲溶液[SSC;20×储备溶液包含3M氯化钠和300mM柠檬酸三钠(使用HQ调节至pH 7.0)]、100mM硫酸铵、400mM Tns pH 9、25mM MgCH和1%牛血清白蛋白(BSA)、1-4M盐酸胍(例如包含40%异丙醇和1%Triton X-100的1M盐酸胍)以及0.5M NaCl。在一个实施例中,洗涤缓冲溶液包含25mM三氨基甲烷醋酸盐(pH 7.8)、100mM醋酸钾(KOAc)、10mM乙酸镁(Mg2OAc)和1mM二硫苏糖醇(DTT;Cleland's Reagent)。在另一个实施例中,洗涤溶液包含2%SDS、10%Tween和/或10%Triton。
本发明方法所使用的试剂成分可包含在单一试剂(药剂)中或作为单独成分。在使用试剂单独成分的实施例中,此类成分可与混合物同时或按顺序结合。根据特定实施例,结合元素的结合顺序不一定至关重要。试剂中所含成分的性质和数量如上述方法所述。试剂可配制为浓缩形式,以使稀释操作能够获得本说明书方法所述的功能和/或浓度。
在核酸(例如DNA和/或RNA)扩增和测序之前,可以使用任何方法对细胞进行预处理。例如在某些实施例中,可通过使用一种或多种洗涤剂(例如Triton-X-100、Tween 20、Igepal CA-630、NP-40、Brij 35和十二烷基硫酸钠)和/或变性剂(例如胍盐试剂)对细胞进行处理,以破坏(或溶解)细胞膜。在具有细胞壁的细胞类型中,例如酵母和植物,最初去除细胞壁可能是促进细胞裂解所必需的。可去除细胞壁,例如,使用酶,如纤维素酶、几丁质酶或细菌溶菌酶,如溶菌酶(破坏肽聚糖)、甘露聚糖酶和聚糖酶。如本领域技术人员所知,选择特定的酶用于细胞壁去除将取决于所研究的细胞类型。
裂解后,可使用常规技术从细胞中提取核酸,如酚氯仿法提取、醇沉法或与固相(如二氧化硅)的非特异性结合。应小心避免在提取步骤中剪切待测序的核酸。此外,酶或化学方法可用于去除污染的细胞成分(例如核糖体RNA、线粒体RNA、蛋白质或其他大分子)。例如,蛋白酶可用来去除污染的蛋白质。核酸酶抑制剂可用于防止核酸降解。
PCR方法
在测序之前,可使用本领域已知的任何适当聚合酶链反应(PCR)技术扩增DNA。在PCR中,过量使用一对引物与靶核酸的互补链进行杂交。引物均由聚合酶以靶核酸为模板进行延伸。延伸产物在从原始靶链解离后成为靶序列。然后用聚合酶将新引物杂交和延伸,重复该循环以几何方式增加靶序列分子的数量。扩增样本中靶核酸序列的PCR方法在本领域中是众所周知的,例如,已在Innis等人(编辑)《PCR方案》(学术出版社,纽约,1990);Taylor(1991)《聚合酶链反应:基本原理和自动化》、《PCR:实用方法》,McPherson等人(编辑)牛津大学出版社;Saiki等人(1986)《自然》324:163;以及第4,683,195号、第4,683,202号和第4,889,818号美国专利中进行了描述,所有内容均通过参考引用纳入全文。
特殊情况下,PCR使用相对较短的寡核苷酸引物,这些引物位于待扩增的靶核苷酸序列的侧面,按以使其3'端相对的方式进行定向,每个引物朝向彼此延伸。一般情况下,引物寡核苷酸的长度在10-100核苷酸之间的范围内,例如15-60、20-40等,通常更多在20-40核苷酸之间的范围内,以及在所述范围内的任何长度中。
优选通过加热提取DNA和使DNA变性,并与存在过量摩尔的第一和第二引物杂交。在存在四种脱氧腺苷三磷酸(dNTPs--dATP、dGTP、dCTP和dTTP)时催化聚合,使用依赖引物和模板的多核苷酸聚合剂,例如能够产生引物延伸产物的所有酶,例如大肠杆菌DNA聚合酶I、DNA聚合酶I的Klenow片段、T4 DNA聚合酶、从水生栖热菌(Taq)分离的热稳定DNA聚合酶,这些热稳定DNA聚合酶可从多种来源(例如Perkin Elmer)、嗜热栖热菌(United StatesBiochemicals)、嗜热脂肪芽孢杆菌(Bio-Rad)、或嗜热高温球菌(“Vent”聚合酶,NewEngland Biolabs)获得。这产生了两个“长链产物”,其5'端分别含有共价连接到原始链的新合成互补序列的引物。然后将反应混合物返回聚合条件下,例如通过降低温度、使变性剂灭活或添加更多聚合酶,并开始第二个循环。第二个循环提供两个原始链、第一个循环的两个长链产物、从原始链复制的两个新的长链产物、以及从长链产物复制的两个“短链产物”。短链产物具有靶序列的序列,每端均有一个引物。在每一个额外的循环中,产生另外两个长链产物,短链产物的数量等于上一个循环结束时剩余的长链产物和短链产物的数量。因此,包含靶序列的短链产物数量随着每个循环呈指数增长。最好用市售的热循环仪(例如可从Bio-Rad、Applied Biosystems和Qiagen处获得的热循环仪)进行PCR。
如上所述,可通过用反转录酶将RNA反向转录成cDNA,然后进行PCR(即RT-PCR)来扩增RNA。适当的反转录酶包括禽成髓细胞瘤病毒(AMV)反转录酶和莫洛尼鼠白血病病毒(MMLV)反转录酶(例如可从Promega、New England Biolabs和Thermo Fisher ScientificInc.获得的反转录酶)。或者,如第5,322,770号美国专利所述,单一酶可用于这两个步骤,通过参考引用纳入本说明书。以这种方式,可以从所有类型的RNA中生成cDNA,包括mRNA、非编码RNA、microRNA、siRNA和病毒RNA,从而对RNA转录本进行测序。
在某些实施例中,扩增包括执行克隆扩增方法,例如但不限于桥式扩增法、乳化PCR(ePCR)或滚环扩增法。特殊情况下,克隆扩增方法,例如但不限于桥式扩增法、乳化PCR(ePCR)或滚环扩增法,可用于在离散区域中聚集扩增的核酸(例如,请参见第7,790,418号;第5,641,658号;第7,264,934号;第7,323,305号;第8,293,502号;美国专利第6,287,824号美国专利;和国际公开WO 1998/044151 A1;Lizardi等人(1998)《自然遗传学》19:225-232;Leamon等人(2003)《电泳》24:3769-3777;Dressman等人(2003)《美国科学院院报》Natl.Acad.Sci.100:8817-8822;Tawfik等人(1998)《自然生物技术》16:652-656;Nakano等人(2003)《生物技术杂志》102:117-124;通过参考引用纳入全文)。为此,适用于高通量扩增的测序接头序列(例如,具有与通用扩增引物或桥式PCR扩增引物互补的序列的测序接头)可以添加到5’端和3’端的DNA或cDNA片段中。例如,连接到固体支持物上的桥式PCR引物可用于获取具有与桥式PCR引物互补的测序接头序列的DNA模板。然后可扩增所述DNA模板,其中每个DNA模板的扩增产物聚集在固体支持物上的离散区域中。
特殊情况下,本发明的方法适用于数字PCR方法。对于数字PCR,在进行PCR之前,将含有核酸的样本分成大量分区。可用本领域已知的多种方式实现分区,例如,通过使用微孔板、毛细血管、乳液、小型化腔室阵列或核酸结合表面。样本的分离可包括在分区之间分配任何适当的部分,最多包括整个样本。每个分区包括从其他分区流体体积处隔离的流体体积。分区可通过液相(例如乳化的连续相)、固相(例如容器的至少一个壁)或其组合彼此隔离。在某些实施例中,分区可包括以连续相设置的液滴,使得液滴和连续相共同形成乳液。
分区可通过任何适当的程序、以任何适当的方式和具有任何适当的性质来形成。例如,可通过样本的搅拌(例如,摇动、搅拌、超声处理等)用流体分配器(例如移液管)和液滴发生器形成分区,等等。因此,分区可以串行、并行或批量形成。分区可具有任何适当的体积。分区可具有基本一样的体积或者可具有不同的体积。具有基本相同体积的实施例性分区为单分散液滴。分区的实施例性体积包括小于约100、10或1L、小于约100、10或1nL、或小于约100、10或1pL的平均体积等等。
样本分离后,在分区中进行PCR。在形成分区时,可在分区中进行一个或多个反应。或者,可在分区形成后将一种或多种试剂添加到分区中,以使其进行反应。可通过任何适当装置添加试剂,例如流体分配器、液滴融合等。
在本发明中的某些实施例中,第一或第二多重PCR包括磷酸钾的使用。在特定实施例中,多重PCR中磷酸钾的浓度至少为5mM、10mM或15mM。发明人已经证明,在本发明的方法中使用磷酸钾提高了多重PCR中靶DNA扩增的覆盖率。
在某些实施例中,调节多重PCR中的引物浓度可达到高扩增子均匀性。在某些实施例中,较低浓度的引物增加了靶核酸的比率。
在PCR扩增后,通过计算包含PCR扩增子的分区来量化核酸。样本的分区使通过假设分子的数量遵循泊松分布来量化不同分子的数量。有关数字PCR方法的描述,例如,请参见,Hindson等人(2011)《分析化学》-83(22):8604-8610;Pohl和Shih(2004)《分子诊断学专家评论》-4(1);41-47;Pekin等人(2011)《芯片实验室》11(13):2156-2166;Pinheiro等人(2012)《分析化学》-84(2):1003-1011;Day等人(2013)《方法》59(1):101-107;通过参考引用纳入本说明书。
寡核苷酸,包括引物和探针,可通过标准技术简便合成,例如通过亚磷酰胺化学的固相合成,如第4,458,066号和第4,415,72号美国专利中所公开的信息,通过参考引用纳入本说明书;Beaucage等人《四面体》(1992)48:2223-2311;以及Applied Biosystems《用户公报》第13期(1987年4月1日)。其他化学合成方法包括,例如,Narang等人所描述的磷酸三酯法《酶学方法》(1979)68:90和Brown等人公开的磷酸二酯法《酶学方法》(1979)68:109。Poly(A)或poly(C)或其他非互补核苷酸延伸可使用这些相同的方法结合到寡核苷酸中。聚氧化乙烯延伸部分可通过本领域已知的方法结合到寡核苷酸上Moore等人,《美国化学学会杂志》《美国化学会志》(1991)113:6324-6326:Levenson等人的第4,914,210号美国专利;Durand等人《核酸研究》(1990)18:6353-6359;以及Horn等人《四面体快报》(1986)27:4705-4708。
此外,寡核苷酸(例如引物和探针)可结合到barcode上进行检测。
已知有几种方法可衍生具有反应性官能团的寡核苷酸,因此允许添加标记。例如,有几种方法可用于生物素化探针,以使放射性、荧光、化学发光、酶或电子密度barcode可通过亲和素附着。例如,请参见Broken等人《核酸研究》(1978)5:363-384,其中公开了铁蛋白-亲和素-生物素标记的使用;以及Chollet等人《核酸研究》(1985)13:1529-1541,其中公开了寡核苷酸5'端通过氨基烷基磷酰胺测序接头臂进行的生物素化。同时有几种方法可用于合成氨基衍生的寡核苷酸,这些寡核苷酸易于被荧光或其他类型的由氨基反应性基团衍生的化合物标记,例如异硫氰酸酯、N-羟基琥珀酼亚胺等,例如,请参见Connolly《核酸研究》(1987)15:3131-3139。Gibson等人《核酸研究》(1987)15:6455-6467以及授予Miyoshi等人的第4,605,735号美国专利。合成巯基衍生的寡核苷酸的方法也可用,这些寡核苷酸可与巯基特异性标记反应,例如请参见授予Fung等人、Connolly等人的美国专利第4,757,141号《核酸研究》(1985)13:4485-4502和Spoat等人《核酸研究》(1987)15:4837-4848。Matthews等人在《分析化学》1988;169:1-25中提供了对标记DNA片段的方法的全面综述。
例如,可通过将荧光分子连接到分子的非连接末端而荧光标记寡核苷酸。选择适当荧光标记的指南可以在Smith等人《酶学方法》(1987)155:260-301;Karger等人《核酸研究》(1991)19:4955-4962;Guo等人(2012)Anal.Bioanal.Chem.402(10):3115-3125;和《Molecular Probes荧光探针和标记技术手册》第11版,Johnson和Spence编辑,2010年(Molecular Probes/Life Technologies)中找到。荧光标记包括荧光素及其衍生物,如第4,318,846号美国专利和Lee等人《细胞计量学》(1989)10:151-164中所公开的信息。用于本发明的染料包括3-苯基-7-香豆素异氰酸酯、吖啶,如9-异硫氰酸酯吖啶和吖啶橙、芘、苯并恶二唑和二苯乙烯,如第4,174,384号美国专利所公开的信息。其他染料包括SYBR绿、SYBR金、亚基马黄、德克萨斯红、3-(8-羧基戊基)-3'-乙基-5,5'-二甲基氧杂-碳菁(CYA);6-羧基荧光素(FAM);CAL荧光橙560,CAL荧光红610,类星体蓝670;5,6-羧基罗丹明-110(R110);6-羧基罗丹明-6G(R6G);N',N',N',N'-四甲基-6-羧基罗丹明(TAMRA);6-羧基-X-罗丹明(ROX);2',4',5',7',-四氯-4-7-二氯荧光素(TET);2',7'-二甲氧基-4',5'-6羧基罗丹明(JOE);6-羧基-2',4,4',5',7,7'-六氯荧光素(HEX);蜻蜓橙;ATTO-Tec;Bodipy;ALEXA;VIC,Cy3和Cy5。这些染料在可从商场上多个供应商处购得,例如,Life Technologies(加利福尼亚州卡尔斯巴德)、Biosearch Technologies(加利福尼亚州诺瓦托)和IntegratedDNA Technolgies(爱荷华州科拉尔维尔)。荧光barcode包括荧光素及其衍生物,例如,在第4,318,846号美国专利和Lee等人在《细胞计量学》(1989)10:151-164中公开的信息,以及6-FAM、JOE、TAMRA、ROX、HEX-1、HEX-2、ZOE、TET-1或NAN-2等类似物。
也可以使用小沟结合(MGB)分子标记寡核苷酸,例如,第6,884,584号、第5,801,155号美国专利;Afonina等人(2002)《生物技术》32:940-944,946-949;Lopez-Andreo等人(2005)《肛门生物化学》339:73-82;Biochem.Belousov等人(2004)《人类基因组学》1:209-217中公开的信息。与未修饰的寡核苷酸相比,具有共价连接MGB的寡核苷酸对其互补靶更具序列特异性。此外,与未修饰的寡核苷酸相比,MGB基团增加互补DNA靶链的杂交稳定性,允许与较短的寡核苷酸杂交。
此外,可使用以下所述的技术,对寡核苷酸进行吖啶酯(AE)标记。当前的技术允许将AE标记放置在探针内的任何位置。参见,例如,Nelson等人(1995)“吖啶酯化学发光法检测”,发表于《非同位素探针、印迹和测序》,Kricka L.J.(编辑),学术出版社,加州圣地亚哥;Nelson等人(1994)“将杂交保护试验(HPA)应用于PCR”,发表于《聚合酶链反应》,Mullis等人(编辑),马萨诸塞州波士顿Birkhauser出版社;Weeks等人,Clin.Chem.(1983)29:1474-1479;Berry等人,Clin.Chem.(1988)34:2087-2090。使用非基于核苷酸的连接臂化学方法(允许将标记放置在探针内的任何位置),AE分子可直接连接到探针。例如,请参见第5,585,481号和第5,185,439号美国专利。
测序接头
本发明的方法包括将测序接头连接到核酸(例如,核酸(例如,NGS文库的文库片段或扩增子文库的扩增子)。在某些实施例中,使用酶将测序接头连接到核酸。酶可以是连接酶或聚合酶。连接酶可以是能够将寡核苷酸(单链RNA、双链RNA、单链DNA或双链DNA)连接到另一个核酸分子的任何酶。适当的连接酶包括T4 DNA连接酶和T4 RNA连接酶(此类连接酶可在市场中购得,例如,从New England Biolabs处购得)。连接酶的使用方法在本领域众所周知。连接可以是平末端,或通过使用互补的悬挂式末端。在某些实施例中,核酸的末端可经磷酸化(例如,使用T4多核苷酸激酶)、修复、修剪(例如,使用核酸外切酶)或填充(例如,使用聚合酶和dNTP),以形成平末端。在产生平末端之后,可使用聚合酶和dATP处理末端以形成,无需模板,添加到片段的3'端,从而产生单个A突出端。将单个A用于指导这些片段与5'端具有单个T突出端的片段进行连接,称为T-A克隆方法。聚合酶可以是能够向模板核酸添加分子的3'和5'末端添加核苷酸的任何酶。
在某些实施例中,测序接头包括通用序列和/或索引,例如,barcode核苷酸序列。此外,测序接头可包含多种序列元件中的一种或多种,包括但不限于一种或多种扩增引物退火序列或其互补序列、一种或多种测序引物退火序列或其互补序列、一种或多种barcode、在多个不同测序接头或不同测序接头子集之间共享的一种或多种公共序列(例如,通用序列)、一个或多个限制性内切酶识别位点、与一个或多个靶多核苷酸突出端互补的一个或多个突出端,一个或多个探针结合位点(例如,用于连接到测序平台,例如,用于大规模平行测序的流动细胞,例如Illumina,Inc.开发的产品),一个或多个随机或临近随机序列(例如,在一个或多个位置,从一组两个或多个不同核苷酸中随机选择的一个或多个核苷酸,其中包括在一个或多个位置选择的每个不同核苷酸,均位于包含随机序列的测序接头池中),及其组合。两个或多个序列元件可以彼此不相邻(例如,由一个或多个核苷酸分开)、彼此相邻、部分重叠或完全重叠。例如,扩增引物退火序列也可用作测序引物退火序列,序列元件可位于3'端或其附近,也可位于5'端或其附近,或位于测序接头寡核苷酸的内部。当测序接头寡核苷酸能够形成二级结构(例如,发夹)时,序列元件可部分或完全位于二级结构之外,部分或完全位于二级结构之内,或位于参与二级结构的序列之间。例如,当测序接头寡核苷酸包含发夹结构时,序列元件可部分或完全位于可杂交序列(“茎”)的内部或外部,包括杂交序列之间的序列(“环”)。在某些实施例中,具有不同barcode的多个第一测序接头寡核苷酸中的第一测序接头寡核苷酸包含多个第一测序接头寡核苷酸中所有第一测序接头寡核苷酸中共有的序列元件。在某些实施例中,所有第二测序接头寡核苷酸包含所有第二测序接头寡核苷酸共有的序列元件,不同于第一测序接头寡核苷酸共有的序列元件。序列元件的差异可以是任何此类差异,即,至少一部分不同的测序接头无法完全对齐,例如,由于序列长度的变化,一个或多个核苷酸的缺失或插入,或一个或多个核苷酸位置的核苷酸组成的变化(例如,碱基变化或碱基修饰)。
在某些实施例中,测序接头寡核苷酸包含与一种或多种靶多核苷酸互补的5'突出端、3'突出端或两者兼有。互补突出端长度可以是一个或多个核苷酸,包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多长度的核苷酸。互补的突出端可包括固定的序列。互补的突出端可包括一个或多个核苷酸的随机序列,使得一个或多个核苷酸从一个或多个位置的一组两个或更多个不同的核苷酸中随机选择,每个不同的核苷酸在测序接头池中的一个或多个位置重进行选择,互补的突出端包括随机序列。在某些实施例中,测序接头突出端与通过限制性内切酶消化产生的靶多核苷酸突出端互补。在某些实施例中,测序接头突出端由腺嘌呤或胸腺嘧啶组成。
在某些实施例中,测序接头序列可包含分子结合位点识别元件,以便于下游应用的靶核酸的识别和分离。分子结合作为亲和机制允许两个分子之间的相互作用产生稳定的缔合复合物。能够参与分子结合反应的分子包括蛋白质、核酸、碳水化合物、脂质和小型有机分子,例如,配体、肽或药物。
当将核酸分子结合位点用作测序接头的一部分时,其可被用于采用选择性杂交,以分离靶序列。选择性杂交可限制与靶核酸(含有具有分子结合位点的测序接头)的大量杂交,并捕获与分子结合位点充分互补的核酸。因此,通过“选择性杂交”,可检测含有许多核酸池的非纯样本中靶多核苷酸的存在。核苷酸-核苷酸选择性杂交分离系统的一个实施例包括具有几个捕获核苷酸的系统,其包含与分子结合鉴定元件互补的序列,并且可选地固定到固体支持物。在某些实施例中,捕获多核苷酸可与靶序列本身互补,或与包含在测序接头内的barcode或唯一标记互补。捕获多核苷酸可固定在各种固体支持物上,例如,板孔内、单分散球体、微阵列或本领域已知的任何其他合适的支持表面。附着在固体支持物上的杂交互补测序接头多核苷酸可通过洗去不需要的非结合核酸来进行分离,留下需要的靶多核苷酸。若讲互补的测序接头分子固定到顺磁性球体或类似的水珠技术上,以进行分离,则球体可与含有测序接头的靶多核苷酸一起在试管中混合。当测序接头序列与固定在球体上的互补序列杂交时,不良分子可冲洗掉,同时使用磁铁或类似试剂将球体保持在试管中。随后可通过升高温度、改变酸碱度或通过使用本领域已知的任何其他合适的洗脱方法,释放所需的靶分子。
barcode
barcode是已知的核酸序列,其允许鉴定出与barcode相关联的核酸的某些特征,在某些实施例中,待鉴定核酸的特征是核酸样本或核酸衍生的样本来源。barcode通常包括使序列在测序反应中有用的某些特征。例如,将barcode设计成在barcode中具有最小或没有均聚物区域,例如,在一行中具有2个或更多个相同的碱基,例如AA或CCC。在某些实施例中,同时将barcode设计成当进行逐个碱基测序时,它们与碱基添加顺序相距至少一个编辑距离,确保第一个和最后一个碱基与序列的预期碱基不匹配。
在某些实施例中,将barcode设计成使得每个序列与特定的靶核酸相关,允许短序列读数与其来源的靶核酸相关。例如,第6,235,475号美国专利中展示了barcode组的设计方法,其内容通过在此进行引用,整体并入本说明书中,在某些实施例中,barcode范围从约5个核苷酸到约15个核苷酸。在特定实施例中,barcode范围从约4个核苷酸到约7个核苷酸。由于barcode与梯形片段核酸一起测序,因此在使用更长序列的实施例中,barcode长度最小,从而允许从附着于barcode的片段核酸中读取最长的长度。例如,在某些实施例中,barcode与片段核酸分子相隔至少一个碱基,例如,使均聚物组合最小化。
在某些实施例中,将barcode的长度和序列设计成实现期望的准确度水平,以用于确定核酸。例如,在某些实施例中,将barcode设计成使得在可容忍数量的点突变之后,仍然能够以期望的准确度推断出相关核酸。在某些实施例中,Tn-5转座酶(可从EpicentreBiotechnologies市场上购买;威斯康辛州麦迪逊市)将核酸切割成片段,并将DNA短片段插入顺反子。将DNA短片段用于整合barcode。
第2008/0081330号美国专利和国际专利(公开号PCT/US09/64001)中申请出版显示了将包含barcode的测序接头连接到核酸模板,其中每个专利的内容均通过参考引用纳入本说明书。美国专利所示的barcode组的设计方法以及连接测序接头(例如,包含barcode)的其他方法6,138,077;6,352,828;5,636,400;6,172,214;6,235,475;7,393,665;7,544,473;5,846,719;5,695,934;5,604,097;6,150,516;RE39,793;7,537,897;6172,218;和5,863,722中所示,其中每个专利的内容均通过引用,整体地并入本说明书。在某些实施例中,单个barcode附着于每个片段,在某些实施例中,多个barcode(例如,两个barcode)附着于每个片段。
核酸序列
在本发明的某些实施例中,产生核酸序列数据。各种核酸测序平台实施例(例如,核酸测序仪;包括如下所述的部件。根据各种实施例,测序仪器包括流体输送和控制单元、样本处理单元、信号检测单元、以及数据采集、分析和控制单元。该仪器的各种实施例提供了自动测序,用于并行和/或基本同时从多个序列中收集序列信息。
在某些实施例中,流体输送和控制单元包括试剂输送系统。试剂输送系统包括试剂储存器,用于储存各种试剂。试剂可以包括基于RNA的引物、正向/反向RNA引物、用于边合成边测序的核苷酸混合物(例如,在某些实施例中,组合物包含核苷酸类似物)、缓冲液、洗涤试剂、封闭试剂、装运试剂等。此外,试剂输送系统还可以包括移液系统或连续流动系统,其将样本处理单元与试剂储存器连接起来。
在某些实施例中,样本处理单元包括样本室,如流动池、基质、微阵列、多孔托盘等。样本处理单元可以包括多个线路、多个通道、多个孔或者其他基本同时处理多个样本集的装置。此外,样本处理单元还可以包括多个样本室,以便能同时处理多次运行,在特殊实施例中,系统可以在一个样本室上执行信号检测,同时基本同时处理另一个样本室。此外,样本处理单元还可以包括自动化系统,用于移动或操纵样本室。在某些实施例中,信号检测单元可以包括成像或检测传感器。例如,成像或检测传感器(例如,荧光检测器或电检测器)可以包括CCD、CMOS、离子传感器,如覆盖CMOS的离子敏感层、电流检测器等。信号检测单元可以包括激发系统,以使探针(如荧光染料)发射信号。检测系统可以包括照明源,如弧光灯、激光器、发光二极管(LED)等。在特殊实施例中,信号检测单元包括光学器件,用于将光从照明源传输到样本或者从样本传输到成像或检测传感器。或者,信号检测元可以不包括照明源,例如,当自发产生信号作为测序反应的结果时。例如,通过释放部分的相互作用,可以产生信号,如释放的离子与离子敏感层相互作用或者焦磷酸与酶或其他催化剂反应产生化学发光信号。在另一个实施例中,检测到电流、电压或电阻变化而不需要照明源。
在某些实施例中,数据采集分析和控制单元监控各种系统参数。系统参数可以包括仪器各部分的温度,如样本处理单元或试剂储存器、各种试剂的体积、各种系统子部件的状态,如操纵器、步进电机、泵等,或其任意组合。
本发明将得到本领域技术人员的赞赏,仪器和系统的各种实施例用于实施测序方法,如通过合成进行测序、单分子方法和其他测序技术。通过合成进行测序可以包括掺入染料标记的核苷酸、链终止、离子/质子测序、焦磷酸测序等。单分子技术可以包括交错测序,其中暂停测序反应,以确定掺入的核苷酸的身份。
在某些实施例中,测序仪器确定核酸的序列,如多核苷酸或寡核苷酸。核酸可以包括DNA或RNA,也可以是单链的,如ssDNA和RNA,或者是双链的,如dsDNA或RNA/cDNA对。在某些实施例中,核酸可以包括或者来源于片段库、扩增子库、配对库、ChIP片段等。在特殊实施例中,测序仪器可以从单个核酸分子或从一组基本相同的核酸分子获得序列信息。
二代测序
该技术设想的特殊测序技术是二代测序(NGS)方法,结合大规模并行、高通量策略的共同特征,目标是比旧测序方法的成本低(例如,参见Voelkerding等人,ClinicalCliem.,55:641-658,2009;MacLean等人,Nature Rev.Microbiol.,7:287-296;通过参考引用纳入全文)。NGS方法可以大致分为常使用模板扩增的方法和不使用模板扩增的方法。需要扩增的方法包括Roche商业化的焦磷酸测序,作为454个技术平台(例如,GS 20和GSFLX),Illumina商业化的高通量测序技术(Solexa)平台,以及Applied Biosystems商业化的受支持的寡核苷酸连接和检测(SQLiD)平台。非扩增方法,也称为单分子测序,分别以Helicos BioSciences商业化的HebScope平台和VisiGen、Oxford Nanopore TechnologiesLtd.、Life Technologies/Ton Torrent和Pacific Biosciences商业化的新兴平台为例。
在焦磷酸测序(Voelkerding等人,Clinical Chem.,55:641-658,2009;MacLean等人..Nature Rev.Microbiol.,7:287-296;第6,210,891号,第6,258,568号美国专利;通过参考引用纳入全文)中,通过捕获单一模板分子,含与测序接头互补的寡核苷酸的珠,原位克隆扩增NGS片段文库。每个具有单一模板类型的珠被划分成油包水微泡,并且使用称为乳液聚合酶链反应(PCR)的技术克隆扩增该模板。扩增后破坏乳液,并且将珠沉到微滴定板的单个孔中充当测序反应期间的流动池。在测序酶和发光报告剂(如荧光素酶)存在下,在流动池中有序、迭代引入四种dNTP试剂中的每一种。若在测序引物的3'端添加适当的dNTP,产生的ATP会在孔内引起发光爆发,这可以用CCD摄像机记录下来。可以实现大于或等于400个碱基的读取长度,也可以实现106个序列读数,导致序列多达5亿个碱基对(Mb)。
在Solexa/Illumina平台(Voelkerding等人,Clinical Chem.,55:641-658,2009;MacLean等人,Nature Rev,Microbiol,7:287-296;第6,833,246号,第7,115,400号,第6,969,488号美国专利;通过参考引用纳入全文)中,以较短长度读取的形式产生测序数据。在这种方法中,在布满寡核苷酸锚的流动池表面上捕获NGS库的片段或扩增子。锚被用作PCR引物,但由于模板的长度及其与其他附近锚寡核苷酸的接近性,PCR延伸导致分子“拱起”,与邻近的锚寡核苷酸杂交,在流动池表面上形成桥结构。这些环状的DNA被变性和切割。然后,用可逆染料终止剂对正向链进行测序。通过掺入后荧光的检测,确定掺入核苷酸的序列,在下一个dNTP添加循环之前去除每个荧光和封闭剂。序列读数长度从36个核苷酸到超过100个核苷酸,每次分析总输出超过10亿个核苷酸对。
使用SOLiD技术对核酸分子测序(Voelkerding等人,Clinical Chem.,55:641-658,2009;MacLean等人,Nature Rev.Microbiol.,7:287-296;第5,912,148号,第6,130,073号美国专利;通过参考引用纳入全文)还涉及通过乳液聚合酶链反应(PCR)克隆扩增NGS片段文库。随后,将带模板的珠固定在玻璃流动池的衍生表面上,并对与测序接头寡核苷酸互补的引物进行退火。但并非利用这种引物进行3'延伸,而是用其提供5'磷酸基团,用于连接到含有两个探针特异性碱基随后是6个简并碱基和4个荧光标记之一的询问探针。在SOLiD系统中,询问探针在每个探针的3'端具有两个碱基的16种可能组合,在5'端具有四种荧光的其中一种。荧光颜色以及每个探针的识别对应于特定的颜色空间编码方案。在进行多轮(通常为7轮)探针退火、连接和荧光检测后,进行变性,然后,使用相对于初始引物偏移一个碱基的引物进行第二轮测序。通过这种方式,在计算上可以重新构建模板序列,并且询问模板库两次,从而提高准确性。序列读数长度平均为35个核苷酸,每次测序总输出超过40亿个碱基。
在某些实施例中,使用Helicos BioSciences的HeliScope(Voelkerding等人,Clinical Chem.,55:641-658,2009;MacLean等人,Nature Rev,Microbiol,7:287-296;第7,169,560号,第7,282,337号,第7,482,120号,第7,501,245号,第6,818,395号,第6,911,345号,第7,501,245号美国专利;通过参考引用纳入全文)。通过添加聚合酶和连续添加荧光标记的dNTP试剂,实现HeliScope测序,掺入事件导致对应于dNTP的荧光信号,以及在每一轮dNTP添加之前,CCD摄像机捕获信号。序列读数长度从25-50个核苷酸不等,每次分析总输出超过10亿个核苷酸对。
在某些实施例中,使用Roche的454测序(Margulies等人,(2005)《自然》,437:376-380)。454测序包括两个步骤。在第一步中,将DNA剪切成约300-800个碱基对的片段,这些片段是钝端片段。然后,寡核苷酸测序接头连接到片段末端。测序接头用作片段扩增和测序的引物。例如,可以使用DNA含有5'-生物素标记的测序接头将片段附着于捕获珠,例如,链霉亲和素包层珠。在油水乳液的液滴内附着于珠的片段进行PCR扩增。结果是在每个珠上多次拷贝克隆扩增的DNA片段。在第二步中,在孔(微微升规格)中捕获珠。在每个平行的DNA片段上进行焦磷酸测序。添加一个或多个核苷酸会产生光信号,由测序仪器中的CCD摄像机记录。信号强度与掺入的核苷酸数量成比例。焦磷酸测序利用添加核苷酸后释放的焦磷酸(PPi)。在腺苷5'酰硫酸存在下,ATP硫酶将PPi转化为ATP。荧光素酶利用ATP将荧光素转化为氧化荧光素,并且这一反应会产生可检测和分析的光。
离子激流技术是一种基于检测DNA聚合期间释放的氢离子的DNA测序方法(例如,参见《科学》327(5970):1190(2010);申请出版第20090026082、20090127589、20100301398、20100197507、20100188073和20100137143号美国专利,出于所有目的通过参考引用纳入全文)。一个微孔板包含待测序的NGS文库[7]的一个片段。微孔层下面是一个非常敏感的ISFET离子传感器。在CMOS半导体芯片(类似于电子行业使用的芯片)内包含所有层。在将dNTP结合到生长的互补链[7]中时,将会释放氢离子,触发离子传感器。若在模板序列中存在均聚物重复,在单个循环中将结合多个dNTP分子。这会产生相应数量的释放氢和比例更高的电子信号。这项技术不同于其他测序技术,因为没有使用修改后的核苷酸或光学器件。离子激流测序仪的每碱基准确度为“50碱基读取99.6%”,每次运行产生100Mb。读取长度为100个碱基对。长度为5次重复的均聚物重复的准确度为98%。离子半导体测序的好处是测序速度快,前期投入和操作成本低。
可适用于本发明的另一种实施例性核酸测序方法由Stratos Genomics,Inc.开发,并涉及使用Xpandomers。该测序过程通常包括提供由模板导向合成产生的子链。子链通常包括多个子单位,这些子单位以对应于全部或部分靶核酸的连续核苷酸序列的序列联接,其中各个子单位均包括系链、至少一个探针或核碱基残基以及至少一个选择性剪切键。剪切选择性剪切键,以产生长度大于子链的多个子单位的Xpandomer。Xpandomer通常包括系链和报告元素,用于在与全部或部分靶核酸的连续核苷酸序列相对应的序列中解析基因信息。然后,检测Xpandomer的报告元素。有关基于Xpandomer的方法的其他详细信息,请参见,例如,-2008年6月19日提交的题为《通过扩展进行高通量核酸测序》的第2009/0035777号美国专利出版物,纳入全文。
其他单分子测序方法包括使用VisiGen平台通过合成进行实时测序(Voelkerding等人,Clinical Chem.,55:64.1-58,2009;美国专利第7,329,492号;美国专利申请序列号第11/671,956号;美国专利申请序列号第11/781,166号;通过参考引用纳入全文),其中固定化、引物化NGS文库的片段,然后使用荧光素修改的聚合酶和荧光受体分子对其进行链延伸,这导致核苷酸添加后可检测的荧光共振能量转移(FRET)。
另一个由Pacific Biosciences开发的实时单分子测序系统(Voelkerding等人,Clinical Chem.,55:641-658,2009;MacLean等人,Nature Rev.Microbiol.,7:287-296;第7,170,050号,第7,302,146号,第7,313,308号,第7,476,503号美国专利;全部通过参考引用纳入全文)使用直径为50-100升的反应孔,包含约20升(10-21升)的反应体积。使用固定化模板、修改的phi29 DNA聚合酶和局部浓度高的荧光标记的dNTP进行测序反应。局部浓度高和连续反应条件允许通过使用激光激发、光波导和CCD摄像机的荧光信号检测实时捕获掺入事件。
在某些实施例中,使用Pacific Biosciences开发的零模波导的单分子实时(SMRT)DXA测序方法或类似方法。利用这项技术,在SMRT芯片上进行DNA测序,每个芯片包含数千个零模波导(ZMW)。ZMW是一个直径为几十纳米的孔,在二氧化硅基底上沉积的100nm金属薄膜上制作。每个ZMW可变成一个纳米光子可视化室,只提供20升的探测体积。在这个体积时,可以在成千上万个标记的核苷酸的背景中检测单个分子的活性。通过合成进行测序时,ZMW为观察DNA聚合酶提供一个窗口。在每个室内,一个单一的DNA聚合酶分子附着于底面,从而使其永久存在于检测体积内。然后,将磷酸连接核苷酸(每种类型用不同颜色的荧光团标记)以高浓度引入到反应溶液中,以提高酶的速度、准确性和进行性。由于ZMW的尺寸小,即使在这些高的、生物学相关的浓度下,仅在一小部分时间内核苷酸占用检测体积,此外,由于扩散必须获得核苷酸的距离非常小,可快速访问检测体积,但仅持续几微秒。结果是背景非常低[7]。
在某些实施例中,使用纳米孔测序(Soni G V和Meller A.(2007),Clin Chem,53:1996-2001)。纳米孔是一个直径约为1纳米的小孔。将纳米孔浸入导电流体中并在其中施加电势,由于离子通过纳米孔传导,产生轻微的电流。流动的电流量对纳米孔大小非常敏感。当一个DNA分子通过纳米孔时,DNA分子上的每个核苷酸都会在不同程度上阻塞纳米孔。因此,当DNA分子通过纳米孔时,通过纳米孔的电流变化即代表DNA序列的读数。
在某些实施例中,测序技术使用化学敏感场效应晶体管(chemFET)阵列对DNA进行测序(例如,如美国专利申请公开出版物第20090026082号所述)。在该技术的一个实施例中,将DNA分子置于反应室中,并将模板分子与结合到聚合酶上的测序引物杂交。通过chemFET的电流变化,可以检测测序引物3'端新核酸添加链中一种或多种三磷酸的掺入。一个阵列可以有多个chemFET传感器。在另一个实施例中,单个核酸可以附着于珠,并且在珠上可以扩增核酸,以及可以将单个珠转移到chemFET阵列上的单个反应室,每个反应室都有chemFET传感器,并且可以对核酸进行测序。
在某些实施例中,测序技术使用电子显微镜(Moudrianakis E.N.和Beer M.ProcNatl Acad Sci USA,1965年3月;53:564-71)。在该技术的一个实施例中,用金属barcode标记单个DNA分子,这些barcode可以用电子显微镜进行区分。然后,将这些分子拉伸到一个平面上,用电子显微镜成像来测量序列。
在某些实施例中,使用“通过使用可剪切荧光核苷酸可逆终止剂的合成进行四种颜色测序”,如Turro等人的PNAS 103:19635-40(2006)所述,例如,如智能生物系统商业化。该技术在申请出版第2010/0323350、2010/0063743、2010/0159531、20100035253、20100152050号美国专利中有所描述,出于所有目的通过参考引用纳入本说明书。
在某些实施例中,由二代测序平台产生的数据的质量取决于加载到测序仪工作流克隆扩增步骤中的DNA(例如,空气NGS库,如片段文库或扩增子panel文库)的浓度。例如,加载低于最小阈值的浓度可能会导致测序仪输出低或次优,而加载高于最大阈值的浓度可能会导致序列质量低或者测序仪无输出。因此,在此提供的本发明可用于制备具有合适测序浓度的样本,例如,使输出的序列数据具有期望的质量。
任何用于核酸测序的高通量技术均可用于本发明的实践。DNA测序技术包括使用标记的终止剂或引物的双脱氧测序反应(桑格法)和平板或毛细管中的凝胶分离、通过使用可逆终止的标记核苷酸的合成进行测序、焦磷酸测序、454测序、通过使用等位基因特异性杂交到标记克隆文库然后连接的合成进行测序、聚合步骤中标记核苷酸掺入的实时监测、polony测序、SOLID测序等。
某些高通量测序方法包括将单个分子在固体表面上空间分离的步骤,其中这些步骤需要进行平行测序。此类固体表面可以包括无孔表面(如在Solexa测序中,例如,Bentley等人,《自然》,456:53-59(2008)或完整基因组测序,例如,Drmanac等人,《科学》,327:78-81(2010))、孔阵列(可包括珠或颗粒结合的模板(如用454测序,例如,Margulies等人,《自然》,437:376-380(2005)或离子激流测序,美国专利出版物2010/0137143或2010/0304982))、微机械膜(如用SMRT测序,例如,Eid等人,《科学》,323:133-138(2009))、或珠阵列(如用SOLiD测序或polony测序,例如,Kim等人,《科学》,316:1481-1414(2007))。此类方法可能包括在固体表面上空间分离之前或之后扩增分离的分子。先前的扩增可能包括基于乳液的扩增,如乳液PCR或滚环扩增。
特别令人感兴趣的是在Illumina MiSeq、NextSeq和HiSeq平台上进行测序,其中这些平台是利用合成技术进行可逆终止剂测序(例如,参见Shen等人,(2012)《BMC生物信息学》,13:160;Junemann等人,(2013)《Nat.Biotechnol.,31(4):294-296;Glenn(2011)Mol.Ecol.Resour.11(5):759-769;Thudi等人,(2012)Brief Funct.Genomics,11(1):3-11;通过参考引用纳入本说明书)。
核酸序列分析
在某些实施例中,基于计算机的分析程序用于将检测测定(例如,测序读取)生成的原始数据转换成对终端用户(例如,医务人员)具有预测价值的数据。用户可以使用任何合适的手段访问预测数据。因此,在一些首选实施例中,本发明提供了进一步的益处,即,不太可能接受遗传学或分子生物学培训的用户无需理解原始数据。数据以最有用的形式直接呈现给终端用户。然后,用户能够立即利用该信息来确定有用的信息(例如,在医学诊断、研究或筛选中)。
某些实施例提供了一种系统,用于重建核酸序列。该系统可以包括核酸测序仪、样本序列数据存储器、参考序列数据存储器、以及分析计算装置/服务器/节点。在某些实施例中,分析计算装置/服务器/节点可能是工作站、大型计算机、个人计算机、移动装置等。可以配置核酸测序仪,以利用所有可用的技术、平台或科技来获得核酸序列信息分析(例如,询问)核酸片段(例如,单片段、配对片段、配对末端片段等),特别是在此所述的使用在此提供的组合物的方法。在某些实施例中,核酸测序仪直接经由数据电缆(例如,串行电缆、直接电缆连接等)或总线连接,或者通过网络连接(例如,互联网、LAN、WAN、VPN等),与样本序列数据存储器通信。在某些实施例中,网络连接可能是“硬连线”物理连接。例如,核酸测序仪可以通信连接(经由类别5(CATS)、光纤或同等电缆布线)至通过互联网通信连接(经由CATS、光纤或同等电缆布线)的数据服务器及至样本序列数据存储器。在某些实施例中,网络连接是无线网络连接(例如,Wi-Fi、WLAN等),例如,使用802.11a/b/g/n或同等传输格式。实际上,所使用的网络连接取决于系统的特殊要求,在某些实施例中,样本序列数据存储器是核酸测序仪的一个整合部分。
在某些实施例中,样本序列数据存储器可以是任何数据库存储装置、系统或实施设备(例如,数据存储器分区等),其配置目的是组织和存储由核酸测序仪生成的核酸序列读数数据,从而可以(例如,由数据库管理员或客户操作员)手动或通过计算机程序、应用程序或软件脚本自动搜索和检索数据。在某些实施例中,参考数据存储器可以是任何数据库设备、存储系统或实施设备(例如,数据存储器分区等),其配置目的是组织和存储参考序列(例如,全基因组或部分基因组、全外显子组或部分外显子组、SNP、基因等),从而可以(例如,由数据库管理员或客户操作员)手动或通过计算机程序、应用程序和/或软件脚本自动搜索和检索数据。在某些实施例中,样本核酸测序读取数据可能以各种不同的数据文件类型/格式(包括但不限于:*.txt、*.fasta、*.csfasta、*seq.txt、*qseq.txt、*.fastq、*.sff、*prb.txt、*.sms、*srs和/或*.qv)存储在样本序列数据存储器和/或参考数据存储器中。
在某些实施例中,样本序列数据存储器和参考数据存储器是独立装置/系统,或者在不同装置上实施。在某些实施例中,样本序列数据存储器和参考数据存储器在同一装置/系统上实施。在某些实施例中,样本序列数据存储器和/或参考数据存储器可以在分析计算装置/服务器/节点上实施。分析计算装置/服务器/节点可以直接经由数据电缆(例如,串行电缆、直接电缆连接等)或总线连接,或者通过网络连接(例如,互联网、LAN、WAN、VPN等),与样本序列数据存储器和参考数据存储器通信。在某些实施例中,分析计算装置/服务器/节点可以托管参考映射引擎、从头映射模块和/或三级分析引擎。在某些实施例中,可以配置参考映射引擎,从样本数据存储器获得样本核酸序列读数,并且使用各种参考映射/对准技术和方法将其与一个或多个从参考数据存储器获得的参考序列进行映射,以便将读数组合成与参考序列相似但不一定相同的序列。然后,通过一个或多个可选的三级分析引擎,可以进一步分析重组的序列,以识别可导致物理特征(表型)差异大的个体的基因组成(基因型)、基因表达或表观遗传状态差异。例如,在某些实施例中,可以配置三级分析引擎,以识别基因突变、重组/交叉或基因漂变而导致的各种基因组变体(在组合序列中)。基因组变异类型实施例包括但不限于:单核苷酸多态性(SNP)、拷贝数变异(CNV)、插入/缺失(Indel)、倒位等。可以配置可选的从头映射模块,以将来自样本数据存储器的样本核酸序列读数组合成新的和先前未知的序列。然而,应当理解,分析计算装置/服务器/节点上托管的各种引擎和模块可以组合或折叠成单个引擎或模块,具体取决于特殊应用或系统架构的要求。此外,在某些实施例中,分析计算装置/服务器/节点可根据特殊应用或系统架构的需要,托管额外的引擎或模块。
在某些实施例中,配置映射和/或三级分析引擎,以在颜色空间中处理核酸和/或参考序列读数。在某些实施例中,配置映射和/或三级分析引擎,以在基础空间中处理核酸和/或参考序列读数。然而,应当理解,在此公开的映射和/或三级分析引擎可能以任何模式或格式处理或分析核酸序列数据,只要该模式或格式能够传达核酸序列的碱基同一性和位置。
此外,客户终端可以是瘦客户端或胖客户端计算装置。在某些实施例中,客户终端可以具有网络浏览器,其可用于控制参考映射引擎、从头映射模块和/或三级分析引擎的操作。也就是说,客户终端可以访问参考映射引擎、从头映射模块和/或第三分析引擎(使用浏览器来控制其功能)。例如,客户终端可用于配置不同引擎的操作参数(例如,失配约束、质量值阈值等),这取决于特殊应用的要求。类似地,客户终端也可以显示由参考映射引擎、从头映射模块和/或三级分析引擎穿孔的分析结果。
本发明还包括任何能够接收、处理和传送信息到进行测定的实验室、信息提供者、医务人员和受试者以及能够从进行测定的实验室、信息提供者、医务人员和受试者接收、处理和传送信息的方法。
申请/使用
本发明不限于特殊用途,而用于广泛的研究(基础和应用)、临床、医学、以及其他生物、生化和分子生物学应用中。本发明的方法和组合物可用于与提供浓度标准化的核酸样本相关的方法、试剂盒、系统等。本发明的方法和组合物的某些实施例性用途包括,例如,植物、动物和其他生物的遗传学、基因组学和/或基因分型,例如,以确定突变和/或等位基因的单倍型、定相和/或连接。在某些实施例中,本发明的方法可用于与癌症诊断、治疗和疗法相关的测序。
在某些实施例中,本发明的方法和组合物可用于产前诊断领域,例如,用于确定染色体异常,如胎儿非整倍性。产前诊断领域的其他特殊和非限制性说明性实施例包括单基因疾病或基因变异和条件。
基因变异范围可以是从单碱基对变异到染色体变异,或本领域已知的任何其他变异。基因变异可以是简单序列重复、短串联重复、单核苷酸多态性、易位、倒位、缺失、重复或任何其他拷贝数变异。在某些实施例中,染色体变异是染色体异常。例如,染色体变异可以是非整倍性、倒位、易位、缺失或重复。基因变异也可以是嵌合体。例如,基因变异可以与基因条件或基因条件的风险因素(例如,囊性纤维化、泰-萨二式病、亨廷顿病、阿尔茨海默病、以及各种癌症)相关联。基因变异也可以包括任何突变、染色体异常或上述优先文献中公开的其他变异(例如,非整倍性、微缺失或微重复)。基因变异可以对表型产生积极、消极或中性的影响。例如,染色体变异可以包括有利的、有害的或中性的变异。在某些实施例中,基因变异是一种疾病或障碍风险因素。在某些实施例中,基因变异编码期望的表型性状。
此外,本发明的方法可用于传染病领域,例如,用于识别传染因子,如病毒、细菌、真菌等,以及确定病毒类型、系列、种和/或准种,并识别突变和/或等位基因的单倍型、定相和/或连接。传染病领域的其他特殊和非限制性说明性实施例包括表征抗生素耐药基因;为流行病跟踪传染性生物体;监控耐药机制的出现和演变;识别与病毒性相关的种、亚种、菌株、染色体外元素、类型等,监控治疗进展等。
在某些实施例中,本发明的方法用于移植医学,例如,用于主要组织相容性复合体(MHC)分型、人类白细胞抗原(HLA)分型,以及用于识别与移植医学相关的突变和/或等位基因的单倍型、定相和/或连接(例如,为需要移植的特殊宿主识别相容的供体、预测排斥机会、监控排斥、存档移植材料、用于医学信息学数据库等)。
在某些实施例中,本发明的方法和组合物可用于肿瘤学及与肿瘤学相关的领域。肿瘤学领域的特殊和非限制性说明性实施例是检测与癌症、癌症易感性和/或癌症治疗相关的基因和/或基因组异常。例如,在某些实施例中,本发明的方法和组合物可用于检测与癌症相关的突变、多态性、等位基因或染色体易位的存在。在某些实施例中,本发明的方法和组合物可用于癌症筛查、癌症诊断、癌症预后、测量最小残留疾病、以及选择和/或监控癌症治疗过程。
本发明的方法将特别用于与各种疾病、结构异常和/或基因致死性相关的非整倍性和/或拷贝数变异的基因筛选。如本说明书所述,测序数据中扩增偏差的校正使更精确检测甚至微小的拷贝数变异成为可能。特别是,这些方法将用于无创性产前检查,以检测胎儿染色体非整倍性或拷贝数变异。可以在怀孕前或怀孕后从后代的母亲或潜在母亲处收集生物样本并进行分析。如本说明书所述,非整倍性或拷贝数变异的检测可能表明后代发育异常或患有疾病(例如,唐氏综合征(三体性21)、爱德华兹综合征(三体性18)或帕托综合征(三体性13))的风险增加。例如,后代可以是新生儿或胎儿。特别是,该方法可用于评估有非整倍性或拷贝数变异相关病儿的风险可能高的母亲或潜在母亲,如之前有一个孩子患此类病或有家族病史或流产史的母亲或潜在母亲。
本发明的方法也将用于癌细胞的基因检测。非整倍性和拷贝数变异通常与许多类型的癌症有关。因此,癌细胞或异常的潜在癌前细胞的基因检测可用于诊断患有特殊类型的癌症或癌前疾病的患者,并确定合适的治疗方案。
为进行基因检测,从个体中收集含有核酸的生物样本。生物样本通常是血液、唾液或来自口腔擦拭或活检的细胞,但也可以是来自体液、组织或含有个体基因组DNA或RNA的细胞的任何样本。对于胎儿的产前检查,生物样本可以是,例如,羊水(例如,羊膜穿刺)、胎盘组织(例如,绒毛膜绒毛取样)或胎儿血液(例如,脐带血取样)。特别是,母体血液中的无创性无细胞胎儿DNA或从母体血液内胎儿细胞中提取的核酸(FCMB)可用于基因筛查。本发明的方法也适用于通过体外受精(IVF)产生的胚胎的基因筛查。例如,可以使用本说明书所述的方法进行植入前基因诊断(PGD),以校正扩增偏差,从而在转移给母亲之前提高胚胎中非整倍性和/或拷贝数变异的检测率。在某些实施例中,使用本领域众所周知的方法进行扩增、测序和分析之前,从生物样本中分离和/或过滤核酸例如,参见Green和Sambrook,《分子克隆》:实验室手册(冷泉港实验室出版社;第4版,2012);和当前分子生物学方案(Ausubeled.、John Wiley&Sons,1995);全部通过参考引用纳入本说明书。
可以基于“相对拷贝数”评估拷贝数变异,以使不同样本的明显基因拷贝数差异不会因样本量的差异而失真。(每个基因组)基因的相对拷贝数可以表示为目标基因拷贝数与DNA样本中参考多核苷酸序列的拷贝数之比。参考多核苷酸序列可以是具有已知基因组拷贝数的序列。通常,参考序列具有单基因组拷贝,其也是在基因组中不太可能扩增或缺失的序列。没有必要凭经验确定参考序列的拷贝数。相反,可能基于感兴趣生物体中的正常拷贝数,假设拷贝数。因此,从两个基因的比率计算出DNA样本中目标核苷酸序列的相对拷贝数,其中疾病诊断是检测到拷贝数变异,即,与对照受试者(例如,正常、健康受试者)相比,受试者存在更多或更少数量的基因(即,异常拷贝数)。
实施例
通过参考下面的实施例,将进一步理解本发明。这些实施例仅仅是本发明的实施例。提供这些实施例仅仅是为了说明所要求的发明。本发明的范围不受实施例性实施例的限制,这些实施例性实施例仅仅旨在说明本发明的单个方面。任何功能等同的方法都在本发明的范围内。根据前面的描述,除在此描述的方法外,对本发明所作出的各种修改对于本领域技术人员而言将变得通俗易懂。此类修改旨在符合所附权利要求范围。
实施例1:使用多重PCR构建二代测序文库
此处,我们描述了使用多重PCR构建二代测序文库的方法及其在无创性产前检查中的应用。无创性产前检测使用母体游离DNA来帮助检测胎儿染色体非整倍性。
生成二代测序文库,具体如下:
制备核酸样本,如下:离心后从母体血液中分离出血浆,并使用商业DNA提取试剂盒从所得血浆中获得游离DNA。
使用磁珠富集核酸样本的短片段DNA(小于300bp)。将特定体积比的磁珠添加到第1步制备的核酸样本中,以结合300bp或更大的DNA。移除含有短DNA的上清液,并将另一特定体积比的磁珠与上清液一起孵育,以结合200bp或更小的DNA。洗涤磁珠,并从磁珠中洗脱短DNA,用于多重PCR。
对第2步富集的核酸样本进行第一次多重PCR(超过1,000重)。改变PCR引物浓度,以确定对扩增子均匀性和目标片段比率的影响。各种引物浓度对核酸扩增的结果如图4所示。
第3步的PCR扩增子应用于特定过滤器,以消除未消耗的引物和引物二聚体。收集过滤后的PCR产物,然后使用磁珠基于大小选择性富集目标扩增子。富集结果如图1所示。
使用第二次PCR将测序接头和barcode附着于第4步的富集扩增子。在第二次PCR中,PCR循环次数从20次减少到14次,以防PCR产物过度扩增。图2中A显示20次PCR循环的结果和导致“菊花链”形成的PCR产物过度扩增。图2中B显示随着库扩增子定量改进将PCR循环次数减少到14次的结果。
将磁珠添加到第5步的PCR扩增子中,以基于大小捕获目标扩增子。将洗脱缓冲液与磁珠混合,以便从磁珠中洗脱目标扩增子,从而产生用于二代测序的测序文库。
对第6步得到的扩增子文库进行二代测序。
分析测序数据,以确定胎儿染色体非整倍性的存在或缺失。
这些结果表明,本发明的方法和组合物可用于产生二代测序文库。
实施例2:磷酸钾浓度对多重PCR的影响
确定磷酸钾浓度对多重PCR的影响,如下:制备核酸样本并进行多重PCR,如实施例1所述,不同之处是在多重PCR反应中使用不同浓度的磷酸钾(5mM、10mM和15mM)。
如图3所示,在样本之间磷酸钾浓度引入了显著的扩增子覆盖差异。图3所示的倾斜拟合曲线也表明,不同的磷酸钾浓度影响目标DNA扩增。
结果表明,本发明的方法和组合物可用于提高多重PCR中的扩增子覆盖率。这些结果进一步表明,本发明的方法和组合物可用于产生二代测序文库。
实施例3:引物浓度对多重PCR的影响
确定引物浓度对多重PCR的影响,如下:制备核酸样本并进行多重PCR,如实施例1所述,不同之处是在多重PCR反应中使用不同的靶核酸引物浓度(l0nM、20nM、40nM)。
如图4所示,适度较低的引物浓度增加了靶核酸扩增率。较低的引物浓度也提高了扩增子均匀性(参见图4)。
结果表明,本发明的方法和组合物可用于提高多重PCR中的扩增子均匀性和靶核酸扩增率。这些结果进一步表明,本发明的方法和组合物可用于产生二代测序文库。
实施例4:胎儿DNA富集
进行胎儿DNA富集,具体如下:从孕妇体内获得母体血液,并制备核酸样本,如实施例1所述。使用磁珠富集核酸样本的短片段DNA(小于300bp)。将特定体积比的磁珠添加到第1步制备的核酸样本中,以结合300bp或更大的DNA。移除含有短DNA的上清液,并将另一特定体积比的磁珠与上清液一起孵育,以结合200bp或更小的DNA。洗涤磁珠,并从磁珠中洗脱出短DNA。通过对洗脱出的短DNA测序,确定胎儿比例。也通过对未经过上述富集步骤的对照母体血浆无细胞DNA测序,确定胎儿比例。
如图5所示,磁珠的大小选择提高了核酸样本中的胎儿比例。这些结果表明,本发明的方法和组合物可用于富集从母体血样获得的核酸样本中的胎儿DNA。结果表明,本发明的方法和组合物可用于产生二代测序文库。
实施例5:在多重PCR中DNA聚合酶对引物二聚体形成的影响
确定在多重PCR中DNA聚合酶对引物二聚体形成的影响,如下:制备核酸样本并进行多重PCR,如实施例1所述,不同之处是在多重PCR反应中使用不同的DNA聚合酶。
如图6所示,在多重PCR中,来自Bioline的MyTaq DNA聚合酶显示了最低量的引物二聚体形成。
这些结果表明,本发明的方法和组合物可用于减少多重PCR中的引物二聚体形成。这些结果进一步表明,本发明的方法和组合物可用于产生二代测序文库。
根据前面的描述,除了在此显示和描述的内容外,本发明的各种修改对于本领域技术人员来说将变得明白易懂。此类修改旨在落入所附权利要求的范围内。
实施例6:核酸富集减少多重PCR中的引物二聚体形成
研究多重PCR期间核酸富集对引物二聚体形成的影响,如下:从孕妇体内获得母体血液,并制备核酸样本,如实施例1所述。使用1)仅磁珠或2)串联的PCR产物过滤器和磁珠富集核酸样本。对富集的核酸样本进行多重PCR,并使用生物分析仪测定扩增子的大小和数量。
图7中A显示了仅使用磁珠富集的核酸样本的生物分析仪数据。图7中B显示了使用串联的PCR产物过滤器和磁珠富集的核酸样本的生物分析仪数据。用串联的PCR产物过滤器和磁珠富集减少了多重PCR期间的引物二聚体形成(参见图7)。这些结果表明,本发明的方法和组合物可用于产生二代测序文库。
所有参考文献特此通过参考引用纳入本文。

Claims (34)

1.一种用于构建测序文库的方法,其特征在于,包括以下步骤:
a)提供包含核酸的样本,其中,所述样本中的一些所述核酸具有靶核酸序列;
b)富集步骤a)所述的靶核酸序列;
c)针对靶核酸序列进行第一次多重PCR以获得扩增子;
d)对步骤c)所得样品进行富集以获得目标扩增子;
e)对所述目标扩增子、测序接头和barcode进行第二次多重PCR以获得带有barcode的目标扩增子。
2.一种用于构建测序文库的方法,其特征在于,包括以下步骤:
a)提供包含核酸的样本,其中,所述样本中的一些所述核酸具有靶核酸序列;
b)富集步骤a)所述的靶核酸序列;
c)针对靶核酸序列进行第一次多重PCR以获得扩增子;
d)对步骤c)所得样品进行富集以获得目标扩增子;
e)对所述目标扩增子、测序接头和barcode进行第二次多重PCR以获得带有barcode的目标扩增子;
f)富集步骤e)所述的带有barcode的目标扩增子。
3.根据权利要求1所述的方法,其特征在于,所述靶核酸序列包括1~300个核苷酸。
4.根据权利要求1所述的方法,其特征在于,所述富集操作所采用的方法包括使用磁珠,其中,所述磁珠在样品中结合靶核酸序列后,自剩余样品中分离。
5.根据权利要求1所述的方法,其特征在于,所述第一次多重PCR或第二次多重PCR采用一组以上的引物对以及一个热启动聚合酶。
6.根据权利要求5所述的方法,其特征在于,所述引物对具有通用序列和靶序列。
7.根据权利要求1所述的方法,其特征在于,所述扩增子具有通用序列和靶序列。
8.根据权利要求1所述的方法,其特征在于,所述富集操作所采用的方法包括使用过滤器处理扩增子,其中,所述过滤器截留扩增子而允许未消化引物和引物二聚体通过。
9.根据权利要求8所述的方法,其特征在于,所述过滤器为PCR产物过滤器。
10.根据权利要求1所述的方法,其特征在于,所述富集操作所采用的方法还包括采用过滤器处理含有扩增子、引物二聚体和/或未消化引物的样品,并采用磁珠结合过滤的扩增子后自剩余物中分离。
11.根据权利要求1所述的方法,其特征在于,所述第二次多重PCR采用正向引物和下游引物。
12.根据权利要求11所述的方法,其特征在于,所述下游引物具有测序接头和通用序列。
13.根据权利要求11所述的方法,其特征在于,所述下游引物具有测序接头、barcode和通用序列。
14.根据权利要求11所述的方法,其特征在于,所述正向引物包括测序接头和通用序列。
15.根据权利要求11所述的方法,其特征在于,所述正向引物具有测序接头、barcode和通用序列。
16.根据权利要求1所述的方法,其特征在于,所述富集操作所采用的方法包括使用磁珠在含有带有barcode的目标扩增子、引物二聚体和/或未消化引物的样品中结合所述带有barcode的目标扩增子后自剩余物中分离。
17.根据权利要求1所述的方法,其特征在于,所述富集操作所采用的方法包括使用磁珠在核酸和靶核酸中结合所述核酸而使所述核酸与所述靶核酸分离。
18.根据权利要求1所述的方法,其特征在于,所述富集操作所采用的方法包括采用过滤器处理含有靶核酸、引物二聚体、dNTP和/或引物的样品,其中,过滤器仅截留靶核酸。
19.根据权利要求18所述的方法,其特征在于,所述过滤器为PCR产物过滤器。
20.根据权利要求1所述的方法,其特征在于,所述富集操作所采用的方法还包括对靶核酸进行凝胶电泳、醇沉或柱层析。
21.根据权利要求1所述的方法,其特征在于,所述多重PCR扩增得到至少100个靶核酸序列、至少500个靶核酸序列或至少1,000个靶核酸序列。
22.根据权利要求1所述的方法,其特征在于,在少于40次循环、少于30次循环、少于20次循环或少于15次循环中进行所述第一次或第二次多重PCR。
23.根据权利要求1所述的方法,其特征在于,所述第一次多重PCR或第二次多重PCR中使用了磷酸钾。
24.根据权利要求23所述的方法,其特征在于,所述磷酸钾的浓度至少为5mM、至少为10mM或至少为15mM。
25.根据权利要求1所述的方法,其特征在于,所述多重PCR所采用的引物浓度至少为10nM、至少为20nM或至少为40nM。
26.根据权利要求1所述的方法,其特征在于,还包括以检测基因变异为目的的测序。
27.根据权利要求26所述的方法,其特征在于,所述基因变异为染色体非整倍性。
28.根据权利要求27所述的方法,其特征在于,染色体非整倍性是胎儿染色体非整倍性。
29.根据权利要求1所述的方法,其特征在于,所述靶核酸来自胎儿、儿童和/或成人。
30.根据权利要求1所述方法进行测序的用途。
31.根据权利要求30所述的用途,其特征在于,所述测序采用第二代测序技术或第三代测序技术。
32.根据权利要求31所述的用途,其特征在于,所述的测序包括基因组DNA测序、目标片段捕获测序、单链DNA片段测序、化石DNA测序和对生物样本游离DNA进行的测序。
33.根据权利要求32所述的用途,其特征在于,所述生物样本包括血液、血浆、尿液或唾液。
34.根据权利要求30所述的用途,其特征在于,还包括用于无创性产前检查以检测胎儿染色体非整倍性或拷贝数变异。
CN201780090660.5A 2017-03-20 2017-03-20 构建测序文库 Active CN110914449B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/077234 WO2018170659A1 (en) 2017-03-20 2017-03-20 Methods and compositions for preparing sequencing libraries

Publications (2)

Publication Number Publication Date
CN110914449A true CN110914449A (zh) 2020-03-24
CN110914449B CN110914449B (zh) 2024-01-26

Family

ID=63584008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780090660.5A Active CN110914449B (zh) 2017-03-20 2017-03-20 构建测序文库

Country Status (3)

Country Link
US (1) US20210108263A1 (zh)
CN (1) CN110914449B (zh)
WO (1) WO2018170659A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480576A (zh) * 2022-01-26 2022-05-13 纳昂达(南京)生物科技有限公司 靶向甲基化测序文库的构建方法及试剂盒

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109837274B (zh) * 2019-01-30 2021-05-07 浙江大学 一种人线粒体基因组文库构建的方法及应用
CN113811620B (zh) * 2019-06-26 2024-04-09 深圳华大智造科技股份有限公司 巢式多重pcr高通量测序文库制备方法及试剂盒
CN111961707B (zh) * 2020-10-14 2021-01-15 苏州贝康医疗器械有限公司 一种核酸文库构建方法及其在植入前胚胎染色体结构异常分析中的应用
CN113755577A (zh) * 2021-09-08 2021-12-07 菲思特(上海)生物科技有限公司 一种用于第二代抗精神病药物代谢标志物的基因多态性检测试剂盒及其检测方法和应用
WO2023164539A2 (en) * 2022-02-25 2023-08-31 Eclipse Bioinnovations, Inc. Methods for oligo targeted proximity ligation
WO2024117970A1 (en) * 2022-12-02 2024-06-06 Lucence Life Sciences Pte. Ltd. Method for efficient multiplex detection and quantification of genetic alterations

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105779636A (zh) * 2016-05-18 2016-07-20 广州安必平医药科技股份有限公司 用于扩增人乳腺癌易感基因brca1和brca2编码序列的pcr引物及应用
CN106282353A (zh) * 2016-08-26 2017-01-04 上海翼和应用生物技术有限公司 一种利用发夹引物进行多重pcr的方法
CN106498504A (zh) * 2016-12-13 2017-03-15 上海美迪维康生物科技有限公司 基于多重pcr的二代测序建库技术

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105779636A (zh) * 2016-05-18 2016-07-20 广州安必平医药科技股份有限公司 用于扩增人乳腺癌易感基因brca1和brca2编码序列的pcr引物及应用
CN106282353A (zh) * 2016-08-26 2017-01-04 上海翼和应用生物技术有限公司 一种利用发夹引物进行多重pcr的方法
CN106498504A (zh) * 2016-12-13 2017-03-15 上海美迪维康生物科技有限公司 基于多重pcr的二代测序建库技术

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480576A (zh) * 2022-01-26 2022-05-13 纳昂达(南京)生物科技有限公司 靶向甲基化测序文库的构建方法及试剂盒
CN114480576B (zh) * 2022-01-26 2023-04-07 纳昂达(南京)生物科技有限公司 靶向甲基化测序文库的构建方法及试剂盒

Also Published As

Publication number Publication date
CN110914449B (zh) 2024-01-26
WO2018170659A1 (en) 2018-09-27
US20210108263A1 (en) 2021-04-15

Similar Documents

Publication Publication Date Title
KR102475710B1 (ko) 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
RU2770879C2 (ru) Полногеномные библиотеки отдельных клеток для бисульфитного секвенирования
US11142786B2 (en) Methods for preparing a sample for nucleic acid amplification using tagmentation
CN110914449B (zh) 构建测序文库
US9249460B2 (en) Methods for obtaining a sequence
JP2020522243A (ja) 核酸のマルチプレックス末端タギング増幅
US20150051088A1 (en) Next-generation sequencing libraries
US20160046987A1 (en) Library generation for next-generation sequencing
EP3320111B1 (en) Sample preparation for nucleic acid amplification
AU2019248635B2 (en) Compositions and methods for making controls for sequence-based genetic testing
US20220145287A1 (en) Methods and compositions for next generation sequencing (ngs) library preparation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant