CN104854246A - 无限制酶的靶标富集 - Google Patents

无限制酶的靶标富集 Download PDF

Info

Publication number
CN104854246A
CN104854246A CN201380063759.8A CN201380063759A CN104854246A CN 104854246 A CN104854246 A CN 104854246A CN 201380063759 A CN201380063759 A CN 201380063759A CN 104854246 A CN104854246 A CN 104854246A
Authority
CN
China
Prior art keywords
oligonucleotide
dna
digestion
genomic fragment
genomic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380063759.8A
Other languages
English (en)
Other versions
CN104854246B (zh
Inventor
斯科特·哈珀
艾米丽·马林·勒普鲁
茱莉亚·巴波扎
约瑟夫·晃·海·翁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of CN104854246A publication Critical patent/CN104854246A/zh
Application granted granted Critical
Publication of CN104854246B publication Critical patent/CN104854246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供用于富集存在于随机剪切的基因组DNA中的靶片段的多种方法。在一些实施方式中,所述方法可涉及:使随机剪切的基因组DNA与晕环探针杂交以产生第一环状复合物,然后酶促消化基因组片段的突出末端。另一些实施方式可包括:使随机剪切的基因组DNA与RNA寡核苷酸杂交以产生RNA/DNA双链体,所述RNA寡核苷酸包含与所述随机剪切的基因组DNA的片段杂交的区域。然后可以酶促消化RNA/DNA双链体中的基因组片段的突出末端。

Description

无限制酶的靶标富集
发明背景
分子生物学中的一些分析方法(例如,测序文库制备)需要将衔接子(adaptor)序列放置在富集的DNA片段的末端以提供操作所述片段的方法。例如,可将一个或多个衔接子连接到富集的DNA片段上以产生连接衔接子的片段,可使用结合位点存在于添加的所述衔接子中的引物对连接衔接子的片段进行扩增和/或测序。
发明概述
本文提供了用于富集存在于随机剪切的基因组DNA中的靶片段的多种方法。在一些实施方式中,所述方法可涉及使随机剪切的基因组DNA与晕环(halo)探针杂交以产生第一环状复合物,然后酶促消化所述基因组片段的突出末端(overhanging end)。另一些实施方式可涉及使随机剪切的基因组DNA与RNA寡核苷酸杂交以产生RNA/DNA双链体,所述RNA寡核苷酸包含与所述随机剪切的基因组DNA的片段杂交的区域。然后可以酶促消化所述RNA/DNA双链体中基因组片段的突出末端。由此得到的具有确定末端的经消化基因组片段可被连接到晕环探针的一种或多种寡核苷酸上。然后可对经消化的基因组片段进行扩增和测序。
附图简述
本领域技术人员将理解,下述附图仅用于阐释目的。附图不旨在以任何方式限制本教导的范围。
图1示意性阐释了晕环探针的两种实施方式。
图2示意性阐释了所述方法的一种实施方式。
图3示意性阐释了所述方法的另一种实施方式。
图4示意性阐释了一种可对产物DNA分子进行测序的方法。
定义
在更详细描述示例性实施方式之前,给出下列定义以阐释和定义说明书中所用术语的含义和范围。
数值范围包括限定该范围的数值。除非另有说明,分别地,核酸是以5’到3’方向从左往右书写,氨基酸序列是以氨基到羧基方向从左往右书写。
除非另外定义,本文所使用的所有技术和科学术语具有本发明所属的领域的普通技术人员通常理解的相同含义。Singleton,等人,DICTIONARYOF MICROBIOLOGY AND MOLECULAR BIOLOGY,第2版,John Wileyand Sons,New York(1994),和Hale&Markham,THE HARPER COLLINSDICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)向技术人员提供了许多本文所用术语的一般含义。尽管如此,为了清楚和容易参考,下文对某些术语进行定义。
必须注意:当在本文和所附权利要求中使用时,除非上下文明确指出相反情况,否则不使用数量词时涵盖复数的指代物。例如,术语“引物”指一个/种或多个/种引物,即单个/种引物和多个/种引物。还应注意:权利要求可撰写成排除任何任选元素。因此,该陈述旨在作为使用与权利要求元素的引述相联系的这些排他性术语如“仅仅”、“仅”等或使用“否定性”限制的在先基础。
本文所使用的术语“样品”指的是含有一种或多种目的分析物的材料或材料混合物,其典型地但并非必须地为液体形式。在一个实施方式中,以最广义使用的该术语指含DNA或RNA的任何植物、动物或病毒材料,例如来自体外细胞培养成分或分离自个体的组织或流体(包括但不限于血浆、血清、脑脊液、淋巴、眼泪、唾液和组织切片),以及来自环境的样品。术语“样品”还指“生物样品”。本文所使用的术语“生物样品”指的是整个生物体或其组织、细胞或组成部分的子集(例如,体液,包括但不限于血液、黏液、淋巴液、滑液、脑脊液、唾液、羊水、羊膜脐带血、尿、阴道液和精液)。“生物样品”还指从整个生物体或其组织、细胞或组成部分的子集,或其级分或部分制备的匀浆、裂解物或提取物,包括但不限于,例如血浆,血清,脊髓液,淋巴液,皮肤、呼吸道、肠道和泌尿生殖道的的外部切片,眼泪、唾液、乳、血细胞、肿瘤、器官。最经常地,已从动物移除样品,但术语“生物样品”还可以指在体内被分析的细胞或组织,即不从动物中移除。典型地,“生物样品”将含有来自动物的细胞,但该术语还可以指非细胞生物材料,例如血液、唾液或尿的非细胞级分,其可被用于测量癌症相关多核苷酸或多肽水平。“生物样品”还指含有细胞组分(例如蛋白质或核酸分子)的生物体已在其中繁殖的基质,例如营养培养液或凝胶。
本文所使用的术语“核酸样品”表示含核酸的样品。本文使用的核酸样品可以是复合物,因它们包含多种不同的含序列分子。来自哺乳动物(例如小鼠或人类)的基因组DNA是复合样品的类型。复合样品可具有多于104、105、106或107种不同核酸分子。DNA靶标可源自任何来源例如基因组DNA或人工DNA构建体。本文中可以使用任何含核酸的样品,例如由组织培养细胞或组织样品制得的基因组DNA。
本文所使用的术语“混合物”指的是散布且无任何特定顺序的要素的组合。混合物是异质的且不可在空间上分离成其不同组分。要素混合物的实例包括大量不同的溶解于相同水性溶液的要素,和大量不同的在随机位置(即,不以特定顺序)附着到固体支持物的要素。混合物是无法寻址的。例如,如本领域中通常已知的,空间上分离的表面结合多核苷酸的阵列不是表面结合多核苷酸的混合物,因为表面结合多核苷酸的种类在空间上不同且所述阵列是可寻址(addressable)的。
术语“核苷酸”旨在包括那些不仅含有已知嘌呤和嘧啶碱基以及含有已被修饰的其它杂环碱基的部分(moiety)。这些修饰包括甲基化的嘌呤或嘧啶,酰基化的嘌呤或嘧啶,烷基化的核糖或其它杂环。此外,术语“核苷酸”包括那些包含半抗原或荧光标记以及可以不仅包含常规核糖和脱氧核糖的糖,也可以包含其它糖的部分。经修饰的核苷或核苷酸也包括对糖部分的修饰,例如,其中一个或多个羟基被卤素原子或脂肪族基团取代,官能化为醚、胺等。
术语“核酸”和“多核苷酸”在本文中可以互换使用,其用于描述任意长度的聚合物,例如,多于约2个碱基,多于约10个碱基,多于约100个碱基,多于约500个碱基,多于1000个碱基,高达约10,000个或更多碱基构成的核苷酸,例如,脱氧核糖核苷酸或核糖核苷酸,并可酶促地或合成地生产(例如,如美国专利号5,948,902和其中所引用的参考文献中所述的PNA),其可以与天然存在的核酸以序列特异性的方式进行杂交,该方式与两种天然存在的核酸杂交类似,例如,能够参与沃森-克里克碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶(分别为G、C、A、T和U)。DNA和RNA分别具有脱氧核糖和核糖骨架,但PNA的骨架由通过肽键相连的重复N-(2-氨乙基)-甘氨酸单元构成。在PNA中,各种嘌呤和嘧啶碱基通过亚甲基羰基键连接到骨架上。锁核酸(LNA)(通常被称为无法接近的RNA)是经修饰的RNA核苷酸。LNA核苷酸的核糖部分被连接2’氧和4’碳的额外桥修饰。所述桥“封锁”了3’-内(北(North))构象的核糖,这通常发现于A-型双链体(duplex)中。只要期望,可将LNA核苷酸与寡核苷酸中的DNA或RNA残基混合。术语“非结构化核酸”或“UNA”是含有相互之间结合的稳定性较低非天然核苷酸的核酸。例如,非结构化核酸可含有G’残基和C’残基,其中这些残基分别对应于G和C的非天然存在形式(即类似物),它们稳定性较低地相互碱基配对,但保留与天然存在的C和G残基碱基配对的能力。US20050233340中描述了非结构化核酸,其中关于UNA的公开内容通过引用被并入本文。
本文所使用的术语“靶多核苷酸”指的是被研究的目的多核苷酸。在某些实施方式中,靶多核苷酸含有一种或多种被研究的目的序列。
本文所使用的术语“寡核苷酸”表示长度为约2-200个核苷酸,直至500个核苷酸的单链核苷酸多聚体。寡核苷酸可以是合成的或者可通过酶法制成,在一些实施方式中,其长度为30-150个核苷酸。寡核苷酸可含有核糖核苷酸单体(即,可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸的长度可以为10-20、11-30、31-40、41-50、51-60、61-70、71-80、80-100、100-150或150-200个核苷酸。
本文所使用的术语“引物”指在纯化的限制消化物中天然存在的或者通过合成产生的寡核苷酸,当被放置在与核酸链互补的引物延伸产物的合成被诱导的条件下时,即存在核苷酸和诱导剂(例如DNA聚合酶)且处于合适的温度和pH时,其能够担当合成起始点。引物可以是单链的或双链的,但必须足够长以在诱导剂存在时启动期望延伸产物的合成。引物的确切长度将取决于许多因素,包括温度、引物来源和方法的使用。例如,对于诊断应用,取决于靶序列的复杂性,寡核苷酸引物典型地含有15-25个或更多核苷酸,但它也可含有更少核苷酸。本文的引物被选择为与特定靶DNA序列的不同链基本上互补。这意味着:引物必需足够互补以与它们各自的链杂交。因此,引物序列不需要反映模板的确切序列。例如,非互补的核苷酸片段可被连接到引物的5’末端,而引物序列的其余部分与链互补。或者,非互补碱基或更长序列可散布在引物中,条件是:引物序列与链序列足够互补以与其杂交并从而形成合成延伸产物的模板。
术语“杂交”指的是下述过程,其中核酸链在正常杂交条件下与第二互补核酸链退火并形成稳定双链体(同源双链体或异源双链体),且在相同的正常杂交条件下不与无关的核酸分子形成稳定双链体。在杂交反应中,通过使两条互补的核酸链退火来实现双链体的形成。可通过调节杂交反应发生的杂交条件(通常被称为杂交严格性)使杂交反应高度特异,从而,除非两条核酸链含有基本上或完全互补的一定数目的特定序列核苷酸,否则两条核酸链之间的杂交将不形成稳定双链体,例如在正常严格性条件下保留双链性(double-strandedness)区域的双链体。对于任何给出的杂交反应,“正常杂交或正常严格性条件”易于确定。参加,例如,Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,New York,或Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory Press。本文使用的术语“杂交”指的是任何下述过程,通过所述过程核酸链通过碱基配对与互补链结合。
如果核酸与参考核酸序列在中度至高度严格性杂交和洗涤条件下特异性相互杂交,那么可认为这两种序列“选择性可杂交”。中度和高度严格性杂交条件是已知的(参见,例如,Ausubel,等人,Short Protocols inMolecular Biology,第3版,Wiley&Sons 1995和Sambrook等人,MolecularCloning:A Laboratory Manual,第3版,2001 Cold Spring Harbor,N.Y.)。高度严格性条件的一个实例包括在约42C下在50%甲酰胺、5X SSC、5XDenhardt氏溶液、0.5%SDS和100μg/mL变性运载体DNA中杂交,随后在室温下在2X SSC和0.5%SDS中洗涤2次并在42℃下在0.1X SSC和0.5%SDS中额外洗涤2次。
本文所使用的术语“双链体(duplex)”或“双链化的(duplexed)”描述了两个碱基配对(即,杂交在一起)的互补多核苷酸。
本文所使用的术语“扩增”指的是合成与模板核酸的一条链或两条链互补的核酸分子的过程。扩增核酸分子典型地包括:使模板核酸变性,使引物与模板核酸在低于引物熔解温度的温度下退火,以及酶促地从引物延伸以产生扩增产物。可进行一次变性、退火和延伸步骤中的每一个。然而,一般进行变性、退火和延伸步骤多次以使扩增产物的量增加,通常指数增加,尽管本发明的方法不需要指数扩增。扩增典型地需要脱氧核糖核苷三磷酸、DNA聚合酶和合适缓冲液和/或有利于聚合酶最佳活性的辅助因子的存在。术语“扩增产物”指的是由本文所定义的扩增过程产生的核酸序列。
术语“测定”、“测量”、“评价”、“评估”、“试验”和“分析”在本文中可互换使用,其指的是任何形式的测量,并包括测定要素是否存在。这些术语包括定性和/或定量测定二者。评估可为相对或绝对。“评估其存在”包括测定存在的某种物质的量,以及测定其是否存在。
术语“使用”具有其常规含义,并因而表示利用(例如付诸运行)方法或组合物以实现目的。例如,如果使用程序来创建文件,那么执行程序以建立文件,所述文件通常是程序的输出。在另一个实例中,如果使用计算机文件,那么通常访问、读取该文件并利用其中储存的信息来实现目的。类似地,如果使用特定标示(例如条码),那么通常读取所述特定标示以识别例如与该特定标示相关的物体或文件。
本文所使用的术语“Tm”指的是寡核苷酸双链体中一半的双链体保持杂交且一半的双链体解离成单链时的熔解温度。寡核苷酸双链体的Tm可通过实验被测定或使用下式预测:Tm=81.5+16.6(log10[Na+])+0.41(G+C部分)-(60/N),其中N是链长,[Na+]小于1M。参见Sambrook和Russell(2001;Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Press,Cold Spring Harbor N.Y.,第10章)。存在用于预测寡核苷酸双链体的Tm的其它公式,一个公式可以或多或少地适合于给定的条件或条件集合。
本文所使用的术语“游离于溶液(free in solution)”描述了不受另一分子束缚或限制的分子,例如多核苷酸。
对于基因组,术语“区分(partitioning)”指的是将基因组的一部分与基因组的其余部分分开以产生与基因组的其余部分分离的产物。术语“区分”涵盖富集。
本文所使用的术语“基因组区域”指的是基因组(例如动物或植物基因组例如人类、猴子、大鼠、鱼或昆虫或植物的基因组)的区域。在某些情况下,可使用参考基因组区域(即已知核苷酸序列的基因组区域,例如其序列被存储在NCBI的Genbank数据库或其它数据库中的染色体区域)来设计本文所述方法中使用的寡核苷酸。这种寡核苷酸可被用于使用含测试基因组的样品的试验中,其中所述测试基因组含有寡核苷酸的结合位点。
本文所使用的术语“基因组序列”指的是出现在基因组中的序列。
本文所使用的术语“基因组片段”指的是基因组(例如动物或植物基因组例如人类、猴子、大鼠、鱼或昆虫或植物的基因组)的区域。基因组片段可以是完整染色体或染色体片段。基因组片段可连接有衔接子(在这种情况下,它具有与片段的一端或两段相连接的衔接子)或未连接衔接子。
在某些情况下,可使用参考基因组区域(即已知核苷酸序列的基因组区域,例如其序列被存储在NCBI的Genbank数据库或其它数据库中的染色体区域)来设计本文所述方法中使用的寡核苷酸。这种寡核苷酸可被用于使用含测试基因组的样品的试验中,其中所述测试基因组含有寡核苷酸的结合位点。
本文所使用的术语“亲和标签”指的是可被用来使连接有亲和标签的分子与不含所述亲和标签的其它分子分开的部分。“亲和标签”是特异性结合对(即两种分子,其中一种分子通过化学或物理方式与另一分子特异性结合)的成员。特异性结合对的互补成员在本文中被称为“捕获剂”,其可被固定化(例如,至色谱支持物、珠子或平面表面)以产生与所述亲和标签特异性结合的亲和色谱支持物。换言之,“亲和标签”可与“捕获剂”结合,其中亲和标签与捕获剂特异性结合,从而促进连接有亲和标签的分子与不含所述亲和标签的其它分子分开。
本文所使用的术语“生物素部分”指的是亲和剂,包括生物素或生物素类似物例如脱硫生物素、氧化生物素、2’-亚氨基生物素、二氨基生物素、生物素亚砜、生物胞素等。生物素部分与链霉亲和素结合的亲和力为至少10-8M。生物素亲和剂还可包括连接子(linker),例如-LC-生物素、-LC-LC-生物素、-SLC-生物素或-PEGn-生物素,其中n为3-12。
本文所使用的术语“末端核苷酸”指的是位于核酸分子5’或3’末端的核苷酸。核酸分子可以是双链(即,双链化的)或单链形式。
本文所使用的术语“连接”指的是酶促催化地结合第一DNA分子5’末端的末端核苷酸与第二DNA分子3’末端的末端核苷酸。
“多个/种”包含至少2个成员。在某些情况下,多个/种可具有至少10个、至少100、至少100、至少10,000、至少100,000、至少106、至少107、至少108或至少109或更多个/种成员。
如果两种核酸“互补”,那么它们在高度严格性条件下相互杂交。术语“完美互补”被用来描述下述双链体,其中一种核酸的每个碱基与另一种核酸中的互补核苷酸碱基配对。在许多情况下,互补的两种序列具有至少10(例如至少12或15)个互补的核苷酸。
术语“消化”旨在表示下述过程,通过所述过程核酸被酶(例如核酸内切酶或核酸外切酶,例如限制酶)切割。为了消化核酸,使酶与核酸在适合限制酶起作用的条件下接触。适合市售限制酶活性的条件是已知的并且购买后随这些酶被提供。
“寡核苷酸结合位点”指的是靶多核苷酸中与寡核苷酸杂交的位点。如果寡核苷酸“提供”引物的结合位点,那么引物可与该寡核苷酸或其互补物杂交。
本文所使用的术语“分开”指的是物理分开两种要素(例如,根据尺寸或亲和力,等)以及降解一种要素而留下完整的另一要素。
术语“靶序列”指的是未被修饰基因组以及已被修饰(例如片段化的和/或连接衔接子的)或复制的基因组中的序列。与靶基因组序列杂交的寡核苷酸与基因组序列碱基配对。含有靶序列的基因组片段的长度可在0.5kb至超过500kb的范围内或更长,例如5kb至100kb。
本文所使用的术语“参考染色体区域”指的是已知核苷酸序列的染色体区域,例如其序列被存储在NCBI的Genbank数据库或其它数据库中的染色体区域。
本文所使用的术语“链”指的是由通过共价键(例如磷酸二酯键)共价连接在一起的核苷酸构成的核酸。
在细胞中,DNA通常以双链形式存在,并因而具有两条互补的核酸链,在本文中被称为“顶”和“底”链。在某些情况下,染色体区域的互补链可被称为“正”链和“负”链、“第一”链和“第二”链、“编码”链和“非编码”链、“Watson”链和“Crick”链或者“正义”链和“反义”链。链被分配成顶链或底链是任意的,并非暗示任何特定的方向、功能或结构。一些示例性的哺乳动物染色体区域(例如BAC、组装体、染色体等)的第一链的核苷酸序列是已知的,并且可在例如NCBI的Genebank数据库中找到。
本文所使用的术语“顶链”指的是核酸的任何一条链,但并非核酸的两条链。当寡核苷酸或引物“仅与顶链”结合或退火时,它仅与一条链结合而不与另一条链结合。本文所使用的术语“底链”指的是与“顶链”互补的链。当寡核苷酸或引物“仅与一条链”结合或退火时,它仅与一条链(例如,第一链或第二链)结合而不与另一条链结合。
术语“共价联结(covalently linking)”指的是在两个分开的分子(例如双链核酸的顶链和底链)之间形成共价键。连接(ligating)是共价联结的一种类型。
本文所使用的术语“变性”指的是通过将核酸双链体放置在合适的变性条件下来使所述双链体的至少部分碱基对分开。变性条件在本领域众所周知。在一种实施方式中,为了使核酸双链体变性,可将该双链体暴露于高于双链体的Tm的温度,从而使该双链体的一条链从另一条链释放。在某些实施方式中,可通过将核酸暴露于至少90℃的温度持续合适量的时间(例如,至少30秒,多达30分钟)来使其变性。在某些实施方式中,可使用完全变性条件来完全分开双链体的碱基对。在另一些实施方式中,可使用部分变性条件(例如,利用低于完全变性条件的温度)来分开双链体某些部分的碱基对(例如,富含A-T碱基对的区域可分开,而富含G-C碱基对的区域可保持配对)。核酸还可被化学变性(例如,使用尿素或NaOH)。
本文所使用的术语“标记”指的是可被用来提供可检测(优选地可量化)效果且可被连接到核酸或蛋白质上的任何原子或分子。标记包括但不限于染料和放射性标记例如32P;结合部分例如生物素;半抗原例如地高辛;萤光(luminogenic)、磷光或荧光部分;和单独的荧光染料或荧光染料与能够通过荧光共振能量转移(FRET)抑制或转变发射谱的部分的组合。标记可提供通过荧光、放射性、比色法、重量测定、X-射线衍射或吸收、磁性、酶活性等等可检测的信号。标记可以是带电部分(带正电荷或负电荷),或者可为电荷中性的。标记可包含核酸或蛋白序列或者由核酸或蛋白序列组成,只要包含标记的序列可被检测到。术语“标记的dNTP”指的是被结合的标记修饰的dNTP。术语“标记的ddNTP”指的是被结合的标记修饰的ddNTP。
本文所使用的术语“标记的寡核苷酸”指的是具有亲和标签(例如,生物素部分)的寡核苷酸,被使得能够分开或检测的原子或基团(例如,溴代-脱氧尿苷,或赋予不同密度的胶体金颗粒)修饰的寡核苷酸,被光学可检测标记(例如,荧光或另一种类型的发光标记)修饰的寡核苷酸。仅含有天然存在核苷酸的寡核苷酸不是被标记的寡核苷酸。
术语“衔接子”指的是双链衔接子、单链衔接子,以及部分为双链且部分为单链的衔接子。衔接子可以是DNA或RNA,或者可含有DNA和RNA二者。
术语“表面被束缚”指的是被固定化在固体基质表面上的分子,其中所述基质可具有多种构型,例如片、珠或其它结构。
本文所使用的术语“基因型分型”指的是任何类型的核酸序列分析,其包括测序、多态性(SNP)分析和鉴定重排的分析。
本文所使用的术语“测序”指的是下述方法,通过所述方法鉴定多核苷酸中的至少10个连续核苷酸(例如鉴定至少20个、至少50个、至少100个或至少200个或更多连续核苷酸)。
术语“下一代测序”指的是Illumina、Life Technologies和Roche等目前采用的所谓并行化的边合成边测序或边连接边测序平台。下一代测序方法还可包括纳米孔测序方法或基于电子检测的方法例如被Life Technologies商业化的离子激流(Ion Torrent)技术。
术语“酶促处理”指的是由酶(例如,聚合酶或限制酶)催化的共价修饰。引物延伸(包括PCR、滚环扩增)、转录(例如,使用例如T7或T3聚合酶)和消化(例如,使用限制酶)都是酶促处理的类型。
本文所使用的术语“延伸”指的是通过使用聚合酶添加核苷酸来延伸引物。如果与核酸退火的引物被延伸,那么所述核酸担当延伸反应的模板。
本文所使用的术语“条码序列”或“分子条码”指的是特定的核苷酸序列,其被用来:a)鉴定和/或追踪反应中多核苷酸的来源,和/或b)计算初始分子被测序多少次(例如,在基本样品中的每个分子被不同序列标签化,然后扩增该样品的情况下)。条码序列可位于寡核苷酸的5’末端、3’末端或中间。条码序列的尺寸和组成可广泛变化;下列参考文献提供了选择适合特定实施方式的条码序列集合的指导:Brenner,美国专利号5,635,400;Brenner等人,Proc.Natl.Acad.Sci.,97:1665-1670(2000);Shoemake等人,Nature Genetics,14:450-456(1996);Morris等人,欧洲专利申请0799897A1;Wallace,美国专利号5,981,179;等等。在一个具体实施方式中,条码序列的长度可在4-36个核苷酸,或6-30个核苷酸,或8-20个核苷酸的范围内。
本文所使用的术语“PCR试剂”指的是在模板上进行聚合酶链反应(PCR)所需的所有试剂。如本领域所知,PCR试剂基本上包括第一引物、第二引物、热稳定性聚合酶和核苷酸。取决于使用的聚合酶,离子(例如,Mg2+)也可存在。PCR试剂可任选地含有模板,靶标序列可从所述模板扩增。
本文所使用的术语“瓣状切割反应(flap cleavage reaction)”指的是下述反应,其中底物以重叠依赖性方式被瓣状核酸内切酶切割从而释放瓣。瓣状试验的原理众所周知并在例如,Lyamichev等人(Nat.Biotechnol.199917:292-296)、Ryan等人(Mol.Diagn.19994:135-44)和Allawi等人(J ClinMicrobio1.200644:3443-3447)中被描述。
本文所使用的术语“瓣状核酸内切酶(flap endonuclease)”或简称“FEN”指的是一类核苷酸分解酶,其作为结构特异性核酸内切酶作用于DNA结构,其中双链体的链之一上包含单链5'突出或瓣,该条链被另一条核酸链取代,即,使得在单链和双链DNA之间的交界处有重叠核苷酸。FEN催化单链和双链DNA交界处的磷酸二酯键水解切割,从而释放所述突出或瓣。瓣状核酸内切酶被Ceska和Savers(Trends Biochem.Sci.l99823:331-336)及Liu等人(Annu.Rev.Biochem.200473:589-615)综述。FEN可以是单独的酶、多亚基酶或可作为另一酶或者蛋白复合体的活性存在,例如DNA聚合酶。瓣状核酸内切酶可以是热稳定的。
其它的术语定义可出现在说明书全文中。
示例性实施方式说明
本公开内容提供了通过侵入性切割将衔接子添加到基因组序列中的方法,以及进行所述方法的试剂盒。在某些实施方式中,所述方法可被用来产生随机产生的基因组片段的文库,其中每个所述片段都含有与其连接的衔接子序列。这些实施方式在全基因组测序中有具体应用。在另一些实施方式中,所述方法可被用来产生靶基因组片段文库,其中每个所述片段都含有与其连接的衔接子序列。这些实施方式在例如靶向再测序应用和SNP图谱制作中有具体应用。
在描述多种实施方式之前,应该理解:本公开的教导不限于所述特定实施方式,并因而当然可以变化。还应该理解:本文中所用术语仅为了描述具体实施方式,并没有意图是限制性的,因为本教导的范围将仅由所附的权利要求限定。
本文所使用的节标题仅为了组织目的,其不应以任何方式被解释为限制被描述的主题。虽然结合多种实施方式描述本教导,但这并不意味着本教导限于这些实施方式。相反地,本教导包含本领域技术人员理解的各种替代选择、改变和等价物。
除非另外定义,本发明使用的所有技术和科学术语具有与本公开所属的技术领域的普通技术人员通常理解的相同含义。尽管与本文描述的那些方法和材料相似或相同的任何方法和材料也能够用于本教导的实践或检测,但现在描述一些示例性的方法和材料。
对任何出版物的引用是其在申请日前的公开,并不应当解释为承认本权利要求无权凭借着在先发明早于这种公开。此外,所提供的出版物的日期可不同于实际公开日期,其可能需要独立确认。
正如本领域技术人员在阅读该公开后显而易见的,本文描述的和示例的每个单独的实施方案有分立的组成和特征,其可以很容易地与任何其它几种实施方案的特征分开或组合而不脱离本教导的范围或精神。任何记载的方法可以以记载的事件顺序进行或逻辑上可行的任何其它顺序进行。
本文引用的所有专利和出版物,包括这些专利和出版物中公开的所有序列,通过引用被清楚并入本文。
为了参考目的,图1中显示了晕环探针的两种实施方式:2和16。如图1所示,晕环探针的两种实施方式2和16包含:(i)第一寡核苷酸4,其包含与片段靶DNA中的不同区域杂交的侧翼序列8和10,以及中心序列12;和(ii)与所述第一寡核苷酸的中心序列互补的一种或多种第二寡核苷酸。在实施方式2(被展示于图A)中,所述一种或多种第二寡核苷酸可以是单个寡核苷酸14。在实施方式16(被展示于图B)中,所述一种或多种第二寡核苷酸可以是两种寡核苷酸14a和14b,其中每种各含有与所述第一寡核苷酸杂交的区域,和不与所述第一寡核苷酸杂交的尾巴。在某些实施方式中,除了分子条码序列之外,所述一种或多种第二寡核苷酸可以提供扩增和/或测序引物结合位点。如果使用晕环探针16,那么这些序列可存在于寡核苷酸14a和14b的尾巴中。图1中所示的任何一种晕环探针均可被用于下文所述方法中。仅仅为了方便解释所述方法,图中示意了利用图1的图A所示的晕环探针的第一实施方式的方法。
参考图2,该方法的一种实施方式包含:将随机剪切的基因组DNA 20与晕环探针22杂交以产生第一环状复合物24。如上所述,晕环探针包含:(i)第一寡核苷酸,其包含与随机剪切的基因组DNA片段中的不同区域杂交的侧翼序列,和中心序列;和(ii)与所述第一寡核苷酸的中心序列互补的一种或多种第二寡核苷酸。如图所示,第一环状复合物24包含具有突出末端26和28的随机剪切的基因组DNA片段23。如图所示,晕环探针的第一寡核苷酸可含有任选的捕获部分21,例如生物素部分,其可被用来在方法过程中分离复合物之一。在这些实施方式中,所述方法可任选地涉及:在消化之前,使用捕获部分分离第一环状复合物。所述方法的下一步涉及酶促消化第一环状复合物中基因组片段的突出末端以提供第二环状复合物30,其中一种或多种第二寡核苷酸的5’和3’末端与经消化的基因组片段32的3’和5’末端可连接性邻近(ligatably adjacent)。可以多种不同方式进行酶促消化。例如,酶促消化可包括:在用于填补任何已被过度消化的末端的聚合酶的任选存在下,使用单链特异性双向核酸外切酶—核酸外切酶VII来消化第一环状复合物。在另一些实施方式中,酶促消化可包括:例如,用包含Pfu DNA聚合酶和Taq DNA聚合酶的混合物、包含T4DNA聚合酶和核酸外切酶VII的混合物处理,用绿豆核酸酶处理,或者用瓣状核酸内切酶和3’核酸外切酶(例如核酸外切酶I、核酸外切酶T、核酸外切酶V)联合处理,或者用5’和3’核酸外切酶顺次处理。如图2中所示,所述方法的这种实施方式包括:使经消化的基因组片段32的可连接性末端与一种或多种第二寡核苷酸的末端连接(即,连接经消化的基因组片段的3’末端和第二寡核苷酸的5’末端之间的可连接性结点(junction)34,和连接经消化的基因组片段的5’末端和第二寡核苷酸的3’末端之间的可连接性结点36)以产生环状DNA分子40。在某些实施方式中(如图2中所示),因为经消化的基因组片段32的末端与单一第二寡核苷酸的两端连接,所以环状DNA分子40可以共价成环。在另一些实施方式中,如果利用晕环探针的第二种实施方式(如图1的图B中所示),那么环状DNA分子40可以非共价成环。在这些实施方式中,第一寡核苷酸与片段化的基因组片段的5’末端和3’末端二者杂交并使片段末端保持在一起以提供环状DNA分子。在这些实施方式中,经消化的基因组片段32的5’末端与一种第二寡核苷酸的3’末端相连接,且经消化的基因组片段32的3’末端与另一第二寡核苷酸的5’末端相连接。
图3中展示了获得类似于通过图2所示方法产生的产物的环状产物的一种替代性方法。在图3所示实施方式中,该方法使用RNA寡核苷酸,但任何可消化的寡核苷酸均能够被使用。参考图3,该方法的这种实施方式包含:将随机剪切的基因组DNA 50与RNA寡核苷酸52杂交以产生RNA/DNA双链体56,其中所述RNA寡核苷酸52包含与所述随机剪切的基因组DNA片段杂交的区域。RNA/DNA双链体56包含基因组片段58和RNA寡核苷酸52,且所述基因组片段含有突出序列。在某些实施方式中,RNA寡核苷酸52可包含任选的捕获部分,例如生物素部分54。在这些实施方式中,所述方法可包括:在下述消化步骤之前,使用捕获部分分离酶促消化的第一复合物56。产生双链体之后,该方法包括:酶促消化RNA/DNA双链体中基因组片段的突出末端以提供双链体59,所述双链体59包含作为确定末端的经消化基因组片段60。酶促消化使用类似于上述方法的方法。例如,酶促消化可包括:在用于填补任何已被过度消化的末端的聚合酶的任选存在下,使用单链特异性双向核酸外切酶—核酸外切酶VII来消化第一环状复合物。例如,在另一些实施方式中,酶促消化可包括:用包含Pfu DNA聚合酶和TaqDNA聚合酶的混合物、包含T4DNA聚合酶和核酸外切酶VII的混合物处理,用绿豆核酸酶处理,或者用瓣状内切核酸酶和3’核酸外切酶(例如核酸外切酶I、核酸外切酶T、核酸外切酶V)联合处理,或者用5’和3’核酸外切酶顺次处理。这种实施方式中使用的寡核苷酸的长度可在10-200个核苷酸范围内,例如10-20、11-30、31-40、41-50、51-60、61-70、71-80、80-100、100-150或150-200个核苷酸范围内。
双链体59产生后,所述方法可包括:消化除去双链体的RNA寡核苷酸以释放经消化的基因组片段62。接下来,所述方法可包括:使经消化的基因组片段62与晕环探针64杂交,其实例在图1中被阐释。如图所示,晕环探针可包含第一寡核苷酸66(其包含与经消化的基因组片段的末端杂交的侧翼序列,和中心序列)和与所述第一寡核苷酸的中心序列互补的一种或多种第二寡核苷酸68以提供第二复合物70,其中所述第二寡核苷酸的5’和3’末端与经消化的基因组片段的3’和5’末端可连接性邻近。所述方法的这种实施方式包括:使经消化的基因组片段70的可连接性末端与一种或多种第二寡核苷酸的末端连接以产生环状DNA分子72。在某些实施方式中(如图3中所示),因为经消化的基因组片段60的末端与单一第二寡核苷酸的两端连接,所以环状DNA分子72可以共价成环。在某些情况下,如果使用晕环探针的第二实施方式(如图1的图B中所示),那么环状DNA分子72可以非共价成环。在这些实施方式中,第一寡核苷酸与片段化的基因组片段的5’末端和3’末端二者杂交并使片段末端保持在一起以提供环状DNA分子。在这种实施方式中,第一寡核苷酸将环末端保持在一起。在这种实施方式中,经消化的基因组片段60的5’末端与一种第二寡核苷酸的3’末端相连接,且经消化的基因组片段60的3’末端与另一第二寡核苷酸的5’末端相连接。在这种实施方式中,可使用NaOH或RNAseH处理消化双链体59的RNA寡核苷酸,但任何合适的消化方法均可被使用。
在任何上述实施方式中,可使用化学、物理或转座酶催化片段化方法从基因组DNA产生随机剪切的基因组DNA,参见,例如,Adey等人(Genome Biology 2010,11:R119)。例如,物理片段化方法可以是超声、雾化或剪切基因组DNA。在某些实施方式中,在进行所述方法之前,可将基因组DNA片段化至平均尺寸在100bp-10kb(例如200bp-1kb)范围内。
图4示意性阐释了能够对任何上述实施方式中的经消化基因组片段进行扩增和测序的方法。如图4中所示,可使用反向PCR引物86和88扩增产物DNA分子80(其包含经消化的基因组片段82和一种或多种第二寡核苷酸,其可为如所示的环形,或者为线性,这取决于所使用的晕环探针的类型),其中所述引物86和88与所述一种或多种第二寡核苷酸提供的位点结合。在所示实施方式中,引物86和88与单一第二寡核苷酸提供的位点结合。在另一些实施方式中,引物86和88的结合位点可由图1的图B中所示的两种第二寡核苷酸的尾巴提供。可对扩增产物90进行测序以提供至少部分的消化的基因组片段的核苷酸序列。在某些实施方式中,可使用与所述一种或多种第二寡核苷酸中的测序引物位点杂交的引物进行测序。
将显而易见的是,在某些实施方式中,通过一种或多种第二寡核苷酸添加的序列可含有适合用于下一代测序平台的序列,所述测序平台例如,Illumina的可逆性终止法、Roche的焦磷酸测序法(454)、Life Technologies的连接测序法(SOLiD平台)或Life Technologies的离子激流平台。下列参考文献中描述了这种方法的实施例:Margulies等人(Nature 2005437:376-80);Ronaghi等人(Analytical Biochemistry 1996 242:84-9);Shendure(Science2005309:1728);Imelfort等人(Brief Bioinform.200910:609-18);Fox等人(Methods Mol Biol.2009;553:79-108);Appleby等人(Methods Mol Biol.2009;513:19-39)和Morozova(Genomics.200892:255-64),其中关于方法和方法的具体步骤(包括每个步骤的起始产物、试剂和终产物全部)的一般描述的通过引用被并入本文。序列可存在于一种或多种第二寡核苷酸中(在它们的尾巴中或在与第一寡核苷酸杂交的序列中)。在某些实施方式中,一种或多种第二寡核苷酸可含有两组引物结合位点,一组用于通过反向PCR扩增环状DNA,另一组用于对由此得到的产物进行测序。一种或多种第二寡核苷酸还可包含位于扩增和测序引物结合位点下游的分子条码,其可被用来鉴定序列来自哪个样品,或计算多少不同的起始分子已被测序。在另一些实施方式中,可使用纳米孔测序对扩增子进行测序(例如,如Soni等人Clin Chem 53:1996-2001 2007中所述,或如Oxford NanoporeTechnologies所述)。纳米孔测序是单分子测序技术,其中单个DNA分子在通过纳米孔时被直接测序。纳米孔是小洞,其直径约1nm。将纳米孔浸入传导流体并越过它应用电势(电压)导致微量电流,这是因为离子通过纳米孔被传导。流过的电流量对纳米孔的尺寸和形状敏感。当DNA分子穿过纳米孔时,DNA分子上的每个核苷酸不同程度阻塞纳米孔,从而不同程度改变通过纳米孔的电流的量级。因此,这种DNA分子穿过纳米孔时的电流改变代表DNA序列的读取。纳米孔测序技术在美国专利号5,795,782,6,015,714,6,627,067,7,238,485和7,258,838以及美国专利申请号2006003171和20090029477中被描述。
主题晕环探针各个区域的长度可变化很大,这取决于期望的应用以及所述一种或多种第二寡核苷酸携带的载量(freight多少)(即,多少个引物结合位点、条码等)。在某些实施方式中,晕环探针双链区域的长度可为20-100个碱基对(例如30bp-60bp),且侧翼区域(其能够与基因组中的靶片段特异性杂交)序列的长度可为10-100个碱基对(例如12bp-50bp)。应该显而易见的是,晕环探针双链区域的核苷酸序列应被设计从而它不与所研究的基因组杂交。
上述方法可被用来操作和分析来自几乎任何核酸来源的DNA,包括但不限于基因组DNA和互补DNA、质粒DNA、线粒体DNA、合成DNA和BAC克隆等。此外,任何生物体、有机材料或含核酸的物质均可被用作将依照本发明被处理的核酸来源,包括但不限于,植物、动物(例如,爬行动物、哺乳动物、昆虫、蠕虫、鱼类、等)、组织样品、细菌、真菌(例如,酵母)、噬菌体、病毒、尸体组织、考古学上的/古代的样品,等等。在某些实施方式中,所述方法中使用的初始DNA可来源于哺乳动物,其中在某些实施方式中,哺乳动物是人类。
在某些实施方式中,被分析的初始DNA可来源于单一来源(例如,单一生物体、病毒、组织、细胞、对象等),然而在另一些实施方式中,核酸样品可以是从多个来源提取的核酸的合并物(例如来自多种生物体、组织、细胞、对象等的核酸合并物),其中“多种”表示两种或更多种。因而,在某些实施方式中,核酸样品可含有来自2种或更多种来源,3种或更多种来源,5种或更多种来源,10种或更多种来源,50种或更多种来源,100种或更多种来源,500种或更多种来源,1000种或更多种来源,5000种或更多种来源,多达并包括约10000种或更多种来源的核酸。分子条码可允许来自不同来源的序列在分析之后被区分。此外,反应可以是多重的以在单个反应中靶向多个不同靶位点(例如,10-1000)。
试剂盒
本公开还提供用于实行如上所述本发明方法的试剂盒(kit)。所述试剂盒至少含有所述晕环探针,以及用于进行所述方法的合适反应试剂(例如,缓冲液等)。根据期望,试剂盒的各种组分可出现在分开的容器中或者某些相容组分可被预先组合在单个容器中。
除了上述组分之外,所述试剂盒可进一步包含关于使用所述试剂盒的组分来实行所述方法的说明(即,样品分析说明)。实行所述方法的说明通常记录在合适的记录介质上。例如,说明可被印刷在基质(例如纸或塑料,等)上。因而,说明可作为包装插入物(insert)出现在试剂盒中,在试剂盒或其组分的容器标记中(即,与包装或小包装相关)等。在另一些实施方式中,说明可以作为存在于合适的计算机可读存储介质(例如,CD-ROM、磁盘等)上的电子存储数据文件被呈现。在又一些实施方式中,实际说明未出现在试剂盒中,但从远程来源(例如,通过因特网)获得说明的方法被提供。这种实施方式的一个实例是包括网址的试剂盒,其中可在所述网址查看说明并/或可从所述网址下载说明。与说明一样,这种获得说明的方法被记录在合适基质上。

Claims (20)

1.一种方法,其包括
(a)使随机剪切的基因组DNA与晕环探针杂交以产生第一环状复合物,其中所述晕环探针包含:
(i)第一寡核苷酸,所述第一寡核苷酸包含与所述随机剪切的基因组DNA的片段中的不同区域杂交的侧翼序列,以及中心序列;和
(ii)与所述第一寡核苷酸的中心序列互补的一种或更多种第二寡核苷酸;
(b)酶促消化第一环状复合物中基因组片段的突出末端,以提供其中所述一种或更多种第二寡核苷酸的5’和3’末端与经消化基因组片段的3’和5’末端可连接性邻近的第二环状复合物;和
(c)使(c)的经消化基因组片段的末端与所述一种或更多种第二寡核苷酸的末端连接以产生环状DNA分子。
2.权利要求1所述方法,其中所述方法包括:
(d)使用与所述一种或更多种第二寡核苷酸提供的位点结合的一种或更多种引物,从所述环状DNA分子扩增经消化的基因组片段。
3.权利要求2所述方法,其还包括:
(e)对(d)的扩增产物进行测序以提供至少部分的经消化基因组片段的核苷酸序列。
4.在前权利要求中任一项所述方法,其中所述第一寡核苷酸包含捕获部分,且其中所述方法在步骤(a)和(b)之间包括:使用所述捕获部分分离所述第一环状复合物。
5.权利要求3所述方法,其中使用与所述一种或更多种第二寡核苷酸中的测序引物位点杂交的引物进行所述测序。
6.在前权利要求中任一项所述方法,其中所述酶促消化包括:在聚合酶的任选存在下,使用单链特异性双向核酸外切酶消化所述第一环状复合物。
7.在前权利要求中任一项所述方法,其中所述单链特异性双向核酸外切酶是核酸外切酶VII。
8.在前权利要求中任一项所述方法,其中所述酶促消化包括:用PfuDNA聚合酶/Taq DNA聚合酶混合物、T4DNA聚合酶/核酸外切酶VII混合物处理,用绿豆核酸酶处理,用瓣状核酸内切酶和另一种3’核酸内切酶联合处理。
9.在前权利要求中任一项所述方法,其中使用化学、物理或转座酶催化的片段化方法从基因组DNA产生所述随机剪切的基因组DNA。
10.权利要求8所述方法,其中所述物理的片段化方法包括超声、雾化或剪切。
11.在前权利要求中任一项所述方法,其中所述一种或更多种第二寡核苷酸是与所述第一寡核苷酸的中心序列互补的单一寡核苷酸。
12.在前权利要求中任一项所述方法,其中所述一种或更多种第二寡核苷酸是两种寡核苷酸,其每种都包含与所述第一寡核苷酸杂交的第一区域,和提供一个或更多个扩增引物结合位点的第二区域。
13.一种方法,其包括:
(a)使随机剪切的基因组DNA与RNA寡核苷酸杂交以产生RNA/DNA双链体,所述RNA寡核苷酸包含与所述随机剪切的基因组DNA的片段杂交的区域;
(b)酶促消化所述RNA/DNA双链体中基因组片段的突出末端,以提供包含具有确定末端的经消化基因组片段的双链体;
(c)消化(b)的双链体的RNA寡核苷酸以释放经消化的基因组片段;
(d)使(c)的经消化基因组片段与晕环探针杂交,所述晕环探针包含:
(i)第一寡核苷酸,所述第一寡核苷酸包含与经消化的基因组片段的末端杂交的侧翼序列,以及中心序列;和
(ii)与所述第一寡核苷酸的中心序列互补的一种或更多种第二寡核苷酸,以提供其中所述第二寡核苷酸的5’和3’末端与经消化的基因组片段的3’和5’末端可连接性邻近的第二复合物;
(e)使经消化的基因组片段的末端与所述第二寡核苷酸连接以产生环状DNA分子。
14.权利要求13所述方法,其中所述RNA寡核苷酸包含捕获部分,且所述方法包括:使用所述捕获部分分离(b)的酶促消化的第一复合物。
15.权利要求13或14所述方法,其中利用NaOH或RNAseH处理来完成所述消化步骤(c)。
16.权利要求13-15中任一项所述方法,其中所述方法包括:
(f)使用与所述第一寡核苷酸的中心序列中的位点结合的一种或更多种引物,从所述环状DNA分子扩增经消化的基因组片段。
17.权利要求16所述方法,其还包含:
(g)对(f)的扩增产物进行测序。
18.权利要求17所述方法,其中使用与所述一种或更多种第二寡核苷酸提供的测序引物位点杂交的引物完成所述测序。
19.权利要求13-18中任一项所述方法,其中所述酶促消化包括:使用核酸外切酶VII消化所述第一复合物。
20.权利要求13-18中任一项所述方法,其中所述第一探针包含捕获部分,且所述方法包括:在所述连接步骤(e)之前分离(d)的所述第二复合物。
CN201380063759.8A 2012-12-06 2013-10-03 无限制酶的靶标富集 Active CN104854246B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261734251P 2012-12-06 2012-12-06
US61/734,251 2012-12-06
PCT/US2013/063290 WO2014088694A1 (en) 2012-12-06 2013-10-03 Restriction enzyme-free target enrichment

Publications (2)

Publication Number Publication Date
CN104854246A true CN104854246A (zh) 2015-08-19
CN104854246B CN104854246B (zh) 2018-05-01

Family

ID=49640140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380063759.8A Active CN104854246B (zh) 2012-12-06 2013-10-03 无限制酶的靶标富集

Country Status (5)

Country Link
US (1) US10072260B2 (zh)
EP (1) EP2929048B1 (zh)
JP (1) JP6335918B2 (zh)
CN (1) CN104854246B (zh)
WO (1) WO2014088694A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109234388A (zh) * 2017-07-04 2019-01-18 深圳华大基因研究院 用于dna高甲基化区域富集的试剂、富集方法及应用
CN111154754A (zh) * 2015-09-18 2020-05-15 苏州新波生物技术有限公司 分析dna样品的探针集合和使用所述探针集合的方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2815099T3 (es) 2013-08-05 2021-03-29 Twist Bioscience Corp Genotecas sintetizadas de novo
WO2016061098A1 (en) * 2014-10-14 2016-04-21 Covaris, Inc. Acoustic energy mediation of genetic fragmentation
CA2975852A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016172377A1 (en) 2015-04-21 2016-10-27 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
IL258164B (en) 2015-09-18 2022-09-01 Twist Bioscience Corp Methods to regulate the activity of proteins and cells and a method for the production of nucleic acids
US11512347B2 (en) 2015-09-22 2022-11-29 Twist Bioscience Corporation Flexible substrates for nucleic acid synthesis
CN115920796A (zh) 2015-12-01 2023-04-07 特韦斯特生物科学公司 功能化表面及其制备
GB2568444A (en) 2016-08-22 2019-05-15 Twist Bioscience Corp De novo synthesized nucleic acid libraries
JP6871364B2 (ja) 2016-09-21 2021-05-12 ツイスト バイオサイエンス コーポレーション 核酸に基づくデータ保存
JP7169975B2 (ja) 2016-12-16 2022-11-11 ツイスト バイオサイエンス コーポレーション 免疫シナプスの変異体ライブラリーおよびその合成
CN110892485B (zh) 2017-02-22 2024-03-22 特韦斯特生物科学公司 基于核酸的数据存储
WO2018170169A1 (en) 2017-03-15 2018-09-20 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
GB2578844A (en) 2017-06-12 2020-05-27 Twist Bioscience Corp Methods for seamless nucleic acid assembly
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
GB2581620A (en) 2017-09-11 2020-08-26 Twist Bioscience Corp GPCR binding proteins and synthesis thereof
CN111565834B (zh) 2017-10-20 2022-08-26 特韦斯特生物科学公司 用于多核苷酸合成的加热的纳米孔
AU2019205269A1 (en) 2018-01-04 2020-07-30 Twist Bioscience Corporation DNA-based digital information storage
CN112639130B (zh) 2018-05-18 2024-08-09 特韦斯特生物科学公司 用于核酸杂交的多核苷酸、试剂和方法
SG11202109283UA (en) 2019-02-26 2021-09-29 Twist Bioscience Corp Variant nucleic acid libraries for antibody optimization
CN113766930A (zh) 2019-02-26 2021-12-07 特韦斯特生物科学公司 Glp1受体的变异核酸文库
CN114729342A (zh) 2019-06-21 2022-07-08 特韦斯特生物科学公司 基于条形码的核酸序列装配
CA3155629A1 (en) 2019-09-23 2021-04-01 Twist Bioscience Corporation Variant nucleic acid libraries for crth2
AU2021282588A1 (en) * 2020-06-05 2023-01-19 Sirona Genomics, Inc. Methods of identifying markers of graft rejection

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0401270D0 (sv) * 2004-05-18 2004-05-18 Fredrik Dahl Method for amplifying specific nucleic acids in parallel
JP2007020474A (ja) 2005-07-15 2007-02-01 Sony Corp 所望の一本鎖核酸を取得するための方法
US20080242560A1 (en) * 2006-11-21 2008-10-02 Gunderson Kevin L Methods for generating amplified nucleic acid arrays
US7862999B2 (en) * 2007-01-17 2011-01-04 Affymetrix, Inc. Multiplex targeted amplification using flap nuclease
US20090156412A1 (en) * 2007-12-17 2009-06-18 Helicos Biosciences Corporation Surface-capture of target nucleic acids
WO2012003374A2 (en) * 2010-07-02 2012-01-05 The Board Of Trustees Of The Leland Stanford Junior University Targeted sequencing library preparation by genomic dna circularization
CN102344961B (zh) 2011-09-30 2015-12-09 北京康旭医学检验所有限公司 一种经济的应用大规模平行测序技术检验多目标多基因的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111154754A (zh) * 2015-09-18 2020-05-15 苏州新波生物技术有限公司 分析dna样品的探针集合和使用所述探针集合的方法
CN111154754B (zh) * 2015-09-18 2024-02-02 苏州新波生物技术有限公司 分析dna样品的探针集合和使用所述探针集合的方法
CN109234388A (zh) * 2017-07-04 2019-01-18 深圳华大基因研究院 用于dna高甲基化区域富集的试剂、富集方法及应用
CN109234388B (zh) * 2017-07-04 2021-09-14 深圳华大生命科学研究院 用于dna高甲基化区域富集的试剂、富集方法及应用

Also Published As

Publication number Publication date
CN104854246B (zh) 2018-05-01
US20150307875A1 (en) 2015-10-29
EP2929048A1 (en) 2015-10-14
JP2016500259A (ja) 2016-01-12
EP2929048B1 (en) 2017-12-13
US10072260B2 (en) 2018-09-11
JP6335918B2 (ja) 2018-05-30
WO2014088694A1 (en) 2014-06-12

Similar Documents

Publication Publication Date Title
CN104854246A (zh) 无限制酶的靶标富集
CN109154013B (zh) 转座酶和y衔接子用于片段化和标签化dna的用途
CN107109401B (zh) 使用crispr-cas系统的多核苷酸富集
US10308979B2 (en) Target enrichment and labeling for multi-kilobase DNA
EP3837379B1 (en) Method of nucleic acid enrichment using site-specific nucleases followed by capture
CN111394426B (zh) 用于个人表观基因组学的至天然染色质的转座
CN102575293B (zh) 用于核酸特异性分析的探针
CN105026577B (zh) 通过序列捕获检测基因组重排
US20240209426A1 (en) Isothermal amplification components and processes
EP2722401B1 (en) Addition of an adaptor by invasive cleavage
CN104736722A (zh) 样品制备方法
MX2013003349A (es) Captura directa, amplificacion y secuenciacion de objetivo adn usando cebadores inmovilizados.
CN110869515B (zh) 用于基因组重排检测的测序方法
CA3225385A1 (en) Modified adapters for enzymatic dna deamination and methods of use thereof for epigenetic sequencing of free and immobilized dna
US20060003337A1 (en) Detection of small RNAS
CN116323971A (zh) 核酸的序列特异性靶向转座和选择以及分选
CN105026578B (zh) 通过引物延伸合成探针库
CN111278974B (zh) 钩状探针、核酸连接方法以及测序文库的构建方法
US20160273027A1 (en) Methods for detecting nucleic acids proximity
US11814689B2 (en) Nucleic acid detection using type III CRISPR complex
EP2828400B1 (en) Methods for assessing rna quality
WO2023170144A1 (en) Method of detection of a target nucleic acid sequence
WO2023034747A1 (en) Epitranscriptome evaluation
JP2005006587A (ja) 標的核酸の増幅及び/又は検出方法

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant