CN102016068A - 制备用于核酸测序的配对标签文库的方法 - Google Patents

制备用于核酸测序的配对标签文库的方法 Download PDF

Info

Publication number
CN102016068A
CN102016068A CN2009801083367A CN200980108336A CN102016068A CN 102016068 A CN102016068 A CN 102016068A CN 2009801083367 A CN2009801083367 A CN 2009801083367A CN 200980108336 A CN200980108336 A CN 200980108336A CN 102016068 A CN102016068 A CN 102016068A
Authority
CN
China
Prior art keywords
adapter
polynucleotide
otch
herbicide
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801083367A
Other languages
English (en)
Inventor
B·李
L·奚
S·S·拉纳德
Y·王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Corp
Original Assignee
Life Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Corp filed Critical Life Technologies Corp
Publication of CN102016068A publication Critical patent/CN102016068A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开内容涉及制备配对标签和配对标签文库的方法和组合物。

Description

制备用于核酸测序的配对标签文库的方法
相关申请
本申请要求2008年10月30日提交的序列号为61/109,638和2008年1月9日提交的序列号为61/020,114的美国临时申请的优先权,其全文引入本文作为参考。
技术领域
本公开内容涉及用于制备和使用序列配对标签和配对标签文库的方法和组合物。
背景技术
″末端配对(paired-end)″、″配对(pairwise)″、或″配对标签″测序技术在分子生物学领域,特别是在全基因组鸟枪法测序(Siegel A.F.等人,Genomics.2000,68:237-246;Roach J.C.等人,Genomics.1995,26:345-353)的背景下是普遍已知的。配对标签测序允许在单条多核苷酸双链体上从两个位置确定序列的两个″读数″。在一些情况下,与通过以随机的方式从两个独立的核酸序列中每个测序″n″个碱基相比,末端配对方式通过测序核酸序列的两个区段(每个长度为″n″个碱基)而允许获得更多的信息。例如,通过使用适当的软件工具用来组装序列信息(Millikin S.C.等人,Genome Res.2003,13:81-90;Kent,W.J.等人,Genome Res.2001,11:1541-8),可能利用下述知识,即″配对标签″序列并非完全随机的,而是已知在单条双链体上出现的,且因此在基因组中是连接的或配对的。这一信息可帮助将全基因组序列组装成一致序列。
发明内容
在一些实施方案中,本教导提供协助制备配对标签和配对标签文库的方法和产品。在一些实施方案中,这些可用于增加所产生的配对标签的大小以及用于降低成本。这种延长的大小可协助序列组装并提高下一代DNA测序应用如微生物鉴定和遗传性变异的发现的精确度。
在一些实施方案中,提供了形成配对标签的方法,该配对标签包含第一标签序列和第二标签序列。该方法包括将双链目标多核苷酸的第一末端和第二末端连接到衔接头由此形成环状核酸分子,其中环状核酸分子包含第一切口,其位于双链目标多核苷酸的第一末端和衔接头之间,以及第二切口,其位于双链目标多核苷酸的第二末端和衔接头之间,其中第一切口和第二切口与第二切口相比位于环状核酸分子的不同链上;以及进行切口平移反应,其中至少一个切口被平移到目标多核苷酸中。
在一些实施方案中,提供了形成来自于目标DNA片段的释放的配对标签的方法。该方法包括连接第一衔接头到目标DNA片段的第一末端,且连接第二衔接头到目标DNA片段的第二末端,由此产生衔接头修饰的片段,通过附着第三衔接头到衔接头修饰的片段来环化衔接头修饰的片段,由此形成环状核酸分子,其中第一切口存在于第三衔接头和第一衔接头之间,且第二切口存在于第二衔接头和第三衔接头之间,其中环状核酸分子包含DNA的第一条链和第二条链,且其中第一切口和第二切口不存在于环状核酸分子的同一条链上;进行切口平移反应,其中环状核酸分子的每条链上的切口被平移到目标DNA片段中,以及在被平移的切口的位置切割环状核酸分子,由此形成释放的配对标签。
在一些实施方案中,提供了释放的配对标签文库。释放的配对标签文库包含两个或更多释放的配对标签,该释放的配对标签通过下述方法制备,该方法包括连接第一衔接头到目标多核苷酸的第一末端,且连接第二衔接头到目标多核苷酸的第二末端,由此产生衔接头修饰的目标多核苷酸,通过附着第三衔接头到衔接头修饰的目标多核苷酸来环化衔接头修饰的目标多核苷酸,由此形成环状核酸分子,其中第一切口存在于第三衔接头和第一衔接头之间,且第二切口存在于第二衔接头和第三衔接头之间,其中环状核酸分子包含第一条链和第二条链,且其中第一切口和第二切口不存在于环状核酸分子的同一条链上;进行切口平移反应,其中环状核酸分子一条链上的切口被平移到目标多核苷酸中,以及在被平移的切口的位置切割环状核酸分子,由此形成释放的配对标签。
在一些实施方案中提供了释放的配对标签。释放的配对标签包含第一标签序列,其中第一标签序列包含目标多核苷酸的第一末端,其中第一标签序列的长度在27个核苷酸以上;第一衔接头,其共价结合到第一标签序列,其中第一衔接头包含结合部分;和第二标签序列,其共价结合到第一衔接头,其中第二标签序列包含目标多核苷酸的第二末端,且其中第二标签序列的长度在27个核苷酸以上。
在一些实施方案中提供了溶液。该溶液包含环状核酸分子,环状核酸分子包含:双链目标多核苷酸,其包含第一末端和第二末端;以及至少一个衔接头。至少一个衔接头可共价结合到双链目标多核苷酸的第一末端和第二末端,由此形成环化的核酸分子。环状核酸分子还包含第一切口,其位于双链目标多核苷酸的第一末端和衔接头之间,以及第二切口,其位于双链目标多核苷酸的第二末端和衔接头之间。第一切口与第二切口或缺口相比位于环状核酸分子的不同链上。该溶液也可包含切口平移酶。在一些实施方案中,该溶液还包含第二环状核酸分子,第二环状核酸分子包含双链目标多核苷酸,该双链目标多核苷酸包含第一末端和第二末端和至少一个衔接头,该衔接头共价结合到双链目标多核苷酸的第一末端和第二末端,由此形成第二环化的核酸分子。第二环状核酸分子包含第三切口,其中第三切口距离双链目标多核苷酸的第一末端和衔接头之间的部位在27个核苷酸以上,以及第四切口,其中第四切口距离双链目标多核苷酸的第二末端和衔接头之间的部位在27个核苷酸以上,且其中第三切口与第四切口相比位于环状核酸分子的不同链上。
在一些实施方案中,提供了形成配对标签的方法。该配对标签包含第一标签序列和第二标签序列,第一标签序列和第二标签序列在一起包含目标多核苷酸的至少一部分。该方法包括连接双链目标多核苷酸的第一末端到至少一个衔接头,以及连接双链目标多核苷酸的第二末端到至少一个衔接头。该方法进一步包括形成环状核酸分子,该环状核酸分子包含双链目标多核苷酸、第一切口和第二切口,第一切口包含环状核酸分子第一条链上的第一3’末端,第二切口包含环状核酸分子第二条链上的第二3’末端。第一切口和第二切口在环状核酸分子的不同链上。该方法进一步包括延伸环状核酸分子第一条链的第一3’末端到双链目标多核苷酸的序列中,以及延伸环状核酸分子第二条链的第二3’末端到双链目标多核苷酸的序列中。
在一些实施方案中,提供了带切口的连接多核苷酸。带切口的连接多核苷酸包含第一衔接头,该第一衔接头包含与第二衔接头链杂交的第一衔接头链。第一衔接头链在其5’末端上缺少磷酸基团。带切口的连接多核苷酸还包含第二衔接头,该第二衔接头包含与第四衔接头链杂交的第三衔接头链。第三衔接头链在其5’末端上缺少磷酸基团。带切口的多核苷酸进一步包含连接多核苷酸,该连接多核苷酸包含与第二连接链杂交的第一连接链。该连接多核苷酸包含第一末端和第二末端。第一衔接头附着到连接多核苷酸的第一末端,从而第一衔接头链在其5’末端上缺少磷酸基团的地方存在切口。第二连接链附着到第二衔接头链。第二衔接头附着到连接多核苷酸的第二末端,从而第二衔接头的第三衔接头链在其5’末端上缺少磷酸基团的地方存在切口。连接多核苷酸的第二条链附着到第四衔接头链。
在一些实施方案中,提供了带切口的连接多核苷酸。带切口的连接多核苷酸包含第一双链衔接头、双链连接多核苷酸和第二双链衔接头,该第二双链衔接头附着到双链连接多核苷酸的第二末端。第一双链衔接头附着到双链连接多核苷酸的第一末端。存在第一切口和第二切口,第一切口将第一衔接头的第一条链和双链载体的第一条链分开,第二切口将第二衔接头的第二条链和双链载体的第一条链分开。第一切口和第二切口在带切口的载体的不同链上。
在一些实施方案中,提供了制备配对标签的方法。该方法包括提供带切口的连接多核苷酸,该带切口的连接多核苷酸包含第一衔接头,该第一衔接头包含与第二衔接头链杂交的第一衔接头链,其中第一衔接头链在其5’末端上缺少磷酸基团;第二衔接头,该第二衔接头包含与第四衔接头链杂交的第三衔接头链,其中第三衔接头链在其5’末端上缺少磷酸基团;以及连接多核苷酸,其包含与第二连接链杂交的第一连接链。该连接多核苷酸包含第一末端和第二末端。第一衔接头附着到连接多核苷酸的第一末端,从而第一衔接头链在其5’末端上缺少磷酸基团的地方存在切口。第二连接链附着到第二衔接头链。第二衔接头附着到连接多核苷酸的第二末端,从而第二衔接头的第三衔接头链在其5’末端上缺少磷酸基团的地方存在切口。连接多核苷酸的第二条链附着到第四衔接头链。该方法进一步包括连接双链目标多核苷酸的第一末端到第一衔接头,连接双链目标多核苷酸的第二末端到第二衔接头,以及将第一和第二切口移动到双链目标多核苷酸中。
在一些实施方案中,提供了制备配对标签的方法,和配对标签本身。在一些实施方案中,该方法允许产生大小不受限制的配对标签。在一些实施方案中,本发明包括线性配对标签。线性配对标签可包含第一标签序列。第一标签序列包含目标多核苷酸的第一末端。线性配对标签可进一步包含共价结合到第一标签序列的第一衔接头和共价结合到第一衔接头的第二标签序列。第二标签序列包含目标多核苷酸的第二末端。线性配对标签缺少IIs型限制位点和缺少III型限制位点。
在一些实施方案中,提供了形成配对标签的方法,该配对标签包含第一标签序列和第二标签序列,第一标签序列和第二标签序列在一起包含目标多核苷酸的至少一部分。该方法可包括连接双链目标多核苷酸的第一末端和第二末端到衔接头,由此形成环状核酸分子,其中环状核酸分子包含第一切口,其位于双链目标多核苷酸的第一末端和衔接头之间,以及第二切口,其位于双链目标多核苷酸的第二末端和衔接头之间,其中第一切口和第二切口与第二切口相比位于环状核酸分子的不同链上,以及进行切口平移反应,其中至少一个切口被平移到目标多核苷酸中。在一些实施方案中,该方法可进一步包括允许切口平移反应持续进行一段特定的时间;以及终止切口平移反应。在一些实施方案中,双链目标多核苷酸的第一末端和第二末端缺少5’磷酸残基。在一些实施方案中,该方法进一步包括在第一切口和第二切口的平移互相越过之前终止切口平移反应。在一些实施方案中,第一切口和第二切口被平移10个碱基以上。在一些实施方案中,该方法进一步包括在第一切口和第二切口切割环状核酸分子的步骤。在一些实施方案中,第一切口和第二切口被平移500个碱基以下。在一些实施方案中,第一切口和第二切口被平移200个碱基以下。在一些实施方案中,第一切口和第二切口被平移100个碱基以下。在一些实施方案中,第一切口和第二切口被平移大约20个碱基至大约50个碱基。在一些实施方案中,至少一个切口被平移500个碱基以下。在一些实施方案中,至少一个切口被平移27个碱基以上并在500个碱基以下。在一些实施方案中,至少一个切口被平移200个碱基以下。在一些实施方案中,至少一个切口被平移28个碱基至大约50个碱基。在一些实施方案中,环状核酸分子包含第一缺口,其位于双链目标多核苷酸的第一末端和衔接头之间。在一些实施方案中,环状核酸分子包含第二缺口,其位于双链目标多核苷酸的第二末端和衔接头之间。在一些实施方案中,环状核酸序列包含缺口,该缺口在切口平移反应进行时被核苷酸填充,由此产生切口。在一些实施方案中,目标多核苷酸包含50至2500个核苷酸。在一些实施方案中,目标多核苷酸在连接步骤前经过大小选择技术以选择包含50至2500个核苷酸的多核苷酸。在一些实施方案中,衔接头包含结合部分。在一些实施方案中,使用选自下列的酶进行切口平移反应:大肠杆菌(E.coli)DNA聚合酶I、Taq DNA聚合酶、Vent DNA聚合酶、Klenow DNA聚合酶I、phi29 DNA聚合酶及其任何组合。在一些实施方案中,使用具有5’至3’外切核酸酶活性的DNA聚合酶进行切口平移反应。在一些实施方案中,切口平移反应包括通过5’至3’外切核酸酶活性除去核苷酸。在一些实施方案中,通过链置换发生切口平移反应。在一些实施方案中,该方法进一步包括在第一被平移的切口处切割环状核酸分子,由此形成线性多核苷酸,该线性多核苷酸包含被衔接头分开的第一标签序列和第二标签序列,其中第一标签序列和第二标签序列来源于目标多核苷酸。在一些实施方案中,该方法进一步包括在第二被平移的切口处切割环状核酸分子。在一些实施方案中,通过选自下列的酶切割环状核酸分子:S1核酸酶、绿豆核酸酶、核酸酶P1、核酸酶BAL-31、及其任何组合。在一些实施方案中,该方法进一步包括扩增线性多核苷酸。在一些实施方案中,衔接头包含结合部分,该结合部分包含生物素。在一些实施方案中,该方法进一步包括使用链霉抗生物素蛋白纯化配对标签的步骤。在一些实施方案中,该方法进一步包括在连接前用碱性磷酸酶处理目标多核苷酸,其中从目标多核苷酸的第一末端和第二末端中都除去5’磷酸。在一些实施方案中,碱性磷酸酶选自:小牛小肠碱性磷酸酶、细菌碱性磷酸酶、虾碱性磷酸酶、及其一些组合。在一些实施方案中,环状核酸分子还包含第二衔接头,其中第二衔接头放置在第一衔接头附近。在一些实施方案中,第一衔接头的一条链和第二衔接头的一条链缺少5’磷酸。在一些实施方案中,每个步骤通过所列的顺序进行。
在一些实施方案中,提供了形成来自于目标DNA片段的释放的配对标签的方法。该方法可包括连接第一衔接头到目标DNA片段的第一末端和连接第二衔接头到目标DNA片段的第二末端,由此产生衔接头修饰的片段,通过附着第三衔接头到衔接头修饰的片段来环化衔接头修饰的片段,由此形成环状核酸分子,其中第一切口存在于第三衔接头和第一衔接头之间,且第二切口存在于第二衔接头和第三衔接头之间,其中环状核酸分子包含DNA的第一条链和第二条链,且其中第一切口和第二切口不存在于环状核酸分子的同一条链上;进行切口平移反应,其中环状核酸分子的每条链上的切口被平移到目标DNA片段中,以及在被平移的切口的位置切割环状核酸分子,由此形成释放的配对标签。在一些实施方案中,该方法进一步包括允许切口平移反应持续进行一段特定的时间,以及终止切口平移反应。在一些实施方案中,该方法进一步包括在每个被平移的切口的位置切割多核苷酸链之前,终止切口平移反应。在一些实施方案中,该方法进一步包括附着引物衔接头到配对标签的末端。在一些实施方案中,该方法进一步包括用针对引物衔接头的引物扩增配对标签。在一些实施方案中,扩增是克隆扩增。在一些实施方案中,克隆扩增包括乳剂聚合酶链反应(乳剂PCR)。在一些实施方案中,克隆扩增包括桥式聚合酶链反应(桥式PCR)。在一些实施方案中,第三衔接头包含结合部分,并进一步包括将该结合部分结合到固体支持物。在一些实施方案中,固体支持物是阵列。在一些实施方案中,该方法进一步包括测序配对标签的一部分。
在一些实施方案中,提供了释放的配对标签文库,该释放的配对标签文库包含两个或更多释放的配对标签,所述释放的配对标签通过下述方法制备。该方法可包括连接第一衔接头到目标多核苷酸的第一末端和连接第二衔接头到目标多核苷酸的第二末端,由此产生衔接头修饰的目标多核苷酸,通过附着第三衔接头到衔接头修饰的目标多核苷酸来环化衔接头修饰的目标多核苷酸,由此形成环状核酸分子,其中第一切口存在于第三衔接头和第一衔接头之间,且第二切口存在于第二衔接头和第三衔接头之间,其中环状核酸分子包含第一条链和第二条链,且其中第一切口和第二切口不存在于环状核酸分子的同一条链上;进行切口平移反应,其中环状核酸分子一条链上的切口被平移到目标多核苷酸中,以及在被平移的切口的位置切割环状核酸分子,由此形成释放的配对标签。在一些实施方案中,目标多核苷酸从生物制备,该生物选自:质粒、病毒、原核细胞、古细菌细胞、细菌人工染色体、真核细胞、细胞系、原生动物、植物、藻类、细菌、真菌、昆虫、爬行动物、鱼、两栖动物、鸟类和哺乳动物。在一些实施方案中,目标多核苷酸经历大小选择技术。在一些实施方案中,在连接步骤前使用大小选择技术来选择包含2000至3000个核苷酸的多核苷酸。
在一些实施方案中,提供了释放的配对标签。释放的配对标签包含第一标签序列,其中第一标签序列包含目标多核苷酸的第一末端,且其中第一标签序列的长度为至少27个核苷酸;第一衔接头,其共价结合到第一标签序列;以及第二标签序列,其共价结合到第一衔接头,其中第二标签序列包含目标多核苷酸的第二末端,且其中第二标签序列的长度为至少27个核苷酸。在一些实施方案中,第一衔接头进一步包含结合部分。在一些实施方案中,第一标签序列的长度为至少40个核苷酸。在一些实施方案中,第二标签序列的长度为至少40个核苷酸。
在一些实施方案中,提供了溶液。该溶液可包含环状核酸分子,所述环状核酸分子包含:双链目标多核苷酸,其包含第一末端和第二末端;以及至少一个衔接头,其中至少一个衔接头共价结合到双链目标多核苷酸的第一末端和第二末端,由此形成环化的核酸分子,其中环状核酸分子还包含第一切口,其位于双链目标多核苷酸的第一末端和衔接头之间,以及第二切口,其位于双链目标多核苷酸的第二末端和衔接头之间,且其中第一切口与第二切口或缺口相比位于环状核酸分子的不同链上;以及切口平移酶。在一些实施方案中,切口平移酶包括DNA聚合酶I。在一些实施方案中,该溶液进一步包含切口切割酶,并且其中切口平移酶通过热灭活。在一些实施方案中,该溶液进一步包含第二环状核酸分子,所述第二环状核酸分子包含:双链目标多核苷酸,其包含第一末端和第二末端;以及至少一个衔接头,其共价结合到双链目标多核苷酸的第一末端和第二末端,由此形成第二环化的核酸分子,其中第二环状核酸分子包含第三切口,其中第三切口距离双链目标多核苷酸的第一末端和衔接头之间的部位在27个核苷酸以上,以及第四切口,其中第四切口距离双链目标多核苷酸的第二末端和衔接头之间的部位在27个核苷酸以上,且其中第三切口与第四切口相比位于环状核酸分子的不同链上。在一些实施方案中,第三切口距离双链目标多核苷酸的第一末端和衔接头之间的部位至少50个核苷酸。在一些实施方案中,第四切口距离双链目标多核苷酸的第二末端和衔接头之间的部位至少50个核苷酸。在一些实施方案中,该溶液还包含切口切割酶,其中切口平移酶通过热灭活。
在一些实施方案中,提供了形成配对标签的方法,该配对标签包含第一标签序列和第二标签序列,第一标签序列和第二标签序列在一起包含目标多核苷酸的至少一部分。该方法可包括连接双链目标多核苷酸的第一末端到至少一个衔接头;连接双链目标多核苷酸的第二末端到至少一个衔接头;形成环状核酸分子,该环状核酸分子包含双链目标多核苷酸、第一切口和第二切口,第一切口包含环状核酸分子第一条链上的第一3’末端,第二切口包含环状核酸分子第二条链上的第二3’末端,其中第一切口和第二切口在环状核酸分子的不同链上;延伸环状核酸分子第一条链的第一3’末端到双链目标多核苷酸的序列中;以及延伸环状核酸分子第二条链的第二3’末端到双链目标多核苷酸的序列中。在一些实施方案中,在延伸第一3’末端之前,第一切口位于双链目标多核苷酸的第一末端和至少一个衔接头之间,且第二切口位于双链目标多核苷酸的第二末端和至少一个衔接头之间。在一些实施方案中,双链目标多核苷酸的第一和第二末端连接到同一衔接头。在一些实施方案中,衔接头包括第一和第二衔接头,其中在形成环状核酸分子后,第一衔接头位于双链目标多核苷酸的第一末端上,并且第二衔接头位于双链目标多核苷酸的第二末端上。在一些实施方案中,第一衔接头通过连接多核苷酸连接到第二衔接头。在一些实施方案中,在环状核酸分子形成后,第一切口位于第一衔接头的末端,该第一衔接头的末端处于连接到双链目标多核苷酸的第一衔接头的末端的远端,且第二切口位于第二衔接头的末端,该第二衔接头的末端处于连接到双链目标多核苷酸的第二衔接头的末端的远端。在一些实施方案中,在衔接头连接到双链目标多核苷酸之前,将衔接头连接到连接多核苷酸。在一些实施方案中,该方法进一步包括消化环状核酸分子第一条链的至少一部分和消化环状核酸分子第二条链的至少一部分,其中消化导致双链目标多核苷酸的至少一部分变成单链,其中消化在延伸第一和第二3’末端之前发生。在一些实施方案中,5’至3’外切核酸酶用于消化所述的带切口的环状核酸分子。在一些实施方案中,在双链目标多核苷酸全部变成单链之前停止消化。在一些实施方案中,全部双链目标多核苷酸消化成单链目标多核苷酸。在一些实施方案中,DNA聚合酶用于延伸所述的带切口的环状核酸分子。在一些实施方案中,该方法进一步包括消化环状核酸分子第一条链的至少一部分和消化环状核酸分子第二条链的至少一部分,其中消化导致至少一部分双链目标多核苷酸变成单链,其中消化在延伸第一和第二3’末端的同时发生。在一些实施方案中,消化和延伸在同一反应管中发生。在一些实施方案中,通过切口平移来完成延伸环状核酸分子第一条链的第一3’末端到双链目标多核苷酸的序列中。在一些实施方案中,通过切口平移来完成延伸环状核酸分子第二条链的第二3’末端到双链目标多核苷酸的序列中。在一些实施方案中,第一和第二切口分别扩展成第一缺口和第二缺口。在一些实施方案中,外切核酸酶用于将第一和第二切口分别扩展成第一缺口和第二缺口。在一些实施方案中,外切核酸酶包括T7外切核酸酶。在一些实施方案中,该方法进一步包括进行单链依赖性消化以释放配对的DNA标签。
在一些实施方案中,提供了带切口的连接多核苷酸。带切口的连接多核苷酸可包含第一衔接头,该第一衔接头包含与第二衔接头链杂交的第一衔接头链,其中第一衔接头链在其5’末端上缺少磷酸基团;第二衔接头,该第二衔接头包含与第四衔接头链杂交的第三衔接头链,其中第三衔接头链在其5’末端上缺少磷酸基团;以及连接多核苷酸,该连接多核苷酸包含与第二连接链杂交的第一连接链,其中连接多核苷酸包含第一末端和第二末端,其中第一衔接头附着到连接多核苷酸的第一末端,从而第一衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中第二连接链附着到第二衔接头链,其中第二衔接头附着到连接多核苷酸的第二末端,从而第二衔接头的第三衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中连接多核苷酸的第二条链附着到第四衔接头链。在一些实施方案中,带切口的连接多核苷酸在第二衔接头链的5’末端进一步包含磷酸基团。在一些实施方案中,带切口的连接多核苷酸在第四衔接头链的5’末端进一步包括磷酸基团。在一些实施方案中,在第二衔接头链的3’末端进一步包含磷酸基团时没有磷酸基团。
在一些实施方案中,提供了带切口的连接多核苷酸。带切口的连接多核苷酸可包含第一双链衔接头;双链连接多核苷酸,其中第一双链衔接头附着到双链连接多核苷酸的第一末端;以及第二双链衔接头,其附着到双链连接多核苷酸的第二末端,其中存在第一切口和第二切口,第一切口将第一衔接头的第一条链和双链载体的第一条链分开,第二切口将第二衔接头的第二条链和双链载体的第一条链分开,其中第一切口和第二切口在带切口的载体的不同链上。
在一些实施方案中,提供了制备配对标签的方法。该方法可包括提供带切口的连接多核苷酸,该带切口的连接多核苷酸包含:第一衔接头,该第一衔接头包含与第二衔接头链杂交的第一衔接头链,其中第一衔接头链在其5’末端上缺少磷酸基团;第二衔接头,其包含与第四衔接头链杂交的第三衔接头链,其中第三衔接头链在其5’末端上缺少磷酸基团;以及连接多核苷酸,其包含与第二连接链杂交的第一连接链,其中连接多核苷酸包含第一末端和第二末端,其中第一衔接头附着到连接多核苷酸的第一末端,从而第一衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中第二连接链附着到第二衔接头链,其中第二衔接头附着到连接多核苷酸的第二末端,从而第二衔接头的第三衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中连接多核苷酸的第二条链附着到第四衔接头链。该方法可进一步包括连接双链目标多核苷酸的第一末端到第一衔接头和连接双链目标多核苷酸的第二末端到第二衔接头;以及将第一和第二切口移动到双链目标多核苷酸中。在一些实施方案中,该方法进一步包括单链依赖性消化以使带切口的连接多核苷酸线性化。在一些实施方案中,该方法进一步包括连接内部衔接头到线性化带切口的连接多核苷酸中。在一些实施方案中,该方法进一步包括扩增双链目标多核苷酸的至少一条链。在一些实施方案中,扩增是基于PCR的扩增。
在一些实施方案中,提供了线性配对标签。线性配对标签可包含第一标签序列,其中第一标签序列包含目标多核苷酸的第一末端;第一衔接头,其共价结合到第一标签序列;以及第二标签序列,其共价结合到第一衔接头,其中第二标签序列包含目标多核苷酸的第二末端,且其中所述的线性配对标签缺少IIs型限制位点并缺少III型限制位点。
附图说明
本领域技术人员将理解下面描述的附图仅为示例说明的目的。附图无意于以任何方式限制本教导的范围。
图1描述了形成带切口的环状核酸分子的实施方案。
图2描述了实施切口平移步骤的实施方案。
图3描述了形成带切口的环状核酸的实施方案。
图4描述了实施本发明的实施方案的步骤的实施方案。
图5描述了线性化环状核酸分子的实施方案。
图6描述了将引物衔接头附着到配对标签以用于进行测序的实施方案。
图7描述了形成带缺口的环状核酸分子的实施方案。
图8描述了形成环状核酸分子的实施方案。
图9描述了形成带切口的环状核酸分子的实施方案。
图10描述了形成具有拓扑异构酶I结合位点和切口的衔接头的实施方案。三角形表示拓扑异构酶I识别位点的部位。
图11描述了形成拓扑异构酶I-衔接头复合物的实施方案。
图12描述了形成带切口的环状核酸分子的实施方案。
图13描述了带切口的环状核酸分子的实施方案。
图14描述了涉及切口平移步骤的实施方案。
图15描述了通过形成缺口来形成配对标签的一些实施方案。
图16描述了形成配对标签的替代实施方案。
图17描述了形成配对标签的替代实施方案(续图16)。
图18描述了形成配对标签的替代实施方案(续图17)。
图19描述了形成配对标签的替代实施方案。
图20描述了形成配对标签的替代实施方案(续图19)。
图21描述了形成配对标签的替代实施方案(续图20)。
图22描述了带切口的连接多核苷酸的实施方案。
图23描述了带切口的连接多核苷酸的实施方案,其中衔接头连接到连接多核苷酸上。
图24A描述了衔接头和连接多核苷酸之间的切口构型的实施方案。
图24B描述了衔接头和连接多核苷酸之间的切口构型的实施方案。
图25A-25C描述了衔接头末端的各种构型的三个实施方案。
图26描述了使用图25B中的带切口的连接多核苷酸的方法的实施方案。
图27描述了图26中实施方案的继续。
图28描述了内部衔接头连接的替代实施方案。
图29A描述了带切口的连接多核苷酸一些实施方案如何使所有的带切口的连接多核苷酸都是有用的。
图29B描述了不太优选的带切口的连接多核苷酸的许多可能排列以及它们中的一些如何导致较不有用的产物。
具体实施方式
本文公开的各种实施方案一般涉及制备配对标签和配对标签文库的组合物和方法。DNA″配对标签″是一段核酸序列,其包括从目标多核苷酸产生的两个标签(核酸序列)。一般而言,每个标签都是目标多核苷酸的单独的部分,从而允许(但不限于)在该单独的标签上使用短读数测序技术,但也允许人们在以后的序列分析过程中将两个标签的序列结合在一起,这是因为该标签最终来源于相同的多核苷酸片段。
目前,制备配对标签和配对标签文库的技术的数量是有限的。不同技术常常具有导致序列读数短以及成本高的问题。迄今为止,下一代测序策略一般使用III型限制酶,如EcoP15I(AB SOLiDTM测序)以及MmeI(454 Life Sciences)来产生DNA配对标签。这些策略限制了标签的长度,这是因为EcoP15I和MmeI分别仅产生27bp和18bp的序列标签。本文描述的一些实施方案克服了这种以及其他限制。
本申请的一些实施方案涉及产生配对标签克隆的方法。在图1和2中一般地概括描述了一种这样的实施方案。在图1中,在双链目标多核苷酸DNA片段(标注为″DNA″)的两个末端都连接上衔接头以形成环状核酸分子。在所描述的实施方案中,双链目标多核苷酸DNA片段在5’末端和3’末端都缺少5’磷酸残基。所产生的环状核酸分子在双链目标多核苷酸DNA片段的5’末端和衔接头之间具有切口,以及在双链目标多核苷酸DNA片段的第二末端和衔接头之间具有切口。如图1中示意图示的,切口可在环状核酸分子的不同链上。然后,如图2所示,进行切口平移反应。如图2中示意图示的,将切口以5’到3’的方向在环状核酸分子的每一条链上移动到双链目标多核苷酸DNA片段的内部的位置。在这一点上,可通过在切口对面的位置切割多核苷酸链来释放配对标签克隆,如图5中示意图示的。
切口平移反应产物的长度,即切口移动的距离,取决于反应条件,如反应时间、反应温度、所使用的聚合酶等等。如本领域技术人员将理解的,可以改变反应条件以控制切口平移产物的长度。因此。在一些实施方案中,人们可以控制所产生的序列标签的长度。此外。在一些实施方案中,可将结合部分偶联到衔接头上,从而允许人们将配对标签克隆附着到,例如固体支持物上。进一步而言,如图6所示意图示的,在一些实施方案中,引物衔接头可以附着到配对标签克隆的末端。引物衔接头可用于扩增配对标签克隆,例如可以使用克隆扩增法。引物衔接头也可用于测序反应以用来对配对标签克隆的一部分进行测序。
除了上述内容以外,本文中也公开了简单地将3’末端延伸到目标多核苷酸中的替代技术。因此,还可以使用3’延伸,且不需要切口平移本身。此外,本文也公开了各种有切口的连接多核苷酸,其简化了向目标多核苷酸的外部和内部添加切口。
如本领域技术人员将理解的,制备具有较长序列标签的配对标签的能力十分有利,特别是对于大的测序工程,如基因组测序。
下面,在对本说明书中使用的一些术语的定义进行简单讨论后,对上述和其他实施方案进行更详细的讨论。
定义和实施方案
本文中使用的章节标题仅为了组织的目的,且不可解释为以任何方式限制所描述的主题。为任何目的,所有在本申请中引用的文献和类似材料,包括但不限于专利、专利申请、文章、书籍、论文和因特网页面的全文都明确地引入作为参考。当所引入的参考文献中对术语的定义似乎与本教导提供的定义不同时,以本教导提供的定义为准。应当理解在本教导中讨论的温度、浓度、时间等等之前暗含了″大约″,从而轻微和非实质性的偏差属于本文中本教导的范围内。在本申请中,使用的单数中包括了复数,除非另有明确说明。同样,使用的“包含”(″comprise″)、“包含”(″comprises″)、“包含”(″comprising″)、“含有”(″contain″)、“含有”(″contains″)、“含有”(″containing″)、“包括”(″include″)、“包括”(″includes″)和“包括”(″including″)没有限制的意图。应当理解前述的一般描述和随后的具体描述都只是示例性和解释性的,并不限制本发明。
除非另有定义,否则与本文中描述的发明有关的科学和技术术语应具有本领域普通技术人员一般理解的含义。另外,除非文中另有需要,单数术语应包括复数,且复数术语应包括单数。一般而言,本文中描述的细胞和组织培养、分子生物学、蛋白质和寡核苷酸或多核苷酸化学和杂交中使用的命名法及其技术是本领域熟知并普遍使用的。例如,使用标准技术进行核酸纯化和制备、化学分析、重组核酸和寡核苷酸合成。酶促反应和纯化技术根据制造商的说明书或本领域普遍做法或如本文中描述的进行。本文中描述的技术和程序一般根据本领域熟知的常规方法和在贯穿本说明书全文中所引用和讨论的各种一般或更具体的参考文献中描述的进行。参见例如Sambrook等人,Molecular Cloning:A Laboratory Manual(Third ed..Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.2000)。所使用的有关名称和本文中描述的实验程序和技术是本领域熟知并普遍使用的。
如根据本文中提供的实施方案中所使用的,除非另有说明,下述术语应当理解为具有下述含义:
“核苷酸”是指核苷的磷酸酯,作为单体单位或位于核酸中。″核苷酸5’-三磷酸″是指在5’位置有三磷酸酯基团的核苷酸,且有时标注为″NTP″,或″dNTP″和″ddNTP″以特别指明核糖的结构特征。三磷酸酯基团可包括对各个氧的硫取代,例如α-硫代-核苷酸5’-三磷酸。核酸化学的综述参见:Shabarova,Z.和Bogdanov,A.Advanced Organic Chemistryof Nucleic Acids,VCH,New York,1994。
术语″核酸″是指天然核酸、人工核酸、其类似物、或其组合。
如本文中所使用的,术语″多核苷酸″和″寡核苷酸″可互换地使用,且意思是单链和双链的核苷酸单体的聚合物(核酸),包括但不限于通过核苷酸间的磷酸二酯键连接(例如3’-5’和2’-5’)、反向连接(例如3’-3’和5’-5’)的2’-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA)、分支结构或核酸类似物。多核苷酸具有结合的反荷离子,如H+、NH4 +、三烷基铵、Mg2+、Na+等等。多核苷酸可以完全由脱氧核糖核苷酸,完全由核糖核苷酸或其嵌合混合物构成。多核苷酸可包括核碱基(nucleobase)和糖的类似物。多核苷酸一般的大小范围是数个单体单位(例如5-40个,此时一般在本领域更常常被称作寡核苷酸)至几千个单体核苷酸单位。除非另有标注,无论何时,在表示多核苷酸序列时,应当理解核苷酸从左到右是5’到3’的顺序,并且″A″表示脱氧腺苷,″C″表示脱氧胞苷,″G″表示脱氧鸟苷,′T″表示胸苷。
多核苷酸被称作具有″5’末端″和″3’末端″是因为使单核苷酸通过这样的方式反应来制备寡核苷酸,从而使得在一个方向上一个单核苷酸戊糖环的5’磷酸通过磷酸二酯键附着到其相邻单核苷酸戊糖环的3’氧上。因此,寡核苷酸或多核苷酸的末端被称为″5’末端″(如果其5’磷酸未连接到单核苷酸戊糖环的3’氧上的话)以及″3’末端″(如果其3’氧未连接到随后的单核苷酸戊糖环的5’磷酸上的话)。如本文中所使用的,即使在更大的寡核苷酸内部,核酸序列也可被称作具有5’和3’末端。
多核苷酸的″第一末端″和″第二末端″是指多核苷酸的5’末端或3’末端。多核苷酸的第一末端或第二末端中任一个都可以是多核苷酸的5’末端或3’末端;术语″第一″和″第二″的意思并非是指该末端具体被指明是5’末端或3’末端。
如本文中所使用的,术语″末端区域″是指位于5’末端或3’末端的多核苷酸区域。
″目标DNA片段″、″目标多核苷酸″、″靶多核苷酸″、″DNA模板″或″模板多核苷酸″表示人们有兴趣进行鉴定、表征或操作的DNA片段或多核苷酸。如本文中所使用的,术语″模板″和″目标多核苷酸″是指被操作的核酸,例如,如,将要与聚合酶混合的核酸。在一些实施方案中,目标多核苷酸是双链目标多核苷酸(″DSPI″)。
如本文中使用的,短语″多核苷酸的不同链″和″核酸分子的不同链″是指与双链体多核苷酸的另一条链不同侧的双链体多核苷酸的核酸链。
如本文中使用的,″标签″″序列标签″或″标签序列″是指目标多核苷酸的子序列。
″配对标签″,也称为″PT″、″标签匹配对″、″匹配对(mate pair)″、″MP″或″末端配对″,含有两个标签(每个都是一条核酸序列),它们来自于目标多核苷酸的每个末端区域。因此,配对标签包括来自于多核苷酸的两个部分的序列片段信息。在一些实施方案中,这一信息可与多核苷酸大小相关的信息结合,从而至少可以大致上得知两个测序的片段之间的间隔。这一信息可用于确定序列标签来源的作图中。
当配对标签是线性的时,配对标签是″释放的″或是″释放的配对标签″的一部分。这样的例子显示于图5中。如本领域技术人员将理解的,可在切口平移后通过切割一个或两个切口而形成释放的配对标签。在一些实施方案中,当允许切口平移进行直至完成时(两个切口在环状核酸分子上相遇),可发生线性化(即配对标签释放)而不需要额外的酶。如本领域技术人员将理解的,″配对标签″在其被释放前可以是更大结构(如环化核酸分子)的一部分。
″配对标签克隆″是指含有配对标签的克隆的多核苷酸。这简单的表示配对标签来源于对初始多核苷酸的一些操作。在一些实施方案中,配对标签克隆包含第一标签序列和第二标签序列,它们被衔接头分开。在一些实施方案中,克隆来源于单个初始多核苷酸分子。
如本文中使用的,术语″配对标签文库″是指配对标签克隆的集合,其包括生物遗传材料的全部或一部分。
″环状核酸分子″是指处于环中的核酸分子。在一些实施方案中,环可包含一个或更多个切口或缺口。在优选的实施方案中,环可在双链体多核苷酸的每条链上包含切口或缺口。
如本文中所使用的,″初始多核苷酸″表示可从中获得目标多核苷酸的原始多核苷酸。例如,来自于细胞的样品,其中初始多核苷酸被片段化成可接受的大小以用作目标多核苷酸。当然,初始多核苷酸的选择和变化至少与目标多核苷酸的选择一样广泛。
如本文中所使用的,术语″切口″是指双链多核苷酸中的点,其中多核苷酸的一条链中相邻核苷酸间没有磷酸二酯键。术语″切口″包括切口和缺口两者。切口和/或缺口可描述为包含3’末端和5’末端和/或侧。这些侧或末端包括一条多核苷酸的3’最末端上的核苷酸和第二多核苷酸5’最末端上的核苷酸。如上所述,这两个核苷酸之间没有磷酸二酯键。第二条链(其与上面描述的两条多核苷酸杂交)在第一条链上缺少磷酸二酯的相应的核苷酸之间的确包含一个或更多磷酸二酯键和0个或更多个核苷酸。
如本文中所使用的,短语″在第一平移的切口切割环状核酸分子″表示在基于切口出现的位置切割与含切口的链杂交的核酸链。在一些实施方案中,在切口对面的位置切割与含切口的链杂交的核酸链。
如本文中所使用的,术语″缺口″是指双链多核苷酸的区域,其中一条链缺失一个或更多核苷酸残基。在一些实施方案中,位于缺口3’末端的核苷酸残基可缺少5’磷酸残基。
如本文中所使用的,术语″切口平移″是指偶联的聚合/降解或链置换过程,其特征在于协调的5’至3’DNA聚合酶活性和5’至3外切’核酸酶活性或5’至3’链置换。如本领域技术人员将理解的,本文所使用的术语″切口平移″可发生在切口或缺口上。如本领域技术人员将理解的,在一些实施方案中,缺口的″切口平移″需要插入适当的核苷酸以形成仅缺少磷酸二酯键的传统切口,然后其被平移。
如本文中所使用的,短语″切口平移到目标DNA片段中″和″切口平移到目标多核苷酸中″是指切口移位到链中的位置,该链包含处在目标DNA片段或多核苷酸中的切口。
如本文中所使用的,短语″延伸环状核酸分子的第一条链的第一3’末端″或″移动第一和第二切口″到双链目标多核苷酸的序列中表示延伸3’末端至少到其序列与目标多核苷酸的一条链互补的点上。延伸3’末端的例子显示于图14、图17和图20中。将3’末端移动或延伸到序列中的简单切口平移(从而所产生的序列具有与目标多核苷酸互补的序列)也属于被移动或延伸。
如本文中所使用的,短语″到双链目标多核苷酸的序列中″或″到双链目标多核苷酸的序列中″表示末端或切口被移动或延伸从而所延伸的部分与目标多核苷酸的一条链的区段互补。如本领域技术人员将理解的,就是在3’末端被移动或延伸到其中之前,″双链″目标多核苷酸不必是双链的(即使使用了短语″到双链目标多核苷酸的序列中″)。在一些实施方案中,例如,当使用切口平移时,目标多核苷酸将主要保持为双链,尽管切口有效地将核苷酸从与双链目标多核苷酸相结合转移到与衔接头共价连接的链上。
″含切口的连接多核苷酸″表示包含切口和至少一个衔接头的连接多核苷酸。在一些实施方案中,连接多核苷酸是或来源于载体或质粒;然而,这并非必需的。
如本文中所使用的,术语″衔接头″表示可用于操作目标多核苷酸的分子。在一些实施方案中,衔接头可用于环化核酸。在一些实施方案中,衔接头可用于引入切口。在一些实施方案中,衔接头可用于扩增配对标签克隆。在一些实施方案中,衔接头可用于测序配对标签克隆的一部分的测序反应中。在一些实施方案中,衔接头可具有一个或更多缺少5’磷酸残基的末端。在一些实施方案中,衔接头包括核酸。在一些实施方案中,衔接头可包括至少一个引发位点、由至少一个引发位点组成或基本上由至少一个引发位点组成。在一些实施方案中,引发位点可用于PCR过程中。在一些实施方案中,将衔接头称为″P1″或″P2″表示可包含引发位点的衔接头。此外,这样的衔接头可称为″引物″衔接头。当然,不是所有衔接头都需要引发位点。如本领域技术人员将理解的,也可使用一般衔接头实施本文中公开的涉及″引物衔接头″的实施方案。即在一些实施方案中,引物衔接头可被不需要包含引发位点的简单衔接头替换。
″条码序列″和″验证码序列″表示足以允许鉴定衔接头、基因或目标序列的核酸序列。条码序列可以是但不需要是原始核酸序列的小区段,根据它可进行鉴定。在一些实施方案中条码为5-30个核酸长。在一些实施方案中,条码包括核苷酸类似物,如L-DNA、LNA、PNA等等。
具有″相容性末端″的核酸序列、片段或配对标签克隆意思是末端与连接到本文中提供的另一核酸序列、片段或配对标签克隆是相容的。相容性末端可以是具有5’和/或3’突出端的″粘性末端″,或可替代地,相容性末端可以是没有5’和/或3’突出端的″平端″。一般而言,粘性末端允许依赖于序列的连接,而平端允许不依赖于序列的连接。可以通过本领域标准的任何已知的方法产生相容性末端。例如,可以通过限制性内切核酸酶消化5’和/或3’末端产生核酸序列的相容性末端。
如本文中所使用的,术语″限制性内切核酸酶″和″限制酶″是指细菌酶,其中每个都在特异性核苷酸序列上或其附近切开双链DNA。
如本文中所使用的,″切口切割酶″是指能够在切口上或其附近切断剩余核酸链的酶。这样的酶的例子包括但不限于S1核酸酶、绿豆核酸酶、核酸酶P1和核酸酶BAL-31。由于术语切口也包括缺口,所以切割单链多核苷酸的酶也属于切口切割酶的类型。例如,单链特异性内切核酸酶也包含于这一组中。此外,在目标多核苷酸的末端是单链的实施方案中(例如,图21),这一术语也包括单链特异性外切核酸酶。
术语IIs型和III型限制性内切核酸酶包括在其识别序列外侧切割的限制性内切核酸酶。因此,该术语包括可能在技术上不被归类到III型或IIs型的限制性内切核酸酶,例如,IV型酶(例如,Acul)。
如本文中使用的,″3’加尾″是指向多核苷酸的3’末端添加一个或更多核苷酸。
术语″固定″是本领域所知的,且当与核酸相关使用时,是指一种状态,其中核酸附着到表面上,其吸引力强于所使用表面预期的环境中存在的吸引力,和作用于该种类上的吸引力。
如本文中所使用的,术语″核酸序列″或″核碱基序列″是包含含有核碱基亚单位的聚合物的任何区段。适当的聚合物或聚合物区段的非限制性例子包括寡核苷酸、寡核糖核苷酸、肽核酸及其类似物和嵌合体。
核酸″类似物″是在宿主(该核酸被加入其中)或被检测样品中非正常发现的核酸。例如,靶序列将不包括核酸类似物。这包括人工的、合成的(或其组合)核酸。因此,例如,在一个实施方案中,PNA为核酸类似物,同样L-DNA和LNA(锁定核酸)、iso-C/iso-G、L-RNA、O-甲基RNA或其他这样的核酸也为核酸类似物。在一个实施方案中,任何修饰的核酸将包含于术语核酸类似物中。在另一个实施方案中,核酸类似物可以是在系统中基本上不与天然核酸杂交但将与其他核酸类似物杂交的核酸;因此,PNA不是核酸类似物,但L-DNA是核酸类似物。例如,尽管L-DNA可以有效与PNA杂交,但L-DNA不能以类似有效的方式与D-DNA或D-RNA杂交。因此。在一些实施方案中,能够与探针或靶序列杂交但缺少至少一个天然核苷酸特性(如受到核酸酶的降解的易感性或结合到D-DNA或D-RNA上)的核苷酸是核苷酸类似物。当然,核苷酸类似物不需具有每个差别。
本文中使用的术语″生物″表示任何活体或非活体实体,其包含能够被复制并且对于进行序列确定重要的核酸。其包括但不限于质粒、病毒、原核的、古细菌的和真核的细胞、细胞系、真菌、原生动物、植物、动物等等。
如本文中所使用的,术语″引物″是指寡核苷酸,无论是天然产生的如处于纯化的限制酶切消化物中的,还是合成产生的,当放置在诱导合成与核酸链互补的引物延伸产物的条件下时(即在核苷酸和诱导试剂如DNA聚合酶存在以及适当的温度和pH时),其能够作为合成的起始点。为了最大的扩增效率,引物优选为单链,但可替代地可以为双链。如果是双链,在用来制备延伸产物前,首先将引物进行处理以将其链分开。优选地,引物是寡脱氧核糖核苷酸。引物必须足够长以在诱导试剂存在时引发延伸产物的合成。引物的确切长度将取决于许多因素,包括温度、引物来源和使用的方法。
如本文中所使用的,术语″核酸测序化学″是指用来测序多核苷酸以产生测序结果的一种类型的化学和相关方法。本领域已知很多种测序化学。在本文中公开的各种实施方案中有用的各种类型的测序化学的例子包括但不限于Maxam-Gilbert测序、链终止法、染料标记的终止法、使用可逆终止子的测序、通过焦磷酸检测的核酸测序(″焦磷酸测序″或″焦磷酸测序(pyrosequencing)″)和通过连接的测序。这样的测序化学和相关测序试剂在下述文件中描述:例如,美国专利号7,057,026、5,763,594、5,808,045、6,232,465、5,990,300、5,872,244、6,613,523、6,664,079、5,302,509、6,255,475、6,309,836、6,613,513、6,841,128、6,210,891、6,258,568、5,750,341、6,306,597、PCT公开号WO91/06678A1、WO93/05183A1、WO6074351A2、WO03054142A2、WO03004690A2、WO07002204A2、WO07002204A2、WO06084132A2和WO06073504A2,其全文引入作为参考。
如本文中所使用的,术语″聚合酶链反应″(″PCR″)是指引入作为参考的K.B.Mullis的美国专利号4,683,195和4,683,202的方法,其描述了不经过克隆或纯化而增加基因组DNA混合物中目标多核苷酸序列区段的浓度的方法。这一扩增目标多核苷酸序列的方法由下述步骤组成:将大量过量的两条寡核苷酸引物引入到含有所需目标多核苷酸序列的DNA混合物中,然后在DNA聚合酶存在下进行精确有序的热循环。两条引物与双链目标多核苷酸序列的其各自的链互补。为实现扩增,使混合物变性,然后引物与目标多核苷酸分子中它们的互补序列退火。退火后,引物用聚合酶延伸从而形成一对新的互补链。变性、引物退火和聚合酶延伸步骤可以重复许多次(即变性、退火和延伸组成一个″循环″;可以有很多次″循环″)以获得高浓度的所需目标多核苷酸的扩增区段。通过引物相互之间的相对位置来确定所需目标多核苷酸扩增区段的长度,因此,这一长度是可控制的参数。由于过程的重复,该方法被称为″聚合酶链反应″(此后称为″PCR″)。因为目标多核苷酸序列的所需的扩增区段成为混合物中占优势的序列(在浓度方面),所以它们被称作是″PCR扩增的″。
利用PCR,可能将基因组DNA中单拷贝的特异性目标多核苷酸扩增到可通过几种不同方法可检测到的水平(例如,利用标记的探针的杂交;加入生物素化的引物然后为通过抗生物素蛋白-酶缀合物检测;加入32P-标记的脱氧核苷酸三磷酸如dCTP或dATP到扩增的区段中)。除了基因组DNA,任何寡核苷酸序列都可以利用适当的引物分子组扩增。特别地,通过PCR方法本身产生的扩增的区段本身是进行随后PCR扩增的有效的目标多核苷酸。
如本文中所使用的,术语″PCR产物″、″PCR片段″和″扩增产物″是指在两轮或更多轮次的变性、退火和延伸PCR步骤完成后产生的化合物的混合物。这些术语包括扩增一个或更多靶序列的一个或更多区段的情况。
如本文中所使用的,术语″扩增试剂″是指除了引物、目标核酸多核苷酸和扩增酶之外的扩增所需的那些试剂(脱氧核糖核苷酸三磷酸、缓冲液等等)。一般而言,扩增试剂和其他反应组分一起放置并包含于反应容器(试管、微孔等等)中。
″克隆扩增″是指产生许多拷贝的个别分子。本领域已知的各种方法都可用于克隆扩增。例如,乳剂PCR是一种方法,且涉及在油相中的水泡中分离个别DNA分子和引物包被的珠子。然后聚合酶链反应(PCR)使每个珠子被分离的文库分子的克隆拷贝包被,且这些珠子随后被固定以便进行以后的测序。乳剂PCR在Marguilis等人以及Shendure和Porreca等人(也称为″聚合酶克隆测序(polony sequencing)″,被Agencourt商业化,且最近被Applied Biosystems获得)发表的方法中使用。Margulies等人.(2005)Nature 437:376-380;Shendure等人,Science309(5741):1728-1732。另一种克隆扩增的方法是″桥式PCR″,其中片段通过附着到固体表面上的引物扩增。这些方法以及其他克隆扩增的方法都产生许多物理上分离的位置,每个位置包含来源于单个分子多核苷酸片段的许多拷贝。
″结合部分″是能够在适当条件下结合到纯化部分的分子。结合部分和纯化部分之间的相互作用足够强以允许富集和/或纯化结合部分及与其相连的分子,例如,配对标签克隆。生物素是结合部分的一个例子。在一些实施方案中,通过将结合部分偶联到衔接头,结合部分结合到纯化部分靶允许纯化配对标签克隆。在一些实施方案中,纯化部分可以存在于固体支持物上。
″纯化部分″是结合到结合分子上的分子。对应于生物素的示例性纯化部分是链霉抗生物素蛋白。
术语″固体支持物″是指任何固相材料,其上可以合成、附着或固定寡核苷酸。固体支持物包括术语如″树脂″、″固相″和″支持物″。固体支持物可以由有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺及其共聚物和移植物构成。固体支持物也可以是无机的,如,例如,玻璃、硅石、可控多孔玻璃(CPG)或反相硅石。固体支持物的构型可以是珠子、球、颗粒、细粒、凝胶、表面或其组合的形式。表面可以是平面、基本平面或非平面。固体支持物可以是多孔的或无孔的,且可具有膨胀或非膨胀的特性。固体支持物可以构造成孔、凹陷或其他容器、管、部件或部位或位置的形式。多种固体支持物可以在各个部位构造在阵列中,例如,对于机器人递送试剂,或通过检测方式包括激光照射扫描和共焦或偏斜光聚集可寻址的位置。
″阵列″或″微阵列″包括存在于固体支持物上或在容器布置中的多核苷酸的排列。一些阵列格式被称作″芯片″或″生物芯片″(M.Schena,Ed.Microarray Biochip Technology,BioTechnique Books,Eaton Publishing,Natick,Mass.(2000))。阵列可包括低密度数目的可寻址部位,例如1至大约12,中等密度的,例如大约一百或更多部位,或高密度数目的,例如一千或更多。一般而言,阵列格式是规则的几何形状以允许制造、处理、放置、堆放、引入试剂、检测和储存。阵列可以构造成行和列的格式,每个部位之间有规则的间隔。可替代地,部位可以是成束的、混合的或同质掺合的以便进行一致处理和/或取样。阵列可包括多个可寻址部位,其被构造为便于每个部位在空间上可寻址,以便进行试剂的高通量处理、机器人递送、掩盖和/或取样和/或通过检测方式包括激光照射扫描和共焦和/或偏斜光聚集。阵列可包括一个或更多″可寻址部位″,例如,″可寻址位置″,即包括已知类型分子的物理部位。
下述节段更详细地描述了各种实施方案的不同实施方案。除非有清楚的相反的说明,否则各种实施方案的每个步骤或特征都可以与任何其他步骤或特征组合。
示例性实施方案
如上所述,与以随机的方式对来自两条独立的目标多核苷酸的每条的″n″个碱基进行测序相比,通过对来自单条目标多核苷酸的两个区段(每个″n″个碱基)进行测序,末端配对测序方法可以提供更多的信息。然而,迄今为止,读数长度受到短的序列标签长度的限制。例如,以前的使用III型限制酶制备配对标签的策略仅产生最多达到27bp的序列标签。两条在给定匹配对克隆上的标签序列可以有不同长度或同样长度。
在一些实施方案中,为了控制和/或增加配对标签克隆中的序列标签的长度,人们可以使用环化和切口平移。在一些实施方案中,所公开的方法可用于从目标核酸分子制备配对标签克隆。
一种这样的实施方案描述于图1和图2中。如图1所示,衔接头附着到附着到双链目标多核苷酸上从而允许双链目标多核苷酸环化。重要地,在环化后,有至少一个切口或缺口存在于环化的核酸序列中,且在一些实施方案中,有两个切口或缺口,环化的核酸序列的每条链上有一个。如图1所示,一个切口或缺口起初位于衔接头的第一末端和双链目标多核苷酸的一条链上的第一末端之间,而第二切口或缺口位于衔接头的第二末端和双链目标多核苷酸的第二末端之间。然后,如图2所示,通过切口平移酶进行切口平移反应。这会将至少一个切口移动到双链目标多核苷酸中。切口移动所需的距离可依赖于使用者的目标而改变;然而,在一些实施方案中,人们允许切口平移反应进行直至切口已移动10、20或27个核苷酸以上至双链目标多核苷酸中。随之,可以通过在切口或其附近切割的酶(如单链特异性核酸酶)使环化的核酸序列在切口部位或其附近被线性化,从而导致产生释放的配对标签。在切口部位使环化的核酸线性化的酶包括,例如但不限于S1核酸酶、核酸酶P1、核酸酶BAL31、来自于粗糙链孢霉(Neurospora crassa)的核酸酶、来自于玉蜀黍黑粉菌(Ustilago maydis)的核酸酶和绿豆核酸酶。
另一个实施方案描述于图3、图4和图5中。在这一实施方案中,可以使用多个衔接头。在第一步骤中,人们可以将具有粘性末端(或在一些实施方案中为平端)的第一类型的衔接头附着到双链目标多核苷酸的第一和第二末端上。随之,人们可以添加具有适当的突出端的第二类型的衔接头以允许其连接到第一衔接头中存在的突出端中并也用来环化分子。如在第一个例子中所述的,在通过第二衔接头进行的环化连接事件后,将存在至少一个(如果不是两个的话)切口或缺口。同前面一样(以及如图4所示),这将允许切口通过切口平移酶被至少部分地平移至双链目标多核苷酸中,如图5所示。然后这一被平移的环化的核酸序列可通过任何适当的酶线性化,如图5所示,从而产生配对标签。
另一个实施方案描述于图10、图11、图12和图13中。在这一实施方案中,可以使用具有拓扑异构酶I(Topo)结合位点CCCTT的衔接头(Topo结合衔接头)。在第一步骤中,人们可以形成在相反链上具有2-3bp缺口并且在上部和下部链的3’末端都有Topo结合位点的衔接头(图10)。随之,人们可以添加拓扑异构酶I以形成拓扑异构酶I-衔接头复合体(图11)。拓扑异构酶I分子和衔接头之间形成的磷酸酪氨酰键随后被去磷酸化的双链目标多核苷酸的5’羟基基团攻击(图12),从而导致环化的核酸分子的形成(图13)。环化后,衔接头和DNA连接处的切口通过T4连接酶封闭。在这样的实施方案中,对于产生长的配对标签,使用基于拓扑异构酶I环化的方法可提供较高的环化效率。
在一些实施方案中,可以将进一步的引物添加到配对标签,如P1和P2引物衔接头,如图6所示。在这样的实施方案中,添加P1和P2引物衔接头可用于各种测序技术,如,例如,SOLiDTM型测序。
在一些实施方案中,可以通过连接目标多核苷酸到一个或更多衔接头来环化目标多核苷酸(例如,如图3所示)。所产生的带切口的环状DNA可以进行切口平移(图14)。带切口的环状DNA可以用外切核酸酶,如,例如,T7外切核酸酶、λ外切核酸酶、和/或大肠杆菌外切核酸酶III消化(图15)。从而打开切口且使其变成缺口,缺口相对更容易被单链特异性的内切核酸酶消化。随之,可使用单链特异性的内切核酸酶(如S1核酸酶)使配对标签从带缺口的双链目标多核苷酸上释放。这样的单链特异性的内切核酸酶包括,例如,S1核酸酶、绿豆核酸酶、P1核酸酶、和/或BAL31核酸酶。T7外切核酸酶反应可以是部分的(在中间的图中显示为″缺口″)或完全的(在中间的图中描述为虚线部分,当有完全的外切核酸酶反应时,它们是不存在的)。
在一些实施方案中,不必实际发生切口平移,而是衔接头的3’末端的延伸可用于产生配对标签。一个这种例子显示于图16-18中。在一些实施方案中,目标多核苷酸可以通过连接到一个或更多衔接头来环化。在一些实施方案中,环状核酸将包含切口。然后环状核酸分子用5’至3’外切核酸酶(如T7外切核酸酶和/或λ外切核酸酶)消化(图16)。然后所产生的消化的环状核酸分子可在其3’末端通过,例如,DNA聚合酶延伸(图17)。任何DNA聚合酶都可用于这一目的。有效地,这一步骤可以允许带有衔接头的序列延伸到目标多核苷酸中。随之,被延伸的经消化的环状核酸分子可用单链特异性的内切核酸酶消化以释放配对标签。如上所述,任何单链特异性酶和/或切割过程都可以使用,如S1核酸酶、绿豆核酸酶、P1核酸酶、和/或BAL 31核酸酶,以释放配对的DNA标签。
图19-21描述了另一个实施方案,其中不需要切口平移本身而形成配对标签。如上所述,在一些实施方案中,目标多核苷酸可以通过连接到一个或更多衔接头进行环化。在一些实施方案中,环状核酸分子将包含切口。然后环状核酸分子可用5’至3’外切核酸酶,如T7外切核酸酶和/或λ外切核酸酶消化(图19)。在一些实施方案中,允许消化以除去目标多核苷酸的大量的双链区段。尽管图16-18中概括描述的例子中表明消化可以是部分的,如图19所示,但是也可以允许进行完全消化。如本领域技术人员将理解的,这将使得全部的目标多核苷酸成为单链。因此,在一些实施方案中,全部的目标多核苷酸在5’至3’消化后都是单链的。在一些实施方案中,这将导致消化的″环状″核酸变成线性的;然而,为简明起见,该分子仍然被称作″消化的环状核酸分子″,尽管它是线性的。当这样的实施方案的线性性质被特别描述时,其将被称作″已被消化成线性状态的消化的环状核酸分子″。如上所述,所产生的消化的环状核酸分子然后可在其3’末端用例如,DNA聚合酶延伸(图20)。随之,被延伸的经消化的环状核酸分子可用单链特异性外切核酸酶和/或内切核酸酶消化以释放配对标签。如上所述,任何单链特异性酶和/或切割过程都可以使用。通过将环状核酸消化至如图20所示的状态,人们可以使用外切核酸酶来除去单链目标多核苷酸的任何剩余部分。当然,内切核酸酶也仍然可以使用。如本领域技术人员将理解的,尽管上述技术就图3中的初始实施方案而言进行了描述,但是图14-20中的实施方案并不限于这样的最初的安排,且可以与本文中描述的其他任何实施方案组合使用,如果是适当的话。
尽管一些实施方案使用了衔接头和目标多核苷酸之间的切口,但是切口和/或缺口并不一定位于这一位置。在一些实施方案中,将切口和/或缺口放置于其他位置有更多优势。在一些实施方案中,本方法可使用已经包含了切口的连接多核苷酸。在一些实施方案中,该连接多核苷酸将在连接多核苷酸的每个末端都具有衔接头,每个衔接头和连接多核苷酸之间都有切口。这可以允许通过初始构建体本身将切口加入到目标多核苷酸中。为简明起见,这一构建体被称作″带切口的载体″或″带切口的连接多核苷酸″。在一些实施方案中,带切口的连接多核苷酸可减少目前配对标签工作流程的时间和步骤。在一些实施方案中,带切口的连接多核苷酸包含线性化载体以用来捕获目标多核苷酸(如剪切的靶DNA),且简化了目标多核苷酸文库的构建。
在一些实施方案中,涉及带切口的目标多核苷酸的方法包括两个部分。第一部分可以涉及制备带切口的连接多核苷酸,其中连接有适当的衔接头。在一些实施方案中,这一步骤可以通过各个部分进行并可包含于制备配对标签的试剂盒中。在一些实施方案中,第二部分涉及使用该带切口的连接多核苷酸来提高文库的工作流程。
连接多核苷酸
在一些实施方案中,第一步骤(图22,步骤1)涉及选择小的环状DNA 2000作为目标多核苷酸的连接多核苷酸。一旦线性化后,它便可以用作连接多核苷酸。由于不需涉及细菌转化和/或扩增,所以载体的选择是灵活的。在一些实施方案中,可以使用任何多核苷酸。因此,连接多核苷酸不需是载体本身或来源于载体。在一些实施方案中,连接多核苷酸可以是任何可被制备和线性化的环状载体。在一些实施方案中,使用了pUC 19质粒。
在一些实施方案中,在选择可用作连接多核苷酸的载体时,有两个相关要素可以考虑。第一,在一些实施方案中,环状载体的尺寸应当小,优选的在400bp至3kb的范围,以容纳200bp直至15kb的靶DNA插入片段。第二,尽管不是必需的,但在一些实施方案中,为了随后的纯化,环状载体可以用结合部分进行修饰。例如。在一些实施方案中,结合部分可包括生物素,由此允许基于生物素-链霉抗生物素蛋白的纯化方案。在一些实施方案中,可以使用允许分离配对标签的任何基于受体-配体的亲和修饰。在一些实施方案中,分离是对特异性连接多核苷酸有特异性的。
选择了连接多核苷酸之后,如果需要,则对其进行线性化2010(例如,如果初始选择了环化的载体)。在一些实施方案中,这通过两个独特的限制酶来完成(图22,步骤2),每个在连接多核苷酸上制造出独特的切点。所产生的两个片段的较大的片段2010含有含有两个不同粘性末端(2011和2015),并且可被选择和纯化。通过使用两种不同的酶,所产生的产物含有阻止自连接的不相容的粘性末端(2011和2015)。其他在连接多核苷酸上产生不相容末端的技术对于这一步骤也是有效的。如图22所示,双切点的连接多核苷酸的两个末端(2011和2015)将具有两个3’链末端2012和2016(其缺少磷酸),和两个5’链末端2013和2014(其含有磷酸基团)。
随之,两个双链衔接头,P1(2020)和P2(2030),杂交到连接多核苷酸2010以形成衔接头杂交的连接多核苷酸2038。在一些实施方案中,P1(2020)和P2(2030)的粘性末端将它们各自的末端匹配到连接多核苷酸(2011和2015),这保证了P1(2020)与P2(2030)的正确的方向和位置。
在一些实施方案中,P1和P2引物衔接头具有不同特征。在一些实施方案中,P1引物衔接头2025(图22中显示为两条P1链的上面一条)和P2引物衔接头2035(图22中显示为两条链的下面一条)的″上部″链在其5’末端不含磷酸基团。在一些实施方案中,P1和P2引物衔接头两者的下部链(分别为2026和2036)在其5’末端的确含有磷酸基团(如2022和2032的位置所示)。作为这一构型的结果,仅两个衔接头的″下部″链(2026和2036)连接到连接多核苷酸,如带切口的连接多核苷酸2039所示(图23)。由于″上部″链的5’末端缺少磷酸基团,所以在连接多核苷酸2010和衔接头2020和2030之间有两个切口2021和2031(图22和23)。因此。在一些实施方案中,本发明包括制备和/或使用上述连接多核苷酸的方法。
在一些实施方案中,本发明包括带切口的连接多核苷酸本身。在一些实施方案中,带切口的连接多核苷酸2039可包含第一衔接头(P12020),该第一衔接头包含与第二衔接头链2026杂交的第一衔接头链2025。第一衔接头链2025在其5’末端上缺少磷酸基团。带切口的连接多核苷酸可以还包含第二衔接头2030,该第二衔接头包含与第四衔接头链2036杂交的第三衔接头链2035。第三衔接头链2035在其5’末端上缺少磷酸基团。带切口的连接多核苷酸可进一步包括连接多核苷酸2010,连接多核苷酸2010包含与第二连接链2018杂交的第一连接链2017。连接多核苷酸包含第一末端2011和第二末端2015。第一衔接头(P12020)附着到连接多核苷酸2010的第一末端2011上,从而在第一衔接头链的5’末端缺少磷酸基团的地方存在切口(和/或缺口)2021。此外,第二连接链2018附着到第二衔接头链2026。第二衔接头(P22030)附着到连接多核苷酸2015的第二末端,从而在第二衔接头2030的第三衔接头链2035的5’末端缺少磷酸基团的地方存在切口(和/或缺口)2031。第一连接链2017附着到第四衔接头链2036。这一实施方案一般地描述于图22和23中(其中衔接头2020和2030被连接到连接多核苷酸2010以形成带切口的连接多核苷酸或带切口的载体2039)。
在一些实施方案中,对于衔接头与连接多核苷酸相连接的区域(″连接区域″)至少有两种可能的排列,如图24A和24B所示。在第一种构型中(图24A),连接多核苷酸的突出端具有对于衔接头2020完全互补的末端。由于连接以及上部衔接头链缺少磷酸基团,所以在连接多核苷酸和上部链上的衔接头之间有切口2021。在第二种构型中(图24B),衔接头的设置导致一个或两个碱基的缺口(且在一些实施方案中为更大的缺口)。两种构型的任何一种都可以在方法的随后的步骤中起作用。人们一般应当保持上部链的断裂(2020和2017之间的切口2021,以及2035和2018之间的切口2031)以允许聚合酶将切口或缺口延伸到目标多核苷酸中。
在一些实施方案中,带切口的连接多核苷酸中切口或缺口的设置可用于产生尤其长的配对标签,或称″长配对标签″(″LPT″)文库。然而,本发明并不局限于LPT。例如,对于一般的基于EcoP15I的常规PT文库,人们可以将具有EcoP15I位点的衔接头的两条链完全连接至线性载体,而没有任何前述的末端构型。简而言之,上述实施方案可通过适当的化学和为了不同配对标签而正确修饰的衔接头来产生常规的和长配对标签文库。
在一些实施方案中,在连接多核苷酸上有其他可能的衔接头末端(2020和2030)构型用来捕获目标多核苷酸,其例子显示于图25A-25C中。通过调整衔接头的上部链的5’末端的长度和组成,人们可获得平端(2040和2041,图25A),单个胸腺嘧啶突出端粘性末端(2050和2051,图25B),或多个胸腺嘧啶(或其他碱基)的突出端(2060和2061,图25C)。可以使用这样的带切口的连接多核苷酸分别捕获带有平端的目标多核苷酸、Taq聚合酶修饰的目标多核苷酸或末端转移酶修饰的目标多核苷酸。在一些实施方案中,这些带切口的连接多核苷酸是用于构建文库的试剂盒的一部分。
文库制备工作流程
一旦制备了带切口的连接多核苷酸,目标多核苷酸(如基因组DNA)就可剪切至所需的长度。在一些实施方案中,对目标多核苷酸进行末端修饰以适合用于基于Support Oligo Ligation Detection(SOLiDTM)的技术。取决于所选择的用于与目标多核苷酸连接的带切口的连接多核苷酸(如图25A-25C所示),剪切的目标多核苷酸可以包括末端的修饰。对于带有平端衔接头的线性载体(图25A),不必进行修饰。对于图25B中描述的带切口的连接多核苷酸,目标多核苷酸需要在3’末端添加腺嘌呤碱基,其可通过,例如,聚合酶如Taq来完成。对于图25C中描述的带切口的连接多核苷酸,可使用末端转移酶添加相同碱基的短的序列段,从而使其与带切口的连接多核苷酸中的突出端互补。
一旦选择了带切口的连接多核苷酸,对于所有三种类型的带切口的连接多核苷酸,工作流程的随后步骤就可以是相似的。为简明起见,仅对就图25A中的带切口的连接多核苷酸而言的随后步骤进行一般地描述。如图26所示,在目标多核苷酸的适当的末端修饰2085之后,目标多核苷酸与具有匹配突出端的带切口的连接多核苷酸一起温育,以进行连接2095。
在连接2095之后,环化的带切口的连接多核苷酸(例如,环化的核酸分子)含有两个切口(2021和2031),这两个切口的位置靠近目标多核苷酸2090,如结构2100所示。然后切口2021和2031都通过过程2105延伸到目标多核苷酸2090中。如上所述,这可通过切口平移或任何其他用来将第一和第二连接多核苷酸2017和2018的3’末端延伸到目标多核苷酸2090中的所述的实施方案进行。在一些实施方案中,延伸通过切口平移来完成。在一些实施方案中,延伸的程度可以是受到控制的从而最终的断点(位于切口或分子是单链的地方)保持一致。
在一些实施方案中,在连接反应2095之后,未连接的线性目标多核苷酸和剩余的线性的带切口的连接多核苷酸可以被清除或去除。在一些实施方案中,这通过消化线性双链DNA的酶(如PLASMID-SAFEATP依赖性DNA酶(DNase)试剂盒(可从Epicentre获得))来完成。
在一些实施方案中,在上述的清除过程之后,可通过过程2205在延伸的3’末端的新的位置切开剩余的环状种类2100以释放配对标签。在3’末端通过切口平移被去除的实施方案中,切开位点处于新的切口位置2221和2231。所产生的释放的配对标签2300可包括连接多核苷酸2010,两个衔接头2020和2030,且两侧翼可以有所需长度的目标多核苷酸标签2091和2092(图27)。
在一些实施方案中,可以将SOLiDTM内部衔接头2310连接到过程2305中产生的释放的配对标签2300(如图27所示)以产生含有内部衔接头的配对标签2400。连接之后,所产生的含有内部衔接头的配对标签2400(或其群体)可变成文库模板,其上有正确定向的目标多核苷酸标签2091和2092。在一些实施方案中,文库可以用作大规模PCR扩增的模板,其中使用能够结合到衔接头P12020和P22030的一条链上的引物,如图27中的过程2405中所一般描述的(引物未描述)。所产生的PCR产物2500可以是单链的并且具有位于该产物每个末端的P1和P2序列。在一些实施方案中,用于PCR扩增2405的引物序列是那些在SOLiDTM文库中使用的。在一些实施方案中,当所产生的扩增的线性产物是文库时,该文库可用于乳剂PCR进行具有模板的珠(templatedbead)的制备。
尽管图27描述了平端内部衔接头2310,在一些实施方案中,释放的配对标签2300的末端可以被修饰以阻止或减少自连接,如图28所示。例如,可以在单链切割2205之后使用Taq聚合酶在3’末端附加腺嘌呤碱基,从而使所产生的释放的配对标签仅能连接到在5’末端包含T突出端的内部衔接头2311(图28)。
尽管上述实施方案有很多不同的优势,但在一些实施方案中,使用带切口的连接多核苷酸可避免或减少各种配对标签文库工作流程的步骤的数量。例如,一些目前的SOLiDTM配对标签文库工作流程在产生适合用于SOLiDTM分析仪上测序的文库时必须有14个重要步骤。在一些实施方案中,使用带切口的连接多核苷酸允许人们从制备配对标签文库工作流程中除去一个或更多步骤。在一些情况下,一般的工作流程可包括下述过程:1)剪切DNA,2)DNA的末端修复,3)在EcoP15I位点甲基化gDNA,4)连接进入衔接头,5)大小分级分离,6)通过内部衔接头环化,7)Eco P15I消化,8)末端修复,9)衔接头连接,10)结合部分的结合,11)切口平移,12)大规模PCR,13)凝胶纯化和大小选择,以及14)文库的最后定量。在一些实施方案中,通过使用本文描述的一个或更多实施方案,过程4-6可以被压缩到仅仅是连接进入带切口的连接多核苷酸。此外,过程9-11中的一个或更多也可去除。因此。在一些实施方案中,过程4-6和9-11中的一个或更多被去除和/或交换为本文描述的一个实施方案。在一些实施方案中,标准工作流程可包括下述过程:1)剪切DNA,2)末端修复DNA,3)在EcoP15I位点甲基化gDNA,4)连接进入衔接头(例如,CAP衔接头),5)大小选择,6)通过内部衔接头进行DNA环化,7)Plasmid-safeTM DNA酶处理,8)Eco P15I消化,9)Klenow介导的末端修复,10)衔接头连接,11)结合部分的结合,12)切口平移,13)大规模PCR(例如,文库扩增),以及14)凝胶纯化和大小选择和文库定量。然而,通过使用一个或更多本文描述的实施方案,工作流程可包括仅仅包括下述过程:1)剪切DNA,2)大小选择,3)末端修复,4)甲基化基因组EcoP15I位点,5)LVA连接,6)PLASMID-SAFETM DNA酶处理,7)EcoP15I消化,8)末端修复,9)内部衔接头连接,10)文库扩增,11)文库纯度QC和定量。因此。在一些实施方案中,工作流程可以从14个减少到11个过程。当然,本文描述的优势不限于在SOLiDTM系统上测序。
一些其他配对标签文库需要大约四天来构建,成为SOLiDTM相关的工作流程的瓶颈。在一些实施方案中,通过使用带切口的连接多核苷酸制备配对标签文库所需的时间在4天以下,例如,3天,2天,1天,20小时以下,15小时以下,或10小时。此外,多个步骤增加了实验误差的机会,以及在这些步骤中的每个步骤中样品损失的机会。使用带切口的连接多核苷酸可加快工作流程同时提高样品回收。在一些实施方案中,基于带切口的连接多核苷酸的工作流程方法将配对标签文库工作流程中步骤的数目减少到六步,和/或将整个程序所需的时间减少到大约10至12小时。在一些实施方案中,实验程序从14步减少到13以下,12以下,11以下,10以下,9以下,8以下,7以下,或6步。
在一些实施方案中,与其他PT方案相比(其中50%的连接到衔接头的靶DNA片段是无用产品),所有的连接到线性载体的靶片段都可有效用于随后的加工(参见例如图29A相对于图29B)。尽管在一些PT方法中,由于不良的自身环化效率,用内部衔接头进行的环化过程可能有显著的样品损失,但在一些所公开的实施方案中,目标多核苷酸已经连接到有正确长度的连接多核苷酸,且从而已经被捕获。因此。在一些实施方案中可使用更多的内部衔接头来促使获得最大的连接效率。另外,利用T/A突出端(例如,图28),可减少连接多核苷酸和衔接头的自连接。
在一些实施方案中,带切口的连接多核苷酸能够处理更小的插入片段大小,低至大约100bp,而现有的PT文库工作流程在插入片段大小小于600bp时不可使用。例如,连接多核苷酸的存在有效增加了目标多核苷酸的长度,从而由于其长度较短而不容易环化的目标多核苷酸现在可以进行环化。在一些实施方案中,当与较长读数的测序化学(如50bp测序化学)偶联时这是尤其有利的;从而允许大约100bp大小的多核苷酸以其全长进行测序。因此,本文中描述的各种实施方案可提供100bp读数的能力(每个标签50bp)而不必在测序化学中进行其他改变。在一些实施方案中,较长的读数可允许进行从头测序。
从上述概括描述的许多方面来看,很清楚所公开的实施方案能够解决现有PT文库创建中的重大的瓶颈步骤,而且同时提供更高的效率和优秀的样品回收。图29A和29B进一步展示了本文公开的一些实施方案(图29A)相对于使用其他技术产生配对标签文库的各种技术(描述于图29B中)的一些优势。尽管本文中描述的一些实施方案将从所有连接反应中产生有用的产物(图29A),但其他用来产生配对标签文库的方法仅有50%的连接产物产生有用的产物(图29B)。
在一些实施方案中,本文中描述的各种方法和部分可以根据Support Oligo Ligation Detection(SOLiDTM)试剂盒(其可用于制备配对标签文库)使用。
尽管许多上述附图中的实施方案被描述为包含P1和/或P2引物衔接头,但在一些实施方案中,这些实施方案中的衔接头不包含引发位点。因此,本文也预期和公开了P1和P2引物衔接头被一般衔接头替换的替代实施方案。
在一些实施方案中,本文中描述的方法允许产生没有大小限制的配对标签。在一些实施方案中,该方法允许产生不被IIs型或III型限制酶加工的配对标签。因此。在一些实施方案中,方法和/或试剂盒将不包括IIs型或III型限制酶。在一些实施方案中,这允许产生包括尚未被IIs型或III型限制酶加工的末端的配对标签。因此。在一些实施方案中,配对标签末端的一个或更多序列不是来自于IIs型或III型限制酶切割的序列。这也包括随后以另一种方式平端化或加工的IIs型或III型切开位点。在一些实施方案中,配对标签缺少IIs型和/或III型限制位点。
尽管上面描述了用来产生配对标签的各种实施方案中涉及的一般概念,但下述部分描述各种具体实施方案并提供具体实施例从而对该技术提供进一步的描述。
双链目标多核苷酸
双链目标多核苷酸可来自于任何来源,如细胞或组织核酸样品,以前克隆的片段的亚克隆,mRNA,化学合成的核酸,基因组核酸样品,从核酸文库获得的核酸分子,具体核酸分子,和核酸分子的混合物。所公开的方法的一些实施方案特别适合用于从将表示于文库中的核酸分子的复杂混合物开始来产生克隆的核酸分子的文库。例如,可以通过细胞样品中的所有mRNA产生cDNA并用于制备cDNA文库,或者可以从基因组核酸样品产生基因组DNA文库。
在一些实施方案中,将要被表征的核酸序列可以是基因组。基因组是细胞或生物的基因组DNA。在一些实施方案中,基因组可以是原核生物、真核生物、植物、病毒、真菌、或其分离的细胞。在其他实施方案中,基因组可以是已知的(以前表征或测序的)基因组。在其他实施方案中,基因组可以是未知的(以前没有表征或测序的)基因组。在一些实施方案中,对基因组的表征可包括对基因组进行核型分析。核型分析是对细胞或生物的基因组的分析。在其他实施方案中,对基因组的表征包括多态性发现或基因型分型以鉴定来自于不同来源的两个或更多核酸序列之间的差异。
目标多核苷酸、核酸或DNA可以基本上是任何已知或未知序列的核酸。其可以是,例如,基因组DNA或cDNA的片段。测序可以导致确定目标分子的全部或部分序列。目标分子可以来源于已经被随机片段化的初级核酸样品。目标分子可以加工成适合扩增的目标多核苷酸片段,例如,通过在每个目标片段的末端放置通用扩增序列。也可以通过逆转录成cDNA从初级RNA样品获得目标分子。
在一些实施方案中,目标多核苷酸可以起源于双链DNA(dsDNA)形式(例如基因组DNA片段,PCR和扩增产物等等)。在一些实施方案中,多核苷酸可以起源于单链形式,如DNA或RNA,并被转化为dsDNA形式。以举例的方式来说,可以通过本领域熟知的标准技术将mRNA分子拷贝成适合于本发明方法使用的双链cDNA。初级多核苷酸分子的精确序列对本发明而言一般并不重要,且可以是已知的或未知的。
配对标签或配对读数可以在任何长度的片段上获得,例如2-10Kb的PCR扩增子或从细菌或其他生物来源分离的DNA克隆。靶可以是大约40kB的质粒分子的末端或大约100-200kB的细菌人工染色体(BAC)的末端。来自于这些来源的多核苷酸的末端可以不经过片段化而进行测序以获得每个未片段化的多核苷酸末端的读数,或者该多核苷酸可被片段化。片段化的多核苷酸可以进行大小选择,例如通过凝胶电泳,以获得靶片段上的窄的大小分布。遍布样品分隔的配对读数可以用作工具用于对以前未测序的样品进行从头组装,以及当可获得参照基因组时用于样品的重新测序。在一些实施方案中,当想要知道分子的任一末端的序列知识时,本文中描述的方法适合于使用从任何来源获得的核酸分子。
在一些实施方案中,目标多核苷酸可以是DNA分子。在一些实施方案中,目标多核苷酸可以代表生物的整个遗传互补,且可以是基因组DNA分子,其包括内含子和外显子序列(编码序列),以及非编码的调节序列如启动子和增强子序列。在使用基因组DNA分子的实施方案中,可以完成基因组范围的分析或对整个基因组的分析。然而,也想到多核苷酸序列或基因组DNA的特定亚群也可以使用,如,例如,特定染色体。在一些实施方案中,目标多核苷酸的序列可以是未知的。在一些实施方案中,目标多核苷酸可以是人类基因组DNA分子。在任何随机片段化过程之前或之后,以及连接衔接头序列之前或之后,目标DNA分子可以经过化学或酶促处理。随机片段化是指通过酶、化学或机械的手段以无序的方式将多核苷酸分子片段化。这样的片段化方法是本领域已知的并使用标准方法(Sambrook和Russell,MolecularCloning,A Laboratory Manual,第三版)。将随机片段化设计为用来产生片段,该片段与包含切断和/或在切断周围的序列特性或核苷酸位置无关。随机片段化可以通过机械手段如雾化或超声处理来完成,能够产生,例如大约50碱基对长度至大约3000碱基对长度,更特别地50-2000碱基对长度,更特别地50-1500碱基对长度,更特别地50-1000碱基对长度,还更特别地50-700碱基对长度的片段。在一些实施方案中,可使用该方法产生大约1000-2000碱基对长度的片段。在一些实施方案中,可使用该方法产生大约500-1000碱基对长度的片段。在一些实施方案中,可使用该方法产生大约50-150碱基对长度的片段。
在一些实施方案中,目标多核苷酸可以经历大小选择的方法以选择特定大小的多核苷酸片段。大小选择方法可以是多种本领域已知的大小选择方法中的任意一种,包括但不限于电泳(如凝胶电泳)和层析(如HPLC和大小排阻层析)。在一些实施方案中,通过大小选择方法选择下述长度的片段:例如,大约50碱基对长度至大约3000碱基对长度,更特别地50-2000碱基对长度,更特别地50-1500碱基对长度,更特别地50-1000碱基对长度,还更特别地50-700碱基对长度。在一些实施方案中,可使用该方法选择大约1000-2000碱基对长度的片段。在一些实施方案中,可使用该方法选择大约100-1000碱基对长度的片段。在一些实施方案中,可使用大小选择方法选择大约50-150碱基对长度的片段。
在本文描述的各种实施方案中提供了表征核酸序列的方法,其包括片段化核酸序列以产生多种具有5’末端和3’末端的核酸序列片段。通过机械手段(例如雾化,超声处理和水力剪切(Hydroshear))片段化多核苷酸分子产生带有平端和3’-和5’-突出端末端的异质混合物的片段。可以通过本领域已知的方法或试剂盒(如Lucigen DNA terminatorEnd Repair Kit)修复片段末端以产生最佳的用于连接的末端,例如,连接到具有平端的衔接头。各种限制性内切核酸酶,如,例如,SmaI,可用于产生平端。在一些实施方案中,核酸群体的片段末端是平端末端的。
在一些实施方案中,如图1中显示的实施方案中,目标多核苷酸在5’和3’末端都缺少5’磷酸残基。虽然图1中描述的目标多核苷酸似乎是具有平端,但在其他实施方案中,目标多核苷酸可以具有一个粘性末端和一个平端,两个粘性末端,或两个平端。在一些实施方案中,衔接头可以具有一个粘性末端和一个平端,两个粘性末端,或两个平端。
在一些实施方案中,制备这样的目标多核苷酸:其至少一个末端缺少5’磷酸残基。例如,5’磷酸残基可以通过碱性磷酸酶的活性而去除,碱性磷酸酶催化从DNA,RNA,核糖核苷三磷酸和脱氧核糖核苷三磷酸上去除5’磷酸基团。用碱性磷酸酶处理多核苷酸的片段
P-----------------    碱性磷酸酶→-----------------
-----------------P                -----------------
                                            P
                                        P
因此,可以从目标多核苷酸的5’末端去除5’磷酸残基。适当的碱性磷酸酶的例子包括小牛小肠碱性磷酸酶、细菌碱性磷酸酶、虾碱性磷酸酶、南极磷酸酶(antarctic phosphatase)、和胎盘碱性磷酸酶。如本领域技术人员将理解的,有多种方式引入切口或从目标多核苷酸的环化中产生切口。这样的技术所需的只是在环化的核酸序列中存在切口。
在一些实施方案中,目标多核苷酸的末端可以被修饰。例如,当待结合到目标多核苷酸的衔接头包含一个或更多胸腺嘧啶时,可以添加一个或更多腺嘌呤。在一些实施方案中,目标多核苷酸保留它们的磷酸残基。
衔接头、环化和切口引入
在一些实施方案中,通过附着一个或更多衔接头至多核苷酸的末端来修饰目标多核苷酸,以从其暴露的末端有效去除5’磷酸。例如,可将在一条链中缺少5’磷酸残基的衔接头连接至目标DNA片段的末端。在一些实施方案中,衔接头具有至少一个与目标多核苷酸的末端相容的末端。在一些实施方案中衔接头可具有一个平端,两个平端,两个粘性末端,或两个平端。在一些实施方案中,衔接头的一个末端可以是粘性末端并缺少5’磷酸残基,且衔接头的另一末端可以是平端。在其他实施方案中,第一衔接头可附着到目标多核苷酸的一个末端,且具有与第一衔接头不同序列的第二衔接头可附着到目标多核苷酸的另一个末端。第一和第二衔接头之一或两者都可以在一条链中缺少5’磷酸残基。在一些实施方案中,衔接头可以通过,例如连接,附着到目标多核苷酸。
如本领域技术人员将理解的,在一些实施方案中,衔接头可以包含任何长度的任何核苷酸序列。在一些实施方案中,衔接头被构造为当连接到目标多核苷酸或另一个衔接头时产生切口或缺口。在一些实施方案中,当衔接头添加到目标多核苷酸时,衔接头的浓度比目标多核苷酸要高得多。在一些实施方案中,衔接头比目标多核苷酸短。在一些实施方案中,衔接头的长度在500碱基以下,例如,400、300、200、100、50,或更少碱基。
在一些实施方案中,衔接头包含条码序列。衔接头条码序列可以通过下述方法检测:如,例如,测序或杂交。在一些实施方案中,条码序列可允许鉴定在单个测序运行中放置在一起的不同样品。例如,可以将2、3、4、5、6、7-10、10-50、50-100、100-200、200-500、500-1000、或更多不同样品(每个具有独特的条码序列)放置在一起,置于单个测序运行中。可使用与配对标签的特定衔接头有关的独特的条码序列来鉴定配对标签的成员。在一些实施方案中,条码与衔接头分离但仍然包含于配对标签中。在一些实施方案中,条码位于两个衔接头之间。在一些实施方案中,条码在一个以上的衔接头中。
在一些实施方案中,衔接头偶联到结合部分。
在一些实施方案中,衔接头(1、2、3、或所有的衔接头)不包含限制酶结合位点。例如。在一些实施方案中,衔接头(在环化的核酸分子中的一个或更多衔接头)缺少EcoP15I和MmeI限制位点。因此。在一些实施方案中,添加结合到特异性序列的限制酶将不会导致对环化的核酸分子的切割。
在一些实施方案中,将目标多核苷酸附着到衔接头可以通过,例如,连接或退火进行。在图1中,环状核酸分子在环状核酸分子的每条不同链上具有一个切口。在示例性实施方案中,切口起初位于衔接头和目标多核苷酸之间。在一些实施方案中,多核苷酸末端的序列和衔接头可以如下所述:在目标多核苷酸附着到衔接头后,在目标多核苷酸和衔接头之间可以形成至少一个缺口,如图7所示。在目标多核苷酸和衔接头之间有缺口的一些实施方案中,缺口两侧的多核苷酸链的5’末端仍然可以具有5’磷酸残基。这是因为当引入缺口时,5’磷酸残基的存在不影响切口平移反应。在目标多核苷酸和衔接头之间有缺口的一些实施方案中,缺口两侧的多核苷酸链的5’末端可以缺少5’磷酸残基。换句话说,位于缺口的3’末端的多核苷酸链可以缺少5’磷酸残基,如图7所示。位于缺口的3’末端的多核苷酸链缺少5’磷酸残基不是必需的。在一些实施方案中,位于缺口的3’末端的多核苷酸链不缺少5’磷酸残基。在一些实施方案中,环状核酸分子可具有一个切口,一个缺口,在相反链上有两个切口,一条链上有切口并且相反链上有缺口,或在相反链上有两个缺口。
在一些实施方案中,在制备配对标签克隆时,第一组衔接头序列可以附着到目标多核苷酸片段,如图3所示。目标多核苷酸附着到衔接头可通过,例如,连接或退火进行。在图中显示的实施方案中,目标多核苷酸具有平端末端,其连接到衔接头1的平端。在其他实施方案中,目标多核苷酸的一个末端可以连接到第一衔接头1,且目标多核苷酸的另一末端可以连接到第二衔接头1,且第一和第二衔接头1可具有相同或不同的序列。在图3中,衔接头1在其粘性5’末端缺少5’磷酸残基。所产生的分子具有缺少5’末端磷酸残基的粘性末端。然后,这一分子的两个粘性末端连接到衔接头2的末端,由此形成在相反链上具有切口的环状核酸分子,如图3所示。切口存在于第一衔接头的末端和第二衔接头之间。在一些实施方案中,衔接头1和衔接头2的序列可以如下所述:当衔接头2连接到衔接头1时,在衔接头1和衔接头2之间形成至少一个缺口。在一些在衔接头1和衔接头2之间存在缺口的实施方案中,缺口两侧的多核苷酸链的5’末端可以具有但并不是需要具有5’磷酸残基。换言之,位于缺口的3’末端的多核苷酸链可以具有但并不是需要具有5’磷酸残基。在一些实施方案中,环状核酸可具有一个切口,一个缺口,在相反链上有两个切口,一条链上有切口并且相反链上有缺口,或在相反链上有两个缺口。在一些实施方案中,衔接头1可具有一个粘性末端和一个平端,两个粘性末端,或两个平端。衔接头2可具有一个粘性末端和一个平端,两个粘性末端,或两个平端。第一衔接头1和第二衔接头1都可以缺少至少一个5’磷酸残基。
在一些实施方案中,将切口引入环状核酸分子。在一些实施方案中,引入到环状核酸分子的切口的位置可以是随机的。在一些实施方案中,可设计环状核酸分子以使之具有切口产生性限制酶识别位点。在一些实施方案中,含有切口产生性限制酶的限制位点的衔接头可以连接到目标多核苷酸的一个或两个末端以产生衔接头修饰的目标多核苷酸(图8)。然后,可以使用另一衔接头将衔接头修饰的目标多核苷酸环化,如图8所示。在其他实施方案中,在两个末端都具有切口产生性限制酶位点的衔接头可以连接到目标多核苷酸的两个末端以形成环状核酸分子。可使用切口产生性限制酶(该酶是对引入环状核酸分子的位点特异性的酶)在每个切口产生性限制酶位点的下游的一条链中产生切口(图9)。
切口产生性限制酶是本领域已知的,且包括,例如但不限于EcoP15I、Nb.BbvCI、Nb.Bsml、Nb.BsrDI、Nb.BtsI、NtAlwI、Nt.BbvCI、Nt.BstNBI。可以使用现有策略将限制酶如EcoP15I和MmeI加工成切口产生性酶(Heiter,DF.等人,2005,J.Mol.Biol.,348,631-640;Samuelson,J.C.,等人NAR,32:3661-3671;Zhu,Z.等人.2004,J.MolBiol.337:573-583)。
在一些实施方案中,在制备配对标签克隆中,拓扑异构酶(Topo)可用于提高环化效率。可使用各种拓扑异构酶,包括类型IA、IB、II等等。在一些实施方案中,拓扑异构酶可以是拓扑异构酶I。在一些实施方案中,可以使用具有Topo结合位点的衔接头(″Topo结合衔接头″)。Topo结合位点的序列将取决于所使用的特定的拓扑异构酶。在一些实施方案中,Topo结合位点是或包含YCCTT,其中Y可以是C或T。在一些实施方案中,衔接头可在一条或两条链的3’末端具有Topo结合位点。在其他实施方案中,Topo结合衔接头可在衔接头的每条链的3’末端具有Topo结合位点。在一些实施方案中,Topo结合衔接头在一条或两条链的3’末端具有一个或更多的延伸到Topo结合位点之外的额外碱基。Topo结合衔接头可具有平端,粘性末端,或一个平端和一个粘性末端。
在一些实施方案中,Topo结合衔接头在一条或两条链上具有缺口或切口。一个Topo结合衔接头的例子描述于图10中。如图10所示,通过组合四条寡核苷酸Topo-IA-A-1、Topo-IA-B-1、Topo-IA-A-2和Topo-IA-B-2形成在相反链上具有缺口或切口的Topo结合衔接头。寡核苷酸Topo-IA-B-1和Topo-IA-A-2中每条在3’末端都具有Topo结合位点并缺少5’磷酸。在所描述的实施方案中,Topo-IA-A-1偶联到结合部分,生物素。所产生的Topo结合衔接头(显示于图10的下部)在两条链的3’末端都具有Topo结合位点,在相反链上有切口、缺口/切口并偶联到生物素。
将拓扑异构酶添加到Topo结合衔接头可以产生拓扑异构酶-衔接头复合物,如图11所示。如本领域技术人员将理解的,在复合物形成过程中,拓扑异构酶I在Topo结合位点与衔接头共价结合(参见例如Shuman,Proc.Natl.Acad.Sci.USA,Vol.88,pp.10104-10108,1991.)。衔接头链中5’YCCTT位点之后的磷酸二酯主链断开,且在切割的链的3’磷酸和拓扑异构酶I的Tyr274残基之间形成磷酸酪氨酰键(图11)。随后磷酸酪氨酰键可被去磷酸化的多核苷酸的5’羟基基团攻击(图12)。在一些实施方案中,DNA插入片段(在一些实施方案中其可用于文库构建)可以是去磷酸化的并且使用相关的一个或多个核苷酸使用Taq或任何其他适合产生突出端的方法加上3’尾部。如本领域技术人员将理解的,拓扑异构酶和衔接头之间具体的键合反应将依赖于所使用的特定的拓扑异构酶而变化。
在一些实施方案中,目标多核苷酸可以是去磷酸化的。目标多核苷酸的去磷酸化的例子在上面进行了讨论。在一些实施方案中,去磷酸化的目标多核苷酸使用所需的核苷酸加上3’尾部。可以使用用来产生突出端的多种方法进行3’加尾。在一些实施方案中,使用Taq在去磷酸化的目标多核苷酸上加上3’尾部以产生突出端。在一些实施方案中,一个或更多核苷酸可被添加到目标多核苷酸的一条或两条链的3’末端。在一些实施方案中,单个核苷酸可被添加到目标多核苷酸的每条链的3’末端。在图12中描述的实施方案中,去磷酸化的目标多核苷酸在每条链的3’末端具有单个A的突出端。
在一些实施方案中,拓扑异构酶-衔接头复合物与去磷酸化的目标多核苷酸组合在一起。去磷酸化的目标多核苷酸的5’羟基基团可以攻击拓扑异构酶-衔接头复合物的磷酸酪氨酰键,如图12所示。形成包含衔接头和目标多核苷酸的环状核酸分子,如图13所示。在一些实施方案中,环状核酸在衔接头内的相反链上可具有切口。
如上所述,在一些实施方案中,可以使用一个以上的衔接头。另外。在一些实施方案中,可以使用连接多核苷酸来连接第一和第二衔接头,且由此形成带切口的连接多核苷酸。在一些实施方案中,通过至少两个衔接头完成环化。在一些实施方案中,在该过程的以后的点上也使用内部衔接头(例如,图27和28)。
如上所述,在一些实施方案中,切口存在于衔接头和目标多核苷酸之间。在一些实施方案中,切口存在于带切口的载体中。在一些实施方案中,切口不是位于衔接头和目标多核苷酸之间,而是位于衔接头和连接多核苷酸之间。在一些实施方案中,切口可以通过单链特异性的内切核酸酶(或外切核酸酶)扩展成缺口以允许增加消化效率。
在一些实施方案中,对衔接头进行修饰,以使之缺少磷酸基团,从而当衔接头连接到连接多核苷酸时形成切口和/或缺口。在一些实施方案中,切口和/或缺口在目标多核苷酸和衔接头之间。在一些实施方案中,切口和/或缺口在连接多核苷酸和衔接头之间。在一些实施方案中,切口和/或缺口在目标多核苷酸内。在一些实施方案中,切口和/或缺口在连接多核苷酸内。
在一些实施方案中,目标多核苷酸的环化可涉及修饰目标多核苷酸和/或衔接头的末端。在一些实施方案中,修饰减少带切口的连接多核苷酸自连接的可能性。在一些实施方案中,修饰是在带切口的连接多核苷酸的衔接头部分的末端添加一个或更多核苷酸(例如,胸腺嘧啶)。选择额外的核苷酸以便减少自连接的可能性(例如,末端将不会相互杂交)。当然,目标多核苷酸将被修饰,从而使之与修饰的衔接头的末端杂交。在一些实施方案中,释放的配对标签的末端也可被修饰(同时内部衔接头的末端也被适当的修饰)。
在一些实施方案中,切口被转化成缺口,如本文描述的,然后在缺口(而非较小的切口)的基础上继续该过程。在一些实施方案中,这允许在单链区段上进行更有效的切割以释放配对标签。
切口平移和/或切口的3’侧的延伸
在各种实施方案中,具有至少一个切口或缺口的环状核酸分子形成后,可以进行切口平移反应,如图2和图4所示。切口平移反应将环状核酸分子中存在的至少一个切口移位到目标多核苷酸中的位置。图4图示了图3中显示的环状核酸分子上进行的切口平移反应的结果。切口平移反应可以通过衔接头1将环状核酸分子中的每个切口移位到目标多核苷酸中的位置,如图4所示。
在一些实施方案中,切口平移可以在线性核酸分子上进行。因此,在切口平移反应过程中,分子不一定是环状的,
进行切口平移反应的方法是本领域技术人员已知的(Rigby,P.W.等人.(1977),J.Mol.Biol.113,237)。多种适当的聚合酶可用于进行切口平移反应,包括例如,大肠杆菌DNA聚合酶I、Taq DNA聚合酶、Vent DNA聚合酶、Klenow DNA聚合酶I和phi29 DNA聚合酶。取决于所使用的酶,切口平移可通过5’至3’外切核酸酶活性,或通过5’至3’链置换进行。当缺口存在于环状核酸分子中时,缺口首先通过5’至3’聚合酶活性被核苷酸填充,由此产生切口。在一些实施方案中,有低活性的突变酶用于切口平移反应。突变酶可以具有,例如,低的延伸率,低的5’至3’外切核酸酶活性,低的5’至3’聚合酶活性,低的5’至3’链置换活性,或其组合。在一些实施方案中,突变酶对反应条件如,例如,温度或pH敏感。
如本领域技术人员将理解的,可以改变反应条件以控制切口平移产物的长度。例如,切口平移反应产物的长度,即切口移动的距离,可取决于反应条件,如反应时间、反应温度、所用的聚合酶、pH、存在的离子、盐条件等等。如上面所讨论的,可以使用突变聚合酶,包括温度敏感的聚合酶。因此,该方法允许人们控制所产生的序列标签的长度。在一些实施方案中,在切割步骤之前停止切口平移。如本领域技术人员将理解的,可以通过提高温度、降低温度、改变pH、改变存在的离子、改变盐条件、添加螯合剂等等停止或减缓切口平移。
在一些实施方案中,使用大肠杆菌DNA聚合酶I在0℃进行5分钟的切口平移反应。在一些实施方案中,切口平移反应可继续进行大约1分钟至大约20分钟。在一些实施方案中,在反应继续进行大约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20分钟之后通过加热终止切口平移反应。在一些实施方案中,切口平移反应在大约0℃至大约40℃之间的温度下进行。在一些实施方案中,切口平移反应在大约0℃、4℃、30℃、室温或37℃进行。
在一些实施方案中,可以允许切口平移反应围绕环化的核酸继续进行所需的长度,然后可以终止反应。可以通过许多适当的手段中的任何一种进行终止,所述手段包括,例如,通过加热或通过添加适当的停止溶液或缓冲液。在一些实施方案中,至少一个切口可被平移至少1个碱基,例如,至少1、2、3、4、5、6、7、8、9、10、15、16、17、18、19、20、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325、330、335、340、345、350、355、360、365、370、375、380、385、390、395、400、405、410、415、420、425、430、435、440、445、450、455、460、465、470、475、480、485、490、495、500、800、1000、1500、和2000个或更多碱基。在一些实施方案中,至少一个切口可被平移10个-2000个碱基。在一些实施方案中,至少一个切口可被平移10个-500个碱基。在一些实施方案中,至少一个切口可被平移10个-200个碱基。在一些实施方案中,至少一个切口可被平移10个-100个碱基。在一些实施方案中,至少一个切口可被平移20个-50个碱基。在一些实施方案中,上述任一范围的下限是28个碱基。在一些实施方案中,上述任一范围的上限是2000个碱基。在其他实施方案中,切口平移反应可继续直至两个相对的切口在一个点上相遇,从而在环状核酸分子中形成断点。
在一些实施方案中,包含切口和/或缺口的部分的多核苷酸的末端简单地进行移动或延伸,且不需要通过切口平移酶进行平移。在一些实施方案中,衔接头的3’末端被去除和/或由其延伸(例如,如图16和17所示)。在一些实施方案中,去除一个或更多的衔接头,然后由一个剩余的衔接头进行延伸(例如,图20)。
在一些实施方案中,带切口和/或缺口的环化核酸可以暴露于外切核酸酶消化(如5’至3’外切核酸酶消化)(图16)。这导致一些或全部双链目标多核苷酸变成单链(以及任选地去除衔接头的一条或更多链)。随之,所产生的产物可以从切口的剩余的3’末端或3’侧延伸(例如通过DNA聚合酶,如图17所示)。有效地,这允许延伸或移动切口的3’末端,即使以前包含该切口的5’末端已经被移动到很远的地方(图17)或已经实际上被去除(图20)。在一些实施方案中,这一过程可以视为涉及非常大的缺口结构。这一过程也可描述为简单地延伸或移动切口的3’末端或部分。在一些实施方案中,包含切口5’侧的链的部分在延伸前被消化。在一些实施方案中,消化起始于包含切口5’侧的链的部分。在一些实施方案中,包含5’末端的链通过5’至3’外切核酸酶(如T7外切核酸酶或λ外切核酸酶)消化。在一些实施方案中,不需要外切核酸酶。在一些实施方案中,例如,可使用解旋酶在切口和/或缺口处展开DNA。在一些实施方案中,解旋酶展开和聚合酶3’延伸可在同一时间在同一反应管中发生。也可使用其他置换5’末端的适当的酶或过程。
如果适当,任何本文描述的与″切口平移″有关的方面也可用于上述的延伸过程(例如,移动的碱基数目等等)。
切口切割和单链切割
如上所述,切口移位到目标多核苷酸内允许在目标多核苷酸内的位置切割,从而允许对衔接头和切口之间的多核苷酸序列的碱基序列进行操作。在一些实施方案中,可以在切割之前终止切口平移反应。如图5所示,切口平移反应终止之后,对环状核酸分子中切口相对的多核苷酸链的切割可以″释放″配对标签克隆,该配对标签克隆包括来自于目标多核苷酸的每个末端的两个标签。在一些实施方案中,含有释放的配对标签的溶液可以包括配对标签,以及目标多核苷酸的剩余区段,其将会是目标多核苷酸的区段减去两个标签序列(它们现在是配对标签的一部分)。
在一些实施方案中,配对标签克隆包含至少一个衔接头,该衔接头的侧翼是来自于目标多核苷酸的相对末端的标签(第一和第二标签)。图5中描述的配对标签包含两侧侧接衔接头1的衔接头2。图5中配对标签的末端区域包含来自于目标多核苷酸的相对末端的序列标签。对切口相对的链的切割可以通过多种适当的核酸酶进行,包括,例如但不限于S1核酸酶、绿豆核酸酶、核酸酶P1、核酸酶BAL-31。在一些实施方案中,切口相对的多核苷酸链可被切割。
当链置换酶用于将切口移动到目标多核苷酸内时,被置换的链也可以通过S1核酸酶、绿豆核酸酶、核酸酶P1或核酸酶BAL-31消化。
在一些实施方案中,环化的核酸分子通过下述方式切割:允许切口平移环绕核酸分子进行直至其遇到另一个切口;由此产生自我切割的分子。同样,在一些实施方案中,整个目标多核苷酸可以在配对标签上,大约一半在第一标签中,且另一半在第二标签中。如本领域技术人员将理解的,这样的配对标签可能相对较大,这取决于目标多核苷酸的最初大小。因此。在一些实施方案中,如果人们希望允许切口平移步骤产生释放的配对标签,那么人们可以在开始时使用适当大小的目标多核苷酸。例如,人们在开始时使用目标多核苷酸的长度为1000、900、800、700、600、500、400、300、200、或100个碱基以下,由此产生的标签的长度为500、450、400、350、300、250、200、150、100、或50个碱基以下。
如本文描述的,在一些实施方案中,不是切口中缺失单个磷酸二酯键,而是存在缺口。在一些实施方案中,这允许更有效的加工和切割以产生释放的配对标签。在一些实施方案中,缺口有效地延伸到链的末端;且因此,整个目标多核苷酸是单链的。在这样的实施方案中,由于末端是单链的,所以外切核酸酶和/或内切核酸酶可用于释放配对标签。
在一些实施方案中,切割目标多核苷酸以形成释放的配对标签不需要单独的切割酶。例如,如图19-21中的实施方案中所示,在一些实施方案中,可以允许5’至3’外切核酸酶消化环化的分子直至其使环状分子线性化。在一些实施方案中,仍然可以通过单链特异性外切核酸酶去除单链目标多核苷酸(例如,如图21所示)。
进一步加工配对标签
在一些实施方案中,可以通过本领域已知的多种方法纯化配对标签克隆以去除不需要的分子。在一些实施方案中,配对标签克隆中的衔接头可以偶联到结合部分。结合部分可以是能够偶联到衔接头的任何结合部分,如,例如,生物素。结合部分可用于,例如,将配对标签克隆附着到固体支持物。固体支持物可以是,例如但不限于,阵列或微阵列。在一些实施方案中,固体支持物是微阵列上的珠子。合并了结合部分的核酸分子可以使用许多本领域已知的方法通过亲和捕获进行纯化,如使用特异性结合到结合部分的纯化部分,例如,链霉抗生物素蛋白。亲和捕获方法一般涉及使用附着到基质(如固体表面,磁珠,或半固体珠或树脂)上的捕获试剂。
在一些实施方案中,一个或更多引物衔接头可附着到配对标签克隆的一个或更多末端。在图6中,引物衔接头P1和P2附着到配对标签克隆的末端。引物衔接头可用于多种目的。例如,可以使用引物衔接头扩增配对标签。在一些实施方案中,扩增可以是克隆扩增,如,例如,乳剂聚合酶链反应(乳剂PCR),桥式聚合酶链反应(桥式PCR),或其组合。在一些实施方案中,引物衔接头可用于测序配对标签克隆的至少一部分,如图6所示。
在一些实施方案中,可在配对标签克隆上进行后续的或额外的切口平移反应。例如,如果引物衔接头是非磷酸化的,可以在引物衔接头附着到配对标签克隆的末端之后,进行额外的切口平移,以用来,例如,促进后续的PCR扩增。
如本领域技术人员将理解的,从目标多核苷酸产生配对标签克隆具有很多应用。例如,其可允许迅速地表征目标多核苷酸。在一些实施方案中,表征核酸序列包括对从核酸序列中产生的配对标签进行测序。测序方法是本领域标准的方法,且包括,例如,使用Maxam和Gilbert技术或Sanger方法的传统测序,或通过在例如芯片上与已知寡核苷酸的阵列或微阵列杂交。其他途径包括通过合成法测序,其中引物-目标多核苷酸复合物被固定到,例如,基质如聚合物、磁珠,或固体表面,并使用DNA聚合酶或DNA连接酶在存在标记的底物的情况下延伸,从而可表征加成产物以确定DNA序列。在一些实施方案中,产生配对标签的各种实施方案在制备用于Support Oligo LigationDetection(SOLiDTM)测序或其他大规模平行测序技术中的目标多核苷酸或其一部分中是有益的。
进一步的实施方案
本申请预期了制备配对标签文库的方法和文库本身。在一些实施方案中,该方法包括片段化核酸序列以产生许多具有5’末端和3’末端的多核苷酸片段。一个或更多衔接头可连接到每个多核苷酸片段的末端以产生许多环状核酸分子,其中在衔接头和多核苷酸片段之间引入切口或缺口。在一些实施方案中,切口或缺口存在于多核苷酸片段的每个末端和衔接头之间。在制备用于配对标签文库的环状核酸分子时,可以使用任何上述描述的方法。可以在环状核酸分子上进行切口平移反应以产生许多环状核酸分子,每个具有至少一个存在于其相应的多核苷酸片段内的切口。可在切口相对的点切割所产生的环状核酸分子以释放配对标签克隆,由此产生配对标签文库。
在一些实施方案中,文库使用内部衔接头。
试剂盒
在一些实施方案中,提供了制备配对标签的试剂盒。试剂盒可包含用于连接目标多核苷酸到衔接头以形成环状核酸分子的试剂,该环状核酸分子具有位于目标多核苷酸的第一末端和衔接头之间的第一切口或缺口,和位于目标多核苷酸的第二末端和衔接头之间的第二切口或缺口,以及进行切口平移反应的试剂。在一些实施方案中,不包含扩增试剂。此外,可包含一组说明书和基因组组装指南。这样的材料可以是,例如,印刷的或数码形式的。在一些实施方案中,包含酶或成分,以调整目标多核苷酸或衔接头的5’或3’末端,以在环化的核酸分子中包括相关的切口。
在一些实施方案中,试剂盒包含带切口的连接多核苷酸,带切口的连接多核苷酸包括连接多核苷酸和连接到其上的两个衔接头。在一些实施方案中,试剂盒包含这三个部分,但这些部分没有连接在一起。在一些实施方案中,试剂盒包含结合部分,如生物素/链霉抗生物素蛋白部分,如图22-28所示(或任何其他连接组合),以允许迅速地操作多核苷酸。在一些实施方案中,试剂盒包含用于基于SOLiDTM的过程的引物。在一些实施方案中,SOLiDTM引物与P1和/或P2中的一条链的至少一部分互补,如图22-28所示。在一些实施方案中,试剂盒包含一个或更多内部衔接头。在一些实施方案中,试剂盒包含一个或更多的酶,其用于连接、切口平移、3’末端延伸、添加粘性末端、单链切割酶(包括内切核酸酶和外切核酸酶)、PCR扩增、用于乳剂PCR的成分、和用于SOLiDTM测序的成分。在一些实施方案中,试剂盒包含本文描述的任何一个或更多的酶和/或多核苷酸。
在一些实施方案中,包含计算机程序(或可以单独提供),其比较本文描述的方法产生的配对标签克隆的测序结果。在一些实施方案中,程序鉴定并组装来自标签克隆(其来自于配对标签文库)的序列信息。通过这种方式,该程序可提供单个完整的、高度精确的序列。在一些实施方案中,该程序执行本文描述的任何一种方法。
实施例
根据下述的实施例可以进一步理解本申请教导的实施方案,这些实施例不应解释为以任何方式限制本申请教导的范围。
实施例1
本实施例举例说明制备配对标签克隆的一种方法。
质粒DNA pUC19用限制酶SmaI线性化并用作目标DNA多核苷酸的模型。衔接头1连接到目标DNA多核苷酸的末端。所产生的构建体通过与衔接头2连接而环化。衔接头2用生物素标记以促进下游纯化。一半的环状DNA用于切口平移反应,所述切口平移反应使用大肠杆菌DNA聚合酶I在0℃进行5分钟。另一半环状DNA保存起来用作非切口平移对照。切口平移DNA和非切口平移对照在37℃用S1核酸酶消化15分钟。S1消化的DNA进行末端修复,然后通过结合到链霉抗生物素蛋白磁珠进行纯化,并与P1和P2引物衔接头连接。所产生的DNA通过P1和P2引物进行PCR扩增。
PCR产物在琼脂糖凝胶上分析。如预期的一样,切口平移反应产物的PCR产物比对照反应的PCR产物更长。此外,切口平移反应的PCR产物显示出成片条带,从而表明产物长度的范围为大约100bp到200bp以上。
实施例2
本实施例举例说明使用pUC19制备配对标签克隆的方法。
pUC19 DNA用SmaI消化,且线性化的DNA通过QIAGENTMMinElute Reaction Cleanup Kit纯化。
使用NEB Quick Ligation Kit将衔接头1连接到线性化的pUC19DNA。随后,反应通过QIAGENTM MinElute Reaction Cleanup Kit清理(clean up)。连接产物使用QIAGENTM MinElute Gel Extraction Kit进行琼脂糖凝胶纯化。
上述连接产物通过使用NEB Quick Ligation Kit与衔接头2连接而环化。然后,反应通过QIAGENTM MinElute Reaction Cleanup Kit清理。
上述反应产物用Epicenter Plasmid safe DNase消化以去除任何线性的DNA,且然后用QIAGENTM MinElute Reaction Cleanup Kit清理。
上述的环状DNA使用大肠杆菌DNA聚合酶I在0℃进行切口平移5、10、或15分钟。通过添加来自于QIAGENTM MinElute Kit的ERC缓冲液停止反应。然后,反应用QIAGENTM MinElute Reaction CleanupKit清理。
上述切口平移的DNA使用Invitrogen S1核酸酶在37℃消化15分钟,以释放配对标签DNA。然后,反应用QIAGENTM MinEluteReaction Cleanup Kit清理。
上述步骤的DNA使用Epicentre EndIt kit进行末端修复。
配对标签DNA通过结合到链霉抗生物素蛋白珠子进行纯化。
P1和P2引物衔接头连接到配对标签DNA。
使用P1引物和P2引物对pUC19配对标签克隆进行PCR扩增以扩增pUC19配对标签。
通过在0℃进行5、10和15分钟的切口平移产生的配对标签的PCR产物在琼脂糖凝胶上分开的泳道上进行分析。每个显示出成片条带,从而表明产物的长度在大约100bp至200bp以上。在0℃进行15分钟产生的配对标签的PCR产物平均比在0℃进行10分钟产生的配对标签的PCR产物更长,后者平均比在0℃进行5分钟产生的配对标签的PCR产物更长。
实施例3
本实施例举例说明使用DH10B基因组DNA制备配对标签克隆文库的方法。在本实施例中,30μg的DH10B基因组DNA进行水力剪切(hydroshear)以产生目标多核苷酸。水力剪切产生的目标多核苷酸的末端使用ENDITTM试剂盒修复。然后,目标多核苷酸使用QIAGENTMMinElute Reaction Cleanup Kit纯化。
通过NEB Quick Ligation Kit将衔接头1连接到上述步骤的目标多核苷酸的末端。
使用QIAGENTM MinElute Reaction Cleanup Kit清理反应。使用琼脂糖凝胶上的DNA选择2kb至3kb长度的衔接头修饰的目标多核苷酸。凝胶选择的衔接头修饰的目标多核苷酸使用QIAGENTM MinEluteGel Extraction Kit纯化。
凝胶选择的衔接头修饰的目标多核苷酸通过与衔接头2连接而环化。衔接头2含有生物素结合部分。
然后,使用QIAGENTM MinElute Reaction Cleanup Kit清理反应。
上述反应产物用Epicenter Plasmid safe DNase消化以去除任何线性DNA,然后用QIAGENTM MinElute Reaction Cleanup Kit清理。
上述步骤的环状DNA使用大肠杆菌DNA聚合酶I在0℃进行15分钟切口平移。通过添加来自于QIAGENTM MinElute Kit的ERC缓冲液停止反应。使用QIAGENTM MinElute Reaction Cleanup Kit清理反应。
通过S1核酸酶在37℃消化15分钟释放配对标签克隆。使用QIAGENTM MinElute Reaction Cleanup Kit清理反应。
上述步骤的DNA通过Epicentre EndIt kit进行末端修复。所产生的配对标签克隆通过结合到链霉抗生物素蛋白珠子进行纯化。
连接P1和P2引物衔接头到配对标签克隆。
用P1引物和P2引物进行试验性PCR扩增以确定正确的循环数。随后,进行大规模PCR来扩增配对标签克隆文库。最终的配对标签克隆文库使用琼脂糖凝胶电泳选择。
PCR产物在琼脂糖凝胶上分析,如图10所示。泳道1含有25bpDNA梯。泳道2-9含有来自于2倍连续稀释模板的PCR产物。
实施例4
本实施例举例说明制备配对标签克隆的另一个方法。
在本实施例中,平端化的目标多核苷酸可以用碱性磷酸酶处理以从末端去除5’磷酸残基。然后,多核苷酸通过与衔接头连接而环化,如图1所示。衔接头可用生物素标记以促进下游纯化。环状核酸分子具有第一切口,其位于多核苷酸双链体一条链上的目标多核苷酸和衔接头之间,以及第二切口,其位于多核苷酸双链体不同链上的目标多核苷酸和衔接头之间。如图2示意图示的,进行切口平移反应,切口平移反应可以使用,例如,大肠杆菌DNA聚合酶I在大约0℃进行,例如,大约5分钟。切口平移反应通过加热终止。切口平移的多核苷酸用,例如,S1核酸酶在,例如,37℃消化大约15分钟。S1消化的DNA通过结合到链霉抗生物素蛋白磁珠进行纯化。引物衔接头P1和P2附着到配对标签克隆的末端,所述配对标签克隆通过衔接头结合到磁珠上。配对标签用P1和P2引物进行克隆扩增。所扩增的配对标签克隆可以随后进行测序。
实施例5
本实施例举例说明制备配对标签克隆的另一个方法。
在本实施例中,衔接头1连接到目标多核苷酸的两个末端,如图3示意图示的。衔接头1的5’末端缺少5’磷酸残基。然后,所产生的构建体通过与衔接头2连接而环化,如图3所示。衔接头2可以用生物素标记以促进下游的纯化。环状核酸分子具有第一切口,其位于多核苷酸双链体一条链上的衔接头1和衔接头2之间,以及第二切口,其位于多核苷酸双链体不同链上的衔接头1和衔接头2之间。如图4示意图示的,进行切口平移反应。切口平移反应可以使用,例如,大肠杆菌DNA聚合酶I在大约0℃进行,例如,大约5分钟。切口平移反应通过加热终止。切口平移的多核苷酸用,例如,S1核酸酶在,例如,37℃消化大约15分钟。S1消化的DNA通过结合到链霉抗生物素蛋白磁珠进行纯化。引物衔接头P1和P2附着到配对标签克隆的末端,所述配对标签克隆通过衔接头结合到磁珠上,如图6所示。配对标签用P1和P2引物进行克隆扩增。所扩增的配对标签克隆可以随后进行测序。
实施例6
本实施例举例说明制备配对标签克隆的另一个方法。
在本实施例中,衔接头1连接到目标多核苷酸的两个末端,如图3示意图示的。衔接头1的5’末端可以具有或不具有5’磷酸残基。然后,所产生的构建体通过与衔接头2退火而环化,如图7所示。衔接头2可以用生物素标记以促进下游的纯化。环状核酸分子具有第一缺口,其位于多核苷酸双链体一条链上的衔接头1和衔接头2之间,以及第二缺口,其位于多核苷酸双链体不同链上的衔接头1和衔接头2之间。如图4示意图示的,进行切口平移反应。切口平移反应可以使用,例如,大肠杆菌DNA聚合酶I在大约0℃进行,例如,大约5分钟。切口平移反应通过加热终止。切口平移的多核苷酸用,例如,S1核酸酶在,例如,37℃消化大约15分钟。S1消化的DNA通过结合到链霉抗生物素蛋白磁珠进行纯化。引物衔接头P1和P2附着到配对标签克隆的末端,所述配对标签克隆通过衔接头结合到磁珠上,如图6所示。配对标签用P1和P2引物进行克隆扩增。所扩增的配对标签克隆可以随后进行测序。
实施例7
本实施例举例说明制备配对标签文库的另一个方法。
在本实施例中,核酸序列被片段化以产生许多具有5’末端和3’末端的多核苷酸片段。多核苷酸片段经过大小选择方法以选择大约2kb至大约3kb的片段。多核苷酸片段末端被平端化,然后用碱性磷酸酶处理以从末端去除5’磷酸残基。衔接头连接到每个多核苷酸片段的末端以产生许多环状核酸分子,其中在衔接头和多核苷酸片段之间引入切口。在环状核酸分子上进行切口平移反应以产生许多环状核酸分子,每个具有至少一个存在于其相应的多核苷酸片段内的切口。所产生的环状核酸分子在切口相对的点切割以释放配对标签克隆,由此产生配对标签文库。配对标签文库的配对标签克隆可以附着到固体支持物,如微阵列。
实施例8
本实施例举例说明制备配对标签文库的另一个方法。
在本实施例中,核酸序列被剪切以产生许多目标多核苷酸,其长度大约2kb至大约3kb。目标多核苷酸的末端被平端化。将衔接头1附着到每条目标多核苷酸的末端,由此形成多个衔接头修饰的目标多核苷酸。衔接头修饰的目标多核苷酸的两个末端连接到衔接头2以产生许多环状核酸分子,其中在衔接头2和衔接头1之间引入切口。在环状核酸分子上进行切口平移反应以产生许多环状核酸分子,每个具有至少一个存在于其相应的多核苷酸片段内的切口。所产生的环状核酸分子在切口相对的点切割以释放配对标签克隆,由此产生配对标签文库。配对标签文库的配对标签克隆可以附着到固体支持物,如微阵列。
实施例9
本实施例举例说明测序配对标签文库的另一个方法。
在本实施例中,核酸序列被片段化以产生许多具有5’末端和3’末端的目标多核苷酸片段。多核苷酸片段经过大小选择方法以选择大约2kb至大约3kb的片段。多核苷酸片段末端被平端化,然后用碱性磷酸酶处理以从末端去除5’磷酸残基。衔接头连接到每个目标多核苷酸的末端以产生许多环状核酸分子,其中在衔接头和目标多核苷酸之间引入切口。在环状核酸分子上进行切口平移反应以产生许多环状核酸分子,每个具有至少一个存在于其相应的多核苷酸片段内的切口。所产生的环状核酸分子在切口相对的点切割以释放配对标签克隆,由此产生配对标签文库。配对标签文库的配对标签克隆可以附着到固体支持物,如微阵列。
为了测序配对标签文库,引物衔接头附着到配对标签克隆的末端,所述配对标签克隆附着到固体支持物上。配对标签克隆通过,例如,乳剂PCR进行克隆扩增,且随后通过,例如,SOLiDTM测序法进行测序。
实施例10
本实施例举例说明制备配对标签克隆的另一个方法。
可以将具有EcoP15I识别位点的DNA衔接头1连接到目标多核苷酸的两个末端,以形成衔接头修饰的目标多核苷酸,如图8所示。然后,衔接头修饰的目标多核苷酸可被环化(图8)。切口产生性限制酶可用于在EcoP15I位点下游的一条链上制造切口,如图9所示。可进行切口平移反应,且切口可以5’至3’的方向移位到目标多核苷酸中(图9)。
实施例11
本实施例举例说明制备带切口的环状核酸的一种方法。
在本实施例中,使用具有拓扑异构酶I结合位点的衔接头以促进环状核酸的制备。通过退火四条寡核苷酸Topo-IA-A-1、Topo-IA-B-1、Topo-IA-A-2和Topo-IA-B-2形成在相反链上具有切口的Topo结合衔接头(图10)。寡核苷酸Topo-IA-B-1和Topo-IA-A-2每个在3’末端具有Topo结合位点并缺少5’磷酸。如图10所示,Topo-IA-A-1偶联到结合部分,生物素。所产生的Topo结合衔接头在两条链的3’末端都具有Topo结合位点,在相反链上具有切口,并偶联到生物素(图10)。
将拓扑异构酶I添加到Topo结合衔接头以产生拓扑异构酶I-衔接头复合物,如图11所示。拓扑异构酶I共价结合到衔接头,在切割的链的3’磷酸和拓扑异构酶I的Tyr274残基之间形成磷酸酪氨酰键,形成拓扑异构酶I-衔接头复合物(图11)。
拓扑异构酶I-衔接头复合物与去磷酸化的目标多核苷酸组合(图12)。去磷酸化的目标多核苷酸的5’羟基基团攻击拓扑异构酶I-衔接头复合物的磷酸酪氨酰键,如图12所示。形成包含衔接头和目标多核苷酸的环状核酸分子,如图13所示。
实施例12
本实施例举例说明制备配对标签的另一个方法。
在本实施例中,通过将目标多核苷酸连接到一个或更多衔接头来环化目标多核苷酸。对所产生的带切口的环状DNA分子进行切口平移。切口平移反应可以使用大肠杆菌DNA聚合酶I进行。环状核酸分子将在目标多核苷酸中具有两个切口。如图15所描述,在环状DNA上形成单链缺口。通过使用T7外切核酸酶消化带切口的环状DNA分子而形成缺口。所产生的带缺口的环状DNA分子用S1核酸酶消化以释放配对的DNA标签。
实施例13
本实施例举例说明不使用切口平移制备配对标签的方法。
在本实施例中,通过将衔接头连接到目标多核苷酸的两个末端对目标多核苷酸进行最初的环化。所产生的环状核酸分子具有第一切口,其位于目标多核苷酸和多核苷酸双链体一条链上的衔接头之间,以及第二切口,其位于目标多核苷酸和多核苷酸双链体不同链上的衔接头之间。通过使用5’至3’外切核酸酶消化带切口的环状DNA分子形成目标多核苷酸的的单链区域。然后,用DNA聚合酶延伸所产生的分子的3’末端。然后,所产生的分子用S1核酸酶消化,以释放配对的DNA标签。
实施例14
本实施例举例说明不使用切口平移制备配对标签的方法。在本实施例中,带切口的环状DNA分子(其包含连接到至少一个衔接头的双链目标多核苷酸)通过5’至3’外切核酸酶消化。允许这一反应继续直至完成,从而以前是双链的目标多核苷酸现在全部是单链。然后,所产生的构建体的3’末端用DNA聚合酶延伸,如图20所述。然后,所产生的构建体用单链特异性外切核酸酶消化,以释放配对标签。
实施例15
本实施例举例说明用于构建配对标签文库的载体的制备。在本实施例中,选择在2kb至3kb范围的小的环状DNA作为目标多核苷酸群体的载体。载体用生物素修饰以便于随后的基于受体-配体的亲和纯化。载体通过在线性化的载体上产生不相容粘性末端的方法线性化,从而阻止载体自连接。随后,将两个双链衔接头连接到线性化的载体上,如图23所述。两个衔接头的上部链在其5’末端都不含有磷酸基团;相反,两个衔接头的下部链在其5’末端都含有磷酸基团。这种构型的结果是,仅两个衔接头的下部链被连接到线性载体,并且在线性载体和衔接头之间有切口。
实施例16
本实施例举例说明配对标签文库的制备工作流程。在本实施例中,首先修饰目标多核苷酸,以使之具有适当的末端构型,以与一组修饰的带切口的连接多核苷酸的末端匹配。然后,目标多核苷酸与带切口的连接多核苷酸一起进行温育,并进行连接反应。连接之后,环化的带切口的连接多核苷酸含有与目标多核苷酸邻近的两个切口。然后通过切口平移将切口延伸到目标多核苷酸中。连接反应之后,未连接的构建体通过消化线性多核苷酸而清除。切口的纯化和平移之后,环状群体在切口位置切开,由此释放配对标签。
实施例17
本实施例举例说明可以在释放的配对标签上进行的一组进一步的操作。实施例16的释放的配对标签通过在配对标签的两个末端之间连接内部衔接头而重新环化。随之,可以使用与在两个衔接头末端的序列杂交的引物进行PCR扩增。PCR扩增的产物可以是最终的配对标签文库。
尽管已经根据这些示例性实施方案描述了本教导,但本领域技术人员将容易地理解这些示例性实施方案可能有许多变形和修饰而不需要过度实验。所有这样的变形和修饰都在本教导的范围内。
尽管已参照多种应用、方法、试剂盒、和组合物描述了所公开的教导,但将理解,在不背离本文的教导和下面所要求保护的发明的情况下可进行各种改变和修饰。提供前述实施例是为了更好的说明所公开的教导,而无意限制本文提出的教导的范围。
在本申请中,使用单数可包括复数,除非另有特别说明,或除非,如根据本文的公开内容,本领域技术人员将理解的,单数是仅有的有功能的实施方案。因此,例如,″一个″可意味着一个以上的,且″一个实施方案″可意味着该描述适用于多个实施方案。此外,在本申请中,″和/或″表示所列内容既适用“和”的包括的含义,同时,可替代地,也适用“或”的排除的含义。因此,所列内容应当解读为包括所列项目的所有可能的组合以及仅仅包括每个项目而将其他项目排除。添加这一术语并不意味着赋予单独使用术语“和”或“或”任何特别的含义。本领域技术人员在阅读了特定的公开内容之后对这样的术语的含义是清楚的。
通过引用并入
本文中所引用的所有参考文献,包括专利、专利申请、论文、教科书等等,以及其中引用的参考文献,在其尚未被并入的程度上,在此其全文引入作为参考。在一个或更多所并入的文献和类似材料与本申请不同或矛盾的情况中,包括但不限于所定义的术语、术语用法、所描述的技术等等,以本申请为准。
等同方案
以上描述和实施例详细说明了一些本发明的具体实施方案,且描述了发明人考虑到的最佳方式。然而,应当理解,无论以上描述在文本上显得多么具体,本发明也可以以多种方式实施,且本发明应当根据所附的权利要求及其任何等同方案来解释。

Claims (91)

1.一种形成配对标签的方法,该配对标签包含第一标签序列和第二标签序列,第一标签序列和第二标签序列在一起包含目标多核苷酸的至少一部分,所述的方法包括:
连接双链目标多核苷酸的第一末端和第二末端到衔接头,由此形成环状核酸分子,其中环状核酸分子包含第一切口,其位于双链目标多核苷酸的第一末端和衔接头之间,以及第二切口,其位于双链目标多核苷酸的第二末端和衔接头之间,其中第一切口和第二切口与第二切口相比位于环状核酸分子的不同链上;以及
进行切口平移反应,其中至少一个切口被平移到目标多核苷酸中。
2.权利要求1的方法,进一步包括:
允许切口平移反应持续进行一段特定的时间;以及
终止切口平移反应。
3.权利要求1的方法,其中所述双链目标多核苷酸的第一末端和第二末端缺少5’磷酸残基。
4.权利要求1的方法,进一步包括在第一切口和第二切口的平移互相越过之前终止切口平移反应。
5.权利要求1的方法,其中第一切口和第二切口被平移10个碱基以上,进一步包括在第一切口和第二切口切割环状核酸分子的步骤。
6.权利要求5的方法,其中第一切口和第二切口被平移500个碱基以下。
7.权利要求6的方法,其中第一切口和第二切口被平移200个碱基以下。
8.权利要求7的方法,其中第一切口和第二切口被平移100个碱基以下。
9.权利要求5的方法,其中第一切口和第二切口被平移大约20碱基至大约50个碱基。
10.权利要求1的方法,其中至少一个切口被平移500个碱基以下。
11.权利要求10的方法,其中至少一个切口被平移27个碱基以上和500个碱基以下。
12.权利要求11的方法,其中至少一个切口被平移200个碱基以下。
13.权利要求1的方法,其中至少一个切口被平移28个碱基至大约50个碱基。
14.权利要求1的方法,其中环状核酸分子包含第一缺口,其位于双链目标多核苷酸的第一末端和衔接头之间。
15.权利要求14的方法,其中环状核酸分子包含第二缺口,其位于双链目标多核苷酸的第二末端和衔接头之间。
16.权利要求14的方法,其中环状核酸序列包含缺口,该缺口在切口平移反应进行时被核苷酸填充,由此产生切口。
17.权利要求1的方法,其中目标多核苷酸包含50至2500个核苷酸。
18.权利要求17的方法,其中目标多核苷酸在连接步骤前经过大小选择技术以选择包含50至2500个核苷酸的多核苷酸。
19.权利要求1的方法,其中衔接头包含结合部分。
20.权利要求1的方法,其中使用选自下述的酶进行切口平移反应:大肠杆菌DNA聚合酶I、Taq DNA聚合酶、Vent DNA聚合酶、Klenow DNA聚合酶I、phi29 DNA聚合酶及其任何组合。
21.权利要求1的方法,其中使用具有5’至3’外切核酸酶活性的DNA聚合酶进行切口平移反应。
22.权利要求1的方法,其中切口平移反应包括通过5’至3’外切核酸酶活性去除核苷酸。
23.权利要求1的方法,其中切口平移反应通过链置换发生。
24.权利要求1的方法,进一步包括在第一被平移的切口处切割环状核酸分子,由此形成线性多核苷酸,该线性多核苷酸包含被衔接头分开的第一标签序列和第二标签序列,其中第一标签序列和第二标签序列来源于目标多核苷酸。
25.权利要求24的方法,进一步包括在第二被平移的切口处切割环状核酸分子。
26.权利要求24的方法,其中环状核酸分子通过选自下述的酶切割:S1核酸酶、绿豆核酸酶、核酸酶P1、核酸酶BAL-31、及其任何组合。
27.权利要求24的方法,进一步包括扩增线性多核苷酸。
28.权利要求1的方法,其中衔接头包含结合部分,该结合部分包含生物素。
29.权利要求28的方法,进一步包括使用链霉抗生物素蛋白纯化配对标签的步骤。
30.权利要求1的方法,进一步包括在连接前用碱性磷酸酶处理目标多核苷酸,其中从目标多核苷酸的第一末端和第二末端都去除5’磷酸。
31.权利要求30的方法,其中碱性磷酸酶选自:小牛小肠碱性磷酸酶、细菌碱性磷酸酶、虾碱性磷酸酶、及其一些组合。
32.权利要求1的方法,其中环状核酸分子还包含第二衔接头,其中第二衔接头放置在第一衔接头附近。
33.权利要求32的方法,其中第一衔接头的一条链和第二衔接头的一条链缺少5’磷酸。
34.权利要求1的方法,其中每个步骤都通过权利要求1中所列的顺序进行。
35.一种形成来自于目标DNA片段的释放的配对标签的方法,该方法包括:
连接第一衔接头到目标DNA片段的第一末端,和连接第二衔接头到目标DNA片段的第二末端,由此产生衔接头修饰的片段,
通过附着第三衔接头到衔接头修饰的片段来环化衔接头修饰的片段,由此形成环状核酸分子,其中第一切口存在于第三衔接头和第一衔接头之间,且第二切口存在于第二衔接头和第三衔接头之间,其中环状核酸分子包含DNA的第一条链和第二条链,并且其中第一切口和第二切口不存在于环状核酸分子的同一条链上;
进行切口平移反应,其中环状核酸分子的每条链上的切口被平移到目标DNA片段中,以及
在被平移的切口的位置切割环状核酸分子,由此形成释放的配对标签。
36.权利要求35的方法,进一步包括:
允许切口平移反应持续进行一段特定的时间;以及
终止切口平移反应。
37.权利要求36的方法,该方法进一步包括在被平移的切口的每个位置切割多核苷酸链之前,终止切口平移反应。
38.权利要求35的方法,进一步包括附着引物衔接头到配对标签的末端。
39.权利要求38的方法,进一步包括用针对引物衔接头的引物扩增配对标签。
40.权利要求39的方法,其中扩增是克隆扩增。
41.权利要求40的方法,其中克隆扩增包括乳剂聚合酶链反应(乳剂PCR)。
42.权利要求40的方法,其中克隆扩增包括桥式聚合酶链反应(桥式PCR)。
43.权利要求35的方法,其中第三衔接头包含结合部分,并进一步包括将结合部分结合到固体支持物。
44.权利要求42的方法,其中固体支持物是阵列。
45.权利要求35的方法,进一步包括测序配对标签的一部分。
46.一种释放的配对标签文库,其包含两个或更多释放的配对标签,其中每个配对标签通过下述方法制备,该方法包括:
连接第一衔接头到目标多核苷酸的第一末端,和连接第二衔接头到目标多核苷酸的第二末端,由此产生衔接头修饰的目标多核苷酸,
通过附着第三衔接头到衔接头修饰的目标多核苷酸来环化衔接头修饰的目标多核苷酸,由此形成环状核酸分子,其中第一切口存在于第三衔接头和第一衔接头之间,且第二切口存在于第二衔接头和第三衔接头之间,其中环状核酸分子包含第一条链和第二条链,并且其中第一切口和第二切口不存在于环状核酸分子的同一条链上;
进行切口平移反应,其中环状核酸分子一条链上的切口被平移到目标多核苷酸中,以及
在被平移的切口的位置切割环状核酸分子,由此形成释放的配对标签。
47.权利要求46的释放的配对标签文库,其中目标多核苷酸从生物制备,该生物选自:质粒、病毒、原核细胞、古细菌细胞、细菌人工染色体、真核细胞、细胞系、原生动物、植物、藻类、细菌、真菌、昆虫、爬行动物、鱼、两栖动物、鸟类和哺乳动物。
48.权利要求46的释放的配对标签文库,其中目标多核苷酸经历大小选择技术。
49.权利要求48的释放的配对标签文库,其中大小选择技术用于在连接步骤前选择包含2000至3000个核苷酸的多核苷酸。
50.一种释放的配对标签,其包含:
第一标签序列,其中第一标签序列包含目标多核苷酸的第一末端,且其中第一标签序列的长度为至少27个核苷酸;
第一衔接头,其共价结合到第一标签序列;以及
第二标签序列,其共价结合到第一衔接头,其中第二标签序列包含目标多核苷酸的第二末端,且其中第二标签序列的长度为至少27个核苷酸。
51.权利要求50的释放的配对标签,其中第一衔接头进一步包含结合部分。
52.权利要求50的释放的配对标签,其中第一标签序列的长度为至少40个核苷酸。
53.权利要求52的释放的配对标签,其中第二标签序列的长度为至少40个核苷酸。
54.一种溶液,该溶液包含:
环状核酸分子,该环状核酸分子包含:
双链目标多核苷酸,其包含第一末端和第二末端;以及
至少一个衔接头,其中至少一个衔接头共价结合到双链目标多核苷酸的第一末端和第二末端,由此形成环化的核酸分子,其中环状核酸分子还包含第一切口,其位于双链目标多核苷酸的第一末端和衔接头之间,以及第二切口,其位于双链目标多核苷酸的第二末端和衔接头之间,且其中第一切口与第二切口或缺口相比位于环状核酸分子的不同链上;以及
切口平移酶。
55.权利要求54的溶液,其中切口平移酶包括DNA聚合酶I。
56.权利要求54的溶液,其中该溶液进一步包含切口切割酶,并且其中切口平移酶通过热灭活。
57.权利要求54的溶液,其中该溶液进一步包含第二环状核酸分子,第二环状核酸分子包含:
双链目标多核苷酸,其包含第一末端和第二末端;以及
至少一个衔接头,其共价结合到双链目标多核苷酸的第一末端和第二末端,由此形成第二环化的核酸分子,其中第二环状核酸分子包含第三切口,其中第三切口距离双链目标多核苷酸的第一末端和衔接头之间的部位在27个核苷酸以上,以及第四切口,其中第四切口距离双链目标多核苷酸的第二末端和衔接头之间的部位在27个核苷酸以上,且其中第三切口与第四切口相比位于环状核酸分子的不同链上。
58.权利要求57的溶液,其中第三切口距离双链目标多核苷酸的第一末端和衔接头之间的部位至少50个核苷酸。
59.权利要求58的溶液,其中第四切口距离双链目标多核苷酸的第二末端和衔接头之间的部位至少50个核苷酸。
60.权利要求59的溶液,其中该溶液还包含切口切割酶,其中切口平移酶通过热灭活。
61.一种形成配对标签的方法,该配对标签包含第一标签序列和第二标签序列,第一标签序列和第二标签序列在一起包含目标多核苷酸的至少一部分,所述的方法包括:
连接双链目标多核苷酸的第一末端到至少一个衔接头;
连接双链目标多核苷酸的第二末端到至少一个衔接头;
形成环状核酸分子,该环状核酸分子包含双链目标多核苷酸、第一切口和第二切口,所述第一切口包含环状核酸分子第一条链上的第一3’末端,所述第二切口包含环状核酸分子第二条链上的第二3’末端,其中所述第一切口和所述第二切口在环状核酸分子的不同链上;
延伸环状核酸分子第一条链的第一3’末端到双链目标多核苷酸的序列中;以及
延伸环状核酸分子第二条链的第二3’末端到双链目标多核苷酸的序列中。
62.权利要求61的方法,其中在延伸第一3’末端之前,第一切口位于双链目标多核苷酸的第一末端和至少一个衔接头之间,且第二切口位于双链目标多核苷酸的第二末端和至少一个衔接头之间。
63.权利要求62的方法,其中双链目标多核苷酸的第一和第二末端连接到同一衔接头。
64.权利要求61的方法,其中衔接头包括第一和第二衔接头,其中在形成环状核酸分子后,第一衔接头位于双链目标多核苷酸的第一末端上,并且其中第二衔接头位于双链目标多核苷酸的第二末端上。
65.权利要求64的方法,其中第一衔接头通过连接多核苷酸连接到第二衔接头。
66.权利要求65的方法,其中在环状核酸分子形成后,第一切口位于第一衔接头的末端,该第一衔接头的末端处于连接到双链目标多核苷酸的第一衔接头的末端的远端,且第二切口位于第二衔接头的末端,该第二衔接头的末端处于连接到双链目标多核苷酸的第二衔接头的末端的远端。
67.权利要求66的方法,其中在衔接头连接到双链目标多核苷酸之前,将衔接头连接到连接多核苷酸。
68.权利要求61的方法,进一步包括消化环状核酸分子第一条链的至少一部分和消化环状核酸分子第二条链的至少一部分,其中消化导致双链目标多核苷酸的至少一部分变成单链,其中消化在延伸第一和第二3’末端之前发生。
69.权利要求68的方法,其中5’至3’外切核酸酶用于消化所述的带切口的环状核酸分子。
70.权利要求68的方法,其中消化在双链目标多核苷酸全部变成单链之前停止。
71.权利要求68的方法,其中全部双链目标多核苷酸消化成单链目标多核苷酸。
72.权利要求68的方法,其中DNA聚合酶用于延伸所述的带切口的环状核酸分子。
73.权利要求61的方法,进一步包括消化环状核酸分子第一条链的至少一部分和消化环状核酸分子第二条链的至少一部分,其中消化导致至少一部分双链目标多核苷酸变成单链,其中消化在延伸第一和第二3’末端的同时发生。
74.权利要求73的方法,其中消化和延伸在同一反应管中发生。
75.权利要求61的方法,其中延伸环状核酸分子第一条链的第一3’末端到双链目标多核苷酸的序列中通过切口平移来完成。
76.权利要求75的方法,其中延伸环状核酸分子第二条链的第二3’末端到双链目标多核苷酸的序列中通过切口平移来完成。
77.权利要求76的方法,其中第一和第二切口分别扩展成第一缺口和第二缺口。
78.权利要求77的方法,其中外切核酸酶用于将第一和第二切口分别扩展成第一缺口和第二缺口。
79.权利要求78的方法,其中外切核酸酶包括T7外切核酸酶。
80.权利要求61的方法,进一步包括进行单链依赖性消化以释放配对DNA标签。
81.一种带切口的连接多核苷酸,其包含:
第一衔接头,该第一衔接头包含与第二衔接头链杂交的第一衔接头链,其中第一衔接头链在其5’末端上缺少磷酸基团;
第二衔接头,该第二衔接头包含与第四衔接头链杂交的第三衔接头链,其中第三衔接头链在其5’末端上缺少磷酸基团;以及
连接多核苷酸,该连接多核苷酸包含与第二连接链杂交的第一连接链,其中连接多核苷酸包含第一末端和第二末端,其中第一衔接头附着到连接多核苷酸的第一末端,从而第一衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中第二连接链附着到第二衔接头链,其中第二衔接头附着到连接多核苷酸的第二末端,从而第二衔接头的第三衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中连接多核苷酸的第二条链附着到第四衔接头链。
82.权利要求81的带切口的连接多核苷酸,在第二衔接头链的5’末端进一步包含磷酸基团。
83.权利要求82的带切口的连接多核苷酸,在第四衔接头链的5’末端进一步包括磷酸基团。
84.权利要求83的带切口的连接多核苷酸,其中在第二衔接头链的3’末端进一步包含磷酸基团时没有磷酸基团。
85.一种带切口的连接多核苷酸,其包含:
第一双链衔接头;
双链连接多核苷酸,其中第一双链衔接头附着到双链连接多核苷酸的第一末端;以及
第二双链衔接头,其附着到双链连接多核苷酸的第二末端,其中存在第一切口和第二切口,所述第一切口将第一衔接头的第一条链和双链载体的第一条链分开,所述第二切口将第二衔接头的第二条链和双链载体的第一条链分开,其中所述第一切口和所述第二切口在带切口的载体的不同链上。
86.一种制备配对标签的方法,所述方法包括:
提供带切口的连接多核苷酸,其包含:
第一衔接头,该第一衔接头包含与第二衔接头链杂交的第一衔接头链,其中第一衔接头链在其5’末端上缺少磷酸基团;
第二衔接头,其包含与第四衔接头链杂交的第三衔接头链,其中第三衔接头链在其5’末端上缺少磷酸基团;以及
连接多核苷酸,其包含与第二连接链杂交的第一连接链,其中连接多核苷酸包含第一末端和第二末端,其中第一衔接头附着到连接多核苷酸的第一末端,从而第一衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中第二连接链附着到第二衔接头链,其中第二衔接头附着到连接多核苷酸的第二末端,从而第二衔接头的第三衔接头链在其5’末端上缺少磷酸基团的地方存在切口,其中连接多核苷酸的第二条链附着到第四衔接头链;
连接双链目标多核苷酸的第一末端到第一衔接头,和连接双链目标多核苷酸的第二末端到第二衔接头;以及
将第一和第二切口移动到双链目标多核苷酸中。
87.权利要求86的方法,进一步包括单链依赖性消化来线性化带切口的连接多核苷酸。
88.权利要求87的方法,进一步包括连接内部衔接头到线性化的带切口的连接多核苷酸中。
89.权利要求88的方法,进一步包括扩增双链目标多核苷酸的至少一条链。
90.权利要求89的方法,其中扩增是基于PCR的扩增。
91.一种线性配对标签,所述的线性配对标签包含:
第一标签序列,其中第一标签序列包含目标多核苷酸的第一末端;
第一衔接头,其共价结合到第一标签序列;以及
第二标签序列,其共价结合到第一衔接头,其中第二标签序列包含目标多核苷酸的第二末端,且其中所述的线性配对标签缺少IIs型限制位点和缺少III型限制位点。
CN2009801083367A 2008-01-09 2009-01-08 制备用于核酸测序的配对标签文库的方法 Pending CN102016068A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US2011408P 2008-01-09 2008-01-09
US61/020114 2008-01-09
US10963808P 2008-10-30 2008-10-30
US61/109638 2008-10-30
PCT/US2009/030490 WO2009089384A1 (en) 2008-01-09 2009-01-08 Method of making a paired tag library for nucleic acid sequencing

Publications (1)

Publication Number Publication Date
CN102016068A true CN102016068A (zh) 2011-04-13

Family

ID=40510009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801083367A Pending CN102016068A (zh) 2008-01-09 2009-01-08 制备用于核酸测序的配对标签文库的方法

Country Status (5)

Country Link
US (5) US8530197B2 (zh)
EP (1) EP2235217B1 (zh)
JP (1) JP2011509095A (zh)
CN (1) CN102016068A (zh)
WO (1) WO2009089384A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103374759A (zh) * 2012-04-26 2013-10-30 中国科学院上海生命科学研究院 一种检测肺癌转移标志性snp的方法及其应用
CN103890175A (zh) * 2011-08-31 2014-06-25 学校法人久留米大学 在dna分子的环化中仅选择由单分子形成的环化dna的方法
CN104342436A (zh) * 2013-07-31 2015-02-11 国际商业机器公司 混合的多核苷酸及其形成方法
WO2016037418A1 (zh) * 2014-09-12 2016-03-17 深圳华大基因科技有限公司 一种核酸单链环状文库的构建方法和试剂
WO2016082130A1 (zh) * 2014-11-26 2016-06-02 深圳华大基因研究院 一种核酸的双接头单链环状文库的构建方法和试剂
WO2016082129A1 (zh) * 2014-11-26 2016-06-02 深圳华大基因研究院 一种核酸的双接头单链环状文库的构建方法和试剂
CN106554957A (zh) * 2015-09-30 2017-04-05 中国农业科学院深圳农业基因组研究所 测序文库及其制备和应用
CN109576346A (zh) * 2018-11-05 2019-04-05 深圳市艾斯基因科技有限公司 高通量测序文库的构建方法及其应用
CN110565174A (zh) * 2019-09-17 2019-12-13 北京博昊云天科技有限公司 一种dna文库构建方法

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060024681A1 (en) 2003-10-31 2006-02-02 Agencourt Bioscience Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
DK2463386T3 (en) 2005-06-15 2017-07-31 Complete Genomics Inc Nucleic acid analysis using random mixtures of non-overlapping fragments
US8592150B2 (en) * 2007-12-05 2013-11-26 Complete Genomics, Inc. Methods and compositions for long fragment read sequencing
JP2011509095A (ja) 2008-01-09 2011-03-24 ライフ テクノロジーズ コーポレーション 核酸配列決定のための対をなすタグのライブラリーを製造する方法
US9540637B2 (en) 2008-01-09 2017-01-10 Life Technologies Corporation Nucleic acid adaptors and uses thereof
WO2009120374A2 (en) * 2008-03-28 2009-10-01 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
BRPI0909212A2 (pt) 2008-03-28 2015-08-18 Pacific Biosciences California Composições e método para sequeciamento de ácido nucléico
EP3216874A1 (en) 2008-09-05 2017-09-13 TOMA Biosciences, Inc. Methods for stratifying and annotating cancer drug treatment options
WO2011017596A2 (en) * 2009-08-06 2011-02-10 University Of Virginia Patent Foundation Compositions and methods for identifying and detecting sites of translocation and dna fusion junctions
US20110269194A1 (en) * 2010-04-20 2011-11-03 Swift Biosciences, Inc. Materials and methods for nucleic acid fractionation by solid phase entrapment and enzyme-mediated detachment
CN102409408B (zh) * 2010-09-21 2013-08-07 深圳华大基因科技服务有限公司 一种利用微量基因组dna进行全基因组甲基化位点精确检测的方法
EP3572528A1 (en) 2010-09-24 2019-11-27 The Board of Trustees of the Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
FR2968671B1 (fr) * 2010-12-13 2015-05-01 Chaouki Miled Sequencage maspet
EP3620533B1 (en) * 2011-09-06 2023-01-18 Gen-Probe Incorporated Closed nucleic acid structures
EP2753714B1 (en) * 2011-09-06 2017-04-12 Gen-Probe Incorporated Circularized templates for sequencing
WO2013036929A1 (en) 2011-09-09 2013-03-14 The Board Of Trustees Of The Leland Stanford Junior Methods for obtaining a sequence
JP6093498B2 (ja) * 2011-12-13 2017-03-08 株式会社日立ハイテクノロジーズ 核酸増幅方法
US9404147B2 (en) 2011-12-19 2016-08-02 Gen-Probe Incorporated Closed nucleic acid structures
US20140287937A1 (en) * 2013-02-21 2014-09-25 Toma Biosciences, Inc. Methods for assessing cancer
KR102291045B1 (ko) 2013-08-05 2021-08-19 트위스트 바이오사이언스 코포레이션 드 노보 합성된 유전자 라이브러리
CN105940024B (zh) 2013-12-05 2019-03-15 生捷科技控股公司 修饰的表面
EP3077545B1 (en) 2013-12-05 2020-09-16 Centrillion Technology Holdings Corporation Methods for sequencing nucleic acids
WO2015085275A2 (en) 2013-12-05 2015-06-11 Centrillion Technology Holdings Corporation Fabrication of patterned arrays
CN105793438B (zh) * 2013-12-15 2020-02-11 中央研究院 未知序列的双股线性核酸的全长扩增方法
US11060139B2 (en) 2014-03-28 2021-07-13 Centrillion Technology Holdings Corporation Methods for sequencing nucleic acids
US20180044668A1 (en) * 2014-10-14 2018-02-15 Bgi Shenzhen Co., Limited Mate pair library construction
WO2016126882A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
CA2975855A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Compositions and methods for synthetic gene assembly
EP3286333A4 (en) * 2015-04-20 2018-11-21 APDN (B.V.I.) Inc. Hydrophobic nucleic acid salts as security markers
US9981239B2 (en) 2015-04-21 2018-05-29 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
EP3103885B1 (en) * 2015-06-09 2019-01-30 Centrillion Technology Holdings Corporation Methods for sequencing nucleic acids
US10844373B2 (en) 2015-09-18 2020-11-24 Twist Bioscience Corporation Oligonucleic acid variant libraries and synthesis thereof
CN108698012A (zh) 2015-09-22 2018-10-23 特韦斯特生物科学公司 用于核酸合成的柔性基底
CN105331683A (zh) * 2015-09-28 2016-02-17 浙江大学 多样本真菌内转录间隔区高通量测序的复合标签及其应用
CN105331684A (zh) * 2015-09-28 2016-02-17 浙江大学 用于环境真菌生物多样性高通量测序的复合标签及其应用
CN115920796A (zh) 2015-12-01 2023-04-07 特韦斯特生物科学公司 功能化表面及其制备
US10655170B2 (en) * 2016-07-06 2020-05-19 Takara Bio Usa, Inc. Coupling adaptors to a target nucleic acid
GB2568444A (en) 2016-08-22 2019-05-15 Twist Bioscience Corp De novo synthesized nucleic acid libraries
US10417457B2 (en) 2016-09-21 2019-09-17 Twist Bioscience Corporation Nucleic acid based data storage
IL266197B2 (en) 2016-10-24 2024-03-01 Geneinfosec Inc Hiding information contained within nucleic acids
CA3047128A1 (en) 2016-12-16 2018-06-21 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
CA3054303A1 (en) 2017-02-22 2018-08-30 Twist Bioscience Corporation Nucleic acid based data storage
WO2018170169A1 (en) 2017-03-15 2018-09-20 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
WO2018231872A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
WO2018229547A1 (en) * 2017-06-15 2018-12-20 Genome Research Limited Duplex sequencing using direct repeat molecules
JP2020536504A (ja) 2017-09-11 2020-12-17 ツイスト バイオサイエンス コーポレーション Gpcr結合タンパク質およびその合成
EP3692166A1 (en) * 2017-10-06 2020-08-12 H. Hoffnabb-La Roche Ag Circularization methods for single molecule sequencing sample preparation
WO2019079769A1 (en) 2017-10-20 2019-04-25 Twist Bioscience Corporation HEATED NANOWELLS FOR THE SYNTHESIS OF POLYNUCLEOTIDES
AU2019205269A1 (en) 2018-01-04 2020-07-30 Twist Bioscience Corporation DNA-based digital information storage
SG11202011467RA (en) 2018-05-18 2020-12-30 Twist Bioscience Corp Polynucleotides, reagents, and methods for nucleic acid hybridization
SG11202109283UA (en) 2019-02-26 2021-09-29 Twist Bioscience Corp Variant nucleic acid libraries for antibody optimization
CN113766930A (zh) 2019-02-26 2021-12-07 特韦斯特生物科学公司 Glp1受体的变异核酸文库
EP3987019A4 (en) 2019-06-21 2023-04-19 Twist Bioscience Corporation BARCODE-BASED NUCLEIC ACID SEQUENCE ARRANGEMENT
RU2746126C9 (ru) * 2019-07-22 2021-07-28 Общество С Ограниченной Ответственностью "Тестген" Способ приготовления библиотеки днк

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060292611A1 (en) * 2005-06-06 2006-12-28 Jan Berka Paired end sequencing
CN1950519A (zh) * 2004-02-27 2007-04-18 哈佛大学的校长及成员们 聚合酶群落荧光原位测序珠子
WO2007044245A2 (en) * 2005-10-07 2007-04-19 Callida Genomics, Inc. Self-assembled single molecule arrays and uses thereof

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4710465A (en) 1984-04-19 1987-12-01 Yale University Junction-fragment DNA probes and probe clusters
US5283173A (en) 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
US5229273A (en) 1990-05-30 1993-07-20 The Trustees Of Columbia University In The City Of New York Purified bacterial protein which stimulates ligation of nucleic acid molecules
WO1993015191A1 (en) 1992-01-24 1993-08-05 Life Technologies, Inc. Modulation of enzyme activities in the in vivo cloning of dna
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5695937A (en) 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5866330A (en) 1995-09-12 1999-02-02 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
SE9504099D0 (sv) 1995-11-16 1995-11-16 Pharmacia Biotech Ab A method of sequencing
US5658736A (en) 1996-01-16 1997-08-19 Genetics Institute, Inc. Oligonucleotide population preparation
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
US5981190A (en) 1997-01-08 1999-11-09 Ontogeny, Inc. Analysis of gene expression, methods and reagents therefor
US5968784A (en) 1997-01-15 1999-10-19 Chugai Pharmaceutical Co., Ltd. Method for analyzing quantitative expression of genes
US6197557B1 (en) * 1997-03-05 2001-03-06 The Regents Of The University Of Michigan Compositions and methods for analysis of nucleic acids
ATE545710T1 (de) 1997-04-01 2012-03-15 Illumina Cambridge Ltd Verfahren zur vervielfältigung von nukleinsäuren
US6114600A (en) 1997-10-31 2000-09-05 The United States Of America As Represented By The Secretary Of Agriculture Resolution of complex integration patterns to obtain single copy transgenes
JP4206154B2 (ja) 1997-11-13 2009-01-07 大日本住友製薬株式会社 変異型loxP配列とその応用
US6054276A (en) * 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
US6136537A (en) 1998-02-23 2000-10-24 Macevicz; Stephen C. Gene expression analysis
US6284497B1 (en) * 1998-04-09 2001-09-04 Trustees Of Boston University Nucleic acid arrays and methods of synthesis
WO2000058522A1 (en) 1999-03-30 2000-10-05 Nanogen, Inc. Single nucleotide polymorphic discrimination by electronic dot blot assay on semiconductor microchips
US7205104B2 (en) 2000-03-24 2007-04-17 Eppendorf Array Technologies Sa (Eat) Identification of biological (micro) organisms by detection of their homologous nucleotide sequences on arrays
AU2001251582A1 (en) 2000-04-14 2001-10-30 Lynx Therapeutics, Inc. Method and compositions for ordering restriction fragments
US6551828B1 (en) 2000-06-28 2003-04-22 Protemation, Inc. Compositions and methods for generating expression vectors through site-specific recombination
AU2001280875A1 (en) 2000-07-28 2002-02-13 The Johns Hopkins University Serial analysis of transcript expression using long tags
US7485443B2 (en) 2001-07-17 2009-02-03 Northwestern University Solid-phase reactions
US6872529B2 (en) 2001-07-25 2005-03-29 Affymetrix, Inc. Complexity management of genomic DNA
US20040002090A1 (en) 2002-03-05 2004-01-01 Pascal Mayer Methods for detecting genome-wide sequence variations associated with a phenotype
CA2478722A1 (en) 2002-03-05 2003-09-12 Solexa Limited Methods for detecting genome-wide sequence variations associated with a phenotype
AUPS298102A0 (en) 2002-06-13 2002-07-04 Nucleics Pty Ltd Method for performing chemical reactions
US7074561B2 (en) 2002-10-22 2006-07-11 Biomerieux, Inc. Isothermal amplification based assay for the detection and quantitation of alpha-fetoprotein mRNA
JP2006525817A (ja) 2003-05-09 2006-11-16 ヘルス リサーチ インコーポレイテッド タンパク質の相互作用の決定のための改良法
US20060024681A1 (en) * 2003-10-31 2006-02-02 Agencourt Bioscience Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
US20090233291A1 (en) 2005-06-06 2009-09-17 454 Life Sciences Corporation Paired end sequencing
US20090156431A1 (en) 2007-12-12 2009-06-18 Si Lok Methods for Nucleic Acid Mapping and Identification of Fine Structural Variations in Nucleic Acids
EP1987159B2 (en) 2006-02-08 2020-08-12 Illumina Cambridge Limited Method for sequencing a polynucleotide template
SG170028A1 (en) * 2006-02-24 2011-04-29 Callida Genomics Inc High throughput genome sequencing on dna arrays
US8071296B2 (en) 2006-03-13 2011-12-06 Agency For Science, Technology And Research Nucleic acid interaction analysis
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
US20090111706A1 (en) 2006-11-09 2009-04-30 Complete Genomics, Inc. Selection of dna adaptor orientation by amplification
EP2102365A4 (en) 2006-12-29 2010-06-09 Applied Biosystems Llc ENRICHMENT THROUGH HETERODUPLEX MOLECULES
EP2191011B1 (en) 2007-08-29 2017-03-29 Illumina Cambridge Limited Method for sequencing a polynucleotide template
JP2011509095A (ja) 2008-01-09 2011-03-24 ライフ テクノロジーズ コーポレーション 核酸配列決定のための対をなすタグのライブラリーを製造する方法
US9074244B2 (en) 2008-03-11 2015-07-07 Affymetrix, Inc. Array-based translocation and rearrangement assays
WO2010003153A2 (en) 2008-07-03 2010-01-07 Life Technologies Corporation Methylation analysis of mate pairs
EP2310524A4 (en) 2008-07-10 2013-07-24 Versitech Ltd METHODS OF CARTOGRAPHY OF NUCLEIC ACIDS AND IDENTIFICATION OF FINE STRUCTURAL VARIATIONS IN NUCLEIC ACIDS
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1950519A (zh) * 2004-02-27 2007-04-18 哈佛大学的校长及成员们 聚合酶群落荧光原位测序珠子
US20060292611A1 (en) * 2005-06-06 2006-12-28 Jan Berka Paired end sequencing
WO2007044245A2 (en) * 2005-10-07 2007-04-19 Callida Genomics, Inc. Self-assembled single molecule arrays and uses thereof

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103890175A (zh) * 2011-08-31 2014-06-25 学校法人久留米大学 在dna分子的环化中仅选择由单分子形成的环化dna的方法
CN103890175B (zh) * 2011-08-31 2015-12-09 学校法人久留米大学 在dna分子的环化中仅选择由单分子形成的环化dna的方法
CN103374759A (zh) * 2012-04-26 2013-10-30 中国科学院上海生命科学研究院 一种检测肺癌转移标志性snp的方法及其应用
CN103374759B (zh) * 2012-04-26 2015-09-30 中国科学院上海生命科学研究院 一种检测肺癌转移标志性snp的方法及其应用
CN104342436A (zh) * 2013-07-31 2015-02-11 国际商业机器公司 混合的多核苷酸及其形成方法
WO2016037418A1 (zh) * 2014-09-12 2016-03-17 深圳华大基因科技有限公司 一种核酸单链环状文库的构建方法和试剂
CN108138364B (zh) * 2014-09-12 2021-07-02 深圳华大智造科技股份有限公司 一种核酸单链环状文库的构建方法和试剂
US10351848B2 (en) 2014-09-12 2019-07-16 Mgi Tech Co., Ltd. Method for constructing nucleic acid single-stranded cyclic library and reagents thereof
CN108138364A (zh) * 2014-09-12 2018-06-08 深圳华大智造科技有限公司 一种核酸单链环状文库的构建方法和试剂
CN107002292A (zh) * 2014-11-26 2017-08-01 深圳华大基因研究院 一种核酸的双接头单链环状文库的构建方法和试剂
CN107002291A (zh) * 2014-11-26 2017-08-01 深圳华大基因研究院 一种核酸的双接头单链环状文库的构建方法和试剂
CN107002291B (zh) * 2014-11-26 2019-03-26 深圳华大智造科技有限公司 一种核酸的双接头单链环状文库的构建方法和试剂
WO2016082129A1 (zh) * 2014-11-26 2016-06-02 深圳华大基因研究院 一种核酸的双接头单链环状文库的构建方法和试剂
US10479991B2 (en) 2014-11-26 2019-11-19 Mgi Tech Co., Ltd Method and reagent for constructing nucleic acid double-linker single-strand cyclical library
WO2016082130A1 (zh) * 2014-11-26 2016-06-02 深圳华大基因研究院 一种核酸的双接头单链环状文库的构建方法和试剂
CN106554957A (zh) * 2015-09-30 2017-04-05 中国农业科学院深圳农业基因组研究所 测序文库及其制备和应用
CN106554957B (zh) * 2015-09-30 2020-04-21 中国农业科学院深圳农业基因组研究所 测序文库及其制备和应用
US11702690B2 (en) 2015-09-30 2023-07-18 Agricultural Genomics Institute At Shenzhen China Academy Of Agricultural Sciences Sequencing library, and preparation and use thereof
CN109576346A (zh) * 2018-11-05 2019-04-05 深圳市艾斯基因科技有限公司 高通量测序文库的构建方法及其应用
CN109576346B (zh) * 2018-11-05 2022-06-10 深圳市艾斯基因科技有限公司 高通量测序文库的构建方法及其应用
CN110565174A (zh) * 2019-09-17 2019-12-13 北京博昊云天科技有限公司 一种dna文库构建方法

Also Published As

Publication number Publication date
US20150315639A1 (en) 2015-11-05
US20170226580A1 (en) 2017-08-10
EP2235217B1 (en) 2016-04-20
US20090181861A1 (en) 2009-07-16
US20190226022A1 (en) 2019-07-25
JP2011509095A (ja) 2011-03-24
US9657291B2 (en) 2017-05-23
WO2009089384A1 (en) 2009-07-16
EP2235217A1 (en) 2010-10-06
US8530197B2 (en) 2013-09-10
US10190164B2 (en) 2019-01-29
US20130252851A1 (en) 2013-09-26

Similar Documents

Publication Publication Date Title
CN102016068A (zh) 制备用于核酸测序的配对标签文库的方法
EP3814494B1 (en) High throughput assembly of nucleic acid molecules
US9328378B2 (en) Method of library preparation avoiding the formation of adaptor dimers
CN104619894B (zh) 用于非期望核酸序列的阴性选择的组合物和方法
US20070172839A1 (en) Asymmetrical adapters and methods of use thereof
EP3564394A1 (en) Method of preparing libraries of template polynucleotides
EP3386550A1 (en) Methods and compositions for the making and using of guide nucleic acids
US20210198732A1 (en) Method
EP3635114A1 (en) Creation and use of guide nucleic acids
JP2019503712A (ja) 核酸アセンブリのための方法および組成物
CN113366115A (zh) 高覆盖率stlfr
WO2020212391A1 (en) Multiplex assembly of nucleic acid molecules
CA3220708A1 (en) Oligo-modified nucleotide analogues for nucleic acid preparation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110413