CN106062209B - 合成性长阅读dna测序 - Google Patents

合成性长阅读dna测序 Download PDF

Info

Publication number
CN106062209B
CN106062209B CN201480068025.3A CN201480068025A CN106062209B CN 106062209 B CN106062209 B CN 106062209B CN 201480068025 A CN201480068025 A CN 201480068025A CN 106062209 B CN106062209 B CN 106062209B
Authority
CN
China
Prior art keywords
nucleotides
dna
barcode
primers
primer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201480068025.3A
Other languages
English (en)
Other versions
CN106062209A (zh
Inventor
J.S.爱德华兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Mexico Rainforest Innovation Co, University of
Original Assignee
STC UNM
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STC UNM filed Critical STC UNM
Publication of CN106062209A publication Critical patent/CN106062209A/zh
Application granted granted Critical
Publication of CN106062209B publication Critical patent/CN106062209B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Abstract

本公开内容描述用于通过组装多个较短的多核苷酸阅读测序长DNA序列部分的方法。一般而言,所述方法包括退火多个引物与变性的DNA分子,在引物的5’末端附加条码多核苷酸,使DNA分子经受多个循环的(1)合并、(2)分开和(3)向引物的5’末端附加条码多核苷酸,测序条码多核苷酸和基因组DNA,以及组装具有同一的条码多核苷酸的短阅读多核苷酸序列。

Description

合成性长阅读DNA测序
与相关申请的交叉引用
本申请要求于2013年10月9日提交的美国临时专利申请序列号61/888,780的优先权,所述临时专利申请通过引用结合到本文中。
发明概述
在一个方面,本公开内容描述一种方法,其包括变性多个DNA分子;将多个引物附着到变性的DNA分子上,使得DNA分子具有多个引物附着位点;将DNA分子分入多个小室中;向至少一部分引物的一个末端添加多核苷酸条码;合并来自至少多个小室的样品;将合并的样品重新分配入第二多个小室中;重复向至少一部分引物的该末端添加多核苷酸条码并合并样品;测序基因组DNA和多核苷酸条码;和将具有同一的条码的多个短阅读组装为单个长阅读合成性多核苷酸序列。
在一些实施方案中,所述多核苷酸条码包含至少五个核苷酸。
在一些实施方案中,所述方法可包括2-8个重复循环。
在一些实施方案中,所述方法可进一步包括在将DNA分子分入多个小室之前用聚合酶延伸附着到DNA分子的引物。
在一些实施方案中,所述多核苷酸条码添加到至少一部分引物的5’末端。
在另一个方面,本公开内容描述一种多核苷酸,其包含含有随机核苷酸序列的3’区域、在3’区域5’的与扩增引物互补的扩增序列和在扩增序列5’的5’区域。在一些实施方案中,所述3’区域包含5-25个核苷酸。在一些实施方案中,所述扩增序列可包含6-50个核苷酸。在一些实施方案中,所述5’区域可包含1-10个核苷酸。
附图简述
图1. 说明本文所述DNA测序方法的一个实施方案的示意图。
图2. 说明用于本文所述DNA测序方法的引物的设计的示意图。
图3. 说明根据本文所述测序方法产生短阅读的示意图。
图4. 说明根据本文所述测序方法扩增和组装短阅读序列的图表。
图5. 说明组装短阅读序列以产生合成性长阅读DNA序列的示意图。
图6. 示例性引物(SEQ ID NO:6)及其互补链(SEQ ID NO:7),其具有在引物的5’末端外建立的三个示例性条码。3’随机序列(NNNNNNNNNN;SEQ ID NO:6的残基63-72)与基因组的一部分结合;共有序列(斜体);条码1 (点下划线);条码2 (粗体);条码3 (虚线下划 线)。
图7. 如实施例1中所描述的使用Ion Torrent PGM (Life Technologies Corp.,Carlsbad, CA)和图6中所示引物测序的大肠杆菌基因组文库分子。大肠杆菌基因组序列(黑色);共有序列(斜体);条码1 (点下划线);条码2 (粗体);条码3 (虚线下划线)。
说明性实施方案的详述
本公开内容描述用于产生长阅读DNA序列的方法。当前,超高通量测序技术通常产生小于250碱基的短阅读。至多250碱基的阅读通常太短而不能解答许多生物学问题。例如,这些阅读长度太短而不能定相同源染色体上的变体,有效发现基因组中的结构变异和重排,或进行重新测序。本文所述方法允许“合成性”长阅读。即,我们能将短阅读拼合在一起以产生长阅读。
因此,本文所述方法提供允许短阅读DNA测序用于完全重新基因组测序的技术。当前使用短阅读下一代测序技术将哺乳动物大小的基因组组装至与人基因组参考序列一致的质量是不可能的。本文所述方法一般涉及将短阅读搭建(scaffolding)为合成性长阅读。所述可产生的合成性长阅读可为任何长度的DNA序列。在某些实施方案中,所述方法可产生具有至少500个碱基对(bp)的长度的DNA序列的合成性长阅读,例如,至少700 bp、至少1千碱基(kb)、至少10 kb、至少50 kb、至少100 kb、至少500 kb、至多并且包括整个染色体的长度。如果合成的阅读比整个染色体短,可将亚染色体合成性阅读组装成完整的染色体。在具体的实施方案中,所述方法可用于产生具有至少100 kb的长度的DNA序列的合成性长阅读。
所述方法的一般性描述在图1中说明。将分离的DNA变性并退火随机引发基因组的引物。一般性的引物设计在图2中说明。每个引物包含3’末端处允许随机引发基因组的随机序列区域、用于扩增引物的共有序列和允许在引物的5’末端外建立条码的5’序列。
尽管引物以其中引物的3’末端与基因组序列退火并且条码从引物的5’末端建立的定向在图2中说明和在下文中详细描述,但引物可替代地具有相反的定向—即,引物的5’末端可与基因组序列退火并且条码可从引物的3’末端建立。
在图2说明的实施方案中,引物的3’末端长度为10个核苷酸。然而,设计用以与基因组退火的引物3’末端可为任何期需长度。因此,引物的3’末端可具有至少4个核苷酸的最小长度,例如,至少5个核苷酸,例如,至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少15个核苷酸或至少20个核苷酸。引物的3’末端可具有可准确和精密合成的任何数目核苷酸的最大长度。在一些实施方案中,3’末端可具有不超过100个核苷酸的最大长度,例如,不超过50个核苷酸、不超过25个核苷酸、不超过12个核苷酸、不超过11个核苷酸、不超过10个核苷酸、不超过9个核苷酸、不超过8个核苷酸、不超过7个核苷酸或不超过6个核苷酸。引物的3’末端可具有通过具有任何上文列出的最小长度和大于该最小长度的任何最大长度作为端点的范围界定的长度。在多个实施方案中,引物的3’末端可具有6-10个核苷酸的长度。在其它实施方案中,引物的3’末端可具有6-9个核苷酸的长度。在具体的实施方案中,引物的3’末端可具有6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸或10个核苷酸的长度。引物的这一3’末端的序列为随机的,以致所述方法可覆盖所测序DNA序列的全部。
图2中说明的实施方案显示具有8个核苷酸的长度的共有序列。然而,共有序列可为任何合适的长度。因此,共有序列可具有至少6个核苷酸的最小长度,例如,至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸或至少20个核苷酸。共有序列可具有不超过100个核苷酸的最大长度,例如,不超过50个核苷酸、不超过30个核苷酸、不超过25个核苷酸、不超过24个核苷酸、不超过23个核苷酸、不超过22个核苷酸、不超过21个核苷酸、不超过20个核苷酸、不超过19个核苷酸、不超过18个核苷酸、不超过17个核苷酸、不超过16个核苷酸、不超过15个核苷酸、不超过14个核苷酸、不超过13个核苷酸、不超过12个核苷酸、不超过11个核苷酸、不超过10个核苷酸或不超过9个核苷酸。共有序列可具有通过具有任何上文列出的最小长度和大于该最小长度的任何最大长度作为端点的范围界定的长度。在一些实施方案中,共有序列可具有8-22个核苷酸的长度,例如,8-15个核苷酸。在具体的实施方案中,共有序列可具有8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸、20个核苷酸、21个核苷酸或22个核苷酸的长度。共有序列设计为与为扩增与DNA退火的引物而选择的扩增引物互补。扩增引物应设计为对于扩增具有适当的熔解温度(Tm),并且不与人基因组内的区域互补。
引物的5’末端具有允许在后续步骤中在引物的5’末端上建立条码的序列。引物的5’末端可包含允许建立条码的任何核苷酸序列。在图2和图6说明的实施方案中,引物的5’末端具有5个核苷酸的长度,一旦扩增引物与共有序列退火其形成突出端。然而,在其它实施方案中,引物的5’末端可为任何合适的长度。因此,引物的5’末端可具有至少1个核苷酸、至少2个核苷酸、至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸或至少8个核苷酸的最小长度。引物的5’末端可具有不超过100个核苷酸的最大长度,例如,不超过50个核苷酸、不超过25个核苷酸、不超过15个核苷酸、不超过14个核苷酸、不超过13个核苷酸、不超过12个核苷酸、不超过11个核苷酸、不超过10个核苷酸、不超过9个核苷酸、不超过8个核苷酸、不超过7个核苷酸、不超过6个核苷酸、不超过5个核苷酸、不超过4个核苷酸、不超过3个核苷酸或不超过2个核苷酸。引物的5’末端可具有通过具有任何上文列出的最小长度和大于该最小长度的任何最大长度作为端点的范围界定的长度。在一些实施方案中,引物的5’末端可具有1-8个核苷酸的长度,例如,1-5个核苷酸、4-8个核苷酸或5-7个核苷酸。在具体的实施方案中,引物的5’末端可具有1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸或8个核苷酸的长度。在一个实施方案中,例如,5’末端可具有序列–TTTTTTT-5’ (SEQ ID NO:1)。然而,在另一个实施方案中,引物的5’部分基本上为随机序列–CGTGCAT-5’ (SEQ ID NO:2)。
因此,在多个实施方案中,引物可为,例如,下列任一:
5-A*A*AAAAAVVVVVV*V*V-3 (SEQ ID NO:3),
5-G*C*ACGTACTCTCAATCCNNNNNNNN*N*N-3 (SEQ ID NO:4), 或
5- G*C*ACGTACTCTCAATCCNNNNNN*N*N-3 (SEQ ID NO:5),
其中*指示硫代磷酸酯键,V为除T外的任何碱基,并且N为任何碱基。
接着,延伸引物来制备DNA双链,以减少个体DNA分子粘在一起的程度。所述方法利用个体DNA分子所显示的性质。引物可使用不具有链置换或5’→3’外切核酸酶活性的聚合酶延伸,例如Phusion (New England Biolabs Inc., Ipswich, MA)、T4或T7聚合酶。当使用这样的聚合酶时,下游引物从DNA移走(dislodge)的程度降至最低。然而,如果使用具有硫代磷酸酯键以限制引物的外切核酸酶消化,可使用具有外切核酸酶活性的聚合酶,例如,Bst DNA聚合酶。如果使用具有校对活性(3’→5’外切核酸酶活性)的聚合酶,可在引物的3’末端上添加硫代磷酸酯键。
或者,可使用切口酶将长模板DNA分子切口,例如,Nt.BstNBI、Nt.AlwI、Nb.BsrDI、Nt.CviPII或任何其它仅在单链上切割DNA的切口外切核酸酶。切割的链具有游离的3’-OH和5’-磷酸并且顺应酶操作。切口的DNA可直接连接至包含用于条码构建的部分的引物。然而,连接之前,必须采取措施以防止切口被连接酶修复。可用磷酸酶处理DNA以去除5’磷酸基团和/或使用外切核酸酶创建小缺口。然后可将包含所需5’延伸的引物连接至切口位点。仍可进行聚合酶延伸以确保整个分子为双链的。
或者,可在DNA内随机引入dU。这可在长DNA分离前进行,或通过使用切口酶以引入切口,如上所述。然后可使用聚合酶以用常规方法向链中引入标记碱基或dU。然后可通过用酶混合剂例如USER (New England Biolabs, Inc., Ipswich, MA)或Uracil DNA转葡糖基酶(UDG)与DNA转葡糖基酶-裂解酶外切核酸酶VIII的组合处理DNA创建切口。这些切口位点然后可用于连接5’标记的引物用以建立条码。
在成功制备dsDNA并连接具有可用于条码连接的5’延伸的引物之后,可将条码连接至延伸的引物(图2)。存在多种用于在5’延伸上建立条码的方法。一种用于建立条码的方法为使用连接酶将标有条码的引物连接至5’延伸。或者,可简单地将引物与5’延伸杂交,而不进行连接。只要双链区域足够长,杂交应足以将DNA条码维持在一起。作为另一种备选的方法,可通过与5’延伸上的基团反应化学合成条码。
为了建立整个条码,可使用任何上述化学或分子生物学方法。用于增长条码的总体方案在图4中说明。首先,可将DNA分子分配入96孔板的孔中。可使用紧接的前一段中所描述的任一方法或可用于增长DNA链的任何其它方法向引物的5’末端连接短条码序列。然后可将来自96个孔的所有DNA合并到一起。接着,将样品中的DNA随机分入另一组96孔中并在引物的5’末端上连接另一个条码序列以致引物会在5’末端具有两个条码序列。可按照需要重复合并和分开循环多次。根据应用,可进行更多或更少个循环。随着重复循环的数目增加,产生独特条码的程度也增加。不同条码的数目将依照式96N增加,其中N为添加条码的循环数目。因此,例如,四个循环产生964 = 84,934,656种不同条码。结果将为每一长分离DNA分子会具有大量的引物。此外,个体DNA分子上的每个引物会具有相同的条码。然而,不同的长DNA分子会得到不同的条码。
在一些实施方案中,所述方法包括最少至少2个重复循环以增长条码,例如,至少3个重复循环、至少4个重复循环、至少5个重复循环、至少6个重复循环、至少7个重复循环或至少8个重复循环。在一些实施方案中,所述方法包括最多不超过12个重复循环以增长条码,例如,不超过11个重复循环、不超过10个重复循环、不超过9个重复循环、不超过8个重复循环、不超过7个重复循环、不超过6个重复循环或不超过5个重复循环。在一些情况下,重复循环的数目可表述为具有任何上文所列最小重复循环数目和大于最小重复循环数目的任何最大重复循环数目作为端点的范围。在一些实施方案中,所述方法可包括,例如,4-8个重复循环以增长条码。
接着,可从所有长DNA分子构建DNA测序文库并确保所有文库分子在5’末端上包含条码(图3和图7)。
所述文库可如图5中所说明来测序。测序过程可涉及测序与引物邻近的基因组片段以及与引物连接的条码。具有相同条码的所有阅读可鉴定为来自同一大DNA分子。因此,可将具有相同条码的这些阅读组装为合成性长片段。在某些实施方案中,可将多个短阅读来自同一大DNA分子这一知识用于下游生物信息学分析中。在其它实施方案中,可将短阅读组装为合成性长阅读,所述长阅读可包括,例如,整个染色体。即使合成性长阅读不能完全组装,会知道短阅读的相对位置以致可使用生物信息学工具将所有的阅读群搭建在一起。
上述说明不意在描述本文所述方法的每个可以想到的实施方案或每一实现。前述说明呈现示例性的说明性实施方案。
在前述说明中,为清楚起见具体的实施方案可独立描述。除非另外清楚说明一个具体实施方案的特征与另一个实施方案的特征不相容,某些实施方案可包含本文所述与一个或多个实施方案有关的相容特征的组合。
对于本文所公开的包含不连续步骤的任何方法,所述步骤可以以任何可行的次序进行。并且,合适时,可同时进行两个或更多个步骤的组合。
本发明通过下列实施例说明。应理解的是具体的实施例、材料、量和程序按照本文所阐述的本发明的范围和精神广义地解释。
实施例
对于所有的实施例,来自组织或血液的50 kb-100 kb的高质量DNA片段可使用DNeasy Blood and Tissue Kit (Qiagen Inc. USA, Valencia, CA)依照制造商的说明来分离。
实施例1
DNA通过在含有包含基因组结合区域和将用于建立条码的已知序列的引物(Integrated DNA Technologies, Inc., Coralville, IA)的6X SSC中加热至95℃持续5分钟变性。立即将管放置在冰上以迅速冷却样品。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics, Indianapolis, IN)依照制造商的说明纯化样品。
DNA然后使用Phusion DNA Polymerase (New England Biolabs Inc., Ipswich,MA)延伸。为此,将DNA放置在具有dNTPs (Thermo Fisher Scientific Inc., Waltham,MA)的1X Phusion GC Buffer中,然后将温度以10℃的间隔从22℃缓慢增加至72℃,每一温度孵育5分钟。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics,Indianapolis, IN)依照制造商的说明纯化样品。
纯化的延伸DNA然后稀释入96孔板中。将第一个条码接头连接至已知的DNA序列。这通过在具有High Concentration T4 DNA连接酶(New England Biolabs Inc.,Ipswich, MA)的1X T4 DNA连接酶缓冲液中25℃孵育双链条码和延伸的DNA 10分钟进行。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics, Indianapolis, IN)依照制造商的说明纯化样品。然后将96个样品合并入单个管中并随后重新分配入96孔板中以添加第二个条码。然后重复该过程以建立条码。最终合并的样品将随后用于制作用于测序的DNA文库。
使用Ion Torrent PGM (Life Technologies Corp., Carlsbad, CA)的测序结果在图7中示出。
实施例2
DNA通过在包含Nt.CviPII (New England Biolabs Inc., Ipswich, MA)的1XCutSmart Buffer中37℃孵育DNA 60分钟而切口。通过将样品加热至65℃持续15分钟灭活酶。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics, Indianapolis, IN)依照制造商的说明纯化样品。
DNA然后用Antarctic Phosphatase (New England Biolabs Inc., Ipswich,MA)通过在1X Antarctic Phosphatase Reaction Buffer中37℃孵育DNA 60分钟处理。通过将样品加热至70℃持续5分钟灭活酶。然后使用High Pure PCR产物纯化试剂盒(RocheDiagnostics, Indianapolis, IN)依照制造商的说明纯化样品。
然后将纯化的样品稀释入96孔板中。将第一个条码接头连接至已知的DNA序列。这通过在具有High Concentration T4 DNA连接酶(New England Biolabs Inc., Ipswich,MA)的1X T4 DNA连接酶缓冲液中25℃孵育双链条码和延伸的DNA 10分钟而进行。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics, Indianapolis, IN)依照制造商的说明来纯化样品。然后将96个样品合并入单个管中并随后重新分配入96孔板中以添加第二个条码。然后重复该过程以建立条码。最终合并的样品将随后用于制作用于测序的DNA文库。
实施例3
DNA将通过在包含Nt.CviPII (New England Biolabs Inc., Ipswich, MA)的1XCutSmart Buffer中37℃孵育DNA 60分钟来切口。通过将样品加热至65℃持续15分钟灭活酶。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics, Indianapolis, IN)依照制造商的说明纯化样品。
DNA然后用Exonuclease III (New England Biolabs Inc., Ipswich, MA)通过在1X NEB Buffer 1中37℃孵育DNA 30分钟处理。通过将样品加热至70℃持续30分钟灭活酶。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics, Indianapolis, IN)依照制造商的说明纯化样品。
纯化的样品然后稀释入96孔板中。将第一个条码接头连接至已知的DNA序列。这通过在具有High Concentration T4 DNA连接酶(New England Biolabs Inc., Ipswich,MA)的1X T4 DNA连接酶缓冲液中25℃孵育双链条码和延伸的DNA 10分钟来进行。然后使用High Pure PCR产物纯化试剂盒(Roche Diagnostics, Indianapolis, IN)依照制造商的说明纯化样品。然后将96个样品合并入单个管中并随后重新分配入96孔板中以添加第二个条码。然后重复该过程以建立条码。最终合并的样品将随后用于制作用于测序的DNA文库。
如本文所使用的,术语“和/或”意指一个或所有列出的元素或任意两个或更多个所列出元素的组合;术语“包含”及其变体在说明书和权利要求中出现这些术语的地方不具有限制含义;除非另外指明,“一个”、“一种”、“所述”和“至少一个”可交换地使用并且指一个或一个以上;通过端点对数值域的叙述包括该范围内包含的所有数值(例如,1-5包括1、1.5、2、2.75、3、3.80、4、5,等)。
本文所引用的所有专利、专利申请和出版的完整公开内容,以及电子可得的材料(包括,例如,如GenBank和RefSeq中的核苷酸序列提交,如SwissProt、PIR、PRF、PDB中的氨基酸序列提交以及来自GenBank和RefSeq中注释的编码区的翻译)通过引用以其整体结合到本文中。如果本申请的公开内容与通过引用结合到本文中的任何文献的公开内容之间存在不一致,应以本申请的公开内容为准。前面的详述和实施例仅为了清楚理解而给出。不应从其理解不必要的限制。本发明不限于所显示和描述的精确细节,因为对本领域技术人员显而易见的变更将包含在通过权利要求定义的本发明内。
除非另外指出,表述在说明书和权利要求中使用的组分、分子量等的量的所有数字应理解为在所有情况下受术语“约”修饰。因此,除非另外指示相反,说明书和权利要求中列出的数字参数为可根据本发明寻求获得的期需性质而变化的近似值。至少,并不试图将等同物的教义限制于权利要求范围,每个数字参数应至少根据报道的有效数的数目并通过应用普通舍入技术解释。
尽管阐述本发明的广泛范围的数值域和参数为近似值,具体实例中列出的数值为尽可能精确地报道的。然而,所有数值固有地包含由其各自的检验测量中存在的标准差所必然产生的范围。
所有标题为了方便读者并且不应该用于限制接在标题之后的文本的含义,除非如此指明。
Figure IDA0001015971590000011
Figure IDA0001015971590000021
Figure IDA0001015971590000031
Figure IDA0001015971590000041
Figure IDA0001015971590000051

Claims (8)

1.一种方法,包括:
变性多个DNA分子;
将多个引物附着到变性的DNA分子上,使得所述DNA分子具有多个引物附着位点;
用缺乏链置换活性的聚合酶延伸附着到所述DNA分子的引物;
将所述DNA分子分入多个小室中;
向至少一部分所述引物的一个末端添加多核苷酸条码;
合并来自至少多个所述小室的样品;
将合并的样品重新分配入第二多个小室中;
重复向至少一部分所述引物的该末端添加多核苷酸条码并合并所述样品;
测序基因组DNA和所述多核苷酸条码;和
将具有同一的条码的多个短阅读组装为单个长阅读合成性多核苷酸序列。
2.权利要求1的方法,其中所述聚合酶缺乏5’-3’外切核酸酶活性。
3.权利要求1的方法,其中将所述DNA分入小室中以便提供所测序DNA分子的10X-40X覆盖。
4.权利要求1的方法,其中所述多核苷酸条码包含至少五个核苷酸。
5.权利要求1的方法,其中将所述重复步骤重复2-8个循环。
6.前述权利要求中任一项的方法,其中所述多核苷酸条码添加到至少一部分所述引物的5’末端。
7.权利要求1的方法,其中用于所述测序的引物是包含以下的多核苷酸:
含有随机核苷酸序列的3’区域;
在3’区域5’的与扩增引物互补的扩增序列;和
在扩增序列5’的5’区域,
其中所述多核苷酸是SEQ ID NO: 3-5中的任一个。
8.权利要求1的方法,其中用于所述测序的引物是包含以下的多核苷酸:
含有随机核苷酸序列的5’区域;
在5’区域3’与扩增引物互补的扩增序列;和
在扩增序列3’的3’区域,
其中所述多核苷酸与SEQ ID NO: 3-5中的任一个互补。
CN201480068025.3A 2013-10-09 2014-09-24 合成性长阅读dna测序 Expired - Fee Related CN106062209B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361888780P 2013-10-09 2013-10-09
US61/888780 2013-10-09
PCT/US2014/057260 WO2015053943A1 (en) 2013-10-09 2014-09-24 Synthetic long read dna sequencing

Publications (2)

Publication Number Publication Date
CN106062209A CN106062209A (zh) 2016-10-26
CN106062209B true CN106062209B (zh) 2021-08-06

Family

ID=52813501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480068025.3A Expired - Fee Related CN106062209B (zh) 2013-10-09 2014-09-24 合成性长阅读dna测序

Country Status (5)

Country Link
US (3) US10266904B2 (zh)
EP (1) EP3055431B1 (zh)
CN (1) CN106062209B (zh)
CA (1) CA2926934A1 (zh)
WO (1) WO2015053943A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9388465B2 (en) 2013-02-08 2016-07-12 10X Genomics, Inc. Polynucleotide barcode generation
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3055431B1 (en) 2013-10-09 2020-06-24 Stc.Unm Synthetic long read dna sequencing
CN113249435A (zh) 2014-06-26 2021-08-13 10X基因组学有限公司 分析来自单个细胞或细胞群体的核酸的方法
AU2016207023B2 (en) 2015-01-12 2019-12-05 10X Genomics, Inc. Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
CN115651972A (zh) 2015-02-24 2023-01-31 10X 基因组学有限公司 用于靶向核酸序列覆盖的方法
WO2016137973A1 (en) 2015-02-24 2016-09-01 10X Genomics Inc Partition processing methods and systems
GB2539675B (en) * 2015-06-23 2017-11-22 Cs Genetics Ltd Libraries of multimeric barcoding reagents and kits thereof for labelling nucleic acids for sequencing
ES2870639T3 (es) 2016-10-24 2021-10-27 Geneinfosec Inc Ocultación de información presente en los ácidos nucleicos
CN117512066A (zh) 2017-01-30 2024-02-06 10X基因组学有限公司 用于基于微滴的单细胞条形编码的方法和系统
CN109526228B (zh) 2017-05-26 2022-11-25 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
US10400235B2 (en) 2017-05-26 2019-09-03 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102459592A (zh) * 2009-06-15 2012-05-16 考利达基因组股份有限公司 用于长片段阅读测序的方法和组合物
WO2013019075A2 (ko) * 2011-08-01 2013-02-07 연세대학교산학협력단 핵산분자의 제조방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8507662B2 (en) * 2001-01-19 2013-08-13 General Electric Company Methods and kits for reducing non-specific nucleic acid amplification
US8592150B2 (en) * 2007-12-05 2013-11-26 Complete Genomics, Inc. Methods and compositions for long fragment read sequencing
US20120024701A1 (en) * 2010-06-24 2012-02-02 Luc Montagnier General procedure for the identification of dna sequences generating electromagnetic signals in biological fluids and tissues
US9469874B2 (en) * 2011-10-18 2016-10-18 The Regents Of The University Of California Long-range barcode labeling-sequencing
ES2626058T3 (es) * 2011-12-22 2017-07-21 Ibis Biosciences, Inc. Cebadores y métodos de amplificación
EP3055431B1 (en) 2013-10-09 2020-06-24 Stc.Unm Synthetic long read dna sequencing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102459592A (zh) * 2009-06-15 2012-05-16 考利达基因组股份有限公司 用于长片段阅读测序的方法和组合物
WO2013019075A2 (ko) * 2011-08-01 2013-02-07 연세대학교산학협력단 핵산분자의 제조방법

Also Published As

Publication number Publication date
US20220119867A1 (en) 2022-04-21
EP3055431A1 (en) 2016-08-17
US10266904B2 (en) 2019-04-23
US20160244811A1 (en) 2016-08-25
EP3055431B1 (en) 2020-06-24
CN106062209A (zh) 2016-10-26
EP3055431A4 (en) 2017-05-10
CA2926934A1 (en) 2015-04-16
US11248271B2 (en) 2022-02-15
US20190218597A1 (en) 2019-07-18
WO2015053943A1 (en) 2015-04-16

Similar Documents

Publication Publication Date Title
CN106062209B (zh) 合成性长阅读dna测序
US20210071171A1 (en) Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US9410193B2 (en) DNA amplification and sequencing using DNA molecules generated by random fragmentation
EP1963525B2 (en) Synthesis of error-minimized nucleic acid molecules
CA2578564C (en) Method of error reduction in nucleic acid populations
WO2017059399A1 (en) Multiplex pairwise assembly of dna oligonucleotides
AU2016255570B2 (en) Compositions and methods for constructing strand specific cDNA libraries
WO2021128441A1 (en) Controlled strand-displacement for paired-end sequencing
WO2015089339A2 (en) Compositions, methods and kits for dna fragmentation and tagmentation
US20230340462A1 (en) Method for producing dna molecules having an adaptor sequence added thereto, and use thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1230669

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: The American state of New Mexico

Patentee after: University of New Mexico rainforest innovation company

Address before: The American state of New Mexico

Patentee before: STC. UNM

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210806