CN115916967A - 使用重组末端脱氧核苷酸转移酶生成具有经修饰的碱基的核酸 - Google Patents
使用重组末端脱氧核苷酸转移酶生成具有经修饰的碱基的核酸 Download PDFInfo
- Publication number
- CN115916967A CN115916967A CN202180035378.3A CN202180035378A CN115916967A CN 115916967 A CN115916967 A CN 115916967A CN 202180035378 A CN202180035378 A CN 202180035378A CN 115916967 A CN115916967 A CN 115916967A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- amino acid
- tdt
- seq
- nucleotides
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1264—DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07031—DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/35—Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/131—Terminal transferase
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文公开了使用重组末端脱氧核苷酸转移酶(TdT)生成包含具有经修饰的碱基的核苷酸的单链脱氧核糖核酸(ssDNA)支架的方法。该重组TdT可以包含与家牛TdT至少80%同一的氨基酸序列或其片段,并且例如在功能上等同于该家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
Description
相关申请的交叉引用
本申请要求2020年5月12日提交的美国临时专利申请号63/023,736的优先权权益,该美国临时专利申请的内容全文以引用方式并入本文。
序列表的参考
本申请连同电子格式的序列表一起提交。该序列表作为创建于2020年5月11日的名称为Sequences_Listing_47CX-311973-WO的文件提供,该文件大小为52千字节。序列表的电子格式的信息全文以引用方式并入本文。
背景技术
技术领域
本公开总体上涉及产生核酸,例如产生具有经修饰的碱基的核酸的领域。
背景技术
单克隆性可以提高合成测序(SBS)的效率。当个别模板多核苷酸种子和簇或来自从个别模板多核苷酸接种和成簇的多核苷酸产物处于基底表面上的空间上不同的位置时,可以发生SBS的单克隆性。
发明内容
本文公开了修饰核酸的方法的实施方案。在一些实施方案中,该方法包括:(a)提供单链脱氧核糖核酸(ssDNA)和包含经修饰的碱基的核苷三磷酸。该方法可包括:(b)使该ssDNA和包含经修饰的碱基的该核苷三磷酸与重组末端脱氧核苷酸转移酶(TdT)接触以生成ssDNA支架。该ssDNA支架可包括结合有一个或多个核苷酸的ssDNA,该一个或多个核苷酸包括来自该核苷三磷酸的经修饰的碱基。重组TdT可以包含与SEQ ID NO:1至少80%同一的氨基酸序列。重组TdT可在功能上等同于SEQ ID NO:12的家牛(Bos taurus)TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
在一些实施方案中,该方法进一步包括:(c)使ssDNA支架与第一衔接子寡核苷酸和第二衔接子寡核苷酸接触以生成核酸载体。使ssDNA支架与第一衔接子寡核苷酸接触可包括使ssDNA支架与包含第一衔接子寡核苷酸和第一聚合物的第一衔接子接触。使ssDNA支架与第二衔接子寡核苷酸接触可包括使ssDNA支架与包含第二衔接子寡核苷酸和第二聚合物的第二衔接子接触。第一衔接子可包含共价连接的第一衔接子寡核苷酸和第一聚合物。第二衔接子可包含共价连接的第二衔接子寡核苷酸和第二聚合物。ssDNA支架可包含第三聚合物。第一衔接子寡核苷酸可包含第一衔接子序列或其反向互补序列。第二衔接子寡核苷酸可包含第二衔接子序列或其反向互补序列。核酸载体可包含附接至第一衔接子寡核苷酸和第二衔接子寡核苷酸的ssDNA支架。在一些实施方案中,该方法进一步包括:(d)提供核酸模板,该核酸模板包含第一衔接子序列或其反向互补序列、第二衔接子序列或其反向互补序列、和核酸杂交序列。该方法可包括:(e)使核酸载体与核酸模板接触以生成核酸载体,该核酸载体具有经由核酸模板的核酸杂交序列与核酸载体的模板捕获位点杂交的核酸模板。该方法可包括:(f)对与核酸模板杂交的核酸载体执行扩增以生成多个经扩增的核酸,该多个经扩增的核酸均包含第一衔接子寡核苷酸和第二衔接子寡核苷酸,该第一衔接子寡核苷酸和该第二衔接子寡核苷酸经延伸以包含核酸模板的序列或其反向互补序列。扩增可以是例如桥式扩增或排除扩增。该方法可包括:(g)使用多个经扩增的核酸确定核酸模板的序列。
本文公开了修饰核酸的方法的实施方案。在一些实施方案中,该方法包括:(a)提供第一核酸和包含第一经修饰的碱基的第一核苷三磷酸。该方法可包括:(b)使第一核酸和包含第一经修饰的碱基的第一核苷三磷酸与重组末端脱氧核苷酸转移酶(TdT)在第一反应中在第一温度下接触达第一反应时间以生成第二核酸。该第二核酸可包含结合有以下的第一核酸:一个或多个包含来自第一核苷三磷酸的第一经修饰的碱基的第一核苷酸。重组TdT可以包含与SEQ ID NO:1至少80%同一的氨基酸序列。重组TdT可在功能上等同于SEQ IDNO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
在一些实施方案中,该第一核酸和该第二核酸中的一者或多者包括单链核酸、具有3'悬垂部的双链核酸、具有3'凹部的双链核酸,或它们的组合。该第一核酸和该第二核酸中的一者或多者可包括脱氧核糖核酸(DNA)。该第一核酸和该第二核酸中的一者或多者的至少50%的核苷酸可包括脱氧核糖核苷酸。该第一核酸和该第二核酸中的一者或多者可包括单链脱氧核糖核酸(ssDNA)。该第一核酸和该第二核酸中的一者或多者可包含至少一个核糖核苷酸。
在一些实施方案中,该第二核酸包含结合有包含第一经修饰的碱基的第一核苷酸中的两个或更多个或三个或更多个第一核苷酸的第一核酸。该第二核酸中包含第一经修饰的碱基的第一核苷酸中的两个或更多个或三个或更多个第一核苷酸可以是连续的。该第一核苷三磷酸的第一经修饰的碱基可包括经修饰的腺嘌呤、经修饰的鸟嘌呤、经修饰的胞嘧啶、经修饰的胸腺嘧啶或经修饰的尿嘧啶。该第一核苷三磷酸可包括5-(15-叠氮基-4,7,10,13-四氧杂-十五烷酰基-氨基烯丙基)-2'-脱氧尿苷-5'-三磷酸(叠氮化物-PEG4-氨基烯丙基-dUTP)、N6-(6-叠氮基)己基-3'-脱氧腺苷-5'-三磷酸(N6-(6-叠氮基)己基-3'-dATP),或它们的组合。在一些实施方案中,该第一核苷三磷酸包含共价连接的第一经修饰的碱基和第一辅助寡核苷酸。
在一些实施方案中,第一反应时间是至少1秒。第一温度可以是至少16℃至至少58℃。第一反应中的第一核酸的浓度可以是至少10nM。第一反应中的第一核苷三磷酸的浓度可以是至少0.1μM。第一反应中的重组TdT的浓度可以是至少10nM。
在一些实施方案中,提供第一核酸和包含第一经修饰的碱基的第一核苷三磷酸包括:提供第一核酸、包含第一经修饰的碱基的第一核苷三磷酸、和第二核苷三磷酸。使第一核酸和包含第一经修饰的碱基的第一核苷三磷酸与重组TdT接触可包括:使第一核酸、包含第一经修饰的碱基的第一核苷三磷酸、和第二核苷三磷酸在第一反应中在第一温度下与重组TdT接触达第一反应时间以生成第二核酸。该第二核酸可包含结合有以下的第一核酸:(i)包含来自第一核苷三磷酸的第一经修饰的碱基的第一核苷酸中的一个或多个第一核苷酸,以及(ii)一个或多个第二核苷酸。
在一些实施方案中,该一个或多个第二核苷酸中的每个第二核苷酸包含来自第二核苷三磷酸的第二经修饰的碱基。该第二核苷三磷酸的第二经修饰的碱基可包括经修饰的腺嘌呤、经修饰的鸟嘌呤、经修饰的胞嘧啶、经修饰的胸腺嘧啶或经修饰的尿嘧啶。该第一核苷三磷酸的该第一经修饰的碱基和该第二核苷三磷酸的该第二经修饰的碱基可包含对同一未修饰的碱基的修饰。该第一核苷三磷酸的该第一经修饰的碱基和该第二核苷三磷酸的该第二经修饰的碱基可包含对不同的未修饰的碱基的修饰。在一些实施方案中,该第二核苷三磷酸包含共价连接的第二经修饰的碱基和第二辅助寡核苷酸。
在一些实施方案中,第二核苷酸中的每个第二核苷酸包含来自第二核苷三磷酸的第二未修饰的碱基。该第二核苷三磷酸的该第二未修饰的碱基可包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。该第一经修饰的碱基可包含对第二未修饰的碱基的修饰。
在一些实施方案中,包含第一经修饰的碱基的第一核苷三磷酸和第二核苷三磷酸以范围为约1:100至约100:1的比率与第一核酸接触。包含该第一经修饰的碱基的该第一核苷酸和该第二核苷酸可以范围为约1:100至约100:1的比率结合到该第二核酸中。
在一些实施方案中,提供第一核酸和包含第一经修饰的碱基的第一核苷三磷酸包括:提供第一核酸、包含第一经修饰的碱基的第一核苷三磷酸、和多种第二核苷三磷酸。使第一核酸和包含第一经修饰的碱基的第一核苷三磷酸与重组TdT接触可包括:使第一核酸、包含第一经修饰的碱基的第一核苷三磷酸和多种第二核苷三磷酸在第一反应中在第一温度下与重组TdT接触达第一反应时间以生成第二核酸。该第二核酸可包含结合有以下的第一核酸:包含第一经修饰的碱基的第一核苷酸中的一个或多个第一核苷酸和来自多种第二核苷三磷酸的一个或多个第二核苷酸。
在一些实施方案中,该多种第二核苷三磷酸包括脱氧核糖腺嘌呤三磷酸、脱氧核糖鸟嘌呤三磷酸、脱氧核糖胞嘧啶三磷酸、脱氧核糖胸腺嘧啶三磷酸、脱氧核糖尿嘧啶三磷酸,或它们的组合。该多种第二核苷三磷酸中的两种第二核苷三磷酸可以范围为约1:100至约100:1的比率与该第一核酸接触。这些第二核苷酸中的两种第二核苷酸可以范围为约1:100至约100:1的比率结合到该第二核酸中。该多种第二核苷三磷酸中的至少一种或每种第二核苷三磷酸可包含第二未修饰的碱基。该多种第二核苷三磷酸中的至少一种或每种第二核苷三磷酸可包含第二经修饰的碱基。
在一些实施方案中,这些核苷酸的经修饰的碱基和未修饰的碱基可以范围为约1:100至约100:1的比率结合到该第二核酸中。经修饰的碱基可包括第一经修饰的碱基和/或结合到第二核酸中的多种第二核苷酸中的至少一种或每种第二核苷酸的碱基。未修饰的碱基可包括结合到第二核酸中的多种第二核苷酸中的至少一种或每种第二核苷酸的碱基。
在一些实施方案中,第二核酸的核苷酸碱基的至少1%包括经修饰的碱基。经修饰的碱基可以分布在整个第二核酸中。经修饰的碱基可以随机分布在整个第二核酸中。第二核酸可包含多个两个或更多个连续的经修饰的碱基。该多个连续的经修饰的碱基可包括三个或更多个连续的经修饰的碱基。在一些实施方案中,第二核酸的核苷酸碱基的至少1%包括第一经修饰的碱基。
在一些实施方案中,该第一核酸包含能够结合核酸模板的模板捕获位点。模板捕获位点可包含模板捕获序列。核酸模板可包含与模板捕获序列的反向互补序列具有至少90%序列同一性并且能够与该模板捕获序列杂交的序列。核酸模板可包括单链DNA。
在一些实施方案中,第二核酸中的第一核苷三磷酸和第一核苷酸的第一经修饰的碱基中的一个或多个第一经修饰的碱基包含官能部分。第一经修饰的碱基的官能部分可以能够参与点击化学反应。第二核酸中的第一核苷三磷酸和第一核苷酸的第一经修饰的碱基可包含饱和或不饱和、取代或未取代的直链或支链脂肪族碳链。该第一经修饰的碱基的该官能部分和碱基可在通过饱和或不饱和、取代或未取代的直链或支链脂肪族碳链连接的第一经修饰的碱基的两个末端上。
在一些实施方案中,该方法进一步包括:提供第一辅助寡核苷酸。该方法可包括:使第二核酸与第一辅助寡核苷酸在第二反应中在第二温度下接触达第二反应时间以生成第三核酸,该第三核酸包含附接至该第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸的第二核酸。
在一些实施方案中,提供第一辅助寡核苷酸包括:提供该第一辅助寡核苷酸和第二辅助寡核苷酸。使该第二核酸与该第一辅助寡核苷酸接触可包括:使该第二核酸与该第一辅助寡核苷酸和该第二辅助寡核苷酸在第二反应中在第二温度下接触达第二反应时间以生成第三核酸,该第三核酸包含附接至该第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸和该第二辅助寡核苷酸中的一个或多个第二辅助寡核苷酸的该第二核酸。
在一些实施方案中,该第一辅助寡核苷酸包含第一衔接子序列或其反向互补序列。该第二辅助寡核苷酸可包含第二衔接子序列或其反向互补序列。在一些实施方案中,该第一衔接子序列包含P5序列。该第二衔接子序列可包含P7序列。
在一些实施方案中,该第一辅助寡核苷酸和该第二辅助寡核苷酸中的一者或多者的长度为约10个核苷酸至约100个核苷酸。第三核酸可包含约10个至约1,000,000个第一辅助寡核苷酸。第三核酸可包含约10个至约1,000,000个第二辅助寡核苷酸。在一些实施方案中,该第三核酸包含附接至第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸的第二核酸。该第三核酸可包含附接至第二辅助寡核苷酸中的一个或多个第二辅助寡核苷酸的第二核酸。
在一些实施方案中,提供第一辅助寡核苷酸包括提供包含该第一辅助寡核苷酸和第一聚合物的第一辅助物。使第二核酸与第一辅助寡核苷酸接触可包括使第二核酸与第一辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸,该第三核酸包含附接至第一辅助物中的一个或多个第一辅助物的第二核酸。提供第二辅助寡核苷酸可包括提供包含该第二辅助寡核苷酸和第二聚合物的第二辅助物。使第二核酸与第二辅助物接触可包括使第二核酸与该第二辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸,该第三核酸包含附接至第二辅助物中的一个或多个第二辅助物的第二核酸。第一辅助物可包含共价连接的第一辅助寡核苷酸和第一聚合物。第二辅助物可包含共价连接的第二辅助寡核苷酸和第二聚合物
在一些实施方案中,第一辅助寡核苷酸或第一聚合物包含第一官能部分。第二辅助寡核苷酸可包含第二官能部分。在一些实施方案中,该第一辅助寡核苷酸或该第一聚合物的该第一官能部分和该第二辅助寡核苷酸或该第二聚合物的该第二官能部分是相同的。第一辅助寡核苷酸的第一官能部分可以能够与第一核苷酸的第一经修饰的碱基的官能部分反应以形成共价键。第二辅助寡核苷酸或第二聚合物的第二官能部分可以能够与第一核苷酸的第一经修饰的碱基的官能部分反应以形成共价键。
在一些实施方案中,第一辅助寡核苷酸或第一聚合物的第一官能部分能够参与点击化学反应。第二辅助寡核苷酸或第二聚合物的第二官能部分可以能够参与点击化学反应。在一些实施方案中,第一辅助寡核苷酸或第一聚合物的第一官能部分能够参与与第一核苷酸的第一经修饰的碱基的官能部分的点击化学反应。第二辅助寡核苷酸或第二聚合物的第二官能部分可以能够参与与第一核苷酸的第一经修饰的碱基的官能部分的点击化学反应。
在一些实施方案中,第一辅助寡核苷酸或第一聚合物的第一官能部分、第二辅助寡核苷酸或第二聚合物的第二官能部分、第一核苷三磷酸的第一经修饰的碱基的官能部分和第一核苷酸的官能部分中的一者或多者独立地为叠氮化物、炔基、烯基、硫醇或硝酮。第一核苷酸的第一经修饰的碱基的官能部分和第一辅助寡核苷酸或第一聚合物的第一官能部分、或第一核苷酸的第一经修饰的碱基的官能部分和第二辅助寡核苷酸或第二聚合物的第二官能部分、或两者可选自以下对:(i)叠氮基/炔基;(ii)炔基/叠氮基;(iii)硫醇/炔基;(iv)炔基/硫醇;(v)烯基/硫醇;(vi)硫醇/烯基;(vii)叠氮基/环辛炔基;(viii)环辛炔基/叠氮基;(ix)硝酮/环辛炔基;以及(x)环辛炔基/硝酮。第一核苷酸的第一经修饰的碱基的官能部分可以是叠氮基。第一辅助寡核苷酸或第一聚合物的第一官能部分和第二辅助寡核苷酸或第二聚合物的第二官能部分中的一者或多者可以独立地为炔基。
在一些实施方案中,点击化学反应包括铜催化的叠氮化物-炔烃环加成(CuAAC)。共价键可以包含三唑基。CuAAC可以包含Cu(I)稳定化配体。该Cu(I)稳定化配体可选自由以下组成的组:3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]丙醇(BTTP)、3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]硫酸氢丙酯(BTTPS)、2-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]硫酸氢乙酯(BTTES)、2-[4-{(双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基)甲基}-1H-1,2,3-三唑-1-基]-乙酸(BTTAA)、红菲绕啉二磺酸二钠盐(BPS)、N,N,N′,N″,N″-五甲基二亚乙基三胺(PMDETA)、三-((1-苄基-1H-1,2,3-三唑-4-基)甲基)胺(TBTA)、三(3-羟丙基三唑基甲基)胺(THPTA)、Nε-((1R,2R)-2-叠氮基环戊氧基)羰基)-L-赖氨酸(ACPK)和4-N,N-二甲基氨基-1,8-萘酰亚胺(4-DMN)。
在一些实施方案中,点击化学反应包括应变促进的叠氮化物-炔烃环加成(SPAAC)。该共价键可包含环辛-三唑基。在一些实施方案中,点击化学反应包括炔烃加氢硫醇化。该共价键可包含烯基硫化物。在一些实施方案中,点击化学反应包括烯烃加氢硫醇化。该共价键可包含烷基硫化物。在一些实施方案中,点击化学反应包括应变促进的炔烃-硝酮环加成(SPANC)。该共价键可包含八氢环辛-异噁唑基。该环辛炔基可以是二苄基环辛炔(DBCO)或其衍生物。在一些实施方案中,点击化学反应是生物相容的。
在一些实施方案中,第二温度的约20℃至约65℃。第二温度可以小于0℃。第二温度可为约-4℃至约-20℃。在一些实施方案中,第二反应时间是至少1秒。
在一些实施方案中,该方法进一步包括:(c)提供核酸模板,该核酸模板包括第一衔接子序列或其反向互补序列、第二衔接子序列或其反向互补序列、以及能够与第三核酸上的模板捕获位点杂交的核酸杂交序列。该方法可包括:(d)使第三核酸与核酸模板接触以生成第三核酸,该第三核酸具有经由核酸模板的核酸杂交序列与第三核酸上的模板捕获位点杂交的核酸模板。该方法可包括:(e)对与核酸模板杂交的第三核酸执行扩增以生成第四核酸,该第四核酸包含附接至第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸和第二辅助寡核苷酸中的一个或多个第二辅助寡核苷酸的第三核酸,该第一辅助寡核苷酸和该第二辅助寡核苷酸经延伸以包含该核酸模板的序列或其反向互补序列。扩增可以是例如桥式扩增或排除扩增。该方法可包括:(f)使用第四核酸确定核酸模板的序列。核酸模板的核酸杂交序列可包含模板捕获位点的反向互补序列。
在一些实施方案中,第一核酸、第二核酸、第三核酸和/或第四核酸包含第三聚合物。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于Glu191的位置处的氨基酸取代突变可包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是Glu191Ala、Glu191Arg、Glu191Asn、Glu191Asp、Glu191Cys、Glu191Gln、Glu191Gly、Glu191His、Glu191Ile、Glu191Leu、Glu191Lys、Glu191Met、Glu191Phe、Glu191Pro、Glu191Ser、Glu191Thr、Glu191Trp、Glu191Tyr、或Glu191Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是Glu191Ala、Glu191Gly、Glu191Ile、Glu191Leu、Glu191Met、或Glu191Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是Glu191Val。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以包括对极性氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是Lys193Ala、Lys193Arg、Lys193Asn、Lys193Asp、Lys193Cys、Lys193Gln、Lys193Glu、Lys193Gly、Lys193His、Lys193Ile、Lys193Leu、Lys193Met、Lys193Phe、Lys193Pro、Lys193Ser、Lys193Thr、Lys193Trp、Lys193Tyr、或Lys193Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是Lys193Asn、Lys193Gln、Lys193Ser、或Lys193Thr。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是Lys193Asn。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是Glu194Ala、Glu194Arg、Glu194Asn、Glu194Asp、Glu194Cys、Glu194Gln、Glu194Gly、Glu194His、Glu194Ile、Glu194Leu、Glu194Lys、Glu194Met、Glu194Phe、Glu194Pro、Glu194Ser、Glu194Thr、Glu194Trp、Glu194Tyr、或Glu194Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是Glu194Ala、Glu194Gly、Glu194Ile、Glu194Leu、Glu194Met、或Glu194Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是Glu194Gly。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可包括对极性氨基酸或芳香族氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是Asp242Ala、Asp242Arg、Asp242Asn、Asp242Cys、Asp242Gln、Asp242Glu、Asp242Gly、Asp242His、Asp242Ile、Asp242Leu、Asp242Lys、Asp242Met、Asp242Phe、Asp242Pro、Asp242Ser、Asp242Thr、Asp242Trp、Asp242Tyr、或Asp242Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是Asp242Asn、Asp242Gln、Asp242Phe、Asp242Ser、Asp242Thr、Asp242Trp、或Asp242Tyr。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是Asp242Tyr。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以包括对极性氨基酸、带负电的氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是Lys287Ala、Lys287Arg、Lys287Asn、Lys287Asp、Lys287Cys、Lys287Gln、Lys287Glu、Lys287Gly、Lys287His、Lys287Ile、Lys287Leu、Lys287Met、Lys287Phe、Lys287Pro、Lys287Ser、Lys287Thr、Lys287Trp、Lys287Tyr、或Lys287Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是Lys287Asp或Lys287Glu。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是Lys287Glu。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是Phe296Ala、Phe296Arg、Phe296Asn、Phe296Asp、Phe296Cys、Phe296Gln、Phe296Glu、Phe296Gly、Phe296His、Phe296Ile、Phe296Leu、Phe296Lys、Phe296Met、Phe296Pro、Phe296Ser、Phe296Thr、Phe296Trp、Phe296Tyr、或Phe296Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是Phe296Ala、Phe296Gly、Phe296Ile、Phe296Leu、Phe296Met、或Phe296Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是Phe296Leu。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以包括对极性氨基酸、带正电的氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是Met299Ala、Met299Arg、Met299Asn、Met299Asp、Met299Cys、Met299Gln、Met299Glu、Met299Gly、Met299His、Met299Ile、Met299Leu、Met299Lys、Met299Phe、Met299Pro、Met299Ser、Met299Thr、Met299Trp、Met299Tyr、或Met299Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是Met299Arg、Met299His、或Met299Lys。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是Met299Lys。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以包括对极性氨基酸、脂肪族氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是Thr342Ala、Thr342Arg、Thr342Asn、Thr342Asp、Thr342Cys、Thr342Gln、Thr342Glu、Thr342Gly、Thr342His、Thr342Ile、Thr342Leu、Thr342Lys、Thr342Met、Thr342Phe、Thr342Pro、Thr342Ser、Thr342Trp、Thr342Tyr、或Thr342Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是Thr342Asn、Thr342Cys、Thr342Gln、Thr342Pro、或Thr342Ser。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是Thr342Ser。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以包括对极性氨基酸、脂肪族氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是His421Ala、His421Arg、His421Asn、His421Asp、His421Cys、His421Gln、His421Glu、His421Gly、His421Ile、His421Leu、His421Lys、His421Met、His421Phe、His421Pro、His421Ser、His421Thr、His421Trp、His421Tyr、或His421Val。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是His421Asn、His421Cys、His421Gln、His421Pro、His421Ser、或His421Thr。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是His421Pro。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的两个或更多个位置处包含两个或更多个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的两个或更多个位置处的两个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的两者或更多者。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的三个或更多个位置处包含三个或更多个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的三个或更多个位置处的三个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的三者或更多者。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的四个或更多个位置处包含四个或更多个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的四个或更多个位置处的四个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的四者或更多者。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的五个或更多个位置处包含五个或更多个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的五个或更多个位置处的五个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的五者或更多者。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的六个或更多个位置处包含六个或更多个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的六个或更多个位置处的六个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的六者或更多者。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的七个或更多个位置处包含七个或更多个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的七个或更多个位置处的七个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的七者或更多者。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个或更多个位置处包含八个或更多个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个或更多个位置处的八个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的八者或更多者。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个位置处包含八个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个位置处的八个氨基酸取代突变可以分别是Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的位置处包含九个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的位置处的九个氨基酸取代突变可以分别是Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。
在一些实施方案中,该重组TdT包含与SEQ ID NO:1至少85%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:1至少90%同一的氨基酸序列。该重组TdT包含可以与SEQID NO:1至少95%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:11至少95%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:12至少80%同一的氨基酸序列。
在一些实施方案中,重组TdT在47℃或更高的温度下是稳定的。重组TdT可以在50℃或更高的温度下是稳定的。重组TdT可以在55℃或更高的温度下是稳定的。重组TdT可以在58℃或更高的温度下是稳定的。在一些实施方案中,在相同的测试温度下,重组TdT的末端脱氧核苷酸转移酶活性是SEQ ID NO:12的家牛TdT的末端脱氧核苷酸转移酶活性的至少80%、85%、90%、95%、100%、105%、110%、115%或120%。测试温度可以是37℃、47℃、50℃、55℃、或58℃。
在一些实施方案中,重组TdT包含小泛素样修饰剂(SUMO)片段。SUMO片段包含可以与SEQ ID NO:13至少80%同一的氨基酸序列。重组TdT可包含在该重组TdT的N末端上的SUMO片段。重组TdT可以包含与SEQ ID NO:14至少80%同一的氨基酸序列。重组TdT可以包含与SEQ ID NO:15至少80%同一的氨基酸序列。重组TdT可包含在该重组TdT的C末端上的SUMO片段。
本文公开了通过任何修饰本公开的核酸的方法获得的第二核酸的实施方案。本文公开了通过任何修饰本公开的核酸的方法获得的第三核酸的实施方案。本文公开了通过任何修饰本公开的核酸的方法获得的第四核酸的实施方案。
本说明书中描述的主题的一个或多个具体实施的细节在附图和以下描述中进行阐述。根据说明书、附图和权利要求,其他特征、方面和优点将变得显而易见。本发明内容和以下具体实施方式均不旨在限定或限制本发明主题的范围。
附图说明
图1是示出生成单链DNA支架、载体和纳米粒子的非限制性示例性过程的示意图。
图2示出了SUMO-TdT(SEQ ID NO:14)与家牛TdT(SEQ ID NO:12)的氨基酸139至520(SEQ ID NO:1)的非限制性示例性序列比对。SUMO-TdT是指在氨基酸位置123至504处含有家牛TdT的氨基酸139至520并且在氨基酸位置22至119处含有N末端SUMO-标签(SEQ IDNO:13)的重组TdT。突出显示的九个氨基酸是本文鉴定的SUMO-TdT中的取代突变。示出了SUMO-TdT(及其变体)中的取代突变的氨基酸位置和家牛TdT中的对应位置。
图3是示出来自NEB的商业TdT和TdT3-2的末端脱氧核苷酸转移酶活性的非限制性示例性凝胶图。
图4A至图4B是示出通过商业NEB TdT使用叠氮化物-PEG4-dUTP和天然核苷酸进行一分钟和60分钟的TdT延伸的结果的非限制性示例性凝胶图。
图5A至图5C是示出通过TdT3-2和商业NEB TdT用叠氮化物-PEG4-dUTP或叠氮化物-己基-dATP进行一分钟和60分钟的TdT延伸的结果的非限制性示例性凝胶图。
具体实施方式
在以下具体实施方式中,参考了附图,附图形成具体实施方式的一部分。在附图中,除非上下文另有规定,否则类似的符号通常标识类似的组分。具体实施方式、附图和权利要求书中所述的示例性实施方案并非旨在为限制性的。在不脱离本文所提出的主题的精神或范围的情况下,可利用其他实施方案,并且可作出其他改变。将容易理解的是,如本文大体所述并且如附图所示,本公开的各方面可被布置、替代、组合、分离和设计成多种不同的构型,所有这些构型均明确涵盖于本文中并成为本公开的一部分。
所有专利、公布的专利申请、其他出版物和来自GenBank的序列、以及本文提及的其他数据库均相对于相关技术全文以引用方式并入。
许多测序平台使用“边合成边测序”(SBS)技术和基于荧光的检测方法。例如,模板多核苷酸的文库可以在被称为接种的过程中附接至基底的表面以生成经接种的模板多核苷酸。然后可以在被称为成簇的过程中将每种经接种的模板多核苷酸的多个拷贝(被称为成簇多核苷酸)合成为附接至与模板多核苷酸已经接种的地方接近的表面。随后,可以通过用例如荧光标记结合核苷酸来合成成簇多核苷酸的新生拷贝。掺入到成簇多核苷酸的新生拷贝中的核苷酸可以发射标识所结合的每种核苷酸的信号(例如,荧光信号)。经接种的模板多核苷酸在最初接种该模板多核苷酸的地方附近的拷贝成簇导致信号扩增,从而改善检测。
当彼此不同的模板多核苷酸以彼此相距足够远的距离接种或附接到表面的各个位置,使得成簇产生各自来源于单个模板多核苷酸的接种的复制多核苷酸的在空间上不同的簇(这种情况被称为单克隆性)时,接种和成簇效果很好。例如,模板多核苷酸的文库可以包括大量的具有不同核苷酸序列的模板多核苷酸。如果两个此类模板多核苷酸在基底的表面上被太近地接种在一起,则成簇可产生成簇多核苷酸的在空间上混合的群体,这些成簇多核苷酸中的一些成簇多核苷酸可具有接种在附近的模板多核苷酸中的一个模板多核苷酸的序列,而其他成簇多核苷酸可具有在表面上也接种在附近的另一个模板多核苷酸的序列。或者,由彼此靠太近接种的两个不同模板多核苷酸形成的两个簇可能彼此太相邻或彼此邻接,使得在SBS过程中使用的成像系统可能无法将由结合的核苷酸生成的信号区分为单独的簇,即使这些簇之间可能没有或极少有基底附接的成簇多核苷酸的空间混合。这种不利条件可被称为多克隆性。从多克隆簇(如果存在)中获取明确的序列信息可能更困难、更耗时、更昂贵且效率更低,并且需要更复杂的数据分析。
还可以通过将各自具有来自模板多核苷酸的复制多核苷酸的单个纳米粒子分配到基底(例如,流动池)的单个孔中来实现单克隆性。支架(例如,单链DNA(ssDNA)支架)可以用作模板多核苷酸的多个拷贝的“载体”。具有模板分子的多个拷贝的载体可以是能够通过以空间碰撞或位阻排除其他大分子占据相同孔来占据基底上的单个孔的纳米粒子。占据基底的单个孔的单个纳米粒子可以导致单克隆性或接近单克隆性。
本文公开了生成支架的方法的实施方案。在一些实施方案中,该方法包括:(a)提供单链脱氧核糖核酸(ssDNA)和包含经修饰的碱基的核苷三磷酸。该方法可包括:(b)使该ssDNA和包含经修饰的碱基的该核苷三磷酸与重组末端脱氧核苷酸转移酶(TdT)接触以生成ssDNA支架。该ssDNA支架可包括结合有一个或多个核苷酸的ssDNA,该一个或多个核苷酸包括来自该核苷三磷酸的经修饰的碱基。重组TdT可以包含与SEQ ID NO:1至少80%同一的氨基酸序列。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。该方法可包括:(c)使ssDNA支架与第一衔接子寡核苷酸和第二衔接子寡核苷酸接触以生成核酸载体。第一衔接子寡核苷酸可包含第一衔接子序列。第二衔接子寡核苷酸可包含第二衔接子序列。核酸载体可包含附接至第一衔接子寡核苷酸和第二衔接子寡核苷酸的ssDNA支架。该方法可以用于从载体生成纳米粒子。例如,该方法可包括:(d)提供核酸模板,该核酸模板包含第一衔接子序列或其反向互补序列、第二衔接子序列或其反向互补序列、和核酸杂交序列。该方法可包括:(e)使核酸载体与核酸模板接触以生成核酸载体,该核酸载体具有经由核酸模板的核酸杂交序列与核酸载体的模板捕获位点杂交的核酸模板。该方法可包括:(f)对与核酸模板杂交的核酸载体执行扩增以生成多个经扩增的核酸,该多个经扩增的核酸均包含第一衔接子寡核苷酸和第二衔接子寡核苷酸,该第一衔接子寡核苷酸和该第二衔接子寡核苷酸经延伸以包含核酸模板的序列或其反向互补序列。扩增可以是例如桥式扩增或排除扩增。具有多个经扩增的核酸的载体在本文中被称为纳米粒子。该方法可包括:(g)使用多个经扩增的核酸确定核酸模板的序列。具有足够空间尺寸的纳米粒子可以能够通过以空间碰撞或位阻排除其他纳米粒子占据相同的孔来占据基底(例如,流动池)上的单个孔,因此导致单克隆性或接近单克隆性。
本文公开了修饰核酸的方法的实施方案。在一些实施方案中,该方法包括:(a)提供第一核酸和包含第一经修饰的碱基的第一核苷三磷酸。该方法可包括:(b)使第一核酸和包含第一经修饰的碱基的第一核苷三磷酸与重组末端脱氧核苷酸转移酶(TdT)在第一反应中在第一温度下接触达第一反应时间以生成第二核酸。该第二核酸可包含结合有以下的第一核酸:一个或多个包含来自第一核苷三磷酸的第一经修饰的碱基的第一核苷酸。重组TdT可以包含与SEQ ID NO:1至少80%同一的氨基酸序列。重组TdT可在功能上等同于SEQ IDNO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
生成结合多个经修饰的碱基的单链DNA分子
可以生成结合有经修饰的核苷酸的支架(例如,单链DNA(ssDNA)支架)。该支架可以用作模板分子的多个拷贝的“载体”。具有模板分子的多个拷贝的载体可以是能够通过以空间碰撞或位阻排除其他大分子占据相同孔来占据基底(例如,包括多个孔,诸如100个、1,000个、10,000个或更多个孔的流动池)上的单个孔(例如,微孔)的纳米粒子。基底上各自具有一个纳米粒子的单个孔可以产生单克隆性,或接近单克隆性。可替代地,ssDNA支架可以携带模板的单个拷贝。该支架可以具有一个或多个锚定寡聚物的一个或多个反向互补序列的多个拷贝。由于一个或多个锚定寡聚物的一个或多个反向互补序列的多个拷贝的存在,该支架可以结合并螯合给定孔中的所有“锚定”寡聚物,从而使每孔能够捕获单个模板。
一种生成或构建此类ssDNA支架的方式是使用ssDNA聚合酶,诸如末端脱氧核苷酸转移酶(TdT),来将携带修饰(诸如碱基上的叠氮化物基团)的核苷酸随机地结合至引物链中。然而,可能是由于空间碰撞,可商购获得的TdT不容易结合多个串联的经碱基修饰的核苷酸。
本文所公开的重组TdT的实施方案是热稳定的,并且在结合经碱基修饰的核苷酸,诸如具有与碱基缀合的PEG链的核苷酸(在本文中被称为PEG-核苷酸)方面比可商购获得的TdT(诸如马塞诸塞州伊普斯威奇的New England公司(New EnglandInc.(NEB;Ipswich,MA)))更好(例如,好得多)。例如,NEB TdT应在结合1至2个PEG-核苷酸后停止,并且重组TdT可以结合多个串联的PEG-核苷酸。
因此,本文所公开的任何重组TdT可以是用于出于不同目的(包括用于单克隆成簇的“载体”的生成)生成携带各种类型的经碱基的修饰的核苷酸的ssDNA的优异催化剂。
图1是示出生成单链DNA支架、载体和纳米粒子的非限制性示例性过程的示意图。可以通过使用末端脱氧核苷酸转移酶112(TdT)来合成单链DNA(ssDNA)支架120s。TdT 112可以在单链DNA链104的3'羟基末端处结合脱氧核苷酸108nt_m、108nt_u,而不需要模板或无需复制模板。通过使用TdT 112合成的ssDNA支架120s的大小可以通过修改合成支架120s的聚合过程的持续时间来控制。
DNA支架120s可以在具有经修饰的碱基的核苷三磷酸108nst_m和具有未修饰的碱基的核苷三磷酸108nst_u的存在下合成。取决于具有经修饰的碱基的核苷三磷酸108nst_m和具有未修饰的碱基的核苷三磷酸108nst_u的相对浓度,结合到DNA支架120s中的一定百分比的核苷酸108nt_m、108nt_u是具有经修饰的碱基的核苷酸108nt_m。当合成DNA支架120s时,可以存在一种或多种类型的具有经修饰的碱基的核苷三磷酸108nt_m,并且可以将一种或多种类型的具有经修饰的碱基的核苷酸120nt_m结合到DNA支架120s中。
在此非限制性示例中,辅助寡核苷酸124as1、124as2被示出为与ssDNA支架结合以形成核酸载体120c。辅助寡核苷酸124as1、124as2可以在点击化学反应中与核苷酸108nt_m的经修饰的碱基的官能部分108fm相互作用。例如,结合到支架120s中的核苷酸108nt_m的经修饰的碱基的官能部分108fm可以与辅助寡核苷酸124ao1、124ao2上的官能部分124fm1、124fm2反应。
单个模板捕获位点104tcs存在于ssDNA支架120s的某一末端(例如,5'末端)上。四角星表示支架120s上的核苷酸108nt_m的经修饰的碱基的官能部分108fm。辅助寡核苷酸124ao1、124ao2可包含P5序列或其反向互补序列,或P7序列或其反向互补序列。辅助寡核苷酸124ao1、124ao2上的五角星表示官能部分124fm1、124m2,这些官能部分可以与支架120s中的核苷酸108nt_m的经修饰的碱基的官能部分108fm相互作用。
然后,模板核酸或多核苷酸128的5'末端被示出为通过非共价沃森-克里克碱基配对杂交在核酸载体120c的互补5'末端处与单个模板捕获位点104tcs结合。然后对核酸载体120c执行成簇过程。模板核酸128的未与核酸载体120c杂交的部分可以含有可以与P5序列或其反向互补序列和P7序列或其反向互补序列杂交的序列。例如,模板核酸128可以含有P5序列或其反向互补序列和P7序列或其反向互补序列。在多轮聚合之后,除了模板核酸128的能够与模板捕获位点104tcs杂交的5'末端之外,模板多核苷酸128的载体结合的拷贝和/或反向互补序列是通过从P5辅助寡核苷酸和P7辅助寡核苷酸的3'末端延伸来合成的。
修饰核酸
本文公开了生成支架、生成载体、生成纳米粒子和对核酸模板进行测序的方法。参考图1,该方法可包括提供单链脱氧核糖核酸(ssDNA)104和包含经修饰的碱基的核苷三磷酸108nst_m。该方法可包括在动作116a处使ssDNA 104和包含经修饰的碱基的核苷三磷酸108nst_m与重组末端脱氧核苷酸转移酶(TdT)112接触以生成ssDNA支架120s。ssDNA支架120s可包含结合有一个或多个核苷酸108nt_m的ssDNA 104,该一个或多个核苷酸包含来自核苷三磷酸108nst_m的经修饰的碱基。重组TdT 108可以包含与SEQ ID NO:1至少80%同一的氨基酸序列。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
该方法可包括在动作116b处使ssDNA支架120s与第一衔接子寡核苷酸124ao1(例如,包含P5序列的寡核苷酸)或包含第一衔接子寡核苷酸124ao1的第一衔接子和第二衔接子寡核苷酸124ao2(例如,包含P7序列的寡核苷酸)或包含第二衔接子寡核苷酸124ao2的第二衔接子接触以生成核酸载体120c。第一衔接子寡核苷酸124ao1可包含第一衔接子序列124as1(例如,P5序列)或其反向互补序列。第二衔接子寡核苷酸124ao2可包含第二衔接子序列124as(例如,P7序列)或其反向互补序列。核酸载体120c可包含附接至第一衔接子寡核苷酸124ao1和第二衔接子寡核苷酸124ao2的ssDNA支架120s。
在一些实施方案中,使ssDNA支架120与第一衔接子寡核苷酸124ao1接触包括使ssDNA支架与包含第一衔接子寡核苷酸124ao1和第一聚合物的第一衔接子接触。使ssDNA支架120与第二衔接子寡核苷酸124ao2接触可包括使ssDNA支架与包含第二衔接子寡核苷酸124ao2和第二聚合物的第二衔接子接触。第一衔接子可包含共价连接的第一衔接子寡核苷酸124ao1和第一聚合物。第二衔接子可包含共价连接的第二衔接子寡核苷酸124ao2和第二聚合物。ssDNA支架120s可包含第三聚合物。
该方法可包括提供核酸模板128,该核酸模板包含第一衔接子序列124as1或其反向互补序列、第二衔接子序列124as2或其反向互补序列、和能够与模板捕获位点104tcs杂交的核酸杂交序列128tcs。该方法可包括在动作116c处使核酸载体120c与核酸模板接触以生成核酸载体120c,该核酸载体具有经由核酸模板128的核酸杂交序列128tcs与核酸载体120c的模板捕获位点104tcs杂交的核酸模板128。模板捕获位点104tcs可以与核酸模板128的核酸杂交序列128tcs杂交。模板捕获位点104tcs与核酸模板128的核酸杂交序列128tcs可以是反向互补序列。模板捕获位点104tcs与核酸模板128的核酸杂交序列128tcs的反向互补序列可以是相同的或基本上相同的(例如,75%、80%、85%、90%、95%、99%同一)。该方法可包括在动作116d处对与核酸模板128杂交的核酸载体120c执行扩增(例如,桥式扩增或排除扩增)以生成多个经扩增的核酸132,该多个经扩增的核酸均包含第一衔接子寡核苷酸124ao1或第二衔接子寡核苷酸124ao2,该第一衔接子寡核苷酸和该第二衔接子寡核苷酸经延伸以包含核酸模板128的序列或其反向互补序列。具有多个经扩增核酸的载体在本文中被称为纳米粒子120n。该方法可包括使用一个或多个该多个经扩增的核酸132确定核酸模板128的序列。
本文公开了修饰核酸的方法。参考图1,该方法可包括提供第一核酸104(例如,单链脱氧核糖核酸)和包含第一经修饰的碱基的第一核苷三磷酸108nst_m。该方法可包括在相互作用116a处使第一核酸104和包含第一经修饰的碱基的第一核苷三磷酸108nst_m与重组末端脱氧核苷酸转移酶(TdT)112在第一反应中在第一温度下接触达第一反应时间以生成第二核酸120s(例如,载体)。第二核酸120s(例如,核酸支架)可包含结合有以下的第一核酸104:一个或多个包含来自第一核苷三磷酸108nst_m的第一经修饰的碱基的第一核苷酸108nt_m。重组TdT 112可包含与SEQ ID NO:1至少80%同一的氨基酸序列。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
核酸、核苷酸和核苷三磷酸
在一些实施方案中,该第一核酸104包括单链核酸、具有3'悬垂部的双链核酸、具有3'凹部的双链核酸,或它们的组合。第二核酸120c可包括单链核酸、具有3'悬垂部的双链核酸、具有3'凹部的双链核酸,或它们的组合。第一核酸104可包括脱氧核糖核酸(DNA)。第二核酸120s可包括脱氧核糖核酸。
在不同实施方案中,第一核酸104或第二核酸120c(或本公开的任何核酸)的长度可以不同。在一些实施方案中,第一核酸或第二核酸(或本公开的任何核酸)的长度是或是约5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、20个核苷酸、30个核苷酸、40个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、200个核苷酸、300个核苷酸、400个核苷酸、500个核苷酸、600个核苷酸、700个核苷酸、800个核苷酸、900个核苷酸、1000个核苷酸、2000个核苷酸、3000个核苷酸、4000个核苷酸、5000个核苷酸、6000个核苷酸、7000个核苷酸、8000个核苷酸、9000个核苷酸、10000个核苷酸、20000个核苷酸、30000个核苷酸、40000个核苷酸、50000个核苷酸、60000个核苷酸、70000个核苷酸、80000个核苷酸、90000个核苷酸、100000个核苷酸、200000个核苷酸、300000个核苷酸、400000个核苷酸、500000个核苷酸、600000个核苷酸、700000个核苷酸、800000个核苷酸、900000个核苷酸、1000000个核苷酸、2000000个核苷酸、3000000个核苷酸、4000000个核苷酸、5000000个核苷酸、6000000个核苷酸、7000000个核苷酸、8000000个核苷酸、9000000个核苷酸、10000000个核苷酸,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一核酸或第二核酸(或本公开的任何核酸)的长度是至少、至少约、至多、或至多约5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、20个核苷酸、30个核苷酸、40个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、200个核苷酸、300个核苷酸、400个核苷酸、500个核苷酸、600个核苷酸、700个核苷酸、800个核苷酸、900个核苷酸、1000个核苷酸、2000个核苷酸、3000个核苷酸、4000个核苷酸、5000个核苷酸、6000个核苷酸、7000个核苷酸、8000个核苷酸、9000个核苷酸、10000个核苷酸、20000个核苷酸、30000个核苷酸、40000个核苷酸、50000个核苷酸、60000个核苷酸、70000个核苷酸、80000个核苷酸、90000个核苷酸、100000个核苷酸、200000个核苷酸、300000个核苷酸、400000个核苷酸、500000个核苷酸、600000个核苷酸、700000个核苷酸、800000个核苷酸、900000个核苷酸、1000000个核苷酸、2000000个核苷酸、3000000个核苷酸、4000000个核苷酸、5000000个核苷酸、6000000个核苷酸、7000000个核苷酸、8000000个核苷酸、9000000个核苷酸、或10000000个核苷酸。
在不同实施方案中,第一核酸104或第二核酸120c的包含脱氧核糖核苷酸的核苷酸108nt-m、108nt_u的百分比和数量可以是不同的。在一些实施方案中,第一核酸或第二核酸的包含脱氧核糖核苷酸的核苷酸的百分比是或是约25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一核酸或第二核酸的包含脱氧核糖核苷酸的核苷酸的百分比是至少、至少约、至多、或至多约25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%。例如,第一核酸104的核苷酸的至少50%可包含脱氧核糖核苷酸。例如,第二核酸120的核苷酸108nt_m、108nt_u的至少50%可包含脱氧核糖核苷酸。在一些实施方案中,第一核酸或第二核酸的包含脱氧核糖核苷酸的核苷酸的数量是或是约100个核苷酸、200个核苷酸、300个核苷酸、400个核苷酸、500个核苷酸、600个核苷酸、700个核苷酸、800个核苷酸、900个核苷酸、1000个核苷酸、2000个核苷酸、3000个核苷酸、4000个核苷酸、5000个核苷酸、6000个核苷酸、7000个核苷酸、8000个核苷酸、9000个核苷酸、10000个核苷酸、20000个核苷酸、30000个核苷酸、40000个核苷酸、50000个核苷酸、60000个核苷酸、70000个核苷酸、80000个核苷酸、90000个核苷酸、100000个核苷酸、200000个核苷酸、300000个核苷酸、400000个核苷酸、500000个核苷酸、600000个核苷酸、700000个核苷酸、800000个核苷酸、900000个核苷酸、1000000个核苷酸、2000000个核苷酸、3000000个核苷酸、4000000个核苷酸、5000000个核苷酸、6000000个核苷酸、7000000个核苷酸、8000000个核苷酸、9000000个核苷酸、10000000个核苷酸,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一核酸或第二核酸的包含脱氧核糖核苷酸的核苷酸的数量是至少、至少约、至多、或至多约100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000。
在一些实施方案中,第一核酸104包括单链核酸。第二核酸120c可包括单链核酸。第一核酸104可包括单链脱氧核糖核酸。第二核酸120c可包括单链脱氧核糖核酸。在不同实施方案中,第一核酸104或第二核酸120c中包含核糖核苷酸的核苷酸108nt-m、108nt_u的百分比和数量可以是不同的。在一些实施方案中,第一核酸或第二核酸的包含核糖核苷酸的核苷酸的百分比是或是约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一核酸或第二核酸的包含脱氧核糖核苷酸的核苷酸的百分比是至少、至少约、至多、或至多约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、或10%。例如,第一核酸的核苷酸的至多1%可包含核糖核苷酸。例如,第二核酸的核苷酸的至多1%可包含核糖核苷酸。在一些实施方案中,第一核酸或第二核酸的包含核糖核苷酸的核苷酸的数量是或是约100个核苷酸、200个核苷酸、300个核苷酸、400个核苷酸、500个核苷酸、600个核苷酸、700个核苷酸、800个核苷酸、900个核苷酸、1000个核苷酸、2000个核苷酸、3000个核苷酸、4000个核苷酸、5000个核苷酸、6000个核苷酸、7000个核苷酸、8000个核苷酸、9000个核苷酸、10000个核苷酸、20000个核苷酸、30000个核苷酸、40000个核苷酸、50000个核苷酸、60000个核苷酸、70000个核苷酸、80000个核苷酸、90000个核苷酸、100000个核苷酸、200000个核苷酸、300000个核苷酸、400000个核苷酸、500000个核苷酸、600000个核苷酸、700000个核苷酸、800000个核苷酸、900000个核苷酸、1000000个核苷酸、2000000个核苷酸、3000000个核苷酸、4000000个核苷酸、5000000个核苷酸、6000000个核苷酸、7000000个核苷酸、8000000个核苷酸、9000000个核苷酸、10000000个核苷酸,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一核酸或第二核酸的包含核糖核苷酸的核苷酸的数量是至少、至少约、至多、或至多约100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、或10000000。例如,第一核酸104可包含至少一个核糖核苷酸。例如,第二核酸120c可包含至少一个核糖核苷酸。
第二核酸120c可包含结合有多个包含第一经修饰的碱基的第一核苷酸108nst_m的第一核酸104。在不同实施方案中,结合在第二核酸120s中的包含第一经修饰的碱基的第一核苷酸108nst_m的数量可以不同。在一些实施方案中,结合在第二核酸中的包含第一经修饰的碱基的第一核苷酸的数量是或是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,结合在第二核酸中的包含第一经修饰的碱基的第一核苷酸的数量是至少、至少约、至多、或至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、或10000000。例如,第二核酸120c包含结合有包含第一经修饰的碱基的第一核苷酸108nst_m中的两个或更多个或三个或更多个第一核苷酸的第一核酸104。
在不同实施方案中,结合在第二核酸120s中的包含第一经修饰的碱基的第一核苷酸108nst_m的百分比可以不同。在一些实施方案中,结合在第二核酸中的包含第一经修饰的碱基的第一核苷酸的百分比是或是约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,结合在第二核酸中的包含第一经修饰的碱基的第一核苷酸的百分比是至少、至少约、至多、或至多约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%,或在这些值中的任何两个值之间的数值或范围。
该第二核酸120c中包含第一经修饰的碱基的第一核苷酸108nt_m中的两个或更多个或三个或更多个第一核苷酸可以是连续的。第二核酸120c可包含一个或多个具有连续的包含第一经修饰的碱基的第一核苷酸108nt_m的区域。在不同实施方案中,具有连续的包含第一经修饰的碱基的第一核苷酸108nt_m的区域的数量可以不同。在一些实施方案中,具有连续的包含第一经修饰的碱基的第一核苷酸的区域的数量是或是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,具有连续的包含第一经修饰的碱基的第一核苷酸的区域的数量是至少、至少约、至多、或至多约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10000。在不同实施方案中,在第二核酸120c的某一区域中连续的包含第一经修饰的碱基的第一核苷酸108nt_m的数量可以不同。在一些实施方案中,在第二核酸的某一区域中连续的包含第一经修饰的碱基的第一核苷酸的数量是或是约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000,或在这些值中的任何两个值之间的数值或范围。在第二核酸的某一区域中连续的包含第一经修饰的碱基的第一核苷酸的数量是或是约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10000。
第一核苷三磷酸108nst_m的第一经修饰的碱基(或本公开的核苷三磷酸的任何经修饰的碱基)可包含经修饰的腺嘌呤、经修饰的鸟嘌呤、经修饰的胞嘧啶、经修饰的胸腺嘧啶、或经修饰的尿嘧啶。第一核苷三磷酸(或本公开的任何核苷三磷酸)可包括例如5-(15-叠氮基-4,7,10,13-四氧杂-十五烷酰基-氨基烯丙基)-2'-脱氧尿苷-5'-三磷酸(叠氮化物-PEG4-氨基烯丙基-dUTP)、N6-(6-叠氮基)己基-3'-脱氧腺苷-5'-三磷酸(N6-(6-叠氮基)己基-3'-dATP),或它们的组合。
在一些实施方案中,第一核苷三磷酸108nst_m包含第一经修饰的碱基和第一辅助寡核苷酸(例如,P7衔接子寡核苷酸或(例如,P衔接子寡核苷酸))。第一核苷三磷酸108nst_m可包含共价连接的第一经修饰的碱基和第一辅助寡核苷酸。
反应
在不同实施方案中,第一核酸104和包含第一经修饰的碱基的第一核苷三磷酸108nst_m与重组末端脱氧核苷酸转移酶112接触的第一反应时间可以不同。例如,第一反应时间是至少10分钟(min)。在一些实施方案中,第一反应时间(或本公开的任何反应时间)是或是约1秒(sec)、2sec、3sec、4sec、5sec、6sec、7sec、8sec、9sec、10sec、11sec、12sec、13sec、14sec、15sec、16sec、17sec、18sec、19sec、20sec、21sec、22sec、23sec、24sec、25sec、26sec、27sec、28sec、29sec、30sec、31sec、32sec、33sec、34sec、35sec、36sec、37sec、38sec、39sec、40sec、41sec、42sec、43sec、44sec、45sec、46sec、47sec、48sec、49sec、50sec、51sec、52sec、53sec、54sec、55sec、56sec、57sec、58sec、59sec、1min、2min、3min、4min、5min、6min、7min、8min、9min、10min、11min、12min、13min、14min、15min、16min、17min、18min、19min、20min、21min、22min、23min、24min、25min、26min、27min、28min、29min、30min、31min、32min、33min、34min、35min、36min、37min、38min、39min、40min、41min、42min、43min、44min、45min、46min、47min、48min、49min、50min、51min、52min、53min、54min、55min、56min、57min、58min、59min、60min、2hr、3hr、4hr、5hr、6hr、7hr、8hr、9hr、10hr、11hr、12hr、13hr、14hr、15hr、16hr、17hr、18hr、19hr、20hr、21hr、22hr、23hr、24hr,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一反应时间(或本公开的任何反应时间)是至少、至少约、至多、或至多约1sec、2sec、3sec、4sec、5sec、6sec、7sec、8sec、9sec、10sec、11sec、12sec、13sec、14sec、15sec、16sec、17sec、18sec、19sec、20sec、21sec、22sec、23sec、24sec、25sec、26sec、27sec、28sec、29sec、30sec、31sec、32sec、33sec、34sec、35sec、36sec、37sec、38sec、39sec、40sec、41sec、42sec、43sec、44sec、45sec、46sec、47sec、48sec、49sec、50sec、51sec、52sec、53sec、54sec、55sec、56sec、57sec、58sec、59sec、1min、2min、3min、4min、5min、6min、7min、8min、9min、10min、11min、12min、13min、14min、15min、16min、17min、18min、19min、20min、21min、22min、23min、24min、25min、26min、27min、28min、29min、30min、31min、32min、33min、34min、35min、36min、37min、38min、39min、40min、41min、42min、43min、44min、45min、46min、47min、48min、49min、50min、51min、52min、53min、54min、55min、56min、57min、58min、59min、60min、2hr、3hr、4hr、5hr、6hr、7hr、8hr、9hr、10hr、11hr、12hr、13hr、14hr、15hr、16hr、17hr、18hr、19hr、20hr、21hr、22hr、23hr、24hr,或在这些值中的任何两个值之间的数值或范围。
在不同实施方案中,第一核酸104和包含第一经修饰的碱基的第一核苷三磷酸108nst_m在第一反应中与重组末端脱氧核苷酸转移酶112接触的第一反应温度可以不同。在一些实施方案中,第一反应温度(或本公开的任何反应温度)是或是约1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一反应温度(或本公开的任何反应温度)是至少、至少约、至多、或至多约1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃,或在这些值中的任何两个值之间的数值或范围。例如,第一温度可以是至少37℃到至少58℃。
在不同实施方案中,第一反应中第一核酸104的浓度可以不同。在一些实施方案中,第一反应(或本公开的任何反应)中的第一核酸(或本公开的任何核酸)的浓度是或是约0.01nM、0.02nM、0.03nM、0.04nM、0.05nM、0.06nM、0.07nM、0.08nM、0.09nM、0.1nM、0.2nM、0.3nM、0.4nM、0.5nM、0.6nM、0.7nM、0.8nM、0.9nM、1nM、2nM、3nM、4nM、5nM、6nM、7nM、8nM、9nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、200nM、300nM、400nM、500nM、600nM、700nM、800nM、900nM、1μM、2μM、3μM、4μM、5μM、6μM、7μM、8μM、9μM、10μM、20μM、30μM、40μM、50μM、60μM、70μM、80μM、90μM、100μM,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一反应(或本公开的任何反应)中的第一核酸(或本公开的任何核酸)的浓度是至少、至少约、至多、或至多约0.01nM、0.02nM、0.03nM、0.04nM、0.05nM、0.06nM、0.07nM、0.08nM、0.09nM、0.1nM、0.2nM、0.3nM、0.4nM、0.5nM、0.6nM、0.7nM、0.8nM、0.9nM、1nM、2nM、3nM、4nM、5nM、6nM、7nM、8nM、9nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、200nM、300nM、400nM、500nM、600nM、700nM、800nM、900nM、1μM、2μM、3μM、4μM、5μM、6μM、7μM、8μM、9μM、10μM、20μM、30μM、40μM、50μM、60μM、70μM、80μM、90μM、或100μM。例如,第一反应中的第一核酸104的浓度可以是至少10nM。
在不同实施方案中,第一反应中的包含第一经修饰的碱基的第一核苷三磷酸108nst_m的浓度可以不同。在一些实施方案中,第一反应(或本公开的任何反应)中的第一核苷三磷酸(或本公开的任何核苷酸三磷酸)的浓度是或是约0.001μM、0.002μM、0.003μM、0.004μM、0.005μM、0.006μM、0.007μM、0.008μM、0.009μM、0.01μM、0.02μM、0.03μM、0.04μM、0.05μM、0.06μM、0.07μM、0.08μM、0.09μM、0.1μM、0.2μM、0.3μM、0.4μM、0.5μM、0.6μM、0.7μM、0.8μM、0.9μM、1μM、2μM、3μM、4μM、5μM、6μM、7μM、8μM、9μM、10μM、20μM、30μM、40μM、50μM、60μM、70μM、80μM、90μM、100μM,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一反应(或本公开的任何反应)中的第一核苷三磷酸(或本公开的任何核苷酸三磷酸)的浓度是至少、至少约、至多、或至多约0.001μM、0.002μM、0.003μM、0.004μM、0.005μM、0.006μM、0.007μM、0.008μM、0.009μM、0.01μM、0.02μM、0.03μM、0.04μM、0.05μM、0.06μM、0.07μM、0.08μM、0.09μM、0.1μM、0.2μM、0.3μM、0.4μM、0.5μM、0.6μM、0.7μM、0.8μM、0.9μM、1μM、2μM、3μM、4μM、5μM、6μM、7μM、8μM、9μM、10μM、20μM、30μM、40μM、50μM、60μM、70μM、80μM、90μM、或100μM。例如,第一反应中的第一核苷三磷酸108nst_m的浓度可以是至少0.1μM。
在不同实施方案中,第一反应中的重组TdT 112的浓度可以不同。在一些实施方案中,第一反应中的重组TdT的浓度是或是约0.01nM、0.02nM、0.03nM、0.04nM、0.05nM、0.06nM、0.07nM、0.08nM、0.09nM、0.1nM、0.2nM、0.3nM、0.4nM、0.5nM、0.6nM、0.7nM、0.8nM、0.9nM、1nM、2nM、3nM、4nM、5nM、6nM、7nM、8nM、9nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、200nM、300nM、400nM、500nM、600nM、700nM、800nM、900nM、1μM、2μM、3μM、4μM、5μM、6μM、7μM、8μM、9μM、10μM、20μM、30μM、40μM、50μM、60μM、70μM、80μM、90μM、100μM,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一反应中的重组TdT的浓度是至少、至少约、至多、或至多约约0.01nM、0.02nM、0.03nM、0.04nM、0.05nM、0.06nM、0.07nM、0.08nM、0.09nM、0.1nM、0.2nM、0.3nM、0.4nM、0.5nM、0.6nM、0.7nM、0.8nM、0.9nM、1nM、2nM、3nM、4nM、5nM、6nM、7nM、8nM、9nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、200nM、300nM、400nM、500nM、600nM、700nM、800nM、900nM、1μM、2μM、3μM、4μM、5μM、6μM、7μM、8μM、9μM、10μM、20μM、30μM、40μM、50μM、60μM、70μM、80μM、90μM、或100μM。例如,第一反应中的重组TdT 112的浓度可以是至少0.1μM。
附加的核苷酸和核苷三磷酸
在一些实施方案中,提供第一核酸和包含第一经修饰的碱基的第一核苷三磷酸包括提供第一核酸、包含第一经修饰的碱基的第一核苷三磷酸、和第二核苷三磷酸(例如,核苷酸三磷酸108nst_u)。在方框116a处使第一核酸和包含第一经修饰的碱基的第一核苷三磷酸与重组TdT接触可包括:在框116a处使第一核酸、包含第一经修饰的碱基的第一核苷三磷酸、和第二核苷三磷酸在第一反应中在第一温度下与重组TdT接触达第一反应时间以生成第二核酸120c。该第二核酸120s可包含结合有以下的第一核酸104:(i)包含来自第一核苷三磷酸的第一经修饰的碱基的第一核苷酸108nst_m中的一个或多个第一核苷酸,以及(ii)一个或多个第二核苷酸(例如,具有未修饰的碱基的核苷酸108nt_u)。
在一些实施方案中,该一个或多个第二核苷酸中的每个第二核苷酸包含来自第二核苷三磷酸的第二经修饰的碱基。该第二核苷三磷酸的第二经修饰的碱基可包括经修饰的腺嘌呤、经修饰的鸟嘌呤、经修饰的胞嘧啶、经修饰的胸腺嘧啶或经修饰的尿嘧啶。第二核苷三磷酸(或本公开的任何核苷三磷酸)可包括例如5-(15-叠氮基-4,7,10,13-四氧杂-十五烷酰基-氨基烯丙基)-2'-脱氧尿苷-5'-三磷酸(叠氮化物-PEG4-氨基烯丙基-dUTP)、N6-(6-叠氮基)己基-3'-脱氧腺苷-5'-三磷酸(N6-(6-叠氮基)己基-3'-dATP),或它们的组合。
在一些实施方案中,第二核苷三磷酸包含第二经修饰的碱基和第二辅助寡核苷酸(例如,P7衔接子寡核苷酸、或P5衔接子寡核苷酸)。第二核苷三磷酸可包含共价连接的第二经修饰的碱基和第二辅助寡核苷酸。
第一核苷三磷酸108nst_m的第一经修饰的碱基和第二核苷三磷酸的第二经修饰的碱基可包含对同一未修饰的碱基的修饰,诸如对腺嘌呤(或鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)的修饰。第一核苷三磷酸108nst_m的第一经修饰的碱基和第二核苷三磷酸的第二经修饰的碱基可以包含对不同的未修饰的碱基的修饰(诸如腺嘌呤和鸟嘌呤的修饰)。
在一些实施方案中,第二核苷酸中的每个第二核苷酸包含来自第二核苷三磷酸(例如,具有未修饰的碱基的核苷三磷酸108nst_u)的第二未修饰的碱基。该第二核苷三磷酸的该第二未修饰的碱基可包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。第一核苷三磷酸108nst_m的第一经修饰的碱基可包含对第二未修饰的碱基的修饰。例如,第一核苷三磷酸108nst_m可包含经修饰的腺嘌呤,并且第二核苷三磷酸可包含腺嘌呤。
在不同实施方案中,第一反应中的作为第一核苷三磷酸108nst_m(或本公开的任何核苷三磷酸,诸如第二核苷三磷酸)的总核苷三磷酸的百分比可以不同。在一些实施方案中,第一反应中的作为第一核苷三磷酸(或本公开的任何核苷三磷酸)的总核苷三磷酸的百分比是或是约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.9%,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一反应中的作为第一核苷三磷酸(或本公开的任何核苷三磷酸)的总核苷三磷酸的百分比是至少、至少约、至多、或至多约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、或99.9%。
在不同实施方案中,包含第一经修饰的碱基的第一核苷三磷酸108nst_m和第二核苷三磷酸(或两个或更多个第二核苷三磷酸,包括所有第二核苷三磷酸)可以不同比率与第一核酸104接触。在一些实施方案中,同第一核酸接触的包含第一经修饰的碱基的第一核苷三磷酸与第二核苷三磷酸(或两个或更多个第二核苷三磷酸)的比率是或是约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,同第一核酸接触的包含第一经修饰的碱基的第一核苷三磷酸与第二核苷三磷酸(或两个或更多个第二核苷三磷酸)的比率是至少、至少约、至多、或至多约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、或1000:1。例如,包含第一经修饰的碱基的第一核苷三磷酸108nst_m和第二核苷三磷酸以范围为约1:100至约100:1的比率与第一核酸104接触。
在不同实施方案中,包含第一经修饰的碱基的第一核苷酸108nt_m和第二核苷酸(或两个或更多个第二核苷三磷酸,包括所有第二核苷三磷酸)可以不同比率结合到第二核酸120s中。在一些实施方案中,结合在第二核酸中的包含第一经修饰的碱基的第一核苷酸与第二核苷酸(或两个或更多个第二核苷三磷酸,包括所有第二核苷三磷酸)的比率是或是约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,结合在第二核酸中的包含第一经修饰的碱基的第一核苷酸与第二核苷酸(或两个或更多个第二核苷三磷酸,包括所有第二核苷三磷酸)的比率是至少、至少约、至多、或至多约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、或1000:1。例如,包含第一经修饰的碱基的第一核苷酸108nt_m和第二核苷酸(例如,108nt_u)可以范围为约1:100至约100:1的比率结合到该第二核酸120s中。
在一些实施方案中,提供第一核酸104和包含第一经修饰的碱基的第一核苷三磷酸108nst_m包括提供第一核酸104、包含第一经修饰的碱基的第一核苷三磷酸108nst_m、和多种第二核苷三磷酸。在动作116a处使第一核酸104和包含第一经修饰的碱基的第一核苷三磷酸108nst_m与重组TdT 112接触可包括在1116a处使第一核酸104、包含第一经修饰的碱基的第一核苷三磷酸108nst_m、和多种第二核苷三磷酸与重组TdT 112在第一反应中在第一温度下接触达第一反应时间以生成第二核酸120s。该第二核酸120s可包含结合有以下的第一核酸104:包含第一经修饰的碱基的第一核苷酸1108nt_m中的一个或多个第一核苷酸和来自多种第二核苷三磷酸的一个或多个第二核苷酸。
在一些实施方案中,该多种第二核苷三磷酸包括脱氧核糖腺嘌呤三磷酸、脱氧核糖鸟嘌呤三磷酸、脱氧核糖胞嘧啶三磷酸、脱氧核糖胸腺嘧啶三磷酸、脱氧核糖尿嘧啶三磷酸,或它们的组合。在不同实施方案中,该多个均包含第二未修饰的碱基的核苷三磷酸中的第二核苷三磷酸的数量可以不同,诸如1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100,或这些值中的任何两个值之间的数值或范围。例如,该多种第二核苷三磷酸中的至少一种或每种第二核苷三磷酸可包含第二未修饰的碱基。在不同实施方案中,该多个均包含第二经修饰的碱基的核苷三磷酸中的第二核苷三磷酸的数量可以不同,诸如1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100,或这些值中的任何两个值之间的数值或范围。例如,该多种第二核苷三磷酸中的至少一种或每种第二核苷三磷酸可包含第二经修饰的碱基。在不同实施方案中,各自包含第二经修饰的碱基的第二核苷三磷酸与各自包含第二未修饰的碱基的第二核苷三磷酸的比率可以不同,诸如1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、或1000:1。
在不同实施方案中,该多种第二核苷三磷酸中的两种第二核苷三磷酸可以不同比率与第一核酸104接触。在一些实施方案中,与第一核酸接触的该多种第二核苷三磷酸中的两种核苷三磷酸的比率是或是约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,与第一核酸接触的多种第二核苷三磷酸中的两种核苷三磷酸的比率是至少、至少约、至多、或至多约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、或1000:1。例如,该多种第二核苷三磷酸中的两种第二核苷三磷酸可以范围为约1:100至约100:1的比率与该第一核酸接触。
在不同实施方案中,该多种第二核苷三磷酸中的两种第二核苷三磷酸可以不同比率结合到第二核酸120s中。在一些实施方案中,结合到第二核酸中的该多种第二核苷三磷酸中的两种核苷三磷酸的比率是或是约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,结合到第二核酸中的多种第二核苷三磷酸中的两种核苷三磷酸的比率是至少、至少约、至多、或至多约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、或1000:1。例如,这些第二核苷酸中的两种第二核苷酸可以范围为约1:100至约100:1的比率结合到该第二核酸中。
在不同实施方案中,核苷酸的经修饰的碱基和未修饰的碱基可以不同比率结合到第二核酸120c中。在一些实施方案中,核苷酸的经修饰的碱基和未修饰的碱基可以为或为约约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1,或在这些值中的任何两个值之间的数值或范围的比率结合到第二核酸120c中。在一些实施方案中,核苷酸的经修饰的碱基和未修饰的碱基可以为至少、至少约、至多、或至多约1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、或1000:1的比率结合到第二核酸中。例如,核苷酸的经修饰的碱基和未修饰的碱基可以范围为约1:100至约100:1的比率结合到第二核酸中。经修饰的碱基可包括第一经修饰的碱基和/或结合到第二核酸中的多种第二核苷酸中的至少一种(诸如1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、100种、200种、300种、400种、500种、600种、700种、800种、900种、或1,000种)或每种第二核苷酸的碱基。未修饰的碱基可包括结合到第二核酸中的多种第二核苷酸中的至少一种或每种第二核苷酸的碱基。
在不同实施方案中,第二核酸120s的包含经修饰的碱基的核苷酸碱基的百分比可以不同。在一些实施方案中,第二核酸的包含经修饰的碱基(或未修饰的碱基)的核苷酸碱基的百分比是或是约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第二核酸的包含经修饰的碱基(或未修饰的碱基)的核苷酸碱基的百分比是至少、至少约、至多、或至多约0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.9%。例如,第二核酸的核苷酸碱基的至少1%包括经修饰的碱基。例如,第二核酸的核苷酸碱基的至少1%包括第一经修饰的碱基。经修饰的碱基可以分布在整个第二核酸中。经修饰的碱基可以随机分布在整个第二核酸中。
第二核酸120c可包含多个具有连续的经修饰的碱基(或未修饰的碱基)的区域。在一些实施方案中,第二核酸120c中的具有连续的经修饰的碱基(或未修饰的碱基)的一个或多个区域的数量是或是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第二核酸120c中的具有连续的经修饰的碱基(或未修饰的碱基)的一个或多个区域的数量是至少、至少约、至多、或至多约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10000。在不同实施方案中,第二核酸120c中的具有连续的经修饰的碱基(或未修饰的碱基)的区域的长度可以不同。在一些实施方案中,第二核酸中的具有连续的经修饰的碱基(或未修饰的碱基)的区域的长度是或是约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第二核酸中的具有连续的经修饰的碱基(或未修饰的碱基)的区域的长度是至少、至少约、至多、或至多约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10000。例如,第二核酸120c可包含多个连续的经修饰的碱基,诸如两个或更多个或三个或更多个连续的经修饰的碱基。
载体
参考图1,第一核酸104可包含能够结合核酸模板128(例如,与该核酸模板杂交)的模板捕获位点104tcs。模板捕获位点104tcs可包含模板捕获序列。核酸模板128可包含能够与模板捕获序列杂交的序列。在不同实施方案中,能够与模板捕获序列杂交的核酸模板128的序列和模板捕获序列的反向互补序列可具有不同的序列同一性。在一些实施方案中,能够与模板捕获序列杂交的核酸模板的序列和模板捕获序列的反向互补序列具有为或为约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或在这些值中的任何两个值之间的数值或范围的序列同一性。在一些实施方案中,能够与模板捕获序列杂交的核酸模板的序列和模板捕获序列的反向互补序列具有为至少、至少约、至多、或至多约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性。例如,核酸模板128可包含与模板捕获序列的反向互补序列具有至少90%的序列同一性的序列。核酸模板128可包括单链核酸,诸如单链DNA。
在一些实施方案中,结合到第二核酸120中的第一核苷三磷酸108nst_m和第一核苷酸108nt_m的第一经修饰的碱基中的一者或多者包含官能部分108fm。第一经修饰的碱基的官能部分108fm可以能够参与点击化学反应。第二核酸120s中的第一核苷三磷酸108nst_m和第一核苷酸108nt_m的第一经修饰的碱基可包含第一饱和或不饱和、取代或未取代的直链或支链脂肪族碳链。第一经修饰的碱基的官能部分和碱基可以在通过第一饱和或不饱和、取代或未取代的直链或支链脂肪族碳链共价连接的第一经修饰的碱基的两个末端上。例如,第一核苷三磷酸可以是5-(15-叠氮基-4,7,10,13-四氧杂-十五烷酰基-氨基烯丙基)-2'-脱氧尿苷-5'-三磷酸(叠氮化物-PEG4-氨基烯丙基-dUTP)或N6-(6-叠氮基)己基-2'脱氧-腺苷-5'-三磷酸(N6-(6-叠氮基)己基-dATP)。
结合到第二核酸120s中的第二核苷三磷酸和第二核苷酸的第二经修饰的碱基中的一者或多者可包含官能部分。第二经修饰的碱基的官能部分可以能够参与点击化学反应。第二核酸120s中的第二核苷三磷酸和第二核苷酸的第二经修饰的碱基可包含第二饱和或不饱和、取代或未取代的直链或支链脂肪族碳链。该第二经修饰的碱基的官能部分和碱基可在通过第二饱和或不饱和、取代或未取代的直链或支链脂肪族碳链共价连接的第二经修饰的碱基的两个末端上。
脂肪族碳链可以共价连接(例如,通过单键、双键、或三键,或缀合)至经修饰的碱基(例如,第二核酸120s中的第一核苷三磷酸108nst_m和第一核苷酸108nt_m的第一经修饰的碱基,或第二核酸120s中的第二核苷三磷酸和第二核苷酸的第二经修饰的碱基)的碱基。官能部分(例如,第一官能部分108fm或第二官能部分)可以通过单键、双键或三键共价连接至脂肪族碳链。
在不同实施方案中,脂肪族碳链可以不同。在一些实施方案中,脂肪族碳链是饱和的。在一些实施方案中,脂肪族碳链是不饱和的。在一些实施方案中,脂肪族碳链是经取代的。在一些实施方案中,脂肪族碳链是未取代的。在一些实施方案中,脂肪族碳链是直链的。在一些实施方案中,脂肪族碳链是支链的。在一些实施方案中,脂肪族碳链的长度是或是约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,脂肪族碳链的长度是至少、至少约、至多、或至多约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000。脂肪族碳链可包括聚乙二醇(PEG)。在一些实施方案中,PEG具有为或为约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100,或在这些值中的任何两个值之间的数值或范围的乙二醇(-OCH2CH2-)重复单元数量n。在一些实施方案中,PEG具有为至少、至少约、至多、或至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100的乙二醇(-OCH2CH2-)重复单元数量n。
结合在第二核酸120s中的第一核苷三磷酸108nst_m和第一核苷酸108nt_m的第一经修饰的碱基的官能部分108fm和结合在第二核酸120s中的第二核苷三磷酸和第二核苷酸的第二经修饰的碱基的官能部分可以相同或不同。结合在第二核酸120s中的该多种第二核苷三磷酸中的两种第二核苷三磷酸和第二核苷酸的经修饰的碱基的官能部分可以相同或不同。结合在第二核酸120s中的该多种第二核苷三磷酸中的全部第二核苷三磷酸和第二核苷酸的经修饰的碱基的官能部分可以相同或不同。
该方法包括提供第一辅助寡核苷酸124ao1(例如,P5衔接子寡核苷酸)或包含第一辅助寡核苷酸124ao1的第一辅助物。该方法可包括在动作116c处使第二核酸120s与第一辅助寡核苷酸124ao1在第二反应中在第二温度下接触达第二反应时间以生成第三核酸120c(例如,载体),该第三核酸包含附接至该第一辅助寡核苷酸124ao1中的一个或多个第一辅助寡核苷酸的第二核酸120c。
在一些实施方案中,提供第一辅助寡核苷酸124ao1包括提供第一辅助寡核苷酸124ao1和第二辅助寡核苷酸124ao2(例如,P7衔接子寡核苷酸)、或包含第二辅助寡核苷酸124ao2的第二辅助物。使该第二核酸120s与该第一辅助寡核苷酸124ao1接触可包括使该第二核酸120s与该第一辅助寡核苷酸124ao1和该第二辅助寡核苷酸124ao2在第二反应中在第二温度下接触达第二反应时间以生成第三核酸120c,该第三核酸包含附接至该第一辅助寡核苷酸124ao1中的一个或多个第一辅助寡核苷酸和该第二辅助寡核苷酸124ao2中的一个或多个第二辅助寡核苷酸的该第二核酸120s。
在一些实施方案中,提供第一辅助寡核苷酸包括提供包含该第一辅助寡核苷酸124ao1和第一聚合物的第一辅助物。使第二核酸120s与第一辅助寡核苷酸124ao1接触可包括使第二核酸120s与第一辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸120c,该第三核酸包含附接至第一辅助物中的一个或多个第一辅助物的第二核酸120s。提供第二辅助寡核苷酸124ao2可包括提供包含该第二辅助寡核苷酸124ao2和第二聚合物的第二辅助物。使第二核酸120s与第二辅助物接触可包括使第二核酸120s与该第二辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸120c,该第三核酸包含附接至第二辅助物中的一个或多个第二辅助物的第二核酸120s。第一辅助物可包含共价连接的第一辅助寡核苷酸124ao1和第一聚合物。第二辅助物可包含共价连接的第二辅助寡核苷酸124ao2和第二聚合物。
在不同实施方案中,具有或不具有任何附接的辅助寡核苷酸(或本公开的任何核酸)的第三核酸128c的尺寸(例如,直径)可以不同。在一些实施方案中,第三核酸(或本公开的任何核酸)的尺寸是或是约0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、1000nm,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第三核酸(或本公开的任何核酸)的尺寸是至少、至少约、至多、或至多约0.04nm、0.05nm、0.06nm、0.07nm、0.08nm、0.09nm、0.1nm、0.2nm、0.3nm、0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、或1000nm。
在一些实施方案中,该第一辅助寡核苷酸124ao2包含第一衔接子序列124as1或其反向互补序列。该第二辅助寡核苷酸可包含第二衔接子序列124as2或其反向互补序列。在一些实施方案中,该第一衔接子序列包含P5序列。该第二衔接子序列可包含P7序列。
在不同实施方案中,第一辅助寡核苷酸(例如,第一辅助寡核苷酸124ao1或第一核苷酸三磷酸108nst_m中的第一辅助寡核苷酸)、第二辅助寡核苷酸(例如,第二辅助寡核苷酸124ao2或第二核苷酸三磷酸中的第二辅助寡核苷酸)、或本公开的任何寡核苷酸的长度可以不同。在一些实施方案中,第一辅助寡核苷酸(或第二辅助寡核苷酸、或本公开的任何寡核苷酸)的长度是或是约5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸、20个核苷酸、21个核苷酸、22个核苷酸、23个核苷酸、24个核苷酸、25个核苷酸、26个核苷酸、27个核苷酸、28个核苷酸、29个核苷酸、30个核苷酸、31个核苷酸、32个核苷酸、33个核苷酸、34个核苷酸、35个核苷酸、36个核苷酸、37个核苷酸、38个核苷酸、39个核苷酸、40个核苷酸、41个核苷酸、42个核苷酸、43个核苷酸、44个核苷酸、45个核苷酸、46个核苷酸、47个核苷酸、48个核苷酸、49个核苷酸、50个核苷酸、51个核苷酸、52个核苷酸、53个核苷酸、54个核苷酸、55个核苷酸、56个核苷酸、57个核苷酸、58个核苷酸、59个核苷酸、60个核苷酸、61个核苷酸、62个核苷酸、63个核苷酸、64个核苷酸、65个核苷酸、66个核苷酸、67个核苷酸、68个核苷酸、69个核苷酸、70个核苷酸、71个核苷酸、72个核苷酸、73个核苷酸、74个核苷酸、75个核苷酸、76个核苷酸、77个核苷酸、78个核苷酸、79个核苷酸、80个核苷酸、81个核苷酸、82个核苷酸、83个核苷酸、84个核苷酸、85个核苷酸、86个核苷酸、87个核苷酸、88个核苷酸、89个核苷酸、90个核苷酸、91个核苷酸、92个核苷酸、93个核苷酸、94个核苷酸、95个核苷酸、96个核苷酸、97个核苷酸、98个核苷酸、99个核苷酸、100个核苷酸、200个核苷酸、300个核苷酸、400个核苷酸、500个核苷酸、600个核苷酸、700个核苷酸、800个核苷酸、900个核苷酸、1000个核苷酸,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一辅助寡核苷酸(或第二辅助寡核苷酸、或本公开的任何寡核苷酸)的长度是至少、至少约、至多、或至多约5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸、20个核苷酸、21个核苷酸、22个核苷酸、23个核苷酸、24个核苷酸、25个核苷酸、26个核苷酸、27个核苷酸、28个核苷酸、29个核苷酸、30个核苷酸、31个核苷酸、32个核苷酸、33个核苷酸、34个核苷酸、35个核苷酸、36个核苷酸、37个核苷酸、38个核苷酸、39个核苷酸、40个核苷酸、41个核苷酸、42个核苷酸、43个核苷酸、44个核苷酸、45个核苷酸、46个核苷酸、47个核苷酸、48个核苷酸、49个核苷酸、50个核苷酸、51个核苷酸、52个核苷酸、53个核苷酸、54个核苷酸、55个核苷酸、56个核苷酸、57个核苷酸、58个核苷酸、59个核苷酸、60个核苷酸、61个核苷酸、62个核苷酸、63个核苷酸、64个核苷酸、65个核苷酸、66个核苷酸、67个核苷酸、68个核苷酸、69个核苷酸、70个核苷酸、71个核苷酸、72个核苷酸、73个核苷酸、74个核苷酸、75个核苷酸、76个核苷酸、77个核苷酸、78个核苷酸、79个核苷酸、80个核苷酸、81个核苷酸、82个核苷酸、83个核苷酸、84个核苷酸、85个核苷酸、86个核苷酸、87个核苷酸、88个核苷酸、89个核苷酸、90个核苷酸、91个核苷酸、92个核苷酸、93个核苷酸、94个核苷酸、95个核苷酸、96个核苷酸、97个核苷酸、98个核苷酸、99个核苷酸、100个核苷酸、100个核苷酸、200个核苷酸、300个核苷酸、400个核苷酸、500个核苷酸、600个核苷酸、700个核苷酸、800个核苷酸、900个核苷酸、或1000个核苷酸。例如,第一辅助寡核苷酸和/或第二辅助寡核苷酸的长度可以均为约10个核苷酸至约100个核苷酸。
第三核酸120c可包含附接至第一辅助寡核苷酸124ao1中的一个或多个第一辅助寡核苷酸的第二核酸120。该第三核酸120c可包含附接至第二辅助寡核苷酸中的一个或多个第二辅助寡核苷酸的第二核酸120s。在不同实施方案中,第三核酸120c可包含不同数量的第一辅助寡核苷酸或第二辅助寡核苷酸。在一些实施方案中,第三核酸包含为或为约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10000个、20000个、30000个、40000个、50000个、60000个、70000个、80000个、90000个、100000个、200000个、300000个、400000个、500000个、600000个、700000个、800000个、900000个、1000000个、2000000个、3000000个、4000000个、5000000个、6000000个、7000000个、8000000个、9000000个、10000000个,或在这些值中的任何两个值之间的数值或范围的第一辅助寡核苷酸或第二辅助寡核苷酸。在一些实施方案中,第三核酸包含为至少、至少约、至多、或至多约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10000个、20000个、30000个、40000个、50000个、60000个、70000个、80000个、90000个、100000个、200000个、300000个、400000个、500000个、600000个、700000个、800000个、900000个、1000000个、2000000个、3000000个、4000000个、5000000个、6000000个、7000000个、8000000个、9000000个、或10000000个的第一辅助寡核苷酸或第二辅助寡核苷酸。例如,第三核酸可包含约10个至约1000000个第一辅助寡核苷酸。例如,第三核酸可包含约10个至约1,000,000个第二辅助寡核苷酸。
在一些实施方案中,提供第一辅助寡核苷酸包括提供包含该第一辅助寡核苷酸和第一聚合物的第一辅助物。使第二核酸与第一辅助寡核苷酸接触可包括使第二核酸与第一辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸,该第三核酸包含附接至第一辅助物中的一个或多个第一辅助物的第二核酸。提供第二辅助寡核苷酸可包括提供包含该第二辅助寡核苷酸和第二聚合物的第二辅助物。使第二核酸与第二辅助物接触可包括使第二核酸与该第二辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸,该第三核酸包含附接至第二辅助物中的一个或多个第二辅助物的第二核酸。第一辅助物可包含共价连接的第一辅助寡核苷酸和第一聚合物。第二辅助物可包含共价连接的第二辅助寡核苷酸和第二聚合物
参考图1,第一辅助寡核苷酸124ao1包含第一官能部分124fm1。第二辅助寡核苷酸124ao2可包含第二官能部分124fm2。第一辅助寡核苷酸124ao1的第一官能部分124fm1可以位于第一辅助寡核苷酸124ao1的5'末端上。第一辅助寡核苷酸124ao1的第一官能部分124fm1可以附接至第一辅助寡核苷酸124ao1的核苷酸间键。第一辅助寡核苷酸中的核苷酸的经修饰的碱基可包含第一辅助寡核苷酸124ao1的第一官能部分124fm1。第一辅助寡核苷酸124ao1的第一官能部分124fm1可以附接至第一辅助寡核苷酸124ao1的核苷酸的糖。第二辅助寡核苷酸124ao2的第二官能部分124fm2可以位于第二辅助寡核苷酸124ao2的5'末端上。第二辅助寡核苷酸124ao2的第二官能部分124fm2可以附接至第二辅助寡核苷酸124ao2的核苷酸间键。第二辅助寡核苷酸中的核苷酸的经修饰的碱基可包含第二辅助寡核苷酸124ao2的第二官能部分124fm2。第二辅助寡核苷酸124ao2的第二官能部分124fm2可以附接至第二辅助寡核苷酸124ao2的核苷酸的糖。
在一些实施方案中,第一辅助寡核苷酸124ao1的第一官能部分124fm1和第二辅助寡核苷酸124ao2的第二官能部分124fm2是相同的。第一辅助寡核苷酸124ao1的第一官能部分124fm1可以能够与第一核苷酸108nt_m的第一经修饰的碱基的官能部分108fm反应以形成共价键。第二辅助寡核苷酸124ao2的第二官能部分124fm2可以能够与第一核苷酸108nt_m的第一经修饰的碱基的官能部分108fm反应以形成共价键。第一辅助寡核苷酸124ao1的第一官能部分124fm1可以能够与第二核苷酸的第二经修饰的碱基的官能部分反应以形成共价键。第二辅助寡核苷酸124ao2的第二官能部分124fm2可以能够与第二核苷酸的第二经修饰的碱基的官能部分反应以形成共价键。
在一些实施方案中,第一辅助寡核苷酸124ao1的第一官能部分124fm1能够参与点击化学反应。第二辅助寡核苷酸124ao2的第二官能部分124fm2可以能够参与点击化学反应。在一些实施方案中,第一辅助寡核苷酸124ao1的第一官能部分124fm1能够参与与结合在第二核酸中的第一核苷酸128nt_m的第一经修饰的碱基的官能部分108fm(或第二核苷酸的第二经修饰的碱基的官能部分)的点击化学反应。第二辅助寡核苷酸124ao2的第二官能部分124fm2可以能够参与与第一核苷酸108nt_m的第一经修饰的碱基的官能部分108fm(或第二核苷酸的第二经修饰的碱基的官能部分)的点击化学反应。
在一些实施方案中,第一辅助寡核苷酸124ao1的第一官能部分124fm1、第二辅助寡核苷酸124ao1的第二官能部分124fm2、第一核苷三磷酸108nst_m的第一经修饰的碱基的官能部分108fm、第一核苷酸108nt_m的官能部分108fm、第二核苷三磷酸的第二经修饰的碱基的官能部分和第二核苷酸的官能部分独立地为叠氮化物、炔基、烯基、硫醇、硝酮,或它们的组合。第一核苷酸的第一经修饰的碱基的官能部分和第一辅助寡核苷酸的第一官能部分、第一核苷酸的第一经修饰的碱基的官能部分和第二辅助寡核苷酸的第二官能部分、第二核苷酸的第二经修饰的碱基的官能部分和第一辅助寡核苷酸的第一官能部分、和/或第二核苷酸的第二经修饰的碱基的官能部分和第二辅助寡核苷酸的第二官能部分,可以独立地选自以下对:(i)叠氮基/炔基;(ii)炔基/叠氮基;(iii)硫醇/炔基;(iv)炔基/硫醇;(v)烯基/硫醇;(vi)硫醇/烯基;(vii)叠氮基/环辛炔基;(viii)环辛炔基/叠氮基;(ix)硝酮/环辛炔基;以及(x)环辛炔基/硝酮。例如,第一核苷酸的第一经修饰的碱基的官能部分和/或第二核苷酸的第二经修饰的碱基的官能部分可以独立地是叠氮基。第一辅助寡核苷酸的第一官能部分和/或第二辅助寡核苷酸的第二官能部分可以独立地为炔基。
在一些实施方案中,点击化学反应包括铜催化的叠氮化物-炔烃环加成(CuAAC)。共价键可以包含三唑基。CuAAC可以包含Cu(I)稳定化配体。该Cu(I)稳定化配体可选自由以下组成的组:3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]丙醇(BTTP)、3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]硫酸氢丙酯(BTTPS)、2-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]硫酸氢乙酯(BTTES)、2-[4-{(双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基)甲基}-1H-1,2,3-三唑-1-基]-乙酸(BTTAA)、红菲绕啉二磺酸二钠盐(BPS)、N,N,N′,N″,N″-五甲基二亚乙基三胺(PMDETA)、三-((1-苄基-1H-1,2,3-三唑-4-基)甲基)胺(TBTA)、三(3-羟丙基三唑基甲基)胺(THPTA)、Nε-((1R,2R)-2-叠氮基环戊氧基)羰基)-L-赖氨酸(ACPK)和4-N,N-二甲基氨基-1,8-萘酰亚胺(4-DMN)。
在一些实施方案中,点击化学反应包括应变促进的叠氮化物-炔烃环加成(SPAAC)。该共价键可包含环辛-三唑基。在一些实施方案中,点击化学反应包括炔烃加氢硫醇化。该共价键可包含烯基硫化物。在一些实施方案中,点击化学反应包括烯烃加氢硫醇化。该共价键可包含烷基硫化物。在一些实施方案中,点击化学反应包括应变促进的炔烃-硝酮环加成(SPANC)。该共价键可包含八氢环辛-异噁唑基。该环辛炔基可以是二苄基环辛炔(DBCO)或其衍生物。在一些实施方案中,点击化学反应是生物相容的。
在不同实施方案中,在相互作用116c处第二核酸120与第一辅助寡核苷酸124ao1和/或第二辅助寡核苷酸124ao2在第二反应中接触时所处的第二温度可以不同。在一些实施方案中,该第二温度是或是约-90℃、-89℃、-88℃、-87℃、-86℃、-85℃、-84℃、-83℃、-82℃、-81℃、-80℃、-79℃、-78℃、-77℃、-76℃、-75℃、-74℃、-73℃、-72℃、-71℃、-70℃、-69℃、-68℃、-67℃、-66℃、-65℃、-64℃、-63℃、-62℃、-61℃、-60℃、-59℃、-58℃、-57℃、-56℃、-55℃、-54℃、-53℃、-52℃、-51℃、-50℃、-49℃、-48℃、-47℃、-46℃、-45℃、-44℃、-43℃、-42℃、-41℃、-40℃、-39℃、-38℃、-37℃、-36℃、-35℃、-34℃、-33℃、-32℃、-31℃、-30℃、-29℃、-28℃、-27℃、-26℃、-25℃、-24℃、-23℃、-22℃、-21℃、-20℃、-19℃、-18℃、-17℃、-16℃、-15℃、-14℃、-13℃、-12℃、-11℃、-10℃、-9℃、-8℃、-7℃、-6℃、-5℃、-4℃、-3℃、-2℃、-1℃、0℃、1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,该第二温度是至少、至少约、至多、或至多约-90℃、-89℃、-88℃、-87℃、-86℃、-85℃、-84℃、-83℃、-82℃、-81℃、-80℃、-79℃、-78℃、-77℃、-76℃、-75℃、-74℃、-73℃、-72℃、-71℃、-70℃、-69℃、-68℃、-67℃、-66℃、-65℃、-64℃、-63℃、-62℃、-61℃、-60℃、-59℃、-58℃、-57℃、-56℃、-55℃、-54℃、-53℃、-52℃、-51℃、-50℃、-49℃、-48℃、-47℃、-46℃、-45℃、-44℃、-43℃、-42℃、-41℃、-40℃、-39℃、-38℃、-37℃、-36℃、-35℃、-34℃、-33℃、-32℃、-31℃、-30℃、-29℃、-28℃、-27℃、-26℃、-25℃、-24℃、-23℃、-22℃、-21℃、-20℃、-19℃、-18℃、-17℃、-16℃、-15℃、-14℃、-13℃、-12℃、-11℃、-10℃、-9℃、-8℃、-7℃、-6℃、-5℃、-4℃、-3℃、-2℃、-1℃、0℃、1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、或90℃。例如,第二温度是约20℃至约65℃。例如,第二温度可以小于0℃。例如,第二温度可以是约-4℃至约-20℃。
在不同实施方案中,在相互作用116c处第二核酸120与第一辅助寡核苷酸124ao1和/或第二辅助寡核苷酸124ao2在第二反应中接触的第二反应时间可以不同。例如,第二反应时间是至少10分钟(min)。在一些实施方案中,第二反应时间(或本公开的任何反应时间)是或是约1秒(sec)、2sec、3sec、4sec、5sec、6sec、7sec、8sec、9sec、10sec、11sec、12sec、13sec、14sec、15sec、16sec、17sec、18sec、19sec、20sec、21sec、22sec、23sec、24sec、25sec、26sec、27sec、28sec、29sec、30sec、31sec、32sec、33sec、34sec、35sec、36sec、37sec、38sec、39sec、40sec、41sec、42sec、43sec、44sec、45sec、46sec、47sec、48sec、49sec、50sec、51sec、52sec、53sec、54sec、55sec、56sec、57sec、58sec、59sec、1min、2min、3min、4min、5min、6min、7min、8min、9min、10min、11min、12min、13min、14min、15min、16min、17min、18min、19min、20min、21min、22min、23min、24min、25min、26min、27min、28min、29min、30min、31min、32min、33min、34min、35min、36min、37min、38min、39min、40min、41min、42min、43min、44min、45min、46min、47min、48min、49min、50min、51min、52min、53min、54min、55min、56min、57min、58min、59min、60min、2hr、3hr、4hr、5hr、6hr、7hr、8hr、9hr、10hr、11hr、12hr、13hr、14hr、15hr、16hr、17hr、18hr、19hr、20hr、21hr、22hr、23hr、24hr,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第二反应时间(或本公开的任何反应时间)是至少、至少约、至多、或至多约1sec、2sec、3sec、4sec、5sec、6sec、7sec、8sec、9sec、10sec、11sec、12sec、13sec、14sec、15sec、16sec、17sec、18sec、19sec、20sec、21sec、22sec、23sec、24sec、25sec、26sec、27sec、28sec、29sec、30sec、31sec、32sec、33sec、34sec、35sec、36sec、37sec、38sec、39sec、40sec、41sec、42sec、43sec、44sec、45sec、46sec、47sec、48sec、49sec、50sec、51sec、52sec、53sec、54sec、55sec、56sec、57sec、58sec、59sec、1min、2min、3min、4min、5min、6min、7min、8min、9min、10min、11min、12min、13min、14min、15min、16min、17min、18min、19min、20min、21min、22min、23min、24min、25min、26min、27min、28min、29min、30min、31min、32min、33min、34min、35min、36min、37min、38min、39min、40min、41min、42min、43min、44min、45min、46min、47min、48min、49min、50min、51min、52min、53min、54min、55min、56min、57min、58min、59min、60min、2hr、3hr、4hr、5hr、6hr、7hr、8hr、9hr、10hr、11hr、12hr、13hr、14hr、15hr、16hr、17hr、18hr、19hr、20hr、21hr、22hr、23hr、24hr,或在这些值中的任何两个值之间的数值或范围。
参考图1,该方法可包括提供核酸模板128,该核酸模板包含第一衔接子序列124as1或其反向互补序列、和第二衔接子序列124as2或其反向互补序列。该方法可包括在动作116c处使第三核酸120c与核酸模板128接触以生成第三核酸120c,该第三核酸具有与该第三核酸120c上的模板捕获位点104tcs杂交的核酸模板128。该方法可包括在动作116d处对与核酸模板128杂交的第三核酸120c执行扩增(例如,桥式扩增或排除扩增)以生成第四核酸120n(在本文中称为纳米粒子),该第四核酸包含附接至第一辅助寡核苷酸124ao1中的一个或多个第一辅助寡核苷酸和第二辅助寡核苷酸124ao2中的一个或多个第二辅助寡核苷酸的第三核酸120c,该第一辅助寡核苷酸和该第二辅助寡核苷酸经延伸以包含该核酸模板128的序列或其反向互补序列。该方法可包括使用第四核酸120n确定核酸模板128的序列。
在不同实施方案中,纳米粒子120n(或第二核酸120s(诸如支架)、或第三核酸120c(诸如载体))的尺寸(例如,直径)可以不同。在一些实施方案中,纳米粒子(或第二核酸、或第三核酸)的尺寸是或是约0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、1000nm,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,纳米粒子(或第二核酸、或第三核酸)的尺寸是至少、至少约、至多、或至多约0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、或1000nm。在边合成边测序中,具有足够空间尺寸的纳米粒子可以能够通过以空间碰撞或位阻排除其他纳米粒子占据相同的孔来占据基底(例如,流动池)上的单个孔,因此导致单克隆性或接近单克隆性。
聚合物
在一些实施方案中,使ssDNA支架120与第一衔接子寡核苷酸124ao1接触包括使ssDNA支架与包含第一衔接子寡核苷酸124ao1和第一聚合物的第一衔接子接触。使ssDNA支架120与第二衔接子寡核苷酸124ao2接触可包括使ssDNA支架与包含第二衔接子寡核苷酸124ao2和第二聚合物的第二衔接子接触。第一衔接子可包含共价连接的第一衔接子寡核苷酸124ao1和第一聚合物。第二衔接子可包含共价连接的第二衔接子寡核苷酸124ao2和第二聚合物。在一些实施方案中,提供第一辅助寡核苷酸包括提供包含该第一辅助寡核苷酸124ao1和第一聚合物的第一辅助物。使第二核酸120s与第一辅助寡核苷酸124ao1接触可包括使第二核酸120s与第一辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸120c,该第三核酸包含附接至第一辅助物中的一个或多个第一辅助物的第二核酸120s。提供第二辅助寡核苷酸124ao2可包括提供包含该第二辅助寡核苷酸124ao2和第二聚合物的第二辅助物。使第二核酸120s与第二辅助物接触可包括使第二核酸120s与该第二辅助物在第二反应中在第二温度下接触达第二反应时间以生成第三核酸120c,该第三核酸包含附接至第二辅助物中的一个或多个第二辅助物的第二核酸120s。第一辅助物可包含共价连接的第一辅助寡核苷酸124ao1和第一聚合物。第二辅助物可包含共价连接的第二辅助寡核苷酸124ao2和第二聚合物。
在一些实施方案中,第一核酸(例如,单链DNA链104)、第二核酸(例如,支架120s)、第三核酸(例如,载体120c)和/或第四核酸(例如,纳米粒子120n)包含第三聚合物。第一核酸、第二核酸、第三核酸和/或第四核酸均可包含一个或多个第三聚合物。在一些实施方案中,第一核酸、第二核酸、第三核酸和/或第四核酸均包含为或为约1个第三聚合物、2个第三聚合物、3个第三聚合物、4个第三聚合物、5个第三聚合物、6个第三聚合物、7个第三聚合物、8个第三聚合物、9个第三聚合物、10个第三聚合物、20个第三聚合物、30个第三聚合物、40个第三聚合物、50个第三聚合物、60个第三聚合物、70个第三聚合物、80个第三聚合物、90个第三聚合物、100个第三聚合物、200个第三聚合物、300个第三聚合物、400个第三聚合物、500个第三聚合物、600个第三聚合物、700个第三聚合物、800个第三聚合物、900个第三聚合物、1000个第三聚合物、2000个第三聚合物、3000个第三聚合物、4000个第三聚合物、5000个第三聚合物、6000个第三聚合物、7000个第三聚合物、8000个第三聚合物、9000个第三聚合物、10000个第三聚合物、20000个第三聚合物、30000个第三聚合物、40000个第三聚合物、50000个第三聚合物、60000个第三聚合物、70000个第三聚合物、80000个第三聚合物、90000个第三聚合物、100000个第三聚合物、200000个第三聚合物、300000个第三聚合物、400000个第三聚合物、500000个第三聚合物、600000个第三聚合物、700000个第三聚合物、800000个第三聚合物、900000个第三聚合物、1000000个第三聚合物,或在这些值中的任何两个值之间的数值或范围。在一些实施方案中,第一核酸、第二核酸、第三核酸和/或第四核酸均包含为至少、至少约、至多、或至多约1个第三聚合物、2个第三聚合物、3个第三聚合物、4个第三聚合物、5个第三聚合物、6个第三聚合物、7个第三聚合物、8个第三聚合物、9个第三聚合物、10个第三聚合物、20个第三聚合物、30个第三聚合物、40个第三聚合物、50个第三聚合物、60个第三聚合物、70个第三聚合物、80个第三聚合物、90个第三聚合物、100个第三聚合物、200个第三聚合物、300个第三聚合物、400个第三聚合物、500个第三聚合物、600个第三聚合物、700个第三聚合物、800个第三聚合物、900个第三聚合物、1000个第三聚合物、2000个第三聚合物、3000个第三聚合物、4000个第三聚合物、5000个第三聚合物、6000个第三聚合物、7000个第三聚合物、8000个第三聚合物、9000个第三聚合物、10000个第三聚合物、20000个第三聚合物、30000个第三聚合物、40000个第三聚合物、50000个第三聚合物、60000个第三聚合物、70000个第三聚合物、80000个第三聚合物、90000个第三聚合物、100000个第三聚合物、200000个第三聚合物、300000个第三聚合物、400000个第三聚合物、500000个第三聚合物、600000个第三聚合物、700000个第三聚合物、800000个第三聚合物、900000个第三聚合物、1000000个第三聚合物。
在一些实施方案中,聚合物(例如,与第一衔接子或第一辅助物的第一辅助寡核苷酸124ao1共价连接的第一聚合物,或与第二衔接子或第二辅助物的第二辅助寡核苷酸124ao1共价连接的第二聚合物,或第一核酸、第二核酸、第三核酸和/或第四核酸的第三聚合物)可以是具有一个重复单元的均聚物。例如,聚合物可包括聚苯乙烯。作为另一示例,聚合物可包括聚(二甲基硅氧烷)。例如,聚合物可包括聚对苯二甲酸乙二醇酯。作为另一示例,聚合物可包括聚乙二醇(PEG)。在一些实施方案中,聚合物可以是具有两个或更多个不同重复单元(诸如2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个不同重复单元)的杂聚物(也被称为共聚物)。在一些实施方案中,聚合物的重复单元可以具有为或为约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000,或在这些值中的任何两个值之间的数值或范围的重复单元数量n。
在一个示例中,使用的聚合物可包括诸如聚(N-(5-叠氮基乙酰胺基戊基)丙烯酰胺-共-丙烯酰胺)(也称为PAZAM)的示例。
“杂聚物”是至少两种不同的重复亚基(单体)组成的大分子。“丙烯酰胺单体”是具有结构或其取代的类似物(例如,甲基丙烯酰胺或N-异丙基丙烯酰胺)的单体。包括丙烯酰胺基团和叠氮基团的单体的示例是上文所示的叠氮基乙酰胺基戊基丙烯酰胺。“烷基”是指完全饱和(即,不包含双键和三键)的直链或支链烃链。示例性烷基基团包括甲基、乙基、丙基、异丙基、丁基、异丁基和叔丁基。作为示例,名称“C1-4烷基”指示烷基链中存在一个至四个碳原子,即,该烷基链选自甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基。
在一个示例中,聚合物可以是杂聚物,并且该杂聚物可包含丙烯酰胺单体,诸如或其取代的类似物(“取代的”是指指定基团中的一个或多个氢原子被另一种原子或基团替换)。在一个示例中,聚合物为杂聚物并且还可包含含叠氮基的丙烯酰胺单体。在一些方面,该杂聚物包括:
在一些方面中,该杂聚物可包括以下结构:
其中x是在1至20,000范围内的整数,并且y是在1至100,000范围内的整数,或其中y是在1至20,000范围内的整数,并且x和z是整数,其中x和z的总和可在1至100,000的范围内,其中每个Rz独立地为H或C1-4烷基,并且分别地,x:y的比率可为约10:90至约1:99,或可为约5:95,或者(x:y):z的比率可为约85:15至约95:5,或可为约90:10(其中x:(y:z)的比率可为约1:(99)至约10:(90),或可为约5:(95))。在这些示例中,约是指一个的相对量可与列出的比率中所述的量相差最多至5%。
核酸产物
本文公开了通过任何修饰本公开的核酸的方法获得的第二核酸(例如,支架120s)的实施方案。本文公开了通过任何修饰本公开的核酸的方法获得的第三核酸(例如,载体120c)的实施方案。本文公开了通过任何修饰本公开的核酸的方法获得的第四核酸(例如,纳米粒子120n)的实施方案。
重组末端脱氧核苷酸转移酶
序列
在一些实施方案中,该重组TdT包含与SEQ ID NO:1至少85%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:1至少90%同一的氨基酸序列。该重组TdT包含可以与SEQID NO:1至少95%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:11至少95%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:12至少80%同一的氨基酸序列。
在一些实施方案中,重组TdT包含与牛或家牛TdT(例如,SEQ ID NO:12)或其片段(例如,SEQ ID NO:12)为或为约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一的氨基酸序列。在一些实施方案中,重组TdT包含与牛或家牛TdT(例如,SEQ ID NO:12)或其片段(例如,SEQID NO:12)为至少、至少约、至多、或至多约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%同一的氨基酸序列。例如,该重组TdT包含与SEQ ID NO:1至少85%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:1至少90%同一的氨基酸序列。该重组TdT包含可以与SEQ ID NO:1至少95%同一的氨基酸序列。
在一些实施方案中,重组TdT包含与牛或家牛TdT(诸如家牛TdT的氨基酸139至520(例如,SEQ ID NO:1))具有高于序列同一性阈值的序列同一性的氨基酸序列。图2示出了家牛TdT的氨基酸139至520的序列。例如,重组末端脱氧核苷酸转移酶(TdT)可包含与SEQ IDNO:1至少80%同一的氨基酸序列。在一些实施方案中,重组TdT包含与牛或家牛TdT的变体或牛或家牛TdT片段的变体(例如,SEQ ID NO:11)具有高于序列同一性阈值的序列同一性的氨基酸序列。例如,重组TdT可包含可与SEQ ID NO:11至少95%同一的氨基酸序列。
取代突变
重组TdT可以在功能上等同于家牛TdT(例如,SEQ ID NO:12)中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的一个或多个位置处包含一个或多个氨基酸取代突变。每个氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。
每个氨基酸取代突变可以是对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸、亲水性氨基酸、或支链氨基酸的取代突变。非极性氨基酸可以是例如丙氨酸、半胱氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、色氨酸、或缬氨酸。极性氨基酸可以是例如天冬氨酸、谷氨酸、精氨酸、组氨酸、赖氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、或酪氨酸。极性氨基酸可以是例如酸性极性氨基酸、碱性极性氨基酸、或非酸性非碱性极性氨基酸。碱性极性氨基酸或带正电的氨基酸可以是例如精氨酸、组氨酸、或赖氨酸。酸性氨基酸或带负电荷的氨基酸可以是例如天冬氨酸或谷氨酸。非酸性非碱性氨基酸可以是例如天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、或酪氨酸。疏水性氨基酸可以是例如异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、酪氨酸、或缬氨酸。芳香族氨基酸可以是例如组氨酸、苯丙氨酸、色氨酸、或酪氨酸。脂肪族(非芳香族)氨基酸可以是例如异亮氨酸、亮氨酸、甲硫氨酸、或缬氨酸。小氨基酸可以是例如丙氨酸、甘氨酸、脯氨酸、或丝氨酸。亲水性氨基酸可以是例如精氨酸、天冬酰胺、天冬氨酸、谷氨酰胺、谷氨酸、组氨酸、赖氨酸、丝氨酸、或苏氨酸。支链氨基酸可以是例如异亮氨酸、亮氨酸、缬氨酸。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于Glu191的位置处的氨基酸取代突变可包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸、或支链氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是对丙氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是Glu191Ala、Glu191Arg、Glu191Asn、Glu191Asp、Glu191Cys、Glu191Gln、Glu191Gly、Glu191His、Glu191Ile、Glu191Leu、Glu191Lys、Glu191Met、Glu191Phe、Glu191Pro、Glu191Ser、Glu191Thr、Glu191Trp、Glu191Tyr、或Glu191Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是Glu191Ala、Glu191Gly、Glu191Ile、Glu191Leu、Glu191Met、或Glu191Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191的位置处的氨基酸取代突变可以是Glu191Val。重组TdT可包含与SEQ ID NO:2具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以包括对极性氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是对天冬酰胺、谷氨酰胺、丝氨酸、或苏氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是Lys193Ala、Lys193Arg、Lys193Asn、Lys193Asp、Lys193Cys、Lys193Gln、Lys193Glu、Lys193Gly、Lys193His、Lys193Ile、Lys193Leu、Lys193Met、Lys193Phe、Lys193Pro、Lys193Ser、Lys193Thr、Lys193Trp、Lys193Tyr、或Lys193Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是Lys193Asn、Lys193Gln、Lys193Ser、或Lys193Thr。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193的位置处的氨基酸取代突变可以是Lys193Asn。重组TdT可包含与SEQ ID NO:3具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是对丙氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是Glu194Ala、Glu194Arg、Glu194Asn、Glu194Asp、Glu194Cys、Glu194Gln、Glu194Gly、Glu194His、Glu194Ile、Glu194Leu、Glu194Lys、Glu194Met、Glu194Phe、Glu194Pro、Glu194Ser、Glu194Thr、Glu194Trp、Glu194Tyr、或Glu194Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是Glu194Ala、Glu194Gly、Glu194Ile、Glu194Leu、Glu194Met、或Glu194Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu194的位置处的氨基酸取代突变可以是Glu194Gly。重组TdT可包含与SEQ ID NO:4具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可包括对极性氨基酸或芳香族氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是对天冬酰胺、谷氨酰胺、苯丙氨酸、丝氨酸、苏氨酸、色氨酸、或酪氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是Asp242Ala、Asp242Arg、Asp242Asn、Asp242Cys、Asp242Gln、Asp242Glu、Asp242Gly、Asp242His、Asp242Ile、Asp242Leu、Asp242Lys、Asp242Met、Asp242Phe、Asp242Pro、Asp242Ser、Asp242Thr、Asp242Trp、Asp242Tyr、或Asp242Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是Asp242Asn、Asp242Gln、Asp242Phe、Asp242Ser、Asp242Thr、Asp242Trp、或Asp242Tyr。在功能上等同于SEQ ID NO:12的家牛TdT中的Asp242的位置处的氨基酸取代突变可以是Asp242Tyr。重组TdT可包含与SEQ ID NO:5具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以包括对极性氨基酸、带负电的氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ IDNO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是对天冬氨酸或谷氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是Lys287Ala、Lys287Arg、Lys287Asn、Lys287Asp、Lys287Cys、Lys287Gln、Lys287Glu、Lys287Gly、Lys287His、Lys287Ile、Lys287Leu、Lys287Met、Lys287Phe、Lys287Pro、Lys287Ser、Lys287Thr、Lys287Trp、Lys287Tyr、或Lys287Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是Lys287Asp或Lys287Glu。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys287的位置处的氨基酸取代突变可以是Lys287Glu。重组TdT可包含与SEQ ID NO:6具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是对丙氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是Phe296Ala、Phe296Arg、Phe296Asn、Phe296Asp、Phe296Cys、Phe296Gln、Phe296Glu、Phe296Gly、Phe296His、Phe296Ile、Phe296Leu、Phe296Lys、Phe296Met、Phe296Pro、Phe296Ser、Phe296Thr、Phe296Trp、Phe296Tyr、或Phe296Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是Phe296Ala、Phe296Gly、Phe296Ile、Phe296Leu、Phe296Met、或Phe296Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Phe296的位置处的氨基酸取代突变可以是Phe296Leu。重组TdT可包含与SEQ ID NO:7具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变包括对极性氨基酸、带正电的氨基酸、或亲水性氨基酸的突变。对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸、或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以包括对极性氨基酸、带正电的氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是对精氨酸、精氨酸、组氨酸、或赖氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是Met299Ala、Met299Arg、Met299Asn、Met299Asp、Met299Cys、Met299Gln、Met299Glu、Met299Gly、Met299His、Met299Ile、Met299Leu、Met299Lys、Met299Phe、Met299Pro、Met299Ser、Met299Thr、Met299Trp、Met299Tyr、或Met299Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是Met299Arg、Met299His、或Met299Lys。在功能上等同于SEQ ID NO:12的家牛TdT中的Met299的位置处的氨基酸取代突变可以是Met299Lys。重组TdT可包含与SEQ ID NO:8具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变包括对极性氨基酸、脂肪族氨基酸、或亲水性氨基酸的突变。对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸、或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以包括对极性氨基酸、脂肪族氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是对天冬酰胺、胱氨酸、谷氨酰胺、脯氨酸、或丝氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是Thr342Ala、Thr342Arg、Thr342Asn、Thr342Asp、Thr342Cys、Thr342Gln、Thr342Glu、Thr342Gly、Thr342His、Thr342Ile、Thr342Leu、Thr342Lys、Thr342Met、Thr342Phe、Thr342Pro、Thr342Ser、Thr342Trp、Thr342Tyr、或Thr342Val。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是Thr342Asn、Thr342Cys、Thr342Gln、Thr342Pro、或Thr342Ser。在功能上等同于SEQ ID NO:12的家牛TdT中的Thr342的位置处的氨基酸取代突变可以是Thr342Ser。重组TdT可包含与SEQ ID NO:9具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变包括对极性氨基酸、脂肪族氨基酸、或亲水性氨基酸的突变。对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸、或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以包括对极性氨基酸、脂肪族氨基酸或亲水性氨基酸的突变。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是对丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、或缬氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是对天冬酰胺、胱氨酸、谷氨酰胺、脯氨酸、丝氨酸、或苏氨酸的氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是His421Ala、His421Arg、His421Asn、His421Asp、His421Cys、His421Gln、His421Glu、His421Gly、His421Ile、His421Leu、His421Lys、His421Met、His421Phe、His421Pro、His421Ser、His421Thr、His421Trp、His421Tyr、或His421Val。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是His421Asn、His421Cys、His421Gln、His421Pro、His421Ser、或His421Thr。在功能上等同于SEQ ID NO:12的家牛TdT中的His421的位置处的氨基酸取代突变可以是His421Pro。重组TdT可包含与SEQ ID NO:10具有高于序列同一性阈值的序列同一性的氨基酸序列。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的两个或更多个位置处包含两个或更多个氨基酸取代突变。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的三个或更多个位置处包含三个或更多个氨基酸取代突变。重组TdT可在功能上等同于SEQ IDNO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的四个或更多个位置处包含四个或更多个氨基酸取代突变。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的五个或更多个位置处包含五个或更多个氨基酸取代突变。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的六个或更多个位置处包含六个或更多个氨基酸取代突变。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的七个或更多个位置处包含七个或更多个氨基酸取代突变。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个或更多个位置处包含八个或更多个氨基酸取代突变。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299和His421的位置处包含八个氨基酸取代突变。重组TdT可在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的位置处包含九个氨基酸取代突变。
在一些实施方案中,在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的两个或更多个位置处的两个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的两者或更多者。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的三个或更多个位置处的三个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的三者或更多者。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的四个或更多个位置处的四个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的四者或更多者。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的五个或更多个位置处的五个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的五者或更多者。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的六个或更多个位置处的六个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的六者或更多者。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的七个或更多个位置处的七个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的七者或更多者。在功能上等同于SEQ IDNO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个或更多个位置处的八个或更多个氨基酸取代突变可分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299和His421的位置处的八个氨基酸取代突变可以分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys和His421Pro。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的九个位置处的九个氨基酸取代突变可以分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。
在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个位置处包含八个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个位置处的八个氨基酸取代突变可以分别是Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。在一些实施方案中,重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的位置处包含九个氨基酸取代突变。在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的位置处的九个氨基酸取代突变可以分别是Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。
热稳定性
在一些实施方案中,重组TdT在47℃或更高的温度下是稳定的。重组TdT可以在50℃或更高的温度下是稳定的。重组TdT可以在55℃或更高的温度下是稳定的。重组TdT可以在58℃或更高的温度下是稳定的。
重组TdT可以是热稳定的。在不同实施方案中,重组TdT可以在不同温度下是稳定的。在一些实施方案中,重组TdT可以在为或为约40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃或更高的温度下是稳定的。例如,重组TdT可以在47℃或更高的温度下是稳定的。重组TdT可以在50℃或更高的温度下是稳定的。重组TdT可以在55℃或更高的温度下是稳定的。重组TdT可以在58℃或更高的温度下是稳定的。重组TdT可以在为至少、至少约、至多、或至多约40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃,或在这些值中的任何两个值之间的数值或范围的温度下是稳定的。
活性
在一些实施方案中,在相同的测试温度下,重组TdT的末端脱氧核苷酸转移酶活性是SEQ ID NO:12的家牛TdT的末端脱氧核苷酸转移酶活性的至少80%、85%、90%、95%、100%、105%、110%、115%或120%。测试温度可以是37℃、47℃、50℃、55℃、或58℃。
重组TdT的末端脱氧核苷酸转移酶活性可以高于或低于牛或家牛TdT或其片段。在一些实施方案中,重组TdT的末端脱氧核苷酸转移酶活性是在相同测试温度下为或为约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、101%、102%、103%、104%、105%、106%、107%、108%、109%、110%、111%、112%、113%、114%、115%、116%、117%、118%、119%、120%、121%、122%、123%、124%、125%、126%、127%、128%、129%、130%、131%、132%、133%、134%、135%、136%、137%、138%、139%、140%、141%、142%、143%、144%、145%、146%、147%、148%、149%、150%、151%、152%、153%、154%、155%、156%、157%、158%、159%、160%、161%、162%、163%、164%、165%、166%、167%、168%、169%、170%、171%、172%、173%、174%、175%、176%、177%、178%、179%、180%、181%、182%、183%、184%、185%、186%、187%、188%、189%、190%、191%、192%、193%、194%、195%、196%、197%、198%、199%、200%或更高的SEQ ID NO:12的家牛TdT或SEQ ID NO:14的重组TdT的末端脱氧核苷酸转移酶活性。在一些实施方案中,重组TdT的末端脱氧核苷酸转移酶活性是在相同测试温度下SEQ ID NO:12的家牛TdT或SEQ IDNO:14的重组TdT的末端脱氧核苷酸转移酶活性的至少、至少约、至多、或至多约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、101%、102%、103%、104%、105%、106%、107%、108%、109%、110%、111%、112%、113%、114%、115%、116%、117%、118%、119%、120%、121%、122%、123%、124%、125%、126%、127%、128%、129%、130%、131%、132%、133%、134%、135%、136%、137%、138%、139%、140%、141%、142%、143%、144%、145%、146%、147%、148%、149%、150%、151%、152%、153%、154%、155%、156%、157%、158%、159%、160%、161%、162%、163%、164%、165%、166%、167%、168%、169%、170%、171%、172%、173%、174%、175%、176%、177%、178%、179%、180%、181%、182%、183%、184%、185%、186%、187%、188%、189%、190%、191%、192%、193%、194%、195%、196%、197%、198%、199%、200%,或在这些值中的任何两个值之间的数值或范围。例如,重组TdT的末端脱氧核苷酸转移酶活性可以是或至少是在相同测试温度下SEQ ID NO:12的家牛TdT或SEQ ID NO:14的重组TdT的末端脱氧核苷酸转移酶活性的80%、85%、90%、95%、100%、105%、110%、115%、或120%。
在不同实施方案中,测试温度可以不同。在一些实施方案中,测试温度为或为约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃或更高。例如,测试温度可以是37℃、47℃、50℃、55℃或58℃。在一些实施方案中,测试温度是至少、至少约、至多、或至多约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃,或在这些值中的任何两个值之间的数值或范围。
附加组分
在一些实施方案中,重组TdT包含小泛素样修饰剂(SUMO)片段。SUMO片段包含可以与SEQ ID NO:13至少80%同一的氨基酸序列。重组TdT可包含在该重组TdT的N末端上的SUMO片段。重组TdT可以包含与SEQ ID NO:14至少80%同一的氨基酸序列。重组TdT可以包含与SEQ ID NO:15至少80%同一的氨基酸序列。重组TdT可包含在该重组TdT的C末端上的SUMO片段。
在一些实施方案中,重组TdT包含用于纯化的标签,诸如His标签或谷胱甘肽S-转移酶。用于纯化的标签可以在重组TdT的N末端上、重组TdT的C末端上、或重组TdT的内部。重组TdT可以包含蛋白酶切割序列,诸如LeuValProArg/GlySer(凝血酶切割位点)或LeuGluValLeuPheGln/GlyPro(预剪切蛋白酶切割位点),该蛋白酶切割序列位于用于纯化的标签与另一组分(例如,牛TdT片段)或重组TdT的其余部分之间。
在一些实施方案中,重组TdT包含小泛素样修饰剂(SUMO)蛋白或其片段。在不同实施方案中,重组TdT中的SUMO蛋白或其片段的序列可以不同。在一些实施方案中,重组TdT中的SUMO蛋白或其片段包含与SUMO蛋白(例如,酵母中mif two 3的抑制因子SMT3)或其片段(例如,包含SEQ ID NO:13的氨基酸序列的SUMO片段)为或为约51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一的氨基酸序列。例如,重组TdT中的SUMO片段可包含与SEQ ID NO:13至少80%同一的氨基酸序列。在一些实施方案中,重组TdT中的SUMO蛋白或其片段包含与SUMO蛋白(例如,酵母中mif two 3的抑制因子SMT3)或其片段(例如,包含SEQ ID NO:13的氨基酸序列的SUMO片段)为至少、至少约、至多、或至多约51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一的氨基酸序列。
在不同实施方案中,SUMO片段在重组TdT中的位置可以不同。在一些实施方案中,重组TdT包含在重组TdT的N末端上的SUMO片段。在一些实施方案中,重组TdT包含在重组TdT的C末端上的SUMO片段。
重组TdT可包含与包含SUMO片段的重组TdT(例如,具有包含SEQ ID NO:14或SEQID NO:15的氨基酸序列的SUMO片段的重组TdT)具有为或为约序列同一性阈值的序列同一性的氨基酸序列。重组TdT可包含与包含SUMO片段的重组TdT(例如,SEQ ID NO:14、或SEQID NO:15)具有高于、高于约、低于、或低于约序列同一性阈值的序列同一性的氨基酸序列。重组TdT可包含与包含SUMO片段的重组TdT(例如,SEQ ID NO:14、或SEQ ID NO:15)具有为至少、至少约、至多、或至多约序列同一性阈值的序列同一性的氨基酸序列。在不同实施方案中,序列同一性阈值可以不同。在一些实施方案中,序列同一性阈值是50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或在这些值中的任何两个值之间的数值或范围。例如,重组TdT可包含与SEQ ID NO:14至少80%同一的氨基酸序列。作为另一示例,重组TdT可包含与SEQ ID NO:15至少80%同一的氨基酸序列。
测序
文库制备
可以按任何合适的方式制备包含多核苷酸的文库,以将寡核苷酸衔接子附接至靶多核苷酸。如本文所用,“文库”是来自给定的来源或样品的多核苷酸群体。文库包括多个靶多核苷酸。如本文所用,“靶多核苷酸”是所需测序的多核苷酸。目标多核苷酸基本上可以是任何已知或未知序列的多核苷酸。其可以是例如基因组DNA或cDNA的片段。测序可导致对靶多核苷酸的全部或一部分的序列的确定。目标多核苷酸可以来源于已被随机片段化的初级多核苷酸样品。可以通过在每个靶片段的末端处放置通用引物序列将靶多核苷酸加工成适用于扩增的模板。靶多核苷酸也可通过逆转录成cDNA从初级RNA样品获得。
如本文所用,术语“多核苷酸”和“寡核苷酸”可以互换使用,并且是指包含通常通过磷酸二酯键彼此共价结合的两个或更多个核苷酸单体的分子。多核苷酸通常含有比寡核苷酸更多的核苷酸。出于说明而非限制的目的,多核苷酸可以被认为含有15个、20个、30个、40个、50个、100个、200个、300个、400个、500个或更多核苷酸,而寡核苷酸则可以被认为含有100个、50个、20个、15个或更少的核苷酸。
多核苷酸和寡核苷酸可以包括脱氧核糖核酸(DNA)或核糖核酸(RNA)。这些术语应当被理解为包括由核苷酸类似物制成的DNA或RNA的类似物作为等同物,并且适用于单链(诸如有义或反义)多核苷酸和双链多核苷酸。如本文所用,该术语还涵盖cDNA,即由RNA模板例如通过逆转录酶的作用产生的互补DNA或拷贝DNA。
初级多核苷酸分子可以来源于双链DNA(dsDNA)形式(例如基因组DNA片段、PCR和扩增产物等),或者可能来源于单链形式,如DNA或RNA,然后被转化为dsDNA形式。举例来说,可以使用本领域熟知的标准技术将mRNA分子复制成双链cDNA。初级多核苷酸的精确序列对于本文所提出的公开内容通常并不重要,可以是已知的,也可以是未知的。
在一些实施方案中,初级靶多核苷酸是RNA分子。在此类实施方案的一个方面中,首先使用本领域已知的技术将分离自特定样品的RNA转化成双链DNA。然后可以用文库特异性标签对该双链DNA加索引标签。可以从分离自不同来源或样品的RNA并行生成包含文库特异性索引标签的这种双链DNA的不同制备物。随后,可以将包含不同文库特异性索引标签的双链DNA的不同制备物混合,一同测序,然后借助文库特异性索引标签序列的存在,关于每个测序片段分离自/来源于的文库确定每个测序片段的身份。
在一些实施方案中,初级靶多核苷酸是DNA分子。例如,初级多核苷酸可以代表生物体的完整遗传互补序列,并且是基因组DNA分子,诸如人DNA分子,既包括内含子和外显子这两种序列(编码序列),还包括非编码调节序列,诸如启动子序列和增强子序列。然而,可以设想还可以使用多核苷酸序列或基因组DNA的特定子集,诸如特定染色体或其一部分。在许多实施方案中,初级多核苷酸的序列是未知的。DNA目标多核苷酸可以在片段化过程(诸如随机片段化过程)之前或之后,以及在连接衔接子寡核苷酸之前、期间或之后进行化学处理或酶处理。
优选地,将初级靶多核苷酸片段化为适用于测序的适当长度。目标多核苷酸能够以任何合适的方式片段化。优选地,目标多核苷酸被随机片段化。随机片段化是指通过例如酶、化学或机械手段以无序方式将多核苷酸片段化。这种片段化方法是本领域中已知的,并且利用标准方法(Sambrook和Russell,Molecular Cloning,A Laboratory Manual,第三版)。为清楚起见,经由较大一段多核苷酸的较小片段的特异性PCR扩增生成此类较小片段并不等同于将这较大一段多核苷酸片段化,因为该较大一段多核苷酸保持完整(即,不被PCR扩增片段化)。此外,随机片段化被设计成产生与包含和/或围绕断裂的核苷酸的序列同一性或位置无关的片段。
在一些实施方案中,随机片段化是通过机械手段(诸如雾化或超声处理)产生长度为约50个碱基对至长度为约1500个碱基对(诸如长度为50个至700个碱基对或长度为50个至500个碱基对)的片段。
通过机械手段(例如,雾化、超声处理和Hydroshear)将多核苷酸分子片段化可以产生具有3'-悬垂末端和5'-悬垂末端的异质混合物的片段。可以使用本领域已知的方法或试剂盒(例如Lucigen DNA终止子末端修复试剂盒)修复片段末端,以生成最适宜插入例如克隆载体的平端位点的末端。在一些实施方案中,核酸群体的片段末端是平末端。这些片段末端可以是平端,并且是磷酸化的。可以经由酶处理(例如使用多核苷酸激酶)来引入磷酸部分。
在一些实施方案中,靶多核苷酸序列用单一悬垂核苷酸通过例如某些类型的DNA聚合酶(诸如Taq聚合酶或Klenow exo minus聚合酶)的活性来制备,所述DNA聚合酶具有非模板依赖性末端转移酶活性,其将单一脱氧核苷酸(例如脱氧腺苷(A))添加到例如PCR产物的3'末端。此类酶可以用于将单一核苷酸“A”添加到目标多核苷酸双链体的每条链的3'末端。因此,可以通过与Taq或Klenow exo minus聚合酶反应将“A”添加到目标多核苷酸双链体的每条末端修复链的3'末端,而衔接子多核苷酸构建体可以是T构建体,其具有存在于该衔接子构建体的每个双链体区的3'末端上的相容的“T”悬垂部。该末端修饰还防止目标多核苷酸的自连接,使得偏向于形成组合的连接衔接子-目标多核苷酸。
在一些实施方案中,通过标记实现片段化,如在例如国际专利申请公开WO 2016/130704中所述。在此类方法中,采用转座酶将双链多核苷酸片段化,然后将通用引物序列附着到双链多核苷酸的一条链中。所得分子可以是间隙填充分子,并且可以使用引物进行延伸(例如通过PCR扩增),所述引物的3'末端具有与所附着的通用引物序列互补的序列,5'末端则含有衔接子的其他序列。
衔接子能够以任何其他合适的方式附着到目标多核苷酸。在一些方案中,衔接子是在多步过程(诸如两步过程)中引入的,该多步过程涉及将衔接子的一部分连接到具有通用引物序列的靶多核苷酸上。第二步包括使用引物进行延伸(例如通过PCR扩增),所述引物的3'末端具有与所附着的通用引物序列互补的序列,5'末端则含有衔接子的其他序列。举例来说,此类延伸可以如美国专利号8,053,192中所述执行。可以执行附加的延伸,以提供连接到先前延伸得到的多核苷酸的5'末端的附接序列。
在一些实施方案中,将整个衔接子连接至片段化的靶多核苷酸。优选地,连接的衔接子包含与双链靶多核苷酸连接的双链区。优选地,该双链区尽可能短,而不丧失功能。在该语境中,“功能”是指双链区在标准反应条件下形成稳定双链体的能力。在一些实施方案中,标准反应条件是指用于酶催化的多核苷酸连接反应的反应条件(其将是有技术的读者所熟知的)(例如,在4℃至25℃范围内的温度下,在适合于酶的连接缓冲液中孵育),其使得形成衔接子的两条链在衔接子与目标分子连接期间保持部分退火。连接方法是本领域中已知的,并且可利用标准方法(Sambrook和Russell,Molecular Cloning,A LaboratoryManual,第三版)。此类方法利用连接酶(诸如DNA连接酶)来实现或催化两条多核苷酸链(在这种情况下,为衔接子双链体寡核苷酸和目标多核苷酸双链体的两条多核苷酸链)的末端的连接,使得形成共价键。衔接子双链体寡核苷酸可以含有5'-磷酸部分,以便促进与目标多核苷酸3'-OH的连接。靶多核苷酸可以含有5'-磷酸部分,该部分是剪切过程的残留物,或是使用酶处理步骤添加的,并且已进行末端修复,任选地通过一个或多个悬垂碱基延伸,从而得到适合连接的3'-OH。在该语境中,附着意指先前未共价连接的多核苷酸链的共价连接。在本发明的具体方面中,这种附接通过在两条多核苷酸链之间形成磷酸二酯键而发生,但是也可以使用其他共价连接方式(例如非磷酸二酯骨架键)。衔接子与靶多核苷酸的连接更详细地描述于例如美国专利号8,053,192中。
任何合适的衔接子可以经由任何合适的方法(诸如上文论述的那些)附着到目标多核苷酸。衔接子包括文库特异性索引标签序列。在将样品固定以供测序之前,可以将该索引标签序列附着到来自每个文库的目标多核苷酸。该索引标签本身不是由目标多核苷酸的一部分形成的,而是成为扩增模板的一部分。索引标签可以是作为模板制备步骤的一部分添加到靶标的合成的核苷酸序列。因此,文库特异性索引标签是附着到特定文库的每个目标分子的核酸序列标签,其存在指示或用于鉴定从中分离出这些目标分子的文库。
优选地,索引标签序列的长度为20个核苷酸或更少的核苷酸。例如,索引标签序列的长度可以是1至10个核苷酸,或4至6个核苷酸。四核苷酸索引标签提供了在同一阵列上复用256个样品的可能性,六碱基索引标签则使得能够在同一阵列上处理4,096个样品。
衔接子可以包含多于一个索引标签,从而可以增大复用的可能性。
衔接子优选地包含双链区,以及包含两条非互补单链的区域。衔接子的双链区可以具有任何合适数目的碱基对。优选地,双链区是短双链区,其通常包括5个或更多个连续碱基对,由两条部分互补的多核苷酸链退火形成。衔接子的这种“双链区”是指其中两条链退火的区域,并不暗示任何特定的结构构象。在一些实施方案中,该双链区包括20个或更少的连续碱基对,诸如10个或更少的、或者5个或更少的连续碱基对。
通过包含表现出比标准沃森-克里克碱基对更强的碱基配对的非天然核苷酸,可以增加双链区的稳定性,因此潜在地缩短其长度。优选地,衔接子的两条链在双链区中是100%互补的。
当衔接子附接至靶多核苷酸时,非互补单链区可以形成待测序的多核苷酸的5'末端和3'末端。术语“非互补单链区”是指衔接子的以下区域:其中形成衔接子的两条多核苷酸链的序列表现出一定程度的非互补性,使得这两条链不能在用于PCR反应的标准退火条件下彼此完全退火。
非互补单链区由形成双链区的同两条多核苷酸链的不同部分提供。单链部分长度的下限通常将通过例如提供用于结合引物以供引物延伸、PCR和/或测序的合适序列的功能来确定。理论上不存在不匹配区域长度的上限,只不过通常有利的是使衔接子的总长度最小化,例如,以便在一个或多个附着步骤之后促进未结合的衔接子从衔接子-目标构建体分离。因此,通常优选的是,衔接子的非互补单链区长度为50个或更少的连续核苷酸,诸如长度为40个或更少的、30个或更少的、或者25个或更少的连续核苷酸。
文库特异性索引标签序列可以位于衔接子的单链区或双链区中,或者跨越衔接子的单链区和双链区。优选地,索引标签序列位于衔接子的单链区中。
除索引标签序列外,衔接子还可以包括任何其他合适的序列。例如,衔接子可以包括通用延伸引物序列,其通常位于衔接子和所得的用于测序的多核苷酸的5'末端或3'末端。通用延伸引物序列可以与结合到固体基底表面的互补引物杂交。互补引物包括游离的3'末端,聚合酶或其他合适的酶可以从该3'末端添加核苷酸,以使用杂交的文库多核苷酸作为模板延伸序列,使得文库多核苷酸的反向链偶联到固体表面。这种延伸可以是测序运行或簇扩增的一部分。
在一些实施方案中,衔接子包含一个或多个通用测序引物序列。通用测序引物序列可以与测序引物结合,以允许对索引标签序列、目标序列或者索引标签序列和目标序列测序。
衔接子的精确核苷酸序列通常对于本发明来说并不重要,并且可以由用户选择,使得期望的序列元件最终包括在来源于衔接子的模板文库的共用序列中,以例如提供特定组的通用延伸引物和/或测序引物的结合位点。
衔接子寡核苷酸可以包含核酸外切酶抗性修饰,诸如硫代磷酸酯键。
优选地,将衔接子附着到目标多肽的两端以产生具有第一衔接子-目标-第二衔接子核苷酸序列的多核苷酸。第一衔接子和第二衔接子可以相同,也可以不同。优选地,第一衔接子和第二衔接子是相同的。如果第一衔接子和第二衔接子是不同的,则第一衔接子和第二衔接子中的至少一者包含文库特异性索引标签序列。
应理解的是“第一衔接子-靶标-第二衔接子序列”或“衔接子-靶标-衔接子”序列是指衔接子相对于彼此以及相对于靶标的取向,不一定意味着该序列可能不包括附加序列,诸如接头序列。
可以采用类似的方式制备其他文库,每个文库包括至少一个文库特异性索引标签序列或索引标签序列组合,其不同于来自其他文库的索引标签序列或索引标签序列组合。
如本文所用,“附着”或“结合”在衔接子相对于目标序列的语境中可互换使用。如上所述,可以使用任何合适的方法将衔接子附着到目标多核苷酸上。例如,衔接子可以通过以下方式附着到目标:通过用连接酶连接;通过以下操作的组合,即连接衔接子的一部分,以及用含有衔接子的另外或剩余部分的引物通过延伸(诸如PCR)添加衔接子的另外或剩余部分;通过转座以结合衔接子的一部分,以及用含有衔接子的另外或剩余部分的引物通过延伸(诸如PCR)添加衔接子的另外或剩余部分;等等。优选地,附着的衔接子寡核苷酸与目标多核苷酸共价结合。
在衔接子附着到目标多核苷酸后,可以使所得的多核苷酸经受净化过程,通过除去至少一部分未结合的衔接子来提高衔接子-目标-衔接子多核苷酸的纯度。可使用任何合适的净化处理,诸如电泳、尺寸排阻色谱法等。在一些实施方案中,可以采用固相反向固定(SPRI)顺磁珠从未附接的衔接子分离衔接子-靶标-衔接子多核苷酸。虽然此类方法可以提高所得的衔接子-目标-衔接子多核苷酸的纯度,但是可能保留一些未附着的衔接子寡核苷酸。
用于测序的固定化样品的制备
然后在测序之前将来自一个或多个来源的多个衔接子-靶标-衔接子分子固定化并扩增。用于将来自一个或多个来源的衔接子-靶标-衔接子分子附接至基底的方法是本领域中已知的。类似地,扩增固定化的衔接子-靶标-衔接子分子的方法包括但不限于桥式扩增法和动力学排除扩增法。用于在测序之前固定化和扩增的方法在例如Binoell等人(US8,053,192)、Gunderson等人(WO2016/130704)、Shen等人(US 8,895,249)和Pipenburg等人(US 9,309,502)中有所描述。
然后可将样品(包括合并的样品)固定化,以为测序做准备。测序可作为单分子阵列来执行或者可在测序之前进行扩增。可使用一个或多个固定化引物来执行扩增。固定化的引物可以是在平坦表面上或在小珠池上的引物苔(lawn)。可在乳液的每个“隔室”中将小珠池分离到具有单个小珠的乳液中。在浓度为每“隔室”仅一个模板时,在每个小珠上仅扩增单个模板。
如本文所用,术语“固相扩增”是指在固体载体上进行的或与固体载体相关联的任何核酸扩增反应,使得扩增产物的全部或一部分在形成时固定在该固体载体上。具体地,该术语涵盖固相聚合酶链反应(固相PCR)和固相等温扩增,该固相PCR和固相等温扩增是类似于标准溶液相扩增的反应,不同的是正向扩增引物和反向扩增引物中的一者或两者被固定在固体载体上。固相PCR包括系统诸如乳液,其中一个引物锚定在小珠上,另一个引物在自由溶液中;和固相凝胶基质中的群体形成,其中一个引物锚定在表面上,一个引物锚定在自由溶液中。
在一些实施方案中,固体载体包括图案化表面。“图案化表面”是指在固体载体的暴露层中或该暴露层上的不同区域的布置。例如,这些区域中的一个或多个区域可以是存在一种或多种扩增引物的特征部。特征部可由不存在扩增引物的间隙区域隔开。在一些实施方案中,图案可以为呈行和列形式的特征部的x-y格式。在一些实施方案中,图案可以为特征部和/或间隙区域的重复布置。在一些实施方案中,图案可以为特征部和/或间隙区域的随机布置。可用于本文所述的方法和组合物中的示例性图案化的表面描述于美国专利号8,778,848、8,778,849和9,079,148以及美国专利公布号2014/0243224中,这些专利中的每一篇均以引用方式并入本文。
在一些具体实施中,固体载体在表面中包括孔或凹陷的阵列。这可如本领域通常已知的那样使用多种技术来制造,这些技术包括但不限于光刻、压印技术、模制技术和微蚀刻技术。本领域的技术人员将会知道,所使用的技术将取决于阵列基板的组成和形状。
图案化的表面中的特征部可以是玻璃、硅、塑料或其他合适的具有图案化的且共价连接的凝胶(诸如,聚(N-(5-叠氮基乙酰胺基戊基)丙烯酰胺-共-丙烯酰胺)(PAZAM,参见例如,美国专利公布号2013/184796、WO 2016/066586和WO 2015/002813,这些专利中的每一篇均全文以引用方式并入本文))的固体载体上的孔阵列中的孔(例如,微孔或纳米孔)。该方法产生用于测序的凝胶垫,该凝胶垫在具有大量循环的测序运行中可为稳定的。聚合物与孔的共价连接有助于在多种用途期间以及在结构化基板的整个寿命期间将凝胶保持为结构化特征。然而,在许多实施方案中,凝胶无需共价连接到孔。例如,在一些条件下,未共价附接到结构化基板的任何部分的不含硅烷的丙烯酰胺(SFA,参见例如,美国专利No.8,563,477,其全文以引用方式并入本文)可用作凝胶材料。
在特定实施方案中,结构化基板可通过以下方法来制作:将固体载体材料图案化为具有孔(例如,微孔或纳米孔),用凝胶材料(例如,PAZAM、SFA或其化学改性的变体,诸如SFA的叠氮化版本(叠氮-SFA))涂覆图案化载体,并且例如通过化学或机械抛光来抛光已涂覆凝胶的载体,从而将凝胶保持在孔中,而从孔之间的结构化基板的表面上的间隙区域移除基本上所有凝胶或使基本上所有凝胶失活。引物核酸可附着到凝胶材料。然后可使靶核酸(例如,片段化的人基因组)的溶液与已抛光的基板接触,使得单个靶核酸将通过与附着到凝胶材料的引物的相互作用接种到单个孔中;然而,由于不存在凝胶材料或该凝胶材料失活,靶核酸将不占用间隙区域。靶核酸的扩增将被限制在孔中,因为间隙区域中不存在凝胶或凝胶失活会阻止生长的核酸群体(nucleic acid colony)的向外迁移。该过程便于制造、可规模化,并且可利用常规的微米或纳米制造方法。
虽然本发明涵盖其中仅一个扩增引物被固定(另一个引物通常存在于游离溶液中)的“固相”扩增方法,但是优选的是固体载体将被提供有固定的正向引物和反向引物两者。在实施过程中,将存在固定在固体载体上的“多个”相同正向引物和/或“多个”相同反向引物,因为扩增过程需要过量的引物来维持扩增。除非上下文另有指示,否则本文对正向引物和反向引物的提及应相应地被解释为涵盖“多个”此类引物。
技术读者将会理解,任何给定的扩增反应都需要对待扩增的模板具有特异性的至少一种类型的正向引物和至少一种类型的反向引物。然而,在某些实施方案中,正向引物和反向引物可包括相同序列的模板特异性部分,并且可具有完全相同的核苷酸序列和结构(包括任何非核苷酸修饰)。换句话讲,可以仅使用一种类型的引物进行固相扩增,并且此类单引物方法涵盖在本发明的范围内。其他实施方案可使用包含相同模板特异性序列但在一些其他结构特征方面不同的正向引物和反向引物。例如,一种类型的引物可包含在另一种类型中不存在的非核苷酸修饰。
在本公开的所有实施方案中,用于固相扩增的引物优选地通过单点共价附接固定到引物5'端处或附近的固体载体,使得引物的模板特异性部分自由退火至其同源模板,而3'羟基则自由进行引物延伸。本领域已知的任何合适的共价附接方式均可用于此目的。所选择的附接化学将取决于固体载体的性质,以及对其应用的任何衍生化或官能化。引物本身可包含可为非核苷酸化学修饰的部分,以促进附接。在一个具体实施方案中,引物可包含5'端处的含硫亲核试剂,诸如硫代磷酸酯或硫代磷酸盐。就固体承载的聚丙烯酰胺水凝胶而言,该亲核试剂将与水凝胶中存在的溴乙酰胺基团结合。将引物和模板附接至固体载体的更具体的方式是经由5'硫代磷酸酯附接到由聚合的丙烯酰胺和N-(5-溴乙酰氨基戊基)丙烯酰胺(BRAPA)构成的水凝胶,如完全在WO 05/065814中所述。
本发明的某些实施方案可利用由惰性基板或基质(例如,载玻片、聚合物小珠等)构成的固体载体,该惰性基板或基质已例如通过施加包含反应性基团的中间材料层或涂层被“官能化”,这些反应性基团允许共价附接到生物分子诸如多核苷酸。此类载体的示例包括但不限于负载在惰性基板诸如玻璃上的聚丙烯酰胺水凝胶。在此类实施方案中,生物分子(例如,多核苷酸)可直接共价附接到中间材料(例如,水凝胶),但该中间材料本身可非共价附接到基板或基质(例如,玻璃基板)。术语“共价附接到固体载体”应相应地被解释为涵盖这种类型的布置。
可在小珠上扩增合并的样品,其中每个小珠包含正向扩增引物和反向扩增引物。在一个具体实施方案中,将根据本发明的第一方面、第二方面或第三方面制备的模板的文库用于制备核酸群体的成簇阵列,类似于在美国公布号2005/0100900、美国专利号7,115,400、WO 00/18957和WO 98/44151(这些文献的内容全文以引用方式并入本文)中所述的通过固相扩增,并且更具体地通过固相等温扩增的那些簇阵列。术语“簇”和“集落”在本文中可互换使用地指代包括多个相同的固定化的核酸链和多个相同的固定化的互补核酸链的固体载体上的离散位点。术语“簇阵列”是指由此类簇或群体形成的阵列。在该语境中,术语“阵列”不应当被理解为需要簇的有序布置。
术语“固相”或“表面”用于表示平面阵列,其中引物附着到平坦表面,例如玻璃、二氧化硅或塑料显微镜载片,或者类似的流通池装置;表示小珠,其中一个或两个引物附接到这些小珠并且这些小珠被扩增;或者表示在小珠已扩增后表面上的小珠阵列。
可使用如WO 98/44151中所述的热循环工艺或使温度保持恒定的工艺来制备簇阵列,并且通过改变试剂来执行延伸和变性的循环。此类等温扩增方法在专利申请号WO 02/46456和美国公布号2008/0009420中有所描述,这些文献全文以引用方式并入本文。由于等温工艺中所需的温度较低,这是特别优选的。
应当理解,本文所述或本领域公知的任一种扩增方法可以与通用引物或目标特异性引物一起用于扩增固定的DNA片段。合适的扩增方法包括但不限于聚合酶链反应(PCR)、链置换扩增(SDA)、转录介导的扩增(TMA)和基于核酸序列的扩增(NASBA),如美国专利号8,003,354中所述,该专利全文以引用方式并入本文。上述扩增方法可用于扩增一种或多种感兴趣核酸。例如,可利用PCR(包括多重PCR)、SDA、TMA、NASBA等扩增固定化DNA片段。在一些实施方案中,在扩增反应中包括特异性针对所关注多核苷酸的引物。
其他合适的多核苷酸扩增方法可包括寡核苷酸延伸和连接、滚环扩增(RCA)(Lizardi等人,Nat.Genet.19:225-232(1998年))和寡核苷酸连接测定(OLA)(通常参见美国专利号7,582,420、5,185,243、5,679,524和5,573,907;EP 0 320 308 B1;EP 0 336 731B1;EP 0 439 182 B1;WO 90/01069;WO 89/12696;和WO 89/09835)技术。应当理解,这些扩增方法可被设计成用于扩增固定化DNA片段。例如,在一些实施方案中,扩增方法可包括连接探针扩增或含有特异性针对所关注核酸的引物的寡核苷酸连接测定(OLA)反应。在一些实施方案中,扩增方法可包括引物延伸-连接反应,该引物延伸-连接反应含有特异性针对所关注核酸的引物。作为可被特别设计用于扩增感兴趣核酸的引物延伸和连接引物的非限制性示例,扩增可包括用于GoldenGate测定(Illumina,Inc.,San Diego,CA)的引物,如美国专利第7,582,420号和第7,611,869号所例示。
在本公开的方法中可使用的示例性等温扩增方法包括但不限于多重置换扩增(MDA),如由例如Dean等人,Proc.Natl.Acad.Sci.USA 99:5261-66(2002年)所例示的多重置换扩增(MDA),或由例如美国专利号6,214,587所例示的等温链置换核酸扩增。可用于本公开的其他非基于PCR的方法包括:例如链置换扩增(SDA),其描述于例如Walker等人,Molecular Methods for Virus Detection,Academic Press,Inc.,1995年;美国专利号5,455,166和5,130,238,以及Walker等人,Nucl.Acids Res.20:1691-96(1992年)中;或超支化链置换扩增,其描述于例如Lage等人,Genome Res.第13卷,第294-307页(2003年)中。等温扩增方法可与链置换Phi29聚合酶或Bst DNA聚合酶大片段5'->3'exo-一起用于基因组DNA的随机引物扩增。这些聚合酶的使用利用了它们的高持续合成能力和链置换活性。高持续合成能力允许聚合酶产生长度为10kb-20kb的片段。如上所述,可使用具有低持续合成能力和链置换活性的聚合酶(诸如Klenow聚合酶)在等温条件下产生较小的片段。对扩增反应、条件和组分的附加描述在美国专利7,670,810的公开内容中详细阐述,该专利以引用方式全文并入本文。
可用于本公开的另一种多核苷酸扩增方法是带标签的PCR,其使用具有恒定5'区,接着是随机3'区的二结构域引物的群体,如例如在Grothues等人,Nucleic Acids Res.21(5):1321-2(1993年)中所述。基于来自随机合成的3'区的单独杂交,进行第一轮扩增以允许大量启动热变性的DNA。由于3'区的性质,设想启动位点在整个基因组中是随机的。然后,可移除未结合的引物,并且可使用与恒定5'区互补的引物进行进一步的复制。
在一些实施方案中,可使用动力学排除扩增(KEA)来执行等温扩增,其也被称为排除扩增(ExAmp)。本公开的核酸文库可使用包括以下步骤的方法制成:使扩增试剂反应以产生多个扩增位点,该多个扩增位点各自包括来自已接种位点的单个靶核酸的扩增子的基本上克隆的群体。在一些实施方案中,扩增反应继续进行,直到生成足够数量的扩增子以填充相应扩增位点的容量。以这种方式将已接种的位点填充至容量抑制了靶核酸在该位点处着位和扩增,从而在该位点处产生扩增子的克隆群体。在一些实施方案中,在第二靶核酸到达该位点之前,即使扩增位点未被填充至容量,也可实现表观的克隆性。在一些条件下,第一靶核酸的扩增可进行到制备了足够数量的拷贝的点,以有效地超出或压倒来自被转运到位点的第二靶核酸的拷贝的产生。例如,在使用直径小于500nm的环形特征上的桥式扩增过程的实施方案中,已确定在第一靶核酸的14个指数扩增循环之后,相同位点处来自第二靶核酸的污染所产生的污染扩增子的数量将不足以对Illumina测序平台上的边合成边测序分析产生不利影响。
在特定实施方案中,阵列中的扩增位点可以是但不必是完全克隆的。相反,对于一些应用,单个扩增位点可主要填充有来自第一靶核酸的扩增子,并且还可具有来自第二靶核酸的低水平的污染扩增子。只要污染水平对阵列的后续使用不具有不可接受的影响,阵列就可具有一个或多个具有低水平污染扩增子的扩增位点。例如,当阵列将用于检测应用时,可接受的污染水平将是不会以不可接受的方式影响检测技术的信噪比或分辨率的水平。因此,表观的克隆性通常将与通过本文所述的方法制备的阵列的特定用途或应用相关。对于特定应用,在单个扩增位点处可以是可接受的示例性污染水平包括但不限于至多0.1%、0.5%、1%、5%、10%或25%的污染扩增子。阵列可包括具有这些示例性水平的污染扩增子的一个或多个扩增位点。例如,阵列中高达5%、10%、25%、50%、75%或甚至100%的扩增位点可具有一些污染扩增子。应当理解,在位点的阵列或其他集合中,高达50%、75%、80%、85%、90%、95%或99%或更多的位点可为克隆的或在表观上克隆的。
在一些实施方案中,当过程以足够快的速率发生以有效地排除另一事件或过程发生时,可发生动力学排除。以制作核酸阵列为例,其中该阵列的位点用来自溶液的目标核酸随机接种,并且在扩增过程中生成目标核酸的拷贝以将每个接种位点填满。根据本公开的动力学排除方法,接种和扩增过程可在扩增速率超过接种速率的条件下同时进行。因此,在已由第一靶核酸接种的位点处产生拷贝的相对较快速率将有效地排除第二核酸使其不接种用于扩增的位点。动力学排他性扩增方法可如美国申请公布号2013/0338042的公开内容中详细描述的那样来进行,该文献全文以引用方式并入本文。
动力学排除可以利用相对慢的速率来启动扩增(例如,以慢速率来制作目标核酸的第一拷贝),与之相比,利用相对快的速率来制作目标核酸(或目标核酸的第一拷贝)的后续拷贝。在前一段落的示例中,由于目标核酸接种以相对慢的速率(例如相对慢的扩散或转运速率)发生,与之相比,扩增通过用核酸种子的拷贝填充位点以相对快的速率发生,因此出现了动力学排斥。在另一个示例性实施方案中,由于已在位点接种的靶核酸形成第一拷贝延迟(例如,活化延迟或缓慢),与之相比,制作后续拷贝以填充该位点的速率相对较快,因此可以出现动力学排斥。在该示例中,各个位点可能已接种有几种不同的目标核酸(例如,几种目标核酸可能在扩增之前就存在于每个位点处)。然而,任何给定的靶核酸的第一拷贝形成可被随机激活,使得第一拷贝形成的平均速率与后续拷贝生成的速率相比相对较慢。在这种情况下,虽然单个位点可能已接种有若干不同的靶核酸,但动力学排除将只允许扩增这些靶核酸中的一个靶核酸。更具体地,一旦第一靶核酸已被激活用于扩增,则该位点将用其拷贝快速填充至容量,从而防止在该位点处制备第二靶核酸的拷贝。
扩增试剂还可包括促进扩增子形成并且在一些情况下提高扩增子形成速率的组分。一个示例是重组酶。重组酶可通过允许反复侵入/延伸来促进扩增子形成。更具体地,重组酶可促进通过聚合酶进行靶核酸的侵入以及通过该聚合酶进行的引物的延伸,该聚合酶使用靶核酸作为扩增子形成的模板。该过程可被重复作为链式反应,其中由每轮入侵/延伸产生的扩增子用作后续轮中的模板。由于不需要变性循环(例如,经由加热或化学变性),因此该过程可比标准PCR更快速地发生。因此,重组酶促进的扩增可等温地进行。通常期望在重组酶促进的扩增试剂中包括ATP或其他核苷酸(或在一些情况下其非可水解的类似物)以促进扩增。重组酶和单链结合(SSB)蛋白的混合物是特别有用的,因为SSB可进一步促进扩增。用于重组酶促进的扩增的示例性制剂包括由TwistDx(Cambridge,UK)市售为TwistAmp试剂盒的那些制剂。重组酶促进的扩增试剂的可用组分和反应条件在US 5,223,414和US7,399,590中有所描述,这些文献中的每篇文献均以引用方式并入本文。
可包括在扩增试剂中以促进扩增子形成并且在一些情况下提高扩增子形成速率的组分的另一个示例是解旋酶。解旋酶可通过允许扩增子形成的链式反应来促进扩增子形成。由于不需要变性循环(例如,经由加热或化学变性),因此该过程可比标准PCR更快速地发生。因此,解旋酶促进的扩增可等温地进行。解旋酶和单链结合(SSB)蛋白的混合物是特别有用的,因为SSB可进一步促进扩增。用于解旋酶促进的扩增的示例性制剂包括来自Biohelle(Beverly,MA)的市售为IsoAmp试剂盒的那些制剂。此外,包括解旋酶蛋白的可用制剂的示例在US 7,399,590和US 7,829,284中有所描述,这些文献中的每篇文献均以引用方式并入本文。
可包括在扩增试剂中以有利于扩增子形成并且在一些情况下提高扩增子形成速率的组分的另一个示例是起点结合蛋白。
在测序中的用途
将衔接子-靶标-衔接子分子附接到表面后,确定固定化且经扩增的衔接子-靶标-衔接子分子的序列。可使用任何合适的测序技术进行测序,并且用于确定固定化且经扩增的衔接子-靶标-衔接子分子的序列(包括链再合成)的方法是本领域已知的并且在例如Bignell等人(US 8,053,192)、Gunderson等人(WO2016/130704)、Shen等人(US 8,895,249)和Pipenburg等人(US 9,309,502)中有所描述。
本文所述的方法可与多种核酸测序技术结合使用。特别适用的技术是其中核酸附接到阵列中的固定位置处使得其相对位置不改变并且其中该阵列被重复成像的那些技术。在不同颜色通道(例如,与用于将一种核苷酸碱基类型与另一种核苷酸碱基类型区分开的不同标记吻合)中获得图像的实施方案特别适用。在一些实施方案中,确定靶核酸的核苷酸序列的过程可以是自动化过程。优选的实施方案包括边合成边测序(“SBS”)技术。
SBS技术通常包括通过针对模板链反复加入核苷酸进行的新生核酸链的酶促延伸。在传统的SBS方法中,可在每次递送中在存在聚合酶的情况下将单个核苷酸单体提供给靶核苷酸。然而,在本文所述的方法中,可在递送中存在聚合酶的情况下向靶核酸提供多于一种类型的核苷酸单体。
SBS可利用具有终止子部分的核苷酸单体或缺少任何终止子部分的核苷酸单体。利用缺乏终止子的核苷酸单体的方法包括例如焦磷酸测序和使用γ-磷酸标记的核苷酸的测序,如下文进一步详细描述的。在使用缺少终止子的核苷酸单体的方法中,在每个循环中加入的核苷酸的数目通常是可变的,并且该数目取决于模板序列和核苷酸递送的方式。对于利用具有终止子部分的核苷酸单体的SBS技术,终止子在使用的测序条件下可为有效不可逆的,如利用双脱氧核苷酸的传统桑格测序的情况,或者终止子可为可逆的,如由Solexa(现为Illumina,Inc.)开发的测序方法的情况。
SBS技术可利用具有标记部分的核苷酸单体或缺少标记部分的核苷酸单体。因此,可基于以下项来检测掺入事件:标记的特性,诸如标记的荧光;核苷酸单体的特性,诸如分子量或电荷;掺入核苷酸的副产物,诸如焦磷酸盐的释放;等等。在测序试剂中存在两种或更多种不同的核苷酸的实施方案中,不同的核苷酸可以是彼此可区分的,或者另选地,两种或更多种不同的标记在所使用的检测技术下可以是不可区分的。例如,测序试剂中存在的不同核苷酸可具有不同的标记,并且它们可使用适当的光学器件进行区分,如由Solexa(现为Illumina,Inc.)开发的测序方法所例示。
优选的实施方案包括焦磷酸测序技术。焦磷酸测序检测当将特定的核苷酸掺入新生链中时无机焦磷酸盐(PPi)的释放(Ronaghi,M.、Karamohamed,S.、Pettersson,B.、Uhlen,M.和Nyren,P.(1996年),“Real-time DNA sequencing using detection ofpyrophosphate release.”,Analytical Biochemistry 242(1),84-9;Ronaghi,M.(2001年)“Pyrosequencing sheds light on DNA sequencing.”Genome Res.,11(1),3-11;Ronaghi,M.,Uhlen,M.and Nyren,P.(1998年)“A sequencing method based on real-time pyrophosphate.”Science 281(5375),363;美国专利号6,210,891;6,258,568和6,274,320,这些参考文献的公开内容全文以引用的方式并入本文中)。在焦磷酸测序中,释放的PPi可通过被腺苷三磷酸(ATP)硫酸化酶立即转化为ATP成来进行检测,并且通过荧光素酶产生的光子来检测所产生的ATP水平。待测序的核酸可附接到阵列中的特征部,并且可对阵列进行成像以捕获由于在阵列的特征部处掺入核苷酸而产生的化学发光信号。可在用特定核苷酸类型(例如,A、T、C或G)处理阵列后获得图像。在添加每种核苷酸类型后获得的图像将在阵列中哪些特征部被检测到方面不同。图像中的这些差异反映阵列上的特征部的不同序列内容。然而,每个特征部的相对位置将在图像中保持不变。可使用本文所述的方法存储、处理和分析图像。例如,在用每种不同核苷酸类型处理阵列后获得的图像可以与本文针对从用于基于可逆终止子的测序方法的不同检测通道获得的图像所例示的相同方式进行处理。
在另一种示例性类型的SBS中,通过逐步添加可逆终止子核苷酸来完成循环测序,这些可逆终止子核苷酸包含例如可裂解或可光漂白的染料标记,如例如WO 04/018497和美国专利号7,057,026所述,这些文献的公开内容以引用方式并入本文。该方法由Solexa(现为Illumina Inc.)商业化,并且还在WO 91/06678和WO 07/123,744中有所描述,这些文献中的每一者的公开内容以引用方式并入本文。荧光标记终止子(其中终止可以是可逆的并且荧光标记可被切割)的可用性有利于高效的循环可逆终止(CRT)测序。聚合酶也可共工程化以有效地掺入这些经修饰的核苷酸并从这些经修饰的核苷酸延伸。
优选地,在基于可逆终止子的测序实施方案中,标记在SBS反应条件下基本上不抑制延伸。然而,检测标记可以是可移除的,例如通过裂解或降解移除。可在将标记掺入到阵列化核酸特征部中后捕获图像。在特定实施方案中,每个循环涉及将四种不同的核苷酸类型同时递送到阵列,并且每种核苷酸类型具有在光谱上不同的标记。然后可获得四个图像,每个图像使用对四个不同标记中的一个标记具有选择性的检测通道。另选地,可顺序地添加不同的核苷酸类型,并且可在每个添加步骤之间获得阵列的图像。在此类实施方案中,每个图像将示出已掺入特定类型的核苷酸的核酸特征部。由于每个特征部的不同序列内容,不同特征部将存在于或不存在于不同图像中。然而,特征部的相对位置将在图像中保持不变。通过此类可逆终止子-SBS方法获得的图像可如本文所述进行存储、处理和分析。在图像捕获步骤后,可移除标记并且可移除可逆终止子部分以用于核苷酸添加和检测的后续循环。已在特定循环中以及在后续循环之前检测到标记之后移除这些标记可提供减少循环之间的背景信号和串扰的优点。可用的标记和移除方法的示例在下文中有所描述。
在特定实施方案中,一些或所有核苷酸单体可包括可逆终止子。在此类实施方案中,可逆终止子/可切割荧光团可包括经由3'酯键连接到核糖部分的荧光团(Metzker,Genome Res.15:1767-1776(2005年),该文献以引用方式并入本文)。其他方法已将终止子化学与荧光标记的裂解分开(Ruparel等人,Proc Natl Acad Sci USA 102:5932-7(2005年),该文献全文以引用方式并入本文)。Ruparel等人描述了可逆终止子的发展,这些可逆终止子使用小的3'烯丙基基团来阻断延伸,但是可通过用钯催化剂进行的短时间处理来容易地去阻断。荧光团经由可光裂解的接头附接到碱基,该可光裂解的接头可通过暴露于长波长紫外光30秒来容易地裂解。因此,二硫化物还原或光裂解可用作可裂解的接头。可逆终止的另一种方法是使用天然终止,该天然终止在将大体积染料放置在dNTP上之后接着发生。dNTP上存在带电大体积染料可通过空间位阻和/或静电位阻而充当高效的终止子。除非染料被移除,否则一个掺入事件的存在防止进一步的掺入。染料的裂解移除荧光团并有效地逆转终止。经修饰的核苷酸的示例还描述于美国专利号7,427,673和7,057,026中,这些文献的公开内容全文以引用方式并入本文中。
可与本文所述的方法和系统一起使用的另外的示例性SBS系统和方法在美国公布号2007/0166705、2006/0188901、2006/0240439、2006/0281109、2012/0270305和2013/0260372、美国专利号7,057,026、PCT公布号WO 05/065814、美国专利申请公布号2005/0100900以及PCT公布号WO 06/064199和WO 07/010,251中有所描述,这些文献的公开内容全文以引用方式并入本文中。
一些实施方案可利用少于四种不同标记来使用对四种不同核苷酸的检测。例如,可利用并入的美国公布号2013/0079232的材料中所述的方法和系统来执行SBS。作为第一个示例,一对核苷酸类型可在相同波长下检测,但基于对中的一个成员相对于另一个成员的强度差异,或基于对中的一个成员的导致与检测到的该对的另一个成员的信号相比明显的信号出现或消失的变化(例如,通过化学改性、光化学改性或物理改性)来区分。作为第二个示例,四种不同核苷酸类型中的三种能够在特定条件下被检测到,而第四种核苷酸类型缺少在那些条件下可被检测到或在那些条件下被最低限度地检测到的标记(例如,由于背景荧光而导致的最低限度检测等)。可基于其相应信号的存在来确定前三种核苷酸类型掺入到核酸中,并且可基于任何信号的不存在或对任何信号的最低限度检测来确定第四核苷酸类型掺入到核酸中。作为第三示例,一种核苷酸类型可包括在两个不同通道中检测到的标记,而其他核苷酸类型在不超过一个通道中被检测到。上述三种例示性构型不被认为是互相排斥的,并且可以各种组合进行使用。组合所有三个示例的示例性实施方案是基于荧光的SBS方法,该方法使用在第一通道中检测到的第一核苷酸类型(例如,具有当由第一激发波长激发时在第一通道中检测到的标记的dATP),在第二通道中检测到的第二核苷酸类型(例如,具有当由第二激发波长激发时在第二通道中检测到的标记的dCTP),在第一通道和第二通道两者中检测到的第三核苷酸类型(例如,具有当被第一激发波长和/或第二激发波长激发时在两个通道中检测到的至少一个标记的dTTP),以及缺少在任一通道中检测到或最低限度地检测到的标记的第四核苷酸类型(例如,不具有标记的dGTP)。
此外,如并入的美国公布2013/0079232的材料中所述,可使用单个通道获得测序数据。在此类所谓的单染料测序方法中,标记第一核苷酸类型,但在生成第一图像之后移除标记,并且仅在生成第一图像之后标记第二核苷酸类型。第三核苷酸类型在第一图像和第二图像中都保留其标记,并且第四核苷酸类型在两个图像中均保持未标记。
一些实施方案可通过连接技术利用测序。此类技术利用DNA连接酶掺入寡核苷酸并确定此类寡核苷酸的掺入。寡核苷酸通常具有与寡核苷酸杂交的序列中的特定核苷酸的同一性相关的不同标记。与其他SBS方法一样,可在用已标记的测序试剂处理核酸特征部的阵列后获得图像。每个图像将示出已掺入特定类型的标记的核酸特征部。由于每个特征部的不同序列内容,不同特征部将存在于或不存在于不同图像中,但特征部的相对位置将在图像中保持不变。通过基于连接的测序方法获得的图像可如本文所述进行存储、处理和分析。可与本文所述的方法和系统一起使用的示例性SBS系统和方法在美国专利号6,969,488、6,172,218和6,306,597中有所描述,这些文献的公开内容全文以引用方式并入本文。
一些实施方案可利用纳米孔测序(Deamer,D.W.和Akeson,M.“Nanopores andnucleic acids:prospects for ultrarapid sequencing.”Trends Biotechnol.第18卷,第147-151页(2000年);Deamer,D.和D.Branton,“Characterization of nucleic acidsby nanopore analysis”,Acc.Chem.Res.第35卷,第817-825页(2002年);Li,J.、M.Gershow、D.Stein、E.Brandin和J.A.Golovchenko,“DNA molecules andconfigurations in a solid-state nanopore microscope”,Nat.Mater.,2:611-615(2003年),这些文献的公开内容全文以引用方式并入本文)。在此类实施方案中,靶核酸穿过纳米孔。纳米孔可为合成孔或生物膜蛋白,诸如α-溶血素。当靶核酸穿过纳米孔时,可通过测量孔的电导率的波动来识别每个碱基对。(美国专利号7,001,792;Soni,G.V.&Meller,“A.Progress toward ultrafast DNA sequencing using solid-state nanopores.”Clin.Chem.53,1996-2001(2007年);Healy,K.,“Nanopore-based single-molecule DNAanalysis.”,Nanomed.2,459-481(2007年);Cockroft,S.L.、Chu,J.、Amorin,M.和Ghadiri,M.R.,“A single-molecule nanopore device detects DNA polymerase activity withsingle-nucleotide resolution.”,J.Am.Chem.Soc.130,818-820(2008年),这些文献的公开内容全文以引用方式并入本文)。从纳米孔测序获得的数据可如本文所述进行存储、处理和分析。具体地,根据本文所述的光学图像和其他图像的示例性处理,可将数据如同图像那样进行处理。
一些实施方案可利用涉及DNA聚合酶活性的实时监测的方法。可通过携带荧光团的聚合酶与γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用来检测核苷酸掺入(如例如美国专利号7,329,492和7,211,414所述,这两篇文献均以引用方式并入本文),或者用零模波导来检测核苷酸掺入(如例如美国专利号7,315,019所述,该文献以引用方式并入本文),并且使用荧光核苷酸类似物和工程化聚合酶来检测核苷酸掺入(如例如美国专利号7,405,281和美国公布号2008/0108082所述,这两篇文献均以引用方式并入本文)。照明可限于表面栓系的聚合酶周围的仄升量级的体积,使得可在低背景下观察到荧光标记的核苷酸的掺入(Levene,M.J.等人,“Zero-mode waveguides for single-moleculeanalysis at high concentrations.”,Science 299,682-686(2003);Lundquist,P.M.等人“Parallel confocal detection of single molecules in real time.”,Opt.Lett.33,1026-1028(2008年);Korlach,J.等人“Selective aluminum passivationfor targeted immobilization of single DNA polymerase molecules in zero-modewaveguide nano structures.”,Proc.Natl.Acad.Sci.USA 105,1176-1181(2008年),这些文献的公开内容全文以引用方式并入本文。通过此类方法获得的图像可如本文所述进行存储、处理和分析。
一些SBS实施方案包括检测在核苷酸掺入延伸产物时释放的质子。例如,基于释放质子的检测的测序可使用可从Ion Torrent公司(Guilford,CT,Life Technologies子公司)商购获得的电检测器和相关技术或在美国公布号2009/0026082、2009/0127589、2010/0137143和2010/0282617中所述的测序方法和系统,这些美国公布全部以引用方式并入本文。本文阐述的使用动力学排阻来扩增靶核酸的方法可以容易地应用于用于检测质子的基板。更具体地,本文阐述的方法可以用于产生用于检测质子的扩增子克隆群体。
上述SBS方法可有利地以多种格式进行,使得同时操纵多个不同的靶核酸。在具体实施方案中,可在共同的反应容器中或在特定基底的表面上处理不同的靶核酸。这允许以多种方式方便地递送测序试剂、移除未反应的试剂和检测掺入事件。在使用表面结合的靶核酸的实施方案中,靶核酸可为阵列格式。在阵列格式中,靶核酸通常可以在空间上可区分的方式结合到表面。靶核酸可通过直接共价附接、附接到小珠或其他粒子或结合到附接到表面的聚合酶或其他分子来结合。阵列可包括在每个位点(也被称为特征部)处的靶核酸的单个拷贝,或者具有相同序列的多个拷贝可存在于每个位点或特征部处。多个拷贝可通过扩增方法(诸如,如下文进一步详细描述的桥式扩增或乳液PCR)产生。
本文所述的方法可使用具有处于多种密度中任一种密度的特征部的阵列,该多种密度包括例如至少约10个特征部/cm2、100个特征部/cm2、500个特征部/cm2、1,000个特征部/cm2、5,000个特征部/cm2、10,000个特征部/cm2、50,000个特征部/cm2、100,000个特征部/cm2、1,000,000个特征部/cm2、5,000,000个特征部/cm2或更高。
本文阐述的方法的优点是它们并行提供了对多个靶核酸的快速且有效检测。因此,本公开提供了能够使用本领域已知的技术(诸如上文所例示的那些)来制备和检测核酸的整合系统。因此,本公开的整合系统可以包括能够将扩增试剂和/或测序试剂递送到一个或多个固定DNA片段的流体部件,该系统包括诸如泵、阀、贮存器、流体管线等的部件。流通池在整合系统中可以被配置用于和/或用于检测靶核酸。示例性流通池在例如美国公布号2010/0111768和美国序列号13/273,666中描述,这些文献中的每一篇以引用方式并入本文。如针对流通池所例示的,整合系统的一个或多个流体部件可以用于扩增方法和检测方法。以核酸测序实施方案为例,整合系统的一个或多个流体部件可以用于本文阐述的扩增方法以及用于在测序方法(诸如上文例示的那些)中递送测序试剂。另选地,整合系统可包括单独的流体系统以执行扩增方法并执行检测方法。能够产生扩增核酸并且还确定核酸序列的整合测序系统的示例包括但不限于MiSeqTM平台(Illumina,Inc.,San Diego,CA)以及在美国序列号13/273,666中描述的设备,该文献以引用方式并入本文。
实施例
以上讨论的实施方案的一些方面在以下实施例中进一步详细公开,这些实施方案并非旨在以任何方式限制本公开的范围。
实施例1
演进出热稳定的末端脱氧核苷酸转移酶
此实施例证明了通过随机诱变并合并所鉴定出的突变来演进出热稳定的末端脱氧核苷酸转移酶。在筛选约10,000个TdT突变体之后,发现在保持催化性质的同时,TdT3-2比SUMO-TdT高10℃热稳定。
通过随机诱变生成突变文库。第一突变文库使用SUMO-TdT作为亲本模板。本公开中的SUMO-TdT是指含有牛(家牛)TdT的氨基酸139至520和N末端SUMO标签(其提高了溶解度和表达)的重组TdT。表1显示了SUMO-TdT的序列。图2示出了SUMO-TdT(SEQ ID NO:14)与家牛TdT(SEQ ID NO:12)的氨基酸139至520(SEQ ID NO:1)的非限制性示例性序列比对。于47℃用热处理筛选2790个突变体的文库达1min。这个轮次鉴定出热稳定的突变体TdT1-1和TdT1-2是热稳定的(表2A和表2B)。与SUMO-TdT相比,TdT1-1和TdT1-2在没有和有热处理的情况下具有显著更高的FRET读数。此外,TdT1-1和TdT1-2在热处理后保留了更大比例的其活性。
表1.SUMO-TdT(牛)和TdT3-2的氨基酸序列。SUMO-TdT(牛)序列中的四个带下划线 的序列是His标签、凝血酶切割位点、SUMO片段和氨基酸139至520的牛TdT片段。TdT3-2序列 中的四个带下划线的序列是His标签、凝血酶切割位点、SUMO片段和具有八个取代突变 (E175V、K177N、E178G、D226Y、K271E、F280L、M283K和H405P)的氨基酸139至520的牛TdT片 段。
表2A.来自热稳定性筛选的TdT变体的总结表。取代突变的位置是SUMO-TdT(及其 TdT变体)中的位置。关于SUMO-TdT(及其TdT变体)中的取代突变的位置和家牛TdT中的对应 位置,参见图2。
a:通过经由易错PCR进行随机诱变创建用于第1轮的突变文库
b:通过经由易错PCR进行随机诱变创建用于第2轮的突变文库
c:通过组合从TdT2-1、TdT2-2、TdT2-3和TdT2-4鉴定出的突变创建用于第3轮的突变文库。
d:在筛选期间粗细胞裂解物经受的温度
e:从每轮筛选鉴定出的阳性TdT变体
f:当与g中所述的亲本模板相比时,在e中的阳性TdT变体中发现的突变
h:TdT3-1衍生自来自TdT1-1和TdT1-2的突变E175V和D226Y的组合
表2B.来自热稳定性筛选的TdT变体的总结表。显示了从第1轮、第2轮和第3轮发现 的一些突变体。从第1轮和第2轮发现的一些突变显示在左手侧列中。没有列出第3轮的突 变,因为第3轮不生成新突变;第3轮突变体是通过从不同突变体重组第2轮突变生成的。复 选框表示在该突变体中存在来自左侧列的特定突变。最低行“其他”指示在第2轮(Del在非 诱变所靶向的区域中)或第3轮中偶然发生的突变。取代突变的位置是SUMO-TdT(及其TdT变 体)中的位置。
对于第二轮筛选,使用TdT1-1作为亲本生成7636的文库大小。选择TdT1-1作为亲本模板,因为与TdT1-2相比,TdT1-1在没有热处理的情况下具有更高的FRET读数。TdT突变体的FRET读数指示TdT突变体的酶促活性。用50℃的热处理进行第二轮筛选达1min,并且鉴定出了四种热稳定的突变体(TdT2-1、TdT2-2、TdT2-3、TdT2-4)(表2A和表2B)。在没有热处理和有热处理条件下,该四种突变体都具有比TdT1-1显著更高的FRET读数。在经受50℃持续1min后,所有四种突变体也都保留了更高比例的其活性。
推测从TdT2-1、TdT2-2、TdT2-3和TdT2-4鉴定出的突变的组合给予热稳定性的协同增加。对于第三轮热稳定性筛选,生成两个突变体文库。这些突变体文库中的一个突变体文库基于具有在TdT2-1、TdT2-2、TdT2-3和TdT2-4中发现的突变的不同组合的TdT1-1模板。类似地创建其他突变体文库,不同之处为利用TdT1-3作为亲本模板。TdT1-3由TdT1-1和TdT1-2中的突变的组合构成(表2A和表2B)。用于55℃的1min热休克来筛选基于TdT1-1的突变体文库。被鉴定为来自此文库的顶部突变体(表2A和表2B)的TdT3-1,在没有和有热休克的情况下都具有高得多的FRET读数,并且在热休克后保留较高分数的其FRET活性。用于58℃的热处理筛选基于TdT1-3的突变体文库达1min导致发现在室温和热休克处理两者下都具有显著更高的FRET读数的TdT3-2(表2A和表2B)。TdT3-2在经受58℃持续1min后保留其FRET活性的至少一半。这表明TdT3-2比TdT1-3显著更具活性并且更热稳定。如表2A和表2B所示,除了T326S之外,TdT3-2携带从每轮筛选中从顶部突变体中鉴定出的大部分突变。表1显示了TdT3-2的氨基酸序列。
在47℃,商业TdT和SUMO-TdT在5分钟内变性,因为具有结合的条带的强度保持相同达5min、10min和20min。相比之下,TdT3-2有活性达20min,因为对于该20min反应可以看到更多的结合。在58℃,商业TdT和SUMO-TdT是无活性的,而TdT3-2在5min内变性,因为此后条带的强度保持相同。此观察确认了TdT3-2比SUMO-TdT更热稳定,并且TdT 3-2在较高温度下保持有活性。
总之,这些数据表明,在此实施例中鉴定出的九个氨基酸取代可单独地或以任何组合增加含有这些氨基酸取代的TdT突变体的热稳定性,与此同时保持TdT催化活性。此外,在此实施例中鉴定出的TdT突变体可以是热稳定的,与此同时保持TdT催化活性。
实施例2
生成结合多个经修饰的碱基的单链DNA分子
此实施例表明使用TdT突变体来生成结合多个经修饰的碱基的单链DNA(ssDNA)分子。
可以生成结合有经修饰的核苷酸的支架(例如,单链DNA(ssDNA)支架)。该支架可以用作模板分子的多个拷贝的“载体”。具有模板分子的多个拷贝的载体可以是能够通过以空间碰撞或位阻排除其他大分子占据相同孔来占据基底(例如,包括多个孔,诸如100个、1,000个、10,000个或更多个孔的流动池)上的单个孔(例如,微孔)的纳米粒子。基底上各自具有一个纳米粒子的单个孔可以产生单克隆性,或接近单克隆性。可替代地,ssDNA支架可以携带模板的单个拷贝。该支架可以具有一个或多个锚定寡聚物的一个或多个反向互补序列的多个拷贝。由于一个或多个锚定寡聚物的一个或多个反向互补序列的多个拷贝的存在,该支架可以结合并螯合给定孔中的所有“锚定”寡聚物,从而使每孔能够捕获单个模板。
一种生成或构建此类ssDNA支架的方式是使用ssDNA聚合酶,诸如末端脱氧核苷酸转移酶(TdT),来将携带修饰(诸如碱基上的叠氮化物基团)的核苷酸随机地结合至引物链中。然而,可能是由于空间碰撞,可商购获得的TdT不容易结合多个串联的经碱基修饰的核苷酸。
热稳定的TdT突变体(在本文中被称为TdT3-2或CM12)比结合经碱基修饰的核苷酸的商业NEB TdT要好得多。这种特性是当测试来自NEB的商业TdT和TdT3-2的具有与该碱基缀合的PEG链的核苷酸的结合时发现的。NEB TdT通常在结合1至2个PEG-核苷酸后停止,而TdT3-2结合多个串联的PEG-核苷酸。
因此,此突变体表示用于出于不同目的(包括本公开的用于单克隆成簇的“载体”的生成)生成携带各种类型的经碱基修饰的核苷酸的ssDNA的优异催化剂。
图3是非限制性示例性凝胶图,其示出了尝试通过TdT3-2或商业NEB TdT将叠氮化物-PEG4-氨基烯丙基-dUTP(Jena Biosciences;#NU-1705S),在此实施例中被称为叠氮化物-PEG4-dUTP或Az-U结合到经5-羧基荧光素(5'FAM)标记的寡核苷酸引物上。如上文单独泳道所示,用TdT3-2或NEB TdT建立与100%叠氮化物-PEG4-dUTP或50%叠氮化物-PEG4-dUTP+50%dNTP的不同反应。比较图3中的泳道1和泳道3显示,与来自NEB的商业TdT(参见由泳道3旁边的星号所指示的产物)相比,在60分钟内,TdT3-2能够结合远远更多的叠氮化物-PEG4-dUTP(参见由泳道1旁边的星号所指示的产物)。与商业NEB TdT相比,TdT3-2在100%叠氮化物-PEG4-dUTP的存在下显示出极大改善的多次结合(比较星号旁边的条带)。如图3中的泳道3所示,NEB TdT非常缓慢地结合叠氮化物-PEG4-dUTP。NEB TdT仅在长时间(诸如60min)之后才能结合五个至七个叠氮化物-PEG4-dUTP分子。泳道2和泳道4使用叠氮化物-PEG4-dUTP和dNTP的50:50混合物,NEB TdT显示出对其的丰富核苷酸结合,表明在泳道3中看到的通过NEB TdT进行的100%叠氮化物-PEG4-dUTP的有限结合不是由于较低的活性,而是由于由经碱基修饰的核苷酸的连续结合产生的空间碰撞,这与经PEG修饰的核苷酸数据一致。
图4A至图4B是示出通过商业NEB TdT使用叠氮化物-PEG4-dUTP和天然核苷酸进行一分钟和60分钟的TdT延伸的结果的非限制性示例性凝胶图。图4A示出在1min内看到良好的结合(左手侧(LHS)半部)。二苯并环辛炔-Cy3(DBCO-Cy3)的添加似乎起作用,但是被核苷酸-DBCO-Cy3缀合物的高强度(右手侧(RHS)半部上的斑点)覆盖。图4B示出了孵育60min给出了分子量高得多的产物。在较高的叠氮化物-PEG4-dUTP核苷酸浓度下,DBCO-Cy3的添加导致产物消失(参见LHS半部和RHS半部上的星号),表明了成功缀合。
图5A至图5C是非限制性示例性凝胶图,其示出了通过TdT3-2和商业NEB TdT用叠氮化物-PEG4-dUTP或N6-(6-叠氮基)己基-dATP(在此实施例中被称为叠氮化物-己基-dATP或Az-A)进行TdT延伸的结果。图5A示出了使用TdT3-2时看到叠氮化物-dU的少量结合,比使用NEB TdT时更多。图5B示出了使用纯叠氮化物-PEG4-dUTP时看到的许多结合(左手侧的第一泳道)。与dNTP混合得到具有NEB TdT的高MW产物;然而,结合的叠氮化物-PEG4-dUTP的比例是未知的。在所测试条件下,PEG4-dUTP似乎比叠氮化物-己基-dATP更好地工作。将图5B中可视化的凝胶用SYBR-Gold染色并在图5C中可视化。
因此,除了使得能够有更高的热稳定性之外,TdT3-2中的突变还使得能够在经碱基修饰的核苷酸的结合方面具有更大的灵活性。这种特性在ssDNA支架的生成方面并且在需要经碱基修饰的核苷酸的连续结合的其他应用中是很有用的。例如,TdT3-2可以用作用于生成含有叠氮化物-PEG4-dUTP核苷酸的连续添加的支架的催化剂。然后使用例如点击化学将合适的部分缀合至叠氮化物基团。
总之,这些数据表明,TdT的氨基酸取代可以改善含氨基酸取代的TdT的热稳定性并改善其结合多个经碱基修饰的核苷酸的能力。
术语
在前述实施方案中的至少一些实施方案中,在一个实施方案中使用的一个或多个元件可在另一个实施方案中互换使用,除非这种替换在技术上不可行。本领域的技术人员应当理解,在不脱离要求保护的主题的范围的情况下,可对上述方法和结构进行各种其他省略、添加和修改。所有此类修改和更改旨在落入由所附权利要求所限定的主题的范围内。
关于本文中基本上任何复数和/或单数术语的使用,本领域的技术人员可根据上下文和/或应用适当地从复数转换成单数和/或从单数转换成复数。为清楚起见,本文可明确示出各种单数/复数排列。如在本说明书和所附权利要求书中所用的,单数形式“一个”、“一种”和“所述”包括复数指代物,除非上下文另有明确规定。除非另外指明,否则本文中对“或”的任何提及旨在包括“和/或”。
本领域的技术人员应当理解,一般来讲,本文所用的术语,尤其是所附权利要求(例如,所附权利要求的主体)中的术语一般旨在作为“开放的”术语(例如,术语“包括”应解释为“包括但不限于”,术语“具有”应解释为“至少具有”,术语“包含”应解释为“包含但不限于”等)。本领域的技术人员还应当理解,如果引入的权利要求表述的具体数量是有意的,则这种意图将在权利要求中明确表述,并且在不存在这种表述的情况下,不存在这种意图。例如,为了有助于理解,以下所附权利要求可包含使用引导短语“至少一个”和“一个或多个”来引入权利要求表述。然而,即使当同一权利要求包括引导短语“一个或多个”或“至少一个”和不定冠词诸如“一个”或“一种”(例如,“一个”和/或“一种”应被解释为意指“至少一个”或“一个或多个”)时,此类短语的使用不应理解为暗示通过不定冠词“一个”或“一种”引入权利要求表述将包含这种引入的权利要求表述的任何特定权利要求限制为仅包含一个这种表述的实施方案;这同样适用于使用定冠词来引入权利要求表述。此外,即使明确表述了引入的权利要求表述的具体数量,本领域的技术人员也将认识到,这种表述应被解释为意指至少所表述的数量(例如,在没有其他修饰语的情况下,对“两个表述”的直接表述意指至少两个表述、或者两个或更多个表述)。此外,在使用类似于“A、B和C等中的至少一者”的惯例的那些情况下,一般来讲,这种惯例意图在本领域的技术人员将理解该惯例的意义上使用(例如,“具有A、B和C中的至少一者的系统”将包括但不限于具有单独的A、单独的B、单独的C、A和B一起、A和C一起、B和C一起和/或A、B和C一起等的系统)。在使用类似于“A、B或C等中的至少一者”的惯例的那些情况下,一般来讲,这种惯例意图在本领域的技术人员将理解该惯例的意义上使用(例如,“具有A、B或C中的至少一者的系统”将包括但不限于具有单独的A、单独的B、单独的C、A和B一起、A和C一起、B和C一起和/或A、B和C一起等的系统)。本领域的技术人员还应当理解,事实上,无论在说明书、权利要求书还是附图中,呈现两个或更多个另选术语的任何转折的词语和/或短语都应当理解为考虑包括术语中的一者、术语中的任一者或这两个术语的可能性。例如,短语“A或B”将被理解为包括“A”或“B”或“A和B”的可能性。
此外,在以马库什群组描述本公开的特征或方面的情况下,本领域的技术人员将认识到,也由此以马库什群组的任何单个成员或成员子组来描述本公开。
如本领域技术人员将理解的,出于任何和所有目的,诸如就提供书面描述而言,本文所公开的所有范围还包括任何和所有可能的子范围及其子范围的组合。任何列出的范围均可容易地被识别为充分地描述并使得同一范围能够被分解为至少相等的二分之一、三分之一、四分之一、五分之一、十分之一等。作为非限制性示例,本文所讨论的每个范围可容易地分解为下三分之一、中三分之一和上三分之一等。如本领域的技术人员还将理解的,所有语言诸如“至多”、“至少”、“大于”、“小于”等包括所引用的数字并且是指可随后分解为如上所述的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个单独的成员。因此,例如,具有1-3个条款的组是指具有1、2或3个条款的组。类似地,具有1-5个条款的组是指具有1、2、3、4或5个条款等的组。
虽然本文已公开了各个方面和实施方案,但是其他方面和实施方案对于本领域技术人员将是显而易见的。本文所公开的各个方面和实施方案是出于说明目的并且不旨在进行限制,其中真实范围和精神由以下权利要求书指示。
Claims (162)
1.一种修饰核酸的方法,所述方法包括:
(a)提供单链脱氧核糖核酸(ssDNA)和包含经修饰的碱基的核苷三磷酸;以及
(b)使所述ssDNA和包含所述经修饰的碱基的所述核苷三磷酸与重组末端脱氧核苷酸转移酶(TdT)接触以生成ssDNA支架,其中所述ssDNA支架包含结合有一个或多个核苷酸的所述ssDNA,所述一个或多个核苷酸包含来自所述核苷三磷酸的所述经修饰的碱基,
其中所述重组TdT包含与SEQ ID NO:1至少80%同一的氨基酸序列,并且其中所述重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
2.根据权利要求1所述的方法,所述方法进一步包括:
(c)使所述ssDNA支架与包含第一衔接子序列的第一衔接子寡核苷酸和包含第二衔接子序列的第二衔接子寡核苷酸接触,以生成核酸载体,所述核酸载体包含附接至所述第一衔接子寡核苷酸和所述第二衔接子寡核苷酸的所述ssDNA支架。
3.根据权利要求1至2中任一项所述的方法,其中使所述ssDNA支架与所述第一衔接子寡核苷酸接触包括使所述ssDNA支架与包含所述第一衔接子寡核苷酸和第一聚合物的第一衔接子接触。
4.根据权利要求1至3中任一项所述的方法,其中使所述ssDNA支架与所述第二衔接子寡核苷酸接触包括使所述ssDNA支架与包含所述第二衔接子寡核苷酸和第二聚合物的第二衔接子接触。
5.根据权利要求3至4中任一项所述的方法,其中所述第一衔接子包含共价连接的所述第一衔接子寡核苷酸,并且其中所述第二衔接子包含共价连接的所述第二衔接子寡核苷酸。
6.根据权利要求2至5中任一项所述的方法,其中所述ssDNA支架包含第三聚合物。
7.根据权利要求2至6中任一项所述的方法,所述方法进一步包括:
(d)提供核酸模板,所述核酸模板包含所述第一衔接子序列或其反向互补序列、所述第二衔接子序列或其反向互补序列、和核酸杂交序列;
(e)使所述核酸载体与所述核酸模板接触以生成所述核酸载体,所述核酸载体具有经由所述核酸模板的所述核酸杂交序列与所述核酸载体的模板捕获位点杂交的所述核酸模板;
(f)对与所述核酸模板杂交的所述核酸载体执行扩增以生成多个经扩增的核酸,所述多个经扩增的核酸均包含所述第一衔接子寡核苷酸和所述第二衔接子寡核苷酸,所述第一衔接子寡核苷酸和所述第二衔接子寡核苷酸经延伸以包含所述核酸模板的序列或其反向互补序列;以及
(g)使用所述多个经扩增的核酸确定所述核酸模板的所述序列。
8.一种修饰核酸的方法,所述方法包括:
(a)提供第一核酸和包含第一经修饰的碱基的第一核苷三磷酸;以及
(b)使所述第一核酸和包含所述第一经修饰的碱基的所述第一核苷三磷酸与重组末端脱氧核苷酸转移酶(TdT)在第一反应中在第一温度下接触达第一反应时间以生成第二核酸,其中所述第二核酸包含结合有一个或多个第一核苷酸的所述第一核酸,所述一个或多个第一核苷酸包含来自所述第一核苷三磷酸的所述第一经修饰的碱基,
其中所述重组TdT包含与SEQ ID NO:1至少80%同一的氨基酸序列,并且其中所述重组TdT在功能上等同于SEQ ID NO:12的家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His420的一个或多个位置处包含一个或多个氨基酸取代突变。
9.根据权利要求8所述的方法,其中所述第一核酸和所述第二核酸中的一者或多者包括单链核酸、具有3'悬垂部的双链核酸、具有3'凹部的双链核酸,或它们的组合。
10.根据权利要求8至9中任一项所述的方法,其中所述第一核酸和所述第二核酸中的一者或多者包括脱氧核糖核酸(DNA)。
11.根据权利要求8至10中任一项所述的方法,其中所述第一核酸和所述第二核酸中的一者或多者的至少50%的核苷酸包括脱氧核糖核苷酸。
12.根据权利要求8至11中任一项所述的方法,其中所述第一核酸和所述第二核酸中的一者或多者包括单链脱氧核糖核酸(ssDNA)。
13.根据权利要求8至11中任一项所述的方法,其中所述第一核酸和所述第二核酸中的一者或多者包含至少一个核糖核苷酸。
14.根据权利要求8至13中任一项所述的方法,其中所述第二核酸包含结合有包含所述第一经修饰的碱基的所述第一核苷酸中的两个或更多个或者三个或更多个第一核苷酸的所述第一核酸。
15.根据权利要求14所述的方法,其中所述第二核酸中包含所述第一经修饰的碱基的所述第一核苷酸中的所述两个或更多个或者三个或更多个第一核苷酸是连续的。
16.根据权利要求8至15中任一项所述的方法,其中所述第一核苷三磷酸的所述第一经修饰的碱基包括经修饰的腺嘌呤、经修饰的鸟嘌呤、经修饰的胞嘧啶、经修饰的胸腺嘧啶或经修饰的尿嘧啶。
17.根据权利要求8至16中任一项所述的方法,其中所述第一核苷三磷酸包括5-(15-叠氮基-4,7,10,13-四氧杂-十五烷酰基-氨基烯丙基)-2'-脱氧尿苷-5'-三磷酸(叠氮化物-PEG4-氨基烯丙基-dUTP)、N6-(6-叠氮基)己基-3'-脱氧腺苷-5'-三磷酸(N6-(6-叠氮基)己基-3'-dATP),或它们的组合。
18.根据权利要求8至16中任一项所述的方法,其中所述第一核苷三磷酸包含共价连接的所述第一经修饰的碱基和第一辅助寡核苷酸。
19.根据权利要求8至17中任一项所述的方法,其中所述第一反应时间是至少1秒。
20.根据权利要求8至19中任一项所述的方法,其中所述第一温度是至少16℃至至少58℃。
21.根据权利要求8至20中任一项所述的方法,其中所述第一反应中的所述第一核酸的浓度是至少10nM。
22.根据权利要求8至21中任一项所述的方法,其中所述第一反应中的所述第一核苷三磷酸的浓度是至少0.1μM。
23.根据权利要求8至22中任一项所述的方法,其中所述第一反应中的所述重组TdT的浓度是至少10nM。
24.根据权利要求8至23中任一项所述的方法,
其中提供所述第一核酸和包含所述第一经修饰的碱基的所述第一核苷三磷酸包括:提供所述第一核酸、包含所述第一经修饰的碱基的所述第一核苷三磷酸、和第二核苷三磷酸,
其中使所述第一核酸和包含所述第一经修饰的碱基的所述第一核苷三磷酸与所述重组TdT接触包括:使所述第一核酸、包含所述第一经修饰的碱基的所述第一核苷三磷酸、和所述第二核苷三磷酸在所述第一反应中在所述第一温度下与所述重组TdT接触达所述第一反应时间以生成所述第二核酸,并且
其中所述第二核酸包含结合有以下的所述第一核酸:(i)包含来自所述第一核苷三磷酸的所述第一经修饰的碱基的所述第一核苷酸中的一个或多个第一核苷酸,以及(ii)一个或多个第二核苷酸。
25.根据权利要求24所述的方法,其中所述一个或多个第二核苷酸中的每个第二核苷酸包含来自所述第二核苷三磷酸的第二经修饰的碱基。
26.根据权利要求25所述的方法,其中所述第二核苷三磷酸的所述第二经修饰的碱基包括经修饰的腺嘌呤、经修饰的鸟嘌呤、经修饰的胞嘧啶、经修饰的胸腺嘧啶或经修饰的尿嘧啶。
27.根据权利要求25至26中任一项所述的方法,其中所述第一核苷三磷酸的所述第一经修饰的碱基和所述第二核苷三磷酸的所述第二经修饰的碱基包含对同一未修饰的碱基的修饰。
28.根据权利要求25至26中任一项所述的方法,其中所述第一核苷三磷酸的所述第一经修饰的碱基和所述第二核苷三磷酸的所述第二经修饰的碱基包含对不同的未修饰的碱基的修饰。
29.根据权利要求25至28中任一项所述的方法,其中所述第二核苷三磷酸包含共价连接的所述第二经修饰的碱基和第二辅助寡核苷酸。
30.根据权利要求24所述的方法,其中所述第二核苷酸中的每个第二核苷酸包含来自所述第二核苷三磷酸的第二未修饰的碱基。
31.根据权利要求30所述的方法,其中所述第二核苷三磷酸的所述第二未修饰的碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。
32.根据权利要求30至31中任一项所述的方法,其中所述第一经修饰的碱基包含对所述第二未修饰的碱基的修饰。
33.根据权利要求24至32中任一项所述的方法,其中包含所述第一经修饰的碱基的所述第一核苷三磷酸和所述第二核苷三磷酸以范围为约1:100至约100:1的比率与所述第一核酸接触。
34.根据权利要求24至33中任一项所述的方法,其中包含所述第一经修饰的碱基的所述第一核苷酸和所述第二核苷酸以范围为约1:100至约100:1的比率结合到所述第二核酸中。
35.根据权利要求8至20中任一项所述的方法,
其中提供所述第一核酸和包含所述第一经修饰的碱基的所述第一核苷三磷酸包括:提供所述第一核酸、包含所述第一经修饰的碱基的所述第一核苷三磷酸、和多种第二核苷三磷酸,
其中使所述第一核酸和包含所述第一经修饰的碱基的所述第一核苷三磷酸与所述重组TdT接触包括:使所述第一核酸、包含所述第一经修饰的碱基的所述第一核苷三磷酸和所述多种第二核苷三磷酸在所述第一反应中在所述第一温度下与所述重组TdT接触达所述第一反应时间以生成所述第二核酸,并且
其中所述第二核酸包含结合有以下的所述第一核酸:包含所述第一经修饰的碱基的所述第一核苷酸中的一个或多个第一核苷酸和来自所述多种第二核苷三磷酸的一个或多个第二核苷酸。
36.根据权利要求35所述的方法,其中所述多种第二核苷三磷酸包括脱氧核糖腺嘌呤三磷酸、脱氧核糖鸟嘌呤三磷酸、脱氧核糖胞嘧啶三磷酸、脱氧核糖胸腺嘧啶三磷酸、脱氧核糖尿嘧啶三磷酸,或它们的组合。
37.根据权利要求35至36中任一项所述的方法,其中所述多种第二核苷三磷酸中的两种第二核苷三磷酸以范围为约1:100至约100:1的比率与所述第一核酸接触。
38.根据权利要求35至37中任一项所述的方法,其中所述第二核苷酸中的两种第二核苷酸以范围为约1:100至约100:1的比率结合到所述第二核酸中。
39.根据权利要求35至38中任一项所述的方法,其中所述多种第二核苷三磷酸中的至少一种或每种第二核苷三磷酸包含第二未修饰的碱基。
40.根据权利要求35至39中任一项所述的方法,其中所述多种第二核苷三磷酸中的至少一种或每种第二核苷三磷酸包含第二经修饰的碱基。
41.根据权利要求8至40中任一项所述的方法,其中核苷酸的经修饰的碱基和未修饰的碱基以范围为约1:100至约100:1的比率结合到所述第二核酸中。
42.根据权利要求41所述的方法,其中所述经修饰的碱基包括所述第一经修饰的碱基和结合到所述第二核酸中的所述多种第二核苷酸中的至少一种或每种第二核苷酸的碱基。
43.根据权利要求41至42中任一项所述的方法,其中所述未修饰的碱基包括结合到所述第二核酸中的所述多种第二核苷酸中的至少一种或每种第二核苷酸的所述碱基。
44.根据权利要求35至43中任一项所述的方法,其中所述第二核酸的所述核苷酸碱基的至少1%包括经修饰的碱基。
45.根据权利要求44所述的方法,其中所述经修饰的碱基分布在整个所述第二核酸中。
46.根据权利要求45所述的方法,其中所述经修饰的碱基在整个所述第二核酸中随机分布。
47.根据权利要求44至46中任一项所述的方法,其中所述第二核酸包含多个两个或更多个连续的经修饰的碱基。
48.根据权利要求47所述的方法,其中所述多个连续的经修饰的碱基包括三个或更多个连续的经修饰的碱基。
49.根据权利要求8至48中任一项所述的方法,其中所述第二核酸的所述核苷酸碱基的至少1%包括所述第一经修饰的碱基。
50.根据权利要求8至49中任一项所述的方法,其中所述第一核酸包含能够结合核酸模板的模板捕获位点。
51.根据权利要求50所述的方法,其中所述模板捕获位点包含模板捕获序列,并且其中所述核酸模板包含与所述模板捕获序列的反向互补序列具有至少90%序列同一性并且能够与所述模板捕获序列杂交的序列。
52.根据权利要求51所述的方法,其中所述核酸模板包括单链DNA。
53.根据权利要求8至52中任一项所述的方法,其中所述第二核酸中的所述第一核苷三磷酸和所述第一核苷酸的所述第一经修饰的碱基中的一者或多者包含官能部分。
54.根据权利要求53所述的方法,其中所述第一经修饰的碱基的所述官能部分能够参与点击化学反应。
55.根据权利要求53至54中任一项所述的方法,其中所述第二核酸中的所述第一核苷三磷酸和所述第一核苷酸的所述第一经修饰的碱基包含饱和或不饱和、取代或未取代的直链或支链脂肪族碳链。
56.根据权利要求55所述的方法,其中所述第一经修饰的碱基的所述官能部分和所述碱基在通过所述饱和或不饱和、取代或未取代的直链或支链脂肪族碳链连接的所述第一经修饰的碱基的两个末端上。
57.根据权利要求8至56中任一项所述的方法,所述方法进一步包括:
提供第一辅助寡核苷酸;以及
使所述第二核酸与所述第一辅助寡核苷酸在第二反应中在第二温度下接触达第二反应时间以生成第三核酸,所述第三核酸包含附接至所述第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸的所述第二核酸。
58.根据权利要求57所述的方法,
其中提供所述第一辅助寡核苷酸包括:提供所述第一辅助寡核苷酸和第二辅助寡核苷酸,并且
其中使所述第二核酸与所述第一辅助寡核苷酸接触包括:使所述第二核酸与所述第一辅助寡核苷酸和所述第二辅助寡核苷酸在所述第二反应中在所述第二温度下接触达所述第二反应时间以生成所述第三核酸,所述第三核酸包含附接至所述第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸和所述第二辅助寡核苷酸中的一个或多个第二辅助寡核苷酸的所述第二核酸。
59.根据权利要求57至58中任一项所述的方法,其中所述第一辅助寡核苷酸包含第一衔接子序列或其反向互补序列。
60.根据权利要求57至59中任一项所述的方法,其中所述第二辅助寡核苷酸包含第二衔接子序列或其反向互补序列。
61.根据权利要求59至60中任一项所述的方法,其中所述第一衔接子序列包括P5序列。
62.根据权利要求59至61中任一项所述的方法,其中所述第二衔接子序列包括P7序列。
63.根据权利要求57至62中任一项所述的方法,其中所述第一辅助寡核苷酸和所述第二辅助寡核苷酸中的一者或多者的长度为约10个核苷酸至约100个核苷酸。
64.根据权利要求57至63中任一项所述的方法,其中所述第三核酸包含约10个至约1,000,000个所述第一辅助寡核苷酸。
65.根据权利要求57至64中任一项所述的方法,所述第三核酸包含约10个至约1,000,000个所述第二辅助寡核苷酸。
66.根据权利要求57至65中任一项所述的方法,其中所述第三核酸包含附接至所述第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸的所述第二核酸。
67.根据权利要求57至66中任一项所述的方法,其中所述第三核酸包含附接至所述第二辅助寡核苷酸中的一个或多个第二辅助寡核苷酸的所述第二核酸。
68.根据权利要求57至67中任一项所述的方法,其中提供所述第一辅助寡核苷酸包括提供包含所述第一辅助寡核苷酸和第一聚合物的第一辅助物,其中使所述第二核酸与所述第一辅助寡核苷酸接触包括使所述第二核酸与所述第一辅助物在所述第二反应中在所述第二温度下接触达所述第二反应时间以生成所述第三核酸,所述第三核酸包含附接至所述第一辅助物中的一个或多个第一辅助物的所述第二核酸。
69.根据权利要求57至68中任一项所述的方法,其中提供所述第二辅助寡核苷酸包括提供包含所述第二辅助寡核苷酸和第二聚合物的第二辅助物,并且/或者其中使所述第二核酸与所述第二辅助物接触包括使所述第二核酸与所述第二辅助物在所述第二反应中在所述第二温度下接触达所述第二反应时间以生成所述第三核酸,所述第三核酸包含附接至所述第二辅助物中的一个或多个第二辅助物的所述第二核酸。
70.根据权利要求68至69中任一项所述的方法,其中所述第一辅助物包含共价连接的所述第一辅助寡核苷酸和所述第一聚合物,并且其中所述第二辅助物包含共价连接的所述第二辅助寡核苷酸和所述第二聚合物。
71.根据权利要求57至67中任一项所述的方法,其中所述第一辅助寡核苷酸或所述第一聚合物包含第一官能部分。
72.根据权利要求57至67中任一项所述的方法,其中所述第二辅助寡核苷酸或所述第二聚合物包含第二官能部分。
73.根据权利要求57至73中任一项所述的方法,其中所述第一辅助寡核苷酸或所述第一聚合物的所述第一官能部分和所述第二辅助寡核苷酸或所述第二聚合物的所述第二官能部分是相同的。
74.根据权利要求73所述的方法,其中所述第一辅助寡核苷酸或所述第一聚合物的所述第一官能部分能够与所述第一核苷酸的所述第一经修饰的碱基的所述官能部分反应以形成共价键。
75.根据权利要求73至74中任一项所述的方法,其中所述第二辅助寡核苷酸或所述第二聚合物的所述第二官能部分能够与所述第一核苷酸的所述第一经修饰的碱基的所述官能部分反应以形成共价键。
76.根据权利要求71至75中任一项所述的方法,其中所述第一辅助寡核苷酸或所述第一聚合物的所述第一官能部分能够参与点击化学反应。
77.根据权利要求71至76中任一项所述的方法,其中所述第二辅助寡核苷酸或所述第二聚合物的所述第二官能部分能够参与点击化学反应。
78.根据权利要求76至77中任一项所述的方法,其中所述第一辅助寡核苷酸或所述第一聚合物的所述第一官能部分能够参与与所述第一核苷酸的所述第一经修饰的碱基的所述官能部分的点击化学反应。
79.根据权利要求76至78中任一项所述的方法,其中所述第二辅助寡核苷酸或所述第二聚合物的所述第二官能部分能够参与与所述第一核苷酸的所述第一经修饰的碱基的所述官能部分的点击化学反应。
80.根据权利要求76至79中任一项所述的方法,其中所述第一辅助寡核苷酸或所述第一聚合物的所述第一官能部分、所述第二辅助寡核苷酸或所述第二聚合物的所述第二官能部分、所述第一核苷三磷酸的所述第一经修饰的碱基的所述官能部分和所述第一核苷酸的所述官能部分中的一者或多者独立地为叠氮化物、炔基、烯基、硫醇或硝酮。
81.根据权利要求76至80中任一项所述的方法,其中所述第一核苷酸的所述第一经修饰的碱基的所述官能部分和所述第一辅助寡核苷酸或所述第一聚合物的所述第一官能部分、或所述第一核苷酸的所述第一经修饰的碱基的所述官能部分和所述第二辅助寡核苷酸或所述第二聚合物的所述第二官能部分、或两者选自以下对:
(i)叠氮基/炔基;
(ii)炔基/叠氮基;
(iii)硫醇/炔基;
(iv)炔基/硫醇;
(v)烯基/硫醇;
(vi)硫醇/烯基;
(vii)叠氮基/环辛炔基;
(viii)环辛炔基/叠氮基;
(ix)硝酮/环辛炔基;以及
(x)环辛炔基/硝酮。
82.根据权利要求76至81中任一项所述的方法,其中所述第一核苷酸的所述第一经修饰的碱基的所述官能部分是叠氮基,并且其中所述第一辅助寡核苷酸或所述第一聚合物的所述第一官能部分和所述第二辅助寡核苷酸或所述第二聚合物的所述第二官能部分中的一者或多者独立地为炔基。
83.根据权利要求76至82中任一项所述的方法,其中所述点击化学反应包括铜催化的叠氮化物-炔烃环加成(CuAAC),并且其中所述共价键包含三唑基。
84.根据权利要求83所述的方法,其中所述CuAAC包含Cu(I)稳定化配体。
85.根据权利要求84所述的方法,其中所述Cu(I)稳定化配体选自由以下组成的组:3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]丙醇(BTTP)、3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]硫酸氢丙酯(BTTPS)、2-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]硫酸氢乙酯(BTTES)、2-[4-{(双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基)甲基}-1H-1,2,3-三唑-1-基]-乙酸(BTTAA)、红菲绕啉二磺酸二钠盐(BPS)、N,N,N′,N″,N″-五甲基二亚乙基三胺(PMDETA)、三-((1-苄基-1H-1,2,3-三唑-4-基)甲基)胺(TBTA)、三(3-羟丙基三唑基甲基)胺(THPTA)、Nε-((1R,2R)-2-叠氮基环戊氧基)羰基)-L-赖氨酸(ACPK)和4-N,N-二甲基氨基-1,8-萘酰亚胺(4-DMN)。
86.根据权利要求76至82中任一项所述的方法,其中所述点击化学反应包括菌株促进的叠氮化物-炔烃环加成(SPAAC),并且其中所述共价键包含环辛-三唑基。
87.根据权利要求76至82中任一项所述的方法,其中所述点击化学反应包括炔烃加氢硫醇化,并且其中所述共价键包含烯基硫化物。
88.根据权利要求76至82中任一项所述的方法,其中所述点击化学反应包括烯烃加氢硫醇化,并且其中所述共价键包含烷基硫化物。
89.根据权利要求76至82中任一项所述的方法,其中所述点击化学反应包括应变促进的炔烃-硝酮环加成(SPANC),并且其中所述共价键包含八氢环辛-异噁唑基。
90.根据权利要求89所述的方法,其中所述环辛炔基是二苄基环辛炔(DBCO)或其衍生物。
91.根据权利要求76至90中任一项所述的方法,其中所述点击化学反应是生物相容的。
92.根据权利要求57至91中任一项所述的方法,其中所述第二温度是约20℃至约65℃。
93.根据权利要求57至91中任一项所述的方法,其中所述第二温度小于0℃。
94.根据权利要求57至91中任一项所述的方法,其中所述第二温度是约-4℃至约-20℃。
95.根据权利要求57至94中任一项所述的方法,其中所述第二反应时间是至少1秒。
96.根据权利要求59至95所述的方法,所述方法进一步包括:
(c)提供所述核酸模板,所述核酸模板包括所述第一衔接子序列或其反向互补序列、所述第二衔接子序列或其反向互补序列、以及能够与所述第三核酸上的所述模板捕获位点杂交的核酸杂交序列;
(d)使所述第三核酸与所述核酸模板接触以生成所述第三核酸,所述第三核酸具有经由所述核酸模板的所述核酸杂交序列与所述第三核酸上的所述模板捕获位点杂交的所述核酸模板;
(e)对与所述核酸模板杂交的所述第三核酸执行扩增以生成第四核酸,所述第四核酸包含附接至所述第一辅助寡核苷酸中的一个或多个第一辅助寡核苷酸和所述第二辅助寡核苷酸中的一个或多个第二辅助寡核苷酸的所述第三核酸,所述第一辅助寡核苷酸和所述第二辅助寡核苷酸经延伸以包含所述核酸模板的序列或其反向互补序列;以及
(f)使用所述第四核酸确定所述核酸模板的所述序列。
97.根据权利要求96所述的方法,其中所述核酸模板的所述核酸杂交序列包括所述模板捕获位点的反向互补序列。
98.根据权利要求8至97中任一项所述的方法,其中所述第一核酸、所述第二核酸、所述第三核酸和/或所述第四核酸包含第三聚合物。
99.根据权利要求1至98中任一项所述的方法,其中在功能上等同于Glu191的所述位置处的所述氨基酸取代突变包括非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸、或亲水性氨基酸。
100.根据权利要求1至98中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191的所述位置处的所述氨基酸取代突变是Glu191Ala、Glu191Arg、Glu191Asn、Glu191Asp、Glu191Cys、Glu191Gln、Glu191Gly、Glu191His、Glu191Ile、Glu191Leu、Glu191Lys、Glu191Met、Glu191Phe、Glu191Pro、Glu191Ser、Glu191Thr、Glu191Trp、Glu191Tyr、或Glu191Val。
101.根据权利要求1至98中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191的所述位置处的所述氨基酸取代突变是Glu191Val。
102.根据权利要求1至101中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Lys193的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。
103.根据权利要求1至101中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Lys193的所述位置处的所述氨基酸取代突变是Lys193Ala、Lys193Arg、Lys193Asn、Lys193Asp、Lys193Cys、Lys193Gln、Lys193Glu、Lys193Gly、Lys193His、Lys193Ile、Lys193Leu、Lys193Met、Lys193Phe、Lys193Pro、Lys193Ser、Lys193Thr、Lys193Trp、Lys193Tyr、或Lys193Val。
104.根据权利要求1至101中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Lys193的所述位置处的所述氨基酸取代突变是Lys193Asn。
105.根据权利要求1至104中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu194的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。
106.根据权利要求1至104中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu194的所述位置处的所述氨基酸取代突变是Glu194Ala、Glu194Arg、Glu194Asn、Glu194Asp、Glu194Cys、Glu194Gln、Glu194Gly、Glu194His、Glu194Ile、Glu194Leu、Glu194Lys、Glu194Met、Glu194Phe、Glu194Pro、Glu194Ser、Glu194Thr、Glu194Trp、Glu194Tyr、或Glu194Val。
107.根据权利要求1至104中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu194的所述位置处的所述氨基酸取代突变是Glu194Gly。
108.根据权利要求1至107中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Asp242的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。
109.根据权利要求1至107中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Asp242的所述位置处的所述氨基酸取代突变是Asp242Ala、Asp242Arg、Asp242Asn、Asp242Cys、Asp242Gln、Asp242Glu、Asp242Gly、Asp242His、Asp242Ile、Asp242Leu、Asp242Lys、Asp242Met、Asp242Phe、Asp242Pro、Asp242Ser、Asp242Thr、Asp242Trp、Asp242Tyr、或Asp242Val。
110.根据权利要求1至107中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Asp242的所述位置处的所述氨基酸取代突变是Asp242Tyr。
111.根据权利要求1至110中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Lys287的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、极性氨基酸、带正电的氨基酸、带负电的氨基酸、疏水性氨基酸、芳香族氨基酸、脂肪族氨基酸、小氨基酸或亲水性氨基酸的突变。
112.根据权利要求1至110中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Lys287的所述位置处的所述氨基酸取代突变是Lys287Ala、Lys287Arg、Lys287Asn、Lys287Asp、Lys287Cys、Lys287Gln、Lys287Glu、Lys287Gly、Lys287His、Lys287Ile、Lys287Leu、Lys287Met、Lys287Phe、Lys287Pro、Lys287Ser、Lys287Thr、Lys287Trp、Lys287Tyr、或Lys287Val。
113.根据权利要求1至110中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Lys287的所述位置处的所述氨基酸取代突变是Lys287Glu。
114.根据权利要求1至113中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Phe296的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。
115.根据权利要求1至113中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Phe296的所述位置处的所述氨基酸取代突变是Phe296Ala、Phe296Arg、Phe296Asn、Phe296Asp、Phe296Cys、Phe296Gln、Phe296Glu、Phe296Gly、Phe296His、Phe296Ile、Phe296Leu、Phe296Lys、Phe296Met、Phe296Pro、Phe296Ser、Phe296Thr、Phe296Trp、Phe296Tyr、或Phe296Val。
116.根据权利要求1至113中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Phe296的所述位置处的所述氨基酸取代突变是Phe296Leu。
117.根据权利要求1至116中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Met299的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。
118.根据权利要求1至116中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Met299的所述位置处的所述氨基酸取代突变是Met299Ala、Met299Arg、Met299Asn、Met299Asp、Met299Cys、Met299Gln、Met299Glu、Met299Gly、Met299His、Met299Ile、Met299Leu、Met299Lys、Met299Phe、Met299Pro、Met299Ser、Met299Thr、Met299Trp、Met299Tyr、或Met299Val。
119.根据权利要求1至116中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Met299的所述位置处的所述氨基酸取代突变是Met299Lys。
120.根据权利要求1至119中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Thr342的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。
121.根据权利要求1至119中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Thr342的所述位置处的所述氨基酸取代突变是Thr342Ala、Thr342Arg、Thr342Asn、Thr342Asp、Thr342Cys、Thr342Gln、Thr342Glu、Thr342Gly、Thr342His、Thr342Ile、Thr342Leu、Thr342Lys、Thr342Met、Thr342Phe、Thr342Pro、Thr342Ser、Thr342Trp、Thr342Tyr、或Thr342Val。
122.根据权利要求1至119中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Thr342的所述位置处的所述氨基酸取代突变是Thr342Ser。
123.根据权利要求1至122中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的His421的所述位置处的所述氨基酸取代突变包括对非极性氨基酸、疏水性氨基酸、脂肪族氨基酸或支链氨基酸的突变。
124.根据权利要求1至122中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的His421的所述位置处的所述氨基酸取代突变是His421Ala、His421Arg、His421Asn、His421Asp、His421Cys、His421Gln、His421Glu、His421Gly、His421Ile、His421Leu、His421Lys、His421Met、His421Phe、His421Pro、His421Ser、His421Thr、His421Trp、His421Tyr、或His421Val。
125.根据权利要求1至122中任一项所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的His421的所述位置处的所述氨基酸取代突变是His421Pro。
126.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的两个或更多个位置处包含两个或更多个氨基酸取代突变。
127.根据权利要求126所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述两个或更多个位置处的所述两个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的两者或更多者。
128.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的三个或更多个位置处包含三个或更多个氨基酸取代突变。
129.根据权利要求128所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述三个或更多个位置处的所述三个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的三者或更多者。
130.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的四个或更多个位置处包含四个或更多个氨基酸取代突变。
131.根据权利要求130所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述四个或更多个位置处的所述四个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的四者或更多者。
132.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的五个或更多个位置处包含五个或更多个氨基酸取代突变。
133.根据权利要求132所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述五个或更多个位置处的所述五个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的五者或更多者。
134.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的六个或更多个位置处包含六个或更多个氨基酸取代突变。
135.根据权利要求134所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述六个或更多个位置处的所述六个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的六者或更多者。
136.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的七个或更多个位置处包含七个或更多个氨基酸取代突变。
137.根据权利要求136所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述七个或更多个位置处的所述七个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的七者或更多者。
138.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个或更多个位置处包含八个或更多个氨基酸取代突变。
139.根据权利要求138所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述八个或更多个位置处的所述八个或更多个氨基酸取代突变分别包括Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro中的八者或更多者。
140.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的八个位置处包含八个氨基酸取代突变。
141.根据权利要求140所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述八个位置处的所述八个氨基酸取代突变分别是Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。
142.根据权利要求1至125中任一项所述的方法,其中所述重组TdT在功能上等同于SEQID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的位置处包含九个氨基酸取代突变。
143.根据权利要求142所述的方法,其中在功能上等同于SEQ ID NO:12的所述家牛TdT中的Glu191、Lys193、Glu194、Asp242、Lys287、Phe296、Met299、Thr342和His421的所述位置处的所述九个氨基酸取代突变分别是Glu191Val、Lys193Asn、Glu194Gly、Asp242Tyr、Lys287Glu、Phe296Leu、Met299Lys、Thr342Ser和His421Pro。
144.根据权利要求1至142中任一项所述的方法,其中所述重组TdT包含与SEQ ID NO:1至少85%同一的氨基酸序列。
145.根据权利要求1至142中任一项所述的方法,其中所述重组TdT包含与SEQ ID NO:1至少90%同一的氨基酸序列。
146.根据权利要求1至142中任一项所述的方法,其中所述重组TdT包含与SEQ ID NO:1至少95%同一的氨基酸序列。
147.根据权利要求1至142中任一项所述的方法,其中所述重组TdT包含与SEQ ID NO:11至少95%同一的氨基酸序列。
148.根据权利要求1至142中任一项所述的方法,其中所述重组TdT包含与SEQ ID NO:12至少80%同一的氨基酸序列。
149.根据权利要求1至148中任一项所述的方法,其中所述重组TdT在47℃或更高的温度下是稳定的。
150.根据权利要求1至148中任一项所述的方法,其中所述重组TdT在50℃或更高的温度下是稳定的。
151.根据权利要求1至148中任一项所述的方法,其中所述重组TdT在55℃或更高的温度下是稳定的。
152.根据权利要求1至148中任一项所述的方法,其中所述重组TdT在58℃或更高的温度下是稳定的。
153.根据权利要求1至152中任一项所述的方法,其中在相同的测试温度下,所述重组TdT的所述末端脱氧核苷酸转移酶活性是SEQ IDNO:12的所述家牛TdT的所述末端脱氧核苷酸转移酶活性的至少80%、85%、90%、95%、100%、105%、110%、115%或120%。
154.根据权利要求153所述的方法,其中所述测试温度是37℃、47℃、50℃、55℃或58℃。
155.根据权利要求1至154中任一项所述的方法,其中所述重组TdT包含小泛素样修饰剂(SUMO)片段。
156.根据权利要求155所述的方法,其中所述SUMO片段包含与SEQ IDNO:13至少80%同一的氨基酸序列。
157.根据权利要求155至156中任一项所述的方法,其中所述重组TdT包含所述重组TdT的所述N末端上的所述SUMO片段。
158.根据权利要求156所述的方法,其中所述重组TdT包含与SEQ IDNO:14至少80%同一的氨基酸序列。
159.根据权利要求156所述的方法,其中所述重组TdT包含与SEQ IDNO:15至少80%同一的氨基酸序列。
根据权利要求155至156中任一项所述的方法,其中所述重组TdT包含所述重组TdT的所述C末端上的所述SUMO片段。
160.一种第二核酸,所述第二核酸是通过根据权利要求8至159中任一项所述的方法获得的。
161.一种第三核酸,所述第三核酸是通过根据权利要求57至159中任一项所述的方法获得的。
162.一种第四核酸,所述第四核酸是通过根据权利要求96至159中任一项所述的方法获得的。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063023736P | 2020-05-12 | 2020-05-12 | |
US63/023,736 | 2020-05-12 | ||
PCT/US2021/031843 WO2021231477A2 (en) | 2020-05-12 | 2021-05-11 | Generating nucleic acids with modified bases using recombinant terminal deoxynucleotidyl transferase |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115916967A true CN115916967A (zh) | 2023-04-04 |
Family
ID=76284169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180035378.3A Pending CN115916967A (zh) | 2020-05-12 | 2021-05-11 | 使用重组末端脱氧核苷酸转移酶生成具有经修饰的碱基的核酸 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20210355518A1 (zh) |
EP (1) | EP4150065A2 (zh) |
JP (1) | JP2023526062A (zh) |
KR (1) | KR20230035237A (zh) |
CN (1) | CN115916967A (zh) |
AU (1) | AU2021271637A1 (zh) |
CA (1) | CA3177286A1 (zh) |
WO (1) | WO2021231477A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116836955A (zh) * | 2023-05-17 | 2023-10-03 | 中国科学院深圳先进技术研究院 | 末端脱氧核苷酸转移酶及其制备方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022019836A1 (en) | 2020-07-21 | 2022-01-27 | Illumina Singapore Pte Ltd | Base-modified nucleotides as substrates for tdt-based enzymatic nucleic acid |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU622426B2 (en) | 1987-12-11 | 1992-04-09 | Abbott Laboratories | Assay using template-dependent nucleic acid probe reorganization |
CA1341584C (en) | 1988-04-06 | 2008-11-18 | Bruce Wallace | Method of amplifying and detecting nucleic acid sequences |
AU3539089A (en) | 1988-04-08 | 1989-11-03 | Salk Institute For Biological Studies, The | Ligase-based amplification method |
JP2801051B2 (ja) | 1988-06-24 | 1998-09-21 | アムジエン・インコーポレーテツド | 核酸塩基配列を検出するための方法及び試薬 |
US5130238A (en) | 1988-06-24 | 1992-07-14 | Cangene Corporation | Enhanced nucleic acid amplification process |
ATE138106T1 (de) | 1988-07-20 | 1996-06-15 | David Segev | Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen |
US5185243A (en) | 1988-08-25 | 1993-02-09 | Syntex (U.S.A.) Inc. | Method for detection of specific nucleic acid sequences |
EP0450060A1 (en) | 1989-10-26 | 1991-10-09 | Sri International | Dna sequencing |
KR950013953B1 (ko) | 1990-01-26 | 1995-11-18 | 애보트 래보라토리즈 | 리가제 연쇄 반응에 적용가능한 표적 핵산의 증폭 방법 |
US5573907A (en) | 1990-01-26 | 1996-11-12 | Abbott Laboratories | Detecting and amplifying target nucleic acids using exonucleolytic activity |
US5223414A (en) | 1990-05-07 | 1993-06-29 | Sri International | Process for nucleic acid hybridization and amplification |
US5455166A (en) | 1991-01-31 | 1995-10-03 | Becton, Dickinson And Company | Strand displacement amplification |
CA2182517C (en) | 1994-02-07 | 2001-08-21 | Theo Nikiforov | Ligase/polymerase-mediated primer extension of single nucleotide polymorphisms and its use in genetic analysis |
AU687535B2 (en) | 1994-03-16 | 1998-02-26 | Gen-Probe Incorporated | Isothermal strand displacement nucleic acid amplification |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
ES2563643T3 (es) | 1997-04-01 | 2016-03-15 | Illumina Cambridge Limited | Método de secuenciación de ácido nucleico |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US7611869B2 (en) | 2000-02-07 | 2009-11-03 | Illumina, Inc. | Multiplexed methylation detection methods |
US7582420B2 (en) | 2001-07-12 | 2009-09-01 | Illumina, Inc. | Multiplex nucleic acid reactions |
US7955794B2 (en) | 2000-09-21 | 2011-06-07 | Illumina, Inc. | Multiplex nucleic acid reactions |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
CN101525660A (zh) | 2000-07-07 | 2009-09-09 | 维西根生物技术公司 | 实时序列测定 |
AU2002227156A1 (en) | 2000-12-01 | 2002-06-11 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
AR031640A1 (es) | 2000-12-08 | 2003-09-24 | Applied Research Systems | Amplificacion isotermica de acidos nucleicos en un soporte solido |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
US8030000B2 (en) | 2002-02-21 | 2011-10-04 | Alere San Diego, Inc. | Recombinase polymerase amplification |
US7399590B2 (en) | 2002-02-21 | 2008-07-15 | Asm Scientific, Inc. | Recombinase polymerase amplification |
AU2003259350A1 (en) | 2002-08-23 | 2004-03-11 | Solexa Limited | Modified nucleotides for polynucleotide sequencing |
CA2498764C (en) | 2002-09-20 | 2015-11-10 | New England Biolabs, Inc. | Helicase dependent amplification of nucleic acids |
CA2528577C (en) | 2003-06-20 | 2012-08-07 | Illumina, Inc. | Methods and compositions for whole genome amplification and genotyping |
GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
WO2005065814A1 (en) | 2004-01-07 | 2005-07-21 | Solexa Limited | Modified molecular arrays |
JP2008513782A (ja) | 2004-09-17 | 2008-05-01 | パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド | 分子解析のための装置及び方法 |
EP1828412B2 (en) | 2004-12-13 | 2019-01-09 | Illumina Cambridge Limited | Improved method of nucleotide detection |
EP1888743B1 (en) | 2005-05-10 | 2011-08-03 | Illumina Cambridge Limited | Improved polymerases |
GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
EP2021503A1 (en) | 2006-03-17 | 2009-02-11 | Solexa Ltd. | Isothermal methods for creating clonal single molecule arrays |
EP4105644A3 (en) | 2006-03-31 | 2022-12-28 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
WO2008051530A2 (en) | 2006-10-23 | 2008-05-02 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
EP2653861B1 (en) | 2006-12-14 | 2014-08-13 | Life Technologies Corporation | Method for sequencing a nucleic acid using large-scale FET arrays |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
EP2121983A2 (en) | 2007-02-02 | 2009-11-25 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
TW200951219A (en) * | 2008-05-06 | 2009-12-16 | Academia Sinica | An improved SUMO fusion protein system for effective production of native proteins |
EP2291533B2 (en) | 2008-07-02 | 2020-09-30 | Illumina Cambridge Limited | Using populations of beads for the fabrication of arrays on surfaces |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
US8778848B2 (en) | 2011-06-09 | 2014-07-15 | Illumina, Inc. | Patterned flow-cells useful for nucleic acid analysis |
PT3623481T (pt) | 2011-09-23 | 2021-10-15 | Illumina Inc | Composições para sequenciação de ácidos nucleicos |
WO2013063382A2 (en) | 2011-10-28 | 2013-05-02 | Illumina, Inc. | Microarray fabrication system and method |
EP3366348B1 (en) | 2012-01-16 | 2023-08-23 | Greatbatch Ltd. | Emi filtered co-connected hermetic feedthrough, feedthrough capacitor and leadwire assembly for an active implantable medical device |
CN204832037U (zh) | 2012-04-03 | 2015-12-02 | 伊鲁米那股份有限公司 | 检测设备 |
US8895249B2 (en) | 2012-06-15 | 2014-11-25 | Illumina, Inc. | Kinetic exclusion amplification of nucleic acid libraries |
US9512422B2 (en) | 2013-02-26 | 2016-12-06 | Illumina, Inc. | Gel patterned surfaces |
MX363806B (es) | 2013-07-01 | 2019-04-03 | Illumina Inc | Funcionalización de superficies sin catalizador e injerto de polímeros.. |
US11390858B2 (en) * | 2014-10-20 | 2022-07-19 | Molecular Assemblies, Inc. | Modified template-independent enzymes for polydeoxynucleotide synthesis |
US10774316B2 (en) * | 2014-10-20 | 2020-09-15 | Molecular Assemblies, Inc. | Modified template-independent enzymes for polydeoxynucleotide synthesis |
LT3212684T (lt) | 2014-10-31 | 2020-04-10 | Illumina Cambridge Limited | Polimerai ir dnr kopolimero dangos |
CN116083546A (zh) | 2015-02-10 | 2023-05-09 | 亿明达股份有限公司 | 用于分析细胞组分的方法和组合物 |
GB201502152D0 (en) * | 2015-02-10 | 2015-03-25 | Nuclera Nucleics Ltd | Novel use |
WO2018217689A1 (en) * | 2017-05-22 | 2018-11-29 | The Charles Stark Draper Laboratory, Inc. | Modified template-independent dna polymerase |
US11293056B2 (en) * | 2017-11-07 | 2022-04-05 | Life Technologies Corporation | Methods and compositions for manipulating nucleic acids |
US10752887B2 (en) * | 2018-01-08 | 2020-08-25 | Dna Script | Variants of terminal deoxynucleotidyl transferase and uses thereof |
GB201901501D0 (en) * | 2019-02-04 | 2019-03-27 | Nuclera Nucleics Ltd | Modified terminal deoxynucleotidyl transferase (TdT) enzymes |
-
2021
- 2021-05-11 CA CA3177286A patent/CA3177286A1/en active Pending
- 2021-05-11 WO PCT/US2021/031843 patent/WO2021231477A2/en unknown
- 2021-05-11 US US17/317,700 patent/US20210355518A1/en active Pending
- 2021-05-11 KR KR1020227042792A patent/KR20230035237A/ko unknown
- 2021-05-11 AU AU2021271637A patent/AU2021271637A1/en active Pending
- 2021-05-11 CN CN202180035378.3A patent/CN115916967A/zh active Pending
- 2021-05-11 JP JP2022568838A patent/JP2023526062A/ja active Pending
- 2021-05-11 EP EP21730356.9A patent/EP4150065A2/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116836955A (zh) * | 2023-05-17 | 2023-10-03 | 中国科学院深圳先进技术研究院 | 末端脱氧核苷酸转移酶及其制备方法 |
CN116836955B (zh) * | 2023-05-17 | 2024-05-10 | 中国科学院深圳先进技术研究院 | 末端脱氧核苷酸转移酶及其制备方法 |
Also Published As
Publication number | Publication date |
---|---|
AU2021271637A1 (en) | 2022-12-08 |
JP2023526062A (ja) | 2023-06-20 |
US20210355518A1 (en) | 2021-11-18 |
WO2021231477A9 (en) | 2022-01-06 |
WO2021231477A2 (en) | 2021-11-18 |
CA3177286A1 (en) | 2021-11-18 |
KR20230035237A (ko) | 2023-03-13 |
WO2021231477A3 (en) | 2022-03-17 |
EP4150065A2 (en) | 2023-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018259202B2 (en) | Compositions and methods for improving sample identification in indexed nucleic acid libraries | |
DK2943589T3 (en) | PROCEDURES AND SOLID CARRIERS FOR SAMPLE PREPARATION USING TRANSPOSOMES | |
AU2021286342B2 (en) | Sequencing from multiple primers to increase data rate and density | |
CN110997932A (zh) | 用于甲基化测序的单细胞全基因组文库 | |
WO2016156845A1 (en) | Surface concatamerization of templates | |
CN110785497A (zh) | 用于改进编索引的核酸文库中的样品鉴定的组合物和方法 | |
CN115916967A (zh) | 使用重组末端脱氧核苷酸转移酶生成具有经修饰的碱基的核酸 | |
CN107849598B (zh) | 簇中的表面引物的增强利用 | |
WO2018013724A1 (en) | System and method for transposase-mediated amplicon sequencing | |
WO2023196983A2 (en) | Methods for polynucleotide sequencing | |
CN117015603A (zh) | 使用基于转座子的技术与用于误差校正的独特分子标识符制备定向标签化测序文库的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |