CN114729389A - 增加多核苷酸的无模板酶促合成中的长序列产率 - Google Patents

增加多核苷酸的无模板酶促合成中的长序列产率 Download PDF

Info

Publication number
CN114729389A
CN114729389A CN202080066564.9A CN202080066564A CN114729389A CN 114729389 A CN114729389 A CN 114729389A CN 202080066564 A CN202080066564 A CN 202080066564A CN 114729389 A CN114729389 A CN 114729389A
Authority
CN
China
Prior art keywords
leu
glu
lys
ala
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080066564.9A
Other languages
English (en)
Other versions
CN114729389B (zh
Inventor
阿德里安·霍根
斯蒂芬·麦克维茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DNA Script SAS
Original Assignee
DNA Script SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DNA Script SAS filed Critical DNA Script SAS
Publication of CN114729389A publication Critical patent/CN114729389A/zh
Application granted granted Critical
Publication of CN114729389B publication Critical patent/CN114729389B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及采用杂交严格性和/或用于去除失效序列的核酸酶消化进行多核苷酸无模板酶促合成的方法和试剂盒。

Description

增加多核苷酸的无模板酶促合成中的长序列产率
背景
最近,人们对多核苷酸合成的酶促方法的兴趣有所增加,这不仅是因为许多领域(如合成生物学、CRISPR-Cas9应用和高通量测序)对合成多核苷酸的需求增加,而且还因为多核苷酸合成的化学方法的局限性,如产物长度的上限以及有机溶剂的使用和所期望处置,Jensen等人,Biochemistry,57:1821-1832(2018)。酶促合成因其特异性和效率以及它对温和水性反应条件的要求而具有吸引力。
目前,大多数酶促方法采用无模板聚合酶将3’-O-封闭的三磷酸核苷重复添加到单链引发剂或与支持物连接的延长链,然后去封闭直到获得所期望序列的多核苷酸。还可以包括加帽步骤。因为这些步骤--单体连接、去封闭和加帽--通常不会进行到完成,所以可能会生成失效序列。因此,大多数无模板酶促合成方法面临的挑战是将全长最终产物与失效序列分离。
鉴于上述情况,如果改进的方法可用于将全长最终产物与失效序列分离,则多核苷酸的酶促合成将得到推进。
发明概述
本发明涉及用于多核苷酸的无模板酶促合成的方法和试剂盒,其包括用于从最终多核苷酸产物减少或清除失效序列的步骤。在各种实施方案中,此类步骤包括一个或多个基于杂交的、基于核酸酶消化的和基于捕获的子步骤。
在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,其包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;b)重复以下循环直到形成具有所述预定序列的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-封闭的三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段;c)通过使引物退火至至少一条多核苷酸的3’端,并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链多核苷酸;d)提供具有在所述双链多核苷酸中解离失效序列的杂交严格性的反应条件;以及e)消化所解离的双链多核苷酸的链。
在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,其包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;b)重复以下循环直到形成扩增的多核苷酸,其中每条在其3’端处包含具有通用引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-封闭的三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段;c)通过使引物退火至每个扩增的多核苷酸的所述通用引物结合位点并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链扩增的多核苷酸;d)提供具有杂交严格性的反应条件,使得在所述双链扩增的多核苷酸中的失效序列解离;以及e)消化所解离的双链扩增的多核苷酸的链。
在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;b)重复以下循环直到形成扩增的多核苷酸或其失效序列,其中每条在其3’端处包含具有引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-封闭的三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段;c)使引物退火至所述扩增的多核苷酸或其失效序列的引物结合位点;d)重复以下循环直到形成扩增的多核苷酸的反向互补序列:(i)在引物延伸条件下使所述引物或具有游离3’-O-羟基的延伸引物与3’-O-封闭的三磷酸核苷以及模板依赖性的DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延伸所述引物或所述延伸引物,以形成包含3’-O-封闭的延伸引物的双链片段,以及(ii)对所述延伸引物去封闭以形成具有游离3’-羟基的延伸引物,其中在所述接触步骤(i)中,以与所述预定序列的反向互补序列相同的顺序使所述引物或所述延伸引物与3’-O-封闭的三磷酸核苷接触,从而在失效序列上形成截短的反向互补序列;以及e)通过它们截短的反向互补序列去除失效序列。
在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;b)重复以下循环直到形成具有所述预定序列的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-氨基三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-氨基三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-氨基延长片段,(ii)将所述3’-O-氨基延长片段转换为3’-肟-延长片段,(iii)用3’-核酸外切酶处理所述延长片段;(iv)将3’-肟-延长片段转换为3’-O-氨基延长片段;以及(v)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段。
本发明的另一目的是提供用于增强用模板非依赖性DNA聚合酶合成全长多核苷酸的试剂盒,所述试剂盒包含:(a)用于具有预定序列的多核苷酸的模板非依赖性合成的一个或多个TdT变体,(b)退火至所述多核苷酸的通用引物结合位点的一条或多条引物,(c)用于延伸退火至所述通用引物结合位点的所述一条或多条引物的模板依赖性聚合酶,和(c)消化失效序列的一种或多种单链核酸酶。
附图简述
图1A和图1B以图解法示出了可用作本发明的一部分的多核苷酸的无模板酶促合成的方法。
图2A以图解法示出了本发明的使用杂交严格性来去除失效序列的方法的实施方案。
图2B以图解法示出了本发明的使用加帽和核酸外切酶处理来去除失效序列的方法。
图3A-图3C以图解法示出了实施方案,其采用模板非依赖性合成,然后进行合成链的模板依赖性的重新合成,然后进行非完整双链产物的核酸酶消化。
图4A-图4C示出了本发明的采用在阵列上杂交捕获全长多核苷酸的实施方案。
图5A-图5C示出了通过在阵列上组装全长多核苷酸来产生长片段的实施方案。
图6显示了证明3’-肟基团赋予核酸外切酶抗性的数据。
图7A示出了可用于直接或间接切割电化学不稳定基团的稳压器/恒流器(PGSTAT)电路。
图7B以图解法示出了用于实施本发明方法的设备的组件。
图7C以图解法示出了用于实施本发明方法的可替代设备,其中一些试剂使用喷墨液滴发生器被递送至反应部位。
发明详述
本发明的一般原理在本文中被更详细地公开,特别是通过实例的方式,如附图中所示和详细描述的那些实例。然而,应当理解,本发明不将本发明限制于所描述的特定实施方案。本发明可进行各种修改和可替代形式,其细节针对若干实施方案示出。本发明将涵盖落入本发明的原理和范围内的所有修改、等效物和可替代物。
除非另有指示,否则本发明的实践可以采用有机化学、分子生物学(包括重组技术)、细胞生物学和生物化学的常规技术和描述,这些都在本领域的技术范围内。此类常规技术可以包括但不限于合成肽、合成多核苷酸、单克隆抗体的制备和使用,核酸克隆,扩增,测序和分析以及相关技术。此类常规技术的方案可在制造商的产品文献和标准实验室手册中找到,诸如基因组分析:实验室手册系列(第I-IV卷)(Genome Analysis:A LaboratoryManual Series(Vols.I-IV));PCR引物:实验室手册(PCR Primer:A Laboratory Manual);和分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)(全部来自冷泉港实验室出版社);Lutz和Bornscheuer,编辑,蛋白质工程手册(Protein EngineeringHandbook)(Wiley-VCH,2009);Hermanson,Bioconjugate Techniques,第2版(学术出版社(Academic Press),2008);以及类似文献。
本发明涉及多核苷酸的无模板酶促合成方法,其包括用于减少最终产物中的失效序列数量的步骤。此类步骤包括但不限于依赖于杂交严格性和核酸酶处理来提高全长多核苷酸产率的步骤。图2A示出了本发明的一实施方案的步骤。固体支持物(202)提供为具有引发剂(204),以进行无模板酶促多核苷酸合成(下文有更完整的描述)。在合成(206)后,即在进行预定数量的连续掺入预定核苷酸序列的循环后,初始产物(207)含有多核苷酸的混合物,其包含全长序列(208)和由于掺入(包括掺入未封闭的dNTP污染物)、去封闭和/或加帽等失败而缺失一个或多个核苷酸的失效序列(210a)。尽管不希望受理论束缚,但据信序列失效的另一个重要来源是由于酶变性和/或粘附到固体支持物和/或生长的多核苷酸链的空间位阻,结果是大多数失效序列是所期望序列的3’截短;因此,大多数失效序列没有可用作引物结合位点的3’端序列,并且可以通过该特性与全长多核苷酸区分开来。
对于全长多核苷酸,可以使引物(214)退火(212)至其3’端并在4种dNTP存在的情况下通过模板依赖性聚合酶延伸(216),以合成初始产物的反向互补链,产生双链多核苷酸产物(218),其可能包括一些双链形式的失效序列(210b)。反应混合物的严格性增加(220),直到失效序列的反向互补序列开始从初始合成链解链(222)。严格性增加,直到仅全长双链多核苷酸产物(221)保留在固体支持物(202)上。然后可以用优先破坏单链DNA(如3’截短的失效序列)的核酸酶(例如3’→5’核酸外切酶,如大肠杆菌(E.coli)核酸外切酶I)处理(224)剩余的全长序列。然后可以从固体支持物(202)上释放全长链(225),作为双链(228)或单链(230)产物。在一些实施方案中,引物(214)及其引物结合位点可以包括IIs型限制性核酸内切酶位点或切口酶位点,以从与固体支持物(202)连接的链去除末端引物结合位点。在另一实施方案中,引物可以用模板依赖性聚合酶来延伸,其中在每个反应步骤中仅包括单一dNTP,并且此类dNTP的序列由全长多核苷酸所期望的预定序列确定(例如,如图3A的实施方案所述的)。因此,至用作模板的多核苷酸包含任何缺失或其他异常所达到的程度,模板/延伸的引物复合物的双链部分将减少,从而允许通过杂交严格性从全长序列更容易地分离失效序列。
在一些实施方案中,在合成期间,可以通过将通用引物结合位点合成至其3’端来扩增所期望预定序列的多核苷酸。例如,可以在以下步骤中进行此类实施方案:(a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;(b)重复以下循环直到形成扩增的多核苷酸,其中每条在其3’端处包含具有通用引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-封闭的三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段;(c)通过使引物退火至每个扩增的多核苷酸的所述通用引物结合位点并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链扩增的多核苷酸;(d)提供具有杂交严格性的反应条件,使得在所述双链扩增的多核苷酸中的失效序列解离;以及(e)消化所解离的双链扩增的多核苷酸的链。在其他实施方案中,所述方法可以包括从未消化的双链扩增的多核苷酸上切割通用引物结合位点以产生预定序列的所述多核苷酸的步骤。例如,可以通过以其双链形式设计通用引物结合位点以包含IIs型限制性核酸内切酶识别位点,来完成此类切割。可以切割引物结合位点并洗涤固体支持物,以在从支持物上释放所期望的多核苷酸之前去除双链片段和核酸内切酶。
图2B示出了本发明的另一实施方案的步骤,其中在最终循环中对全长链加帽,以防止在通过核酸酶处理消化失效序列后核酸酶被消化,从而仅保留全长链。在此类消化后,可以去除捕获部分(264)。如上所述,固体支持物(252)上的引发剂(254)通过无模板酶促合成而延伸(256),产生包含全长多核苷酸(258)和如上所述的失效序列(260)(其主要为3’-截短)的产物(257)。在预定数量的去封闭-掺入循环后,进行最终的加帽步骤(262),以向全长链添加加帽部分(264),其使得它们对3’→5’核酸外切酶消化具有抗性。在一些实施方案中,添加加帽部分(264)的反应是可逆的,使得在消化失效序列后,可以去除加帽部分(264),以恢复3’-羟基端。在本发明的一个方面,如通过图6中的数据所示的,在采用3’-O-氨基-dNTP单体的实施方案中,已发现3’-O-胺部分可易于转换为3’-肟部分(例如,于50mM乙酸盐中的50mM丙酮,pH 5),并且3’-肟对核酸外切酶处理(例如,热稳定的核酸外切酶I,NEB)具有抗性。此外,3’-O-肟可通过用甲氧基胺或等效试剂处理而转换回3’-O-胺。3’-O-胺可通过去封闭而转换为3’-羟基,其在一些实施方案中,可以通过甲氧基胺处理在相同的反应混合物中进行。在其他实施方案中,多聚A尾可被添加为加帽部分,以防止被3’→5’核酸外切酶消化。
回到图2B,在加帽(262)后,用3’→5’核酸外切酶消化未加帽的序列(270)(如虚线所示的),其后去除加帽部分(264)。可从固体支持物(252)上释放或切割(271)全长链(274),以产生单链产物(273),或者它们可被转换(276)为双链形式,并被释放或被切割(278),以产生双链产物(280)。如图2A的实施方案中所示,还可以通过将通用引物结合位点合成至多核苷酸的3’端来扩增本实施方案的多核苷酸,所述通用引物结合位点可以在完整合成、退火引物和产生互补链后被去除。
本发明的另一实施方案在图3A中示出。按如上所述合成多核苷酸产物(307),并将引物(314)退火至新合成链的3’端。然后使用模板依赖性的聚合酶延伸(331)引物(314),其中3’封闭的dNTP被递送至通过无模板的合成合成的链的所期望序列的反向互补序列中的延伸引物(314)。由于暴露于生长的互补链的3’封闭的dNTP的序列是所期望序列的反向互补序列,因此一旦到达失效位置,用作模板的失效序列将与所呈现的3’-封闭的dNTP以及截短或停止被延伸的失效序列的反向互补链变得反相。也就是说,在用作模板的全长多核苷酸上,下一个碱基可能是“A”,而失效序列可能缺失“A”,使得不会掺入3’-可逆保护的dTTP。虽然失效序列可能会因偶然出现的序列而重新开始延伸,但它会导致最终的延伸产物比用作模板的全长多核苷酸的产物短。只有全长序列(332)会产生完整的双链产物。可以通过解链和/或核酸外切酶消化(例如,exo I、exo T、exo VII)或通过用非特异性单链核酸内切酶(绿豆、核酸酶P1)处理,来从固体支持物(302)上去除(334)失效序列及其截短的组分。如上所述,全长链(335)可以作为单链(338)或双链(340)产物释放(336)。如图3B所示的,全长链(380)可被用于通过线性扩增产生互补链。也就是说,全长双链产物(380)的非共价连接链可以被解链(382)以释放互补链(384),其后引物(386)可以退火(385)至共价连接链(388)并在常规的模板依赖性聚合酶延伸反应中延伸(389),以形成新的非共价连接产物(390)。产物(390)可以从共价连接的全长链中解链并且重复循环(392)。在一些实施方案中,可以在每个核苷酸添加循环中实施加帽步骤。在其他实施方案中,全长链可以通过固相扩增方法(如桥式PCR、RPA、模板步移等)扩增。在一些此类扩增中,可以为固体支持物(302)提供引物群以及引发剂(304)。如在图2A的实施方案中,该实施方案的多核苷酸也可以通过将通用引物结合位点合成至多核苷酸的3’端来扩增,所述通用引物结合位点可以在合成完成、引物退火和互补链产生后被去除。
如图3C中所示的,图3A的实施方案可以通过无模板合成和模板依赖性合成的一系列交替步骤来进行。通过采用此类交替步骤,合成的链可以保持相对短,从而使全长序列与失效序列之间的解链温度差异最大化。例如,无模板合成的步骤包括多达10个,或多达20个,或多达30个,或多达40个,或多达50个连接循环。在一些实施方案中,无模板合成的步骤可以包括在10至50个范围内的多个掺入循环;在其他实施方案中,范围可以是10至30个;在其他实施方案中,该范围可以是10至20个。如上所述,初始产物(350)通过无模板酶促合成制备,其后引物(314)退火至合成链,并在3’-封闭的dNTP存在的情况下通过模板依赖性聚合酶延伸(354),以产生双链产物(355)。双链产物(355)包括完全双链的全长序列(357)以及部分双链和部分单链的失效序列(353)。如上文所提及的,双链产物(355)可以通过优先对较短失效序列的互补序列解链,然后进行单链核酸外切酶处理,或(如同所示的)通过切割引物(314)及其引物结合位点(显示为双链片段(358),然后优先解链(359)以及进行核酸外切酶处理而被加工(356),以产生全长序列,其可通过另一轮的无模板酶促合成(360)而延伸,以进而产生延伸的产物(362),其中每个包含新的片段(365),其可以包括新的失效序列。然后对延伸产物(362)进行另一循环(364)的引物退火、延伸和去除失效序列。
在一些实施方案中,可以通过在它们各自的引发剂上使用正交保护基团,在与所期望的多核苷酸相同的阵列上合成在图2A-图2B、图3A-图3C和相关实施方案中描述的实施方案中采用的引物,例如,使用由Godron等人,国际专利公开WO2020/141143所公开的技术。因此,在一些实施方案中,可以在相同反应混合物中合成具有针对特定多核苷酸定制序列的引物。在其他实施方案中,期望的多核苷酸可以通过通用引物结合位点延伸它们的3’端。
如下文更全面描述的,本发明的其他实施方案可以使用在固体支持物上的平行合成来实施,如含有空间上不同的合成区域的平面阵列,在该区域内可以合成不同的多核苷酸。如图4A-图4C中所示的,此类阵列可以被用于全长多核苷酸的合成和富集。图4A示出了示例性平面阵列(400)的子部分,其包括具有离散合成位点(404)的中心区域1(402)和包括与区域1(402)的合成位点不同的一个或多个合成位点(405)的外围区域2(406)。根据本发明,在其他平面阵列中,区域1(402)的离散合成位点(404)可以覆盖区域1(402)的而非所示的(或区域1(402)的全部)不同的部分,并且同样地,离散的合成位点(405)可以覆盖区域2(406)的而非所示的(整个区域2(406)的全部)不同的部分。所采用的配置是熟练从业人员的设计选择,其取决于所选择的平行合成方法,例如,该方法可以基于电化学、光化学或两者,用于合成反应的局部控制。在图4A-图4C的实施方案中,基本概念是形成两个区域(regions/zones),区域1是中心,且区域2围绕区域1。利用此类配置,在区域1中合成并从区域1释放的序列将扩散通过区域2,从而区域1的多核苷酸可以被设计并合成为包含与在区域2中设计和合成的多核苷酸互补的核苷酸片段。因此,在两个区域中合成多核苷酸后,在区域1的多核苷酸释放后,此类释放的区域1多核苷酸可以通过与区域2中的它们的互补序列杂交而被捕获。通过在阵列上平行进行此类操作,可以获得全长序列的大量富集的不同多核苷酸。
返回图4A,作为此类操作的实例,区域1多核苷酸被合成以产生产物(408),其包含全长序列和失效序列的组合。例如,在第一步中,可以合成300-mer序列,以产生含有20%全长序列和80%失效序列的产物(408)。在第二步中,在区域2(406)的反应位点(405)处合成与产物(408)序列的一部分互补的30-mer序列(412)。例如,30-mer产物(412)可能是90%的纯全长序列和10%的失效序列。在一些实施方案中,多核苷酸(408)的3’端是与30-mer产物(412)互补的部分。如图4C所示,在切割(414)区域1(402)的产物(408)(在允许杂交的条件下)后,产物的多核苷酸扩散穿过区域2(406),其中全长序列(416a、b、c)的一部分通过与区域2(406)中它们的互补序列杂交而被捕获。可选地,通过使用与区域1和区域2的分子连接的结合对的成员(如生物素和链霉亲和素)代替基于杂交的选择,可以实现类似的结果。例如,在此类可替代方案中,在区域1(402)的多核苷酸(408)的最终合成步骤中,可以掺入用生物素衍生化的dNTP,并且代替在区域2(406)中合成30-mer互补多核苷酸(412),可以将链霉亲和素的涂层应用于区域2(406)。在任一情况下,全长多核苷酸(416a-c)可以通过切割或去杂交(420)而被释放(418)。
如图5A-图5C中所示的,图4A-图4C的阵列可以被应用于从包含来自单个区域的全长多核苷酸的组分组装更大的多核苷酸(“组装的多核苷酸”)。包括(例如)区域A、区域B、区域C至区域K的一系列合成区域(501)可以被线性地布置在阵列上。在每个区域中,在中心合成位点(分别为502、504、506、……508)处合成具有序列A、序列B、序列C……序列K的多核苷酸组分,并在外围合成位点(分别为503、505、507、...509)处合成夹板寡核苷酸a’-B’、b’-C’、c’-D’…j’-K’。夹板寡核苷酸包含与相邻区域的全长多核苷酸末端互补的区域,从而(例如)在连接酶存在的情况下,区域A和B的多核苷酸与夹板寡核苷酸a’-B’杂交后,区域A和B的多核苷酸形成根据图5B中所示的设计(510)的中间组装的多核苷酸。如图5C中所示的,此类组装可以在中心合成位点处的多核苷酸富集全长序列之后以逐步方式进行(这可以在每个连接步骤之前同时或逐步进行)。此类逐步组装的步骤按如下进行:(i)在杂交条件和连接条件下,切割第一区域(例如区域A)的中心合成位点的全长多核苷酸,并且切割(512)第一区域的外围合成位点处的夹板寡核苷酸,使得全长序列和夹板寡核苷酸都可以扩散(514)到第二区域(例如区域B),并形成包含来自第一区域的全长序列、第二区域的全长序列(其仍然与其合成位点连接)和夹板寡核苷酸的三向复合物(516)形式,其(ii)允许将区域A的全长序列连接到区域B的全长序列的3’端,以形成序列A-B的组装中间体。可以通过施加电场E(530和531)以在与它们形成复合物的连接多核苷酸的方向上驱动带负电荷的多核苷酸和寡核苷酸,来偏移切割序列的扩散。在组装中间体在第二区域连接(和任选的扩增,例如通过模板步移或其他固相扩增方法)后,对下一个区域重复(524)上述步骤,直到完成组装的多核苷酸。
无模板酶促合成
通常,无模板(或等效地,“模板非依赖性”)酶促DNA合成方法包括重复的步骤循环(如图2所示的重复的步骤循环),其中在每个循环中预定的核苷酸与引发剂或生长链连接。在以下参考文献中描述了无模板酶促合成的一般要素:Ybert等人,国际专利公开WO/2015/159023;Ybert等人,国际专利公开WO/2017/216472;Hyman,美国专利5436143;Hiatt等人,美国专利5763594;Jensen等人,Biochemistry,57:1821-1832(2018);Mathews等人,Organic&Biomolecular Chemistry,DOI:0.1039/c6ob01371f(2016);Schmitz等人,Organic Lett.,1(11):1729-1731(1999)。
例如,提供了与固体支持物(102)连接的具有游离3’-羟基(103)的引发剂多核苷酸(100)。在将3’-O-经保护的dNTP有效酶促掺入到引发剂多核苷酸(100)(或延长的引发剂多核苷酸)的3’端上的条件(104)下,向引发剂多核苷酸(100)(或随后循环中的延长的引发剂多核苷酸)添加3’-O-经保护的dNTP以及无模板聚合酶(如TdT或其变体(例如Ybert等人,WO/2017/216472;Champion等人,WO2019/135007))。该反应产生延长的引发剂多核苷酸,其3’-羟基被保护(106)。如果延长的引发剂多核苷酸包含竞争序列,则3’-O-保护基可以被去除,或去保护,并且可以从原来的引发剂多核苷酸切割所期望的序列。可以采用多种单链切割技术中的任一种来进行此类切割,例如,通过在原始引发剂多核苷酸内的预定位置处插入可切割的核苷酸。示例性的可切割核苷酸可以是尿嘧啶核苷酸,其被尿嘧啶DNA糖基化酶切割。如果延长的引发剂多核苷酸不包含完整的序列,则3’-O-保护基被去除以暴露游离3’-羟基(103),并且延长的引发剂多核苷酸进行另一循环的核苷酸添加和去保护。
如本文所用的,关于特定基团(如核苷酸或核苷的3’-羟基)的术语“经保护的”和“封闭的”可互换使用,并且旨在意指与在化学或酶促过程中防止该基团发生化学变化的特定基团共价连接的部分。只要指定的基团是三磷酸核苷的3’-羟基,或其中掺入了3’-经保护的(或封闭的)-三磷酸核苷的延伸片段(或“延伸中间体”),则阻止的化学变化是通过酶促连接反应进一步或随后延伸延伸片段(或“延伸中间体”)。
如本文所用的,“引发剂”(或等效术语,诸如“引发片段”、“引发剂核酸”、“引发剂寡核苷酸”等)通常是指具有游离3’端的短寡核苷酸序列,其可以通过无模板聚合酶(如TdT)被进一步延长。在一实施方案中,引发片段是DNA引发片段。在可替代的实施方案中,引发片段是RNA引发片段。在一些实施方案中,引发片段具有3-100个核苷酸,特别是3-20个核苷酸。在一些实施方案中,引发片段是单链的。在可替代的实施方案中,引发片段是双链的。在一些实施方案中,引发剂可以包含具有TdT可以将3’-O-经保护的dNTP与其连接的游离羟基的非核酸化合物,例如Baiga,美国专利公开US2019/0078065和US2019/0078126。
在一些实施方案中,引发剂可以包含具有游离羟基的非核酸化合物,TdT可将所述非核酸化合物与3’-O-经保护的dNTP连接,例如Baiga,美国专利公开US2019/0078065和US2019/0078126。
合成完成后,具有所期望核苷酸序列的多核苷酸可以通过切割从引发剂和固体支持物上被释放。为此目的,可以使用多种可切割的连接或可切割的核苷酸。在一些实施方案中,切割所期望多核苷酸在切割链上留下天然游离5’-羟基;然而,在可替代实施方案中,切割步骤可以留下部分,例如5’-磷酸盐,其可以在后续步骤中去除,例如通过磷酸酶处理。切割步骤可以通过化学、热、酶促或通过光化学方法进行。在一些实施方案中,可切割的核苷酸可以是核苷酸类似物(如脱氧尿苷或8-氧代-脱氧鸟苷),它们被特定的糖基化酶(例如,分别为尿嘧啶脱氧糖基化酶及随后的核酸内切酶VIII和8-氧代鸟嘌呤DNA糖基化酶)识别。在一些实施方案中,可以通过提供具有脱氧肌苷作为倒数第二个3’核苷酸的引发剂来完成切割,所述引发剂可以在引发剂的3’端被核酸内切酶V切割,在释放的多核苷酸上留下5’-磷酸盐。用于切割单链多核苷酸的其他方法在以下参考文献中被公开,这些参考文献通过引用并入:美国专利第5,739,386、5,700,642和5,830,655号;以及美国专利公开第2003/0186226号和第2004/0106728号;以及Urdea和Horn,美国专利5367066。
在一些实施方案中,通过糖基化酶和/或核酸内切酶切割可能需要双链DNA底物。
回到图1A,在一些实施方案中,在每个合成步骤中,在3’-O-经保护的dNTP存在的情况下,使用无模板聚合酶(如TdT)将核苷酸的有序序列与引发剂核酸连接。在一些实施方案中,合成寡核苷酸的方法包括以下步骤:(a)提供具有游离3’-羟基的引发剂(100);(b)在延伸条件下(104),在3’-O-经保护的三磷酸核苷存在的情况下,使具有游离3’-羟基的引发剂或延伸中间体与无模板的聚合酶反应,以产生3’-O-经保护的延伸中间体(106);(c)对延伸中间体进行去保护,以产生具有游离3’-羟基的延伸中间体(108);以及(d)重复步骤(b)和(c)(110),直到合成多核苷酸。(有时,术语“延伸中间体”和“延伸片段”可互换使用)。在一些实施方案中,引发剂提供为例如通过其5’端与固体支持物连接的寡核苷酸。上述方法还可以包括在反应或延伸步骤之后以及去保护步骤之后的洗涤步骤。例如,反应步骤可以包括在预定的孵育期或反应时间后去除未掺入的三磷酸核苷的子步骤(例如通过洗涤)。此类预定的孵育期或反应时间可以是几秒钟(例如30sec)至几分钟(例如30min)。
当合成支持物上的多核苷酸序列包括反向互补子序列时,可以通过在反向互补区域之间形成氢键来产生二级分子内或分子间结构。在一些实施方案中,选择环外胺的碱基保护部分以使被保护氮的氢不能参与氢键结合,从而防止此类二级结构的形成。也就是说,可以采用碱基保护部分来防止氢键的形成,如在正常碱基配对中形成的氢键,例如在核苷A和T之间以及G和C之间形成的氢键。在合成结束时,碱基保护部分可以被去除并且多核苷酸产物可以从固体支持物上被切割下来,例如,通过将它从其引发剂上切割下来。
除了提供具有碱基保护基团的3’-O-封闭的dNTP单体外,延长反应可以使用热稳定的无模板聚合酶在更高的温度下进行。例如,可以采用具有高于40℃活性的热稳定的无模板聚合酶;或者,在一些实施方案中,可以采用具有40-85℃范围内的活性的热稳定的无模板聚合酶;或者,在一些实施方案中,可以采用具有40-65℃范围内的活性的热稳定的无模板聚合酶。
在一些实施例中,延长条件可以包括向延长反应混合物中添加抑制氢键结合或碱基堆积的溶剂。此类溶剂包括具有低介电常数的水混溶性溶剂(如二甲亚砜(DMSO)、甲醇等)。同样,在一些实施方案中,延长条件可以包括提供离液剂,其包括但不限于正丁醇、乙醇、氯化胍、高氯酸锂、乙酸锂、氯化镁、苯酚、2-丙醇、十二烷基硫酸钠、硫脲、尿素等。在一些实施方案中,延长条件包括存在二级结构抑制量的DMSO。在一些实施方案中,延长条件可以包括提供抑制二级结构形成的DNA结合蛋白,其中此类蛋白包括但不限于单链结合蛋白、解旋酶、DNA乙二醇酶(DNA glycolases)等。
没有碱基保护的3’-O-封闭的dNTP可从商业供应商购得,或使用发表的技术合成,例如,美国专利7057026;Guo等人,Proc.Natl.Acad.Sci.,105(27):9145-9150(2008);Benner,美国专利7544794和8212020;国际专利公开WO2004/005667、WO91/06678;Canard等人,Gene(本文中引用的);Metzker等人,Nucleic Acids Research,22:4259-4267(1994);Meng等人,J.Org.Chem.,14:3248-3252(3006);美国专利公开2005/037991。可按如下所述合成具有碱基保护的3’-O-封闭的dNTP。
当采用经碱基保护的dNTP时,图1A的上述方法还可以包括步骤(e):去除碱基保护部分,在酰基或脒保护基团的情况下,这可以(例如)包括用浓氨处理。
除了在反应或延伸步骤之后的洗涤步骤之外,上述方法还可以包括一个或多个加帽步骤。第一加帽步骤可以加帽,或使得部分合成的多核苷酸上的未反应的3’-OH基对进一步延伸呈惰性。此类加帽步骤通常在连接步骤之后实施,并且无论何时使用加帽化合物,都选择不与刚刚与生长链连接的单体的保护基团反应。在一些实施方案中,此类加帽步骤可以通过连接(例如,通过第二个酶促连接步骤)使部分合成的多核苷酸不能例如用TdT进一步连接的加帽化合物来实施。此类加帽化合物可以是三磷酸双脱氧核苷。在其他实施方案中,具有游离3’-羟基的非延伸链可以通过用3’-核酸外切酶活性(例如Exo I)处理它们来降解。例如,参见Hyman,美国专利5436143。同样,在一些实施方案中,可以对未能去封闭的链进行处理以去除该链或使其对进一步延伸呈惰性。可以在去保护步骤之后实施第二加帽步骤,以使受影响的链对任何后续连接或去保护任何3’-O保护或封闭基团都呈惰性。选择此类第二加帽步骤的加帽化合物,以使它们不与可能存在的游离3’-羟基反应。在一些实施方案中,此类第二加帽化合物可以是醛基和疏水基团的缀合物。后一组允许基于疏水性进行分离,例如Andrus,美国专利5047524。
在一些实施方案中,延伸或延长步骤的反应条件可以包括以下物质:2.0μM纯化的TdT;125-600μM的3’-O-封闭的dNTP(例如,3’-O-NH2-封闭的dNTP);约10至约500mM的卡可基酸钾缓冲液(6.5-7.5的pH),以及约0.01至约10mM的二价阳离子(例如,CoCl2或MnCl2),其中所述延长反应可以在50μL反应体积中,在RT至45℃范围内的温度下进行3分钟。在实施方案中,其中3’-O-封闭的dNTP是3’-O-NH2-封闭的dNTP,去封闭步骤的反应条件可以包括以下物质:700mM的NaNO2;1M的乙酸钠(用乙酸调节pH范围为4.8-6.5),其中所述去封闭反应可以在50μL体积中,在RT至45℃范围内的温度下进行30秒至几分钟。
取决于特定的应用,去封闭和/或切割的步骤可以包括多种化学或物理条件,例如光、热、pH、特定试剂(如能够切割特定化学键的酶)的存在。选择3’-O-封闭基团和相应的去封闭条件的指导可以在以下参考文献中找到,这些参考文献通过引用并入本文中:Benner,美国专利7544794和8212020;美国专利5808045;美国专利8808988;国际专利公开WO91/06678;以及下列参考文献。在一些实施方案中,切割剂(有时也被称为去封闭试剂或去封闭剂)是化学切割剂,诸如例如二硫苏糖醇(DTT)。在可替代实施方案中,切割剂可以是酶促切割剂,诸如例如磷酸酶,其可以切割3’-磷酸封闭基团。本领域技术人员将理解,去封闭剂的选择取决于所使用的3’-核苷酸封闭基团的类型、是否使用一个或多个封闭基团、引发剂是否与活细胞或生物体或固体支持物连接等,这使得需要进行温和的处理。例如,膦,如三(2-羧乙基)膦(TCEP)可以被用于切割3’O-叠氮甲基,钯络合物可以被用于切割3’O-烯丙基,或亚硝酸钠可以被用于切割3’O-氨基。在具体实施方案中,切割反应涉及TCEP、钯络合物或亚硝酸钠,例如参见美国专利8212020,其通过引用并入本文中。
如上所述,在一些实施方案中,期望采用两个或更多个封闭基团,这些封闭基团可以使用正交去封闭条件来去除。以下示例性的保护基对可以被用于平行合成实施方案中。应当理解,其他保护基团对或包含多于两个的基团可能可用于本发明的这些实施方案中。
3’-O-NH2 3’-O-叠氮甲基
3’-O-NH2 3’-O-烯丙基、3’-O-炔丙基
3’-O-NH2 3’-O-磷酸酯
3’-O-叠氮甲基 3’-O-烯丙基、3’-O-炔丙基
3’-O-叠氮甲基 3’-O-磷酸酯
3’-O-烯丙基、3’-O-炔丙基 3’-O-磷酸酯
在活细胞上合成寡核苷酸需要温和的去封闭或去保护的条件,即不破坏细胞膜、不使蛋白质变性、不干扰关键细胞功能等的条件。在一些实施方案中,去保护的条件在与细胞存活相容的生理条件范围内。在此类实施方案中,酶促去保护是可期望的,因为它可以在生理条件下进行。在一些实施方案中,特定的酶促可去除的封闭基团与特定的酶缔合以去除它们。例如,基于酯-或酰基-的封闭基团可以用酯酶(如乙酰酯酶)或类似酶去除,并且磷酸酯封闭基团可以用3’磷酸酶(如T4多核苷酸激酶)去除。例如,可以通过用100mM的Tris-HCl(pH 6.5)、10mM的MgCl2、5mM的2-巯基乙醇和一种Unit T4多核苷酸激酶的溶液处理来去除3’-O-磷酸酯。反应在37℃的温度下进行一分钟。
“3’-磷酸酯封闭的”或“3’-磷酸酯保护的”核苷酸是指其中3’-位置处的羟基通过存在的含磷酸酯部分封闭的核苷酸。根据本发明的3’-磷酸酯封闭的核苷酸的实例是核苷酸基(nucleotidyl)-3’-磷酸单酯/核苷酸基-2’,3’-环磷酸酯、核苷酸基-2’-磷酸单酯和核苷酸基-2’或3’-烷基磷酸二酯,以及核苷酸基-2’或3’-焦磷酸酯。也可以使用硫代磷酸酯或此类化合物的其他类似物,只要该取代不会阻止磷酸酶去磷酸化导致游离的3’-OH。
3’-O-酯保护的dNTP或3’-O-磷酸酯保护的dNTP的合成和酶促去保护的其他实例在以下参考文献中有详细描述:Canard等人,Proc.Natl.Acad.Sci.,92:10859-10863(1995);Canard等人,Gene,148:1-6(1994);Cameron等人,Biochemistry,16(23):5120-5126(1977);Rasolonjatovo等人,Nucleosides&Nucleotides,18(4&5):1021-1022(1999);Ferrero等人,Monatshefte fur Chemie,131:585-616(2000);Taunton-Rigby等人,J.Org.Chem.,38(5):977-985(1973);Uemura等人,Tetrahedron Lett.,30(29):3819-3820(1989);Becker等人,J.Biol.Chem.,242(5):936-950(1967);Tsien,国际专利公开WO1991/006678。
在一些实施方案中,经修饰的核苷酸包含经修饰的核苷酸或核苷分子,其包含嘌呤或嘧啶碱基和核糖或脱氧核糖糖部分,所述糖部分具有与其共价连接的可去除的3’-OH封闭基团,使得3’碳原子连接一组结构:
-O-Z
其中–Z是以下中的任一个:–C(R’)2-O-R”、-C(R’)2-N(R”)2、-C(R’)2-N(H)R”、-C(R’)2-S-R”和–C(R’)2-F,其中每个R”是可去除的保护基团或其一部分;每个R’独立地是氢原子、烷基、取代烷基、芳烷基、烯基、炔基、芳基、杂芳基、杂环基、酰基、氰基、烷氧基、芳氧基、杂芳氧基或氨基,或通过连接基团连接的可检测标记;条件是在一些实施方案中,此类取代基具有至多10个碳原子和/或至多5个氧或氮杂原子;或(R’)2表示式=C(R”’)2的基团,其中每个R”’可以相同或不同,并且选自氢和卤原子以及烷基,条件是在一些实施方案中,每个R’”的烷基具有1-3个碳原子;并且其中所述分子可以反应产生中间体,其中每个R”被交换为H,或者,其中Z是–(R’)2-F,F被交换为OH、SH或NH2,优选OH,该中间体在水性条件下解离得到具有游离3’-OH的分子;条件是其中Z是–C(R’)2-S-R”,两个R’基团都不是H。在某些实施方案中,经修饰的核苷酸或核苷的R’是烷基或取代的烷基,条件是此类烷基或取代的烷基具有1至10个碳原子和0至4个氧或氮杂原子。在某些实施方案中,经修饰的核苷酸或核苷的-Z具有式–C(R’)2-N3。在某些实施方案中,Z是叠氮甲基。
在一些实施方案中,Z是具有或不具有分子量为200或更小的杂原子的可切割有机部分。在其他实施方案中,Z是具有或不具有分子量为100或更小的杂原子的可切割有机部分。在其他实施方案中,Z是具有或不具有分子量为50或更小的杂原子的可切割有机部分。在一些实施方案中,Z是具有或不具有分子量为200或更小的杂原子的酶促可切割的有机部分。在其他实施方案中,Z是具有或不具有分子量为100或更小的杂原子的酶促可切割的有机部分。在其他实施方案中,Z是具有或不具有分子量为50或更小的杂原子的酶促可切割的有机部分。在其他实施方案中,Z是分子量为200或更小的酶促可切割的酯基。在其他实施方案中,Z是可被3’-磷酸酶去除的磷酸酯基团。在一些实施方案中,以下3’-磷酸酶中的一种或多种可以与制造商推荐的方案一起使用:T4多核苷酸激酶、小牛肠碱性磷酸酶、重组虾碱性磷酸酶(例如可从New England Biolabs,Beverly,MA获得)。
在其他实施方案中,3’-封闭的三磷酸核苷酸被3’-O-叠氮甲基、3’-O-NH2或3’-O-烯丙基封闭。在其他实施方案中,本发明的3’-O-封闭基团包括3’-O-甲基、3’-O-(2-硝基苄基)、3’-O-烯丙基、3’-O-胺、3’-O-叠氮甲基、3’-O-叔丁氧乙氧基、3’-O-(2-氰乙基)、3’-O-硝基和3’-O-炔丙基。在其他实施方案中,3’-封闭的三磷酸核苷酸被3’-O-叠氮甲基或3’-O-NH2封闭。此类3’封闭的三磷酸核苷的合成和使用在以下参考文献中公开:美国专利9410197;8808988;6664097;5744595;7544794;8034923;8212020;10472383;Guo等人,Proc.Natl.Acad.Sci.,105(27):9145-9150(2008);以及类似参考文献。
在一些实施方案中,3’-O-保护基团是电化学不稳定的基团。即,保护基团的去保护或可切割是通过改变导致可切割的保护基团附近的电化学条件来完成的。电化学条件的此类变化可以通过改变或施加物理量(如电压差或光)来引起以激活辅助物质,这反过来会导致保护基团位置处电化学条件的变化(如pH升高或降低)。在一些实施方案中,电化学不稳定基团包括例如pH敏感保护基团,其在pH变化至预定值时被切割。在其他实施方案中,电化学不稳定的基团包括保护基团,当还原或氧化条件改变时,例如通过增加或减少保护基团位置处的电压差,其直接被切割。
TdT变体
多种不同的无模板聚合酶可用于由本发明的系统和装置实施的合成方法中。无模板聚合酶包括但不限于polX家族聚合酶(包括DNA聚合酶β、λ和μ)、多聚(A)聚合酶(PAP)、多聚(U)聚合酶(PUP)、DNA聚合酶θ等,例如,以下参考文献中所述的:Ybert等人,国际专利公开WO2017/216472;Champion等人,美国专利10435676;Champion等人,国际专利公开WO2020/099451;Yang等人,J.Biol.Chem.,269(16):11859-11868(1994);Motea等人,Biochim.Biophys.Acta,1804(5):1151-1166(2010)。特别地,末端脱氧核苷酸转移酶(TdT)及其变体可用于无模板DNA合成,尤其是用于多核苷酸的喷墨辅助合成。
在一些实施方案中,酶促合成方法采用TdT变体,其显示出相对于3’-O-经修饰的三磷酸核苷增加的掺入活性。例如,此类TdT变体可以使用Champion等人,美国专利10435676中所描述的技术产生,该专利通过引用并入本文中。在一些实施方案中,采用与具有SEQ ID NO2-31中的任一项的氨基酸序列以及表1中所列出的一个或多个取代的TdT至少60%相同的氨基酸序列的TdT变体,其中所述TdT变体(i)能够在无模板的情况下合成核酸片段,和(ii)能够在核酸片段的游离3’-羟基上掺入3’-O-经修饰的核苷酸。在一些实施方案中,上述TdT变体包括表1中所列出的每个位置处的取代。在一些实施方案中,上述同一性百分比值与所示的SEQ ID NO具有至少80%的同一性;在一些实施方案中,上述同一性百分比值与所示的SEQ ID NO具有至少90%的同一性;在一些实施方案中,上述同一性百分比值与所示的SEQ ID NO具有至少95%的同一性;在一些实施方案中,上述同一性百分比值至少为97%的同一性;在一些实施方案中,上述百分比同一性值为至少98%的同一性;在一些实施方案中,上述同一性百分比值为至少99%的同一性。如本文所用的,用于比较参考序列与变体序列的同一性百分比值不包括明确指定的含有变体序列取代的氨基酸位置;也就是说,百分比同一性关系在参考蛋白的序列与在变体中包含取代的明确指定位置之外的变体蛋白的序列之间。因此,例如,如果参考序列和变体序列各自包含100个氨基酸并且变体序列在位置25和81具有突变,那么同源性百分比将是关于序列1-24、26-80和82-100。
关于(ii),此类3’-O-经修饰的核苷酸可以包含3’-O-NH2-三磷酸核苷、3’-O-叠氮甲基-三磷酸核苷、3’-O-烯丙基-三磷酸核苷、3’-O-(2-硝基苄基)-三磷酸核苷或3’-O-炔丙基-三磷酸核苷。
表1
Figure BDA0003558619410000201
Figure BDA0003558619410000211
在一些实施方案中,如表1中所示的,用于本发明方法的其他TdT变体包括甲硫氨酸、半胱氨酸或谷氨酸的一个或多个取代。
在一些实施方案中,如表1中所示的,用于本发明的方法的其他TdT变体包括甲硫氨酸、半胱氨酸或谷氨酸的一个或多个其他的取代。
在表2中列出了可用于本发明方法的其他特定TdT变体。表2的TdT变体DS1001至DS1018中的每一个包含与SEQ ID NO 2至少60%相同的氨基酸序列,并且包含在指定位置处的取代。在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO 2至少80%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO 2至少90%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO 2至少95%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQID NO 2至少97%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO 2至少98%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO 2至少99%相同的氨基酸,并且包含在指定位置处的取代。
表2:用于本发明方法的特定TdT变体
Figure BDA0003558619410000221
Figure BDA0003558619410000231
如上所述的本发明的TdT变体各自包含与指定的SEQ ID NO具有百分比序列同一性的氨基酸序列,受指定取代存在的影响。在一些实施方案中,以这种方式描述的本发明的TdT变体与指定的SEQ ID NO之间的序列差异的数量和类型可能是由于取代、缺失和/或插入,并且被取代、缺失和/或插入的氨基酸可以包含任何氨基酸。在一些实施方案中,此类缺失、取代和/或插入仅包含天然存在的氨基酸。在一些实施方案中,取代仅包含保守的或同义的氨基酸变化,如Grantham,Science,185:862-864(1974)中所述的。也就是说,氨基酸的取代只能发生在其同义氨基酸组的成员中。在一些实施方案中,可采用的同义氨基酸组列于表3A中。
表3A:同义氨基酸组I
Figure BDA0003558619410000232
在一些实施方案中,可采用的同义氨基酸组列于表3B中。
表3B:同义氨基酸组II
Figure BDA0003558619410000241
TdT变体的产生
本发明的变体可以通过突变已知的参考或野生型TdT编码多核苷酸,然后使用常规分子生物学技术表达它来产生。例如,编码具有所期望序列的多肽的所期望基因或DNA片段可以使用常规分子生物学技术从合成片段组装,例如使用Stemmer等人,Gene,164:49-53(1995);Kodumal等人,Proc.Natl.Acad.Sci.,101:15573-15578(2004)等描述的方案;或者此类基因或DNA片段可以使用常规方案从选定物种的细胞中直接克隆,例如由Boule等人,Mol.Biotechnology,10:199-208(1998),或Bentolila等人,EMBO J.,14:4221-4229(1995)等描述的。
可将编码所期望TdT变体的分离基因插入表达载体(如pET32(Novagen))中,以产生表达载体,然后可使用常规方案将其用于制备和表达变体TdT蛋白。具有正确序列的载体可以被转化到大肠杆菌生产菌株中。
使用常规技术将转化的菌株培养成沉淀,从中提取TdT蛋白。例如,将先前制备的细胞团在30-37℃的水浴中解冻。一旦完全解冻后,将细胞团重新悬浮在由50mM tris-HCL(Sigma)pH 7.5、150mM NaCl(Sigma)、0.5mM巯基乙醇(Sigma)、5%甘油(Sigma)、20mM咪唑(Sigma)和1片的100mL蛋白酶混合物抑制剂(Thermofisher)组成的裂解缓冲液中。进行仔细的再悬浮,以避免过早裂解和残留聚集体。将重悬的细胞通过几个循环的弗氏压碎器裂解,直到获得全色均一性。通常使用的压力是14,000psi。然后以10,000rpm的速度将裂解物离心1h-1h30。将离心液通过0.2μm过滤器以在柱纯化前去除任何碎屑。
可以在一步亲和程序中从离心液中纯化TdT蛋白。例如,Ni-NTA亲和柱(GEHealthcare)可被用于结合TdT聚合酶。最初,用15倍柱体积的50mM tris-HCL(Sigma)pH7.5、150mM NaCl(Sigma)和20mM咪唑(Sigma)洗涤和平衡柱。TdT聚合酶在平衡后与柱结合;然后,例如由50mM tris-HCL(Sigma)pH 7.5、500mM NaCl(Sigma)和20mM咪唑(Sigma)组成的洗涤缓冲液可以以15倍柱体积应用于柱。在此类洗涤之后,用50mM tris-HCL(Sigma)pH7.5、500mM NaCl(Sigma)和0.5M咪唑(Sigma)洗脱TdT聚合酶。收集与最高浓度的目标TdT聚合酶相对应的级分并在单个样品中合并。用透析缓冲液(20mM Tris-HCl,pH 6.8、200mM NaCl、50mM MgOAc、100mM[NH4]2SO4)对合并的级分进行透析。随后在浓缩过滤器(AmiconUltra-30,Merk Millipore)的帮助下浓缩透析液。将浓缩的酶以小等分试样分配,加入50%最终甘油,然后将这些等分试样在-20℃冷冻并长期储存。在SDSPAGE凝胶中分析5μL不同纯化酶级分。
在一些实施方案中,TdT变体可以可操作地连接至包括共价或非共价键的连接子部分;氨基酸标签(例如多聚氨基酸标签、多聚His标签、6His标签等);化合物(例如聚乙二醇);蛋白质-蛋白质结合对(例如,生物素-亲和素);亲和连接;捕获探针;或这些的任何组合。连接子部分可以与TdT变体分开或作为TdT变体的一部分。与本发明的TdT变体一起使用的示例性His标签是MASSHHHHHHSSGSENLYFQTGSSG-(SEQ ID NO:54))。标签-连接子部分不干扰TdT变体的核苷酸结合活性或催化活性。
上述过程或等效过程产生可与多种试剂混合的分离的TdT变体,所述试剂为诸如盐、pH缓冲剂、载体化合物等,它们对于活性和/或保存是必需的或有用的。
模板依赖性酶促合成
许多聚合酶和3’-可逆保护的dNTP可用于在DNA测序领域中开发的模板依赖性酶促合成,例如以下参考文献(通过引用并入本文中)公开了示例性聚合酶和3’-可逆保护的dNTP:Ju等人,美国专利6664079、7345159、7635578、7713698;Balasubramanian等人,美国专利7566537、7790869、8394586、9121062;Smith等人,美国专利8852910;Wu,Thesis,Columbia University,2008;Guo等人,Proc.Natl.Acad.Sci.,105(27):9145-9150(2008);Chen等人,美国专利9765309、10150954;Ost等人,美国专利8623628等。模板依赖性酶促合成的步骤与实施无模板酶促合成的那些步骤相似,当然,除了前者采用不同类型的聚合酶并需要模板的存在。即,在将引物退火至合成链(用作模板)后,通过重复以下循环来合成合成链的反向互补链:(i)在存在3’-O-经保护的三磷酸核苷的情况下,在延伸条件下使引物或具有游离3’-羟基的延伸中间体与模板依赖性聚合酶反应,以产生3’-O保护的延伸中间体;(ii)将延伸中间体去保护,以产生具有游离3’-羟基的延伸中间体;以及(iii)重复步骤(i)和(ii)直到合成反向互补序列。
碱基保护基团
可以采用多种保护基团(或等效地,“碱基保护部分”)来减少或消除在多核苷酸链延伸过程中二级结构的形成。通常,去除碱基保护基团的条件与去除3’-O-封闭基团的条件是正交的。具体地,当3’-O-封闭基团的去除或去封闭条件为酸性时,则可选择碱基保护基团为碱不稳定的。在此类情况下,由于使用了酸不稳定的5’-O-三苯甲基保护单体,在亚磷酰胺合成化学中开发出了许多碱不稳定的保护基团,例如Beaucage和Iyer,TetrahedronLetters,48(12):2223-2311(1992)。特别地,用于亚磷酰胺化学的酰基和脒保护基团适用于本发明的实施方案(例如,Beaucage和Iyer(上文引用的)的表2和表3的保护基团)。在一些实施方案中,碱基保护基团是脒,如在Beaucage和Iyer(上文引用的)的表2中所描述的。通常,碱基保护的3’-O-封闭的三磷酸核苷单体可以通过文献中所描述的方法的常规修改来合成,如以下实例中所描述的。
在一些实施方案中,碱基保护基团与三磷酸脱氧腺苷的6-氮、三磷酸脱氧鸟苷的2-氮和/或三磷酸脱氧胞苷的4-氮上。在一些实施方案中,碱基保护基团与所有指定的氮连接。在一些实施方案中,与三磷酸脱氧腺苷的6-氮连接的碱基保护基团选自:苯甲酰基、邻苯二甲酰基、苯氧基乙酰基和甲氧基乙酰基;与三磷酸脱氧鸟苷的2-氮连接的碱基保护基团选自:异丁酰基、异丁酰氧基乙烯、乙酰基、4-异丙基-苯氧基乙酰基、苯氧基乙酰基和甲氧基乙酰基;并且与三磷酸脱氧胞苷的4-氮连接的碱基保护基团选自:苯甲酰基、邻苯二甲酰基、乙酰基和异丁酰基。
在一些实施方案中,与三磷酸脱氧腺苷的6-氮连接的保护基团是苯甲酰基;与三磷酸脱氧鸟苷的2-氮连接的碱基保护基团是异丁酰基或二甲基甲脒;并且与三磷酸脱氧胞苷的4-氮连接的碱基保护基团是乙酰基。
在一些实施方案中,与三磷酸脱氧腺苷的6-氮连接的碱基保护基团是苯氧乙酰基;与三磷酸脱氧鸟苷的2-氮连接的碱基保护基团是4-异丙基-苯氧基乙酰基或二甲基甲脒;并且与三磷酸脱氧胞苷的4-氮连接的碱基保护基团是乙酰基。
在一些实施方案中,碱基保护部分被去除(即产物被去保护),并且在同一反应中产物被从固体支持物上切割。例如,引发剂可以包括核糖尿苷,其可以通过用1M的KOH或类似试剂(氨、氢氧化铵、NaOH等)处理而被切割以释放多核苷酸产物,所述试剂同时去除碱不稳定的碱基保护部分。
延长条件的其他修改
除了提供具有碱基保护基团的3’-O-封闭的dNTP单体外,延长反应可以使用热稳定的无模板聚合酶在更高的温度下进行。例如,可以采用具有高于40℃活性的热稳定的无模板聚合酶;或者,在一些实施方案中,可以采用具有40-85℃范围内的活性的热稳定的无模板聚合酶;或者,在一些实施方案中,可以采用具有40-65℃范围内的活性的热稳定的无模板聚合酶。
在一些实施例中,延长条件可以包括向延长反应混合物中添加抑制氢键结合或碱基堆积的溶剂。此类溶剂包括具有低介电常数的水混溶性溶剂(如二甲亚砜(DMSO)、甲醇等)。同样,在一些实施方案中,延长条件可以包括提供离液剂,其包括但不限于正丁醇、乙醇、氯化胍、高氯酸锂、乙酸锂、氯化镁、苯酚、2-丙醇、十二烷基硫酸钠、硫脲、尿素等。在一些实施方案中,延长条件包括存在二级结构抑制量的DMSO。在一些实施方案中,延长条件可以包括提供抑制二级结构形成的DNA结合蛋白,其中此类蛋白包括但不限于单链结合蛋白、解旋酶、DNA乙二醇酶等。
使用无模板聚合酶在固体支持物上进行平行多核苷酸合成
在一些实施方案中,通过提供具有离散的、非重叠的、可寻址位点的支持物来实施平行合成,在该位点合成单独的多核苷酸,并且提供了用于控制独立于其他位点的每个位点处的电化学条件的方式。在一些实施方案中,此类平行合成支持物是具有可寻址位点的规则图案的平面支持物,如位点的直线图案或位点的六边形图案。在一些实施方案中,平面支持物的每个位点与一个或多个电极相关联,其电学特性可以在独立于平面支持物的其他电极的可寻址区域中被控制。在一些实施方案中,此类平面支持物具有多个位点,其包括至少256个位点、至少512个位点、至少1024个位点、至少5000个位点、至少10,000个位点、至少25,000个位点,或至少100,000个位点,以及多达10,000,000个位点。在一些实施方案中,此类平面支持物具有大于1000,或10,000,或25,000,或50,000,或100,000,或500,000的多个位点,以及最多1,000,000个位点或最多10,000,000个位点。在一些实施方案中,此类平面支持物的位点以规则阵列布置并且每个位点与与平面支持物集成的至少一个电极相关联。在一些实施方案中,进行合成和/或测序的离散位点各自具有以下范围内的面积:.25μm2至1000μm2、或1μm2至1000μm2、或10μm2至1000μm2、或100μm2至1000μm2。在一些实施方案中,在每个位点合成的多核苷酸的量为至少10-6fmol、或至少10-3fmol、或至少1fmol、或至少1pmol,或者在每个位点合成的多核苷酸的量范围为:10-6fmol至1fmol、或10-3fmol至1fmol、或1fmol至1pmol、或10-6pmol至10pmol、或10-6pmol至1pmol。在一些实施方案中,在每个位点合成的多核苷酸的数量范围为1000个分子至106个分子,或1000个分子至109个分子,或1000个分子至1012个分子。上述阵列上的可寻址位点可以排列成包括区域的组(如上所述的,诸如区域1和区域2),以实施本发明的方法。
在一些实施方案中,在每个反应位点处酶促合成的多核苷酸具有50至500个核苷酸范围内的长度;在其他实施方案中,此类多核苷酸具有50至1000个核苷酸范围内的长度。
图1B示出了在可寻址的离散位点上平行合成多条多核苷酸的一实施方案的步骤,所述离散位点可用于特定光照明或用于电极激活。在一些实施方案中,阵列是可寻址电极阵列,其中可以控制各个电极以在阵列的任何给定工作电极和反电极之间产生预定电压差。提供阵列(120),使得每个位点(122)具有引发剂或具有经保护的3’-羟基的延长片段(表示为暗盘)。为了启动合成循环,使用去保护方法对选定位点(对应于下一个单体为A的多核苷酸的位点)的引发剂或延长片段的3’-羟基去保护(121)(表示为开放圆盘),该方法可以限于所选位点的位置。如下文更全面地描述的,在一些实施方案中,此类局部去保护可以通过局部光反应或通过使用位点特异性电极的电压差的局部变化来实现。向选择性去保护的位点添加包含3’-O-经保护的dATP(124)的试剂,并将无模板聚合酶(如TdT)递送到去保护的位点。如下文简要描述的,合成试剂可以以多种方式递送,如通过整个阵列上的简单整体流动、由喷墨装置递送到各个位点的液滴等。在连接反应进行到完成或达到适当程度的预定时间后,洗涤阵列,并且在选定位点的下一组多核苷酸(C是下一个单体的那些)使其3’-羟基去保护。向选择性去保护位点添加包含3’-O-经保护的dCTP(128)的试剂,并将无模板聚合酶(如TdT)递送至去保护位点。对dGTP(130)和dTTP(132)进行类似的步骤,直到循环完成。重复(134)循环直到完成多核苷酸。
光诱导的去保护
在一些实施方案中,平行合成可以采用利用光生酸的光诱导的去保护,以局部去保护,例如Gao等人,美国专利6426184、7491680和7838466。有利地,寡核苷酸在流动池中合成,与当今用于通过合成测序(SBS)的那些流动池非常相似。SBS使用经过修饰的dNTP,其包含阻止进一步聚合的终止子。因此,聚合酶只能将单个碱基添加到每个正在生长的DNA或RNA拷贝链中。测序反应同时在固体表面上散布开的大量不同模板分子上进行。在将四种dNTP添加到模板后,终止子被去除。这种化学物质被称为“可逆终止剂”。最后,启动另外四个dNTP添加循环。由于单个碱基以统一的方式添加到所有模板中,因此测序过程会产生一组统一长度的DNA/RNA序列读取。有利地,通过将DNA/RNA样品片段化成每个大约200个碱基长的片段,将DNA/RNA样品制备成“测序文库”。将定制衔接子添加到每一端,并且文库流过固体表面(“流动池”),并且模板片段与该表面结合。在此之后,固相“桥式扩增”PCR过程(簇生成)在流动池表面上的紧密物理簇中创建每种模板的大约一百万个拷贝。
电化学去保护
可替代地或除了局部光化学产生pH变化之外,电极处的受控电势变化可被用于直接或间接切割电化学不稳定基团。例如,可以通过采用电活性化合物,使用电压变化间接切割pH敏感保护基团,该电活性化合物的氧化还原状态可以通过控制局部电压差来改变,从而释放影响局部pH的电子,例如Southern,美国专利5667667;Egeland和Southern,美国专利公开US2004/0238369;Egeland等人,Nucleic Acids Research,33(14):e125(2005);Maurer等人,美国专利9267213;Fomina等人,LabChip,16:2236-2244(2016)。
如图7A中所示的,在一些实施方案中,电极阵列上的每个位点可以被配置为如Levine等人(上文引用的)所述的稳压器和/或恒流器电化学电池(7001)或Metrohm应用注释EC08。在恒电势模式下,如图7A中所示的稳压器/恒流器(PGSTAT)电路(7000)将准确控制反电极(CE)(7002)对工作电极(WE)(7004)的电势,从而使工作电极(WE)(7004)和参比电极(RE)(7006)之间的电势差限定良好,并且对应于用户指定的值。在恒电流模式下,WE(7004)和CE(7002)之间的电流受到控制。RE(7006)和WE(7004)之间的电势差以及CE(7002)和WE(7004)之间流动的电流被连续监测。通过使用PGSTAT,用户指定的值(即施加的电势或电流)在测量期间的任何时候都可以通过使用负反馈机制进行精确控制。
从图中可以看出,CE(7002)连接到被称为控制放大器(CA)(7008)的电子块的输出。控制放大器迫使电流流过电池。分别针对低电流和高电流,使用电流跟随器(低CF)(7010)或分流器(高CR)(7012)测量电流值。始终利用差异放大器(Diffamp)(7016)测量RE(7006)与S(7014)之间的电势差。根据仪器使用的模式(稳压的或横流的),相应地设置PSTAT/GSTAT开关(7018)。然后将信号馈入求和点(+)(7020),该求和点与数模转换器(E)(7022)设置的波形一起用作控制放大器的输入。
反电极(也被称为辅助电极)是用于闭合电化学电池中的电流电路的电极。它通常由惰性材料(例如Pt、Au、石墨、玻璃碳)制成,并且其通常不参与电化学反应。因为电流在WE(7004)与CE(7002)之间流动,所以CE的总表面积(电子的源/汇)通常大于WE的面积,因此它不会成为电化学过程的动力学中的限制因素。
参比电极是具有稳定且众所周知的电极电势的电极,并且它被用作电化学电池中用于电势控制和测量的参考点。参比电极电势的高稳定性通常是通过采用具有恒定(缓冲或饱和)浓度的每个氧化还原反应参与者的氧化还原系统来实现的。此外,流过参比电极的电流保持接近零(理想情况下为零),这是通过使用CE关闭池中的电流电路以及静电计上非常高的输入阻抗(>100GOhm)来实现的。
工作电极是电化学系统中发生目标反应的电极。常见的工作电极可以由惰性材料制成,如Au、Ag、Pt、玻璃碳(GC)和Hg滴和薄膜电极等。工作电极(7004)可以包括用于连接分子的涂层,如用于无模板酶促多核苷酸合成的引发剂。
两个电极设置。在双电极电池设置中,CE(7002)和RE(7006)在其中一个电极上短接,而WE(7004)和S(7014)在相反电极上短接。测量整个电池的电势。这包括来自CE/电解质界面和电解质本身的贡献。因此,只要精确控制跨WE(7004)电化学界面的界面电势并不重要,并且整个电池的行为正在研究中,就可以使用双电极配置。
三电极设置。三电极池设置是电化学中最常见的电化学电池设置。在这种情况下,电流在CE(7002)与WE(7004)之间流动。控制WE(7004)与CE(7002)之间的电势差,并测量RE(7006)(最好保持在紧靠WE(7004)附近)与S(7014)之间的电势差。由于WE(7004)与S(7014)相连,并且WE(7004)保持在伪地(固定、稳定的电势),通过控制CE(7002)的极化,RE(7006)与WE(7004)之间的电势差会一直受到控制。通常不会测量WE(7004)与CE(7002)之间的电势。这是由控制放大器(7008)施加的电压,并且其受仪器的顺从电压限制。它被调整,以使得WE(7004)与RE(7006)之间的电势差将等于由用户指定的电势差。这种配置允许相对于RE(7006)控制WE(7004)处电化学界面间的电势。
已经构建了包含在电路支持基板(尤其是CMOS)中形成的多个可单独寻址电极的大型电极阵列,以用于基于亚磷酰胺的合成和传感器应用,例如,Montgomery,美国专利6093302、6444111和6280595;Gindilis,美国专利9339782;Maurer等人,美国专利9267213;Maurer等人,PLosOne,2006年12月,第1卷,e34;Fomina等人,LabChip,16:2236-2244(2016);Kavusi等人,美国专利9075041;Johnson等人,美国专利9874538和9910008;Gordon等人,美国专利6251595;Levine等人等。IEEE J.Solid State Circuits,43:1859-1871(2008)等。这些参考文献为本发明的特定实施方案的设计提供了关于诸如阵列位置处的电极数量、尺寸、组成和配置等特征;用于电压和电流控制和测量的CMOS电路;阵列制造和操作;在阵列位点连接或固定化学组分(诸如例如引发剂)的方法等的指导。
特别感兴趣的是Morimoto等人,Anal.Chem.80:905-914(2008);Levine等人(上文引用的);和Fomina等人(上文引用的)及它们的CMOS技术实施中所述的,特别是如Levine等人和Fomina等人所述的电极配置。在本发明的一些实施方案中,提供的电极阵列包括在CMOS基板中的多个可单独寻址的工作电极,其在操作上与参比电极以及反电极相关联,后者可以在板上或与CMOS电极阵列分离。CMOS电路被配置为使得工作电极与反电极之间的电压可以被调整,以建立和维持选定工作电极与参比电极之间的所期望电压差。可以在选定的工作电极处改变所期望的电压差以切割电化学不稳定的保护基团。
酶促合成和电化学去保护的组合。
在一方面,本发明还提供了解决方案,其用于将通过降低pH来诱导特别控制的去保护的不同方式与酶促DNA合成技术相结合。酶促合成与水性介质完全兼容。大多数化学、电化学或光化学,通过物理驱动实现pH值变化,仅在水性介质中起作用。本发明通过开发用于pH变化的适当化学物质以及用于酶促合成的适当缓冲剂、试剂和保护基团,来提供使这两个方面兼容的技术解决方案。因此,在一个实施方案中,可控化学与DNA合成以及与流动池芯片表面化学兼容。
电化学或诱导的去保护,即在与反应位点相邻的电极处使用电压变化,已被用于在基于亚磷酰胺的合成中去除DMT保护基团,例如Egeland等人,Nucleic Acids Research,33(14):e125(2005);Montgomery(上文引用的)。本发明部分是发现和认识到平行的无模板酶促多核苷酸合成可以使用对酶促合成特异性的保护基的电化学去保护来完成。具体地,3’-O-叠氮甲基保护基团可以通过直接还原来切割,并且3’-O-氨基保护基团可以通过电活性中间化合物的方式,通过调节局部pH值而被间接切割。例如,在后者的情况下,在一些实施方案中,典型的去保护溶液是用HCl滴定至pH 5.0-5.5的700mM亚硝酸钠(NaNO2)和1M乙酸钠。可以通过将局部pH从pH 7降低到pH 5来实现阵列反应位点处的3’-O-NH2基团的局部去保护。
用于实施本发明方法的设备。在图7B中以图解法示出了用于实施本发明方法的设备的组件。流动池和电极阵列(700)包括反应位点阵列,每个反应位点可以包括微孔、涂层以增强引发剂或其他组分的连接,并且每个反应位点在操作上与一个或多个电极相关联。在一些实施方案中,电极阵列与CMOS控制和测量电路集成为单个芯片。流动池可以有多种设计来控制电极阵列上试剂的路径和流速。在一些实施方案中,流动池是微流体装置。也就是说,它可以用微机械加工技术或精密模制制造,以包括其它的流体通道、腔室等。在一方面,流动池包括入口(702)、出口(703)和用于限定电极阵列(707)上的试剂流动路径的流动室(705)。在离开流动池和传感器阵列(700)之后,将试剂丢弃到废物容器(706)中。根据该实施方案,该设备的功能是以预定的顺序、预定的持续时间、预定的流速将不同的试剂递送到流动池和电极阵列(700),并且任选地以测量电极位点处的物理和/或化学参数,其提供有关其中发生的反应状态的信息。为此,流体控制器(718)通过常规仪器控制软件(例如LabView(National Instruments,Austin,Tex.)),通过线路(720和722)控制多种试剂(714)(例如,在适当的缓冲液和去保护溶液中的3’-O-经保护的dNTP和/或无模板聚合酶)和阀门(例如,712和716)的操作的驱动力。
可以通过泵、气压或其他常规方法驱动试剂通过流体路径、阀和流动池。在一些实施方案中,单个参比电极(708)可以被放置在流动池和传感器阵列(700)的上游。在其他实施方案中,参比电极可以被放置在流动室内。在一些实施方案中,单一流体或试剂在整个多步反应中与参比电极(708)接触。这可以通过图7B中所示的配置来实现,其中试剂(714)通过通道(709)被引导至流动池(705)。当那些试剂流动时,阀(712)关闭,从而防止任何洗涤溶液流入通道(709)中。尽管洗涤溶液的流动停止,但在参比电极、通道(709)与电极阵列(707)之间仍然存在不间断的流体和电连通。当流过通道(709)时,最多试剂(714)扩散到通道(711)中,但是参比电极(708)与通道(709)和(711)之间的连接之间的距离被选择为使得很少量或没有量的在公用通道(709)中流动的试剂到达参比电极(708)。尽管图7B和其他图将电极(例如参比电极708)示出为与流体通道(例如,711)同心的圆柱体,但是参比电极如(708)可以具有多种不同的形状。例如,它可以是插入(711)内腔中的导线。在一方面,参比电极(708)构成通道(712)的一部分,其由诸如不锈钢、金等的导电材料制成。在一些实施方案中,材料对于与其接触的试剂是惰性的。在一实施方案中,参比电极(708)是由形成通道(712)的一部分的导电材料制成的管。
参比电压的电势取决于电极与电极接触的溶液之间的界面。例如,不同三磷酸核苷的溶液可能会导致参比电压发生变化,从而导致工作电极处发生非期望的变化。如图7B中所示的,对于使用频繁洗涤步骤的多步反应,可选择洗涤溶液(710)作为与参比电极(708)连续接触的试剂。
该实施方案的其他组件包括阵列控制器(724),其用于提供偏置电压(如以控制工作电极和反电极(721)之间的电势,其可以与阵列(707)集成或不集成)以及至电极阵列(如果这些组件没有集成到电极阵列中)的定时和控制信号,以及用于收集和/或处理输出信号。来自流动池和电极阵列(700)的信息以及仪器设置和控制可以通过用户界面(728)显示和进入。对于一些实施方案,例如核酸合成和/或测序,流动池和传感器阵列(700)的温度受到控制,使得反应发生并且在已知的并且优选地预定的温度下进行测量。此类温度可以通过传统的温度控制装置来控制,如Peltier装置等。在一方面,通过控制流过流动池的试剂的温度来方便地控制温度。设备的流动池和流体回路可以通过多种方法和材料制造。选择材料时要考虑的因素包括所需要的化学惰性程度、操作条件(例如温度等)、待递送的试剂量、是否需要参比电压、可制造性等。对于小规模流体递送,微流体制造技术非常适合制造本发明的流体回路,并且本领域普通技术人员容易获得对此类技术的指导,例如Malloy,注塑成型塑料零件设计:简介(Plastic Part Design for Injection Molding:AnIntroduction)(Hanser Gardner Publications,1994);Herold等人,编辑,芯片实验室技术(第1卷):制造和微流体(Lab-on-a-Chip Technology(Vol.1):Fabrication andMicrofluidics)(Caister Academic Press,2009)等。对于中等规模和更大规模的流体递送,可以使用常规机械加工技术来制造可以组装到本发明的流动池或流体回路中的部件。在一方面,诸如聚碳酸酯、聚甲基甲基丙烯酸酯等的塑料可以被用于制造本发明的流动池和流体回路。
图7C以图表法示出了用于实施本发明方法的替代设备,其中使用喷墨液滴发生器将一些试剂递送至反应位点。上述的许多设计特征都适用于本实施方案。如上所述,流动池和电极阵列(750)包括反应位点阵列,每个反应位点可以包括微孔、涂层以增强引发剂或其他组分的连接,并且每个反应位点在操作上与一个或多个电极相关联。如上所述,在一些实施方案中,电极阵列可以与CMOS控制和测量电路集成为单个芯片。流动池可以有多种设计来控制电极阵列上试剂的路径和流速;然而,与图7B的设备不同,此处电极阵列的反应位点必须是可接近的,以便通过打印头(780)递送含有试剂的液滴。在一方面,流动池包括入口(752)、出口(753)和流动室(755),用于限定电极阵列(757)上的试剂(不通过打印头(780)递送)的流动路径。在离开流动池和传感器阵列(750)之后,将试剂丢弃到废物容器(756)中。根据该实施方案,设备的功能是经由入口(752)或打印头(780)以预定的顺序、以预定的持续时间、以预定的流速将不同的试剂递送到流动池和电极阵列(750),并且任选地以测量电极或反应位点处的物理和/或化学参数,这些参数提供关于其中发生的反应状态的信息。为此,流体控制器(758)通过线路(771a、7711b和771c)控制阀(760a和760b)和打印头(780)。阀(760a)和(760b)控制洗涤溶液(761)和去保护溶液(762)(如果需要)到流动池(757)的递送。用于设计和控制喷墨递送系统的指南为本领域技术人员所熟知,并且可以在美国专利公开US2003/0170698和美国专利6306599;6323043;7276336;7534561及类似参考文献中找到。
在一些实施方案中,单个参比电极(708)可以被放置在流动池和传感器阵列(700)的上游。在其他实施方案中,参比电极可以被放置在流动室内。在一些实施方案中,可以采用单个反电极(763),或者在其他实施方案中,可以采用多于一个反电极,并且如上所述,此类反电极可以集成或不集成在相同的电子基板上作为阵列(757)的工作电极。
如虚线(771、772和773)所示的,设备通过用户界面(792)控制,其继而通过流体/喷墨控制器(765)和阵列控制器(790)致动和监测合成步骤。具体地,物理参数(如温度)以及用于电极选择、电压控制、传感器读出等的电路,通过阵列控制器(790)处理;试剂(796)、液滴速率、头部移动等的选择由流体/喷墨控制器(765)控制。在一些实施方案中,在3’-O-经保护的dNTP单体和/或无模板聚合酶的液滴递送期间,由于流动池(755)可能被排空以防止接收不同单体的相邻反应位点之间的交叉污染,反应位点与参比电极(781)之间的电解质连接被破坏。在一些实施方案中,可以通过提供被疏水区域包围的反应位点来避免此类交叉污染,使得当诸如洗涤溶液或去保护溶液的电解质从流动室退去时,每个位点都被分离的液滴包围,例如,如Brennan,美国专利5474796、6921636等中所述的。具体地,当流动室充满去保护溶液时,连续电解质路径恢复到参比电极(781)和可以在阵列(757)上或阵列外的反电极。
在一些实施方式中,选择工作电极与参比电极之间的电压差的值以避免不希望的氧化还原反应(如水的电解),从而不会在装置的流体中形成气泡。在一些实施方案中,在本发明中引起电化学反应的预定电压差为约1.5伏或更低。
在一些实施方案中,本发明的方法,如由图7B和图7C的设备所实施的,可以包括以下步骤:(a)提供反应位点的空间可寻址阵列,其中每个反应位点在操作上与至少一个工作电极相关联并且在其上布置有通过它们的5’端连接且具有3’-O-电化学不稳定的保护基团的引发剂;(b)对每种核苷酸进行包括以下步骤的循环:(i)通过在预定地址处的每个电极与参比电极之间产生电压差以使电化学不稳定的保护基团被切割,从而在预定地址的电极处的引发剂或延长片段上产生游离3’-羟基,来在预定地址处的电极处对引发剂或延长片段去保护,和(ii)在延长条件下使预定地址处的电极与3’-O-电化学不稳定的保护的三磷酸核苷以及模板非依赖性DNA聚合酶接触,以通过掺入3’-电化学不稳定的保护的三磷酸核苷来延长预定地址处的引发剂或延长片段,以形成3’-O-电化学不稳定的保护的延长片段;以及(c)重复步骤(b),直到预定序列的多核苷酸的阵列完成。反应位点通常是底物上的离散区域,其中合成了具有预定序列的单一种类的多核苷酸。反应位点在空间上是可寻址的,因为它们在基板或表面上具有明确的位置,其通常形成规则的图案,如直线图案、六边形图案等。每个反应位点在操作上与至少一个工作电极相关联,因为反应位点处的电势或电压可以由其相关联的一个或多个工作电极控制或确定。通常,反应位点和工作电极在空间上对齐。也就是说,如果电极是嵌入基板表面上的圆盘或其他平面结构,则反应位点占据的面积对应于电极表面的面积。这有利于确保在反应位点处发生的反应中的均匀电效应。在一些实施方案中,反应位点可以包括工作电极表面上的基板或膜,例如,此类基板或膜可以被用于促进组分(如引发剂)的连接和/或保留。此类基板和电极可以被集成在半导体装置(如CMOS装置)中。关于步骤(b),对每种核苷酸进行所示的步骤循环并不旨在限于四种核苷酸A、C、G和T。在一些实施方案中,每种核苷酸意指A、C、G和T的子集。在其他实施方案中,每种核苷酸意指可以包括非天然核苷酸或可用于编码多核苷酸中的信息的其他核苷酸类似物的扩展集。在本发明的方法中可以采用多种模板非依赖性DNA聚合酶;具体地,采用末端脱氧核苷酸转移酶的变体,例如,如Ybert等人,国际专利公开WO/2019/030149等中所述。步骤(b)的循环可以包括进一步的步骤,如洗涤步骤。延长条件包括缓冲液、盐、温度、辅因子等,它们对于所采用的无模板聚合酶的掺入活性是必需的或有用的。
在一些实施方案中,电化学不稳定的保护基团可以是pH敏感的,并且pH可以通过工作电极与参比电极之间的电压差来调节,该电压激活电活性剂继而改变pH,例如Southern,美国专利5667667;Mauer等人,美国专利9267213等,其在此通过引用并入本文中。示例性的电活性剂包括对苯二酚、苯醌、醌及其衍生物。
在一些实施方案中,电化学不稳定的保护基团本身可以是氧化还原敏感的,使得工作电极与参比电极之间的电压差将电化学不稳定的保护基团转换为还原态,从而切割所述电化学不稳定的保护基团。具体地,在一些实施方案中,氧化还原敏感的3’-O-保护基团是叠氮甲基。
用于实施本发明方法的试剂盒
本发明包括用于实施本发明方法的多种试剂盒。在一方面,本发明的试剂盒在适合进行本文所述的无模板酶促多核苷酸合成的制剂中包含TdT变体。此类试剂盒还可以包括合成缓冲液,其为优化无模板添加或将3’-O-经保护的dNTP掺入生长链提供反应条件。在一些实施方案中,本发明的试剂盒还包括3’-O-可逆保护的dNTP。在此类实施方案中,3’-O-可逆保护的dNTP可以包含3’-O-氨基-dNTP或3’-O-叠氮甲基-dNTP。在其他实施方案中,试剂盒可以单独或与上述项目一起包括以下项目中的一项或多项:(i)用于进行如本文所述的去保护步骤的去保护试剂,(ii)具有连接其上的引发剂的固体支持物,(iii)用于从固体支持物上释放完整多核苷酸的切割试剂,(iv)用于在酶促添加或连接步骤结束时去除未反应的3’-O-经保护的dNTP的洗涤试剂或缓冲液,(v)合成后处理试剂,如纯化柱、脱盐试剂、洗脱试剂等,(vi)用于退火至在全长多核苷酸产物的3’端上合成的通用引物结合位点的引物,(vii)用于延伸退火至多核苷酸产物的引物结合位点的引物的模板依赖性聚合酶,(viii)消化从多核苷酸产物和/或失效序列解链的片段的一种或多种单链核酸酶。
关于上述项目(ii)和(iii),某些引发剂和切割试剂一起使用。例如,包含肌苷可切割核苷酸的引发剂可以与核酸内切酶V切割试剂一起提供;包含硝基苄基光可切割连接子的引发剂可以与用于切割光可切割连接子的合适光源一起提供;包含尿嘧啶的引发剂可以与尿嘧啶DNA糖基化酶切割试剂一起提供等。
定义
除非本文另有明确定义,否则本文中所使用的核酸化学、生物化学、遗传学和分子生物学的术语和符号遵循该领域的标准论文和文本的那些,例如Kornberg和Baker,DNAReplication,第2版(W.H.Freeman,纽约,1992);Lehninger,Biochemistry,第2版(WorthPublishers,纽约,1975);Strachan和Read,Human Molecular Genetics,第2版(Wiley-Liss,纽约,1999)。
关于两个或更多个不同TdT中的氨基酸位置的“功能等效”意指(i)各个位置处的氨基酸在TdT的活性中发挥相同的功能作用,和(ii)氨基酸出现在各个TdT的氨基酸序列中的同源氨基酸位置处。基于序列比对和/或分子建模,可能识别两个或更多个不同TdT的氨基酸序列中位置等效或同源的氨基酸残基。在一些实施方案中,功能等效的氨基酸位置属于在进化相关物种(例如属、科等)的TdT的氨基酸序列中保守的低效基序。此类保守的低效基序的实例描述于Motea等人,Biochim.Biophys.Acta.1804(5):1151-1166(2010);Delarue等人,EMBO J.,21:427-439(2002)和类似参考文献中。
“试剂盒”是指任何递送系统(如包装),其用于递送材料或试剂以进行由本发明的系统或设备实施的方法。在一些实施方案中,消耗材料或试剂在本文被称为“试剂盒”的包装中递送给本发明的系统或设备的用户。在本发明的系统和设备的上下文中,此类递送系统通常包括允许储存、运输或递送材料的包装方法和材料,如可能具有容易损坏或污染的组件(如合成支持物)的合成板。例如,试剂盒可以包括包含合成板和/或支撑材料的一个或多个外壳(例如,盒子)。此类内容物可以一起或单独地递送给预期的接收者。例如,第一容器可以包含合成板,其中每个孔中的合成支持物都真空包裹在保护性塑料材料中,而第二或更多容器包含3’-O-可逆封闭的dNTP以及无模板聚合酶和缓冲液。
可互换使用的“突变体”或“变体”是指来源于本文所述的天然或参考TdT多肽的多肽,并且包含在一个或多个位置处的修饰或改变,即取代、插入和/或缺失。变体可以通过本领域熟知的各种技术获得。特别地,用于改变编码野生型蛋白质的DNA序列的技术的实例包括但不限于定点诱变、随机诱变、序列改组和合成寡核苷酸构建。诱变活性在于删除、插入或取代蛋白质序列中的一个或几个氨基酸,或者在本发明的聚合酶的情况下删除、插入或取代一个或几个氨基酸。以下术语被用于指定取代:L238A表示参考或野生型序列的第238位氨基酸残基(亮氨酸,L)改变为丙氨酸(A)。A132V/I/M表示亲本序列第132位的氨基酸残基(丙氨酸,A)被下列氨基酸之一取代:缬氨酸(V)、异亮氨酸(I)或甲硫氨酸(M)。取代可以是保守性或非保守性取代。保守性取代的实例属于以下组;碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺和苏氨酸)、疏水性氨基酸(甲硫氨酸、亮氨酸、异亮氨酸、半胱氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸和丝氨酸)。
“多核苷酸”或“寡核苷酸”可互换使用,并且每个意指核苷酸单体或其类似物的线性聚合物。组成多核苷酸和寡核苷酸的单体能够通过单体与单体相互作用的规则模式的方式与天然多核苷酸特异性结合,如Watson-Crick类型的碱基配对、碱基堆叠、Hoogsteen或反向Hoogsteen类型的碱基配对等。此类单体及其核苷间连接可以是天然存在的或可以是其类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可以包括PNA、硫代磷酸酯核苷间连接、含有允许连接标记(如荧光团)或半抗原的连接基团的碱基等。每当寡核苷酸或多核苷酸的使用需要酶促加工(诸如通过聚合酶延伸、通过连接酶连接等时),普通技术人员将理解在那些情况下寡核苷酸或多核苷酸将不包含核苷间连接的某些类似物、糖部分或任何或某些位置处的碱基。多核苷酸的大小范围通常从几个单体单元开始(例如5-40个,此时它们通常被称为“寡核苷酸”)至几千个单体单元。每当多核苷酸或寡核苷酸通过字母序列(大写或小写,如“ATGCCTG”)表示时,应理解核苷酸从左到右按5’→3’顺序排列,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,并且“T”表示胸苷,“I”表示脱氧肌苷,“U”表示尿苷,除非另有指示或从上下文中显而易见。除非另有说明,否则术语和原子编号约定将遵循Strachan和Read,Human Molecular Genetics 2(Wiley-Liss,纽约,1999)中所公开的那些。通常多核苷酸包含通过磷酸二酯键连接的四种天然核苷(例如对于DNA的脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷,或对于RNA的它们的核糖对应物);然而,它们也可以包含非天然核苷酸类似物,例如包括经修饰的碱基、糖或核苷间连接。本领域技术人员清楚,酶对活性具有特定的寡核苷酸或多核苷酸底物要求,例如单链DNA、RNA/DNA双链体等,则为寡核苷酸或多核苷酸底物选择合适的组成完全在普通技术人员的知识范围内,尤其是在论文(如Sambrook等人,Molecular Cloning,第2版(冷泉港实验室,纽约,1989))和类似参考资料的指导下。同样,寡核苷酸和多核苷酸可以指单链形式或双链形式(即寡核苷酸或多核苷酸及其相应互补物的双链体)。普通技术人员从术语使用的上下文中将清楚,旨在哪种形式或哪两种形式。
“引物”意指寡核苷酸,无论是天然的还是合成的,其在与多核苷酸模板形成双链体后,能够充当核酸合成的起始点并从其3'端沿模板延伸,使得形成延伸的双链体。引物的延伸通常利用核酸聚合酶(如DNA或RNA聚合酶)进行。延伸过程中添加的核苷酸序列由模板多核苷酸的序列决定。通常引物由DNA聚合酶延伸。引物的长度通常在14至40个核苷酸的范围内,或在18至36个核苷酸的范围内。引物被用于多种核酸扩增反应,例如,使用单一引物的线性扩增反应,或采用两种或更多种引物的聚合酶链式反应。选择用于特定应用的引物长度和序列的指导对于本领域普通技术人员来说是众所周知的,如通过引用并入本文中的以下参考文献所证明的那样:Dieffenbach,编辑,PCR引物:实验室手册(PCR Primer:ALaboratory Manual),第2版(冷泉港出版社,纽约,2003)。
“序列同一性”是指两条序列(如两条多肽序列或两条多核苷酸序列)之间的匹配(例如,相同的氨基酸残基)的数量(或分数,通常表示为百分比)。序列同一性是通过在比对时比较序列来确定的,以使重叠和同一性最大化,同时使序列间隙最小化。具体地,序列同一性可以使用许多数学全局或局部比对算法中的任一种来确定,这取决于两条序列的长度。相似长度的序列优选使用全局比对算法(例如,Needleman和Wunsch算法;Needleman和Wunsch,J.Mol.Biol.,48:443-453(1970))比对,其在整个长度上最佳地比对序列,而具有显著不同长度的序列优选使用局部比对算法(例如,Smith和Waterman算法(Smith和Waterman,J.Mol.Biol.,147:195-197(1981))或Altschul算法(Altschul等人,AcidsResearch,25(17):3389-3402(1997);Altschul等人,FEBS J.,272:5101-5109(2005))比对。用于确定氨基酸序列同一性百分比目的的比对可以通过本领域技术范围内的多种方式实现,例如,使用互联网网站上可用的公共可用计算机软件,如http://blast.ncbi.nlm.nih.gov/或ttp://www.ebi.ac.uk/Tools/emboss/。本领域技术人员可以确定用于测量比对的适当参数,其包括在被比较的序列的全长上实现最大比对所期望的任何算法。出于本文的目的,氨基酸序列同一性%值是指使用成对序列比对程序EMBOSSNeedle生成的值,该程序使用Needleman-Wunsch算法产生两条序列的最佳全局比对,其中所有搜索参数均设置为默认值,即评分矩阵=BLOSUM62,缺口开放=10,缺口延伸=0.5,末端缺口罚分=假,末端缺口开放=10和末端缺口延伸=0.5。
“取代”意指一个氨基酸残基被另一个氨基酸残基代替。优选地,术语“取代”是指用选自以下的另一氨基酸代替一个氨基酸残基:天然存在的标准20种氨基酸残基、稀有天然存在的氨基酸残基(例如羟脯氨酸、羟赖氨酸、别羟基赖氨酸、6-N-甲基赖氨酸、N-乙基甘氨酸、N-甲基甘氨酸、N-乙基天冬酰胺、别异亮氨酸、N-甲基异亮氨酸、N-甲基缬氨酸、焦谷氨酰胺、氨基丁酸、鸟氨酸、正亮氨酸、正缬氨酸)和非天然存在的氨基酸残基,通常是合成的(例如环己基丙氨酸)。优选地,术语“取代”是指氨基酸残基被选自天然存在的标准20种氨基酸残基的另一氨基酸残基代替。符号“+”表示取代的组合。根据以下命名法,氨基酸在本文中通过它们的单字母或三字母代码表示:A:丙氨酸(Ala);C:半胱氨酸(Cys);D:天冬氨酸(Asp);E:谷氨酸(Glu);F:苯丙氨酸(Phe);G:甘氨酸(Gly);H:组氨酸(His);I:异亮氨酸(Ile);K:赖氨酸(Lys);L:亮氨酸(Leu);M:甲硫氨酸(Met);N:天冬酰胺(Asn);P:脯氨酸(Pro);Q:谷氨酰胺(Gln);R:精氨酸(Arg);S:丝氨酸(Ser);T:苏氨酸(Thr);V:缬氨酸(Val);W:色氨酸(Trp)和Y:酪氨酸(Tyr)。在本文件中,以下术语被用于指定取代:L238A表示在亲本序列的第238位的氨基酸残基(亮氨酸,L)被改变为丙氨酸(A)。A132V/I/M表示在亲本序列第132位的氨基酸残基(丙氨酸,A)被下列氨基酸之一取代:缬氨酸(V)、异亮氨酸(I)或甲硫氨酸(M)。取代可以是保守性或非保守性取代。保守性取代的实例属于以下组:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺和苏氨酸)、疏水性氨基酸(甲硫氨酸、亮氨酸、异亮氨酸、半胱氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸和丝氨酸)。
本公开不旨在限制于所阐述的特定形式的范围,而是旨在涵盖本文描述的变化的可替代物、修改和等同物。此外,本公开的范围完全涵盖鉴于本公开对于本领域技术人员而言可能变得显而易见的其他变化。本发明的范围仅受所附权利要求的限制。
序列表
<110> DNA斯克瑞普特公司(DNA SCRIPT)
<120> 增加多核苷酸的无模板酶促合成中的长序列产率
<130> B3094PC00
<160> 31
<170> PatentIn version 3.5
<210> 1
<211> 510
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> TdT全长小鼠
<400> 1
Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro
1 5 10 15
Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe
20 25 30
Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg
35 40 45
Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu
50 55 60
Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser
65 70 75 80
Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser
85 90 95
Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly
100 105 110
Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn
115 120 125
Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala
130 135 140
Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
145 150 155 160
Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala
165 170 175
Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met
180 185 190
Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met
195 200 205
Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile
210 215 220
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val
225 230 235 240
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
245 250 255
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
260 265 270
Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met
275 280 285
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
290 295 300
Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
305 310 315 320
Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
325 330 335
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
340 345 350
Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe
355 360 365
Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr
370 375 380
Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His
385 390 395 400
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His
405 410 415
Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg
420 425 430
Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu
435 440 445
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
450 455 460
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg
465 470 475 480
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
485 490 495
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
500 505 510
<210> 2
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> TdT截短的小鼠序列
<400> 2
Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile
85 90 95
Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His Ser
275 280 285
Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 3
<211> 380
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 牛截短的(催化结构域):
<400> 3
Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu
20 25 30
Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu
35 40 45
Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser
130 135 140
Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu
225 230 235 240
Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu
245 250 255
Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln
260 265 270
Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser
275 280 285
Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
290 295 300
Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His
325 330 335
Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
340 345 350
Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu
355 360 365
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 4
<211> 380
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> TdT人截短的
<400> 4
Asp Tyr Ser Asp Ser Thr Asn Pro Gly Pro Pro Lys Thr Pro Pro Ile
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu
35 40 45
Asn Cys Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Gly Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Val Arg Ser Asp Lys Ser Leu Lys Phe Thr Arg Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Glu Asp Glu Glu Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu
225 230 235 240
Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu
245 250 255
Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln
260 265 270
Lys Cys Phe Leu Ile Phe Lys Leu Pro Arg Gln Arg Val Asp Ser Asp
275 280 285
Gln Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
290 295 300
Leu Val Leu Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
325 330 335
Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
340 345 350
Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu
355 360 365
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 5
<211> 376
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> TdT 鸡 1截短的
<400> 5
Gln Tyr Pro Thr Leu Lys Thr Pro Glu Ser Glu Val Ser Ser Phe Thr
1 5 10 15
Ala Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn
20 25 30
Asn Cys Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn
35 40 45
Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala
50 55 60
Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp
65 70 75 80
Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu
85 90 95
Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Ala Lys Asp Val Leu Asn
100 105 110
Asp Glu Arg Tyr Lys Ser Phe Lys Glu Phe Thr Ser Val Phe Gly Val
115 120 125
Gly Val Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Leu Arg Thr Val
130 135 140
Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Arg
145 150 155 160
Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala
165 170 175
Glu Ala Asp Ala Val Ser Ser Ile Val Lys Asn Thr Val Cys Thr Phe
180 185 190
Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys
195 200 205
Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Ser Pro Gly Gln Arg
210 215 220
Glu Asp Asp Glu Leu Leu His Lys Gly Leu Leu Leu Tyr Cys Asp Ile
225 230 235 240
Ile Glu Ser Thr Phe Val Lys Glu Gln Ile Pro Ser Arg His Val Asp
245 250 255
Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln
260 265 270
Pro Arg Val Asp Asn Ser Ser Tyr Asn Met Ser Lys Lys Cys Asp Met
275 280 285
Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr
290 295 300
Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg
305 310 315 320
Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met
325 330 335
Met Leu Asp Asn His Ala Leu Tyr Asp Lys Arg Lys Arg Val Phe Leu
340 345 350
Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr
355 360 365
Val Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 6
<211> 387
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 负鼠截短的
<400> 6
Ser Ala Asn Pro Asp Pro Thr Ala Gly Thr Leu Asn Ile Leu Pro Pro
1 5 10 15
Thr Thr Lys Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Ile
20 25 30
Asn Asn His Asn Gln Arg Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys
35 40 45
Asn Tyr Glu Phe Lys Glu Asn Asp Asp Thr Cys Leu Thr Phe Met Arg
50 55 60
Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Glu Val Val Ser Leu Lys
65 70 75 80
Asp Thr Glu Gly Leu Pro Trp Ile Gly Asp Glu Val Lys Gly Ile Met
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Leu Glu Val Gln Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Asp Lys Trp Tyr Arg Met Gly Phe Arg Thr
130 135 140
Leu Asn Lys Ile Arg Ser Asp Lys Thr Leu Lys Leu Thr Lys Met Gln
145 150 155 160
Lys Ala Gly Leu Cys Tyr Tyr Glu Asp Leu Ile Asp Cys Val Ser Lys
165 170 175
Ala Glu Ala Asp Ala Val Ser Leu Leu Val Gln Asp Ala Val Trp Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Glu Phe Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala
210 215 220
Glu Lys Glu Gln Glu Asp Gln Leu Leu Gln Lys Val Thr Asn Leu Trp
225 230 235 240
Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Leu Ile Glu Ser Thr Phe
245 250 255
Glu Asp Leu Lys Leu Pro Ser Arg Lys Ile Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr His His Lys Glu Asp Lys
275 280 285
Arg Lys Trp Glu Met Pro Thr Gly Ser Asn Glu Ser Glu Ala Lys Ser
290 295 300
Trp Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Asp Arg Tyr
305 310 315 320
Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser Arg Gln Phe Glu Arg Asp
325 330 335
Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His
340 345 350
Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Lys Ser Glu
355 360 365
Glu Glu Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Gln Pro Ser Glu
370 375 380
Arg Asn Ala
385
<210> 7
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的鼩鼱
<400> 7
Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser Ala
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu
35 40 45
Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg Thr
130 135 140
Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe Trp
225 230 235 240
Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp Asp
275 280 285
Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 8
<211> 387
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 蟒蛇截短的
<400> 8
Glu Lys Tyr Gln Leu Pro Glu Asp Glu Asp Arg Ser Val Thr Ser Asp
1 5 10 15
Leu Asp Arg Asp Ser Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr
20 25 30
Leu Lys Asn Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala
35 40 45
Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly Phe Cys Thr Ala Phe Arg
50 55 60
Arg Ala Ala Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Gln Val
65 70 75 80
His Asp Ile Glu Gly Val Pro Trp Met Gly Lys Gln Val Lys Gly Ile
85 90 95
Ile Glu Asp Ile Ile Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val
100 105 110
Leu Asp Asn Glu Asn Tyr Arg Ser Val Lys Leu Phe Thr Ser Val Phe
115 120 125
Gly Val Gly Leu Lys Thr Ser Asp Lys Trp Tyr Arg Met Gly Leu Arg
130 135 140
Thr Leu Glu Glu Val Lys Arg Asp Lys Asn Leu Lys Leu Thr Arg Met
145 150 155 160
Gln Lys Ala Gly Phe Leu His Tyr Asp Asp Leu Thr Ser Cys Val Ser
165 170 175
Lys Ala Glu Ala Asp Ala Ala Ser Leu Ile Val Gln Asp Val Val Trp
180 185 190
Lys Ile Val Pro Asn Ala Ile Val Thr Ile Ala Gly Gly Phe Arg Arg
195 200 205
Gly Lys Gln Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly
210 215 220
Ser Lys Gln Glu Glu Glu Glu Leu Leu His Thr Val Ile Asp Ile Trp
225 230 235 240
Lys Lys Gln Glu Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe
245 250 255
Glu Asp Thr Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Ala Ile Leu Lys Val His Lys Glu Arg Glu Asp Lys
275 280 285
Gly Asn Ser Ile Arg Ser Lys Ala Phe Ser Glu Glu Glu Ile Lys Asp
290 295 300
Trp Lys Ala Ile Arg Val Asp Leu Val Val Val Pro Phe Glu Gln Tyr
305 310 315 320
Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Thr Gln Phe Glu Arg Asp
325 330 335
Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His
340 345 350
Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Asn Ala Ala Ser Glu
355 360 365
Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu
370 375 380
Arg Asn Ala
385
<210> 9
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的狗
<400> 9
Asp Tyr Thr Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Leu Pro Val
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Asn Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu
35 40 45
Asn Tyr Glu Phe Arg Glu Asn Glu Val Phe Ser Leu Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Gln Val Lys Cys Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Lys Phe Thr Pro Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Asp Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp
225 230 235 240
Glu Arg Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly
275 280 285
Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser
325 330 335
His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 10
<211> 382
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的鼹鼠
<400> 10
Gly Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser
1 5 10 15
Ala Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
20 25 30
Leu Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala
35 40 45
Glu Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met
50 55 60
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met
65 70 75 80
Lys Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val
85 90 95
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
100 105 110
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
115 120 125
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg
130 135 140
Thr Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met
145 150 155 160
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr
165 170 175
Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp
180 185 190
Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg
195 200 205
Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
210 215 220
Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe
225 230 235 240
Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr
245 250 255
Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His
260 265 270
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp
275 280 285
Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg
290 295 300
Val Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu
305 310 315 320
Gly Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
325 330 335
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
340 345 350
Thr Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala
355 360 365
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 11
<211> 379
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 鼠兔截短的
<400> 11
Glu Tyr Ser Ala Asn Pro Ser Pro Gly Pro Gln Ala Thr Pro Ala Val
1 5 10 15
Tyr Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Gly Cys Tyr Val Thr Tyr Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Val Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Glu Asp Lys Val Lys Ser Ile Met Glu Glu
85 90 95
Ile Ile Glu Glu Gly Glu Ser Ser Glu Val Lys Ala Val Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Cys Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser
130 135 140
Asn Ile Arg Leu Asp Lys Ser Leu Lys Phe Thr Gln Met Gln Lys Ala
145 150 155 160
Gly Phe Arg Tyr Tyr Glu Asp Ile Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Asp Val Leu Val Asn Glu Ala Val Arg Ala Phe Leu
180 185 190
Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Leu Thr Glu
210 215 220
Glu Asp Glu Gln Gln Leu Leu His Lys Val Met Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Phe Lys Leu Tyr His Glu Arg Val Gly Gly Asp Arg
275 280 285
Cys Arg Gln Pro Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Cys His Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Val Phe Leu Gln Ala Glu Asn Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 12
<211> 384
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的刺猬
<400> 12
Asp Ala Ser Phe Gly Ser Asn Pro Gly Ser Gln Asn Thr Pro Pro Leu
1 5 10 15
Ala Ile Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Ser Leu
20 25 30
Asn Asn Cys Asn His Ile Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn His Glu Phe Arg Glu Asn Glu Val Ser Cys Val Ala Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Lys Gly Ile Pro Cys Leu Gly Asp Lys Ala Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Ile Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Asn Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Arg Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ala Lys
165 170 175
Ala Glu Ala Asp Ala Val Ser Val Leu Val Gln Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Met Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Leu Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala
210 215 220
Thr Glu Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Phe Trp
225 230 235 240
Glu Arg Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His Leu Gln His Val Asn Gly
275 280 285
Val Gly Asn Ser Lys Thr Gly Gln Gln Glu Gly Lys Asn Trp Lys Ala
290 295 300
Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala
305 310 315 320
Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg
325 330 335
Phe Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr
340 345 350
Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile
355 360 365
Phe Ala His Leu Gly Leu Asp Tyr Ile Asp Pro Trp Glu Arg Asn Ala
370 375 380
<210> 13
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的树鼩
<400> 13
Asp His Ser Thr Ser Pro Ser Pro Gly Pro Gln Lys Thr Pro Ala Leu
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Arg Val Phe Thr Asp Ala Phe Glu Thr Leu Ala Glu
35 40 45
Asn Tyr Glu Phe Arg Glu Asn Glu Asp Ser Ser Val Ile Phe Leu Arg
50 55 60
Ala Ala Ser Val Leu Arg Ser Leu Pro Phe Thr Ile Thr Ser Met Arg
65 70 75 80
Asp Thr Glu Gly Leu Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Asn Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Arg Val Arg Ser Asp Lys Ser Leu His Leu Thr Arg Met Gln
145 150 155 160
Gln Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Glu Glu Lys Glu Glu Glu Leu Leu Gln Lys Val Leu Asn Leu Trp
225 230 235 240
Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Pro Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly
275 280 285
Asp Lys Pro Ser Gln Gln Glu Gly Lys Ser Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Glu Arg His Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 14
<211> 394
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的鸭嘴兽
<400> 14
Leu Thr Asn Ser Ala Pro Ile Asn Cys Met Thr Glu Thr Pro Ser Leu
1 5 10 15
Ala Thr Lys Gln Val Ser Gln Tyr Ala Cys Glu Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys
35 40 45
Asp Phe Glu Phe Arg Glu Asn Glu Gly Ile Cys Leu Ala Phe Met Arg
50 55 60
Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Arg Met Lys
65 70 75 80
Asp Ile Glu Gly Val Pro Trp Leu Gly Asp Gln Val Lys Ser Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Ser Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Arg Ser Phe Gln Leu Phe Asn Ser Val Phe Glu
115 120 125
Val Gly Leu Thr Asp Asn Gly Glu Asn Gly Ile Ala Arg Gly Phe Gln
130 135 140
Thr Leu Asn Glu Val Ile Thr Asp Glu Asn Ile Ser Leu Thr Lys Thr
145 150 155 160
Thr Leu Ser Thr Ser Leu Trp Asn Tyr Leu Pro Gly Phe Leu Tyr Tyr
165 170 175
Glu Asp Leu Val Ser Cys Val Ala Lys Glu Glu Ala Asp Ala Val Tyr
180 185 190
Leu Ile Val Lys Glu Ala Val Arg Ala Phe Leu Pro Glu Ala Leu Val
195 200 205
Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val
210 215 220
Asp Phe Leu Ile Ser Asp Pro Glu Ser Gly Gln Asp Glu Gln Leu Leu
225 230 235 240
Pro Asn Ile Ile Lys Leu Trp Glu Lys Gln Glu Leu Leu Leu Tyr Tyr
245 250 255
Asp Leu Val Glu Ser Thr Phe Glu Lys Thr Lys Ile Pro Ser Arg Lys
260 265 270
Val Asp Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu
275 280 285
His His Gln Lys Val Asp Ser Gly Arg Tyr Lys Pro Pro Pro Glu Ser
290 295 300
Lys Asn His Glu Ala Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val
305 310 315 320
Met Cys Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly
325 330 335
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys
340 345 350
Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile
355 360 365
Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu
370 375 380
Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
385 390
<210> 15
<211> 384
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的跳鼠
<400> 15
Ser Ser Glu Leu Glu Leu Leu Asp Val Ser Trp Leu Ile Glu Cys Met
1 5 10 15
Gly Ala Gly Lys Pro Val Glu Met Thr Gly Arg His Gln Leu Val Lys
20 25 30
Gln Thr Phe Cys Leu Pro Gly Phe Ile Leu Gln Asp Ala Phe Asp Ile
35 40 45
Leu Ala Glu Asn Cys Glu Phe Arg Glu Asn Glu Ala Ser Cys Val Glu
50 55 60
Phe Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile
65 70 75 80
Ser Val Lys Asp Thr Glu Gly Ile Pro Trp Leu Gly Gly Lys Val Lys
85 90 95
Cys Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys
100 105 110
Ala Leu Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser
115 120 125
Val Phe Gly Val Gly Leu Lys Thr Ala Glu Arg Trp Phe Arg Met Gly
130 135 140
Phe Arg Thr Leu Ser Thr Val Lys Leu Asp Lys Ser Leu Thr Phe Thr
145 150 155 160
Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp Leu Val Ser Cys
165 170 175
Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Gln Gln Ala
180 185 190
Val Val Ala Phe Leu Pro Asp Ala Leu Val Ser Met Thr Gly Gly Phe
195 200 205
Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser
210 215 220
Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr
225 230 235 240
Asn Phe Trp Glu Gln Lys Gly Leu Leu Leu Tyr Cys Asp His Val Glu
245 250 255
Ser Thr Phe Glu Lys Cys Lys Leu Pro Ser Arg Lys Val Asp Ala Leu
260 265 270
Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr Arg Glu Arg
275 280 285
Val Asp Ser Val Lys Ser Ser Gln Gln Glu Gly Lys Gly Trp Lys Ala
290 295 300
Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys Arg Ala Phe Ala
305 310 315 320
Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg
325 330 335
Tyr Ala Thr His Glu Arg Lys Met Arg Leu Asp Asn His Ala Leu Tyr
340 345 350
Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile
355 360 365
Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Leu Glu Arg Asn Ala
370 375 380
<210> 16
<211> 382
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt金丝雀
<400> 16
Ser Pro Pro Leu Asn Thr Pro Glu Leu Glu Met Pro Ser Phe Ile Ala
1 5 10 15
Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala Ala
50 55 60
Ser Leu Leu Lys Ser Leu Pro Phe Ser Val Thr Arg Met Lys Asp Ile
65 70 75 80
Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Asp Val Ile Glu Ile
85 90 95
Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu
100 105 110
Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Val
115 120 125
Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Gly Glu
130 135 140
Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly
145 150 155 160
Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala Glu Ala
165 170 175
Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Cys Thr Phe Leu Pro
180 185 190
Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Asn Ile
195 200 205
Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp
210 215 220
Asp Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly Leu
225 230 235 240
Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu
245 250 255
Pro Ser Arg Lys Ile Asp Ala Met Asp His Phe Gln Lys Cys Phe Ala
260 265 270
Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Cys Asn Thr
275 280 285
Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg
290 295 300
Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ser Tyr Ala Leu Leu
305 310 315 320
Gly Trp Thr Gly Ser Arg Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala
325 330 335
Ala His Glu Arg Arg Met Ile Leu Asp Asn His Gly Leu Tyr Asp Arg
340 345 350
Thr Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala
355 360 365
His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 17
<211> 370
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt桔黄冠霸侏儒鸟
<400> 17
Phe Ile Ala Arg Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala
20 25 30
Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu
35 40 45
Arg Ala Ala Ser Leu Leu Lys Tyr Leu Pro Phe Pro Val Thr Arg Met
50 55 60
Lys Asp Ile Gln Gly Leu Pro Cys Ile Gly Asp Gln Val Arg Asp Val
65 70 75 80
Ile Glu Gly Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Val Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg
115 120 125
Thr Val Glu Glu Leu Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser
145 150 155 160
Lys Ala Glu Ala Asp Ala Val Thr Leu Ile Val Lys Asn Thr Val Ser
165 170 175
Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Lys Met Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly
195 200 205
Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Val Asp Leu Trp Lys
210 215 220
Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val
225 230 235 240
Glu Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln
245 250 255
Lys Cys Phe Thr Ile Leu Lys Leu Tyr Gln Pro Gly Val Asp Asn Ser
260 265 270
Ser Tyr Asn Met Ser Lys Lys Ser Asp Met Ala Glu Val Lys Asp Trp
275 280 285
Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala
290 295 300
Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg Glu Phe Gly Arg Asp Leu
305 310 315 320
Arg Arg Tyr Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Gly
325 330 335
Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu
340 345 350
Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg
355 360 365
Asn Ala
370
<210> 18
<211> 383
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt扬子鳄
<400> 18
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Cys
35 40 45
Glu Phe Arg Glu Asn Arg Leu Gly Cys Leu Glu Phe Leu Arg Ala Ala
50 55 60
Ser Val Leu Lys Phe Leu Pro Phe Pro Ile Val Lys Met Lys Asn Ile
65 70 75 80
Glu Gly Leu Pro Cys Met Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Glu Ser Cys Gln Ala Lys Glu Ile Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Thr Glu Lys Trp Tyr Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Glu Val Lys Ala Glu Lys Thr Leu Lys Leu Ser Arg Met Gln Ile Ala
145 150 155 160
Gly Phe Leu His Tyr Glu Asp Ile Ile Ser Tyr Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Val Ser Leu Leu Ile Lys Asp Thr Val Cys Met Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Asn Pro Gly Pro Glu Glu
210 215 220
Glu Lys Glu Leu Leu His Lys Val Val Asp Leu Trp Glu Lys Gln Gly
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Val Ile Glu Ser Thr Phe Glu Lys Glu Lys
245 250 255
Arg Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Leu His Gln Gln Arg Arg Gly Asn Ser Asn Ser Asn
275 280 285
Ile Ser Lys Glu Ser Asp Lys Ala Glu Val Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Ile Ser Pro Phe Glu Gln Tyr Ala Tyr Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Ser Arg Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Arg Thr Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe
355 360 365
Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 19
<211> 380
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt非洲爪蟾
<400> 19
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu
1 5 10 15
Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Cys Thr Thr Leu Gln Asp
20 25 30
Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu His Phe
35 40 45
Glu Phe Cys Glu Asn Lys Gly Arg Thr Val Ala Phe Leu Arg Ala Ser
50 55 60
Ser Leu Ile Lys Ser Leu Pro Phe Pro Ile Thr Ala Met Lys Glu Leu
65 70 75 80
Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Gly Ile Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Lys Ser Tyr Lys Val Leu Glu Val Met Asn Glu
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Asp Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Glu Ile Lys Asn Glu Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Cys
145 150 155 160
Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Tyr Val Ser Arg Ala Glu
165 170 175
Ala Glu Thr Thr Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val
180 185 190
Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Lys Gly His Asp Val Asp Ile Leu Ile Thr Cys Ala Arg Lys Gly Lys
210 215 220
Glu Lys Asn Ile Leu His Asn Thr Met Ser Val Leu Lys Asn Arg Gly
225 230 235 240
Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys
245 250 255
Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Thr Ile Leu Lys Leu Pro Lys Arg Gln Met Asp Ile Gly Asn Ile Ile
275 280 285
Asp Pro His Glu Cys Glu Arg Lys Asn Trp Lys Ala Val Arg Leu Asp
290 295 300
Leu Val Ile Thr Pro Tyr Glu Gln Tyr Pro Tyr Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
325 330 335
Glu Lys Arg Met Met Leu Asp Asn His Gly Leu Tyr Asp Lys Thr Lys
340 345 350
Asn Asn Phe Leu Lys Ala Asn Asn Glu Glu Asp Ile Phe Lys Gln Leu
355 360 365
Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 20
<211> 383
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt (澳洲虎蛇)虎蛇
<400> 20
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Ser Ile Ser Pro Tyr Ala Cys Gln Arg Arg Thr Thr Leu Lys Asn
20 25 30
Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Val Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Asn Lys Glu Phe Cys Leu Ala Phe Gly Arg Ala Ala
50 55 60
Ser Leu Leu Lys Cys Leu Pro Phe Thr Val Val Arg Val Asn Asp Ile
65 70 75 80
Glu Gly Leu Pro Trp Met Gly Lys Gln Val Arg Glu Ile Ile Glu Asp
85 90 95
Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Asn Tyr Arg Ser Ile Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Arg Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu
130 135 140
Glu Val Lys Cys Asn Lys Asn Leu Thr Leu Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Phe Tyr Tyr Asp Asp Leu Ile Ser Ser Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Ala Thr Gln Ile Val Gln Asp Thr Val Trp Lys Ile Leu
180 185 190
Pro Asn Ala Val Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Gln
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln
210 215 220
Glu Glu Glu Leu Leu His Pro Val Ile Asp Ile Trp Lys Lys Gln Glu
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Asn Thr Lys
245 250 255
Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Val His Lys Glu Arg Val Asn Lys Gly Ser Ala Val
275 280 285
Gln Ser Asn Val Phe Ala Glu Glu Gly Thr Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Val Thr Pro Phe Gln His Tyr Ala Phe Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Thr Gln Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Lys Ile Phe Leu Ser Ala Ala Asn Glu Glu Glu Ile Phe
355 360 365
Ser His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 21
<211> 367
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt棕鳟
<400> 21
Thr Ala Ala Ala Asn Val Ser Gln Tyr Ala Cys Leu Arg Arg Thr Thr
1 5 10 15
Thr Glu Asn His Asn Lys Ile Phe Thr Asp Val Leu Glu Glu Leu Ala
20 25 30
Glu Asn Ser Glu Phe Asn Glu Ser Lys Gly Pro Cys Leu Ala Phe Arg
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val His Cys Leu
50 55 60
Gly Ala Ile Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Val
65 70 75 80
Met Glu Glu Ile Leu Ile Phe Gly Arg Ser Phe Lys Val Glu Glu Val
85 90 95
Gln Ser Asp Glu Arg Tyr Gln Ala Leu Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg
115 120 125
Ser Leu Lys Glu Ile Leu Ala Glu Pro Asn Ile Gln Leu Asn Arg Met
130 135 140
Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Ala Val Ser
145 150 155 160
Lys Ala Glu Ala Lys Ala Leu Ser Ser Ile Ile Glu Glu Thr Ala His
165 170 175
Trp Ile Ala Pro Asp Ser Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Glu Tyr Gly His Asp Val Asp Phe Leu Leu Thr Met Pro Glu
195 200 205
Met Gly Lys Glu Glu Gly Leu Leu Leu Arg Val Ile Asp Arg Leu Arg
210 215 220
Asp Gln Gly Ile Leu Leu Tyr Cys Glu His Gln Asp Ser Thr Phe Asp
225 230 235 240
Met Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Glu
245 250 255
Lys Cys Phe Leu Ile Leu Arg Leu Glu Glu Gly Gln Val Glu Gly Asp
260 265 270
Gly Gly Leu Gln Lys Asp Pro Gly Glu Ser Arg Gly Trp Arg Ala Val
275 280 285
Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Val Leu
290 295 300
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe
305 310 315 320
Ala Ser Lys Glu Arg Gly Met Cys Leu Asp Asn His Ala Leu Tyr Asp
325 330 335
Lys Thr Lys Lys Leu Phe Leu Pro Ala Thr Ser Glu Glu Asp Ile Phe
340 345 350
Ala His Leu Gly Leu Glu Tyr Val Glu Pro Trp Gln Arg Asn Ala
355 360 365
<210> 22
<211> 377
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt电鳗
<400> 22
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu
1 5 10 15
Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn
20 25 30
His Asn Lys Val Phe Thr Asp Ala Leu Glu Val Leu Ile Glu Asn Tyr
35 40 45
Glu Phe Ser Asp Asn Lys Gly Ala Cys Val Gly Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Lys Pro Leu Arg Cys Leu Lys Asp Met
65 70 75 80
Glu Gly Leu Pro Cys Leu Gly Asp Asp Thr Lys Ala Ile Ile Glu Glu
85 90 95
Ile Tyr Glu Cys Gly Ser Ser Ser Arg Val Glu Asn Ile Leu Ser Asp
100 105 110
Glu Lys Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Gly Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ala Leu Glu
130 135 140
Gln Val His Ser Glu Pro Ser Ile Gln Leu Asn Lys Met Gln Ala Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Arg Ala Glu
165 170 175
Ala Lys Ala Val Gly Cys Ile Ile Glu Glu Val Ala Ser Cys Phe Ser
180 185 190
Ser Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Leu Leu Ser Ile Pro Glu Pro Gly Lys
210 215 220
Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Lys Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Leu Gln Glu Ser Thr Leu Gln Gln Trp Lys
245 250 255
Arg Pro Ser Arg Cys Phe Asp Ser Met Asp His Phe Gln Lys Cys Phe
260 265 270
Leu Ile Val Lys Leu Trp Thr Arg Leu Val Glu Gly His Arg Glu Asp
275 280 285
Pro Ser Ser Gln Arg Asp Trp Lys Ala Val Arg Val Asp Leu Val Val
290 295 300
Pro Pro Val Asp Cys Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser
305 310 315 320
Thr Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg
325 330 335
Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe
340 345 350
Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp
355 360 365
Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 23
<211> 378
<212> PRT
<213> 截短的wt(龟壳攀鲈)步行鱼
<400> 23
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn
20 25 30
Asn Asn Lys Ile Leu Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr
35 40 45
Glu Leu Asn Gln Leu Glu Gly Pro Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Cys Leu Gly Ala Thr
65 70 75 80
Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Leu Ile Glu Glu
85 90 95
Ile Leu Gln Tyr Gly His Ser Phe Glu Val Glu Lys Ile Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser
130 135 140
Asp Ile Leu Ala Glu Pro Ser Ile Gln Leu Asn Arg Met Gln Gln Ser
145 150 155 160
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
165 170 175
Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr
180 185 190
Pro Asp Gly Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Gln Gly Lys
210 215 220
Glu Glu Thr Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Glu Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Tyr Gln Thr Ser Thr Phe Asp Ile Ser Lys
245 250 255
Leu Pro Ser His Lys Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
260 265 270
Leu Ile Leu Arg Leu Glu Gly Ser Leu Val Asp Arg Gly Leu Asn Ser
275 280 285
Thr Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
290 295 300
Ser Pro Pro Met Glu Arg Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly
305 310 315 320
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Gln
325 330 335
His Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu
340 345 350
Phe Leu Ala Ala Thr Thr Glu Arg Asp Ile Phe Ala His Leu Gly Leu
355 360 365
Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 24
<211> 378
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt(孔雀鱼) 古比鱼
<400> 24
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Val Glu Asn
20 25 30
Asn Asn Arg Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Ile Glu Gly Arg Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Trp Ala Val Arg Ser Val Gly Ala Thr
65 70 75 80
Leu Asp Leu Pro Cys Leu Gly Glu His Thr Thr Ala Val Met Lys Glu
85 90 95
Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp
100 105 110
Glu Arg Cys Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser
130 135 140
Asp Val Leu Ala Gln Pro Gly Ile His Leu Asn Arg Met Gln Gln Ser
145 150 155 160
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
165 170 175
Ala Arg Ala Val Gly Asn Ile Ile Asp Glu Ala Val His Val Ile Thr
180 185 190
Pro Asn Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Asp
195 200 205
Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Thr Glu Leu Gly Lys
210 215 220
Glu Lys Asn Leu Leu Ile Ser Val Ile Glu Ser Leu Lys Lys Gln Gly
225 230 235 240
Leu Leu Leu Phe Ser Asp Tyr Gln Ala Ser Thr Phe Asp Ile Ser Lys
245 250 255
Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
260 265 270
Leu Ile Leu Arg Leu Glu Gly Ser Arg Val Glu Gly Gly Leu Gln Arg
275 280 285
Ala Gln Ala Asp Gly Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
290 295 300
Ser Pro Pro Ala Asp Arg Phe Ala Phe Thr Met Leu Gly Trp Thr Gly
305 310 315 320
Ser Arg Met Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg
325 330 335
Gln Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu
340 345 350
Phe Leu Thr Ala Ala Thr Glu Lys Asp Ile Phe Asp His Leu Gly Leu
355 360 365
Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 25
<211> 366
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt短褐家鼠
<400> 25
Pro Leu Met Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
1 5 10 15
Leu Asn Asn His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala
20 25 30
Glu Asn Tyr Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met
50 55 60
Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val
65 70 75 80
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Thr Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
145 150 155 160
Arg Ala Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
165 170 175
Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
195 200 205
Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe
210 215 220
Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr
225 230 235 240
Phe Glu Lys Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His
245 250 255
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg
260 265 270
Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg
275 280 285
Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu
290 295 300
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
305 310 315 320
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
325 330 335
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
340 345 350
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360 365
<210> 26
<211> 379
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt长褐家鼠
<400> 26
Ser Leu Ser Pro Val Pro Gly Ser Gln Thr Val Pro Pro Pro Leu Met
1 5 10 15
Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Gly
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Met
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln
225 230 235 240
Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys
245 250 255
Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu
275 280 285
Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 27
<211> 379
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt(红疣猴)猴
<400> 27
Ser Asp Ser Thr Asn Pro Gly Leu Pro Lys Thr Pro Pro Thr Ala Ile
1 5 10 15
Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Cys
35 40 45
Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Cys Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Ala Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu
210 215 220
Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Asp Ser Asp Gln
275 280 285
Ser Ser Trp Gln Gly Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 28
<211> 379
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> N27截短的wt(野猪)猪
<400> 28
Ser Ala Ser Pro Ser Pro Gly Ser Gln Asn Thr Leu Pro Pro Ala Val
1 5 10 15
Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Thr Phe Cys Leu Ala Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Arg Trp Phe Arg Met Gly Phe Arg Ser Leu Ser
130 135 140
Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gln Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp
210 215 220
Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Val Asn Leu Trp Glu Arg
225 230 235 240
Glu Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Leu Glu Lys
245 250 255
Ser Lys Leu Pro Ser Arg Asn Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Met
275 280 285
Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Leu Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 29
<211> 379
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt西伯利亚虎
<400> 29
Tyr Ser Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Pro Pro Leu Val
1 5 10 15
Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Phe Asn His Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Val Ser Ser Ala Thr Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp
210 215 220
Glu Glu Glu Glu Glu Leu Leu Pro Lys Val Ile Asn Leu Trp Gln Arg
225 230 235 240
Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Lys
275 280 285
Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 30
<211> 365
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的wt水牛
<400> 30
Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala
20 25 30
Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met
50 55 60
Lys Asp Thr Gln Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val
65 70 75 80
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Ser Leu Ser Lys Ile Thr Ser Asp Lys Thr Leu Lys Phe Thr Lys Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr
145 150 155 160
Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp
165 170 175
Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly
195 200 205
Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp
210 215 220
Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe
225 230 235 240
Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe
245 250 255
Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser
260 265 270
Gly Arg Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val
275 280 285
Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly
290 295 300
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr
305 310 315 320
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
325 330 335
Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His
340 345 350
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360 365
<210> 31
<211> 379
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> N93或截短的wt(黄腹旱獭)土拨鼠
<400> 31
Pro Asp His Ser Asn Ser Asp Pro Gln Arg Ile Pro Pro Pro Ala Val
1 5 10 15
Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Ser Cys Ser Val Val Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu
65 70 75 80
Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Ser Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Asn
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys
275 280 285
Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375

Claims (14)

1.合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:
a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;
b)重复以下循环直到形成具有所述预定序列的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-封闭的三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段;
c)通过使引物退火至至少一条多核苷酸的3’端,并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链多核苷酸;
d)提供具有在所述双链多核苷酸中解离失效序列的杂交严格性的反应条件;以及
e)消化所解离的双链多核苷酸的链。
2.合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:
a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;
b)重复以下循环直到形成扩增的多核苷酸,其中每条在其3’端处包含具有通用引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-封闭的三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段;
c)通过使引物退火至每个扩增的多核苷酸的所述通用引物结合位点并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链扩增的多核苷酸;
d)提供具有杂交严格性的反应条件,使得在所述双链扩增的多核苷酸中的失效序列解离;以及
e)消化所解离的双链扩增的多核苷酸的链。
3.如权利要求1或2所述的方法,其还包括从未消化的双链扩增的多核苷酸切割所述通用引物结合位点以产生所述预定序列的所述多核苷酸的步骤。
4.合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:
a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;
b)重复以下循环直到形成扩增的多核苷酸或其失效序列,其中每条在其3’端处包含具有引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-封闭的三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段;
c)使引物退火至所述扩增的多核苷酸或其失效序列的引物结合位点;
d)重复以下循环直到形成扩增的多核苷酸的反向互补序列:(i)在引物延伸条件下使所述引物或具有游离3’-O-羟基的延伸引物与3’-O-封闭的三磷酸核苷以及模板依赖性的DNA聚合酶接触,使得通过掺入3’-O-封闭的三磷酸核苷来延伸所述引物或所述延伸引物,以形成包含3’-O-封闭的延伸引物的双链片段,以及(ii)对所述延伸引物去封闭以形成具有游离3’-羟基的延伸引物,其中在所述接触步骤(i)中,以与所述预定序列的反向互补序列相同的顺序使所述引物或所述延伸引物与3’-O-封闭的三磷酸核苷接触,从而在失效序列上形成截短的反向互补序列;以及
e)通过它们截短的反向互补序列去除失效序列。
5.如权利要求5所述的方法,其中通过优先对所述截短的反向互补序列解链并用产生单链失效序列的单链核酸酶消化来实施所述去除步骤。
6.如权利要求5所述的方法,其中通过用单链核酸内切酶消化所述失效序列的单链部分,从而从所述固体支持物上释放所述失效序列来实施所述去除步骤。
7.合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:
a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3’-羟基的3’-末端核苷酸;
b)重复以下循环直到形成具有所述预定序列的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3’-O-羟基的延长片段与3’-O-氨基三磷酸核苷以及模板非依赖性DNA聚合酶接触,使得通过掺入3’-O-氨基三磷酸核苷来延长所述引发剂或所述延长片段,以形成3’-O-氨基延长片段,(ii)将所述3’-O-氨基延长片段转换为3’-肟-延长片段,(iii)用3’-核酸外切酶处理所述延长片段;(iv)将3’-肟-延长片段转换为3’-O-氨基延长片段;以及(v)对所述延长片段去封闭,以形成具有游离3’-羟基的延长片段。
8.如权利要求1至7中任一项所述的方法,其中所述模板非依赖性DNA聚合酶是末端脱氧核苷酸转移酶(TdT)变体,其具有与选自以下的氨基酸序列至少90%相同的氨基酸序列:SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31,其中对此类选定的氨基酸序列进行两个或更多个突变,其SEQ ID NO在表1中列出;以及其中所述TdT变体(i)能够在无模板的情况下合成核酸片段,并且(ii)能够在多核苷酸的游离3’-羟基上掺入3’-O-封闭的核苷酸。
9.如权利要求1至8中任一项所述的方法,其中所述3’-O-封闭的核苷酸包含选自以下的3’-O-封闭基团:3’-O-甲基、3’-O-(2-硝基苄基)、3’-O-烯丙基、3’-O-胺、3’-O-叠氮甲基、3’-O-叔丁氧乙氧基、3’-O-(2-氰乙基)、3’-O-硝基和3’-O-炔丙基。
10.如权利要求1至9中任一项所述的方法,其中所述引发剂在其3’端处包含可切割的核苷酸或可切割的连接,并且其中通过切割所述可切割的核苷酸或所述可切割的连接,将具有所述预定序列的所述多核苷酸从所述固体支持物上释放出来。
11.用于增强用模板非依赖性DNA聚合酶合成全长多核苷酸的试剂盒,所述试剂盒包含:(a)用于具有预定序列的多核苷酸的模板非依赖性合成的一个或多个TdT变体,(b)退火至所述多核苷酸的通用引物结合位点的一条或多条引物,(c)用于延伸退火至所述通用引物结合位点的所述一条或多条引物的模板依赖性聚合酶,和(c)消化失效序列的一种或多种单链核酸酶。
12.如权利要求11所述的试剂盒,其还包括其上连接有引发剂的一个或多个固体支持物。
13.如权利要求11或12所述的试剂盒,其还包括3’-O-封闭的三磷酸核苷。
14.如权利要求11至13中任一项所述的试剂盒,其中所述TdT变体具有与选自以下的氨基酸序列至少90%相同的氨基酸序列:SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31,其中对此类选定的氨基酸序列进行两个或更多个突变,其SEQ ID NO在表1中列出;以及其中所述TdT变体(i)能够在无模板的情况下合成核酸片段,并且(ii)能够在多核苷酸的游离3’-羟基上掺入3’-O-封闭的核苷酸。
CN202080066564.9A 2019-09-23 2020-09-21 增加多核苷酸的无模板酶促合成中的长序列产率 Active CN114729389B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19199022.5 2019-09-23
EP19199022 2019-09-23
PCT/EP2020/076315 WO2021058438A1 (en) 2019-09-23 2020-09-21 Increasing long-sequence yields in template-free enzymatic synthesis of polynucleotides

Publications (2)

Publication Number Publication Date
CN114729389A true CN114729389A (zh) 2022-07-08
CN114729389B CN114729389B (zh) 2024-03-08

Family

ID=68062833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080066564.9A Active CN114729389B (zh) 2019-09-23 2020-09-21 增加多核苷酸的无模板酶促合成中的长序列产率

Country Status (7)

Country Link
US (1) US20220403436A1 (zh)
EP (1) EP4034669A1 (zh)
JP (1) JP2022549196A (zh)
CN (1) CN114729389B (zh)
AU (1) AU2020352503A1 (zh)
CA (1) CA3151411A1 (zh)
WO (1) WO2021058438A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022013094A1 (en) * 2020-07-15 2022-01-20 Dna Script Massively parallel enzymatic synthesis of polynucleotides
US20230317208A1 (en) 2022-03-31 2023-10-05 Ribbon Biolabs Gmbh Biopolymer synthesis

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5436143A (en) * 1992-12-23 1995-07-25 Hyman; Edward D. Method for enzymatic synthesis of oligonucleotides
WO2001094546A2 (en) * 2000-06-02 2001-12-13 Dna Sciences, Inc. Primer extension using a mixture of labelled and unlabelled nucleotides
US20060234264A1 (en) * 2005-03-14 2006-10-19 Affymetrix, Inc. Multiplex polynucleotide synthesis
US20070087417A1 (en) * 2005-10-14 2007-04-19 Eugeni Namsaraev Multiplex polynucleotide synthesis
CN101547928A (zh) * 2006-12-22 2009-09-30 霍夫曼-拉罗奇有限公司 合成和纯化寡核苷酸的化合物和方法
US20120129770A1 (en) * 2009-06-22 2012-05-24 Rajyashri Karur Ramakrishna Novel polynucleotide molecules for enhanced gene expression
US20150315541A1 (en) * 2012-12-13 2015-11-05 Moderna Therapeutics, Inc. Modified polynucleotides for altering cell phenotype
US20160046974A1 (en) * 2013-04-02 2016-02-18 Molecular Assemblies, Inc. Reusable initiators for synthesizing nucleic acids
US20160108382A1 (en) * 2014-10-20 2016-04-21 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis
CN106459135A (zh) * 2014-03-16 2017-02-22 米拉根医疗股份有限公司 双环核苷的合成
CN107074903A (zh) * 2014-09-02 2017-08-18 Dna斯克瑞普特公司 用于核酸合成的修饰的核苷酸、含此类核苷酸的试剂盒及其用于生产合成的核酸序列或基因的用途
US20190078065A1 (en) * 2017-09-08 2019-03-14 Sigma-Aldrich Co. Llc Modified dna polymerases
US20190264248A1 (en) * 2014-04-17 2019-08-29 Dna Script Method for Synthesizing Nucleic Acids, in particular Long Nucleic Acids, Use of Said Method and Kit for Implementing Said Method

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
US5047524A (en) 1988-12-21 1991-09-10 Applied Biosystems, Inc. Automated system for polynucleotide synthesis and purification
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5474796A (en) 1991-09-04 1995-12-12 Protogene Laboratories, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
US6921636B1 (en) 1991-09-04 2005-07-26 Metrigen, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
US5667667A (en) 1992-04-24 1997-09-16 Isis Innovation Limited Electrochemical treatment of surfaces
AU1436995A (en) 1993-12-30 1995-07-17 Chemgenes Corporation Synthesis of propargyl modified nucleosides and phosphoramidites and their incorporation into defined sequence oligonucleotides
DE69531545T2 (de) 1994-06-23 2004-06-24 Affymax Technologies N.V., Willemstad Photolabile verbindungen und verfahren für deren verwendung
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5830655A (en) 1995-05-22 1998-11-03 Sri International Oligonucleotide sizing using cleavable primers
US5700642A (en) 1995-05-22 1997-12-23 Sri International Oligonucleotide sizing using immobilized cleavable primers
ZA975891B (en) 1996-07-05 1998-07-23 Combimatrix Corp Electrochemical solid phase synthesis of polymers
US6093302A (en) 1998-01-05 2000-07-25 Combimatrix Corporation Electrochemical solid phase synthesis
DE69909972T2 (de) 1998-02-11 2004-05-13 University Of Houston, Houston Vorrichtung zur durchführung chemischer und biochemischer reaktionen unter anwendung von photoerzeugten reagenzien
US6251595B1 (en) 1998-06-18 2001-06-26 Agilent Technologies, Inc. Methods and devices for carrying out chemical reactions
DE69928995T2 (de) 1998-06-22 2006-09-07 Affymetrix, Inc., Santa Clara Reagenz und Verfahren zu fester Phase Synthese
EP1159285B1 (en) 1999-03-08 2005-05-25 Metrigen, Inc. Methods and compositions for economically synthesizing and assembling long dna sequences
US6323043B1 (en) 1999-04-30 2001-11-27 Agilent Technologies, Inc. Fabricating biopolymer arrays
US7276336B1 (en) 1999-07-22 2007-10-02 Agilent Technologies, Inc. Methods of fabricating an addressable array of biopolymer probes
US6306599B1 (en) 1999-07-16 2001-10-23 Agilent Technologies Inc. Biopolymer arrays and their fabrication
US6664097B2 (en) 2000-05-23 2003-12-16 North Carolina State University Polynucleotide encoding a Lactobacillus gasseri beta-glucuronidase polypeptide
CA2425112C (en) 2000-10-06 2011-09-27 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding dna and rna
GB0121155D0 (en) 2001-08-31 2001-10-24 Isis Innovation Treatment of substrates
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
AU2003210438A1 (en) 2002-01-04 2003-07-24 Board Of Regents, The University Of Texas System Droplet-based microfluidic oligonucleotide synthesis engine
WO2004005667A1 (en) 2002-07-08 2004-01-15 Shell Internationale Research Maatschappij B.V. Choke for controlling the flow of drilling mud
US7534561B2 (en) 2003-04-02 2009-05-19 Agilent Technologies, Inc. Nucleic acid array in situ fabrication methods and arrays produced using the same
US7947817B2 (en) 2003-06-30 2011-05-24 Roche Molecular Systems, Inc. Synthesis and compositions of 2'-terminator nucleotides
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
US20060102471A1 (en) 2004-11-18 2006-05-18 Karl Maurer Electrode array device having an adsorbed porous reaction layer
US7544794B1 (en) 2005-03-11 2009-06-09 Steven Albert Benner Method for sequencing DNA and RNA by synthesis
US8212020B2 (en) 2005-03-11 2012-07-03 Steven Albert Benner Reagents for reversibly terminating primer extension
US20070034513A1 (en) 2005-03-25 2007-02-15 Combimatrix Corporation Electrochemical deblocking solution for electrochemical oligomer synthesis on an electrode array
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
US8399188B2 (en) 2006-09-28 2013-03-19 Illumina, Inc. Compositions and methods for nucleotide sequencing
US8034923B1 (en) 2009-03-27 2011-10-11 Steven Albert Benner Reagents for reversibly terminating primer extension
US9874538B2 (en) 2012-07-06 2018-01-23 Robert Bosch Gmbh Methods for generating pH/ionic concentration gradient near electrode surfaces for modulating biomolecular interactions
US9910008B2 (en) 2012-07-06 2018-03-06 Robert Bosch Gmbh Methods for generating pH/ionic concentration gradient near electrode surfaces for modulating biomolecular interactions
US9075041B2 (en) 2012-07-06 2015-07-07 Robert Bosch Gmbh Methods for generating pH/ionic concentration gradient near electrode surfaces for modulating biomolecular interactions
EP2876166B1 (en) 2013-11-20 2016-12-14 Roche Diagnostics GmbH New compound for sequencing by synthesis
CN106536728A (zh) 2014-06-27 2017-03-22 伊鲁米那股份有限公司 用于核苷酸类似物的改进的掺入的修饰的聚合酶
WO2016054096A1 (en) 2014-09-30 2016-04-07 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
FR3052462A1 (fr) 2016-06-14 2017-12-15 Dna Script Variants d'une adn polymerase de la famille polx
US10472383B2 (en) 2017-03-16 2019-11-12 Steven A Benner Nucleoside triphosphates with stable aminoxy groups
US11390856B2 (en) 2017-08-07 2022-07-19 Dna Script Variants of family a DNA polymerase and uses thereof
EP3737749A1 (en) 2018-01-08 2020-11-18 DNA Script Variants of terminal deoxynucleotidyl transferase and uses thereof
JP2022513031A (ja) 2018-11-14 2022-02-07 ディーエヌエー スクリプト 末端デオキシヌクレオチジルトランスフェラーゼバリアントおよびその使用
US20220356510A1 (en) 2019-01-03 2022-11-10 Dna Script One Pot Synthesis of Sets of Oligonucleotides

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5436143A (en) * 1992-12-23 1995-07-25 Hyman; Edward D. Method for enzymatic synthesis of oligonucleotides
WO2001094546A2 (en) * 2000-06-02 2001-12-13 Dna Sciences, Inc. Primer extension using a mixture of labelled and unlabelled nucleotides
US20060234264A1 (en) * 2005-03-14 2006-10-19 Affymetrix, Inc. Multiplex polynucleotide synthesis
US20070087417A1 (en) * 2005-10-14 2007-04-19 Eugeni Namsaraev Multiplex polynucleotide synthesis
CN101547928A (zh) * 2006-12-22 2009-09-30 霍夫曼-拉罗奇有限公司 合成和纯化寡核苷酸的化合物和方法
US20120129770A1 (en) * 2009-06-22 2012-05-24 Rajyashri Karur Ramakrishna Novel polynucleotide molecules for enhanced gene expression
US20150315541A1 (en) * 2012-12-13 2015-11-05 Moderna Therapeutics, Inc. Modified polynucleotides for altering cell phenotype
US20160046974A1 (en) * 2013-04-02 2016-02-18 Molecular Assemblies, Inc. Reusable initiators for synthesizing nucleic acids
CN106459135A (zh) * 2014-03-16 2017-02-22 米拉根医疗股份有限公司 双环核苷的合成
US20190264248A1 (en) * 2014-04-17 2019-08-29 Dna Script Method for Synthesizing Nucleic Acids, in particular Long Nucleic Acids, Use of Said Method and Kit for Implementing Said Method
CN107074903A (zh) * 2014-09-02 2017-08-18 Dna斯克瑞普特公司 用于核酸合成的修饰的核苷酸、含此类核苷酸的试剂盒及其用于生产合成的核酸序列或基因的用途
US20160108382A1 (en) * 2014-10-20 2016-04-21 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis
US20190078065A1 (en) * 2017-09-08 2019-03-14 Sigma-Aldrich Co. Llc Modified dna polymerases

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EMILY ET AL.: "Synthesis of high-quality libraries of long (150mer) oligonucleotides by a novel depurination controlled process", 《NUCLEIC ACIDS RES》, vol. 38, no. 8, pages 2522 - 2540, XP055085142, DOI: 10.1093/nar/gkq163 *
MICHAEL A JENSEN: "Template-Independent Enzymatic Oligonucleotide Synthesis (TiEOS): Its History, Prospects, and Challenges", 《BIOCHEMISTRY》, vol. 57, no. 12, pages 1821 - 1832, XP055729259, DOI: 10.1021/acs.biochem.7b00937 *
贤: "多核苷酸的合成", 《化学通报》, no. 2, pages 79 *

Also Published As

Publication number Publication date
US20220403436A1 (en) 2022-12-22
CN114729389B (zh) 2024-03-08
AU2020352503A1 (en) 2022-05-19
WO2021058438A1 (en) 2021-04-01
CA3151411A1 (en) 2021-04-01
EP4034669A1 (en) 2022-08-03
JP2022549196A (ja) 2022-11-24

Similar Documents

Publication Publication Date Title
EP3115462B1 (en) Methods and apparatus for synthesizing nucleic acids
CN113423840B (zh) 多核苷酸无模板酶促合成中有效的产物裂解
EP4110940B1 (en) Method and apparatus for enzymatic synthesis of polynucleotides
US11331643B2 (en) Reusable initiators for synthesizing nucleic acids
CN114729389B (zh) 增加多核苷酸的无模板酶促合成中的长序列产率
CN105264085B (zh) 合成核酸的方法和设备
CA2958581A1 (en) Methods and apparatus for synthesizing nucleic acids
EP3867361A1 (en) Modified template-independent enzymes for polydeoxynucleotide synthesis
NL2031471B1 (en) Methods and kits for enzymatic synthesis of g4-prone polynucleotides
EP4237573A1 (en) Enzymatic synthesis of polynucleotide probes
CN115427559A (zh) 末端脱氧核苷酸转移酶变体及其用途
EP3917660A1 (en) Reusable initiators for synthesizing nucleic acids
CA3179701A1 (en) Reusable initiators for synthesizing nucleic acids
KR20220097976A (ko) 폴리뉴클레오타이드의 무-주형 고 효율 효소 합성

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant