CN111117978B - 一种单链DNA肽连接酶sDPlaseI及其使用方法 - Google Patents

一种单链DNA肽连接酶sDPlaseI及其使用方法 Download PDF

Info

Publication number
CN111117978B
CN111117978B CN202010077331.0A CN202010077331A CN111117978B CN 111117978 B CN111117978 B CN 111117978B CN 202010077331 A CN202010077331 A CN 202010077331A CN 111117978 B CN111117978 B CN 111117978B
Authority
CN
China
Prior art keywords
leu
ligase
ser
arg
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010077331.0A
Other languages
English (en)
Other versions
CN111117978A (zh
Inventor
黄志玲
黄种山
其他发明人请求不公开姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huang Zhongshan
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202010077331.0A priority Critical patent/CN111117978B/zh
Publication of CN111117978A publication Critical patent/CN111117978A/zh
Application granted granted Critical
Publication of CN111117978B publication Critical patent/CN111117978B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种新型的可用于催化特定单链DNA和特定多肽共价连接的单链DNA肽连接酶sDPlaseI及其酶学特性和使用方法。sDPlaseI酶的氨基酸序列如SEQ ID NO:4所示,对应的基因编码序列如SEQ ID NO:3所示;sDPlaseI酶可以识别5’末端起始为5’‑ATGATCCAG‑3’序列且其5’末端脱氧核糖核苷酸A为磷酸化状态的特定DNA单链和C末端起始为N’‑MANCEHL‑C’这7肽的特定多肽链,并催化这两者以共价键相互连接在一起;单链DNA和多肽连接产物在358nm波长处有特征吸收峰,可用于sDPlaseI连接酶反应活性的测定。sDPlaseI连接酶缓冲液是由pH为7.5的500mM Tris‑Hcl、100mM Mg2+、10mM ATP和10mM DTT组成,其最适反应的温度范围是30℃‑40℃,连接反应时间为5min‑15min。本发明提供的全新的单链DNA多肽连接酶,可以作为基因工程和基因分析的工具酶。

Description

一种单链DNA肽连接酶sDPlaseI及其使用方法
技术领域
本发明涉及分子生物学领域,具体涉及一种全新的可以连接特定单链DNA和特定多肽的连接酶及其使用方法。
背景技术
基因工程领域离不开各种分子生物学工具酶,这些工具酶可以实现体外的核酸扩增、转录或反转录、消化或切除、连接和修饰以及蛋白的消化或切除等,被广泛用于目的基因扩增、核酸序列分析、重组体DNA制备、载体构建、核酸探针标记和蛋白分析等领域,例如DNA聚合酶是PCR体系中的核心组分,cDNA文库的构建离不开RNA聚合酶。基因工程常用的工具酶,主要是DNA聚合酶、限制性核酸内切酶、DNA连接酶,此外还有RNA聚合酶、反转录酶、核酸外切酶、DNA甲基化酶、核糖核酸酶、脱氧核糖核酸酶、多核苷酸激酶、碱性磷酸酯酶、末端核苷酸转移酶以及各种蛋白酶等。目前商品化的分子工具酶大多数来源于微生物,主要是由于微生物生长增殖速度快、新陈代谢旺盛,此外也便于这些酶的表达和分离纯化。自然界中的微生物种类繁多,其所处的微生态各种各样,因此其新陈代谢形式和过程多种多样,这些都离不开相应的能执行各种生化反应的酶,因此微生物是分子酶的巨大资源库。例如来源于T4噬菌体的T4连接酶,该酶原本就是噬菌体用于修复被宿主细胞的限制性核酸内切酶切断的DNA的,其连接效率十分高效。随着越来越多的酶分子被挖掘,分子工具酶的数量和用途不断增加,这大大开拓了基因工程的研究和应用领域。
申请人前期在研究干枯稻草降解的微生物生态体系时,发现体系中存在着一种特定的单链RNA肽连接酶,可以识别特定mRNA的5’端特定序列并将其和特定多肽进行共价连接,从而调控特定mRNA翻译为蛋白这一过程。进一步的借助生物信息分析设计,申请人对该单链RNA肽连接酶基因进行改造,开发出了1种特定的单链DNA肽连接酶和2种特定的双链DNA肽连接酶,分别可以识别特定单链DNA的5’末端上特定DNA单链序列或特定双链DNA的5’末端上特定DNA双链序列并将其和特定多肽进行共价连接。在对这些核酸肽连接酶外源表达的基础上,申请人探究了其酶学特性和使用方法。目前已有多种商业化的DNA连接酶(如美国赛默飞公司的T4 DNAlagase)和修饰酶(NEB公司的DNA甲基化酶),仅是对核酸片段进行相互连接和特定修饰,尚未见报道可以实现核酸片段和多肽片段相互共价连接的连接酶。本发明提供了全新的核酸多肽连接酶,可以作为基因工程和基因分析的工具酶,在核酸标记和核酸分析等领域中具有巨大的应用前景。
发明内容
本发明提供了新的可用于连接特定核酸片段和特定多肽片段的核酸多肽连接酶及其酶学特性和使用方法。
本发明解决其技术问题所采用的技术方案如下:
本发明的目的(1)在于提供一种可用于催化特定单链RNA和特定多肽共价连接的单链RNA肽连接酶sRPlaseI及其酶学特性和使用方法。sRPlaseI酶的氨基酸序列如SEQ IDNO:2所示,对应的基因编码序列如SEQ ID NO:1所示;sRPlaseI酶可以识别5’末端起始为5’-AUGAUCCAG-3’序列且其5’末端核糖核苷酸A为磷酸化状态的特定RNA单链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化RNA单链5’末端磷酸化的腺嘌呤核糖核苷酸A和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得单链RNA和多肽以共价键相互连接在一起;单链RNA和多肽的连接产物RP在351nm波长处有最大吸收峰,该峰为其特征吸收峰,可用于sRPlaseI连接酶反应活性的测定。sRPlaseI连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定RNA单链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.5的500mM Tris-Hcl、100mM Mg2+、10mM ATP和10mM DTT组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)1μg的sRPlaseI酶;(5)去离子水,补足至所需体积。其中,特定RNA单链是指5’末端起始为5’-AUGAUCCAG-3’序列且其5’末端核糖核苷酸A为磷酸化状态的RNA单链,特定多肽是指C末端起始为N’-MANCEHL-C’这7肽的多肽链。sRPlaseI连接酶的最适反应的温度范围是30℃-40℃,连接反应时间为10min-15min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
本发明的目的(2)在于提供一种可用于催化特定单链DNA和特定多肽共价连接的单链DNA肽连接酶sDPlaseI及其酶学特性和使用方法。sDPlaseI酶的氨基酸序列如SEQ IDNO:4所示,对应的基因编码序列如SEQ ID NO:3所示;sDPlaseI酶可以识别5’末端起始为5’-ATGATCCAG-3’序列且其5’末端脱氧核糖核苷酸A为磷酸化状态的特定DNA单链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化DNA单链5’末端磷酸化的腺嘌呤脱氧核糖核苷酸A和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得单链DNA和多肽以共价键相互连接在一起;单链DNA和多肽连接产物sDP在358nm波长处有最大吸收峰,该峰为其特征吸收峰,可用于sDPlaseI连接酶反应活性的测定。sDPlaseI连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定DNA单链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.5的500mM Tris-Hcl、100mM Mg2+、10mM ATP和10mM DTT组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)1μg的sDPlaseI酶;(5)去离子水,补足至所需体积。其中,特定DNA单链是指5’末端起始为5’-ATGATCCAG-3’序列且其5’末端脱氧核糖核苷酸A为磷酸化状态的DNA单链,特定多肽是指C末端起始为N’-MANCEHL-C’这7肽的多肽链。sDPlaseI连接酶的最适反应的温度范围是30℃-40℃,连接反应时间为5min-15min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
本发明的目的(3)在于提供一种可用于催化特定双链DNA和特定多肽共价连接的双链DNA肽连接酶dDPlaseI及其酶学特性和使用方法。dDPlaseI酶的氨基酸序列如SEQ IDNO:6所示,对应的基因编码序列如SEQ ID NO:5所示;dDPlaseI酶可以识别5’末端起始为5’-ATGATCCAG-3’双链序列且该5’末端脱氧核糖核苷酸A为磷酸化状态的特定DNA双链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化DNA双链5’末端磷酸化的腺嘌呤脱氧核糖核苷酸A和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得双链DNA和多肽以共价键相互连接在一起;双链DNA和多肽连接产物dDPI在360nm波长处有最大吸收峰,该峰为其特征吸收峰,可用于dDPlaseI连接酶反应活性的测定。dDPlaseI连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定DNA双链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.8的450mM Tris-Hcl、100mM Mg2+、80mM NaCl、20mMATP和8mMTriton X-100组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)1μg的dDPlaseI酶;(5)去离子水,补足至所需体积。其中,特定DNA双链是指5’末端起始为5’-ATGATCCAG-3’双链序列且该5’末端脱氧核糖核苷酸A为磷酸化状态的DNA双链,特定多肽是指C末端以N’-MANCEHL-C’这7肽为起始的多肽链。dDPlaseI连接酶的最适反应的温度范围是35℃-45℃,连接反应时间为3min-10min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
本发明的目的(4)在于提供另外一种可用于催化特定双链DNA和特定多肽共价连接的双链DNA肽连接酶dDPlaseII及其酶学特性和使用方法。dDPlaseII酶的氨基酸序列如SEQ ID NO:8所示,对应的基因编码序列如SEQ ID NO:7所示;dDPlaseII酶可以识别5’末端起始为5’-CTGGATCAT-3’双链序列且该5’末端脱氧核糖核苷酸C为磷酸化状态的特定DNA双链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化DNA双链5’末端磷酸化的胞嘧啶脱氧核糖核苷酸C和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得双链DNA和多肽以共价键相互连接在一起;双链DNA和多肽连接产物dDPII在372nm波长处有最大吸收峰,该峰为其特征吸收峰,可用于dDPlaseII连接酶反应活性的测定。dDPlaseII连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定DNA双链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.8的450mM Tris-Hcl、100mM Mg2+、80mMNaCl、20mMATP和8mM Triton X-100组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)1μg的dDPlaseII酶;(5)去离子水,补足至所需体积。其中,特定DNA双链是指5’末端起始为5’-CTGGATCAT-3’双链序列且该5’末端脱氧核糖核苷酸C为磷酸化状态的DNA双链,特定多肽是指C末端以N’-MANCEHL-C’这7肽为起始的多肽链。dDPlaseII连接酶的最适反应的温度范围是35℃-45℃,连接反应时间为3min-10min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
本发明提供的全新的核酸多肽连接酶及其酶学反应特性和使用方法,可以为其做为基因工程和基因分析的新的工具酶以及其在核酸分析和核酸标记等领域中的应用奠定基础。
附图说明
图1是干枯稻草微生态宏基因组测序分析中获取的特殊DNA构造示意图,主要包括启动子I、X基因、短肽基因和前导DNA片段。
图2是X蛋白作用下R9和P7连接产物的验证方法。
图3是O=P-C=O构造磷碳键示意图。
图4是在单链RNA肽连接酶sRPlaseI作用下R9和P7连接产物RP的全波长扫描图谱,特征吸收峰在351nm波长处。
图5是在单链DNA肽连接酶sDPlaseI作用下sD9和P7连接产物sDP的全波长扫描图谱,特征吸收峰在358nm波长处。
图6是在双链DNA肽连接酶dDPlaseI作用下dD9和P7连接产物dDPI的全波长扫描图谱,特征吸收峰在360nm波长处。
图7是在双链DNA肽连接酶dDPlaseII作用下dD9和P7连接产物dDPII的全波长扫描图谱,特征吸收峰在372nm波长处。
图8是双链DNA肽连接酶dDPlaseI和dDPlaseII对于dD9和P7连接反应的差异。
具体实施方式
以下结合具体实施例,进一步阐述本发明。
实施例1可催化特定RNA单链和特定多肽连接的酶
申请人前期利用宏基因组测序技术研究福建某地的干枯稻草微生态体系的功能基因组,通过对测序数据的拼接分析,发现在十几种不同基因片段的上游均含有类似的特殊DNA构造,以纤维素酶(具体是指内切葡聚糖酶,EC.3.2.1.4,纤维素酶系中的主要组分)基因为例,该特殊DNA构造如图1所示。在纤维素酶等十几种基因前端紧邻区均含有两个ORF(开放阅读框架),以纤维素酶基因为例所述特殊DNA构造包括一个长度为1362bp的X基因(其序列如SEQ ID NO:1所示)和长度为24bp的短肽基因(其序列如SEQ ID NO:9所示)。短肽基因编码的多肽序列为N’-MANCEHL-C’(如SEQ ID NO:10所示),依次对应于N’-甲硫氨酸-丙氨酸-天冬酰胺-半胱氨酸-谷氨酸-组氨酸-亮氨酸-C’这7个氨基酸,N’代表多肽链的N端,C’代表多肽链的C端。X基因和短肽基因功能未明,这两者共用一个启动子(图中启动子I),由于其在纤维素酶基因前端且紧邻纤维素酶基因,推测该基因构造产物是纤维素降解酶复合物组分。此外,在纤维素酶基因启动子(图中启动子II)和起始密码子之间还有一段9核苷酸的DNA短双链即5’-ATGATCCAG-3’(互补DNA链序列为3’-TACTAGGTC-5’,对应的转录序列为5’-AUGAUCCAG-3’的短RNA序列),也是伴随X基因和短肽基因一起出现的,在十几种基因起始密码子前均含有类似的短DNA双链,此处记其为前导DNA片段。
为了探究图1所示特殊基因构造(主要包括启动子I、X基因、短肽基因和前导DNA片段)在纤维素复合酶体系中的作用,对其连同纤维素酶基因进行基因克隆和蛋白表达:设计引物扩增图1所示的基因构造(含纤维素酶基因),构建重组质粒转入大肠杆菌工程菌进行外源表达,之后进行分离纯化,结果发现表达产物基本没有纤维素降解能力(包括内切葡聚糖酶活力)。利用实时荧光定量PCR检测到了纤维素酶基因的转录产物即其mRNA,而利用Western blot却检测不到对应的纤维素酶蛋白,检测出的蛋白条带大小符合的是X基因产物;此外,还检测到有N’-MANCEHL-C’多肽存在,表明多肽基因也被成功表达。总的来说,在构建的重组大肠杆菌外源表达体系中纤维素酶基因有转录成mRNA,但并没有翻译成纤维素酶蛋白,该结果显示纤维素酶mRNA的翻译过程被阻断了,然而相邻的X基因和前导DNA片段却能成功表达出相应的蛋白和多肽。。
进一步分析发现,对于导入图1所示纤维素酶复合基因构造的重组质粒的大肠杆菌工程菌体系来说,提取得到的纤维素基因的mRNA在变性RNA电泳上参照RNA Marker分析得到的长度和理论的不符,实际长度要大于理论长度。深入分析(Qubit4.0)发现,该mRNA其实是mRNA和多肽的复合物,该mRNA的5’端连接了一段短肽,通过RNase酶消化和质谱分析发现该短肽正是图1所示短肽基因的编码产物(相关分析方法和过程参见实施例2)。正常情况下,mRNA和多肽并不会自动连接,因此推测X基因表达产物是一种酶,可以催化特定mRNA和特定多肽的连接。需要进一步克隆X基因进行表达纯化,以便探究其特性。
实施例2 X基因的克隆表达和X蛋白性能探究
基于X基因序列(SEQ ID NO:1)设计引物5’-ATGCGGACGCGCCACAGC-3’和5’-CTACATCTGACGTCGAAGG-3’扩增X基因(参照常规PCR体系和条件,退火温度为51℃),利用日本Takara公司的重组蛋白大肠杆菌表达和纯化体系(pET Express & Purify Kits)按照说明书方法克隆表达X基因,并使用融合蛋白附带上的组氨酸标签对X蛋白(X基因编码表达产物)进行分离纯化,采用Qubit4.0测得最终纯化的X蛋白浓度为0.18μg/ml,其氨基酸序列如SEQ ID NO:2所示。由实施例1可知X蛋白可能是一种可以催化特定RNA和特定多肽连接的连接酶,鉴于X蛋白已成功实现外源表达和分离纯化了,因此可以进一步验证和研究其特性。由于短肽序列N’-MANCEHL-C’和短前导RNA单链序列5’-AUGAUCCAG-3’形式(据前文所述前导DNA片段和纤维素酶基因有被转录,其mRNA是存在的,由图1所示可知其5’端为短前导RNA序列,由前导DNA片段转录而成)是普遍存在的,因此推测X连接酶主要是识别短肽序列和短前导RNA序列并将这两者连接起来,从而阻断和短前导RNA连接的mRNA(如实施例1中的纤维素酶基因的mRNA)翻译成蛋白质的过程。
委托金斯瑞生物科技有限公司合成N’-MANCEHL-C’这一7个氨基酸的短肽P7(图1短肽基因编码产物),纯度不低于95%。同时合成5’-P-AUGAUCCAG-B-3’这一9个核糖核苷酸的短前导RNA单链R9(图1前导DNA片段转录产物,其5’末端A核糖核苷酸进行单磷酸化修饰,用P表示;本文中RNA链中的A是指腺嘌呤核糖核苷酸、U是指尿嘧啶核糖核苷酸,C是指胞嘧啶核糖核苷酸,G是指鸟嘌呤核糖核苷酸),在其3’末端核糖核苷酸G上修饰生物素(Biotin,用B表示),以便用包被链霉亲和素的磁珠对其进行分离。本文中提及的磷酸化修饰均指同天然单磷酸或三磷酸单核苷酸一样,修饰的磷酸基团连接于核糖核苷酸(或脱氧核糖核苷酸)五碳糖的第5位碳原子上;另外,三磷酸修饰也可适用,然而考虑到实际应用方便使用单磷酸即可,为简便起见下面不再具体一一指明;本文所述5’末端或3’末端核苷酸均是指相应末端的首个核苷酸即最末端的核苷酸。生物素与链霉亲和素的结合是目前自然界中已知的最强的非共价相互作用,常用于特定核酸或蛋白的分离纯化和分析。按表1在PCR管中配制X蛋白的混合反应体系,置于PCR仪中37℃下保温30min。反应体系中涉及的组分均用RNase-free水配制,耗材均经去RNase处理。由于短RNA单链R9的3’末端核糖核苷酸G带有生物素修饰,因此反应结束后采用美国赛默飞公司的链酶亲和素磁珠(DynabeadsMyOne T1)按照说明书方法捕获反应体系中的R9。捕获R9后,加入RNase I(美国赛默飞公司,可将RNA彻底消化为单核苷酸)按照说明书方法进行RNA消化。取RNA消化产物纯化后,送北京百泰克生物科技有限公司进行质谱分析。如果X蛋白能够识别短前导RNA单链R9和短肽序列P7并将这两者进行连接,则连接复合物经RNase I消化后将得到短肽序列P7和短前导RNA单链R9的5’末端核苷酸A的连接物,最后利用质谱通过分子量对其进行验证,具体原理和过程详见图2(图2中B代表生物素修饰)。
质谱结果显示出现对应N’-MANCEHL-A分子量的主峰(相对分子质量约为1146.1,-A中的A代表A核糖核苷酸),此外次峰中出现了对应C’-L-A分子量的峰(相对分子质量约为460.4,C’-L表示C末端氨基酸即L氨基酸,-A中的A代表A核糖核苷酸),然而并未发现有对应N’-M-A分子量的峰。主峰结果表明,R9和P7有被连接在一起;次峰结果确认,R9和P7的连接是R9的5’端核糖核苷酸A和P7的C’端氨基酸L之间以P-C磷碳键(具体构造为O=P-C=O构造,即磷氧双键P=O中的磷原子和碳氧原双键O=C中的碳原子共价连接,参见图3,为A核糖核苷酸的磷酸基团和L氨基酸的羧基脱水缩合而成)相互连接。综上可知,X蛋白可以催化R9和P7以共价键的方式进行连接,X蛋白是新发现的一种单链RNA肽连接酶,用缩写字符sRPlaseI表示(即one ligase for single-stranded RNA and polypeptide),其催化的RNA单链和多肽的特定连接产物用RP表示。
表1 X蛋白反应体系
组分 添加量
1μg/μL的合成RNA单链R9 1μL
1μg/μL的合成短肽P7 1μL
连接酶缓冲液(由pH为7.5的500mM Tris-Hcl、100mM Mg<sup>2+</sup>、10mM ATP和10mM DTT组成) 1μL
X蛋白 1μg
超纯水 补足至10μL
实施例3 单链RNA肽连接酶sRPlaseI的反应产物检测和酶学特性探究
实施例1和2表明,sRPlaseI是一种可催化特定单链RNA和特定多肽连接的连接酶,为了进一步探究其酶学特性,应该建立一种简便的连接反应测定方法。由于sRPlaseI连接酶催化的反应产物是RNA单链和多肽的共价连接(O=P-C=O构造磷碳键)复合物,因此可以尝试测定其吸收光谱特性以便尝试采用简便的分光光度法进行反应测定。取实施例2表1中反应产物以及单独的R9、P7和空白反应体系各3μl,采用美国Biotek公司的Epoch酶标仪在200nm-1000nm范围内分别进行全波长扫描,反应产物结果如图4所示。结果显示,RNA单链和多肽的连接反应复合物(记为RP)在351nm波长处出现了一个最大吸收,而R9、P7和空白反应体系均无此峰出现,表明351nm波长峰是连接复合物RP的特征吸收峰,其为O=P-C=O构造磷碳键特异性吸收所致。由于是RNA和多肽的连接产物,因此其在215nm、260nm和280nm左右波长处也分别出现了吸收峰,然而受反应体系影响,这些波长不宜做RP的测定波长。由此可知,351nm吸光度是测定sRPlaseI连接酶反应(产物分析法)的一种简便有效的方法。
为了探究sRPlaseI连接酶的底物特异性,尝试改变R9和/或P7片段。改变R9片段,包括减少和/或替换其中某些核糖核苷酸,则连接反应结束后体系在351nm处并无显著吸收峰,表明没有O=P-C=O构造磷碳键产物生成,即没有进行连接反应。同样的,改变P7片段,包括减少和/或替换其中某些氨基酸,则连接反应结束后体系在351nm处也无显著吸收峰,表明也没有O=P-C=O构造磷碳键产物生成,即没有进行连接反应。由此表明,sRPlaseI连接酶催化连接反应是要基于严格的R9和P7片段的识别,这也验证了实施例1中提到的十几种基因前面都出现有类似于R9和P7的基因构造,对于sRPlaseI连接酶而言R9和P7序列要是保守的,未发现与其基因相连的R9和P7对应基因的其它序列形式。然而,由于sRPlaseI连接酶介导的是R9的5’末端核糖核苷酸和P7的C末端氨基酸的连接,因此在保留R9和P7的基础上,延长R9的3’端核糖核苷酸链和/或P7的N端氨基酸链理论上并不会影响连接反应的进行。采用5’-P-AUGAUCCAG-Rn-3’(这里P表示单磷酸化修饰)和N’-Pm-MANCEHL-C’做为底物,其中Rn是与R9的3’端连接的一段单链RNA片段,尝试了3种不同长度和序列的片段R1、R2和R3(鉴于序列合成技术和成本,R1-R3分别选择谷胱甘肽、人胰岛素A链和人胰岛素B链相应的mRNA区域,谷胱甘肽的为虚拟mRNA序列),其核糖核苷酸序列分别如SEQ ID NO:11-SEQ ID NO:13(长度分别为9nt、63nt和90nt);Pm是与P7的N端连接的一段多肽片段,尝试了3种不同长度和序列的片段P1、P2和P3(P1-P3分别对应于R1-R3,分别是谷胱甘肽、人胰岛素A链和人胰岛素B链对应的肽链),其氨基酸序列分别如SEQ ID NO:14-16(长度分别为3aa、21aa和30aa),则总共采用了两种底物(RNA单链和多肽)的9种组合形式,参照表1进行连接反应,sRPlaseI连接酶介导的反应体系在351nm处均能检测到显著的吸收峰,表明有O=P-C=O构造磷碳键产物生成,即有进行连接反应。这也与实施例1中观察到的纤维素酶基因有转录然而并未翻译成蛋白的现象一致,其原因在于纤维素酶基因转录的长mRNA因其5’端连接有短前导RNA单链,则在sRPlaseI连接酶(图1特殊基因构造中纤维素酶紧邻的X基因的表达产物)作用下其5’端的短前导RNA单链R9连接上了P7,导致纤维素酶mRNA无法进行识别和翻译。
综上可知,sRPlaseI连接酶能够以5’末端起始含有完整R9且5’末端的A核糖核苷酸为磷酸化状态的特定RNA单链(即5’-P-R9-***-3’,P表示R9的5’末端核糖核苷酸为单磷酸化,***表示3’端的其它RNA序列)和C末端起始含有完整P7的特定多肽链为底物(即N’-***-P7-C’,***表示N端其它多肽序列),催化RNA单链和多肽链进行共价连接反应,具体是RNA的5’末端核糖核苷酸A和多肽的C末端氨基酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键来相互连接的。5’末端核糖核苷酸指的是5’末端首个核糖核苷酸。磷酸化形式核苷酸是指同天然单磷酸或三磷酸单核苷酸一样,修饰的或天然存在的磷酸基团连接于核糖核苷酸五碳糖的第5位碳原子上;另外,三磷酸修饰也可适用,然而考虑到实际应用方便使用单磷酸即可,为简便起见下面不再具体一一指明。
参照表1以R9和P7为底物,按照表2采用不同的缓冲液和温度探究sRPlaseI连接酶的最适反应缓冲体系和温度。缓冲液A和B是2种常用的连接酶缓冲液,缓冲液A由pH为7.5的500mM Tris-Hcl、100mM Mg2+、10mM ATP和10mM DTT组成;缓冲液B由pH为7.8的450mM Tris-Hcl、100mM Mg2+、80mM NaCl、20mMATP、8mMTriton X-100组成。sRPlaseI连接酶添加量为1μg,反应时间为30min。结束后取3μL反应产物,利用美国Biotek公司的Epoch酶标仪在351nm处测定其吸光度,结果如表2所示。从表2可知,在各个温度下相比于缓冲液B,缓冲液A体系下反应产物测得的吸光度均更高,表明缓冲液A更适合sRPlaseI连接酶。在缓冲液A组中,37℃下反应产物测得的吸光度最高(1.28),表明37℃是sRPlaseI连接酶的最适反应温度。此外,根据表2中结果可知,sRPlaseI连接酶的最适反应温度范围为30℃-40℃。采用前述5’-P-AUGAUCCAG-Rn-3’(P表示5’末端A核糖核苷酸为磷酸化)和N’-Pm-MANCEHL-C’做为底物,最适缓冲液和最适温度情况也跟R9和P7底物组一致。
表2 sRPlaseI连接酶在不同反应缓冲液体系和温度梯度下的反应活性
Figure 71942DEST_PATH_IMAGE002
在缓冲液A和37℃条件下,将反应时间延长至60min以及将sRPlaseI连接酶添加量增加至2μg,发现反应产物在351nm处的吸光度也是1.28,表明在缓冲液A和37℃条件下反应30min已经是进行了彻底的反应了。保持原体系和条件不变,将反应时间缩短为10min,发现反应产物在351nm处的吸光度也是1.28,因此10min即可充分进行反应了。保持原体系和条件不变,将sRPlaseI连接酶反应体系先在80℃下保温3min(80℃下温育基本反应体系15min后再加入sRPlaseI连接酶),再继续反应,则发现反应产物在351nm处的吸光度和空白对照(不添加sRPlaseI连接酶)无显著差异(空白对照为0.08,80℃预温育体系为0.13),表明反应被终止了,因此反应结束后可以在80℃下保温3min以彻底终止反应。
综上所述,本发明提供了一种可用于催化特定单链RNA和特定多肽共价连接的单链RNA肽连接酶sRPlaseI,其氨基酸序列如SEQ ID NO:2所示,对应的基因编码序列如SEQID NO:1所示;sRPlaseI酶可以识别5’末端起始为5’-AUGAUCCAG-3’序列且其5’末端核糖核苷酸A为磷酸化状态的特定RNA单链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化RNA单链5’末端的腺嘌呤核糖核苷酸A和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得单链RNA和多肽以共价键相互连接在一起。单链RNA和多肽的连接产物RP在351nm波长下有最大吸收峰,该峰为其特征吸收峰。sRPlaseI连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定RNA单链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.5的500mM Tris-Hcl、100mM Mg2+、10mM ATP和10mM DTT组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)去离子水,补足至所需体积。其中,特定RNA单链是指5’末端起始为5’-AUGAUCCAG-3’序列且其5’末端核糖核苷酸A为磷酸化状态的RNA单链,特定多肽是指C末端起始为N’-MANCEHL-C’这7肽的多肽链。sRPlaseI连接酶的最适反应的温度范围是30℃-40℃,连接反应时间为10min-15min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
实施例4 可催化特定DNA单链或特定DNA双链和特定多肽连接的DNA肽连接酶
除了单链RNA以外,生物体内以及分子生物学领域中常见的核酸形式还包括双链DNA和单链DNA,因此进一步的借助生物信息分析设计,对该单链RNA肽连接酶sRPlaseI的编码基因(即图1中的X基因,如SEQ ID NO:1所示序列)进行改造,以期构造出特定的DNA肽连接酶。通过生物信息分析,预测单链RNA肽连接酶sRPlaseI的底物结合位点和催化活性中心,重点通过定制化改变这些关键位点的编码序列获得系列改造基因,并参照实施例2中方法利用日本Takara公司的重组蛋白大肠杆菌表达和纯化体系(pET Express & PurifyKits)按照说明书方法克隆表达和分离纯化以获取改造酶。考虑到连接酶对底物的严谨性,因此两种底物中的多肽仍选择P7,而DNA单链(5’-P-ATGATCCAG-B-3’,记为sD9,P代表单磷酸化修饰,B代表生物素修饰)或DNA双链(5’-P-ATGATCCAG-B-3’的双链形式,互补链为3’-TACTAGGTC-P-5’,记为dD9,P代表单磷酸化修饰,B代表生物素修饰)则选择的是R9对应的DNA链。其中短单链DNA即sD9直接委托金斯瑞生物科技有限公司合成;而短双链DNA片段即dD9则先委托金斯瑞生物科技有限公司分别合成互补链,再将互补的两条单链DNA等量(1.5μg/μL)混合于退火体系缓冲液中,25℃下保温16h,之后纯化双链产物并采用Qubit4.0进行浓度测定,双链DNA的制备由公司完成。
按照表3配制改造酶反应体系,置于PCR仪中37℃下保温30min。将单链DNA和双链DNA与P7的反应产物分别记为sDP和dDP(合起来则记为DP)。由于单链RNA肽连接酶sRPlaseI可催化R9和P7形成含O=P-C=O构造磷碳键产物RP,该产物在351nm波长下有特征吸收。参照于此,经改造酶体系作用的DNA链和P7的反应产物进行全波长扫描,看其在351nm处或其它临近波长处是否有特征吸收峰,以此简便地筛选可用于连接sD9(或dD9)和P7的改造酶。在全波长扫描初筛的基础上,对于候选的改造酶体系,参照实施例2中方法,利用包被链霉亲和素的磁珠捕获带有生物素标记的DNA链(sD9或dD9即D9),再利用DNA核酸外切酶(可消化单链DNA和双链DNA)按照说明书中方法消化连接反应体系产物,纯化后送公司进行质谱检测分析。
表3 改造酶反应体系
组分 添加量
1μg/μL的DNA单链sD9或DNA双链片段dD9 1μL
1μg/μL的合成短肽P7 1μL
连接酶缓冲液(由pH为7.5的500mM Tris-Hcl、100mM Mg<sup>2+</sup>、10mM ATP和10mM DTT组成) 1μL
改造酶 1μg
超纯水 补足至10μL
通过对34种改造酶的筛选,发现候选的高反应活性的特定单链DNA多肽连接酶1种,记为sDPlaseI(即one ligase for single-stranded DNA and polypeptide),其基因序列如SEQ ID NO:3所示,其对应的氨基酸序列如SEQ ID NO:4所示;候选的高反应活性的特定双链DNA多肽连接酶2种,分别记为dDPlaseI(即ligase I for double-stranded DNAand polypeptide)和dDPlaseII(即ligase II for double-stranded DNA andpolypeptide),其基因序列分别如SEQ ID NO:5和SEQ ID NO:7所示,其对应的氨基酸序列分别如SEQ ID NO:6和SEQ ID NO:8所示。sDPlaseI、dDPlaseI和dDPlaseII酶反应体系的全波长扫描图谱分别如图5-7所示。3种DNA多肽连接酶反应体系产物在215nm、260nm和280nm左右波长处均出现了吸收峰,利用包被链霉亲和素的磁珠捕获含生物素标记的物质再行全波长扫描测量时,这3个波长的峰仍旧存在,这些正是DNA和多肽的特征吸收峰,也从侧面验证了有DNA和多肽复合物的存在。不同的是,sDPlaseI、dDPlaseI和dDPlaseII酶反应体系各自出现了独有的特征吸收波长,分别是358nm、360nm和372nm,这与实施例3中单链RNA多肽复合物RP的特征吸收波长351nm十分接近,很可能是O=P-C=O构造磷碳键的特征吸收峰,然而由于与L氨基酸形成磷碳键的核苷酸(核糖核苷酸或脱氧核糖核苷酸)及其周围环境不一致,因此导致特征吸收波长有略微的差异。在全波长扫描确定特征吸收峰以筛选候选DNA多肽连接酶体系的基础上,再通过质谱进行验证。
进一步的,sDPlaseI酶反应产物的质谱结果显示出现对应N’-MANCEHL-A分子量的主峰(相对分子质量为1130.2,-A中的A表示sD9的5’末端核苷酸即A脱氧核糖核苷酸),此外次峰中出现了对应C’-L-A分子量的峰(相对分子质量为444.4,C’-L表示P7的C末端氨基酸即L氨基酸,-A中的A表示sD9的5’末端核苷酸即A脱氧核糖核苷酸)。质谱结果表明,sD9和P7有被连接在一起,其连接是sD9的5’末端脱氧核糖核苷酸A和P7的C末端氨基酸L之间以O=P-C=O构造磷碳键相互连接。由此可知,sDPlaseI酶可以催化sD9和P7以共价键的方式进行连接,sDPlaseI酶是一种全新的单链DNA肽连接酶,其催化的DNA单链和多肽的连接产物用sDP表示。
对于dDPlaseI酶反应产物,其质谱结果显示出现对应N’-MANCEHL-A分子量的主峰(相对分子质量为1130.2,-A中的A表示dD9连接链的5’末端核苷酸即A脱氧核糖核苷酸),此外次峰中出现了对应C’-L-A分子量的峰(相对分子质量为444.4,C’-L表示P7的C末端氨基酸即L氨基酸,-A中的A表示dD9连接链的5’末端核苷酸即A脱氧核糖核苷酸)。需要指明的是,虽然短双链DNA片段dD9连接一端是A=T核苷酸对,但在质谱条件下,A=T之间碱基互补配对的氢键将被打开,只保留和P7共价连接的脱氧核糖核苷酸A。质谱结果表明,dD9和P7有被连接在一起,其连接是dD9连接链上的5’末端脱氧核糖核苷酸A和P7的C末端氨基酸L之间以O=P-C=O构造磷碳键相互连接。由此可知,dDPlaseI酶可以催化dD9和P7以共价键的方式进行连接,dDPlaseI酶是一种全新的双链DNA肽连接酶,其催化的DNA双链和多肽的连接产物用dDPI表示。
对于dDPlaseII酶反应产物,其质谱结果显示出现对应N’-MANCEHL-C分子量的主峰(相对分子质量为1106.1,-C中的C表示dD9连接链的5’末端核苷酸即C脱氧核糖核苷酸),此外次峰中出现了对应C’-L-C分子量的峰(相对分子质量为420.4,C’-L表示P7的C末端氨基酸即L氨基酸,-C中的C表示dD9连接链的5’末端核苷酸即C脱氧核糖核苷酸)。需要指明的是,虽然短双链DNA片段dD9连接一端是C≡G核苷酸对,但在质谱条件下,C≡G之间碱基互补配对的氢键将被打开,只保留和P7共价连接的脱氧核糖核苷酸C。质谱结果表明,dD9和P7有被连接在一起,dD9和P7的连接是dD9其中一条链上的5’末端脱氧核糖核苷酸C和P7的C末端氨基酸L之间以O=P-C=O构造磷碳键相互连接。由此可知,dDPlaseII酶可以催化dD9和P7以共价键的方式进行连接,dDPlaseII酶是一种全新的双链DNA肽连接酶,其催化的DNA双链和多肽的连接产物用dDPII表示。
dDPlaseI酶和dDPlaseII酶均可以催化dD9和P7以O=P-C=O构造磷碳键的共价键方式进行连接,区别在于dDPlaseI酶催化的是dD9其中一条链(即5’-P-ATGATCCAG-3’链)上的5’末端脱氧核糖核苷酸A和P7的C末端氨基酸L之间以O=P-C=O构造磷碳键相互连接,而dDPlaseII酶催化的则是dD9另外一条链(5’-P-CTGGATCAT-3’链,即5’-P-ATGATCCAG-3’链的互补链)上的5’末端脱氧核糖核苷酸C和P7的C末端氨基酸L之间以O=P-C=O构造磷碳键相互连接,具体如图8所示。这样实际应用时例如用于核酸标记时,DNA双链任何一条链就均可通过本发明连接酶dDPlaseI或dDPlaseII实现标记了;又例如用于阻止基因表达或调控时,DNA双链中无论何链的转录或调控表达产物均可通过本发明连接酶dDPlaseI或dDPlaseII实现阻止了。
实施例5 3种DNA多肽连接酶的酶学特性探究
为了探究sDPlaseI、dDPlaseI和dDPlaseII这3种DNA多肽连接酶的底物特异性,尝试改变sD9(或dD9)和/或P7片段。改变sD9(或dD9)片段,包括减少和/或替换其中某些脱氧核糖核苷酸,则连接反应结束后体系在358nm(或360nm或372nm)处并无显著吸收峰,表明没有O=P-C=O构造磷碳键产物生成,即没有进行连接反应。同样的,改变P7片段,包括减少和/或替换其中某些氨基酸,则连接反应结束后体系在358nm(或360nm或372nm)处也无显著吸收峰,表明也没有O=P-C=O构造磷碳键产物生成,即没有进行连接反应。由此表明,sDPlaseI、dDPlaseI和dDPlaseII连接酶催化连接反应是要基于严格的D9(即sD9或dD9)和P7片段的识别,这同单链RNA多肽连接酶sRPlaseI具有严格的底物序列要求是一致的,即这3种DNA多肽连接酶要求D9和P7识别序列要是保守的。然而,由于3种DNA多肽连接酶介导的都是D9的5’末端脱氧核糖核苷酸和P7的C末端氨基酸的连接,因此在保留D9和P7的基础上,延长D9非连接侧的3’端脱氧核糖核苷酸链和/或P7的N端氨基酸链理论上并不会影响连接反应的进行。对于单链DNA多肽连接酶sDPlaseI体系,采用5’-P-ATGATCCAG-Dn-3’的DNA单链(这里P表示磷酸化修饰)和N’-Pm-MANCEHL-C’做为底物;对于双链DNA多肽连接酶dDPlaseI体系,采用5’-P-ATGATCCAG-Dn-3’的DNA双链(其互补链为3’-TACTAGGTC-Dn’-5’,Dn’为Dn的互补链)和N’-Pm-MANCEHL-C’做为底物;对于双链DNA多肽连接酶dDPlaseII体系,采用5’-P-CTGGATCAT-Dn-3’ 的DNA双链(其互补链为3’-GACCTAGTA-Dn’-5’,Dn’为Dn的互补链)和N’-Pm-MANCEHL-C’做为底物,其中Dn是D9非酶连接侧的3’端连接的一段DNA片段,同单链RNA多肽连接酶探究一样,尝试了3种不同长度和序列的片段D1、D2和D3(D1、D2和D3分别与R1、R2和R3相对应,即Dn是Rn的DNA形式),其序列分别如SEQ ID NO:17-19;Pm是与P7的N端连接的一段多肽片段,尝试了3种不同长度和序列的片段P1、P2和P3(分别对应于D1-D3的编码多肽产物,分别为谷胱甘肽、人胰岛素A链和人胰岛素B链),其序列分别如SEQID NO:14-16,对于3种DNA多肽连接酶中的每一种,均尝试了两种底物的9种组合形式,sDPlaseI、dDPlaseI和dDPlaseII连接酶介导的各自的反应体系分别在358nm、360nm和372nm处均始终能检测到显著的吸收峰,则表明均有O=P-C=O构造磷碳键产物生成,即有进行连接反应。
综上可知,sDPlaseI连接酶能够以5’末端起始为完整sD9且其5’末端脱氧核糖核苷酸A为磷酸化形式的DNA单链(即5’-P-ATGATCCAG-***-3’,***表示3’端的其它DNA序列)和C末端起始为完整P7的多肽链为底物,催化DNA单链和多肽链进行共价连接反应;dDPlaseI连接酶能够以5’末端起始为完整dD9构造且其5’末端脱氧核糖核苷酸A为磷酸化形式的DNA双链(即5’-P-ATGATCCAG-***-3’所对应的DNA双链,***表示3’端的其它DNA序列)和C末端起始为完整P7的多肽链为底物,催化DNA双链和多肽链进行共价连接反应;dDPlaseII连接酶能够以5’末端起始为完整dD9构造且其5’末端脱氧核糖核苷酸C为磷酸化形式的DNA双链(即5’-P-CTGGATCAT-***-3’所对应的DNA双链,***表示3’端其它DNA序列)和C末端起始为完整P7的多肽链为底物,催化DNA双链和多肽链进行共价连接反应。5’末端脱氧核糖核苷酸指的是5’末端首个脱氧核糖核苷酸。磷酸化形式脱氧核糖核苷酸是指同天然单磷酸或三磷酸单脱氧核糖核苷酸一样,修饰的或天然存在的磷酸基团连接于脱氧核糖核苷酸五碳糖的第5位碳原子上;另外,三磷酸修饰也可适用,然而考虑到实际应用方便使用单磷酸即可,为简便起见下面不再具体一一指明。
参照表3以D9(sD9或dD9)和P7为底物,按照表4采用不同的缓冲液和温度在各自的特征吸收波长处探究sDPlaseI、dDPlaseI和dDPlaseII这3种连接酶的最适反应缓冲体系和温度。同单链RNA多肽连接酶sRPlaseI探究,仍采用缓冲液A和B这2种常用的连接酶缓冲液。DNA多肽连接酶添加量均为1μg,反应时间均为30min。结束后取3μL反应产物,利用美国Biotek公司的Epoch酶标仪根据使用的酶在358nm(sDPlaseI连接酶反应体系)、360nm(dDPlaseI连接酶反应体系)和372nm(dDPlaseII连接酶反应体系)处测定其吸光度,结果如表4所示。从表4可知,对于sDPlaseI连接酶,在各个温度下相比于缓冲液B,缓冲液A体系反应产物测得的吸光度均更高,表明缓冲液A更适合sDPlaseI连接酶;而对于dDPlaseI和dDPlaseII连接酶,在各个温度下相比于缓冲液A,缓冲液B体系反应产物测得的吸光度均更高,表明缓冲液B均更适合dDPlaseI和dDPlaseII连接酶。对于sDPlaseI连接酶,其在缓冲液A组中,37℃下反应产物测得的吸光度最高(1.37),表明37℃是sDPlaseI连接酶的最适反应温度。对于dDPlaseI和dDPlaseII连接酶,其在缓冲液B组中,均是40℃下反应产物测得的吸光度最高(分别为1.44和1.48),表明40℃是dDPlaseI和dDPlaseII连接酶的最适反应温度。此外,根据表4结果可知,sDPlaseI连接酶的最适反应温度范围为30℃-40℃,而dDPlaseI和dDPlaseII连接酶的最适反应温度范围均为35℃-45℃。
同底物特异性探究,对于单链DNA多肽连接酶sDPlaseI体系,采用5’-P-ATGATCCAG-Dn-3’的DNA单链和N’-Pm-MANCEHL-C’做为底物;对于双链DNA多肽连接酶dDPlaseI体系,采用5’-P-ATGATCCAG-Dn-3’的DNA双链和N’-Pm-MANCEHL-C’做为底物;对于双链DNA多肽连接酶dDPlaseII体系,采用5’-P-CTGGATCAT-Dn-3’ 的DNA双链和N’-Pm-MANCEHL-C’做为底物,对于这3种DNA多肽连接酶,其最适缓冲液和最适温度情况也跟D9和P7底物组一致。
表4 3种DNA多肽连接酶在不同反应缓冲液体系和温度梯度下的反应活性
Figure 989082DEST_PATH_IMAGE004
参照实施例3中sRPlaseI连接酶的反应条件探究,通过改变反应体系中酶的添加量和反应时间发现,在缓冲液A和37℃条件下(参照表3体系),添加1μg的sDPlaseI连接酶10min即可充分进行连接反应了;在缓冲液B和40℃条件下(参照表3体系),添加1μg的dDPlaseI连接酶(或dDPlaseII连接酶)需要8min即可充分进行连接反应。对于sDPlaseI、dDPlaseI和dDPlaseII连接酶,80℃下保温3min均可彻底终止反应。
综上所述,本发明提供了一种可用于催化特定单链DNA和特定多肽共价连接的单链DNA肽连接酶sDPlaseI,其氨基酸序列如SEQ ID NO:4所示,对应的基因编码序列如SEQID NO:3所示;sDPlaseI酶可以识别5’末端起始为5’-ATGATCCAG-3’序列且其5’末端脱氧核糖核苷酸A为磷酸化状态的特定DNA单链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化DNA单链5’末端的腺嘌呤脱氧核糖核苷酸A和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得单链DNA和多肽以共价键相互连接在一起。单链DNA和多肽连接产物sDP在358nm波长处有最大吸收峰,该峰为其特征吸收峰。sDPlaseI连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定DNA单链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.5的500mM Tris-Hcl、100mM Mg2+、10mM ATP和10mM DTT组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)去离子水,补足至所需体积。其中,特定DNA单链是指5’末端起始为5’-ATGATCCAG-3’序列且其5’末端脱氧核糖核苷酸A为磷酸化状态的DNA单链,特定多肽是指C末端起始为N’-MANCEHL-C’这7肽的多肽链。sDPlaseI连接酶的最适反应的温度范围是30℃-40℃,连接反应时间为5min-15min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
本发明还提供了一种可用于催化特定双链DNA和特定多肽共价连接的双链DNA肽连接酶dDPlaseI,其氨基酸序列如SEQ ID NO:6所示,对应的基因编码序列如SEQ ID NO:5所示;dDPlaseI酶可以识别5’末端起始为5’-ATGATCCAG-3’双链序列且该5’末端脱氧核糖核苷酸A为磷酸化状态的特定DNA双链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化DNA双链5’末端的腺嘌呤脱氧核糖核苷酸A和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得双链DNA和多肽以共价键相互连接在一起。双链DNA和多肽连接产物dDPI在360nm波长处有最大吸收峰,该峰为其特征吸收峰。dDPlaseI连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定DNA双链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.8的450mM Tris-Hcl、100mM Mg2+、80mM NaCl、20mMATP和8mMTriton X-100组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)去离子水,补足至所需体积。其中,特定DNA双链是指5’末端起始为5’-ATGATCCAG-3’双链序列且该5’末端脱氧核糖核苷酸A为磷酸化状态的DNA双链,特定多肽是指C末端以N’-MANCEHL-C’这7肽为起始的多肽链。dDPlaseI连接酶的最适反应的温度范围是35℃-45℃,连接反应时间为3min-10min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
本发明还提供了另外一种可用于催化特定双链DNA和特定多肽共价连接的双链DNA肽连接酶dDPlaseII,其氨基酸序列如SEQ ID NO:8所示,对应的基因编码序列如SEQ IDNO:7所示;dDPlaseII酶可以识别5’末端起始为5’-CTGGATCAT-3’双链序列且该5’末端脱氧核糖核苷酸C为磷酸化状态的特定DNA双链和C末端起始为N’-MANCEHL-C’这7肽的特定多肽链,并催化DNA双链5’末端的胞嘧啶脱氧核糖核苷酸C和多肽链C末端的亮氨酸L之间发生脱水缩合反应形成O=P-C=O构造磷碳键,使得双链DNA和多肽以共价键相互连接在一起。双链DNA和多肽连接产物dDPII在372nm波长处有最大吸收峰,该峰为其特征吸收峰。dDPlaseII连接酶的反应体系为:(1)1ng/μL-100ng/μL的特定DNA双链;(2)1ng/μL-100ng/μL的特定多肽;(3)连接酶缓冲液,由pH为7.8的450mM Tris-Hcl、100mM Mg2+、80mM NaCl、20mMATP和8mMTriton X-100组成,每1μL反应体系中添加0.1μL的连接酶缓冲液;(4)去离子水,补足至所需体积。其中,特定DNA双链是指5’末端起始为5’-CTGGATCAT-3’双链序列且该5’末端脱氧核糖核苷酸C为磷酸化状态的DNA双链,特定多肽是指C末端以N’-MANCEHL-C’这7肽为起始的多肽链。dDPlaseII连接酶的最适反应的温度范围是35℃-45℃,连接反应时间为3min-10min,连接反应结束后可将反应体系置于80℃温度下保温3min即可完全终止反应。
综上可知,本发明提供了4种全新的核酸多肽连接酶,包括1种特定的单链RNA肽连接酶sRPlaseI、1种特定的单链DNA肽连接酶sDPlaseI以及2种特定的双链DNA肽连接酶dDPlaseI和dDPlaseII,这些核酸肽连接酶可以作为基因工程和基因分析的工具酶,在核酸标记和核酸分析等领域中具有巨大的应用前景。
序列表
<110> 福建晨欣科生物科技有限公司
<120> 一种单链RNA肽连接酶sRPlaseI及其使用方法
<160> 19
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1362
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atgcggacgc gccacagcag aactctgcta ctcgagcatc ttgccacaga aagacgacgt 60
ttagctccgt ggaacatagg gtccgcttca acaagacact tgcttctaga caagagtccc 120
tctagaaatc ccttccagtc tatatgttac tggggccaag aattggtcac cggcgggaat 180
cttacattga gtaacgggca gctccgatca cagagatatt ggcacacctt gagttcgacg 240
cccatcctcc gaatctgtat gagatcctgc ttctccttac gttctccgaa actacagttg 300
cgtccgatac cagttttatg tttcttcatg ggagcgacca atatcagttt acgcttcgca 360
agccaaggga cggtggatat agttcatagt gttgaacgtt ccgagagtca gtcccgcacc 420
tacgtgtttt tggaactgtg ggccttcggg ttttacacag cctttggttt cagcatgcta 480
ttagtctcca ccttggaggc acacctaatc acggtaaagg gtgatggcct aatacgttgg 540
gatgtagcgc gctccttccg gtcaggtcac gaggatggag cgtgtcttac acgcgatccg 600
tgcggtccgc agtttgcgtc tgacgactac gagccgcgtt cttgcctacc ccagatgcta 660
tcggcgagag ggggtcccgg ttcgtttatc gttgtgtatg gttgtcattg ggctcaattg 720
cggattcagg cggggctagc aaaccaagtg ttgagtgttt gtcttatttg taaggcatat 780
atgatctcag agtttttgtc catacctaac cattcctatt acttgcgcgc gccatgtgaa 840
caaggtaaaa tgttgataga tgcgaggcac ctttggctac gggtagagcg gctgaattct 900
atcattgcag gtctggcatc acttcgtaag cgaggtaata ctcgcaccag cttgaactca 960
atccttttat ttagtaagga tcaacagtat aaaatgcggc gcgccgcact gagtatacta 1020
ctatattggg gctatttcac agtccgcgca tcctgcgata atcttgtggc cactctacgg 1080
aaagaccccc gggaatacga ttcggcgact gggccgtcga aactttgtca gcccaaagct 1140
catccctgtc atccgatgca aatgtacctg agggactggg caggcaaatt aagagcaacg 1200
aagcggccag acaggggcgc ccaacaagaa catgcggtga accccgccgg ctaccatcaa 1260
atgcagagtg caaggttggt tgcgccttta accccgtccg cccagcttac tgagcgtgat 1320
tgtacaggaa aggttgggct tgaccttcga cgtcagatgt ag 1362
<210> 2
<211> 453
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Arg Thr Arg His Ser Arg Thr Leu Leu Leu Glu His Leu Ala Thr
1 5 10 15
Glu Arg Arg Arg Leu Ala Pro Trp Asn Ile Gly Ser Ala Ser Thr Arg
20 25 30
His Leu Leu Leu Asp Lys Ser Pro Ser Arg Asn Pro Phe Gln Ser Ile
35 40 45
Cys Tyr Trp Gly Gln Glu Leu Val Thr Gly Gly Asn Leu Thr Leu Ser
50 55 60
Asn Gly Gln Leu Arg Ser Gln Arg Tyr Trp His Thr Leu Ser Ser Thr
65 70 75 80
Pro Ile Leu Arg Ile Cys Met Arg Ser Cys Phe Ser Leu Arg Ser Pro
85 90 95
Lys Leu Gln Leu Arg Pro Ile Pro Val Leu Cys Phe Phe Met Gly Ala
100 105 110
Thr Asn Ile Ser Leu Arg Phe Ala Ser Gln Gly Thr Val Asp Ile Val
115 120 125
His Ser Val Glu Arg Ser Glu Ser Gln Ser Arg Thr Tyr Val Phe Leu
130 135 140
Glu Leu Trp Ala Phe Gly Phe Tyr Thr Ala Phe Gly Phe Ser Met Leu
145 150 155 160
Leu Val Ser Thr Leu Glu Ala His Leu Ile Thr Val Lys Gly Asp Gly
165 170 175
Leu Ile Arg Trp Asp Val Ala Arg Ser Phe Arg Ser Gly His Glu Asp
180 185 190
Gly Ala Cys Leu Thr Arg Asp Pro Cys Gly Pro Gln Phe Ala Ser Asp
195 200 205
Asp Tyr Glu Pro Arg Ser Cys Leu Pro Gln Met Leu Ser Ala Arg Gly
210 215 220
Gly Pro Gly Ser Phe Ile Val Val Tyr Gly Cys His Trp Ala Gln Leu
225 230 235 240
Arg Ile Gln Ala Gly Leu Ala Asn Gln Val Leu Ser Val Cys Leu Ile
245 250 255
Cys Lys Ala Tyr Met Ile Ser Glu Phe Leu Ser Ile Pro Asn His Ser
260 265 270
Tyr Tyr Leu Arg Ala Pro Cys Glu Gln Gly Lys Met Leu Ile Asp Ala
275 280 285
Arg His Leu Trp Leu Arg Val Glu Arg Leu Asn Ser Ile Ile Ala Gly
290 295 300
Leu Ala Ser Leu Arg Lys Arg Gly Asn Thr Arg Thr Ser Leu Asn Ser
305 310 315 320
Ile Leu Leu Phe Ser Lys Asp Gln Gln Tyr Lys Met Arg Arg Ala Ala
325 330 335
Leu Ser Ile Leu Leu Tyr Trp Gly Tyr Phe Thr Val Arg Ala Ser Cys
340 345 350
Asp Asn Leu Val Ala Thr Leu Arg Lys Asp Pro Arg Glu Tyr Asp Ser
355 360 365
Ala Thr Gly Pro Ser Lys Leu Cys Gln Pro Lys Ala His Pro Cys His
370 375 380
Pro Met Gln Met Tyr Leu Arg Asp Trp Ala Gly Lys Leu Arg Ala Thr
385 390 395 400
Lys Arg Pro Asp Arg Gly Ala Gln Gln Glu His Ala Val Asn Pro Ala
405 410 415
Gly Tyr His Gln Met Gln Ser Ala Arg Leu Val Ala Pro Leu Thr Pro
420 425 430
Ser Ala Gln Leu Thr Glu Arg Asp Cys Thr Gly Lys Val Gly Leu Asp
435 440 445
Leu Arg Arg Gln Met
450
<210> 3
<211> 1359
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atgcggacgc gccacagcag aactctgcta ctcgagcatc ttgccacaga aagacgacgt 60
ttagctccgt ggaacatagg gtccgcttca acaagacact tgcttctaga caagagtccc 120
tctagaaatc ccttccagtc tatatgttac tggggccaag aattggtcac cggcgggaat 180
cttacattga gtaacgggca gctccgatca cagagatatt ggcacacctt gagttcgacg 240
cccatcctcc gaatctgtat gagatcctgc ttctccttac gttctccgaa actacagttg 300
cgtccgatac cagttttatg tttcttcatg ggagcgagca acagtttacg cttcgcaagc 360
caagggacgg tggatatagt tcatagtgtt gaacgttccg agagtcagtc ccgcacctac 420
gtgtttttgg aactgtgggc cttcgggttt tacacagcct ttggtttcag catgctatta 480
gtctccacct tggaggcaca cctaatcacg gtaaagggtg atggcctaat acgttgggat 540
gtagcgcgct ccttccggtc aggtcacgag gatggagcgt gtcttacacg cgatccgtgc 600
ggtccgcagt ttgcgtctga cgactacgag ccgcgttctt gcctacccca gatgctatcg 660
gcgagagggg gtcccggttc gtttaccgat gtgtatggtt gtcattgggc tcaattgcgg 720
attcaggcgg ggctagcaaa ccaagtgttg agtgtttgtc ttatttgtaa ggcatatatg 780
atctcagagt ttttgtccat acctaaccat tcctattact tgcgcgcgcc atgtgaacaa 840
ggtaaaatgt tgatagatgc gaggcacctt tggctacggg tagagcggct gaattctatc 900
attgcaggtc tggcatcact tcgtaagcga ggtaatactc gcaccagctt gaactcaatc 960
cttttattta gtaaggatca acagtataaa atgcggcgcg ccgcactgag tatactacta 1020
tattggggct atttcacagt ccgcgcatcc tgcgataatc ttgtggccac tctacggaaa 1080
gacccccggg aatacgattc ggcgactggg ccgtcgaaac tttgtcagcc caaagctcat 1140
ccctgtcatc cgatgcaaat gtacctgagg gactgggcag gcaaattaag agcaacgaag 1200
cggccagaca ggggcgccca acaagaacat gcggtgaacc ccgccggcta ccatcaaatg 1260
cagagtgcaa ggttggttgc gcctttaacc ccgtccgccc agcttactga gcgtgattgt 1320
acaggaaagg ttgggcttga ccttcgacgt cagatgtag 1359
<210> 4
<211> 452
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Arg Thr Arg His Ser Arg Thr Leu Leu Leu Glu His Leu Ala Thr
1 5 10 15
Glu Arg Arg Arg Leu Ala Pro Trp Asn Ile Gly Ser Ala Ser Thr Arg
20 25 30
His Leu Leu Leu Asp Lys Ser Pro Ser Arg Asn Pro Phe Gln Ser Ile
35 40 45
Cys Tyr Trp Gly Gln Glu Leu Val Thr Gly Gly Asn Leu Thr Leu Ser
50 55 60
Asn Gly Gln Leu Arg Ser Gln Arg Tyr Trp His Thr Leu Ser Ser Thr
65 70 75 80
Pro Ile Leu Arg Ile Cys Met Arg Ser Cys Phe Ser Leu Arg Ser Pro
85 90 95
Lys Leu Gln Leu Arg Pro Ile Pro Val Leu Cys Phe Phe Met Gly Ala
100 105 110
Ser Asn Ser Leu Arg Phe Ala Ser Gln Gly Thr Val Asp Ile Val His
115 120 125
Ser Val Glu Arg Ser Glu Ser Gln Ser Arg Thr Tyr Val Phe Leu Glu
130 135 140
Leu Trp Ala Phe Gly Phe Tyr Thr Ala Phe Gly Phe Ser Met Leu Leu
145 150 155 160
Val Ser Thr Leu Glu Ala His Leu Ile Thr Val Lys Gly Asp Gly Leu
165 170 175
Ile Arg Trp Asp Val Ala Arg Ser Phe Arg Ser Gly His Glu Asp Gly
180 185 190
Ala Cys Leu Thr Arg Asp Pro Cys Gly Pro Gln Phe Ala Ser Asp Asp
195 200 205
Tyr Glu Pro Arg Ser Cys Leu Pro Gln Met Leu Ser Ala Arg Gly Gly
210 215 220
Pro Gly Ser Phe Thr Asp Val Tyr Gly Cys His Trp Ala Gln Leu Arg
225 230 235 240
Ile Gln Ala Gly Leu Ala Asn Gln Val Leu Ser Val Cys Leu Ile Cys
245 250 255
Lys Ala Tyr Met Ile Ser Glu Phe Leu Ser Ile Pro Asn His Ser Tyr
260 265 270
Tyr Leu Arg Ala Pro Cys Glu Gln Gly Lys Met Leu Ile Asp Ala Arg
275 280 285
His Leu Trp Leu Arg Val Glu Arg Leu Asn Ser Ile Ile Ala Gly Leu
290 295 300
Ala Ser Leu Arg Lys Arg Gly Asn Thr Arg Thr Ser Leu Asn Ser Ile
305 310 315 320
Leu Leu Phe Ser Lys Asp Gln Gln Tyr Lys Met Arg Arg Ala Ala Leu
325 330 335
Ser Ile Leu Leu Tyr Trp Gly Tyr Phe Thr Val Arg Ala Ser Cys Asp
340 345 350
Asn Leu Val Ala Thr Leu Arg Lys Asp Pro Arg Glu Tyr Asp Ser Ala
355 360 365
Thr Gly Pro Ser Lys Leu Cys Gln Pro Lys Ala His Pro Cys His Pro
370 375 380
Met Gln Met Tyr Leu Arg Asp Trp Ala Gly Lys Leu Arg Ala Thr Lys
385 390 395 400
Arg Pro Asp Arg Gly Ala Gln Gln Glu His Ala Val Asn Pro Ala Gly
405 410 415
Tyr His Gln Met Gln Ser Ala Arg Leu Val Ala Pro Leu Thr Pro Ser
420 425 430
Ala Gln Leu Thr Glu Arg Asp Cys Thr Gly Lys Val Gly Leu Asp Leu
435 440 445
Arg Arg Gln Met
450
<210> 5
<211> 1365
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgcggacgc gccacagcag aactctgcta ctcgagcatc ttgccacaga aagacgacgt 60
ttagctccgt ggaacatagg gtccgcttca acaagacact tgcttctaga caagagtccc 120
tctagaaatc ccttccagtc tatatgttac tggggccaag aattggtcac cggcgggaat 180
cttacattga gtaacgggca gctccgatca cagagatatt ggcacacctt gagttcgacg 240
cccatcctcc gaatctgtat gagatcctgc ttctccttac gttctccgaa actacagttg 300
cgtccgatac cagttttatg tttcttcatg ggaccgagca aaagtttacg cttcgcaagc 360
caagggacgg tggatatagt tcatagtgtt gaacgttccg agagtcagtc ccgcacctac 420
gtgtttttgg aactgtgggc cttcgggttt tacacagcct ttggtttcag catgctatta 480
gtctccacct tggaggcaca cctaatcacg gtaaagggtg atggcctaat acgttgggat 540
gtagcgcgct ccttccggtc aggtcacgag gatggagcgt gtcttacacg cgatccgtgc 600
ggtccgcagt ttgcgtctga cgactacgag ccgcgttctt gcctacccca gatgctatcg 660
gcgagagggg gtcccgtttc gtttaccgat gtgtatggtt gtcattgggc tcaattgcgg 720
attcaggcgg ggctagcaaa ccaagtgttg agtgtttgtc ttatttgtaa ggcatatatg 780
atctcagagt ttttgtccat acctaaccat tcctattact tgcgcgcgcc atgtgaacaa 840
ggtaaaatgt tgatagatgc gaggcacctt tggctacggg tagagcggct gaattctatc 900
attgcaggtc tggcatcact tcgtaagcga ggtaatactc gcaccagctt gaactcaatc 960
cttttattta gtaaggatca acagtataaa atgcggcgcg ccgcactgag tatactacta 1020
tattggggct atttcacagt ccgcgcatcc tgcgataatc ttgtggccac tctacggaaa 1080
gacccccggg aatacgattc ggcgactggg ccgtcgaaac tttgtcagcc caaagctcat 1140
ccctgtcatc cgatgcaaat gtacctgagg gactgggcag gcaaattaag agcaacgaag 1200
cggccagaca ggggcgccca acaagaacat gcggtgaacc ccgccggcta ccatcaaatg 1260
cagagtgcaa ggttggttgc gcctttaacc ccgtccgccc agcttactga gcgcagccac 1320
gattgtacag gaaaggttgg gcttgacctt cgacgtcaga tgtag 1365
<210> 6
<211> 454
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Arg Thr Arg His Ser Arg Thr Leu Leu Leu Glu His Leu Ala Thr
1 5 10 15
Glu Arg Arg Arg Leu Ala Pro Trp Asn Ile Gly Ser Ala Ser Thr Arg
20 25 30
His Leu Leu Leu Asp Lys Ser Pro Ser Arg Asn Pro Phe Gln Ser Ile
35 40 45
Cys Tyr Trp Gly Gln Glu Leu Val Thr Gly Gly Asn Leu Thr Leu Ser
50 55 60
Asn Gly Gln Leu Arg Ser Gln Arg Tyr Trp His Thr Leu Ser Ser Thr
65 70 75 80
Pro Ile Leu Arg Ile Cys Met Arg Ser Cys Phe Ser Leu Arg Ser Pro
85 90 95
Lys Leu Gln Leu Arg Pro Ile Pro Val Leu Cys Phe Phe Met Gly Pro
100 105 110
Ser Lys Ser Leu Arg Phe Ala Ser Gln Gly Thr Val Asp Ile Val His
115 120 125
Ser Val Glu Arg Ser Glu Ser Gln Ser Arg Thr Tyr Val Phe Leu Glu
130 135 140
Leu Trp Ala Phe Gly Phe Tyr Thr Ala Phe Gly Phe Ser Met Leu Leu
145 150 155 160
Val Ser Thr Leu Glu Ala His Leu Ile Thr Val Lys Gly Asp Gly Leu
165 170 175
Ile Arg Trp Asp Val Ala Arg Ser Phe Arg Ser Gly His Glu Asp Gly
180 185 190
Ala Cys Leu Thr Arg Asp Pro Cys Gly Pro Gln Phe Ala Ser Asp Asp
195 200 205
Tyr Glu Pro Arg Ser Cys Leu Pro Gln Met Leu Ser Ala Arg Gly Gly
210 215 220
Pro Val Ser Phe Thr Asp Val Tyr Gly Cys His Trp Ala Gln Leu Arg
225 230 235 240
Ile Gln Ala Gly Leu Ala Asn Gln Val Leu Ser Val Cys Leu Ile Cys
245 250 255
Lys Ala Tyr Met Ile Ser Glu Phe Leu Ser Ile Pro Asn His Ser Tyr
260 265 270
Tyr Leu Arg Ala Pro Cys Glu Gln Gly Lys Met Leu Ile Asp Ala Arg
275 280 285
His Leu Trp Leu Arg Val Glu Arg Leu Asn Ser Ile Ile Ala Gly Leu
290 295 300
Ala Ser Leu Arg Lys Arg Gly Asn Thr Arg Thr Ser Leu Asn Ser Ile
305 310 315 320
Leu Leu Phe Ser Lys Asp Gln Gln Tyr Lys Met Arg Arg Ala Ala Leu
325 330 335
Ser Ile Leu Leu Tyr Trp Gly Tyr Phe Thr Val Arg Ala Ser Cys Asp
340 345 350
Asn Leu Val Ala Thr Leu Arg Lys Asp Pro Arg Glu Tyr Asp Ser Ala
355 360 365
Thr Gly Pro Ser Lys Leu Cys Gln Pro Lys Ala His Pro Cys His Pro
370 375 380
Met Gln Met Tyr Leu Arg Asp Trp Ala Gly Lys Leu Arg Ala Thr Lys
385 390 395 400
Arg Pro Asp Arg Gly Ala Gln Gln Glu His Ala Val Asn Pro Ala Gly
405 410 415
Tyr His Gln Met Gln Ser Ala Arg Leu Val Ala Pro Leu Thr Pro Ser
420 425 430
Ala Gln Leu Thr Glu Arg Ser His Asp Cys Thr Gly Lys Val Gly Leu
435 440 445
Asp Leu Arg Arg Gln Met
450
<210> 7
<211> 1365
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atgcggacgc gccacagcag aactctgcta ctcgagcatc ttgccacaga aagacgacgt 60
ttagctccgt ggaacatagg gtccgcttca acaagacact tgcttctaga caagagtccc 120
tctagaaatc ccttccagtc tatatgttac tggggccaag aattggtcac cggcgggaat 180
cttacattga gtaacgggca gctccgatca cagagatatt ggcacacctt gagttcgacg 240
cccatcctcc gaatctgtat gagatcctgc ttctccttac gttctccgaa actacagttg 300
cgtccgatac cagttttatg tttcttcatg ggaccgagca gaagtttacg cttcgcaagc 360
caagggacgg tggatatagt tcatagtgtt gaacgttccg agagtcagtc ccgcacctac 420
gtgtttttgg aactgtgggc cttcgggttt tacacagcct ttggtttcag catgctatta 480
gtctccacct tggaggcaca cctaatcacg gtaaagggtg atggcctaat acgttgggat 540
gtagcgcgct ccttccggtc aggtcacgag gatggagcgt gtcttacacg cgatccgtgc 600
ggtccgcagt ttgcgtctga cgactacgag ccgcgttctt gcctacccca gatgctatcg 660
gcgagagggg gtcccgtttt taccgatctt tatatgtgtc attgggctca attgcggatt 720
caggcggggc tagcaaacca agtgttgagt gtttgtctta tttgtaaggc atatatgatc 780
tcagagtttt tgtccatacc taaccattcc tattacttgc gcgcgccatg tgaacaaggt 840
aaaatgttga tagatgcgag gcacctttgg ctacgggtag agcggctgaa ttctatcatt 900
gcaggtctgg catcacttcg taagcgaggt aatactcgca ccagcttgaa ctcaatcctt 960
ttatttagta aggatcaaca gtataaaatg cggcgcgccg cactgagtat actactatat 1020
tggggctatt tcacagtccg cgcatcctgc gataatcttg tggccactct acggaaagac 1080
ccccgggaat acgattcggc gactgggccg tcgaaacttt gtcagcccaa agctcatccc 1140
tgtcatccga tgcaaatgta cctgagggac tgggcaggca aattaagagc aacgaagcgg 1200
ccagacaggg gcgcccaaca agaacatgcg gtgaaccccg ccggctacca tcaaatgcag 1260
agtgcaaggt tggttgcgcc tttaaccccg tccgcccagc ttactgagcg cagccacaca 1320
gattgtacag gaaaggttgg gcttgacctt cgacgtcaga tgtag 1365
<210> 8
<211> 454
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Arg Thr Arg His Ser Arg Thr Leu Leu Leu Glu His Leu Ala Thr
1 5 10 15
Glu Arg Arg Arg Leu Ala Pro Trp Asn Ile Gly Ser Ala Ser Thr Arg
20 25 30
His Leu Leu Leu Asp Lys Ser Pro Ser Arg Asn Pro Phe Gln Ser Ile
35 40 45
Cys Tyr Trp Gly Gln Glu Leu Val Thr Gly Gly Asn Leu Thr Leu Ser
50 55 60
Asn Gly Gln Leu Arg Ser Gln Arg Tyr Trp His Thr Leu Ser Ser Thr
65 70 75 80
Pro Ile Leu Arg Ile Cys Met Arg Ser Cys Phe Ser Leu Arg Ser Pro
85 90 95
Lys Leu Gln Leu Arg Pro Ile Pro Val Leu Cys Phe Phe Met Gly Pro
100 105 110
Ser Arg Ser Leu Arg Phe Ala Ser Gln Gly Thr Val Asp Ile Val His
115 120 125
Ser Val Glu Arg Ser Glu Ser Gln Ser Arg Thr Tyr Val Phe Leu Glu
130 135 140
Leu Trp Ala Phe Gly Phe Tyr Thr Ala Phe Gly Phe Ser Met Leu Leu
145 150 155 160
Val Ser Thr Leu Glu Ala His Leu Ile Thr Val Lys Gly Asp Gly Leu
165 170 175
Ile Arg Trp Asp Val Ala Arg Ser Phe Arg Ser Gly His Glu Asp Gly
180 185 190
Ala Cys Leu Thr Arg Asp Pro Cys Gly Pro Gln Phe Ala Ser Asp Asp
195 200 205
Tyr Glu Pro Arg Ser Cys Leu Pro Gln Met Leu Ser Ala Arg Gly Gly
210 215 220
Pro Val Phe Thr Asp Leu Tyr Met Cys His Trp Ala Gln Leu Arg Ile
225 230 235 240
Gln Ala Gly Leu Ala Asn Gln Val Leu Ser Val Cys Leu Ile Cys Lys
245 250 255
Ala Tyr Met Ile Ser Glu Phe Leu Ser Ile Pro Asn His Ser Tyr Tyr
260 265 270
Leu Arg Ala Pro Cys Glu Gln Gly Lys Met Leu Ile Asp Ala Arg His
275 280 285
Leu Trp Leu Arg Val Glu Arg Leu Asn Ser Ile Ile Ala Gly Leu Ala
290 295 300
Ser Leu Arg Lys Arg Gly Asn Thr Arg Thr Ser Leu Asn Ser Ile Leu
305 310 315 320
Leu Phe Ser Lys Asp Gln Gln Tyr Lys Met Arg Arg Ala Ala Leu Ser
325 330 335
Ile Leu Leu Tyr Trp Gly Tyr Phe Thr Val Arg Ala Ser Cys Asp Asn
340 345 350
Leu Val Ala Thr Leu Arg Lys Asp Pro Arg Glu Tyr Asp Ser Ala Thr
355 360 365
Gly Pro Ser Lys Leu Cys Gln Pro Lys Ala His Pro Cys His Pro Met
370 375 380
Gln Met Tyr Leu Arg Asp Trp Ala Gly Lys Leu Arg Ala Thr Lys Arg
385 390 395 400
Pro Asp Arg Gly Ala Gln Gln Glu His Ala Val Asn Pro Ala Gly Tyr
405 410 415
His Gln Met Gln Ser Ala Arg Leu Val Ala Pro Leu Thr Pro Ser Ala
420 425 430
Gln Leu Thr Glu Arg Ser His Thr Asp Cys Thr Gly Lys Val Gly Leu
435 440 445
Asp Leu Arg Arg Gln Met
450
<210> 9
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Ala Asn Cys Glu His Leu
1 5
<210> 10
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atggccaact gtgaacatct gtga 24
<210> 11
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 11
gaauguggu 9
<210> 12
<211> 63
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 12
ggcauugugg aacaaugcug uaccagcauc ugcucccucu accagcugga gaacuacugc 60
aac 63
<210> 13
<211> 90
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 13
uuugugaacc aacaccugug cggcucacac cugguggaag cucucuaccu agugugcggg 60
gaacgaggcu ucuucuacac acccaagacc 90
<210> 14
<211> 3
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 14
Glu Cys Gly
1
<210> 15
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 15
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Asn
20
<210> 16
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 16
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
20 25 30
<210> 17
<211> 9
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gaatgtggt 9
<210> 18
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ggcattgtgg aacaatgctg taccagcatc tgctccctct accagctgga gaactactgc 60
aac 63
<210> 19
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tttgtgaacc aacacctgtg cggctcacac ctggtggaag ctctctacct agtgtgcggg 60
gaacgaggct tcttctacac acccaagacc 90

Claims (1)

1.一种单链DNA肽连接酶sDPlaseI,其特征在于sDPlaseI连接酶的氨基酸序列如SEQNO:4所示。
CN202010077331.0A 2020-01-27 2020-01-27 一种单链DNA肽连接酶sDPlaseI及其使用方法 Expired - Fee Related CN111117978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010077331.0A CN111117978B (zh) 2020-01-27 2020-01-27 一种单链DNA肽连接酶sDPlaseI及其使用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010077331.0A CN111117978B (zh) 2020-01-27 2020-01-27 一种单链DNA肽连接酶sDPlaseI及其使用方法

Publications (2)

Publication Number Publication Date
CN111117978A CN111117978A (zh) 2020-05-08
CN111117978B true CN111117978B (zh) 2022-07-15

Family

ID=70492427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010077331.0A Expired - Fee Related CN111117978B (zh) 2020-01-27 2020-01-27 一种单链DNA肽连接酶sDPlaseI及其使用方法

Country Status (1)

Country Link
CN (1) CN111117978B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4587044A (en) * 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
CN110452303A (zh) * 2019-08-08 2019-11-15 中国科学院武汉病毒研究所 共价连接核酸和肽或蛋白的方法及应用
CN110637086A (zh) * 2017-03-17 2019-12-31 珂璧斯塔斯株式会社 Rna分子与肽的复合体的制造方法及其利用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4587044A (en) * 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
CN110637086A (zh) * 2017-03-17 2019-12-31 珂璧斯塔斯株式会社 Rna分子与肽的复合体的制造方法及其利用
CN110452303A (zh) * 2019-08-08 2019-11-15 中国科学院武汉病毒研究所 共价连接核酸和肽或蛋白的方法及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RNA-peptide fusions for the in vitro selection of peptides and proteins;Roberts, RW等;《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA》;19971111;第94卷(第23期);第12297-12302页 *
Synthesis of a peptide-universal nucleotide antigen: towards next-generation antibodies to detect topoisomerase I-DNA covalent complexes;Perkins, AL等;《ORGANIC & BIOMOLECULAR CHEMISTRY》;20160413;第14卷(第17期);第4103-4109页 *

Also Published As

Publication number Publication date
CN111117978A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
US20180037943A1 (en) Method of dna synthesis
US8034910B2 (en) SUMO fusion protein expression system for producing native proteins
CA2073630C (en) Method for synthesizing single-stranded stem-loop dnas, the products and uses therefor
EP1546313B1 (en) Thermostable rna ligase from thermus phage
US10883091B2 (en) DNA polymerase variant and application thereof
CN108779442A (zh) 多种连接酶的组合物、系统以及方法
CN110914415A (zh) 工程化连接酶变体
WO2019128836A1 (zh) 一种改进的启动子及其应用
WO2022227880A1 (zh) 一种新型磷酸化腺苷酰化酶及其制备方法与应用
JPH03501925A (ja) 合成遺伝子
CN113785053A (zh) 酶活性提高的逆转录酶及其应用
JP2022522397A (ja) 環状及び線状dna分子を規則正しく構築する方法
CN111117978B (zh) 一种单链DNA肽连接酶sDPlaseI及其使用方法
CN111088235B (zh) 一种双链DNA肽连接酶dDPlaseI及其使用方法
CN111088236B (zh) 一种单链RNA肽连接酶sRPlaseI及其使用方法
CN111088234B (zh) 一种双链DNA肽连接酶dDPlaseII及使用方法
WO2023273366A1 (zh) 核酸连接酶
EP0877084B1 (en) Thermostable diaphorase gene
CN112725331B (zh) 一种高通量突变体文库的构建方法
CN115261363B (zh) Apobec3a的rna脱氨酶活性测定方法及rna高活性的apobec3a变体
CN113930405B (zh) 一种新型热稳定磷酸化和腺苷酰化一步法催化酶及其制备方法与应用
CN117051043B (zh) 一种基于环状rna编码耐甲氧西林金黄色葡萄球菌内溶素及其应用
KR100774102B1 (ko) 썰포포보코커스 질리지 유래의 내열성 dna 연결효소
KR100673836B1 (ko) 스태필로써머스 마리너스 유래의 내열성 dna 연결효소
CN115011578A (zh) 一种强化型m-mlv逆转录酶突变体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TA01 Transfer of patent application right

Effective date of registration: 20220701

Address after: 362300 room 114, building 5, yangguangyoujia, Meilin street, Nan'an City, Quanzhou City, Fujian Province

Applicant after: Huang Zhongshan

Address before: 350005 No. 178 on the east side of the second floor of the complex building, Lianpan 34, Xiangyuan street, Jin'an District, Fuzhou City, Fujian Province

Applicant before: Fujian chenxinke Biotechnology Co.,Ltd.

TA01 Transfer of patent application right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220715

CF01 Termination of patent right due to non-payment of annual fee