CN117355609A - 牛痘病毒加帽酶的产生 - Google Patents

牛痘病毒加帽酶的产生 Download PDF

Info

Publication number
CN117355609A
CN117355609A CN202280037047.8A CN202280037047A CN117355609A CN 117355609 A CN117355609 A CN 117355609A CN 202280037047 A CN202280037047 A CN 202280037047A CN 117355609 A CN117355609 A CN 117355609A
Authority
CN
China
Prior art keywords
seq
nucleic acid
sequence
naturally occurring
host cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280037047.8A
Other languages
English (en)
Inventor
J·博贝尔
J·I·布切尔
J·M·加尔丁
J·金
S·马尔
M·麦克曼
K·S·帕特尔
A·瓦尔德曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ginkgo Bioworks Inc
Original Assignee
Ginkgo Bioworks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ginkgo Bioworks Inc filed Critical Ginkgo Bioworks Inc
Priority claimed from PCT/US2022/022303 external-priority patent/WO2022212342A1/en
Publication of CN117355609A publication Critical patent/CN117355609A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开的方面涉及宿主细胞中牛痘病毒加帽酶(VCE)的产生。例如,宿主细胞可以包括:启动子;核糖体结合位点(RBS);编码牛痘病毒加帽酶(VCE)或VCE亚基的核酸;和终止子。

Description

牛痘病毒加帽酶的产生
相关申请的交叉引用
本申请要求于2021年03月29日提交的标题为“牛痘病毒加帽酶的产生”的美国临时申请号63/167,249以及于2021年05月14日提交的标题为“牛痘病毒加帽酶的产生”的美国临时申请号63/188,977(其中的每个的整个公开内容通过引用被整体并入本文)在35U.S.C§119(e)下的权益。
对经由EFS-WEB作为文本文件提交的序列表的引用
本申请含有已经经由EFS-Web以ASCII格式提交的序列表,并且特此通过引用整体并入。创建于2022年03月29日的ASCII文件被命名为G091970072WO00-SEQ-OMJ.txt,并且大小为138941字节。
发明领域
本公开涉及对于牛痘病毒加帽酶的产生有用的核酸、细胞和方法。
背景
7-甲基鸟苷酸帽结构(m7G-cap 0)在蛋白质合成的帽依赖性起始中具有重要作用,并且涉及真核信使RNA(mRNA)的稳定、转运和翻译。牛痘病毒加帽酶(VCE)是一种来自牛痘病毒的酶,对于将m7G cap 0添加到RNA的5'端有效,从而提高RNA稳定性和翻译能力。VCE对于mRNA的产生可以是有用的。然而,以前已经报道了大规模表达和生产VCE的困难。
概述
VCE的增加的产生将对于满足对该酶日益增长的需求是有用的。VCE的增加的产生在mRNA疫苗的产生中可能是特别有用的。本公开的各方面提供对于VCE的产生有用的非天然存在的核酸、细胞和方法。
本公开的方面涉及非天然存在的核酸,非天然存在的核酸包括:(a)启动子,其中启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;以及(b)编码与SEQ IDNO:6或SEQ ID NO:29至少90%一致的氨基酸序列的核酸、和/或编码与SEQ ID NO:7或SEQID NO:31至少90%一致的氨基酸序列的核酸,其中(a)和(b)可操作地连接,并且其中非天然存在的核酸还包括核糖体结合位点(RBS)。
在一些实施方案中,启动子可通过乳糖和/或半乳糖诱导。
在一些实施方案中,非天然存在的核酸还包括终止子。在一些实施方案中,RBS包括与SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:45至少90%一致的序列,和/或终止子包括与SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20至少90%一致的序列。
在一些实施方案中,编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列的核酸包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:33或SEQ ID NO:34至少90%一致的核酸序列;和/或编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列的核酸包括与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:35或SEQ ID NO:36至少90%一致的核酸序列。
在一些实施方案中,启动子、RBS和终止子可操作地连接至编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列的核酸,和/或编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列的核酸。在一些实施方案中,编码与SEQ ID NO:6或SEQ IDNO:29至少90%一致的氨基酸序列的核酸编码SEQ ID NO:6或SEQ ID NO:29的氨基酸序列。在一些实施方案中,编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列的核酸编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。在一些实施方案中,编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列的核酸和/或编码与SEQ ID NO:7或SEQ IDNO:31至少90%一致的氨基酸序列的核酸编码SEQ ID NO:6或SEQ ID NO:29的氨基酸序列并且也编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。
本公开的另外的方面涉及非天然存在的核酸,非天然存在的核酸包括:(a)第一启动子,其中第一启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;(b)第一核酸,其中第一核酸编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列;(c)第二启动子,其中第二启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;以及(d)第二核酸,其中第二核酸编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列,其中(a)和(b)可操作地连接,并且其中(c)和(d)可操作地连接,并且其中非天然存在的核酸还包括至少一个核糖体结合位点(RBS)。
在一些实施方案中,第一启动子和/或第二启动子可通过乳糖和/或半乳糖诱导。
在一些实施方案中,非天然存在的核酸还包括至少一个终止子。在一些实施方案中,RBS包括与SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:45至少90%一致的序列,和/或终止子包括与SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20至少90%一致的序列。在一些实施方案中,第一核酸包括与SEQ ID NO:2、SEQ ID NO:3、SEQID NO:33或SEQ ID NO:34至少90%一致的序列;和/或第二核酸包括与SEQ ID NO:4、SEQID NO:5、SEQ ID NO:35或SEQ ID NO:36至少90%一致的序列。在一些实施方案中,非天然存在的核酸包括与SEQ ID NO:21-28或SEQ ID NO:49-54中的任意一者至少90%一致的序列。
本公开的另外的方面涉及非天然存在的核酸,非天然存在的核酸包括与SEQ IDNO:21-28或SEQ ID NO:49-54中的任意一者至少90%一致的序列。在一些实施方案中,非天然存在的核酸不编码融合蛋白。
本公开的另外的方面涉及宿主细胞,宿主细胞包括与本公开相关联的任意非天然存在的核酸。在一些实施方案中,非天然存在的核酸被整体或部分整合到宿主细胞的基因组中。在一些实施方案中,非天然存在的核酸在质粒上表达。
本公开的另外的方面涉及宿主细胞,宿主细胞包括一种或更多种非天然存在的核酸,非天然存在的核酸包括:启动子,其中启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列,以及编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列的核酸和/或编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列的核酸,其中一种或更多种非天然存在的核酸还包括核糖体结合位点(RBS)。
在一些实施方案中,启动子可通过乳糖和/或半乳糖诱导。
在一些实施方案中,RBS包括与SEQ ID NO:10-17、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:45中的一者至少90%一致的序列。在一些实施方案中,一种或更多种非天然存在的核酸还包括终止子。在一些实施方案中,一种或更多种非天然存在的核酸被整合到宿主细胞的基因组中。在一些实施方案中,一种或更多种非天然存在的核酸在质粒上表达。
在一些实施方案中,宿主细胞是细菌细胞。在一些实施方案中,细菌细胞是E.coli细胞。在一些实施方案中,一种或更多种核酸序列编码SEQ ID NO:6或SEQ ID NO:29的氨基酸序列。在一些实施方案中,一种或更多种核酸序列编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。在一些实施方案中,一种或更多种核酸编码SEQ ID NO:6或SEQ ID NO:29的氨基酸序列并且也编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。
本公开的方面涉及宿主细胞,宿主细胞包括一种或更多种非天然存在的核酸,非天然存在的核酸包括:(a)第一启动子,其中第一启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;(b)第一核酸,其中第一核酸编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列;(c)第二启动子,其中第二启动子包括与SEQ ID NO:8或SEQ IDNO:9至少90%一致的序列;以及(d)第二核酸,其中第二核酸编码与SEQ ID NO:7或SEQ IDNO:31至少90%一致的氨基酸序列,其中(a)和(b)可操作地连接,其中(c)和(d)可操作地连接,并且其中一种或更多种非天然存在的核酸还包括至少一个核糖体结合位点(RBS)。
在一些实施方案中,启动子可通过乳糖和/或半乳糖诱导。在一些实施方案中,一种或更多种非天然存在的核酸还包括至少一个终止子。在一些实施方案中,RBS包括与SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:45至少90%一致的序列和/或终止子包括与SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20至少90%一致的序列。
在一些实施方案中,第一核酸包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:33或SEQ ID NO:34至少90%一致的序列和/或第二核酸包括与SEQ ID NO:4、SEQ ID NO:5、SEQID NO:35或SEQ ID NO:36至少90%一致的序列。在一些实施方案中,一种或更多种非天然存在的核酸包括与SEQ ID NO:21-28或SEQ ID NO:49-54中的任意一者至少90%一致的序列。
在一些实施方案中,宿主细胞能够比对照宿主细胞多产生至少1倍、2倍、3倍、4倍或5倍的牛痘病毒加帽酶,其中对照宿主细胞是野生型E.coli细胞。在一些实施方案中,宿主细胞能够产生至少50mg/L、100mg/L、150mg/L、200mg/L、250mg/L、300mg/L、350mg/L、400mg/L或450mg/L的牛痘病毒加帽酶。在一些实施方案中,非天然存在的核酸不编码融合蛋白。
本公开的另外的方面涉及产生牛痘病毒加帽酶的方法,方法包括培养本公开的任意宿主细胞。在一些实施方案中,方法还包括牛痘病毒加帽酶的纯化。
本公开的另外的方面涉及非天然存在的核酸,非天然存在的核酸包括:(a)启动子,其中启动子是Ptac启动子或其功能性片段、或者P(T5)2xlacO启动子或其功能性片段;以及(b)编码VCE的D1亚基和/或牛痘病毒加帽酶的D12亚基的核酸,其中(a)和(b)可操作地连接,并且其中非天然存在的核酸还包括核糖体结合位点(RBS)。
在一些实施方案中,启动子可通过乳糖和/或半乳糖诱导。在一些实施方案中,非天然存在的核酸不编码融合蛋白。
在一些实施方案中,相对于野生型细胞,宿主细胞具有ftsZ的增加的表达。在一些实施方案中,宿主细胞表达一个或更多个质粒上的ftsZ的一个或更多个拷贝。在一些实施方案中,ftsZ的一个或更多个拷贝被整体或部分整合到宿主细胞的基因组中。
在一些实施方案中,相对于野生型细胞,宿主细胞具有metK的增加的表达。在一些实施方案中,宿主细胞表达一个或更多个质粒上的metK的一个或更多个拷贝。在一些实施方案中,metK的一个或更多个拷贝被整体或部分整合到宿主细胞的基因组中。
在一些实施方案中,相对于野生型细胞,宿主细胞具有mreB的增加的表达。在一些实施方案中,宿主细胞表达一个或更多个质粒上的mreB的一个或更多个拷贝。在一些实施方案中,mreB的一个或更多个拷贝被整体或部分整合到宿主细胞的基因组中。
在一些实施方案中,在SAM相关代谢物和GTP相关代谢物的存在下培养宿主细胞。
本发明的限制中的每个可以涵盖本发明的各种实施方案。因此,预期涉及任何一个要素或要素的组合的本发明的限制中的每个都可以包含在本发明的每个方面中。本公开的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。此外,本申请中使用的措辞和术语是出于描述的目的,而不应当被视为限制性的。“包含”、“包括”、或“具有”、“含有”、“涉及”及其变体的使用意在涵盖其后列出的项目及其等同物以及附加项目。术语“一(a)”或“一(an)”指一个(种)或更多个(种)实体。
附图的简要说明
附图并非旨在按比例绘制。为清楚起见,并非每个组成部分都可能在每个图中标记。在附图中:
图1A-1B提供了示出通过VCE的mRNACap 0结构的生成的示意图。图1A描绘了从质粒DNA生成RNA,随后进行VCE加帽。图1B描绘了由VCE催化的加帽反应以生成mRNAm7GpppG(Cap 0)。
图2描绘了示出来自前23个E.coli候选VCE产生菌株的补料分批发酵的最大可溶性酶滴度的图表。阳性对照菌株t778543来源于Fuchs et al.(2016)RNA 22:1454-1466的表达系统。
图3描绘了示出来自前8个E.coli候选VCE产生菌株(816008、816072、816070、816056、807172、807173、815995和815917)的50小时补料分批发酵的可溶性酶滴度的图表。时间过程数据示出了3个生物反应器重复的绘图,其中误差条示出了4个裂解生物重复的分析方差。
图4描绘了示出无诱导物的6个E.coli候选VCE产生菌株(807175、807176、815930、815934、816019和816020)和由IPTG、乳糖或半乳糖诱导和无诱导物诱导的1个E.coli候选人VCE产生菌株(870868)的50小时补料分批发酵的可溶性酶滴度的图表。时间过程数据示出了2个生物反应器重复的绘图,其中误差条示出了两个裂解生物重复的分析方差。
详细说明
在一些方面,本公开提供被工程化用于产生VCE的宿主细胞。这些经工程化的宿主细胞在合成启动子的控制下表达编码VCE亚基D1和/或D12的重新编码的核酸。以前已经报道了大规模表达和生产VCE的困难。在本公开的实施例中令人惊讶地证明,相对于对照宿主细胞,包括遗传元件(如合成启动子、核糖体结合位点(RBS)、重新编码的核酸序列和终止子)的优化组合的宿主细胞产生增加水平的VCE。与过去的方法相比,本申请中描述的宿主细胞可以用于产生滴度增加的VCE。
牛痘病毒加帽酶
牛痘病毒加帽酶(VCE)是一种由牛痘病毒编码的异二聚体RNA加帽酶,并且由两个亚基(大亚基D1和小亚基D12)组成。大亚基D1包括三种酶活性:1)RNA三磷酸酶;2)鸟苷酸转移酶;和3)鸟嘌呤甲基转移酶,所有这些对于将完整的Cap 0结构m7Gppp5'N酶促添加到5'三磷酸RNA是必需的(图1B)。大亚基D1的鸟嘌呤甲基转移酶活性需要与小亚基D12结合才能有效发挥作用。mRNA加帽的各方面描述于Ramanathan et al.(2016).Nucleic Acids Res.(16):7511–7526中,并且通过引用被并入。如本申请的实施例部分所描述的,编码D1和/或D12的重新编码的核酸在合成启动子、RBS和终止子的各种组合的控制下的过表达令人惊讶地提高了VCE产生菌株的生产率和产量。不希望受任何理论的束缚,本公开中提供的编码D1和/或D12的重新编码的核酸,其在本公开中描述的合成启动子、RBS和/或终止子的特定组合的控制下表达,可以提供D1:D12共表达(包含D12的充分表达)的改进的平衡,这可能导致D1亚基的提高的稳定性,从而导致VCE的增加的产量。
VCE D1亚基的氨基酸序列对应于UniProt登录号P04298并且由SEQ ID NO:29提供。在一些实施方案中,与本公开相关的VCE D1亚基的序列包括SEQ ID NO:29或其保守置换版本。在一些实施方案中,与本公开相关的VCE D1亚基的序列含有标签。在一些实施方案中,与本公开相关的VCE D1亚基的序列包括SEQ ID NO:6或其保守置换版本。在一些实施方案中,与本公开相关的VCE D1亚基包括与下列中任意者至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列:SEQ ID NO:29或SEQ ID NO:6、或者其保守置换版本;或者本申请中另外描述的或本领域已知的VCE D1亚基序列。
VCE D1亚基由基因VACWR106(SEQ ID NO:30)编码。在一些实施方案中,编码D1的核酸包括SEQ ID NO:30。在其他实施方案中,编码D1的核酸被重新编码。在一些实施方案中,编码D1的核酸包括SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:30、SEQ ID NO:33或SEQ IDNO:34。在一些实施方案中,编码D1的核酸包括与下列中的任意者至少40%、45%、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列:SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:30、SEQ ID NO:33或SEQ ID NO:34;表3中的D1重新编码序列;或本申请中另外描述的或本领域已知的编码D1的序列。
VCE D12亚基的氨基酸序列对应于UniProt登录号P04318并且由SEQ ID NO:31提供。在一些实施方案中,与本公开相关的VCE D12亚基的序列包括SEQ ID NO:31或其保守置换版本。在一些实施方案中,与本公开相关的VCE D12亚基的序列含有标签。在一些实施方案中,与本公开相关的VCE D12亚基的序列包括SEQ ID NO:7或其保守置换版本。在一些实施方案中,与本公开相关的VCE D12亚基包括与下列中任意者至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列:SEQ ID NO:31或SEQ ID NO:7、或者其保守置换版本;或者本申请中另外描述的或本领域已知的VCE D12亚基序列。
VCE D12亚基由基因VACWR117(SEQ ID NO:32)编码。在一些实施方案中,编码D12的核酸包括SEQ ID NO:32。在其他实施方案中,编码D12的核酸被重新编码。在一些实施方案中,编码D12的核酸包括SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:32、SEQ ID NO:35或SEQID NO:36。在一些实施方案中,编码D12的核酸包括与下列中的任意者至少40%、45%、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列:SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:32、SEQ ID NO:35或SEQ ID NO:36;表3中的D12重新编码序列;或本申请中另外描述的或本领域已知的编码D12的序列。
本申请中描述的宿主细胞可以包括VCE或VCE亚基、和/或编码这样的酶或酶亚基的核酸。在一些实施方案中,宿主细胞包括:编码包括SEQ ID NO:6或SEQ ID NO:29的氨基酸序列的VCE的核酸和/或编码包括SEQ ID NO:7或SEQ ID NO:31的氨基酸序列的VCE的核酸;或者本申请中另外描述的或本领域已知的VCE。在一些实施方案中,宿主细胞包括:编码包括SEQ ID NO:6或SEQ ID NO:29的序列的VCE D1亚基的核酸;或本申请中另外描述的或本领域已知的VCE D1亚基。在一些实施方案中,宿主细胞包括:编码包括SEQ ID NO:7或SEQID NO:31的序列的VCE D12亚基的核酸;或本申请中另外描述的或本领域已知的VCE D12亚基。在一些实施方案中,宿主细胞包括与下列中的任意者至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的核酸:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36;表3中的编码VCE或VCE亚基的核酸;或本申请中另外描述的或本领域已知的编码VCE或VCE亚基的核酸。
在一些实施方案中,VCE的大亚基和小亚基(D1和D12)转录在单独的mRNA上。mRNA可以在宿主细胞中的一个或更多个质粒上表达或者被整合到宿主细胞的基因组中。在一些实施方案中,核酸仅编码一个亚基(例如,仅编码D1或仅编码D12)。在一些实施方案中,编码D1或D12的核酸在质粒上表达。在一些实施方案中,编码D1或D12的核酸被整合到细胞的染色体中。
在一些实施方案中,VCE的大亚基和小亚基(D1和D12)一起转录为单个多顺反子mRNA,其中相同的调控序列(例如,启动子)控制两个VCE亚基(D1和D12)的表达。编码两个亚基的mRNA可以在宿主细胞中的质粒上表达或者被整合到宿主细胞的基因组中。在一些实施方案中,编码D1和D12的核酸在质粒上表达。在一些实施方案中,编码D1和D12的核酸被整合到细胞的染色体中。
在一些实施方案中,VCE的大亚基和小亚基(D1和D12)从两个单顺反子单元内的相同的mRNA转录,从而各个亚基(D1和D12)的表达受其自己的调控序列(例如,其自己的启动子)的控制。编码两个单顺反子单元的mRNA可以在宿主细胞中的质粒上表达或者被整合到宿主细胞的基因组中。在一些实施方案中,核酸在质粒上表达。在一些实施方案中,核酸被整合到细胞的染色体中。
在一些实施方案中,宿主细胞包括编码VCE或一个或更多个VCE亚基(D1和/或D12)的核酸的2个或更多个拷贝。在一些实施方案中,宿主细胞包括编码VCE或一个或更多个VCE亚基(D1和/或D12)的核酸的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、或10个或更多个拷贝。
在其中核酸编码D1和D12两者的一些实施方案中,包括编码D1的序列的核酸的一部分与下列中的任意者至少40%、45%、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值):SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:30、SEQ ID NO:33或SEQ ID NO:34;表3中的D1重新编码序列;或本申请中另外描述的或本领域已知的编码D1的序列。
在其中核酸编码D1和D12两者的一些实施方案中,包括编码D12的序列的核酸的一部分与下列中的任意者至少40%、45%、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值):SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:32、SEQ ID NO:35或SEQ ID NO:36;表3中的D12重新编码序列;或本申请中另外描述的或本领域已知的编码D12的序列。
在一些实施方案中,本公开的核酸不编码包括D1亚基和D12亚基的融合蛋白。
在其他实施方案中,本公开的核酸可以编码包括D1亚基和D12亚基的融合蛋白。包括D1亚基和D12亚基的融合蛋白可以包含在D1亚基和D12亚基的之间的裂解位点。在其中核酸编码D1和D12两者的一些实施方案中,核酸编码包含在编码D1的序列和编码D12的序列之间的裂解位点的氨基酸序列。在一些实施方案中,裂解位点是TEV裂解位点。
本公开的方面涉及表达编码VCE或VCE亚基(D1和/或D12)的异源核酸的宿主细胞。应当理解的是,本公开预期了用于增加编码VCE或VCE亚基(D1和/或D12)的核酸的表达的任何机制或机制的组合。例如,宿主细胞可以具有编码VCE或VCE亚基(D1和/或D12)的核酸的增加的拷贝数,和/或核酸的一个或更多个拷贝可以受强启动子(相对于其天然启动子,强启动子增加核酸的表达)的调控。在一些实施方案中,编码VCE或VCE亚基(D1和/或D12)的核酸的增加的拷贝数通过在一个或更多个质粒上表达一个或更多个拷贝实现。在其他实施方案中,编码VCE或VCE亚基(D1和/或D12)的核酸的增加的拷贝数通过将核酸的一个或更多个拷贝整合到染色体中而实现。
与本公开相关的基因的表达的调控
本公开涵盖了包括宿主细胞中核酸的异源表达的方法。就核酸(如包括基因的核酸或者包括调控区(如启动子或核糖体结合位点)的核酸)而言,术语“异源的”与术语“外源的”和术语“重组的”可互换地使用,并且指:已经被人工地提供给生物系统的核酸;已经在生物系统内修饰的核酸、或者已经在生物系统内操纵其表达或调控的核酸。被引入宿主细胞中或者在宿主细胞中表达的异源核酸可以是来自与宿主细胞不同的生物体或物种的核酸,或者可以是合成的核酸,或者可以是也在与宿主细胞相同的生物体或物种中内源表达的核酸。例如,当在宿主细胞中内源表达的核酸非天然地位于宿主细胞中;在宿主细胞中稳定或瞬时重组表达;在宿主细胞内被修饰;在宿主细胞内被选择性编辑;在宿主细胞内以非天然的拷贝数表达;或者在宿主细胞内以非天然方式表达(如通过操纵控制核酸的表达的调控区)时,在宿主细胞中内源表达的核酸可以被认为是异源的。在一些实施方案中,异源核酸是一核酸,所述核酸在宿主细胞中内源表达,但所述核酸的表达由不天然调控核酸表达的启动子驱动。在其他实施方案中,异源核酸是一核酸,所述核酸在宿主细胞中内源表达,并且所述核酸的表达由天然调控核酸表达的启动子驱动,但所述启动子或另外的调控区被修饰。在一些实施方案中,启动子被重组激活或阻遏。例如,基于基因编辑的技术可以用于调控核酸(包含内源核酸)自启动子(包含内源启动子)的表达。参见,例如Chavez etal.,Nat Methods.2016Jul;13(7):563–567。与参考核酸序列相比,异源核酸可以包括野生型序列或突变序列。
在一些实施方案中,编码本申请中描述的任意蛋白质的核酸受一个或更多个调控序列的控制。如本申请中所使用的,调控序列指可以影响或控制(例如,增加或减少)编码序列(例如,基因)的表达的核酸序列。在一些实施方案中,调控序列可以包含启动子、核糖体结合位点、增强子、沉默子和/或终止子中的一种或更多种。
在一些实施方案中,核酸在启动子的控制下表达。在一些实施方案中,启动子是异源的。启动子可以是天然启动子(例如,在基因的内源性背景中基因的启动子),其提供基因表达的正常调控。可替换地,启动子可以是与基因的天然启动子不同的启动子(例如,启动子不同于在基因的内源性背景中基因的启动子)。在一些实施方案中,相对于天然启动子,不同的启动子具有增加的强度(例如,相对于通过其天然启动子的基因的调控,较强的启动子导致基因的增加的表达)。本领域技术人员将理解如何基于本领域已知的方法评估启动子强度。本公开的方面涉及在合成启动子的控制下编码VCE的一个或两个亚基的核酸的表达。
在一些实施方案中,启动子是合成启动子。如本申请中所使用的,“合成启动子”指不是已知在自然界中存在的启动子。如实施例中所证明的,在合成启动子的控制下编码D1和/或D12 VCE亚基的核酸的表达在增加VCE的产生中是有效的。
在一些实施方案中,驱动编码D1和/或D12 VCE亚基的核酸的表达的启动子包括与SEQ ID NO:8(Ptac)至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。在一些实施方案中,相对于SEQ ID NO:8,启动子包括不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸置换、插入、添加或缺失。在一些实施方案中,驱动编码D1和/或D12 VCE亚基的核酸的表达的启动子包括与SEQ ID NO:9(P(T5)2xlacO)至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。在一些实施方案中,相对于SEQ ID NO:9,启动子包括不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸置换、插入、添加或缺失。
在一些实施方案中,启动子是Ptac或其功能性片段、或者P(T5)2xlacO或其功能性片段。核酸的片段指至多但不包含全长核酸分子的部分。本公开的核酸的功能性片段指核酸的生物学活性部分。尽管与全长基因调控元件的活性水平相比,基因调控元件的生物学活性部分的活性水平可变,但是基因调控元件(如启动子)的生物学活性部分可以包括全长基因调控元件的部分或片段,并且具有与全长基因调控元件相同类型的活性。
合成启动子的其他非限制性实例包含:P(Bba_j23104);P(galP);P(apFAB322);P(apFAB29);P(apFAB76);P(apFAB339);P(apFAB346);P(apFAB101);P(gcvTp);CP38、CP44、osmY、apFAB38、xthA、poxB、lacUV5、pLlacO1、pLTetO1、apFAB56、Trc、apFAB45、apFAB70、apFAB71、apFAB92、T7A1、bad和rha。
在一些实施方案中,驱动天然存在的牛痘病毒中编码VCE D1和/或D12亚基的基因的表达的启动子被用于驱动编码VCE D1和/或D12亚基的一个或更多个异源核酸的表达。
在一些实施方案中,启动子是真核启动子。如本领域技术人员所知,真核启动子的非限制性实例包含TDH3、PGK1、PKC1、PDC1、TEF1、TEF2、RPL18B、SSA1、TDH2、PYK1、TPI1GAL1、GAL10、GAL7、GAL3、GAL2、MET3、MET25、HXT3、HXT7、ACT1、ADH1、ADH2、CUP1-1、ENO2和SOD1(参见,例如Addgene website:blog.addgene.org/plasmids-101-the-promoter-region)。在一些实施方案中,启动子是原核启动子(例如,噬菌体启动子或细菌启动子)。噬菌体启动子的非限制性实例包含Pls1con、T3、T7、SP6和PL。细菌启动子的非限制性实例包含Pbad、PmgrB、Ptrc2、Plac/ara、CP6、CP25、CP38、CP44、CP43、CP31、CP24、CP18、CP27、CP37、CP17、CP2、CP4、CP45、CP1、CP22、CP19、CP34、CP20、CP11、CP26、CP3、CP14、CP13、CP40、CP8、CP28、CP10、CP32、CP30、CP9、CP46、CP23、CP39、CP35、CP33、CP15、CP29、CP12、CP41、CP16、CP42、CP7、Pm、PH207、PD/E20、PN25、PG25、PJ5、PA1、PA2、PL、Plac、PlacUV5、PtacI和Pcon。原核启动子在下列文献中被进一步描述并且从下列文献通过引用被并入:Jensen et al.(1998)Appl EnvironMicrobiol.64:82-7,Kosuri et al.(2013)Proc Natl Acad Sci U S A.110:14024-9和Deuschle et al.(1986)EMBO J.5:2987-94。
在一些实施方案中,启动子是诱导型启动子。如本申请中所使用的,“诱导型启动子”是受到分子的存在或不存在控制的启动子。例如,这可以用于可控地诱导酶的表达。诱导型启动子的非限制性实例包含化学调控的启动子和物理调控的启动子。对于化学调控的启动子,转录活性可以由一种或更多种化合物(如醇、四环素、乳糖、半乳糖、类固醇、金属、或其他化合物)调控。对于物理调控的启动子,转录活性可以受现象(如光或温度)的调控。四环素调控的启动子的非限制性实例包含脱水四环素(aTc)响应性启动子和其他四环素响应性启动子系统(例如,四环素阻遏蛋白(tetR)、四环素操纵子序列(tetO)和四环素反式激活子融合蛋白(tTA))。类固醇调控的启动子的非限制性实例包含基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子,以及来自类固醇/类维生素A/甲状腺受体超家族的启动子。金属调控的启动子的非限制性实例包含来源于金属硫蛋白(结合并且螯合金属离子的蛋白质)基因的启动子。发病机制调控的启动子的非限制性实例包含由水杨酸、乙烯或苯并噻二唑(BTH)诱导的启动子。温度/热诱导型启动子的非限制性实例包含热激启动子。光调控的启动子的非限制性实例包含来自植物细胞的光响应性启动子。在某些实施方案中,诱导型启动子是乳糖诱导型启动子。在某些实施方案中,诱导型启动子是半乳糖诱导型启动子。在一些实施方案中,通过一种或更多种生理条件(例如,pH、温度、辐射、渗透压、盐水梯度、细胞表面结合、或者一种或更多种外在诱导剂或内在诱导剂的浓度)来诱导诱导型启动子。外在诱导物或诱导剂的非限制性实例包含氨基酸和氨基酸类似物、糖类和多糖、核酸、蛋白质转录激活子(activator)和阻遏子(repressor)、细胞因子、毒素、石油基化合物、含金属的化合物、盐、离子、酶底物类似物、激素或其任何组合。
在一些实施方案中,诱导物是异丙基-β-d-1-硫代半乳糖苷(IPTG)。在一些实施方案中,诱导物是香草酸。在一些实施方案中,诱导物是枯铭酸。在一些实施方案中,诱导物是脱水四环素。
在一些实施方案中,启动子是组成型启动子。如本申请中所使用的,“组成型启动子”指允许基因的连续转录的未经调控的启动子。组成型启动子的非限制性实例包含TDH3、PGK1、PKC1、PDC1、TEF1、TEF2、RPL18B、SSA1、TDH2、PYK1、TPI1、HXT3、HXT7、ACT1、ADH1、ADH2、ENO2和SOD1。
还预期了本领域普通技术人员可能知道的其他诱导型启动子或组成型启动子(包含合成启动子)。在一些实施方案中,相对于天然启动子,本公开涵盖的合成启动子具有增加的强度。
VCE和/或VCE亚基的翻译可以通过RBS的存在而被至少部分地增强。本申请中使用的“RBS”或“核糖体结合位点”指参与核糖体招募的mRNA中起始密码子上游的调控序列。在一些实施方案中,RBS是异源的。宿主细胞可以表达天然RBS(例如,在其内源性背景中的RBS),天然RBS提供基因或操纵子的表达的正常调控。可替换地,RBS可以是不同于与基因相关的天然RBS的RBS(例如,RBS不同于在其内源性背景中的基因的RBS)。RBS可以是合成的。如本申请中所使用的,“合成RBS”指不是已知自然界中存在的RBS。合成RBS进一步在下列文献中被描述并且通过引用从下列文献被并入:Salis et al.(2009)Nat.Biotechnol.27,946–950(2009)。
在一些实施方案中,RBS包括与SEQ ID NO:10-17、SEQ ID NO:37、SEQ ID NO:38和SEQ ID NO:45 70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。在一些实施方案中,相对于SEQ ID NO:10-17、SEQ ID NO:37、SEQ ID NO:38和SEQ ID NO:45,RBS包括不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个核苷酸置换、插入、添加或缺失。
在一些实施方案中,RBS是apFAB873、apFAB826、DeadRBS、apFAB871、BBa_J61133、BBa_J61139、apFAB843、BBa_J61124、apFAB864、apFAB964、BBa_J61101、BBa_J61131、salis-3-11、BBa_J61125、BBa_J61118、apFAB922、BBa_J61130、BBa_J61134、BBa_J61128、BBa_J61107、apFAB869、apFAB890、BBa_J61120、BBa_J61109、BBa_J61103、apFAB868、apFAB914、BBa_J61119、BBa_J61126、B0032_RBS、apFAB895、BBa_J61136、apFAB866、GSGV_RBS、apFAB918、BBa_J61129、apFAB867、apFAB903、apFAB872、BBa_J61137、BBa_J61111、apFAB821、apFAB844、BBa_J61110、BBa_J61112、BBa_J61104、BBa_J61122、apFAB854、BBa_J61127、BBa_J61113、GSG_RBS、apFAB892、BBa_J61115、apFAB927、BBa_J61108、Anderson_RBS、apFAB883、apFAB894、BBa_J61132、apFAB860、BBa_J61100、apFAB856、apFAB862、apFAB865、BBa_J61106、apFAB845、apFAB820、apFAB954、apFAB910、salis-4-10、apFAB901、salis-4-4、apFAB832、apFAB909、salis-4-7、apFAB861、apFAB876、apFAB827、salis-2-4、Alon_RBS、apFAB831、apFAB857、apFAB863、apFAB912、apFAB889、apFAB851、apFAB884、apFAB833、apFAB848、apFAB839、salis-1-21、apFAB923、Plotkin_RBS、apFAB842、salis-2-3、apFAB837、apFAB916、apFAB834、apFAB904、apFAB917、salis-1-10、Invitrogen_RBS、salis-1-1、salis-1-3、salis-3-3、salis-4-2、JBEI_RBS、salis-1-5、B0034_RBS、B0030_RBS或Bujard_RBS,其在下列文献中被进一步描述并且通过引用从下列文献被并入:Kosuriet al.(2013)Proc Natl Acad Sci U S A.110:14024-9。在某些实施方案中,RBS是apFAB873或apFAB826。
与本公开相关的核酸可以包括终止子(例如,定位在编码VCE或其亚基的核酸的部分的下游或3'的转录终止子)。在一些实施方案中,终止子包括与SEQ ID NO:18至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。在一些实施方案中,相对于SEQ ID NO:18,终止子包括不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸置换、插入、添加或缺失。在一些实施方案中,终止子包括与SEQ ID NO:19至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。在一些实施方案中,相对于SEQ ID NO:19,终止子包括不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸置换、插入、添加或缺失。在一些实施方案中,终止子包括与SEQ ID NO:20至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。在一些实施方案中,相对于SEQ ID NO:20,终止子包括不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸置换、插入、添加或缺失。
VCE和/或VCE亚基的表达还可以通过增强子的存在而至少部分增加。
当编码序列和调控序列共价连接和/或编码序列的表达或转录受到调控序列的影响或控制时,编码序列和调控序列被称为“可操作地连接(operably joined)”或“可操作地连接(operably linked)”。在一些实施方案中,启动子(如Ptac或其功能性片段、或者P(T5)2xlacO或其功能性片段)可操作地连接至一个或更多个编码VCE亚基D1和/或D12的核酸。在一些实施方案中,启动子(如Ptac或其功能性片段、或者P(T5)2xlacO或其功能性片段)与一个或更多个RBS可操作地连接至一个或更多个编码VCE亚基D1和/或D12的核酸。在一些实施方案中,启动子(如Ptac或其功能性片段、或者P(T5)2xlacO或其功能性片段)与一个或更多个RBS可操作地连接至一个或更多个编码VCE亚基D1和/或D12的核酸。在一些实施方案中,启动子(如SEQ ID NO:8或SEQ ID NO:9或者其功能性片段)可操作地连接至一个或更多个编码VCE亚基D1和/或D12的核酸。
可以通过本领域已知的任何方法将本申请中描述的核酸并入任何适当的运载体中。例如,运载体可以是表达载体(包含但不限于病毒运载体(例如,慢病毒运载体、逆转录病毒运载体、腺病毒运载体、或腺相关病毒运载体)、适合于瞬时表达的任何运载体、适合于组成型表达的任何运载体、或者适合于诱导型表达的任何运载体(例如,乳糖和/或半乳糖诱导型运载体或强力霉素诱导型运载体))。可以使用本领域已知的任何方法将本申请中描述的运载体引入合适的宿主细胞中。
在一些实施方案中,运载体在细胞中自主复制。在一些实施方案中,自主复制的运载体包括DNA复制的起点;如果起点需要,可以在运载体和/或宿主细胞染色体上提供编码复制酶和/或其他反式作用因子的基因。在一些实施方案中,自主复制的运载体可以包括载体稳定保持在细胞中所需的顺式作用区;如果运载体的稳定维持需要,可以在运载体和/或宿主细胞染色体上提供编码反式作用因子(一个或多个)的基因(一个或多个)。在一些实施方案中,将运载体整合到细胞内的染色体中(例如,自杀运载体)。运载体可以含有一个或更多个核酸内切酶限制性位点,核酸内切酶限制位点可以被限制性核酸内切酶切割以插入和连接含有本申请中描述的基因的核酸,以产生能够在细胞中复制的重组运载体。运载体可以由DNA或RNA组成。克隆运载体包含(但不限于):质粒、F黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。如本申请中所使用的,术语“表达运载体”或“表达构建体”指重组或合成生成的、具有一系列容许特定核酸在宿主细胞(例如,微生物)(如酵母细胞)中转录的指定核酸元件的核酸构建体。在一些实施方案中,将本申请中描述的基因的核酸序列插入克隆运载体中,使得其可操作地连接至调控序列,并且在一些实施方案中表达为RNA转录物。在一些实施方案中,运载体含有一种或更多种标志物(如本申请中描述的可选择的标志物),以鉴别用重组运载体转化或转染的细胞。
在一些实施方案中,本申请中描述的基因的核酸序列被重新编码。如本公开中所使用的,“重新编码的”核酸序列指相对于参考核酸序列,通过用同义密码子交换一个或更多个密码子而被修饰的核酸序列。在一些实施方案中,一个或更多个密码子与同义密码子的交换是基于核酸在其中将被异源表达的生物体或宿主细胞优先使用的密码子的选择。相对于未经重新编码的参考序列,重新编码可以将基因产物的产生增加至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100(包含之间的所有数值)。适合于宿主细胞内一种或更多种基因的诱导表达的一种或更多种适当的运载体的选择和设计是在本领域普通技术人员的能力范围之内。含有表达必需元件的表达运载体是可商业获得的,并且是本领域普通技术人员已知的(参见,例如,Sambrook etal.,Molecular Cloning:A Laboratory Manual,Fourth Edition,Cold Spring HarborLaboratory Press,2012)。
VCE的产生
本申请中描述的任何核酸、蛋白质、宿主细胞和方法均可用于VCE的产生。一般而言,术语“产生”用于指,例如由特定核酸,生成一种或更多种产物(例如,感兴趣的VCE亚基D1和/或D12、和/或VCE)。可以使用本领域普通技术人员熟悉的度量标准在途径的任何一个或更多个步骤(如,最终产物或中间产物)处评估VCE的产生量。可以通过本领域已知的任何度量标准来评估产生,例如通过评估一种或更多种产物(例如,感兴趣的产物和/或副产物/非产物)的体积产率、酶动力学/反应速率、比生产率、生物质比生产率、滴度、产量和总滴度。
在一些实施方案中,用于测量产生的度量标准可以取决于是否正在监测连续过程或者是否正在测量特定的最终产物。例如,在一些实施方案中,用于监测连续过程的产生的度量标准可以包含体积生产率、酶动力学和反应速率。在一些实施方案中,用于监测特定产物的产生的度量标准可以包含一种或更多种产物(例如,感兴趣的产物和/或副产品/非产物)的比生产率、生物质比生产率、滴度、产量和总滴度。术语“体积生产率”或“生产率”指每单位时间每体积培养基形成的产物量。体积生产率可以以克每升每小时(g/L/h)为单位报告。
术语产物的“比生产率”指按单位体积或质量或生物量归一化的产物形成速率,并具有每单位时间每单位质量或体积的物质数量的物理量纲[M·T-1·M-1或M·T-1·L-3,其中M是质量或摩尔,T是时间,L是长度]。
术语“生物质比生产率”是指以克产物每克细胞干重(CDW)每小时(g/g CDW/h)或以mmol产物每克细胞干重(CDW)每小时(mmol/g CDW/h)为单位的比生产率。使用给定微生物的CDW与OD600的关系,比生产率也可以表示为克产物每升培养基在600nm(OD)每小时下培养液的光密度(g/L/h/OD)。此外,如果生物质的元素组成已知,则生物质比生产率可以表示为每小时每C-摩尔(碳摩尔)生物质的mmol产物(mmol/C-mol/h)。
术语“产量”指每单位重量某种底物获得的产物的量,并且可以表示为g产物/g底物(g/g)或产物摩尔数/底物摩尔数(mol/mol)。产量也可以表示为理论产量的百分比。“理论产量”被定义为每给定数量的底物可以生成的最大产物量(如由用于制造产物的代谢途径的化学计量决定),并且可以表示为g产物/g底物(g/g)或产物摩尔数/底物摩尔数(mol/mol)。
术语“滴度”指溶液的强度或溶液中物质的浓度。例如,发酵液中感兴趣的产物(例如,小分子、肽、合成化合物、燃料、酒精等)的滴度被描述为每升发酵液或无细胞液的溶液中感兴趣的产物的g(g/L),或每kg发酵液或无细胞液的溶液中感兴趣的产物的g(g/Kg)。
术语“总滴度”指在一过程中产生的所有感兴趣的产物的总和,包含但不限于溶液中的感兴趣的产物、气相中的感兴趣的产物(如果适用)以及从过程中去除的任何感兴趣的产物以及相对于过程中的初始体积或过程中的操作体积而言回收的任何感兴趣的产物。例如,发酵液中感兴趣的产物(例如,小分子、肽、合成化合物、燃料、酒精等)的总滴度被描述为每升发酵液或无细胞液的溶液中感兴趣的产物的g(g/L)或每kg发酵液或无细胞液的溶液中感兴趣的产物的g(g/Kg)。
在一些实施方案中,本申请中描述的宿主细胞可以产生至少10mg/L、50mg/L、100mg/L、150mg/L、200mg/L、250mg/L、300mg/L、350mg/L、400mg/L、450mg/L、500mg/L、550mg/L、600mg/L、650mg/L、700mg/L、750mg/L、800mg/L、850mg/L、900mg/L、950mg/L、1000mg/L、1050mg/L、1100mg/L、1150mg/L、1200mg/L、1250mg/L、1300mg/L、1350mg/L、1400mg/L、1450mg/L、1500mg/L、1550mg/L或1600mg/L的VCE的滴度。在一些实施方案中,本申请中描述的宿主细胞对于VCE的产生展现出至少1.0mg/L/h、1.5mg/L/h、2.0mg/L/h、2.5mg/L/h、3.0mg/L/h、3.5mg/L/h、4.0mg/L/h、4.5mg/L/h、5.0mg/L/h、5.5mg/L/h、6.0mg/L/h、6.5mg/L/h、7.0mg/L/h、7.5mg/L/h、8.0mg/L/h、8.5mg/L/h、9.0mg/L/h、9.5mg/L/h、10.0mg/L/h、10.5mg/L/h、11.0mg/L/h、11.5mg/L/h的生产率。在一些实施方案中,滴度为大约550mg/L。在一些实施方案中,生产率为大约10mg/L/h。在一些实施方案中,宿主细胞能够比对照宿主细胞多产生1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍或10倍的VCE。在一些实施方案中,对照宿主细胞是不异源表达一种或更多种编码VCE亚基D1和/或D12的核酸的细胞。在一些实施方案中,对照宿主细胞是野生型细胞(如野生型E.coli细胞)。在一些实施方案中,对照宿主细胞包括与测试细胞相同的编码VCE亚基D1和/或D12的核酸,但是包括不同的调控序列,该调控序列控制一个或更多个编码VCE亚基D1和/或D12的核酸的表达。
附加的细胞修改
在一些实施方案中,宿主细胞中VCE的产生可以导致粘度的增加和/或发酵减缓。不希望受任何理论的束缚,这些效果可以由细胞伸长引起。在一些实施方案中,一个或更多个基因的表达在宿主细胞中被增加,以抵消VCE的产生的影响。
在一些实施方案中,编码FtsZ蛋白的基因的表达在宿主细胞中被增加,以抵消VCE的产生的影响。E.coli FtsZ蛋白是细胞尺寸的重要调控因子。FtsZ蛋白受细胞内腺苷甲硫氨酸(SAM)和鸟苷三磷酸(GTP)的水平的影响。SAM和GTP两者是VCE的已知的底物。不希望受任何理论的束缚,VCE过表达可以阻碍天然ftsZ的体内平衡,从而造成细胞伸长和粘度增加。
E.coli FtsZ蛋白的氨基酸序列对应于UniProt登录号P0A9A6并且由SEQ ID NO:39提供。在一些实施方案中,与本公开相关的FtsZ蛋白包括与下列中的任意者至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列:SEQ ID NO:39或其保守置换版本;或本申请中另外描述的或本领域已知的FtsZ序列。
E.coli FtsZ蛋白由在GenBank登录号CP001509.3可获得的核酸序列(其对应于E.coli BL21(DE3)基因组序列)编码。在一些实施方案中,编码FtsZ蛋白的核酸包括SEQ IDNO:42的序列。在一些实施方案中,编码FtsZ蛋白的核酸被重新编码。在一些实施方案中,编码FtsZ蛋白的核酸包括与SEQ ID NO:42或本申请中另外描述的或本领域已知的FtsZ序列至少40%、45%、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。
在一些实施方案中,宿主细胞表达在其天然启动子的控制下的ftsZ基因的内源性拷贝。在一些实施方案中,表达在其天然启动子的控制下的ftsZ基因的内源性拷贝的宿主细胞还表达编码FtsZ蛋白的附加核酸的一个或更多个拷贝。在一些实施方案中,编码FtsZ蛋白的附加核酸的一个或更多个拷贝在质粒上表达或者被整合到宿主细胞的基因组中。在一些实施方案中,在一个或更多个合成启动子的控制下表达编码FtsZ蛋白的附加核酸的一个或更多个拷贝。FtsZ蛋白在天然启动子或合成启动子的控制下的翻译,可以通过RBS的存在至少部分被增强。本公开的方面涉及过表达编码FtsZ蛋白的基因的宿主细胞。应当理解的是,本公开预期了用于增加编码FtsZ蛋白的基因的表达的任何机制。例如,宿主细胞可以具有编码FtsZ蛋白的基因的增加的拷贝数,和/或基因的一个或更多个拷贝可以受强启动子(相对于其天然启动子,强启动子增加基因的表达)的调控。在一些实施方案中,编码FtsZ蛋白的基因的增加的拷贝数通过在一个或更多个质粒上表达一个或更多个拷贝实现。在其他实施方案中,编码FtsZ蛋白的基因的增加的拷贝数通过将基因的一个或更多个拷贝整合到染色体中而实现。
在一些实施方案中,相对于不过表达编码FtsZ蛋白的基因的宿主细胞,过表达编码FtsZ蛋白的基因的宿主细胞展现出降低的细胞伸长和/或降低的粘度。在一些实施方案中,相对于不过表达编码FtsZ蛋白的基因的宿主细胞,过表达编码FtsZ蛋白的基因的VCE产生菌株展现出降低的细胞伸长和/或降低的粘度。
在一些实施方案中,编码SAM合成酶的metK基因的表达在宿主细胞中被增加,以抵消VCE的产生的影响。E.coli MetK蛋白的氨基酸序列对应于UniProt登录号P0A817并且由SEQ ID NO:40提供。在一些实施方案中,与本公开相关的MetK蛋白包括与下列中的任意者至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列:SEQ ID NO:40或其保守置换版本;或本申请中另外描述的或本领域已知的MetK序列。
E.coli MetK蛋白由在GenBank登录号CP001509.3可获得的核酸序列(其对应于E.coli BL21(DE3)基因组序列)编码。在一些实施方案中,编码MetK蛋白的核酸包括SEQ IDNO:43的序列。在一些实施方案中,编码MetK蛋白的核酸被重新编码。在一些实施方案中,编码MetK蛋白的核酸包括与SEQ ID NO:43或本申请中另外描述的或本领域已知的MetK序列至少40%、45%、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。
在一些实施方案中,宿主细胞表达在其天然启动子的控制下的metK基因的内源性拷贝。在一些实施方案中,表达在其天然启动子的控制下的metK基因的内源性拷贝的宿主细胞还表达编码MetK蛋白的附加核酸的一个或更多个拷贝。在一些实施方案中,编码MetK蛋白的附加核酸的一个或更多个拷贝在质粒上表达或者被整合到宿主细胞的基因组中。在一些实施方案中,在一个或更多个合成启动子的控制下表达编码MetK蛋白的附加核酸的一个或更多个拷贝。MetK蛋白在天然启动子或合成启动子的控制下的翻译可以通过RBS的存在至少部分被增强。
本公开的方面涉及过表达编码MetK蛋白的基因的宿主细胞。应当理解的是,本公开预期了用于增加编码MetK蛋白的基因的表达的任何机制。例如,宿主细胞可以具有编码MetK蛋白的基因的增加的拷贝数,和/或基因的一个或更多个拷贝可以受强启动子(相对于其天然启动子,强启动子增加基因的表达)的调控。在一些实施方案中,编码MetK蛋白的基因的增加的拷贝数通过在一个或更多个质粒上表达一个或更多个拷贝实现。在其他实施方案中,编码MetK蛋白的基因的增加的拷贝数通过将基因的一个或更多个拷贝整合到染色体中而实现。
在一些实施方案中,相对于不过表达编码MetK蛋白的基因的宿主细胞,过表达编码MetK蛋白的基因的宿主细胞展现出降低的细胞伸长和/或降低的粘度。在一些实施方案中,相对于不过表达编码MetK蛋白的基因的宿主细胞,过表达编码MetK蛋白的基因的VCE产生菌株展现出降低的细胞伸长和/或降低的粘度。
在一些实施方案中,mreB基因的表达在宿主细胞中被增加,以抵消VCE的产生的影响。E.coli MreB蛋白的氨基酸序列对应于UniProt登录号P0A9X4并且由SEQ ID NO:41提供。在一些实施方案中,与本公开相关的MreB蛋白包括与下列中的任意者至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列:SEQ ID NO:41或其保守置换版本;或本申请中另外描述的或本领域已知的MreB序列。
E.coli MreB蛋白由在GenBank登录号CP001509.3可获得的核酸序列(其对应于E.coli BL21(DE3)基因组序列)编码。在一些实施方案中,编码MreB蛋白的核酸包括SEQ IDNO:44的序列。在一些实施方案中,编码MreB蛋白的核酸被重新编码。在一些实施方案中,编码MreB蛋白的核酸包括与SEQ ID NO:44或本申请中另外描述的或本领域已知的MreB序列至少40%、45%、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致或者100%一致(包含之间的所有数值)的序列。
在一些实施方案中,宿主细胞表达在其天然启动子的控制下的mreB基因的内源性拷贝。在一些实施方案中,表达在其天然启动子的控制下的mreB基因的内源性拷贝的宿主细胞还表达编码MreB蛋白的附加核酸的一个或更多个拷贝。在一些实施方案中,编码MreB蛋白的附加核酸的一个或更多个拷贝在质粒上表达或者被整合到宿主细胞的基因组中。在一些实施方案中,在一个或更多个合成启动子的控制下表达编码MreB蛋白的附加核酸的一个或更多个拷贝。MreB蛋白在天然启动子或合成启动子的控制下的翻译可以通过RBS的存在至少部分被增强。
本公开的方面涉及过表达编码MreB蛋白的基因的宿主细胞。应当理解的是,本公开预期了用于增加编码MreB蛋白的基因的表达的任何机制。例如,宿主细胞可以具有编码MreB蛋白的基因的增加的拷贝数,和/或基因的一个或更多个拷贝可以受强启动子(相对于其天然启动子,强启动子增加基因的表达)的调控。在一些实施方案中,编码MreB蛋白的基因的增加的拷贝数通过在一个或更多个质粒上表达一个或更多个拷贝实现。在其他实施方案中,编码MreB蛋白的基因的增加的拷贝数通过将基因的一个或更多个拷贝整合到染色体中而实现。
在一些实施方案中,相对于不过表达编码MreB蛋白的基因的宿主细胞,过表达编码MreB蛋白的基因的宿主细胞展现出降低的细胞伸长和/或降低的粘度。在一些实施方案中,相对于不过表达编码MreB蛋白的基因的宿主细胞,过表达编码MreB蛋白的基因的VCE产生菌株展现出降低的细胞伸长和/或降低的粘度。
本申请中描述的宿主细胞可以在补充有S-腺苷甲硫氨酸(SAM)和/或鸟苷三磷酸(GTP)相关代谢物添加到发酵液中的条件下培养。SAM相关代谢物和GTP相关代谢物(例如,SAM、半胱氨酸、甲硫氨酸、丝氨酸、腺嘌呤、鸟嘌呤、腺苷和鸟苷)是本领域已知的并在本文中被预期。在一些实施方案中,相对于未在补充有S-腺苷甲硫氨酸(SAM)和/或鸟苷三磷酸(GTP)相关代谢物添加到发酵液中的条件下培养的宿主细胞,在补充有S-腺苷甲硫氨酸(SAM)和/或鸟苷三磷酸(GTP)相关代谢物添加到发酵液中的条件下培养的宿主细胞展现出降低的细胞伸长和/或降低的粘度。在一些实施方案中,相对于未在补充有S-腺苷甲硫氨酸(SAM)和/或鸟苷三磷酸(GTP)相关代谢物添加到发酵液中的条件下培养的VCE产生菌株,在补充有S-腺苷甲硫氨酸(SAM)和/或鸟苷三磷酸(GTP)相关代谢物添加到发酵液中的条件下培养的VCE产生菌株展现出降低的细胞伸长和/或降低的粘度。
本申请中描述的宿主细胞可以包括下列中的一种或更多种:FtsZ、MetK、和/或MreB和/或编码这样的蛋白质的核酸。在一些实施方案中,宿主细胞包括编码包括SEQ IDNO:39、SEQ ID NO:40和/或SEQ ID NO:41的氨基酸序列的FtsZ、MetK和/或MreB蛋白的核酸,和/或编码FtsZ、MetK和/或MreB的核酸。在一些实施方案中,相对于对照,宿主细胞过表达FtsZ、MetK和/或MreB。在一些实施方案中,相对于对照宿主细胞,过表达FtsZ、MetK和/或MreB的宿主细胞具有减小的细胞伸长、减小的粘度和/或减小的毒性。
变体
本公开的方面涉及核酸(包含编码多肽的核酸)。本公开也涵盖本申请中描述的核酸和多肽的变体。变体可以与参考序列共有至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%(包含之间的所有数值)的序列一致性。
除非另外指出,否则如本领域已知的,在本公开中与术语“百分比一致性”可互换的使用的术语“序列一致性”指通过序列比较(比对)确定的两个多肽或多核苷酸的序列之间的关系。在一些实施方案中,在序列的整个长度上确定序列一致性。在一些实施方案中,在序列的区(例如,氨基酸或核酸的段,例如,跨越活性位点的序列)上确定序列一致性。例如,在一些实施方案中,在与参考序列的长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或超过100%对应的区上确定序列一致性。
一致性测量具有由特定数学模型、算法或计算机程序解决的空位比对(如果有的话)的两个或更多个序列中的较小序列之间一致匹配的百分比。可以通过本领域普通技术人员已知的方法中的任何一种容易地计算相关多肽或核酸序列的一致性。可以例如使用Karlin and Altschul Proc.Natl.Acad.Sci.USA 87:2264-68,1990的算法、Karlin andAltschul Proc.Natl.Acad.Sci.USA 90:5873-77,1993中修改的算法来确定两个序列(例如,核酸序列或氨基酸序列)的“百分比一致性”。这样的算法被并入Altschul et al.,J.Mol.Biol.215:403-10,1990的程序和/>程序(版本2.0)。例如,可以用XBLAST程序(评分=50,字长=3)进行/>蛋白质搜索,以获得与本申请中描述的蛋白质同源的氨基酸序列。在两个序列之间存在空位的情况下,例如,如Altschul et al.,Nucleic Acids Res.25(17):3389-3402,1997中所描述的,可以利用Gapped/>当利用/>程序和Gapped/>程序时,如本领域普通技术人员将理解的,可以使用各自程序(例如,/>和/>)的系统内定参数,或者可以适当地调整参数。
例如,可以使用的另外的局部比对技术基于史密斯-沃特曼算法(Smith,T.F.&Waterman,M.S.(1981)“Identification of common molecular subsequences.”J.Mol.Biol.147:195-197)。例如,可以使用的通用全局比对技术是基于动态编程的尼德曼-翁施算法(Needleman,S.B.&Wunsch,C.D.(1970)“A general method applicable tothe search for similarities in the amino acid sequences of two proteins.”J.Mol.Biol.48:443-453)。
最近,开发了一种快速最优全局序列比对算法(FOGSAA),据称该算法比其他最优全局比对方法(包含尼德曼-翁施算法)更快地产生核酸序列和氨基酸序列的全局比对。在一些实施方案中,通过比对两个氨基酸序列、计算相同氨基酸的数量、并且除以氨基酸序列之一的长度来确定两个多肽的百分比一致性。在一些实施方案中,通过比对两个核苷酸序列并且计算相同核苷酸的数量并且除以核酸之一的长度来确定两个核酸的百分比一致性。
在优选实施方案中,当使用Karlin and Altschul Proc.Natl.Acad.Sci.USA 87:2264-68,1990(如在Karlin and Altschul Proc.Natl.Acad.Sci.USA 90:5873-77,1993中修改的)的算法(例如,程序、/>程序、/>程序或Gapped/>程序,使用各程序的默认参数)确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本申请中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
在一些实施方案中,当使用史密斯-沃特曼算法(Smith,T.F.&Waterman,M.S.(1981)“Identification of common molecular subsequences.”J.Mol.Biol.147:195-197)或尼德曼-翁施算法(Needleman,S.B.&Wunsch,C.D.(1970)“A general methodapplicable to the search for similarities in the amino acid sequences of twoproteins.”J.Mol.Biol.48:443-453)使用默认参数确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本申请中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
在一些实施方案中,当使用快速最优全局序列比对算法(FOGSAA)使用默认参数确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本申请中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
在一些实施方案中,当使用Clustal Omega(Sievers et al.,Mol SystBiol.2011Oct 11;7:539)使用默认参数确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本申请中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
如本申请中所使用的,当使用本领域已知的氨基酸序列比对工具比对序列X和序列Y且当序列“X”中的残基在序列“Y”中的“n”的对应位置处时,序列“X”中的残基(如核酸残基或氨基酸残基)被称为对应于不同序列“Y”中的位置或残基(如核酸残基或氨基酸残基)“n”。
变体序列可以是同源序列。如本申请中所使用的,同源序列是共有一定百分比一致性(例如,至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)百分比一致性)的序列(例如,核酸序列或氨基酸序列),并且包含但不限于旁系同源序列、直系同源序列、或者来源于趋同进化的序列。旁系同源序列由物种的基因组内的基因的复制产生,而直系同源序列在物种形成事件之后趋异。由于趋同进化,两个不同物种可能已经独立地进化,但可能各自包括与来自其他物种的序列共有一定百分比一致性的序列。
在一些实施方案中,多肽变体包括与参考多肽共有二级结构(例如,α螺旋、β片层)的域。在一些实施方案中,多肽变体与参考多肽共有三级结构。作为非限制性实例,变体多肽与参考多肽相比可以具有低初级序列一致性(例如,小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、或小于5%的序列一致性),但共有一个或更多个二级结构(例如,包含但不限于环、α螺旋或β片层),或者具有与参考多肽相同的三级结构。例如,环可以位于β片层与α螺旋之间、两个α螺旋之间、或两个β片层之间。同源建模可以用于比较两个或更多个三级结构。
本公开涵盖了酶的功能变体。例如,功能变体可以结合相同底物中的一种或更多种或者产生相同产物中的一种或更多种。可以使用本领域已知的任何方法鉴别功能变体。例如,上文描述的Karlin and Altschul Proc.Natl.Acad.Sci.USA 87:2264-68,1990的算法可以用于鉴别具有已知功能的同源蛋白质。
也可以通过搜索具有功能注释域的多肽鉴别推定的功能变体。数据库(包含Pfam(Sonnhammer et al.,Proteins.1997Jul;28(3):405-20))可以用于鉴别具有特定域的多肽。
同源建模也可以用于鉴别适合突变而不影响功能的氨基酸残基。这样的方法的非限制性实例可以包含位置特异性评分矩阵(position-specific scoring matrix)(PSSM)和能量最小化协议的使用。位置特异性评分矩阵(PSSM)使用位置权重矩阵来鉴别共有序列(例如,基序)。可以在核酸序列或氨基酸序列上进行PSSM。比对序列,并且方法考虑在特定位置处观察到的特定残基(例如,氨基酸或核苷酸)的频率和所分析的序列的数量。参见,例如,Stormo et al.,Nucleic Acids Res.1982May 11;10(9):2997-3011。可以计算在给定位置处观察到特定残基的可能性。不受特定理论的束缚,具有高变异性的序列中的位置可以适合突变(例如,PSSM评分≥0)以产生功能同系物。
PSSM可以与Rosetta能量函数的计算配对,Rosetta能量函数确定野生型与单点突变体之间的差异。Rosetta能量函数将该差异计算为(ΔΔGcalc)。利用Rosetta函数,突变的残基与周围原子之间的键合相互作用被用于确定突变是提高还是降低蛋白质稳定性。例如,然后可以使用Rosetta能量函数分析由PSSM评分(例如,PSSM评分≥0)指定为有利的突变,以确定突变对蛋白质稳定性的潜在影响。不受特定理论的束缚,潜在稳定化的突变对于蛋白质工程(例如,功能同系物的产生)是期望的。在一些实施方案中,潜在稳定化的突变具有小于-0.1(例如,小于-0.2、小于-0.3、小于-0.35、小于-0.4、小于-0.45、小于-0.5、小于-0.55、小于-0.6、小于-0.65、小于-0.7、小于-0.75、小于-0.8、小于-0.85、小于-0.9、小于-0.95、或小于-1.0)Rosetta能量单位(R.e.u.)的ΔΔGcalc值。参见,例如,Goldenzweig etal.,Mol Cell.2016Jul 21;63(2):337-346.Doi:10.1016/j.molcel.2016.06.012。
在一些实施方案中,相对于参考编码序列,编码序列包括在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或超过100个位置处的突变。在一些实施方案中,相对于参考编码序列,编码序列包括在编码序列的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个密码子中的突变。如本领域普通技术人员将理解的,由于遗传码的简并性,密码子内的突变可以改变由密码子编码的氨基酸或者可以不改变由密码子编码的氨基酸。在一些实施方案中,相对于参考多肽的氨基酸序列,编码序列中的一个或更多个突变不改变编码序列的氨基酸序列。
在一些实施方案中,相对于参考多肽的氨基酸序列,编码序列中的一个或更多个突变改变对应多肽的氨基酸序列。在一些实施方案中,相对于参考多肽的氨基酸序列,一个或更多个突变改变多肽的氨基酸序列,并且相对于参考多肽改变(增强或降低)多肽的活性。
可以使用常规方法测量本申请中描述的多肽(例如,VCE)中任何一种的活性(例如,比活性)。作为非限制性实例,可以通过测量多肽的底物特异性、产生的一种或多种产物、产生的一种或多种产物的浓度、或其任何组合来确定多肽的活性。如本申请中所使用的,重组多肽的“比活性”指每单位时间针对给定量(例如,浓度)的重组多肽产生的特定产物的量(例如,浓度)。
本领域技术人员还将认识到,多肽编码序列中的突变可以造成保守氨基酸置换,以提供前述多肽的功能等效变体(例如,保留多肽的活性的变体)。保守置换可以不改变进行氨基酸置换的蛋白质的相对电荷特性或尺寸特性或功能活性。
在一些情况下,氨基酸的特征在于其R基团(参见,例如,表1)。例如,氨基酸可以包括非极性脂族R基团、带正电荷的R基团、带负电荷的R基团、非极性芳族R基团、或极性不带电荷的R基团。包括非极性脂族R基团的氨基酸的非限制性实例包含丙氨酸、甘氨酸、缬氨酸、亮氨酸、甲硫氨酸和异亮氨酸。包括带正电荷的R基团的氨基酸的非限制性实例包含赖氨酸、精氨酸和组氨酸。包括带负电荷的R基团的氨基酸的非限制性实例包含天门冬氨酸盐和谷氨酸盐。包括非极性芳族R基团的氨基酸的非限制性实例包含苯丙氨酸、酪氨酸和色氨酸。包括极性不带电荷的R基团的氨基酸的非限制性实例包含丝氨酸、苏氨酸、半胱氨酸、脯氨酸、天门冬酰胺和谷氨酰胺。
多肽的功能等效变体的非限制性实例可以包含本申请中公开的蛋白质的氨基酸序列中的保守氨基酸置换。如本申请中所使用的,“保守置换”与“保守氨基酸置换”可互换地使用,并且指表1中提供的氨基酸置换中的任何一种。
在一些实施方案中,在制备变体多肽时,可以改变1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或超过20个残基。在一些实施方案中,氨基酸被保守氨基酸置换替代。
表1.保守氨基酸置换
原始残基 R基团类型 保守氨基酸置换
Ala 非极性脂族R基团 Cys、Gly、Ser
Arg 带正电荷的R基团 His、Lys
Asn 极性不带电荷的R基团 Asp、Gln、Glu
Asp 带负电荷的R基团 Asn、Gln、Glu
Cys 极性不带电荷的R基团 Ala、Ser
Gln 极性不带电荷的R基团 Asn、Asp、Glu
Glu 带负电荷的R基团 Asn、Asp、Gln
Gly 非极性脂族R基团 Ala、Ser
His 带正电荷的R基团 Arg、Tyr、Trp
Ile 非极性脂族R基团 Leu、Met、Val
Leu 非极性脂族R基团 Ile、Met、Val
Lys 带正电荷的R基团 Arg、His
Met 非极性脂族R基团 Ile、Leu、Phe、Val
Pro 极性不带电荷的R基团
Phe 非极性芳族R基团 Met、Trp、Tyr
Ser 极性不带电荷的R基团 Ala、Gly、Thr
Thr 极性不带电荷的R基团 Ala、Asn、Ser
Trp 非极性芳族R基团 His、Phe、Tyr、Met
Tyr 非极性芳族R基团 His、Phe、Trp
Val 非极性脂族R基团 Ile、Leu、Met、Thr
可以通过改变多肽的编码序列来进行多肽的氨基酸序列中的氨基酸置换以产生具有期望性质和/或活性的重组多肽变体。类似地,通常通过改变重组多肽的编码序列来进行多肽的氨基酸序列中的保守氨基酸置换以产生多肽的功能等效变体。
可以通过本领域普通技术人员已知的多种方法在核苷酸序列中进行突变。例如,可以通过PCR定向突变、根据Kunkel的方法(Kunkel,Proc.Nat.Acad.Sci.U.S.A.82:488-492,1985)的定点突变、通过编码多肽的基因的化学合成、通过基因编辑技术、或者通过插入(如标签(例如,HIS标签或GFP标签)的插入)来进行突变。如本公开中所使用的,“标签”指添加到感兴趣的核酸或蛋白质序列中的序列。可以出于多种目的添加标签,如用于检测、纯化和/或定位感兴趣的核酸或蛋白质。在一些实施方案中,将接头序列插入感兴趣的核酸或蛋白质的序列与标签的序列之间。在一些实施方案中,在感兴趣的核酸或蛋白质的序列与标签的序列之间插入裂解位点。在一些实施方案中,裂解位点是TEV裂解位点。
突变可以包含例如通过本领域已知的任何方法生成的置换、缺失、插入、添加、选择性编辑、截断和易位。作为非限制性实例,可以通过基因替换(例如,用标记,包括选择标记)删除基因。也可以通过使用转座子系统截断基因(参见,例如Poussu et al.,NucleicAcids Res.2005;33(12):e104)。也可以通过使用本领域已知的基因编辑技术(如基于CRISPR的技术)来编辑基因。可以在参考文献(如Molecular Cloning:ALaboratoryManual,J.Sambrook,et al.,eds.,Fourth Edition,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,New York,2012或者Current Protocols in MolecularBiology,F.M.Ausubel,et al.,eds.,John Wiley&Sons,Inc.,New York,2010)中找到用于产生突变的方法。
在一些实施方案中,用于产生变体的方法包含环状变换(Yu and Lutz,TrendsBiotechnol.2011Jan;29(1):18-25)。在环状变换中,可以环化多肽的线性一级序列(例如,通过连接序列的N末端和C末端),并且可以在不同位置处切断(“断裂”)多肽。因此,如由线性序列比对方法(例如,Clustal Omega或BLAST)所确定的,新多肽的线性一级序列可以具有低的序列一致性(例如,小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小或小于5%(包含之间的全部值))。然而,两种蛋白质的拓扑分析可以揭示两种多肽的三级结构类似或者不类似。不受特定理论的束缚,通过参考多肽的环状变换创建并且具有与参考多肽的三级结构类似的三级结构的变体多肽可以共有类似的功能特性(例如,酶活性、酶动力学、底物特异性或产物特异性)。在一些情况下,环状变换可以改变二级结构、三级结构或四级结构,并且产生具有不同功能特性(例如,提高或降低的酶活性、不同的底物特异性、或不同的产物特异性)的酶。参见,例如,Yu and Lutz,TrendsBiotechnol.2011Jan;29(1):18-25。
应当理解的是,在已经经历环状变换的蛋白质中,蛋白质的线性氨基酸序列将不同于尚未经历环状变换的参考蛋白质。然而,本领域普通技术人员将能够通过例如比对序列和检测保守基序、和/或通过比较蛋白质的结构或预测结构(例如,通过同源建模)容易地确定已经经历环状变换的蛋白质中的哪些残基对应于尚未经历环状变换的参考蛋白质中的残基。
在一些实施方案中,本申请中描述的确定感兴趣的序列与参考序列之间的百分比一致性的算法说明了序列之间的环状变换的存在。可以使用本领域已知的任何方法(包含,例如,RASPODOM(Weiner et al.,Bioinformatics.2005Apr 1;21(7):932-7))检测环状变换的存在。在一些实施方案中,在计算感兴趣的序列与本申请中描述的序列之间的百分比一致性之前,对环状变换的存在进行校正(例如,重排至少一个序列中的域)。应当理解本申请的权利要求包含在考虑序列的潜在环状变换后计算与参考序列的百分比一致性的序列。
宿主细胞
如本领域普通技术人员将理解的,用E.coli举例说明公开的方法和宿主细胞,但也适用于其他宿主细胞。
适合的宿主细胞包含(但不限于):细菌细胞、酵母细胞、藻类细胞、植物细胞、真菌细胞、昆虫细胞和动物细胞(包含哺乳动物细胞)。
在一些实施方案中,宿主细胞是原核细胞。适合的原核细胞包含革兰氏阳性细菌细胞、革兰氏阴性细菌细胞和革兰氏不定细菌细胞。在一些非限制性实施方案中,宿主细胞是下列物种:农杆菌属、脂环酸芽孢杆菌属(Alicyclobacillus)、鱼腥藻属、倒囊藻属、不动杆菌属、热酸菌属(Acidothermus)、节杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、短杆菌属、丁酸弧菌属、布赫纳氏菌属(Buchnera)、油菜属菌属(Campestris)、弯曲菌属、梭菌属、棒状杆菌属、着色菌属、粪球菌属、埃希氏菌属、肠球菌属、肠杆菌属、欧文氏菌属、梭杆菌属、粪杆菌属、弗朗西斯氏菌属、黄杆菌属、地芽孢杆菌属、嗜血杆菌属、螺杆菌属、克雷伯菌属、乳杆菌属、乳球菌属、泥杆菌属(Ilyobacter)、微球菌属、微杆菌属、中间根瘤菌属(Mesorhizobium)、甲基杆菌属、甲基杆菌属、分枝杆菌属、奈瑟氏菌属、泛菌属、假单胞菌属、原绿球藻(Prochlorococcus)、红细菌属、红假单胞菌属、红假单胞菌属、罗氏菌属(Roseburia)、红螺菌属、红球菌属、栅藻属、链霉菌属、链球菌属、聚球藻属(Synecoccus)、糖单孢菌属、糖多孢菌属、葡萄球菌属、沙雷氏菌属、沙门氏菌属、志贺氏菌属、嗜热厌氧杆菌属(Thermoanaerobacterium)、Tropheryma、Tularensis、Temecula、嗜热聚球藻属(Thermosynechococcus)、热球菌属(Thermococcus)、尿素原体(Ureaplasma)、黄杆菌属、小菌属(Xylella)、耶尔森氏菌属和发酵单胞菌属。在一些实施方案中,宿主细胞是谷氨酸棒状杆菌(Corynebacterium glutamicum)细胞。在一些实施方案中,宿主细胞是粘质沙雷氏菌(Serratia marcescens)细胞。在一些实施方案中,宿主细胞是大肠埃希氏杆菌。
在一些实施方案中,细菌宿主菌株是工业菌株。许多细菌工业菌株是已知的,并且适合于本申请中描述的方法和组合物。
在一些实施方案中,细菌宿主细胞是农杆菌属(例如,放射形农杆菌(A.radiobacter)、发根农杆菌(A.rhizogenes)、悬钩子农杆菌(A.rubi))、节杆菌属(例如,金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、原玻璃蝇节杆菌(A.protophonniae)、玫瑰色石蜡节杆菌(A.roseoparaffinus)、硫磺节杆菌(A.sulfureus)、产脲节杆菌(A.ureafaciens))、或者芽孢杆菌属(例如,苏云金芽孢杆菌(B.thuringiensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌(B.subtilis)、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulars)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、嗜碱芽孢杆菌(B.alkaophius)、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、耐盐芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌(B.amyloliquefaciens))。在特定实施方案中,宿主细胞是工业芽孢杆菌菌株(包含但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌)。在一些实施方案中,宿主细胞是工业梭菌属(例如,丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌E88(C.tetaniE88)、象牙海岸梭菌(C.lituseburense)、糖丁基梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)、拜氏梭菌(C.beijerinckii))。在一些实施方案中,宿主细胞是工业棒状杆菌属(例如,谷氨酸棒状杆菌(C.glutamicum)、嗜醋酸棒状杆菌(C.acetoacidophilum))。在一些实施方案中,宿主细胞是工业埃希氏菌属(例如,大肠埃希氏菌)。在一些实施方案中,宿主细胞是工业欧文氏菌属(例如,噬夏孢欧文氏菌(E.uredovora)、软腐欧文氏菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、斑点欧文氏菌(E.punctata)、E.terreus)。在一些实施方案中,宿主细胞是工业泛菌属(例如,柠檬泛菌(P.citrea)、成团泛菌(P.agglomerans))。在一些实施方案中,宿主细胞是工业假单胞菌属(例如,恶臭假单胞菌(P.putida)、绿脓假单胞菌(P.aeruginosa)、梅瓦隆假单胞菌(P.mevalonii))。在一些实施方案中,宿主细胞是工业链球菌属(例如,相似型链球菌(S.equisimiles)、酿脓链球菌(S.pyogenes)、乳房链球菌(S.uberis))。在一些实施方案中,宿主细胞是工业链霉菌属(例如,产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、阿维链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、金霉素链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)、变铅青链霉菌(S.lividans))。在一些实施方案中,宿主细胞是工业发酵单胞菌属(例如,运动发酵单胞菌(Z.mobilis)、解脂发酵单胞菌(Z.lipolytica))。
适合的酵母宿主细胞包含(但不限于):假丝酵母属、汉逊酵母属、酵母属、裂殖酵母属、毕赤酵母属、克鲁维酵母属和耶氏酵母属。在一些实施方案中,酵母细胞是大肠埃希氏菌、多形汉逊酵母、酿酒酵母、卡尔斯伯酵母(Saccaromyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、诺地酵母(Saccharomyces norbensis)、克鲁弗酵母(Saccharomyces kluyveri)、粟酒裂殖酵母、芬兰毕赤酵母(Pichia finlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichia kodamae、膜蹼毕赤酵母(Pichiamembranaefaciens)、仙人掌毕赤酵母(Pichia opuntiae)、巴斯德毕赤酵母(Pichiapastoris)、Pichia pseudopastoris、Pichia membranifaciens、Komagataellapseudopastoris、Komagataella pastoris、Komagataella kurtzmanii、Komagataellamondaviorum、耐热毕赤酵母(Pichia thermotolerans)、柳毕赤酵母(Pichiasalictaria)、栋树毕赤酵母(Pichia quercuum)、皮杰普氏毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、法夫驹形氏酵母(Komagataella phaffii)、Komagataella pastoris、乳酸克鲁维酵母(Kluyveromyces lactis)、白假丝酵母(Candida albicans)、博伊丁假丝酵母(Candida boidinii)或解脂耶氏酵母(Yarrowia lipolytica)。
在一些实施方案中,酵母菌株是工业多倍体酵母菌株。真菌细胞的其他非限制性实例包含获自曲霉属、青霉属、镰刀菌属、根霉属、支顶孢属、脉孢菌属、粪壳菌属、稻瘟菌属、异水霉属、黑粉菌属、葡萄孢属和木霉属的细胞。
在某些实施方案中,宿主细胞是藻类细胞(如衣藻属(例如,莱茵衣藻)和席藻属(席藻属ATCC29409))。
本公开也适合于与多种动物细胞类型(包含哺乳动物细胞,例如,人类细胞系(包含293细胞、海拉细胞、WI38细胞、PER.C6细胞和Bowes黑素瘤细胞)、小鼠细胞系(包含3T3、NS0、NS1、Sp2/0)、仓鼠细胞系(CHO、BHK)、猴细胞系(COS、FRhL、Vero)、牛(包含KOP-R、BT和MDBK)、马(包含EK)、昆虫细胞(例如夜蛾(包含Sf9和Sf21)、蚕蛾(包含BmN)、菜尺蠖(包含BTI-Tn-5B1-4)和普通果蝇(包含Schneider 2)和杂交瘤细胞系)使用。
在各种实施方案中,公众易于从多个培养物保藏中心(如美国典型培养物保藏中心(American Type Culture Collection)(ATCC)、德国微生物菌种保藏中心(DeutscheSammlung von Mikroorganismen and Zellkulturen GmbH)(DSM)、荷兰微生物菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)获取可以在本公开的实践中使用的菌株(包含原核菌株和真核菌株两者)。
如本申请中所使用的,术语“细胞”可以指单个细胞或细胞群体(如属于相同细胞系或菌株的细胞群体)。不应当将单数术语“细胞”的使用解释为明确地指单个细胞而不是细胞群体。相对于野生型对应物,宿主细胞可以包括基因修饰。
宿主细胞的培养
可以在接触和/或核酸的整合之前、在接触和/或核酸的整合期间、和/或在接触和/或核酸的整合之后在任何类型(富集的或基本的)和任何组成的培养基中培养本申请中公开的任何细胞。如本领域普通技术人员所理解的,可以通过常规实验优化培养物或培养过程的条件。在一些实施方案中,选择的培养基补充有各种组分。在一些实施方案中,优化补充组分的浓度和量。在一些实施方案中,通过常规实验优化培养基和生长条件(例如,pH、温度等)的其他方面。在一些实施方案中,优化培养基补充一种或更多种补充组分的频率、以及培养细胞的时间量。
可以在本领域已知且使用的培养容器中进行本申请中描述的细胞的培养。在一些实施方案中,充气反应容器(例如,搅拌釜反应器)用于培养细胞。在一些实施方案中,生物反应器或发酵器用于培养细胞。因此,在一些实施方案中,在发酵中使用细胞。如本申请中所使用的,术语“生物反应器”和术语“发酵器”可互换地使用,并且指在其中发生生物反应、生物化学反应和/或化学反应(涉及活生物体、活生物体的一部分和/或经分离或纯化的酶)的包围物或部分包围物。“大规模生物反应器”或“工业规模生物反应器”是用于以商业规模或准商业规模生成产物的生物反应器。大型生物反应器通常具有在升、数百升、数千升、或更大范围内的体积。
生物反应器的非限制性实例包含:搅拌釜发酵器、通过旋转混合装置搅动的生物反应器、恒化器、通过振动装置搅动的生物反应器、气升式发酵器、填充床反应器、固定床反应器、流化床生物反应器、采用波诱导的搅动的生物反应器、离心生物反应器、滚瓶、旋转式细胞培养系统、以及中空纤维生物反应器、滚转器设备(例如,台式种类、推车安装式种类、和/或自动化种类)、竖直堆叠的板、旋转瓶、搅拌瓶或摇动瓶、振动的多孔板、MD瓶、方瓶、洛克斯氏瓶、多表面组织培养繁殖器、改良的发酵器、以及经涂覆的珠(例如,用血清蛋白、硝化纤维素或羧甲基纤维素涂覆的珠以防止细胞附着)。
在一些实施方案中,生物反应器包含细胞培养系统,其中宿主细胞与运动的液体和/或气泡接触。在一些实施方案中,细胞或细胞培养物悬浮生长。在其他实施方案中,细胞或细胞培养物附着于固相载体。载体系统的非限制性实例包含微载体(例如,可以是多孔或无孔的聚合物球、微珠和微盘)、带有特定化学基团(例如,叔胺基团)的交联珠(例如,右旋糖酐)、2D微载体(包含捕获在无孔聚合物纤维中的细胞)、3D载体(例如,载体纤维、中空纤维、多筒反应器(multicartridge reactor)、以及可以包括多孔纤维的半渗透膜)、具有降低的离子交换能力的微载体、微囊化细胞、毛细管、以及聚集体。在一些实施方案中,由材料(如右旋糖酐、明胶、玻璃、或纤维素)制造载体。
在一些实施方案中,以连续模式、半连续模式或非连续模式操作工业规模的过程。操作模式的非限制性实例是分批、补料分批(fed batch)、扩展分批(extended batch)、重复分批(repetitive batch)、抽取/填充、旋转壁、旋转瓶、和/或灌注操作模式。在一些实施方案中,生物反应器允许连续或半连续补充底物原料(例如,碳水化合物来源)和/或从生物反应器连续或半连续分离产物。
在一些实施方案中,生物反应器或发酵器包含传感器和/或控制系统以测量和/或调整反应参数。反应参数的非限制性实例包含生物学参数(例如,生长速率、细胞尺寸、细胞数量、细胞密度、细胞类型、或细胞状态等)、化学参数(例如,pH、氧化还原电位、反应底物和/或产物的浓度、溶解的气体的浓度(如氧气浓度和CO2浓度)、营养物浓度、代谢物浓度、寡肽的浓度、氨基酸的浓度、维生素的浓度、激素的浓度、添加剂的浓度、血清浓度、离子强度、离子的浓度、相对湿度、摩尔浓度、同渗容摩、其他化学物质(例如,缓冲剂、佐剂或反应副产物)的浓度)、物理/机械参数(例如,密度、传导率、搅拌程度、压力、和流速、剪切应力、剪切速率、粘度、颜色、浊度、光吸收、混合速率、转化率、以及热力学参数(如温度、光强度/质量)等)。测量本申请中描述的参数的传感器对于相关机械和电子领域的普通技术人员来说是公知的。控制系统基于来自本申请中描述的传感器的输入来调整生物反应器中的参数是生物反应器工程领域的普通技术人员公知的。
在一些实施方案中,方法涉及分批发酵(例如,摇瓶发酵)。分批发酵(例如,摇瓶发酵)的一般考虑因素包含氧气和葡萄糖的水平。例如,分批发酵(例如,摇瓶发酵)可能受限于氧气和葡萄糖,因此在一些实施方案中,菌株在设计良好的补料分批发酵中进行的能力被低估。
在一些实施方案中,本公开的细胞适合于在体内产生VCE或VCE亚基。
纯化和进一步处理
在一些实施方案中,本申请中描述的任何方法可以包含产生(例如,在生物反应器中产生)的VCE的分离和/或纯化。例如,分离和/或纯化可以涉及细胞裂解、离心、萃取、柱层析、蒸馏、结晶和冻干中的一种或更多种。
可以使用本领域已知的任何方法鉴别和提取通过本申请中公开的任意重组细胞或本申请中描述的任意体外方法产生的VCE。质谱法(例如,LC-MS、GC-MS)是鉴定方法的非限制性示例,并且可以用于提取感兴趣的化合物。
通过以下实施例进一步阐明本发明,但不应当将以下实施例解释为限制。贯穿本申请所引用的全部参考文献(包含文献参考、授权专利、公布的专利申请、以及待审专利申请)的全部内容特此通过引用被明确并入。如果并入本申请的参考文献含有定义与本公开中定义的相同术语的定义不一致或不相容的术语,则应当以本公开中归于该术语的含义为准。对本申请中引用的任何参考文献、文章、出版物、专利、专利公布和专利申请的提及不被认为是其构成有效现有技术或者形成世界上任何国家中的公知常识的一部分的承认或任何形式的暗示,也不应当被认为其构成有效现有技术或者形成本领域技术人员的公知常识的一部分的承认或暗示。
实施例
为了可以更充分地理解本申请中描述的发明,示出下列实施例。本申请中描述的实施例被提供以阐明本申请中提供的系统和方法,并且不被解释为限制其范围。
实施例1:筛选以鉴别E.coli VCE产生菌株
为了研究是否有可能增加宿主细胞中VCE的产生,用编码VCE的质粒转化E.coliBL21(DE3)菌株,以生成约300株候选VCE产生文库菌株。文库菌株被设计以从染色体外质粒表达VCE。13种不同的启动子、21种不同的RBS和3种不同的终止子以各种不同的组合测试了它们驱动编码VCE D1和D12亚基(分别对应于氨基酸序列SEQ ID NO:6和SEQ ID NO:7)的基因的表达的能力。
开发基于平板的发酵筛选法以定量来自每个候选VCE产生文库菌株的VCE产生。在37℃下在LB培养基中培养菌株,随后在~1的光密度下用500μM IPTG诱导。诱导后,菌株在30℃下发酵5小时,随后定量VCE,测量为VCE总蛋白浓度(μg/L)。
基于平板的筛选鉴别出产生VCE的多个候选VCE产生文库菌株。在基于平板的筛选的基础上,23个候选VCE产生文库菌株被提升到实施例2中所描述的二级筛选。
实施例2:候选VCE产生文库菌株的确认
使用Ambr 250s发酵法重新筛选实施例1中鉴别出的23个候选VCE产生文库菌株,以测定总VCE浓度(mg/L)。
菌株在37℃下,在丰富无动物培养基中生长过夜,同时在带挡板的烧瓶中以250rpm振荡。静置培养用于接种具有250mL体积容量的微型生物反应器。向反应器中装入由酵母提取物、甘油、盐和矿物质组成的不含动物的半限定生产培养基,然后用进气空气平衡反应器,直到实现期望的氧化。培养物在分批碳和氮进料上生长至期望的生物质负载,然后连续添加乳糖以诱导VCE的产生。培养物连续进料,同时在自适应控制回路上保持碳补料速率以保持可接受的氧气吸收速率。在45-50小时时,终止培养发酵。在整个实验中和发酵结束时采集的生物质样品被裂解并测定细胞内VCE滴度和活性。
由各菌株产生的平均VCE蛋白浓度(mg/L)在表2和图2中示出。图2描绘了与源自Fuchs et al.(2016)RNA 22:1454-1466的表达系统的阳性对照菌株t778543相比,来自前23个E.coli候选VCE产生文库菌株的补料分批发酵的最大可溶性酶滴度。在表2中,对于每个菌株,上排对应于VCE亚基D1,并且下排对应于VCE亚基D12。
表2:Ambr 250s发酵系统中VCE产生数据
/>
/>
在Ambr 250s发酵中,在接近时间过程结束时,在一些生物反应器中观察到蛋白质下降。这可能是由于下列中的一个或更多个原因:细胞裂解和光密度降低、蛋白质降解、当达到高浓度时的蛋白质不溶性、和/或由于在发酵期内选择不当而导致的质粒维持。
两种发酵模型(基于平板的发酵和Ambr 250s发酵)之间的VCE蛋白产生没有发现相关性,因此使用附加的富集评分标准(总文库中的%与最高命中率中的%之间的比较)以基于实施例1中描述的基于平板的发酵测定来评估候选VCE产生文库菌株。文库菌株经历用于VCE表达质粒的构建的遗传部分(启动子、RBS、重新编码的VCE序列和终止子)的富集评分,以确定遗传部分的哪些组合比其他组合对于VCE产生更有效。表3示出了对某些启动子显示出富集的产生VCE的文库菌株的总数。表4示出了对VCE D1亚基的转录和翻译的某些RBS显示出富集的产生VCE的文库菌株的总数。
表3:VCE启动子的富集分析
/>
表4:VCE亚基D1 RBS的富集分析
在基于平板的发酵模型中测试的~300个文库菌株中遗传部分的富集(表3和表4)和在Ambr 250s发酵模型中检测的23个菌株的VCE蛋白产生性能(图2)的基础上,选择对应于菌株ID 816008、816072、816070、816056、807172、807173、815995和815917的8个候选VCE产生文库菌株,并使用上文描述的Ambr 250s发酵方法重新筛选用于VCE产生。尽管Ptac启动子在表3中展现出负富集,但包括Ptac启动子的菌株807173是所选择的菌株之一,因为在Ambr 250s发酵测定中发现,相对于其他菌株,其产生相当的VCE滴度,但具有较少的累积生物质(即,每克细胞颗粒较高的特异性VCE滴度)。
在下列时间点:15小时、20小时、26小时、32小时、38小时、44小时和46小时,从50小时的补料分批发酵中测量针对每个菌株的VCE的可溶性酶滴度(mg/L)。时间过程数据取自3个生物反应器重复。误差条示出了4个裂解重复的分析方差(图3)。
因此,在测试的~300个文库菌株中,鉴别出了针对VCE产生有效的遗传组分的特定组合。不希望受任何理论的束缚,本公开中提供的、在本公开中描述的合成启动子、RBS和/或终止子的特定组合的控制下表达的编码D1和/或D12的重新编码核酸可以提供D1:D12共表达(包含D12的充分表达)的改进的平衡,这可能导致D1亚基的提高的稳定性,从而导致VCE的增加的产量。
实施例3:诱导物对E.coli VCE产生菌株中VCE滴度的影响
使用Ambr 250s发酵方法评估携带组成型VCE表达质粒的6个候选VCE产生文库菌株(菌株807175、807176、815930、815934、816019和816020)(相比于携带用于VCE产生的可诱导VCE表达质粒的VCE产生文库菌株(菌株870868))。对菌株870868进行了多种诱导物(IPTG、乳糖、半乳糖和无诱导物)的测试。对于组成型VCE表达菌株,没有添加诱导物。在下列时间点:10小时、18小时、26小时、35小时、41小时和46小时,从50小时的补料分批发酵中测量针对每个菌株的VCE的可溶性酶滴度(mg/L)。时间过程数据取自2个生物反应器重复(图4)。乳糖和半乳糖被观察为比IPTG更有效的VCE产生诱导物。
表5:Ambr 250s发酵系统中VCE菌株数据
实施例4:ftsZ的过表达减少细胞伸长
细胞中增加的VCE产生可能导致粘度的增加和发酵的减慢。不希望受任何理论的束缚,粘度的增加可能是由于VCE的过表达引起的细胞伸长。为了降低在VCE产生宿主细胞中由于细胞伸长而导致的粘度增加的风险,可以在来自实施例2的候选VCE产生文库菌株中增加ftsZ基因的表达。例如,表达ftsZ基因的一个或更多个拷贝的一个或更多个质粒可以在VCE产生文库菌株中表达,和/或ftsZ基因的一个或更多个拷贝可以被整合到VCE产生文库菌株的基因组中。
使用实施例2中所描述的Ambr 250s发酵测定法筛选具有ftsZ基因的增加的表达的VCE产生文库菌株,并测定总VCE浓度(mg/L)。还测量了细胞伸长和粘度(例如,分别通过显微镜可视化和通过粘度计),并且与对应的不具有ftsZ基因的增加的表达的VCE产生文库菌株进行比较。
实施例5:SAM相关代谢物和GTP相关代谢物的补充以减少细胞伸长
为了降低由于VCE产生宿主细胞中的细胞伸长而导致的粘度增加的风险,来自实施例2的候选VCE产生文库菌株在补充有SAM相关代谢物和GTP相关代谢物的发酵液中生长。使用如实施例2中所描述的Ambr 250s发酵测定法筛选在SAM相关代谢物和GTP相关代谢物存在下培养的VCE产生文库菌株,并测定总VCE浓度(mg/L)。培养物或者用一次性注射补充,或者用SAM相关代谢物和GTP相关代谢物持续补充,以增加天然FtsZ的活性。还测量了细胞伸长和粘度(例如,分别通过显微镜可视化和通过粘度计),并对在SAM相关代谢物和GTP相关代谢物存在下培养的VCE产生文库菌株与对应的不在SAM相关代谢物和GTP相关代谢物存在下培养的VCE产生文库菌株进行比较。
实施例6:metK和/或mreB的过表达以调控细胞尺寸和/或形态
VCE过表达可能影响基因(如编码SAM合成酶的metK和可能导致对细胞生长和/或形态产生影响的mreB)的表达。为了减轻对细胞生长和/或形态的任何影响,可以在来自实施例2的候选VCE产生文库菌株中增加metK基因和/或mreB基因的表达。例如,表达metK基因和/或mreB基因的一个或更多个拷贝的一个或更多个质粒可以在VCE产生文库菌株中表达,和/或metK基因和/或mreB基因的一个或更多个拷贝可以被整合到VCE产生文库菌株的基因组中。
使用实施例2中所描述的Ambr 250s发酵测定法筛选具有metK基因和/或mreB基因的增加的表达的VCE产生文库菌株,并测定总VCE浓度(mg/L)。还测量了细胞伸长和粘度(例如,分别通过显微镜可视化和通过粘度计),并与对应的不具有metK基因和/或mreB基因的增加的表达的VCE产生文库菌株进行比较。
表6.与本公开相关的序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
等同物
本领域技术人员仅使用常规实验就将认识到或能够确知本文中描述的本发明的具体实施方案的许多等同物。这样的等同物旨在由以下权利要求书涵盖。
全部参考文献(包含专利文件)通过引用被整体并入本文。
应当理解的是,本申请中公开的序列可以含有分泌信号或者可以不含有分泌信号。本申请中公开的序列涵盖具有分泌信号的型式或者不具有分泌信号的型式。还应当理解的是,本申请中公开的蛋白质序列可以描述为具有起始密码子(M)或者不具有起始密码子(M)。本申请中公开的序列涵盖具有起始密码子的型式或者不具有起始密码子的型式。因此,在一些情况下,氨基酸编号可以对应于含有起始密码子的蛋白质序列,而在其他情况下,氨基酸编号可以对应于不含有起始密码子的蛋白质序列。还应当理解的是,本申请中公开的序列可以描述为具有终止密码子或者不具有终止密码子。本申请中公开的序列涵盖具有终止密码子的型式或者不具有终止密码子的型式。本公开的方面涵盖包括本申请中描述的序列中的任何一种及其片段的宿主细胞。
序列表
<110> 银杏生物制品公司
<120> 牛痘病毒加帽酶的产生
<130> G0919.70072WO00
<140> 尚未分配
<141> 同此同时
<150> US 63/167,249
<151> 2021-03-29
<150> US 63/188,977
<151> 2021-05-14
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 1
taatacgact cactatag 18
<210> 2
<211> 2610
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 2
atgaaacatc accatcacca tcaccccatg agcgattacg acatccccac tactgagaat 60
ctttattttc agggcgccga cgctaatgtc gtgtcttctt ctaccatcgc aacctatatt 120
gacgctctgg caaaaaacgc ctcggaactg gaacaacgct caaccgcgta tgaaatcaac 180
aatgaactgg aactggtgtt tatcaaaccg ccgctgatta cgctgaccaa cgtggttaat 240
atcagcacca ttcaggaatc ttttattcgt ttcacggtta ccaacaaaga aggcgtcaaa 300
atccgcacga aaattccgct gagcaaagtt catggtctgg atgtgaaaaa cgttcaactg 360
gtcgacgcaa tcgataatat tgtgtgggaa aagaaaagcc tggttaccga aaatcgtctg 420
cataaagaat gcctgctgcg tctgagcacg gaagaacgcc acatctttct ggactataaa 480
aaatacggca gctctatccg cctggaactg gtgaacctga tccaggctaa aaccaaaaac 540
ttcacgatcg atttcaaact gaaatatttt ctgggcagtg gtgctcaatc caaaagttcc 600
ctgctgcatg cgatcaacca cccgaaaagt cgtccgaata cctccctgga aattgaattc 660
accccgcgcg acaacgaaac ggtgccgtac gatgaactga ttaaagaact gaccacgctg 720
tcacgtcata tctttatggc gtcgccggaa aacgttattc tgagcccgcc gatcaatgcc 780
ccgattaaaa ccttcatgct gccgaaacag gacattgttg gcctggatct ggaaaacctg 840
tatgcggtca cgaaaaccga tggtattccg atcaccattc gcgtgacgtc gaatggcctg 900
tattgctact ttacccacct gggttatatt atccgttacc cggttaaacg cattatcgac 960
tccgaagtcg tggttttcgg cgaagcggtc aaagataaaa attggaccgt gtatctgatc 1020
aaactgattg aaccggtgaa cgccatcaac gatcgtctgg aagaatcaaa atacgtggaa 1080
tcgaaactgg ttgacatctg tgatcgcatc gttttcaaaa gcaaaaaata cgaaggtccg 1140
ttcaccacga cctctgaagt cgtggatatg ctgagtacct atctgccgaa acagccggaa 1200
ggcgtgatcc tgttttacag caaaggtccg aaatctaaca tcgacttcaa aatcaaaaaa 1260
gaaaacacca tcgatcaaac ggccaatgtt gtctttcgtt atatgtcatc ggaaccgatt 1320
atctttggcg aaagctctat cttcgtggaa tacaaaaaat tctcgaacga taaaggcttc 1380
ccgaaagaat acggcagcgg taaaattgtc ctgtataacg gtgtgaatta cctgaacaat 1440
atctattgcc tggaatacat taacacccat aatgaagttg gcattaaatc tgtggttgtc 1500
ccgatcaaat ttattgcaga attcctggtc aacggtgaaa tcctgaaacc gcgtattgac 1560
aaaaccatga aatacatcaa cagtgaagat tactacggta accagcataa catcatcgtg 1620
gaacacctgc gcgaccaatc tatcaaaatc ggcgatatct tcaacgaaga caaactgagt 1680
gatgtcggtc accagtatgc gaacaatgat aaatttcgtc tgaacccgga agtgtcctac 1740
ttcaccaata aacgtacgcg cggcccgctg ggtatcctgt caaattatgt caaaaccctg 1800
ctgatttcaa tgtactgttc gaaaacgttt ctggatgaca gcaacaaacg caaagttctg 1860
gccattgact ttggcaatgg tgcagatctg gaaaaatatt tctacggcga aatcgctctg 1920
ctggttgcga ccgatccgga cgcggatgcc attgcacgtg gcaacgaacg ctataacaaa 1980
ctgaattctg gtatcaaaac caaatactac aaattcgact acatccagga aaccattcgt 2040
agtgatacgt tcgtgagttc cgttcgcgaa gtcttttatt tcggcaaatt caacatcatc 2100
gattggcaat tcgccatcca ttattctttc catccgcgtc actacgcaac cgtgatgaac 2160
aatctgagtg aactgacggc ttccggcggt aaagttctga ttacgacgat ggatggtgat 2220
aaactgtcca aactgaccga taagaaaacc ttcattatcc acaaaaacct gccgtcatcg 2280
gaaaactaca tgtcagtgga aaaaatcgcc gatgaccgca ttgtggttta taacccgagc 2340
acgatgtcta ccccgatgac ggaatacatc attaagaaaa acgatatcgt ccgtgtgttt 2400
aatgaatacg gtttcgttct ggtcgacaac gttgattttg caaccattat cgaacgcagc 2460
aaaaaattca tcaatggcgc ttccacgatg gaagatcgtc cgtcaacgcg caactttttc 2520
gaactgaatc gcggtgcaat taaatgtgaa ggtctggatg tggaagatct gctgtcctat 2580
tatgtcgtgt atgtgttctc taaacgctaa 2610
<210> 3
<211> 2610
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 3
atgaaacatc accatcacca tcaccccatg agcgattacg acatccccac tactgagaat 60
ctttattttc agggcgccga cgccaacgta gtgagctcgt ccacgattgc tacatacatc 120
gacgcactgg ctaaaaacgc gagtgaatta gagcaacgtt caaccgccta tgaaatcaac 180
aacgaacttg agctcgtctt tattaagcct ccgctaatca ccctgactaa cgttgttaat 240
atatctacca tccaggaaag cttcattcgc ttcactgtta ctaacaaaga aggcgtaaaa 300
atcaggacta aaatcccatt gtctaaggtg cacgggctgg atgtgaaaaa cgttcagctg 360
gttgacgcta ttgacaacat cgtatgggaa aagaaatccc tcgtaaccga aaaccgtctg 420
cataaagaat gtctgctgcg tctgagcacg gaggaacgac acatctttct ggattacaaa 480
aaatatggta gttctattcg tctggagctg gtgaacctga tccaggcaaa gaccaaaaat 540
ttcacaattg acttcaaact aaaatacttt ctgggctccg gtgcgcagag caaatcttcc 600
ctgttgcatg ctatcaacca cccgaaaagc cgcccgaata cttctctgga aatcgagttc 660
accccccgcg ataacgaaac tgtcccatac gatgagctta ttaaggaact gaccacgctg 720
tcccgtcaca tttttatggc gagcccggaa aacgttatat tatcgccgcc tatcaacgct 780
ccgatcaaga ccttcatgtt gccgaaacaa gacatcgtcg gtctggatct ggagaacctg 840
tacgcagtta ctaaaaccga cggcatcccc atcactatca gagtaacgtc aaacggattg 900
tattgctatt tcacccatct gggttacatt attcgttacc cggtgaaacg catcatagat 960
tctgaagttg ttgttttcgg cgaagccgta aaggacaaaa actggaccgt ctatctgatc 1020
aagctaatcg aaccggttaa tgctatcaac gatcggctgg aagaatcgaa atacgtagaa 1080
tctaaactgg tggatatttg cgaccgtatt gtctttaaat cgaaaaagta cgagggtcct 1140
ttcactacta ctagcgaagt cgtggacatg ctctctacgt acctgccgaa acagcctgag 1200
ggcgttatcc tgttctatag caaaggtccg aaatccaaca tcgattttaa gattaaaaag 1260
gaaaacacca ttgatcagac ggctaatgta gttttccggt acatgtctag cgagccgatc 1320
atctttggcg aatcttctat ctttgtagaa tataaaaagt tcagcaacga caaaggattc 1380
ccaaaagaat acgggtccgg gaaaatcgtc ttatacaacg gtgttaacta cttgaacaac 1440
atctattgcc tggaatatat caatactcac aatgaagttg gtattaaatc agtggttgtt 1500
ccgataaaat tcatcgcgga atttctggtc aatggcgaaa tcctgaaacc ccgcattgat 1560
aagaccatga aatacataaa ctccgaagac tactacggta accagcataa catcatcgtg 1620
gaacacctga gagatcagag tatcaaaatc ggcgacattt tcaatgagga caagttaagc 1680
gacgtgggcc atcaatacgc aaacaacgac aaattccgtc tgaacccgga ggtttcctat 1740
ttcaccaaca aacgtacccg aggtccgctt ggcatcctct ccaattacgt aaaaaccctg 1800
ctgatttcta tgtattgttc aaaaacgttc ctggatgaca gcaacaaaag gaaggtactg 1860
gctatcgatt tcggtaacgg cgcggatctg gaaaagtact tttacggtga aatcgctctg 1920
ttagtcgcaa ctgatccgga cgccgacgca attgctcgcg gaaatgaacg ttacaacaaa 1980
ctgaactccg gtattaaaac aaagtattat aaattcgact atatccagga gactatccgc 2040
tctgatactt tcgtgagcag cgtgcgtgag gttttttact ttggtaaatt caacattatt 2100
gactggcagt ttgcgatcca ctacagcttt cacccgcgtc actatgcgac cgttatgaat 2160
aacctatcgg aactcacggc tagcggcggc aaagtgctga ttactactat ggacggtgac 2220
aaactgtcta agctgaccga taagaaaacc ttcatcatcc acaaaaactt gccaagttct 2280
gagaactata tgtctgttga aaaaattgcg gacgaccgca tcgtcgttta caacccatct 2340
accatgtcca cccctatgac agagtacatc atcaaaaaga acgacatagt tcgtgttttc 2400
aacgaatacg gcttcgtact ggtagataac gtcgattttg ctaccattat cgagcgttcg 2460
aaaaaattca ttaacggtgc ttccactatg gaagatcgtc cgtccactcg taactttttt 2520
gaattaaacc gtggcgcaat caaatgcgaa gggctggatg tggaagacct cctgtcttac 2580
tacgttgtat acgtcttctc taaacgctaa 2610
<210> 4
<211> 957
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
atggatgaaa tcgtcaaaaa tatccgcgaa ggcacgcacg tcctgctgcc gttctatgaa 60
accctgccgg aactgaatct gtcactgggc aaatctccgc tgccgagtct ggaatatggt 120
gcaaactact ttctgcagat ttctcgtgtg aacgatctga atcgcatgcc gaccgacatg 180
ctgaaactgt tcacgcatga tatcatgctg ccggaaagcg atctggacaa agtctacgaa 240
atcctgaaaa tcaactccgt taaatactac ggccgttcaa ccaaagcgga tgccgtggtt 300
gcagacctgt ccgctcgcaa taaactgttt aaacgtgaac gcgatgctat taaatcgaac 360
aatcacctga ccgaaaacaa cctgtacatc agcgattaca aaatgctgac gtttgacgtg 420
ttccgtccgc tgttcgattt cgttaacgaa aaatactgca tcatcaaact gccgaccctg 480
tttggccgtg gtgtgattga tacgatgcgc atctactgca gcctgttcaa aaatgtccgc 540
ctgctgaaat gtgtgtcgga tagctggctg aaagactctg cgattatggt ggccagtgac 600
gtttgtaaga aaaacctgga cctgtttatg tcccatgtca aatcagtgac caaaagctct 660
agttggaaag acgttaattc ggtccaattt agcattctga acaatccggt tgatacggaa 720
ttcatcaaca aattcctgga attctctaac cgtgtttacg aagcactgta ttacgtccac 780
agtctgctgt actcctcaat gacctcggac tccaaatcca tcgaaaataa acatcaacgc 840
cgcctggtga aactgctgct ggggagcgct tggagccacc cgcagttcga aaaaggtgga 900
ggttctggcg gtggatcggg aggttcagcg tggagccacc cgcagttcga gaaataa 957
<210> 5
<211> 957
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 5
atggatgaga tcgttaagaa cattcgtgaa ggtacgcatg tgcttttgcc attttacgaa 60
actctcccgg aactgaatct gtccttaggc aaaagccctc taccctctct ggagtatggg 120
gccaactact tcctgcaaat ctcacgcgtc aacgacctga atcgaatgcc gaccgacatg 180
ctgaaactgt tcactcacga tataatgctg ccggaaagtg atctggacaa agtatatgaa 240
atcctgaaaa tcaacagcgt taagtactac ggacggtcga ccaaagcgga cgctgttgta 300
gcagatctgt ctgctcgcaa caaactcttt aaacgtgaac gtgacgctat taagtccaac 360
aaccacctga cagagaacaa tctctatatc tctgactaca aaatgttgac tttcgatgtg 420
ttccgtccgc tgtttgattt cgtgaacgaa aaatattgca ttatcaaact gccgaccctg 480
ttcggccgtg gtgttattga caccatgcgc atctactgta gcctcttcaa gaatgtcaga 540
ctactgaaat gcgtgtccga tagctggctg aaagacagcg caatcatggt agcctcagac 600
gtttgcaaaa agaacctgga tctgtttatg tcccatgtta aatccgttac taagtctagc 660
tcgtggaaag atgttaacag cgtacagttt tctattttga acaaccctgt tgacacggaa 720
tttatcaaca aattcctgga gttctctaac cgtgtatacg aagcgctgta ttacgtgcac 780
tccttactgt actcttctat gaccagcgat agtaagtcta tcgaaaataa acaccagcgc 840
cgtctggtaa aactgctcct tgggagcgct tggagccacc cgcagttcga aaaaggtgga 900
ggttctggcg gtggatcggg aggttcagcg tggagccacc cgcagttcga gaaataa 957
<210> 6
<211> 869
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 6
Met Lys His His His His His His Pro Met Ser Asp Tyr Asp Ile Pro
1 5 10 15
Thr Thr Glu Asn Leu Tyr Phe Gln Gly Ala Asp Ala Asn Val Val Ser
20 25 30
Ser Ser Thr Ile Ala Thr Tyr Ile Asp Ala Leu Ala Lys Asn Ala Ser
35 40 45
Glu Leu Glu Gln Arg Ser Thr Ala Tyr Glu Ile Asn Asn Glu Leu Glu
50 55 60
Leu Val Phe Ile Lys Pro Pro Leu Ile Thr Leu Thr Asn Val Val Asn
65 70 75 80
Ile Ser Thr Ile Gln Glu Ser Phe Ile Arg Phe Thr Val Thr Asn Lys
85 90 95
Glu Gly Val Lys Ile Arg Thr Lys Ile Pro Leu Ser Lys Val His Gly
100 105 110
Leu Asp Val Lys Asn Val Gln Leu Val Asp Ala Ile Asp Asn Ile Val
115 120 125
Trp Glu Lys Lys Ser Leu Val Thr Glu Asn Arg Leu His Lys Glu Cys
130 135 140
Leu Leu Arg Leu Ser Thr Glu Glu Arg His Ile Phe Leu Asp Tyr Lys
145 150 155 160
Lys Tyr Gly Ser Ser Ile Arg Leu Glu Leu Val Asn Leu Ile Gln Ala
165 170 175
Lys Thr Lys Asn Phe Thr Ile Asp Phe Lys Leu Lys Tyr Phe Leu Gly
180 185 190
Ser Gly Ala Gln Ser Lys Ser Ser Leu Leu His Ala Ile Asn His Pro
195 200 205
Lys Ser Arg Pro Asn Thr Ser Leu Glu Ile Glu Phe Thr Pro Arg Asp
210 215 220
Asn Glu Thr Val Pro Tyr Asp Glu Leu Ile Lys Glu Leu Thr Thr Leu
225 230 235 240
Ser Arg His Ile Phe Met Ala Ser Pro Glu Asn Val Ile Leu Ser Pro
245 250 255
Pro Ile Asn Ala Pro Ile Lys Thr Phe Met Leu Pro Lys Gln Asp Ile
260 265 270
Val Gly Leu Asp Leu Glu Asn Leu Tyr Ala Val Thr Lys Thr Asp Gly
275 280 285
Ile Pro Ile Thr Ile Arg Val Thr Ser Asn Gly Leu Tyr Cys Tyr Phe
290 295 300
Thr His Leu Gly Tyr Ile Ile Arg Tyr Pro Val Lys Arg Ile Ile Asp
305 310 315 320
Ser Glu Val Val Val Phe Gly Glu Ala Val Lys Asp Lys Asn Trp Thr
325 330 335
Val Tyr Leu Ile Lys Leu Ile Glu Pro Val Asn Ala Ile Asn Asp Arg
340 345 350
Leu Glu Glu Ser Lys Tyr Val Glu Ser Lys Leu Val Asp Ile Cys Asp
355 360 365
Arg Ile Val Phe Lys Ser Lys Lys Tyr Glu Gly Pro Phe Thr Thr Thr
370 375 380
Ser Glu Val Val Asp Met Leu Ser Thr Tyr Leu Pro Lys Gln Pro Glu
385 390 395 400
Gly Val Ile Leu Phe Tyr Ser Lys Gly Pro Lys Ser Asn Ile Asp Phe
405 410 415
Lys Ile Lys Lys Glu Asn Thr Ile Asp Gln Thr Ala Asn Val Val Phe
420 425 430
Arg Tyr Met Ser Ser Glu Pro Ile Ile Phe Gly Glu Ser Ser Ile Phe
435 440 445
Val Glu Tyr Lys Lys Phe Ser Asn Asp Lys Gly Phe Pro Lys Glu Tyr
450 455 460
Gly Ser Gly Lys Ile Val Leu Tyr Asn Gly Val Asn Tyr Leu Asn Asn
465 470 475 480
Ile Tyr Cys Leu Glu Tyr Ile Asn Thr His Asn Glu Val Gly Ile Lys
485 490 495
Ser Val Val Val Pro Ile Lys Phe Ile Ala Glu Phe Leu Val Asn Gly
500 505 510
Glu Ile Leu Lys Pro Arg Ile Asp Lys Thr Met Lys Tyr Ile Asn Ser
515 520 525
Glu Asp Tyr Tyr Gly Asn Gln His Asn Ile Ile Val Glu His Leu Arg
530 535 540
Asp Gln Ser Ile Lys Ile Gly Asp Ile Phe Asn Glu Asp Lys Leu Ser
545 550 555 560
Asp Val Gly His Gln Tyr Ala Asn Asn Asp Lys Phe Arg Leu Asn Pro
565 570 575
Glu Val Ser Tyr Phe Thr Asn Lys Arg Thr Arg Gly Pro Leu Gly Ile
580 585 590
Leu Ser Asn Tyr Val Lys Thr Leu Leu Ile Ser Met Tyr Cys Ser Lys
595 600 605
Thr Phe Leu Asp Asp Ser Asn Lys Arg Lys Val Leu Ala Ile Asp Phe
610 615 620
Gly Asn Gly Ala Asp Leu Glu Lys Tyr Phe Tyr Gly Glu Ile Ala Leu
625 630 635 640
Leu Val Ala Thr Asp Pro Asp Ala Asp Ala Ile Ala Arg Gly Asn Glu
645 650 655
Arg Tyr Asn Lys Leu Asn Ser Gly Ile Lys Thr Lys Tyr Tyr Lys Phe
660 665 670
Asp Tyr Ile Gln Glu Thr Ile Arg Ser Asp Thr Phe Val Ser Ser Val
675 680 685
Arg Glu Val Phe Tyr Phe Gly Lys Phe Asn Ile Ile Asp Trp Gln Phe
690 695 700
Ala Ile His Tyr Ser Phe His Pro Arg His Tyr Ala Thr Val Met Asn
705 710 715 720
Asn Leu Ser Glu Leu Thr Ala Ser Gly Gly Lys Val Leu Ile Thr Thr
725 730 735
Met Asp Gly Asp Lys Leu Ser Lys Leu Thr Asp Lys Lys Thr Phe Ile
740 745 750
Ile His Lys Asn Leu Pro Ser Ser Glu Asn Tyr Met Ser Val Glu Lys
755 760 765
Ile Ala Asp Asp Arg Ile Val Val Tyr Asn Pro Ser Thr Met Ser Thr
770 775 780
Pro Met Thr Glu Tyr Ile Ile Lys Lys Asn Asp Ile Val Arg Val Phe
785 790 795 800
Asn Glu Tyr Gly Phe Val Leu Val Asp Asn Val Asp Phe Ala Thr Ile
805 810 815
Ile Glu Arg Ser Lys Lys Phe Ile Asn Gly Ala Ser Thr Met Glu Asp
820 825 830
Arg Pro Ser Thr Arg Asn Phe Phe Glu Leu Asn Arg Gly Ala Ile Lys
835 840 845
Cys Glu Gly Leu Asp Val Glu Asp Leu Leu Ser Tyr Tyr Val Val Tyr
850 855 860
Val Phe Ser Lys Arg
865
<210> 7
<211> 318
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 7
Met Asp Glu Ile Val Lys Asn Ile Arg Glu Gly Thr His Val Leu Leu
1 5 10 15
Pro Phe Tyr Glu Thr Leu Pro Glu Leu Asn Leu Ser Leu Gly Lys Ser
20 25 30
Pro Leu Pro Ser Leu Glu Tyr Gly Ala Asn Tyr Phe Leu Gln Ile Ser
35 40 45
Arg Val Asn Asp Leu Asn Arg Met Pro Thr Asp Met Leu Lys Leu Phe
50 55 60
Thr His Asp Ile Met Leu Pro Glu Ser Asp Leu Asp Lys Val Tyr Glu
65 70 75 80
Ile Leu Lys Ile Asn Ser Val Lys Tyr Tyr Gly Arg Ser Thr Lys Ala
85 90 95
Asp Ala Val Val Ala Asp Leu Ser Ala Arg Asn Lys Leu Phe Lys Arg
100 105 110
Glu Arg Asp Ala Ile Lys Ser Asn Asn His Leu Thr Glu Asn Asn Leu
115 120 125
Tyr Ile Ser Asp Tyr Lys Met Leu Thr Phe Asp Val Phe Arg Pro Leu
130 135 140
Phe Asp Phe Val Asn Glu Lys Tyr Cys Ile Ile Lys Leu Pro Thr Leu
145 150 155 160
Phe Gly Arg Gly Val Ile Asp Thr Met Arg Ile Tyr Cys Ser Leu Phe
165 170 175
Lys Asn Val Arg Leu Leu Lys Cys Val Ser Asp Ser Trp Leu Lys Asp
180 185 190
Ser Ala Ile Met Val Ala Ser Asp Val Cys Lys Lys Asn Leu Asp Leu
195 200 205
Phe Met Ser His Val Lys Ser Val Thr Lys Ser Ser Ser Trp Lys Asp
210 215 220
Val Asn Ser Val Gln Phe Ser Ile Leu Asn Asn Pro Val Asp Thr Glu
225 230 235 240
Phe Ile Asn Lys Phe Leu Glu Phe Ser Asn Arg Val Tyr Glu Ala Leu
245 250 255
Tyr Tyr Val His Ser Leu Leu Tyr Ser Ser Met Thr Ser Asp Ser Lys
260 265 270
Ser Ile Glu Asn Lys His Gln Arg Arg Leu Val Lys Leu Leu Leu Gly
275 280 285
Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly
290 295 300
Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
305 310 315
<210> 8
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcgctc acaatt 56
<210> 9
<211> 118
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccaca 118
<210> 10
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcacaggag 60
actttcta 68
<210> 11
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 11
gtcaataaag gcatataaaa ggaggttaat aacatgaaag ttaaagtaaa acatcttaat 60
catgctaagg aggttttcta 80
<210> 12
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 12
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcgccggag 60
gttttcta 68
<210> 13
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 13
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcggaggat 60
cgtttcta 68
<210> 14
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 14
gtcaataaag gcatataaaa ggaggttaat aacatgaaag ttaaagtaaa acatcttaat 60
catgcggggg agtgtttcta 80
<210> 15
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 15
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcggtggag 60
ggtttcta 68
<210> 16
<211> 80
<212> DNA
<213> 人工的
<220>
<223> 合成的
<400> 16
gtcaataaag gcatataaaa ggaggttaat aacatgaaag ttaaagtaaa acatcttaat 60
catgcggggg agtctttcta 80
<210> 17
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcgacggag 60
cgtttcta 68
<210> 18
<211> 113
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 18
ccggcttatc ggtcagtttc acctgattta cgtaaaaacc cgcttcggcg ggtttttgct 60
tttggagggg cagaaagatg aatgactgtc cacgacgcta tacccaaaag aaa 113
<210> 19
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 19
ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 60
gtttgtcggt gaacgctctc tactagagtc acactggctc accttcgggt gggcctttct 120
gcgtttata 129
<210> 20
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 20
ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgc 44
<210> 21
<211> 4163
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccacagc 120
gaaaaatcaa taaggaggca acaagatgtg cgaaaaacat cttaatcatg cacaggagac 180
tttctaatga aacatcacca tcaccatcac cccatgagcg attacgacat ccccactact 240
gagaatcttt attttcaggg cgccgacgct aatgtcgtgt cttcttctac catcgcaacc 300
tatattgacg ctctggcaaa aaacgcctcg gaactggaac aacgctcaac cgcgtatgaa 360
atcaacaatg aactggaact ggtgtttatc aaaccgccgc tgattacgct gaccaacgtg 420
gttaatatca gcaccattca ggaatctttt attcgtttca cggttaccaa caaagaaggc 480
gtcaaaatcc gcacgaaaat tccgctgagc aaagttcatg gtctggatgt gaaaaacgtt 540
caactggtcg acgcaatcga taatattgtg tgggaaaaga aaagcctggt taccgaaaat 600
cgtctgcata aagaatgcct gctgcgtctg agcacggaag aacgccacat ctttctggac 660
tataaaaaat acggcagctc tatccgcctg gaactggtga acctgatcca ggctaaaacc 720
aaaaacttca cgatcgattt caaactgaaa tattttctgg gcagtggtgc tcaatccaaa 780
agttccctgc tgcatgcgat caaccacccg aaaagtcgtc cgaatacctc cctggaaatt 840
gaattcaccc cgcgcgacaa cgaaacggtg ccgtacgatg aactgattaa agaactgacc 900
acgctgtcac gtcatatctt tatggcgtcg ccggaaaacg ttattctgag cccgccgatc 960
aatgccccga ttaaaacctt catgctgccg aaacaggaca ttgttggcct ggatctggaa 1020
aacctgtatg cggtcacgaa aaccgatggt attccgatca ccattcgcgt gacgtcgaat 1080
ggcctgtatt gctactttac ccacctgggt tatattatcc gttacccggt taaacgcatt 1140
atcgactccg aagtcgtggt tttcggcgaa gcggtcaaag ataaaaattg gaccgtgtat 1200
ctgatcaaac tgattgaacc ggtgaacgcc atcaacgatc gtctggaaga atcaaaatac 1260
gtggaatcga aactggttga catctgtgat cgcatcgttt tcaaaagcaa aaaatacgaa 1320
ggtccgttca ccacgacctc tgaagtcgtg gatatgctga gtacctatct gccgaaacag 1380
ccggaaggcg tgatcctgtt ttacagcaaa ggtccgaaat ctaacatcga cttcaaaatc 1440
aaaaaagaaa acaccatcga tcaaacggcc aatgttgtct ttcgttatat gtcatcggaa 1500
ccgattatct ttggcgaaag ctctatcttc gtggaataca aaaaattctc gaacgataaa 1560
ggcttcccga aagaatacgg cagcggtaaa attgtcctgt ataacggtgt gaattacctg 1620
aacaatatct attgcctgga atacattaac acccataatg aagttggcat taaatctgtg 1680
gttgtcccga tcaaatttat tgcagaattc ctggtcaacg gtgaaatcct gaaaccgcgt 1740
attgacaaaa ccatgaaata catcaacagt gaagattact acggtaacca gcataacatc 1800
atcgtggaac acctgcgcga ccaatctatc aaaatcggcg atatcttcaa cgaagacaaa 1860
ctgagtgatg tcggtcacca gtatgcgaac aatgataaat ttcgtctgaa cccggaagtg 1920
tcctacttca ccaataaacg tacgcgcggc ccgctgggta tcctgtcaaa ttatgtcaaa 1980
accctgctga tttcaatgta ctgttcgaaa acgtttctgg atgacagcaa caaacgcaaa 2040
gttctggcca ttgactttgg caatggtgca gatctggaaa aatatttcta cggcgaaatc 2100
gctctgctgg ttgcgaccga tccggacgcg gatgccattg cacgtggcaa cgaacgctat 2160
aacaaactga attctggtat caaaaccaaa tactacaaat tcgactacat ccaggaaacc 2220
attcgtagtg atacgttcgt gagttccgtt cgcgaagtct tttatttcgg caaattcaac 2280
atcatcgatt ggcaattcgc catccattat tctttccatc cgcgtcacta cgcaaccgtg 2340
atgaacaatc tgagtgaact gacggcttcc ggcggtaaag ttctgattac gacgatggat 2400
ggtgataaac tgtccaaact gaccgataag aaaaccttca ttatccacaa aaacctgccg 2460
tcatcggaaa actacatgtc agtggaaaaa atcgccgatg accgcattgt ggtttataac 2520
ccgagcacga tgtctacccc gatgacggaa tacatcatta agaaaaacga tatcgtccgt 2580
gtgtttaatg aatacggttt cgttctggtc gacaacgttg attttgcaac cattatcgaa 2640
cgcagcaaaa aattcatcaa tggcgcttcc acgatggaag atcgtccgtc aacgcgcaac 2700
tttttcgaac tgaatcgcgg tgcaattaaa tgtgaaggtc tggatgtgga agatctgctg 2760
tcctattatg tcgtgtatgt gttctctaaa cgctaaccgg cttatcggtc agtttcacct 2820
gatttacgta aaaacccgct tcggcgggtt tttgcttttg gaggggcaga aagatgaatg 2880
actgtccacg acgctatacc caaaagaaat gttgacaatt aatcatcggc tcgtataatg 2940
tgtggaattg tgagcgctca caattgcgaa aaatcaataa ggaggcaaca agatgtgcga 3000
aaaacatctt aatcatgcgc cggaggtttt ctaatggatg aaatcgtcaa aaatatccgc 3060
gaaggcacgc acgtcctgct gccgttctat gaaaccctgc cggaactgaa tctgtcactg 3120
ggcaaatctc cgctgccgag tctggaatat ggtgcaaact actttctgca gatttctcgt 3180
gtgaacgatc tgaatcgcat gccgaccgac atgctgaaac tgttcacgca tgatatcatg 3240
ctgccggaaa gcgatctgga caaagtctac gaaatcctga aaatcaactc cgttaaatac 3300
tacggccgtt caaccaaagc ggatgccgtg gttgcagacc tgtccgctcg caataaactg 3360
tttaaacgtg aacgcgatgc tattaaatcg aacaatcacc tgaccgaaaa caacctgtac 3420
atcagcgatt acaaaatgct gacgtttgac gtgttccgtc cgctgttcga tttcgttaac 3480
gaaaaatact gcatcatcaa actgccgacc ctgtttggcc gtggtgtgat tgatacgatg 3540
cgcatctact gcagcctgtt caaaaatgtc cgcctgctga aatgtgtgtc ggatagctgg 3600
ctgaaagact ctgcgattat ggtggccagt gacgtttgta agaaaaacct ggacctgttt 3660
atgtcccatg tcaaatcagt gaccaaaagc tctagttgga aagacgttaa ttcggtccaa 3720
tttagcattc tgaacaatcc ggttgatacg gaattcatca acaaattcct ggaattctct 3780
aaccgtgttt acgaagcact gtattacgtc cacagtctgc tgtactcctc aatgacctcg 3840
gactccaaat ccatcgaaaa taaacatcaa cgccgcctgg tgaaactgct gctggggagc 3900
gcttggagcc acccgcagtt cgaaaaaggt ggaggttctg gcggtggatc gggaggttca 3960
gcgtggagcc acccgcagtt cgagaaataa ccaggcatca aataaaacga aaggctcagt 4020
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc tactagagtc 4080
acactggctc accttcgggt gggcctttct gcgtttataa taaccccttg gggcctctaa 4140
acgggtcttg aggggttttt tgc 4163
<210> 22
<211> 3944
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcgctc acaattgcga 60
aaaatcaata aggaggcaac aagatgtgcg aaaaacatct taatcatgcg gaggatcgtt 120
tctaatgaaa catcaccatc accatcaccc catgagcgat tacgacatcc ccactactga 180
gaatctttat tttcagggcg ccgacgctaa tgtcgtgtct tcttctacca tcgcaaccta 240
tattgacgct ctggcaaaaa acgcctcgga actggaacaa cgctcaaccg cgtatgaaat 300
caacaatgaa ctggaactgg tgtttatcaa accgccgctg attacgctga ccaacgtggt 360
taatatcagc accattcagg aatcttttat tcgtttcacg gttaccaaca aagaaggcgt 420
caaaatccgc acgaaaattc cgctgagcaa agttcatggt ctggatgtga aaaacgttca 480
actggtcgac gcaatcgata atattgtgtg ggaaaagaaa agcctggtta ccgaaaatcg 540
tctgcataaa gaatgcctgc tgcgtctgag cacggaagaa cgccacatct ttctggacta 600
taaaaaatac ggcagctcta tccgcctgga actggtgaac ctgatccagg ctaaaaccaa 660
aaacttcacg atcgatttca aactgaaata ttttctgggc agtggtgctc aatccaaaag 720
ttccctgctg catgcgatca accacccgaa aagtcgtccg aatacctccc tggaaattga 780
attcaccccg cgcgacaacg aaacggtgcc gtacgatgaa ctgattaaag aactgaccac 840
gctgtcacgt catatcttta tggcgtcgcc ggaaaacgtt attctgagcc cgccgatcaa 900
tgccccgatt aaaaccttca tgctgccgaa acaggacatt gttggcctgg atctggaaaa 960
cctgtatgcg gtcacgaaaa ccgatggtat tccgatcacc attcgcgtga cgtcgaatgg 1020
cctgtattgc tactttaccc acctgggtta tattatccgt tacccggtta aacgcattat 1080
cgactccgaa gtcgtggttt tcggcgaagc ggtcaaagat aaaaattgga ccgtgtatct 1140
gatcaaactg attgaaccgg tgaacgccat caacgatcgt ctggaagaat caaaatacgt 1200
ggaatcgaaa ctggttgaca tctgtgatcg catcgttttc aaaagcaaaa aatacgaagg 1260
tccgttcacc acgacctctg aagtcgtgga tatgctgagt acctatctgc cgaaacagcc 1320
ggaaggcgtg atcctgtttt acagcaaagg tccgaaatct aacatcgact tcaaaatcaa 1380
aaaagaaaac accatcgatc aaacggccaa tgttgtcttt cgttatatgt catcggaacc 1440
gattatcttt ggcgaaagct ctatcttcgt ggaatacaaa aaattctcga acgataaagg 1500
cttcccgaaa gaatacggca gcggtaaaat tgtcctgtat aacggtgtga attacctgaa 1560
caatatctat tgcctggaat acattaacac ccataatgaa gttggcatta aatctgtggt 1620
tgtcccgatc aaatttattg cagaattcct ggtcaacggt gaaatcctga aaccgcgtat 1680
tgacaaaacc atgaaataca tcaacagtga agattactac ggtaaccagc ataacatcat 1740
cgtggaacac ctgcgcgacc aatctatcaa aatcggcgat atcttcaacg aagacaaact 1800
gagtgatgtc ggtcaccagt atgcgaacaa tgataaattt cgtctgaacc cggaagtgtc 1860
ctacttcacc aataaacgta cgcgcggccc gctgggtatc ctgtcaaatt atgtcaaaac 1920
cctgctgatt tcaatgtact gttcgaaaac gtttctggat gacagcaaca aacgcaaagt 1980
tctggccatt gactttggca atggtgcaga tctggaaaaa tatttctacg gcgaaatcgc 2040
tctgctggtt gcgaccgatc cggacgcgga tgccattgca cgtggcaacg aacgctataa 2100
caaactgaat tctggtatca aaaccaaata ctacaaattc gactacatcc aggaaaccat 2160
tcgtagtgat acgttcgtga gttccgttcg cgaagtcttt tatttcggca aattcaacat 2220
catcgattgg caattcgcca tccattattc tttccatccg cgtcactacg caaccgtgat 2280
gaacaatctg agtgaactga cggcttccgg cggtaaagtt ctgattacga cgatggatgg 2340
tgataaactg tccaaactga ccgataagaa aaccttcatt atccacaaaa acctgccgtc 2400
atcggaaaac tacatgtcag tggaaaaaat cgccgatgac cgcattgtgg tttataaccc 2460
gagcacgatg tctaccccga tgacggaata catcattaag aaaaacgata tcgtccgtgt 2520
gtttaatgaa tacggtttcg ttctggtcga caacgttgat tttgcaacca ttatcgaacg 2580
cagcaaaaaa ttcatcaatg gcgcttccac gatggaagat cgtccgtcaa cgcgcaactt 2640
tttcgaactg aatcgcggtg caattaaatg tgaaggtctg gatgtggaag atctgctgtc 2700
ctattatgtc gtgtatgtgt tctctaaacg ctaagtcaat aaaggcatat aaaaggaggt 2760
taataacatg aaagttaaag taaaacatct taatcatgcg ggggagtgtt tctaatggat 2820
gaaatcgtca aaaatatccg cgaaggcacg cacgtcctgc tgccgttcta tgaaaccctg 2880
ccggaactga atctgtcact gggcaaatct ccgctgccga gtctggaata tggtgcaaac 2940
tactttctgc agatttctcg tgtgaacgat ctgaatcgca tgccgaccga catgctgaaa 3000
ctgttcacgc atgatatcat gctgccggaa agcgatctgg acaaagtcta cgaaatcctg 3060
aaaatcaact ccgttaaata ctacggccgt tcaaccaaag cggatgccgt ggttgcagac 3120
ctgtccgctc gcaataaact gtttaaacgt gaacgcgatg ctattaaatc gaacaatcac 3180
ctgaccgaaa acaacctgta catcagcgat tacaaaatgc tgacgtttga cgtgttccgt 3240
ccgctgttcg atttcgttaa cgaaaaatac tgcatcatca aactgccgac cctgtttggc 3300
cgtggtgtga ttgatacgat gcgcatctac tgcagcctgt tcaaaaatgt ccgcctgctg 3360
aaatgtgtgt cggatagctg gctgaaagac tctgcgatta tggtggccag tgacgtttgt 3420
aagaaaaacc tggacctgtt tatgtcccat gtcaaatcag tgaccaaaag ctctagttgg 3480
aaagacgtta attcggtcca atttagcatt ctgaacaatc cggttgatac ggaattcatc 3540
aacaaattcc tggaattctc taaccgtgtt tacgaagcac tgtattacgt ccacagtctg 3600
ctgtactcct caatgacctc ggactccaaa tccatcgaaa ataaacatca acgccgcctg 3660
gtgaaactgc tgctggggag cgcttggagc cacccgcagt tcgaaaaagg tggaggttct 3720
ggcggtggat cgggaggttc agcgtggagc cacccgcagt tcgagaaata accaggcatc 3780
aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg 3840
tgaacgctct ctactagagt cacactggct caccttcggg tgggcctttc tgcgtttata 3900
ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgc 3944
<210> 23
<211> 4163
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccacagc 120
gaaaaatcaa taaggaggca acaagatgtg cgaaaaacat cttaatcatg cgacggagcg 180
tttctaatga aacatcacca tcaccatcac cccatgagcg attacgacat ccccactact 240
gagaatcttt attttcaggg cgccgacgct aatgtcgtgt cttcttctac catcgcaacc 300
tatattgacg ctctggcaaa aaacgcctcg gaactggaac aacgctcaac cgcgtatgaa 360
atcaacaatg aactggaact ggtgtttatc aaaccgccgc tgattacgct gaccaacgtg 420
gttaatatca gcaccattca ggaatctttt attcgtttca cggttaccaa caaagaaggc 480
gtcaaaatcc gcacgaaaat tccgctgagc aaagttcatg gtctggatgt gaaaaacgtt 540
caactggtcg acgcaatcga taatattgtg tgggaaaaga aaagcctggt taccgaaaat 600
cgtctgcata aagaatgcct gctgcgtctg agcacggaag aacgccacat ctttctggac 660
tataaaaaat acggcagctc tatccgcctg gaactggtga acctgatcca ggctaaaacc 720
aaaaacttca cgatcgattt caaactgaaa tattttctgg gcagtggtgc tcaatccaaa 780
agttccctgc tgcatgcgat caaccacccg aaaagtcgtc cgaatacctc cctggaaatt 840
gaattcaccc cgcgcgacaa cgaaacggtg ccgtacgatg aactgattaa agaactgacc 900
acgctgtcac gtcatatctt tatggcgtcg ccggaaaacg ttattctgag cccgccgatc 960
aatgccccga ttaaaacctt catgctgccg aaacaggaca ttgttggcct ggatctggaa 1020
aacctgtatg cggtcacgaa aaccgatggt attccgatca ccattcgcgt gacgtcgaat 1080
ggcctgtatt gctactttac ccacctgggt tatattatcc gttacccggt taaacgcatt 1140
atcgactccg aagtcgtggt tttcggcgaa gcggtcaaag ataaaaattg gaccgtgtat 1200
ctgatcaaac tgattgaacc ggtgaacgcc atcaacgatc gtctggaaga atcaaaatac 1260
gtggaatcga aactggttga catctgtgat cgcatcgttt tcaaaagcaa aaaatacgaa 1320
ggtccgttca ccacgacctc tgaagtcgtg gatatgctga gtacctatct gccgaaacag 1380
ccggaaggcg tgatcctgtt ttacagcaaa ggtccgaaat ctaacatcga cttcaaaatc 1440
aaaaaagaaa acaccatcga tcaaacggcc aatgttgtct ttcgttatat gtcatcggaa 1500
ccgattatct ttggcgaaag ctctatcttc gtggaataca aaaaattctc gaacgataaa 1560
ggcttcccga aagaatacgg cagcggtaaa attgtcctgt ataacggtgt gaattacctg 1620
aacaatatct attgcctgga atacattaac acccataatg aagttggcat taaatctgtg 1680
gttgtcccga tcaaatttat tgcagaattc ctggtcaacg gtgaaatcct gaaaccgcgt 1740
attgacaaaa ccatgaaata catcaacagt gaagattact acggtaacca gcataacatc 1800
atcgtggaac acctgcgcga ccaatctatc aaaatcggcg atatcttcaa cgaagacaaa 1860
ctgagtgatg tcggtcacca gtatgcgaac aatgataaat ttcgtctgaa cccggaagtg 1920
tcctacttca ccaataaacg tacgcgcggc ccgctgggta tcctgtcaaa ttatgtcaaa 1980
accctgctga tttcaatgta ctgttcgaaa acgtttctgg atgacagcaa caaacgcaaa 2040
gttctggcca ttgactttgg caatggtgca gatctggaaa aatatttcta cggcgaaatc 2100
gctctgctgg ttgcgaccga tccggacgcg gatgccattg cacgtggcaa cgaacgctat 2160
aacaaactga attctggtat caaaaccaaa tactacaaat tcgactacat ccaggaaacc 2220
attcgtagtg atacgttcgt gagttccgtt cgcgaagtct tttatttcgg caaattcaac 2280
atcatcgatt ggcaattcgc catccattat tctttccatc cgcgtcacta cgcaaccgtg 2340
atgaacaatc tgagtgaact gacggcttcc ggcggtaaag ttctgattac gacgatggat 2400
ggtgataaac tgtccaaact gaccgataag aaaaccttca ttatccacaa aaacctgccg 2460
tcatcggaaa actacatgtc agtggaaaaa atcgccgatg accgcattgt ggtttataac 2520
ccgagcacga tgtctacccc gatgacggaa tacatcatta agaaaaacga tatcgtccgt 2580
gtgtttaatg aatacggttt cgttctggtc gacaacgttg attttgcaac cattatcgaa 2640
cgcagcaaaa aattcatcaa tggcgcttcc acgatggaag atcgtccgtc aacgcgcaac 2700
tttttcgaac tgaatcgcgg tgcaattaaa tgtgaaggtc tggatgtgga agatctgctg 2760
tcctattatg tcgtgtatgt gttctctaaa cgctaaccgg cttatcggtc agtttcacct 2820
gatttacgta aaaacccgct tcggcgggtt tttgcttttg gaggggcaga aagatgaatg 2880
actgtccacg acgctatacc caaaagaaat gttgacaatt aatcatcggc tcgtataatg 2940
tgtggaattg tgagcgctca caattgcgaa aaatcaataa ggaggcaaca agatgtgcga 3000
aaaacatctt aatcatgcgc cggaggtttt ctaatggatg aaatcgtcaa aaatatccgc 3060
gaaggcacgc acgtcctgct gccgttctat gaaaccctgc cggaactgaa tctgtcactg 3120
ggcaaatctc cgctgccgag tctggaatat ggtgcaaact actttctgca gatttctcgt 3180
gtgaacgatc tgaatcgcat gccgaccgac atgctgaaac tgttcacgca tgatatcatg 3240
ctgccggaaa gcgatctgga caaagtctac gaaatcctga aaatcaactc cgttaaatac 3300
tacggccgtt caaccaaagc ggatgccgtg gttgcagacc tgtccgctcg caataaactg 3360
tttaaacgtg aacgcgatgc tattaaatcg aacaatcacc tgaccgaaaa caacctgtac 3420
atcagcgatt acaaaatgct gacgtttgac gtgttccgtc cgctgttcga tttcgttaac 3480
gaaaaatact gcatcatcaa actgccgacc ctgtttggcc gtggtgtgat tgatacgatg 3540
cgcatctact gcagcctgtt caaaaatgtc cgcctgctga aatgtgtgtc ggatagctgg 3600
ctgaaagact ctgcgattat ggtggccagt gacgtttgta agaaaaacct ggacctgttt 3660
atgtcccatg tcaaatcagt gaccaaaagc tctagttgga aagacgttaa ttcggtccaa 3720
tttagcattc tgaacaatcc ggttgatacg gaattcatca acaaattcct ggaattctct 3780
aaccgtgttt acgaagcact gtattacgtc cacagtctgc tgtactcctc aatgacctcg 3840
gactccaaat ccatcgaaaa taaacatcaa cgccgcctgg tgaaactgct gctggggagc 3900
gcttggagcc acccgcagtt cgaaaaaggt ggaggttctg gcggtggatc gggaggttca 3960
gcgtggagcc acccgcagtt cgagaaataa ccaggcatca aataaaacga aaggctcagt 4020
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc tactagagtc 4080
acactggctc accttcgggt gggcctttct gcgtttataa taaccccttg gggcctctaa 4140
acgggtcttg aggggttttt tgc 4163
<210> 24
<211> 4175
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccacagc 120
gaaaaatcaa taaggaggca acaagatgtg cgaaaaacat cttaatcatg cgacggagcg 180
tttctaatga aacatcacca tcaccatcac cccatgagcg attacgacat ccccactact 240
gagaatcttt attttcaggg cgccgacgcc aacgtagtga gctcgtccac gattgctaca 300
tacatcgacg cactggctaa aaacgcgagt gaattagagc aacgttcaac cgcctatgaa 360
atcaacaacg aacttgagct cgtctttatt aagcctccgc taatcaccct gactaacgtt 420
gttaatatat ctaccatcca ggaaagcttc attcgcttca ctgttactaa caaagaaggc 480
gtaaaaatca ggactaaaat cccattgtct aaggtgcacg ggctggatgt gaaaaacgtt 540
cagctggttg acgctattga caacatcgta tgggaaaaga aatccctcgt aaccgaaaac 600
cgtctgcata aagaatgtct gctgcgtctg agcacggagg aacgacacat ctttctggat 660
tacaaaaaat atggtagttc tattcgtctg gagctggtga acctgatcca ggcaaagacc 720
aaaaatttca caattgactt caaactaaaa tactttctgg gctccggtgc gcagagcaaa 780
tcttccctgt tgcatgctat caaccacccg aaaagccgcc cgaatacttc tctggaaatc 840
gagttcaccc cccgcgataa cgaaactgtc ccatacgatg agcttattaa ggaactgacc 900
acgctgtccc gtcacatttt tatggcgagc ccggaaaacg ttatattatc gccgcctatc 960
aacgctccga tcaagacctt catgttgccg aaacaagaca tcgtcggtct ggatctggag 1020
aacctgtacg cagttactaa aaccgacggc atccccatca ctatcagagt aacgtcaaac 1080
ggattgtatt gctatttcac ccatctgggt tacattattc gttacccggt gaaacgcatc 1140
atagattctg aagttgttgt tttcggcgaa gccgtaaagg acaaaaactg gaccgtctat 1200
ctgatcaagc taatcgaacc ggttaatgct atcaacgatc ggctggaaga atcgaaatac 1260
gtagaatcta aactggtgga tatttgcgac cgtattgtct ttaaatcgaa aaagtacgag 1320
ggtcctttca ctactactag cgaagtcgtg gacatgctct ctacgtacct gccgaaacag 1380
cctgagggcg ttatcctgtt ctatagcaaa ggtccgaaat ccaacatcga ttttaagatt 1440
aaaaaggaaa acaccattga tcagacggct aatgtagttt tccggtacat gtctagcgag 1500
ccgatcatct ttggcgaatc ttctatcttt gtagaatata aaaagttcag caacgacaaa 1560
ggattcccaa aagaatacgg gtccgggaaa atcgtcttat acaacggtgt taactacttg 1620
aacaacatct attgcctgga atatatcaat actcacaatg aagttggtat taaatcagtg 1680
gttgttccga taaaattcat cgcggaattt ctggtcaatg gcgaaatcct gaaaccccgc 1740
attgataaga ccatgaaata cataaactcc gaagactact acggtaacca gcataacatc 1800
atcgtggaac acctgagaga tcagagtatc aaaatcggcg acattttcaa tgaggacaag 1860
ttaagcgacg tgggccatca atacgcaaac aacgacaaat tccgtctgaa cccggaggtt 1920
tcctatttca ccaacaaacg tacccgaggt ccgcttggca tcctctccaa ttacgtaaaa 1980
accctgctga tttctatgta ttgttcaaaa acgttcctgg atgacagcaa caaaaggaag 2040
gtactggcta tcgatttcgg taacggcgcg gatctggaaa agtactttta cggtgaaatc 2100
gctctgttag tcgcaactga tccggacgcc gacgcaattg ctcgcggaaa tgaacgttac 2160
aacaaactga actccggtat taaaacaaag tattataaat tcgactatat ccaggagact 2220
atccgctctg atactttcgt gagcagcgtg cgtgaggttt tttactttgg taaattcaac 2280
attattgact ggcagtttgc gatccactac agctttcacc cgcgtcacta tgcgaccgtt 2340
atgaataacc tatcggaact cacggctagc ggcggcaaag tgctgattac tactatggac 2400
ggtgacaaac tgtctaagct gaccgataag aaaaccttca tcatccacaa aaacttgcca 2460
agttctgaga actatatgtc tgttgaaaaa attgcggacg accgcatcgt cgtttacaac 2520
ccatctacca tgtccacccc tatgacagag tacatcatca aaaagaacga catagttcgt 2580
gttttcaacg aatacggctt cgtactggta gataacgtcg attttgctac cattatcgag 2640
cgttcgaaaa aattcattaa cggtgcttcc actatggaag atcgtccgtc cactcgtaac 2700
ttttttgaat taaaccgtgg cgcaatcaaa tgcgaagggc tggatgtgga agacctcctg 2760
tcttactacg ttgtatacgt cttctctaaa cgctaaccgg cttatcggtc agtttcacct 2820
gatttacgta aaaacccgct tcggcgggtt tttgcttttg gaggggcaga aagatgaatg 2880
actgtccacg acgctatacc caaaagaaat gttgacaatt aatcatcggc tcgtataatg 2940
tgtggaattg tgagcgctca caattgtcaa taaaggcata taaaaggagg ttaataacat 3000
gaaagttaaa gtaaaacatc ttaatcatgc gggggagtct ttctaatgga tgagatcgtt 3060
aagaacattc gtgaaggtac gcatgtgctt ttgccatttt acgaaactct cccggaactg 3120
aatctgtcct taggcaaaag ccctctaccc tctctggagt atggggccaa ctacttcctg 3180
caaatctcac gcgtcaacga cctgaatcga atgccgaccg acatgctgaa actgttcact 3240
cacgatataa tgctgccgga aagtgatctg gacaaagtat atgaaatcct gaaaatcaac 3300
agcgttaagt actacggacg gtcgaccaaa gcggacgctg ttgtagcaga tctgtctgct 3360
cgcaacaaac tctttaaacg tgaacgtgac gctattaagt ccaacaacca cctgacagag 3420
aacaatctct atatctctga ctacaaaatg ttgactttcg atgtgttccg tccgctgttt 3480
gatttcgtga acgaaaaata ttgcattatc aaactgccga ccctgttcgg ccgtggtgtt 3540
attgacacca tgcgcatcta ctgtagcctc ttcaagaatg tcagactact gaaatgcgtg 3600
tccgatagct ggctgaaaga cagcgcaatc atggtagcct cagacgtttg caaaaagaac 3660
ctggatctgt ttatgtccca tgttaaatcc gttactaagt ctagctcgtg gaaagatgtt 3720
aacagcgtac agttttctat tttgaacaac cctgttgaca cggaatttat caacaaattc 3780
ctggagttct ctaaccgtgt atacgaagcg ctgtattacg tgcactcctt actgtactct 3840
tctatgacca gcgatagtaa gtctatcgaa aataaacacc agcgccgtct ggtaaaactg 3900
ctccttggga gcgcttggag ccacccgcag ttcgaaaaag gtggaggttc tggcggtgga 3960
tcgggaggtt cagcgtggag ccacccgcag ttcgagaaat aaccaggcat caaataaaac 4020
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 4080
tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat aataacccct 4140
tggggcctct aaacgggtct tgaggggttt tttgc 4175
<210> 25
<211> 4175
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccacagc 120
gaaaaatcaa taaggaggca acaagatgtg cgaaaaacat cttaatcatg cacaggagac 180
tttctaatga aacatcacca tcaccatcac cccatgagcg attacgacat ccccactact 240
gagaatcttt attttcaggg cgccgacgcc aacgtagtga gctcgtccac gattgctaca 300
tacatcgacg cactggctaa aaacgcgagt gaattagagc aacgttcaac cgcctatgaa 360
atcaacaacg aacttgagct cgtctttatt aagcctccgc taatcaccct gactaacgtt 420
gttaatatat ctaccatcca ggaaagcttc attcgcttca ctgttactaa caaagaaggc 480
gtaaaaatca ggactaaaat cccattgtct aaggtgcacg ggctggatgt gaaaaacgtt 540
cagctggttg acgctattga caacatcgta tgggaaaaga aatccctcgt aaccgaaaac 600
cgtctgcata aagaatgtct gctgcgtctg agcacggagg aacgacacat ctttctggat 660
tacaaaaaat atggtagttc tattcgtctg gagctggtga acctgatcca ggcaaagacc 720
aaaaatttca caattgactt caaactaaaa tactttctgg gctccggtgc gcagagcaaa 780
tcttccctgt tgcatgctat caaccacccg aaaagccgcc cgaatacttc tctggaaatc 840
gagttcaccc cccgcgataa cgaaactgtc ccatacgatg agcttattaa ggaactgacc 900
acgctgtccc gtcacatttt tatggcgagc ccggaaaacg ttatattatc gccgcctatc 960
aacgctccga tcaagacctt catgttgccg aaacaagaca tcgtcggtct ggatctggag 1020
aacctgtacg cagttactaa aaccgacggc atccccatca ctatcagagt aacgtcaaac 1080
ggattgtatt gctatttcac ccatctgggt tacattattc gttacccggt gaaacgcatc 1140
atagattctg aagttgttgt tttcggcgaa gccgtaaagg acaaaaactg gaccgtctat 1200
ctgatcaagc taatcgaacc ggttaatgct atcaacgatc ggctggaaga atcgaaatac 1260
gtagaatcta aactggtgga tatttgcgac cgtattgtct ttaaatcgaa aaagtacgag 1320
ggtcctttca ctactactag cgaagtcgtg gacatgctct ctacgtacct gccgaaacag 1380
cctgagggcg ttatcctgtt ctatagcaaa ggtccgaaat ccaacatcga ttttaagatt 1440
aaaaaggaaa acaccattga tcagacggct aatgtagttt tccggtacat gtctagcgag 1500
ccgatcatct ttggcgaatc ttctatcttt gtagaatata aaaagttcag caacgacaaa 1560
ggattcccaa aagaatacgg gtccgggaaa atcgtcttat acaacggtgt taactacttg 1620
aacaacatct attgcctgga atatatcaat actcacaatg aagttggtat taaatcagtg 1680
gttgttccga taaaattcat cgcggaattt ctggtcaatg gcgaaatcct gaaaccccgc 1740
attgataaga ccatgaaata cataaactcc gaagactact acggtaacca gcataacatc 1800
atcgtggaac acctgagaga tcagagtatc aaaatcggcg acattttcaa tgaggacaag 1860
ttaagcgacg tgggccatca atacgcaaac aacgacaaat tccgtctgaa cccggaggtt 1920
tcctatttca ccaacaaacg tacccgaggt ccgcttggca tcctctccaa ttacgtaaaa 1980
accctgctga tttctatgta ttgttcaaaa acgttcctgg atgacagcaa caaaaggaag 2040
gtactggcta tcgatttcgg taacggcgcg gatctggaaa agtactttta cggtgaaatc 2100
gctctgttag tcgcaactga tccggacgcc gacgcaattg ctcgcggaaa tgaacgttac 2160
aacaaactga actccggtat taaaacaaag tattataaat tcgactatat ccaggagact 2220
atccgctctg atactttcgt gagcagcgtg cgtgaggttt tttactttgg taaattcaac 2280
attattgact ggcagtttgc gatccactac agctttcacc cgcgtcacta tgcgaccgtt 2340
atgaataacc tatcggaact cacggctagc ggcggcaaag tgctgattac tactatggac 2400
ggtgacaaac tgtctaagct gaccgataag aaaaccttca tcatccacaa aaacttgcca 2460
agttctgaga actatatgtc tgttgaaaaa attgcggacg accgcatcgt cgtttacaac 2520
ccatctacca tgtccacccc tatgacagag tacatcatca aaaagaacga catagttcgt 2580
gttttcaacg aatacggctt cgtactggta gataacgtcg attttgctac cattatcgag 2640
cgttcgaaaa aattcattaa cggtgcttcc actatggaag atcgtccgtc cactcgtaac 2700
ttttttgaat taaaccgtgg cgcaatcaaa tgcgaagggc tggatgtgga agacctcctg 2760
tcttactacg ttgtatacgt cttctctaaa cgctaaccgg cttatcggtc agtttcacct 2820
gatttacgta aaaacccgct tcggcgggtt tttgcttttg gaggggcaga aagatgaatg 2880
actgtccacg acgctatacc caaaagaaat gttgacaatt aatcatcggc tcgtataatg 2940
tgtggaattg tgagcgctca caattgtcaa taaaggcata taaaaggagg ttaataacat 3000
gaaagttaaa gtaaaacatc ttaatcatgc taaggaggtt ttctaatgga tgagatcgtt 3060
aagaacattc gtgaaggtac gcatgtgctt ttgccatttt acgaaactct cccggaactg 3120
aatctgtcct taggcaaaag ccctctaccc tctctggagt atggggccaa ctacttcctg 3180
caaatctcac gcgtcaacga cctgaatcga atgccgaccg acatgctgaa actgttcact 3240
cacgatataa tgctgccgga aagtgatctg gacaaagtat atgaaatcct gaaaatcaac 3300
agcgttaagt actacggacg gtcgaccaaa gcggacgctg ttgtagcaga tctgtctgct 3360
cgcaacaaac tctttaaacg tgaacgtgac gctattaagt ccaacaacca cctgacagag 3420
aacaatctct atatctctga ctacaaaatg ttgactttcg atgtgttccg tccgctgttt 3480
gatttcgtga acgaaaaata ttgcattatc aaactgccga ccctgttcgg ccgtggtgtt 3540
attgacacca tgcgcatcta ctgtagcctc ttcaagaatg tcagactact gaaatgcgtg 3600
tccgatagct ggctgaaaga cagcgcaatc atggtagcct cagacgtttg caaaaagaac 3660
ctggatctgt ttatgtccca tgttaaatcc gttactaagt ctagctcgtg gaaagatgtt 3720
aacagcgtac agttttctat tttgaacaac cctgttgaca cggaatttat caacaaattc 3780
ctggagttct ctaaccgtgt atacgaagcg ctgtattacg tgcactcctt actgtactct 3840
tctatgacca gcgatagtaa gtctatcgaa aataaacacc agcgccgtct ggtaaaactg 3900
ctccttggga gcgcttggag ccacccgcag ttcgaaaaag gtggaggttc tggcggtgga 3960
tcgggaggtt cagcgtggag ccacccgcag ttcgagaaat aaccaggcat caaataaaac 4020
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 4080
tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat aataacccct 4140
tggggcctct aaacgggtct tgaggggttt tttgc 4175
<210> 26
<211> 4163
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccacagc 120
gaaaaatcaa taaggaggca acaagatgtg cgaaaaacat cttaatcatg cggtggaggg 180
tttctaatga aacatcacca tcaccatcac cccatgagcg attacgacat ccccactact 240
gagaatcttt attttcaggg cgccgacgct aatgtcgtgt cttcttctac catcgcaacc 300
tatattgacg ctctggcaaa aaacgcctcg gaactggaac aacgctcaac cgcgtatgaa 360
atcaacaatg aactggaact ggtgtttatc aaaccgccgc tgattacgct gaccaacgtg 420
gttaatatca gcaccattca ggaatctttt attcgtttca cggttaccaa caaagaaggc 480
gtcaaaatcc gcacgaaaat tccgctgagc aaagttcatg gtctggatgt gaaaaacgtt 540
caactggtcg acgcaatcga taatattgtg tgggaaaaga aaagcctggt taccgaaaat 600
cgtctgcata aagaatgcct gctgcgtctg agcacggaag aacgccacat ctttctggac 660
tataaaaaat acggcagctc tatccgcctg gaactggtga acctgatcca ggctaaaacc 720
aaaaacttca cgatcgattt caaactgaaa tattttctgg gcagtggtgc tcaatccaaa 780
agttccctgc tgcatgcgat caaccacccg aaaagtcgtc cgaatacctc cctggaaatt 840
gaattcaccc cgcgcgacaa cgaaacggtg ccgtacgatg aactgattaa agaactgacc 900
acgctgtcac gtcatatctt tatggcgtcg ccggaaaacg ttattctgag cccgccgatc 960
aatgccccga ttaaaacctt catgctgccg aaacaggaca ttgttggcct ggatctggaa 1020
aacctgtatg cggtcacgaa aaccgatggt attccgatca ccattcgcgt gacgtcgaat 1080
ggcctgtatt gctactttac ccacctgggt tatattatcc gttacccggt taaacgcatt 1140
atcgactccg aagtcgtggt tttcggcgaa gcggtcaaag ataaaaattg gaccgtgtat 1200
ctgatcaaac tgattgaacc ggtgaacgcc atcaacgatc gtctggaaga atcaaaatac 1260
gtggaatcga aactggttga catctgtgat cgcatcgttt tcaaaagcaa aaaatacgaa 1320
ggtccgttca ccacgacctc tgaagtcgtg gatatgctga gtacctatct gccgaaacag 1380
ccggaaggcg tgatcctgtt ttacagcaaa ggtccgaaat ctaacatcga cttcaaaatc 1440
aaaaaagaaa acaccatcga tcaaacggcc aatgttgtct ttcgttatat gtcatcggaa 1500
ccgattatct ttggcgaaag ctctatcttc gtggaataca aaaaattctc gaacgataaa 1560
ggcttcccga aagaatacgg cagcggtaaa attgtcctgt ataacggtgt gaattacctg 1620
aacaatatct attgcctgga atacattaac acccataatg aagttggcat taaatctgtg 1680
gttgtcccga tcaaatttat tgcagaattc ctggtcaacg gtgaaatcct gaaaccgcgt 1740
attgacaaaa ccatgaaata catcaacagt gaagattact acggtaacca gcataacatc 1800
atcgtggaac acctgcgcga ccaatctatc aaaatcggcg atatcttcaa cgaagacaaa 1860
ctgagtgatg tcggtcacca gtatgcgaac aatgataaat ttcgtctgaa cccggaagtg 1920
tcctacttca ccaataaacg tacgcgcggc ccgctgggta tcctgtcaaa ttatgtcaaa 1980
accctgctga tttcaatgta ctgttcgaaa acgtttctgg atgacagcaa caaacgcaaa 2040
gttctggcca ttgactttgg caatggtgca gatctggaaa aatatttcta cggcgaaatc 2100
gctctgctgg ttgcgaccga tccggacgcg gatgccattg cacgtggcaa cgaacgctat 2160
aacaaactga attctggtat caaaaccaaa tactacaaat tcgactacat ccaggaaacc 2220
attcgtagtg atacgttcgt gagttccgtt cgcgaagtct tttatttcgg caaattcaac 2280
atcatcgatt ggcaattcgc catccattat tctttccatc cgcgtcacta cgcaaccgtg 2340
atgaacaatc tgagtgaact gacggcttcc ggcggtaaag ttctgattac gacgatggat 2400
ggtgataaac tgtccaaact gaccgataag aaaaccttca ttatccacaa aaacctgccg 2460
tcatcggaaa actacatgtc agtggaaaaa atcgccgatg accgcattgt ggtttataac 2520
ccgagcacga tgtctacccc gatgacggaa tacatcatta agaaaaacga tatcgtccgt 2580
gtgtttaatg aatacggttt cgttctggtc gacaacgttg attttgcaac cattatcgaa 2640
cgcagcaaaa aattcatcaa tggcgcttcc acgatggaag atcgtccgtc aacgcgcaac 2700
tttttcgaac tgaatcgcgg tgcaattaaa tgtgaaggtc tggatgtgga agatctgctg 2760
tcctattatg tcgtgtatgt gttctctaaa cgctaaccgg cttatcggtc agtttcacct 2820
gatttacgta aaaacccgct tcggcgggtt tttgcttttg gaggggcaga aagatgaatg 2880
actgtccacg acgctatacc caaaagaaat gttgacaatt aatcatcggc tcgtataatg 2940
tgtggaattg tgagcgctca caattgcgaa aaatcaataa ggaggcaaca agatgtgcga 3000
aaaacatctt aatcatgcgc cggaggtttt ctaatggatg aaatcgtcaa aaatatccgc 3060
gaaggcacgc acgtcctgct gccgttctat gaaaccctgc cggaactgaa tctgtcactg 3120
ggcaaatctc cgctgccgag tctggaatat ggtgcaaact actttctgca gatttctcgt 3180
gtgaacgatc tgaatcgcat gccgaccgac atgctgaaac tgttcacgca tgatatcatg 3240
ctgccggaaa gcgatctgga caaagtctac gaaatcctga aaatcaactc cgttaaatac 3300
tacggccgtt caaccaaagc ggatgccgtg gttgcagacc tgtccgctcg caataaactg 3360
tttaaacgtg aacgcgatgc tattaaatcg aacaatcacc tgaccgaaaa caacctgtac 3420
atcagcgatt acaaaatgct gacgtttgac gtgttccgtc cgctgttcga tttcgttaac 3480
gaaaaatact gcatcatcaa actgccgacc ctgtttggcc gtggtgtgat tgatacgatg 3540
cgcatctact gcagcctgtt caaaaatgtc cgcctgctga aatgtgtgtc ggatagctgg 3600
ctgaaagact ctgcgattat ggtggccagt gacgtttgta agaaaaacct ggacctgttt 3660
atgtcccatg tcaaatcagt gaccaaaagc tctagttgga aagacgttaa ttcggtccaa 3720
tttagcattc tgaacaatcc ggttgatacg gaattcatca acaaattcct ggaattctct 3780
aaccgtgttt acgaagcact gtattacgtc cacagtctgc tgtactcctc aatgacctcg 3840
gactccaaat ccatcgaaaa taaacatcaa cgccgcctgg tgaaactgct gctggggagc 3900
gcttggagcc acccgcagtt cgaaaaaggt ggaggttctg gcggtggatc gggaggttca 3960
gcgtggagcc acccgcagtt cgagaaataa ccaggcatca aataaaacga aaggctcagt 4020
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc tactagagtc 4080
acactggctc accttcgggt gggcctttct gcgtttataa taaccccttg gggcctctaa 4140
acgggtcttg aggggttttt tgc 4163
<210> 27
<211> 4175
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccacagc 120
gaaaaatcaa taaggaggca acaagatgtg cgaaaaacat cttaatcatg cggaggatcg 180
tttctaatga aacatcacca tcaccatcac cccatgagcg attacgacat ccccactact 240
gagaatcttt attttcaggg cgccgacgct aatgtcgtgt cttcttctac catcgcaacc 300
tatattgacg ctctggcaaa aaacgcctcg gaactggaac aacgctcaac cgcgtatgaa 360
atcaacaatg aactggaact ggtgtttatc aaaccgccgc tgattacgct gaccaacgtg 420
gttaatatca gcaccattca ggaatctttt attcgtttca cggttaccaa caaagaaggc 480
gtcaaaatcc gcacgaaaat tccgctgagc aaagttcatg gtctggatgt gaaaaacgtt 540
caactggtcg acgcaatcga taatattgtg tgggaaaaga aaagcctggt taccgaaaat 600
cgtctgcata aagaatgcct gctgcgtctg agcacggaag aacgccacat ctttctggac 660
tataaaaaat acggcagctc tatccgcctg gaactggtga acctgatcca ggctaaaacc 720
aaaaacttca cgatcgattt caaactgaaa tattttctgg gcagtggtgc tcaatccaaa 780
agttccctgc tgcatgcgat caaccacccg aaaagtcgtc cgaatacctc cctggaaatt 840
gaattcaccc cgcgcgacaa cgaaacggtg ccgtacgatg aactgattaa agaactgacc 900
acgctgtcac gtcatatctt tatggcgtcg ccggaaaacg ttattctgag cccgccgatc 960
aatgccccga ttaaaacctt catgctgccg aaacaggaca ttgttggcct ggatctggaa 1020
aacctgtatg cggtcacgaa aaccgatggt attccgatca ccattcgcgt gacgtcgaat 1080
ggcctgtatt gctactttac ccacctgggt tatattatcc gttacccggt taaacgcatt 1140
atcgactccg aagtcgtggt tttcggcgaa gcggtcaaag ataaaaattg gaccgtgtat 1200
ctgatcaaac tgattgaacc ggtgaacgcc atcaacgatc gtctggaaga atcaaaatac 1260
gtggaatcga aactggttga catctgtgat cgcatcgttt tcaaaagcaa aaaatacgaa 1320
ggtccgttca ccacgacctc tgaagtcgtg gatatgctga gtacctatct gccgaaacag 1380
ccggaaggcg tgatcctgtt ttacagcaaa ggtccgaaat ctaacatcga cttcaaaatc 1440
aaaaaagaaa acaccatcga tcaaacggcc aatgttgtct ttcgttatat gtcatcggaa 1500
ccgattatct ttggcgaaag ctctatcttc gtggaataca aaaaattctc gaacgataaa 1560
ggcttcccga aagaatacgg cagcggtaaa attgtcctgt ataacggtgt gaattacctg 1620
aacaatatct attgcctgga atacattaac acccataatg aagttggcat taaatctgtg 1680
gttgtcccga tcaaatttat tgcagaattc ctggtcaacg gtgaaatcct gaaaccgcgt 1740
attgacaaaa ccatgaaata catcaacagt gaagattact acggtaacca gcataacatc 1800
atcgtggaac acctgcgcga ccaatctatc aaaatcggcg atatcttcaa cgaagacaaa 1860
ctgagtgatg tcggtcacca gtatgcgaac aatgataaat ttcgtctgaa cccggaagtg 1920
tcctacttca ccaataaacg tacgcgcggc ccgctgggta tcctgtcaaa ttatgtcaaa 1980
accctgctga tttcaatgta ctgttcgaaa acgtttctgg atgacagcaa caaacgcaaa 2040
gttctggcca ttgactttgg caatggtgca gatctggaaa aatatttcta cggcgaaatc 2100
gctctgctgg ttgcgaccga tccggacgcg gatgccattg cacgtggcaa cgaacgctat 2160
aacaaactga attctggtat caaaaccaaa tactacaaat tcgactacat ccaggaaacc 2220
attcgtagtg atacgttcgt gagttccgtt cgcgaagtct tttatttcgg caaattcaac 2280
atcatcgatt ggcaattcgc catccattat tctttccatc cgcgtcacta cgcaaccgtg 2340
atgaacaatc tgagtgaact gacggcttcc ggcggtaaag ttctgattac gacgatggat 2400
ggtgataaac tgtccaaact gaccgataag aaaaccttca ttatccacaa aaacctgccg 2460
tcatcggaaa actacatgtc agtggaaaaa atcgccgatg accgcattgt ggtttataac 2520
ccgagcacga tgtctacccc gatgacggaa tacatcatta agaaaaacga tatcgtccgt 2580
gtgtttaatg aatacggttt cgttctggtc gacaacgttg attttgcaac cattatcgaa 2640
cgcagcaaaa aattcatcaa tggcgcttcc acgatggaag atcgtccgtc aacgcgcaac 2700
tttttcgaac tgaatcgcgg tgcaattaaa tgtgaaggtc tggatgtgga agatctgctg 2760
tcctattatg tcgtgtatgt gttctctaaa cgctaaccgg cttatcggtc agtttcacct 2820
gatttacgta aaaacccgct tcggcgggtt tttgcttttg gaggggcaga aagatgaatg 2880
actgtccacg acgctatacc caaaagaaat gttgacaatt aatcatcggc tcgtataatg 2940
tgtggaattg tgagcgctca caattgtcaa taaaggcata taaaaggagg ttaataacat 3000
gaaagttaaa gtaaaacatc ttaatcatgc gggggagtct ttctaatgga tgaaatcgtc 3060
aaaaatatcc gcgaaggcac gcacgtcctg ctgccgttct atgaaaccct gccggaactg 3120
aatctgtcac tgggcaaatc tccgctgccg agtctggaat atggtgcaaa ctactttctg 3180
cagatttctc gtgtgaacga tctgaatcgc atgccgaccg acatgctgaa actgttcacg 3240
catgatatca tgctgccgga aagcgatctg gacaaagtct acgaaatcct gaaaatcaac 3300
tccgttaaat actacggccg ttcaaccaaa gcggatgccg tggttgcaga cctgtccgct 3360
cgcaataaac tgtttaaacg tgaacgcgat gctattaaat cgaacaatca cctgaccgaa 3420
aacaacctgt acatcagcga ttacaaaatg ctgacgtttg acgtgttccg tccgctgttc 3480
gatttcgtta acgaaaaata ctgcatcatc aaactgccga ccctgtttgg ccgtggtgtg 3540
attgatacga tgcgcatcta ctgcagcctg ttcaaaaatg tccgcctgct gaaatgtgtg 3600
tcggatagct ggctgaaaga ctctgcgatt atggtggcca gtgacgtttg taagaaaaac 3660
ctggacctgt ttatgtccca tgtcaaatca gtgaccaaaa gctctagttg gaaagacgtt 3720
aattcggtcc aatttagcat tctgaacaat ccggttgata cggaattcat caacaaattc 3780
ctggaattct ctaaccgtgt ttacgaagca ctgtattacg tccacagtct gctgtactcc 3840
tcaatgacct cggactccaa atccatcgaa aataaacatc aacgccgcct ggtgaaactg 3900
ctgctgggga gcgcttggag ccacccgcag ttcgaaaaag gtggaggttc tggcggtgga 3960
tcgggaggtt cagcgtggag ccacccgcag ttcgagaaat aaccaggcat caaataaaac 4020
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 4080
tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat aataacccct 4140
tggggcctct aaacgggtct tgaggggttt tttgc 4175
<210> 28
<211> 4175
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
aattgtgagc ggataacaat tacgagcttc atgcacagtg aaatcatgaa aaatttattt 60
gctttgtgag cggataacaa ttataatatg tggaattgtg agcgctcaca attccacagc 120
gaaaaatcaa taaggaggca acaagatgtg cgaaaaacat cttaatcatg cggaggatcg 180
tttctaatga aacatcacca tcaccatcac cccatgagcg attacgacat ccccactact 240
gagaatcttt attttcaggg cgccgacgct aatgtcgtgt cttcttctac catcgcaacc 300
tatattgacg ctctggcaaa aaacgcctcg gaactggaac aacgctcaac cgcgtatgaa 360
atcaacaatg aactggaact ggtgtttatc aaaccgccgc tgattacgct gaccaacgtg 420
gttaatatca gcaccattca ggaatctttt attcgtttca cggttaccaa caaagaaggc 480
gtcaaaatcc gcacgaaaat tccgctgagc aaagttcatg gtctggatgt gaaaaacgtt 540
caactggtcg acgcaatcga taatattgtg tgggaaaaga aaagcctggt taccgaaaat 600
cgtctgcata aagaatgcct gctgcgtctg agcacggaag aacgccacat ctttctggac 660
tataaaaaat acggcagctc tatccgcctg gaactggtga acctgatcca ggctaaaacc 720
aaaaacttca cgatcgattt caaactgaaa tattttctgg gcagtggtgc tcaatccaaa 780
agttccctgc tgcatgcgat caaccacccg aaaagtcgtc cgaatacctc cctggaaatt 840
gaattcaccc cgcgcgacaa cgaaacggtg ccgtacgatg aactgattaa agaactgacc 900
acgctgtcac gtcatatctt tatggcgtcg ccggaaaacg ttattctgag cccgccgatc 960
aatgccccga ttaaaacctt catgctgccg aaacaggaca ttgttggcct ggatctggaa 1020
aacctgtatg cggtcacgaa aaccgatggt attccgatca ccattcgcgt gacgtcgaat 1080
ggcctgtatt gctactttac ccacctgggt tatattatcc gttacccggt taaacgcatt 1140
atcgactccg aagtcgtggt tttcggcgaa gcggtcaaag ataaaaattg gaccgtgtat 1200
ctgatcaaac tgattgaacc ggtgaacgcc atcaacgatc gtctggaaga atcaaaatac 1260
gtggaatcga aactggttga catctgtgat cgcatcgttt tcaaaagcaa aaaatacgaa 1320
ggtccgttca ccacgacctc tgaagtcgtg gatatgctga gtacctatct gccgaaacag 1380
ccggaaggcg tgatcctgtt ttacagcaaa ggtccgaaat ctaacatcga cttcaaaatc 1440
aaaaaagaaa acaccatcga tcaaacggcc aatgttgtct ttcgttatat gtcatcggaa 1500
ccgattatct ttggcgaaag ctctatcttc gtggaataca aaaaattctc gaacgataaa 1560
ggcttcccga aagaatacgg cagcggtaaa attgtcctgt ataacggtgt gaattacctg 1620
aacaatatct attgcctgga atacattaac acccataatg aagttggcat taaatctgtg 1680
gttgtcccga tcaaatttat tgcagaattc ctggtcaacg gtgaaatcct gaaaccgcgt 1740
attgacaaaa ccatgaaata catcaacagt gaagattact acggtaacca gcataacatc 1800
atcgtggaac acctgcgcga ccaatctatc aaaatcggcg atatcttcaa cgaagacaaa 1860
ctgagtgatg tcggtcacca gtatgcgaac aatgataaat ttcgtctgaa cccggaagtg 1920
tcctacttca ccaataaacg tacgcgcggc ccgctgggta tcctgtcaaa ttatgtcaaa 1980
accctgctga tttcaatgta ctgttcgaaa acgtttctgg atgacagcaa caaacgcaaa 2040
gttctggcca ttgactttgg caatggtgca gatctggaaa aatatttcta cggcgaaatc 2100
gctctgctgg ttgcgaccga tccggacgcg gatgccattg cacgtggcaa cgaacgctat 2160
aacaaactga attctggtat caaaaccaaa tactacaaat tcgactacat ccaggaaacc 2220
attcgtagtg atacgttcgt gagttccgtt cgcgaagtct tttatttcgg caaattcaac 2280
atcatcgatt ggcaattcgc catccattat tctttccatc cgcgtcacta cgcaaccgtg 2340
atgaacaatc tgagtgaact gacggcttcc ggcggtaaag ttctgattac gacgatggat 2400
ggtgataaac tgtccaaact gaccgataag aaaaccttca ttatccacaa aaacctgccg 2460
tcatcggaaa actacatgtc agtggaaaaa atcgccgatg accgcattgt ggtttataac 2520
ccgagcacga tgtctacccc gatgacggaa tacatcatta agaaaaacga tatcgtccgt 2580
gtgtttaatg aatacggttt cgttctggtc gacaacgttg attttgcaac cattatcgaa 2640
cgcagcaaaa aattcatcaa tggcgcttcc acgatggaag atcgtccgtc aacgcgcaac 2700
tttttcgaac tgaatcgcgg tgcaattaaa tgtgaaggtc tggatgtgga agatctgctg 2760
tcctattatg tcgtgtatgt gttctctaaa cgctaaccgg cttatcggtc agtttcacct 2820
gatttacgta aaaacccgct tcggcgggtt tttgcttttg gaggggcaga aagatgaatg 2880
actgtccacg acgctatacc caaaagaaat gttgacaatt aatcatcggc tcgtataatg 2940
tgtggaattg tgagcgctca caattgtcaa taaaggcata taaaaggagg ttaataacat 3000
gaaagttaaa gtaaaacatc ttaatcatgc gggggagtgt ttctaatgga tgaaatcgtc 3060
aaaaatatcc gcgaaggcac gcacgtcctg ctgccgttct atgaaaccct gccggaactg 3120
aatctgtcac tgggcaaatc tccgctgccg agtctggaat atggtgcaaa ctactttctg 3180
cagatttctc gtgtgaacga tctgaatcgc atgccgaccg acatgctgaa actgttcacg 3240
catgatatca tgctgccgga aagcgatctg gacaaagtct acgaaatcct gaaaatcaac 3300
tccgttaaat actacggccg ttcaaccaaa gcggatgccg tggttgcaga cctgtccgct 3360
cgcaataaac tgtttaaacg tgaacgcgat gctattaaat cgaacaatca cctgaccgaa 3420
aacaacctgt acatcagcga ttacaaaatg ctgacgtttg acgtgttccg tccgctgttc 3480
gatttcgtta acgaaaaata ctgcatcatc aaactgccga ccctgtttgg ccgtggtgtg 3540
attgatacga tgcgcatcta ctgcagcctg ttcaaaaatg tccgcctgct gaaatgtgtg 3600
tcggatagct ggctgaaaga ctctgcgatt atggtggcca gtgacgtttg taagaaaaac 3660
ctggacctgt ttatgtccca tgtcaaatca gtgaccaaaa gctctagttg gaaagacgtt 3720
aattcggtcc aatttagcat tctgaacaat ccggttgata cggaattcat caacaaattc 3780
ctggaattct ctaaccgtgt ttacgaagca ctgtattacg tccacagtct gctgtactcc 3840
tcaatgacct cggactccaa atccatcgaa aataaacatc aacgccgcct ggtgaaactg 3900
ctgctgggga gcgcttggag ccacccgcag ttcgaaaaag gtggaggttc tggcggtgga 3960
tcgggaggtt cagcgtggag ccacccgcag ttcgagaaat aaccaggcat caaataaaac 4020
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 4080
tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat aataacccct 4140
tggggcctct aaacgggtct tgaggggttt tttgc 4175
<210> 29
<211> 844
<212> PRT
<213> 未知
<220>
<223> 牛痘病毒
<400> 29
Met Asp Ala Asn Val Val Ser Ser Ser Thr Ile Ala Thr Tyr Ile Asp
1 5 10 15
Ala Leu Ala Lys Asn Ala Ser Glu Leu Glu Gln Arg Ser Thr Ala Tyr
20 25 30
Glu Ile Asn Asn Glu Leu Glu Leu Val Phe Ile Lys Pro Pro Leu Ile
35 40 45
Thr Leu Thr Asn Val Val Asn Ile Ser Thr Ile Gln Glu Ser Phe Ile
50 55 60
Arg Phe Thr Val Thr Asn Lys Glu Gly Val Lys Ile Arg Thr Lys Ile
65 70 75 80
Pro Leu Ser Lys Val His Gly Leu Asp Val Lys Asn Val Gln Leu Val
85 90 95
Asp Ala Ile Asp Asn Ile Val Trp Glu Lys Lys Ser Leu Val Thr Glu
100 105 110
Asn Arg Leu His Lys Glu Cys Leu Leu Arg Leu Ser Thr Glu Glu Arg
115 120 125
His Ile Phe Leu Asp Tyr Lys Lys Tyr Gly Ser Ser Ile Arg Leu Glu
130 135 140
Leu Val Asn Leu Ile Gln Ala Lys Thr Lys Asn Phe Thr Ile Asp Phe
145 150 155 160
Lys Leu Lys Tyr Phe Leu Gly Ser Gly Ala Gln Ser Lys Ser Ser Leu
165 170 175
Leu His Ala Ile Asn His Pro Lys Ser Arg Pro Asn Thr Ser Leu Glu
180 185 190
Ile Glu Phe Thr Pro Arg Asp Asn Glu Thr Val Pro Tyr Asp Glu Leu
195 200 205
Ile Lys Glu Leu Thr Thr Leu Ser Arg His Ile Phe Met Ala Ser Pro
210 215 220
Glu Asn Val Ile Leu Ser Pro Pro Ile Asn Ala Pro Ile Lys Thr Phe
225 230 235 240
Met Leu Pro Lys Gln Asp Ile Val Gly Leu Asp Leu Glu Asn Leu Tyr
245 250 255
Ala Val Thr Lys Thr Asp Gly Ile Pro Ile Thr Ile Arg Val Thr Ser
260 265 270
Asn Gly Leu Tyr Cys Tyr Phe Thr His Leu Gly Tyr Ile Ile Arg Tyr
275 280 285
Pro Val Lys Arg Ile Ile Asp Ser Glu Val Val Val Phe Gly Glu Ala
290 295 300
Val Lys Asp Lys Asn Trp Thr Val Tyr Leu Ile Lys Leu Ile Glu Pro
305 310 315 320
Val Asn Ala Ile Asn Asp Arg Leu Glu Glu Ser Lys Tyr Val Glu Ser
325 330 335
Lys Leu Val Asp Ile Cys Asp Arg Ile Val Phe Lys Ser Lys Lys Tyr
340 345 350
Glu Gly Pro Phe Thr Thr Thr Ser Glu Val Val Asp Met Leu Ser Thr
355 360 365
Tyr Leu Pro Lys Gln Pro Glu Gly Val Ile Leu Phe Tyr Ser Lys Gly
370 375 380
Pro Lys Ser Asn Ile Asp Phe Lys Ile Lys Lys Glu Asn Thr Ile Asp
385 390 395 400
Gln Thr Ala Asn Val Val Phe Arg Tyr Met Ser Ser Glu Pro Ile Ile
405 410 415
Phe Gly Glu Ser Ser Ile Phe Val Glu Tyr Lys Lys Phe Ser Asn Asp
420 425 430
Lys Gly Phe Pro Lys Glu Tyr Gly Ser Gly Lys Ile Val Leu Tyr Asn
435 440 445
Gly Val Asn Tyr Leu Asn Asn Ile Tyr Cys Leu Glu Tyr Ile Asn Thr
450 455 460
His Asn Glu Val Gly Ile Lys Ser Val Val Val Pro Ile Lys Phe Ile
465 470 475 480
Ala Glu Phe Leu Val Asn Gly Glu Ile Leu Lys Pro Arg Ile Asp Lys
485 490 495
Thr Met Lys Tyr Ile Asn Ser Glu Asp Tyr Tyr Gly Asn Gln His Asn
500 505 510
Ile Ile Val Glu His Leu Arg Asp Gln Ser Ile Lys Ile Gly Asp Ile
515 520 525
Phe Asn Glu Asp Lys Leu Ser Asp Val Gly His Gln Tyr Ala Asn Asn
530 535 540
Asp Lys Phe Arg Leu Asn Pro Glu Val Ser Tyr Phe Thr Asn Lys Arg
545 550 555 560
Thr Arg Gly Pro Leu Gly Ile Leu Ser Asn Tyr Val Lys Thr Leu Leu
565 570 575
Ile Ser Met Tyr Cys Ser Lys Thr Phe Leu Asp Asp Ser Asn Lys Arg
580 585 590
Lys Val Leu Ala Ile Asp Phe Gly Asn Gly Ala Asp Leu Glu Lys Tyr
595 600 605
Phe Tyr Gly Glu Ile Ala Leu Leu Val Ala Thr Asp Pro Asp Ala Asp
610 615 620
Ala Ile Ala Arg Gly Asn Glu Arg Tyr Asn Lys Leu Asn Ser Gly Ile
625 630 635 640
Lys Thr Lys Tyr Tyr Lys Phe Asp Tyr Ile Gln Glu Thr Ile Arg Ser
645 650 655
Asp Thr Phe Val Ser Ser Val Arg Glu Val Phe Tyr Phe Gly Lys Phe
660 665 670
Asn Ile Ile Asp Trp Gln Phe Ala Ile His Tyr Ser Phe His Pro Arg
675 680 685
His Tyr Ala Thr Val Met Asn Asn Leu Ser Glu Leu Thr Ala Ser Gly
690 695 700
Gly Lys Val Leu Ile Thr Thr Met Asp Gly Asp Lys Leu Ser Lys Leu
705 710 715 720
Thr Asp Lys Lys Thr Phe Ile Ile His Lys Asn Leu Pro Ser Ser Glu
725 730 735
Asn Tyr Met Ser Val Glu Lys Ile Ala Asp Asp Arg Ile Val Val Tyr
740 745 750
Asn Pro Ser Thr Met Ser Thr Pro Met Thr Glu Tyr Ile Ile Lys Lys
755 760 765
Asn Asp Ile Val Arg Val Phe Asn Glu Tyr Gly Phe Val Leu Val Asp
770 775 780
Asn Val Asp Phe Ala Thr Ile Ile Glu Arg Ser Lys Lys Phe Ile Asn
785 790 795 800
Gly Ala Ser Thr Met Glu Asp Arg Pro Ser Thr Arg Asn Phe Phe Glu
805 810 815
Leu Asn Arg Gly Ala Ile Lys Cys Glu Gly Leu Asp Val Glu Asp Leu
820 825 830
Leu Ser Tyr Tyr Val Val Tyr Val Phe Ser Lys Arg
835 840
<210> 30
<211> 2535
<212> DNA
<213> 未知
<220>
<223> 牛痘病毒
<400> 30
atggatgcca acgtagtatc atcttctact attgcgacgt atatagacgc tttagcgaag 60
aatgcttcgg aattagaaca gaggtctacc gcatacgaaa taaataatga attggaacta 120
gtatttatta agccgccatt gattactttg acaaatgtag tgaatatctc tacgattcag 180
gaatcgttta ttcgatttac cgttactaat aaggaaggtg ttaaaattag aactaagatt 240
ccattatcta aggtacatgg tctagatgta aaaaatgtac agttagtaga tgctatagat 300
aacatagttt gggaaaagaa atcattagtg acggaaaatc gtcttcacaa agaatgcttg 360
ttgagactat cgacagagga acgtcatata tttttggatt acaagaaata tggatcctct 420
atccgactag aattagtcaa tcttattcaa gcaaaaacaa aaaactttac gatagacttt 480
aagctaaaat attttctagg atccggtgcc cagtctaaaa gttctttatt acacgctatt 540
aatcatccaa agtcaaggcc taatacatct ctggaaatag aatttacacc tagagacaat 600
gaaacagttc catatgatga actaataaag gaattgacga ctctctcgcg tcatatattt 660
atggcttctc cagagaatgt aattctttct ccgcctatta acgcgcctat aaaaaccttt 720
atgttgccta aacaagatat agtaggtttg gatctggaaa atctatatgc cgtaactaag 780
actgacggca ttcctataac tatcagagtt acatcaaacg ggttgtattg ttattttaca 840
catcttggtt atattattag atatcctgtt aagagaataa tagattccga agtagtagtc 900
tttggtgagg cagttaagga taagaactgg accgtatatc tcattaagct aatagagcct 960
gtgaatgcaa tcaatgatag actagaagaa agtaagtatg ttgaatctaa actagtggat 1020
atttgtgatc ggatagtatt caagtcaaag aaatacgaag gtccgtttac tacaactagt 1080
gaagtcgtcg atatgttatc tacatattta ccaaagcaac cagaaggtgt tattctgttc 1140
tattcaaagg gacctaaatc taacattgat tttaaaatta aaaaggaaaa tactatagac 1200
caaactgcaa atgtagtatt taggtacatg tccagtgaac caattatctt tggagagtcg 1260
tctatctttg tagagtataa gaaatttagc aacgataaag gctttcctaa agaatatggt 1320
tctggtaaga ttgtgttata taacggcgtt aattatctaa ataatatcta ttgtttggaa 1380
tatattaata cacataatga agtgggtatt aagtccgtgg ttgtacctat taagtttata 1440
gcagaattct tagttaatgg agaaatactt aaacctagaa ttgataaaac catgaaatat 1500
attaactcag aagattatta tggaaatcaa cataatatca tagtcgaaca tttaagagat 1560
caaagcatca aaataggaga tatctttaac gaggataaac tatcggatgt gggacatcaa 1620
tacgccaata atgataaatt tagattaaat ccagaagtta gttattttac gaataaacga 1680
actagaggac cgttgggaat tttatcaaac tacgtcaaga ctcttcttat ttctatgtat 1740
tgttccaaaa catttttaga cgattccaac aaacgaaagg tattggcgat tgattttgga 1800
aacggtgctg acctggaaaa atacttttat ggagagattg cgttattggt agcgacggat 1860
ccggatgctg atgctatagc tagaggaaat gaaagataca acaaattaaa ctctggaatt 1920
aaaaccaagt actacaaatt tgactacatt caggaaacta ttcgatccga tacatttgtc 1980
tctagtgtca gagaagtatt ctattttgga aagtttaata tcatcgactg gcagtttgct 2040
atccattatt cttttcatcc gagacattat gctaccgtca tgaataactt atccgaacta 2100
actgcttctg gaggcaaggt attaatcact accatggacg gagacaaatt atcaaaatta 2160
acagataaaa agacttttat aattcataag aatttaccta gtagcgaaaa ctatatgtct 2220
gtagaaaaaa tagctgatga tagaatagtg gtatataatc catcaacaat gtctactcca 2280
atgactgaat acattatcaa aaagaacgat atagtcagag tgtttaacga atacggattt 2340
gttcttgtag ataacgttga tttcgctaca attatagaac gaagtaaaaa gtttattaat 2400
ggcgcatcta caatggaaga tagaccatct acaagaaact ttttcgaact aaatagagga 2460
gccattaaat gtgaaggttt agatgtcgaa gacttactta gttactatgt tgtttatgtc 2520
ttttctaagc ggtaa 2535
<210> 31
<211> 287
<212> PRT
<213> 未知
<220>
<223> 牛痘病毒
<400> 31
Met Asp Glu Ile Val Lys Asn Ile Arg Glu Gly Thr His Val Leu Leu
1 5 10 15
Pro Phe Tyr Glu Thr Leu Pro Glu Leu Asn Leu Ser Leu Gly Lys Ser
20 25 30
Pro Leu Pro Ser Leu Glu Tyr Gly Ala Asn Tyr Phe Leu Gln Ile Ser
35 40 45
Arg Val Asn Asp Leu Asn Arg Met Pro Thr Asp Met Leu Lys Leu Phe
50 55 60
Thr His Asp Ile Met Leu Pro Glu Ser Asp Leu Asp Lys Val Tyr Glu
65 70 75 80
Ile Leu Lys Ile Asn Ser Val Lys Tyr Tyr Gly Arg Ser Thr Lys Ala
85 90 95
Asp Ala Val Val Ala Asp Leu Ser Ala Arg Asn Lys Leu Phe Lys Arg
100 105 110
Glu Arg Asp Ala Ile Lys Ser Asn Asn His Leu Thr Glu Asn Asn Leu
115 120 125
Tyr Ile Ser Asp Tyr Lys Met Leu Thr Phe Asp Val Phe Arg Pro Leu
130 135 140
Phe Asp Phe Val Asn Glu Lys Tyr Cys Ile Ile Lys Leu Pro Thr Leu
145 150 155 160
Phe Gly Arg Gly Val Ile Asp Thr Met Arg Ile Tyr Cys Ser Leu Phe
165 170 175
Lys Asn Val Arg Leu Leu Lys Cys Val Ser Asp Ser Trp Leu Lys Asp
180 185 190
Ser Ala Ile Met Val Ala Ser Asp Val Cys Lys Lys Asn Leu Asp Leu
195 200 205
Phe Met Ser His Val Lys Ser Val Thr Lys Ser Ser Ser Trp Lys Asp
210 215 220
Val Asn Ser Val Gln Phe Ser Ile Leu Asn Asn Pro Val Asp Thr Glu
225 230 235 240
Phe Ile Asn Lys Phe Leu Glu Phe Ser Asn Arg Val Tyr Glu Ala Leu
245 250 255
Tyr Tyr Val His Ser Leu Leu Tyr Ser Ser Met Thr Ser Asp Ser Lys
260 265 270
Ser Ile Glu Asn Lys His Gln Arg Arg Leu Val Lys Leu Leu Leu
275 280 285
<210> 32
<211> 864
<212> DNA
<213> 未知
<220>
<223> 牛痘病毒
<400> 32
atggatgaaa ttgtaaaaaa tatccgggag ggaacgcatg tccttcttcc attttatgaa 60
acattgccag aacttaatct gtctctaggt aaaagcccat tacctagtct ggaatacgga 120
gctaattact ttcttcagat ttctagagtt aatgatctaa atagaatgcc gaccgacatg 180
ttaaaacttt ttacacatga tatcatgtta ccagaaagcg atctagataa agtctatgaa 240
attttaaaga ttaatagcgt aaagtattat gggaggagta ctaaagcgga cgccgtagtt 300
gccgacctca gcgcacgcaa taaactgttc aaacgtgaac gagatgctat taaatctaat 360
aatcatctca ctgaaaacaa tctatacatt agcgattata agatgttaac cttcgacgtg 420
tttcgaccat tatttgattt tgtaaacgaa aaatattgta ttattaaact tccaacttta 480
ttcggtagag gtgtaatcga tactatgaga atatattgta gtctctttaa aaatgttaga 540
ctgctaaaat gcgtaagcga tagctggtta aaagatagcg ccattatggt ggctagtgat 600
gtttgtaaaa aaaatttgga tttatttatg tctcatgtta agtccgtcac taagtcttct 660
tcttggaagg atgtgaacag tgttcaattt agtattttaa acaatccagt ggatacggaa 720
ttcattaata agttcttaga gttttcgaat agagtatacg aagctctcta ttacgttcac 780
tcgttgcttt attctagtat gacttctgat tcaaaaagta tcgaaaacaa acatcagaga 840
agactagtta aactactgct gtga 864
<210> 33
<211> 2529
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
gacgctaatg tcgtgtcttc ttctaccatc gcaacctata ttgacgctct ggcaaaaaac 60
gcctcggaac tggaacaacg ctcaaccgcg tatgaaatca acaatgaact ggaactggtg 120
tttatcaaac cgccgctgat tacgctgacc aacgtggtta atatcagcac cattcaggaa 180
tcttttattc gtttcacggt taccaacaaa gaaggcgtca aaatccgcac gaaaattccg 240
ctgagcaaag ttcatggtct ggatgtgaaa aacgttcaac tggtcgacgc aatcgataat 300
attgtgtggg aaaagaaaag cctggttacc gaaaatcgtc tgcataaaga atgcctgctg 360
cgtctgagca cggaagaacg ccacatcttt ctggactata aaaaatacgg cagctctatc 420
cgcctggaac tggtgaacct gatccaggct aaaaccaaaa acttcacgat cgatttcaaa 480
ctgaaatatt ttctgggcag tggtgctcaa tccaaaagtt ccctgctgca tgcgatcaac 540
cacccgaaaa gtcgtccgaa tacctccctg gaaattgaat tcaccccgcg cgacaacgaa 600
acggtgccgt acgatgaact gattaaagaa ctgaccacgc tgtcacgtca tatctttatg 660
gcgtcgccgg aaaacgttat tctgagcccg ccgatcaatg ccccgattaa aaccttcatg 720
ctgccgaaac aggacattgt tggcctggat ctggaaaacc tgtatgcggt cacgaaaacc 780
gatggtattc cgatcaccat tcgcgtgacg tcgaatggcc tgtattgcta ctttacccac 840
ctgggttata ttatccgtta cccggttaaa cgcattatcg actccgaagt cgtggttttc 900
ggcgaagcgg tcaaagataa aaattggacc gtgtatctga tcaaactgat tgaaccggtg 960
aacgccatca acgatcgtct ggaagaatca aaatacgtgg aatcgaaact ggttgacatc 1020
tgtgatcgca tcgttttcaa aagcaaaaaa tacgaaggtc cgttcaccac gacctctgaa 1080
gtcgtggata tgctgagtac ctatctgccg aaacagccgg aaggcgtgat cctgttttac 1140
agcaaaggtc cgaaatctaa catcgacttc aaaatcaaaa aagaaaacac catcgatcaa 1200
acggccaatg ttgtctttcg ttatatgtca tcggaaccga ttatctttgg cgaaagctct 1260
atcttcgtgg aatacaaaaa attctcgaac gataaaggct tcccgaaaga atacggcagc 1320
ggtaaaattg tcctgtataa cggtgtgaat tacctgaaca atatctattg cctggaatac 1380
attaacaccc ataatgaagt tggcattaaa tctgtggttg tcccgatcaa atttattgca 1440
gaattcctgg tcaacggtga aatcctgaaa ccgcgtattg acaaaaccat gaaatacatc 1500
aacagtgaag attactacgg taaccagcat aacatcatcg tggaacacct gcgcgaccaa 1560
tctatcaaaa tcggcgatat cttcaacgaa gacaaactga gtgatgtcgg tcaccagtat 1620
gcgaacaatg ataaatttcg tctgaacccg gaagtgtcct acttcaccaa taaacgtacg 1680
cgcggcccgc tgggtatcct gtcaaattat gtcaaaaccc tgctgatttc aatgtactgt 1740
tcgaaaacgt ttctggatga cagcaacaaa cgcaaagttc tggccattga ctttggcaat 1800
ggtgcagatc tggaaaaata tttctacggc gaaatcgctc tgctggttgc gaccgatccg 1860
gacgcggatg ccattgcacg tggcaacgaa cgctataaca aactgaattc tggtatcaaa 1920
accaaatact acaaattcga ctacatccag gaaaccattc gtagtgatac gttcgtgagt 1980
tccgttcgcg aagtctttta tttcggcaaa ttcaacatca tcgattggca attcgccatc 2040
cattattctt tccatccgcg tcactacgca accgtgatga acaatctgag tgaactgacg 2100
gcttccggcg gtaaagttct gattacgacg atggatggtg ataaactgtc caaactgacc 2160
gataagaaaa ccttcattat ccacaaaaac ctgccgtcat cggaaaacta catgtcagtg 2220
gaaaaaatcg ccgatgaccg cattgtggtt tataacccga gcacgatgtc taccccgatg 2280
acggaataca tcattaagaa aaacgatatc gtccgtgtgt ttaatgaata cggtttcgtt 2340
ctggtcgaca acgttgattt tgcaaccatt atcgaacgca gcaaaaaatt catcaatggc 2400
gcttccacga tggaagatcg tccgtcaacg cgcaactttt tcgaactgaa tcgcggtgca 2460
attaaatgtg aaggtctgga tgtggaagat ctgctgtcct attatgtcgt gtatgtgttc 2520
tctaaacgc 2529
<210> 34
<211> 2529
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 34
gacgccaacg tagtgagctc gtccacgatt gctacataca tcgacgcact ggctaaaaac 60
gcgagtgaat tagagcaacg ttcaaccgcc tatgaaatca acaacgaact tgagctcgtc 120
tttattaagc ctccgctaat caccctgact aacgttgtta atatatctac catccaggaa 180
agcttcattc gcttcactgt tactaacaaa gaaggcgtaa aaatcaggac taaaatccca 240
ttgtctaagg tgcacgggct ggatgtgaaa aacgttcagc tggttgacgc tattgacaac 300
atcgtatggg aaaagaaatc cctcgtaacc gaaaaccgtc tgcataaaga atgtctgctg 360
cgtctgagca cggaggaacg acacatcttt ctggattaca aaaaatatgg tagttctatt 420
cgtctggagc tggtgaacct gatccaggca aagaccaaaa atttcacaat tgacttcaaa 480
ctaaaatact ttctgggctc cggtgcgcag agcaaatctt ccctgttgca tgctatcaac 540
cacccgaaaa gccgcccgaa tacttctctg gaaatcgagt tcaccccccg cgataacgaa 600
actgtcccat acgatgagct tattaaggaa ctgaccacgc tgtcccgtca catttttatg 660
gcgagcccgg aaaacgttat attatcgccg cctatcaacg ctccgatcaa gaccttcatg 720
ttgccgaaac aagacatcgt cggtctggat ctggagaacc tgtacgcagt tactaaaacc 780
gacggcatcc ccatcactat cagagtaacg tcaaacggat tgtattgcta tttcacccat 840
ctgggttaca ttattcgtta cccggtgaaa cgcatcatag attctgaagt tgttgttttc 900
ggcgaagccg taaaggacaa aaactggacc gtctatctga tcaagctaat cgaaccggtt 960
aatgctatca acgatcggct ggaagaatcg aaatacgtag aatctaaact ggtggatatt 1020
tgcgaccgta ttgtctttaa atcgaaaaag tacgagggtc ctttcactac tactagcgaa 1080
gtcgtggaca tgctctctac gtacctgccg aaacagcctg agggcgttat cctgttctat 1140
agcaaaggtc cgaaatccaa catcgatttt aagattaaaa aggaaaacac cattgatcag 1200
acggctaatg tagttttccg gtacatgtct agcgagccga tcatctttgg cgaatcttct 1260
atctttgtag aatataaaaa gttcagcaac gacaaaggat tcccaaaaga atacgggtcc 1320
gggaaaatcg tcttatacaa cggtgttaac tacttgaaca acatctattg cctggaatat 1380
atcaatactc acaatgaagt tggtattaaa tcagtggttg ttccgataaa attcatcgcg 1440
gaatttctgg tcaatggcga aatcctgaaa ccccgcattg ataagaccat gaaatacata 1500
aactccgaag actactacgg taaccagcat aacatcatcg tggaacacct gagagatcag 1560
agtatcaaaa tcggcgacat tttcaatgag gacaagttaa gcgacgtggg ccatcaatac 1620
gcaaacaacg acaaattccg tctgaacccg gaggtttcct atttcaccaa caaacgtacc 1680
cgaggtccgc ttggcatcct ctccaattac gtaaaaaccc tgctgatttc tatgtattgt 1740
tcaaaaacgt tcctggatga cagcaacaaa aggaaggtac tggctatcga tttcggtaac 1800
ggcgcggatc tggaaaagta cttttacggt gaaatcgctc tgttagtcgc aactgatccg 1860
gacgccgacg caattgctcg cggaaatgaa cgttacaaca aactgaactc cggtattaaa 1920
acaaagtatt ataaattcga ctatatccag gagactatcc gctctgatac tttcgtgagc 1980
agcgtgcgtg aggtttttta ctttggtaaa ttcaacatta ttgactggca gtttgcgatc 2040
cactacagct ttcacccgcg tcactatgcg accgttatga ataacctatc ggaactcacg 2100
gctagcggcg gcaaagtgct gattactact atggacggtg acaaactgtc taagctgacc 2160
gataagaaaa ccttcatcat ccacaaaaac ttgccaagtt ctgagaacta tatgtctgtt 2220
gaaaaaattg cggacgaccg catcgtcgtt tacaacccat ctaccatgtc cacccctatg 2280
acagagtaca tcatcaaaaa gaacgacata gttcgtgttt tcaacgaata cggcttcgta 2340
ctggtagata acgtcgattt tgctaccatt atcgagcgtt cgaaaaaatt cattaacggt 2400
gcttccacta tggaagatcg tccgtccact cgtaactttt ttgaattaaa ccgtggcgca 2460
atcaaatgcg aagggctgga tgtggaagac ctcctgtctt actacgttgt atacgtcttc 2520
tctaaacgc 2529
<210> 35
<211> 858
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
gatgaaatcg tcaaaaatat ccgcgaaggc acgcacgtcc tgctgccgtt ctatgaaacc 60
ctgccggaac tgaatctgtc actgggcaaa tctccgctgc cgagtctgga atatggtgca 120
aactactttc tgcagatttc tcgtgtgaac gatctgaatc gcatgccgac cgacatgctg 180
aaactgttca cgcatgatat catgctgccg gaaagcgatc tggacaaagt ctacgaaatc 240
ctgaaaatca actccgttaa atactacggc cgttcaacca aagcggatgc cgtggttgca 300
gacctgtccg ctcgcaataa actgtttaaa cgtgaacgcg atgctattaa atcgaacaat 360
cacctgaccg aaaacaacct gtacatcagc gattacaaaa tgctgacgtt tgacgtgttc 420
cgtccgctgt tcgatttcgt taacgaaaaa tactgcatca tcaaactgcc gaccctgttt 480
ggccgtggtg tgattgatac gatgcgcatc tactgcagcc tgttcaaaaa tgtccgcctg 540
ctgaaatgtg tgtcggatag ctggctgaaa gactctgcga ttatggtggc cagtgacgtt 600
tgtaagaaaa acctggacct gtttatgtcc catgtcaaat cagtgaccaa aagctctagt 660
tggaaagacg ttaattcggt ccaatttagc attctgaaca atccggttga tacggaattc 720
atcaacaaat tcctggaatt ctctaaccgt gtttacgaag cactgtatta cgtccacagt 780
ctgctgtact cctcaatgac ctcggactcc aaatccatcg aaaataaaca tcaacgccgc 840
ctggtgaaac tgctgctg 858
<210> 36
<211> 858
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 36
gatgagatcg ttaagaacat tcgtgaaggt acgcatgtgc ttttgccatt ttacgaaact 60
ctcccggaac tgaatctgtc cttaggcaaa agccctctac cctctctgga gtatggggcc 120
aactacttcc tgcaaatctc acgcgtcaac gacctgaatc gaatgccgac cgacatgctg 180
aaactgttca ctcacgatat aatgctgccg gaaagtgatc tggacaaagt atatgaaatc 240
ctgaaaatca acagcgttaa gtactacgga cggtcgacca aagcggacgc tgttgtagca 300
gatctgtctg ctcgcaacaa actctttaaa cgtgaacgtg acgctattaa gtccaacaac 360
cacctgacag agaacaatct ctatatctct gactacaaaa tgttgacttt cgatgtgttc 420
cgtccgctgt ttgatttcgt gaacgaaaaa tattgcatta tcaaactgcc gaccctgttc 480
ggccgtggtg ttattgacac catgcgcatc tactgtagcc tcttcaagaa tgtcagacta 540
ctgaaatgcg tgtccgatag ctggctgaaa gacagcgcaa tcatggtagc ctcagacgtt 600
tgcaaaaaga acctggatct gtttatgtcc catgttaaat ccgttactaa gtctagctcg 660
tggaaagatg ttaacagcgt acagttttct attttgaaca accctgttga cacggaattt 720
atcaacaaat tcctggagtt ctctaaccgt gtatacgaag cgctgtatta cgtgcactcc 780
ttactgtact cttctatgac cagcgatagt aagtctatcg aaaataaaca ccagcgccgt 840
ctggtaaaac tgctcctt 858
<210> 37
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 37
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcaggggag 60
ggtttcta 68
<210> 38
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 38
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcatcggac 60
cgtttcta 68
<210> 39
<211> 383
<212> PRT
<213> 大肠埃希氏杆菌
<400> 39
Met Phe Glu Pro Met Glu Leu Thr Asn Asp Ala Val Ile Lys Val Ile
1 5 10 15
Gly Val Gly Gly Gly Gly Gly Asn Ala Val Glu His Met Val Arg Glu
20 25 30
Arg Ile Glu Gly Val Glu Phe Phe Ala Val Asn Thr Asp Ala Gln Ala
35 40 45
Leu Arg Lys Thr Ala Val Gly Gln Thr Ile Gln Ile Gly Ser Gly Ile
50 55 60
Thr Lys Gly Leu Gly Ala Gly Ala Asn Pro Glu Val Gly Arg Asn Ala
65 70 75 80
Ala Asp Glu Asp Arg Asp Ala Leu Arg Ala Ala Leu Glu Gly Ala Asp
85 90 95
Met Val Phe Ile Ala Ala Gly Met Gly Gly Gly Thr Gly Thr Gly Ala
100 105 110
Ala Pro Val Val Ala Glu Val Ala Lys Asp Leu Gly Ile Leu Thr Val
115 120 125
Ala Val Val Thr Lys Pro Phe Asn Phe Glu Gly Lys Lys Arg Met Ala
130 135 140
Phe Ala Glu Gln Gly Ile Thr Glu Leu Ser Lys His Val Asp Ser Leu
145 150 155 160
Ile Thr Ile Pro Asn Asp Lys Leu Leu Lys Val Leu Gly Arg Gly Ile
165 170 175
Ser Leu Leu Asp Ala Phe Gly Ala Ala Asn Asp Val Leu Lys Gly Ala
180 185 190
Val Gln Gly Ile Ala Glu Leu Ile Thr Arg Pro Gly Leu Met Asn Val
195 200 205
Asp Phe Ala Asp Val Arg Thr Val Met Ser Glu Met Gly Tyr Ala Met
210 215 220
Met Gly Ser Gly Val Ala Ser Gly Glu Asp Arg Ala Glu Glu Ala Ala
225 230 235 240
Glu Met Ala Ile Ser Ser Pro Leu Leu Glu Asp Ile Asp Leu Ser Gly
245 250 255
Ala Arg Gly Val Leu Val Asn Ile Thr Ala Gly Phe Asp Leu Arg Leu
260 265 270
Asp Glu Phe Glu Thr Val Gly Asn Thr Ile Arg Ala Phe Ala Ser Asp
275 280 285
Asn Ala Thr Val Val Ile Gly Thr Ser Leu Asp Pro Asp Met Asn Asp
290 295 300
Glu Leu Arg Val Thr Val Val Ala Thr Gly Ile Gly Met Asp Lys Arg
305 310 315 320
Pro Glu Ile Thr Leu Val Thr Asn Lys Gln Val Gln Gln Pro Val Met
325 330 335
Asp Arg Tyr Gln Gln His Gly Met Ala Pro Leu Thr Gln Glu Gln Lys
340 345 350
Pro Val Ala Lys Val Val Asn Asp Asn Ala Pro Gln Thr Ala Lys Glu
355 360 365
Pro Asp Tyr Leu Asp Ile Pro Ala Phe Leu Arg Lys Gln Ala Asp
370 375 380
<210> 40
<211> 384
<212> PRT
<213> 大肠埃希氏杆菌
<400> 40
Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro
1 5 10 15
Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu
20 25 30
Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr
35 40 45
Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp
50 55 60
Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His
65 70 75 80
Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile
85 90 95
Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro
100 105 110
Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr
115 120 125
Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg
130 135 140
Leu Val Gln Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp
145 150 155 160
Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly
165 170 175
Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu
180 185 190
Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile
195 200 205
Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe
210 215 220
Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys
225 230 235 240
Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala
245 250 255
Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp
260 265 270
Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala
275 280 285
Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly
290 295 300
Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys
305 310 315 320
Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu
325 330 335
Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr
340 345 350
Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp
355 360 365
Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys
370 375 380
<210> 41
<211> 347
<212> PRT
<213> 大肠埃希氏杆菌
<400> 41
Met Leu Lys Lys Phe Arg Gly Met Phe Ser Asn Asp Leu Ser Ile Asp
1 5 10 15
Leu Gly Thr Ala Asn Thr Leu Ile Tyr Val Lys Gly Gln Gly Ile Val
20 25 30
Leu Asn Glu Pro Ser Val Val Ala Ile Arg Gln Asp Arg Ala Gly Ser
35 40 45
Pro Lys Ser Val Ala Ala Val Gly His Asp Ala Lys Gln Met Leu Gly
50 55 60
Arg Thr Pro Gly Asn Ile Ala Ala Ile Arg Pro Met Lys Asp Gly Val
65 70 75 80
Ile Ala Asp Phe Phe Val Thr Glu Lys Met Leu Gln His Phe Ile Lys
85 90 95
Gln Val His Ser Asn Ser Phe Met Arg Pro Ser Pro Arg Val Leu Val
100 105 110
Cys Val Pro Val Gly Ala Thr Gln Val Glu Arg Arg Ala Ile Arg Glu
115 120 125
Ser Ala Gln Gly Ala Gly Ala Arg Glu Val Phe Leu Ile Glu Glu Pro
130 135 140
Met Ala Ala Ala Ile Gly Ala Gly Leu Pro Val Ser Glu Ala Thr Gly
145 150 155 160
Ser Met Val Val Asp Ile Gly Gly Gly Thr Thr Glu Val Ala Val Ile
165 170 175
Ser Leu Asn Gly Val Val Tyr Ser Ser Ser Val Arg Ile Gly Gly Asp
180 185 190
Arg Phe Asp Glu Ala Ile Ile Asn Tyr Val Arg Arg Asn Tyr Gly Ser
195 200 205
Leu Ile Gly Glu Ala Thr Ala Glu Arg Ile Lys His Glu Ile Gly Ser
210 215 220
Ala Tyr Pro Gly Asp Glu Val Arg Glu Ile Glu Val Arg Gly Arg Asn
225 230 235 240
Leu Ala Glu Gly Val Pro Arg Gly Phe Thr Leu Asn Ser Asn Glu Ile
245 250 255
Leu Glu Ala Leu Gln Glu Pro Leu Thr Gly Ile Val Ser Ala Val Met
260 265 270
Val Ala Leu Glu Gln Cys Pro Pro Glu Leu Ala Ser Asp Ile Ser Glu
275 280 285
Arg Gly Met Val Leu Thr Gly Gly Gly Ala Leu Leu Arg Asn Leu Asp
290 295 300
Arg Leu Leu Met Glu Glu Thr Gly Ile Pro Val Val Val Ala Glu Asp
305 310 315 320
Pro Leu Thr Cys Val Ala Arg Gly Gly Gly Lys Ala Leu Glu Met Ile
325 330 335
Asp Met His Gly Gly Asp Leu Phe Ser Glu Glu
340 345
<210> 42
<211> 1152
<212> DNA
<213> 大肠埃希氏杆菌
<400> 42
atgtttgaac caatggaact taccaatgac gcggtgatta aagtcatcgg cgtcggcggc 60
ggcggcggta atgctgttga acacatggtg cgcgagcgca ttgaaggtgt tgaattcttc 120
gcggtaaata ccgatgcaca agcgctgcgt aaaacagcgg ttggacagac gattcaaatc 180
ggtagcggta tcaccaaagg actgggcgct ggcgctaatc cagaagttgg ccgcaatgcg 240
gctgatgagg atcgcgatgc attgcgtgcg gcgctggaag gtgcagacat ggtctttatt 300
gctgcgggta tgggtggtgg taccggtaca ggtgcagcac cagtcgtcgc tgaagtggca 360
aaagatttgg gtatcctgac cgttgctgtc gtcactaagc ctttcaactt tgaaggcaag 420
aagcgtatgg cattcgcgga gcaggggatc actgaactgt ccaagcatgt ggactctctg 480
atcactatcc cgaacgacaa actgctgaaa gttctgggcc gcggtatctc cctgctggat 540
gcgtttggcg cagcgaacga tgtactgaaa ggcgctgtgc aaggtatcgc tgaactgatt 600
actcgtccgg gtttgatgaa cgtggacttt gcagacgtac gcaccgtaat gtctgagatg 660
ggctacgcaa tgatgggttc tggcgtggcg agcggtgaag accgtgcgga agaagctgct 720
gaaatggcta tctcttctcc gctgctggaa gatatcgacc tgtctggcgc gcgcggcgtg 780
ctggttaaca tcacggcggg cttcgacctg cgtctggatg agttcgaaac ggtaggtaac 840
accatccgtg catttgcttc cgacaacgcg actgtggtta tcggtacttc tcttgacccg 900
gatatgaatg acgagctgcg cgtaaccgtt gttgcgacag gtatcggcat ggacaaacgt 960
cctgaaatca ctctggtgac caataagcag gttcagcagc cagtgatgga tcgctaccag 1020
cagcatggga tggctccgct gacccaggag cagaagccgg ttgctaaagt cgtgaatgac 1080
aatgcgccgc aaactgcgaa agagccggat tatctggata tcccagcatt cctgcgtaag 1140
caagctgatt aa 1152
<210> 43
<211> 1155
<212> DNA
<213> 大肠埃希氏杆菌
<400> 43
atggcaaaac acctttttac gtccgagtcc gtctctgaag ggcatcctga caaaattgct 60
gaccaaattt ctgatgccgt tttagacgcg atcctcgaac aggatccgaa agcacgcgtt 120
gcttgcgaaa cctacgtaaa aaccggcatg gttttagttg gcggcgaaat caccaccagc 180
gcctgggtag acatcgaaga gatcacccgt aacaccgttc gcgaaattgg ctatgtgcat 240
tccgacatgg gctttgacgc taactcctgt gcggttctga gcgctatcgg caaacagtct 300
cctgacatca accagggcgt tgaccgtgcc gatccgctgg aacagggcgc gggtgaccag 360
ggtctgatgt ttggctacgc aactaatgaa accgacgtgc tgatgccagc acctatcacc 420
tatgcacacc gtctggtaca gcgtcaggct gaagtgcgta aaaacggcac tctgccgtgg 480
ctgcgcccgg acgcgaaaag ccaggtgact tttcagtatg acgacggcaa aatcgttggt 540
atcgatgctg tcgtgctttc cactcagcac tctgaagaga tcgaccagaa atcgctgcaa 600
gaagcggtaa tggaagagat catcaagcca attctgcccg ctgaatggct gacttctgcc 660
accaaattct tcatcaaccc gaccggtcgt ttcgttatcg gtggcccaat gggtgactgc 720
ggtctgactg gtcgtaaaat tatcgttgat acctacggcg gcatggcgcg tcacggtggc 780
ggtgcattct ctggtaaaga tccatcaaaa gtggaccgtt ccgcagccta cgcagcacgt 840
tatgtcgcga aaaacatcgt tgctgctggc ctggccgatc gttgtgaaat tcaggtttcc 900
tacgcaatcg gcgtggctga accgacctcc atcatggtag aaactttcgg tactgagaaa 960
gtgccttctg aacaactgac cctgctggta cgtgagttct tcgacctgcg cccatacggt 1020
ctgattcaga tgctggatct gctgcacccg atctacaaag aaaccgcagc atacggtcac 1080
tttggtcgtg aacatttccc gtgggaaaaa accgacaaag cgcagctgct gcgcgatgct 1140
gccggtctga agtaa 1155
<210> 44
<211> 1044
<212> DNA
<213> 大肠埃希氏杆菌
<400> 44
ttactcttcg ctgaacaggt cgccgccgtg catgtcgatc atttccagcg ctttgccgcc 60
accgcgcgcc acacaggtca gcgggtcttc agcaacaacg actggaatgc cggtttcttc 120
cattaacaaa cggtcaaggt tacgcagcag tgcgccacca ccggtgagca ccatgccgcg 180
ctcggagatg tcggaagcca gttccggcgg gcactgttcc agtgcaacca ttaccgcgct 240
cacaataccg gtcagcggtt cctgcagtgc ttcgaggatt tcattggagt tcagggtaaa 300
accgcgtgga acaccttctg ccaggttacg gccacgaact tcgatttcac ggacttcatc 360
gcccggataa gccgaaccga tttcgtgctt gatacgttct gcggtggctt caccgatcag 420
agaaccgtaa ttacgacgca catagttgat gatagcttcg tcgaaacggt caccaccaat 480
gcgcacagaa gaggagtaaa ccacaccgtt caaggagata acagcaactt cagtggtacc 540
accaccgata tcaaccacca tagaaccggt cgcttcagaa accggcaggc cagcaccaat 600
tgcggcagcc atcggttctt caatcaggaa gacttcacgg gcaccagcgc cctgcgcgga 660
ttcacgaatt gcgcggcgtt caacctgggt cgcgccaacc ggcacacaaa ccagaacgcg 720
cgggcttgga cgcataaagc tgttgctgtg cacttgtttg atgaagtgct ggagcatttt 780
ttcagtcacg aagaagtcgg cgataacgcc gtctttcatt gggcgaatgg cagcaatatt 840
gcccggcgta cggcccagca tctgcttcgc gtcatgacct actgcagcta cgcttttcgg 900
tgaaccggca cgatcctgac gaatggccac cacggaaggc tcattcaata cgatgccttg 960
tccttttaca taaatgaggg tattcgcagt acccaggtca atggacaagt cattggaaaa 1020
catgccacga aattttttca acat 1044
<210> 45
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 45
gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac atcttaatca tgcgagggat 60
ggtttctaat g 71
<210> 46
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 46
ttgacatcgc atctttttgt accatactta cagccattgt ac 42
<210> 47
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 47
tcgacattta tcccttgcgg cgaatactta cagcca 36
<210> 48
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 48
ttccctatta atcatccggc tcgtataatg tgtgga 36
<210> 49
<211> 3883
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 49
tcgacattta tcccttgcgg cgaatactta cagccagcga aaaatcaata aggaggcaac 60
aagatgtgcg aaaaacatct taatcatgcg gtggagggtt tctaatgaaa catcaccatc 120
accatcaccc catgagcgat tacgacatcc ccactactga gaatctttat tttcagggcg 180
ccgacgccaa cgtagtgagc tcgtccacga ttgctacata catcgacgca ctggctaaaa 240
acgcgagtga attagagcaa cgttcaaccg cctatgaaat caacaacgaa cttgagctcg 300
tctttattaa gcctccgcta atcaccctga ctaacgttgt taatatatct accatccagg 360
aaagcttcat tcgcttcact gttactaaca aagaaggcgt aaaaatcagg actaaaatcc 420
cattgtctaa ggtgcacggg ctggatgtga aaaacgttca gctggttgac gctattgaca 480
acatcgtatg ggaaaagaaa tccctcgtaa ccgaaaaccg tctgcataaa gaatgtctgc 540
tgcgtctgag cacggaggaa cgacacatct ttctggatta caaaaaatat ggtagttcta 600
ttcgtctgga gctggtgaac ctgatccagg caaagaccaa aaatttcaca attgacttca 660
aactaaaata ctttctgggc tccggtgcgc agagcaaatc ttccctgttg catgctatca 720
accacccgaa aagccgcccg aatacttctc tggaaatcga gttcaccccc cgcgataacg 780
aaactgtccc atacgatgag cttattaagg aactgaccac gctgtcccgt cacattttta 840
tggcgagccc ggaaaacgtt atattatcgc cgcctatcaa cgctccgatc aagaccttca 900
tgttgccgaa acaagacatc gtcggtctgg atctggagaa cctgtacgca gttactaaaa 960
ccgacggcat ccccatcact atcagagtaa cgtcaaacgg attgtattgc tatttcaccc 1020
atctgggtta cattattcgt tacccggtga aacgcatcat agattctgaa gttgttgttt 1080
tcggcgaagc cgtaaaggac aaaaactgga ccgtctatct gatcaagcta atcgaaccgg 1140
ttaatgctat caacgatcgg ctggaagaat cgaaatacgt agaatctaaa ctggtggata 1200
tttgcgaccg tattgtcttt aaatcgaaaa agtacgaggg tcctttcact actactagcg 1260
aagtcgtgga catgctctct acgtacctgc cgaaacagcc tgagggcgtt atcctgttct 1320
atagcaaagg tccgaaatcc aacatcgatt ttaagattaa aaaggaaaac accattgatc 1380
agacggctaa tgtagttttc cggtacatgt ctagcgagcc gatcatcttt ggcgaatctt 1440
ctatctttgt agaatataaa aagttcagca acgacaaagg attcccaaaa gaatacgggt 1500
ccgggaaaat cgtcttatac aacggtgtta actacttgaa caacatctat tgcctggaat 1560
atatcaatac tcacaatgaa gttggtatta aatcagtggt tgttccgata aaattcatcg 1620
cggaatttct ggtcaatggc gaaatcctga aaccccgcat tgataagacc atgaaataca 1680
taaactccga agactactac ggtaaccagc ataacatcat cgtggaacac ctgagagatc 1740
agagtatcaa aatcggcgac attttcaatg aggacaagtt aagcgacgtg ggccatcaat 1800
acgcaaacaa cgacaaattc cgtctgaacc cggaggtttc ctatttcacc aacaaacgta 1860
cccgaggtcc gcttggcatc ctctccaatt acgtaaaaac cctgctgatt tctatgtatt 1920
gttcaaaaac gttcctggat gacagcaaca aaaggaaggt actggctatc gatttcggta 1980
acggcgcgga tctggaaaag tacttttacg gtgaaatcgc tctgttagtc gcaactgatc 2040
cggacgccga cgcaattgct cgcggaaatg aacgttacaa caaactgaac tccggtatta 2100
aaacaaagta ttataaattc gactatatcc aggagactat ccgctctgat actttcgtga 2160
gcagcgtgcg tgaggttttt tactttggta aattcaacat tattgactgg cagtttgcga 2220
tccactacag ctttcacccg cgtcactatg cgaccgttat gaataaccta tcggaactca 2280
cggctagcgg cggcaaagtg ctgattacta ctatggacgg tgacaaactg tctaagctga 2340
ccgataagaa aaccttcatc atccacaaaa acttgccaag ttctgagaac tatatgtctg 2400
ttgaaaaaat tgcggacgac cgcatcgtcg tttacaaccc atctaccatg tccaccccta 2460
tgacagagta catcatcaaa aagaacgaca tagttcgtgt tttcaacgaa tacggcttcg 2520
tactggtaga taacgtcgat tttgctacca ttatcgagcg ttcgaaaaaa ttcattaacg 2580
gtgcttccac tatggaagat cgtccgtcca ctcgtaactt ttttgaatta aaccgtggcg 2640
caatcaaatg cgaagggctg gatgtggaag acctcctgtc ttactacgtt gtatacgtct 2700
tctctaaacg ctaaaataat tttgtttaac tttaagaagg aggtatatcc atggctagca 2760
tgactaaaca tcttaatcat gcgggggagt ctttctaatg gatgagatcg ttaagaacat 2820
tcgtgaaggt acgcatgtgc ttttgccatt ttacgaaact ctcccggaac tgaatctgtc 2880
cttaggcaaa agccctctac cctctctgga gtatggggcc aactacttcc tgcaaatctc 2940
acgcgtcaac gacctgaatc gaatgccgac cgacatgctg aaactgttca ctcacgatat 3000
aatgctgccg gaaagtgatc tggacaaagt atatgaaatc ctgaaaatca acagcgttaa 3060
gtactacgga cggtcgacca aagcggacgc tgttgtagca gatctgtctg ctcgcaacaa 3120
actctttaaa cgtgaacgtg acgctattaa gtccaacaac cacctgacag agaacaatct 3180
ctatatctct gactacaaaa tgttgacttt cgatgtgttc cgtccgctgt ttgatttcgt 3240
gaacgaaaaa tattgcatta tcaaactgcc gaccctgttc ggccgtggtg ttattgacac 3300
catgcgcatc tactgtagcc tcttcaagaa tgtcagacta ctgaaatgcg tgtccgatag 3360
ctggctgaaa gacagcgcaa tcatggtagc ctcagacgtt tgcaaaaaga acctggatct 3420
gtttatgtcc catgttaaat ccgttactaa gtctagctcg tggaaagatg ttaacagcgt 3480
acagttttct attttgaaca accctgttga cacggaattt atcaacaaat tcctggagtt 3540
ctctaaccgt gtatacgaag cgctgtatta cgtgcactcc ttactgtact cttctatgac 3600
cagcgatagt aagtctatcg aaaataaaca ccagcgccgt ctggtaaaac tgctccttgg 3660
gagcgcttgg agccacccgc agttcgaaaa aggtggaggt tctggcggtg gatcgggagg 3720
ttcagcgtgg agccacccgc agttcgagaa ataaccaggc atcaaataaa acgaaaggct 3780
cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag 3840
agtcacactg gctcaccttc gggtgggcct ttctgcgttt ata 3883
<210> 50
<211> 3874
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 50
ttgacatcgc atctttttgt accatactta cagccattgt acgcgaaaaa tcaataagga 60
ggcaacaaga tgtgcgaaaa acatcttaat catgcggtgg agggtttcta atgaaacatc 120
accatcacca tcaccccatg agcgattacg acatccccac tactgagaat ctttattttc 180
agggcgccga cgccaacgta gtgagctcgt ccacgattgc tacatacatc gacgcactgg 240
ctaaaaacgc gagtgaatta gagcaacgtt caaccgccta tgaaatcaac aacgaacttg 300
agctcgtctt tattaagcct ccgctaatca ccctgactaa cgttgttaat atatctacca 360
tccaggaaag cttcattcgc ttcactgtta ctaacaaaga aggcgtaaaa atcaggacta 420
aaatcccatt gtctaaggtg cacgggctgg atgtgaaaaa cgttcagctg gttgacgcta 480
ttgacaacat cgtatgggaa aagaaatccc tcgtaaccga aaaccgtctg cataaagaat 540
gtctgctgcg tctgagcacg gaggaacgac acatctttct ggattacaaa aaatatggta 600
gttctattcg tctggagctg gtgaacctga tccaggcaaa gaccaaaaat ttcacaattg 660
acttcaaact aaaatacttt ctgggctccg gtgcgcagag caaatcttcc ctgttgcatg 720
ctatcaacca cccgaaaagc cgcccgaata cttctctgga aatcgagttc accccccgcg 780
ataacgaaac tgtcccatac gatgagctta ttaaggaact gaccacgctg tcccgtcaca 840
tttttatggc gagcccggaa aacgttatat tatcgccgcc tatcaacgct ccgatcaaga 900
ccttcatgtt gccgaaacaa gacatcgtcg gtctggatct ggagaacctg tacgcagtta 960
ctaaaaccga cggcatcccc atcactatca gagtaacgtc aaacggattg tattgctatt 1020
tcacccatct gggttacatt attcgttacc cggtgaaacg catcatagat tctgaagttg 1080
ttgttttcgg cgaagccgta aaggacaaaa actggaccgt ctatctgatc aagctaatcg 1140
aaccggttaa tgctatcaac gatcggctgg aagaatcgaa atacgtagaa tctaaactgg 1200
tggatatttg cgaccgtatt gtctttaaat cgaaaaagta cgagggtcct ttcactacta 1260
ctagcgaagt cgtggacatg ctctctacgt acctgccgaa acagcctgag ggcgttatcc 1320
tgttctatag caaaggtccg aaatccaaca tcgattttaa gattaaaaag gaaaacacca 1380
ttgatcagac ggctaatgta gttttccggt acatgtctag cgagccgatc atctttggcg 1440
aatcttctat ctttgtagaa tataaaaagt tcagcaacga caaaggattc ccaaaagaat 1500
acgggtccgg gaaaatcgtc ttatacaacg gtgttaacta cttgaacaac atctattgcc 1560
tggaatatat caatactcac aatgaagttg gtattaaatc agtggttgtt ccgataaaat 1620
tcatcgcgga atttctggtc aatggcgaaa tcctgaaacc ccgcattgat aagaccatga 1680
aatacataaa ctccgaagac tactacggta accagcataa catcatcgtg gaacacctga 1740
gagatcagag tatcaaaatc ggcgacattt tcaatgagga caagttaagc gacgtgggcc 1800
atcaatacgc aaacaacgac aaattccgtc tgaacccgga ggtttcctat ttcaccaaca 1860
aacgtacccg aggtccgctt ggcatcctct ccaattacgt aaaaaccctg ctgatttcta 1920
tgtattgttc aaaaacgttc ctggatgaca gcaacaaaag gaaggtactg gctatcgatt 1980
tcggtaacgg cgcggatctg gaaaagtact tttacggtga aatcgctctg ttagtcgcaa 2040
ctgatccgga cgccgacgca attgctcgcg gaaatgaacg ttacaacaaa ctgaactccg 2100
gtattaaaac aaagtattat aaattcgact atatccagga gactatccgc tctgatactt 2160
tcgtgagcag cgtgcgtgag gttttttact ttggtaaatt caacattatt gactggcagt 2220
ttgcgatcca ctacagcttt cacccgcgtc actatgcgac cgttatgaat aacctatcgg 2280
aactcacggc tagcggcggc aaagtgctga ttactactat ggacggtgac aaactgtcta 2340
agctgaccga taagaaaacc ttcatcatcc acaaaaactt gccaagttct gagaactata 2400
tgtctgttga aaaaattgcg gacgaccgca tcgtcgttta caacccatct accatgtcca 2460
cccctatgac agagtacatc atcaaaaaga acgacatagt tcgtgttttc aacgaatacg 2520
gcttcgtact ggtagataac gtcgattttg ctaccattat cgagcgttcg aaaaaattca 2580
ttaacggtgc ttccactatg gaagatcgtc cgtccactcg taactttttt gaattaaacc 2640
gtggcgcaat caaatgcgaa gggctggatg tggaagacct cctgtcttac tacgttgtat 2700
acgtcttctc taaacgctaa gcgaaaaatc aataaggagg caacaagatg tgcgaaaaac 2760
atcttaatca tgcgagggat ggtttctaat ggatgagatc gttaagaaca ttcgtgaagg 2820
tacgcatgtg cttttgccat tttacgaaac tctcccggaa ctgaatctgt ccttaggcaa 2880
aagccctcta ccctctctgg agtatggggc caactacttc ctgcaaatct cacgcgtcaa 2940
cgacctgaat cgaatgccga ccgacatgct gaaactgttc actcacgata taatgctgcc 3000
ggaaagtgat ctggacaaag tatatgaaat cctgaaaatc aacagcgtta agtactacgg 3060
acggtcgacc aaagcggacg ctgttgtagc agatctgtct gctcgcaaca aactctttaa 3120
acgtgaacgt gacgctatta agtccaacaa ccacctgaca gagaacaatc tctatatctc 3180
tgactacaaa atgttgactt tcgatgtgtt ccgtccgctg tttgatttcg tgaacgaaaa 3240
atattgcatt atcaaactgc cgaccctgtt cggccgtggt gttattgaca ccatgcgcat 3300
ctactgtagc ctcttcaaga atgtcagact actgaaatgc gtgtccgata gctggctgaa 3360
agacagcgca atcatggtag cctcagacgt ttgcaaaaag aacctggatc tgtttatgtc 3420
ccatgttaaa tccgttacta agtctagctc gtggaaagat gttaacagcg tacagttttc 3480
tattttgaac aaccctgttg acacggaatt tatcaacaaa ttcctggagt tctctaaccg 3540
tgtatacgaa gcgctgtatt acgtgcactc cttactgtac tcttctatga ccagcgatag 3600
taagtctatc gaaaataaac accagcgccg tctggtaaaa ctgctccttg ggagcgcttg 3660
gagccacccg cagttcgaaa aaggtggagg ttctggcggt ggatcgggag gttcagcgtg 3720
gagccacccg cagttcgaga aataaccagg catcaaataa aacgaaaggc tcagtcgaaa 3780
gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact 3840
ggctcacctt cgggtgggcc tttctgcgtt tata 3874
<210> 51
<211> 3868
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 51
tcgacattta tcccttgcgg cgaatactta cagccagcga aaaatcaata aggaggcaac 60
aagatgtgcg aaaaacatct taatcatgcg gtggagggtt tctaatgaaa catcaccatc 120
accatcaccc catgagcgat tacgacatcc ccactactga gaatctttat tttcagggcg 180
ccgacgctaa tgtcgtgtct tcttctacca tcgcaaccta tattgacgct ctggcaaaaa 240
acgcctcgga actggaacaa cgctcaaccg cgtatgaaat caacaatgaa ctggaactgg 300
tgtttatcaa accgccgctg attacgctga ccaacgtggt taatatcagc accattcagg 360
aatcttttat tcgtttcacg gttaccaaca aagaaggcgt caaaatccgc acgaaaattc 420
cgctgagcaa agttcatggt ctggatgtga aaaacgttca actggtcgac gcaatcgata 480
atattgtgtg ggaaaagaaa agcctggtta ccgaaaatcg tctgcataaa gaatgcctgc 540
tgcgtctgag cacggaagaa cgccacatct ttctggacta taaaaaatac ggcagctcta 600
tccgcctgga actggtgaac ctgatccagg ctaaaaccaa aaacttcacg atcgatttca 660
aactgaaata ttttctgggc agtggtgctc aatccaaaag ttccctgctg catgcgatca 720
accacccgaa aagtcgtccg aatacctccc tggaaattga attcaccccg cgcgacaacg 780
aaacggtgcc gtacgatgaa ctgattaaag aactgaccac gctgtcacgt catatcttta 840
tggcgtcgcc ggaaaacgtt attctgagcc cgccgatcaa tgccccgatt aaaaccttca 900
tgctgccgaa acaggacatt gttggcctgg atctggaaaa cctgtatgcg gtcacgaaaa 960
ccgatggtat tccgatcacc attcgcgtga cgtcgaatgg cctgtattgc tactttaccc 1020
acctgggtta tattatccgt tacccggtta aacgcattat cgactccgaa gtcgtggttt 1080
tcggcgaagc ggtcaaagat aaaaattgga ccgtgtatct gatcaaactg attgaaccgg 1140
tgaacgccat caacgatcgt ctggaagaat caaaatacgt ggaatcgaaa ctggttgaca 1200
tctgtgatcg catcgttttc aaaagcaaaa aatacgaagg tccgttcacc acgacctctg 1260
aagtcgtgga tatgctgagt acctatctgc cgaaacagcc ggaaggcgtg atcctgtttt 1320
acagcaaagg tccgaaatct aacatcgact tcaaaatcaa aaaagaaaac accatcgatc 1380
aaacggccaa tgttgtcttt cgttatatgt catcggaacc gattatcttt ggcgaaagct 1440
ctatcttcgt ggaatacaaa aaattctcga acgataaagg cttcccgaaa gaatacggca 1500
gcggtaaaat tgtcctgtat aacggtgtga attacctgaa caatatctat tgcctggaat 1560
acattaacac ccataatgaa gttggcatta aatctgtggt tgtcccgatc aaatttattg 1620
cagaattcct ggtcaacggt gaaatcctga aaccgcgtat tgacaaaacc atgaaataca 1680
tcaacagtga agattactac ggtaaccagc ataacatcat cgtggaacac ctgcgcgacc 1740
aatctatcaa aatcggcgat atcttcaacg aagacaaact gagtgatgtc ggtcaccagt 1800
atgcgaacaa tgataaattt cgtctgaacc cggaagtgtc ctacttcacc aataaacgta 1860
cgcgcggccc gctgggtatc ctgtcaaatt atgtcaaaac cctgctgatt tcaatgtact 1920
gttcgaaaac gtttctggat gacagcaaca aacgcaaagt tctggccatt gactttggca 1980
atggtgcaga tctggaaaaa tatttctacg gcgaaatcgc tctgctggtt gcgaccgatc 2040
cggacgcgga tgccattgca cgtggcaacg aacgctataa caaactgaat tctggtatca 2100
aaaccaaata ctacaaattc gactacatcc aggaaaccat tcgtagtgat acgttcgtga 2160
gttccgttcg cgaagtcttt tatttcggca aattcaacat catcgattgg caattcgcca 2220
tccattattc tttccatccg cgtcactacg caaccgtgat gaacaatctg agtgaactga 2280
cggcttccgg cggtaaagtt ctgattacga cgatggatgg tgataaactg tccaaactga 2340
ccgataagaa aaccttcatt atccacaaaa acctgccgtc atcggaaaac tacatgtcag 2400
tggaaaaaat cgccgatgac cgcattgtgg tttataaccc gagcacgatg tctaccccga 2460
tgacggaata catcattaag aaaaacgata tcgtccgtgt gtttaatgaa tacggtttcg 2520
ttctggtcga caacgttgat tttgcaacca ttatcgaacg cagcaaaaaa ttcatcaatg 2580
gcgcttccac gatggaagat cgtccgtcaa cgcgcaactt tttcgaactg aatcgcggtg 2640
caattaaatg tgaaggtctg gatgtggaag atctgctgtc ctattatgtc gtgtatgtgt 2700
tctctaaacg ctaagcgaaa aatcaataag gaggcaacaa gatgtgcgaa aaacatctta 2760
atcatgcgag ggatggtttc taatggatga aatcgtcaaa aatatccgcg aaggcacgca 2820
cgtcctgctg ccgttctatg aaaccctgcc ggaactgaat ctgtcactgg gcaaatctcc 2880
gctgccgagt ctggaatatg gtgcaaacta ctttctgcag atttctcgtg tgaacgatct 2940
gaatcgcatg ccgaccgaca tgctgaaact gttcacgcat gatatcatgc tgccggaaag 3000
cgatctggac aaagtctacg aaatcctgaa aatcaactcc gttaaatact acggccgttc 3060
aaccaaagcg gatgccgtgg ttgcagacct gtccgctcgc aataaactgt ttaaacgtga 3120
acgcgatgct attaaatcga acaatcacct gaccgaaaac aacctgtaca tcagcgatta 3180
caaaatgctg acgtttgacg tgttccgtcc gctgttcgat ttcgttaacg aaaaatactg 3240
catcatcaaa ctgccgaccc tgtttggccg tggtgtgatt gatacgatgc gcatctactg 3300
cagcctgttc aaaaatgtcc gcctgctgaa atgtgtgtcg gatagctggc tgaaagactc 3360
tgcgattatg gtggccagtg acgtttgtaa gaaaaacctg gacctgttta tgtcccatgt 3420
caaatcagtg accaaaagct ctagttggaa agacgttaat tcggtccaat ttagcattct 3480
gaacaatccg gttgatacgg aattcatcaa caaattcctg gaattctcta accgtgttta 3540
cgaagcactg tattacgtcc acagtctgct gtactcctca atgacctcgg actccaaatc 3600
catcgaaaat aaacatcaac gccgcctggt gaaactgctg ctggggagcg cttggagcca 3660
cccgcagttc gaaaaaggtg gaggttctgg cggtggatcg ggaggttcag cgtggagcca 3720
cccgcagttc gagaaataac caggcatcaa ataaaacgaa aggctcagtc gaaagactgg 3780
gcctttcgtt ttatctgttg tttgtcggtg aacgctctct actagagtca cactggctca 3840
ccttcgggtg ggcctttctg cgtttata 3868
<210> 52
<211> 3883
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 52
tcgacattta tcccttgcgg cgaatactta cagccagcga aaaatcaata aggaggcaac 60
aagatgtgcg aaaaacatct taatcatgcg gtggagggtt tctaatgaaa catcaccatc 120
accatcaccc catgagcgat tacgacatcc ccactactga gaatctttat tttcagggcg 180
ccgacgctaa tgtcgtgtct tcttctacca tcgcaaccta tattgacgct ctggcaaaaa 240
acgcctcgga actggaacaa cgctcaaccg cgtatgaaat caacaatgaa ctggaactgg 300
tgtttatcaa accgccgctg attacgctga ccaacgtggt taatatcagc accattcagg 360
aatcttttat tcgtttcacg gttaccaaca aagaaggcgt caaaatccgc acgaaaattc 420
cgctgagcaa agttcatggt ctggatgtga aaaacgttca actggtcgac gcaatcgata 480
atattgtgtg ggaaaagaaa agcctggtta ccgaaaatcg tctgcataaa gaatgcctgc 540
tgcgtctgag cacggaagaa cgccacatct ttctggacta taaaaaatac ggcagctcta 600
tccgcctgga actggtgaac ctgatccagg ctaaaaccaa aaacttcacg atcgatttca 660
aactgaaata ttttctgggc agtggtgctc aatccaaaag ttccctgctg catgcgatca 720
accacccgaa aagtcgtccg aatacctccc tggaaattga attcaccccg cgcgacaacg 780
aaacggtgcc gtacgatgaa ctgattaaag aactgaccac gctgtcacgt catatcttta 840
tggcgtcgcc ggaaaacgtt attctgagcc cgccgatcaa tgccccgatt aaaaccttca 900
tgctgccgaa acaggacatt gttggcctgg atctggaaaa cctgtatgcg gtcacgaaaa 960
ccgatggtat tccgatcacc attcgcgtga cgtcgaatgg cctgtattgc tactttaccc 1020
acctgggtta tattatccgt tacccggtta aacgcattat cgactccgaa gtcgtggttt 1080
tcggcgaagc ggtcaaagat aaaaattgga ccgtgtatct gatcaaactg attgaaccgg 1140
tgaacgccat caacgatcgt ctggaagaat caaaatacgt ggaatcgaaa ctggttgaca 1200
tctgtgatcg catcgttttc aaaagcaaaa aatacgaagg tccgttcacc acgacctctg 1260
aagtcgtgga tatgctgagt acctatctgc cgaaacagcc ggaaggcgtg atcctgtttt 1320
acagcaaagg tccgaaatct aacatcgact tcaaaatcaa aaaagaaaac accatcgatc 1380
aaacggccaa tgttgtcttt cgttatatgt catcggaacc gattatcttt ggcgaaagct 1440
ctatcttcgt ggaatacaaa aaattctcga acgataaagg cttcccgaaa gaatacggca 1500
gcggtaaaat tgtcctgtat aacggtgtga attacctgaa caatatctat tgcctggaat 1560
acattaacac ccataatgaa gttggcatta aatctgtggt tgtcccgatc aaatttattg 1620
cagaattcct ggtcaacggt gaaatcctga aaccgcgtat tgacaaaacc atgaaataca 1680
tcaacagtga agattactac ggtaaccagc ataacatcat cgtggaacac ctgcgcgacc 1740
aatctatcaa aatcggcgat atcttcaacg aagacaaact gagtgatgtc ggtcaccagt 1800
atgcgaacaa tgataaattt cgtctgaacc cggaagtgtc ctacttcacc aataaacgta 1860
cgcgcggccc gctgggtatc ctgtcaaatt atgtcaaaac cctgctgatt tcaatgtact 1920
gttcgaaaac gtttctggat gacagcaaca aacgcaaagt tctggccatt gactttggca 1980
atggtgcaga tctggaaaaa tatttctacg gcgaaatcgc tctgctggtt gcgaccgatc 2040
cggacgcgga tgccattgca cgtggcaacg aacgctataa caaactgaat tctggtatca 2100
aaaccaaata ctacaaattc gactacatcc aggaaaccat tcgtagtgat acgttcgtga 2160
gttccgttcg cgaagtcttt tatttcggca aattcaacat catcgattgg caattcgcca 2220
tccattattc tttccatccg cgtcactacg caaccgtgat gaacaatctg agtgaactga 2280
cggcttccgg cggtaaagtt ctgattacga cgatggatgg tgataaactg tccaaactga 2340
ccgataagaa aaccttcatt atccacaaaa acctgccgtc atcggaaaac tacatgtcag 2400
tggaaaaaat cgccgatgac cgcattgtgg tttataaccc gagcacgatg tctaccccga 2460
tgacggaata catcattaag aaaaacgata tcgtccgtgt gtttaatgaa tacggtttcg 2520
ttctggtcga caacgttgat tttgcaacca ttatcgaacg cagcaaaaaa ttcatcaatg 2580
gcgcttccac gatggaagat cgtccgtcaa cgcgcaactt tttcgaactg aatcgcggtg 2640
caattaaatg tgaaggtctg gatgtggaag atctgctgtc ctattatgtc gtgtatgtgt 2700
tctctaaacg ctaaaataat tttgtttaac tttaagaagg aggtatatcc atggctagca 2760
tgactaaaca tcttaatcat gcgggggagt ctttctaatg gatgaaatcg tcaaaaatat 2820
ccgcgaaggc acgcacgtcc tgctgccgtt ctatgaaacc ctgccggaac tgaatctgtc 2880
actgggcaaa tctccgctgc cgagtctgga atatggtgca aactactttc tgcagatttc 2940
tcgtgtgaac gatctgaatc gcatgccgac cgacatgctg aaactgttca cgcatgatat 3000
catgctgccg gaaagcgatc tggacaaagt ctacgaaatc ctgaaaatca actccgttaa 3060
atactacggc cgttcaacca aagcggatgc cgtggttgca gacctgtccg ctcgcaataa 3120
actgtttaaa cgtgaacgcg atgctattaa atcgaacaat cacctgaccg aaaacaacct 3180
gtacatcagc gattacaaaa tgctgacgtt tgacgtgttc cgtccgctgt tcgatttcgt 3240
taacgaaaaa tactgcatca tcaaactgcc gaccctgttt ggccgtggtg tgattgatac 3300
gatgcgcatc tactgcagcc tgttcaaaaa tgtccgcctg ctgaaatgtg tgtcggatag 3360
ctggctgaaa gactctgcga ttatggtggc cagtgacgtt tgtaagaaaa acctggacct 3420
gtttatgtcc catgtcaaat cagtgaccaa aagctctagt tggaaagacg ttaattcggt 3480
ccaatttagc attctgaaca atccggttga tacggaattc atcaacaaat tcctggaatt 3540
ctctaaccgt gtttacgaag cactgtatta cgtccacagt ctgctgtact cctcaatgac 3600
ctcggactcc aaatccatcg aaaataaaca tcaacgccgc ctggtgaaac tgctgctggg 3660
gagcgcttgg agccacccgc agttcgaaaa aggtggaggt tctggcggtg gatcgggagg 3720
ttcagcgtgg agccacccgc agttcgagaa ataaccaggc atcaaataaa acgaaaggct 3780
cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag 3840
agtcacactg gctcaccttc gggtgggcct ttctgcgttt ata 3883
<210> 53
<211> 3883
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 53
ttccctatta atcatccggc tcgtataatg tgtggagcga aaaatcaata aggaggcaac 60
aagatgtgcg aaaaacatct taatcatgcg gtggagggtt tctaatgaaa catcaccatc 120
accatcaccc catgagcgat tacgacatcc ccactactga gaatctttat tttcagggcg 180
ccgacgccaa cgtagtgagc tcgtccacga ttgctacata catcgacgca ctggctaaaa 240
acgcgagtga attagagcaa cgttcaaccg cctatgaaat caacaacgaa cttgagctcg 300
tctttattaa gcctccgcta atcaccctga ctaacgttgt taatatatct accatccagg 360
aaagcttcat tcgcttcact gttactaaca aagaaggcgt aaaaatcagg actaaaatcc 420
cattgtctaa ggtgcacggg ctggatgtga aaaacgttca gctggttgac gctattgaca 480
acatcgtatg ggaaaagaaa tccctcgtaa ccgaaaaccg tctgcataaa gaatgtctgc 540
tgcgtctgag cacggaggaa cgacacatct ttctggatta caaaaaatat ggtagttcta 600
ttcgtctgga gctggtgaac ctgatccagg caaagaccaa aaatttcaca attgacttca 660
aactaaaata ctttctgggc tccggtgcgc agagcaaatc ttccctgttg catgctatca 720
accacccgaa aagccgcccg aatacttctc tggaaatcga gttcaccccc cgcgataacg 780
aaactgtccc atacgatgag cttattaagg aactgaccac gctgtcccgt cacattttta 840
tggcgagccc ggaaaacgtt atattatcgc cgcctatcaa cgctccgatc aagaccttca 900
tgttgccgaa acaagacatc gtcggtctgg atctggagaa cctgtacgca gttactaaaa 960
ccgacggcat ccccatcact atcagagtaa cgtcaaacgg attgtattgc tatttcaccc 1020
atctgggtta cattattcgt tacccggtga aacgcatcat agattctgaa gttgttgttt 1080
tcggcgaagc cgtaaaggac aaaaactgga ccgtctatct gatcaagcta atcgaaccgg 1140
ttaatgctat caacgatcgg ctggaagaat cgaaatacgt agaatctaaa ctggtggata 1200
tttgcgaccg tattgtcttt aaatcgaaaa agtacgaggg tcctttcact actactagcg 1260
aagtcgtgga catgctctct acgtacctgc cgaaacagcc tgagggcgtt atcctgttct 1320
atagcaaagg tccgaaatcc aacatcgatt ttaagattaa aaaggaaaac accattgatc 1380
agacggctaa tgtagttttc cggtacatgt ctagcgagcc gatcatcttt ggcgaatctt 1440
ctatctttgt agaatataaa aagttcagca acgacaaagg attcccaaaa gaatacgggt 1500
ccgggaaaat cgtcttatac aacggtgtta actacttgaa caacatctat tgcctggaat 1560
atatcaatac tcacaatgaa gttggtatta aatcagtggt tgttccgata aaattcatcg 1620
cggaatttct ggtcaatggc gaaatcctga aaccccgcat tgataagacc atgaaataca 1680
taaactccga agactactac ggtaaccagc ataacatcat cgtggaacac ctgagagatc 1740
agagtatcaa aatcggcgac attttcaatg aggacaagtt aagcgacgtg ggccatcaat 1800
acgcaaacaa cgacaaattc cgtctgaacc cggaggtttc ctatttcacc aacaaacgta 1860
cccgaggtcc gcttggcatc ctctccaatt acgtaaaaac cctgctgatt tctatgtatt 1920
gttcaaaaac gttcctggat gacagcaaca aaaggaaggt actggctatc gatttcggta 1980
acggcgcgga tctggaaaag tacttttacg gtgaaatcgc tctgttagtc gcaactgatc 2040
cggacgccga cgcaattgct cgcggaaatg aacgttacaa caaactgaac tccggtatta 2100
aaacaaagta ttataaattc gactatatcc aggagactat ccgctctgat actttcgtga 2160
gcagcgtgcg tgaggttttt tactttggta aattcaacat tattgactgg cagtttgcga 2220
tccactacag ctttcacccg cgtcactatg cgaccgttat gaataaccta tcggaactca 2280
cggctagcgg cggcaaagtg ctgattacta ctatggacgg tgacaaactg tctaagctga 2340
ccgataagaa aaccttcatc atccacaaaa acttgccaag ttctgagaac tatatgtctg 2400
ttgaaaaaat tgcggacgac cgcatcgtcg tttacaaccc atctaccatg tccaccccta 2460
tgacagagta catcatcaaa aagaacgaca tagttcgtgt tttcaacgaa tacggcttcg 2520
tactggtaga taacgtcgat tttgctacca ttatcgagcg ttcgaaaaaa ttcattaacg 2580
gtgcttccac tatggaagat cgtccgtcca ctcgtaactt ttttgaatta aaccgtggcg 2640
caatcaaatg cgaagggctg gatgtggaag acctcctgtc ttactacgtt gtatacgtct 2700
tctctaaacg ctaaaataat tttgtttaac tttaagaagg aggtatatcc atggctagca 2760
tgactaaaca tcttaatcat gcgggggagt ctttctaatg gatgagatcg ttaagaacat 2820
tcgtgaaggt acgcatgtgc ttttgccatt ttacgaaact ctcccggaac tgaatctgtc 2880
cttaggcaaa agccctctac cctctctgga gtatggggcc aactacttcc tgcaaatctc 2940
acgcgtcaac gacctgaatc gaatgccgac cgacatgctg aaactgttca ctcacgatat 3000
aatgctgccg gaaagtgatc tggacaaagt atatgaaatc ctgaaaatca acagcgttaa 3060
gtactacgga cggtcgacca aagcggacgc tgttgtagca gatctgtctg ctcgcaacaa 3120
actctttaaa cgtgaacgtg acgctattaa gtccaacaac cacctgacag agaacaatct 3180
ctatatctct gactacaaaa tgttgacttt cgatgtgttc cgtccgctgt ttgatttcgt 3240
gaacgaaaaa tattgcatta tcaaactgcc gaccctgttc ggccgtggtg ttattgacac 3300
catgcgcatc tactgtagcc tcttcaagaa tgtcagacta ctgaaatgcg tgtccgatag 3360
ctggctgaaa gacagcgcaa tcatggtagc ctcagacgtt tgcaaaaaga acctggatct 3420
gtttatgtcc catgttaaat ccgttactaa gtctagctcg tggaaagatg ttaacagcgt 3480
acagttttct attttgaaca accctgttga cacggaattt atcaacaaat tcctggagtt 3540
ctctaaccgt gtatacgaag cgctgtatta cgtgcactcc ttactgtact cttctatgac 3600
cagcgatagt aagtctatcg aaaataaaca ccagcgccgt ctggtaaaac tgctccttgg 3660
gagcgcttgg agccacccgc agttcgaaaa aggtggaggt tctggcggtg gatcgggagg 3720
ttcagcgtgg agccacccgc agttcgagaa ataaccaggc atcaaataaa acgaaaggct 3780
cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag 3840
agtcacactg gctcaccttc gggtgggcct ttctgcgttt ata 3883
<210> 54
<211> 3868
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 54
ttccctatta atcatccggc tcgtataatg tgtggagcga aaaatcaata aggaggcaac 60
aagatgtgcg aaaaacatct taatcatgcg gtggagggtt tctaatgaaa catcaccatc 120
accatcaccc catgagcgat tacgacatcc ccactactga gaatctttat tttcagggcg 180
ccgacgccaa cgtagtgagc tcgtccacga ttgctacata catcgacgca ctggctaaaa 240
acgcgagtga attagagcaa cgttcaaccg cctatgaaat caacaacgaa cttgagctcg 300
tctttattaa gcctccgcta atcaccctga ctaacgttgt taatatatct accatccagg 360
aaagcttcat tcgcttcact gttactaaca aagaaggcgt aaaaatcagg actaaaatcc 420
cattgtctaa ggtgcacggg ctggatgtga aaaacgttca gctggttgac gctattgaca 480
acatcgtatg ggaaaagaaa tccctcgtaa ccgaaaaccg tctgcataaa gaatgtctgc 540
tgcgtctgag cacggaggaa cgacacatct ttctggatta caaaaaatat ggtagttcta 600
ttcgtctgga gctggtgaac ctgatccagg caaagaccaa aaatttcaca attgacttca 660
aactaaaata ctttctgggc tccggtgcgc agagcaaatc ttccctgttg catgctatca 720
accacccgaa aagccgcccg aatacttctc tggaaatcga gttcaccccc cgcgataacg 780
aaactgtccc atacgatgag cttattaagg aactgaccac gctgtcccgt cacattttta 840
tggcgagccc ggaaaacgtt atattatcgc cgcctatcaa cgctccgatc aagaccttca 900
tgttgccgaa acaagacatc gtcggtctgg atctggagaa cctgtacgca gttactaaaa 960
ccgacggcat ccccatcact atcagagtaa cgtcaaacgg attgtattgc tatttcaccc 1020
atctgggtta cattattcgt tacccggtga aacgcatcat agattctgaa gttgttgttt 1080
tcggcgaagc cgtaaaggac aaaaactgga ccgtctatct gatcaagcta atcgaaccgg 1140
ttaatgctat caacgatcgg ctggaagaat cgaaatacgt agaatctaaa ctggtggata 1200
tttgcgaccg tattgtcttt aaatcgaaaa agtacgaggg tcctttcact actactagcg 1260
aagtcgtgga catgctctct acgtacctgc cgaaacagcc tgagggcgtt atcctgttct 1320
atagcaaagg tccgaaatcc aacatcgatt ttaagattaa aaaggaaaac accattgatc 1380
agacggctaa tgtagttttc cggtacatgt ctagcgagcc gatcatcttt ggcgaatctt 1440
ctatctttgt agaatataaa aagttcagca acgacaaagg attcccaaaa gaatacgggt 1500
ccgggaaaat cgtcttatac aacggtgtta actacttgaa caacatctat tgcctggaat 1560
atatcaatac tcacaatgaa gttggtatta aatcagtggt tgttccgata aaattcatcg 1620
cggaatttct ggtcaatggc gaaatcctga aaccccgcat tgataagacc atgaaataca 1680
taaactccga agactactac ggtaaccagc ataacatcat cgtggaacac ctgagagatc 1740
agagtatcaa aatcggcgac attttcaatg aggacaagtt aagcgacgtg ggccatcaat 1800
acgcaaacaa cgacaaattc cgtctgaacc cggaggtttc ctatttcacc aacaaacgta 1860
cccgaggtcc gcttggcatc ctctccaatt acgtaaaaac cctgctgatt tctatgtatt 1920
gttcaaaaac gttcctggat gacagcaaca aaaggaaggt actggctatc gatttcggta 1980
acggcgcgga tctggaaaag tacttttacg gtgaaatcgc tctgttagtc gcaactgatc 2040
cggacgccga cgcaattgct cgcggaaatg aacgttacaa caaactgaac tccggtatta 2100
aaacaaagta ttataaattc gactatatcc aggagactat ccgctctgat actttcgtga 2160
gcagcgtgcg tgaggttttt tactttggta aattcaacat tattgactgg cagtttgcga 2220
tccactacag ctttcacccg cgtcactatg cgaccgttat gaataaccta tcggaactca 2280
cggctagcgg cggcaaagtg ctgattacta ctatggacgg tgacaaactg tctaagctga 2340
ccgataagaa aaccttcatc atccacaaaa acttgccaag ttctgagaac tatatgtctg 2400
ttgaaaaaat tgcggacgac cgcatcgtcg tttacaaccc atctaccatg tccaccccta 2460
tgacagagta catcatcaaa aagaacgaca tagttcgtgt tttcaacgaa tacggcttcg 2520
tactggtaga taacgtcgat tttgctacca ttatcgagcg ttcgaaaaaa ttcattaacg 2580
gtgcttccac tatggaagat cgtccgtcca ctcgtaactt ttttgaatta aaccgtggcg 2640
caatcaaatg cgaagggctg gatgtggaag acctcctgtc ttactacgtt gtatacgtct 2700
tctctaaacg ctaagcgaaa aatcaataag gaggcaacaa gatgtgcgaa aaacatctta 2760
atcatgcgag ggatggtttc taatggatga gatcgttaag aacattcgtg aaggtacgca 2820
tgtgcttttg ccattttacg aaactctccc ggaactgaat ctgtccttag gcaaaagccc 2880
tctaccctct ctggagtatg gggccaacta cttcctgcaa atctcacgcg tcaacgacct 2940
gaatcgaatg ccgaccgaca tgctgaaact gttcactcac gatataatgc tgccggaaag 3000
tgatctggac aaagtatatg aaatcctgaa aatcaacagc gttaagtact acggacggtc 3060
gaccaaagcg gacgctgttg tagcagatct gtctgctcgc aacaaactct ttaaacgtga 3120
acgtgacgct attaagtcca acaaccacct gacagagaac aatctctata tctctgacta 3180
caaaatgttg actttcgatg tgttccgtcc gctgtttgat ttcgtgaacg aaaaatattg 3240
cattatcaaa ctgccgaccc tgttcggccg tggtgttatt gacaccatgc gcatctactg 3300
tagcctcttc aagaatgtca gactactgaa atgcgtgtcc gatagctggc tgaaagacag 3360
cgcaatcatg gtagcctcag acgtttgcaa aaagaacctg gatctgttta tgtcccatgt 3420
taaatccgtt actaagtcta gctcgtggaa agatgttaac agcgtacagt tttctatttt 3480
gaacaaccct gttgacacgg aatttatcaa caaattcctg gagttctcta accgtgtata 3540
cgaagcgctg tattacgtgc actccttact gtactcttct atgaccagcg atagtaagtc 3600
tatcgaaaat aaacaccagc gccgtctggt aaaactgctc cttgggagcg cttggagcca 3660
cccgcagttc gaaaaaggtg gaggttctgg cggtggatcg ggaggttcag cgtggagcca 3720
cccgcagttc gagaaataac caggcatcaa ataaaacgaa aggctcagtc gaaagactgg 3780
gcctttcgtt ttatctgttg tttgtcggtg aacgctctct actagagtca cactggctca 3840
ccttcgggtg ggcctttctg cgtttata 3868

Claims (44)

1.一种非天然存在的核酸,所述非天然存在的核酸包括:
a)启动子,其中所述启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;以及
b)编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列的核酸、
和/或编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列的核酸,
其中(a)和(b)可操作地连接,并且其中所述非天然存在的核酸还包括核糖体结合位点(RBS)。
2.如权利要求1所述的非天然存在的核酸,其中所述启动子可通过乳糖和/或半乳糖诱导。
3.如权利要求1或2所述的非天然存在的核酸,其中所述非天然存在的核酸还包括终止子。
4.如权利要求1-3中任一项所述的非天然存在的核酸,其中:
a)所述RBS包括与SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:
13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:37、SEQID NO:38或SEQ ID NO:45至少90%一致的序列;和/或
b)所述终止子包括与SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20至少90%一致的序列。
5.如权利要求1-4中任一项所述的非天然存在的核酸,其中:
a)编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的所述氨基酸序列的所述核酸包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:33或SEQ ID NO:34至少90%一致的核酸序列;和/或
b)编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的所述氨基酸序列的所述核酸包括与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:35或SEQ ID NO:36至少90%一致的核酸序列。
6.如权利要求3-5中任一项所述的非天然存在的核酸,其中所述启动子、所述RBS和所述终止子可操作地连接至权利要求1(b)的所述核酸。
7.如权利要求1-6中任一项所述的非天然存在的核酸,其中权利要求1(b)中的所述核酸编码SEQ ID NO:6或SEQ ID NO:29的氨基酸序列。
8.如权利要求1-6中任一项所述的非天然存在的核酸,其中权利要求1(b)中的所述核酸编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。
9.如权利要求1-6中任一项所述的非天然存在的核酸,其中权利要求1(b)中的所述核酸编码SEQ ID NO:6或SEQ ID NO:29的氨基酸序列并且也编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。
10.一种非天然存在的核酸,所述非天然存在的核酸包括:
a)第一启动子,其中所述第一启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;
b)第一核酸,其中所述第一核酸编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列;
c)第二启动子,其中所述第二启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;以及
d)第二核酸,其中所述第二核酸编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列,
其中(a)和(b)可操作地连接,并且其中(c)和(d)可操作地连接,
并且其中所述非天然存在的核酸还包括至少一个核糖体结合位点(RBS)。
11.如权利要求10所述的非天然存在的核酸,其中所述第一启动子和/或所述第二启动子可通过乳糖和/或半乳糖诱导。
12.如权利要求10或11所述的非天然存在的核酸,其中所述非天然存在的核酸还包括至少一个终止子。
13.如权利要求10-12中任一项所述的非天然存在的核酸,其中:
a)所述RBS包括与SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:
13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:37、SEQID NO:38或SEQ ID NO:45至少90%一致的序列;和/或
b)所述终止子包括与SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20至少90%一致的序列。
14.如权利要求10-13中任一项所述的非天然存在的核酸,其中:
a)所述第一核酸包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:33或SEQ ID NO:34至少90%一致的序列;和/或
b)所述第二核酸包括与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:35或SEQ ID NO:36至少90%一致的序列。
15.如权利要求10-14中任一项所述的非天然存在的核酸,其中所述非天然存在的核酸包括与SEQ ID NO:21-28或SEQ ID NO:49-54中的任意一者至少90%一致的序列。
16.一种非天然存在的核酸,所述非天然存在的核酸包括与SEQ ID NO:21-28或SEQ IDNO:49-54中的任意一者至少90%一致的序列。
17.如权利要求1-16中任一项所述的非天然存在的核酸,其中所述非天然存在的核酸不编码融合蛋白。
18.一种宿主细胞,所述宿主细胞包括权利要求1-17中任一项所述的非天然存在的核酸。
19.如权利要求18所述的宿主细胞,其中所述非天然存在的核酸被整体或部分整合到所述宿主细胞的基因组中。
20.一种宿主细胞,所述宿主细胞包括一种或更多种非天然存在的核酸,所述非天然存在的核酸包括:
启动子,其中所述启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列,以及
编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列的核酸和/或编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列的核酸,
其中一种或更多种所述非天然存在的核酸还包括核糖体结合位点(RBS)。
21.如权利要求20所述的宿主细胞,其中所述启动子可通过乳糖和/或半乳糖诱导。
22.如权利要求21所述的宿主细胞,其中所述RBS包括与SEQ ID NO:10-17、SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:45中的一者至少90%一致的序列。
23.如权利要求19-22中任一项所述的宿主细胞,其中一种或更多种所述非天然存在的核酸还包括终止子。
24.如权利要求19-23中任一项所述的宿主细胞,其中一种或更多种所述非天然存在的核酸被整合到所述宿主细胞的基因组中。
25.如权利要求19-23中任一项所述的宿主细胞,其中一种或更多种所述非天然存在的核酸在质粒上表达。
26.如权利要求19-25中任一项所述的宿主细胞,其中所述宿主细胞是细菌细胞。
27.如权利要求26所述的宿主细胞,其中所述细菌细胞是E.coli细胞。
28.如权利要求19-27中任一项所述的宿主细胞,其中一种或更多种所述核酸序列编码SEQ ID NO:6或SEQ ID NO:29的氨基酸序列。
29.如权利要求19-27中任一项所述的宿主细胞,其中一种或更多种所述核酸序列编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。
30.如权利要求19-27中任一项所述的宿主细胞,其中一种或更多种所述核酸编码SEQID NO:6或SEQ ID NO:29的氨基酸序列并且还编码SEQ ID NO:7或SEQ ID NO:31的氨基酸序列。
31.一种宿主细胞,所述宿主细胞包括一种或更多种非天然存在的核酸,所述非天然存在的核酸包括:
a)第一启动子,其中所述第一启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;
b)第一核酸,其中所述第一核酸编码与SEQ ID NO:6或SEQ ID NO:29至少90%一致的氨基酸序列;
c)第二启动子,其中所述第二启动子包括与SEQ ID NO:8或SEQ ID NO:9至少90%一致的序列;以及
d)第二核酸,其中所述第二核酸编码与SEQ ID NO:7或SEQ ID NO:31至少90%一致的氨基酸序列,
其中(a)和(b)可操作地连接,并且其中(c)和(d)可操作地连接,并且其中一种或更多种所述非天然存在的核酸还包括至少一个核糖体结合位点(RBS)。
32.如权利要求31所述的宿主细胞,其中所述启动子可通过乳糖和/或半乳糖诱导。
33.如权利要求31或32所述的宿主细胞,其中一种或更多种所述非天然存在的核酸还包括至少一个终止子。
34.如权利要求32或33所述的宿主细胞,其中:
a)所述RBS包括与SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:
13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:37、SEQID NO:38或SEQ ID NO:45至少90%一致的序列;和/或
b)所述终止子包括与SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20至少90%一致的序列。
35.如权利要求31-34中任一项所述的宿主细胞,其中:
a)所述第一核酸包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:33或SEQ ID NO:34至少90%一致的序列;和/或
b)所述第二核酸包括与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:35或SEQ IDNO:36至少90%一致的序列。
36.如权利要求31-35中任一项所述的宿主细胞,其中一种或更多种所述非天然存在的核酸包括与SEQ ID NO:21-28或SEQ ID NO:49-54中的任意一者至少90%一致的序列。
37.如权利要求18-36中任一项所述的宿主细胞,其中所述宿主细胞能够比对照宿主细胞多产生至少1倍、2倍、3倍、4倍或5倍的牛痘病毒加帽酶,其中所述对照宿主细胞是野生型E.coli细胞。
38.如权利要求18-37中任一项所述的宿主细胞,其中所述宿主细胞能够产生至少50mg/L、100mg/L、150mg/L、200mg/L、250mg/L、300mg/L、350mg/L、400mg/L或450mg/L的牛痘病毒加帽酶。
39.如权利要求18-38中任一项所述的宿主细胞,其中所述非天然存在的核酸不编码融合蛋白。
40.一种产生牛痘病毒加帽酶的方法,所述方法包括培养权利要求18-39中任一项所述的宿主细胞。
41.如权利要求40所述的方法,其中所述方法还包括牛痘病毒加帽酶的纯化。
42.一种非天然存在的核酸,所述非天然存在的核酸包括:
(a)启动子,其中所述启动子是Ptac启动子或其功能性片段、或者P(T5)2xlacO启动子或其功能性片段;以及
(b)编码VCE的D1亚基或牛痘病毒加帽酶的D12亚基的核酸,
其中(a)和(b)可操作地连接,并且其中所述非天然存在的核酸还包括核糖体结合位点(RBS)。
43.如权利要求42所述的非天然存在的核酸,其中所述启动子可通过乳糖和/或半乳糖诱导。
44.如权利要求42或43所述的非天然存在的核酸,其中所述非天然存在的核酸不编码融合蛋白。
CN202280037047.8A 2021-03-29 2022-03-29 牛痘病毒加帽酶的产生 Pending CN117355609A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/167,249 2021-03-29
US202163188977P 2021-05-14 2021-05-14
US63/188,977 2021-05-14
PCT/US2022/022303 WO2022212342A1 (en) 2021-03-29 2022-03-29 Production of vaccinia capping enzyme

Publications (1)

Publication Number Publication Date
CN117355609A true CN117355609A (zh) 2024-01-05

Family

ID=89369663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280037047.8A Pending CN117355609A (zh) 2021-03-29 2022-03-29 牛痘病毒加帽酶的产生

Country Status (1)

Country Link
CN (1) CN117355609A (zh)

Similar Documents

Publication Publication Date Title
US20150218567A1 (en) Bacterial Mutants with Improved Transformation Efficiency
US20220348933A1 (en) Biosynthesis of enzymes for use in treatment of maple syrup urine disease (msud)
JP2022529690A (ja) メタノールの利用
Bäumchen et al. D‐mannitol production by resting state whole cell biotransformation of D‐fructose by heterologous mannitol and formate dehydrogenase gene expression in Bacillus megaterium
JP2019523271A (ja) N−アセチルホモセリン
US20240158451A1 (en) Biosynthesis of mogrosides
US20230065419A1 (en) Enhanced production of histidine, purine pathway metabolites, and plasmid dna
US20220378072A1 (en) Biosynthesis of mogrosides
WO2023173066A1 (en) Biosynthesis of abscisic acid and abscisic acid precursors
US20140296571A1 (en) Microorganisms And Methods For Producing Propionic Acid
US20160237442A1 (en) Modified group i methanotrophic bacteria and uses thereof
CN117355609A (zh) 牛痘病毒加帽酶的产生
KR20230162968A (ko) 백시니아 캡핑 효소의 제조
US20240182877A1 (en) Production of vaccinia capping enzyme
US20220372501A1 (en) Production of oligosaccharides
US20230174993A1 (en) Biosynthesis of mogrosides
KR102031886B1 (ko) 신규한 프로모터 및 이의 용도
WO2023097167A1 (en) Engineered sesquiterpene synthases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination