CN101223281A - 芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途 - Google Patents

芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途 Download PDF

Info

Publication number
CN101223281A
CN101223281A CN 200680026224 CN200680026224A CN101223281A CN 101223281 A CN101223281 A CN 101223281A CN 200680026224 CN200680026224 CN 200680026224 CN 200680026224 A CN200680026224 A CN 200680026224A CN 101223281 A CN101223281 A CN 101223281A
Authority
CN
China
Prior art keywords
microorganism
methionine
meti
carotenoid
dna sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200680026224
Other languages
English (en)
Inventor
O·策尔德尔
A·赫罗尔德
C·克洛普罗格
H·施罗德
R·R·约库姆
M·K·威廉姆斯
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN101223281A publication Critical patent/CN101223281A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • Y02E50/17
    • Y02E50/343

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及使用来自枯草芽孢杆菌的metI基因或metI相关基因产生甲硫氨酸和其它含硫精细化学品的改良的微生物和方法。在本发明的一些实施方案中,metI基因或另一基因以允许共同产生水溶性化合物如甲硫氨酸或其它氨基酸和类胡萝卜素化合物的方式被整合。

Description

芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途
相关申请
本申请要求在2005年7月18日提交的美国临时专利申请号60/700,557和2005年9月1日提交的美国临时专利申请号60/713,905的优先权,二者的名称均为“芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途”,二者各自的公开在本文引用作为参考。
另外,本申请涉及在2005年7月18日提交的美国临时专利申请号60/700,698和2005年9月1日提交的美国临时专利申请号60/713,907,二者的名称均为“二甲基二硫醚对于微生物中甲硫氨酸产量的用途”,二者各自的公开在本文引用作为参考。
本申请还涉及在2005年7月18日提交的美国临时专利申请号60/700,699和2005年9月1日提交的美国临时专利申请号60/714,042,二者的名称均为“产生甲硫氨酸的重组微生物”,二者各自的公开在本文引用作为参考。
背景技术
在细胞中,通过天然代谢过程发生含硫精细化学品的生物合成,例如甲硫氨酸、高半胱氨酸、S-腺苷甲硫氨酸、谷胱甘肽、辅酶A、辅酶M、mycothiol、半胱氨酸、生物素、硫胺素和硫辛酸。统称为“含硫精细化学品”的这些化合物包括有机酸、蛋白原性(proteinogenic)和非蛋白原性氨基酸、维生素和辅因子,并用于许多的工业分支中,包括食品、动物饲料、化妆品和制药工业。这些化合物可能通过培养微生物大规模地生产,所述微生物如细菌并且特别是棒状杆菌,已将它们开发用于生产和分泌大量所述期望的物质。
由于在广泛的工业中含硫精细化学品如甲硫氨酸的巨大重要性,需要改良精细化学品的生产方法。
发明概述
本发明涉及用于产生甲硫氨酸与其它精细含硫化学品的改良的微生物和方法(例如微生物生物合成,微生物发酵)。特别地,本发明人发现在例如芽孢杆菌中参与甲硫氨酸生物合成途径的某些有用的酶未受到甲硫氨酸反馈抑制。更具体地,在本文证明了当芽孢杆菌metI基因表达比正常水平高时,或组成性表达时,或被引入(通过例如转化)异源微生物时,使得甲硫氨酸产量增加。
因此,本发明另外涉及具有能够更有效产生甲硫氨酸的能力的重组微生物。这些微生物可以使用转硫途径或直接的硫化氢解途径,其中引入基因如芽孢杆菌metI基因产生增加水平的甲硫氨酸产量。在例示性的微生物中,通过引入甲硫氨酸反馈抗性酶,互补、增加或者避免了受到甲硫氨酸反馈抑制的内源酶,从而产生增加的甲硫氨酸产量。在本发明的某些实施方案中,使用具有较小的或消除的基于转硫作用的甲硫氨酸生物合成途径的微生物。这些微生物只可以通过直接的硫化氢解途径产生甲硫氨酸,因此特别适合于使用内源引入的芽孢杆菌metI来增加甲硫氨酸的产量。
在一些实施方案中,本发明涉及缺乏或具有受抑制的MetB或MetC的重组微生物,其中此类微生物对于MetI失调。在一些实施方案中,对MetI失调的重组微生物缺乏MetB或包括受抑制的MetB。
本公开所包括的在一些重组微生物的情形中的MetI是芽孢杆菌MetI,例如枯草芽孢杆菌(Bacillus subtilis)MetI。
在一些实施方案中,本发明的重组微生物属于棒杆菌(Corynebacterium),例如谷氨酸棒杆菌(corynebacterium glutamicum)。
MetI的失调可以通过本文描述的和本领域已知的一种或多种方法来实现。在一些实施方案中,MetI的失调通过过量表达metI基因来实现。
本发明同样包括有表达盒,例如MetI表达盒,其包含有效连接异源启动子以及任选的核糖体结合位点的metI基因。
在一些实施方案中,用在MetI盒中的启动子是P15启动子。
本发明同样包括有过量表达metI的载体。在一些实施方案中,如本文所述,载体包含MetI表达盒。
在一些实施方案中,本文描述的重组微生物包括MetI表达盒。在一些实施方案中,除了包括MetI表达盒外,微生物的MetB和MetC被抑制。
本发明另外涉及产生甲硫氨酸的方法,这是通过在产生甲硫氨酸的条件下,培养MetB或MetC被抑制或缺乏并且MetI被失调的微生物。分离甲硫氨酸的另外步骤也可以包括在产生甲硫氨酸的方法中。
在一些实施方案中,本文描述了在产生甲硫氨酸的微生物中增加甲硫氨酸产生能力的方法,其中此类方法包括在微生物中失调MetI,从而增加微生物的甲硫氨酸产生能力。
在一些实施方案中,描述了在表现出甲硫氨酸反馈抑制的微生物中增加甲硫氨酸产生能力的方法,其中此类方法包括失调MetI以减轻甲硫氨酸反馈抑制,从而增加微生物的甲硫氨酸产生能力。
在一些实施方案中,与对照微生物相比,甲硫氨酸产生能力至少增加了20%。
在再一个实施方案中,与对照微生物相比,甲硫氨酸产生能力至少增加了30%。
另外,在一些实施方案中,与对照微生物相比,甲硫氨酸产生能力至少增加了40%。
同样还包括重组微生物,其具有增加的甲硫氨酸产生能力,但是不包括失调的MetI。
在另一实施方案中,在微生物中安装异源metI是以这样的方式进行,即所述方式使得改造的微生物产生作为副产品的第二种有用的化合物,例如类胡萝卜素化合物,如番茄红素或变胞藻黄素,从而这两种有用的化合物可以共产生。在另一个实施方案中,改造生物以共产生第一种化合物如氨基酸(例如包括但不限于甲硫氨酸、赖氨酸、谷氨酸、苏氨酸、异亮氨酸、苯丙氨酸、酪氨酸、色氨酸、丙氨酸、半胱氨酸、亮氨酸、高丝氨酸、高半胱氨酸等)或其它有商业重要性的非类胡萝卜素化合物(例如包括但不限于甲烷、氢、乳酸、1,2-丙二醇、1,3-丙二醇、乙醇、甲醇、丙醇、丙酮、丁醇、乙酸、丙酸、柠檬酸、衣康酸、葡糖胺、甘油、糖类、维生素、治疗剂、研究与工业用酶、治疗、研究与工业用蛋白质,以及任意上述列出的化合物的多种盐),以及第二种化合物,其包括有商业重要性的的类胡萝卜素化合物(例如,包括但不限于番茄红素、变胞藻黄素、β-胡萝卜素、叶黄素、玉米黄质、角黄素、decaprenoxanthin和胭脂树橙)。在优选的实施方案中,第一化合物作为气体分离或者被分泌到培养基中,而第二类胡萝卜素化合物仍然保持在细胞量中。
本发明另外涉及改良的遗传工程技术,即促进核酸序列转移进靶标微生物的载体构建体。本文的改良的方法和材料的一方面是能够转化细胞、并且因此引起所需核酸序列的表达的新的重组表达载体。优选地,这些核酸序列包含促进或改良靶标微生物的生物合成途径从而实现、改善或增加所需物质产量的基因。此类基因可以编码参与例如含硫精细化学品如甲硫氨酸的生物合成的酶或蛋白质。在本发明优选的实施方案中,酶是o-乙酰高丝氨酸硫化氢解酶、o-琥珀酰高丝氨酸硫化氢解酶或参与甲硫氨酸生物合成产生的类似酶。
在本发明的某些实施方案中,重组表达载体包括整合盒。重组表达盒可用于将核酸序列整合到靶标生物的特异、所需基因组区域。在本发明的某些实施方案中,包含整合盒的重组表达载体被设计为使得整合盒破坏了特异性基因序列并且插入了异源核酸序列。这些异源序列可以编码所需的蛋白质或酶(例如甲硫氨酸生物合成酶)。
在本文同样包含了用于有效筛选包含所需性状的重组生物的改良方法和材料。在某些实施方案中,筛选是比色筛选。在优选的实施方案中,比色筛选通过改变类胡萝卜素化合物产量水平来实现,所述类胡萝卜素为靶细胞中的例如番茄红素、变胞藻黄素、β-胡萝卜素、叶黄素、玉米黄质、角黄素、decaprenoxanthin和胭脂树橙,等等。因此,本发明提供了用于修饰类胡萝卜素生物合成操纵子从而产生基因工程化的转化体的材料和方法,所述转化体是基于与类胡萝卜素产量相关的表型改变(例如颜色改变)来选择的。
本发明还涉及新的表达载体,其被设计用来将核酸序列引入到微生物中,所述核酸序列任选地包含基因序列。
根据上述方法产生的组合物特征也为在所述方法中利用的微生物。
附图描述
图1提供了在本发明的微生物中利用的甲硫氨酸生物合成途径的图解。
图2是来自实施例2的实验数据的图示,显示了谷氨酸棒杆菌MetY和枯草芽孢杆菌(B.subtilis)MetI对甲硫氨酸抑制的相对敏感性。
图3是用于整合包含metI基因的盒的pOM284质粒的图示。
图4是在谷氨酸棒杆菌中存在的类胡萝卜素生物合成操纵子的图示。
图5是用于整合包含metI基因的盒的pOM246质粒的图示。
图6是谷氨酸棒杆菌的类胡萝卜素生物合成途径的图示。
图7A-C描述了SEQ ID NO:2中给出的枯草芽孢杆菌MetI氨基酸序列对在NCBI’s
Figure A20068002622400111
数据库中发现的50个最接近序列的多序列比对(MSA)。SEQ ID NO:26-75对应于下列的氨基酸序列:枯草芽孢杆菌推定的蛋白(hypothetical protein)(
Figure A20068002622400112
登录号NP_389069.1)(SEQID NO:26)、地衣芽孢杆菌(Bacillus licheniformis)Cys/Met代谢吡哆权磷酸依赖酶(登录号AAU22849.1)(SEQ ID NO:27)、地衣芽孢杆菌克隆ATCC 14580(
Figure A20068002622400114
登录号YP_090888.1)(SEQ ID NO:28)Geobacillus kaustophilus胱硫醚γ-合酶(
Figure A20068002622400115
登录号YP_146719.1)(SEQ ID NO:29)、Bacillus halodurans胱硫醚γ-合酶(登录号BAB05346.1)(SEQ ID NO:30)、蜡状芽孢杆菌(Bacillus cereus)胱硫醚β-裂合酶(
Figure A20068002622400117
登录号YP_085587.1)(SEQ ID NO:31)、蜡状芽孢杆菌胱硫醚γ-合酶(
Figure A20068002622400118
登录号ZP_00238525.1)(SEQ IDNO:32)、苏云金芽孢杆菌(Bacillus thuringiensis)胱硫醚β-裂合酶(登录号YP_038316.1)(SEQ ID NO:33)、炭疽芽孢杆菌(Bacillus anthracis)胱硫醚β-裂合酶(
Figure A20068002622400122
登录号YP_021123.1)(SEQ ID NO:34)、蜡状芽孢杆菌胱硫醚β-裂合酶ATCC 10987(
Figure A20068002622400123
登录号NP_980629.1)(SEQ ID NO:35)、蜡状芽孢杆菌胱硫醚γ-合酶ATCC 14579(
Figure A20068002622400124
登录号NP_833967.1)(SEQ IDNO:36)、多杀巴斯德氏菌(Pasteurella mitocida)亚种(
Figure A20068002622400125
登录号NP_245932.1)(SEQ ID NO:37)、睡眠嗜血杆菌(Hemophilussomnus)COGO626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A20068002622400126
登录号ZP_00132603.1)(SEQ ID NO:38)、Manheimia succiniciproducens MetC蛋白质(登录号YP_088819.1)(SEQ ID NO:39)、睡眠嗜血杆菌OGO626胱硫醚β裂合酶/胱硫醚γ-合酶(
Figure A20068002622400128
登录号ZP_00122714.1)(SEQ ID NO:40)、流感嗜血杆菌(Hemophilus influenzae)胱硫醚γ-合酶(
Figure A20068002622400129
登录号NP_438259.1)(SEQ ID NO:41)、胱硫醚γ合酶(
Figure A200680026224001210
登录号P44502)(SEQ ID NO:42)、流感嗜血杆菌COGO626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A200680026224001211
登录号ZP_00322320.1)(SEQ ID NO:43)、流感嗜血杆菌COGO626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A200680026224001212
登录号ZP_00157594.2)(SEQ IDNO:44)、流感嗜血杆菌COGO626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A200680026224001213
登录号ZP_00154815.2)(SEQ ID NO:45)、克劳氏芽孢杆菌(Bacillus clausii)胱硫醚γ-合酶(
Figure A200680026224001214
登录号YP_175363.1)(SEQID NO:46)、胸膜肺炎放线杆菌(Actinobacilluspleuropneumoniae)COGO626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A200680026224001215
登录号ZP_00134030.2)(SEQ ID NO:47)、单核细胞增生利斯特氏(Listeria monocytogenes)胱硫醚β/γ-裂合酶(
Figure A200680026224001216
登录号YP_014300.1)(SEQ ID NO:48)、单核细胞增生利斯特氏菌胱硫醚β-裂合酶/胱硫醚γ-合酶(登录号ZP_00234337.1)(SEQ ID NO:49)、单核细胞增生利斯特氏菌推定的蛋白1mo1680(
Figure A200680026224001218
登录号NP_465205.1)(SEQ ID NO:50)、无害利斯特氏菌(Listeria innocua)推定的蛋白lin1788(登录号NP_471124.1)(SEQ ID NO:51)、丙酮丁醇梭菌(Clostridium acetobutylicum)胱硫醚γ-合酶(
Figure A20068002622400132
登录号NP_347010.1)(SEQ ID NO:52)、Symbiobacterium thermophilium胱硫醚γ-合酶(
Figure A20068002622400133
登录号YP_076192.1)(SEQ ID NO:53)、植物乳杆菌(Lactobacillus plantarum)O-琥珀酰高丝氨酸(硫羟)-裂合酶(登录号NP_786043.1)(SEQ ID NO:54)、表皮葡萄球菌(Staphylococcus epidermis)转硫酶家族蛋白质(
Figure A20068002622400135
登录号YP_187637.1)(SEQ ID NO:55)、表皮葡萄球菌ATCC 12228(登录号NP_765934.1)(SEQ ID NO:56)、热纤梭菌(Clostridiumthermocellum)COGO0626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A20068002622400137
登录号ZP_00313823.1)(SEQ ID NO:57)、热醋穆尔氏菌(Moorellathermoacetica)COGO0626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A20068002622400138
登录号ZP_0030849.1)(SEQ ID NO:58)、嗜热链球菌(Streptococcusthermophilus)胱硫醚γ-合酶(
Figure A20068002622400139
登录号YP_140770.1)(SEQ IDNO:59)、肺炎链球菌(Streptococcus pneumoniae)胱硫醚γ-合酶(
Figure A200680026224001310
登录号NP_358970.1)(SEQ ID NO:60)、Geobactersulfurreducens胱硫醚β-裂合酶(
Figure A200680026224001311
登录号NP_951998.1)(SEQ ID NO:61)、Geobacter metallireducens COGO0626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A200680026224001312
登录号ZP_00298719.1)(SEQ ID NO:62)、肺炎链球菌转硫酶家族蛋白质(登录号NP_345975.1)(SEQ ID NO:63)、咽峡炎链球菌(Streptococcus anginosus)胱硫醚γ-合酶(
Figure A200680026224001314
登录号BAC41490.1)(SEQ ID NO:64)、变异链球菌(Streptacoccus mutans)推定的胱硫醚γ-合酶(
Figure A200680026224001315
登录号AAN59314.1)(SEQ ID NO:65)、地衣芽孢杆菌胱硫醚γ-裂合酶(
Figure A200680026224001316
登录号AAU24359.1)(SEQ ID NO:66)、乳乳球菌(Lactococcus lactis)胱硫醚γ-合酶(
Figure A200680026224001317
登录号NP_268074.1)(SEQ ID NO:67)、金黄色葡萄球菌(Staphylococcus aureus)Cys/Met代谢PLP-依赖酶(
Figure A200680026224001318
登录号CAG42106.1)(SEQ ID NO:68)、金黄色葡萄球菌转硫酶家族蛋白质(登录号YP_185322.1)(SEQID NO:69)、金黄色葡萄球菌Cys/met代谢PLP-依赖酶(
Figure A20068002622400142
登录号CAG39379.1)(SEQ ID NO:70)、Helicobacter hepaticus胱硫醚γ-合酶(
Figure A20068002622400143
登录号AAP76659.1)(SEQ ID NO:71)、屎肠球菌(Enterococcus faecium)COGO0626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A20068002622400144
登录号ZP_00285445.1)(SEQ ID NO:72)、多变鱼腥藻(Anabaena variabilis)COGO0626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A20068002622400145
登录号ZP_00351535.1)(SEQ ID NO:73)、猪链球菌(Streptococcus suis)COGO0626胱硫醚β-裂合酶/胱硫醚γ-合酶(
Figure A20068002622400146
登录号ZP_00332320.1)(SEQ ID NO:74),和乳乳球菌胱硫醚γ合酶(
Figure A20068002622400147
登录号NP_266937.1)(SEQ ID NO:75)。比对使用ClustalW MSA软件在京都大学化学研究所(the Institute for ChemicalResearch,Kyoto University)的GenomeNet CLUSTALW服务器上生成。使用下列参数:成对比对,K-tuple(字)大小=1,窗口大小=5,空位罚分=3,顶部对角线的数量=5,评分方法=百分比;多重比对,空位开放罚分=10,空位延伸罚分=0.0,权重过渡=无,亲水残基=Gly、Pro、Ser、Asn、Asp、Gln、Glu、Arg和Lys,疏水空位=是;以及评分矩阵=BLOSUM。
发明详述
本发明至少部分是基于下述发现:某些参与甲硫氨酸生物合成的芽孢杆菌基因/酶不受到甲硫氨酸反馈抑制。当用在异源微生物中时,这些基因增强内源甲硫氨酸生物合成途径,从而提供能够增加甲硫氨酸输出的重组微生物。
在微生物的甲硫氨酸合成中存在两种候选途径用来将硫原子添加到前体底物(见图1)。例如,大肠杆菌使用转硫途径,而其它微生物如酿酒酵母(Saccharomyces cerevisiae)和谷氨酸棒杆菌另外发展了直接的硫化氢解途径。尽管许多微生物使用转硫或直接的硫化氢解,但是不是二者都用。谷氨酸棒杆菌使用两种途径用于合成甲硫氨酸。
转硫和直接的硫化氢解途径都开始于O-乙酰-高丝氨酸或O-琥珀酰-高丝氨酸,并且产生了中间体高半胱氨酸——甲硫氨酸的前体。在转硫途径中,半胱氨酸是硫供体,用于形成胱硫醚,这一反应由酶MetB(胱硫醚-γ-合酶)催化。胱硫醚随后在MetC(胱硫醚-β-裂合酶)催化的反应中被切割成高半胱氨酸和丙酮酸。在使用O-乙酰-高丝氨酸的直接的硫化氢解途径中,MetY(O-乙酰高丝氨酸硫化氢解酶)催化直接将硫添加到O-乙酰-高丝氨酸上以形成高半胱氨酸。直接来自O-琥珀酰-高丝氨酸的高半胱氨酸的产生类似地是通过MetZ(O-琥珀酰-高丝氨酸-硫化氢解酶)来实现的。在一些现有技术中,术语MetY和MetZ可互换使用,部分是因为已知MetY除了对其正常底物O-乙酰-高丝氨酸外,对O-琥珀酰-高丝氨酸也有活性。(Hwang等人,(2002)J.Bacteriol.184:1277-1286)。
本发明人进行的许多实验表明,在改造来促进直接的硫化氢解途径(用受抑制的metB)的棒杆菌,例如相关的M2014和OM99(McbR+)菌株背景中,在甲硫氨酸生物合成中MetY活性是限速步骤。具体地,在包含复制质粒H357的菌株(其表达metA(有时也称作metX)和metY)中O-乙酰-高丝氨酸(为MetY的一种底物)积累相对高的水平。另外,从酶测定中了解到MetY对于甲硫氨酸的反馈抑制敏感。最近的文献(Auger等人,2002Microbiology 148:507-518)表征了枯草芽孢杆菌基因metI,其编码O-乙酰-高丝氨酸硫化氢解酶,该酶执行与谷氨酸棒杆菌MetY相同的功能。令人感兴趣地,MetY酶还具有重要的MetB样活性,胱硫醚-γ-合酶(见表1)。另外,枯草芽孢杆菌基因组除了MetI外不包含MetB同源物。因此假定MetI在其天然宿主中行使MetY和MetB的功能。这一假设是由以下事实所支持的:枯草芽孢杆菌metI互补了大肠杆菌metB-营养缺陷型。在大多数(如果不是所有的话)目前研究的其它微生物中,MetY样活性受到甲硫氨酸的反馈抑制,而MetB活性则不受到抑制。因此,可以推断芽孢杆菌MetI演化成对甲硫氨酸抑制有抗性,从而在MetB样途径中有效行使功能。
表1.MetZ、MetB和MetI的所报道的比活性。
Figure A20068002622400161
本发明提供了已经基因工程化为表达异源甲硫氨酸生物合成酶的重组微生物。
另外,本发明提供了用于将异源核酸序列插入到(例如)棒杆菌的类胡萝卜素操纵子的重组表达载体。这些重组载体另外包含整合盒,其靶向于类胡萝卜素操纵子的特异性核酸序列,例如编码蛋白质或表达调节序列。另外,这些载体和整合盒可以用来修饰操纵子,从而在靶标生物中产生类胡萝卜素,使得表型改变,例如生物的色素改变和产生的一种或多种类胡萝卜素改变。这使得所需类胡萝卜素与所需氨基酸(例如甲硫氨酸、赖氨酸、谷氨酸、苏氨酸、异亮氨酸、苯丙氨酸、酪氨酸、色氨酸、丙氨酸、亮氨酸、半胱氨酸等)一起共产生。
为了使本发明更容易被理解,首先在本文定义了一些术语。
短语“生物合成途径”或“生物合成过程”在本文使用,意指作为一种或多种生物化学反应结果来产生目的分子或化合物的体内或体外过程。通常,从前体分子开始,原型生物合成过程包括一种或多种酶以逐步方式作用,以产生目的分子或化合物。终产物通常是含碳的分子。目的分子或化合物包含例如小有机分子、氨基酸、肽、细胞辅因子、维生素、核苷酸和类似的化学实体。目的分子或化合物另外包含含硫化学品,如甲硫氨酸、高半胱氨酸、S-腺苷甲硫氨酸、谷胱甘肽、半胱氨酸、生物素、硫胺素、mycothiol、辅酶A、辅酶M和硫辛酸。在某些环境中,在生物合成途径中作用的一种或多种酶受到在所述过程中产生的化学产物的调节。在此种情形中,说存在反馈环,其中增加的终产物或中间产物的浓度会改变途径中酶的水平、功能或活性。例如,生物合成途径的最终产物可以作用为下调该生物合成过程中酶的活性,并且因此降低所需终产物产生的速度。例如,在用于工业中产生目的分子或化合物的大规模发酵过程中,这种情况通常是不希望的。本发明的方法和材料涉及,至少是部分的涉及目的化合物的改良的工业规模发酵生产。反馈环的典型实例发生在下文所述的生产甲硫氨酸中。
术语“甲硫氨酸生物合成途径”包括这样的生物合成途径,其涉及甲硫氨酸生物合成酶(例如由编码生物合成酶的基因所编码的多肽)、化合物(例如前体、底物、中间体或产品)、辅因子以及在甲硫氨酸形成或生物合成中所用的那些。术语“甲硫氨酸生物合成途径”包括引导甲硫氨酸在微生物(例如在体内)合成的生物合成途径以及引导甲硫氨酸在体外合成的生物合成途径。图1描绘了甲硫氨酸生物合成途径的图示。如在图1中所示的,从草酰乙酸(OAA)合成甲硫氨酸是通过中间体、天冬氨酸、天冬氨酸(天冬氨酰)磷酸和天冬氨酸半醛来进行的。天冬氨酸半醛通过高丝氨酸脱氢酶(hom基因的产物,hom在其它生物中也已知为thrA、metL、hdh、hsd等其它名称)被转化成高丝氨酸。甲硫氨酸合成中的随后步骤也通过转硫途径和/或直接的硫化氢解途径来进行。
术语“甲硫氨酸生物合成酶”包括在甲硫氨酸生物合成途径的化合物(例如中间体或产物)形成中使用的任何酶。“甲硫氨酸生物合成酶”包括参与例如“转硫途径”和参与“直接的硫化氢解途径”(甲硫氨酸合成的备选途径)的酶。例如,大肠杆菌利用转硫途径,而其它微生物如酿酒酵母已经发展了直接的硫化氢解途径。
“甲硫氨酸生物合成酶”包括在促进产生甲硫氨酸的微生物中通常发现的所有酶。它们包括这样的酶,所述酶参与例如转硫途径,其中高半胱氨酸从半胱氨酸和O-乙酰-高丝氨酸或者半胱氨酸和O-琥珀酰-高丝氨酸形成。在转硫途径中,高丝氨酸通过高丝氨酸乙酰转移酶(metX基因的产物)和添加乙酰辅酶A转化成O-乙酰-高丝氨酸,或者通过添加琥珀酰辅酶A和metA基因的产物(高丝氨酸琥珀酰转移酶)转化成O-琥珀酰-高丝氨酸。通过胱硫醚-γ-合酶(metB基因的产物)将硫基团从半胱氨酸供给O-乙酰-高丝氨酸或O-琥珀酰-高丝氨酸,产生了胱硫醚。然后通过胱硫醚β-裂合酶(metC基因(在一些生物中也称作aecD基因)的产物)将胱硫醚转化成高半胱氨酸。甲硫氨酸生物合成酶也包括在直接的硫化氢解途径中的酶,在所述途径中具有O-乙酰-高丝氨酸-硫化氢解酶(例如棒杆菌的metY基因——有时也称作metZ基因)活性的酶在单一步骤过程中使用硫化物作为硫原子的来源将O-乙酰-高丝氨酸转化成高半胱氨酸。高半胱氨酸也可以在直接的硫化氢解途径中通过O-琥珀酰高丝氨酸硫化氢解酶(metZ基因的产物)通过直接添加硫化物到O-琥珀酰-高丝氨酸中来形成。
不管使用何种途径,转硫途径或直接的硫化氢解途径,随后通过维生素B12依赖性甲硫氨酸合酶(metH基因的产物)或维生素B12独立性甲硫氨酸合酶(metE基因的产物)添加甲基基团,来从高半胱氨酸产生甲硫氨酸。
本发明部分涉及参与在革兰氏阳性菌(如芽孢杆菌属和棒杆菌属所体现的)中的甲硫氨酸产生(甲硫氨酸生物合成酶)的酶。在微生物中存在的例示性甲硫氨酸生物合成酶在图1中提供。这些酶包括例如天冬氨酸激酶、天冬氨酸半醛脱氢酶、高丝氨酸脱氢酶、高丝氨酸乙酰转移酶(例如在枯草芽孢杆菌和谷氨酸棒杆菌中存在)、高丝氨酸琥珀酰转移酶(例如存在于大肠杆菌中)、O-乙酰-高丝氨酸硫化氢解酶、O-琥珀酰-高丝氨酸硫化氢解酶、胱硫醚γ-合酶、胱硫醚β-裂合酶、亚甲基四氢叶酸还原酶、维生素B12依赖性甲硫氨酸合酶和不依赖于钴胺素的甲硫氨酸合酶。
如本文所描述的,“MetI”酶具有:(1)O-乙酰-高丝氨酸硫化氢解酶活性(也称作O-乙酰高丝氨酸硫化氢解酶(sulfhydrolase);O-乙酰-高丝氨酸硫解酶)和胱硫醚-γ-合酶二者的活性,以及任选的还具有作为O-琥珀酰-高丝氨酸硫化氢解酶(也已知为O-琥珀酰-高丝氨酸硫化氢解酶、O-琥珀酰-高丝氨酸硫解酶)和胱硫醚-γ-合酶的活性;(2)与在SEQ ID NO:2中给出的枯草芽孢杆菌MetI氨基酸序列具有至少约65%的序列同一性,所述枯草芽孢杆菌包含:实质上对甲硫氨酸抑制有抗性的O-乙酰-高丝氨酸硫化氢解酶或O-琥珀酰-高丝氨酸硫化氢解酶。
术语“被操作的微生物”包括这样的微生物,其已经被工程化(例如基因工程化)或修饰,从而所述微生物具有至少一种甲硫氨酸生物合成途径的酶,所述酶已经在量或结构上被修饰从而使得甲硫氨酸产量增加。此类微生物的修饰或工程化可以根据本文描述的任何方法,包括但不限于失调生物合成途径和/或过量表达至少一种生物合成酶。“被操作的”酶(例如“被操作的”生物合成酶)包括这样的酶,即例如与相应的野生型或天然存在的酶相比,其表达、产生或活性已经被改变或修饰,从而改变或修饰了该酶的至少一种上游或下游前体、底物或产物(例如改变或修饰的前体、底物和/或产物的水平、比例等)。“被操作的酶”还包括对例如一种或多种产物或中间体的反馈抑制的抗性增强的一种酶。例如,能够在例如甲硫氨酸存在时酶促有效作用的酶。
在一些实施方案中,本发明所包括的基因来自芽孢杆菌,术语“来自芽孢杆菌”或“芽孢杆菌来源的”包括在芽孢杆菌属中天然发现的基因。在一些实施方案中,本发明的基因来自选自下列的微生物:枯草芽孢杆菌、缓病芽孢杆菌(Bacillus lentimorbus)、迟缓芽孢杆菌(Bacillus lentus)、坚强芽孢杆菌(Bacillus firmus)、泛酸芽孢杆菌(Bacillus pantothenticus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、蜡状芽孢杆菌、环状芽孢杆菌(Bacilluscirculans)、凝结芽孢杆菌(Bacillus coagulans)、地衣芽孢杆菌、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、苏云金芽孢杆菌、炭疽芽孢杆菌、Bacillus halodurans,以及其它组1的芽孢杆菌种,例如由16S rRNA类型所表征的。而在另一些实施方案中,基因来自短芽孢杆菌(Bacillus brevis)或者嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)。在一些实施方案中,本发明的基因来自选自下列的微生物:地衣芽孢杆菌、解淀粉芽孢杆菌、枯草芽孢杆菌和短小芽孢杆菌。在一些实施方案中,基因来自枯草芽孢杆菌(即为枯草芽孢杆菌来源的)。术语“来自枯草芽孢杆菌”和“枯草芽孢杆菌来源的”在本文互换使用,包括在微生物枯草芽孢杆菌中天然发现的基因。包括在本发明范围内的为芽孢杆菌来源的基因(例如枯草芽孢杆菌来源的基因),例如芽孢杆菌或枯草芽孢杆菌metI基因。
如本文用到的,术语“基因”包括核酸分子(例如DNA分子或其区段),其在生物中可以通过基因间DNA(即天然与生物的染色体DNA中的基因侧翼相接和/或分开所述基因的间插或间隔DNA)与一个或多个其它基因分开。备选地,基因可以与另一基因稍微重叠(例如第一个基因的3’端与第二个基因的5’端重叠),重叠基因通过基因间DNA与其它基因分开。基因可以指导酶或其它蛋白质分子的合成(例如可以包含编码序列,例如编码蛋白质的邻近可读框(ORF))或可以自身在生物中有功能。生物中的基因可以在操纵子中聚簇,如本文定义的,所述操纵子与其它基因和/或操纵子通过基因间DNA分开。如本文用到的,“分离的基因”包括基本上没有下述序列的基因并且可任选地包括5’和3’调节序列(例如启动子序列和/或终止子序列),所述序列与所述基因所来源的生物的染色体DNA中的基因天然侧翼相接(即没有编码第二种或不同蛋白质的邻近编码序列、邻近结构序列等)。在一个实施方案中,分离的基因主要包括蛋白质的编码序列(例如编码芽孢杆菌蛋白质的序列)。在另一个实施方案中,分离的基因包括蛋白质(例如芽孢杆菌蛋白质)的编码序列,以及邻近的5’和/或3’调节序列,所述调节序列来自所述基因所来源生物的染色体DNA(例如邻近5’和/或3’芽孢杆菌调节序列)。优选地,分离的基因包含少于约10kb、5kb、2kb、1kb、0.5kb、0.2kb、0.1kb、50bp、25bp或10bp的核苷酸序列,其与基因所来源生物的染色体DNA中的该基因天然侧翼相接。
术语“操纵子”包括至少两个邻近基因或ORF,它们任选的在至少一个基因或ORF的5’或3’端在序列上重叠。术语“操纵子”包括基因表达的协同单元,其包含启动子以及可能地与一个或多个邻近基因或ORF(例如编码酶、例如生物合成酶的结构基因)相关的调节元件。基因的表达可以被协同调节,例如通过结合在调节元件的调节蛋白或通过转录的抗终止。操纵子的基因(例如结构基因)可以被转录以给出编码所有蛋白质的单一mRNA。
本发明的多方面在下列分部中进一步详细描述。
I.用于在异源微生物中增加甲硫氨酸产量的方法和微生物
谷氨酸棒杆菌具有两种甲硫氨酸合成途径:直接的硫化氢解途径和转硫途径(见图1)。所述途径使用O-乙酰-高丝氨酸并且产生高半胱氨酸——甲硫氨酸的前体。在转硫途径中,在半胱氨酸存在时通过MetB将O-乙酰-高丝氨酸转变成胱硫醚。胱硫醚随后在由MetC催化的反应中被切割成高半胱氨酸和丙酮酸。在直接的硫化氢解途径中,MetY催化将硫化物直接添加到O-乙酰-高丝氨酸以形成高半胱氨酸。如上所描述的,认为MetY活性是使用直接硫化氢解途径的微生物中的限速步骤。表II描述了在甲硫氨酸生物合成途径中的多种酶。
表II:在甲硫氨酸生物合成途径中的酶和编码它们的基因
  酶   基因
  天冬氨酸激酶   ask
  高丝氨酸脱氢酶   hom
  高丝氨酸乙酰转移酶   metX
  高丝氨酸琥珀酰转移酶   metA
  胱硫醚γ-合成酶   metB
  胱硫醚β-裂合酶   metC
  O-乙酰高丝氨酸硫化氢解酶   metY
  O-琥珀酰高丝氨酸硫化氢解酶   metZ
  维生素B12-依赖性甲硫氨酸合酶   metH
  维生素B12独立性甲硫氨酸合酶   metE
  N5,10-亚甲基-四氢叶酸还原酶   metF
  S-腺苷甲硫氨酸合酶   metK
本发明描述了微生物的修饰,例如通过使用基因工程化,从而修饰的微生物能够增加甲硫氨酸产量。更具体地,在一些实施方案中,基因工程化方法包括引入编码酶的一种或多种异源基因,所述酶在内源生物合成途径中行使功能,从而使得甲硫氨酸产量改变或增加。优选地,所述酶对甲硫氨酸反馈抑制有抗性。短语“对甲硫氨酸反馈抑制有抗性”,如本文所述,是指这样的酶,其能够在甲硫氨酸存在时以显著活性发挥酶促功能。对甲硫氨酸反馈抑制有抗性的酶可以在例如1-10μM、10-100μM或100μM-1mM甲硫氨酸存在时显著行使功能。在本发明的一些实施方案中,目的酶能够在1-10mM、10-100mM的浓度或甚至更高的甲硫氨酸浓度下行使功能。本发明特别包括甲硫氨酸反馈抑制性酶,其参与产生甲硫氨酸的生物合成途径或过程。
本发明描述了从微生物中产生增加水平的甲硫氨酸的方法。如本文用到的,短语“甲硫氨酸产量的增加水平”是指比未修饰微生物或其它适当的对照微生物所产生的高(例如高5%、高10%、高15%、高20%、高30%、高40%或更高)的甲硫氨酸的量或水平。在例示性的实施方案中,甲硫氨酸产量的水平比未修饰微生物或其它适当对照微生物所产生的高至少50%、60%或70%。在其他实施方案中,产量水平比未修饰微生物或其它适当对照微生物所产生的高至少约100%(即高2倍、3倍、4倍、5倍、或甚至10倍或更多)。本发明也意图包括本文所包括的值和范围和/或本文所述值的中间值。在例示性的实施方案中,甲硫氨酸产量增加的水平也意图包括高于基本水平的所产生的量,所述基本水平是通过未被基因工程化以表达异源甲硫氨酸抗性生物合成酶的微生物所建立的。
因此,本发明提供了产生甲硫氨酸的方法,其包括培养“产生甲硫氨酸的微生物”。“产生甲硫氨酸的微生物”是能够产生甲硫氨酸的任何微生物,例如细菌、真菌、古细菌等等。在一个实施方案中,产生甲硫氨酸的微生物属于棒杆菌属或短杆菌属(Brevibacterium)。在另一个实施方案中,产生甲硫氨酸的微生物为谷氨酸棒杆菌。在再一个实施方案中,产生甲硫氨酸的微生物选自大肠杆菌或相关的肠细菌、枯草芽孢杆菌或相关的芽孢杆菌属、酿酒酵母或相关的酵母菌株。
本发明至少部分是基于这样的发现,即可以基因工程化某些谷氨酸棒杆菌菌株来表达对甲硫氨酸反馈抑制有抗性的酶,绕过和/或补充内源甲硫氨酸反馈敏感的酶,例如metY和/或metZ的产物。引入微生物的异源基因包括例如MetI,所述MetI酶具有体外O-乙酰-高丝氨酸硫化氢解酶活性和胱硫醚-γ合酶活性,或具有O-琥珀酰高丝氨酸硫化氢解酶活性和胱硫醚-γ合酶活性,其中O-乙酰高丝氨酸硫化氢解酶或O-琥珀酰高丝氨酸硫化氢解酶活性抗甲硫氨酸反馈抑制。
II重组微生物
本发明描述了用于产生精细化学品的微生物。在一个实施方案中,本发明的微生物是革兰氏阳性生物(例如这样的微生物,其由于在微生物周围存在革兰氏阳性壁而保留碱性染料,例如结晶紫)。在一些实施方案中,微生物是属于下列属的微生物,所述属选自芽孢杆菌属、短杆菌属、棒杆菌属、乳杆菌属(Lactobacillus)、乳球菌属(Lactococci)和链霉菌属(Streptomyces)。另外,在一些实施方案中,微生物选自谷氨酸棒杆菌、Corynebacterium efficiens、百合棒杆菌(Corynebacterium lilium)、白喉棒杆菌(Corynebacterium diphtheriae)、假结核棒杆菌(Corynebacteriumpseudotuberculosis)和化脓棒杆菌(Corynebacterium pyogenes)。
本发明例示性的方面描述了重组微生物,特别是包括如本文描述的载体或基因(例如野生型和/或突变的基因)的重组微生物。如本文用到的,术语“重组微生物”包括这样的微生物(例如细菌、酵母细胞、真菌细胞等),其已经被遗传改变、修饰或工程化(例如基因工程化),从而与其所来源的天然存在的微生物相比,其表现出改变的、修饰的或不同的基因型和/或表型(例如当遗传修饰影响微生物的编码核酸序列时)。本文描述的遗传改变可以例如通过体外操作DNA序列或通过接合、转导、转化等经典遗传方法来实现。
在一些实施方案中,微生物为革兰氏阴性(排阻碱性染料)的生物。在其他实施方案中,微生物为属于下列属的微生物,所述属选自沙门氏菌属(Salmonella)、埃希氏菌属(Escherichia)、克雷伯氏菌属(Klebsiella)沙雷氏菌属(Serratia)和变性菌属(Proteus)。而在其他实施方案中,微生物属于埃希氏菌属,例如大肠杆菌。在一些实施方案中,微生物属于酵母属(例如酿酒酵母)。
在某些实施方案中,修饰或工程化的重组微生物使得表达或过量表达至少一种非天然甲硫氨酸生物合成酶。术语“被过量表达的”和“过量表达”包括组成型表达基因产物(例如生物合成酶),或者以这样的水平表达,所述水平比微生物修饰或改造前或在未受到操作的相当的微生物中所表达的水平高。在一些实施方案中,微生物可以被遗传设计或改造为过量表达一定水平的基因产物,所述水平比在未被改造的相当的微生物中所表达的水平要高。
在一些实施方案中,可以物理或环境地操作微生物以过量表达一定水平的基因产物,所述水平比在微生物操作前或在未受到操作的相当的微生物中所表达的水平要高。例如,可以用已知或怀疑会增加特定基因的转录和/或特定基因产物的翻译的物质处理微生物,或在所述物质的存在下培养微生物,从而增强或增加转录和/或翻译。可选地,微生物可以在选择用来增加特定基因转录和/或特定基因产物翻译的温度下培养,从而增强或增加转录和/或翻译。
基因工程可以包括但不限于改变或修饰与特定基因表达相关的调节序列或位点(例如通过添加强启动子、组成型启动子、诱导型启动子或多个启动子,或通过移除调节序列从而使得表达成为组成型的)、修饰特定基因的基因组位置、改变邻近特定基因的核酸序列例如核糖体结合位点、增加特定基因的拷贝数、修饰参与特定基因转录和/或特定基因产物翻译的蛋白质(例如调节蛋白质、阻抑基因、增强子、转录激活子等),或任何其它本领域常规的失调特定基因表达的方法(包括但不限于使用反义核酸分子,例如阻断阻抑蛋白或生物合成蛋白的表达和/或使用增变等位基因,例如增强遗传变异性和加速例如适应性突变的细菌等位基因)。基因工程化也可以包括基因缺失,例如以阻断途径或移除阻抑蛋白。
在某些实施方案中,本发明的微生物是“坎贝尔进(Campbell in)”或“坎贝尔出(Cambell out)”微生物(或细胞或转化体)。如本文用到的,短语“坎贝尔进”转化体是指最初宿主细胞的转化体,其中通过单一同源重组事件(事件中的杂交),将完整环状双链DNA分子(例如质粒)整合到细胞的染色体中,并且有效产生了将环状DNA分子的线性化形式插入到染色体的第一DNA序列中,所述第一DNA序列与环状DNA分子的第一DNA序列同源。短语“坎贝尔进”是指整合到“坎贝尔进”转化体染色体中的线性化DNA序列。“坎贝尔进”转化体包含第一同源DNA序列的复制,所述DNA序列包括并围绕在同源重组交换点的周围。
“坎贝尔出”是指作为“坎贝尔进”转化体的后代的细胞,其中在“坎贝尔进”DNA的线性化插入的DNA上所包含的第二DNA序列与染色体起点的第二DNA序列(与线性化的插入片段的第二DNA序列同源)之间发生第二次同源重组事件(删除(cross out)事件),第二次同源重组事件使得删除(丢掉)一部分整合的DNA序列,但是更重要的,还使得一部分整合的DNA序列(这可以少至单个碱基)仍保留在染色体中,从而与最初宿主细胞相比,“坎贝尔出”细胞在染色体中包含一个或多个有意改变(例如单一碱基取代、多碱基取代、异源基因或DNA序列的插入、额外一个或多个拷贝的异源基因或修饰的同源基因的插入,或包含多于一个这些前述的上述列出的实例的DNA序列的插入)。
“坎贝尔进”细胞或菌株通常但不必需是通过针对基因的反选择来得到的,所述基因包含在“坎贝尔进”DNA序列的一部分(期望被丢掉的部分)中,所述基因为例如枯草芽孢杆菌sacB基因,其在当细胞在大约5%到10%的蔗糖存在下生长时是致命的。用或不用反选择,可以通过使用任何可筛选的表型,例如但不限于菌落形态、菌落颜色、抗生素抗性的存在或不存在、通过聚合酶链式反应检测的给定DNA序列的存在或不存在、营养缺陷型的存在或不存在、酶的存在或不存在、菌落核酸杂交等,来筛选所需细胞,得到或鉴定所需的“坎贝尔进”细胞。
导致“坎贝尔进”或“坎贝尔出”的同源重组事件可以在同源DNA序列的DNA碱基的一定范围内发生,并且由于对于这一范围的至少一部分,同源序列是彼此相同的,所以通常不可能确切指出交换事件在哪处发生。换句话说,不可能确切指出哪一序列最初来自插入的DNA,以及哪一序列最初来自染色体DNA。此外,第一同源DNA序列和第二同源DNA序列通常被部分非同源区域分开,并且正是这一非同源区域仍然留在“坎贝尔出”细胞的染色体中。
为了实用,在谷氨酸棒杆菌中,典型的第一和第二同源DNA序列是至少约200个碱基对长,并且可以多达几千个碱基对长,但是也可以用更短或更长序列来进行该方法。第一和第二同源序列优选的长度是大约500到2000个碱基,并且从“坎贝尔进”得到“坎贝尔出”是通过以下促进:将第一和第二同源序列安排成近似相同长度,优选差异小于200个碱基对,且最优选两者中较短的那个序列在碱基对上至少较长序列长度的70%。
III.MetI基因和其同源物
在枯草芽孢杆菌中,metI和metC基因位于近期阐明的metIC操纵子中(Auger等人,(2002)Microbiology 148:507-518)。以前,枯草芽孢杆菌metI基因被称为yjcI且metC被称为yjcJ。在枯草芽孢杆菌中metIC操纵子的转录受到硫来源的控制。当半胱氨酸或硫酸盐是唯一的硫来源时,转录是高的,而当唯一硫来源是甲硫氨酸时,其转录是低的。
通过蛋白质序列的同源性比较,MetI和MetC酶属于蛋白质的胱硫醚γ合酶家族,其包括胱硫醚γ-合酶、胱硫醚β-裂合酶、胱硫醚γ-裂合酶和O-乙酰高丝氨酸硫化氢解酶。该家族由以下氨基酸基序区分:[DQ]-[LIVMF]-X3-[STAGC]-[STAGCI]-T-K-[FYWQ]-[LIVMF]-X-G-[HQ]-[SGNH](SEQ ID NO:76),其包括对于共有辅因子吡哆醛磷酸的结合至关重要的赖氨酸残基。MetC酶具有胱硫醚β-裂合酶活性,而MetI具有O-乙酰高丝氨酸硫化氢解酶和胱硫醚γ合酶活性,或者具有O-琥珀酰高丝氨酸硫化氢解酶和胱硫醚γ合酶活性。
本发明涉及具有O-乙酰高丝氨酸硫化氢解酶活性和/或O-琥珀酰高丝氨酸硫化氢解酶活性的酶。本发明还涉及具有胱硫醚γ合酶活性的酶。在某些实施方案中,本发明包含具有O-乙酰高丝氨酸硫化氢解酶和胱硫醚γ合酶活性的酶。在其它实施方案中,本发明包括具有O-琥珀酰高丝氨酸硫化氢解酶活性的酶。而在其他实施方案中,本发明包含O-琥珀酰高丝氨酸硫化氢解酶和胱硫醚γ合酶活性活性。
本发明包含具有与枯草芽孢杆菌的MetI酶功能和结构同源的酶。“功能同源”指例如同源酶具有以与MetI酶基本类似的酶促方式作用的能力,即作为O-乙酰高丝氨酸的生物化学硫化氢解以产生高半胱氨酸的抗甲硫氨酸的介体或作为O-琥珀酰高丝氨酸的生物化学硫化氢解以产生高半胱氨酸的抗甲硫氨酸介体。在本文所用的意义中,术语“同源性”和“同源的”不限于具有理论上共同的遗传祖先的指定的蛋白质,而且包括这样的蛋白质,其是遗传不相关的,且依然进化成行使类似的功能和/或具有类似的结构。对枯草芽孢杆菌MetI酶的功能同源还包括具有作用为胱硫醚γ合成酶的特征的酶,其中胱硫醚是从半胱氨酸和O-琥珀酰高丝氨酸产生的或者其中胱硫醚是从半胱氨酸和O-乙酰高丝氨酸产生的。对于具有功能同源性的蛋白质,不需要它们在其氨基酸序列上具有显著的同一性,而是具有功能同源的蛋白质通过具有类似或相同的活性,例如酶促活性来定义。类似地,具有结构同源性的蛋白质被定义为具有一级(序列)或类似的二级、三级(或四级)结构,而不必需要核酸或氨基酸同一性。在某些情况中,结构同源性可以包括仅在蛋白质的活性位点或底物结合位点维持结构同源性的蛋白质。
除了结构和功能同源,本发明另外包括与枯草芽孢杆菌的MetI酶具有至少部分的核酸或氨基酸同一性的蛋白质。为了确定两个氨基酸序列或两个核酸的部分同一性百分比,为了最优比较目的比对序列(例如可以在一个蛋白质或核酸的序列中引入空位,用于与另一蛋白质或核酸最优比对)。然后比较在相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当在一个序列中的位置被与在另一个中的相应位置上相同的氨基酸残基或核苷酸所占据时,那么分子在该位置是同一的。两个序列之间的百分比同一性是序列共有的同一位置数的函数(即%同一性y=同一位置数/总位置数乘以100)。百分比同一性也可通过使用局部比对研究工具(Local AlignmentSearch Tool)(BLASTTM)程序比对两个核苷酸序列来确定。
因此,本发明的一方面涉及分离的核酸分子(例如cDNA、DNA或RNA),其包含编码与枯草芽孢杆菌的MetI酶同一的蛋白质(或其生物学活性部分)的核苷酸序列。在一些实施方案中,本发明分离的核酸分子包含这样的核苷酸序列,其与在SEQ ID NO:1中给出的枯草芽孢杆菌metI的核苷酸序列或其部分杂交,或与其有至少约50%,优选至少约60%,更优选至少约70%、80%或90%,甚至更优选至少约95%、96%、97%、98%、99%或更高同一性。
在一些实施方案中,分离的核酸分子编码蛋白质或其部分,其中蛋白质或其部分包括氨基酸序列,所述氨基酸序列与枯草芽孢杆菌MetI的氨基酸序列足够相似或同一,从而该蛋白质或其部分表现出O-乙酰高丝氨酸硫化氢解酶和胱硫醚γ合酶活性,或者O-琥珀酰高丝氨酸硫化氢解酶和胱硫醚γ合酶活性。优选地,核酸分子编码的蛋白质或其部分对甲硫氨酸反馈抑制有抗性或具有减少的敏感性。在一个实施方案中,核酸分子所编码的蛋白质与在SEQ ID NO:2中给出的枯草芽孢杆菌MetI氨基酸序列或其部分有至少约50%,优选至少约60%,更优选至少约70%、80%或90%,最优选至少约95%、96%、97%、98%或99%的或更高的同一性。
本发明还包含本领域熟知的技术,其可用于本文描述的蛋白质基因工程化以产生具有改良的或修饰特征的酶。例如,可以很容易在本领域的教导内修饰蛋白质,从而使得蛋白质具有增加的或降低的底物结合亲和性。也有利地在本领域的教导内设计具有增加的或减少的酶促速率的蛋白质。特别对于多功能酶,差别地微调蛋白质的多种活性以在特定的环境下最优行使功能是有用的。另外,调节酶对反馈抑制(例如通过甲硫氨酸)的敏感性的能力可以通过选择性改变参与甲硫氨酸或其它辅因子(可能参与负或正反馈)谐调的氨基酸来实现。另外,基因工程化包括与在转录和翻译水平的表达调节相关的事件。例如,当完全或部分操纵子用于克隆和表达时,调节序列例如基因的启动子或增强子可以被修饰,从而它们提供所需水平的转录。还证明了芽孢杆菌属包含转录调节序列,例如S-盒,其对于甲硫氨酸生物合成途径的下游产物(例如S-腺苷甲硫氨酸)是敏感的。类似地,可以修饰这些核酸基序以实现酶例如MetI表达的所需水平。
IV.重组核酸分子和载体
本发明另外描述了重组核酸分子(例如重组DNA分子),其包括本文描述的基因(例如分离的基因),优选的芽孢杆菌属基因,更优选枯草芽孢杆菌基因,甚至更优选枯草芽孢杆菌甲硫氨酸生物合成基因。术语“重组核酸分子”包括这样的核酸分子(例如DNA分子),其已被改变、修饰或改造,从而其在核苷酸序列上不同于该重组核酸分子所来源的自然或天然核酸分子(例如通过添加、缺失或取代一个或多个核苷酸)。优选地,重组核酸分子(例如重组DNA分子)包括有效连接到调节序列的本发明的分离的基因。短语“有效连接到调节序列”意思是目的基因的至少部分(通常是编码蛋白质部分加或减几个碱基对,例如2、3、4或更多个碱基对)核苷酸序列以允许基因表达的方式(例如增强的、增加的、组成型的、基本的、弱化的、降低的或受到抑制的表达)连接到一个或多个调节序列,所述方式优选地为允许基因所编码的基因产物的表达(例如如本文定义的,当重组核酸分子包括成型表达的那些(例如组成型启动子和强的组成型启动子)、在微生物中指导核苷酸序列诱导型表达的那些(例如诱导型启动子,例如木糖诱导型启动子)和在微生物中弱化或阻抑核苷酸序列表达的那些(例如弱化信号或阻抑序列)。通过移除或缺失调节序列调节基因表达也在本发明范围内。例如,参与转录的负调节的序列可以被移除,从而增强目的基因的表达。
在一些实施方案中,本发明的重组核酸分子包括编码至少一种细菌基因产物(例如甲硫氨酸生物合成酶)的核酸序列或基因,其有效连接启动子或启动子序列。本发明的例示性启动子包括棒杆菌启动子和/或噬菌体启动子(例如感染棒杆菌的噬菌体)。在一个实施方案中,启动子是棒杆菌启动子,优选是强的棒杆菌启动子(例如与生物化学持家基因相关的启动子,所述持家基因是在棒杆菌中相对高表达的持家基因)。在另一个实施方案中,启动子是噬菌体启动子。在一些实施方案中,启动子来自枯草芽孢杆菌噬菌体SP01或大肠杆菌噬菌体λ。在一些实施方案中,启动子选自P15或P497启动子,它们具有例如下列分别的序列:(SEQ ID NO:3)和(SEQ ID NO:4)。额外的启动子包括tef(翻译延伸因子(TEF)启动子)、sod(超氧化物歧化酶)启动子和pyc(丙酮酸羧化酶(PYC)启动子),它们在棒杆菌(例如谷氨酸棒杆菌)中启动高水平的表达。例如用于革兰氏阳性微生物的启动子的额外实例包括但不限于amy和SP01启动子。另外,可以使用用于革兰氏阴性和革兰氏阳性微生物的启动子实例包括但不限于cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacIQ、T7、T5、T3、gal、trc、ara、SP6、λ-PR或λ-PL。
在另一个实施方案中,本发明的重组核酸分子包括一种或多种终止序列(例如转录终止序列)。术语“终止序列”包括用于终止mRNA转录的调节序列。终止序列(或串联转录终止子)可以另外用于稳定mRNA(例如通过向mRNA添加结构),例如以抗核酸酶。
在再一个实施方案中,本发明的重组核酸分子包括这样的序列,其允许检测包含所述序列(即可检测的和/或选择性标记)的载体,例如,编码抗生素抗性序列的基因或克服营养缺陷突变的基因,例如trpC、药物标记、荧光标记,和/或比色标记(例如lacZ/β-半乳糖苷酶)。
在再一个实施方案中,本发明的重组核酸分子包括自然(发现与野生型基因结合)或人造的或杂种或复合的核糖体结合位点(RBS)或被转录成人造RBS的序列。术语“人造核糖体结合位点(RBS)”包括核糖体结合(例如以启动翻译)的mRNA分子(例如DNA中编码的)内的位点,所述位点在至少一个核苷酸上不同于自然RBS(例如在天然发生的基因中发现的RBS)。在一些实施方案中,人造RBS包括约5-6、7-8、9-10、11-12、13-14、15-16、17-18、19-20、21-22、23-24、25-26、27-28、29-30或更多个核苷酸,其中大约1-2、3-4、5-6、7-8、9-10、11-12、13-15或更多个不同于自然RBS。在一些实施方案中,RBS序列包括如本发明的载体中所述和所用的RBSI(SEQ ID NO:5tctagaAGGAGGAGAAAACatg)和RBS 1284(SEQ ID NO:6:tctagaCCAGGAGGACATACAgtg)(见表III)。
表III:设计表达在谷氨酸棒杆菌中的crtEb整合的枯草芽孢杆菌metI的质粒
Figure A20068002622400321
Figure A20068002622400331
本发明另外描述了如本文所述载体(例如重组载体),其包括核酸分子(例如包含所述基因的异源基因、异源核酸序列或重组核酸分子)。术语“重组载体”包括这样的载体(例如质粒、噬菌体、噬菌粒、病毒、黏粒或其它纯化的核酸载体),其已经被改变、修饰或改造,从而使得与该重组载体所来源的自然或天然核酸分子所包括的那些相比,所述重组载体包含更多、更少或不同的核酸序列。在一些实施方案中,重组载体包括编码生物合成酶的基因或包括所述基因的重组核酸分子,它们有效连接到调节序列例如如本文定义的启动子序列、终止序列和/或人造核糖体结合位点(RBS)。在另一实施方案中,本发明的重组载体包括增强在细菌中复制(例如重组序列的起点)的序列。在一个实施方案中,增强复制的序列在大肠杆菌中有功能。在另一个实施方案中,增强复制的序列来自pBR322。
在再一个实施方案中,本发明的重组载体包括抗生素抗性序列。术语“抗生素抗性序列”包括对宿主生物(例如棒杆菌)启动或赋予抗生素抗性的序列。在一个实施方案中,抗生素抗性序列选自cat(氯霉素抗性)序列、tet(四环素抗性)序列、erm(红霉素抗性)序列、neo(新霉素抗性)序列、kan(卡那霉素抗性)序列、amp(-内酰胺抗生素抗性序列)和spec(壮观霉素抗性)序列。本发明的重组载体可以另外包括同源重组序列(例如设计以允许目的基因重组到宿主生物的染色体中的序列)。例如,bioAD、bioB或crtEb序列可以用作用于重组进宿主染色体的同源靶标。本领域的技术人员将还理解载体的设计可以根据这样的因素例如待基因工程化的微生物的选择、所需基因产物的表达水平等来定制。
V.类胡萝卜素生物合成和类胡萝卜素操纵子
类胡萝卜素是一组脂溶性的、脂族烃的通用名,其还可以包含一个或多个氧原子,由可以作用以引起着色的经修饰的聚异戊二烯主链组成。它们通过常规类异戊二烯生物合成途径产生,并且由植物、藻类、一些真菌和细菌合成。目前,已知天然存在600多种类胡萝卜素。除了提供特征性颜色外,类胡萝卜素行使多种功能。类胡萝卜素可以提供抗氧化保护,例如针对单线态氧和自由基作用的保护。在光合成中,类胡萝卜素可以在集光功能中将吸收的辐射能转移到叶绿素分子中,在高等植物和某些藻类中通过叶黄素循环驱散多余的能量,并且直接淬灭激发状态的叶绿素。类胡萝卜素也可以提供针对有害辐射如紫外线的保护。近来,已经证明了类胡萝卜素作为某些光合成色素蛋白质复合体的分子胶的结构功能。β-胡萝卜素和结构相关的化合物在哺乳动物中作用为维生素A、视网膜和视黄酸的前体,从而分别在营养、视觉和细胞分化中起到关键作用(Krubasik,P.等人(2001)_Eur.J.Biochem.268:3702-3708;Armstrong G.A.,(1994)J.Bacteriol.176:4795-4802)。
许多类胡萝卜素包含线性C40烃主链,所述烃主链包括一些(通常在3-15之间)共轭双键。但是在某些细菌中,也产生C45和C50类胡萝卜素。在谷氨酸棒杆菌中产生的decaprenoxanthin是C50类胡萝卜素的一个实例(Krubasik,出处同上)。大量存在的双链的数量和排列确定了所给类胡萝卜素的光谱性质,其通常吸收在400和500nm之间的光。对于类异戊二烯生物合成的类胡萝卜素支路独特的第一步是两分子的C20中间体牻牛儿牻牛儿焦磷酸(GGPP)的尾对尾缩合,以形成八氢番茄红素(见图6)。这一无环烃是产生的第一种C40类胡萝卜素,并且对于所有C40胡萝卜素生成(carotegenic)生物是常见的。取决于生物,八氢番茄红素被转变成链孢红素或番茄红素。在这一中间体之后,胡萝卜素生成生物中的生物合成途径分叉,产生多种天然存在的类胡萝卜素(Armstgrong,G.A.等人(1996)FASEBJ.10,228-237)。
类胡萝卜素合成是通过一些酶的渐进作用来实现的,所述酶以协同方式起作用以产生中间体和最终分子。在例如谷氨酸棒杆菌中,5种酶起作用产生类胡萝卜素decaprenoxanthin(见图6)。由于一些原因,类胡萝卜素操纵子是基因工程技术的有吸引力的候选。类胡萝卜素的产生是工业上重要的,因为分子如叶黄素、变胞藻黄素、番茄红素和β胡萝卜素等的利用已经是长久已知的,并且所述分子作为营养添加剂或补充物的潜力不断增长。例如使用番茄红素作为抗氧化剂和抗癌剂是目前研究的目标。操纵子可以被容易地操作以产生多种结构的类胡萝卜素,这是基于提供和/或调节在生物的类胡萝卜素生物合成途径的步骤中起作用的酶的产生。另外,可以操作操纵子或生物以增加用于产生所需类胡萝卜素的酶的产量。
另外,通过使用整合盒,操纵子可以用作引入外源核酸序列的载体。此类整合盒包括与操纵子内源序列同源的核酸序列。通过重组事件,整合盒将外源序列插入到靶标生物的类胡萝卜素操纵子中。所述核酸序列可以编码目的蛋白质或其可以包含非编码序列,该非编码序列用于例如改变、破坏或增强类胡萝卜素操纵子的功能。
本发明另外涉及可以在棒杆菌类胡萝卜素操纵子(见图3)处整合的重组表达载体。类胡萝卜素操纵子是遗传单元,其包含负责产生类胡萝卜素的一些基因和基因调节元件。具体地,发明人已经开发了包含整合盒的表达载体,所述整合盒可以用于将异源核酸序列或异源基因引入类胡萝卜素操纵子中。发明人已经设计了整合盒以使得类胡萝卜素操纵子的特异性基因或调节序列可以被靶定而被破坏。类胡萝卜素操纵子的特异性基因或调节序列的破坏产生了不同的表型结果,这取决于类胡萝卜素途径的哪一步被破坏或改变。谷氨酸棒杆菌通常由于decaprenoxanthin的合成而得到黄色的菌落。例如,在该途径中的早期阻断提供了白色菌落,而在番茄红素延伸酶(在crtEb基因座所编码的)的阻断产生粉色菌落。在此,粉色是番茄红素而不是decaprenoxanthin积累的结果。最终,在编码类胡萝卜素操纵子的推定负调节子的marR中的插入产生了更高水平的总类胡萝卜素,使得菌落的颜色更暗或更强。发明人另外在本文证明了番茄红素延伸酶(crtEb)基因座和marR基因座的破坏提供了番茄红素产量的显著增加。
总之,本发明描述的发现提供了重组微生物的生成,所述重组微生物同时产生增加水平的甲硫氨酸和番茄红素或另一种类胡萝卜素化合物。由于使用一种生物产生两种工业上重要化合物的产量增加的经济性,使得这提供了明显的优势。可以用或不用从发酵留下的细胞量中进一步纯化,来得到类胡萝卜素。
另外,本发明的载体可以用于促进微生物的基因工程化,因为伴随着多种改造步骤的颜色改变可以有助于鉴定所希望的分子事件。
IV.培养和发酵重组微生物
本发明的微生物特别适用于产生精细化学品,例如含硫精细化学品。优选设计微生物和此类微生物特有的发酵步骤,以用于改善或增加精细化学品例如含硫精细化学品的产量。
方法改良可以与发酵技术方面的方法相关,所述发酵技术方面如搅拌和氧供应,或者由于营养培养基的组成,例如发酵过程中的糖浓度或由于用在纯化产物中的分离技术,例如通过离子交换层析。
改良所需物质(例如含硫精细化学品)产量的方法包括通过例如基因工程内在地提高微生物的产出值或产量。所需物质(例如含硫精细化学品)的输出可以通过修饰参与目的物质生物合成的一种酶(或多种酶)的表达水平来增加。这可以通过例如修饰启动子或增强子序列来实现,所述启动子或增强子序列负责驱动生物合成中重要的酶的表达。另外,可重组引入外源启动子或增强子序列,并且它们赋予了内源酶或蛋白质的优选表达水平。在一些实例中,插入的调节序列允许靶标蛋白质组成型或诱导型表达。所需物质增加水平的产量也可以通过引入重组修饰的基因来实现,所述重组修饰的基因表达具有改良特征的蛋白质。在某些实例中,改造编码自然蛋白质的基因从而使得得到的蛋白质具有所需的特征,例如对物质更高的亲和性或更快的反应速率。而实现所需物质增加的或改良的产量的另一种方式是通过重组引入异源基因。异源基因的插入可以具有补充或代替自然酶的优势,从而影响生物化学途径的特别需要的产物的产量。在某些环境中,敲除自然基因并且引入异源基因是有益的,从而提高的所需物质的产量。也可以引入异源基因从而产生对于靶标微生物来说是新的物质。
提高在微生物中所需物质产量的特别有意义的是开发新的遗传工程技术用于促进靶标生物的修饰。通常,通过使用重组核酸载体将异源核酸序列插入到靶标生物中。这些载体可以自主复制和游离型存在,或它们可以被设计为使得异源序列插入到宿主细胞基因组中。另外,在某些环境中,设计位点特异性整合的载体是可能和有利的。如这些整合载体可以行使双重功能:它们插入所需的异源基因并且同时消除天然靶标基因序列的功能。对所提供的这些载体的进一步开发意味着促进重组微生物的生成,所述重组微生物可用于产生所需物质如含硫精细化学品。
术语“培养”包括维持和/或生长本发明的活微生物(例如维持和/或生长培养物或菌株)。在一个实施方案中,本发明的微生物在液体培养基中培养。在另一个实施方案中,本发明的微生物在固体培养基或半固体培养基中培养。在一些实施方案中,本发明的微生物培养在培养基中(例如无菌、液体培养基),所述培养基包含对于维持和/或生长微生物所必需或有益的营养物(例如碳源或碳底物,例如糖类、烃、油、脂肪、脂肪酸、有机酸和醇;氮源,例如蛋白胨、酵母提取物、肉膏、麦芽汁、尿素、硫酸铵、氯化铵、硝酸铵和磷酸铵;磷源,例如磷酸、其钠盐和钾盐;痕量元素,例如镁、铁、锰、钙、铜、锌、硼、钼和/或钴盐;以及生长因子如氨基酸、维生素、生长促进剂等)。
优选地,本发明的微生物在受控pH下培养。术语“受控pH”包括使得所需产物(例如甲硫氨酸和/或番茄红素)产生的任何pH。在一个实施方案中,微生物在约为7的pH下培养。在另一个实施方案中,微生物在pH约为6.0和8.5之间培养。所需的pH可以通过本领域技术人员已知的任何一种方法来维持。
在一些实施方案中,本发明的微生物在受控通气下培养。术语“受控通气”包括使得所需产物(例如甲硫氨酸和/或番茄红素)产生的充足通气(例如氧供应)。在一个实施方案中,通气受到在培养物中调节氧水平的控制,例如通过调节溶解在培养基中的氧气量来控制。例如,在一些实施方案中,培养物的通气至少部分地通过搅拌培养物来控制。搅拌可以通过螺旋桨或类似的机械搅拌装置来提供,通过旋转或摇动培养容器(例如试管或烧瓶)或通过多种泵动装置来提供。通气可以另外通过无菌空气或氧气穿过培养基(例如通过发酵混合物)来控制。本发明的微生物也优选的在没有过量发泡(例如通过添加消泡剂)下培养。
此外,本发明的微生物可以在受控温度下培养。术语“受控温度”包括使得所需产物(例如甲硫氨酸和/或类胡萝卜素)产生的任何温度。在一个实施方案中,受控温度包括在15℃和95℃之间的温度。在另一个实施方案中,受控温度包括在15℃和70℃之间的温度。在一些实施方案中,温度在20℃和55℃之间,更优选在28℃和44℃之间。
微生物可以培养(例如维持和/或生长)在液体培养基中,并且优选通过常规培养方法连续或间歇地培养,所述方法如静置培养、试管培养、摇动培养(例如旋转摇动培养、摇瓶培养等)、通气旋式培养或发酵。在优选的实施方案中,微生物培养在摇瓶中。在更优选的实施方案中,微生物培养在发酵罐中(例如发酵方法)。本发明的发酵方法包括但不限于分批、补料分批和连续发酵方法。短语“分批方法”或“分批发酵”是指系统,其中在发酵开始时设定培养基、营养物、补充添加剂等的组成,并且在发酵过程中不再改变,但是,可以尝试控制此类因素如pH和氧浓度,以预防过度培养基酸化和/或微生物死亡。短语“补料分批方法”或“补料分批”发酵是指具有额外供应的分批发酵,其中随着发酵的进展添加(例如增量或连续添加)了一种或多种底物或补充物。短语“连续方法”或“连续发酵”是指这样的系统,其中将确定的发酵培养基连续添加到发酵罐中并且同时移除等量的已用的或“条件化的”培养基,优选是用于回收所需产物(例如甲硫氨酸和/或类胡萝卜素)。已经开发了多种此类方法并且它们在本领域是已知的。
短语“在产生所需化合物的条件下培养”包括在适合或足够得以产生所需化合物或得到待产生的特定化合物的所需产量的条件(例如温度、压力、pH、持续时间等)下维持和/或生长微生物。例如,培养持续了足以产生所需量的(例如甲硫氨酸和/或类胡萝卜素)的时间。优选地,培养持续了这样的时间,即所述时间足以充分达到化合物的合适产量(例如足以达到适当浓度的甲硫氨酸和/或类胡萝卜素的时间)。在一个实施方案中,培养持续了约12到24小时。在另一个实施方案中,培养持续了约24到36小时、36到48小时、48到72小时、72到96小时、96到120小时、120到144小时,或多于144小时。在再一个实施方案中,微生物培养在这样的条件下,即在所述条件下在约48小时中产生了至少约1到5g/L或5到10g/L的化合物,或在约72小时中产生了至少约10到20g/L的化合物。在再一个实施方案中,微生物培养在这样的条件下,即在所述条件下在约36小时中产生了至少约5到20g/L的化合物,或在约48小时中产生了至少约20到30g/L的化合物,或在约72小时中产生了至少约30到50或60g/L的化合物。
本发明的方法可以另外包括回收所需化合物(例如甲硫氨酸和/或类胡萝卜素)的步骤。术语“回收”所需化合物包括提取、收获、分离或纯化来自培养基或细胞量的化合物。回收化合物可以根据本领域已知的任何常规分离或纯化方法来进行,所述方法包括但不限于用常规树脂(例如阴离子或阳离子交换树脂、非离子吸附树脂等)来处理,用常规吸附剂(例如活性炭、硅酸、硅胶、纤维素、氧化铝等)来处理、改变pH、溶剂萃取(例如用常规溶剂如醇、乙酸乙酯、己烷等)、渗析、过滤、浓缩、结晶、重结晶、pH调整、冻干等。
在一些情况中,优选“提取”、“分离”或“纯化”本发明所需化合物,从而使得得到的制备物基本上没有其它培养基成分(例如没有培养基成分和/或发酵副产物)。术语“基本上没有其它培养基成分”包括所需化合物的制备,其中将化合物与产生其的培养物的培养基成分或发酵副产物分离出来。在一个实施方案中,制备物具有高于约80%的(干重)所需化合物(例如其它培养基成分或发酵副产物少于约20%),更优选地高于约90%的所需化合物(例如其他培养基成分或发酵副产物少于约10%),仍更优选地高于约95%的所需化合物(例如其它培养基成分或发酵副产物少于约5%),以及最优选地高于约98-99%所需化合物(例如其它培养基成分或发酵副产物少于约1-2%)。
在备选实施方案中,所需化合物不从培养基或微生物中纯化出来。例如,当微生物是生物学无害(例如安全)时。例如,完整的培养物(或培养上清液)或细胞量可以用作产品(例如粗产品)来源。在一个实施方案中,不经修饰使用培养物(或培养上清液)。在另一个实施方案中,浓缩培养物(或培养上清液)。在再一个实施方案中,干燥或冻干培养物(或培养上清液)。在再一个实施方案中,干燥、冻干或直接使用(例如作为饲料添加剂)细胞量(在从细胞上清液分离后)。本发明所得到的产物除了含硫精细化学品(例如甲硫氨酸)外,可以包括发酵液和细胞量的其他成分,例如磷酸盐、碳酸盐、残留的糖类、生物量、复合培养基成分、类胡萝卜素等。
在一些实施方案中,本发明的产生方法使得以显著高的产量产生所需化合物。短语“显著高的产量”包括产生或产量水平,所述水平被充分提高或者高于相当的产生方法所通常产生的,例如,其被提高到足以用于商业产生所需产物的水平(例如以商业可行的成本生产产物)。在一个实施方案中,本发明表征了包括在下述条件下培养重组微生物的生产方法,在所述条件下,所需产物(例如甲硫氨酸和/或类胡萝卜素)在可溶产物(例如甲硫氨酸)情况下以高于2g/L,或在难溶产物(例如类胡萝卜素)情况下以高于0.1mg/L的水平产生。在另一个实施方案中,本发明表征了包括在下述条件下培养重组微生物的生产方法,在所述条件下,使得所需产物(例如甲硫氨酸)以高于10g/L的水平产生,并且当存在时,类胡萝卜素化合物以1mg/L或更高的水平产生。在另一个实施方案中,本发明表征了包括在下述条件下培养重组微生物的生产方法,在所述条件下,使得所需产物(甲硫氨酸)以高于20g/L的水平产生。在再一个实施方案中,本发明表征了在下述条件下培养重组微生物的生产方法,在所述条件下,使得所需产物(甲硫氨酸)以高于30g/L的水平产生。在再一个实施方案中,本发明表征了在下述条件下培养重组微生物的生产方法,在所述条件下,使得所需产物(例如甲硫氨酸)以高于40g/L的水平产生。在再一个实施方案中,本发明表征了在下述条件下培养重组微生物的生产方法,在所述条件下,使得所需产物(例如甲硫氨酸)以高于50g/L的水平产生。在再一个实施方案中,本发明表征了在下述条件下培养重组微生物的生产方法,在所述条件下,使得所需产物(例如甲硫氨酸)以高于60g/L的水平产生。本发明另外表征了包括在下述条件下培养重组微生物产生所需化合物的生产方法,在所述条件下在商业所需的时间段内产生足够提高水平的化合物。
根据生物合成酶或操作的生物合成酶的组合,可以需要或必须为本发明的微生物提供(例如喂饲)至少一种生物合成前体,从而产生所需一种或多种化合物。术语“生物合成前体”和“前体”包括这样的物质或化合物,其当被提供给微生物的培养基或与微生物的培养基接触或包括在培养基内时,起到增强或增加所需产物的生物合成的作用。
本发明的另一方面包括以本文描述的重组微生物为特征的生物转化方法。术语“生物转化过程”也在本文称为“生物转变方法”,包括使得适当底物和/或中间化合物向所需产物(例如甲硫氨酸和/或类胡萝卜素)生成(例如转化或转变)的生物学方法。
用在生物转化反应中的一种或多种微生物和/或酶为允许它们行使它们预期功能(例如产生所需化合物)的形式。微生物可以是全细胞,或可以仅是必须得到所需最终结果的细胞的那些部分。微生物可以被悬浮(例如在适当的溶液中如缓冲的溶液或培养基中)、漂洗(例如漂洗除去培养微生物的培养基)、丙酮干燥、固定(例如用聚丙烯酰胺凝胶或k-角叉藻聚糖固定或固定在合成支持物例如珠子、基质等上)、固定(fix)、交联或透化(例如具有渗透的膜和/或壁,从而化合物例如底物、中间体或产物可以容易地通过所述膜或壁)。
本发明进一步通过下列实施例说明,所述实施例不应该被理解为限制。本申请全文中引用的所有参考文献、专利和公开的专利申请的内容在本文引用作为参考。
实施例1.枯草芽孢杆菌metI基因向谷氨酸棒杆菌菌株中的安装
通过聚合酶链式反应得到枯草芽孢杆菌metI基因的克隆,并将其在产生甲硫氨酸的多种谷氨酸棒杆菌菌株中表达。在通过PCR扩增metI后,构建四种不同的质粒来在crtEb基因座整合后组成型表达metI(见实施例3)。将两个启动子P497和P15与两个核糖体结合位点RBS1和RBS1284组合以提供四种组合,这列在表2中。在图3中图示了来自此组的一种代表性质粒pOM284。所有质粒都互补了大肠杆菌metB突变体。
将所有四种质粒转化到OM99中(在共同待决的专利申请60/700,699“Methionine Producing Recombinant Microorganisms,”中描述,2005年7月18日提交)。在摇瓶中,使用基于糖浆的培养基对每种坎贝尔进菌株的四个分离菌进行甲硫氨酸产量的测定(表IV)。所有四种质粒都导致甲硫氨酸产量的增加。最大的增加来自pOM284,其包含从P15和RBS1表达的metI。在此情况中,甲硫氨酸产量从大约1.6g/l增加到大约2.2g/l,或约37%。这一增加被解释为是由于MetY样活性、MetB样活性的比活性的增加或由于反馈抗性,或由于上述这些的组合。在包含pOM284的大肠杆菌metB-粗提物中的O-乙酰-高丝氨酸硫化氢解酶测定表明MetI实际上对高达10mM浓度的甲硫氨酸抑制有抗性。
表IV.在摇瓶中的糖浆培养基中,包含坎贝尔进metI质粒的OM99衍生物生长48小时的甲硫氨酸产量。所有的滴定度以克/升给出。
Figure A20068002622400421
Figure A20068002622400431
将用pOM284转化的OM99衍生物进行坎贝尔出,以得到名为OM134C的新菌株。在摇瓶中,相对于OM99,OM134C的甲硫氨酸产量增加40%,这与坎贝尔进中间体OM99/pOM284的类似(表V)。OM134C的O-乙酰-高丝氨酸滴定度从约1.2g/l下降到约0.3g/l,这与存在更有活性的O-乙酰-高丝氨酸硫化氢解酶和/或更有活性的胱硫醚合酶相符。
表V.在摇瓶的糖浆培养基中生长48小时的OM134C——包含在crtEb整合的P15RBS1metI的OM99坎贝尔出衍生物的甲硫氨酸产量
所有滴定度以克/升给出。
用在本发明菌株构建中的多种启动子序列在以下说明:SEQ ID NO:16(启动子P1284);SEQ ID NO:17(启动子P3119);SEQ ID NO:18(启动子噬菌体λPR)和SEQ ID NO:19(启动子噬菌体λPL)。另外,枯草芽孢杆菌metI蛋白质的氨基酸序列用来搜索最接近的已知序列。图7A-C描述了枯草芽孢杆菌MetI蛋白质(SEQ ID NO:2)和通过序列同一性在NCBI的
Figure A20068002622400441
数据库中发现的50个最接近的序列(SEQ ID NO:26-75)之间的多序列比对。
实施例2.确定来自谷氨酸棒杆菌的MetY和来自枯草芽孢杆菌的MetI的O-乙酰-高丝氨酸硫化氢解酶酶活性,所述酶活性作为甲硫氨酸浓度的函数
在大肠杆菌-谷氨酸棒杆菌质粒穿梭载体pOM284上编码的metI基因(SEQ ID NO:12)和在大肠杆菌-谷氨酸棒杆菌质粒穿梭载体pH357上编码的metY基因(SEQ ID NO:15)通过标准转化技术被转化到来自ColiGenetic Stock Center(耶鲁大学,美国)的metB缺陷的大肠杆菌菌株CGSC4896中,并且通过在添加有25mg/l卡那霉素的LB上生长来选择。包含pOM284的转化大肠杆菌菌株在缺乏甲硫氨酸的极限葡萄糖培养基上生长,表明MetI可以利用O-琥珀酰高丝氨酸作为底物。
携带metI或metY基因的大肠杆菌菌株生长在具有25mg/l卡那霉素的液体LB培养基中。收获细胞并且使用Ribolyzer方法和仪器(Hybaid,英国)得到来自沉淀物的细胞裂解物。离心细胞提取物以得到胞质溶胶蛋白质的可溶上清液级分。测定细胞提取物中O-乙酰-高丝氨酸硫化氢解酶活性的方法基本上如在Yamagata,Methods,in Enzymology,1987,第143卷,第479-480页中描述的进行。将细胞提取物添加到100mM KH2PO4(pH 7.2)的缓冲液,所述缓冲液包含5mM O-乙酰-高丝氨酸和200μM磷酸吡哆醛。为了分析甲硫氨酸对酶促活性的影响,将L-甲硫氨酸添加到所指示的最终mM浓度。反应通过添加硫化钠溶液到终浓度为4mM来起始。在30℃温育15分钟后,将反应终止并且通过添加1/10体积的30%三氯乙酸来酸化。在离心(13,000转/分钟,5分钟)移除沉淀的蛋白质后,在Speed-Vac蒸发器中在降低的气压下进行温育以耗尽残余H2S。如上述在Yamagata中描述的,将耗尽了硫化物的溶液与氰化物和硝普盐反应。测定520nm处吸光度,并且进行背景修正。
将在甲硫氨酸存在时的酶活性表示为相对于不存在添加的甲硫氨酸时活性(设定为1)的相对值(见图2)。没有添加质粒DNA的大肠杆菌菌株CGSC4896没有表现出可测量的酶促O-乙酰-高丝氨酸硫化氢解酶活性。
从在图2中描述的结果清楚的显示,枯草芽孢杆菌MetI酶的O-乙酰-高丝氨酸硫化氢解酶活性对甲硫氨酸(高达至少10mM甲硫氨酸)的抑制有抗性,而谷氨酸棒杆菌MetY酶的O-乙酰-高丝氨酸硫化氢解酶活性受到2.5到10mM范围内的甲硫氨酸抑制,在大约5mM时有50%的抑制。5mM是可能存在于细胞胞质中的甲硫氨酸浓度,所述细胞被工程化以过量产生甲硫氨酸。
实施例3.MetI酶的体内O-乙酰高丝氨酸硫化氢解酶和O-琥珀酰高丝氨酸硫化氢解酶活性的增强
尽管如在上述实施例1和实施例2中所描述的,来自枯草芽孢杆菌的MetI在体外酶测定中具有O-乙酰高丝氨酸硫化氢解酶活性,MetI的体内活性不足以支持缺乏转硫途径的大肠杆菌或谷氨酸棒杆菌菌株的生长。
通过用pOM284的P15metI盒(SEQ ID NO:12)取代pH357的P497metY盒(SEQ ID NO:15),来构建质粒pOM150(SEQ ID NO:20)。
通过metC162::Tn10等位基因从大肠杆菌菌株CGSC7435到CGSC4896(metB)的P1 vir转导构建大肠杆菌菌株MW001(metB,metC162::Tn10),并且选择四环素抗性。MW001缺乏甲硫氨酸合成的转硫途径和直接硫化氢解途径。
通过分别使用质粒pH216(SEQ ID NO:21)、pOM115(SEQ ID NO:22)和pH215(SEQ ID NO:23)的顺序坎贝尔进和坎贝尔出,从OM99缺失metB、metC和metY的部分来构建谷氨酸棒杆菌菌株OM175。OM175缺乏甲硫氨酸合成的转硫途径和直接硫化氢解途径。
MW001和OM175各自用pOM150转化,在25mg/l下选择卡那霉素抗性。将转化体在包含无甲硫氨酸的培养基的培养皿上划线,如在2005年7月18日提交的美国临时专利申请60/700,557中描述,其在本文引用作为参考。没有转化体生长在无甲硫氨酸的培养基上,尽管MetI的体外硫化氢解活性表明了转化体应当被赋予通过MetI进行的直接硫化氢解途径。
为了增加MetI的体内直接硫化氢解活性,将MW001/pOM150菌株进行紫外线诱变并且选择在无甲硫氨酸平板上的生长。分离生长良好的突变菌株。从一些独立的突变体中分离质粒DNA并且将纯化的DNA再次转化到幼稚MW001和OM175中。分离自一些不同突变体的质粒提供了生长在无甲硫氨酸培养基上的两种(MW001和OM175)转化体,并且那些质粒的MW001转化体以与原始突变分离菌相同的速率生长,表明赋予了生长的突变是质粒来源的。
将两个新的突变质粒分别命名为pOM150-2和pOM150-14。测定两种质粒的metI区域的DNA序列,并且它们都含有相同的单碱基突变,其将MetI的第308位氨基酸(将ATG起始密码子记为1号氨基酸)的丝氨酸密码子(AGC)改变为天冬酰胺密码子(AAC)。值得注意的是具有直接硫化氢解活性的MetY在同源的氨基酸位置处包含天冬酰胺,结果,在pOM150质粒中鉴定的突变使得MetI序列更像MetY。
名为pOM148-1(SEQ ID NO:24)的质粒是pOM150-14的近亲,其与pOM150-14一样包含相同的P15metI(S308N)盒,但是没有metX基因。不像在MW001中分离的pOM150-2,pOM148-1最初在紫外线诱变后的OM175分离,在无甲硫氨酸的平板上选择,分离质粒,并且转化进幼稚OM175和MW001中。推测产生O-琥珀酰高丝氨酸而不是O-乙酰高丝氨酸的大肠杆菌菌株MW001/pOM148-1在没有甲硫氨酸的培养基上仍生长良好。
总之,根据这些结果断定:在谷氨酸棒杆菌和大肠杆菌中,新突变形式的MetI(S308N)在体内具有增加的O-乙酰高丝氨酸硫化氢解酶和O-琥珀酰高丝氨酸硫化氢解酶活性,这对于增强甲硫氨酸生物合成是有用的。
实施例4:开发用于在谷氨酸棒杆菌的类胡萝卜素生物合成操纵子上整合基因表达盒的载体
谷氨酸棒杆菌菌落通常在极限或丰富培养基平板上48小时后变成黄色。据报道这一黄色是由于C50类胡萝卜素decaprenoxanthin的积累(Krubasik等人,2001,Eur.J.Biochem.268:3702-8)。催化从类异戊二烯前体生物合成decaprenoxanthin的酶由单操纵子编码,所述单操纵子以转座子诱变、克隆和测序为特征(Krubasik等人,出处同上)。我们预测这一操纵子(图4)对于谷氨酸棒杆菌是非必需的,所以其可以是用于插入基因表达盒的方便并且潜在有用的基因座。具体地,在操纵子的特定位置的插入将改变类胡萝卜素途径,其随后将导致菌落的颜色改变。例如,在途径早期的阻断将产生白色菌落,在番茄红素延伸酶的阻断将导致番茄红素而非decaprenoxanthin的积累,这使得菌落为粉红色而非黄色。最后,在编码类胡萝卜素操纵子的推定负调节子的marR中的插入将导致更高水平的类胡萝卜素,这将使菌落颜色更暗或更强。
设计了两组整合载体来在crtEb(番茄红素延伸酶)或marR(负调节子)处整合盒。每组的一个成员包含P497-lacZ表达构件,而另一个包含P15-lacZ表达构件。这些载体的一个代表pOM246(在crtEb的P15-lacZ)显示在图5中(SEQ ID NO:14)。四个载体的组总结在表VI中。在crtEb处盒的整合产生了粉红色菌落,这使得更有效地挑出保留了所需插入片段的“坎贝尔出”。
marR处的插入产生了比亲本具有更深黄色的菌落。在marR处的插入和在crtEb处的插入的组合使得番茄红素产量增加。
实施例5.非类胡萝卜素化合物和类胡萝卜素化合物的共同产生
如本文所述的,本文描述的质粒和菌株除了在菌株构建中有用外,还可以用于通过与类胡萝卜素化合物一起共产生有商业价值的氨基酸或其它非类胡萝卜素化合物,来增加发酵方法的商业价值的方法。因此,例如,菌株OM134C(见实施例1)产生了甲硫氨酸和番茄红素。甲硫氨酸分泌到液体培养物的培养基中,而番茄红素则结合到细胞量。通过离心,细胞形成粉红色沉淀物,并且例如通过将细胞悬浮在甲醇∶氯仿(体积1∶1)的混合物中来提取包含在所述沉淀物中的番茄红素。对于一些应用,例如,用于鲑鱼饲料的变胞藻黄素,可以将细胞量简单干燥成固体或粉末并且与饲料混合来提供类胡萝卜素、蛋白质和维生素的来源。
类胡萝卜素(例如但不限于例如番茄红素、变胞藻黄素、β-胡萝卜素、叶黄素、玉米黄质、角黄素、decaprenoxanthin和胭脂树橙等)可以因此从第一产物是氨基酸或其它非类胡萝卜素化合物的来自谷氨酸棒杆菌的消耗完的细胞量或其它发酵中得到,因此节省了仅用于类胡萝卜素生产的发酵费用。在此描述的插入导致类胡萝卜素水平的升高,这使得类胡萝卜素被作为副产物收获在经济上是吸引人的。除了番茄红素和decaprenoxanthin的类胡萝卜素也可以从本领域熟知的来源,使用本领域熟知的技术通过引入适当的生物合成基因来产生,例如变胞藻黄素和β-胡萝卜素生物合成基因可通过PCR从红发肤酵母(Phaffia rhodozyma)或Xanthophyllomycesdendrorhous得到(Verdoes等人(2003)Appl.Env.Microbiol.69:3728-3738),或从噬夏孢欧文氏菌(Erwinia uredovora)和Agrobacteriumaurantiacum(Miura等人(1998)Appl.Env.Microbiol.64:1226-1229)得到。将番茄红素转变成β-胡萝卜素、变胞藻黄素等必需的基因可以从上述来源或其它适当的来源中得到,并且如本文为metI描述的在谷氨酸棒杆菌中单独表达,或作为操纵子,或作为操纵子的一部分。
不希望受到理论的限制,要理解本文描述的方法可以延伸至产生除甲硫氨酸外的任何氨基酸或除氨基酸外的化合物,或非类胡萝卜素化合物以及除decaprenoxanthin和番茄红素外的类胡萝卜素,以及使用除谷氨酸棒杆菌外的其它生物。另外,本发明所包括的方法可以用于在单次发酵反应中共产生氨基酸或其它非类胡萝卜素化合物与类胡萝卜素化合物。其它氨基酸的实例包括但不限于赖氨酸、谷氨酸、苏氨酸、异亮氨酸、亮氨酸、丙氨酸、苯丙氨酸、酪氨酸、色氨酸、半胱氨酸、高丝氨酸、高半胱氨酸和其盐。其它类胡萝卜素实例包括但不限于β-胡萝卜素、变胞藻黄素、叶黄素、玉米黄质、角黄素和胭脂树橙等。可以工程化以过量产生氨基酸的任何生物还可以被改造为共产生类胡萝卜素。通常,氨基酸的滴定度将高于类胡萝卜的滴定度,并且进入类胡萝卜素的碳流量将足够小,这样将不会产生对氨基酸滴定度的主要影响。同样,在一些情况中,类胡萝卜素的产生或过量产生将实际上增强待产生的氨基酸滴定度,这是因为类胡萝卜素将为生产生物提供一定保护而免受氧化破坏。除谷氨酸棒杆菌外可以被改造为共产生非类胡萝卜素化合物与类胡萝卜素化合物的生物的实例包括细菌、酵母、丝状真菌、古细菌和植物的其它属和种。唯一的要求是生物能够被改造从而以有经济吸引力水平产生所述两种化合物。
另外,通过共产生类胡萝卜素(第二化合物)来增加发酵价值也可以被扩展到第一目的化合物是除氨基酸外的化合物的生物和发酵。此类化合物包括例如但不限于,甲烷、氢、乳酸、1,2-丙二醇、1,3-丙二醇、乙醇、甲醇、丙醇、丙酮、丁醇、乙酸、丙酸、柠檬酸、衣康酸、葡糖胺、甘油、糖类、维生素、治疗用酶、研究与工业用酶、治疗性蛋白质、研究与工业用蛋白质,以及任意上述列出的化合物的多种盐。本领域熟知此类化合物可以通过发酵产生,并且所述生物可以被改造、选择或筛选从而以有经济吸引力的水平过量产生此类化合物。另外,可以通过共产生类胡萝卜素来增加发酵方法的价值,所述类胡萝卜素结合到细胞量或结合到可以在细胞破坏后从可溶材料中分离的材料上。在许多但非所有情形中,第一目的化合物将是至少0.5g/l水溶性的并且分泌到培养上清液中,并且第二目的化合物例如类胡萝卜素将是难溶于水的并且将仍保持结合到细胞量或结合在通过离心或其它方法(例如蒸发、过滤、超滤等)从培养物或从破坏的细胞浓缩的材料上。在一些情形中,第一化合物将是气体如甲烷或氢,它们可以容易地与类胡萝卜素分离。
实施例6.进一步增加类胡萝卜素产量
如在上文实施例4中所述,可以通过在编码类胡萝卜素生物合成的负调节子的基因(例如谷氨酸棒杆菌的marR基因)中产生无功能性等位基因(例如插入、缺失或点突变),增加类胡萝卜素产量。这一方法导致类胡萝卜素生物合成基因或操纵子的组成型转录。但是,可以通过在类胡萝卜素基因或操纵子上游安装比天然启动子强的启动子(甚至在其受阻抑的状态)来得到类胡萝卜素合成水平的更进一步增加。质粒pOM163(SEQ IDNO:25)是可以用于安装强组成型启动子P15启动子(SEQ ID NO:3)的质粒实例,所述安装是以将启动子与谷氨酸棒杆菌类胡萝卜素生物合成操纵子功能性连接的方式。通过坎贝尔进和坎贝尔出将pOM163的功能性部分整合到谷氨酸棒杆菌菌株也移除了天然的、MarR可抑制的crt操纵子启动子和marR基因的部分,并且安装P497specR盒,其在谷氨酸棒杆菌转化体中赋予壮观霉素抗性。
将质粒pOM163整合到菌株OM469(见相关的美国专利申请BGI 180)以给出菌株OM609K。在使用糖浆培养基的摇瓶中,如在本文引用作为参考的美国临时专利申请60/714,042和60/700,699中所述,在用甲醇∶氯仿(体积1∶1)提取细胞沉淀物后,OM469和OM609K分别产生每升大约2.1和2.0克的甲硫氨酸,以及分别产生据估计每克细胞干重0.6和4.3mg的decaprenoxanthin。
将质粒pOM163整合到菌株OM182中,所述菌株OM182是类似于上述OM134C的菌株,因为它是M2014的衍生物(见相关美国临时专利申请60/714,042和60/700,699),包含crtEb基因破坏并因此产生番茄红素而非decaprenoxanthin。得到的菌株被称为OM610K。在使用糖蜜培养基的摇瓶中(如在美国临时专利申请60/714,042和60/700,699中所述),在用甲醇∶氯仿(按体积计1∶1)提取细胞沉淀后,OM182和OM610K分别产生每升约1.1和0.9克甲硫氨酸,以及分别产生据估计每克细胞干重0.3和5.7mg的番茄红素。
表VI.设计为在谷氨酸棒杆菌类胡萝卜素操纵子处整合的载体总结
Figure A20068002622400501
Figure A20068002622400511
根据说明书中引用的参考文献(在本文引用作为参考)的教导,可以最彻底理解说明书。在说明书中的实施方案提供了本公开中实施方案的说明,并且不应理解为限制它的范围。技术人员容易认识到许多其它实施方案被在本公开包括。在本公开中所有引用的出版物和专利以及通过登录号或数据库参考号标识的序列以其完整引用作为参考。如果参考文献中引用的材料与本说明书矛盾或不相符,本说明书将替代任何此类材料。本文的任何参考文献引用并不承认此类参考文献是本公开的现有技术。
除非另外说明,用在说明书(包括权利要求书)中表示成分的量、细胞培养物、处理条件等的所有数字应当理解为通过术语“约”在所有实例中被修饰。因此,除非指出相反,数字参数是近似值并且根据本发明所想要得到的所需性质而变化。除非另外说明,在一系列要素前的术语“至少”要理解为是指在该系列中的每个要素。本领域的技术人员将认识到,或能够仅使用常规实验法来确定本文所述发明的具体实施方案的等同方案。此类等同方案也意在由下列权利要求所包括。
序列表
<110>巴斯福股份公司
<120>芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途
<130>BGI-179PC
<140>PCT/US2006/027617
<141>2006-07-18
<150>60/713,905
<151>2005-09-01
<150>60/700,557
<151>2005-07-18
<160>76
<170>PatentIn版本3.3
<210>1
<211>1122
<212>DNA
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>1
atgtcacagc acgttgaaac gaaattagct caaattggga accgtagcga tgaagtcacg 60
ggaacagtga gtgctcctat ctatttatca acagcatacc gccacagagg gatcggagaa 120
tctaccggat ttgattatgt ccgcacaaaa aatccgacac gccagcttgt tgaggacgcg 180
atcgctaact tagaaaacgg cgcgagaggg cttgccttta gttcgggaat ggctgctatc 240
caaacgatta tggcgctgtt taaaagcgga gatgaactga tcgtttcatc ggacctatat 300
ggcggcacgt accgtttatt tgaaaatgaa tggaaaaaat acggattgac ttttcattat 360
gatgatttca gcgatgagga ctgtttacgc tctaagatta cgccgaatac aaaagcggtg 420
tttgtggaaa cgccgacaaa ccccctcatg caggaggcgg acattgaaca tattgcccgg 480
attacaaagg agcacggtct tctgctgatc gtagataata cattttatac accggtcttg 540
cagcggccgc ttgagctggg agctgacatt gtcattcaca gcgcaaccaa gtatttaggc 600
gggcataacg atctgcttgc tggacttgtc gtggtgaagg atgagcggct cggagaggaa 660
atgtttcagc atcaaaatgc aatcggcgcc gtcctgccgc catttgattc gtggcttctg 720
atgagaggaa tgaagacgct gagcctcaga atgcgccagc atcaggcaaa cgcgcaggag 780
cttgcggcgt ttttagaaga gcaggaagaa atttcggatg tgctgtatcc cggaaaaggc 840
ggcatgctgt ccttccgtct gcaaaaagaa gaatgggtca atccgttttt aaaagcactg 900
aagaccattt gttttgcaga aagcctcggc ggggtggaaa gctttattac ataccctgcg 960
acccagacgc acatggatat tcctgaagag atccgcatcg caaacggggt gtgcaatcgg 1020
ttgctgcgct tttctgtcgg tattgaacat gcggaagatt taaaagagga tctaaaacag 1080
gcattatgtc aggtcaaaga gggagctgtt tcatttgagt aa                    1122
<210>2
<211>373
<212>PRT
<213>枯草芽孢杆菌
<400>2
Met Ser Gln His Val Glu Thr Lys Leu Ala Gln Ile Gly Asn Arg Ser
  1               5                  10                  15
Asp Glu Val Thr Gly Thr Val Ser Ala Pro Ile Tyr Leu Ser Thr Ala
             20                  25                  30
Tyr Arg His Arg Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr Val Arg
         35                  40                  45
Thr Lys Asn Pro Thr Arg Gln Leu Val Glu Asp Ala Ile Ala Asn Leu
     50                  55                  60
Glu Asn Gly Ala Arg Gly Leu Ala Phe Ser Ser Gly Met Ala Ala Ile
 65                  70                  75                  80
Gln Thr Ile Met Ala Leu Phe Lys Ser Gly Asp Glu Leu Ile Val Ser
                 85                  90                  95
Ser Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Glu Asn Glu Trp Lys
            100                 105                 110
Lys Tyr Gly Leu Thr Phe His Tyr Asp Asp Phe Ser Asp Glu Asp Cys
        115                 120                 125
Leu Arg Ser Lys Ile Thr Pro Asn Thr Lys Ala Val Phe Val Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Gln Glu Ala Asp Ile Glu His Ile Ala Arg
145                 150                 155                 160
Ile Thr Lys Glu His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr
                165                 170                 175
Thr Pro Val Leu Gln Arg Pro Leu Glu Leu Gly Ala Asp Ile Val Ile
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Leu Leu Ala Gly
        195                 200                 205
Leu Val Val Val Lys Asp Glu Arg Leu Gly Glu Glu Met Phe Gln His
    210                 215                 220
Gln Asn Ala Ile Gly Ala Val Leu Pro Pro Phe Asp Ser Trp Leu Leu
225                 230                 235                 240
Met Arg Gly Met Lys Thr Leu Ser Leu Arg Met Arg Gln His Gln Ala
                245                 250                 255
Asn Ala Gln Glu Leu Ala Ala Phe Leu Glu Glu Gln Glu Glu Ile Ser
            260                 265                 270
Asp Val Leu Tyr Pro Gly Lys Gly Gly Met Leu Ser Phe Arg Leu Gln
        275                 280                 285
Lys Glu Glu Trp Val Asn Pro Phe Leu Lys Ala Leu Lys Thr Ile Cys
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Phe Ile Thr Tyr Pro Ala
305                 310                 315                 320
Thr Gln Thr His Met Asp Ile Pro Glu Glu Ile Arg Ile Ala Asn Gly
                325                 330                 335
Val Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu His Ala Glu
            340                 345                 350
Asp Leu Lys Glu Asp Leu Lys Gln Ala Leu Cys Gln Val Lys Glu Gly
        355                 360                 365
Ala Val Ser Phe Glu
    370
<210>3
<211>195
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     启动子序列
<400>3
gctattgacg acagctatgg ttcactgtcc accaaccaaa actgtgctca gtaccgccaa 60
tatttctccc ttgaggggta caaagaggtg tccctagaag agatccacgc tgtgtaaaaa 120
ttttacaaaa aggtattgac tttccctaca gggtgtgtaa taatttaatt acaggcgggg 180
gcaaccccgc ctgtt                                                  195
<210>4
<211>156
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     启动子序列
<400>4
ccttaaagtt tggctgccat gtgaattttt agcaccctca acagttgagt gctggcactc 60
tcgggggtag agtgccaaat aggttgtttg acacacagtt gttcacccgc gacgacggct 120
gtgctggaaa cccacaaccg gcacacacaa aatttt                           156
<210>5
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     寡核苷酸
<400>5
tctagaagga ggagaaaaca tg      22
<210>6
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     寡核苷酸
<400>6
tctagaccag gaggacatac agtg    24
<210>7
<211>8970
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     载体序列
<400>7
ggatcggcgg ccagggccct catgagatat cgagtggatt tgtgcaaaac tttcaggtgt 60
gcgatgcatg agaatctgcc caataaaatt aagtttgcct cggcgataga ggtctccgtc 120
aataacatcg tcatgaacca aaagggaaaa atgcagtagt tctaaagcca ctgctacctg 180
taaaacggtg ttgagtttga cctcaatgtc atcgtctaca agcgtgttgt atagccccag 240
tagcattcga gggcggatta acttgccacc tcgcaaagct tggaaagcag catctaggca 300
ggtacggaac tctggttgat atgtgctgca ctgttgagat agcgaagcgc agatgcggtt 360
tagttcccga taaatctcat cattgaaatc aagatcagga tgagttgaat gttctgtggt 420
gattgtcatg ccattgtcca ttcgagtatc acacggccag ttatctcgca aaaattccca 480
atcgttgtat atggcgcttt attttgatga agtacagaaa gtgtgaattt gggtccataa 540
aaataatgtg cctacaagaa atttatagta tcccatgagt taatattttt aaaaataaac 600
tttatctgac tttgtagaaa aaggtgatta ctatgctgaa tatgcaggaa ccagataaaa 660
tccatccggc agaacctaca cttcgtaata tttatgacgt taaaactagt gatcccaaaa 720
gtgaattagt tgatcgttct ggcatgtcgg aagaagacat tgcgcaaatt gggcggctaa 780
tgaaatcgtt ggccagtctt cgcgatgtgg aacgtagtat tggtgaagcc tcggcacgtt 840
atatggagct aagtgcccct gatatgcgag ctttgcacta tttgattgtg gcgggcaatg 900
cgggcgaagt ggtgactcca ggaatgcttg gagctgcggc cgcacagcga tcccagagga 960
aatatcctct ggggtcgctg tgtcgacctt aaagtttggc tgccatgtga atttttagca 1020
ccctcaacag ttgagtgctg gcactctcgg gggtagagtg ccaaataggt tgtttgacac 1080
acagttgttc acccgcgacg acggctgtgc tggaaaccca caaccggcac acacaaaatt 1140
tttctagagg agggattcat catgaataca tacgaacaaa ttaataaagt gaaaaaaata 1200
cttcggaaac atttaaaaaa taaccttatt ggtacttaca tgtttggatc aggagttgag 1260
agtggactaa aaccaaatag tgatcttgac tttttagtcg tcgtatctga accattgaca 1320
gatcaaagta aagaaatact tatacaaaaa attagaccta tttcaaaaaa aataggagat 1380
aaaagcaact tacgatatat tgaattaaca attattattc agcaagaaat ggtaccgtgg 1440
aatcatcctc ccaaacaaga atttatttat ggagaatggt tacaagagct ttatgaacaa 1500
ggatacattc ctcagaagga attaaattca gatttaacca taatgcttta ccaagcaaaa 1560
cgaaaaaata aaagaatata cggaaattat gacttagagg aattactacc tgatattcca 1620
ttttctgatg tgagaagagc cattatggat tcgtcagagg aattaataga taattatcag 1680
gatgatgaaa ccaactctat attaacttta tgccgtatga ttttaactat ggacacgggt 1740
aaaatcatac caaaagatat tgcgggaaat gcagtggctg aatcttctcc attagaacat 1800
agggagagaa ttttgttagc agttcgtagt tatcttggag agaatattga atggactaat 1860
gaaaatgtaa atttaactat aaactattta aataacagat taaaaaaatt ataaaaaaat 1920
tgaaaaaatg gtggaaacac ttttttcaat ttttttgttt tattatttaa tatttgggaa 1980
atattcattc taattggtaa tcagatttta gaaaacaata aacccttgca tagggggatc 2040
gatatccgtt taggctgggc ggatccgccc tcccgcacgc tttgcgggag ggcggtacca 2100
gctcacctta agctttcccc ggcatctgta acaaagacgc ttaataggct agaaaaaggt 2160
gggcatattg ttcgtaatgt gcaccccgtc gaccgcaggg ctttcgccct catggtcact 2220
gatgccactc gtggagaggc gatgcggacg cttggtaagc atcaggcgcg tcgttttgat 2280
gctgctaaac gattaactcc acaagagcgt gaagtggtta tccgattcct tcaggatatg 2340
gcacaggagt tatcccttaa taatgcacca tggctcaaca cggagtagat gaccatctac 2400
gttaattaaa gtgtgcagag cggagtggcg gtgtttaagc cacctgtcgc tgggactgta 2460
atgaatgcgc atggccacca cccactgtcc tctgtaatgt tccgaacgtg agaccattgg 2520
tcactactga gctgtggcgt gcgggatagt ataaatcctg aggaccggct tgggctgccg 2580
acgattgcta gtgaataatc atcttcgata taggtcacgc ggtagtttgc ttgattgtct 2640
tcactctgaa atggaatacc tgggaagcta acctttaatg aagcattgga aactacttta 2700
gcgctgcctt caataactga aggcccaaag aaagtgccac acttatttgt tacagagatt 2760
gtgtccgagt cgatcacgcc gtaatcagcg gtaacgtcat gtgagcactg taaagagaat 2820
ggttggggaa ttgctgcgac ttgataccac ttgcctttgt agcgttctag gtcaatgcta 2880
ttttcaattt cgggcagcgc taggttttca ggaaccgaac ttaggttaga tacctgcgag 2940
gagccacctg caagtcgtcc gccgtcaaaa atgtcttggg cttgtgccgt ggatatcccg 3000
aaaagtgaaa tggctgcgag tagtgctgtg gtgacaagtt tgcttgaaat gcgcataaag 3060
caaatccttt cttcatgttt atattaactc aatagttatt acttctaaaa gtatagtaga 3120
tagttgtgga tgggtgaaga atttcataga aatcgcactc gattcactaa agacccaaga 3180
gtaaaatccc aggatttgct tatacttgcg ctcatggata atcaacttcg tcccactttg 3240
cattatcaag ctcaaaaccc gcaccctcac gcgtcccggg atttaaatcg ctagcgggct 3300
gctaaaggaa gcggaacacg tagaaagcca gtccgcagaa acggtgctga ccccggatga 3360
atgtcagcta ctgggctatc tggacaaggg aaaacgcaag cgcaaagaga aagcaggtag 3420
cttgcagtgg gcttacatgg cgatagctag actgggcggt tttatggaca gcaagcgaac 3480
cggaattgcc agctggggcg ccctctggta aggttgggaa gccctgcaaa gtaaactgga 3540
tggctttctt gccgccaagg atctgatggc gcaggggatc aagatctgat caagagacag 3600
gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 3660
gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 3720
ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 3780
gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 3840
ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 3900
gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 3960
tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 4020
accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 4080
aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 4140
aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga 4200
atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 4260
cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 4320
aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 4380
ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 4440
ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 4500
gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 4560
catgctggag ttcttcgccc acgctagttt aaactgcgga tcagtgaggg tttgtaactg 4620
cgggtcaagg atctggattt cgatcacggc acgatcatcg tgcgggaggg caagggctcc 4680
aaggatcggg ccttgatgtt acccgagagc ttggcaccca gcctgcgcga gcaggggaat 4740
tgatccggtg gatgaccttt tgaatgacct ttaatagatt atattactaa ttaattgggg 4800
accctagagg tccccttttt tattttaaaa attttttcac aaaacggttt acaagcataa 4860
cgggttttgc tgcccgcaaa cgggctgttc tggtgttgct agtttgttat cagaatcgca 4920
gatccggctt caggtttgcc ggctgaaagc gctatttctt ccagaattgc catgattttt 4980
tccccacggg aggcgtcact ggctcccgtg ttgtcggcag ctttgattcg ataagcagca 5040
tcgcctgttt caggctgtct atgtgtgact gttgagctgt aacaagttgt ctcaggtgtt 5100
caatttcatg ttctagttgc tttgttttac tggtttcacc tgttctatta ggtgttacat 5160
gctgttcatc tgttacattg tcgatctgtt catggtgaac agctttaaat gcaccaaaaa 5220
ctcgtaaaag ctctgatgta tctatctttt ttacaccgtt ttcatctgtg catatggaca 5280
gttttccctt tgatatctaa cggtgaacag ttgttctact tttgtttgtt agtcttgatg 5340
cttcactgat agatacaaga gccataagaa cctcagatcc ttccgtattt agccagtatg 5400
ttctctagtg tggttcgttg tttttgcgtg agccatgaga acgaaccatt gagatcatgc 5460
ttactttgca tgtcactcaa aaattttgcc tcaaaactgg tgagctgaat ttttgcagtt 5520
aaagcatcgt gtagtgtttt tcttagtccg ttacgtaggt aggaatctga tgtaatggtt 5580
gttggtattt tgtcaccatt catttttatc tggttgttct caagttcggt tacgagatcc 5640
atttgtctat ctagttcaac ttggaaaatc aacgtatcag tcgggcggcc tcgcttatca 5700
accaccaatt tcatattgct gtaagtgttt aaatctttac ttattggttt caaaacccat 5760
tggttaagcc ttttaaactc atggtagtta ttttcaagca ttaacatgaa cttaaattca 5820
tcaaggctaa tctctatatt tgccttgtga gttttctttt gtgttagttc ttttaataac 5880
cactcataaa tcctcataga gtatttgttt tcaaaagact taacatgttc cagattatat 5940
tttatgaatt tttttaactg gaaaagataa ggcaatatct cttcactaaa aactaattct 6000
aatttttcgc ttgagaactt ggcatagttt gtccactgga aaatctcaaa gcctttaacc 6060
aaaggattcc tgatttccac agttctcgtc atcagctctc tggttgcttt agctaataca 6120
ccataagcat tttccctact gatgttcatc atctgagcgt attggttata agtgaacgat 6180
accgtccgtt ctttccttgt agggttttca atcgtggggt tgagtagtgc cacacagcat 6240
aaaattagct tggtttcatg ctccgttaag tcatagcgac taatcgctag ttcatttgct 6300
ttgaaaacaa ctaattcaga catacatctc aattggtcta ggtgatttta atcactatac 6360
caattgagat gggctagtca atgataatta ctagtccttt tcctttgagt tgtgggtatc 6420
tgtaaattct gctagacctt tgctggaaaa cttgtaaatt ctgctagacc ctctgtaaat 6480
tccgctagac ctttgtgtgt tttttttgtt tatattcaag tggttataat ttatagaata 6540
aagaaagaat aaaaaaagat aaaaagaata gatcccagcc ctgtgtataa ctcactactt 6600
tagtcagttc cgcagtatta caaaaggatg tcgcaaacgc tgtttgctcc tctacaaaac 6660
agaccttaaa accctaaagg cttaagtagc accctcgcaa gctcgggcaa atcgctgaat 6720
attccttttg tctccgacca tcaggcacct gagtcgctgt ctttttcgtg acattcagtt 6780
cgctgcgctc acggctctgg cagtgaatgg gggtaaatgg cactacaggc gccttttatg 6840
gattcatgca aggaaactac ccataataca agaaaagccc gtcacgggct tctcagggcg 6900
ttttatggcg ggtctgctat gtggtgctat ctgacttttt gctgttcagc agttcctgcc 6960
ctctgatttt ccagtctgac cacttcggat tatcccgtga caggtcattc agactggcta 7020
atgcacccag taaggcagcg gtatcatcaa caggcttagt ttaaacccat cggcattttc 7080
ttttgcgttt ttatttgtta actgttaatt gtccttgttc aaggatgctg tctttgacaa 7140
cagatgtttt cttgcctttg atgttcagca ggaagctcgg cgcaaacgtt gattgtttgt 7200
ctgcgtagaa tcctctgttt gtcatatagc ttgtaatcac gacattgttt cctttcgctt 7260
gaggtacagc gaagtgtgag taagtaaagg ttacatcgtt aggatcaaga tccattttta 7320
acacaaggcc agttttgttc agcggcttgt atgggccagt taaagaatta gaaacataac 7380
caagcatgta aatatcgtta gacgtaatgc cgtcaatcgt catttttgat ccgcgggagt 7440
cagtgaacag gtaccatttg ccgttcattt taaagacgtt cgcgcgttca atttcatctg 7500
ttactgtgtt agatgcaatc agcggtttca tcactttttt cagtgtgtaa tcatcgttta 7560
gctcaatcat accgagagcg ccgtttgcta actcagccgt gcgtttttta tcgctttgca 7620
gaagtttttg actttcttga cggaagaatg atgtgctttt gccatagtat gctttgttaa 7680
ataaagattc ttcgccttgg tagccatctt cagttccagt gtttgcttca aatactaagt 7740
atttgtggcc tttatcttct acgtagtgag gatctctcag cgtatggttg tcgcctgagc 7800
tgtagttgcc ttcatcgatg aactgctgta cattttgata cgtttttccg tcaccgtcaa 7860
agattgattt ataatcctct acaccgttga tgttcaaaga gctgtctgat gctgatacgt 7920
taacttgtgc agttgtcagt gtttgtttgc cgtaatgttt accggagaaa tcagtgtaga 7980
ataaacggat ttttccgtca gatgtaaatg tggctgaacc tgaccattct tgtgtttggt 8040
cttttaggat agaatcattt gcatcgaatt tgtcgctgtc tttaaagacg cggccagcgt 8100
ttttccagct gtcaatagaa gtttcgccga ctttttgata gaacatgtaa atcgatgtgt 8160
catccgcatt tttaggatct ccggctaatg caaagacgat gtggtagccg tgatagtttg 8220
cgacagtgcc gtcagcgttt tgtaatggcc agctgtccca aacgtccagg ccttttgcag 8280
aagagatatt tttaattgtg gacgaatcaa attcagaaac ttgatatttt tcattttttt 8340
gctgttcagg gatttgcagc atatcatggc gtgtaatatg ggaaatgccg tatgtttcct 8400
tatatggctt ttggttcgtt tctttcgcaa acgcttgagt tgcgcctcct gccagcagtg 8460
cggtagtaaa ggttaatact gttgcttgtt ttgcaaactt tttgatgttc atcgttcatg 8520
tctccttttt tatgtactgt gttagcggtc tgcttcttcc agccctcctg tttgaagatg 8580
gcaagttagt tacgcacaat aaaaaaagac ctaaaatatg taaggggtga cgccaaagta 8640
tacactttgc cctttacaca ttttaggtct tgcctgcttt atcagtaaca aacccgcgcg 8700
atttactttt cgacctcatt ctattagact ctcgtttgga ttgcaactgg tctattttcc 8760
tcttttgttt gatagaaaat cataaaagga tttgcagact acgggcctaa agaactaaaa 8820
aatctatctg tttcttttca ttctctgtat tttttatagt ttctgttgca tgggcataaa 8880
gttgcctttt taatcacaat tcagaaaata tcataatatc tcatttcact aaataatagt 8940
gaacggcagg tatatgtgat gggttaaaaa                                  8970
<210>8
<211>12383
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     载体序列
<400>8
ggatcggcgg ccagggccct catgagatat cgagtcagcg ctgtattgcc cgtgaagttg 60
atggtgtttc cgctgccctg ctgggtggga ttggaggtgt aatcaatgaa ccaaccagga 120
gttccggtgc cagtgagatc aaataccacg cggtcaaagc cactgtgaga gccaatccga 180
acatcggtga ccatgagctg tgcaggcgca tcaggtcgga gagtcttcat tgctacatcg 240
gcttcgccca atgcggttgg gccggtggaa gcttcgttgg acaactgtgc gccatccgca 300
gttgcggaca tagtttgggt tacagaagaa gcatcgttgg tggtggaatt ggaggttcca 360
caacccgcaa gagtcaacgc gctagcgccg acaatcgcta gagtcttcag gcgggcacga 420
tgctttgaat gagaagttgg ctgcacaatc atgcacacac cgtaaccctg ggtcaccccc 480
gaaacctaag caagacgccc aatttcgctc aatcgtgaac gaattgttgt aattcgtctt 540
aaaaacgcca ggagacgtga aaattacaga caccccagac atcagatgga ggcggcgata 600
ctagggtaga ggacatgact cttcgctgtt ctgacgtcaa tgttgaaccc ctgccgggaa 660
cggcaaaaac aggttctggg tttgttctcc ttgaacatgc tggctcgtgg agccgtgatg 720
ttttagacgg cggaacattt gatcctgagt tgactgatca attgaagagg cacctgaaag 780
cttccggaat gggtctgcaa ttaattagga agccgggaag ggagggtcga aacgtcgaaa 840
agcataatct ttttctcgtt tttgctgagg cctcaattat tgagcacctg gtggtggacg 900
cgccggctga tgttttggat cttgatttaa gcgggccggg caaaaacaat gcgcagcgca 960
tggatgatcc gatgctgctg atttgtacgc attcgaagcg cgatgtgtgc tgcgcgatca 1020
aggggcgtcc gctggcagct gccgtggagc cacaatttgg gccgctgcat gtgtgggagg 1080
cttcgcacac caagggccac cgttttgcgc catcgatgct gctcatgccg tggaattact 1140
cttatggcct acttgatgag gccgaaaccg tgcagctttt ccaaggcgcg ttggacaaca 1200
aactcttcct gccgggcaac cgtggccgag gaaccttaga tgctcgtggc caggttgcag 1260
aaattgccgt ggcggaagct ttcggcgagg cggttgctcc tgcgagtttg caggttgaat 1320
tcgaagatga ttctgttttg gttactcatc ccgatgggcg cacgtgggtt gtggagcttg 1380
aacgcatcga ggtcgacggc gtggtgtcct cgtgtggtga tcagccgaaa actggaaaag 1440
cgtgggtggc taggcaagtt acagaactga tcggataaaa gcagagttat atctgatgaa 1500
ttgctattag cagtatcgtt atcacagcac caacaaagta gttcagccac aggaaaactt 1560
tccaactgcg attagcctgt tcacaactgg catctgtaat gttccaaaat cgtgcggcat 1620
taaatacgta agttagaatc gcaatcccga tgatccacgc cggattaggc aaagtagtga 1680
ctaacacagc agctagtaaa taaagtacta ctgaaagccg aatggctcca cgcgccccaa 1740
ttacagtggc aattgagctg cggccgcaca gcgatcccag aggaaatatc ctctggggtc 1800
gctgtgtcga ccttaaagtt tggctgccat gtgaattttt agcaccctca acagttgagt 1860
gctggcactc tcgggggtag agtgccaaat aggttgtttg acacacagtt gttcacccgc 1920
gacgacggct gtgctggaaa cccacaaccg gcacacacaa aatttttcta gagatcccca 1980
gcttgttgat acactaatgc ttttatatag ggaaaaggtg gtgaactact gtggaagtta 2040
ctgacgtaag attacgggtc gaccgggaaa accctggcgt tacccaactt aatcgccttg 2100
cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 2160
cccaacagtt gcgcagcctg aatggcgaat ggcgctttgc ctggtttccg gcaccagaag 2220
cggtgccgga aagctggctg gagtgcgatc ttcctgaggc cgatactgtc gtcgtcccct 2280
caaactggca gatgcacggt tacgatgcgc ccatctacac caacgtaacc tatcccatta 2340
cggtcaatcc gccgtttgtt cccacggaga atccgacggg ttgttactcg ctcacattta 2400
atgttgatga aagctggcta caggaaggcc agacgcgaat tatttttgat ggcgttaact 2460
cggcgtttca tctgtggtgc aacgggcgct gggtcggtta cggccaggac agtcgtttgc 2520
cgtctgaatt tgacctgagc gcatttttac gcgccggaga aaaccgcctc gcggtgatgg 2580
tgctgcgttg gagtgacggc agttatctgg aagatcagga tatgtggcgg atgagcggca 2640
ttttccgtga cgtctcgttg ctgcataaac cgactacaca aatcagcgat ttccatgttg 2700
ccactcgctt taatgatgat ttcagccgcg ctgtactgga ggctgaagtt cagatgtgcg 2760
gcgagttgcg tgactaccta cgggtaacag tttctttatg gcagggtgaa acgcaggtcg 2820
ccagcggcac cgcgcctttc ggcggtgaaa ttatcgatga gcgtggtggt tatgccgatc 2880
gcgtcacact acgtctgaac gtcgaaaacc cgaaactgtg gagcgccgaa atcccgaatc 2940
tctatcgtgc ggtggttgaa ctgcacaccg ccgacggcac gctgattgaa gcagaagcct 3000
gcgatgtcgg tttccgcgag gtgcggattg aaaatggtct gctgctgctg aacggcaagc 3060
cgttgctgat tcgaggcgtt aaccgtcacg agcatcatcc tctgcatggt caggtcatgg 3120
atgagcagac gatggtgcag gatatcctgc tgatgaagca gaacaacttt aacgccgtgc 3180
gctgttcgca ttatccgaac catccgctgt ggtacacgct gtgcgaccgc tacggcctgt 3240
atgtggtgga tgaagccaat attgaaaccc acggcatggt gccaatgaat cgtctgaccg 3300
atgatccgcg ctggctaccg gcgatgagcg aacgcgtaac gcgaatggtg cagcgcgatc 3360
gtaatcaccc gagtgtgatc atctggtcgc tggggaatga atcaggccac ggcgctaatc 3420
acgacgcgct gtatcgctgg atcaaatctg tcgatccttc ccgcccggtg cagtatgaag 3480
gcggcggagc cgacaccacg gccaccgata ttatttgccc gatgtacgcg cgcgtggatg 3540
aagaccagcc cttcccggct gtgccgaaat ggtccatcaa aaaatggctt tcgctacctg 3600
gagagacgcg cccgctgatc ctttgcgaat acgcccacgc gatgggtaac agtcttggcg 3660
gtttcgctaa atactggcag gcgtttcgtc agtatccccg tttacagggc ggcttcgtct 3720
gggactgggt ggatcagtcg ctgattaaat atgatgaaaa cggcaacccg tggtcggctt 3780
acggcggtga ttttggcgat acgccgaacg atcgccagtt ctgtatgaac ggtctggtct 3840
ttgccgaccg cacgccgcat ccagcgctga cggaagcaaa acaccagcag cagtttttcc 3900
agttccgttt atccgggcaa accatcgaag tgaccagcga atacctgttc cgtcatagcg 3960
ataacgagct cctgcactgg atggtggcgc tggatggtaa gccgctggca agcggtgaag 4020
tgcctctgga tgtcgctcca caaggtaaac agttgattga actgcctgaa ctaccgcagc 4080
cggagagcgc cgggcaactc tggctcacag tacgcgtagt gcaaccgaac gcgaccgcat 4140
ggtcagaagc cgggcacatc agcgcctggc agcagtggcg tctggcggaa aacctcagtg 4200
tgacgctccc cgccgcgtcc cacgccatcc cgcatctgac caccagcgaa atggattttt 4260
gcatcgagct gggtaataag cgttggcaat ttaaccgcca gtcaggcttt ctttcacaga 4320
tgtggattgg cgataaaaaa caactgctga cgccgctgcg cgatcagttc acccgtgcac 4380
cgctggataa cgacattggc gtaagtgaag cgacccgcat tgaccctaac gcctgggtcg 4440
aacgctggaa ggcggcgggc cattaccagg ccgaagcagc gttgttgcag tgcacggcag 4500
atacacttgc tgatgcggtg ctgattacga ccgctcacgc gtggcagcat caggggaaaa 4560
ccttatttat cagccggaaa acctaccgga ttgatggtag tggtcaaatg gcgattaccg 4620
ttgatgttga agtggcgagc gatacaccgc atccggcgcg gattggcctg aactgccagc 4680
tggcgcaggt agcagagcgg gtaaactggc tcggattagg gccgcaagaa aactatcccg 4740
accgccttac tgccgcctgt tttgaccgct gggatctgcc attgtcagac atgtataccc 4800
cgtacgtctt cccgagcgaa aacggtctgc gctgcgggac gcgcgaattg aattatggcc 4860
cacaccagtg gcgcggcgac ttccagttca acatcagccg ctacagtcaa cagcaactga 4920
tggaaaccag ccatcgccat ctgctgcacg cggaagaagg cacatggctg aatatcgacg 4980
gtttccatat ggggattggt ggcgacgact cctggagccc gtcagtatcg gcggaatttc 5040
agctgagcgc cggtcgctac cattaccagt tggtctggtg tcaaaaataa taataaccgg 5100
gcaggccatg tctgcccgta tttcgcgtaa ggggatccgc cctcccgcac gctttgcggg 5160
agggcttttc ttttaccggt accagctcag attagcttcc cggtctgcat taacatcctg 5220
tactgctcca aggatctgac tggccatgcc ccacaagaaa aaggatccca gtgctatcca 5280
catcgctgct gaaggagatg ttccagtgat cgttgcaccg attaatgcag gtgaagtgaa 5340
gtgagtagaa gatgttagag catcgataaa ggggcgttct ttaaaacgca atttcggtgc 5400
tgaataagca atcactgcta gcactgagag tgtcagccat aaagacgaca tccaggtgcc 5460
aaatatgaaa agaataacta ggaaaggaat tgttgagata gccgaggccc ataacagtgt 5520
gctgtgggaa cttttcggta gcacggcccc ctcgacgccg cctttgcggg gattacgcat 5580
atcagattcg taatcaaaaa catcgttgat accatacatg gcgatgttat acgggataag 5640
aaaaaatacg atgcctagcc aaaacagcca gtcaatctct cctgcattta ataggtaggc 5700
cagaccaaag gggtaggcgg tattgatcca gctaatgggg cgagatgaca atagaattag 5760
tcttattttt tccatcatga ctacggcttt tctggctcag attgcgtggt ggtggatcta 5820
gtagtgatgc ttccattggc gatggtgggt aaggaatggt gtggacgttt tttcctgcgt 5880
ttaaacatat ttccaggcaa ccatagggca ggaatcagaa gtactgcgaa gagcggatag 5940
aaaagatcct ctagggggat taaaccgagc caaatgccaa ggtgctgggt atcgccatat 6000
ccaaagagat cagcccaaac catgaggtta tcaaatatga tagttaggga acatagggta 6060
agggcactga cagcggtgat tggtaaaagt ttaggtgttc cagactgcag ctttaagaca 6120
aataggacca tggctattgc taaaaaagga atgcttataa aaatataagt catggttcaa 6180
cctcgggagt ggtagttggt tggaaagtat cgcgctgtgg tgtgagggga gactttttac 6240
cgggtttttt aggcagtggt gctttaagcc ataatgctgc tgccgaggta aggttgaggg 6300
tgatgtagca gaggaagaat aagaaaaaaa gttcttcaat gggcatatgg ggtgcaaggt 6360
taataccgga cataaacgct gagtctccgc gataaaaagt gccagtaata atgccaaata 6420
tatcccataa aagaaatcca atatatgcag cacctaccga aagaattgct cgtaacggat 6480
ggcggaagaa cgctagcttc caacggtggt cgcacaaagc catgcaccca atgagaacta 6540
ggagagtacc tagataaata aaggccataa aaatatcgct atcttgctca ttttgtgaaa 6600
tatcgatgat agggatcaaa atttaatgat cgtatgaggt cttttgagat ggtgtcgttt 6660
taggcggcaa tggttcggct cacgcgtccc gggatttaaa tcgctagcgg gctgctaaag 6720
gaagcggaac acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag 6780
ctactgggct atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag 6840
tgggcttaca tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt 6900
gccagctggg gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt 6960
cttgccgcca aggatctgat ggcgcagggg atcaagatct gatcaagaga caggatgagg 7020
atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 7080
gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt 7140
ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 7200
gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 7260
cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 7320
gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 7380
tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 7440
gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 7500
tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 7560
catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat 7620
ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 7680
ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 7740
tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 7800
tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 7860
acgcccaacc tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc 7920
ttcggaatcg ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg 7980
gagttcttcg cccacgctag tttaaactgc ggatcagtga gggtttgtaa ctgcgggtca 8040
aggatctgga tttcgatcac ggcacgatca tcgtgcggga gggcaagggc tccaaggatc 8100
gggccttgat gttacccgag agcttggcac ccagcctgcg cgagcagggg aattgatccg 8160
gtggatgacc ttttgaatga cctttaatag attatattac taattaattg gggaccctag 8220
aggtcccctt ttttatttta aaaatttttt cacaaaacgg tttacaagca taacgggttt 8280
tgctgcccgc aaacgggctg ttctggtgtt gctagtttgt tatcagaatc gcagatccgg 8340
cttcaggttt gccggctgaa agcgctattt cttccagaat tgccatgatt ttttccccac 8400
gggaggcgtc actggctccc gtgttgtcgg cagctttgat tcgataagca gcatcgcctg 8460
tttcaggctg tctatgtgtg actgttgagc tgtaacaagt tgtctcaggt gttcaatttc 8520
atgttctagt tgctttgttt tactggtttc acctgttcta ttaggtgtta catgctgttc 8580
atctgttaca ttgtcgatct gttcatggtg aacagcttta aatgcaccaa aaactcgtaa 8640
aagctctgat gtatctatct tttttacacc gttttcatct gtgcatatgg acagttttcc 8700
ctttgatatc taacggtgaa cagttgttct acttttgttt gttagtcttg atgcttcact 8760
gatagataca agagccataa gaacctcaga tccttccgta tttagccagt atgttctcta 8820
gtgtggttcg ttgtttttgc gtgagccatg agaacgaacc attgagatca tgcttacttt 8880
gcatgtcact caaaaatttt gcctcaaaac tggtgagctg aatttttgca gttaaagcat 8940
cgtgtagtgt ttttcttagt ccgttacgta ggtaggaatc tgatgtaatg gttgttggta 9000
ttttgtcacc attcattttt atctggttgt tctcaagttc ggttacgaga tccatttgtc 9060
tatctagttc aacttggaaa atcaacgtat cagtcgggcg gcctcgctta tcaaccacca 9120
atttcatatt gctgtaagtg tttaaatctt tacttattgg tttcaaaacc cattggttaa 9180
gccttttaaa ctcatggtag ttattttcaa gcattaacat gaacttaaat tcatcaaggc 9240
taatctctat atttgccttg tgagttttct tttgtgttag ttcttttaat aaccactcat 9300
aaatcctcat agagtatttg ttttcaaaag acttaacatg ttccagatta tattttatga 9360
atttttttaa ctggaaaaga taaggcaata tctcttcact aaaaactaat tctaattttt 9420
cgcttgagaa cttggcatag tttgtccact ggaaaatctc aaagccttta accaaaggat 9480
tcctgatttc cacagttctc gtcatcagct ctctggttgc tttagctaat acaccataag 9540
cattttccct actgatgttc atcatctgag cgtattggtt ataagtgaac gataccgtcc 9600
gttctttcct tgtagggttt tcaatcgtgg ggttgagtag tgccacacag cataaaatta 9660
gcttggtttc atgctccgtt aagtcatagc gactaatcgc tagttcattt gctttgaaaa 9720
caactaattc agacatacat ctcaattggt ctaggtgatt ttaatcacta taccaattga 9780
gatgggctag tcaatgataa ttactagtcc ttttcctttg agttgtgggt atctgtaaat 9840
tctgctagac ctttgctgga aaacttgtaa attctgctag accctctgta aattccgcta 9900
gacctttgtg tgtttttttt gtttatattc aagtggttat aatttataga ataaagaaag 9960
aataaaaaaa gataaaaaga atagatccca gccctgtgta taactcacta ctttagtcag 10020
ttccgcagta ttacaaaagg atgtcgcaaa cgctgtttgc tcctctacaa aacagacctt 10080
aaaaccctaa aggcttaagt agcaccctcg caagctcggg caaatcgctg aatattcctt 10140
ttgtctccga ccatcaggca cctgagtcgc tgtctttttc gtgacattca gttcgctgcg 10200
ctcacggctc tggcagtgaa tgggggtaaa tggcactaca ggcgcctttt atggattcat 10260
gcaaggaaac tacccataat acaagaaaag cccgtcacgg gcttctcagg gcgttttatg 10320
gcgggtctgc tatgtggtgc tatctgactt tttgctgttc agcagttcct gccctctgat 10380
tttccagtct gaccacttcg gattatcccg tgacaggtca ttcagactgg ctaatgcacc 10440
cagtaaggca gcggtatcat caacaggctt agtttaaacc catcggcatt ttcttttgcg 10500
tttttatttg ttaactgtta attgtccttg ttcaaggatg ctgtctttga caacagatgt 10560
tttcttgcct ttgatgttca gcaggaagct cggcgcaaac gttgattgtt tgtctgcgta 10620
gaatcctctg tttgtcatat agcttgtaat cacgacattg tttcctttcg cttgaggtac 10680
agcgaagtgt gagtaagtaa aggttacatc gttaggatca agatccattt ttaacacaag 10740
gccagttttg ttcagcggct tgtatgggcc agttaaagaa ttagaaacat aaccaagcat 10800
gtaaatatcg ttagacgtaa tgccgtcaat cgtcattttt gatccgcggg agtcagtgaa 10860
caggtaccat ttgccgttca ttttaaagac gttcgcgcgt tcaatttcat ctgttactgt 10920
gttagatgca atcagcggtt tcatcacttt tttcagtgtg taatcatcgt ttagctcaat 10980
cataccgaga gcgccgtttg ctaactcagc cgtgcgtttt ttatcgcttt gcagaagttt 11040
ttgactttct tgacggaaga atgatgtgct tttgccatag tatgctttgt taaataaaga 11100
ttcttcgcct tggtagccat cttcagttcc agtgtttgct tcaaatacta agtatttgtg 11160
gcctttatct tctacgtagt gaggatctct cagcgtatgg ttgtcgcctg agctgtagtt 11220
gccttcatcg atgaactgct gtacattttg atacgttttt ccgtcaccgt caaagattga 11280
tttataatcc tctacaccgt tgatgttcaa agagctgtct gatgctgata cgttaacttg 11340
tgcagttgtc agtgtttgtt tgccgtaatg tttaccggag aaatcagtgt agaataaacg 11400
gatttttccg tcagatgtaa atgtggctga acctgaccat tcttgtgttt ggtcttttag 11460
gatagaatca tttgcatcga atttgtcgct gtctttaaag acgcggccag cgtttttcca 11520
gctgtcaata gaagtttcgc cgactttttg atagaacatg taaatcgatg tgtcatccgc 11580
atttttagga tctccggcta atgcaaagac gatgtggtag ccgtgatagt ttgcgacagt 11640
gccgtcagcg ttttgtaatg gccagctgtc ccaaacgtcc aggccttttg cagaagagat 11700
atttttaatt gtggacgaat caaattcaga aacttgatat ttttcatttt tttgctgttc 11760
agggatttgc agcatatcat ggcgtgtaat atgggaaatg ccgtatgttt ccttatatgg 11820
cttttggttc gtttctttcg caaacgcttg agttgcgcct cctgccagca gtgcggtagt 11880
aaaggttaat actgttgctt gttttgcaaa ctttttgatg ttcatcgttc atgtctcctt 11940
ttttatgtac tgtgttagcg gtctgcttct tccagccctc ctgtttgaag atggcaagtt 12000
agttacgcac aataaaaaaa gacctaaaat atgtaagggg tgacgccaaa gtatacactt 12060
tgccctttac acattttagg tcttgcctgc tttatcagta acaaacccgc gcgatttact 12120
tttcgacctc attctattag actctcgttt ggattgcaac tggtctattt tcctcttttg 12180
tttgatagaa aatcataaaa ggatttgcag actacgggcc taaagaacta aaaaatctat 12240
ctgtttcttt tcattctctg tattttttat agtttctgtt gcatgggcat aaagttgcct 12300
ttttaatcac aattcagaaa atatcataat atctcatttc actaaataat agtgaacggc 12360
aggtatatgt gatgggttaa aaa                                         12383
<210>9
<211>11378
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     载体序列
<400>9
ggatcggcgg ccagggccct catgagatat cgagtggatt tgtgcaaaac tttcaggtgt 60
gcgatgcatg agaatctgcc caataaaatt aagtttgcct cggcgataga ggtctccgtc 120
aataacatcg tcatgaacca aaagggaaaa atgcagtagt tctaaagcca ctgctacctg 180
taaaacggtg ttgagtttga cctcaatgtc atcgtctaca agcgtgttgt atagccccag 240
tagcattcga gggcggatta acttgccacc tcgcaaagct tggaaagcag catctaggca 300
ggtacggaac tctggttgat atgtgctgca ctgttgagat agcgaagcgc agatgcggtt 360
tagttcccga taaatctcat cattgaaatc aagatcagga tgagttgaat gttctgtggt 420
gattgtcatg ccattgtcca ttcgagtatc acacggccag ttatctcgca aaaattccca 480
atcgttgtat atggcgcttt attttgatga agtacagaaa gtgtgaattt gggtccataa 540
aaataatgtg cctacaagaa atttatagta tcccatgagt taatattttt aaaaataaac 600
tttatctgac tttgtagaaa aaggtgatta ctatgctgaa tatgcaggaa ccagataaaa 660
tccatccggc agaacctaca cttcgtaata tttatgacgt taaaactagt gatcccaaaa 720
gtgaattagt tgatcgttct ggcatgtcgg aagaagacat tgcgcaaatt gggcggctaa 780
tgaaatcgtt ggccagtctt cgcgatgtgg aacgtagtat tggtgaagcc tcggcacgtt 840
atatggagct aagtgcccct gatatgcgag ctttgcacta tttgattgtg gcgggcaatg 900
cgggcgaagt ggtgactcca ggaatgcttg gagctgcggc cgcttcgcga agcttgtcga 960
ccgaaacagc agttataagg catgaagctg tccggttttt gcaaaagtgg ctgtgactgt 1020
aaaaagaaat cgaaaaagac cgttttgtgt gaaaacggtc tttttgtttc cttttaacca 1080
actgccataa ctcgaggcta ttgacgacag ctatggttca ctgtccacca accaaaactg 1140
tgctcagtac cgccaatatt tctcccttga ggggtacaaa gaggtgtccc tagaagagat 1200
ccacgctgtg taaaaatttt acaaaaaggt attgactttc cctacagggt gtgtaataat 1260
ttaattacag gcgggggcaa ccccgcctgt tctagagatc cccagcttgt tgatacacta 1320
atgcttttat atagggaaaa ggtggtgaac tactgtggaa gttactgacg taagattacg 1380
ggtcgaccgg gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt 1440
cgccagctgg cgtaatagcg aagaggcccg caccgatcgc ccttcccaac agttgcgcag 1500
cctgaatggc gaatggcgct ttgcctggtt tccggcacca gaagcggtgc cggaaagctg 1560
gctggagtgc gatcttcctg aggccgatac tgtcgtcgtc ccctcaaact ggcagatgca 1620
cggttacgat gcgcccatct acaccaacgt aacctatccc attacggtca atccgccgtt 1680
tgttcccacg gagaatccga cgggttgtta ctcgctcaca tttaatgttg atgaaagctg 1740
gctacaggaa ggccagacgc gaattatttt tgatggcgtt aactcggcgt ttcatctgtg 1800
gtgcaacggg cgctgggtcg gttacggcca ggacagtcgt ttgccgtctg aatttgacct 1860
gagcgcattt ttacgcgccg gagaaaaccg cctcgcggtg atggtgctgc gttggagtga 1920
cggcagttat ctggaagatc aggatatgtg gcggatgagc ggcattttcc gtgacgtctc 1980
gttgctgcat aaaccgacta cacaaatcag cgatttccat gttgccactc gctttaatga 2040
tgatttcagc cgcgctgtac tggaggctga agttcagatg tgcggcgagt tgcgtgacta 2100
cctacgggta acagtttctt tatggcaggg tgaaacgcag gtcgccagcg gcaccgcgcc 2160
tttcggcggt gaaattatcg atgagcgtgg tggttatgcc gatcgcgtca cactacgtct 2220
gaacgtcgaa aacccgaaac tgtggagcgc cgaaatcccg aatctctatc gtgcggtggt 2280
tgaactgcac accgccgacg gcacgctgat tgaagcagaa gcctgcgatg tcggtttccg 2340
cgaggtgcgg attgaaaatg gtctgctgct gctgaacggc aagccgttgc tgattcgagg 2400
cgttaaccgt cacgagcatc atcctctgca tggtcaggtc atggatgagc agacgatggt 2460
gcaggatatc ctgctgatga agcagaacaa ctttaacgcc gtgcgctgtt cgcattatcc 2520
gaaccatccg ctgtggtaca cgctgtgcga ccgctacggc ctgtatgtgg tggatgaagc 2580
caatattgaa acccacggca tggtgccaat gaatcgtctg accgatgatc cgcgctggct 2640
accggcgatg agcgaacgcg taacgcgaat ggtgcagcgc gatcgtaatc acccgagtgt 2700
gatcatctgg tcgctgggga atgaatcagg ccacggcgct aatcacgacg cgctgtatcg 2760
ctggatcaaa tctgtcgatc cttcccgccc ggtgcagtat gaaggcggcg gagccgacac 2820
cacggccacc gatattattt gcccgatgta cgcgcgcgtg gatgaagacc agcccttccc 2880
ggctgtgccg aaatggtcca tcaaaaaatg gctttcgcta cctggagaga cgcgcccgct 2940
gatcctttgc gaatacgccc acgcgatggg taacagtctt ggcggtttcg ctaaatactg 3000
gcaggcgttt cgtcagtatc cccgtttaca gggcggcttc gtctgggact gggtggatca 3060
gtcgctgatt aaatatgatg aaaacggcaa cccgtggtcg gcttacggcg gtgattttgg 3120
cgatacgccg aacgatcgcc agttctgtat gaacggtctg gtctttgccg accgcacgcc 3180
gcatccagcg ctgacggaag caaaacacca gcagcagttt ttccagttcc gtttatccgg 3240
gcaaaccatc gaagtgacca gcgaatacct gttccgtcat agcgataacg agctcctgca 3300
ctggatggtg gcgctggatg gtaagccgct ggcaagcggt gaagtgcctc tggatgtcgc 3360
tccacaaggt aaacagttga ttgaactgcc tgaactaccg cagccggaga gcgccgggca 3420
actctggctc acagtacgcg tagtgcaacc gaacgcgacc gcatggtcag aagccgggca 3480
catcagcgcc tggcagcagt ggcgtctggc ggaaaacctc agtgtgacgc tccccgccgc 3540
gtcccacgcc atcccgcatc tgaccaccag cgaaatggat ttttgcatcg agctgggtaa 3600
taagcgttgg caatttaacc gccagtcagg ctttctttca cagatgtgga ttggcgataa 3660
aaaacaactg ctgacgccgc tgcgcgatca gttcacccgt gcaccgctgg ataacgacat 3720
tggcgtaagt gaagcgaccc gcattgaccc taacgcctgg gtcgaacgct ggaaggcggc 3780
gggccattac caggccgaag cagcgttgtt gcagtgcacg gcagatacac ttgctgatgc 3840
ggtgctgatt acgaccgctc acgcgtggca gcatcagggg aaaaccttat ttatcagccg 3900
gaaaacctac cggattgatg gtagtggtca aatggcgatt accgttgatg ttgaagtggc 3960
gagcgataca ccgcatccgg cgcggattgg cctgaactgc cagctggcgc aggtagcaga 4020
gcgggtaaac tggctcggat tagggccgca agaaaactat cccgaccgcc ttactgccgc 4080
ctgttttgac cgctgggatc tgccattgtc agacatgtat accccgtacg tcttcccgag 4140
cgaaaacggt ctgcgctgcg ggacgcgcga attgaattat ggcccacacc agtggcgcgg 4200
cgacttccag ttcaacatca gccgctacag tcaacagcaa ctgatggaaa ccagccatcg 4260
ccatctgctg cacgcggaag aaggcacatg gctgaatatc gacggtttcc atatggggat 4320
tggtggcgac gactcctgga gcccgtcagt atcggcggaa tttcagctga gcgccggtcg 4380
ctaccattac cagttggtct ggtgtcaaaa ataataataa ccgggcaggc catgtctgcc 4440
cgtatttcgc gtaaggggat ccgccctccc gcacgctttg cgggagggct tttcttttac 4500
cggtaccagc tcaccttaag ctttccccgg catctgtaac aaagacgctt aataggctag 4560
aaaaaggtgg gcatattgtt cgtaatgtgc accccgtcga ccgcagggct ttcgccctca 4620
tggtcactga tgccactcgt ggagaggcga tgcggacgct tggtaagcat caggcgcgtc 4680
gttttgatgc tgctaaacga ttaactccac aagagcgtga agtggttatc cgattccttc 4740
aggatatggc acaggagtta tcccttaata atgcaccatg gctcaacacg gagtagatga 4800
ccatctacgt taattaaagt gtgcagagcg gagtggcggt gtttaagcca cctgtcgctg 4860
ggactgtaat gaatgcgcat ggccaccacc cactgtcctc tgtaatgttc cgaacgtgag 4920
accattggtc actactgagc tgtggcgtgc gggatagtat aaatcctgag gaccggcttg 4980
ggctgccgac gattgctagt gaataatcat cttcgatata ggtcacgcgg tagtttgctt 5040
gattgtcttc actctgaaat ggaatacctg ggaagctaac ctttaatgaa gcattggaaa 5100
ctactttagc gctgccttca ataactgaag gcccaaagaa agtgccacac ttatttgtta 5160
cagagattgt gtccgagtcg atcacgccgt aatcagcggt aacgtcatgt gagcactgta 5220
aagagaatgg ttggggaatt gctgcgactt gataccactt gcctttgtag cgttctaggt 5280
caatgctatt ttcaatttcg ggcagcgcta ggttttcagg aaccgaactt aggttagata 5340
cctgcgagga gccacctgca agtcgtccgc cgtcaaaaat gtcttgggct tgtgccgtgg 5400
atatcccgaa aagtgaaatg gctgcgagta gtgctgtggt gacaagtttg cttgaaatgc 5460
gcataaagca aatcctttct tcatgtttat attaactcaa tagttattac ttctaaaagt 5520
atagtagata gttgtggatg ggtgaagaat ttcatagaaa tcgcactcga ttcactaaag 5580
acccaagagt aaaatcccag gatttgctta tacttgcgct catggataat caacttcgtc 5640
ccactttgca ttatcaagct caaaacccgc accctcacgc gtcccgggat ttaaatcgct 5700
agcgggctgc taaaggaagc ggaacacgta gaaagccagt ccgcagaaac ggtgctgacc 5760
ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5820
gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5880
aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5940
aaactggatg gctttcttgc cgccaaggat ctgatggcgc aggggatcaa gatctgatca 6000
agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 6060
ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 6120
tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 6180
cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt ggctggccac 6240
gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 6300
gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 6360
agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 6420
attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 6480
tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 6540
caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 6600
cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6660
gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6720
tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6780
gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct ggggttcgaa 6840
atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc 6900
tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc 6960
ggggatctca tgctggagtt cttcgcccac gctagtttaa actgcggatc agtgagggtt 7020
tgtaactgcg ggtcaaggat ctggatttcg atcacggcac gatcatcgtg cgggagggca 7080
agggctccaa ggatcgggcc ttgatgttac ccgagagctt ggcacccagc ctgcgcgagc 7140
aggggaattg atccggtgga tgaccttttg aatgaccttt aatagattat attactaatt 7200
aattggggac cctagaggtc ccctttttta ttttaaaaat tttttcacaa aacggtttac 7260
aagcataacg ggttttgctg cccgcaaacg ggctgttctg gtgttgctag tttgttatca 7320
gaatcgcaga tccggcttca ggtttgccgg ctgaaagcgc tatttcttcc agaattgcca 7380
tgattttttc cccacgggag gcgtcactgg ctcccgtgtt gtcggcagct ttgattcgat 7440
aagcagcatc gcctgtttca ggctgtctat gtgtgactgt tgagctgtaa caagttgtct 7500
caggtgttca atttcatgtt ctagttgctt tgttttactg gtttcacctg ttctattagg 7560
tgttacatgc tgttcatctg ttacattgtc gatctgttca tggtgaacag ctttaaatgc 7620
accaaaaact cgtaaaagct ctgatgtatc tatctttttt acaccgtttt catctgtgca 7680
tatggacagt tttccctttg atatctaacg gtgaacagtt gttctacttt tgtttgttag 7740
tcttgatgct tcactgatag atacaagagc cataagaacc tcagatcctt ccgtatttag 7800
ccagtatgtt ctctagtgtg gttcgttgtt tttgcgtgag ccatgagaac gaaccattga 7860
gatcatgctt actttgcatg tcactcaaaa attttgcctc aaaactggtg agctgaattt 7920
ttgcagttaa agcatcgtgt agtgtttttc ttagtccgtt acgtaggtag gaatctgatg 7980
taatggttgt tggtattttg tcaccattca tttttatctg gttgttctca agttcggtta 8040
cgagatccat ttgtctatct agttcaactt ggaaaatcaa cgtatcagtc gggcggcctc 8100
gcttatcaac caccaatttc atattgctgt aagtgtttaa atctttactt attggtttca 8160
aaacccattg gttaagcctt ttaaactcat ggtagttatt ttcaagcatt aacatgaact 8220
taaattcatc aaggctaatc tctatatttg ccttgtgagt tttcttttgt gttagttctt 8280
ttaataacca ctcataaatc ctcatagagt atttgttttc aaaagactta acatgttcca 8340
gattatattt tatgaatttt tttaactgga aaagataagg caatatctct tcactaaaaa 8400
ctaattctaa tttttcgctt gagaacttgg catagtttgt ccactggaaa atctcaaagc 8460
ctttaaccaa aggattcctg atttccacag ttctcgtcat cagctctctg gttgctttag 8520
ctaatacacc ataagcattt tccctactga tgttcatcat ctgagcgtat tggttataag 8580
tgaacgatac cgtccgttct ttccttgtag ggttttcaat cgtggggttg agtagtgcca 8640
cacagcataa aattagcttg gtttcatgct ccgttaagtc atagcgacta atcgctagtt 8700
catttgcttt gaaaacaact aattcagaca tacatctcaa ttggtctagg tgattttaat 8760
cactatacca attgagatgg gctagtcaat gataattact agtccttttc ctttgagttg 8820
tgggtatctg taaattctgc tagacctttg ctggaaaact tgtaaattct gctagaccct 8880
ctgtaaattc cgctagacct ttgtgtgttt tttttgttta tattcaagtg gttataattt 8940
atagaataaa gaaagaataa aaaaagataa aaagaataga tcccagccct gtgtataact 9000
cactacttta gtcagttccg cagtattaca aaaggatgtc gcaaacgctg tttgctcctc 9060
tacaaaacag accttaaaac cctaaaggct taagtagcac cctcgcaagc tcgggcaaat 9120
cgctgaatat tccttttgtc tccgaccatc aggcacctga gtcgctgtct ttttcgtgac 9180
attcagttcg ctgcgctcac ggctctggca gtgaatgggg gtaaatggca ctacaggcgc 9240
cttttatgga ttcatgcaag gaaactaccc ataatacaag aaaagcccgt cacgggcttc 9300
tcagggcgtt ttatggcggg tctgctatgt ggtgctatct gactttttgc tgttcagcag 9360
ttcctgccct ctgattttcc agtctgacca cttcggatta tcccgtgaca ggtcattcag 9420
actggctaat gcacccagta aggcagcggt atcatcaaca ggcttagttt aaacccatcg 9480
gcattttctt ttgcgttttt atttgttaac tgttaattgt ccttgttcaa ggatgctgtc 9540
tttgacaaca gatgttttct tgcctttgat gttcagcagg aagctcggcg caaacgttga 9600
ttgtttgtct gcgtagaatc ctctgtttgt catatagctt gtaatcacga cattgtttcc 9660
tttcgcttga ggtacagcga agtgtgagta agtaaaggtt acatcgttag gatcaagatc 9720
catttttaac acaaggccag ttttgttcag cggcttgtat gggccagtta aagaattaga 9780
aacataacca agcatgtaaa tatcgttaga cgtaatgccg tcaatcgtca tttttgatcc 9840
gcgggagtca gtgaacaggt accatttgcc gttcatttta aagacgttcg cgcgttcaat 9900
ttcatctgtt actgtgttag atgcaatcag cggtttcatc acttttttca gtgtgtaatc 9960
atcgtttagc tcaatcatac cgagagcgcc gtttgctaac tcagccgtgc gttttttatc 10020
gctttgcaga agtttttgac tttcttgacg gaagaatgat gtgcttttgc catagtatgc 10080
tttgttaaat aaagattctt cgccttggta gccatcttca gttccagtgt ttgcttcaaa 10140
tactaagtat ttgtggcctt tatcttctac gtagtgagga tctctcagcg tatggttgtc 10200
gcctgagctg tagttgcctt catcgatgaa ctgctgtaca ttttgatacg tttttccgtc 10260
accgtcaaag attgatttat aatcctctac accgttgatg ttcaaagagc tgtctgatgc 10320
tgatacgtta acttgtgcag ttgtcagtgt ttgtttgccg taatgtttac cggagaaatc 10380
agtgtagaat aaacggattt ttccgtcaga tgtaaatgtg gctgaacctg accattcttg 10440
tgtttggtct tttaggatag aatcatttgc atcgaatttg tcgctgtctt taaagacgcg 10500
gccagcgttt ttccagctgt caatagaagt ttcgccgact ttttgataga acatgtaaat 10560
cgatgtgtca tccgcatttt taggatctcc ggctaatgca aagacgatgt ggtagccgtg 10620
atagtttgcg acagtgccgt cagcgttttg taatggccag ctgtcccaaa cgtccaggcc 10680
ttttgcagaa gagatatttt taattgtgga cgaatcaaat tcagaaactt gatatttttc 10740
atttttttgc tgttcaggga tttgcagcat atcatggcgt gtaatatggg aaatgccgta 10800
tgtttcctta tatggctttt ggttcgtttc tttcgcaaac gcttgagttg cgcctcctgc 10860
cagcagtgcg gtagtaaagg ttaatactgt tgcttgtttt gcaaactttt tgatgttcat 10920
cgttcatgtc tcctttttta tgtactgtgt tagcggtctg cttcttccag ccctcctgtt 10980
tgaagatggc aagttagtta cgcacaataa aaaaagacct aaaatatgta aggggtgacg 11040
ccaaagtata cactttgccc tttacacatt ttaggtcttg cctgctttat cagtaacaaa 11100
cccgcgcgat ttacttttcg acctcattct attagactct cgtttggatt gcaactggtc 11160
tattttcctc ttttgtttga tagaaaatca taaaaggatt tgcagactac gggcctaaag 11220
aactaaaaaa tctatctgtt tcttttcatt ctctgtattt tttatagttt ctgttgcatg 11280
ggcataaagt tgccttttta atcacaattc agaaaatatc ataatatctc atttcactaa 11340
ataatagtga acggcaggta tatgtgatgg gttaaaaa                         11378
<210>10
<211>10322
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>10
ggatcggcgg ccagggccct catgagatat cgagtcagcg ctgtattgcc cgtgaagttg 60
atggtgtttc cgctgccctg ctgggtggga ttggaggtgt aatcaatgaa ccaaccagga 120
gttccggtgc cagtgagatc aaataccacg cggtcaaagc cactgtgaga gccaatccga 180
acatcggtga ccatgagctg tgcaggcgca tcaggtcgga gagtcttcat tgctacatcg 240
gcttcgccca atgcggttgg gccggtggaa gcttcgttgg acaactgtgc gccatccgca 300
gttgcggaca tagtttgggt tacagaagaa gcatcgttgg tggtggaatt ggaggttcca 360
caacccgcaa gagtcaacgc gctagcgccg acaatcgcta gagtcttcag gcgggcacga 420
tgctttgaat gagaagttgg ctgcacaatc atgcacacac cgtaaccctg ggtcaccccc 480
gaaacctaag caagacgccc aatttcgctc aatcgtgaac gaattgttgt aattcgtctt 540
aaaaacgcca ggagacgtga aaattacaga caccccagac atcagatgga ggcggcgata 600
ctagggtaga ggacatgact cttcgctgtt ctgacgtcaa tgttgaaccc ctgccgggaa 660
cggcaaaaac aggttctggg tttgttctcc ttgaacatgc tggctcgtgg agccgtgatg 720
ttttagacgg cggaacattt gatcctgagt tgactgatca attgaagagg cacctgaaag 780
cttccggaat gggtctgcaa ttaattagga agccgggaag ggagggtcga aacgtcgaaa 840
agcataatct ttttctcgtt tttgctgagg cctcaattat tgagcacctg gtggtggacg 900
cgccggctga tgttttggat cttgatttaa gcgggccggg caaaaacaat gcgcagcgca 960
tggatgatcc gatgctgctg atttgtacgc attcgaagcg cgatgtgtgc tgcgcgatca 1020
aggggcgtcc gctggcagct gccgtggagc cacaatttgg gccgctgcat gtgtgggagg 1080
cttcgcacac caagggccac cgttttgcgc catcgatgct gctcatgccg tggaattact 1140
cttatggcct acttgatgag gccgaaaccg tgcagctttt ccaaggcgcg ttggacaaca 1200
aactcttcct gccgggcaac cgtggccgag gaaccttaga tgctcgtggc caggttgcag 1260
aaattgccgt ggcggaagct ttcggcgagg cggttgctcc tgcgagtttg caggttgaat 1320
tcgaagatga ttctgttttg gttactcatc ccgatgggcg cacgtgggtt gtggagcttg 1380
aacgcatcga ggtcgacggc gtggtgtcct cgtgtggtga tcagccgaaa actggaaaag 1440
cgtgggtggc taggcaagtt acagaactga tcggataaaa gcagagttat atctgatgaa 1500
ttgctattag cagtatcgtt atcacagcac caacaaagta gttcagccac aggaaaactt 1560
tccaactgcg attagcctgt tcacaactgg catctgtaat gttccaaaat cgtgcggcat 1620
taaatacgta agttagaatc gcaatcccga tgatccacgc cggattaggc aaagtagtga 1680
ctaacacagc agctagtaaa taaagtacta ctgaaagccg aatggctcca cgcgccccaa 1740
ttacagtggc aattgagctg cggccgcaca gcgatcccag aggaaatatc ctctggggtc 1800
gctgtgtcga ccttaaagtt tggctgccat gtgaattttt agcaccctca acagttgagt 1860
gctggcactc tcgggggtag agtgccaaat aggttgtttg acacacagtt gttcacccgc 1920
gacgacggct gtgctggaaa cccacaaccg gcacacacaa aatttttcta gaaggaggag 1980
aaaacatgtc acagcacgtt gaaacgaaat tagctcaaat tgggaaccgt agcgatgaag 2040
tcacgggaac agtgagtgct cctatctatt tatcaacagc ataccgccac agagggatcg 2100
gagaatctac cggatttgat tatgtccgca caaaaaatcc gacacgccag cttgttgagg 2160
acgcgatcgc taacttagaa aacggcgcga gagggcttgc ctttagttcg ggaatggctg 2220
ctatccaaac gattatggcg ctgtttaaaa gcggagatga actgatcgtt tcatcggacc 2280
tatatggcgg cacgtaccgt ttatttgaaa atgaatggaa aaaatacgga ttgacttttc 2340
attatgatga tttcagcgat gaggactgtt tacgctctaa gattacgccg aatacaaaag 2400
cggtgtttgt ggaaacgccg acaaaccccc tcatgcagga ggcggacatt gaacatattg 2460
cccggattac aaaggagcac ggtcttctgc tgatcgtaga taatacattt tatacaccgg 2520
tcttgcagcg gccgcttgag ctgggagctg acattgtcat tcacagcgca accaagtatt 2580
taggcgggca taacgatctg cttgctggac ttgtcgtggt gaaggatgag cggctcggag 2640
aggaaatgtt tcagcatcaa aatgcaatcg gcgccgtcct gccgccattt gattcgtggc 2700
ttctgatgag aggaatgaag acgctgagcc tcagaatgcg ccagcatcag gcaaacgcgc 2760
aggagcttgc ggcgttttta gaagagcagg aagaaatttc ggatgtgctg tatcccggaa 2820
aaggcggcat gctgtccttc cgtctgcaaa aagaagaatg ggtcaatccg tttttaaaag 2880
cactgaagac catttgtttt gcagaaagcc tcggcggggt ggaaagcttt attacatacc 2940
ctgcgaccca gacgcacatg gatattcctg aagagatccg catcgcaaac ggggtgtgca 3000
atcggttgct gcgcttttct gtcggtattg aacatgcgga agatttaaaa gaggatctaa 3060
aacaggcatt atgtcaggtc aaagagggag ctgtttcatt tgagtaaaca caattggacg 3120
ctggaaaccc agctcgtgca caatccattt aaaacagacg gcggaaccgg ggcagtcagt 3180
gtaccgattc agcacgcctc aggatcccag tgctatccac atcgctgctg aaggagatgt 3240
tccagtgatc gttgcaccga ttaatgcagg tgaagtgaag tgagtagaag atgttagagc 3300
atcgataaag gggcgttctt taaaacgcaa tttcggtgct gaataagcaa tcactgctag 3360
cactgagagt gtcagccata aagacgacat ccaggtgcca aatatgaaaa gaataactag 3420
gaaaggaatt gttgagatag ccgaggccca taacagtgtg ctgtgggaac ttttcggtag 3480
cacggccccc tcgacgccgc ctttgcgggg attacgcata tcagattcgt aatcaaaaac 3540
atcgttgata ccatacatgg cgatgttata cgggataaga aaaaatacga tgcctagcca 3600
aaacagccag tcaatctctc ctgcatttaa taggtaggcc agaccaaagg ggtaggcggt 3660
attgatccag ctaatggggc gagatgacaa tagaattagt cttatttttt ccatcatgac 3720
tacggctttt ctggctcaga ttgcgtggtg gtggatctag tagtgatgct tccattggcg 3780
atggtgggta aggaatggtg tggacgtttt ttcctgcgtt taaacatatt tccaggcaac 3840
catagggcag gaatcagaag tactgcgaag agcggataga aaagatcctc tagggggatt 3900
aaaccgagcc aaatgccaag gtgctgggta tcgccatatc caaagagatc agcccaaacc 3960
atgaggttat caaatatgat agttagggaa catagggtaa gggcactgac agcggtgatt 4020
ggtaaaagtt taggtgttcc agactgcagc tttaagacaa ataggaccat ggctattgct 4080
aaaaaaggaa tgcttataaa aatataagtc atggttcaac ctcgggagtg gtagttggtt 4140
ggaaagtatc gcgctgtggt gtgaggggag actttttacc gggtttttta ggcagtggtg 4200
ctttaagcca taatgctgct gccgaggtaa ggttgagggt gatgtagcag aggaagaata 4260
agaaaaaaag ttcttcaatg ggcatatggg gtgcaaggtt aataccggac ataaacgctg 4320
agtctccgcg ataaaaagtg ccagtaataa tgccaaatat atcccataaa agaaatccaa 4380
tatatgcagc acctaccgaa agaattgctc gtaacggatg gcggaagaac gctagcttcc 4440
aacggtggtc gcacaaagcc atgcacccaa tgagaactag gagagtacct agataaataa 4500
aggccataaa aatatcgcta tcttgctcat tttgtgaaat atcgatgata gggatcaaaa 4560
tttaatgatc gtatgaggtc ttttgagatg gtgtcgtttt aggcggcaat ggttcggctc 4620
acgcgtcccg ggatttaaat cgctagcggg ctgctaaagg aagcggaaca cgtagaaagc 4680
cagtccgcag aaacggtgct gaccccggat gaatgtcagc tactgggcta tctggacaag 4740
ggaaaacgca agcgcaaaga gaaagcaggt agcttgcagt gggcttacat ggcgatagct 4800
agactgggcg gttttatgga cagcaagcga accggaattg ccagctgggg cgccctctgg 4860
taaggttggg aagccctgca aagtaaactg gatggctttc ttgccgccaa ggatctgatg 4920
gcgcagggga tcaagatctg atcaagagac aggatgagga tcgtttcgca tgattgaaca 4980
agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg gctatgactg 5040
ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg 5100
cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc aggacgaggc 5160
agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt 5220
cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg atctcctgtc 5280
atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc ggcggctgca 5340
tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca tcgagcgagc 5400
acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag agcatcaggg 5460
gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc atgcccgacg gcgaggatct 5520
cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc 5580
tggattcatc gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc 5640
tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta 5700
cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg acgagttctt 5760
ctgagcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct gccatcacga 5820
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 5880
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccacgctagt 5940
ttaaactgcg gatcagtgag ggtttgtaac tgcgggtcaa ggatctggat ttcgatcacg 6000
gcacgatcat cgtgcgggag ggcaagggct ccaaggatcg ggccttgatg ttacccgaga 6060
gcttggcacc cagcctgcgc gagcagggga attgatccgg tggatgacct tttgaatgac 6120
ctttaataga ttatattact aattaattgg ggaccctaga ggtccccttt tttattttaa 6180
aaattttttc acaaaacggt ttacaagcat aacgggtttt gctgcccgca aacgggctgt 6240
tctggtgttg ctagtttgtt atcagaatcg cagatccggc ttcaggtttg ccggctgaaa 6300
gcgctatttc ttccagaatt gccatgattt tttccccacg ggaggcgtca ctggctcccg 6360
tgttgtcggc agctttgatt cgataagcag catcgcctgt ttcaggctgt ctatgtgtga 6420
ctgttgagct gtaacaagtt gtctcaggtg ttcaatttca tgttctagtt gctttgtttt 6480
actggtttca cctgttctat taggtgttac atgctgttca tctgttacat tgtcgatctg 6540
ttcatggtga acagctttaa atgcaccaaa aactcgtaaa agctctgatg tatctatctt 6600
ttttacaccg ttttcatctg tgcatatgga cagttttccc tttgatatct aacggtgaac 6660
agttgttcta cttttgtttg ttagtcttga tgcttcactg atagatacaa gagccataag 6720
aacctcagat ccttccgtat ttagccagta tgttctctag tgtggttcgt tgtttttgcg 6780
tgagccatga gaacgaacca ttgagatcat gcttactttg catgtcactc aaaaattttg 6840
cctcaaaact ggtgagctga atttttgcag ttaaagcatc gtgtagtgtt tttcttagtc 6900
cgttacgtag gtaggaatct gatgtaatgg ttgttggtat tttgtcacca ttcattttta 6960
tctggttgtt ctcaagttcg gttacgagat ccatttgtct atctagttca acttggaaaa 7020
tcaacgtatc agtcgggcgg cctcgcttat caaccaccaa tttcatattg ctgtaagtgt 7080
ttaaatcttt acttattggt ttcaaaaccc attggttaag ccttttaaac tcatggtagt 7140
tattttcaag cattaacatg aacttaaatt catcaaggct aatctctata tttgccttgt 7200
gagttttctt ttgtgttagt tcttttaata accactcata aatcctcata gagtatttgt 7260
tttcaaaaga cttaacatgt tccagattat attttatgaa tttttttaac tggaaaagat 7320
aaggcaatat ctcttcacta aaaactaatt ctaatttttc gcttgagaac ttggcatagt 7380
ttgtccactg gaaaatctca aagcctttaa ccaaaggatt cctgatttcc acagttctcg 7440
tcatcagctc tctggttgc tttagctaata caccataagc attttcccta ctgatgttca 7500
tcatctgagc gtattggtta taagtgaacg ataccgtccg ttctttcctt gtagggtttt 7560
caatcgtggg gttgagtagt gccacacagc ataaaattag cttggtttca tgctccgtta 7620
agtcatagcg actaatcgct agttcatttg ctttgaaaac aactaattca gacatacatc 7680
tcaattggtc taggtgattt taatcactat accaattgag atgggctagt caatgataat 7740
tactagtcct tttcctttga gttgtgggta tctgtaaatt ctgctagacc tttgctggaa 7800
aacttgtaaa ttctgctaga ccctctgtaa attccgctag acctttgtgt gttttttttg 7860
tttatattca agtggttata atttatagaa taaagaaaga ataaaaaaag ataaaaagaa 7920
tagatcccag ccctgtgtat aactcactac tttagtcagt tccgcagtat tacaaaagga 7980
tgtcgcaaac gctgtttgct cctctacaaa acagacctta aaaccctaaa ggcttaagta 8040
gcaccctcgc aagctcgggc aaatcgctga atattccttt tgtctccgac catcaggcac 8100
ctgagtcgct gtctttttcg tgacattcag ttcgctgcgc tcacggctct ggcagtgaat 8160
gggggtaaat ggcactacag gcgcctttta tggattcatg caaggaaact acccataata 8220
caagaaaagc ccgtcacggg cttctcaggg cgttttatgg cgggtctgct atgtggtgct 8280
atctgacttt ttgctgttca gcagttcctg ccctctgatt ttccagtctg accacttcgg 8340
attatcccgt gacaggtcat tcagactggc taatgcaccc agtaaggcag cggtatcatc 8400
aacaggctta gtttaaaccc atcggcattt tcttttgcgt ttttatttgt taactgttaa 8460
ttgtccttgt tcaaggatgc tgtctttgac aacagatgtt ttcttgcctt tgatgttcag 8520
caggaagctc ggcgcaaacg ttgattgttt gtctgcgtag aatcctctgt ttgtcatata 8580
gcttgtaatc acgacattgt ttcctttcgc ttgaggtaca gcgaagtgtg agtaagtaaa 8640
ggttacatcg ttaggatcaa gatccatttt taacacaagg ccagttttgt tcagcggctt 8700
gtatgggcca gttaaagaat tagaaacata accaagcatg taaatatcgt tagacgtaat 8760
gccgtcaatc gtcatttttg atccgcggga gtcagtgaac aggtaccatt tgccgttcat 8820
tttaaagacg ttcgcgcgtt caatttcatc tgttactgtg ttagatgcaa tcagcggttt 8880
catcactttt ttcagtgtgt aatcatcgtt tagctcaatc ataccgagag cgccgtttgc 8940
taactcagcc gtgcgttttt tatcgctttg cagaagtttt tgactttctt gacggaagaa 9000
tgatgtgctt ttgccatagt atgctttgtt aaataaagat tcttcgcctt ggtagccatc 9060
ttcagttcca gtgtttgctt caaatactaa gtatttgtgg cctttatctt ctacgtagtg 9120
aggatctctc agcgtatggt tgtcgcctga gctgtagttg ccttcatcga tgaactgctg 9180
tacattttga tacgtttttc cgtcaccgtc aaagattgat ttataatcct ctacaccgtt 9240
gatgttcaaa gagctgtctg atgctgatac gttaacttgt gcagttgtca gtgtttgttt 9300
gccgtaatgt ttaccggaga aatcagtgta gaataaacgg atttttccgt cagatgtaaa 9360
tgtggctgaa cctgaccatt cttgtgtttg gtcttttagg atagaatcat ttgcatcgaa 9420
tttgtcgctg tctttaaaga cgcggccagc gtttttccag ctgtcaatag aagtttcgcc 9480
gactttttga tagaacatgt aaatcgatgt gtcatccgca tttttaggat ctccggctaa 9540
tgcaaagacg atgtggtagc cgtgatagtt tgcgacagtg ccgtcagcgt tttgtaatgg 9600
ccagctgtcc caaacgtcca ggccttttgc agaagagata tttttaattg tggacgaatc 9660
aaattcagaa acttgatatt tttcattttt ttgctgttca gggatttgca gcatatcatg 9720
gcgtgtaata tgggaaatgc cgtatgtttc cttatatggc ttttggttcg tttctttcgc 9780
aaacgcttga gttgcgcctc ctgccagcag tgcggtagta aaggttaata ctgttgcttg 9840
ttttgcaaac tttttgatgt tcatcgttca tgtctccttt tttatgtact gtgttagcgg 9900
tctgcttctt ccagccctcc tgtttgaaga tggcaagtta gttacgcaca ataaaaaaag 9960
acctaaaata tgtaaggggt gacgccaaag tatacacttt gccctttaca cattttaggt 10020
cttgcctgct ttatcagtaa caaacccgcg cgatttactt ttcgacctca ttctattaga 10080
ctctcgtttg gattgcaact ggtctatttt cctcttttgt ttgatagaaa atcataaaag 10140
gatttgcaga ctacgggcct aaagaactaa aaaatctatc tgtttctttt cattctctgt 10200
attttttata gtttctgttg catgggcata aagttgcctt tttaatcaca attcagaaaa 10260
tatcataata tctcatttca ctaaataata gtgaacggca ggtatatgtg atgggttaaa 10320
aa                                                                10322
<210>11
<211>10324
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>11
ggatcggcgg ccagggccct catgagatat cgagtcagcg ctgtattgcc cgtgaagttg 60
atggtgtttc cgctgccctg ctgggtggga ttggaggtgt aatcaatgaa ccaaccagga 120
gttccggtgc cagtgagatc aaataccacg cggtcaaagc cactgtgaga gccaatccga 180
acatcggtga ccatgagctg tgcaggcgca tcaggtcgga gagtcttcat tgctacatcg 240
gcttcgccca atgcggttgg gccggtggaa gcttcgttgg acaactgtgc gccatccgca 300
gttgcggaca tagtttgggt tacagaagaa gcatcgttgg tggtggaatt ggaggttcca 360
caacccgcaa gagtcaacgc gctagcgccg acaatcgcta gagtcttcag gcgggcacga 420
tgctttgaat gagaagttgg ctgcacaatc atgcacacac cgtaaccctg ggtcaccccc 480
gaaacctaag caagacgccc aatttcgctc aatcgtgaac gaattgttgt aattcgtctt 540
aaaaacgcca ggagacgtga aaattacaga caccccagac atcagatgga ggcggcgata 600
ctagggtaga ggacatgact cttcgctgtt ctgacgtcaa tgttgaaccc ctgccgggaa 660
cggcaaaaac aggttctggg tttgttctcc ttgaacatgc tggctcgtgg agccgtgatg 720
ttttagacgg cggaacattt gatcctgagt tgactgatca attgaagagg cacctgaaag 780
cttccggaat gggtctgcaa ttaattagga agccgggaag ggagggtcga aacgtcgaaa 840
agcataatct ttttctcgtt tttgctgagg cctcaattat tgagcacctg gtggtggacg 900
cgccggctga tgttttggat cttgatttaa gcgggccggg caaaaacaat gcgcagcgca 960
tggatgatcc gatgctgctg atttgtacgc attcgaagcg cgatgtgtgc tgcgcgatca 1020
aggggcgtcc gctggcagct gccgtggagc cacaatttgg gccgctgcat gtgtgggagg 1080
cttcgcacac caagggccac cgttttgcgc catcgatgct gctcatgccg tggaattact 1140
cttatggcct acttgatgag gccgaaaccg tgcagctttt ccaaggcgcg ttggacaaca 1200
aactcttcct gccgggcaac cgtggccgag gaaccttaga tgctcgtggc caggttgcag 1260
aaattgccgt ggcggaagct ttcggcgagg cggttgctcc tgcgagtttg caggttgaat 1320
tcgaagatga ttctgttttg gttactcatc ccgatgggcg cacgtgggtt gtggagcttg 1380
aacgcatcga ggtcgacggc gtggtgtcct cgtgtggtga tcagccgaaa actggaaaag 1440
cgtgggtggc taggcaagtt acagaactga tcggataaaa gcagagttat atctgatgaa 1500
ttgctattag cagtatcgtt atcacagcac caacaaagta gttcagccac aggaaaactt 1560
tccaactgcg attagcctgt tcacaactgg catctgtaat gttccaaaat cgtgcggcat 1620
taaatacgta agttagaatc gcaatcccga tgatccacgc cggattaggc aaagtagtga 1680
ctaacacagc agctagtaaa taaagtacta ctgaaagccg aatggctcca cgcgccccaa 1740
ttacagtggc aattgagctg cggccgcaca gcgatcccag aggaaatatc ctctggggtc 1800
gctgtgtcga ccttaaagtt tggctgccat gtgaattttt agcaccctca acagttgagt 1860
gctggcactc tcgggggtag agtgccaaat aggttgtttg acacacagtt gttcacccgc 1920
gacgacggct gtgctggaaa cccacaaccg gcacacacaa aatttttcta gaccaggagg 1980
acatacagtg tcacagcacg ttgaaacgaa attagctcaa attgggaacc gtagcgatga 2040
agtcacggga acagtgagtg ctcctatcta tttatcaaca gcataccgcc acagagggat 2100
cggagaatct accggatttg attatgtccg cacaaaaaat ccgacacgcc agcttgttga 2160
ggacgcgatc gctaacttag aaaacggcgc gagagggctt gcctttagtt cgggaatggc 2220
tgctatccaa acgattatgg cgctgtttaa aagcggagat gaactgatcg tttcatcgga 2280
cctatatggc ggcacgtacc gtttatttga aaatgaatgg aaaaaatacg gattgacttt 2340
tcattatgat gatttcagcg atgaggactg tttacgctct aagattacgc cgaatacaaa 2400
agcggtgttt gtggaaacgc cgacaaaccc cctcatgcag gaggcggaca ttgaacatat 2460
tgcccggatt acaaaggagc acggtcttct gctgatcgta gataatacat tttatacacc 2520
ggtcttgcag cggccgcttg agctgggagc tgacattgtc attcacagcg caaccaagta 2580
tttaggcggg cataacgatc tgcttgctgg acttgtcgtg gtgaaggatg agcggctcgg 2640
agaggaaatg tttcagcatc aaaatgcaat cggcgccgtc ctgccgccat ttgattcgtg 2700
gcttctgatg agaggaatga agacgctgag cctcagaatg cgccagcatc aggcaaacgc 2760
gcaggagctt gcggcgtttt tagaagagca ggaagaaatt tcggatgtgc tgtatcccgg 2820
aaaaggcggc atgctgtcct tccgtctgca aaaagaagaa tgggtcaatc cgtttttaaa 2880
agcactgaag accatttgtt ttgcagaaag cctcggcggg gtggaaagct ttattacata 2940
ccctgcgacc cagacgcaca tggatattcc tgaagagatc cgcatcgcaa acggggtgtg 3000
caatcggttg ctgcgctttt ctgtcggtat tgaacatgcg gaagatttaa aagaggatct 3060
aaaacaggca ttatgtcagg tcaaagaggg agctgtttca tttgagtaaa cacaattgga 3120
cgctggaaac ccagctcgtg cacaatccat ttaaaacaga cggcggaacc ggggcagtca 3180
gtgtaccgat tcagcacgcc tcaggatccc agtgctatcc acatcgctgc tgaaggagat 3240
gttccagtga tcgttgcacc gattaatgca ggtgaagtga agtgagtaga agatgttaga 3300
gcatcgataa aggggcgttc tttaaaacgc aatttcggtg ctgaataagc aatcactgct 3360
agcactgaga gtgtcagcca taaagacgac atccaggtgc caaatatgaa aagaataact 3420
aggaaaggaa ttgttgagat agccgaggcc cataacagtg tgctgtggga acttttcggt 3480
agcacggccc cctcgacgcc gcctttgcgg ggattacgca tatcagattc gtaatcaaaa 3540
acatcgttga taccatacat ggcgatgtta tacgggataa gaaaaaatac gatgcctagc 3600
caaaacagcc agtcaatctc tcctgcattt aataggtagg ccagaccaaa ggggtaggcg 3660
gtattgatcc agctaatggg gcgagatgac aatagaatta gtcttatttt ttccatcatg 3720
actacggctt ttctggctca gattgcgtgg tggtggatct agtagtgatg cttccattgg 3780
cgatggtggg taaggaatgg tgtggacgtt ttttcctgcg tttaaacata tttccaggca 3840
accatagggc aggaatcaga agtactgcga agagcggata gaaaagatcc tctaggggga 3900
ttaaaccgag ccaaatgcca aggtgctggg tatcgccata tccaaagaga tcagcccaaa 3960
ccatgaggtt atcaaatatg atagttaggg aacatagggt aagggcactg acagcggtga 4020
ttggtaaaag tttaggtgtt ccagactgca gctttaagac aaataggacc atggctattg 4080
ctaaaaaagg aatgcttata aaaatataag tcatggttca acctcgggag tggtagttgg 4140
ttggaaagta tcgcgctgtg gtgtgagggg agacttttta ccgggttttt taggcagtgg 4200
tgctttaagc cataatgctg ctgccgaggt aaggttgagg gtgatgtagc agaggaagaa 4260
taagaaaaaa agttcttcaa tgggcatatg gggtgcaagg ttaataccgg acataaacgc 4320
tgagtctccg cgataaaaag tgccagtaat aatgccaaat atatcccata aaagaaatcc 4380
aatatatgca gcacctaccg aaagaattgc tcgtaacgga tggcggaaga acgctagctt 4440
ccaacggtgg tcgcacaaag ccatgcaccc aatgagaact aggagagtac ctagataaat 4500
aaaggccata aaaatatcgc tatcttgctc attttgtgaa atatcgatga tagggatcaa 4560
aatttaatga tcgtatgagg tcttttgaga tggtgtcgtt ttaggcggca atggttcggc 4620
tcacgcgtcc cgggatttaa atcgctagcg ggctgctaaa ggaagcggaa cacgtagaaa 4680
gccagtccgc agaaacggtg ctgaccccgg atgaatgtca gctactgggc tatctggaca 4740
agggaaaacg caagcgcaaa gagaaagcag gtagcttgca gtgggcttac atggcgatag 4800
ctagactggg cggttttatg gacagcaagc gaaccggaat tgccagctgg ggcgccctct 4860
ggtaaggttg ggaagccctg caaagtaaac tggatggctt tcttgccgcc aaggatctga 4920
tggcgcaggg gatcaagatc tgatcaagag acaggatgag gatcgtttcg catgattgaa 4980
caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac 5040
tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg 5100
cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag 5160
gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt 5220
gtcactgaag cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg 5280
tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg 5340
catacgcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga 5400
gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag 5460
gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat 5520
ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt 5580
tctggattca tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg 5640
gctacccgtg atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt 5700
tacggtatcg ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc 5760
ttctgagcgg gactctgggg ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 5820
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 5880
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacgcta 5940
gtttaaactg cggatcagtg agggtttgta actgcgggtc aaggatctgg atttcgatca 6000
cggcacgatc atcgtgcggg agggcaaggg ctccaaggat cgggccttga tgttacccga 6060
gagcttggca cccagcctgc gcgagcaggg gaattgatcc ggtggatgac cttttgaatg 6120
acctttaata gattatatta ctaattaatt ggggacccta gaggtcccct tttttatttt 6180
aaaaattttt tcacaaaacg gtttacaagc ataacgggtt ttgctgcccg caaacgggct 6240
gttctggtgt tgctagtttg ttatcagaat cgcagatccg gcttcaggtt tgccggctga 6300
aagcgctatt tcttccagaa ttgccatgat tttttcccca cgggaggcgt cactggctcc 6360
cgtgttgtcg gcagctttga ttcgataagc agcatcgcct gtttcaggct gtctatgtgt 6420
gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag ttgctttgtt 6480
ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac attgtcgatc 6540
tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga tgtatctatc 6600
ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat ctaacggtga 6660
acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac aagagccata 6720
agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc gttgtttttg 6780
cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac tcaaaaattt 6840
tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg tttttcttag 6900
tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac cattcatttt 6960
tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt caacttggaa 7020
aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat tgctgtaagt 7080
gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa actcatggta 7140
gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta tatttgcctt 7200
gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca tagagtattt 7260
gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta actggaaaag 7320
ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga acttggcata 7380
gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt ccacagttct 7440
cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc tactgatgtt 7500
catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc ttgtagggtt 7560
ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt catgctccgt 7620
taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt cagacataca 7680
tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta gtcaatgata 7740
attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga cctttgctgg 7800
aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt gtgttttttt 7860
tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa agataaaaag 7920
aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt attacaaaag 7980
gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta aaggcttaag 8040
tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg accatcaggc 8100
acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct ctggcagtga 8160
atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa ctacccataa 8220
tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg ctatgtggtg 8280
ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc tgaccacttc 8340
ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc agcggtatca 8400
tcaacaggct tagtttaaac ccatcggcat tttcttttgc gtttttattt gttaactgtt 8460
aattgtcctt gttcaaggat gctgtctttg acaacagatg ttttcttgcc tttgatgttc 8520
agcaggaagc tcggcgcaaa cgttgattgt ttgtctgcgt agaatcctct gtttgtcata 8580
tagcttgtaa tcacgacatt gtttcctttc gcttgaggta cagcgaagtg tgagtaagta 8640
aaggttacat cgttaggatc aagatccatt tttaacacaa ggccagtttt gttcagcggc 8700
ttgtatgggc cagttaaaga attagaaaca taaccaagca tgtaaatatc gttagacgta 8760
atgccgtcaa tcgtcatttt tgatccgcgg gagtcagtga acaggtacca tttgccgttc 8820
attttaaaga cgttcgcgcg ttcaatttca tctgttactg tgttagatgc aatcagcggt 8880
ttcatcactt ttttcagtgt gtaatcatcg tttagctcaa tcataccgag agcgccgttt 8940
gctaactcag ccgtgcgttt tttatcgctt tgcagaagtt tttgactttc ttgacggaag 9000
aatgatgtgc ttttgccata gtatgctttg ttaaataaag attcttcgcc ttggtagcca 9060
tcttcagttc cagtgtttgc ttcaaatact aagtatttgt ggcctttatc ttctacgtag 9120
tgaggatctc tcagcgtatg gttgtcgcct gagctgtagt tgccttcatc gatgaactgc 9180
tgtacatttt gatacgtttt tccgtcaccg tcaaagattg atttataatc ctctacaccg 9240
ttgatgttca aagagctgtc tgatgctgat acgttaactt gtgcagttgt cagtgtttgt 9300
ttgccgtaat gtttaccgga gaaatcagtg tagaataaac ggatttttcc gtcagatgta 9360
aatgtggctg aacctgacca ttcttgtgtt tggtctttta ggatagaatc atttgcatcg 9420
aatttgtcgc tgtctttaaa gacgcggcca gcgtttttcc agctgtcaat agaagtttcg 9480
ccgacttttt gatagaacat gtaaatcgat gtgtcatccg catttttagg atctccggct 9540
aatgcaaaga cgatgtggta gccgtgatag tttgcgacag tgccgtcagc gttttgtaat 9600
ggccagctgt cccaaacgtc caggcctttt gcagaagaga tatttttaat tgtggacgaa 9660
tcaaattcag aaacttgata tttttcattt ttttgctgtt cagggatttg cagcatatca 9720
tggcgtgtaa tatgggaaat gccgtatgtt tccttatatg gcttttggtt cgtttctttc 9780
gcaaacgctt gagttgcgcc tcctgccagc agtgcggtag taaaggttaa tactgttgct 9840
tgttttgcaa actttttgat gttcatcgtt catgtctcct tttttatgta ctgtgttagc 9900
ggtctgcttc ttccagccct cctgtttgaa gatggcaagt tagttacgca caataaaaaa 9960
agacctaaaa tatgtaaggg gtgacgccaa agtatacact ttgcccttta cacattttag 10020
gtcttgcctg ctttatcagt aacaaacccg cgcgatttac ttttcgacct cattctatta 10080
gactctcgtt tggattgcaa ctggtctatt ttcctctttt gtttgataga aaatcataaa 10140
aggatttgca gactacgggc ctaaagaact aaaaaatcta tctgtttctt ttcattctct 10200
gtatttttta tagtttctgt tgcatgggca taaagttgcc tttttaatca caattcagaa 10260
aatatcataa tatctcattt cactaaataa tagtgaacgg caggtatatg tgatgggtta 10320
aaaa                                                              10324
<210>12
<211>10470
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     载体序列
<400>12
ggatcggcgg ccagggccct catgagatat cgagtcagcg ctgtattgcc cgtgaagttg 60
atggtgtttc cgctgccctg ctgggtggga ttggaggtgt aatcaatgaa ccaaccagga 120
gttccggtgc cagtgagatc aaataccacg cggtcaaagc cactgtgaga gccaatccga 180
acatcggtga ccatgagctg tgcaggcgca tcaggtcgga gagtcttcat tgctacatcg 240
gcttcgccca atgcggttgg gccggtggaa gcttcgttgg acaactgtgc gccatccgca 300
gttgcggaca tagtttgggt tacagaagaa gcatcgttgg tggtggaatt ggaggttcca 360
caacccgcaa gagtcaacgc gctagcgccg acaatcgcta gagtcttcag gcgggcacga 420
tgctttgaat gagaagttgg ctgcacaatc atgcacacac cgtaaccctg ggtcaccccc 480
gaaacctaag caagacgccc aatttcgctc aatcgtgaac gaattgttgt aattcgtctt 540
aaaaacgcca ggagacgtga aaattacaga caccccagac atcagatgga ggcggcgata 600
ctagggtaga ggacatgact cttcgctgtt ctgacgtcaa tgttgaaccc ctgccgggaa 660
cggcaaaaac aggttctggg tttgttctcc ttgaacatgc tggctcgtgg agccgtgatg 720
ttttagacgg cggaacattt gatcctgagt tgactgatca attgaagagg cacctgaaag 780
cttccggaat gggtctgcaa ttaattagga agccgggaag ggagggtcga aacgtcgaaa 840
agcataatct ttttctcgtt tttgctgagg cctcaattat tgagcacctg gtggtggacg 900
cgccggctga tgttttggat cttgatttaa gcgggccggg caaaaacaat gcgcagcgca 960
tggatgatcc gatgctgctg atttgtacgc attcgaagcg cgatgtgtgc tgcgcgatca 1020
aggggcgtcc gctggcagct gccgtggagc cacaatttgg gccgctgcat gtgtgggagg 1080
cttcgcacac caagggccac cgttttgcgc catcgatgct gctcatgccg tggaattact 1140
cttatggcct acttgatgag gccgaaaccg tgcagctttt ccaaggcgcg ttggacaaca 1200
aactcttcct gccgggcaac cgtggccgag gaaccttaga tgctcgtggc caggttgcag 1260
aaattgccgt ggcggaagct ttcggcgagg cggttgctcc tgcgagtttg caggttgaat 1320
tcgaagatga ttctgttttg gttactcatc ccgatgggcg cacgtgggtt gtggagcttg 1380
aacgcatcga ggtcgacggc gtggtgtcct cgtgtggtga tcagccgaaa actggaaaag 1440
cgtgggtggc taggcaagtt acagaactga tcggataaaa gcagagttat atctgatgaa 1500
ttgctattag cagtatcgtt atcacagcac caacaaagta gttcagccac aggaaaactt 1560
tccaactgcg attagcctgt tcacaactgg catctgtaat gttccaaaat cgtgcggcat 1620
taaatacgta agttagaatc gcaatcccga tgatccacgc cggattaggc aaagtagtga 1680
ctaacacagc agctagtaaa taaagtacta ctgaaagccg aatggctcca cgcgccccaa 1740
ttacagtggc aattgagctg cggccgcttc gcgaagcttg tcgaccgaaa cagcagttat 1800
aaggcatgaa gctgtccggt ttttgcaaaa gtggctgtga ctgtaaaaag aaatcgaaaa 1860
agaccgtttt gtgtgaaaac ggtctttttg tttcctttta accaactgcc ataactcgag 1920
gctattgacg acagctatgg ttcactgtcc accaaccaaa actgtgctca gtaccgccaa 1980
tatttctccc ttgaggggta caaagaggtg tccctagaag agatccacgc tgtgtaaaaa 2040
ttttacaaaa aggtattgac tttccctaca gggtgtgtaa taatttaatt acaggcgggg 2100
gcaaccccgc ctgttctaga aggaggagaa aacatgtcac agcacgttga aacgaaatta 2160
gctcaaattg ggaaccgtag cgatgaagtc acgggaacag tgagtgctcc tatctattta 2220
tcaacagcat accgccacag agggatcgga gaatctaccg gatttgatta tgtccgcaca 2280
aaaaatccga cacgccagct tgttgaggac gcgatcgcta acttagaaaa cggcgcgaga 2340
gggcttgcct ttagttcggg aatggctgct atccaaacga ttatggcgct gtttaaaagc 2400
ggagatgaac tgatcgtttc atcggaccta tatggcggca cgtaccgttt atttgaaaat 2460
gaatggaaaa aatacggatt gacttttcat tatgatgatt tcagcgatga ggactgttta 2520
cgctctaaga ttacgccgaa tacaaaagcg gtgtttgtgg aaacgccgac aaaccccctc 2580
atgcaggagg cggacattga acatattgcc cggattacaa aggagcacgg tcttctgctg 2640
atcgtagata atacatttta tacaccggtc ttgcagcggc cgcttgagct gggagctgac 2700
attgtcattc acagcgcaac caagtattta ggcgggcata acgatctgct tgctggactt 2760
gtcgtggtga aggatgagcg gctcggagag gaaatgtttc agcatcaaaa tgcaatcggc 2820
gccgtcctgc cgccatttga ttcgtggctt ctgatgagag gaatgaagac gctgagcctc 2880
agaatgcgcc agcatcaggc aaacgcgcag gagcttgcgg cgtttttaga agagcaggaa 2940
gaaatttcgg atgtgctgta tcccggaaaa ggcggcatgc tgtccttccg tctgcaaaaa 3000
gaagaatggg tcaatccgtt tttaaaagca ctgaagacca tttgttttgc agaaagcctc 3060
ggcggggtgg aaagctttat tacataccct gcgacccaga cgcacatgga tattcctgaa 3120
gagatccgca tcgcaaacgg ggtgtgcaat cggttgctgc gcttttctgt cggtattgaa 3180
catgcggaag atttaaaaga ggatctaaaa caggcattat gtcaggtcaa agagggagct 3240
gtttcatttg agtaaacaca attggacgct ggaaacccag ctcgtgcaca atccatttaa 3300
aacagacggc ggaaccgggg cagtcagtgt accgattcag cacgcctcag gatcccagtg 3360
ctatccacat cgctgctgaa ggagatgttc cagtgatcgt tgcaccgatt aatgcaggtg 3420
aagtgaagtg agtagaagat gttagagcat cgataaaggg gcgttcttta aaacgcaatt 3480
tcggtgctga ataagcaatc actgctagca ctgagagtgt cagccataaa gacgacatcc 3540
aggtgccaaa tatgaaaaga ataactagga aaggaattgt tgagatagcc gaggcccata 3600
acagtgtgct gtgggaactt ttcggtagca cggccccctc gacgccgcct ttgcggggat 3660
tacgcatatc agattcgtaa tcaaaaacat cgttgatacc atacatggcg atgttatacg 3720
ggataagaaa aaatacgatg cctagccaaa acagccagtc aatctctcct gcatttaata 3780
ggtaggccag accaaagggg taggcggtat tgatccagct aatggggcga gatgacaata 3840
gaattagtct tattttttcc atcatgacta cggcttttct ggctcagatt gcgtggtggt 3900
ggatctagta gtgatgcttc cattggcgat ggtgggtaag gaatggtgtg gacgtttttt 3960
cctgcgttta aacatatttc caggcaacca tagggcagga atcagaagta ctgcgaagag 4020
cggatagaaa agatcctcta gggggattaa accgagccaa atgccaaggt gctgggtatc 4080
gccatatcca aagagatcag cccaaaccat gaggttatca aatatgatag ttagggaaca 4140
tagggtaagg gcactgacag cggtgattgg taaaagttta ggtgttccag actgcagctt 4200
taagacaaat aggaccatgg ctattgctaa aaaaggaatg cttataaaaa tataagtcat 4260
ggttcaacct cgggagtggt agttggttgg aaagtatcgc gctgtggtgt gaggggagac 4320
tttttaccgg gttttttagg cagtggtgct ttaagccata atgctgctgc cgaggtaagg 4380
ttgagggtga tgtagcagag gaagaataag aaaaaaagtt cttcaatggg catatggggt 4440
gcaaggttaa taccggacat aaacgctgag tctccgcgat aaaaagtgcc agtaataatg 4500
ccaaatatat cccataaaag aaatccaata tatgcagcac ctaccgaaag aattgctcgt 4560
aacggatggc ggaagaacgc tagcttccaa cggtggtcgc acaaagccat gcacccaatg 4620
agaactagga gagtacctag ataaataaag gccataaaaa tatcgctatc ttgctcattt 4680
tgtgaaatat cgatgatagg gatcaaaatt taatgatcgt atgaggtctt ttgagatggt 4740
gtcgttttag gcggcaatgg ttcggctcac gcgtcccggg atttaaatcg ctagcgggct 4800
gctaaaggaa gcggaacacg tagaaagcca gtccgcagaa acggtgctga ccccggatga 4860
atgtcagcta ctgggctatc tggacaaggg aaaacgcaag cgcaaagaga aagcaggtag 4920
cttgcagtgg gcttacatgg cgatagctag actgggcggt tttatggaca gcaagcgaac 4980
cggaattgcc agctggggcg ccctctggta aggttgggaa gccctgcaaa gtaaactgga 5040
tggctttctt gccgccaagg atctgatggc gcaggggatc aagatctgat caagagacag 5100
gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 5160
gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 5220
ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 5280
gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 5340
ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 5400
gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 5460
tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 5520
accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 5580
aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 5640
aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga 5700
atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 5760
cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 5820
aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 5880
ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga 5940
ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag 6000
gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct 6060
catgctggag ttcttcgccc acgctagttt aaactgcgga tcagtgaggg tttgtaactg 6120
cgggtcaagg atctggattt cgatcacggc acgatcatcg tgcgggaggg caagggctcc 6180
aaggatcggg ccttgatgtt acccgagagc ttggcaccca gcctgcgcga gcaggggaat 6240
tgatccggtg gatgaccttt tgaatgacct ttaatagatt atattactaa ttaattgggg 6300
accctagagg tccccttttt tattttaaaa attttttcac aaaacggttt acaagcataa 6360
cgggttttgc tgcccgcaaa cgggctgttc tggtgttgct agtttgttat cagaatcgca 6420
gatccggctt caggtttgcc ggctgaaagc gctatttctt ccagaattgc catgattttt 6480
tccccacggg aggcgtcact ggctcccgtg ttgtcggcag ctttgattcg ataagcagca 6540
tcgcctgttt caggctgtct atgtgtgact gttgagctgt aacaagttgt ctcaggtgtt 6600
caatttcatg ttctagttgc tttgttttac tggtttcacc tgttctatta ggtgttacat 6660
gctgttcatc tgttacattg tcgatctgtt catggtgaac agctttaaat gcaccaaaaa 6720
ctcgtaaaag ctctgatgta tctatctttt ttacaccgtt ttcatctgtg catatggaca 6780
gttttccctt tgatatctaa cggtgaacag ttgttctact tttgtttgtt agtcttgatg 6840
cttcactgat agatacaaga gccataagaa cctcagatcc ttccgtattt agccagtatg 6900
ttctctagtg tggttcgttg tttttgcgtg agccatgaga acgaaccatt gagatcatgc 6960
ttactttgca tgtcactcaa aaattttgcc tcaaaactgg tgagctgaat ttttgcagtt 7020
aaagcatcgt gtagtgtttt tcttagtccg ttacgtaggt aggaatctga tgtaatggtt 7080
gttggtattt tgtcaccatt catttttatc tggttgttct caagttcggt tacgagatcc 7140
atttgtctat ctagttcaac ttggaaaatc aacgtatcag tcgggcggcc tcgcttatca 7200
accaccaatt tcatattgct gtaagtgttt aaatctttac ttattggttt caaaacccat 7260
tggttaagcc ttttaaactc atggtagtta ttttcaagca ttaacatgaa cttaaattca 7320
tcaaggctaa tctctatatt tgccttgtga gttttctttt gtgttagttc ttttaataac 7380
cactcataaa tcctcataga gtatttgttt tcaaaagact taacatgttc cagattatat 7440
tttatgaatt tttttaactg gaaaagataa ggcaatatct cttcactaaa aactaattct 7500
aatttttcgc ttgagaactt ggcatagttt gtccactgga aaatctcaaa gcctttaacc 7560
aaaggattcc tgatttccac agttctcgtc atcagctctc tggttgcttt agctaataca 7620
ccataagcat tttccctact gatgttcatc atctgagcgt attggttata agtgaacgat 7680
accgtccgtt ctttccttgt agggttttca atcgtggggt tgagtagtgc cacacagcat 7740
aaaattagct tggtttcatg ctccgttaag tcatagcgac taatcgctag ttcatttgct 7800
ttgaaaacaa ctaattcaga catacatctc aattggtcta ggtgatttta atcactatac 7860
caattgagat gggctagtca atgataatta ctagtccttt tcctttgagt tgtgggtatc 7920
tgtaaattct gctagacctt tgctggaaaa cttgtaaatt ctgctagacc ctctgtaaat 7980
tccgctagac ctttgtgtgt tttttttgtt tatattcaag tggttataat ttatagaata 8040
aagaaagaat aaaaaaagat aaaaagaata gatcccagcc ctgtgtataa ctcactactt 8100
tagtcagttc cgcagtatta caaaaggatg tcgcaaacgc tgtttgctcc tctacaaaac 8160
agaccttaaa accctaaagg cttaagtagc accctcgcaa gctcgggcaa atcgctgaat 8220
attccttttg tctccgacca tcaggcacct gagtcgctgt ctttttcgtg acattcagtt 8280
cgctgcgctc acggctctgg cagtgaatgg gggtaaatgg cactacaggc gccttttatg 8340
gattcatgca aggaaactac ccataataca agaaaagccc gtcacgggct tctcagggcg 8400
ttttatggcg ggtctgctat gtggtgctat ctgacttttt gctgttcagc agttcctgcc 8460
ctctgatttt ccagtctgac cacttcggat tatcccgtga caggtcattc agactggcta 8520
atgcacccag taaggcagcg gtatcatcaa caggcttagt ttaaacccat cggcattttc 8580
ttttgcgttt ttatttgtta actgttaatt gtccttgttc aaggatgctg tctttgacaa 8640
cagatgtttt cttgcctttg atgttcagca ggaagctcgg cgcaaacgtt gattgtttgt 8700
ctgcgtagaa tcctctgttt gtcatatagc ttgtaatcac gacattgttt cctttcgctt 8760
gaggtacagc gaagtgtgag taagtaaagg ttacatcgtt aggatcaaga tccattttta 8820
acacaaggcc agttttgttc agcggcttgt atgggccagt taaagaatta gaaacataac 8880
caagcatgta aatatcgtta gacgtaatgc cgtcaatcgt catttttgat ccgcgggagt 8940
cagtgaacag gtaccatttg ccgttcattt taaagacgtt cgcgcgttca atttcatctg 9000
ttactgtgtt agatgcaatc agcggtttca tcactttttt cagtgtgtaa tcatcgttta 9060
gctcaatcat accgagagcg ccgtttgcta actcagccgt gcgtttttta tcgctttgca 9120
gaagtttttg actttcttga cggaagaatg atgtgctttt gccatagtat gctttgttaa 9180
ataaagattc ttcgccttgg tagccatctt cagttccagt gtttgcttca aatactaagt 9240
atttgtggcc tttatcttct acgtagtgag gatctctcag cgtatggttg tcgcctgagc 9300
tgtagttgcc ttcatcgatg aactgctgta cattttgata cgtttttccg tcaccgtcaa 9360
agattgattt ataatcctct acaccgttga tgttcaaaga gctgtctgat gctgatacgt 9420
taacttgtgc agttgtcagt gtttgtttgc cgtaatgttt accggagaaa tcagtgtaga 9480
ataaacggat ttttccgtca gatgtaaatg tggctgaacc tgaccattct tgtgtttggt 9540
cttttaggat agaatcattt gcatcgaatt tgtcgctgtc tttaaagacg cggccagcgt 9600
ttttccagct gtcaatagaa gtttcgccga ctttttgata gaacatgtaa atcgatgtgt 9660
catccgcatt tttaggatct ccggctaatg caaagacgat gtggtagccg tgatagtttg 9720
cgacagtgcc gtcagcgttt tgtaatggcc agctgtccca aacgtccagg ccttttgcag 9780
aagagatatt tttaattgtg gacgaatcaa attcagaaac ttgatatttt tcattttttt 9840
gctgttcagg gatttgcagc atatcatggc gtgtaatatg ggaaatgccg tatgtttcct 9900
tatatggctt ttggttcgtt tctttcgcaa acgcttgagt tgcgcctcct gccagcagtg 9960
cggtagtaaa ggttaatact gttgcttgtt ttgcaaactt tttgatgttc atcgttcatg 10020
tctccttttt tatgtactgt gttagcggtc tgcttcttcc agccctcctg tttgaagatg 10080
gcaagttagt tacgcacaat aaaaaaagac ctaaaatatg taaggggtga cgccaaagta 10140
tacactttgc cctttacaca ttttaggtct tgcctgcttt atcagtaaca aacccgcgcg 10200
atttactttt cgacctcatt ctattagact ctcgtttgga ttgcaactgg tctattttcc 10260
tcttttgttt gatagaaaat cataaaagga tttgcagact acgggcctaa agaactaaaa 10320
aatctatctg tttcttttca ttctctgtat tttttatagt ttctgttgca tgggcataaa 10380
gttgcctttt taatcacaat tcagaaaata tcataatatc tcatttcact aaataatagt 10440
gaacggcagg tatatgtgat gggttaaaaa                                  10470
<210>13
<211>10484
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>13
ggatcggcgg ccagggccct catgagatat cgagtcagcg ctgtattgcc cgtgaagttg 60
atggtgtttc tctagaccag gaggacatac agtggctgcc ctgctgggtg ggattggagg 120
tgtaatcaat gaaccaacca ggagttccgg tgccagtgag atcaaatacc acgcggtcaa 180
agccactgtg agagccaatc cgaacatcgg tgaccatgag ctgtgcaggc gcatcaggtc 240
ggagagtctt cattgctaca tcggcttcgc ccaatgcggt tgggccggtg gaagcttcgt 300
tggacaactg tgcgccatcc gcagttgcgg acatagtttg ggttacagaa gaagcatcgt 360
tggtggtgga attggaggtt ccacaacccg caagagtcaa cgcgctagcg ccgacaatcg 420
ctagagtctt caggcgggca cgatgctttg aatgagaagt tggctgcaca atcatgcaca 480
caccgtaacc ctgggtcacc cccgaaacct aagcaagacg cccaatttcg ctcaatcgtg 540
aacgaattgt tgtaattcgt cttaaaaacg ccaggagacg tgaaaattac agacacccca 600
gacatcagat ggaggcggcg atactagggt agaggacatg actcttcgct gttctgacgt 660
caatgttgaa cccctgccgg gaacggcaaa aacaggttct gggtttgttc tccttgaaca 720
tgctggctcg tggagccgtg atgttttaga cggcggaaca tttgatcctg agttgactga 780
tcaattgaag aggcacctga aagcttccgg aatgggtctg caattaatta ggaagccggg 840
aagggagggt cgaaacgtcg aaaagcataa tctttttctc gtttttgctg aggcctcaat 900
tattgagcac ctggtggtgg acgcgccggc tgatgttttg gatcttgatt taagcgggcc 960
gggcaaaaac aatgcgcagc gcatggatga tccgatgctg ctgatttgta cgcattcgaa 1020
gcgcgatgtg tgctgcgcga tcaaggggcg tccgctggca gctgccgtgg agccacaatt 1080
tgggccgctg catgtgtggg aggcttcgca caccaagggc caccgttttg cgccatcgat 1140
gctgctcatg ccgtggaatt actcttatgg cctacttgat gaggccgaaa ccgtgcagct 1200
tttccaaggc gcgttggaca acaaactctt cctgccgggc aaccgtggcc gaggaacctt 1260
agatgctcgt ggccaggttg cagaaattgc cgtggcggaa gctttcggcg aggcggttgc 1320
tcctgcgagt ttgcaggttg aattcgaaga tgattctgtt ttggttactc atcccgatgg 1380
gcgcacgtgg gttgtggagc ttgaacgcat cgaggtcgac ggcgtggtgt cctcgtgtgg 1440
tgatcagccg aaaactggaa aagcgtgggt ggctaggcaa gttacagaac tgatcggata 1500
aaagcagagt tatatctgat gaattgctat tagcagtatc gttatcacag caccaacaaa 1560
gtagttcagc cacaggaaaa ctttccaact gcgattagcc tgttcacaac tggcatctgt 1620
aatgttccaa aatcgtgcgg cattaaatac gtaagttaga atcgcaatcc  cgatgatcca 1680
cgccggatta ggcaaagtag tgactaacac agcagctagt aaataaagta ctactgaaag 1740
ccgaatggct ccacgcgccc caattacagt ggcaattgag ctgcggccgc ttcgcgaagc 1800
ttgtcgaccg aaacagcagt tataaggcat gaagctgtcc ggtttttgca aaagtggctg 1860
tgactgtaaa aagaaatcga aaaagaccgt tttgtgtgaa aacggtcttt ttgtttcctt 1920
ttaaccaact gccataactc gagaccctgc gaatgtccac agggtagctg gtagtttgaa 1980
aatcaacgcc gttgccctta ggattcagta actggcacat tttgtaatgc gctagatctg 2040
tgtgctcagt cttccaggct gcttatcaca gtgaaagcaa aaccaattcg tggctgcgaa 2100
agtcgtagcc accacgaagt ccacgatcta gaccaggagg acatacagtg tcacagcacg 2160
ttgaaacgaa attagctcaa attgggaacc gtagcgatga agtcacggga acagtgagtg 2220
ctcctatcta tttatcaaca gcataccgcc acagagggat cggagaatct accggatttg 2280
attatgtccg cacaaaaaat ccgacacgcc agcttgttga ggacgcgatc gctaacttag 2340
aaaacggcgc gagagggctt gcctttagtt cgggaatggc tgctatccaa acgattatgg 2400
cgctgtttaa aagcggagat gaactgatcg tttcatcgga cctatatggc ggcacgtacc 2460
gtttatttga aaatgaatgg aaaaaatacg gattgacttt tcattatgat gatttcagcg 2520
atgaggactg tttacgctct aagattacgc cgaatacaaa agcggtgttt gtggaaacgc 2580
cgacaaaccc cctcatgcag gaggcggaca ttgaacatat tgcccggatt acaaaggagc 2640
acggtcttct gctgatcgta gataatacat tttatacacc ggtcttgcag cggccgcttg 2700
agctgggagc tgacattgtc attcacagcg caaccaagta tttaggcggg cataacgatc 2760
tgcttgctgg acttgtcgtg gtgaaggatg agcggctcgg agaggaaatg tttcagcatc 2820
aaaatgcaat cggcgccgtc ctgccgccat ttgattcgtg gcttctgatg agaggaatga 2880
agacgctgag cctcagaatg cgccagcatc aggcaaacgc gcaggagctt gcggcgtttt 2940
tagaagagca ggaagaaatt tcggatgtgc tgtatcccgg aaaaggcggc atgctgtcct 3000
tccgtctgca aaaagaagaa tgggtcaatc cgtttttaaa agcactgaag accatttgtt 3060
ttgcagaaag cctcggcggg gtggaaagct ttattacata ccctgcgacc cagacgcaca 3120
tggatattcc tgaagagatc cgcatcgcaa acggggtgtg caatcggttg ctgcgctttt 3180
ctgtcggtat tgaacatgcg gaagatttaa aagaggatct aaaacaggca ttatgtcagg 3240
tcaaagaggg agctgtttca tttgagtaaa cacaattgga cgctggaaac ccagctcgtg 3300
cacaatccat ttaaaacaga cggcggaacc ggggcagtca gtgtaccgat tcagcacgcc 3360
tcaggatccc agtgctatcc acatcgctgc tgaaggagat gttccagtga tcgttgcacc 3420
gattaatgca ggtgaagtga agtgagtaga agatgttaga gcatcgataa aggggcgttc 3480
tttaaaacgc aatttcggtg ctgaataagc aatcactgct agcactgaga gtgtcagcca 3540
taaagacgac atccaggtgc caaatatgaa aagaataact aggaaaggaa ttgttgagat 3600
agccgaggcc cataacagtg tgctgtggga acttttcggt agcacggccc cctcgacgcc 3660
gcctttgcgg ggattacgca tatcagattc gtaatcaaaa acatcgttga taccatacat 3720
ggcgatgtta tacgggataa gaaaaaatac gatgcctagc caaaacagcc agtcaatctc 3780
tcctgcattt aataggtagg ccagaccaaa ggggtaggcg gtattgatcc agctaatggg 3840
gcgagatgac aatagaatta gtcttatttt ttccatcatg actacggctt ttctggctca 3900
gattgcgtgg tggtggatct agtagtgatg cttccattgg cgatggtggg taaggaatgg 3960
tgtggacgtt ttttcctgcg tttaaacata tttccaggca accatagggc aggaatcaga 4020
agtactgcga agagcggata gaaaagatcc tctaggggga ttaaaccgag ccaaatgcca 4080
aggtgctggg tatcgccata tccaaagaga tcagcccaaa ccatgaggtt atcaaatatg 4140
atagttaggg aacatagggt aagggcactg acagcggtga ttggtaaaag tttaggtgtt 4200
ccagactgca gctttaagac aaataggacc atggctattg ctaaaaaagg aatgcttata 4260
aaaatataag tcatggttca acctcgggag tggtagttgg ttggaaagta tcgcgctgtg 4320
gtgtgagggg agacttttta ccgggttttt taggcagtgg tgctttaagc cataatgctg 4380
ctgccgaggt aaggttgagg gtgatgtagc agaggaagaa taagaaaaaa agttcttcaa 4440
tgggcatatg gggtgcaagg ttaataccgg acataaacgc tgagtctccg cgataaaaag 4500
tgccagtaat aatgccaaat atatcccata aaagaaatcc aatatatgca gcacctaccg 4560
aaagaattgc tcgtaacgga tggcggaaga acgctagctt ccaacggtgg tcgcacaaag 4620
ccatgcaccc aatgagaact aggagagtac ctagataaat aaaggccata aaaatatcgc 4680
tatcttgctc attttgtgaa atatcgatga tagggatcaa aatttaatga tcgtatgagg 4740
tcttttgaga tggtgtcgtt ttaggcggca atggttcggc tcacgcgtcc cgggatttaa 4800
atcgctagcg ggctgctaaa ggaagcggaa cacgtagaaa gccagtccgc agaaacggtg 4860
ctgaccccgg atgaatgtca gctactgggc tatctggaca agggaaaacg caagcgcaaa 4920
gagaaagcag gtagcttgca gtgggcttac atggcgatag ctagactggg cggttttatg 4980
gacagcaagc gaaccggaat tgccagctgg ggcgccctct ggtaaggttg ggaagccctg 5040
caaagtaaac tggatggctt tcttgccgcc aaggatctga tggcgcaggg gatcaagatc 5100
tgatcaagag acaggatgag gatcgtttcg catgattgaa caagatggat tgcacgcagg 5160
ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg 5220
ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa 5280
gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct 5340
ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga 5400
ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc 5460
cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac 5520
ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc 5580
cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact 5640
gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga 5700
tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg 5760
ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga 5820
agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga 5880
ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagcgg gactctgggg 5940
ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac gagatttcga ttccaccgcc 6000
gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc 6060
cagcgcgggg atctcatgct ggagttcttc gcccacgcta gtttaaactg cggatcagtg 6120
agggtttgta actgcgggtc aaggatctgg atttcgatca cggcacgatc atcgtgcggg 6180
agggcaaggg ctccaaggat cgggccttga tgttacccga gagcttggca cccagcctgc 6240
gcgagcaggg gaattgatcc ggtggatgac cttttgaatg acctttaata gattatatta 6300
ctaattaatt ggggacccta gaggtcccct tttttatttt aaaaattttt tcacaaaacg 6360
gtttacaagc ataacgggtt ttgctgcccg caaacgggct gttctggtgt tgctagtttg 6420
ttatcagaat cgcagatccg gcttcaggtt tgccggctga aagcgctatt tcttccagaa 6480
ttgccatgat tttttcccca cgggaggcgt cactggctcc cgtgttgtcg gcagctttga 6540
ttcgataagc agcatcgcct gtttcaggct gtctatgtgt gactgttgag ctgtaacaag 6600
ttgtctcagg tgttcaattt catgttctag ttgctttgtt ttactggttt cacctgttct 6660
attaggtgtt acatgctgtt catctgttac attgtcgatc tgttcatggt gaacagcttt 6720
aaatgcacca aaaactcgta aaagctctga tgtatctatc ttttttacac cgttttcatc 6780
tgtgcatatg gacagttttc cctttgatat ctaacggtga acagttgttc tacttttgtt 6840
tgttagtctt gatgcttcac tgatagatac aagagccata agaacctcag atccttccgt 6900
atttagccag tatgttctct agtgtggttc gttgtttttg cgtgagccat gagaacgaac 6960
cattgagatc atgcttactt tgcatgtcac tcaaaaattt tgcctcaaaa ctggtgagct 7020
gaatttttgc agttaaagca tcgtgtagtg tttttcttag tccgttacgt aggtaggaat 7080
ctgatgtaat ggttgttggt attttgtcac cattcatttt tatctggttg ttctcaagtt 7140
cggttacgag atccatttgt ctatctagtt caacttggaa aatcaacgta tcagtcgggc 7200
ggcctcgctt atcaaccacc aatttcatat tgctgtaagt gtttaaatct ttacttattg 7260
gtttcaaaac ccattggtta agccttttaa actcatggta gttattttca agcattaaca 7320
tgaacttaaa ttcatcaagg ctaatctcta tatttgcctt gtgagttttc ttttgtgtta 7380
gttcttttaa taaccactca taaatcctca tagagtattt gttttcaaaa gacttaacat 7440
gttccagatt atattttatg aattttttta actggaaaag ataaggcaat atctcttcac 7500
taaaaactaa ttctaatttt tcgcttgaga acttggcata gtttgtccac tggaaaatct 7560
caaagccttt aaccaaagga ttcctgattt ccacagttct cgtcatcagc tctctggttg 7620
ctttagctaa tacaccataa gcattttccc tactgatgtt catcatctga gcgtattggt 7680
tataagtgaa cgataccgtc cgttctttcc ttgtagggtt ttcaatcgtg gggttgagta 7740
gtgccacaca gcataaaatt agcttggttt catgctccgt taagtcatag cgactaatcg 7800
ctagttcatt tgctttgaaa acaactaatt cagacataca tctcaattgg tctaggtgat 7860
tttaatcact ataccaattg agatgggcta gtcaatgata attactagtc cttttccttt 7920
gagttgtggg tatctgtaaa ttctgctaga cctttgctgg aaaacttgta aattctgcta 7980
gaccctctgt aaattccgct agacctttgt gtgttttttt tgtttatatt caagtggtta 8040
taatttatag aataaagaaa gaataaaaaa agataaaaag aatagatccc agccctgtgt 8100
ataactcact actttagtca gttccgcagt attacaaaag gatgtcgcaa acgctgtttg 8160
ctcctctaca aaacagacct taaaacccta aaggcttaag tagcaccctc gcaagctcgg 8220
gcaaatcgct gaatattcct tttgtctccg accatcaggc acctgagtcg ctgtcttttt 8280
cgtgacattc agttcgctgc gctcacggct ctggcagtga atgggggtaa atggcactac 8340
aggcgccttt tatggattca tgcaaggaaa ctacccataa tacaagaaaa gcccgtcacg 8400
ggcttctcag ggcgttttat ggcgggtctg ctatgtggtg ctatctgact ttttgctgtt 8460
cagcagttcc tgccctctga ttttccagtc tgaccacttc ggattatccc gtgacaggtc 8520
attcagactg gctaatgcac ccagtaaggc agcggtatca tcaacaggct tagtttaaac 8580
ccatcggcat tttcttttgc gtttttattt gttaactgtt aattgtcctt gttcaaggat 8640
gctgtctttg acaacagatg ttttcttgcc tttgatgttc agcaggaagc tcggcgcaaa 8700
cgttgattgt ttgtctgcgt agaatcctct gtttgtcata tagcttgtaa tcacgacatt 8760
gtttcctttc gcttgaggta cagcgaagtg tgagtaagta aaggttacat cgttaggatc 8820
aagatccatt tttaacacaa ggccagtttt gttcagcggc ttgtatgggc cagttaaaga 8880
attagaaaca taaccaagca tgtaaatatc gttagacgta atgccgtcaa tcgtcatttt 8940
tgatccgcgg gagtcagtga acaggtacca tttgccgttc attttaaaga cgttcgcgcg 9000
ttcaatttca tctgttactg tgttagatgc aatcagcggt ttcatcactt ttttcagtgt 9060
gtaatcatcg tttagctcaa tcataccgag agcgccgttt gctaactcag ccgtgcgttt 9120
tttatcgctt tgcagaagtt tttgactttc ttgacggaag aatgatgtgc ttttgccata 9180
gtatgctttg ttaaataaag attcttcgcc ttggtagcca tcttcagttc cagtgtttgc 9240
ttcaaatact aagtatttgt ggcctttatc ttctacgtag tgaggatctc tcagcgtatg 9300
gttgtcgcct gagctgtagt tgccttcatc gatgaactgc tgtacatttt gatacgtttt 9360
tccgtcaccg tcaaagattg atttataatc ctctacaccg ttgatgttca aagagctgtc 9420
tgatgctgat acgttaactt gtgcagttgt cagtgtttgt ttgccgtaat gtttaccgga 9480
gaaatcagtg tagaataaac ggatttttcc gtcagatgta aatgtggctg aacctgacca 9540
ttcttgtgtt tggtctttta ggatagaatc atttgcatcg aatttgtcgc tgtctttaaa 9600
gacgcggcca gcgtttttcc agctgtcaat agaagtttcg ccgacttttt gatagaacat 9660
gtaaatcgat gtgtcatccg catttttagg atctccggct aatgcaaaga cgatgtggta 9720
gccgtgatag tttgcgacag tgccgtcagc gttttgtaat ggccagctgt cccaaacgtc 9780
caggcctttt gcagaagaga tatttttaat tgtggacgaa tcaaattcag aaacttgata 9840
tttttcattt ttttgctgtt cagggatttg cagcatatca tggcgtgtaa tatgggaaat 9900
gccgtatgtt tccttatatg gcttttggtt cgtttctttc gcaaacgctt gagttgcgcc 9960
tcctgccagc agtgcggtag taaaggttaa tactgttgct tgttttgcaa actttttgat 10020
gttcatcgtt catgtctcct tttttatgta ctgtgttagc ggtctgcttc ttccagccct 10080
cctgtttgaa gatggcaagt tagttacgca caataaaaaa agacctaaaa tatgtaaggg 10140
gtgacgccaa agtatacact ttgcccttta cacattttag gtcttgcctg ctttatcagt 10200
aacaaacccg cgcgatttac ttttcgacct cattctatta gactctcgtt tggattgcaa 10260
ctggtctatt ttcctctttt gtttgataga aaatcataaa aggatttgca gactacgggc 10320
ctaaagaact aaaaaatcta tctgtttctt ttcattctct gtatttttta tagtttctgt 10380
tgcatgggca taaagttgcc tttttaatca caattcagaa aatatcataa tatctcattt 10440
cactaaataa tagtgaacgg caggtatatg tgatgggtta aaaa                  10484
<210>14
<211>12531
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     载体序列
<400>14
ggatcggcgg ccagggccct catgagatat cgagtcagcg ctgtattgcc cgtgaagttg 60
atggtgtttc cgctgccctg ctgggtggga ttggaggtgt aatcaatgaa ccaaccagga 120
gttccggtgc cagtgagatc aaataccacg cggtcaaagc cactgtgaga gccaatccga 180
acatcggtga ccatgagctg tgcaggcgca tcaggtcgga gagtcttcat tgctacatcg 240
gcttcgccca atgcggttgg gccggtggaa gcttcgttgg acaactgtgc gccatccgca 300
gttgcggaca tagtttgggt tacagaagaa gcatcgttgg tggtggaatt ggaggttcca 360
caacccgcaa gagtcaacgc gctagcgccg acaatcgcta gagtcttcag gcgggcacga 420
tgctttgaat gagaagttgg ctgcacaatc atgcacacac cgtaaccctg ggtcaccccc 480
gaaacctaag caagacgccc aatttcgctc aatcgtgaac gaattgttgt aattcgtctt 540
aaaaacgcca ggagacgtga aaattacaga caccccagac atcagatgga ggcggcgata 600
ctagggtaga ggacatgact cttcgctgtt ctgacgtcaa tgttgaaccc ctgccgggaa 660
cggcaaaaac aggttctggg tttgttctcc ttgaacatgc tggctcgtgg agccgtgatg 720
ttttagacgg cggaacattt gatcctgagt tgactgatca attgaagagg cacctgaaag 780
cttccggaat gggtctgcaa ttaattagga agccgggaag ggagggtcga aacgtcgaaa 840
agcataatct ttttctcgtt tttgctgagg cctcaattat tgagcacctg gtggtggacg 900
cgccggctga tgttttggat cttgatttaa gcgggccggg caaaaacaat gcgcagcgca 960
tggatgatcc gatgctgctg atttgtacgc attcgaagcg cgatgtgtgc tgcgcgatca 1020
aggggcgtcc gctggcagct gccgtggagc cacaatttgg gccgctgcat gtgtgggagg 1080
cttcgcacac caagggccac cgttttgcgc catcgatgct gctcatgccg tggaattact 1140
cttatggcct acttgatgag gccgaaaccg tgcagctttt ccaaggcgcg ttggacaaca 1200
aactcttcct gccgggcaac cgtggccgag gaaccttaga tgctcgtggc caggttgcag 1260
aaattgccgt ggcggaagct ttcggcgagg cggttgctcc tgcgagtttg caggttgaat 1320
tcgaagatga ttctgttttg gttactcatc ccgatgggcg cacgtgggtt gtggagcttg 1380
aacgcatcga ggtcgacggc gtggtgtcct cgtgtggtga tcagccgaaa actggaaaag 1440
cgtgggtggc taggcaagtt acagaactga tcggataaaa gcagagttat atctgatgaa 1500
ttgctattag cagtatcgtt atcacagcac caacaaagta gttcagccac aggaaaactt 1560
tccaactgcg attagcctgt tcacaactgg catctgtaat gttccaaaat cgtgcggcat 1620
taaatacgta agttagaatc gcaatcccga tgatccacgc cggattaggc aaagtagtga 1680
ctaacacagc agctagtaaa taaagtacta ctgaaagccg aatggctcca cgcgccccaa 1740
ttacagtggc aattgagctg cggccgcttc gcgaagcttg tcgaccgaaa cagcagttat 1800
aaggcatgaa gctgtccggt ttttgcaaaa gtggctgtga ctgtaaaaag aaatcgaaaa 1860
agaccgtttt gtgtgaaaac ggtctttttg tttcctttta accaactgcc ataactcgag 1920
gctattgacg acagctatgg ttcactgtcc accaaccaaa actgtgctca gtaccgccaa 1980
tatttctccc ttgaggggta caaagaggtg tccctagaag agatccacgc tgtgtaaaaa 2040
ttttacaaaa aggtattgac tttccctaca gggtgtgtaa taatttaatt acaggcgggg 2100
gcaaccccgc ctgttctaga gatccccagc ttgttgatac actaatgctt ttatataggg 2160
aaaaggtggt gaactactgt ggaagttact gacgtaagat tacgggtcga ccgggaaaac 2220
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 2280
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 2340
cgctttgcct ggtttccggc accagaagcg gtgccggaaa gctggctgga gtgcgatctt 2400
cctgaggccg atactgtcgt cgtcccctca aactggcaga tgcacggtta cgatgcgccc 2460
atctacacca acgtaaccta tcccattacg gtcaatccgc cgtttgttcc cacggagaat 2520
ccgacgggtt gttactcgct cacatttaat gttgatgaaa gctggctaca ggaaggccag 2580
acgcgaatta tttttgatgg cgttaactcg gcgtttcatc tgtggtgcaa cgggcgctgg 2640
gtcggttacg gccaggacag tcgtttgccg tctgaatttg acctgagcgc atttttacgc 2700
gccggagaaa accgcctcgc ggtgatggtg ctgcgttgga gtgacggcag ttatctggaa 2760
gatcaggata tgtggcggat gagcggcatt ttccgtgacg tctcgttgct gcataaaccg 2820
actacacaaa tcagcgattt ccatgttgcc actcgcttta atgatgattt cagccgcgct 2880
gtactggagg ctgaagttca gatgtgcggc gagttgcgtg actacctacg ggtaacagtt 2940
tctttatggc agggtgaaac gcaggtcgcc agcggcaccg cgcctttcgg cggtgaaatt 3000
atcgatgagc gtggtggtta tgccgatcgc gtcacactac gtctgaacgt cgaaaacccg 3060
aaactgtgga gcgccgaaat cccgaatctc tatcgtgcgg tggttgaact gcacaccgcc 3120
gacggcacgc tgattgaagc agaagcctgc gatgtcggtt tccgcgaggt gcggattgaa 3180
aatggtctgc tgctgctgaa cggcaagccg ttgctgattc gaggcgttaa ccgtcacgag 3240
catcatcctc tgcatggtca ggtcatggat gagcagacga tggtgcagga tatcctgctg 3300
atgaagcaga acaactttaa cgccgtgcgc tgttcgcatt atccgaacca tccgctgtgg 3360
tacacgctgt gcgaccgcta cggcctgtat gtggtggatg aagccaatat tgaaacccac 3420
ggcatggtgc caatgaatcg tctgaccgat gatccgcgct ggctaccggc gatgagcgaa 3480
cgcgtaacgc gaatggtgca gcgcgatcgt aatcacccga gtgtgatcat ctggtcgctg 3540
gggaatgaat caggccacgg cgctaatcac gacgcgctgt atcgctggat caaatctgtc 3600
gatccttccc gcccggtgca gtatgaaggc ggcggagccg acaccacggc caccgatatt 3660
atttgcccga tgtacgcgcg cgtggatgaa gaccagccct tcccggctgt gccgaaatgg 3720
tccatcaaaa aatggctttc gctacctgga gagacgcgcc cgctgatcct ttgcgaatac 3780
gcccacgcga tgggtaacag tcttggcggt ttcgctaaat actggcaggc gtttcgtcag 3840
tatccccgtt tacagggcgg cttcgtctgg gactgggtgg atcagtcgct gattaaatat 3900
gatgaaaacg gcaacccgtg gtcggcttac ggcggtgatt ttggcgatac gccgaacgat 3960
cgccagttct gtatgaacgg tctggtcttt gccgaccgca cgccgcatcc agcgctgacg 4020
gaagcaaaac accagcagca gtttttccag ttccgtttat ccgggcaaac catcgaagtg 4080
accagcgaat acctgttccg tcatagcgat aacgagctcc tgcactggat ggtggcgctg 4140
gatggtaagc cgctggcaag cggtgaagtg cctctggatg tcgctccaca aggtaaacag 4200
ttgattgaac tgcctgaact accgcagccg gagagcgccg ggcaactctg gctcacagta 4260
cgcgtagtgc aaccgaacgc gaccgcatgg tcagaagccg ggcacatcag cgcctggcag 4320
cagtggcgtc tggcggaaaa cctcagtgtg acgctccccg ccgcgtccca cgccatcccg 4380
catctgacca ccagcgaaat ggatttttgc atcgagctgg gtaataagcg ttggcaattt 4440
aaccgccagt caggctttct ttcacagatg tggattggcg ataaaaaaca actgctgacg 4500
ccgctgcgcg atcagttcac ccgtgcaccg ctggataacg acattggcgt aagtgaagcg 4560
acccgcattg accctaacgc ctgggtcgaa cgctggaagg cggcgggcca ttaccaggcc 4620
gaagcagcgt tgttgcagtg cacggcagat acacttgctg atgcggtgct gattacgacc 4680
gctcacgcgt ggcagcatca ggggaaaacc ttatttatca gccggaaaac ctaccggatt 4740
gatggtagtg gtcaaatggc gattaccgtt gatgttgaag tggcgagcga tacaccgcat 4800
ccggcgcgga ttggcctgaa ctgccagctg gcgcaggtag cagagcgggt aaactggctc 4860
ggattagggc cgcaagaaaa ctatcccgac cgccttactg ccgcctgttt tgaccgctgg 4920
gatctgccat tgtcagacat gtataccccg tacgtcttcc cgagcgaaaa cggtctgcgc 4980
tgcgggacgc gcgaattgaa ttatggccca caccagtggc gcggcgactt ccagttcaac 5040
atcagccgct acagtcaaca gcaactgatg gaaaccagcc atcgccatct gctgcacgcg 5100
gaagaaggca catggctgaa tatcgacggt ttccatatgg ggattggtgg cgacgactcc 5160
tggagcccgt cagtatcggc ggaatttcag ctgagcgccg gtcgctacca ttaccagttg 5220
gtctggtgtc aaaaataata ataaccgggc aggccatgtc tgcccgtatt tcgcgtaagg 5280
ggatccgccc tcccgcacgc tttgcgggag ggcttttctt ttaccggtac cagctcagat 5340
tagcttcccg gtctgcatta acatcctgta ctgctccaag gatctgactg gccatgcccc 5400
acaagaaaaa ggatcccagt gctatccaca tcgctgctga aggagatgtt ccagtgatcg 5460
ttgcaccgat taatgcaggt gaagtgaagt gagtagaaga tgttagagca tcgataaagg 5520
ggcgttcttt aaaacgcaat ttcggtgctg aataagcaat cactgctagc actgagagtg 5580
tcagccataa agacgacatc caggtgccaa atatgaaaag aataactagg aaaggaattg 5640
ttgagatagc cgaggcccat aacagtgtgc tgtgggaact tttcggtagc acggccccct 5700
cgacgccgcc tttgcgggga ttacgcatat cagattcgta atcaaaaaca tcgttgatac 5760
catacatggc gatgttatac gggataagaa aaaatacgat gcctagccaa aacagccagt 5820
caatctctcc tgcatttaat aggtaggcca gaccaaaggg gtaggcggta ttgatccagc 5880
taatggggcg agatgacaat agaattagtc ttattttttc catcatgact acggcttttc 5940
tggctcagat tgcgtggtgg tggatctagt agtgatgctt ccattggcga tggtgggtaa 6000
ggaatggtgt ggacgttttt tcctgcgttt aaacatattt ccaggcaacc atagggcagg 6060
aatcagaagt actgcgaaga gcggatagaa aagatcctct agggggatta aaccgagcca 6120
aatgccaagg tgctgggtat cgccatatcc aaagagatca gcccaaacca tgaggttatc 6180
aaatatgata gttagggaac atagggtaag ggcactgaca gcggtgattg gtaaaagttt 6240
aggtgttcca gactgcagct ttaagacaaa taggaccatg gctattgcta aaaaaggaat 6300
gcttataaaa atataagtca tggttcaacc tcgggagtgg tagttggttg gaaagtatcg 6360
cgctgtggtg tgaggggaga ctttttaccg ggttttttag gcagtggtgc tttaagccat 6420
aatgctgctg ccgaggtaag gttgagggtg atgtagcaga ggaagaataa gaaaaaaagt 6480
tcttcaatgg gcatatgggg tgcaaggtta ataccggaca taaacgctga gtctccgcga 6540
taaaaagtgc cagtaataat gccaaatata tcccataaaa gaaatccaat atatgcagca 6600
cctaccgaaa gaattgctcg taacggatgg cggaagaacg ctagcttcca acggtggtcg 6660
cacaaagcca tgcacccaat gagaactagg agagtaccta gataaataaa ggccataaaa 6720
atatcgctat cttgctcatt ttgtgaaata tcgatgatag ggatcaaaat ttaatgatcg 6780
tatgaggtct tttgagatgg tgtcgtttta ggcggcaatg gttcggctca cgcgtcccgg 6840
gatttaaatc gctagcgggc tgctaaagga agcggaacac gtagaaagcc agtccgcaga 6900
aacggtgctg accccggatg aatgtcagct actgggctat ctggacaagg gaaaacgcaa 6960
gcgcaaagag aaagcaggta gcttgcagtg ggcttacatg gcgatagcta gactgggcgg 7020
ttttatggac agcaagcgaa ccggaattgc cagctggggc gccctctggt aaggttggga 7080
agccctgcaa agtaaactgg atggctttct tgccgccaag gatctgatgg cgcaggggat 7140
caagatctga tcaagagaca ggatgaggat cgtttcgcat gattgaacaa gatggattgc 7200
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 7260
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 7320
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 7380
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 7440
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 7500
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 7560
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 7620
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 7680
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 7740
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 7800
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 7860
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 7920
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagcgggac 7980
tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 8040
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 8100
gatcctccag cgcggggatc tcatgctgga gttcttcgcc cacgctagtt taaactgcgg 8160
atcagtgagg gtttgtaact gcgggtcaag gatctggatt tcgatcacgg cacgatcatc 8220
gtgcgggagg gcaagggctc caaggatcgg gccttgatgt tacccgagag cttggcaccc 8280
agcctgcgcg agcaggggaa ttgatccggt ggatgacctt ttgaatgacc tttaatagat 8340
tatattacta attaattggg gaccctagag gtcccctttt ttattttaaa aattttttca 8400
caaaacggtt tacaagcata acgggttttg ctgcccgcaa acgggctgtt ctggtgttgc 8460
tagtttgtta tcagaatcgc agatccggct tcaggtttgc cggctgaaag cgctatttct 8520
tccagaattg ccatgatttt ttccccacgg gaggcgtcac tggctcccgt gttgtcggca 8580
gctttgattc gataagcagc atcgcctgtt tcaggctgtc tatgtgtgac tgttgagctg 8640
taacaagttg tctcaggtgt tcaatttcat gttctagttg ctttgtttta ctggtttcac 8700
ctgttctatt aggtgttaca tgctgttcat ctgttacatt gtcgatctgt tcatggtgaa 8760
cagctttaaa tgcaccaaaa actcgtaaaa gctctgatgt atctatcttt tttacaccgt 8820
tttcatctgt gcatatggac agttttccct ttgatatcta acggtgaaca gttgttctac 8880
ttttgtttgt tagtcttgat gcttcactga tagatacaag agccataaga acctcagatc 8940
cttccgtatt tagccagtat gttctctagt gtggttcgtt gtttttgcgt gagccatgag 9000
aacgaaccat tgagatcatg cttactttgc atgtcactca aaaattttgc ctcaaaactg 9060
gtgagctgaa tttttgcagt taaagcatcg tgtagtgttt ttcttagtcc gttacgtagg 9120
taggaatctg atgtaatggt tgttggtatt ttgtcaccat tcatttttat ctggttgttc 9180
tcaagttcgg ttacgagatc catttgtcta tctagttcaa cttggaaaat caacgtatca 9240
gtcgggcggc ctcgcttatc aaccaccaat ttcatattgc tgtaagtgtt taaatcttta 9300
cttattggtt tcaaaaccca ttggttaagc cttttaaact catggtagtt attttcaagc 9360
attaacatga acttaaattc atcaaggcta atctctatat ttgccttgtg agttttcttt 9420
tgtgttagtt cttttaataa ccactcataa atcctcatag agtatttgtt ttcaaaagac 9480
ttaacatgtt ccagattata ttttatgaat ttttttaact ggaaaagata aggcaatatc 9540
tcttcactaa aaactaattc taatttttcg cttgagaact tggcatagtt tgtccactgg 9600
aaaatctcaa agcctttaac caaaggattc ctgatttcca cagttctcgt catcagctct 9660
ctggttgctt tagctaatac accataagca ttttccctac tgatgttcat catctgagcg 9720
tattggttat aagtgaacga taccgtccgt tctttccttg tagggttttc aatcgtgggg 9780
ttgagtagtg ccacacagca taaaattagc ttggtttcat gctccgttaa gtcatagcga 9840
ctaatcgcta gttcatttgc tttgaaaaca actaattcag acatacatct caattggtct 9900
aggtgatttt aatcactata ccaattgaga tgggctagtc aatgataatt actagtcctt 9960
ttcctttgag ttgtgggtat ctgtaaattc tgctagacct ttgctggaaa acttgtaaat 10020
tctgctagac cctctgtaaa ttccgctaga cctttgtgtg ttttttttgt ttatattcaa 10080
gtggttataa tttatagaat aaagaaagaa taaaaaaaga taaaaagaat agatcccagc 10140
cctgtgtata actcactact ttagtcagtt ccgcagtatt acaaaaggat gtcgcaaacg 10200
ctgtttgctc ctctacaaaa cagaccttaa aaccctaaag gcttaagtag caccctcgca 10260
agctcgggca aatcgctgaa tattcctttt gtctccgacc atcaggcacc tgagtcgctg 10320
tctttttcgt gacattcagt tcgctgcgct cacggctctg gcagtgaatg ggggtaaatg 10380
gcactacagg cgccttttat ggattcatgc aaggaaacta cccataatac aagaaaagcc 10440
cgtcacgggc ttctcagggc gttttatggc gggtctgcta tgtggtgcta tctgactttt 10500
tgctgttcag cagttcctgc cctctgattt tccagtctga ccacttcgga ttatcccgtg 10560
acaggtcatt cagactggct aatgcaccca gtaaggcagc ggtatcatca acaggcttag 10620
tttaaaccca tcggcatttt cttttgcgtt tttatttgtt aactgttaat tgtccttgtt 10680
caaggatgct gtctttgaca acagatgttt tcttgccttt gatgttcagc aggaagctcg 10740
gcgcaaacgt tgattgtttg tctgcgtaga atcctctgtt tgtcatatag cttgtaatca 10800
cgacattgtt tcctttcgct tgaggtacag cgaagtgtga gtaagtaaag gttacatcgt 10860
taggatcaag atccattttt aacacaaggc cagttttgtt cagcggcttg tatgggccag 10920
ttaaagaatt agaaacataa ccaagcatgt aaatatcgtt agacgtaatg ccgtcaatcg 10980
tcatttttga tccgcgggag tcagtgaaca ggtaccattt gccgttcatt ttaaagacgt 11040
tcgcgcgttc aatttcatct gttactgtgt tagatgcaat cagcggtttc atcacttttt 11100
tcagtgtgta atcatcgttt agctcaatca taccgagagc gccgtttgct aactcagccg 11160
tgcgtttttt atcgctttgc agaagttttt gactttcttg acggaagaat gatgtgcttt 11220
tgccatagta tgctttgtta aataaagatt cttcgccttg gtagccatct tcagttccag 11280
tgtttgcttc aaatactaag tatttgtggc ctttatcttc tacgtagtga ggatctctca 11340
gcgtatggtt gtcgcctgag ctgtagttgc cttcatcgat gaactgctgt acattttgat 11400
acgtttttcc gtcaccgtca aagattgatt tataatcctc tacaccgttg atgttcaaag 11460
agctgtctga tgctgatacg ttaacttgtg cagttgtcag tgtttgtttg ccgtaatgtt 11520
taccggagaa atcagtgtag aataaacgga tttttccgtc agatgtaaat gtggctgaac 11580
ctgaccattc ttgtgtttgg tcttttagga tagaatcatt tgcatcgaat ttgtcgctgt 11640
ctttaaagac gcggccagcg tttttccagc tgtcaataga agtttcgccg actttttgat 11700
agaacatgta aatcgatgtg tcatccgcat ttttaggatc tccggctaat gcaaagacga 11760
tgtggtagcc gtgatagttt gcgacagtgc cgtcagcgtt ttgtaatggc cagctgtccc 11820
aaacgtccag gccttttgca gaagagatat ttttaattgt ggacgaatca aattcagaaa 11880
cttgatattt ttcatttttt tgctgttcag ggatttgcag catatcatgg cgtgtaatat 11940
gggaaatgcc gtatgtttcc ttatatggct tttggttcgt ttctttcgca aacgcttgag 12000
ttgcgcctcc tgccagcagt gcggtagtaa aggttaatac tgttgcttgt tttgcaaact 12060
ttttgatgtt catcgttcat gtctcctttt ttatgtactg tgttagcggt ctgcttcttc 12120
cagccctcct gtttgaagat ggcaagttag ttacgcacaa taaaaaaaga cctaaaatat 12180
gtaaggggtg acgccaaagt atacactttg ccctttacac attttaggtc ttgcctgctt 12240
tatcagtaac aaacccgcgc gatttacttt tcgacctcat tctattagac tctcgtttgg 12300
attgcaactg gtctattttc ctcttttgtt tgatagaaaa tcataaaagg atttgcagac 12360
tacgggccta aagaactaaa aaatctatct gtttcttttc attctctgta ttttttatag 12420
tttctgttgc atgggcataa agttgccttt ttaatcacaa ttcagaaaat atcataatat 12480
ctcatttcac taaataatag tgaacggcag gtatatgtga tgggttaaaa a          12531
<210>15
<211>8554
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     载体序列
<400>15
tcgagaggcc tgacgtcggg cccggtaccg ttgctcgctg atctttcggc ttaacaactt 60
tgtattcaat cagtcgggca tagaaagaaa acgcaatgat ataggaacca actgccgcca 120
aaaccagcca cacagagttg attgtttcgc cacgggagaa agcgattgct ccccaaccca 180
ccgccgcgat aaccccaaag acaaggagac caacgcgggc ggtcggtgac attttagggg 240
acttcttcac gcctactgga aggtcagtag cgttgctgta caccaaatca tcgtcattga 300
tgttgtcagt ctgttttatg gtcacgatct ttactgtttt ctcttcgggt cgtttcaaag 360
ccactatgcg tagaaacagc gggcagaaac tgtgtgcaga aatgcatgca gaaaaaggaa 420
agttcggcca gatgggtgtt tctgtatgcc gatgatcgga tctttgacag ctgggtatgc 480
gacaaatcac cgagagttgt taattcttaa caatggaaaa gtaacattga gagatgattt 540
ataccatcct gcaccattta gagtggggct agtcataccc ccataaccct agctgtacgc 600
aatcgatttc aaatcagttg gaaaaagtca agaaaattac ccgagacata tgcggcttaa 660
agtttggctg ccatgtgaat ttttagcacc ctcaacagtt gagtgctggc actctcgagg 720
gtagagtgcc aaataggttg tttgacacac agttgttcac ccgcgacgac ggctgtgctg 780
gaaacccaca accggcacac acaaaatttt tctcatggag ggattcatca tgccaaagta 840
cgacaattcc aatgctgacc agtggggctt tgaaacccgc tccattcacg caggccagtc 900
agtagacgca cagaccagcg cacgaaacct tccgatctac caatccaccg ctttcgtgtt 960
cgactccgct gagcacgcca agcagcgttt cgcacttgag gatctaggcc ctgtttactc 1020
ccgcctcacc aacccaaccg ttgaggcttt ggaaaaccgc atcgcttccc tcgaaggtgg 1080
cgtccacgct gtagcgttct cctccggaca ggccgcaacc accaacgcca ttttgaacct 1140
ggcaggagcg ggcgaccaca tcgtcacctc cccacgcctc tacggtggca ccgagactct 1200
attccttatc actcttaacc gcctgggtat cgatgtttcc ttcgtggaaa accccgacga 1260
ccctgagtcc tggcaggcag ccgttcagcc aaacaccaaa gcattcttcg gcgagacttt 1320
cgccaaccca caggcagacg tcctggatat tcctgcggtg gctgaagttg cgcaccgcaa 1380
cagcgttcca ctgatcatcg acaacaccat cgctaccgca gcgctcgtgc gcccgctcga 1440
gctcggcgca gacgttgtcg tcgcttccct caccaagttc tacaccggca acggctccgg 1500
actgggcggc gtgcttatcg acggcggaaa gttcgattgg actgtcgaaa aggatggaaa 1560
gccagtattc ccctacttcg tcactccaga tgctgcttac cacggattga agtacgcaga 1620
ccttggtgca ccagccttcg gcctcaaggt tcgcgttggc cttctacgcg acaccggctc 1680
caccctctcc gcattcaacg catgggctgc agtccagggc atcgacaccc tttccctgcg 1740
cctggagcgc cacaacgaaa acgccatcaa ggttgcagaa ttcctcaaca accacgagaa 1800
ggtggaaaag gttaacttcg caggcctgaa ggattcccct tggtacgcaa ccaaggaaaa 1860
gcttggcctg aagtacaccg gctccgttct caccttcgag atcaagggcg gcaaggatga 1920
ggcttgggca tttatcgacg ccctgaagct acactccaac cttgcaaaca tcggcgatgt 1980
tcgctccctc gttgttcacc cagcaaccac cacccattca cagtccgacg aagctggcct 2040
ggcacgcgcg ggcgttaccc agtccaccgt ccgcctgtcc gttggcatcg agaccattga 2100
tgatatcatc gctgacctcg aaggcggctt tgctgcaatc tagcactagt tcggacctag 2160
ggatatcgtc gagagctgcc aattattccg ggcttgtgac ccgctacccg ataaataggt 2220
cggctgaaaa atttcgttgc aatatcaaca aaaaggccta tcattgggag gtgtcgcacc 2280
aagtactttt gcgaagcgcc atctgacgga ttttcaaaag atgtatatgc tcggtgcgga 2340
aacctacgaa aggatttttt acccatgccc accctcgcgc cttcaggtca acttgaaatc 2400
caagcgatcg gtgatgtctc caccgaagcc ggagcaatca ttacaaacgc tgaaatcgcc 2460
tatcaccgct ggggtgaata ccgcgtagat aaagaaggac gcagcaatgt cgttctcatc 2520
gaacacgccc tcactggaga ttccaacgca gccgattggt gggctgactt gctcggtccc 2580
ggcaaagcca tcaacactga tatttactgc gtgatctgta ccaacgtcat cggtggttgc 2640
aacggttcca ccggacctgg ctccatgcat ccagatggaa atttctgggg taatcgcttc 2700
cccgccacgt ccattcgtga tcaggtaaac gccgaaaaac aattcctcga cgcactcggc 2760
atcaccacgg tcgccgcagt acttggtggt tccatgggtg gtgcccgcac cctagagtgg 2820
gccgcaatgt acccagaaac tgttggcgca gctgctgttc ttgcagtttc tgcacgcgcc 2880
agcgcctggc aaatcggcat tcaatccgcc caaattaagg cgattgaaaa cgaccaccac 2940
tggcacgaag gcaactacta cgaatccggc tgcaacccag ccaccggact cggcgccgcc 3000
cgacgcatcg cccacctcac ctaccgtggc gaactagaaa tcgacgaacg cttcggcacc 3060
aaagcccaaa agaacgaaaa cccactcggt ccctaccgca agcccgacca gcgcttcgcc 3120
gtggaatcct acttggacta ccaagcagac aagctagtac agcgtttcga cgccggctcc 3180
tacgtcttgc tcaccgacgc cctcaaccgc cacgacattg gtcgcgaccg cggaggcctc 3240
aacaaggcac tcgaatccat caaagttcca gtccttgtcg caggcgtaga taccgatatt 3300
ttgtacccct accaccagca agaacacctc tccagaaacc tgggaaatct actggcaatg 3360
gcaaaaatcg tatcccctgt cggccacgat gctttcctca ccgaaagccg ccaaatggat 3420
cgcatcgtga ggaacttctt cagcctcatc tccccagacg aagacaaccc ttcgacctac 3480
atcgagttct acatctaaca tatgactagt tcggacctag ggatatcgtc gacatcgatg 3540
ctcttctgcg ttaattaaca attgggatcc tctagacccg ggatttaaat cgctagcggg 3600
ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtgct gaccccggat 3660
gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt 3720
agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga cagcaagcga 3780
accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 3840
gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatctg atcaagagac 3900
aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt ctccggccgc 3960
ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc 4020
cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc 4080
cggtgccctg aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg 4140
cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt 4200
gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc 4260
catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga 4320
ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga 4380
tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct 4440
caaggcgcgc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc 4500
gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt 4560
ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg 4620
cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat 4680
cgccttctat cgccttcttg acgagttctt ctgagcggga ctctggggtt cgaaatgacc 4740
gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 4800
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 4860
ctcatgctgg agttcttcgc ccacgctagc ggcgcgccgg ccggcccggt gtgaaatacc 4920
gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga 4980
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 5040
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 5100
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 5160
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 5220
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 5280
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 5340
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 5400
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 5460
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 5520
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 5580
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 5640
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 5700
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 5760
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 5820
cttcacctag atccttttaa aggccggccg cggccgcgca aagtcccgct tcgtgaaaat 5880
tttcgtgccg cgtgattttc cgccaaaaac tttaacgaac gttcgttata atggtgtcat 5940
gaccttcacg acgaagtact aaaattggcc cgaatcatca gctatggatc tctctgatgt 6000
cgcgctggag tccgacgcgc tcgatgctgc cgtcgattta aaaacggtga tcggattttt 6060
ccgagctctc gatacgacgg acgcgccagc atcacgagac tgggccagtg ccgcgagcga 6120
cctagaaact ctcgtggcgg atcttgagga gctggctgac gagctgcgtg ctcggccagc 6180
gccaggagga cgcacagtag tggaggatgc aatcagttgc gcctactgcg gtggcctgat 6240
tcctccccgg cctgacccgc gaggacggcg cgcaaaatat tgctcagatg cgtgtcgtgc 6300
cgcagccagc cgcgagcgcg ccaacaaacg ccacgccgag gagctggagg cggctaggtc 6360
gcaaatggcg ctggaagtgc gtcccccgag cgaaattttg gccatggtcg tcacagagct 6420
ggaagcggca gcgagaatta tcgcgatcgt ggcggtgccc gcaggcatga caaacatcgt 6480
aaatgccgcg tttcgtgtgc cgtggccgcc caggacgtgt cagcgccgcc accacctgca 6540
ccgaatcggc agcagcgtcg cgcgtcgaaa aagcgcacag gcggcaagaa gcgataagct 6600
gcacgaatac ctgaaaaatg ttgaacgccc cgtgagcggt aactcacagg gcgtcggcta 6660
acccccagtc caaacctggg agaaagcgct caaaaatgac tctagcggat tcacgagaca 6720
ttgacacacc ggcctggaaa ttttccgctg atctgttcga cacccatccc gagctcgcgc 6780
tgcgatcacg tggctggacg agcgaagacc gccgcgaatt cctcgctcac ctgggcagag 6840
aaaatttcca gggcagcaag acccgcgact tcgccagcgc ttggatcaaa gacccggaca 6900
cggagaaaca cagccgaagt tataccgagt tggttcaaaa tcgcttgccc ggtgccagta 6960
tgttgctctg acgcacgcgc agcacgcagc cgtgcttgtc ctggacattg atgtgccgag 7020
ccaccaggcc ggcgggaaaa tcgagcacgt aaaccccgag gtctacgcga ttttggagcg 7080
ctgggcacgc ctggaaaaag cgccagcttg gatcggcgtg aatccactga gcgggaaatg 7140
ccagctcatc tggctcattg atccggtgta tgccgcagca ggcatgagca gcccgaatat 7200
gcgcctgctg gctgcaacga ccgaggaaat gacccgcgtt ttcggcgctg accaggcttt 7260
ttcacatagg ctgagccgtg gccactgcac tctccgacga tcccagccgt accgctggca 7320
tgcccagcac aatcgcgtgg atcgcctagc tgatcttatg gaggttgctc gcatgatctc 7380
aggcacagaa aaacctaaaa aacgctatga gcaggagttt tctagcggac gggcacgtat 7440
cgaagcggca agaaaagcca ctgcggaagc aaaagcactt gccacgcttg aagcaagcct 7500
gccgagcgcc gctgaagcgt ctggagagct gatcgacggc gtccgtgtcc tctggactgc 7560
tccagggcgt gccgcccgtg atgagacggc ttttcgccac gctttgactg tgggatacca 7620
gttaaaagcg gctggtgagc gcctaaaaga caccaagggt catcgagcct acgagcgtgc 7680
ctacaccgtc gctcaggcgg tcggaggagg ccgtgagcct gatctgccgc cggactgtga 7740
ccgccagacg gattggccgc gacgtgtgcg cggctacgtc gctaaaggcc agccagtcgt 7800
ccctgctcgt cagacagaga cgcagagcca gccgaggcga aaagctctgg ccactatggg 7860
aagacgtggc ggtaaaaagg ccgcagaacg ctggaaagac ccaaacagtg agtacgcccg 7920
agcacagcga gaaaaactag ctaagtccag tcaacgacaa gctaggaaag ctaaaggaaa 7980
tcgcttgacc attgcaggtt ggtttatgac tgttgaggga gagactggct cgtggccgac 8040
aatcaatgaa gctatgtctg aatttagcgt gtcacgtcag accgtgaata gagcacttaa 8100
ggtctgcggg cattgaactt ccacgaggac gccgaaagct tcccagtaaa tgtgccatct 8160
cgtaggcaga aaacggttcc cccgtagggt ctctctcttg gcctcctttc taggtcgggc 8220
tgattgctct tgaagctctc taggggggct cacaccatag gcagataacg ttccccaccg 8280
gctcgcctcg taagcgcaca aggactgctc ccaaagatct tcaaagccac tgccgcgact 8340
gccttcgcga agccttgccc cgcggaaatt tcctccaccg agttcgtgca cacccctatg 8400
ccaagcttct ttcaccctaa attcgagaga ttggattctt accgtggaaa ttcttcgcaa 8460
aaatcgtccc ctgatcgccc ttgcgacgtt ggcgtcggtg ccgctggttg cgcttggctt 8520
gaccgacttg atcagcggcc gctcgattta aatc                             8554
<210>16
<211>183
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     启动子序列
<400>16
accctgcgaa tgtccacagg gtagctggta gtttgaaaat caacgccgtt gcccttagga 60
ttcagtaact ggcacatttt gtaatgcgct agatctgtgt gctcagtctt ccaggctgct 120
tatcacagtg aaagcaaaac caattcgtgg ctgcgaaagt cgtagccacc acgaagtcca 180
cga                                                               183
<210>17
<211>192
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     启动子序列
<400>17
gagctgccaa ttattccggg cttgtgaccc gctacccgat aaataggtcg gctgaaaaat 60
ttcgttgcaa tatcaacaaa aaggcctatc attgggaggt gtcgcaccaa gtacttttgc 120
gaagcgccat ctgacggatt ttcaaaagat gtatatgctc ggtgcggaaa cctacgaaag 180
gattttttac cc                                                     192
<210>18
<211>83
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     启动子序列
<400>18
tacgttaaat ctatcaccgc aagggataaa tatctaacac cgtgcgtgtt gactatttta 60
cctctgcggt gataatggtt gca                                         83
<210>19
<211>86
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     启动子序列
<400>19
taaaaaacat acagataacc atctgcggtg ataaattatc tctggcggtg ttgacataaa 60
taccactggc ggtgatactg agcaca                                      86
<210>20
<211>9462
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>20
ttgatcagcg gccgcttcgc gaagcttgtc gaccgaaaca gcagttataa ggcatgaagc 60
tgtccggttt ttgcaaaagt ggctgtgact gtaaaaagaa atcgaaaaag accgttttgt 120
gtgaaaacgg tctttttgtt tccttttaac caactgccat aactcgaggc tattgacgac 180
agctatggtt cactgtccac caaccaaaac tgtgctcagt accgccaata tttctccctt 240
gaggggtaca aagaggtgtc cctagaagag atccacgctg tgtaaaaatt ttacaaaaag 300
gtattgactt tccctacagg gtgtgtaata atttaattac aggcgggggc aaccccgcct 360
gttctagaag gaggagaaaa catgtcacag cacgttgaaa cgaaattagc tcaaattggg 420
aaccgtagcg atgaagtcac gggaacagtg agtgctccta tctatttatc aacagcatac 480
cgccacagag ggatcggaga atctaccgga tttgattatg tccgcacaaa aaatccgaca 540
cgccagcttg ttgaggacgc gatcgctaac ttagaaaacg gcgcgagagg gcttgccttt 600
agttcgggaa tggctgctat ccaaacgatt atggcgctgt ttaaaagcgg agatgaactg 660
atcgtttcat cggacctata tggcggcacg taccgtttat ttgaaaatga atggaaaaaa 720
tacggattga cttttcatta tgatgatttc agcgatgagg actgtttacg ctctaagatt 780
acgccgaata caaaagcggt gtttgtggaa acgccgacaa accccctcat gcaggaggcg 840
gacattgaac atattgcccg gattacaaag gagcacggtc ttctgctgat cgtagataat 900
acattttata caccggtctt gcagcggccg cttgagctgg gagctgacat tgtcattcac 960
agcgcaacca agtatttagg cgggcataac gatctgcttg ctggacttgt cgtggtgaag 1020
gatgagcggc tcggagagga aatgtttcag catcaaaatg caatcggcgc cgtcctgccg 1080
ccatttgatt cgtggcttct gatgagagga atgaagacgc tgagcctcag aatgcgccag 1140
catcaggcaa acgcgcagga gcttgcggcg tttttagaag agcaggaaga aatttcggat 1200
gtgctgtatc ccggaaaagg cggcatgctg tccttccgtc tgcaaaaaga agaatgggtc 1260
aatccgtttt taaaagcact gaagaccatt tgttttgcag aaagcctcgg cggggtggaa 1320
agctttatta cataccctgc gacccagacg cacatggata ttcctgaaga gatccgcatc 1380
gcaaacgggg tgtgcaatcg gttgctgcgc ttttctgtcg gtattgaaca tgcggaagat 1440
ttaaaagagg atctaaaaca ggcattatgt caggtcaaag agggagctgt ttcatttgag 1500
taaacacaat tggacgctgg aaacccagct cgtgcacaat ccatttaaaa cagacggcgg 1560
aaccggggca gtcagtgtac cgattcagca cgcctcagga tccgccctcc cgcacgcttt 1620
gcgggagggc ttttcttttc ccggtattta tcgtcgagag ctgccaatta ttccgggctt 1680
gtgacccgct acccgataaa taggtcggct gaaaaatttc gttgcaatat caacaaaaag 1740
gcctatcatt gggaggtgtc gcaccaagta cttttgcgaa gcgccatctg acggattttc 1800
aaaagatgta tatgctcggt gcggaaacct acgaaaggat tttttaccca tgcccaccct 1860
cgcgccttca ggtcaacttg aaatccaagc gatcggtgat gtctccaccg aagccggagc 1920
aatcattaca aacgctgaaa tcgcctatca ccgctggggt gaataccgcg tagataaaga 1980
aggacgcagc aatgtcgttc tcatcgaaca cgccctcact ggagattcca acgcagccga 2040
ttggtgggct gacttgctcg gtcccggcaa agccatcaac actgatattt actgcgtgat 2100
ctgtaccaac gtcatcggtg gttgcaacgg ttccaccgga cctggctcca tgcatccaga 2160
tggaaatttc tggggtaatc gcttccccgc cacgtccatt cgtgatcagg taaacgccga 2220
aaaacaattc ctcgacgcac tcggcatcac cacggtcgcc gcagtacttg gtggttccat 2280
gggtggtgcc cgcaccctag agtgggccgc aatgtaccca gaaactgttg gcgcagctgc 2340
tgttcttgca gtttctgcac gcgccagcgc ctggcaaatc ggcattcaat ccgcccaaat 2400
taaggcgatt gaaaacgacc accactggca cgaaggcaac tactacgaat ccggctgcaa 2460
cccagccacc ggactcggcg ccgcccgacg catcgcccac ctcacctacc gtggcgaact 2520
agaaatcgac gaacgcttcg gcaccaaagc ccaaaagaac gaaaacccac tcggtcccta 2580
ccgcaagccc gaccagcgct tcgccgtgga atcctacttg gactaccaag cagacaagct 2640
agtacagcgt ttcgacgccg gctcctacgt cttgctcacc gacgccctca accgccacga 2700
cattggtcgc gaccgcggag gcctcaacaa ggcactcgaa tccatcaaag ttccagtcct 2760
tgtcgcaggc gtagataccg atattttgta cccctaccac cagcaagaac acctctccag 2820
aaacctggga aatctactgg caatggcaaa aatcgtatcc cctgtcggcc acgatgcttt 2880
cctcaccgaa agccgccaaa tggatcgcat cgtgaggaac ttcttcagcc tcatctcccc 2940
agacgaagac aacccttcga cctacatcga gttctacatc taacatatga ctagttcgga 3000
cctagggata aatcgctagc gggctgctaa aggaagcgga acacgtagaa agccagtccg 3060
cagaaacggt gctgaccccg gatgaatgtc agctactggg ctatctggac aagggaaaac 3120
gcaagcgcaa agagaaagca ggtagcttgc agtgggctta catggcgata gctagactgg 3180
gcggttttat ggacagcaag cgaaccggaa ttgccagctg gggcgccctc tggtaaggtt 3240
gggaagccct gcaaagtaaa ctggatggct ttcttgccgc caaggatctg atggcgcagg 3300
ggatcaagat ctgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga 3360
ttgcacgcag gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa 3420
cagacaatcg gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt 3480
ctttttgtca agaccgacct gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg 3540
ctatcgtggc tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa 3600
gcgggaaggg actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac 3660
cttgctcctg ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt 3720
gatccggcta cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact 3780
cggatggaag ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg 3840
ccagccgaac tgttcgccag gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg 3900
acccatggcg atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc 3960
atcgactgtg gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt 4020
gatattgctg aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc 4080
gccgctcccg attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgagcg 4140
ggactctggg gttcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 4200
attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 4260
ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacgct agtttaaact 4320
gcggatcagt gagggtttgt aactgcgggt caaggatctg gatttcgatc acggcacgat 4380
catcgtgcgg gagggcaagg gctccaagga tcgggccttg atgttacccg agagcttggc 4440
acccagcctg cgcgagcagg ggaattgatc cggtggatga ccttttgaat gacctttaat 4500
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4560
ttcacaaaac ggtttacaag cataacgggt tttgctgccc gcaaacgggc tgttctggtg 4620
ttgctagttt gttatcagaa tcgcagatcc ggcttcaggt ttgccggctg aaagcgctat 4680
ttcttccaga attgccatga ttttttcccc acgggaggcg tcactggctc ccgtgttgtc 4740
ggcagctttg attcgataag cagcatcgcc tgtttcaggc tgtctatgtg tgactgttga 4800
gctgtaacaa gttgtctcag gtgttcaatt tcatgttcta gttgctttgt tttactggtt 4860
tcacctgttc tattaggtgt tacatgctgt tcatctgtta cattgtcgat ctgttcatgg 4920
tgaacagctt taaatgcacc aaaaactcgt aaaagctctg atgtatctat cttttttaca 4980
ccgttttcat ctgtgcatat ggacagtttt ccctttgata tctaacggtg aacagttgtt 5040
ctacttttgt ttgttagtct tgatgcttca ctgatagata caagagccat aagaacctca 5100
gatccttccg tatttagcca gtatgttctc tagtgtggtt cgttgttttt gcgtgagcca 5160
tgagaacgaa ccattgagat catgcttact ttgcatgtca ctcaaaaatt ttgcctcaaa 5220
actggtgagc tgaatttttg cagttaaagc atcgtgtagt gtttttctta gtccgttacg 5280
taggtaggaa tctgatgtaa tggttgttgg tattttgtca ccattcattt ttatctggtt 5340
gttctcaagt tcggttacga gatccatttg tctatctagt tcaacttgga aaatcaacgt 5400
atcagtcggg cggcctcgct tatcaaccac caatttcata ttgctgtaag tgtttaaatc 5460
tttacttatt ggtttcaaaa cccattggtt aagcctttta aactcatggt agttattttc 5520
aagcattaac atgaacttaa attcatcaag gctaatctct atatttgcct tgtgagtttt 5580
cttttgtgtt agttctttta ataaccactc ataaatcctc atagagtatt tgttttcaaa 5640
agacttaaca tgttccagat tatattttat gaattttttt aactggaaaa gataaggcaa 5700
tatctcttca ctaaaaacta attctaattt ttcgcttgag aacttggcat agtttgtcca 5760
ctggaaaatc tcaaagcctt taaccaaagg attcctgatt tccacagttc tcgtcatcag 5820
ctctctggtt gctttagcta atacaccata agcattttcc ctactgatgt tcatcatctg 5880
agcgtattgg ttataagtga acgataccgt ccgttctttc cttgtagggt tttcaatcgt 5940
ggggttgagt agtgccacac agcataaaat tagcttggtt tcatgctccg ttaagtcata 6000
gcgactaatc gctagttcat ttgctttgaa aacaactaat tcagacatac atctcaattg 6060
gtctaggtga ttttaatcac tataccaatt gagatgggct agtcaatgat aattactagt 6120
ccttttcctt tgagttgtgg gtatctgtaa attctgctag acctttgctg gaaaacttgt 6180
aaattctgct agaccctctg taaattccgc tagacctttg tgtgtttttt ttgtttatat 6240
tcaagtggtt ataatttata gaataaagaa agaataaaaa aagataaaaa gaatagatcc 6300
cagccctgtg tataactcac tactttagtc agttccgcag tattacaaaa ggatgtcgca 6360
aacgctgttt gctcctctac aaaacagacc ttaaaaccct aaaggcttaa gtagcaccct 6420
cgcaagctcg ggcaaatcgc tgaatattcc ttttgtctcc gaccatcagg cacctgagtc 6480
gctgtctttt tcgtgacatt cagttcgctg cgctcacggc tctggcagtg aatgggggta 6540
aatggcacta caggcgcctt ttatggattc atgcaaggaa actacccata atacaagaaa 6600
agcccgtcac gggcttctca gggcgtttta tggcgggtct gctatgtggt gctatctgac 6660
tttttgctgt tcagcagttc ctgccctctg attttccagt ctgaccactt cggattatcc 6720
cgtgacaggt cattcagact ggctaatgca cccagtaagg cagcggtatc atcaacaggc 6780
ttagtttaaa ccgcaaagtc ccgcttcgtg aaaattttcg tgccgcgtga ttttccgcca 6840
aaaactttaa cgaacgttcg ttataatggt gtcatgacct tcacgacgaa gtactaaaat 6900
tggcccgaat catcagctat ggatctctct gatgtcgcgc tggagtccga cgcgctcgat 6960
gctgccgtcg atttaaaaac ggtgatcgga tttttccgag ctctcgatac gacggacgcg 7020
ccagcatcac gagactgggc cagtgccgcg agcgacctag aaactctcgt ggcggatctt 7080
gaggagctgg ctgacgagct gcgtgctcgg ccagcgccag gaggacgcac agtagtggag 7140
gatgcaatca gttgcgccta ctgcggtggc ctgattcctc cccggcctga cccgcgagga 7200
cggcgcgcaa aatattgctc agatgcgtgt cgtgccgcag ccagccgcga gcgcgccaac 7260
aaacgccacg ccgaggagct ggaggcggct aggtcgcaaa tggcgctgga agtgcgtccc 7320
ccgagcgaaa ttttggccat ggtcgtcaca gagctggaag cggcagcgag aattatcgcg 7380
atcgtggcgg tgcccgcagg catgacaaac atcgtaaatg ccgcgtttcg tgtgccgtgg 7440
ccgcccagga cgtgtcagcg ccgccaccac ctgcaccgaa tcggcagcag cgtcgcgcgt 7500
cgaaaaagcg cacaggcggc aagaagcgat aagctgcacg aatacctgaa aaatgttgaa 7560
cgccccgtga gcggtaactc acagggcgtc ggctaacccc cagtccaaac ctgggagaaa 7620
gcgctcaaaa atgactctag cggattcacg agacattgac acaccggcct ggaaattttc 7680
cgctgatctg ttcgacaccc atcccgagct cgcgctgcga tcacgtggct ggacgagcga 7740
agaccgccgc gaattcctcg ctcacctggg cagagaaaat ttccagggca gcaagacccg 7800
cgacttcgcc agcgcttgga tcaaagaccc ggacacggag aaacacagcc gaagttatac 7860
cgagttggtt caaaatcgct tgcccggtgc cagtatgttg ctctgacgca cgcgcagcac 7920
gcagccgtgc ttgtcctgga cattgatgtg ccgagccacc aggccggcgg gaaaatcgag 7980
cacgtaaacc ccgaggtcta cgcgattttg gagcgctggg cacgcctgga aaaagcgcca 8040
gcttggatcg gcgtgaatcc actgagcggg aaatgccagc tcatctggct cattgatccg 8100
gtgtatgccg cagcaggcat gagcagcccg aatatgcgcc tgctggctgc aacgaccgag 8160
gaaatgaccc gcgttttcgg cgctgaccag gctttttcac ataggctgag ccgtggccac 8220
tgcactctcc gacgatccca gccgtaccgc tggcatgccc agcacaatcg cgtggatcgc 8280
ctagctgatc ttatggaggt tgctcgcatg atctcaggca cagaaaaacc taaaaaacgc 8340
tatgagcagg agttttctag cggacgggca cgtatcgaag cggcaagaaa agccactgcg 8400
gaagcaaaag cacttgccac gcttgaagca agcctgccga gcgccgctga agcgtctgga 8460
gagctgatcg acggcgtccg tgtcctctgg actgctccag ggcgtgccgc ccgtgatgag 8520
acggcttttc gccacgcttt gactgtggga taccagttaa aagcggctgg tgagcgccta 8580
aaagacacca agggtcatcg agcctacgag cgtgcctaca ccgtcgctca ggcggtcgga 8640
ggaggccgtg agcctgatct gccgccggac tgtgaccgcc agacggattg gccgcgacgt 8700
gtgcgcggct acgtcgctaa aggccagcca gtcgtccctg ctcgtcagac agagacgcag 8760
agccagccga ggcgaaaagc tctggccact atgggaagac gtggcggtaa aaaggccgca 8820
gaacgctgga aagacccaaa cagtgagtac gcccgagcac agcgagaaaa actagctaag 8880
tccagtcaac gacaagctag gaaagctaaa ggaaatcgct tgaccattgc aggttggttt 8940
atgactgttg agggagagac tggctcgtgg ccgacaatca atgaagctat gtctgaattt 9000
agcgtgtcac gtcagaccgt gaatagagca cttaaggtct gcgggcattg aacttccacg 9060
aggacgccga aagcttccca gtaaatgtgc catctcgtag gcagaaaacg gttcccccgt 9120
agggtctctc tcttggcctc ctttctaggt cgggctgatt gctcttgaag ctctctaggg 9180
gggctcacac cataggcaga taacgttccc caccggctcg cctcgtaagc gcacaaggac 9240
tgctcccaaa gatcttcaaa gccactgccg cgactgcctt cgcgaagcct tgccccgcgg 9300
aaatttcctc caccgagttc gtgcacaccc ctatgccaag cttctttcac cctaaattcg 9360
agagattgga ttcttaccgt ggaaattctt cgcaaaaatc gtcccctgat cgcccttgcg 9420
acgttggcgt cggtgccgct ggttgcgctt ggcttgaccg ac                    9462
<210>21
<211>6779
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>21
agaggatccg actgtttcag aagtgatgac tcctgaaaat ttgggcgcgc tgtatgacat 60
gtcggtgtcg ttggaaactg tgcgcagccg gtggttcgcg ttcgatgctc tgcattaaaa 120
ggggctagtt ttacacaaaa gtggacagct tggtctatca ttgccagaag accggtcctt 180
ttagggccat agaattctga ttacaggagt tgatctacct tgtcttttga cccaaacacc 240
cagggtttct ccactgcatc gattcacgct gggtatgagc cagacgacta ctacggttcg 300
attaacaccc caatctatgc ctccaccacc ttcgcgcaga acgctccaaa cgaactgcgc 360
aaaggctacg agtacacccg tgtgggcaac cccaccatcg tggcattaga gcagaccgtc 420
gcagcactcg aaggcgcaaa gtatggccgc gcattctcct ccggcatggc tgcaaccgac 480
atcctgttcc gcatcatcct caagccgggc gatcacatct gtttaagttt agtggatggg 540
ccaggtctga agaaccaccc aggccacgaa gtcgcagcga agcagatgaa gcgcttcggc 600
ggcatgatct ccgtccgttt cgcaggcggc gaagaagcag ctaagaagtt ctgtacctcc 660
accaaactga tctgtctggc cgagtccctc ggtggcgtgg aatccctcct ggagcaccca 720
gcaaccatga cccaccagtc agctgccggc tctcagctcg aggttccccg cgacctcgtg 780
cgcatctcca ttggtattga agacattgaa gacctgctcg cagatgtcga gcaggccctc 840
aataaccttt agaaactatt tggcggcaag cagcttttca atataagcaa tgcgagcctc 900
caccatgtag ccgaagagtt cgtcagaagt tgagacggac tcttcgactg ctttacgggt 960
cagtggcgct tccacatctg ggttctcatc aagccatggc ttaggaaccg gagcaaacac 1020
atccggcttt tcgccctctg gacgattgtc aaaggtgtag tcggatcccc gggtaccgag 1080
ctcgaattca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 1140
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 1200
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgat aagctagctt 1260
cacgctgccg caagcactca gggcgcaagg gctgctaaag gaagcggaac acgtagaaag 1320
ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct atctggacaa 1380
gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca tggcgatagc 1440
tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg gcgccctctg 1500
gtaaggttgg gaagccctgc aaagtaaact ggatggcttt cttgccgcca aggatctgat 1560
ggcgcagggg atcaagatct gatcaagaga caggatgagg atcgtttcgc atgattgaac 1620
aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 1680
gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 1740
gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactc caagacgagg 1800
cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 1860
tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 1920
catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 1980
atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 2040
cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 2100
ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg gatgcccgac ggcgaggatc 2160
tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 2220
ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 2280
ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 2340
acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 2400
tctgagcggg actctggggt tcgctagagg atcgatcctt tttaacccat cacatatacc 2460
tgccgttcac tattatttag tgaaatgaga tattatgata ttttctgaat tgtgattaaa 2520
aaggcaactt tatgcccatg caacagaaac tataaaaaat acagagaatg aaaagaaaca 2580
gatagatttt ttagttcttt aggcccgtag tctgcaaatc cttttatgat tttctatcaa 2640
acaaaagagg aaaatagacc agttgcaatc caaacgagag tctaatagaa tgaggtcgaa 2700
aagtaaatcg cgcgggtttg ttactgataa agcaggcaag acctaaaatg tgtaaagggc 2760
aaagtgtata ctttggcgtc accccttaca tattttaggt ctttttttat tgtgcgtaac 2820
taacttgcca tcttcaaaca ggagggctgg aagaagcaga ccgctaacac agtacataaa 2880
aaaggagaca tgaacgatga acatcaaaaa gtttgcaaaa caagcaacag tattaacctt 2940
tactaccgca ctgctggcag gaggcgcaac tcaagcgttt gcgaaagaaa cgaaccaaaa 3000
gccatataag gaaacatacg gcatttccca tattacacgc catgatatgc tgcaaatccc 3060
tgaacagcaa aaaaatgaaa aatatcaagt ttctgaattt gattcgtcca caattaaaaa 3120
tatctcttct gcaaaaggcc tggacgtttg ggacagctgg ccattacaaa acgctgacgg 3180
cactgtcgca aactatcacg gctaccacat cgtctttgca ttagccggag atcctaaaaa 3240
tgcggatgac acatcgattt acatgttcta tcaaaaagtc ggcgaaactt ctattgacag 3300
ctggaaaaac gctggccgcg tctttaaaga cagcgacaaa ttcgatgcaa atgattctat 3360
cctaaaagac caaacacaag aatggtcagg ttcagccaca tttacatctg acggaaaaat 3420
ccgtttattc tacactgatt tctccggtaa acattacggc aaacaaacac tgacaactgc 3480
acaagttaac gtatcagcat cagacagctc tttgaacatc aacggtgtag aggattataa 3540
atcaatcttt gacggtgacg gaaaaacgta tcaaaatgta cagcagttca tcgatgaagg 3600
caactacagc tcaggcgaca accatacgct gagagatcct cactacgtag aagataaagg 3660
ccacaaatac ttagtatttg aagcaaacac tggaactgaa gatggctacc aaggcgaaga 3720
atctttattt aacaaagcat actatggcaa aagcacatca ttcttccgtc aagaaagtca 3780
aaaacttctg caaagcgata aaaaacgcac ggctgagtta gcaaacggcg ctctcggtat 3840
gattgagcta aacgatgatt acacactgaa aaaagtgatg aaaccgctga ttgcatctaa 3900
cacagtaaca gatgaaattg aacgcgcgaa cgtctttaaa atgaacggca aatggtacct 3960
gttcactgac tcccgcggat caaaaatgac gattgacggc attacgtcta acgatattta 4020
catgcttggt tatgtttcta attctttaac tggcccatac aagccgctga acaaaactgg 4080
ccttgtgtta aaaatggatc ttgatcctaa cgatgtaacc tttacttact cacacttcgc 4140
tgtacctcaa gcgaaaggaa acaatgtcgt gattacaagc tatatgacaa acagaggatt 4200
ctacgcagac aaacaatcaa cgtttgcgcc gagcttcctg ctgaacatca aaggcaagaa 4260
aacatctgtt gtcaaagaca gcatccttga acaaggacaa ttaacagtta acaaataaaa 4320
acgcaaaaga aaatgccgat gggtaccgag cgaaatgacc gaccaagcga cgcccaacct 4380
gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt 4440
tttccgggac gccctcgcgg acgtgctcat agtccacgac gcccgtgatt ttgtagccct 4500
ggccgacggc cagcaggtag gccgacaggc tcatgccggc cgccgccgcc ttttcctcaa 4560
tcgctcttcg ttcgtctgga aggcagtaca ccttgatagg tgggctgccc ttcctggttg 4620
gcttggtttc atcagccatc cgcttgccct catctgttac gccggcggta gccggccagc 4680
ctcgcagagc aggattcccg ttgagcaccg ccaggtgcga ataagggaca gtgaagaagg 4740
aacacccgct cgcgggtggg cctacttcac ctatcctgcc cggctgacgc cgttggatac 4800
accaaggaaa gtctacacga accctttggc aaaatcctgt atatcgtgcg aaaaaggatg 4860
gatataccga aaaaatcgct ataatgaccc cgaagcaggg ttatgcagcg gaaaagcgct 4920
gcttccctgc tgttttgtgg aatatctacc gactggaaac aggcaaatgc aggaaattac 4980
tgaactgagg ggacaggcga gagacgatgc caaagagctc ctgaaaatct cgataactca 5040
aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc 5100
cgatcaacgt ctcattttcg ccaaaagttg gcccagggct tcccggtatc aacagggaca 5160
ccaggattta tttattctgc gaagtgatct tccgtcacag gtatttattc ggcgcaaagt 5220
gcgtcgggtg atgctgccaa cttactgatt tagtgtatga tggtgttttt gaggtgctcc 5280
agtggcttct gtttctatca gctcctgaaa atctcgataa ctcaaaaaat acgcccggta 5340
gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca acgtctcatt 5400
ttcgccaaaa gttggcccag ggcttcccgg tatcaacagg gacaccagga tttatttatt 5460
ctgcgaagtg atcttccgtc acaggtattt attcggcgca aagtgcgtcg ggtgatgctg 5520
ccaacttact gatttagtgt atgatggtgt ttttgaggtg ctccagtggc ttctgtttct 5580
atcagggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 5640
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 5700
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 5760
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 5820
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 5880
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 5940
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 6000
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 6060
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 6120
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 6180
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 6240
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 6300
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 6360
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 6420
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 6480
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 6540
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 6600
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 6660
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 6720
acacaggaaa cagctatgac catgattacg ccaagcttgc atgcctgcag gtcgactct  6779
<210>22
<211>6934
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>22
tcgagaggcc tgacgtcggg cccggtacca cgcgtcatat gactagttcg gacctaggga 60
tcttcaaccc tcctctcgcc gcttgagact gtgattgggc ttacctcttt ggcttcgaac 120
accggggttg aggtagtggt tacttccatg gtttcctcag cggaaacggc ttggctatca 180
gcactttcac ccgaacagcc tgcaagaagt gcgacggcta acagggctgg gattgtcctc 240
aacttcactt cgggctcctt cttagtaata ggttcgtaga aaagtttact agcctagaga 300
gtatgcgatt tcctgaactc gaagaattga agaatcgccg gaccttgaaa tggacccggt 360
ttccagaaga cgtgcttcct ttgtgggttg cggaaagtga ttttggcacc tgcccgcagt 420
tgaaggaagc tatggcagat gccgttgagc gcgaggtctt cggataccca ccagatgcta 480
ctgggttgaa tgatgcgttg actggattct acgagcgtcg ctatgggttt ggcccaaatc 540
cggaaagtgt tttcgccatt ccggatgtgg ttcgtggcct gaagcttgcc attgagcatt 600
tcactaagcc tggttcggcg atcattgtgc cgttgcctgc ataccctcct ttcattgagt 660
tgcctaaggt gactggtcgt caggcgatct acattgatgc ctgcggccgc acagcgatcc 720
cagaggaaat atcctctggg gtcgctgtgt cgaccttaaa gtttggctgc catgtgaatt 780
tttagcaccc tcaacagttg agtgctggca ctctcggggg tagagtgcca aataggttgt 840
ttgacacaca gttgttcacc cgcgacgacg gctgtgctgg aaacccacaa ccggcacaca 900
caaaattttt ctagaggagg gattcatcat gaactttaat aaaattgatt tagacaattg 960
gaagagaaaa gagatattta atcattattt gaaccaacaa acgactttta gtataaccac 1020
agaaattgat attagtgttt tataccgaaa cataaaacaa gaaggatata aattttaccc 1080
tgcatttatt ttcttagtga caagggtgat aaactcaaat acagctttta gaactggtta 1140
caatagcgac ggagagttag gttattggga taagttagag ccactttata caatttttga 1200
tggtgtatct aaaacattct ctggtatttg gactcctgta aagaatgact tcaaagagtt 1260
ttatgattta tacctttctg atgtagagaa atataatggt tcggggaaat tgtttcccaa 1320
aacacctata cctgaaaatg ctttttctct ttctattatt ccatggactt catttactgg 1380
gtttaactta aatatcaata ataatagtaa ttaccttcta cccattatta cagcaggaaa 1440
attcattaat aaaggtaatt caatatattt accgctatct ttacaggtac atcattctgt 1500
ttgtgatggt tatcatgcag gattgtttat gaactctatt caggaattgt cagataggcc 1560
taatgactgg cttttataat atgagataat gccgactgta ctttttggat ccgccctccc 1620
gcacgctttg cgggagggcg gtaccagctc accgatattg cggcgaagta cgatgcccgc 1680
atcatcgtcg atgagatcca cgcgccactg gtttatgaag gcacccatgt ggttgctgct 1740
ggtgtttctg agaacgctgc aaacacttgc atcaccatca ccgcaacttc taaggcgtgg 1800
aacactgctg gtttgaagtg tgctcagatc ttcttcagta atgaagccga tgtgaaggcc 1860
tggaagaatt tgtcggatat tacccgtgac ggtgtgtcca tccttggatt gatcgctgcg 1920
gagacagtgt acaacgaggg cgaagaattc cttgatgagt caattcagat tctcaaggac 1980
aaccgtgact ttgcggctgc tgaactggaa aagcttggcg tgaaggtcta cgcaccggac 2040
tccacttatt tgatgtggtt ggacttcgct ggcaccaaga tcgaagaggc gccttctaaa 2100
attcttcgtg aggagggtaa ggtcatgctg aatgatggcg cagcttttgg tggtttcacc 2160
acctgcgctc gtcttaattt tgcgtgttcc agagagaccc ttgaggaggg gctgcgccgt 2220
atcgccagcg tgttgtaaat aatgagtaaa aagtctgtcc tgattacttc tttgatgctg 2280
ttttccatgt tcttcggagc tggaaacctc atcttcccgc cgatgcttgg attgtcggca 2340
ggaaccaact atctaccagc tatcttagga tttctagcaa cgagtgttct gctcccggtg 2400
ctggcgatta tcgcggtggt gttgtcggga gaaaatgtca aggacatggc ttctcgtggc 2460
ggtaagatct ttggcctggt gtttcctatt gctgcctatt tgtctatcgg cgcgttttac 2520
gcgctgccga ggactggggc ggtgagctat tcgacggcgg ttggcgtcga taatgcgctt 2580
tattcgggct tgtttaactt tgtgtttttt gcggtggcac tggcgttgtc gtggaatccg 2640
aatggcattg cagacaagtt gggtaagtgg ctcacgccag cgttgctcac gttgattgtg 2700
gtgctggtgg tgttgtcggt agctaagttg atcgtcgaca tcgatgctct tctgcgttaa 2760
ttaacaattg ggatcctcta gacccgggat ttaaatcgct agcgggctgc taaaggaagc 2820
ggaacacgta gaaagccagt ccgcagaaac ggtgctgacc ccggatgaat gtcagctact 2880
gggctatctg gacaagggaa aacgcaagcg caaagagaaa gcaggtagct tgcagtgggc 2940
ttacatggcg atagctagac tgggcggttt tatggacagc aagcgaaccg gaattgccag 3000
ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt aaactggatg gctttcttgc 3060
cgccaaggat ctgatggcgc aggggatcaa gatctgatca agagacagga tgaggatcgt 3120
ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 3180
tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 3240
tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 3300
aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 3360
ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 3420
ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 3480
caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 3540
atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 3600
acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 3660
ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 3720
aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 3780
aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 3840
gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 3900
ttcttgacga gttcttctga gcgggactct ggggttcgaa atgaccgacc aagcgacgcc 3960
caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 4020
aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 4080
cttcgcccac gctagtttaa acaccccgag tccactgagc gtcagacccc ttaataagat 4140
gatcttcttg agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac gaaaaaaccg 4200
ccttgcaggg cggtttttcg aaggttctct gagctaccaa ctctttgaac cgaggtaact 4260
ggcttggagg agcgcagtca ccaaaacttg tcctttcagt ttagccttaa ccggcgcatg 4320
acttcaagac taactcctct aaatcaatta ccagtggctg ctgccagtgg tgcttttgca 4380
tgtctttccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcggactga 4440
acggggggtt cgtgcataca gtccagcttg gagcgaactg cctacccgga actgagtgtc 4500
aggcgtggaa tgagacaaac gcggccataa cagcggaatg acaccggtaa accgaaaggc 4560
aggaacagga gagcgcacga gggagccgcc agggggaaac gcctggtatc tttatagtcc 4620
tgtcgggttt cgccaccact gatttgagcg tcagatttcg tgatgcttgt caggggggcg 4680
gagcctatgg aaaaacggct ttgccgcggc cctctcactt ccctgttaag tatcttcctg 4740
gcatcttcca ggaaatctcc gccccgttcg taagccattt ccgctcgccg cagtcgaacg 4800
accgagcgta gcgagtcagt gagcgaggaa gcggaatata tcctgtatca catattctgc 4860
tgacgcaccg gtgcagcctt ttttctcctg ccacatgaag cacttcactg acaccctcat 4920
cagtgccaac atagtaagcc agtatacact ccgctagcgc atgcatccat ttaaatggaa 4980
gaaataaaag aaaatgccaa taggatattg gcattttctt ttgcgttttt atttgttaac 5040
tgttaattgt ccttgttcaa ggatgctgtc tttgacaaca gatgttttct tgcctttgat 5100
gttcagcagg aagctcggcg caaacgttga ttgtttgtct gcgtagaatc ctctgtttgt 5160
catatagctt gtaatcacga cattgtttcc tttcgcttga ggtacagcga agtgtgagta 5220
agtaaaggtt acatcgttag gatcaagatc catttttaac acaaggccag ttttgttcag 5280
cggcttgtat gggccagtta aagaattaga aacataacca agcatgtaaa tatcgttaga 5340
cgtaatgccg tcaatcgtca tttttgatcc gcgggagtca gtgaacaggt accatttgcc 5400
gttcatttta aagacgttcg cgcgttcaat ttcatctgtt actgtgttag atgcaatcag 5460
cggtttcatc acttttttca gtgtgtaatc atcgtttagc tcaatcatac cgagagcgcc 5520
gtttgctaac tcagccgtgc gttttttatc gctttgcaga agtttttgac tttcttgacg 5580
gaagaatgat gtgcttttgc catagtatgc tttgttaaat aaagattctt cgccttggta 5640
gccatcttca gttccagtgt ttgcttcaaa tactaagtat ttgtggcctt tatcttctac 5700
gtagtgagga tctctcagcg tatggttgtc gcctgagctg tagttgcctt catcgatgaa 5760
ctgctgtaca ttttgatacg tttttccgtc accgtcaaag attgatttat aatcctctac 5820
accgttgatg ttcaaagagc tgtctgatgc tgatacgtta acttgtgcag ttgtcagtgt 5880
ttgtttgccg taatgtttac cggagaaatc agtgtagaat aaacggattt ttccgtcaga 5940
tgtaaatgtg gctgaacctg accattcttg tgtttggtct tttaggatag aatcatttgc 6000
atcgaatttg tcgctgtctt taaagacgcg gccagcgttt ttccagctgt caatagaagt 6060
ttcgccgact ttttgataga acatgtaaat cgatgtgtca tccgcatttt taggatctcc 6120
ggctaatgca aagacgatgt ggtagccgtg atagtttgcg acagtgccgt cagcgttttg 6180
taatggccag ctgtcccaaa cgtccaggcc ttttgcagaa gagatatttt taattgtgga 6240
cgaatcaaat tcagaaactt gatatttttc atttttttgc tgttcaggga tttgcagcat 6300
atcatggcgt gtaatatggg aaatgccgta tgtttcctta tatggctttt ggttcgtttc 6360
tttcgcaaac gcttgagttg cgcctcctgc cagcagtgcg gtagtaaagg ttaatactgt 6420
tgcttgtttt gcaaactttt tgatgttcat cgttcatgtc tcctttttta tgtactgtgt 6480
tagcggtctg cttcttccag ccctcctgtt tgaagatggc aagttagtta cgcacaataa 6540
aaaaagacct aaaatatgta aggggtgacg ccaaagtata cactttgccc tttacacatt 6600
ttaggtcttg cctgctttat cagtaacaaa cccgcgcgat ttacttttcg acctcattct 6660
attagactct cgtttggatt gcaactggtc tattttcctc ttttgtttga tagaaaatca 6720
taaaaggatt tgcagactac gggcctaaag aactaaaaaa tctatctgtt tcttttcatt 6780
ctctgtattt tttatagttt ctgttgcatg ggcataaagt tgccttttta atcacaattc 6840
agaaaatatc ataatatctc atttcactaa ataatagtga acggcaggta tatgtgatgg 6900
gttaaaaagg atcggcggcc gctcgattta aatc                             6934
<210>23
<211>1851
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>23
gttcggccag atgggtgttt ctgtatgccg atgatcggat ctttgacagc tgggtatgcg 60
acaaatcacc gagagttgtt aattcttaac aatggaaaag taacattgag agatgattta 120
taccatcctg caccatttag agtggggcta gtcatacccc cataacccta gctgtacgca 180
atcgatttca aatcagttgg aaaaagtcaa gaaaattacc cgagaataaa tttataccac 240
acagtctatt gcaatagacc aagctgttca gtagggtgca tgggagaaga atttcctaat 300
aaaaactctt aaggacctcc aaatgccaaa gtacgacaat tccaatgctg accagtgggg 360
ctttgaaacc cgctccattc acgcaggcca gtcagtagac gcacagacca gcgcacgaaa 420
ccttccgatc taccaatcca ccgctttcgt gttcgactcc gctgagcacg ccaagcagcg 480
tttcgcactt gaggatctag gccctgttta ctcccgcctc accaacccaa ccgttgaggc 540
tttggaaaac cgcatcgctt ccctcgaagg tggcgtccac gctgtagcgt tctcctccgg 600
acaggccgca accaccaacg ccattttgaa cctggcagga gcgggcgacc acatcgtcac 660
ctccccacgc ctctacggtg gcaccgagac tctattcctt atcactctta accgcctggg 720
tatcgatgtt tccttcgtgg aaaaccccga cgaccctgag tcctggcagg cagccgttca 780
gccaaacacc aaagcattct tcggcgagac tttcgccaac ccacaggcag acgtcctgga 840
tattcctgcg gtggctgaag ttgcgcaccg caacagcgtt ccactgatca tcgacaacac 900
catcgctacc gcagcgctcg tgcgcccgct ctccctcgtt gttcacccag caaccaccac 960
ccattcacag tccgacgaag ctggcctggc acgcgcgggc gttacccagt ccaccgtccg 1020
cctgtccgtt ggcatcgaga ccattgatga tatcatcgct gacctcgaag gcggctttgc 1080
tgcaatctag ctttaaatag actcacccca gtgcttaaag cgctgggttt ttctttttca 1140
gactcgtgag aatgcaaact agactagaca gagctgtcca tatacactgg acgaagtttt 1200
agtcttgtcc acccagaaca ggcggttatt ttcatgccca ccctcgcgcc ttcaggtcaa 1260
cttgaaatcc aagcgatcgg tgatgtctcc accgaagccg gagcaatcat tacaaacgct 1320
gaaatcgcct atcaccgctg gggtgaatac cgcgtagata aagaaggacg cagcaatgtc 1380
gttctcatcg aacacgccct cactggagat tccaacgcag ccgattggtg ggctgacttg 1440
ctcggtcccg gcaaagccat caacactgat atttactgcg tgatctgtac caacgtcatc 1500
ggtggttgca acggttccac cggacctggc tccatgcatc cagatggaaa tttctggggt 1560
aatcgcttcc ccgccacgtc cattcgtgat caggtaaacg ccgaaaaaca attcctcgac 1620
gcactcggca tcaccacggt cgccgcagta cttggtggtt ccatgggtgg tgcccgcacc 1680
ctagagtggg ccgcaatgta cccagaaact gttggcgcag ctgctgttct tgcagtttct 1740
gcacgcgcca gcgcctggca aatcggcatt caatccgccc aaattaaggc gattgaaaac 1800
gaccaccact ggcacgaagg caactactac gaatccggct gcaacccagc c          1851
<210>24
<211>8102
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     质粒序列
<400>24
ttgatcagcg gccgcttcgc gaagcttgtc gaccgaaaca gcagttataa ggcatgaagc 60
tgtccggttt ttgcaaaagt ggctgtgact gtaaaaagaa atcgaaaaag accgttttgt 120
gtgaaaacgg tctttttgtt tccttttaac caactgccat aactcgaggc tattgacgac 180
agctatggtt cactgtccac caaccaaaac tgtgctcagt accgccaata tttctccctt 240
gaggggtaca aagaggtgtc cctagaagag atccacgctg tgtaaaaatt ttacaaaaag 300
gtattgactt tccctacagg gtgtgtaata atttaattac aggcgggggc aaccccgcct 360
gttctagaag gaggagaaaa catgtcacag cacgttgaaa cgaaattagc tcaaattggg 420
aaccgtagcg atgaagtcac gggaacagtg agtgctccta tctatttatc aacagcatac 480
cgccacagag ggatcggaga atctaccgga tttgattatg tccgcacaaa aaatccgaca 540
cgccagcttg ttgaggacgc gatcgctaac ttagaaaacg gcgcgagagg gcttgccttt 600
agttcgggaa tggctgctat ccaaacgatt atggcgctgt ttaaaagcgg agatgaactg 660
atcgtttcat cggacctata tggcggcacg taccgtttat ttgaaaatga atggaaaaaa 720
tacggattga cttttcatta tgatgatttc agcgatgagg actgtttacg ctctaagatt 780
acgccgaata caaaagcggt gtttgtggaa acgccgacaa accccctcat gcaggaggcg 840
gacattgaac atattgcccg gattacaaag gagcacggtc ttctgctgat cgtagataat 900
acattttata caccggtctt gcagcggccg cttgagctgg gagctgacat tgtcattcac 960
agcgcaacca agtatttagg cgggcataac gatctgcttg ctggacttgt cgtggtgaag 1020
gatgagcggc tcggagagga aatgtttcag catcaaaatg caatcggcgc cgtcctgccg 1080
ccatttgatt cgtggcttct gatgagagga atgaagacgc tgagcctcag aatgcgccag 1140
catcaggcaa acgcgcagga gcttgcggcg tttttagaag agcaggaaga aatttcggat 1200
gtgctgtatc ccggaaaagg cggcatgctg tccttccgtc tgcaaaaaga agaatgggtc 1260
aatccgtttt taaaagcact gaagaccatt tgttttgcag aaaacctcgg cggggtggaa 1320
agctttatta cataccctgc gacccagacg cacatggata ttcctgaaga gatccgcatc 1380
gcaaacgggg tgtgcaatcg gttgctgcgc ttttctgtcg gtattgaaca tgcggaagat 1440
ttaaaagagg atctaaaaca ggcattatgt caggtcaaag agggagctgt ttcatttgag 1500
taaacacaat tggacgctgg aaacccagct cgtgcacaat ccatttaaaa cagacggcgg 1560
aaccggggca gtcagtgtac cgattcagca cgcctcagga tccgccctcc cgcacgcttt 1620
gcgggagggc ttttcttttc ccggtattta aatcgctagc gggctgctaa aggaagcgga 1680
acacgtagaa agccagtccg cagaaacggt gctgaccccg gatgaatgtc agctactggg 1740
ctatctggac aagggaaaac gcaagcgcaa agagaaagca ggtagcttgc agtgggctta 1800
catggcgata gctagactgg gcggttttat ggacagcaag cgaaccggaa ttgccagctg 1860
gggcgccctc tggtaaggtt gggaagccct gcaaagtaaa ctggatggct ttcttgccgc 1920
caaggatctg atggcgcagg ggatcaagat ctgatcaaga gacaggatga ggatcgtttc 1980
gcatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 2040
tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 2100
cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 2160
tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 2220
tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 2280
aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 2340
tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 2400
gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 2460
aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg cgcatgcccg 2520
acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 2580
atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 2640
acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 2700
tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 2760
ttgacgagtt cttctgagcg ggactctggg gttcgaaatg accgaccaag cgacgcccaa 2820
cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg gcttcggaat 2880
cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc tggagttctt 2940
cgcccacgct agtttaaact gcggatcagt gagggtttgt aactgcgggt caaggatctg 3000
gatttcgatc acggcacgat catcgtgcgg gagggcaagg gctccaagga tcgggccttg 3060
atgttacccg agagcttggc acccagcctg cgcgagcagg ggaattgatc cggtggatga 3120
ccttttgaat gacctttaat agattatatt actaattaat tggggaccct agaggtcccc 3180
ttttttattt taaaaatttt ttcacaaaac ggtttacaag cataacgggt tttgctgccc 3240
gcaaacgggc tgttctggtg ttgctagttt gttatcagaa tcgcagatcc ggcttcaggt 3300
ttgccggctg aaagcgctat ttcttccaga attgccatga ttttttcccc acgggaggcg 3360
tcactggctc ccgtgttgtc ggcagctttg attcgataag cagcatcgcc tgtttcaggc 3420
tgtctatgtg tgactgttga gctgtaacaa gttgtctcag gtgttcaatt tcatgttcta 3480
gttgctttgt tttactggtt tcacctgttc tattaggtgt tacatgctgt tcatctgtta 3540
cattgtcgat ctgttcatgg tgaacagctt taaatgcacc aaaaactcgt aaaagctctg 3600
atgtatctat cttttttaca ccgttttcat ctgtgcatat ggacagtttt ccctttgata 3660
tctaacggtg aacagttgtt ctacttttgt ttgttagtct tgatgcttca ctgatagata 3720
caagagccat aagaacctca gatccttccg tatttagcca gtatgttctc tagtgtggtt 3780
cgttgttttt gcgtgagcca tgagaacgaa ccattgagat catgcttact ttgcatgtca 3840
ctcaaaaatt ttgcctcaaa actggtgagc tgaatttttg cagttaaagc atcgtgtagt 3900
gtttttctta gtccgttacg taggtaggaa tctgatgtaa tggttgttgg tattttgtca 3960
ccattcattt ttatctggtt gttctcaagt tcggttacga gatccatttg tctatctagt 4020
tcaacttgga aaatcaacgt atcagtcggg cggcctcgct tatcaaccac caatttcata 4080
ttgctgtaag tgtttaaatc tttacttatt ggtttcaaaa cccattggtt aagcctttta 4140
aactcatggt agttattttc aagcattaac atgaacttaa attcatcaag gctaatctct 4200
atatttgcct tgtgagtttt cttttgtgtt agttctttta ataaccactc ataaatcctc 4260
atagagtatt tgttttcaaa agacttaaca tgttccagat tatattttat gaattttttt 4320
aactggaaaa gataaggcaa tatctcttca ctaaaaacta attctaattt ttcgcttgag 4380
aacttggcat agtttgtcca ctggaaaatc tcaaagcctt taaccaaagg attcctgatt 4440
tccacagttc tcgtcatcag ctctctggtt gctttagcta atacaccata agcattttcc 4500
ctactgatgt tcatcatctg agcgtattgg ttataagtga acgataccgt ccgttctttc 4560
cttgtagggt tttcaatcgt ggggttgagt agtgccacac agcataaaat tagcttggtt 4620
tcatgctccg ttaagtcata gcgactaatc gctagttcat ttgctttgaa aacaactaat 4680
tcagacatac atctcaattg gtctaggtga ttttaatcac tataccaatt gagatgggct 4740
agtcaatgat aattactagt ccttttcctt tgagttgtgg gtatctgtaa attctgctag 4800
acctttgctg gaaaacttgt aaattctgct agaccctctg taaattccgc tagacctttg 4860
tgtgtttttt ttgtttatat tcaagtggtt ataatttata gaataaagaa agaataaaaa 4920
aagataaaaa gaatagatcc cagccctgtg tataactcac tactttagtc agttccgcag 4980
tattacaaaa ggatgtcgca aacgctgttt gctcctctac aaaacagacc ttaaaaccct 5040
aaaggcttaa gtagcaccct cgcaagctcg ggcaaatcgc tgaatattcc ttttgtctcc 5100
gaccatcagg cacctgagtc gctgtctttt tcgtgacatt cagttcgctg cgctcacggc 5160
tctggcagtg aatgggggta aatggcacta caggcgcctt ttatggattc atgcaaggaa 5220
actacccata atacaagaaa agcccgtcac gggcttctca gggcgtttta tggcgggtct 5280
gctatgtggt gctatctgac tttttgctgt tcagcagttc ctgccctctg attttccagt 5340
ctgaccactt cggattatcc cgtgacaggt cattcagact ggctaatgca cccagtaagg 5400
cagcggtatc atcaacaggc ttagtttaaa ccgcaaagtc ccgcttcgtg aaaattttcg 5460
tgccgcgtga ttttccgcca aaaactttaa cgaacgttcg ttataatggt gtcatgacct 5520
tcacgacgaa gtactaaaat tggcccgaat catcagctat ggatctctct gatgtcgcgc 5580
tggagtccga cgcgctcgat gctgccgtcg atttaaaaac ggtgatcgga tttttccgag 5640
ctctcgatac gacggacgcg ccagcatcac gagactgggc cagtgccgcg agcgacctag 5700
aaactctcgt ggcggatctt gaggagctgg ctgacgagct gcgtgctcgg ccagcgccag 5760
gaggacgcac agtagtggag gatgcaatca gttgcgccta ctgcggtggc ctgattcctc 5820
cccggcctga cccgcgagga cggcgcgcaa aatattgctc agatgcgtgt cgtgccgcag 5880
ccagccgcga gcgcgccaac aaacgccacg ccgaggagct ggaggcggct aggtcgcaaa 5940
tggcgctgga agtgcgtccc ccgagcgaaa ttttggccat ggtcgtcaca gagctggaag 6000
cggcagcgag aattatcgcg atcgtggcgg tgcccgcagg catgacaaac atcgtaaatg 6060
ccgcgtttcg tgtgccgtgg ccgcccagga cgtgtcagcg ccgccaccac ctgcaccgaa 6120
tcggcagcag cgtcgcgcgt cgaaaaagcg cacaggcggc aagaagcgat aagctgcacg 6180
aatacctgaa aaatgttgaa cgccccgtga gcggtaactc acagggcgtc ggctaacccc 6240
cagtccaaac ctgggagaaa gcgctcaaaa atgactctag cggattcacg agacattgac 6300
acaccggcct ggaaattttc cgctgatctg ttcgacaccc atcccgagct cgcgctgcga 6360
tcacgtggct ggacgagcga agaccgccgc gaattcctcg ctcacctggg cagagaaaat 6420
ttccagggca gcaagacccg cgacttcgcc agcgcttgga tcaaagaccc ggacacggag 6480
aaacacagcc gaagttatac cgagttggtt caaaatcgct tgcccggtgc cagtatgttg 6540
ctctgacgca cgcgcagcac gcagccgtgc ttgtcctgga cattgatgtg ccgagccacc 6600
aggccggcgg gaaaatcgag cacgtaaacc ccgaggtcta cgcgattttg gagcgctggg 6660
cacgcctgga aaaagcgcca gcttggatcg gcgtgaatcc actgagcggg aaatgccagc 6720
tcatctggct cattgatccg gtgtatgccg cagcaggcat gagcagcccg aatatgcgcc 6780
tgctggctgc aacgaccgag gaaatgaccc gcgttttcgg cgctgaccag gctttttcac 6840
ataggctgag ccgtggccac tgcactctcc gacgatccca gccgtaccgc tggcatgccc 6900
agcacaatcg cgtggatcgc ctagctgatc ttatggaggt tgctcgcatg atctcaggca 6960
cagaaaaacc taaaaaacgc tatgagcagg agttttctag cggacgggca cgtatcgaag 7020
cggcaagaaa agccactgcg gaagcaaaag cacttgccac gcttgaagca agcctgccga 7080
gcgccgctga agcgtctgga gagctgatcg acggcgtccg tgtcctctgg actgctccag 7140
ggcgtgccgc ccgtgatgag acggcttttc gccacgcttt gactgtggga taccagttaa 7200
aagcggctgg tgagcgccta aaagacacca agggtcatcg agcctacgag cgtgcctaca 7260
ccgtcgctca ggcggtcgga ggaggccgtg agcctgatct gccgccggac tgtgaccgcc 7320
agacggattg gccgcgacgt gtgcgcggct acgtcgctaa aggccagcca gtcgtccctg 7380
ctcgtcagac agagacgcag agccagccga ggcgaaaagc tctggccact atgggaagac 7440
gtggcggtaa aaaggccgca gaacgctgga aagacccaaa cagtgagtac gcccgagcac 7500
agcgagaaaa actagctaag tccagtcaac gacaagctag gaaagctaaa ggaaatcgct 7560
tgaccattgc aggttggttt atgactgttg agggagagac tggctcgtgg ccgacaatca 7620
atgaagctat gtctgaattt agcgtgtcac gtcagaccgt gaatagagca cttaaggtct 7680
gcgggcattg aacttccacg aggacgccga aagcttccca gtaaatgtgc catctcgtag 7740
gcagaaaacg gttcccccgt agggtctctc tcttggcctc ctttctaggt cgggctgatt 7800
gctcttgaag ctctctaggg gggctcacac cataggcaga taacgttccc caccggctcg 7860
cctcgtaagc gcacaaggac tgctcccaaa gatcttcaaa gccactgccg cgactgcctt 7920
cgcgaagcct tgccccgcgg aaatttcctc caccgagttc gtgcacaccc ctatgccaag 7980
cttctttcac cctaaattcg agagattgga ttcttaccgt ggaaattctt cgcaaaaatc 8040
gtcccctgat cgcccttgcg acgttggcgt cggtgccgct ggttgcgctt ggcttgaccg 8100
ac                                                                8102
<210>25
<211>9627
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的
     载体序列
<400>25
ggatcggcgg ccagggccca gatttcttct tgttctctgt tgtgatgcta gtagacatca 60
aattcacttc cgttaaaggc gtaaaggtta gttctaagat ttgcggctgg ctagttgctc 120
aacttgttta agtaataaat tttgagcctt gggatctacc tgggggctta gtgttttgat 180
catcgaacgg cagatattta agtggtcgga gatggcattc aaggagtgat tctttgctcc 240
acactgtatg agaagatgtt gaattcgctc tgcctgagag gtgctcagat ctgcggagcc 300
gaagttgtct tgaatatcag tccatttagc agtatctcga gcgaaggcga taattgtagt 360
ttcttttcct tctcgaaggt cagaaaaggc atctttgccg tgttcggctg cgtcaccaaa 420
agtagataag taatcgtcct gcaattgata agcgatgccc aagtttgtgc ctatctcacc 480
tatctttgtt tcaatctcct gaggtagttc cgcgagaatt gccgctgctc tcattggaag 540
ttcaaaagtg tatgtggctg tttttagccg actcatttct agagcaatgt ccatattggg 600
gctgatggct ttgctgctta atcccacatc aagaaactca cccacaatag tgtcatttat 660
cgtgtggttg agtaaatcta aaagtcgaac ccgttggtga tgtggaaggt caaggcgcgc 720
gaagatttga tgggtggcag caagaaaaag atttcccata agcagtccat tagattgtgc 780
ccaatctaga tgctctggat cgcgctggat ttgtgcaaaa ctttcaggtg tgcgatgcat 840
gagaatctgc ccaataaaat taagtttgcc tcggcgatag aggtctccgt caataacatc 900
gtcatgaacc aaaagggaaa aatgcagtag ttctaaagcc actgctacct gtaaaacggt 960
gttgagtttg acctcaatgt catcgtctac aagcgtgttg tatagcccca gtagcattcg 1020
agggcggatt aacttgccac ctcgcaaagc ttggaaagca gcatctaggc aggtacggaa 1080
ctctggttga tatgtgctgc actgttgaga tagcgaagcg cagatgcggt ttagttcccg 1140
ataaatctca tcattgaaat caagatcagg atgagttgaa tgttctgtgg tgattgtcat 1200
gccattgtcc attcgagtat cacacggcca gttatcacgc atgtattctc ctccttacta 1260
gaacaggcgg ggttgccccc gcctgtaatt aaattattac acaccctgta gggaaagtca 1320
ataccttttt gtaaaatttt tacacagcgt ggatctcttc tagggacacc tctttgtacc 1380
cctcaaggga gaaatattgg cggtactgag cacagttttg gttggtggac agtgaaccat 1440
agctgtcgtc aatagcctcg agttatggca gttggttaaa aggaaacaaa aagaccgttt 1500
tcacacaaaa cggtcttttt cgatttcttt ttacagtcac agccactttt gcaaaaaccg 1560
gacagcttca tgccttataa ctgctgtttc gaagcggccg cacagcgatc ccagaggaaa 1620
tatcctctgg ggtcgctgtg tcgaccttaa agtttggctg ccatgtgaat ttttagcacc 1680
ctcaacagtt gagtgctggc actctcgggg gtagagtgcc aaataggttg tttgacacac 1740
agttgttcac ccgcgacgac ggctgtgctg gaaacccaca accggcacac acaaaatttt 1800
tctagaggag ggattcatca tgaatacata cgaacaaatt aataaagtga aaaaaatact 1860
tcggaaacat ttaaaaaata accttattgg tacttacatg tttggatcag gagttgagag 1920
tggactaaaa ccaaatagtg atcttgactt tttagtcgtc gtatctgaac cattgacaga 1980
tcaaagtaaa gaaatactta tacaaaaaat tagacctatt tcaaaaaaaa taggagataa 2040
aagcaactta cgatatattg aattaacaat tattattcag caagaaatgg taccgtggaa 2100
tcatcctccc aaacaagaat ttatttatgg agaatggtta caagagcttt atgaacaagg 2160
atacattcct cagaaggaat taaattcaga tttaaccata atgctttacc aagcaaaacg 2220
aaaaaataaa agaatatacg gaaattatga cttagaggaa ttactacctg atattccatt 2280
ttctgatgtg agaagagcca ttatggattc gtcagaggaa ttaatagata attatcagga 2340
tgatgaaacc aactctatat taactttatg ccgtatgatt ttaactatgg acacgggtaa 2400
aatcatacca aaagatattg cgggaaatgc agtggctgaa tcttctccat tagaacatag 2460
ggagagaatt ttgttagcag ttcgtagtta tcttggagag aatattgaat ggactaatga 2520
aaatgtaaat ttaactataa actatttaaa taacagatta aaaaaattat aaaaaaattg 2580
aaaaaatggt ggaaacactt ttttcaattt ttttgtttta ttatttaata tttgggaaat 2640
attcattcta attggtaatc agattttaga aaacaataaa cccttgcata gggggatcga 2700
tatccgttta ggctgggcgg atccgccctc ccgcacgctt tgcgggaggg cggtaccagc 2760
tcaccttaag ctttccccgg catctgtaac aaagacgctt aataggctag aaaaaggtgg 2820
gcatattgtt cgtaatgtgc accccgtcga ccgcagggct ttcgccctca tggtcactga 2880
tgccactcgt ggagaggcga tgcggacgct tggtaagcat caggcgcgtc gttttgatgc 2940
tgctaaacga ttaactccac aagagcgtga agtggttatc cgattccttc aggatatggc 3000
acaggagtta tcccttaata atgcaccatg gctcaacacg gagtagatga ccatctacgt 3060
taattaaagt gtgcagagcg gagtggcggt gtttaagcca cctgtcgctg ggactgtaat 3120
gaatgcgcat ggccaccacc cactgtcctc tgtaatgttc cgaacgtgag accattggtc 3180
actactgagc tgtggcgtgc gggatagtat aaatcctgag gaccggcttg ggctgccgac 3240
gattgctagt gaataatcat cttcgatata ggtcacgcgg tagtttgctt gattgtcttc 3300
actctgaaat ggaatacctg ggaagctaac ctttaatgaa gcattggaaa ctactttagc 3360
gctgccttca ataactgaag gcccaaagaa agtgccacac ttatttgtta cagagattgt 3420
gtccgagtcg atcacgccgt aatcagcggt aacgtcatgt gagcactgta aagagaatgg 3480
ttggggaatt gctgcgactt gataccactt gcctttgtag cgttctaggt caatgctatt 3540
ttcaatttcg ggcagcgcta ggttttcagg aaccgaactt aggttagata cctgcgagga 3600
gccacctgca agtcgtccgc cgtcaaaaat gtcttgggct tgtgccgtgg atatcccgaa 3660
aagtgaaatg gctgcgagta gtgctgtggt gacaagtttg cttgaaatgc gcataaagca 3720
aatcctttct tcatgtttat attaactcaa tagttattac ttctaaaagt atagtagata 3780
gttgtggatg ggtgaagaat ttcatagaaa tcgcactcga ttcactaaag acccaagagt 3840
aaaatcccag gatttgctta tacttgcgct catggataat caacttcgtc ccactttgca 3900
ttatcaagct caaaacccgc accctcacgc gtcccgggat ttaaatcgct agcgggctgc 3960
taaaggaagc ggaacacgta gaaagccagt ccgcagaaac ggtgctgacc ccggatgaat 4020
gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa gcaggtagct 4080
tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc aagcgaaccg 4140
gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt aaactggatg 4200
gctttcttgc cgccaaggat ctgatggcgc aggggatcaa gatctgatca agagacagga 4260
tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg 4320
gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc 4380
gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt 4440
gccctgaatg aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt 4500
ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc 4560
gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc 4620
atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac 4680
caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag 4740
gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag 4800
gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat 4860
atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg 4920
gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa 4980
tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc 5040
ttctatcgcc ttcttgacga gttcttctga gcgggactct ggggttcgaa atgaccgacc 5100
aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 5160
tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 5220
tgctggagtt cttcgcccac gctagtttaa actgcggatc agtgagggtt tgtaactgcg 5280
ggtcaaggat ctggatttcg atcacggcac gatcatcgtg cgggagggca agggctccaa 5340
ggatcgggcc ttgatgttac ccgagagctt ggcacccagc ctgcgcgagc aggggaattg 5400
atccggtgga tgaccttttg aatgaccttt aatagattat attactaatt aattggggac 5460
cctagaggtc ccctttttta ttttaaaaat tttttcacaa aacggtttac aagcataacg 5520
ggttttgctg cccgcaaacg ggctgttctg gtgttgctag tttgttatca gaatcgcaga 5580
tccggcttca ggtttgccgg ctgaaagcgc tatttcttcc agaattgcca tgattttttc 5640
cccacgggag gcgtcactgg ctcccgtgtt gtcggcagct ttgattcgat aagcagcatc 5700
gcctgtttca ggctgtctat gtgtgactgt tgagctgtaa caagttgtct caggtgttca 5760
atttcatgtt ctagttgctt tgttttactg gtttcacctg ttctattagg tgttacatgc 5820
tgttcatctg ttacattgtc gatctgttca tggtgaacag ctttaaatgc accaaaaact 5880
cgtaaaagct ctgatgtatc tatctttttt acaccgtttt catctgtgca tatggacagt 5940
tttccctttg atatctaacg gtgaacagtt gttctacttt tgtttgttag tcttgatgct 6000
tcactgatag atacaagagc cataagaacc tcagatcctt ccgtatttag ccagtatgtt 6060
ctctagtgtg gttcgttgtt tttgcgtgag ccatgagaac gaaccattga gatcatgctt 6120
actttgcatg tcactcaaaa attttgcctc aaaactggtg agctgaattt ttgcagttaa 6180
agcatcgtgt agtgtttttc ttagtccgtt acgtaggtag gaatctgatg taatggttgt 6240
tggtattttg tcaccattca tttttatctg gttgttctca agttcggtta cgagatccat 6300
ttgtctatct agttcaactt ggaaaatcaa cgtatcagtc gggcggcctc gcttatcaac 6360
caccaatttc atattgctgt aagtgtttaa atctttactt attggtttca aaacccattg 6420
gttaagcctt ttaaactcat ggtagttatt ttcaagcatt aacatgaact taaattcatc 6480
aaggctaatc tctatatttg ccttgtgagt tttcttttgt gttagttctt ttaataacca 6540
ctcataaatc ctcatagagt atttgttttc aaaagactta acatgttcca gattatattt 6600
tatgaatttt tttaactgga aaagataagg caatatctct tcactaaaaa ctaattctaa 6660
tttttcgctt gagaacttgg catagtttgt ccactggaaa atctcaaagc ctttaaccaa 6720
aggattcctg atttccacag ttctcgtcat cagctctctg gttgctttag ctaatacacc 6780
ataagcattt tccctactga tgttcatcat ctgagcgtat tggttataag tgaacgatac 6840
cgtccgttct ttccttgtag ggttttcaat cgtggggttg agtagtgcca cacagcataa 6900
aattagcttg gtttcatgct ccgttaagtc atagcgacta atcgctagtt catttgcttt 6960
gaaaacaact aattcagaca tacatctcaa ttggtctagg tgattttaat cactatacca 7020
attgagatgg gctagtcaat gataattcta gtccttttcc tttgagttgt gggtatctgt 7080
aaattctgct agacctttgc tggaaaactt gtaaattctg ctagaccctc tgtaaattcc 7140
gctagacctt tgtgtgtttt ttttgtttat attcaagtgg ttataattta tagaataaag 7200
aaagaataaa aaaagataaa aagaatagat cccagccctg tgtataactc actactttag 7260
tcagttccgc agtattacaa aaggatgtcg caaacgctgt ttgctcctct acaaaacaga 7320
ccttaaaacc ctaaaggctt aagtagcacc ctcgcaagct cgggcaaatc gctgaatatt 7380
ccttttgtct ccgaccatca ggcacctgag tcgctgtctt tttcgtgaca ttcagttcgc 7440
tgcgctcacg gctctggcag tgaatggggg taaatggcac tacaggcgcc ttttatggat 7500
tcatgcaagg aaactaccca taatacaaga aaagcccgtc acgggcttct cagggcgttt 7560
tatggcgggt ctgctatgtg gtgctatctg actttttgct gttcagcagt tcctgccctc 7620
tgattttcca gtctgaccac ttcggattat cccgtgacag gtcattcaga ctggctaatg 7680
cacccagtaa ggcagcggta tcatcaacag gcttagttta aacccatcgg cattttcttt 7740
tgcgttttta tttgttaact gttaattgtc cttgttcaag gatgctgtct ttgacaacag 7800
atgttttctt gcctttgatg ttcagcagga agctcggcgc aaacgttgat tgtttgtctg 7860
cgtagaatcc tctgtttgtc atatagcttg taatcacgac attgtttcct ttcgcttgag 7920
gtacagcgaa gtgtgagtaa gtaaaggtta catcgttagg atcaagatcc atttttaaca 7980
caaggccagt tttgttcagc ggcttgtatg ggccagttaa agaattagaa acataaccaa 8040
gcatgtaaat atcgttagac gtaatgccgt caatcgtcat ttttgatccg cgggagtcag 8100
tgaacaggta ccatttgccg ttcattttaa agacgttcgc gcgttcaatt tcatctgtta 8160
ctgtgttaga tgcaatcagc ggtttcatca cttttttcag tgtgtaatca tcgtttagct 8220
caatcatacc gagagcgccg tttgctaact cagccgtgcg ttttttatcg ctttgcagaa 8280
gtttttgact ttcttgacgg aagaatgatg tgcttttgcc atagtatgct ttgttaaata 8340
aagattcttc gccttggtag ccatcttcag ttccagtgtt tgcttcaaat actaagtatt 8400
tgtggccttt atcttctacg tagtgaggat ctctcagcgt atggttgtcg cctgagctgt 8460
agttgccttc atcgatgaac tgctgtacat tttgatacgt ttttccgtca ccgtcaaaga 8520
ttgatttata atcctctaca ccgttgatgt tcaaagagct gtctgatgct gatacgttaa 8580
cttgtgcagt tgtcagtgtt tgtttgccgt aatgtttacc ggagaaatca gtgtagaata 8640
aacggatttt tccgtcagat gtaaatgtgg ctgaacctga ccattcttgt gtttggtctt 8700
ttaggataga atcatttgca tcgaatttgt cgctgtcttt aaagacgcgg ccagcgtttt 8760
tccagctgtc aatagaagtt tcgccgactt tttgatagaa catgtaaatc gatgtgtcat 8820
ccgcattttt aggatctccg gctaatgcaa agacgatgtg gtagccgtga tagtttgcga 8880
cagtgccgtc agcgttttgt aatggccagc tgtcccaaac gtccaggcct tttgcagaag 8940
agatattttt aattgtggac gaatcaaatt cagaaacttg atatttttca tttttttgct 9000
gttcagggat ttgcagcata tcatggcgtg taatatggga aatgccgtat gtttccttat 9060
atggcttttg gttcgtttct ttcgcaaacg cttgagttgc gcctcctgcc agcagtgcgg 9120
tagtaaaggt taatactgtt gcttgttttg caaacttttt gatgttcatc gttcatgtct 9180
ccttttttat gtactgtgtt agcggtctgc ttcttccagc cctcctgttt gaagatggca 9240
agttagttac gcacaataaa aaaagaccta aaatatgtaa ggggtgacgc caaagtatac 9300
actttgccct ttacacattt taggtcttgc ctgctttatc agtaacaaac ccgcgcgatt 9360
tacttttcga cctcattcta ttagactctc gtttggattg caactggtct attttcctct 9420
tttgtttgat agaaaatcat aaaaggattt gcagactacg ggcctaaaga actaaaaaat 9480
ctatctgttt cttttcattc tctgtatttt ttatagtttc tgttgcatgg gcataaagtt 9540
gcctttttaa tcacaattca gaaaatatca taatatctca tttcactaaa taatagtgaa 9600
cggcaggtat atgtgatggg ttaaaaa                                     9627
<210>26
<211>373
<212>PRT
<213>枯草芽孢杆菌
<400>26
Met Ser Gln His Val Glu Thr Lys Leu Ala Gln Ile Gly Asn Arg Ser
  1               5                  10                  15
Asp Glu Val Thr Gly Thr Val Ser Ala Pro Ile Tyr Leu Ser Thr Ala
             20                  25                  30
Tyr Arg His Arg Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr Val Arg
         35                  40                  45
Thr Lys Asn Pro Thr Arg Gln Leu Val Glu Asp Ala Ile Ala Asn Leu
     50                  55                  60
Glu Asn Gly Ala Arg Gly Leu Ala Phe Ser Ser Gly Met Ala Ala Ile
 65                  70                  75                  80
Gln Thr Ile Met Ala Leu Phe Lys Ser Gly Asp Glu Leu Ile Val Ser
                 85                  90                  95
Ser Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Glu Asn Glu Trp Lys
            100                 105                 110
Lys Tyr Gly Leu Thr Phe His Tyr Asp Asp Phe Ser Asp Glu Asp Cys
        115                 120                 125
Leu Arg Ser Lys Ile Thr Pro Asn Thr Lys Ala Val Phe Val Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Gln Glu Ala Asp Ile Glu His Ile Ala Arg
145                 150                 155                 160
Ile Thr Lys Glu His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr
                165                 170                 175
Thr Pro Val Leu Gln Arg Pro Leu Glu Leu Gly Ala Asp Ile Val Ile
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Leu Leu Ala Gly
        195                 200                 205
Leu Val Val Val Lys Asp Glu Arg Leu Gly Glu Glu Met Phe Gln His
    210                 215                 220
Gln Asn Ala Ile Gly Ala Val Leu Pro Pro Phe Asp Ser Trp Leu Leu
225                 230                 235                 240
Met Arg Gly Met Lys Thr Leu Ser Leu Arg Met Arg Gln His Gln Ala
                245                 250                 255
Asn Ala Gln Glu Leu Ala Ala Phe Leu Glu Glu Gln Glu Glu Ile Ser
            260                 265                 270
Asp Val Leu Tyr Pro Gly Lys Gly Gly Met Leu Ser Phe Arg Leu Gln
        275                 280                 285
Lys Glu Glu Trp Val Asn Pro Phe Leu Lys Ala Leu Lys Thr Ile Cys
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Phe Ile Thr Tyr Pro Ala
305                 310                 315                 320
Thr Gln Thr His Met Asp Ile Pro Glu Glu Ile Arg Ile Ala Asn Gly
                325                 330                 335
Val Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu His Ala Glu
            340                 345                 350
Asp Leu Lys Glu Asp Leu Lys Gln Ala Leu Cys Gln Val Lys Glu Gly
        355                 360                 365
Ala Val Ser Phe Glu
    370
<210>27
<211>374
<212>PRT
<213>地衣芽孢杆菌(Bacillus licheniformis)
<400>27
Met Thr Glu His Val Gln Thr Thr Leu Ala Gln Ile Gly Asn Arg Ser
  1               5                  10                  15
Asp Glu Ile Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Ser Ala
             20                  25                  30
Tyr Arg His Lys Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr Ile Arg
         35                  40                  45
Thr Lys Asn Pro Thr Arg Gln Leu Val Glu Asp Ala Ile Ala Lys Leu
     50                  55                  60
Glu Gly Gly Thr Arg Gly Phe Ala Phe Ser Ser Gly Met Ala Ala Ile
 65                  70                  75                  80
Gln Thr Ile Met Ala Leu Phe Gln Ser Gly Asp Glu Leu Ile Val Ser
                 85                  90                  95
Ser Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Glu Asn Glu Trp Lys
            100                 105                 110
Lys Tyr Gly Leu Arg Phe Leu Tyr Asp Asp Phe Ser Asp Glu Asp Cys
        115                 120                 125
Ile Lys Ser Lys Ile Thr Asp Asn Thr Lys Ala Leu Phe Val Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Gln Glu Ala Asp Ile Gln Lys Ile Ala Gln
145                 150                 155                 160
Ile Ala Lys Glu Asn Asp Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr
                165                 170                 175
Thr Pro Val Leu Gln Arg Pro Ile Glu Leu Gly Ala Asp Leu Val Ile
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Leu Leu Ala Gly
        195                 200                 205
Leu Val Val Ala Lys Gly Glu Glu Leu Ser Glu Glu Met Phe Gln His
    210                 215                 220
Gln Asn Ala Ile Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu
225                 230                 235                 240
Met Arg Gly Leu Lys Thr Leu Ala Leu Arg Met Arg Gln His Gln Glu
                245                 250                 255
Asn Ala Arg Glu Leu Ala Ala Phe Leu Glu Glu Gln Glu Glu Ile Ala
            260                 265                 270
Asp Val Leu Tyr Pro Gly Lys Gly Gly Met Leu Ser Phe Arg Val Gln
        275                 280                 285
Lys Glu Glu Trp Val Asn Pro Phe Leu Lys Asn Leu Lys Thr Ile Cys
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Phe Ile Thr Tyr Pro Ala
305                 310                 315                 320
Thr Gln Thr His Met Asp Ile Pro Glu Asp Ile Arg Ile Ala Asn Gly
                325                 330                 335
Val Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu His Val Ser
            340                 345                 350
Asp Leu Lys Gln Asp Leu Lys Ala Ala Leu Glu Lys Val Lys Gly Glu
        355                 360                 365
Ala Val Pro His Glu Ser
    370
<210>28
<211>387
<212>PRT
<213>地衣芽孢杆菌
<400>28
Met Lys Lys Gly Phe Leu Leu Phe Lys Gly Trp Cys His Met Thr Glu
  1               5                  10                  15
His Val Gln Thr Thr Leu Ala Gln Ile Gly Asn Arg Ser Asp Glu Ile
             20                  25                  30
Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Ser Ala Tyr Arg His
         35                  40                  45
Lys Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr Ile Arg Thr Lys Asn
     50                  55                  60
Pro Thr Arg Gln Leu Val Glu Asp Ala Ile Ala Lys Leu Glu Gly Gly
 65                  70                  75                  80
Thr Arg Gly Phe Ala Phe Ser Ser Gly Met Ala Ala Ile Gln Thr Ile
                 85                  90                  95
Met Ala Leu Phe Gln Ser Gly Asp Glu Leu Ile Val Ser Ser Asp Leu
            100                 105                 110
Tyr Gly Gly Thr Tyr Arg Leu Phe Glu Asn Glu Trp Lys Lys Tyr Gly
        115                  120                  125
Leu Arg Phe Leu Tyr Asp Asp Phe Ser Asp Glu Asp Cys Ile Lys Ser
    130                 135                 140
Lys Ile Thr Asp Asn Thr Lys Ala Leu Phe Val Glu Thr Pro Thr Asn
145                 150                 155                 160
Pro Leu Met Gln Glu Ala Asp Ile Gln Lys Ile Ala Gln Ile Ala Lys
                165                 170                 175
Glu Asn Asp Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr Pro Val
            180                 185                 190
Leu Gln Arg Pro Ile Glu Leu Gly Ala Asp Leu Val Ile His Ser Ala
        195                 200                 205
Thr Lys Tyr Leu Gly Gly His Asn Asp Leu Leu Ala Gly Leu Val Val
    210                 215                 220
Ala Lys Gly Glu Glu Leu Ser Glu Glu Met Phe Gln His Gln Asn Ala
225                 230                 235                 240
Ile Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Met Arg Gly
                245                 250                 255
Leu Lys Thr Leu Ala Leu Arg Met Arg Gln His Gln Glu Asn Ala Arg
            260                 265                 270
Glu Leu Ala Ala Phe Leu Glu Glu Gln Glu Glu Ile Ala Asp Val Leu
        275                 280                 285
Tyr Pro Gly Lys Gly Gly Met Leu Ser Phe Arg Val Gln Lys Glu Glu
    290                 295                 300
Trp Val Asn Pro Phe Leu Lys Asn Leu Lys Thr Ile Cys Phe Ala Glu
305                 310                 315                 320
Ser Leu Gly Gly Val Glu Ser Phe Ile Thr Tyr Pro Ala Thr Gln Thr
                325                 330                 335
His Met Asp Ile Pro Glu Asp Ile Arg Ile Ala Asn Gly Val Cys Asn
            340                 345                 350
Arg Leu Leu Arg Phe Ser Val Gly Ile Glu His Val Ser Asp Leu Lys
        355                 360                 365
Gln Asp Leu Lys Ala Ala Leu Glu Lys Val Lys Gly Glu Ala Val Pro
    370                 375                 380
His Glu Ser
385
<210>29
<211>367
<212>PRT
<213>Geobacillus kaustophilus
<400>29
Met Glu Lys Leu Glu Thr Leu Leu Ala Gln Ile Gly Asn Arg Ser Glu
  1               5                  10                  15
Thr Val Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Thr Ala Tyr
             20                  25                  30
Arg His Ala Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr Ile Arg Thr
         35                  40                  45
Gly Asn Pro Thr Arg Lys Ile Val Glu Glu Ala Ile Ala Arg Leu Glu
     50                  55                  60
Gly Gly Asp Gln Gly Tyr Ala Phe Ser Ser Gly Met Ala Ala Ile Gln
 65                  70                  75                  80
Thr Val Leu Ala Leu Phe Glu Ser Gly Asp Glu Phe Leu Val Ser Ala
                 85                  90                  95
Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Glu Arg Gly Trp Arg Lys
            100                 105                 110
Tyr Gly Leu Gly Phe His Tyr Val Asp Phe Ala Asp Leu Ala Ala Val
        115                 120                 125
Glu Ala Cys Ile Thr Glu Lys Thr Lys Ala Ile Phe Leu Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met His Glu Thr Asp Ile Arg Ala Val Ser Glu Phe
145                 150                 155                 160
Ala Lys Arg His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr
                165                 170                 175
Pro Val Leu Gln Arg Pro Ile Glu Gln Gly Ala Asp Ile Val Ile His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ala Gly Leu
        195                 200                 205
Val Val Ala Lys Gly Glu Glu Leu Cys Gln Arg Leu Ala Glu Tyr Gln
    210                 215                 220
Asn Ala Ile Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Ile
225                 230                 235                 240
Arg Gly Met Lys Thr Leu Ala Leu Arg Met Arg Gln His Glu Glu Asn
                245                 250                 255
Ala Lys Arg Ile Ser Ala Phe Leu Arg Glu His Glu Asp Val Thr Asp
            260                 265                 270
Val Leu Tyr Pro Gly Arg Gly Gly Met Leu Ser Phe Arg Ile Ala Asp
        275                 280                 285
Glu Lys Trp Val Asn Gly Phe Leu Lys Ser Leu Arg Leu Ile Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Phe Ile Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Glu Glu Ile Arg Ile Gln Asn Gly Ile
                325                 330                 335
Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu His Ala Asp Asp
            340                 345                 350
Leu Ile Ala Asp Leu Ala Gln Ala Leu Lys Asn Met Lys Glu Val
        355                 360                 365
<210>30
<211>378
<212>PRT
<213>Bacillus halodurans
<400>30
Met Asn Arg Lys Glu Leu Glu Thr Ala Leu Val Gln Ile Gly Asn Arg
  1               5                  10                  15
Met Asp Asp Arg Thr Gly Ala Ile Asn Thr Pro Val Tyr Phe Ser Thr
             20                  25                  30
Ala Tyr Arg His Ser Gly Ile Gly Glu Ser Thr Gly Tyr Asp Tyr Ala
         35                  40                  45
Arg Thr Gly Asn Pro Thr Arg Glu Val Leu Glu Lys Ala Ile Ala Thr
     50                  55                  60
Leu Glu Asn Gly Asp Gln Gly Phe Ala Cys Ser Ser Gly Met Ala Ala
 65                  70                  75                  80
Ile Gln Thr Val Phe Ser Leu Phe Gln Ser Gly Asp Glu Ile Ile Ala
                 85                  90                  95
Ser Gln Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Glu Gly Gly Trp
            100                 105                 110
Lys Lys Trp Gly Leu Ser Phe Ser Tyr Ala Asp Pro Arg Asn Leu Ala
        115                 120                 125
Ala Leu Glu Gln Gln Ile Thr Glu Lys Thr Arg Ala Leu Phe Ile Glu
    130                 135                 140
Thr Pro Thr Asn Pro Leu Met Gln Glu Ala Asn Ile Arg Glu Leu Ala
145                 150                 155                 160
Ala Leu Ala Asn Lys His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe
                165                 170                 175
Tyr Thr Pro Leu Leu Gln Gln Pro Leu Asn Glu Gly Thr His Ile Val
            180                 185                 190
Ile His Ser Ala Ser Lys Tyr Leu Gly Gly His Asn Asp Val Ile Ala
        195                 200                 205
Gly Leu Ile Val Ala Lys Gly Gln Glu Leu Cys Glu Gln Ile Ala Tyr
    210                 215                 220
Tyr His Asn Gly Ile Gly Gly Thr Leu Ser Ala Phe Asp Ser Trp Leu
225                 230                 235                 240
Leu Ile Arg Gly Met Lys Thr Leu Ala Leu Arg Met Glu Gln His Gln
                245                 250                 255
Asn Asn Ala Arg Ala Ile Ala Ser Tyr Leu Glu Lys His Glu Gly Val
            260                 265                 270
Thr Asp Val Leu Tyr Pro Gly Arg Gly Gly Met Leu Ser Phe Arg Ile
        275                 280                 285
Gln Ser Glu Ser Trp Val Asn Pro Phe Leu Gln Ser Leu Lys Leu Ile
    290                 295                 300
Ser Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro
305                 310                 315                 320
Ala Thr Gln Thr His Ala Asp Ile Pro Glu Asp Val Arg Ile Ala Asn
                325                 330                 335
Gly Val Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu His Val
            340                 345                 350
Gly Asp Leu Ile Ala Asp Leu Asp Gln Ala Phe Asn Arg Val Ile Glu
        355                 360                 365
Gln Ser Ala Val Lys Gly Ser Glu Ala Gln
    370                 375
<210>31
<211>370
<212>PRT
<213>蜡状芽孢杆菌(Bacillus cereus)
<400>31
Met Ser Thr Ile Glu Thr Lys Leu Ala Gln Ile Gly Asn Arg Ser Glu
  1               5                  10                  15
Thr Thr Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Thr Ala Tyr
             20                  25                  30
Arg His Glu Gly Ile Gly Lys Ser Thr Gly Phe Asp Tyr Ser Arg Thr
         35                  40                  45
Gly Asn Pro Thr Arg Gly Leu Leu Glu Gln Ala Ile Ala Asp Leu Glu
     50                  55                  60
Tyr Gly Glu Gln Gly Tyr Ala Cys Ser Ser Gly Met Ala Ala Val Leu
 65                  70                  75                  80
Leu Val Leu Ser Leu Phe Arg Ser Gly Asp Glu Leu Ile Val Ser Glu
                 85                  90                  95
Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Ser Glu His Glu Lys Lys
            100                 105                 110
Trp Asn Val Arg Cys Arg Tyr Val Asn Thr Gln Ser Ile Lys Gln Ile
        115                 120                 125
Glu Gln Ala Ile Thr Thr Glu Thr Lys Ala Ile Phe Ile Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met Gln Val Thr Asp Ile Ala Ala Val Ala Thr Val
145                 150                 155                 160
Ala Lys Arg His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr
                165                 170                 175
Pro Tyr Ile Gln Gln Pro Leu Thr Glu Gly Ala Asp Ile Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ser Gly Leu
        195                 200                 205
Val Val Ala Lys Gly Lys Glu Leu Cys Glu Glu Ile Ala His Tyr His
    210                 215                 220
Asn Ala Ser Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Ile
225                 230                 235                 240
Arg Gly Met Lys Thr Leu Ala Leu Arg Met Arg Gln His Glu Glu Asn
                245                 250                 255
Ala Lys Ala Val Val Ala Tyr Leu Asn Asp Glu Asp Gly Val Thr Asp
            260                 265                 270
Val Phe Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Arg Leu Lys Asp
        275                 280                 285
Glu Glu Trp Ile Asn Pro Phe Leu Gln Ser Leu Ser Leu Ile Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Glu Glu Ile Arg Thr Ala Asn Gly Val
                325                 330                 335
Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu Asn Ser Asn Asp
            340                 345                 350
Leu Ile Gln Asp Leu Gln Gln Ala Ile Lys Leu Val Lys Glu Gly Val
        355                 360                 365
Arg Ile
    370
<210>32
<211>370
<212>PRT
<213>蜡状芽孢杆菌
<400>32
Met Ser Thr Ile Glu Thr Lys Leu Ala Gln Ile Gly Asn Arg Ser Glu
  1               5                  10                  15
Thr Thr Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Thr Ala Tyr
             20                  25                  30
Arg His Glu Gly Ile Gly Gln Ser Thr Gly Phe Asp Tyr Ser Arg Thr
         35                  40                  45
Gly Asn Pro Thr Arg Gly Leu Leu Glu Gln Ala Ile Ala Asp Leu Glu
     50                  55                  60
Tyr Gly Glu Gln Gly Tyr Ala Cys Ser Ser Gly Met Ala Ala Val Leu
 65                  70                  75                  80
Leu Val Leu Ser Leu Phe Arg Ser Gly Asp Glu Leu Ile Val Ser Glu
                 85                  90                  95
Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Ser Glu His Glu Lys Lys
            100                 105                 110
Trp Asn Val Arg Cys Arg Tyr Val Asn Thr Gln Ser Ile Lys Gln Ile
        115                 120                 125
Glu Gln Ala Ile Thr Thr Glu Thr Lys Ala Ile Phe Ile Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met Gln Val Thr Asp Ile Ala Ala Val Ala Thr Val
145                 150                 155                 160
Ala Lys Arg His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr
                165                 170                 175
Pro Tyr Ile Gln Gln Pro Leu Thr Glu Gly Ala Asp Ile Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ser Gly Leu
        195                 200                 205
Val Val Ala Lys Gly Lys Glu Leu Cys Glu Glu Ile Ala His Tyr His
    210                 215                 220
Asn Ala Ser Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Ile
225                 230                 235                 240
Arg Gly Met Lys Thr Leu Ala Leu Arg Met Arg Gln His Glu Glu Asn
                245                 250                 255
Ala Lys Ala Val Val Ala Tyr Leu Asn Asp Glu Asp Gly Val Thr Asp
            260                 265                 270
Val Phe Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Arg Leu Gln Asp
        275                 280                 285
Glu Thr Trp Ile Asn Pro Phe Leu Gln Ser Leu Ser Leu Ile Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Glu Asp Ile Arg Thr Ala Asn Gly Val
                325                 330                 335
Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu Asn Ser Asn Asp
            340                 345                 350
Leu Ile Gln Asp Leu Gln Gln Ala Ile Lys Leu Val Lys Glu Gly Val
        355                 360                 365
Arg Ile
    370
<210>33
<211>370
<212>PRT
<213>苏云金芽孢杆菌(Bacillus thuringiensis)
<400>33
Met Ser Thr Ile Glu Thr Lys Leu Ala Gln Ile Gly Asn Arg Ser Glu
  1               5                  10                  15
Thr Thr Thr Gly Thr Val Asn Thr Pro Val Tyr Phe Ser Thr Ala Tyr
             20                  25                  30
Arg His Glu Gly Ile Gly Lys Ser Thr Gly Phe Asp Tyr Ser Arg Thr
         35                  40                  45
Gly Asn Pro Thr Arg Gly Leu Leu Glu Gln Ala Ile Ala Asp Leu Glu
     50                  55                  60
Tyr Gly Glu Gln Gly Tyr Ala Cys Ser Ser Gly Met Ala Ala Val Leu
 65                  70                  75                  80
Leu Val Leu Ser Leu Phe Arg Ser Gly Asp Glu Leu Ile Val Ser Glu
                 85                  90                  95
Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Ser Glu His Glu Lys Lys
            100                 105                 110
Trp Asn Val Arg Cys Arg Tyr Val Asn Thr Gln Ser Ile Lys Gln Ile
        115                 120                 125
Glu Gln Ala Ile Thr Thr Glu Thr Lys Ala Ile Phe Ile Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met Gln Val Thr Asp Ile Ala Ala Val Ala Thr Val
145                 150                 155                 160
Ala Lys Arg His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr
                165                 170                 175
Pro Tyr Ile Gln Gln Pro Leu Thr Glu Gly Ala Asp Ile Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ser Gly Leu
        195                 200                 205
Val Val Ala Lys Gly Lys Glu Leu Cys Glu Glu Ile Ala His Tyr His
    210                 215                 220
Asn Ala Ser Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Ile
225                 230                 235                 240
Arg Gly Met Lys Thr Leu Ala Leu Arg Met Arg Gln His Glu Glu Asn
                245                 250                 255
Ala Lys Ala Val Val Ala Tyr Leu Asn Asp Glu Asp Gly Val Thr Asp
            260                 265                 270
Val Phe Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Arg Leu Lys Asp
        275                 280                 285
Glu Thr Trp Ile Asn Pro Phe Leu Gln Ser Leu Ser Leu Ile Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Glu Glu Ile Arg Thr Ala Asn Gly Val
                325                 330                 335
Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu Asn Ser Asn Asp
            340                 345                 350
Leu Ile Gln Asp Leu Gln Gln Ala Ile Lys Leu Val Lys Glu Gly Val
        355                 360                 365
Arg Ile
    370
<210>34
<211>370
<212>PRT
<213>炭疽芽孢杆菌(Bacillus anthracis)
<400>34
Met Ser Thr Ile Glu Thr Lys Leu Ala Gln Ile Gly Asn Arg Ser Glu
  1               5                  10                  15
Thr Thr Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Thr Ala Tyr
             20                  25                  30
Arg His Glu Gly Ile Gly Lys Ser Thr Gly Phe Asp Tyr Ser Arg Thr
         35                  40                  45
Gly Asn Pro Thr Arg Gly Leu Leu Glu Gln Ala Ile Ala Asp Leu Glu
     50                  55                  60
Tyr Gly Glu Gln Gly Tyr Ala Cys Ser Ser Gly Met Ala Ala Val Leu
 65                  70                  75                  80
Leu Val Leu Ser Leu Phe Arg Ser Gly Asp Glu Leu Ile Val Ser Glu
                 85                  90                  95
Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Ser Glu His Glu Lys Lys
            100                 105                 110
Trp Asn Val Arg Cys Arg Tyr Val Asn Thr Gln Ser Ile Lys Gln Ile
        115                 120                 125
Glu Gln Ala Ile Thr Thr Glu Thr Lys Ala Ile Phe Ile Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met Gln Val Thr Asp Ile Ala Ala Val Ala Thr Val
145                 150                 155                 160
Ala Lys Arg His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr
                165                 170                 175
Pro Tyr Ile Gln Gln Pro Leu Thr Glu Gly Ala Asp Ile Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ser Gly Leu
        195                 200                 205
Val Val Ala Lys Gly Lys Glu Leu Cys Glu Glu Ile Ala His Tyr His
    210                 215                 220
Asn Ala Ser Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Ile
225                 230                 235                 240
Arg Gly Met Lys Thr Leu Ala Leu Arg Met Arg Gln His Glu Lys Asn
                245                 250                 255
Ala Lys Ala Val Val Ala Tyr Leu Asn Asp Glu Asp Gly Val Thr Asp
            260                 265                 270
Val Phe Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Arg Leu Lys Asp
        275                 280                 285
Glu Thr Trp Ile Asn Pro Phe Leu Gln Ser Leu Ser Leu Ile Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Glu Glu Ile Arg Thr Ala Asn Gly Val
                325                 330                 335
Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu Asn Ser Asn Asp
            340                 345                 350
Leu Ile Gln Asp Leu Gln Gln Ala Ile Lys Leu Val Lys Glu Gly Val
        355                 360                 365
Arg Ile
    370
<210>35
<211>370
<212>PRT
<213>蜡状芽孢杆菌
<400>35
Met Ser Thr Ile Glu Thr Lys Leu Ala Gln Ile Gly Asn Arg Ser Glu
  1               5                  10                  15
Thr Thr Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Thr Ala Tyr
             20                  25                  30
Arg His Glu Gly Ile Gly Lys Ser Thr Gly Phe Asp Tyr Ser Arg Thr
         35                  40                  45
Gly Asn Pro Thr Arg Gly Leu Leu Glu Gln Ala Ile Ala Asp Leu Glu
     50                  55                  60
Cys Gly Glu Gln Gly Tyr Ala Cys Ser Ser Gly Met Ala Ala Val Leu
 65                  70                  75                  80
Leu Val Leu Ser Leu Phe Arg Ser Gly Asp Glu Leu Ile Val Ser Glu
                 85                  90                  95
Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Ser Glu His Glu Lys Lys
            100                 105                 110
Trp Asn Val Arg Cys Arg Tyr Val Asn Thr Gln Ser Ile Lys Gln Ile
        115                 120                 125
Glu Gln Ala Ile Thr Thr Lys Thr Lys Ala Ile Phe Ile Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met Gln Val Thr Asp Ile Ala Ala Val Ala Thr Val
145                 150                 155                 160
Ala Lys Arg His Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr
                165                 170                 175
Pro Tyr Ile Gln Gln Pro Leu Thr Glu Gly Ala Asp Ile Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ser Gly Leu
        195                 200                 205
Val Val Ala Lys Gly Lys Glu Leu Cys Glu Glu Ile Ala His Tyr His
    210                 215                 220
Asn Ala Ser Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Ile
225                 230                 235                 240
Arg Gly Met Lys Thr Leu Ala Leu Arg Met Arg Gln His Glu Glu Asn
                245                 250                 255
Ala Lys Ala Val Val Ala Tyr Leu Asn Asp Glu Asp Gly Val Thr Asp
            260                 265                 270
Val Phe Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Arg Leu Lys Asp
        275                 280                 285
Glu Thr Trp Ile Asn Pro Phe Leu Gln Ser Leu Ser Leu Ile Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Glu Glu Ile Arg Thr Ala Asn Gly Val
                325                 330                 335
Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu Asn Ser Asn Asp
            340                 345                 350
Leu Ile Gln Asp Leu Gln Gln Ala Val Lys Leu Val Lys Glu Gly Val
        355                 360                 365
Arg Ile
    370
<210>36
<211>370
<212>PRT
<213>蜡状芽孢杆菌
<400>36
Met Ser Thr Ile Glu Thr Lys Leu Ala Gln IIe Gly Asn Arg Ser Glu
  1               5                  10                  15
Thr Thr Thr Gly Thr Val Asn Pro Pro Val Tyr Phe Ser Thr Ala Tyr
             20                  25                  30
Arg His Glu Gly Ile Gly Lys Ser Thr Gly Phe Asp Tyr Ser Arg Thr
         35                  40                  45
Gly Asn Pro Thr Arg Gly Leu Leu Glu Gln Ala Ile Ala Asp Leu Glu
     50                  55                  60
Tyr Gly Glu Gln Gly Tyr Ala Cys Ser Ser Gly Met Ala Ala Val Leu
 65                  70                  75                  80
Leu Val Leu Ser Leu Phe Arg Ser Gly Asp Glu Leu Ile Val Ser Glu
                 85                  90                  95
Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Ser Glu His Glu Lys Lys
            100                 105                 110
Trp Asn Val Arg Cys Arg Tyr Val Asn Thr Gln Ser Ile Lys Gln Ile
        115                 120                 125
Glu Gln Ala Ile Thr Thr Glu Thr Lys Ala Ile Phe Ile Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met Gln Val Thr Asp Ile Ala Ala Val Ala Thr Val
145                 150                 155                 160
Ala Lys Arg Asn Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr
                165                 170                 175
Pro Tyr Ile Gln Gln Pro Leu Thr Glu Gly Ala Asp Ile Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ser Gly Leu
        195                 200                 205
Val Val Ala Lys Gly Lys Glu Leu Cys Glu Glu Ile Ala His Tyr His
    210                 215                 220
Asn Ala Ser Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Leu Ile
225                 230                 235                 240
Arg Gly Met Lys Thr Leu Ala Leu Arg Met Arg Gln His Glu Glu Asn
                245                 250                 255
Ala Lys Ala Val Val Ala Tyr Leu Asn Asp Glu Asp Gly Val Thr Asp
            260                 265                 270
Val Phe Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Arg Leu Lys Asp
        275                 280                 285
Glu Ala Trp Ile Asn Pro Phe Leu Gln Ser Leu Ser Leu Ile Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Glu Glu Ile Arg Thr Ala Asn Gly Val
                325                 330                 335
Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Ile Glu Asn Ser Asn Asp
            340                 345                 350
Leu Ile Gln Asp Leu Lys Gln Ala Ile Lys Leu Val Lys Glu Gly Val
        355                 360                 365
Arg Ile
    370
<210>37
<211>369
<212>PRT
<213>多杀巴斯德氏菌(Pasteurella multocida)
<400>37
Met Thr Gln His Tyr Ser Ile Glu Thr Leu Leu Ala Gln Ala Gly Asn
  1               5                  10                  15
Arg Thr Asp Glu Arg Thr Gly Ala Val Ser Thr Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Ala His His Gly Ile Gly Glu Ser Thr Gly Tyr Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Ser Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Gly Gly Glu Arg Gly Phe Ala Cys Ala Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Leu Ile Met Ser Leu Phe Thr Ser Pro Asp Glu Trp Ile
                 85                  90                  95
Val Ser Arg Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ala
            100                 105                 110
Tyr Lys Asn Thr Gln Gly Val Lys Pro Val Tyr Val Asn Thr Ser Glu
        115                 120                 125
Val Ser Cys Ile Glu Ala Ala Ile Thr Ser Asn Thr Lys Ala Ile Phe
    130                 135                 140
Val Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val Ala Ala
145                 150                 155                 160
Ile Ala Lys Ile Ala Lys Lys His Asn Leu Leu Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Leu Phe Arg Pro Ile Glu Ala Gly Ala Asp
            180                 185                 190
Ile Val Ile His Ser Gly Thr Lys Tyr Leu Ala Gly His Asn Asp Ala
        195                 200                 205
Leu Val Gly Leu Val Val Ala Lys Gly Glu Glu Leu Cys Gln Arg Leu
    210                 215                 220
Phe Tyr Ile Gln Asn Gly Ala Gly Ala Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Met Lys Thr Leu Ala Leu Arg Met Glu Arg
                245                 250                 255
His Glu Gln Asn Ala Lys Gln Leu Ala Ala Phe Leu Ala Ser Gln Pro
            260                 265                 270
Gln Val Lys Asn Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu His Glu Ala His Trp Val Asn Pro Phe Leu Lys Ala Leu Lys
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Ala Thr Gln Thr His Met Asp Ile Pro Glu Glu Glu Arg Ile
                325                 330                 335
Ala Arg Gly Val Cys Asn Cys Leu Leu Arg Phe Ser Val Gly Leu Glu
            340                 345                 350
Asn Val Glu Asp Ile Lys Ala Asp Leu Leu Gln Ala Phe Ala Gln Leu
        355                 360                 365
Asn
<210>38
<211>369
<212>PRT
<213>睡眠嗜血杆菌(Haemophilus somnus)
<400>38
Met Thr Gln Gln Tyr Ala Leu Asp Thr Leu Leu Ala Gln Ala Gly Asn
  1               5                  10                  15
Arg Thr Asp Glu Arg Thr Gly Ala Val Ser Thr Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Ala His His Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Gly Gly Asp Arg Gly Phe Ala Cys Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Leu Leu Met Asn Leu Phe Ala Ser Pro Asp Glu Trp Ile
                 85                  90                  95
Val Ser Ser Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ala
            100                 105                 110
His Lys Asn Ile His Gly Val Lys Pro Val Tyr Val Asn Thr Ala Ser
        115                 120                 125
Ser Glu Glu Ile Glu Lys Ala Ile Thr Glu Asn Thr Lys Ala Ile Phe
    130                 135                 140
Val Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val Ala Glu
145                 150                 155                 160
Ile Ala Lys Ile Ala Lys Lys Tyr Asn Leu Leu Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Leu Phe Arg Pro Met Glu His Gly Ala Asp
            180                 185                 190
Ile Val Ile His Ser Gly Thr Lys Tyr Ile Ala Gly His Asn Asp Thr
        195                 200                 205
Leu Val Gly Leu Ile Val Ala Lys Gly Gln Glu Ile Cys Asp Arg Leu
    210                 215                 220
Tyr Tyr Ile Gln Asn Gly Ala Gly Pro Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Met Lys Thr Leu Ala Leu Arg Met Glu Arg
                245                 250                 255
His Gln Lys Asn Ala Gln Glu Leu Ala Asn Phe Leu Arg Glu Gln Pro
            260                 265                 270
Gln Val Lys Asp Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu Gln Asn Glu Asn Trp Val Asn Pro Phe Leu Lys Ala Met Lys
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Ala Thr Gln Thr His Met Asp Ile Pro Glu Val Glu Arg Val
                325                 330                 335
Ala Arg Gly Val Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Leu Glu
            340                 345                 350
Asn Val Glu Asp Ile Lys Ala Asp Leu Leu Gln Ala Phe Ser Gln Leu
        355                 360                 365
Lys
<210>39
<211>369
<212>PRT
<213>Mannheimia succiniciproducens
<400>39
Met Thr Gln Asn Tyr Ser Ile Glu Thr Ile Leu Ala Gln Ala Gly Asn
  1               5                  10                  15
Lys Ser Asp Ala Arg Thr Gly Ala Val Ser Thr Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Gly His Arg Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Leu Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Asn Gly Asp Gln Gly Phe Ala Phe Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Val Leu Met Thr Leu Phe Thr Ala Pro Asp Glu Trp Ile
                 85                  90                  95
Val Ser Ser Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ala
            100                 105                 110
Tyr Lys Asn Asn Asn Ser Val Lys Pro Val Tyr Val Asn Thr Ala Ser
        115                 120                 125
Val Glu Ala Ile Glu Thr Ala Ile Thr Pro Asn Thr Lys Ala Ile Phe
    130                 135                 140
Val Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asn Val Thr Glu
145                 150                 155                 160
Ile Ala Lys Ile Ala Lys Lys Tyr Asn Leu Leu Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Phe Ser Arg Pro Leu Asp Leu Gly Ala Asp
            180                 185                 190
Ile Val Ile His Ser Ala Thr Lys Tyr Leu Ala Gly His Asn Asp Thr
        195                 200                 205
Leu Ala Gly Leu Val Val Ala Lys Gly Gln Ala Leu Cys Glu Arg Ile
    210                 215                 220
Phe Tyr Ile Gln Asn Gly Ala Gly Ala Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Leu Lys Thr Leu Ala Leu Arg Met Glu Arg
                245                 250                 255
His Gln Ala Asn Ala Ala Ala Ile Ala Glu Phe Leu Lys Ala Gln Pro
            260                 265                 270
Gln Val Lys Asp Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu Gln Asp Glu Asn Trp Val Asn Pro Phe Leu Lys Ala Ile Asn
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Thr Thr Gln Thr His Met Asp Ile Pro Ala Glu Glu Arg Ile
                325                 330                 335
Ala Arg Gly Val Thr Asn Asp Leu Leu Arg Phe Ser Val Gly Leu Glu
            340                 345                 350
Asn Val Glu Asp Ile Lys Ala Asp Leu Ala Gln Ala Phe Ala Gln Phe
        355                 360                 365
Lys
<210>40
<211>369
<212>PRT
<213>睡眠嗜血杆菌
<400>40
Met Thr Gln Gln Tyr Ala Leu Asp Thr Leu Leu Ala Gln Thr Gly Asn
  1               5                  10                  15
Arg Thr Asp Glu Arg Thr Gly Ala Val Ser Thr Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Gly His His Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Gly Gly Asp Arg Gly Phe Ala Cys Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Leu Leu Met Asn Leu Phe Ala Ser Pro Asp Glu Trp Ile
                 85                  90                  95
Val Ser Ser Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ala
            100                 105                 110
His Lys Asn Ile His Gly Val Lys Pro Val Tyr Val Asn Thr Ala Ser
        115                 120                 125
Ser Glu Glu Ile Glu Lys Ala Ile Thr Glu Asn Thr Lys Ala Ile Phe
    130                 135                 140
Val Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val Ala Glu
145                 150                 155                 160
Ile Ala Lys Ile Ala Lys Lys Tyr Lys Leu Leu Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Leu Phe Arg Pro Met Glu His Gly Ala Asp
            180                 185                 190
Ile Val Ile His Ser Gly Thr Lys Tyr Ile Ala Gly His Asn Asp Thr
        195                 200                 205
Leu Val Gly Leu Ile Val Ala Lys Gly Gln Glu Ile Cys Asn Arg Leu
    210                 215                 220
Tyr Tyr Ile Gln Asn Gly Ala Gly Pro Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Met Lys Thr Leu Ala Leu Arg Met Glu Arg
                245                 250                 255
His Gln Lys Asn Ala Gln Glu Leu Ala Asn Phe Leu Arg Glu Gln Pro
            260                 265                 270
Gln Val Lys Asp Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu Gln Asn Glu Asn Trp Val Asn Pro Phe Leu Lys Ala Met Lys
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Ala Thr Gln Thr His Met Asp Ile Pro Glu Val Glu Arg Val
                325                 330                 335
Ala Arg Gly Val Cys Asn Arg Leu Leu Arg Phe Ser Val Gly Leu Glu
            340                 345                 350
Asn Val Glu Asp Ile Lys Ala Asp Leu Leu Gln Ala Phe Ser Gln Leu
        355                 360                 365
Lys
<210>41
<211>381
<212>PRT
<213>流感嗜血杆菌(Haemophilus influenzae)
<400>41
Met Arg Ser Ile Phe Ser Leu Phe Leu Glu Asp Val Met Thr Gln Gln
  1               5                  10                  15
Tyr Ala Ile Asp Thr Leu Leu Ala Gln Ala Gly Asn Arg Ser Asp Glu
             20                  25                  30
Arg Thr Gly Ala Val Ser Ala Pro Ile Phe Leu Ser Thr Ala Tyr Gly
         35                  40                  45
His Cys Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr Thr Arg Thr Lys
     50                  55                  60
Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Ile Ala Lys Leu Glu Asn
 65                  70                  75                  80
Gly Asp Arg Gly Phe Ala Phe Ser Ser Gly Met Ala Ala Ile Gln Val
                 85                  90                  95
Leu Met Thr Leu Phe Thr Ala Pro Asp Glu Trp Ile Val Ser Ser Asp
            100                 105                 110
Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ser Tyr Lys Asn Asn
        115                 120                 125
Asn Ser Val Lys Pro Val Tyr Val Asn Thr Ala Ser Ala Ser Ala Ile
    130                 135                 140
Glu Ala Ala Ile Asn Pro Asn Thr Lys Ala Ile Phe Ile Glu Thr Pro
145                 150                 155                 160
Ser Asn Pro Leu Met Glu Glu Cys Asp Val Val Glu Ile Ala Lys Leu
                165                 170                 175
Ala Lys Lys His Asn Leu Met Leu Ile Val Asp Asn Thr Phe Leu Thr
            180                 185                 190
Pro Val Leu Ser Arg Pro Leu Asp Leu Gly Ala Asp Val Val Ile His
        195                 200                 205
Ser Gly Thr Lys Tyr Ile Ala Gly His Asn Asp Ala Leu Val Gly Leu
    210                 215                 220
Ile Val Ala Lys Gly Gln Glu Leu Cys Asp Arg Ile Ala Tyr Ile Gln
225                 230                 235                 240
Asn Gly Ala Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu Thr Ile
                245                 250                 255
Arg Gly Met Lys Thr Leu Ser Leu Arg Met Lys Arg His Gln Glu Asn
            260                 265                 270
Ala Gln Ala Ile Ala Glu Phe Leu Lys Ala Gln Pro Gln Val Glu Ser
        275                 280                 285
Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe Arg Leu Gln Asp
    290                 295                 300
Glu Ala Trp Val Asn Thr Phe Leu Lys Ser Ile Lys Leu Ile Thr Phe
305                 310                 315                 320
Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr Tyr Pro Ala Thr
                325                 330                 335
Gln Thr His Met Asp Ile Pro Glu Ser Glu Arg Val Ala Arg Gly Ile
            340                 345                 350
Thr Asn Thr Leu Leu Arg Phe Ser Val Gly Ile Glu Asp Val Glu Asp
        355                 360                 365
Ile Lys Ala Asp Leu Leu Gln Ala Phe Ala Asn Leu Lys
    370                 375                 380
<210>42
<211>369
<212>PRT
<213>流感嗜血杆菌
<400>42
Met Thr Gln Gln Tyr Ala Ile Asp Thr Leu Leu Ala Gln Ala Gly Asn
  1               5                  10                  15
Arg Ser Asp Glu Arg Thr Gly Ala Val Ser Ala Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Gly His Cys Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Asn Gly Asp Arg Gly Phe Ala Phe Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Val Leu Met Thr Leu Phe Thr Ala Pro Asp Glu Trp Ile
                 85                  90                  95
Val Ser Ser Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ser
            100                 105                 110
Tyr Lys Asn Asn Asn Ser Val Lys Pro Val Tyr Val Asn Thr Ala Ser
        115                 120                 125
Ala Ser Ala Ile Glu Ala Ala Ile Asn Pro Asn Thr Lys Ala Ile Phe
    130                 135                 140
Ile Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val Val Glu
145                 150                 155                 160
Ile Ala Lys Leu Ala Lys Lys His Asn Leu Met Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Leu Ser Arg Pro Leu Asp Leu Gly Ala Asp
            180                 185                 190
Val Val Ile His Ser Gly Thr Lys Tyr Ile Ala Gly His Asn Asp Ala
        195                 200                 205
Leu Val Gly Leu Ile Val Ala Lys Gly Gln Glu Leu Cys Asp Arg Ile
    210                 215                 220
Ala Tyr Ile Gln Asn Gly Ala Gly Ala Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Met Lys Thr Leu Ser Leu Arg Met Lys Arg
                245                 250                 255
His Gln Glu Asn Ala Gln Ala Ile Ala Glu Phe Leu Lys Ala Gln Pro
            260                 265                 270
Gln Val Glu Ser Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu Gln Asp Glu Ala Trp Val Asn Thr Phe Leu Lys Ser Ile Lys
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Ala Thr Gln Thr His Met Asp Ile Pro Glu Ser Glu Arg Val
                325                 330                 335
Ala Arg Gly Ile Thr Asn Thr Leu Leu Arg Phe Ser Val Gly Ile Glu
            340                 345                 350
Asp Val Glu Asp Ile Lys Ala Asp Leu Leu Gln Ala Phe Ala Asn Leu
        355                 360                 365
Lys
<210>43
<211>369
<212>PRT
<213>流感嗜血杆菌
<400>43
Met Thr Gln Gln Tyr Ala Ile Asp Thr Leu Leu Ala Gln Ala Gly Asn
  1               5                  10                  15
Arg Ser Asp Glu Arg Thr Gly Ala Val Ser Ala Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Gly His Cys Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Asn Gly Asp Arg Gly Phe Ala Phe Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Val Leu Met Thr Leu Phe Thr Ala Pro Asp Glu Trp Ile
                 85                  90                  95
Val Ser Ser Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ser
            100                 105                 110
Tyr Lys Asn Asn Asn Ser Val Lys Pro Val Tyr Val Asn Thr Ala Ser
        115                 120                 125
Ala Ser Ala Ile Glu Ala Ala Ile Asn Pro Asn Thr Lys Ala Ile Phe
    130                 135                 140
Ile Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val Val Glu
145                 150                 155                 160
Ile Ala Lys Leu Ala Lys Lys His Asn Leu Met Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Leu Ser Arg Pro Leu Asp Leu Gly Ala Asp
            180                 185                 190
Val Val Ile His Ser Gly Thr Lys Tyr Ile Ala Gly His Asn Asp Ala
        195                 200                 205
Leu Val Gly Leu Ile Val Ala Lys Gly Gln Glu Leu Cys Asp Arg Ile
    210                 215                 220
Ala Tyr Ile Gln Asn Gly Ala Gly Ala Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Met Lys Thr Leu Ser Leu Arg Met Lys Arg
                245                 250                 255
His Gln Glu Asn Ala Gln Ala Ile Ala Glu Phe Leu Lys Ala Gln Pro
            260                 265                 270
Gln Val Glu Ser Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu Gln Asp Glu Ala Trp Val Asn Thr Phe Leu Lys Ser Ile Lys
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Ala Thr Gln Thr His Met Asp Ile Pro Glu Pro Glu Arg Val
                325                 330                 335
Ala Arg Gly Ile Thr Asn Thr Leu Leu Arg Phe Ser Val Gly Ile Glu
            340                 345                 350
Asp Val Glu Asp Ile Lys Ala Asp Leu Leu Gln Ala Phe Ala Asn Leu
        355                 360                 365
Lys
<210>44
<211>369
<212>PRT
<213>流感嗜血杆菌
<400>44
Met Thr Gln Gln Tyr Ala IIe Asp Thr Leu Leu Ala Gln Ala Gly Asn
  1               5                  10                  15
Arg Ser Asp Glu Arg Thr Gly Ala Val Ser Ala Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Gly His Cys Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Asn Gly Asp Arg Gly Phe Ala Phe Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Val Leu Met Thr Leu Phe Thr Ala Pro Asp Glu Trp Ile
                 85                  90                  95
Val Ser Ser Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ser
            100                 105                 110
Tyr Lys Asn Asn Asn Ser Val Lys Pro Val Tyr Val Asn Thr Ala Phe
        115                 120                 125
Ala Ser Glu Ile Glu Ala Ala Ile Asn Pro Asn Thr Lys Ala Ile Phe
    130                 135                 140
Ile Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val Val Glu
145                 150                 155                 160
Ile Ala Lys Leu Ala Lys Lys His Asn Leu Met Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Leu Ser Arg Pro Leu Asp Leu Gly Ala Asp
            180                 185                 190
Val Val Ile His Ser Gly Thr Lys Tyr Ile Ala Gly His Asn Asp Ala
        195                 200                 205
Leu Val Gly Leu Ile Val Ala Lys Gly Gln Glu Leu Cys Asp Arg Ile
    210                 215                 220
Ala Tyr Ile Gln Asn Gly Ala Gly Ala Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Met Lys Thr Leu Ser Leu Arg Met Lys Arg
                245                 250                 255
His Gln Glu Asn Ala Gln Ala Ile Ala Glu Phe Leu Lys Asp Gln Pro
            260                 265                 270
Gln Val Glu Ser Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu Gln Asp Glu Ala Trp Val Asn Thr Phe Leu Lys Ser Ile Lys
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Ala Thr Gln Thr His Met Asp Ile Pro Glu Ser Glu Arg Val
                325                 330                 335
Ala Arg Gly Ile Thr Asn Thr Leu Leu Arg Phe Ser Val Gly Ile Glu
            340                 345                 350
Asp Val Glu Asp Ile Lys Ala Asp Leu Leu Gln Ala Phe Ala Asn Leu
        355                 360                 365
Lys
<210>45
<211>369
<212>PRT
<213>流感嗜血杆菌
<400>45
Met Thr Gln Gln Tyr Ala Ile Asp Thr Leu Leu Ala Gln Ala Gly Asn
  1               5                  10                  15
Arg Ser Asp Glu Arg Thr Gly Ala Val Ser Ala Pro Ile Phe Leu Ser
             20                  25                  30
Thr Ala Tyr Gly His Cys Gly Ile Gly Glu Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Ile Ala
     50                  55                  60
Lys Leu Glu Asn Gly Asp Arg Gly Phe Ala Phe Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Ile Gln Val Leu Met Thr Leu Phe Thr Ala Leu Asp Glu Trp Ile
                 85                  90                  95
Val Ser Ser Asp Val Tyr Gly Gly Thr Tyr Arg Leu Leu Asp Phe Ser
            100                 105                 110
Tyr Lys Asn Asn Asn Ser Val Lys Pro Val Tyr Val Asn Thr Ala Ser
        115                 120                 125
Ala Ser Glu Ile Glu Ala Ala Ile Asn Pro Asn Thr Lys Ala Ile Phe
    130                 135                 140
Ile Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val Val Glu
145                 150                 155                 160
Ile Ala Lys Leu Ala Lys Lys His Asn Leu Met Leu Ile Val Asp Asn
                165                 170                 175
Thr Phe Leu Thr Pro Val Leu Ser Arg Pro Leu Asp Leu Gly Ala Asp
            180                 185                 190
Val Val Ile His Ser Gly Thr Lys Tyr Ile Ala Gly His Asn Asp Ala
        195                 200                 205
Leu Val Gly Leu Ile Val Ala Lys Gly Gln Glu Leu Cys Asp Arg Ile
    210                 215                 220
Ala Tyr Ile Gln Asn Gly Ala Gly Ala Val Leu Ser Pro Phe Asp Ser
225                 230                 235                 240
Trp Leu Thr Ile Arg Gly Met Lys Thr Leu Ser Leu Arg Met Lys Arg
                245                 250                 255
His Gln Glu Asn Ala Gln Ala Ile Ala Glu Phe Leu Lys Asp Gln Pro
            260                 265                 270
Gln Val Glu Ser Val Leu Tyr Pro Asn Lys Gly Gly Met Leu Ser Phe
        275                 280                 285
Arg Leu Gln Asp Glu Ala Trp Val Asn Thr Phe Leu Lys Ser Ile Lys
    290                 295                 300
Leu Ile Thr Phe Ala Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr
305                 310                 315                 320
Tyr Pro Ala Thr Gln Thr His Met Asp Ile Pro Glu Thr Glu Arg Val
                325                 330                 335
Ala Arg Gly Ile Thr Asn Thr Leu Leu Arg Phe Ser Val Gly Ile Glu
            340                 345                 350
Asp Val Glu Asp Ile Lys Ala Asp Leu Leu Gln Ala Phe Ala Asn Leu
        355                 360                 365
Lys
<210>46
<211>368
<212>PRT
<213>克劳氏芽孢杆菌(Bacillus clausii)
<400>46
Met Glu Lys Arg Ala Glu Thr Ile Leu Ala Gln Ile Gly Asn Arg Arg
  1               5                  10                  15
Asp Glu His Thr Gly Ala Val Asn Thr Pro Val Tyr Phe Ser Thr Ala
             20                  25                  30
Tyr Arg His Pro Gly Ile Gly Glu Ser Thr Gly Tyr Asp Tyr Ala Arg
         35                  40                  45
Thr Gly Asn Pro Thr Arg Asp Val Leu Glu Lys Ala Ile Ala Glu Leu
     50                  55                  60
Glu Glu Gly Glu Arg Gly Phe Ala Thr Ser Ser Gly Met Ala Ala Val
 65                  70                  75                  80
Gln Ile Val Leu Ser Leu Phe Glu Gln Gly Asp Gly Ile Ile Cys Ser
                 85                  90                  95
Lys Asp Leu Tyr Gly Gly Thr Tyr Arg Leu Phe Glu Gly Gly Trp Thr
            100                 105                 110
Arg Trp Gly Val Ser Phe Thr Tyr Val Asp Pro Arg Asn Leu Gln Glu
        115                 120                 125
Val Glu Gln Ala Ile His Ser Asn Val Lys Ala Ile Phe Ile Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Gln Glu Ala Ser Ile Pro Ala Leu Ala Ala
145                 150                 155                 160
Leu Ala Lys Lys His Asp Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr
                165                 170                 175
Thr Pro Leu Leu Gln Lys Pro Leu Thr Glu Gly Ala Asp Ile Val Ile
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Val Ala Gly
        195                 200                 205
Leu Ile Val Ala Lys Gly Ala Asp Leu Cys Glu Arg Leu Ala Tyr Tyr
    210                 215                 220
His Asn Gly Ala Gly Gly Ile Leu Ser Ala Phe Asp Ser Trp Leu Leu
225                 230                 235                 240
Ile Arg Gly Met Lys Thr Leu Ala Leu Arg Met Ala Lys His Glu Glu
                245                 250                 255
Asn Ala Lys Lys Val Val His Ala Leu Glu Gln Thr Asp Gly Ile Val
            260                 265                 270
Asp Val Leu Tyr Pro Gly Arg Gly Gly Met Leu Ser Phe Arg Val Gln
        275                 280                 285
Asn Glu Ala Trp Val Asn Pro Leu Leu Lys His Leu Gln Leu Ile Ser
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Met Thr Tyr Pro Ala
305                 310                 315                 320
Thr Gln Thr His Ala Asp Ile Pro Glu Glu Ile Arg Leu Ala Asn Gly
                325                 330                 335
Val Asp Asn Gly Leu Leu Arg Phe Ser Val Gly Ile Glu Asn Gly Glu
            340                 345                 350
Asp Ile Val Ala Asp Leu Leu Gln Ala Ile Ala Ala Ala Lys Lys Ser
        355                 360                 365
<210>47
<211>380
<212>PRT
<213>胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)
<400>47
Met Lys Met Thr Lys Tyr Ser Asn Ile Glu Thr Thr Leu Val Gln Leu
  1               5                  10                  15
Gly Asn Arg Thr Asp Pro Arg Thr Gly Ala Val Ala Thr Pro Ile Val
             20                  25                  30
Leu Ser Thr Ala Tyr Gly Arg Gly Gly Leu Gly Glu Ser Thr Gly Trp
         35                  40                  45
Asp Tyr Ile Arg Thr Lys Asn Pro Thr Arg Ala Val Leu Glu Gln Gly
     50                  55                  60
Ile Ala Asp Leu Glu Gly Gly Asp Ala Gly Phe Ala Met Ala Ser Gly
 65                  70                  75                  80
Met Ala Ala Ile Gln Leu Val Met Ser Leu Phe Lys Ala Pro Asp Glu
                 85                  90                  95
Trp Ile Ile Ser Ser Asp Val Tyr Gly Gly Ser Tyr Arg Leu Phe Asp
            100                 105                 110
Phe Ser His Lys His His Asn Thr Val Lys Pro Val Tyr Val Asn Thr
        115                 120                 125
Ala Asp Leu Ala Ala Ile Glu Ala Ala Ile Thr Pro Asn Thr Lys Ala
    130                 135                 140
Ile Phe Val Glu Thr Pro Ser Asn Pro Leu Met Glu Glu Cys Asp Val
145                 150                 155                 160
Asp Ala Ile Ser Lys Ile Ala Lys Lys His Asn Leu Met Leu Ile Val
                165                 170                 175
Asp Asn Thr Phe Leu Thr Pro Ile Leu Phe Arg Pro Ile Glu His Gly
            180                 185                 190
Ala Asp Ile Val Ile His Ser Ala Thr Lys Tyr Leu Ser Gly His Asn
        195                 200                 205
Asp Val Leu Ala Gly Leu Ile Val Ala Lys Asp Ser Glu Ala Thr Lys
    210                 215                 220
Asn Glu Ala Gly Gln Lys Leu Ser Glu Arg Leu Phe Tyr Phe Gln Asn
225                 230                 235                 240
Cys Ala Gly Ala Val Leu Ser Pro Phe Asp Ser Tyr Leu Ala Val Arg
                245                 250                 255
Gly Leu Lys Thr Leu Ala Leu Arg Met Glu Arg His Gln Ser Asn Ala
            260                 265                 270
Thr Glu Leu Ala Arg Phe Leu Ser Glu Gln Pro Glu Ile Glu Cys Val
        275                 280                 285
Leu Tyr Ser Gly Lys Ser Gly Met Leu Ser Phe Arg Leu Gln Lys Glu
    290                 295                 300
Glu Trp Val Pro Lys Phe Leu Lys Ala Ile Lys Leu Ile Thr Phe Ala
305                 310                 315                 320
Glu Ser Leu Gly Gly Thr Glu Ser Phe Ile Thr Tyr Pro Ser Thr Gln
                325                 330                 335
Thr His Met Asp Ile Pro Glu Ala Glu Arg Ile Ala Arg Gly Ile Thr
            340                 345                 350
Asn Asn Leu Leu Arg Phe Ser Val Gly Leu Glu His Val Glu Asp Leu
        355                 360                 365
Lys Val Asp Leu Arg Gln Ala Phe Gly Gln Leu Lys
    370                 375                 380
<210>48
<211>374
<212>PRT
<213>单核细胞增生利斯特氏(Listeria monocytogenes)
<400>48
Met Ala Lys Leu Lys Gln Glu Thr Ile Ala Ala Gln Ile Gly Asn Arg
  1               5                  10                  15
Lys Cys Glu Arg Thr Gly Ala Val Asn Met Pro Val Tyr Phe Ser Thr
             20                  25                  30
Ala Tyr Gln His Ala Asp Leu Gly Val Ser Thr Gly Tyr Asp Tyr Thr
         35                  40                  45
Arg Thr Gly Asn Pro Thr Arg Asp Ala Leu Gln Glu Ala Leu Ala Glu
     50                  55                  60
Leu Glu Asn Gly Thr His Ala Phe Ala Thr Ser Ser Gly Met Ser Ala
 65                  70                  75                  80
Ile Gln Leu Val Phe Gln Leu Phe Lys Thr Gly Glu His Ile Ile Ser
                 85                  90                  95
Ser Gln Asp Leu Tyr Gly Gly Thr Phe Arg Tyr Phe Glu Gln Phe Gly
            100                 105                 110
Ala Gln Tyr Asn Ile Gly Phe Ser Tyr Trp Asp Gly Ala Glu Ile Ala
        115                 120                 125
Asp Leu Glu Lys Leu Val Arg Pro Glu Thr Lys Ala Ile Phe Ile Glu
    130                 135                 140
Thr Pro Thr Asn Pro Leu Met Gln Glu Thr Asp Ile Ala Ala Val Ser
145                 150                 155                 160
Glu Trp Ala Gly Ala His Asp Leu Leu Val Ile Val Asp Asn Thr Phe
                165                 170                 175
Tyr Thr Pro Ile Leu Gln Gln Pro Leu Thr Leu Gly Ala Asp Ile Val
            180                 185                 190
Ile His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ala
        195                 200                 205
Gly Ala Val Ile Val Lys Glu Glu Arg Leu Gly Asn Phe Phe Phe Asn
    210                 215                 220
Gln Leu Asn Ala Thr Gly Ala Val Leu Ser Pro Phe Asp Ser Trp Leu
225                 230                 235                 240
Leu Ile Arg Gly Leu Lys Thr Leu Val Leu Arg Val Arg Gln His Gln
                245                 250                 255
Ala Asn Ala Glu Lys Ile Ala Ala Phe Leu Glu Ser His Glu Leu Val
            260                 265                 270
Glu Glu Val Arg Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Phe Ile
        275                 280                 285
Gln Asp Ala Ala Leu Val Ser Pro Leu Leu Lys Glu Leu Glu Leu Phe
    290                 295                 300
Thr Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro
305                 310                 315                 320
Thr Thr Gln Thr His Ala Asp Ile Pro Glu Glu Leu Arg Asn Ser Tyr
                325                 330                 335
Gly Leu Thr Asp Lys Leu Leu Arg Ile Ser Val Gly Ile Glu Ala Ser
            340                 345                 350
Glu Asp Leu Ile Ala Asp Leu Ser Lys Ala Leu Asp Ala Val Leu Glu
        355                 360                 365
Gly Val Ser Ala Arg Gly
    370
<210>49
<211>374
<212>PRT
<213>单核细胞增生利斯特氏
<400>49
Met Ala Lys Leu Lys Gln Glu Thr Ile Ala Ala Gln Ile Gly Asn Arg
  1               5                  10                  15
Lys Cys Glu Arg Thr Gly Ala Val Asn Met Pro Val Tyr Phe Ser Thr
             20                  25                  30
Ala Tyr Gln His Ala Asp Leu Gly Val Ser Thr Gly Tyr Asp Tyr Thr
         35                  40                  45
Arg Thr Gly Asn Pro Thr Arg Asp Ala Leu Gln Glu Ala Leu Ala Glu
     50                  55                  60
Leu Glu Asn Gly Thr His Ala Phe Ala Thr Ser Ser Gly Met Ser Ala
 65                  70                  75                  80
Ile Gln Leu Val Phe Gln Leu Phe Lys Thr Gly Glu His Ile Ile Ser
                 85                  90                  95
Ser Gln Asp Leu Tyr Gly Gly Thr Phe Arg Tyr Phe Glu Gln Phe Gly
            100                 105                 110
Ala Gln Tyr Gln Ile Gly Phe Ser Tyr Trp Asp Gly Ala Glu Ile Thr
        115                 120                 125
Asp Leu Glu Lys Leu Ile Arg Pro Glu Thr Lys Ala Ile Phe Ile Glu
    130                 135                 140
Thr Pro Thr Asn Pro Leu Met Gln Glu Thr Asp Ile Ala Thr Val Ala
145                 150                 155                 160
Lys Trp Ala His Ala His Asp Leu Leu Val Ile Val Asp Asn Thr Phe
                165                 170                 175
Tyr Thr Pro Val Leu Gln Gln Pro Leu Ser Leu Gly Ala Asp Ile Val
            180                 185                 190
Ile His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ala
        195                 200                 205
Gly Ala Val Ile Val Lys Glu Glu Lys Leu Gly Lys Phe Phe Phe Asp
    210                 215                 220
Gln Leu Asn Ala Thr Gly Thr Val Leu Ser Pro Phe Asp Ser Trp Leu
225                 230                 235                 240
Leu Ile Arg Gly Leu Lys Thr Leu Val Leu Arg Val Arg Gln His Gln
                245                 250                 255
Ala Asn Ala Gln Lys Ile Ala Ala Phe Leu Glu Glu His Lys Leu Val
            260                 265                 270
Glu Glu Val Arg Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Phe Ile
        275                 280                 285
Arg Asp Ala Ala Leu Val Ser Pro Leu Leu Lys Glu Leu Glu Leu Phe
    290                 295                 300
Thr Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro
305                 310                 315                 320
Thr Thr Gln Thr His Ala Asp Ile Pro Val Glu Leu Arg Asn Ser Tyr
                325                 330                 335
Gly Leu Thr Asp Lys Leu Leu Arg Ile Ser Val Gly Ile Glu Ala Ser
            340                 345                 350
Glu Asp Leu Ile Ala Asp Leu Ser Lys Ala Leu Asp Ala Val Leu Glu
        355                 360                 365
Glu Val Ser Ala Arg Gly
    370
<210>50
<211>374
<212>PRT
<213>单核细胞增生利斯特氏
<400>50
Met Ala Lys Leu Lys Gln Glu Thr Ile Ala Ala Gln Ile Gly Asn Arg
  1               5                  10                  15
Lys Cys Glu Arg Thr Gly Ala Val Asn Met Pro Val Tyr Phe Ser Thr
             20                  25                  30
Ala Tyr Gln His Ala Asp Leu Gly Val Ser Thr Gly Tyr Asp Tyr Thr
         35                  40                  45
Arg Thr Gly Asn Pro Thr Arg Asp Ala Leu Gln Glu Ala Leu Ala Glu
     50                  55                  60
Leu Glu Asn Gly Thr His Ala Phe Ala Thr Ser Ser Gly Met Ser Ala
 65                  70                  75                  80
Ile Gln Leu Val Phe Gln Leu Phe Lys Thr Gly Glu His Ile Ile Ser
                 85                  90                  95
Ser Gln Asp Leu Tyr Gly Gly Thr Phe Arg Tyr Phe Glu Gln Phe Gly
            100                 105                 110
Ala Gln Tyr Gln Ile Gly Phe Ser Tyr Trp Asp Gly Ala Glu Ile Ala
        115                 120                 125
Asp Leu Glu Lys Leu Ile Arg Pro Glu Thr Lys Ala Ile Phe Ile Glu
    130                 135                 140
Thr Pro Thr Asn Pro Leu Met Gln Glu Thr Asp Ile Ala Thr Val Ala
145                 150                 155                 160
Lys Trp Ala His Ala His Asp Leu Leu Val Ile Val Asp Asn Thr Phe
                165                 170                 175
Tyr Thr Pro Val Leu Gln Gln Pro Leu Ser Leu Gly Ala Asp Ile Val
            180                 185                 190
Ile His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ala
        195                 200                 205
Gly Ala Val Ile Val Lys Glu Glu Lys Leu Gly Lys Phe Phe Phe Asp
    210                 215                 220
Gln Leu Asn Ala Thr Gly Thr Val Leu Ser Pro Phe Asp Ser Trp Leu
225                 230                 235                 240
Leu Ile Arg Gly Leu Lys Thr Leu Val Leu Arg Val Arg Gln His Gln
                245                 250                 255
Ala Asn Ala Gln Lys Ile Ala Ala Phe Leu Glu Glu His Lys Leu Val
            260                 265                 270
Glu Glu Val Arg Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Phe Ile
        275                 280                 285
Arg Asp Ala Ala Leu Val Ser Pro Leu Leu Lys Glu Leu Glu Leu Phe
    290                 295                 300
Thr Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro
305                 310                 315                 320
Thr Thr Gln Thr His Ala Asp Ile Pro Val Glu Leu Arg Asn Ser Tyr
                325                 330                 335
Gly Leu Thr Asp Lys Leu Leu Arg Ile Ser Val Gly Ile Glu Ala Ser
            340                 345                 350
Glu Asp Leu Ile Ala Asp Leu Ser Lys Ala Leu Asp Ala Val Leu Glu
        355                 360                 365
Glu Val Ser Ala Arg Gly
    370
<210>51
<211>374
<212>PRT
<213>无害利斯特氏菌(Listeria innocua)
<400>51
Met Ala Lys Leu Lys Gln Glu Thr Ile Ala Ala Gln Ile Gly Asn Arg
  1               5                  10                  15
Lys Cys Glu Arg Thr Gly Ala Val Asn Met Pro Val Tyr Phe Ser Thr
             20                  25                  30
Ala Tyr Gln His Ala Asp Leu Gly Val Ser Thr Gly Tyr Asp Tyr Thr
         35                  40                  45
Arg Thr Gly Asn Pro Thr Arg Asp Ala Leu Gln Glu Ala Leu Ala Glu
     50                  55                  60
Leu Glu Asn Gly Thr His Ala Phe Ala Thr Ser Ser Gly Met Ser Ala
 65                  70                  75                  80
Ile Gln Leu Val Phe Gln Leu Phe Lys Thr Gly Glu His Ile Ile Ser
                 85                  90                  95
Ser Gln Asp Leu Tyr Gly Gly Thr Phe Arg Tyr Phe Glu Gln Phe Gly
            100                 105                 110
Ala Gln Tyr Gln Ile Gly Phe Ser Tyr Trp Asp Gly Ala Asn Val Asn
        115                 120                 125
Asp Leu Glu Lys Leu Val Arg Pro Glu Thr Lys Ala Ile Phe Ile Glu
    130                 135                 140
Thr Pro Thr Asn Pro Leu Met Gln Glu Thr Asp Ile Ala Ser Val Ser
145                 150                 155                 160
Arg Trp Ala His Ala Asn Asp Leu Leu Val Ile Val Asp Asn Thr Phe
                165                 170                 175
Tyr Thr Pro Val Leu Gln Gln Pro Leu Thr Leu Gly Ala Asp Ile Val
            180                 185                 190
Val His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ala
        195                 200                 205
Gly Ala Val Ile Val Lys Glu Glu Trp Leu Gly Lys Phe Phe Phe Asp
    210                 215                 220
Gln Leu Asn Ala Thr Gly Thr Val Leu Ser Pro Phe Asp Ser Trp Leu
225                 230                 235                 240
Leu Ile Arg Gly Leu Lys Thr Leu Val Leu Arg Val Arg Gln His Gln
                245                 250                 255
Ala Asn Ala Glu Lys Ile Ala Ala Phe Leu Glu Glu His Glu Leu Val
            260                 265                 270
Glu Glu Val Arg Tyr Pro Gly Arg Gly Gly Met Ile Ser Phe Phe Ile
        275                 280                 285
Lys Asp Ala Ala Leu Val Ser Pro Leu Leu Lys Glu Leu Glu Leu Phe
    290                 295                 300
Thr Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro
305                 310                 315                 320
Thr Thr Gln Thr His Ala Asp Ile Pro Leu Glu Leu Arg Asn Ser Tyr
                325                 330                 335
Gly Leu Thr Asp Lys Leu Leu Arg Ile Ser Val Gly Ile Glu Ala Ser
            340                 345                 350
Glu Asp Leu Ile Ala Asp Leu Ser Lys Ala Leu Asp Ala Val Leu Lys
        355                 360                 365
Gly Val Thr Ala Arg Gly
    370
<210>52
<211>384
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>52
Met Gly Glu Ile Asp Cys Arg Asn Phe Glu Thr Lys Ala Val His Gly
  1               5                  10                  15
Glu Ser Gly Phe Glu Ser Arg Thr Gly Ala Ile Ser Tyr Pro Ile Tyr
             20                  25                  30
Gln Ser Ser Thr Phe Arg His Glu Gly Leu Asn Lys Gly Thr Gly Tyr
         35                  40                  45
Asp Tyr Ser Arg Thr Gly Asn Pro Thr Arg Asp Glu Val Glu Lys Thr
     50                  55                  60
Val Ala Ala Leu Glu Asn Gly Arg Ala Cys Leu Ala Tyr Ser Ser Gly
 65                  70                  75                  80
Met Ala Ala Ile Ser Ser Val Leu Thr Ile Phe Lys Gly Gly Asp His
                 85                  90                  95
Ile Ile Val Ser Asp Asp Leu Tyr Gly Gly Thr Tyr Arg Ile Phe Glu
            100                 105                 110
Glu Ile Tyr Glu His Tyr Gly Ile Glu Val Thr Tyr Thr Asp Thr Thr
        115                 120                 125
Ser Thr Glu Asn Ile Glu Lys Glu Leu Arg Glu Asn Thr Lys Ala Ile
    130                 135                 140
Tyr Leu Glu Thr Pro Thr Asn Pro Leu Met Lys Ile Thr Asp Ile Arg
145                 150                 155                 160
Glu Val Ser Lys Leu Ala Lys Glu His Asn Thr Leu Leu Ile Val Asp
                165                 170                 175
Asn Thr Phe Met Thr Pro Tyr Tyr Gln Lys Pro Leu Glu Leu Gly Ala
            180                 185                 190
Asp Ile Val Leu His Ser Gly Thr Lys Tyr Leu Cys Gly His Asn Asp
        195                 200                 205
Ala Leu Ala Gly Phe Val Ile Leu Asn Asp Glu Arg Leu Ile Glu Lys
    210                 215                 220
Leu Arg Phe Ile Gln Asn Ser Val Gly Ala Val Leu Ala Pro Phe Asp
225                 230                 235                 240
Ser Trp Leu Ile Leu Arg Gly Ile Lys Thr Leu His Ile Arg Leu Asp
                245                 250                 255
Arg Gln Gln Glu Asn Ala Ile Lys Ile Ala Asn Phe Leu Lys Lys His
            260                 265                 270
Lys Lys Ile Thr Lys Val Leu Tyr Pro Gly Leu Glu Glu His Val Gly
        275                 280                 285
His Asp Ile Leu Lys Ser Glu Ala Ser Gly Phe Gly Ala Met Ile Ser
    290                 295                 300
Phe Tyr Val Asp Ser Lys Glu Thr Val Glu Lys Val Leu Glu Ser Val
305                 310                 315                 320
Lys Val Ile Ile Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile
                325                 330                 335
Thr Tyr Pro Tyr Thr Gln Thr His Ala Asp Ile Pro Asp Asp Ile Arg
            340                 345                 350
Lys Arg Leu Gly Val Thr Asp Lys Leu Leu Arg Phe Ser Val Gly Ile
        355                 360                 365
Glu Asn Val Asp Asp Leu Ile Lys Asp Leu Asp Lys Ala Leu Gln Ala
    370                 375                 380
<210>53
<211>359
<212>PRT
<213>Symbiobacterium thermophilum
<400>53
Met Lys Leu Asp Thr Val Leu Val His Ala Gly Val Arg Arg Asp Pro
  1               5                  10                  15
Ala Tyr Gly Ala Val Ser Val Pro Val Tyr Gln Ser Ala Thr Phe Gln
             20                  25                  30
His Pro Ala Leu Gly Glu Ser Thr Gly Tyr Asp Tyr Ser Arg Ser Gly
         35                  40                  45
Asn Pro Thr Arg Ala Ala Leu Glu Glu Ala Leu Ala Arg Ala Glu Gly
     50                  55                  60
Gly Ala Arg Ala Leu Ala Phe Ala Ser Gly Met Ala Ala Leu Thr Cys
 65                  70                  75                  80
Ala Leu Gly Leu Phe Gly Pro Gly Asp His Leu Val Val Thr Glu Asp
                 85                  90                  95
Leu Tyr Gly Gly Thr Tyr Arg Leu Leu Glu Gln Val Leu Ala Leu Pro
            100                 105                 110
His Thr Tyr Ala Asp Thr Ala Asp Leu Asp Ala Val Arg Ala Ala Ile
        115                 120                 125
Arg Pro Asp Thr Arg Ala Val Leu Val Glu Ser Leu Thr Asn Pro Arg
    130                 135                 140
Met Lys Arg Ala Asp Val Ala Ala Leu Ala Gly Leu Cys Arg Ala His
145                 150                 155                 160
Gly Leu Leu Leu Ile Val Asp Asn Thr Phe Leu Thr Pro Trp Leu Cys
                165                 170                 175
Arg Pro Leu Glu Leu Gly Ala Asp Ile Val Val His Ser Ala Thr Lys
            180                 185                 190
Tyr Leu Ala Gly His Asn Asp Val Val Ala Gly Ala Leu Ile Thr Arg
        195                 200                 205
Asp Thr Ala Leu Gly Asp Arg Leu Ser Phe Leu Gln Asn Ala Val Gly
    210                 215                 220
Ser Val Leu Gly Pro Gln Asp Ser Trp Leu Val Leu Arg Gly Leu Lys
225                 230                 235                 240
Thr Leu Ala Leu Arg Met Glu Arg His Gln Gln Asn Ala Ala Arg Ile
                245                 250                 255
Ala Ala Trp Leu Arg Glu His Pro Arg Val Glu Glu Val Leu Tyr Pro
            260                 265                 270
Gly Val Gly Gly Met Leu Ser Phe Thr Val Thr Glu Pro Ser Leu Val
        275                 280                 285
Pro Gln Val Leu Arg Arg Val Lys Leu Ile Leu Phe Ala Glu Ser Leu
    290                 295                 300
Gly Gly Val Glu Ser Leu Ile Thr Phe Pro Trp Thr Gln Thr His Ala
305                 310                 315                 320
Asp Met Pro Glu Glu Val Arg Arg Arg Leu Gly Ile Thr Asp Arg Leu
                325                 330                 335
Leu Arg Leu Ser Val Gly Ile Glu Asp Ala Asp Asp Leu Ile Ala Asp
            340                 345                 350
Leu Ala Gln Ala Leu Glu Gly
        355
<210>54
<211>373
<212>PRT
<213>植物乳杆菌(Lactobacillus plantarum)
<400>54
Met Thr Lys Gln Ala Glu Lys Leu His Ile Glu Thr Arg Leu Ala Gln
  1               5                  10                  15
Ala Gly Asn Arg Ser Asp Asp Glu Lys Thr Gly Ala Ile Ser Ala Pro
             20                  25                  30
Ile Tyr Leu Ser Thr Ala Tyr Arg His Ala Gly Leu Gly Gln Ser Thr
         35                  40                  45
Gly Phe Asp Tyr Pro Arg Glu Ala Gln Pro Thr Arg Cys Ile Leu Glu
     50                  55                  60
Arg Val Leu Ala Glu Met Glu His Gly Ile Ala Ala Tyr Ala Leu Thr
 65                  70                  75                  80
Ser Gly Met Ala Ala Ile Gln Leu Val Phe Thr Leu Phe Asn Ser Gly
                 85                  90                  95
Asp Lys Ile Ile Val Ser Asp Asp Leu Tyr Gly Gly Ser Tyr Arg Phe
            100                 105                 110
Phe Asp Leu Leu His Asp His Tyr His Leu Asp Phe Ala Val Trp Asp
        115                 120                 125
Gly Gln Asp Gln Ala Thr Leu Ala Ala Leu Ala Asp Asp Gln Thr Val
    130                 135                 140
Ala Leu Trp Leu Glu Thr Pro Ser Asn Pro Thr Met Lys Val Ile Asp
145                 150                 155                 160
Ile Thr Ala Thr Ala Ala Thr Ala His Ala His Asp Leu Lys Leu Ile
                165                 170                 175
Val Asp Asn Thr Phe Tyr Thr Pro Leu Ile Gln Lys Pro Leu Asp Leu
            180                 185                 190
Gly Ala Asp Ile Val Val His Ser Ala Thr Lys Tyr Leu Ala Gly His
        195                 200                 205
Asn Asp Val Leu Ala Gly Ala Val Val Val Lys Ser Gln Ala Asp Ala
    210                 215                 220
Asp Ala Leu Glu Phe Asn Leu Val Thr Thr Gly Ala Val Leu Asp Pro
225                 230                 235                 240
Phe Asp Ala Trp Leu Leu Leu Arg Ser Leu Lys Thr Leu Pro Leu Arg
                245                 250                 255
Leu His Gln Gln Glu Ala Asn Ala Gln Glu Leu Val Thr Val Leu Glu
            260                 265                 270
Ala Asp Glu His Val Glu Arg Val Leu Tyr Ser Gly Arg Gly Gly Met
        275                 280                 285
Ile Ser Phe Tyr Leu Ala Thr Gly Thr Asp Val Asp Thr Phe Leu Arg
    290                 295                 300
Ala Leu Asn Val Ile Ser Phe Ala Glu Ser Leu Gly Gly Val Glu Ser
305                 310                 315                 320
Leu Leu Thr Val Pro Ala Val Gln Thr His Ala Asp Leu Thr Glu Glu
                325                 330                 335
Gln Arg Gln Ser Lys Gly Ile Thr Ala Asn Leu Leu Arg Leu Ser Val
            340                 345                 350
Gly Ile Glu Asn Ser Ala Asp Leu Ala Ala Asp Leu Lys Gln Ala Leu
        355                 360                 365
Ile Arg Ala Thr Lys
    370
<210>55
<211>367
<212>PRT
<213>表皮葡萄球菌(Staphylococcus epidermidis)
<400>55
Met Lys Asp Thr Asp Leu Ala Gln Ile Ala Leu Thr Gln Asp His Thr
  1               5                  10                  15
Gly Ala Ile Ala Asn Pro Ile Tyr Leu Ser Thr Ala Tyr Gln His Pro
             20                  25                  30
His Leu Gly Glu Ser Thr Gly Tyr Asp Tyr Thr Arg Thr Lys Asn Pro
         35                  40                  45
Thr Arg Thr Ala Phe Glu Glu Ala Phe Ala Gln Leu Glu Lys Gly Ile
     50                  55                  60
Ala Ser Phe Ala Thr Ser Ser Gly Met Ala Ala Ile Gln Leu Ile Cys
 65                  70                  75                  80
Asn Ile Phe Lys Pro Gly Asp Glu Ile Leu Val Ala Phe Asp Leu Tyr
                 85                  90                  95
Gly Gly Thr Phe Arg Leu Phe Asp Phe Tyr Glu Lys Gln Tyr Gly Leu
            100                 105                 110
Lys Phe Lys Tyr Val Asp Phe Leu Asn Tyr Glu Glu Val Glu Lys Asn
        115                 120                 125
Ile Thr Pro Gln Thr Arg Ala Leu Phe Ile Glu Pro Ile Ser Asn Pro
    130                 135                 140
Gln Met Ile Glu Ile Asp Val Glu Thr Tyr Tyr Ile Leu Ser Lys Lys
145                 150                  55                 160
His Gln Leu Leu Thr Ile Ile Asp Asn Thr Phe Leu Thr Pro Tyr Leu
                165                 170                 175
Ser Thr Pro Leu Glu Glu Gly Ala Asp Ile Val Leu His Ser Ala Thr
            180                 185                 190
Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Val Val Thr Val
        195                 200                 205
Lys Asp Ala Gln Leu Ala Glu Gln Leu Asn Gln Phe His Asn Met Ile
    210                 215                 220
Gly Ala Thr Leu Ser Pro Leu Asp Ser Tyr Leu Leu Gln Arg Gly Leu
225                 230                 235                 240
Lys Thr Leu His Leu Arg Ile Glu Arg Ser Gln Glu Asn Ala Gln Lys
                245                 250                  55
Leu Ala Gln Arg Cys Arg Gln Ser Asp Ser Ile Asp Glu Val Leu Tyr
            260                 265                 270
Ser Gly Arg Thr Gly Met Leu Ser Leu Arg Leu Asn Gln Ala Tyr Ser
        275                 280                 285
Val Ala Lys Phe Leu Glu Asn Leu Glu Ile Cys Ile Phe Ala Glu Ser
    290                 295                 300
Leu Gly Gly Thr Glu Thr Phe Ile Thr Phe Pro Tyr Thr Gln Thr His
305                 310                 315                 320
Val Asp Met Pro Asp Glu Glu Lys Asp Lys Arg Gly Ile Asp Glu Tyr
                325                 330                 335
Leu Ile Arg Leu Ser Val Gly Ile Glu Asp Tyr Asn Asp Ile Glu Ala
            340                 345                 350
Asp Ile Ile Gln Ala Leu Glu Asn Ser Lys Val Gly Val Ile Ser
        355                 360                 365
<210>56
<211>367
<212>PRT
<213>表皮葡萄球菌
<400>56
Met Lys Asp Thr Asp Leu Ala Gln Ile Ala Leu Thr Gln Asp His Thr
  1               5                  10                  15
Gly Ala Ile Val Asn Pro Ile Tyr Leu Ser Thr Ala Tyr Gln His Pro
             20                  25                  30
His Leu Gly Glu Ser Thr Gly Tyr Asp Tyr Thr Arg Thr Lys Asn Pro
         35                  40                  45
Thr Arg Thr Ala Phe Glu Glu Ala Phe Ala Gln Leu Glu Lys Gly Ile
     50                  55                  60
Ala Ser Phe Ala Thr Ser Ser Gly Met Ala Ala Ile Gln Leu Ile Cys
 65                  70                  75                  80
Asn Ile Phe Lys Pro Gly Asp Glu Ile Leu Val Ala Phe Asp Leu Tyr
                 85                  90                  95
Gly Gly Thr Phe Arg Leu Phe Asp Phe Tyr Glu Lys Gln Tyr Gly Leu
            100                 105                 110
Lys Phe Lys Tyr Val Asp Phe Leu Asn Tyr Glu Glu Val Glu Lys Asn
        115                 120                 125
Ile Thr Pro Gln Thr Arg Ala Leu Phe Ile Glu Pro Ile Ser Asn Pro
    130                 135                 140
Gln Met Ile Glu Ile Asp Val Glu Pro Tyr Tyr Ile Leu Ser Lys Lys
145                 150                 155                 160
His Gln Leu Leu Thr Ile Ile Asp Asn Thr Phe Leu Thr Pro Tyr Leu
                165                 170                 175
Ser Thr Pro Leu Glu Glu Gly Ala Asp Ile Val Leu His Ser Ala Thr
            180                 185                 190
Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Val Val Thr Val
        195                 200                 205
Lys Asp Ala Gln Leu Ala Glu Gln Leu Asn Gln Phe His Asn Met Ile
    210                 215                 220
Gly Ala Thr Leu Ser Pro Leu Asp Ser Tyr Leu Leu Gln Arg Gly Leu
225                 230                 235                 240
Lys Thr Leu His Leu Arg Ile Glu Arg Ser Gln Glu Asn Ala Gln Lys
                245                 250                 255
Leu Ala Gln Arg Cys Arg Gln Ser Asp Ser Ile Asp Glu Val Leu Tyr
            260                  65                 270
Ser Gly Arg Thr Gly Met Leu Ser Leu Arg Leu Asn Gln Ala Tyr Ser
        275                 280                 285
Val Ala Lys Phe Leu Glu Asn Leu Glu Ile Cys Ile Phe Ala Glu Ser
    290                 295                 300
Leu Gly Gly Thr Glu Thr Phe Ile Thr Phe Pro Tyr Thr Gln Thr His
305                 310                  15                  20
Val Asp Met Pro Asp Glu Glu Lys Asp Lys Arg Gly Ile Asp Glu Tyr
                325                 330                 335
Leu Ile Arg Leu Ser Val Gly Ile Glu Asp Tyr Asn Asp Ile Glu Ala
            340                 345                 350
Asp Ile Ile Gln Ala Leu Glu Asn Ser Lys Val Gly Val Ile Ser
        355                 360                 365
<210>57
<211>386
<212>PRT
<213>热纤梭菌(Clostridium thermocellum)
<400>57
Met Met Lys Val Gly Asn Val Ser Asn Tyr Ser Ile Ser Thr Lys Val
  1               5                  10                  15
Val His Gly Ser Lys Cys Tyr Asp Pro His Thr Gly Ala Val Ser Phe
             20                  25                  30
Pro Ile Tyr Gln Ser Ala Thr Phe Arg His Pro Ala Leu Tyr Gln Thr
         35                  40                  45
Thr Gly Tyr Asp Tyr Ser Arg Leu Gln Asn Pro Thr Arg Glu Glu Leu
     50                  55                  60
Glu Asn Thr Ile Ala Asn Ile Glu Asn Gly Lys Phe Gly Phe Ala Phe
 65                  70                  75                  80
Ser Ser Gly Met Ala Ala Val Ser Thr Ile Leu Ser Leu Phe Ser Pro
                 85                  90                  95
Lys Asp His Ile Ile Val Ser Asp Asp Leu Tyr Gly Gly Thr Tyr Arg
            100                 105                 110
Leu Phe Glu Glu Ile Tyr Lys Lys Tyr Gly Leu Glu Phe Ser Tyr Val
        115                 120                 125
Asn Thr Ser Arg Ile Gln Asp Ile Glu Glu Ala Val Lys Glu Asn Thr
    130                 135                 140
Lys Ala Phe Phe Ile Glu Thr Pro Thr Asn Pro Met Met Lys Val Ala
145                 150                 155                 160
Asp Leu Lys Thr Ile Ser Arg Phe Ala Lys Asp Arg Lys Ile Leu Leu
                165                 170                 175
Ile Val Asp Asn Thr Phe Leu Thr Pro Tyr Phe Gln Arg Pro Leu Glu
            180                 185                 190
Leu Gly Ala Asp Ile Val Val His Ser Gly Thr Lys Tyr Leu Gly Gly
        195                 200                 205
His Asn Asp Thr Leu Ala Gly Leu Val Val Val Asn Asp Glu Glu Leu
    210                 215                 220
Ala Glu Arg Ile Lys Leu Ile Gln Lys Ser Glu Gly Ala Val Leu Ser
225                 230                 235                 240
Pro Phe Asp Ser Trp Leu Ile Leu Arg Gly Ile Lys Thr Leu Gly Val
                245                 250                 255
Arg Leu Glu Lys Gln Gln Glu Asn Ala Met Lys Ile Ala Lys Trp Leu
            260                 265                 270
Cys Thr His Lys Asn Val Thr Lys Val Asn Tyr Val Gly Leu Pro Asp
        275                 280                 285
His Glu Gly Tyr Glu Ile Ser Lys Ser Gln Ala Ser Gly Phe Gly Ala
    290                 295                 300
Met Ile Ser Phe Asn Val Lys Asp Val Gln Thr Val Glu Lys Val Leu
305                 310                 315                 320
Ser Lys Val Gln Leu Val Met Phe Ala Glu Ser Leu Gly Gly Val Glu
                325                 330                 335
Ser Leu Ile Thr Tyr Pro Ala Val Gln Thr His Ala Ala Ile Pro Glu
            340                 345                 350
Glu Met Arg Asn Arg Ile Gly Val Thr Asp Thr Leu Leu Arg Leu Ser
        355                 360                 365
Val Gly Ile Glu Asp Ala Asp Asp Ile Ile Ala Asp Leu Glu Gln Ala
    370                 375                 380
Leu Glu
385
<210>58
<211>378
<212>PRT
<213>热醋穆尔氏菌(Moorella thermoacetica)
<400>58
Met Arg Leu Ala Thr Glu Leu Val Gln Leu Gly Val Gly Tyr Asp Ser
  1               5                  10                  15
Lys Thr Gly Ala Ile Ser Thr Pro Ile Tyr Gln Ser Ala Thr Phe Arg
             20                  25                  30
His Pro Ala Leu Gly Gln Ser Thr Gly Phe Asp Tyr Ser Arg Thr Gly
         35                  40                  45
Asn Pro Thr Arg Gln Val Leu Glu Glu Gly Leu Ala Gly Leu Glu Gly
     50                  55                  60
Gly Cys Arg Ala Leu Ala Phe Ala Ser Gly Met Ala Ala Ile Thr Ala
 65                  70                  75                  80
Val Leu Cys Leu Phe Arg Pro Gly Asp His Leu Val Val Ser Glu Asp
                 85                  90                  95
Leu Tyr Gly Gly Thr Tyr Arg Leu Leu Asn Gln Val Ala Val Pro Leu
            100                 105                 110
Gly Leu Glu Phe Ser Leu Val Asp Thr Thr Asp Leu Ala Ala Leu Ala
        115                 120                 125
Ala Ser Ile Arg Asn Asn Thr Lys Gly Ile Phe Leu Glu Thr Pro Thr
    130                 135                 140
Asn Pro Leu Met Lys Ile Thr Asp Ile Ala Ala Val Val Ala Leu Ala
145                 150                 155                 160
Arg Gln Arg Gly Leu Leu Thr Ile Val Asp Asn Thr Phe Met Thr Pro
                165                 170                 175
Tyr Leu Gln Arg Pro Leu Glu Leu Gly Ala Asp Leu Val Val His Ser
            180                 185                 190
Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Val Met Gly Ala Ala
        195                 200                 205
Ile Ala Ala Arg Glu Asp Leu Ser Glu Arg Leu Ala Phe Ile Gln Asn
    210                 215                 220
Thr Ile Gly Ala Ile Pro Gly Pro Gln Asp Cys Trp Leu Val Ile Arg
225                  30                 235                 240
Gly Leu Lys Thr Leu Ala Val Arg Leu Glu Arg Ala Gln Ala Asn Ala
                245                 250                 255
Phe Glu Leu Ala Arg Trp Leu Ala Glu His Pro Leu Val Thr Arg Val
            260                 265                 270
Tyr Tyr Pro Gly Leu Pro His His Pro Gly His Glu Ile Cys Lys Lys
        275                 280                 285
Gln Ser Ser Gly Phe Gly Ala Met Leu Ser Phe Glu Val Lys His Ala
    290                 295                 300
Gly Leu Val Glu Gln Ile Leu Gln Arg Leu Lys Ile Ile Ser Phe Ala
305                 310                 315                 320
Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Phe Pro Glu Arg Gln
                325                 330                 335
Thr His Ala Glu Ile Pro Ala Glu Met Arg Leu Lys Leu Gly Ile Asn
            340                 345                 350
Asp Arg Leu Leu Arg Leu Ser Val Gly Leu Glu Asp Leu Asn Asp Leu
        355                 360                 365
Lys Ala Asp Leu Asp Gln Ala Leu Ala Cys
    370                 375
<210>59
<211>364
<212>PRT
<213>嗜热链球菌(Streptococcus thermophilus)
<400>59
Met Thr Gln Asp Tyr Gln Leu Glu Thr Ile Leu Ala His Ala Gly Ile
  1               5                  10                  15
Asn Ser Asp Glu Ala Thr Gly Ala Leu Ala Ser Pro Ile His Phe Ser
             20                  25                  30
Thr Thr Tyr Gln His Pro Glu Phe Gly Gln Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Ala Thr Val Glu Lys Thr Leu Ala
     50                  55                  60
Ala Ile Glu Lys Ala Asp Tyr Ala Ile Ala Thr Ser Ser Gly Met Ser
 65                  70                  75                  80
Ala Ile Val Leu Ala Phe Glu Ile Phe Pro Val Gly Ser Lys Val Val
                 85                  90                  95
Ala Ala Arg Asp Leu Tyr Gly Gly Ser Phe Arg Trp Phe Asn Asp Lys
            100                 105                 110
Glu Lys Glu Gly Arg Phe Phe Phe Glu Tyr Thr Asn Thr Glu Asp Glu
        115                 120                 125
Met Ile Ala Ala Ile Ala Glu Asp Thr Asp Ile Val Tyr Ile Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Ile Glu Phe Asp Ile Glu Lys Val Ala Gln
145                 150                 155                 160
Thr Ala His Glu Lys Gly Ala Val Val Ile Val Asp Asn Thr Phe Tyr
                165                 170                 175
Ser Pro Ile Tyr Gln Thr Pro Ile Thr Gln Gly Ala Asp Ile Val Val
            180                 185                  90
His Ser Ala Thr Lys Tyr Leu Ser Gly His Asn Asp Val Leu Ala Gly
        195                 200                 205
Val Val Val Thr Ser Asn Pro Glu Phe Tyr Asp Lys Leu Tyr Tyr Asn
    210                 215                 220
Leu Asn Thr Thr Gly Pro Asn Leu Ser Pro Phe Asp Ser Tyr Met Leu
225                 230                 235                 240
Met Arg Gly Leu Lys Thr Leu Lys Leu Arg Met Glu Ala Ser Thr Ala
                245                 250                 255
Asn Ala Lys Glu Val Val Ala Phe Leu Glu Lys Ser Pro Ala Val Lys
            260                 265                 270
Glu Val Leu Tyr Pro Gly Lys Gly Gly Met Ile Ser Phe Lys Val Ala
        275                 280                 285
Asn Gln Asp Lys Ile Pro Thr Ile Ile Asn Thr Leu Lys Val Phe Thr
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro Ala
305                 310                 315                 320
Thr Gln Thr His Ala Asp Ile Pro Ser Glu Val Arg Ala Ser Tyr Gly
                325                 330                 335
Leu Thr Asp Asp Leu Leu Arg Leu Ser Ile Gly Ile Glu Ala Ala Glu
            340                 345                  50
Asp Leu Ile Ala Asp Leu Glu Asn Ala Leu Ser Leu
        355                 360
<210>60
<211>364
<212>PRT
<213>肺炎链球菌(Streptococcus pneumoniae)
<400>60
Met Ser Lys Glu Leu His Ile Asn Thr Ile Leu Ala Gln Ala Gly Ile
  1               5                  10                  15
Lys Ser Asp Glu Ala Thr Gly Ala Leu Val Thr Pro Leu His Phe Ser
             20                  25                  30
Thr Thr Tyr Gln His Pro Glu Phe Gly Arg Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Ser Lys Ala Glu Glu Val Leu Ala
     50                  55                  60
Ala Ile Glu Ser Ala Asp Tyr Ala Leu Ala Thr Ser Ser Gly Met Ser
 65                  70                  75                  80
Ala Ile Val Leu Ala Phe Ser Val Phe Pro Val Gly Ser Lys Val Leu
                 85                  90                  95
Ala Val Arg Asp Leu Tyr Gly Gly Ser Phe Arg Trp Phe Asn Gln Val
            100                 105                 110
Glu Gln Glu Gly Arg Phe His Phe Thr Tyr Ala Asn Thr Glu Glu Glu
        115                 120                 125
Leu Ile Ala Glu Leu Glu Lys Asp Val Asp Val Leu Tyr Ile Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Leu Glu Phe Asp Ile Glu Lys Leu Ala Lys
145                 150                 155                 160
Leu Ala His Ala Lys Gly Ala Lys Val Val Val Asp Asn Thr Phe Tyr
                165                 170                 175
Ser Pro Ile Tyr Gln Arg Pro Ile Glu Asp Gly Ala Asp Ile Val Leu
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Ala Gly His Asn Asp Val Leu Ala Gly
        195                 200                 205
Val Val Val Thr Asn Ser Leu Glu Leu Tyr Glu Lys Leu Phe Tyr Asn
    210                 215                 220
Leu Asn Thr Thr Gly Ala Val Leu Ser Pro Phe Asp Ser Tyr Gln Leu
225                 230                 235                 240
Leu Arg Gly Leu Lys Thr Leu Ser Leu Arg Met Glu Arg Ser Thr Ala
                245                 250                 255
Asn Ala Gln Glu Val Val Ala Phe Leu Lys Asp Ser Pro Ala Val Lys
            260                 265                 270
Glu Val Leu Tyr Thr Gly Arg Gly Gly Met Ile Ser Phe Lys Val Ala
        275                 280                 285
Asp Glu Thr Arg Ile Pro His Ile Leu Asn Ser Leu Lys Val Phe Ser
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro Thr
305                 310                 315                 320
Thr Gln Thr His Ala Asp Ile Pro Ala Glu Val Arg His Ser Tyr Gly
                325                 330                 335
Leu Thr Asp Asp Leu Leu Arg Leu Ser Ile Gly Ile Glu Asp Ala Arg
            340                 345                 350
Asp Leu Ile Ala Asp Leu Arg Gln Ala Leu Glu Gly
        355                 360
<210>61
<211>377
<212>PRT
<213>Geobacter sulfurreducens
<400>61
Met Asn Ile Ala Thr Gln Ala Ala Gln Ile Gly Leu Asp Trp Asp Thr
  1               5                  10                  15
Arg Thr Gly Ala Val Thr Val Pro Ile Tyr Gln Thr Ala Thr Phe Arg
             20                  25                  30
His Pro Gly Leu Gly Gln Ser Thr Gly Tyr Asp Tyr Ser Arg Ser Gly
         35                  40                  45
Asn Pro Thr Arg Gln Ala Leu Glu Glu Gly Ile Ala Arg Leu Asp Gly
     50                  55                  60
Gly Ala Arg Gly Phe Ala Tyr Ala Ser Gly Met Ala Ala Ile Ala Asn
 65                  70                  75                  80
Leu Leu Leu Leu Phe Lys Ser Gly Asp His Leu Val Val Thr Glu Asp
                 85                  90                  95
Leu Tyr Gly Gly Thr Cys Arg Leu Phe Asp Gln Ile Leu Val Gln Tyr
            100                 105                 110
Gly Leu Ser Phe Thr Tyr Val Asp Thr Ser Asp Pro Glu Ala Val Arg
        115                 120                 125
Asp Ala Ile Arg Pro Glu Thr Arg Ala Leu Phe Val Glu Ser Leu Thr
    130                 135                 140
Asn Pro Leu Leu Lys Val Ala Asp Ile Ala Ala Leu Ser Thr Leu Cys
145                 150                 155                 160
Arg Glu Arg Gly Leu Leu Cys Ile Val Asp Asn Thr Phe Leu Thr Pro
                165                 170                 175
Tyr Leu Leu Arg Pro Leu Asp Leu Gly Ala Asp Ile Thr Val Tyr Ser
            180                 185                 190
Gly Thr Lys Tyr Leu Ser Gly His Asn Asp Thr Val Ser Gly Leu Val
        195                 200                 205
Val Val Lys Glu Pro Ala Leu Ala Glu Arg Val Tyr Phe Leu Gln Asn
    210                 215                 220
Ser Val Gly Ala Val Leu Gly Pro Gln Asp Ala Trp Leu Thr Ile Arg
225                 230                 235                 240
Gly Met Lys Thr Leu Ser Val Arg Leu Asp Arg Gln Gln Glu Asn Ala
                245                 250                 255
Gly Arg Ile Ala Glu Trp Leu Ala Arg His Pro Arg Val Pro Arg Val
            260                 265                 270
Phe Tyr Pro Gly Leu Pro Gly His Pro Gly His Glu Leu Leu Ala Arg
        275                 280                 285
Gln Ala Arg Gly Phe Gly Ala Met Ile Ala Phe Glu Val Asp Asp Lys
    290                 295                 300
Ala Leu Val Glu Arg Leu Leu Leu Lys Thr Glu Leu Ile Ser Phe Ala
305                 310                 315                 320
Glu Ser Leu Gly Gly Val Glu Thr Leu Ile Thr Phe Pro Gln Val Gln
                325                 330                 335
Thr His Ala Asp Ile Pro Pro Glu Val Arg Glu Arg Leu Gly Ile Asn
            340                 345                 350
Asp Val Leu Leu Arg Leu Ser Val Gly Ile Glu Asp Ala Asp Asp Leu
        355                 360                 365
Ile Ala Asp Leu Ser Arg Ala Phe Ala
    370                 375
<210>62
<211>391
<212>PRT
<213>Geobacter metallireducens
<400>62
Met Asn Ile Ala Thr Gln Thr Ala Gln Ile Gly Leu Glu Trp Asp Thr
  1               5                  10                  15
Arg Thr Gly Ala Val Thr Val Pro Ile Tyr Gln Thr Ala Thr Phe Arg
             20                  25                  30
His Pro Gly Leu Gly Gln Ser Thr Gly Tyr Asp Tyr Thr Arg Ser Gly
         35                  40                  45
Asn Pro Thr Arg Gln Ala Leu Glu Glu Gly Ile Ala Arg Leu Glu Gly
     50                  55                  60
Gly Ala Arg Gly Phe Ala Tyr Ala Ser Gly Met Ala Ala Ile Ala Asn
 65                  70                  75                  80
Leu Leu Leu Leu Phe Lys Lys Gly Asp His Leu Val Val Thr Glu Asp
                 85                  90                  95
Leu Tyr Gly Gly Thr Cys Arg Leu Phe Asp Gln Ile Phe Thr Gln Tyr
            100                 105                 110
Glu Leu Ser Phe Thr Tyr Val Asp Thr Ser Asp Ile Lys Ala Val Arg
        115                 120                 125
Ala Ala Ile Arg Pro Glu Thr Lys Ala Leu Phe Val Glu Ser Leu Thr
    130                 135                 140
Asn Pro Leu Leu Lys Val Ala Asp Ile Ala Ala Leu Ser Ala Leu Cys
145                 150                 155                 160
Arg Glu Arg Gly Leu Leu His Ile Val Asp Asn Thr Phe Leu Thr Pro
                165                 170                 175
Tyr Leu Leu Arg Pro Phe Asp His Gly Ala Asp Ile Thr Val Tyr Ser
            180                 185                 190
Ala Thr Lys Tyr Leu Ala Gly His Asn Asp Thr Val Ser Gly Leu Val
        195                 200                 205
Ala Val Lys Asp Pro Gln Leu Ala Glu Arg Val Tyr Phe Leu Gln Asn
    210                 215                 220
Ser Val Gly Ala Val Leu Gly Pro Gln Asp Ser Trp Leu Thr Ile Arg
225                 230                 235                 240
Gly Met Lys Thr Leu Ser Val Arg Leu Asp Arg Gln Gln Glu Asn Ala
                245                 250                 255
Gly Arg Val Ala Gln Trp Leu Ser Asn His Pro Arg Val Arg Lys Val
            260                 265                 270
Tyr Tyr Pro Gly Leu Ser Gly His Pro Gly His Pro Gly His Glu Leu
        275                 280                 285
Leu Ala Arg Gln Ala Arg Gly Phe Gly Ala Met Ile Ala Phe Glu Val
    290                 295                 300
Asp Glu His Ala Leu Val Glu Arg Leu Leu Leu Lys Thr Glu Val Ile
305                 310                 315                 320
Ser Phe Ala Glu Ser Leu Gly Gly Val Glu Thr Leu Ile Thr Phe Pro
                325                 330                 335
Gln Val Gln Thr His Ala Asp Ile Pro Pro Glu Leu Arg Gln Arg Leu
            340                 345                 350
Gly Ile Asn Asp Val Leu Leu Arg Leu Ser Val Gly Ile Glu Asp Ala
        355                 360                 365
Asp Asp Leu Ile Asp Asp Leu Ala Gln Ala Phe Glu Gly Gly Asp Gln
    370                 375                 380
Gly Ser Gly Thr Gly Asp Arg
385                 390
<210>63
<211>364
<212>PRT
<213>肺炎链球菌
<400>63
Met Ser Lys Glu Leu His Ile Asn Thr Ile Leu Ala Gln Ala Gly Ile
  1               5                  10                  15
Lys Ser Asp Glu Ala Thr Gly Ala Leu Val Thr Pro Leu His Phe Ser
             20                  25                  30
Thr Thr Tyr Gln His Pro Glu Phe Gly Arg Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Ser Lys Ala Glu Glu Val Leu Ala
     50                  55                  60
Ala Ile Glu Ser Ala Asp Tyr Ala Leu Ala Thr Ser Ser Gly Met Ser
 65                  70                  75                  80
Ala Ile Val Leu Ala Phe Ser Val Phe Pro Val Gly Ser Lys Val Leu
                 85                  90                  95
Ala Val Arg Asp Leu Tyr Gly Gly Ser Phe Arg Trp Phe Asn Gln Val
            100                 105                 110
Glu Gln Glu Gly His Phe His Phe Thr Tyr Ala Asn Thr Glu Glu Glu
        115                 120                 125
Leu Ile Ala Glu Leu Glu Lys Asp Val Asp Val Leu Tyr Ile Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Leu Glu Phe Asp Ile Glu Lys Leu Ala Lys
145                 150                 155                 160
Leu Ala His Ala Lys Gly Ala Lys Val Val Val Asp Asn Thr Phe Tyr
                165                 170                 175
Ser Pro Ile Tyr Gln Arg Pro Ile Glu Asp Gly Ala Asp Ile Val Leu
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Ala Gly His Asn Asp Val Leu Ala Gly
        195                 200                 205
Val Val Val Thr Asn Ser Leu Glu Leu Tyr Glu Lys Leu Phe Tyr Asn
    210                 215                 220
Leu Asn Thr Thr Gly Ala Val Leu Ser Pro Phe Asp Ser Tyr Gln Leu
225                 230                 235                 240
Leu Arg Gly Leu Lys Thr Leu Ser Leu Arg Met Glu Arg Ser Thr Ala
                245                 250                 255
Asn Ala Gln Glu Val Val Ala Phe Leu Lys Asp Ser Pro Ala Val Lys
            260                 265                 270
Glu Val Leu Tyr Thr Gly Arg Gly Gly Met Ile Ser Phe Lys Val Ala
        275                 280                 285
Asp Glu Thr Arg Ile Pro His Ile Leu Asn Ser Leu Lys Val Phe Ser
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro Thr
305                 310                 315                 320
Thr Gln Thr His Ala Asp Ile Pro Ala Glu Val Arg His Ser Tyr Gly
                325                 330                 335
Leu Thr Asp Asp Leu Leu Arg Leu Ser Ile Gly Ile Glu Asp Ala Arg
            340                 345                 350
Asp Leu Ile Ala Asp Leu Arg Gln Ala Ile Glu Gly
        355                 360
<210>64
<211>364
<212>PRT
<213>咽峡炎链球菌(Streptococcus anginosus)
<400>64
Met Asp Lys Lys Leu Gln Leu Asp Thr Ile Leu Ala His Ala Gly Ile
  1               5                  10                  15
Lys Thr Asp Glu Ala Thr Gly Ala Leu Thr Thr Pro Leu His Phe Ser
             20                  25                  30
Thr Thr Tyr Gln His Pro Glu Phe Gly Lys Ser Thr Gly Tyr Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Ser Ser Leu Glu Lys Thr Leu Ala
     50                  55                  60
Ala Ile Glu His Ala Asp Tyr Ala Leu Ala Thr Ser Ser Gly Met Ser
 65                  70                  75                  80
Ala Ile Val Leu Ala Phe Ser Val Phe Pro Ile Gly Ser Arg Val Ile
                 85                  90                  95
Ala Val Arg Asp Leu Tyr Gly Gly Ser Phe Arg Trp Phe His Gln Val
            100                 105                 110
Glu Gln Glu Gly Arg Phe His Phe Thr Tyr Ala Asn Thr Glu Glu Glu
        115                 120                 125
Leu Leu Ala Ala Leu Thr Glu Asp Ile Asp Val Val Tyr Leu Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Leu Glu Phe Asp Val Ala Phe Ile Ala Glu
145                 150                 155                 160
Lys Ala His Ala Lys Gly Ala Lys Val Ile Val Asp Asn Thr Phe Tyr
                165                 170                 175
Thr Pro Ile Tyr Gln Arg Pro Leu Glu Asn Gly Ala Asp Leu Val Leu
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Gly Gly His Asn Asp Val Leu Ala Gly
        195                 200                 205
Ala Leu Met Thr Ser Asp Lys Glu Leu Tyr Glu Asn Leu Phe Tyr Asn
    210                 215                 220
Leu Asn Thr Thr Gly Ala Val Leu Ser Pro Phe Asp Ser Tyr Leu Leu
225                 230                 235                 240
Leu Arg Gly Leu Lys Thr Leu Ser Leu Arg Met Glu Arg Ser Thr Lys
                245                 250                 255
Asn Ala Gln Ala Val Ala Ala Phe Leu Lys Asp Ser Pro Ala Val Lys
            260                 265                 270
Glu Val Leu Tyr Pro Gly Lys Gly Gly Met Ile Ser Phe Lys Val Lys
        275                 280                 285
Asp Glu Ala Val Ile Pro His Leu Leu Asn Thr Leu Lys Val Phe Thr
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro Ala
305                 310                 315                 320
Thr Gln Thr His Ala Asp Ile Pro Ala Glu Val Arg Lys Ser Tyr Gly
                325                 330                 335
Leu Thr Asp Asp Leu Leu Arg Leu Ser Ile Gly Ile Glu Asp Ser Gln
            340                 345                 350
Asp Leu Ile Thr Asp Leu Lys Phe Ala Leu Glu Val
        355                 360
<210>65
<211>364
<212>PRT
<213>变异链球菌(Streptococcus mutans)
<400>65
Met Thr Glu Asp Tyr Lys Leu Asp Thr Ile Leu Ala His Ala Gly Ile
  1               5                  10                  15
Asn Thr Asp Lys Thr Thr Gly Ala Leu Thr Ala Pro Ile His Leu Ser
             20                  25                  30
Thr Thr Tyr Gln His Pro Gln Phe Gly Gln Ser Thr Gly Phe Asp Tyr
         35                  40                  45
Thr Arg Thr Lys Asn Pro Thr Arg Thr Val Leu Glu Glu Thr Leu Ala
     50                  55                  60
Lys Ile Glu Lys Ala Lys Tyr Ala Leu Val Thr Ser Ser Gly Met Ala
 65                  70                  75                  80
Ala Leu Val Leu Leu Phe Thr Gly Phe Pro Ile Gly Ser Lys Val Val
                 85                  90                  95
Ala Ala Arg Asp Leu Tyr Gly Gly Ser Phe Arg Trp Phe Asn Glu Gln
            100                 105                 110
Glu Lys Ala Gly Arg Phe Ser Phe Val Tyr Thr Asn Thr Glu Thr Asp
        115                 120                 125
Met Ile Ala Ala Ile Ser Asp Glu Thr Asp Tyr Val Phe Ile Glu Thr
    130                 135                 140
Pro Thr Asn Pro Leu Met Ile Glu Phe Asp Ile Ser Lys Val Ala Gln
145                 150                 155                 160
Ala Ala His Lys His Gly Ala Lys Val Ile Val Asp Asn Thr Phe Tyr
                165                 170                 175
Ser Pro Ile Tyr Gln Asn Pro Leu Val Leu Gly Ala Asp Val Val Leu
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Ser Gly His Asn Asp Val Leu Ala Gly
        195                 200                 205
Val Leu Met Thr Ser Asp Gln Glu Ile Tyr Asp Lys Leu Phe Tyr Asp
    210                 215                 220
Gln Asn Thr Thr Gly Pro Thr Leu Ser Pro Leu Asp Thr Tyr Leu Leu
225                 230                 235                 240
Met Arg Gly Leu Lys Thr Leu Lys Leu Arg Met Glu Lys Ala Thr Gln
                245                 250                 255
Asn Ala Lys Thr Val Val Ala Tyr Leu Glu Lys Ser Pro Ala Val Lys
            260                 265                 270
Glu Val Leu Tyr Thr Gly Lys Gly Gly Met Ile Ser Phe Lys Val Val
        275                 280                 285
Asp Glu Lys Lys Ile Pro Gln Ile Leu Asn His Leu Gln Leu Phe Thr
    290                 295                 300
Phe Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro Ala
305                 310                 315                 320
Thr Gln Thr His Leu Asp Ile Pro Glu Glu Val Arg His Ser Tyr Gly
                325                 330                 335
Leu Thr Asp Asp Leu Leu Arg Leu Ser Ile Gly Ile Glu Asp Ala Glu
            340                 345                 350
Asp Leu Ile Asp Asp Leu Lys Ala Ala Leu Glu Ala
        355                 360
<210>66
<211>380
<212>PRT
<213>地衣芽孢杆菌
<400>66
Met Lys Pro Lys Thr Lys Met Ile His Gly Gly Ile Thr Gly Asp Glu
  1               5                  10                  15
Lys Thr Gly Ala Val Ser Val Pro Ile Tyr Gln Val Ser Thr Tyr Lys
             20                  25                  30
Gln Pro Arg Ala Gly Gln His Thr Gly Tyr Glu Tyr Ser Arg Thr Gly
         35                  40                  45
Asn Pro Thr Arg Thr Ala Leu Glu Ser Leu Ile Ala Asp Val Glu Gly
     50                  55                  60
Gly Ala Ala Gly Tyr Ala Phe Gly Ser Gly Met Ala Ala Ile Thr Ala
 65                  70                  75                  80
Val Met Met Leu Phe Lys Ser Gly Asp His Ile Val Leu Thr Asp Asp
                 85                  90                  95
Val Tyr Gly Gly Thr Tyr Arg Val Met Thr Lys Val Leu Asn Arg Ile
            100                 105                 110
Gly Ile Glu Ala Thr Phe Ser Asp Thr Ser Ser Ile Glu Asp Ile Glu
        115                 120                 125
Lys Ala Ile Lys Pro Asn Thr Lys Ala Ile Tyr Val Glu Thr Pro Thr
    130                 135                 140
Asn Pro Leu Leu Lys Ile Thr Asp Ile Lys Lys Thr Ala Glu Thr Ala
145                 150                 155                 160
Lys Lys His Asp Leu Leu Leu Ile Val Asp Asn Thr Phe Tyr Thr Pro
                165                 170                 175
Tyr Phe Gln Asn Pro Ile Ser Leu Gly Ala Asp Ile Val Leu His Ser
            180                 185                 190
Ala Thr Lys Tyr Leu Gly Gly His Ser Asp Val Val Gly Gly Leu Val
        195                 200                 205
Val Ala Ala Ser Lys Glu Leu Ala Glu Glu Ile His Phe Ile Gln Asn
    210                 215                 220
Ser Thr Gly Gly Ile Leu Gly Pro Gln Asp Ser Trp Leu Leu Met Arg
225                 230                 235                 240
Gly Met Lys Thr Leu Gly Leu Arg Met Glu Ala His Glu Gln Asn Ala
                245                 250                 255
Arg Lys Ile Ala Ala Phe Leu Asp Asp His Pro Ala Val Lys Lys Val
            260                 265                 270
Tyr Tyr Pro Gly Leu Pro Ser Hi s Pro Gly His Glu Leu Ala Lys Arg
        275                 280                 285
Gln Ser Thr Gly Phe Gly Gly Met Ile Ser Phe Asp Ile Gly Lys Glu
    290                 295                 300
Glu Asn Val Asp Leu Val Leu Gly Arg Leu Lys Trp Phe Thr Ile Ala
305                 310                 315                 320
Glu Ser Leu Gly Ala Val Glu Ser Leu Ile Ser Val Pro Ala Arg Met
                325                 330                 335
Thr His Ala Ser Ile Pro Pro Glu Arg Arg Leu Glu Leu Gly Ile Thr
            340                 345                 350
Asp Gly Leu Ile Arg Ile Ser Ala Gly Val Glu Asp Ile Asp Asp Leu
        355                 360                 365
Leu Glu Asp Leu Gln Gln Ala Leu Ala Pro Leu Ser
    370                 375                 380
<210>67
<211>362
<212>PRT
<213>乳乳球菌(Lactococcus lactis)
<400>67
Met Asp Lys Arg Leu Asp Thr Leu Leu Ala Gln Val Gly Ile His Gln
  1               5                  10                  15
Asp Glu Ala Thr Gly Ala Leu Val Ser Pro Leu His Phe Ser Thr Thr
             20                  25                  30
Tyr Gln His Pro Glu Phe Gly Gln Ser Thr Gly Phe Asp Tyr Thr Arg
         35                  40                  45
Thr Lys Asn Pro Thr Arg Ala Thr Leu Glu Glu Ala Leu Ala Ser Ile
     50                  55                  60
Glu Ser Gly Gln Phe Ala Leu Ala Thr Ser Ser Gly Met Ala Ala Ile
 65                  70                  75                  80
Val Leu Ala Phe Ser Val Phe Pro Ile Gly Ser Lys Ile Val Ala Ser
                 85                  90                  95
Arg Asp Leu Tyr Gly Gly Ser Phe Arg Trp Phe Asp Glu Gln Glu Lys
            100                 105                 110
Glu Gly Arg Phe Tyr Phe Ser Tyr Ala Lys Thr Glu Lys Glu Met Leu
        115                 120                 125
Glu Leu Ile Asp Glu Asn Thr Asp Ile Val Tyr Ile Glu Thr Pro Thr
    130                 135                 140
Asn Pro Met Met Val Lys Tyr Asn Ile Glu Lys Ile Ala Asn Lys Ala
145                 150                 155                 160
Gln Ala Tyr His Ala Lys Val Ile Val Val Asn Thr Phe Tyr Thr Pro
                165                 170                 175
Ile Tyr Gln Lys Pro Leu Glu Leu Gly Ala Asp Leu Val Ile His Ser
            180                 185                 190
Ala Thr Lys Tyr Leu Ser Gly His Asn Asp Val Leu Ala Gly Ala Val
        195                 200                 205
Ile Val Tyr Asp Glu Glu Leu Tyr Glu Arg Leu Leu Tyr Gln Leu Asn
    210                 215                 220
Thr Thr Gly Ala Val Leu Ser Pro Phe Asp Ser Tyr Leu Val Met Arg
225                 230                 235                 240
Gly Leu Lys Thr Leu Ser Leu Arg Met Glu Arg Ala Thr Lys Asn Ala
                245                 250                 255
Gln Lys Ile Val Thr Phe Leu Lys Lys Leu Pro Ser Val Lys Glu Val
            260                 265                 270
Leu Tyr Ser Gly Leu Gly Gly Met Ile Ser Leu Lys Val Thr Asp Lys
        275                 280                 285
Thr Lys Ile Pro Ala Ile Leu Asn His Leu Gly Val Phe Thr Phe Ala
    290                 295                 300
Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro Thr Ala Gln
305                 310                 315                 320
Thr His His Asp Ile Pro Leu Glu Ile Arg Glu Ser Tyr Gly Leu Thr
                325                 330                 335
Asp Asp Leu Leu Arg Leu Ser Ile Gly Ile Glu Asp Val Arg Asp Leu
            340                 345                 350
Ile Glu Asp Leu Lys Glu Ala Leu Glu Asn
        355                 360
<210>68
<211>367
<212>PRT
<213>金黄色葡萄球菌(Staphylococcus aureus)
<400>68
Met Lys Asp Thr Gln Leu Ala Gln Ile Thr Leu Thr Asp Asp Ser Thr
  1               5                  10                  15
Gly Ala Ile Ala Asn Pro Ile His Leu Ser Thr Ala Tyr Lys His Pro
             20                  25                  30
Lys Leu Gly Gln Ser Thr Gly Phe Asp Tyr Thr Arg Thr Lys Asn Pro
         35                  40                  45
Thr Arg Ser Thr Phe Glu Thr Cys Phe Ala Lys Leu Glu His Gly Ile
     50                  55                  60
Ala Ser Phe Ala Thr Ser Ser Gly Met Ser Ala Ile Gln Leu Ile Cys
 65                  70                  75                  80
Asn Leu Phe Lys Pro His Asp Glu Ile Leu Val Ser Phe Asp Leu Tyr
                 85                  90                  95
Gly Gly Thr Phe Arg Leu Phe Glu Phe Tyr Glu Gln Gln Tyr Asn Ile
            100                 105                 110
Lys Phe Lys Tyr Val Asp Phe Thr Asp Tyr Glu Gln Val Glu Lys Glu
        115                 120                 125
Ile Thr Asp Lys Thr Val Ala Leu Phe Ile Glu Pro Ile Ser Asn Pro
    130                 135                 140
Gln Met Ile Ala Ile Asp Val Lys Pro Tyr Tyr Gln Leu Cys Lys Ala
145                 150                 155                 160
Lys Gly Leu Leu Ser Ile Ile Asp Asn Thr Phe Leu Thr Pro Tyr Leu
                165                 170                 175
Ser Thr Pro Leu Ala Glu Gly Ala Asp Ile Val Leu His Ser Ala Thr
            180                 185                 190
Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Val Val Thr Val
        195                 200                 205
Lys Asp Glu Ser Leu Ala Gln Gln Leu Phe Asp Phe His Asn Met Thr
    210                 215                 220
Gly Ala Thr Leu Ser Pro Ile Asp Ser Tyr Leu Leu Leu Arg Gly Leu
225                 230                 235                 240
Lys Thr Leu His Leu Arg Ile Glu Arg Ala Gln Ser Asn Ala Arg Lys
                245                 250                 255
Leu Ala Lys Lys Cys Gln Ser Leu Gln Ala Ile Asp Glu Val Leu Tyr
            260                 265                 270
Ser Gly Gln Thr Gly Met Leu Ser Leu Arg Leu Asn Lys Ala Tyr Ser
        275                 280                 285
Val Ala Lys Leu Leu Glu Asn Leu Asp Ile Cys Ile Phe Ala Glu Ser
    290                 295                 300
Leu Gly Gly Thr Glu Thr Leu Val Thr Phe Pro Tyr Thr Gln Thr His
305                 310                 315                 320
Val Asp Met Pro Asp Ala Glu Lys Asp Lys Arg Gly Ile Asp Glu Tyr
                325                 330                 335
Leu Ile Arg Leu Ser Leu Gly Val Glu Asn Tyr Glu Asp Ile Glu Arg
            340                 345                 350
Asp Ile Ile Gln Ala Leu Asp Lys Ala Gln Ile Gly Glu Ile Val
        355                 360                 365
<210>69
<211>367
<212>PRT
<213>金黄色葡萄球菌
<400>69
Met Lys Asp Thr Gln Leu Ala Gln Ile Thr Leu Thr Asp Asp Ser Thr
  1               5                  10                  15
Gly Ala Ile Ala Asn Pro Ile His Leu Ser Thr Ala Tyr Lys His Pro
             20                  25                  30
Lys Leu Gly Gln Ser Thr Gly Phe Asp Tyr Thr Arg Thr Lys Asn Pro
         35                  40                  45
Thr Arg Ser Thr Phe Glu Thr Cys Phe Ala Lys Leu Glu His Gly Ile
     50                  55                  60
Ala Ser Phe Ala Thr Ser Ser Gly Met Ser Ala Ile Gln Leu Ile Cys
 65                  70                  75                  80
Asn Leu Phe Lys Pro His Asp Glu Ile Leu Val Ser Phe Asp Leu Tyr
                 85                  90                  95
Gly Gly Thr Phe Arg Leu Phe Glu Phe Tyr Glu Gln Gln Tyr Asp Ile
            100                 105                 110
Lys Phe Lys Tyr Val Asp Phe Thr Asp Tyr Glu Gln Val Glu Lys Glu
        115                 120                 125
Ile Thr Asp Lys Thr Val Ala Leu Phe Ile Glu Pro Ile Ser Asn Pro
    130                 135                 140
Gln Met Ile Ala Ile Asp Val Lys Pro Tyr Tyr Gln Leu Cys Lys Ala
145                 150                 155                 160
Lys Gly Leu Leu Ser Ile Ile Asp Asn Thr Phe Leu Thr Pro Tyr Leu
                165                 170                 175
Ser Thr Pro Leu Ala Glu Gly Ala Asp Ile Val Leu His Ser Ala Thr
            180                 185                 190
Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Val Val Thr Val
        195                 200                 205
Lys Asp Glu Ser Leu Ala Gln Gln Leu Phe Asp Phe His Asn Met Thr
    210                 215                 220
Gly Ala Thr Leu Ser Pro Ile Asp Ser Tyr Leu Leu Leu Arg Gly Leu
225                 230                 235                 240
Lys Thr Leu His Leu Arg Ile Glu Arg Ala Gln Ser Asn Ala Arg Lys
                245                 250                 255
Leu Ala Lys Lys Cys Gln Ser Leu Gln Ala Ile Asp Glu Val Leu Tyr
            260                 265                 270
Ser Gly Gln Thr Gly Met Leu Ser Leu Arg Leu Asn Lys Ala Tyr Ser
        275                 280                 285
Val Ala Lys Leu Leu Glu Asn Leu Asp Ile Cys Ile Phe Ala Glu Ser
    290                 295                 300
Leu Gly Gly Thr Glu Thr Leu Val Thr Phe Pro Tyr Thr Gln Thr His
305                 310                 315                 320
Val Asp Met Pro Asp Ala Glu Lys Asp Lys Arg Gly Ile Asp Glu Tyr
                325                 330                 335
Leu Ile Arg Leu Ser Leu Gly Val Glu Asn Tyr Glu Asp Ile Glu Arg
            340                 345                 350
Asp Ile Ile Gln Ala Leu Asp Lys Ala Gln Ile Gly Glu Ile Val
        355                 360                 365
<210>70
<211>367
<212>PRT
<213>金黄色葡萄球菌
<400>70
Met Lys Asp Thr Gln Leu Ala Gln Ile Thr Leu Thr Asp Asp Ser Thr
  1               5                  10                  15
Gly Ala Ile Ala Asn Pro Ile His Leu Ser Thr Ala Tyr Lys His Pro
             20                  25                  30
Lys Leu Gly Gln Ser Thr Gly Phe Asp Tyr Thr Arg Thr Lys Asn Pro
         35                  40                  45
Thr Arg Ser Thr Phe Glu Thr Cys Phe Ala Lys Leu Glu His Gly Ile
     50                  55                  60
Ala Ser Phe Ala Thr Ser Ser Gly Met Ser Ala Ile Gln Leu Ile Cys
 65                  70                  75                  80
Asn Leu Phe Lys Pro His Asp Glu Ile Leu Val Ser Phe Asp Leu Tyr
                 85                  90                  95
Gly Gly Thr Phe Arg Leu Phe Glu Phe Tyr Glu Gln Gln Tyr Asp Ile
            100                 105                 110
Lys Phe Lys Tyr Val Asp Phe Thr Asp Tyr Glu Gln Val Glu Lys Glu
        115                 120                 125
Ile Thr Asp Lys Thr Val Ala Leu Phe Ile Glu Pro Ile Ser Asn Pro
    130                 135                 140
Gln Met Ile Ala Ile Asp Val Lys Pro Tyr Tyr Gln Leu Cys Lys Ala
145                 150                 155                 160
Lys Gly Leu Leu Ser Ile Ile Asp Asn Thr Phe Leu Thr Pro Tyr Leu
                165                 170                 175
Ser Thr Pro Leu Ala Glu Gly Ala Asp Ile Val Leu His Ser Ala Thr
            180                 185                 190
Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Val Val Thr Val
        195                 200                 205
Lys Asp Glu Ser Leu Ala Gln Lys Leu Phe Asp Phe His Asn Met Thr
    210                 215                 220
Gly Ala Thr Leu Ser Pro Ile Asp Ser Tyr Leu Leu Leu Arg Gly Leu
225                 230                 235                 240
Lys Thr Leu His Leu Arg Ile Glu Arg Ala Gln Ser Asn Ala Arg Lys
                245                 250                 255
Leu Ala Glu Lys Cys Gln Ser Leu Gln Ala Ile Asp Glu Val Leu Tyr
            260                 265                 270
Ser Gly Gln Thr Gly Met Leu Ser Leu Arg Leu Asn Lys Ala Tyr Ser
        275                 280                 285
Val Ala Lys Leu Leu Glu Asn Leu Asp Ile Cys Ile Phe Ala Glu Ser
    290                 295                 300
Leu Gly Gly Thr Glu Thr Leu Val Thr Phe Pro Tyr Thr Gln Thr His
305                 310                 315                 320
Val Asp Met Pro Asp Ala Glu Lys Asp Lys Arg Gly Ile Asp Glu Tyr
                325                 330                 335
Leu Ile Arg Leu Ser Leu Gly Val Glu Asn Tyr Glu Asp Ile Glu Arg
            340                 345                 350
Asp Ile Ile Gln Ala Leu Asp Lys Ala Gln Ile Gly Glu Ile Val
        355                 360                 365
<210>71
<211>383
<212>PRT
<213>Helicobacter hepaticus
<400>71
Met Lys Ser Thr Leu Asp Thr Leu Leu Ile His Gly Gly Ala Thr Thr
  1               5                  10                  15
Asp Pro Arg Thr Gly Ala Val Asn Ile Pro Ile Tyr Gln Thr Ser Thr
             20                  25                  30
Tyr Ala Gln Ser Ala Leu Gly Glu His Leu Gly Tyr Glu Tyr Ser Arg
         35                  40                  45
Thr Lys Asn Pro Thr Arg Asp Gly Ile Glu Ser Leu Ile Ala Gln Cys
     50                  55                  60
Glu Gly Gly Lys Phe Gly Phe Ala Phe Ala Ser Gly Met Ala Ala Ile
 65                  70                  75                  80
Gly Thr Ile Leu Ser Leu Phe Gln Ser Gly Asp Cys Ile Ile Ile Ser
                 85                  90                  95
Asn Asn Val Tyr Gly Gly Thr Phe Arg Ile Leu Asp Lys Val Phe Ser
            100                 105                 110
His Phe Asn Ile Ser Tyr Lys Ile Val Asp Thr Arg Asp Leu Lys Ala
        115                 120                 125
Leu Glu Ser Ala Ile Thr Pro Glu Val Lys Ala Val Leu Ile Glu Thr
    130                 135                 140
Pro Ala Asn Pro Leu Leu Ser Val Thr Pro Leu Glu Gln Val Ala Ile
145                 150                 155                 160
Leu Ala Lys Lys Lys Gly Ile Leu Ser Ile Val Asp Asn Thr Phe Met
                165                 170                 175
Thr Pro Tyr Leu Gln Lys Pro Leu Glu Leu Gly Ile Asp Ile Val Met
            180                 185                 190
His Ser Ala Thr Lys Tyr Leu Gly Gly His Ser Asp Leu Ile Ala Gly
        195                 200                 205
Leu Val Val Val Asn Asp Ser Ala Leu Ala Glu Arg Ile Gly Phe Leu
    210                 215                 220
Gln Asn Ser Ile Gly Gly Val Leu Ala Pro Phe Asp Ser Phe Leu Leu
225                 230                 235                 240
Ile Arg Gly Met Lys Thr Leu Gly Val Arg Leu Gln Arg His Cys Glu
                245                 250                 255
Asn Ala Leu Phe Leu Ala Gln Ala Leu Ser Glu His Ser Gly Val Glu
            260                 265                 270
Lys Val Tyr Tyr Pro Gly Leu Lys Ser Asp Glu Gly Tyr Gln Ile Gln
        275                 280                 285
Asn Ser Gln Ala Arg Ser Gly Gly Gly Met Leu Ser Phe Glu Leu Lys
    290                 295                 300
Lys Asn Tyr Asp Tyr Arg Ile Phe Phe Lys Ser Thr Gln Thr Ile Val
305                 310                 315                 320
Leu Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Leu Cys His Pro Ala
                325                 330                 335
Ser Met Thr His Ala Ser Ile Pro Lys Asp Val Arg Glu Arg Met Gly
            340                 345                 350
Ile Ser Glu His Leu Ile Arg Leu Ser Val Gly Ile Glu Tyr Ala Gln
        355                 360                 365
Asp Leu Leu Asp Asp Leu Asn Gln Ala Ile Lys Lys Ala Lys Val
    370                 375                 380
<210>72
<211>381
<212>PRT
<213>屎肠球菌(Enterococcus faecium)
<400>72
Met His Ile Gln Thr Lys Leu Ile His Gly Gly Ile Ser Glu Asp Pro
  1               5                  10                  15
Thr Thr Gly Ala Val Ser Val Pro Ile Tyr Gln Thr Ser Thr Tyr Arg
             20                  25                  30
Gln Asp Gly Val Gly Gln Pro Lys Gln Tyr Glu Tyr Ser Arg Ser Gly
         35                  40                  45
Asn Pro Thr Arg Phe Ala Leu Glu Glu Leu Ile Ala Asp Leu Glu Gly
     50                  55                  60
Gly Val Arg Gly Phe Ala Phe Ser Ser Gly Leu Ser Gly Ile His Ala
 65                  70                  75                  80
Val Phe Ser Leu Phe Gln Ala Gly Asp His Ile Leu Leu Gly Asp Asp
                 85                  90                  95
Val Tyr Gly Gly Thr Phe Arg Leu Phe Asp Lys Val Leu Thr Lys Asn
            100                 105                 110
Gly Leu Glu Tyr Thr Ile Ile Asp Thr Ser Asn Leu Asp Lys Ile Glu
        115                 120                 125
Gln Ser Ile Lys Pro Asn Thr Lys Ala Leu Tyr Leu Glu Thr Pro Ser
    130                 135                 140
Asn Pro Leu Leu Lys Ile Thr Asp Leu Glu Lys Ser Ala Thr Leu Ala
145                 150                 155                 160
His Gln His Gly Leu Ile Val Ile Ala Asp Asn Thr Phe Ala Thr Pro
                165                 170                 175
Tyr Phe Gln Arg Pro Leu Asp Leu Gly Ser Asp Ile Val Val His Ser
            180                 185                 190
Gly Thr Lys Tyr Leu Gly Gly His Ser Asp Val Val Ala Gly Leu Val
        195                 200                 205
Thr Ser Asn His Lys Asp Leu Ala Asp Gln Ile Gly Phe Tyr Gln Asn
    210                 215                 220
Ala Ile Gly Ala Val Leu Gly Pro Gln Asp Ser Trp Leu Leu Gln Arg
225                 230                 235                 240
Gly Ile Lys Thr Leu Ser Val Arg Met Glu Glu His Gln Lys Asn Ala
                245                 250                 255
Phe Val Val Ala Asp Phe Leu Phe Ser His Pro Ala Val Glu Lys Val
            260                 265                 270
Tyr Tyr Pro Gly Leu Pro Asp His Glu Leu His Gly Val Ala Lys Gln
        275                 280                 285
Gln Met Ser Gly Phe Ser Gly Met Ile Ser Phe Thr Leu Lys Asn Glu
    290                 295                 300
Glu Ser Ala Ile Pro Phe Val Glu Ser Leu Gln Leu Phe Thr Leu Ala
305                 310                 315                 320
Glu Ser Leu Gly Gly Val Glu Ser Leu Val Glu Ile Pro Ser Val Met
                325                 330                 335
Thr His Ala Ser Ile Pro Lys Glu Lys Arg Glu Glu Ala Gly Ile Lys
            340                 345                 350
Asp Gly Leu Ile Arg Leu Ser Val Gly Ile Glu Tyr Gly Gln Asp Leu
        355                 360                 365
Ile Asn Asp Leu Ala Gln Ala Phe Asp Arg Ile Lys Asn
    370                 375                 380
<210>73
<211>378
<212>PRT
<213>多变鱼腥藻(Anabaena variabilis)
<400>73
Met Glu Phe Glu Thr Lys Ala Ile His Glu Gly Gln Gln Ser Asp Pro
  1               5                  10                  15
Gln Thr Gly Ala Val Ile Val Pro Ile Tyr Leu Thr Ser Thr Tyr Gln
             20                  25                  30
Gln Glu Ala Ile Gly Gln His Lys Gly Tyr Glu Tyr Ser Arg Thr Gly
         35                  40                  45
Asn Pro Thr Arg Asn Ala Leu Glu Glu Ala Leu Ala Ala Ile Glu Asn
     50                  55                  60
Gly Glu Tyr Gly Leu Ala Phe Ala Ser Gly Leu Ala Ala Thr Thr Thr
 65                  70                  75                  80
Val Leu Ser Leu Leu Lys Ser Cys Asp His Ile Val Ala Gly Asp Asp
                 85                  90                  95
Leu Tyr Gly Gly Thr Tyr Arg Leu Leu Glu Arg Val Val Lys Asn Trp
            100                 105                 110
Gly Val Thr Thr Thr Tyr Val Asp Ile Asp Asp Ile Ser Asn Phe Ala
        115                 120                 125
Lys Ala Ile Gln Pro Asn Thr Lys Leu Ile Trp Val Glu Thr Pro Thr
    130                 135                 140
Asn Pro Leu Leu Lys Ile Ile Asp Ile Ala Ala Leu Ala Asn Ile Ala
145                 150                 155                 160
Glu Gln Asn Asn Leu Ile Leu Val Val Asp Asn Thr Phe Ala Ser Pro
                165                 170                 175
Tyr Phe Gln Arg Pro Leu Asp Asn Gly Ala Asp Ile Val Val His Ser
            180                 185                 190
Thr Thr Lys Tyr Leu Gly Gly His Ser Asp Ile Ile Gly Gly Ala Val
        195                 200                 205
Val Thr Ser Asn Glu Gln Leu Tyr Thr Glu Leu Lys Phe Tyr Gln Asn
    210                 215                 220
Ala Ile Gly Ala Val Pro Ser Pro Phe Asp Ser Trp Leu Val Leu Arg
225                 230                 235                 240
Gly Ile Lys Thr Leu Ala Val Arg Met Arg Glu His Glu Lys Asn Ala
                245                 250                 255
Leu Leu Leu Ala Gln Phe Leu Glu Gln His Pro Lys Val Glu Arg Val
            260                 265                 270
Tyr Tyr Pro Gly Leu Pro Ser His Glu Gln His Gln Leu Ala Lys Ser
        275                 280                 285
Gln Met Ser Gly Phe Gly Gly Met Ile Ser Leu Glu Leu Lys Gly Asp
    290                 295                 300
Phe Ala Asp Val Glu Lys Phe Ala Ser Arg Leu Gln Leu Phe Leu Leu
305                 310                 315                 320
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Leu Cys Tyr Pro Ala Lys
                325                 330                 335
Met Thr His Gly Ser Leu Pro Gln Glu Glu Arg Tyr Lys Arg Gly Ile
            340                 345                 350
Asn Asp Asn Leu Val Arg Leu Ser Val Gly Ile Glu Asn Val Leu Asp
        355                 360                 365
Leu Gln Ala Asp Leu Glu Asn Ala Leu Ser
    370                 375
<210>74
<211>363
<212>PRT
<213>猪链球菌(Streptococcus suis)
<400>74
Met Thr Asp Tyr Lys Ile Asp Thr Ile Leu Ala His Thr Gly Ile Asn
  1               5                  10                  15
Ser Asp Glu Arg Thr Gly Ala Leu Ile Ser Pro Ile His Leu Ser Thr
             20                  25                  30
Thr Tyr Gln His Pro Glu Phe Gly Gln Ser Thr Gly Tyr Asp Tyr Thr
         35                  40                  45
Arg Thr Lys Asn Pro Thr Arg Ala Ser Leu Glu Thr Thr Leu Ala Ala
     50                  55                  60
Ile Glu Lys Ala Asp Tyr Ala Leu Ala Thr Ser Ser Gly Met Ala Ala
 65                  70                  75                  80
Leu Val Leu Leu Phe Asn Gly Phe Pro Val Gly Ser Gln Val Val Ala
                 85                  90                  95
Ala Arg Asp Leu Tyr Gly Gly Ser Phe Arg Trp Phe Asn Glu Gln Glu
            100                 105                 110
Ser Ile Gly Arg Phe Gln Phe Thr Tyr Ala Asn Thr Glu Glu Glu Leu
        115                 120                 125
Ile Ala Ala Ile Thr Glu Glu Thr Asp Tyr Val Tyr Leu Glu Thr Pro
    130                 135                 140
Thr Asn Pro Leu Met Val Glu Phe Asp Ile Ala Lys Val Ser Ala Ile
145                 150                 155                 160
Ala His Ala Lys Gly Ala Lys Val Ile Val Asp Asn Thr Phe Tyr Ser
                165                 170                 175
Pro Ile Tyr Gln Asn Pro Leu Val Leu Gly Ala Asp Val Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Ser Gly His Asn Asp Val Leu Ala Gly Ala
        195                 200                 205
Leu Met Thr Asn Asp Gln Asp Leu Tyr Asp Lys Leu Phe Tyr Asp Gln
    210                 215                 220
Asn Thr Ser Gly Pro Thr Leu Ser Pro Leu Asp Ser Tyr Leu Leu Met
225                 230                 235                 240
Arg Gly Leu Lys Thr Leu Ser Leu Arg Met Glu Arg Thr Thr Gln Asn
                245                 250                 255
Ala Gln Lys Ile Val Ala Tyr Leu Glu Lys Ser Pro Ala Val Lys Gln
            260                 265                 270
Val Tyr Tyr Thr Gly Lys Gly Gly Met Ile Ser Val Lys Val Val Asp
        275                 280                 285
Glu Ser Arg Ile Pro His Ile Leu Asn Thr Leu Lys Val Phe Thr Phe
    290                 295                 300
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Thr Tyr Pro Ala Thr
305                 310                 315                 320
Gln Thr His Ala Asp Ile Pro Ala Glu Ile Arg His Ser Tyr Gly Leu
                325                 330                 335
Thr Asp Asp Leu Leu Arg Leu Ser Ile Gly Ile Glu Asp Ala Glu Asp
            340                 345                 350
Leu Ile Ala Asp Leu Lys Thr Ala Leu Glu Gly
        355                 360
<210>75
<211>380
<212>PRT
<213>乳乳球菌
<400>75
Met Thr Ser Ile Lys Thr Lys Val Ile His Gly Gly Ile Ser Thr Asp
  1               5                  10                  15
Lys Thr Thr Gly Ala Val Ser Val Pro Ile Tyr Gln Thr Ser Thr Tyr
             20                  25                  30
Lys Gln Asn Gly Leu Gly Gln Pro Lys Glu Tyr Glu Tyr Ser Arg Ser
         35                  40                  45
Gly Asn Pro Thr Arg His Ala Leu Glu Glu Leu Ile Ala Asp Leu Glu
     50                  55                  60
Gly Gly Val Gln Gly Phe Ala Phe Ser Ser Gly Leu Ala Gly Ile His
 65                  70                  75                  80
Ala Val Leu Ser Leu Phe Ser Ala Gly Asp His Ile Ile Leu Ala Asp
                 85                  90                  95
Asp Val Tyr Gly Gly Thr Phe Arg Leu Met Asp Lys Val Leu Thr Lys
            100                 105                 110
Thr Gly Ile Ile Tyr Asp Leu Val Asp Leu Ser Asn Leu Asp Asp Leu
        115                 120                 125
Lys Ala Ala Phe Lys Glu Glu Thr Lys Ala Ile Tyr Phe Glu Thr Pro
    130                 135                 140
Ser Asn Pro Leu Leu Lys Val Leu Asp Ile Lys Glu Ile Ser Ala Ile
145                 150                 155                 160
Ala Lys Ala His Asp Ala Leu Thr Leu Val Asp Asn Thr Phe Ala Thr
                165                 170                 175
Pro Tyr Leu Gln Gln Pro Ile Ala Leu Gly Ala Asp Ile Val Leu His
            180                 185                 190
Ser Ala Thr Lys Tyr Leu Gly Gly His Ser Asp Val Val Ala Gly Leu
        195                 200                 205
Val Thr Thr Asn Ser Lys Glu Leu Ala Ser Glu Ile Gly Phe Leu Gln
    210                 215                 220
Asn Ser Ile Gly Ala Val Leu Gly Pro Gln Asp Ser Trp Leu Val Gln
225                 230                 235                 240
Arg Gly Ile Lys Thr Leu Ala Leu Arg Met Glu Ala His Ser Ala Asn
                245                 250                 255
Ala Gln Lys Ile Ala Glu Phe Leu Glu Thr Ser Lys Ala Val Ser Lys
            260                 265                 270
Val Tyr Tyr Pro Gly Leu Asn Ser His Pro Gly His Glu Ile Ala Lys
        275                 280                 285
Lys Gln Met Ser Ala Phe Gly Gly Met Ile Ser Phe Glu Leu Thr Asp
    290                 295                 300
Glu Asn Ala Val Lys Asp Phe Val Glu Asn Leu Ser Tyr Phe Thr Leu
305                 310                 315                 320
Ala Glu Ser Leu Gly Gly Val Glu Ser Leu Ile Glu Val Pro Ala Val
                325                 330                 335
Met Thr His Ala Ser Ile Pro Lys Glu Leu Arg Glu Glu Ile Gly Ile
            340                 345                 350
Lys Asp Gly Leu Ile Arg Leu Ser Val Gly Val Glu Ala Ile Glu Asp
        355                 360                 365
Leu Leu Thr Asp Ile Lys Glu Ala Leu Glu Lys Lys
    370                 375                 380
<210>76
<211>15
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:合成的
     氨基酸基序
<220>
<221>MOD_RES
<222>(1)
<223>Asp或Gln
<220>
<221>MOD_RES
<222>(2)
<223>Leu、Ile、Val、Met,或Phe
<220>
<221>MOD_RES
<222>(3)..(5)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(6)
<223>Ser、Thr、Ala、Gly,或Cys
<220>
<221>MOD_RES
<222>(7)
<223>Ser、Thr、Ala、Gly、Cys,或Ile
<220>
<221>MOD_RES
<222>(10)
<223>Phe、Tyr、Trp,或Gln
<220>
<221>MOD_RES
<222>(11)
<223>Leu、Ile、Val、Met,或Phe
<220>
<221>MOD_RES
<222>(12)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(14)
<223>His或Gln
<220>
<221>MOD_RES
<222>(15)
<223>Ser、Gly、Asn,或His
<400>76
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Lys Xaa Xaa Xaa Gly Xaa Xaa
  1               5                  10                  15

Claims (51)

1.产生甲硫氨酸的重组微生物,其中所述微生物表达异源metI基因。
2.权利要求1的微生物,其中metI基因来自芽孢杆菌属。
3.权利要求1的微生物,其中metI基因为枯草芽孢杆菌metI。
4.权利要求1-3任一项的微生物,其中所述微生物属于棒杆菌属。
5.权利要求1-4任一项的微生物,其中所述微生物是谷氨酸棒杆菌。
6.权利要求1-4任一项的微生物,其中所述微生物包含失调的MetI。
7.权利要求6的微生物,其中MetI的失调通过从与metI基因天然不相关的启动子和/或核糖体结合位点组成型表达所述metI基因来实现。
8.MetI表达盒,其包含有效连接异源启动子和任选地核糖体结合位点的metI。
9.权利要求8的MetI表达盒,其中所述启动子是P15、P497、P1284、P3119、λPR或λPL
10.包含权利要求8-9任一项的盒的载体。
11.包含权利要求8-9任一项的盒的微生物。
12.包含权利要求10的载体的微生物。
13.产生甲硫氨酸的方法,其包括在产生甲硫氨酸的条件下培养权利要求1或7任一项的微生物。
14.权利要求13的方法,其还包括至少部分纯化甲硫氨酸。
15.在产生甲硫氨酸的微生物中增加甲硫氨酸生产能力的方法,其包括:在所述微生物中表达异源MetI,从而增加甲硫氨酸生产能力。
16.在微生物中增加甲硫氨酸生产能力的方法,其中在所述微生物中一个或多个甲硫氨酸生物合成步骤受到甲硫氨酸反馈抑制,所述方法包括在所述微生物中表达异源MetI以减轻甲硫氨酸反馈抑制,从而增加甲硫氨酸生产能力。
17.权利要求16的方法,其中甲硫氨酸生产能力相对于对照微生物增加了至少20%。
18.权利要求16的方法,其中甲硫氨酸生产能力相对于对照微生物增加了至少30%。
19.权利要求16的方法,其中甲硫氨酸生产能力相对于对照微生物增加了至少40%.
20.权利要求17-19任一项的方法,其中所述对照微生物不包含MetI酶。
21.能够在谷氨酸棒杆菌crtEb基因座(crtEb整合盒)处整合的DNA序列,其包含:
(a)第一DNA序列;
(b)第二DNA序列,以及
(c)位于所述第一和第二DNA序列之间的第三异源DNA序列,
其中所述第一和第二DNA序列各自与谷氨酸棒杆菌类胡萝卜素生物合成操纵子的不同部分同源,并且其中所述第三DNA序列具有通过谷氨酸棒杆菌菌株的“坎贝尔进”和“坎贝尔出”衍生物破坏所述菌株crtEb基因的能力。
22.权利要求21的DNA序列,其中所述异源DNA序列包含含有metI基因的表达盒。
23.包含权利要求21-21任一项的DNA序列的载体。
24.包含权利要求23的载体或所述载体的部分的微生物。
25.产生番茄红素的方法,其包括在产生番茄红素的条件下培养用权利要求21的整合盒转化的微生物。
26.能够在类胡萝卜素生物合成基因座的谷氨酸棒杆菌marR基因处整合的DNA序列,其包含
(a)第一DNA序列;
(b)第二DNA序列,以及
(c)位于所述第一和第二DNA序列之间的第三异源DNA序列,其中第一和第二DNA序列各自与谷氨酸棒杆菌类胡萝卜素生物合成操纵子的不同部分同源,并且所述DNA序列具有通过谷氨酸棒杆菌菌株的“坎贝尔进”和“坎贝尔出”衍生物破坏所述菌株marR基因的能力,以及任选地
(d)作为所述第三DNA序列一部分的组成型启动子,其功能性连接所述类胡萝卜素生物合成操纵子的第一基因,从而在整合到所述谷氨酸棒杆菌菌株的基因组后,所述类胡萝卜素生物合成操纵子从所述组成型启动子转录。
27.权利要求26的DNA序列,其中所述异源DNA序列包含metI基因。
28.包含权利要求26-27任一项的DNA序列的载体。
29.包含权利要求28的载体或所述载体的部分的微生物。
30.产生提高水平的所需类胡萝卜素的方法,其包括在产生提高水平的所需类胡萝卜素的条件下培养用权利要求26的DNA序列转化的微生物。
31.权利要求30的方法,其中所需类胡萝卜素是番茄红素。
32.权利要求25或30的方法,其中所述微生物是棒杆菌。
33.载体,其包含选自marR整合盒和crtEb整合盒的整合盒。
34.包含权利要求33的载体的微生物。
35.在发酵过程中产生至少两种化合物的方法,其中产生的第一种化合物不是类胡萝卜素,且产生的第二种化合物包含类胡萝卜素。
36.权利要求35的方法,其中所述第一种化合物是氨基酸。
37.权利要求36的方法,其中所述氨基酸选自甲硫氨酸、赖氨酸、谷氨酸、苏氨酸、异亮氨酸、苯丙氨酸、酪氨酸、色氨酸、丙氨酸、半胱氨酸、高丝氨酸、高半胱氨酸和亮氨酸。
38.权利要求35的方法,其中所述第一种化合物是水溶性化合物。
39.权利要求38的方法,其中所述第一种化合物选自乳酸、1,2-丙二醇、1,3-丙二醇、乙醇、甲醇、丙醇、丙酮、丁醇、乙酸、丙酸、柠檬酸、衣康酸、葡糖胺、甘油、糖类、维生素、治疗用蛋白质、研究用蛋白质和工业用蛋白质、酶、治疗用酶、研究用酶和工业用酶,及其盐。
40.权利要求35的方法,其中所述第一种化合物是气体。
41.权利要求40的方法,其中所述气体为甲烷或氢气。
42.产生类胡萝卜素化合物的方法,所述化合物是产生氨基酸的发酵过程的副产物,所述方法包括培养被改造为产生提高水平的氨基酸和类胡萝卜素化合物的微生物。
43.权利要求42的方法,其中培养所述微生物包括将培养物分离为至少两种组分,一种组分富含氨基酸且另一种组分富含类胡萝卜素。
44.权利要求42或43的方法,其中所述氨基酸选自甲硫氨酸、赖氨酸、谷氨酸、苏氨酸、异亮氨酸、苯丙氨酸、酪氨酸、色氨酸、丙氨酸、半胱氨酸、高丝氨酸、高半胱氨酸和亮氨酸。
45.权利要求42的方法,其中所述类胡萝卜素选自decaprenoxanthin、番茄红素、β-胡萝卜素、叶黄素、变胞藻黄素、角黄素、胭脂树橙和玉米黄质。
46.微生物,其被改造为过量产生不是类胡萝卜素的第一种化合物以及包含类胡萝卜素化合物的第二种化合物。
47.权利要求46的微生物,其中所述第一种化合物是氨基酸。
48.权利要求46的微生物,其中所述第一种化合物是氨基酸,所述氨基酸选自甲硫氨酸、赖氨酸、谷氨酸、苏氨酸、异亮氨酸、苯丙氨酸、酪氨酸、色氨酸、丙氨酸、半胱氨酸和亮氨酸,所述第二种化合物选自decaprenoxanthin、番茄红素、β-胡萝卜素、叶黄素、变胞藻黄素、角黄素、胭脂树橙和玉米黄质。
49.权利要求46的微生物,其中所述第一种化合物选自甲烷、氢、乳酸、1,2-丙二醇、1,3-丙二醇、乙醇、甲醇、丙醇、丙酮、丁醇、乙酸、丙酸、柠檬酸、衣康酸、葡糖胺、甘油、糖类、维生素、治疗用酶和蛋白质、研究用酶和蛋白质、工业用酶和蛋白质,和其盐,并且所述第二种化合物选自decaprenoxanthin、番茄红素、β-胡萝卜素、叶黄素、变胞藻黄素、角黄素、胭脂树橙和玉米黄质。
50.能够产生含硫精细化学品的重组微生物,其包含异源metI基因。
51.产生含硫精细化学品的方法,其包括在产生含硫精细化学品的条件下培养权利要求1或权利要求7的微生物。
CN 200680026224 2005-07-18 2006-07-18 芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途 Pending CN101223281A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US70055705P 2005-07-18 2005-07-18
US60/700,557 2005-07-18
US60/713,905 2005-09-01

Publications (1)

Publication Number Publication Date
CN101223281A true CN101223281A (zh) 2008-07-16

Family

ID=39632395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200680026224 Pending CN101223281A (zh) 2005-07-18 2006-07-18 芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途

Country Status (2)

Country Link
CN (1) CN101223281A (zh)
ZA (1) ZA200801495B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104911136A (zh) * 2009-08-28 2015-09-16 Cj第一制糖株式会社 产生o-乙酰高丝氨酸的微生物和利用所述微生物产生o-乙酰高丝氨酸的方法
CN110914425A (zh) * 2017-06-06 2020-03-24 齐默尔根公司 用于改良刺糖多孢菌的高通量(htp)基因组工程改造平台

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104911136A (zh) * 2009-08-28 2015-09-16 Cj第一制糖株式会社 产生o-乙酰高丝氨酸的微生物和利用所述微生物产生o-乙酰高丝氨酸的方法
CN110914425A (zh) * 2017-06-06 2020-03-24 齐默尔根公司 用于改良刺糖多孢菌的高通量(htp)基因组工程改造平台

Also Published As

Publication number Publication date
ZA200801495B (en) 2009-07-29

Similar Documents

Publication Publication Date Title
BRPI0613660A2 (pt) microorganismo, cassete de expressão de metl, vetor, métodos para produzir metionina, licopeno, nìveis incrementados de um carotenóide desejado, pelo menos dois compostos em um processo de fermentação, um composto carotenóide desejado, pelo menos dois compostos em um processo de fermentação, um composto carotenóide, e um produto quìmico fino contendo enxofre, e para incrementar a capacidade de produção de metionina em um microorganismo, e, sequência de dna
RU2262532C2 (ru) Полинуклеотид, кодирующий фосфоенолпируваткарбоксикиназу, и зонд, предназначенный для его получения
KR101511639B1 (ko) 재조합 미생물 및 이의 사용 방법
DK2855662T3 (en) RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF
KR101640325B1 (ko) 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조
CN108587995B (zh) 用于生产鼠李糖脂的细胞和方法
KR20080033413A (ko) 미생물 내에서 메티오닌 생산을 위한 디메틸 디술파이드의용도
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
CN106906175A (zh) 用于生产尸胺的方法和重组微生物
CN101849017A (zh) 具有下调的维生素b12系统的微生物
KR20080036608A (ko) 메티오닌 생산 재조합 미생물
CN101646687A (zh) 通过过表达戊糖磷酸途径的酶在棒状细菌中生产甲硫氨酸的方法
US7339048B2 (en) Genes encoding genetic stability, gene expression and folding proteins
TW201233798A (en) Recombinant microorganisms and methods of use thereof
CN111566217A (zh) 宿主细胞中风味化合物的产生
DK3004146T3 (en) POLYPEPTIDES WITH PERMEASE ACTIVITY
CN101223281A (zh) 芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途
CN101223280B (zh) 二甲基二硫醚在微生物中用于甲硫氨酸生产
CN109370974B (zh) 一种高产l-赖氨酸的重组谷氨酸棒状杆菌及其构建方法
KR20050034747A (ko) 황-함유 정밀 화학물질 (metY)의 발효적 제조 방법
AU761093B2 (en) Construction of production strains for producing substituted phenols by specifically inactivating genes of the eugenol and ferulic acid catabolism
CN113201514B (zh) 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
KR20060080194A (ko) 비-항생제 내성 선별 마커를 포함하는 선별 시스템
RU2819270C1 (ru) Микроорганизм для продуцирования L-аминокислоты, обладающий повышенной активностью цитохрома С, и способ получения L-аминокислоты с его использованием
KR20230156365A (ko) 메타게놈 유래의 새로운 CRISPR-Cas 뉴클레아제

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090206

Address after: essen

Applicant after: Evonik Degussa GmbH

Address before: Ludwigshafen, Germany

Applicant before: BASF SE

ASS Succession or assignment of patent right

Owner name: YINGCHUANG DEGUSSA CO., LTD.

Free format text: FORMER OWNER: BASF EUROPEAN CO.,LTD.

Effective date: 20090206

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080716