CN115605589A

CN115605589A - 改进的用于生产类异戊二烯的方法

Info

Publication number: CN115605589A
Application number: CN202180035549.2A
Authority: CN
Inventors: M·S·波特; S·西梅尔; M·布罗伊尔; C·威尔罗特; J·K·普拉斯迈尔; E·马勒; B·托科文科
Original assignee: BASF SE
Current assignee: BASF SE
Priority date: 2020-05-15
Filing date: 2021-05-17
Publication date: 2023-01-13
Also published as: US20230383321A1; WO2021229106A1; BR112022022933A2; KR20230012530A; JP2023526068A; EP4150064A1; CA3172001A1; AU2021272383A1

Abstract

本发明属于生物催化、生物转化和发酵领域，并且涉及一种用于生产异戊烯二磷酸、二甲基烯丙基二磷酸和/或由其衍生的类异戊二烯的方法。

Description

改进的用于生产类异戊二烯的方法

发明描述

本发明属于生物催化、生物转化和发酵领域，并且涉及一种用于生产异戊烯二磷酸、二甲基烯丙基二磷酸和/或由其衍生的类异戊二烯(isoprenoid)的方法。

引言

类异戊二烯呈现出令人难以置信的多样化类别的天然产物，其广泛应用于调味剂和芳香剂、化妆品、农业、营养以及药物结构单元(Chandran，S.S.，J.T.Kealey和C.D.Reeves，Microbial production of isoprenoids.Process Biochemistry，2011.46(9)：p.1703-1710)。通过关键中间体异戊烯二磷酸(IPP)及其异构体二甲基烯丙基二磷酸(DMAPP)进行类异戊二烯的生物合成。在自然界中，这些中间体通过甲羟戊酸或1-脱氧-D-木酮糖-5-磷酸途径组装，所述途径都是初级代谢的分支。这两种途径对于生产生物体都是能量密集的，并且它们都受到高度复杂的调控。最终，这限制了理论上可实现的碳产率，并因此限制了通过这种途径的类异戊二烯的最小生产成本。在这点上，绕过甲羟戊酸和1-脱氧-D-木酮糖-5-磷酸途径的IPP或DMAPP的替代途径提供了实现显著降低类异戊二烯生产成本的巨大潜力。最近，Stephanopoulos的研究小组(Chatzivasileiou，A.O.等，Two-steppathway for isoprenoid synthesis.Proc Natl Acad Sci U S A，2019.116(2)：p.506-511；Ward，V.C.A.，A.O.Chatzivasileiou和G.Stephanopoulos，Cell free biosynthesisof isoprenoids from isopentenol.Biotechnol Bioeng，2019.116(12)：p.3269-3281)、Gonzalez(Clomburg，J.M.等，The isoprenoid alcohol pathway,a synthetic route forisoprenoid biosynthesis.Proc Natl Acad Sci U S A，2019.116(26)：p.12810-12815)和Williams(Lund，S.，R.Hall，和G.J.Williams，An artificial pathway for IsoprenoidBiosynthesis Decoupled from Native Hemiterpene Metabolism.ACS Synth Biol，2019.8(2)：p.232-238)提出了此类替代途径。他们设想了一条人工途径，其从容易获得的化学合成的isoprenol或prenol开始，并通过两个随后的磷酸化反应构建IPP和DMAPP。在第一步中，酶激酶1从isoprenol合成异戊烯磷酸(IP)或从prenol合成二甲基烯丙基二磷酸(DMAP)。这两种产物是激酶2的底物，激酶2转移第二个磷酸部分以产生IPP或DMAPP。在人工途径内，有效的激酶1以及有效的激酶2的鉴定构成了相当大的挑战，因为激酶1的反应性在自然界中没有被描述，并且激酶2通常具有低效率。我们鉴定了能够从isoprenol/prenol高产率生产IP/DMAP的有效激酶1催化剂的酶，以及能够从IP/DMAP高产率生产IPP/DMAPP的有效激酶2催化剂的酶。此外，我们可以从这些中间体开始高效地生产类异戊二烯。

发明详述

本发明的第一实施方案包含分离的激酶1，其能够在包含水、激酶1和isoprenol和/或prenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg2+)的水性介质中催化从isoprenol(3-甲基-3-丁烯-1-醇)和/或prenol(3,3-二甲基烯丙醇、3-甲基-2-丁烯-1-醇)到异戊烯磷酸(异戊烯单磷酸、3-甲基丁-3-烯基二氢磷酸)或其盐和/或二甲基烯丙基磷酸(3-甲基丁-2-烯基二氢磷酸)或其盐的反应，其中在温育后，至少10％，优选地至少15％、更优选地至少20％、甚至更优选地至少25％、甚至更优选地至少30％、甚至更优选地至少35％、甚至更优选地至少40％、甚至更优选地至少45％、甚至更优选地至少50％、甚至更优选地至少50％、甚至更优选地至少55％、甚至更优选地至少60％、甚至更优选地至少65％、甚至更优选地至少70％、甚至更优选地至少75％、甚至更优选地至少80％、甚至更优选地至少85％、甚至更优选地至少90％、甚至更优选至少95％，甚至更优选至少96％、97％、98％、99％或100％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

水性介质的温育时间可以是至少0.5h、至少1h、至少1.5h、至少2h、至少2.5h、至少5h、至少10h或至少12h。

在一个实施方案中，温育在10℃至50℃，优选在15℃至40℃，更优选在20℃至40℃，甚至更优选在24℃至37℃，最优选在36℃至38℃下进行。

在优选的实施方案中，在37℃下温育10小时后，至少20％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在更优选的实施方案中，在37℃下温育7小时后，至少20％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在甚至更优选的实施方案中，在37℃下温育7小时后，至少25％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在甚至更优选的实施方案中，在37℃下温育18h后，至少40％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在最优选的实施方案中，在37℃下温育5小时后，至少25％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

在本发明的一个实施方案中，分离的激酶1在对应于SEQ ID NO:37相应位置的位置处包含非14A、非122A、非174M和/或非217T。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含14Y、K或T、122S或T、174K或V和/或217E或M中的至少3个，优选至少4个。

在本发明的另一个实施方案中，分离的激酶1在对应于SEQ ID NO:37相应位置的位置处包含非30D、E、S或Y，非33G或S，非125S或T和/或非201A、I或S。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含30N、33T、125K和/或201C或D中的至少2个，优选至少3个，优选至少4个。

在一个实施方案中，分离的激酶1包含选自以下的序列：

a.SEQ ID NO:43、46、49、52、123、126、135、138、144、150、153、324、351、357、375、378、390或393的氨基酸分子和

b.与SEQ ID NO:43、46、49、52、123、126、135、138、144、150、153、324、351、357、375、378、390或393的氨基酸分子具有至少50％同一性的氨基酸分子，或其功能性片段，和

c.由SEQ ID NO:44、45、47、48、50、51、53、54、124、127、136、139、145、151、154、325、358、379、394、125、128、137、140、146、152、155、326、353、359、377、380、392或395的核酸分子编码的氨基酸分子，或其功能性片段，和

d.由与SEQ ID NO:44、45、47、48、50、51、53、54、124、127、136、139、145、151、154、325、358、379、394、125、128、137、140、146、152、155、326、353、359、377、380、392或395具有至少50％同一性的核酸分子编码的氨基酸分子，或其功能性片段，和

e.由与在严格条件下互补于SEQ ID NO:44、45、47、48、50、51、53、54、124、127、136、139、145、151、154、325、358、379、394、125、128、137、140、146、152、155、326、353、359、377、380、392或395的至少250个碱基的片段杂交的核酸分子编码的氨基酸分子，或其功能性片段，

其中如b.、c.、d.和e.中限定的氨基酸分子催化水性介质中从isoprenol和/或prenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应，和

其中在温育后至少10％、优选至少15％、更优选至少20％、甚至更优选至少25％、甚至更优选至少30％、甚至更优选至少35％、甚至更优选至少40％、甚至更优选至少45％、甚至更优选至少50％、甚至更优选至少55％、甚至更优选至少60％、甚至更优选至少65％、甚至更优选至少70％、甚至更优选至少75％、甚至更优选至少80％、甚至更优选至少85％、甚至更优选至少90％、甚至更优选至少95％、甚至更优选至少96％、97％、98％、99％或100％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

在本发明的一个实施方案中，如b.、c.、d.和e.中限定的氨基酸分子在对应于SEQIDNO:37相应位置的位置处包含非14A、非122A、非174M和/或非217T。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含14Y、K或T、122S或T、174K或V和/或217E或M中的至少3个，优选至少4个。

在本发明的再一个实施方案中，如b.、c.、d.和e.中限定的氨基酸分子在对应于SEQ IDNO:37相应位置的位置处包含非30D、E、S或Y，非33G或S，非125S或T和/或非201A、I或S。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含30N、33T、125K和/或201C或D中的至少2个，优选至少3个，优选至少4个。

本发明的再一个实施方案是分离的激酶1，其包含选自以下的序列：

a.SEQ ID NO:43、46、49、52、123、126、135、138、144、150、153、324、351、357、375、378、390或393的氨基酸分子；和

其中如b.、c.、d.和e.中限定的氨基酸分子催化水性介质中从isoprenol和/或prenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应。

本发明的再一个实施方案是生产异戊烯磷酸和/或二甲基烯丙基磷酸或其盐的方法，所述方法包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1和prenol和/或isoprenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²⁺)，和

ii.温育水性介质，和

iii.任选地从反应混合物分离异戊烯磷酸和/或二甲基烯丙磷酸或其盐，

其中一种或多种激酶1能够催化在包含水、激酶1和prenol和/或isoprenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²⁺)的水性介质中从prenol和/或isoprenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应，其中在温育后，至少10％、优选至少15％、更优选至少20％、甚至更优选至少25％、甚至更优选至少30％、甚至更优选至少35％、甚至更优选至少40％、甚至更优选至少45％、甚至更优选至少50％、甚至更优选至少55％、甚至更优选至少60％、甚至更优选至少65％、甚至更优选至少70％、甚至更优选至少75％、甚至更优选至少80％、甚至更优选至少85％、甚至更优选至少90％、甚至更优选至少95％、甚至更优选至少96％、97％、98％、99％或100％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

在优选实施方案中，在37℃下温育10小时后，至少20％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在更优选的实施方案中，在37℃下温育7小时后，至少20％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在甚至更优选的实施方案中，在37℃下温育7小时后，至少25％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在甚至更优选的实施方案中，在37℃下温育18h后，至少40％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。在最优选的实施方案中，在37℃下温育5小时后，至少25％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

水性介质可以是溶液或悬浮液或溶液和悬浮液，其中包含在所述水性介质中的任何物质可以完全或部分溶解和/或部分或完全悬浮。

在本发明方法的一个实施方案中，激酶1包含选自以下的序列：

c.由SEQ ID NO:44、45、47、48、50、51、53、54、124、127、136、139、145、151、154、325、358、379、394、125、128、137、140、146、152、155、326、353、359、377、380、392或395的核酸分子编码的氨基酸分子，或其功能性片段；和

d.由与SEQ ID NO:44、45、47、48、50、51、53、54、124、127、136、139、145、151、154、325、358、379、394、125、128、137、140、146、152、155、326、353、359、377、380、392或395具有至少50％同一性的核酸分子编码的氨基酸分子，或其功能性片段；和

其中如b.、c.、d.和e.中限定的氨基酸分子催化水性介质中从isoprenol和/或prenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应，并且其中在温育后至少10％、优选至少15％、更优选至少20％、甚至更优选至少25％、甚至更优选至少30％、甚至更优选至少35％、甚至更优选至少40％、甚至更优选至少45％、甚至更优选至少50％、甚至更优选至少55％、甚至更优选至少60％、甚至更优选至少65％、甚至更优选至少70％、甚至更优选至少75％，甚至更优选至少80％、甚至更优选至少85％、甚至更优选至少90％、甚至更优选至少95％、甚至更优选至少96％、97％、98％、99％或100％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

在本发明的一个实施方案中，如b.、c.、d.和e中限定的氨基酸分子在对应于SEQIDNO:37相应位置的位置处包含非14A、非122A、非174M和/或非217T。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含14Y、K或T、122S或T、174K或V和/或217E或M中的至少3个，优选至少4个。

在本发明的另一个实施方案中，如b.、c.、d.和e.中限定的氨基酸分子在对应于SEQ IDNO:37相应位置的位置处包含非30D、E、S或Y、非33G或S、非125S或T和/或非201A、I或S。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含30N、33T、125K和/或201C或D中的至少2个，优选至少3个，优选至少4个。

本发明的另一个实施方案是生产异戊烯磷酸和/或二甲基烯丙基磷酸或其盐的方法，所述方法包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1和isoprenol和/或prenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²⁺)，和

ii.温育水性介质，和

iii.任选从反应混合物分离异戊烯磷酸和/或二甲基烯丙基磷酸或其盐，

其中一种或多种激酶1包含选自以下的序列：

a.SEQ ID NO:43、46、49、52、123、126、135、138、144、150、153、324、351、357、375、378、390或393的氨基酸分子，和

在本发明的一个实施方案中，如b.，c.，d.和e中限定的氨基酸分子在对应于SEQIDNO:37相应位置的位置处包含非14A、非122A、非174M和/或非217T。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含14Y、K或T、122S或T、174K或V和/或217E或M中的至少3个，优选至少4个。

在本发明的另一个实施方案中，如b.、c.、d.和e中限定的氨基酸分子在对应于SEQIDNO:37相应位置的位置处包含非30D、E、S或Y、非33G或S、非125S或T和/或非201A、I或S。优选地，本发明的激酶1在对应于SEQ ID NO:37相应位置的位置处包含30N、33T、125K和/或201C或D中的至少2个，优选至少3个，优选至少4个。

本发明的另一个实施方案是包含激酶1的重组构建体，其中激酶1包含编码选自以下的氨基酸分子的序列：

用于表达激酶1的所述重组构建体可以整合到生物体的基因组中，或者用于表达激酶1的重组构建体可以包含在引入生物体中的载体(例如质粒或病毒载体)上。

重组构建体中的激酶1可以功能性地连接异源启动子、异源终止子和/或任何其他异源遗传元件。

本发明的再一个实施方案是重组载体，如包含所述重组构建体的表达载体或病毒载体。

在特别优选的实施方案中，所述载体包含SEQ ID NO:109、110或491的序列。

本发明的再一个实施方案是包含所述重组构建体或所述重组载体的重组微生物。

在一些实施方案中，重组微生物是原核细胞。合适的原核细胞包括革兰氏阳性、革兰氏阴性和革兰氏可变细菌细胞，优选革兰氏阴性。

因此，可用于本发明的原核微生物包括但不限于氧化葡糖杆菌(Gluconobacteroxydans)、浅井氏葡糖杆菌(Gluconobacter asaii)、德尔马瓦无色杆菌(Achromobacterdelmarvae)、粘无色杆菌(Achromobacter viscosus)、乳无色杆菌(Achromobacterlacticum)、根癌土壤杆菌(Agrobacterium tumefaciens)、放射形土壤杆菌(Agrobacterium radiobacter)、粪产碱菌(Alcaligenes faecalis)、柠檬节杆菌(Arthrobacter citreus)、肿胀节杆菌(Arthrobacter tumescens)、石蜡节杆菌(Arthrobacter paraffineus)、Arthrobacter hydrocarboglutamicus、氧化节杆菌(Arthrobacter oxydans)、天牛短小杆菌(Aureobacterium saperdae)、印度固氮菌(Azotobacter indicus)、产氨短杆菌(Brevibacterium ammoniagenes)、叉枝短杆菌(Brevibacterium divaricatum)、乳发酵短杆菌(Brevibacterium lactofermentum)、黄色短杆菌(Brevibacterium flavum)、球形短杆菌(Brevibacterium globosum)、褐色短杆菌(Brevibacterium fuscum)、酮谷氨酸短杆菌(Brevibacterium ketoglutamicum)、Brevibacterium helcolum、Brevibacterium pusillum、需土短杆菌(Brevibacteriumtestaceum)、玫瑰色短杆菌(Brevibacterium roseum)、Brevibacterium immariophilium、扩展短杆菌(Brevibacterium linens)、Brevibacterium protopharmiae、嗜乙酰棒杆菌(Corynebacterium acetophilum)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、美棒杆菌(Corynebacterium callunae)、嗜乙酰乙酸棒杆菌(Corynebacteriumacetoacidophilum)、醋谷棒杆菌(Corynebacterium acetoglutamicum)、产气肠杆菌(Enterobacter aerogenes)、解淀粉欧文氏菌(Erwinia amylovora)、胡萝卜软腐欧文氏菌(Erwinia carotovora)、草生欧文氏菌(Erwinia herbicola)、菊欧文氏菌(Erwiniachrysanthemi)、奇异黄杆菌(Flavobacterium peregrinum)、Flavobacterium fucatum、橙色黄杆菌(Flavobacterium aurantinum)、莱菌黄杆菌(Flavobacterium rhenanum)、缝黄杆菌(Flavobacterium sewanense)、短黄杆菌(Flavobacterium breve)、脑膜炎黄杆菌(Flavobacterium meningosepticum)、微球菌属种CCM825、摩氏变形菌(Morganellamorganii)、不透明诺卡氏菌(Nocardia opaca)、粗糙诺卡氏菌(Nocardia rugosa)、Planococcus eucinatus、雷氏变形菌(Proteus rettgeri)、谢氏丙酸杆菌(Propionibacterium shermanii)、产黄假单胞菌(Pseudomonas synxantha)、氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵状假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、Pseudomonasacidovolans、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonastestosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、红串红球菌(Rhodococcuserythropolis)、玫瑰红红球菌(Rhodococcus rhodochrous)、红球菌属物种ATCC 15592、红球菌属物种ATCC 19070、脲芽孢八叠球菌(Sporosarcina ureae)、金黄色葡萄球菌(Staphylococcus aureus)、麦氏弧菌(Vibrio metschnikovii)、乳酪弧菌(Vibriotyrogenes)、马杜拉诺卡氏菌(Actinomadura madurae)、Actinomycesviolaceochromogenes、Kitasatosporia parulosa、阿维链霉菌(Streptomycesavermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、Streptomyces flavelus、浅灰链霉菌(Streptomyces griseolus)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、抗生链霉菌(Streptomyces antibioticus)、可可链霉菌(Streptomyces cacaoi)、淡紫灰链霉菌(Streptomyces lavendulae)、绿色产色链霉菌(Streptomyces viridochromogenes)、杀鲑气单胞菌(Aeromonas salmonicida)、短小芽孢杆菌(Bacillus pumilus)、环状芽孢杆菌(Bacillus circulans)、解硫胺素芽孢杆菌(Bacillus thiaminolyticus)、弗氏埃希氏菌(Escherichia freundii)、嗜氨微杆菌(Microbacterium ammoniaphilum)、粘质沙雷菌(Serratia marcescens)、鼠伤寒沙门氏菌(Salmonella typhimurium)、肖特苗勒氏沙门氏菌(Salmonella schottmulleri)或柑橘黄单胞菌(Xanthomonas citri)、集胞藻属(Synechocystis sp.)、细长集球藻(Synechococcus elongatus)、细长嗜热聚球藻(Thermosynechococcus elongatus)、铜绿微囊藻(Microcystis aeruginosa)、念珠藻属(Nostoc sp.)、普通念珠藻(N.commune)、球形念珠藻(N.sphaericum)、点形念珠藻(Nostoc punctiforme)、钝顶念珠藻(Spirulinaplatensis)、巨大鞘丝藻(Lyngbya majuscula)、赖氏鞘丝藻(L.lagerheimii)、纤细席藻(Phormidium tenue)、鱼腥藻属(Anabaena sp.)、瘦鞘丝藻属(Leptolyngbya sp.)。

可用于本发明的真核微生物包括但不限于酵母属(Saccharomyces spec)，如酿酒酵母(Saccharomyces cerevisiae)，汉逊酵母属(Hansenula spec)，如多形汉逊酵母(Hansenula polymorpha)，裂殖酵母属(Schizosaccharomyces spec)，如粟酒裂殖酵母(Schizosaccharomyces pombe)，克鲁维酵母属(Kluyveromyces spec)，如乳酸克鲁维酵母(Kluyveromyces lactis)和马克斯克鲁维酵母(Kluyveromyces marxianus)，耶氏酵母属(Yarrowia spec)，如解脂耶氏酵母(Yarrowia lipolytica)、毕赤酵母属(Pichia spec)，如甲醇毕赤酵母(Pichia methanolica)、树干毕赤酵母(Pichia stipites)、巴斯德毕赤酵母(Pichia pastoris)，接合酵母属(Zygosaccharomyces spec)，如鲁氏接合酵母(Zygosaccharomyces rouxii)和拜氏接合酵母(Zygosaccharomyces bailii)，假丝酵母属(Candida spec)，如博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candidautilis)、弗里思假丝酵母(Candida freyschussii)、光滑假丝酵母(Candida glabrata)和Candida sonorensis，许旺酵母属(Schwanniomyces spec)，如西方许旺酵母(Schwanniomyces occidentalis)，阿氏酵母属(Arxula spec)，如解腺嘌呤阿氏酵母(Arxula adeninivorans)，Ogataea spec，如Ogataea minuta，克雷伯氏菌属(Klebsiellaspec)，如肺炎克雷伯氏菌(Klebsiella pneumonia)，曲霉属(Aspergillus spec)，如黑曲霉(Aspergillus niger)或嗜热毁丝霉(Myceliophthora thermophila)。

本发明优选的微生物包括玫瑰红红球菌(Rhodococcus rhodochrous)、气球菌属(Aerococcus sp.)、曲霉属(Aspergillus sp.)、短小芽孢杆菌(Bacillus pumilus)、枯草芽孢杆菌(Bacillus subtilis)、多形拟杆菌(Bacteroides thetaiotaomicron)、Clostridium algidicarnis、高效棒状杆菌(Corynebacterium efficiens)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、大肠杆菌(Escherichia coli)、沃氏产卤菌(Haloferax volcanii)、干酪乳杆菌(Lactobacillus casei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、热自养甲烷热杆菌(Methanothermobacterthermautotrophicus)、嗜热毁丝霉(Myceliophthora thermophila)、巴斯德毕赤酵母(Pichia pastoris)、产黄假单胞菌(Pseudomonas synxantha)、固氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵形假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、嗜酸假单胞菌(Pseudomonas acidovolans)、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonas testosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、筑波拟酵母(Pseudozyma tsukubaensis)、真养罗氏菌(Ralstonia eutropha)、浑球红细菌(Rhodobacter sphaeroides)、浑浊红球菌(Rhodococcus opacus)、酿酒酵母(Saccharomyces cerevisiae)、鲍氏志贺氏菌(Shigella boydii)、草木樨中华根瘤菌(Sinorhizobium meliloti)、抗生链霉菌(Streptomyces antibioticus)、阿维链霉菌(Streptomyces avermitilis)、可可链霉菌(Streptomyces cacaoi)、天蓝色链霉菌(Streptomyces coelicolor)、黄链霉菌(Streptomyces flavelus)、浅灰链霉菌(Streptomyces griseolus)、淡紫灰链霉菌(Streptomyces lavendulae)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、绿色产色链霉菌(Streptomyces viridochromogenes)、嗜酸热原体(Thermoplasma acidophilum)、需钠弧菌(Vibrio natrigens)或解脂耶氏酵母(Yarrowia lipolytica)。

特别优选的微生物是枯草芽孢杆菌(Bacillus subtilis)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、大肠杆菌(Escherichia coli)、铜绿假单胞菌(Pseudomonas aeruginosa)、恶臭假单胞菌(Pseudomonas putida)、浑球红细菌(Rhodobacter sphaeroides)、混浊红球菌(Rhodococcus opacus)、酿酒酵母(Saccharomyces cerevisiae)和解脂耶氏酵母(Yarrowia lipolytica)。

本发明的再一个实施方案是组合物，其包含水、激酶1、异戊烯磷酸和/或二甲基烯丙基磷酸和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²)，其中激酶1包含选自以下的序列：

本发明的再一个实施方案是生产异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法，该方法包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1、一种或多种激酶2和prenol和/或isoprenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²)，和

ii.温育水性介质，和

iii.任选地从反应混合物分离异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐，

其中一种或多种激酶1能够催化在包含水、激酶1和prenol和/或isoprenol的水性介质中从prenol和/或isoprenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应，和

其中一种或多种激酶2能够催化在包含水、激酶2和异戊烯磷酸和/或二甲基烯丙基磷酸和任选的核苷酸三磷酸酯(优选ATP)和二价阳离子(优选Mg2+)的水性介质中从异戊烯磷酸和/或二甲基烯丙基磷酸到异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的反应，其中在温育后至少10％、优选至少15％、更优选至少20％、甚至更优选至少25％、甚至更优选至少30％、甚至更优选至少35％、甚至更优选至少40％、甚至更优选至少45％、甚至更优选至少50％、甚至更优选至少55％、甚至更优选至少60％、甚至更优选至少65％、甚至更优选至少70％、甚至更优选至少75％、甚至更优选至少80％、甚至更优选至少85％、甚至更优选至少90％、甚至更优选至少95％、甚至更优选至少96％、97％、98％、99％或100％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

在优选实施方案中，在37℃下温育10小时后，至少20％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在更优选的实施方案中，在37℃下温育7小时后，至少20％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在甚至更优选的实施方案中，在37℃下温育7小时后，至少25％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在甚至更优选的实施方案中，在37℃下温育18h后，至少40％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在最优选的实施方案中，在37℃下温育5小时后，至少25％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

在本发明用于生产异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法的一个实施方案中，激酶1包含选自以下的序列：

其中如b.、c.、d.和e.中限定的氨基酸分子催化水性介质中从isoprenol和/或prenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应，其中在温育后至少10％、优选至少15％、更优选至少20％、甚至更优选至少25％、甚至更优选至少30％、甚至更优选至少35％、甚至更优选至少40％、甚至更优选至少45％、甚至更优选至少50％、甚至更优选至少55％、甚至更优选至少60％、甚至更优选至少65％、甚至更优选至少70％、甚至更优选至少75％、甚至更优选至少80％、甚至更优选至少85％、甚至更优选至少90％、甚至更优选至少95％、甚至更优选至少96％、97％、98％、99％或100％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

在用于生产异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的本发明的另一种方法中，激酶2包含选自以下的序列：

f.SEQ ID NO:76、85、88、103、138、171、174、177、180、183、189、192、195、198、201、204、207、210、216、219、222、225、228、231、234、237、240、246、249、252、255、258、261、270、273、279、282、288、426、429、435、447或483的氨基酸分子，和

g.与SEQ ID NO:76、85、88、103、138、171、174、177、180、183、189、192、195、198、201、204、207、210、216、219、222、225、228、231、234、237、240、246、249、252、255、258、261、270、273、279、282、288、426、429、435、447或483的氨基酸分子具有至少50％同一性的氨基酸分子，或其功能性片段，和

h.由SEQ ID NO:77、78、86、87、89、90、104、105、139、172、175、178、181、184、190、193、196、199、202、205、208、211、217、220、223、226、229、232、235、238、241、247、250、253、256、259、262、271、274、280、283、289、430、448、484、140、173、176、179、182、185、191、194、197、200、203、206、209、212、218、221、224、227、230、233、236、239、242、248、251、254、257、260、263、272、275、281、284、290、428、431、437、449或485的核酸分子编码的氨基酸分子，或其功能性片段，和

i.由与SEQ ID NO:77、78、86、87、89、90、104、105、139、172、175、178、181、184、190、193、196、199、202、205、208、211、217、220、223、226、229、232、235、238、241、247、250、253、256、259、262、271、274、280、283、289、430、448、484、140、173、176、179、182、185、191、194、197、200、203、206、209、212、218、221、224、227、230、233、236、239、242、248、251、254、257、260、263、272、275、281、284、290、428、431、437、449或485具有至少50％同一性的核酸分子编码的氨基酸分子，或其功能性片段，和

j.由与在严格条件下互补于SEQ ID NO:77、78、86、87、89、90、104、105、139、172、175、178、181、184、190、193、196、199、202、205、208、211、217、220、223、226、229、232、235、238、241、247、250、253、256、259、262、271、274、280、283、289、430、448、484、140、173、176、179、182、185、191、194、197、200、203、206、209、212、218、221、224、227、230、233、236、239、242、248、251、254、257、260、263、272、275、281、284、290、428、431、437、449或485的至少250个碱基的片段杂交的核酸分子编码的氨基酸分子，或其功能性片段，

其中如g.、h.、i.和j中限定的氨基酸分子催化水性介质中从异戊烯磷酸和/或二甲基烯丙基磷酸到异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的反应，其中在温育后至少10％、优选至少15％、更优选至少20％、甚至更优选至少25％、甚至更优选至少30％、甚至更优选至少35％、甚至更优选至少40％、甚至更优选至少45％、甚至更优选至少50％、甚至更优选至少55％、甚至更优选至少60％、甚至更优选至少65％、甚至更优选至少70％、甚至更优选至少75％、甚至更优选至少80％、甚至更优选至少85％、甚至更优选至少90％、甚至更优选至少95％、甚至更优选至少96％、97％、98％、99％或100％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

在优选的实施方案中，在37℃下温育10小时后，至少20％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在更优选的实施方案中，在37℃下温育7小时后，至少20％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在甚至更优选的实施方案中，在37℃下温育7小时后，至少25％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在甚至更优选的实施方案中，在37℃下温育18h后，至少40％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。在最优选的实施方案中，在37℃下温育5小时后，至少25％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

本发明的另一个实施方案是生产异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法，其包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1、一种或多种激酶2和isoprenol和/或prenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²)，和

ii.温育水性介质，和

iii.任选从反应混合物中分离异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐，

其中所述一种或多种激酶1选自

其中如g.、h.、i.和j.中限定的氨基酸分子催化水性介质中从异戊烯磷酸和/或二甲基烯丙基磷酸到异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的反应。

在优选的实施方案中，激酶1包含与SEQ.ID.NO:37具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，或其功能性变体，和

激酶2包含与SEQ ID NO:85具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的氨基酸序列，或其功能性变体。

在另一个优选实施方案中，激酶1包含与SEQ.ID.NO:1具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，或其功能性变体，和

激酶2包含与SEQ ID NO:486具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的氨基酸序列，或其功能性变体。

在另一个优选实施方案中，激酶1包含与SEQ.ID.NO:291具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，或其功能性变体，和

激酶2包含与SEQ ID NO:103具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的氨基酸序列，或其功能性变体。

在另一个优选实施方案中，激酶1包含与SEQ.ID.NO:46具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，或其功能性变体，和

激酶2包含与SEQ ID NO:88具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的氨基酸序列，或其功能性变体。

在另一个优选实施方案中，激酶1包含与SEQ.ID.NO:49具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，或其功能性变体，和

本发明的另一个实施方案是包含激酶1和激酶2的重组构建体，其中激酶1包含编码选自以下的氨基酸分子的序列：

其中如b.、c.、d.和e中限定的氨基酸分子催化水性介质中从isoprenol和/或prenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应。

在包含激酶1和激酶2的重组构建体的一个实施方案中，激酶2包含编码选自以下的氨基酸分子的序列：

在包含激酶1和激酶2的重组构建体的另一个实施方案中，激酶1和激酶2各自与异源调控元件(例如启动子、终止子、增强子或任何其他异源元件)功能性地连接。

本发明的另一个实施方案是包含重组构建体的重组载体，所述重组构建体包含激酶1和激酶2，其中激酶1和激酶2各自与异源例如启动子、终止子、增强子或任何其他异源元件功能性地连接。

本发明的另一个实施方案是重组微生物，其包含含有激酶1和激酶2的重组构建体，其中激酶1和激酶2各自与异源调控元件功能性地连接，或包含含有所述重组构建体的重组载体。

包含含有激酶1和激酶2(其中激酶1和激酶2各自与异源调控元件功能性地连接)的重组构建体或包含含有所述重组构建体的重组载体的重组微生物优选选自包含以下的列表：氧化葡糖杆菌(Gluconobacter oxydans)、浅井氏葡糖杆菌(Gluconobacter asaii)、德尔马瓦无色杆菌(Achromobacter delmarvae)、粘无色杆菌(Achromobacter viscosus)、乳无色杆菌(Achromobacter lacticum)、根癌土壤杆菌(Agrobacterium tumefaciens)、放射形土壤杆菌(Agrobacterium radiobacter)、粪产碱菌(Alcaligenes faecalis)、柠檬节杆菌(Arthrobacter citreus)、肿胀节杆菌(Arthrobacter tumescens)、石蜡节杆菌(Arthrobacter paraffineus)、Arthrobacter hydrocarboglutamicus、氧化节杆菌(Arthrobacter oxydans)、天牛短小杆菌(Aureobacterium saperdae)、印度固氮菌(Azotobacter indicus)、产氨短杆菌(Brevibacterium ammoniagenes)、叉枝短杆菌(Brevibacterium divaricatum)、乳发酵短杆菌(Brevibacterium lactofermentum)、黄色短杆菌(Brevibacterium flavum)、球形短杆菌(Brevibacterium globosum)、褐色短杆菌(Brevibacterium fuscum)、酮谷氨酸短杆菌(Brevibacterium ketoglutamicum)、Brevibacterium helcolum、Brevibacterium pusillum、需土短杆菌(Brevibacteriumtestaceum)、玫瑰色短杆菌(Brevibacterium roseum)、Brevibacterium immariophilium、扩展短杆菌(Brevibacterium linens)、Brevibacterium protopharmiae、嗜乙酰棒杆菌(Corynebacterium acetophilum)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、美棒杆菌(Corynebacterium callunae)、嗜乙酰乙酸棒杆菌(Corynebacteriumacetoacidophilum)、醋谷棒杆菌(Corynebacterium acetoglutamicum)、产气肠杆菌(Enterobacter aerogenes)、解淀粉欧文氏菌(Erwinia amylovora)、胡萝卜软腐欧文氏菌(Erwinia carotovora)、草生欧文氏菌(Erwinia herbicola)、菊欧文氏菌(Erwiniachrysanthemi)、奇异黄杆菌(Flavobacterium peregrinum)、Flavobacterium fucatum、橙色黄杆菌(Flavobacterium aurantinum)、莱菌黄杆菌(Flavobacterium rhenanum)、缝黄杆菌(Flavobacterium sewanense)、短黄杆菌(Flavobacterium breve)、脑膜炎黄杆菌(Flavobacterium meningosepticum)、微球菌属种CCM825、摩氏变形菌(Morganellamorganii)、不透明诺卡氏菌(Nocardia opaca)、粗糙诺卡氏菌(Nocardia rugosa)、Planococcus eucinatus、雷氏变形菌(Proteus rettgeri)、谢氏丙酸杆菌(Propionibacterium shermanii)、产黄假单胞菌(Pseudomonas synxantha)、氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵状假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、Pseudomonasacidovolans、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonastestosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、红串红球菌(Rhodococcuserythropolis)、玫瑰红红球菌(Rhodococcus rhodochrous)、红球菌属物种ATCC 15592、红球菌属物种ATCC 19070、脲芽孢八叠球菌(Sporosarcina ureae)、金黄色葡萄球菌(Staphylococcus aureus)、麦氏弧菌(Vibrio metschnikovii)、乳酪弧菌(Vibriotyrogenes)、马杜拉诺卡氏菌(Actinomadura madurae)、Actinomycesviolaceochromogenes、Kitasatosporia parulosa、阿维链霉菌(Streptomycesavermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、Streptomyces flavelus、浅灰链霉菌(Streptomyces griseolus)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、抗生链霉菌(Streptomyces antibioticus)、可可链霉菌(Streptomyces cacaoi)、淡紫灰链霉菌(Streptomyces lavendulae)、绿色产色链霉菌(Streptomyces viridochromogenes)、杀鲑气单胞菌(Aeromonas salmonicida)、短小芽孢杆菌(Bacillus pumilus)、环状芽孢杆菌(Bacillus circulans)、解硫胺素芽孢杆菌(Bacillus thiaminolyticus)、弗氏埃希氏菌(Escherichia freundii)、嗜氨微杆菌(Microbacterium ammoniaphilum)、粘质沙雷菌(Serratia marcescens)、鼠伤寒沙门氏菌(Salmonella typhimurium)、肖特苗勒氏沙门氏菌(Salmonella schottmulleri)或柑橘黄单胞菌(Xanthomonas citri)、集胞藻属(Synechocystissp.)、细长集球藻(Synechococcuselongatus)、细长嗜热聚球藻(Thermosynechococcus elongatus)、铜绿微囊藻(Microcystis aeruginosa)、念珠藻属(Nostoc sp.)、普通念珠藻(N.commune)、球形念珠藻(N.sphaericum)、点形念珠藻(Nostoc punctiforme)、钝顶念珠藻(Spirulinaplatensis)、巨大鞘丝藻(Lyngbya majuscula)、赖氏鞘丝藻(L.lagerheimii)、纤细席藻(Phormidium tenue)、鱼腥藻属(Anabaena sp.)、瘦鞘丝藻属(Leptolyngbya sp.)、酵母属(Saccharomyces spec)，如酿酒酵母(Saccharomyces cerevisiae)，汉逊酵母属(Hansenula spec)，如多形汉逊酵母(Hansenula polymorpha)，裂殖酵母属(Schizosaccharomyces spec)，如粟酒裂殖酵母(Schizosaccharomyces pombe)，克鲁维酵母属(Kluyveromyces spec)，如乳酸克鲁维酵母(Kluyveromyces lactis)和马克斯克鲁维酵母(Kluyveromyces marxianus)，耶氏酵母属(Yarrowia spec)，如解脂耶氏酵母(Yarrowia lipolytica)、毕赤酵母属(Pichia spec)，如甲醇毕赤酵母(Pichiamethanolica)、树干毕赤酵母(Pichia stipites)、巴斯德毕赤酵母(Pichia pastoris)，接合酵母属(Zygosaccharomyces spec)，如鲁氏接合酵母(Zygosaccharomyces rouxii)和拜氏接合酵母(Zygosaccharomyces bailii)，假丝酵母属(Candida spec)，如博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candida utilis)、弗里思假丝酵母(Candidafreyschussii)、光滑假丝酵母(Candida glabrata)和Candida sonorensis，许旺酵母属(Schwanniomyces spec)，如西方许旺酵母(Schwanniomyces occidentalis)，阿氏酵母属(Arxula spec)，如解腺嘌呤阿氏酵母(Arxula adeninivorans)，Ogataea spec，如Ogataeaminuta，克雷伯氏菌属(Klebsiella spec)，如肺炎克雷伯氏菌(Klebsiella pneumonia)，曲霉属(Aspergillus spec)，如黑曲霉(Aspergillus niger)或嗜热毁丝霉(Myceliophthora thermophila)。

更优选，重组微生物是玫瑰红红球菌(Rhodococcus rhodochrous)、气球菌属(Aerococcussp.)、曲霉属(Aspergillus sp.)、短小芽孢杆菌(Bacillus pumilus)、枯草芽孢杆菌(Bacillus subtilis)、多形拟杆菌(Bacteroides thetaiotaomicron)、Clostridium algidicarnis、高效棒状杆菌(Corynebacterium efficiens)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、大肠杆菌(Escherichia coli)、沃氏产卤菌(Haloferax volcanii)、干酪乳杆菌(Lactobacillus casei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、热自养甲烷热杆菌(Methanothermobacterthermautotrophicus)、嗜热毁丝霉(Myceliophthora thermophila)、巴斯德毕赤酵母(Pichia pastoris)、产黄假单胞菌(Pseudomonas synxantha)、固氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵形假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、嗜酸假单胞菌(Pseudomonas acidovolans)、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonas testosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、筑波拟酵母(Pseudozyma tsukubaensis)、真养罗氏菌(Ralstonia eutropha)、浑球红细菌(Rhodobacter sphaeroides)、浑浊红球菌(Rhodococcus opacus)、酿酒酵母(Saccharomyces cerevisiae)、鲍氏志贺氏菌(Shigella boydii)、草木樨中华根瘤菌(Sinorhizobium meliloti)、抗生链霉菌(Streptomyces antibioticus)、阿维链霉菌(Streptomyces avermitilis)、可可链霉菌(Streptomyces cacaoi)、天蓝色链霉菌(Streptomyces coelicolor)、黄链霉菌(Streptomyces flavelus)、浅灰链霉菌(Streptomyces griseolus)、淡紫灰链霉菌(Streptomyces lavendulae)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、绿色产色链霉菌(Streptomyces viridochromogenes)、嗜酸热原体(Thermoplasma acidophilum)、需钠弧菌(Vibrio natrigens)或解脂耶氏酵母(Yarrowia lipolytica)。

本发明的另一个实施方案是一种组合物，其包含水、一种或多种激酶1、一种或多种激酶2、isoprenol和/或prenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²)，其中激酶1选自

在包含水、一种或多种激酶1、一种或多种激酶2、isoprenol和/或prenol和任选的核苷酸三磷酸(优选ATP)和二价阳离子(优选Mg²)的组合物的另一个实施方案中，激酶2选自以下：

本发明的另一个实施方案是重组微生物，其包含引入、增加或增强的一种或多种激酶1、一种或多种激酶2和任选地能够产生一种或多种类异戊二烯(优选橙花叔醇、法呢醇或法呢烯)的一种或多种途径的活性和/或表达，

其中一种或多种激酶1能够催化从prenol和/或isoprenol至异戊烯磷酸和/或二甲基烯丙基磷酸的反应，并且其中一种或多种激酶2能够催化从异戊烯磷酸和/或二甲基烯丙基磷酸至异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的反应，和

其中激酶1包含选自以下的序列：

其中如b.、c.、d.和e.中限定的氨基酸分子催化水性介质中从isoprenol和/或prenol到异戊烯磷酸和/或二甲基烯丙基的反应。

在包含引入的、增加的或增强的一种或多种激酶1、一种或多种激酶2和任选地能够产生一种或多种类异戊二烯(优选橙花叔醇、法呢醇或法呢烯)的一种或多种途径的活性和/或表达的重组微生物的另一个实施方案中，激酶2包含选自以下的序列：

本发明的另一个实施方案是用于发酵生产一种或多种类异戊二烯(优选橙花叔醇、法呢醇或法呢烯)或异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法，其包括以下步骤：

i.提供重组微生物，其包含引入的、增加的或增强的一种或多种激酶1、一种或多种激酶2和任选地能够产生一种或多种类异戊二烯的一种或多种途径的活性和/或表达，

ii.在允许产生所述一种或多种类异戊二烯或其盐或异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的条件下，在包含prenol和/或isoprenol的介质中培养所述微生物，并任选地从介质分离所述一种或多种类异戊二烯或其盐或异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐。

本发明的另一个实施方案是包含一种或多种重组微生物的组合物，所述重组微生物包含引入的、增加的或增强的一种或多种激酶1、一种或多种激酶2和任选地能够产生一种或多种类异戊二烯的一种或多种途径的活性和/或表达。

在一个实施方案中，所述组合物还包含prenol和/或isoprenol、介质和碳源。

本发明的再一个实施方案是一种生产重组微生物的方法，所述重组微生物包含引入的、增加的或增强的一种或多种激酶1、一种或多种激酶2和任选地能够产生一种或多种类异戊二烯(优选橙花叔醇、法呢醇或法呢烯)的一种或多种途径的活性和/或表达，所述方法包括以下步骤：

(I)在所述微生物中引入、增加或增强编码具有prenol和/或isoprenol磷酸化活性的激酶1酶的激酶1基因的活性和/或表达；和

(II)在所述微生物中引入、增加或增强编码具有异戊烯基磷酸和/或二甲基烯丙基磷酸磷酸化活性的激酶2酶的激酶2基因的活性和/或表达；和任选地

(III)在所述微生物中进一步引入、增加或增强类异戊二烯产生途径的活性和/或表达。

根据如上限定的方法生产的或发酵生产一种或多种类异戊二烯或其盐或异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法中使用的重组微生物优选选自氧化葡糖杆菌(Gluconobacter oxydans)、浅井氏葡糖杆菌(Gluconobacter asaii)、德尔马瓦无色杆菌(Achromobacter delmarvae)、粘无色杆菌(Achromobacter viscosus)、乳无色杆菌(Achromobacter lacticum)、根癌土壤杆菌(Agrobacterium tumefaciens)、放射形土壤杆菌(Agrobacterium radiobacter)、粪产碱菌(Alcaligenes faecalis)、柠檬节杆菌(Arthrobacter citreus)、肿胀节杆菌(Arthrobacter tumescens)、石蜡节杆菌(Arthrobacter paraffineus)、Arthrobacter hydrocarboglutamicus、氧化节杆菌(Arthrobacter oxydans)、天牛短小杆菌(Aureobacterium saperdae)、印度固氮菌(Azotobacter indicus)、产氨短杆菌(Brevibacterium ammoniagenes)、叉枝短杆菌(Brevibacterium divaricatum)、乳发酵短杆菌(Brevibacterium lactofermentum)、黄色短杆菌(Brevibacterium flavum)、球形短杆菌(Brevibacterium globosum)、褐色短杆菌(Brevibacterium fuscum)、酮谷氨酸短杆菌(Brevibacterium ketoglutamicum)、Brevibacterium helcolum、Brevibacterium pusillum、需土短杆菌(Brevibacteriumtestaceum)、玫瑰色短杆菌(Brevibacterium roseum)、Brevibacterium immariophilium、扩展短杆菌(Brevibacterium linens)、Brevibacterium protopharmiae、嗜乙酰棒杆菌(Corynebacterium acetophilum)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、美棒杆菌(Corynebacterium callunae)、嗜乙酰乙酸棒杆菌(Corynebacteriumacetoacidophilum)、醋谷棒杆菌(Corynebacterium acetoglutamicum)、产气肠杆菌(Enterobacter aerogenes)、解淀粉欧文氏菌(Erwinia amylovora)、胡萝卜软腐欧文氏菌(Erwinia carotovora)、草生欧文氏菌(Erwinia herbicola)、菊欧文氏菌(Erwiniachrysanthemi)、奇异黄杆菌(Flavobacterium peregrinum)、Flavobacterium fucatum、橙色黄杆菌(Flavobacterium aurantinum)、莱菌黄杆菌(Flavobacterium rhenanum)、缝黄杆菌(Flavobacterium sewanense)、短黄杆菌(Flavobacterium breve)、脑膜炎黄杆菌(Flavobacterium meningosepticum)、微球菌属种CCM825、摩氏变形菌(Morganellamorganii)、不透明诺卡氏菌(Nocardia opaca)、粗糙诺卡氏菌(Nocardia rugosa)、Planococcus eucinatus、雷氏变形菌(Proteus rettgeri)、谢氏丙酸杆菌(Propionibacterium shermanii)、产黄假单胞菌(Pseudomonas synxantha)、氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵状假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、Pseudomonasacidovolans、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonastestosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、红串红球菌(Rhodococcuserythropolis)、玫瑰红红球菌(Rhodococcus rhodochrous)、红球菌属物种ATCC 15592、红球菌属物种ATCC 19070、脲芽孢八叠球菌(Sporosarcina ureae)、金黄色葡萄球菌(Staphylococcus aureus)、麦氏弧菌(Vibrio metschnikovii)、乳酪弧菌(Vibriotyrogenes)、马杜拉诺卡氏菌(Actinomadura madurae)、Actinomycesviolaceochromogenes、Kitasatosporia parulosa、阿维链霉菌(Streptomycesavermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、Streptomyces flavelus、浅灰链霉菌(Streptomyces griseolus)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、抗生链霉菌(Streptomyces antibioticus)、可可链霉菌(Streptomyces cacaoi)、淡紫灰链霉菌(Streptomyces lavendulae)、绿色产色链霉菌(Streptomyces viridochromogenes)、杀鲑气单胞菌(Aeromonas salmonicida)、短小芽孢杆菌(Bacillus pumilus)、环状芽孢杆菌(Bacillus circulans)、解硫胺素芽孢杆菌(Bacillus thiaminolyticus)、弗氏埃希氏菌(Escherichia freundii)、嗜氨微杆菌(Microbacterium ammoniaphilum)、粘质沙雷菌(Serratia marcescens)、鼠伤寒沙门氏菌(Salmonella typhimurium)、肖特苗勒氏沙门氏菌(Salmonella schottmulleri)或柑橘黄单胞菌(Xanthomonas citri)、集胞藻属(Synechocystissp.)、细长集球藻(Synechococcuselongatus)、细长嗜热聚球藻(Thermosynechococcus elongatus)、铜绿微囊藻(Microcystis aeruginosa)、念珠藻属(Nostoc sp.)、普通念珠藻(N.commune)、球形念珠藻(N.sphaericum)、点形念珠藻(Nostoc punctiforme)、钝顶念珠藻(Spirulinaplatensis)、巨大鞘丝藻(Lyngbya majuscula)、赖氏鞘丝藻(L.lagerheimii)、纤细席藻(Phormidium tenue)、鱼腥藻属(Anabaena sp.)、瘦鞘丝藻属(Leptolyngbya sp.)、酵母属(Saccharomyces spec)，如酿酒酵母(Saccharomyces cerevisiae)，汉逊酵母属(Hansenula spec)，如多形汉逊酵母(Hansenula polymorpha)，裂殖酵母属(Schizosaccharomyces spec)，如粟酒裂殖酵母(Schizosaccharomyces pombe)，克鲁维酵母属(Kluyveromyces spec)，如乳酸克鲁维酵母(Kluyveromyces lactis)和马克斯克鲁维酵母(Kluyveromyces marxianus)，耶氏酵母属(Yarrowia spec)，如解脂耶氏酵母(Yarrowia lipolytica)、毕赤酵母属(Pichia spec)，如甲醇毕赤酵母(Pichiamethanolica)、树干毕赤酵母(Pichia stipites)、巴斯德毕赤酵母(Pichia pastoris)，接合酵母属(Zygosaccharomyces spec)，如鲁氏接合酵母(Zygosaccharomyces rouxii)和拜氏接合酵母(Zygosaccharomyces bailii)，假丝酵母属(Candida spec)，如博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candida utilis)、弗里思假丝酵母(Candidafreyschussii)、光滑假丝酵母(Candida glabrata)和Candida sonorensis，许旺酵母属(Schwanniomyces spec)，如西方许旺酵母(Schwanniomyces occidentalis)，阿氏酵母属(Arxula spec)，如解腺嘌呤阿氏酵母(Arxula adeninivorans)，Ogataea spec，如Ogataeaminuta，克雷伯氏菌属(Klebsiella spec)，如肺炎克雷伯氏菌(Klebsiella pneumonia)，曲霉属(Aspergillus spec)，如黑曲霉(Aspergillus niger)或嗜热毁丝霉(Myceliophthora thermophila)。

本发明的再一个实施方案是重组表达构建体，其包含

i.功能性地连接编码激酶1的核酸分子的在微生物中有功能的启动子，和

ii.功能性地连接编码激酶2的核酸分子的在微生物中有功能的启动子，

其中至少一个功能性地连接激酶1或激酶2的启动子与激酶1或激酶2是异源的，

其中激酶1包含编码选自以下的氨基酸分子的序列：

在重组表达构建体的一个实施方案中，所述重组表达构建体包含

其中至少一个功能性地连接激酶1或激酶2的启动子与激酶1或激酶2是异源的，激酶2包含编码选自以下的氨基酸分子的序列：

激酶1和激酶2可以各自在异源启动子的控制下，或者可以排列在与激酶1、激酶2或两者异源的一种启动子的控制下的操纵子中。操纵子可以包含从IPP和/或DMAPP产生优选的类异戊二烯所必需的其他基因。

与SEQ ID NO 1、4、7、10、13、16、19、22、25、28、31、34、37、40、43、46、49、52、55、58、61、64、67、70、73、76、79、82、85、88、91、94、97、100、103、106、111、114、117、120、123、126、129、132、135、138、141、144、147、150、153、156、159、162、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、234、237、240、243、246、249、252、255、258、261、264、267、270、273、276、279、282、285、288、291、294、297、300、303、306、309、312、315、318、321、324、327、330、333、336、339、342、345、348、351、354、357、360、363、366、369、372、375、378、381、384、387、390、393、396、399、402、405、408、411、414、417、420、423、426、429、432、435、438、441、444、447、450、453、456、459、462、465、468、471、474、477、480、483或486中的任一个序列具有特定同一性的氨基酸分子包括与SEQ IDNO:1、4、7、10、13、16、19、22、25、28、31、34、37、40、43、46、49、52、55、58、61、64、67、70、73、76、79、82、85、88、91、94、97、100、103、106、111、114、117、120、123、126、129、132、135、138、141、144、147、150、153、156、159、162、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、234、237、240、243、246、249、252、255、258、261、264、267、270、273、276、279、282、285、288、291、294、297、300、303、306、309、312、315、318、321、324、327、330、333、336、339、342、345、348、351、354、357、360、363、366、369、372、375、378、381、384、387、390、393、396、399、402、405、408、411、414、417、420、423、426、429、432、435、438、441、444、447、450、453、456、459、462、465、468、471、474、477、480、483或486中的任一个序列具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的氨基酸分子。

与SEQ ID NO 2、3、5、6、8、9、11、12、14、15、17、18、20、21、23、24、26、27、29、30、32、33、35、36、38、39、41、42、44、45、47、48、50、51、53、54、56、57、59、60、62、63、65、66、68、69、71、72、74、75、77、78、80、81、83、84、86、87、89、90、92、93、95、96、98、99、101、102、104、105、107、108、109、110、112、115、118、121、124、127、130、133、136、139、142、145、148、151、154、157、160、163、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、235、238、241、244、247、250、253、256、259、262、265、268、271、274、277、280、283、286、289、292、295、298、301、304、307、310、313、316、319、322、325、349、358、361、367、379、388、394、397、412、430、442、445、448、463、478、481、484、487、113、116、119、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、233、236、239、242、245、248、251、254、257、260、263、266、269、272、275、278、281、284、287、290、293、296、299、302、305、308、311、314、317、320、323、326、329、332、335、338、341、344、347、350、353、356、359、362、365、368、371、374、377、380、383、386、389、392、395、398、401、404、407、410、413、416、419、422、425、428、431、434、437、440、443、446、449、452、455、458、461、464、467、470、473、476、479、482、485或488中的任一个具有特定同一性的核酸分子包括与SEQ ID NO:2、3、5、6、8、9、11、12、14、15、17、18、20、21、23、24、26、27、29、30、32、33、35、36、38、39、41、42、44、45、47、48、50、51、53、54、56、57、59、60、62、63、65、66、68、69、71、72、74、75、77、78、80、81、83、84、86、87、89、90、92、93、95、96、98、99、101、102、104、105、107、108、109、110、112、115、118、121、124、127、130、133、136、139、142、145、148、151、154、157、160、163、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、235、238、241、244、247、250、253、256、259、262、265、268、271、274、277、280、283、286、289、292、295、298、301、304、307、310、313、316、319、322、325、349、358、361、367、379、388、394、397、412、430、442、445、448、463、478、481、484、487、113、116、119、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、233、236、239、242、245、248、251、254、257、260、263、266、269、272、275、278、281、284、287、290、293、296、299、302、305、308、311、314、317、320、323、326、329、332、335、338、341、344、347、350、353、356、359、362、365、368、371、374、377、380、383、386、389、392、395、398、401、404、407、410、413、416、419、422、425、428、431、434、437、440、443、446、449、452、455、458、461、464、467、470、473、476、479、482、485或488中的任一个具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的核酸分子。

本发明的氨基酸分子的功能性片段包含SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34、37、40、43、46、49、52、55、58、61、64、67、70、73、76、79、82、85、88、91、94、97、100、103、106、111、114、117、120、123、126、129、132、135、138、141、144、147、150、153、156、159、162、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、234、237、240、243、246、249、252、255、258、261、264、267、270、273、276、279、282、285、288、291、294、297、300、303、306、309、312、315、318、321、324、327、330、333、336、339、342、345、348、351、354、357、360、363、366、369、372、375、378、381、384、387、390、393、396、399、402、405、408、411、414、417、420、423、426、429、432、435、438、441、444、447、450、453、456、459、462、465、468、471、474、477、480、483或486的任一个序列的至少50个连续氨基酸，优选至少75个连续氨基酸，更优选至少100个连续氨基酸，更优选至少125个连续氨基酸，更优选至少150个连续氨基酸，甚至更优选至少175个连续氨基酸，甚至更优选至少200个连续氨基酸，甚至更优选至少225个连续氨基酸，最优选至少250个连续氨基酸。

本发明的再一个实施方案是包含重组表达构建体的重组载体，所述重组表达构建体包含

其中至少一个功能性地连接激酶1或激酶2的启动子与激酶1或激酶2是异源的。激酶1和激酶2可以各自在异源启动子的控制下，或者可以在操纵子中排列在与激酶1、激酶2或两者异源的一个启动子的控制下。操纵子可以包含从IPP和/或DMAPP产生优选的类异戊二烯所必需的其他基因。

本发明的再一个实施方案是重组微生物，其包含a)重组表达构建体，其包含功能性地连接编码激酶1的核酸分子的在微生物中有功能的启动子，和功能性地连接编码激酶2的核酸分子的在微生物中有功能的启动子，其中至少一个功能性地连接激酶1或激酶2的启动子与激酶1或激酶2是异源的，或b)包含所述重组表达构建体的重组载体。

优选地，重组微生物是玫瑰红红球菌(Rhodococcus rhodochrous)、气球菌属(Aerococcussp.)、曲霉属(Aspergillus sp.)、短小芽孢杆菌(Bacillus pumilus)、枯草芽孢杆菌(Bacillus subtilis)、多形拟杆菌(Bacteroides thetaiotaomicron)、Clostridium algidicarnis、高效棒状杆菌(Corynebacterium efficiens)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、大肠杆菌(Escherichia coli)、沃氏产卤菌(Haloferax volcanii)、干酪乳杆菌(Lactobacillus casei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、热自养甲烷热杆菌(Methanothermobacterthermautotrophicus)、嗜热毁丝霉(Myceliophthora thermophila)、巴斯德毕赤酵母(Pichia pastoris)、产黄假单胞菌(Pseudomonas synxantha)、固氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵形假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、嗜酸假单胞菌(Pseudomonas acidovolans)、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonas testosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、筑波拟酵母(Pseudozyma tsukubaensis)、真养罗氏菌(Ralstonia eutropha)、浑球红细菌(Rhodobacter sphaeroides)、浑浊红球菌(Rhodococcus opacus)、酿酒酵母(Saccharomyces cerevisiae)、鲍氏志贺氏菌(Shigella boydii)、草木樨中华根瘤菌(Sinorhizobium meliloti)、抗生链霉菌(Streptomyces antibioticus)、阿维链霉菌(Streptomyces avermitilis)、可可链霉菌(Streptomyces cacaoi)、天蓝色链霉菌(Streptomyces coelicolor)、黄链霉菌(Streptomyces flavelus)、浅灰链霉菌(Streptomyces griseolus)、淡紫灰链霉菌(Streptomyces lavendulae)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、绿色产色链霉菌(Streptomyces viridochromogenes)、嗜酸热原体(Thermoplasma acidophilum)、需钠弧菌(Vibrio natrigens)或解脂耶氏酵母(Yarrowia lipolytica)。

本发明的另一个实施方案是一种培养或如上限定的重组微生物或使其生长的方法，包括用一种或多种所述重组微生物接种介质，并在包含prenol和/或isoprenol的介质中培养所述重组微生物或使其生长。

本发明的另一个实施方案是如上限定的重组微生物或如上限定的组合物用于将prenol和/或isoprenol全细胞生物转化为一种或多种类异戊二烯或其盐或者异戊烯焦磷酸或其盐和/或二甲基烯丙基焦磷酸或其盐的用途。

本发明的另一个实施方案是将prenol和/或isoprenol全细胞生物转化为一种或多种类异戊二烯或其盐或者IPP或其盐和/或DMAPP或其盐的方法，包括以下步骤：

i)在包含prenol和/或isoprenol、适于所述重组微生物生长的介质和碳源的发酵罐中使如上限定的重组微生物生长，和

ii)从i)中获得的发酵液收集一种或多种类异戊二烯或其盐或者IPP或其盐和/或DMAPP或其盐。

i)使如上定义的重组微生物在发酵罐中生长，所述发酵罐包含适于所述重组微生物生长的介质和碳源，和

ii)从发酵罐中收集重组微生物，和

iii)通过补充isoprenol/prenol在介质中进行全细胞生物转化，和

iv)从iii)中获得的介质收集一种或多种类异戊二烯或其盐或IPP和/或DMAPP。

定义

应当理解，本发明不限于特定的方法或方案。还应理解，本文使用的术语仅用于描述特定实施方案的目的，并不旨在限制本发明的范围，其仅由所附权利要求限制。必须注意，除非上下文另有明确规定，否则如本文和所附权利要求中所用，单数形式“一个(a)”、“一个(an)”和“该(the)”包括复数指代。因此，例如，提及“载体”是指一种或多种载体，并且包括本领域技术人员已知的其等同物，等等。术语“约”在本文中用于表示大约、大致、周围或在……的区域中。术语“约”与数值范围结合使用时，它通过将边界扩展到所述数值上下来修饰该范围。通常，术语“约”在本文中用于以20％的变化在所述值上下修饰数值，优选地向上或向下(更高或更低)10％。如本文所用，词语“或”意指特定列表的任何一个成员，并且还包括该列表的成员的任何组合。在本说明书和所附权利要求中使用时，词语“包含(comprise)”、“包含(comprising)”、“包括(include)”、“包括(including)”和“包括(includes)”旨在指定一个或多个所述特征、整数、部件或步骤的存在，但不排除一个或多个其他特征、整数、部件、步骤或其组的存在或添加。为清楚起见，说明书中使用的某些术语定义和使用如下：

反向平行：“反向平行”在本文中是指通过互补碱基残基之间的氢键配对的两个核苷酸序列，其中磷酸二酯键在一个核苷酸序列中以5'-3'方向延伸，并且在另一个核苷酸序列中以3'-5'方向延伸。

反义：术语“反义”是指相对于其转录或功能的正常方向反转的核苷酸序列，且因此表达与宿主细胞内表达的靶基因mRNA分子互补的RNA转录物(例如，它可以通过Watson-Crick碱基配对与靶基因mRNA分子或单链基因组DNA杂交)或与靶DNA分子(如，例如，存在于宿主细胞中的基因组DNA)互补的RNA转录物。

编码区：如本文所用，提及结构基因使用时，术语“编码区”是指编码由于mRNA分子的翻译而在新生多肽中发现的氨基酸的核苷酸序列。在真核生物中，编码区在5'侧由编码起始甲硫氨酸的核苷酸三联体“ATG”界定，并且在3'侧由指定终止密码子的三个三联体(即TAA、TAG、TGA)之一界定。除了含有内含子之外，基因的基因组形式还可以包括位于RNA转录物上存在的序列的5'-和3'-端的序列。这些序列被称为“侧翼”序列或区域(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5'或3')。5'-侧翼区可含有调控序列，如控制或影响基因转录的启动子和增强子。3'-侧翼区可含有指导转录终止、转录后切割和聚腺苷酸化的序列。

互补：“互补”或“互补性”是指包含反平行核苷酸序列的两个核苷酸序列，所述反向平行核苷酸序列能够在反平行核苷酸序列中的互补碱基残基之间形成氢键时彼此配对(通过碱基配对规则)。例如，序列5'-AGT-3'与序列5'-ACT-3'互补。互补性可以是“部分的”或“全部的”。“部分”互补性是指其中一个或多个核酸碱基根据碱基配对规则不匹配。核酸分子之间的“全部”或“完全”互补性是其中每个核酸碱基在碱基配对规则下与另一个碱基匹配。核酸分子链之间的互补程度对核酸分子链之间杂交的效率和强度具有显著影响。如本文所用的核酸序列的“互补序列”是指其核酸分子显示出与核酸序列的核酸分子的完全互补性的核苷酸序列。

供体DNA分子：如本文所用，术语“供体DNA分子”、“修复DNA分子”或“模板DNA分子”在本文中均可互换使用，意指具有待引入细胞基因组中的序列的DNA分子。它可以在5'和/或3'端侧接与所述细胞基因组的靶区域中的序列同源或相同的序列。它可以包含在相应细胞中不天然存在的序列，如ORF、非编码RNA或应引入靶区域中的调控元件，或可以包含除了至少一个突变之外与靶区域同源的序列。基因编辑：供体DNA分子的序列可以添加到基因组中，或可以替换供体DNA序列长度的基因组中的序列。

双链RNA：“双链RNA”分子或“dsRNA”分子包含核苷酸序列的有义RNA片段和核苷酸序列的反义RNA片段，其均包含彼此互补的核苷酸序列，从而允许有义和反义RNA片段配对并形成双链RNA分子。

内源性：“内源性”核苷酸序列是指存在于未转化细胞的基因组中的核苷酸序列。

表达：“表达”是指基因产物的生物合成，优选地是指细胞中核苷酸序列(例如内源基因或异源基因)的转录和/或翻译。例如，在结构基因的情况下，表达涉及结构基因转录成mRNA和任选地随后mRNA翻译成一种或多种多肽。在其他情况下，表达可以仅指携带RNA分子的DNA的转录。

表达构建体：如本文所用的“表达构建体”意指能够指导特定核苷酸序列在细胞中表达的DNA序列，其包含在其将被引入的所述细胞中起作用的启动子，所述启动子可操作地连接目的核苷酸序列，所述目的核苷酸序列任选地可操作地连接终止信号。如果需要翻译，其通常还包含核苷酸序列正确翻译所需的序列。编码区可以编码目的蛋白质，但也可以在有义或反义方向上编码目的功能性RNA，例如RNAa、siRNA、snoRNA、snRNA、microRNA、ta-siRNA或任何其他非编码调节RNA。包含目的核苷酸序列的表达构建体可以是嵌合的，这意味着其一个或多个组分相对于其一个或多个其他组分是异源的。表达构建体也可以是天然存在但以可用于异源表达的重组形式获得的表达构建体。然而，通常，表达构建体相对于宿主是异源的，即表达构建体的特定DNA序列不天然存在于宿主细胞中，并且必须通过转化事件引入宿主细胞或宿主细胞的祖先中。表达构建体中核苷酸序列的表达可以在组成型启动子的控制下，或诱导型启动子的控制下，其仅在宿主细胞暴露于一些特定的外部刺激时才启动转录。

外源：术语“外源”是指通过实验操作引入细胞基因组中的任何核酸分子(例如，基因序列)，并且可以包括在该细胞中发现的序列，只要引入的序列含有一些修饰(例如，点突变、选择性标记基因的存在等)，且因此相对于天然存在的序列是不同的。

功能性连接：术语“功能性连接”或“功能性地连接”应理解为意指例如调控元件(例如启动子)与待表达的核酸序列以及(如果合适的话)其他调控元件(如，例如，终止子)的顺序排列，使得每个调控元件可以实现其预期功能以允许、修饰、促进或以其他方式影响所述核酸序列的表达。作为同义词，可以使用措辞“可操作的连接”或“可操作地连接”。表达可以根据核酸序列相对于有义或反义RNA的排列而产生。为此，不一定需要化学意义上的直接连接。遗传控制序列(如，例如增强子序列)也可以从更远的位置或实际上从其他DNA分子对靶序列发挥其功能。优选的排列是其中待重组表达的核酸序列位于作为启动子的序列后，使得两个序列彼此共价连接的那些。启动子序列和待重组表达的核酸序列之间的距离优选小于200个碱基对，特别优选小于100个碱基对，非常特别优选小于50个碱基对。在优选的实施方案中，待转录的核酸序列位于启动子后，使得转录起始与本发明的嵌合RNA的所需起始相同。功能连接和表达构建体可以通过所述的常规重组和克隆技术产生(例如，Maniatis T，Fritsch EF和Sambrook J(1989)Molecular Cloning：A Laboratory Manual，第2版，Cold Spring Harbor Laboratory，Cold Spring Harbor(NY)；Silhavy等(1984)Experiments with Gene Fusions，Cold Spring Harbor Laboratory，Cold SpringHarbor(NY)；Ausubel等(1987)Current Protocols in Molecular Biology，GreenePublishing Assoc and Wiley Interscience)。然而，例如充当具有限制酶的特异性切割位点的接头或充当信号肽的其他序列也可以位于两个序列之间。序列的插入也可导致融合蛋白的表达。优选地，由调控区(例如启动子)和待表达的核酸序列的连接组成的表达构建体可以以载体整合的形式存在并例如通过转化插入基因组中。

基因：术语“基因”是指可操作地连接到能够以某种方式调控基因产物(例如，多肽或功能性RNA)的表达的适当调节序列的区域。基因包括编码区(开放阅读框，ORF)之前(上游)和之后(下游)的DNA的非翻译调控区(例如，启动子、增强子、阻遏物等)，以及在适用的情况下，各个编码区(即外显子)之间的间插序列(即内含子)。如本文所用的术语“结构基因”旨在意指转录成mRNA的DNA序列，该mRNA然后翻译成特定多肽的特征性氨基酸序列。

在本文中使用时，“基因编辑”意指在细胞基因组的特定位置处引入特定突变。可以通过应用更先进的技术的精确编辑来引入基因编辑，例如使用CRISPR Cas系统和供体DNA，或与诱变活性相关的CRISPR Cas系统，如脱氨酶(WO15133554、WO17070632)。

基因组和基因组DNA：术语“基因组”或“基因组DNA”是指宿主生物体的可遗传遗传信息。所述基因组DNA包含细胞核的DNA(也称为染色体DNA)，但也包含质体(例如叶绿体)和其他细胞器(例如线粒体)的DNA。优选，术语基因组或基因组DNA是指细胞核的染色体DNA。

异源的：关于核酸分子或DNA的术语“异源的”是指与第二核酸分子可操作地连接或被操纵以变得与第二核酸分子可操作地连接的核酸分子，所述第二核酸分子例如在自然界中(例如在WT细胞的基因组中)不与之可操作地连接的启动子，或在自然界中在不同地点或位置处(例如在WT细胞的基因组中)与之可操作地连接的启动子。

优选，关于核酸分子或DNA的术语“异源的”是指与第二核酸分子可操作地连接或被操纵以变得与第二核酸分子可操作地连接的核酸分子，所述第二核酸分子例如在自然界中不与之可操作地连接的启动子或开放阅读框。

包含核酸分子和与其连接的一个或多个调控核酸分子(如启动子或转录终止信号)的异源表达构建体例如是源自实验操作的构建体，其中a)所述核酸分子，或b)所述调控核酸分子，或c)两者(即(a)和(b))不位于其自然(天然)遗传环境中或已通过实验操作修饰，修饰的实例是一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境是指起源生物体中的天然染色体基因座，或是指基因组文库中的存在。在基因组文库的情况下，优选至少部分地保留核酸分子序列的天然遗传环境。环境至少在一侧侧接核酸序列，并且具长度为有至少50bp，优选至少500bp，特别优选至少1,000bp，非常特别优选至少5,000bp的序列。天然存在的表达构建体-例如启动子与相应基因的天然存在的组合-当其通过非天然的、合成的“人工”方法(例如诱变)修饰时变成转基因表达构建体。这些方法已有描述(US 5,565,350；WO 00/15815)。例如，认为与启动子(其不是该分子的天然启动子)可操作地连接的编码蛋白质的核酸分子相对于启动子是异源的。优选地，异源DNA对于其被引入的细胞不是内源的或不是与其天然相关的，而是已经从另一种细胞获得或已经合成。异源DNA还包括内源DNA序列，其含有内源DNA序列的一些修饰、非天然存在的多个拷贝，或不是天然与其物理连接的另一DNA序列天然相关的DNA序列。通常，尽管不是必需的，但异源DNA编码通常不由表达它的细胞产生的RNA或蛋白质。

杂交：如本文所定义的术语“杂交”是其中基本上互补的核苷酸序列彼此退火的过程。杂交过程可以完全在溶液中发生，即两种互补核酸都在溶液中。杂交过程也可以在互补核酸之一固定于基质(如磁珠、琼脂糖珠或任何其他树脂)的情况下发生。杂交过程也可以在如下情况下发生：互补核酸之一固定于固体支持物(如硝酸纤维素或尼龙膜)上，或通过例如光刻法固定于例如硅质玻璃支持物(后者称为核酸阵列或微阵列或核酸芯片)上。为了允许杂交发生，通常将核酸分子热变性或化学变性以将双链解链成两条单链和/或从单链核酸中除去发夹或其他二级结构。

术语“严格性”是指发生杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常，选择低严格性条件为在限定的离子强度和pH下比特定序列的热解链点(Tm)低约30℃。中等严格条件是温度比Tm低20℃时，并且高严格条件是温度比Tm低10℃时。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。然而，由于遗传密码的简并性，核酸可能在序列上偏离并且仍然编码基本上相同的多肽。因此，有时可能需要中等严格性杂交条件来鉴定此类核酸分子。

“Tm”是在限定的离子强度和pH下的温度，在该温度下50％的靶序列与完全匹配的探针杂交。Tm取决于溶液条件以及探针的碱基组成和长度。例如，较长的序列在较高温度下特异性杂交。从低于Tm约16℃至32℃获得最大杂交速率。杂交溶液中一价阳离子的存在降低了两条核酸链之间的静电排斥，从而促进杂交体形成；对于高达0.4M的钠浓度，这种效应是可见的(对于较高浓度，这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度，每百分比甲酰胺降低0.6至0.7℃，并且添加50％甲酰胺允许杂交在30至45℃下进行，尽管杂交速率将降低。碱基对错配降低了双链体的杂交速率和热稳定性。平均而言，且对于大探针，每％碱基错配Tm降低约1℃。根据杂合体的类型，可以使用以下等式计算Tm：

DNA-DNA杂交体(Meinkoth和Wahl，Anal.Biochem.，138：267-284,1984)：

Tm＝81.5℃+16.6×log[Na+]A+0.41x％[G/Cb]-500x[Lc]-1-0.61×％甲酰胺

DNA-RNA或RNA-RNA杂合体：

Tm＝79.8+18.5(Log10[Na+]a)+0.58(％G/Cb)+11.8(％G/Cb)2-820/LC

寡-DNA或寡-RNAd杂交体：

对于<20个核苷酸：Tm＝2(ln)

对于20-35个核苷酸：Tm＝22+1.46(ln)

a或对于其它一价阳离子，但仅在0.01-0.4M范围内准确。

b仅在30％至75％范围内准确。

c L＝以碱基对计的双链体长度。

d Oligo，寡核苷酸；In，引物的有效长度＝2*(G/C的数量)+(A/T的数量)。

可以使用许多已知技术中的任何一种来控制非特异性结合，例如用含蛋白质的溶液封闭膜，向杂交缓冲液中添加异源RNA、DNA和SDS，以及用RNA酶处理。对于非相关探针，可以通过改变(i)逐渐降低退火温度(例如从68℃至42℃)或(ii)逐渐降低甲酰胺浓度(例如从50％至0％)中的一种来进行一系列杂交。本领域技术人员知道可以在杂交期间改变并且将维持或改变严格条件的各种参数。

除了杂交条件之外，杂交的特异性通常还取决于杂交后洗涤的功能。为了去除由非特异性杂交产生的背景，用稀盐溶液洗涤样品。这种洗涤的关键因素包括最终洗涤溶液的离子强度和温度：盐浓度越低和洗涤温度越高，洗涤的严格性越高。洗涤条件通常在杂交严格性下或低于杂交严格性下进行。阳性杂交产生至少是背景信号两倍的信号。通常，用于核酸杂交测定或基因扩增检测程序的合适的严格条件如上所述。也可以选择更严格或更不严格的条件。本领域技术人员知道可以在洗涤期间改变并且将维持或改变严格性条件的各种参数。

例如，长于50个核苷酸的DNA杂交体的典型高严格性杂交条件包括在65℃下在1×SSC中或在42℃下在1×SSC和50％甲酰胺中杂交，然后在65℃下在0.3×SSC中洗涤。长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在50℃下在4×SSC中或在40℃下在6×SSC和50％甲酰胺中杂交，然后在50℃下在2×SSC中洗涤。杂交体的长度是杂交核酸的预期长度。杂交已知序列的核酸时，可以通过比对序列并鉴定本文所述的保守区域来确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠；杂交溶液和洗涤溶液可以另外包括5×Denhardt’s试剂、0.5-1.0％SDS、100μg/ml变性的片段化鲑鱼精子DNA、0.5％焦磷酸钠。高严格性条件的另一个实例是在65℃下在包含0.1×SDS和任选的5×Denhardt’s试剂、100μg/ml变性的片段化鲑鱼精子DNA、0.5％焦磷酸钠的0.1×SSC中杂交，然后在65℃下在0.3×SSC中洗涤。

为了确定严格性水平，可以参考Sambrook等(2001)Molecular Cloning：ALaboratory Manual，第3版，Cold Spring Harbor Laboratory Press，CSH，New York或Current Protocols in Molecular Biology，John Wiley&Sons，N.Y.(1989和年度更新)。

“同一性”：关于两个或更多个核酸或氨基酸分子的比较使用时，“同一性”意指所述分子的序列共享一定程度的序列相似性，所述序列是部分相同的。

与亲本酶相比时，酶变体可以通过它们的序列同一性来定义。序列同一性通常以“％序列同一性”或“％同一性”提供。为了在第一步中确定两个氨基酸序列之间的同一性百分比，在这两个序列之间产生成对序列比对，其中两个序列在其完整长度上比对(即，成对全局比对)。用实施Needleman和Wunsch算法的程序(J.Mol.Biol.(1979)48，第443-453页)产生比对，优选通过使用程序“NEEDLE”(欧洲分子生物学开放软件套件(EMBOSS))，其具有程序默认参数(空位开放＝10.0，空位延伸＝0.5和矩阵＝EBLOSUM62)。出于本发明的目的，优选的比对是可以确定最高序列同一性的比对。

以下实施例旨在说明两个核苷酸序列，但相同的计算适用于蛋白质序列：

SEQ A：AAGATACTG长度：9个碱基

SEQ B：GATCTGA长度：7个碱基

因此，较短的序列是序列B。

产生显示两个序列在其完整长度上的成对全局比对导致

Seq A:AAGATACTG-

||||||

Seq B:--GAT-CTGA

比对中的“|”符号表示相同的残基(其意指DNA的碱基或蛋白质的氨基酸)。相同残基的数目为6。

比对中的符号“-”指示空位。通过比对在Seq B内引入的空位数为1。在SEQ B的边界处通过比对引入的空位数为2，并且在SEQ A的边界处为1。

显示比对序列在其整个长度上的比对长度为10。

因此，根据本发明产生在其整个长度上显示较短序列的成对比对导致：

Seq A:GATACTG-

||||||

Seq B:GAT-CTGA

因此，根据本发明产生在其整个长度上显示序列A的成对比对导致：

Seq A:AAGATACTG

||||||

Seq B:--GAT-CTG

因此，根据本发明产生在其整个长度上显示序列B的成对比对导致：

Seq A:GATACTG-

||||||

Seq B:GAT-CTGA

显示较短序列在其整个长度上的比对长度为8(存在一个空位，其在较短序列的比对长度中被考虑)。

因此，显示Seq A在其完整长度上的比对长度将为9(意味着Seq A是本发明的序列)。

因此，显示Seq B在其完整长度上的比对长度将为8(意味着Seq B是本发明的序列)。

在比对两个序列后，在第二步中，从产生的比对确定同一性值。出于本说明书的目的，同一性百分比通过％-同一性＝(相同残基/在其整个长度上显示本发明相应序列的比对区域的长度)*100来计算。因此，与根据这个实施方案的两个氨基酸序列的比较相关的序列同一性通过将相同残基数除以在其整个长度上显示本发明的相应序列的比对区域的长度来计算。将这个值乘以100以给出“％-同一性”。根据上文提供的实例，％-同一性为：对于作为本发明序列的Seq A(6/9)*100＝66.7％；对于Seq B是本发明的序列(6/8)*100＝75％。

插入缺失是与通过NHEJ修复DSB相关的生物体基因组中碱基的随机插入或缺失的术语。它被分类为小的遗传变异，测量长度为1至10000个碱基对。如本文所用，它是指在靶位点中或其附近(例如，在上游和/或下游小于1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、25bp、20bp、15bp、10bp或5bp)的碱基的随机插入或缺失。

关于将供体DNA分子引入靶DNA的靶位点的术语“引入(introducing)”、“引入(introduction)”等意指将供体DNA分子的序列任何引入靶区域中，例如通过将供体DNA分子或其部分物理整合到靶区域中或将供体DNA分子的序列或其部分引入靶区域中，其中供体DNA用作聚合酶的模板。

内含子：是指基因内的DNA区段(间插序列)，其不编码基因产生的蛋白质的一部分，并且在从细胞核输出之前从基因转录的mRNA中剪接出来。内含子序列是指内含子的核酸序列。因此，内含子是与编码序列(外显子)一起被转录但在成熟mRNA形成期间被去除的DNA序列的那些区域。内含子可以位于实际编码区内或前mRNA(未剪接的mRNA)的5'或3'未翻译前导序列中。切除初级转录物中的内含子，同时精确地连接编码序列以形成成熟mRNA。内含子和外显子的连接形成剪接位点。内含子的序列以GU开始并以AG结束。此外，在植物中，已经描述了AU-AC内含子的两个实例：来自拟南芥的RecA样蛋白基因的第十四内含子和G5基因的第七内含子是AT-AC内含子。含有内含子的前mRNA具有三个短序列，除了其他序列外，这三个短序列准确剪接内含子必需的。这些序列是5'剪接位点、3'剪接位点和分支点。mRNA剪接是去除初级mRNA转录物中存在的间插序列(内含子)并结合或连接外显子序列。这也称为顺式剪接，其连接去除间插序列(内含子)的同一RNA上的两个外显子。内含子的功能元件包含被剪接体的特定蛋白质组分识别和结合的序列(例如在内含子末端剪接共有序列)。功能元件与剪接体的相互作用导致内含子序列从早熟mRNA中去除并重新连接外显子序列。内含子具有三个短序列，这三个短序列对于准确剪接内含子是必需的(尽管不是足够的)。这些序列是5'剪接位点、3'剪接位点和分支点。分支点序列在剪接和剪接位点选择中是重要的。分支点序列通常位于3'剪接位点上游10-60个核苷酸。

同基因：遗传上相同的生物体，除了它们可能因异源DNA序列的存在或不存在而不同。

分离的：如本文所用的术语“分离的”意指材料已通过人工移除并且与其原始的天然环境分开存在，且因此不是自然界的产物。分离的材料或分子(如DNA分子或酶)可以以纯化形式存在，或者可以存在于非天然环境中，如在转基因宿主细胞中。例如，活细胞中存在的天然存在的多核苷酸或多肽不是分离的，但是相同的多核苷酸或多肽从天然系统中的一些或所有共存材料分离后是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或多肽可以是组合物的一部分并且将被分离，因为这样的载体或组合物不是其原始环境的一部分。优选地，关于核酸分子使用时，如在“分离的核酸序列”中，术语“分离的”是指从至少一种污染物核酸分子中鉴定和分离的核酸序列，所述污染物核酸分子通常在其天然来源中与其相关。分离的核酸分子是以与其在自然界中发现的形式或环境不同的形式或环境存在的核酸分子。相反，非分离的核酸分子是以其在自然界中存在的状态发现的核酸分子，如DNA和RNA。例如，给定的DNA序列(例如基因)在邻近基因附近的宿主细胞染色体上发现；RNA序列，如编码特定蛋白质的特定mRNA序列，作为与编码多种蛋白质的许多其他mRNA的混合物存在于细胞中。然而，包含例如SEQ ID NO:2的分离的核酸序列包括例如通常含有SEQ ID NO:2的细胞中的此类核酸序列，其中核酸序列位于与天然细胞不同的染色体或染色体外位置，或者以其他方式侧接与自然界中发现的核酸序列不同的核酸序列。分离的核酸序列可以以单链或双链形式存在。将分离的核酸序列用于表达蛋白质时，核酸序列将至少含有一部分有义链或编码链(即，核酸序列可以是单链的)。或者，它可以含有有义链和反义链(即，核酸序列可以是双链的)。

最小启动子：启动子元件，特别是TATA元件，其在不存在上游激活的情况下是无活性的或具有大大降低的启动子活性。在合适的转录因子存在下，最小启动子起到允许转录的作用。

非编码：术语“非编码”是指不编码部分或全部表达的蛋白质的核酸分子序列。非编码序列包括但不限于内含子、增强子、启动子区、3'非翻译区和5'非翻译区。

核酸和核苷酸：术语“核酸”和“核苷酸”是指天然存在的或合成的或人工的核酸或核苷酸。术语“核酸”和“核苷酸”包括单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和聚合物或杂合体，除非另有说明，特定的核酸序列还隐含地包括其保守修饰的变体(例如简并密码子取代)和互补序列，以及明确指出的序列。术语“核酸”在本文中可与“基因”、“cDNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换使用。核苷酸类似物包括在碱基、糖和/或磷酸酯的化学结构中具有修饰的核苷酸，所述修饰包括但不限于5位嘧啶修饰、8位嘌呤修饰、胞嘧啶环外胺处的修饰、5-溴-尿嘧啶的取代等；和2'-位置糖修饰，包括但不限于其中2'-OH被选自H、OR、R、卤素、SH、SR、NH2、NHR、NR2或CN的基团替代的糖修饰的核糖核苷酸。短发夹RNA(shRNA)还可以包含非天然元件，如非天然碱基，例如离子蛋白和黄嘌呤，非天然糖，例如2'-甲氧基核糖，或非天然磷酸二酯键，例如甲基膦酸酯、硫代磷酸酯和肽。

核酸序列：短语“核酸序列”是指从5'至3'端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。它包括染色体DNA、自我复制质粒、DNA或RNA的感染性聚合物以及发挥主要结构作用的DNA或RNA。“核酸序列”还指代表核苷酸的缩写、字母、字符或单词的连续列表。在一个实施方案中，核酸可以是“探针”，其是相对短的核酸，通常长度小于100个核苷酸。通常，核酸探针的长度为约50个核苷酸至约10个核苷酸。核酸的“靶区域”是被鉴定为目的的核酸部分。核酸的“编码区”是置于适当的调控序列的控制下时以序列特异性方式转录和翻译以产生特定的多肽或蛋白质的核酸部分。编码区被认为编码此类的多肽或蛋白质。

寡核苷酸：术语“寡核苷酸”是指核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物的寡聚物或聚合物，以及具有功能类似的非天然存在部分的寡核苷酸。这种修饰或取代的寡核苷酸通常优于天然形式，因为具有所需的性质，如，例如增强的细胞摄取、增强的对核酸靶标的亲和力和在核酸酶存在下增加的稳定性。寡核苷酸优选包括通过键(例如磷酸二酯)或取代键彼此共价偶联的两个或更多个核单体。

突出：“突出”是在双链寡核苷酸分子的5'-或3'-羟基末端上的相对短的单链核苷酸序列(也称为“延伸”、“突出端”或“粘性端”)。

多肽：术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在本文中可互换使用，是指连续氨基酸残基的聚合物或寡聚物。

前体蛋白：蛋白质，其通常靶向细胞器，如叶绿体，并且仍然包含其转运肽。

关于在靶区域中引入供体DNA分子的“精确”意指与不包含在供体DNA分子序列中的靶区域的未改变的DNA序列相比，供体DNA分子的序列被引入靶区域而没有任何插入缺失、重复或其他突变。

初级转录物：如本文所用的术语“初级转录物”是指基因的早熟RNA转录物。例如，“初级转录物”仍然包含内含子和/或尚未包含多A尾或帽结构和/或缺少其作为转录物的正确功能所必需的其他修饰，如，例如修剪或编辑。

启动子：术语“启动子”或“启动子序列”是等同物，并且如本文所用，是指与目的核苷酸序列连接时能够控制目的核苷酸序列转录成RNA的DNA序列。启动子位于5'(即上游)，接近于目的核苷酸序列转录成mRNA的转录起始位点，其控制并提供用于通过RNA聚合酶和其他转录因子特异性结合以起始转录的位点。所述启动子包含例如邻近转录起始位点的至少10kb，例如5kb或2kb。它还可以包含接近转录起始位点的至少1500bp，优选至少1000bp，更优选至少500bp，甚至更优选至少400bp，至少300bp，至少200bp或至少100bp。在进一步优选的实施方案中，启动子包含邻近转录起始位点的至少50bp，例如至少25bp。启动子不包含外显子和/或内含子区或5'非翻译区。启动子可以例如与相应细胞异源或同源。如果多核苷酸序列源自外来物种，或者如果来自相同物种，则该多核苷酸序列与生物体或第二多核苷酸序列是“异源的”，或者是从其原始形式修饰的。例如，与异源编码序列可操作地连接的启动子是指来自与衍生启动子的物种不同的物种的编码序列，或者如果来自相同的物种，则是与启动子不天然相关的编码序列(例如，遗传工程化的编码序列或来自不同生态型或品种的等位基因)。合适的启动子可以衍生自其中应当发生表达的宿主细胞的基因或衍生自该宿主细胞的病原体(例如病毒)。如果启动子是诱导型启动子，则转录速率响应于诱导剂而增加。提及启动子或衍生自启动子的表达时，术语“组成型”意指启动子能够在细胞中在不存在刺激(例如，热休克、化学品、光等)的情况下在所述细胞的基本上整个寿命期间指导可操作地连接的核酸分子的转录。

启动子特异性：提及启动子时，术语“特异性”意指由相应启动子赋予的表达模式。特异性描述了细胞的发育状态，其中启动子在相应启动子的控制下赋予核酸分子的表达。启动子的特异性还可以包括环境条件，在该环境条件下启动子可以被激活或下调，如通过生物或环境胁迫(如寒冷、干旱或感染)诱导或抑制。

纯化的：如本文所用，术语“纯化的”是指从其天然环境中取出、分离或分开的分子(核酸或氨基酸序列)。“基本上纯化的”分子至少60％不含，优选至少75％不含，更优选至少90％不含与其天然缔合的其它组分。纯化的核酸序列可以是分离的核酸序列。

重组：关于核酸分子的术语“重组”是指通过重组DNA技术产生的核酸分子。重组核酸分子还可以包含这样的分子，其本身不存在于自然界中，而是由人修饰、改变、突变或以其他方式操纵。优选地，“重组核酸分子”是在序列上与天然存在的核酸分子相差至少一个核酸的非天然存在的核酸分子。“重组核酸分子”还可以包含“重组构建体”，其包含(优选可操作地连接)非天然地以该顺序存在的核酸分子序列。用于产生所述重组核酸分子的优选方法可包括克隆技术、定向或非定向诱变、合成或重组技术。

有义：术语“有义”应理解为意指具有与靶序列互补或相同的序列的核酸分子，例如与蛋白质转录因子结合并参与给定基因表达的序列。根据优选的实施方案，核酸分子包含目的基因和允许所述目的基因表达的元件。

显著增加或减少：例如酶活性或基因表达的增加或减少，其大于测量技术中固有的误差范围，优选对照细胞中对照酶或表达的活性增加或减少约2倍或更多，更优选增加或减少约5倍或更多，最优选增加或减少约10倍或更多。

小核酸分子：“小核酸分子”被理解为由核酸或其衍生物组成的分子，如RNA或DNA。它们可以是双链或单链的，并且为约15至约30bp，例如15至30bp，更优选约19至约26bp，例如19至26bp，甚至更优选约20至约25bp，例如20至25bp。在特别优选的实施方案中，寡核苷酸为约21至约24bp，例如21至24bp。在最优选的实施方案中，小核酸分子为约21bp和约24bp，例如21bp和24bp。

基本上互补：在其最广泛的意义上，术语“基本上互补”在本文中关于与参考或靶核苷酸序列相关的核苷酸序列使用时，意指核苷酸序列在基本上互补的核苷酸序列与所述参考或靶核苷酸序列的精确互补序列之间具有至少60％、更理想地至少70％、更理想地至少80％或85％、优选地至少90％、更优选地至少93％、还更优选地至少95％或96％、还更优选地至少97％或98％、还更优选地至少至少99％或最优选100％的同一性百分比(后者在本文中等同于术语“相同”)。优选地，在核酸序列的至少19个核苷酸，优选至少50个核苷酸，更优选整个长度的长度上评估与所述参考序列的同一性(如果下面没有另外说明)。基于Needleman和Wunsch的算法(Needleman和Wunsch(1970)J.Mol.Biol.48:443-453，如上文所定义)，使用Wisconsin大学GCG的默认GAP分析，GAP的SEQWEB应用进行序列比较。与参考核苷酸序列“基本上互补”的核苷酸序列在低严格条件下，优选中等严格条件下，最优选高严格条件下(如上所定义)与参考核苷酸序列杂交。

如本文所用的“靶区域”意指接近例如10个碱基、20个碱基、30个碱基、40个碱基、50个碱基、60个碱基、70个碱基、80个碱基、90个碱基、100个碱基、125个碱基、150个碱基、200个碱基或500个碱基或更多个碱基远离靶位点的区域，或包括其中供体DNA分子的序列被引入细胞基因组中的靶位点。

如本文所用的“靶位点”意指基因组中使用重组技术诱导双链断裂或一个或一对单链断裂(切口)的位置，所述重组技术如锌指、TALEN、限制酶、归巢核酸内切酶、RNA指导的核酸酶、RNA指导的切口酶，如CRISPR/Cas核酸酶或切口酶等。

转基因：如本文所用的术语“转基因”是指通过实验操作引入细胞基因组中的任何核酸序列。转基因可以是“内源DNA序列”或“异源DNA序列”(即“外源DNA”)。术语“内源DNA序列”是指核苷酸序列，其天然存在于其所引入的细胞中，只要其相对于天然存在的序列不含一些修饰(例如，点突变、存在选择性标记基因等)即可。

转基因(的)：提及生物体时，术语转基因(的)意指用重组DNA分子转化的，优选稳定转化的，所述重组DNA分子优选包含与目的DNA序列可操作地连接的合适的启动子。

载体：如本文所用，术语“载体”是指能够转运与其连接的另一核酸分子的核酸分子。一种类型的载体是基因组整合载体或“整合载体”，其可以整合到宿主细胞的染色体DNA中。另一种类型的载体是游离型载体，即能够染色体外复制的核酸分子。能够指导与其可操作地连接的基因表达的载体在本文中称为“表达载体”。在本说明书中，除非上下文另有明确说明，否则“质粒”和“载体”可互换使用。设计用于在体外或体内产生如本文所述的RNA的表达载体可含有由任何RNA聚合酶识别的序列，包括线粒体RNA聚合酶、RNA pol I、RNA polII和RNA pol III。这些载体可用于在根据本发明的细胞中转录所需RNA分子。

野生型：关于生物体、多肽或核酸序列，术语“野生型”、“天然的”或“天然来源”意指所述生物体是在至少一种天然存在的未被人改变、突变或以其他方式操纵的生物体中天然存在的或可获得的。

附图说明

图1显示了由激酶1催化的反应。(A)从isoprenol合成异戊烯磷酸(IP)和(B)从prenol合成二甲基烯丙基磷酸(DMAP)。

图2显示了激酶1的筛选结果。通过在ATP和MgCl₂存在下测量补充有isoprenol的澄清大肠杆菌细胞裂解物中的IP形成来监测酶活性。

图3显示了由激酶2催化的反应。(A)从IP合成异戊烯二磷酸(IPP)和(B)从DMAP合成二甲基烯丙基二磷酸(DMAPP)。

图4显示了激酶2的筛选结果。通过在ATP和MgCl₂存在下测量补充有IP的澄清大肠杆菌细胞裂解物中的IPP形成来监测酶活性。

图5显示了激酶1和2的级联反应。(A)从isoprenol合成IPP和(B)从prenol合成DMAPP。

图6显示了激酶1(SEQ ID NO 43)和激酶2将isoprenol转化为IPP的级联反应的实例。通过在ATP和MgCl₂存在下测量补充有isoprenol的澄清大肠杆菌细胞裂解物中的IPP形成来监测酶活性。

图7显示了激酶1的筛选结果。通过在ATP和MgCl₂存在下测量补充有isoprenol的澄清大肠杆菌细胞裂解物中的IP形成来监测酶活性。

图8显示了激酶2的筛选结果。通过在ATP和MgCl₂存在下测量补充有IP的澄清大肠杆菌细胞裂解物中的IPP形成来监测酶活性。

图9显示了IP随时间的细胞(体内)产生。描绘了归一化至培养物的OD600的IP浓度。值是三次独立测量的结果，且误差条表示标准偏差。

图10显示了IPP随时间的细胞(体内)产生。描绘了归一化至培养物的OD600的IPP浓度。值是三次独立测量的结果，且误差条表示标准偏差。

实施例

化学品和常用方法

除非另有说明，出于本发明的目的进行的克隆程序，包括限制性消化、琼脂糖凝胶电泳、核酸纯化、核酸连接、转化、细菌细胞的选择和培养，如所描述的进行(Sambrook等，1989)。重组DNA的序列分析用激光荧光DNA测序仪(Applied Biosystems，Foster City，CA，Applied Biosystems)使用Sanger技术进行。除非另有说明，否则化学品和试剂获自SigmaAldrich(Sigma Aldrich，St.Louis，USA)、Promega(Madison，WI，USA)、Duchefa(Haarlem，荷兰)或Invitrogen(Carlsbad，1977)。限制性内切核酸酶来自New England Biolabs(Ipswich，MA，USA)或Roche Diagnostics GmbH(Penzberg，德国)。寡核苷酸由EurofinsEurofins Genomics(Ebersberg，德国)或Integrated DNA Technologies(Coralville，IA，USA)合成。

实施例1激酶的克隆

从公共数据库鉴定激酶的氨基酸序列。使用大肠杆菌的标准密码子使用衍生各自的DNA序列。合成DNA序列(Biocat GmbH)并克隆到质粒pDHE19.2(Ress-Lo-Eschke，M.等，DE19848129，1998，(BASF AG))中。所得质粒用于转化感受态细胞(Chung，C.T.等，Proc NatlAcad Sci U S A，1989，86，2172)，所述感受态细胞属于大肠杆菌菌株TG10、pAgro、pHSG575(大肠杆菌TG10(Kesseler，M.等，WO2004050877A1，2004，(BASF AG))：rhaA——大肠杆菌TG1(DSMZ 6056)用pHSG575(Takeshita，S.等，Gene，1987，61，63)和pAgro4(Tomoyasu，T.等，Mol.Cell.Biol.，2001，40，397中的pBB541)转化的衍生物

实施例2激酶的重组生产

将携带激酶的重组质粒的大肠杆菌TG10用于接种100ml带挡板的锥形瓶中的25mlLB培养基(Bertani，G.，J Bacteriol，1951，62，293)，所述培养基补充有100μg/mL氨苄青霉素、100μg/mL壮观霉素、20μg/mL氯霉素、0.1mM异丙基-β-D-硫代吡喃半乳糖苷和0.5μg/mL鼠李糖。将培养物在37℃下在振荡条件下温育18小时。随后，通过以5000×g离心10分钟收获生物质。将细胞在缓冲液(50mM Tris*HCl，1mM MgCl₂，pH 7.0)中洗涤，然后重悬于1ml相同的缓冲液中。

通过在均质器(PeqLab Precellys24，VWR)中用0.7ml石英珠(Φ0.1mm)破碎300mg生物质两个30秒循环来制备无细胞的澄清的原始裂解物。在循环之间，将样品在冰上冷却。通过在10℃下20817×g离心澄清所得的无细胞裂解物。分离上清液(＝澄清的细胞裂解物)，并且其通常含有10至15mg/ml的蛋白质。

实施例3酶筛选

激酶1，isoprenol转化为异戊烯磷酸(IP)

在筛选测定中评估酶活性。在这方面，缓冲液(50mM NH₄HCO₃，pH 7.5)补充有5mMisoprenol(BASF生产)、15mM ATP、20mM MgCl₂。通过加入20体积％(最终)的澄清细胞裂解物引发反应。随后，将反应在恒温混合器(Eppendorf)中在37℃、300rpm下温育24小时，然后通过用乙腈1:5稀释并剧烈混合淬灭。通过在室温下以14,100×g离心5min来澄清淬灭的反应，并将所得上清液用于通过与质谱联用的液相色谱(LC-MS)来定量IP和异戊烯焦磷酸(IPP)的水平。

激酶2，IP转化为异戊烯焦磷酸(IPP)

在此，将50mM NH₄HCO₃ pH7.5的缓冲液补充5mM IP二锂盐(Sigma-Aldrich)、15mMATP、20mM MgCl₂。通过加入20体积％(最终)的澄清的细胞裂解物引发反应。如前一段所述处理和分析反应。

实施例4体外级联反应激酶1和激酶2，isoprenol转化为IPP

为了评估用激酶1和激酶2的组合将isoprenol转化为IPP的潜力，在体外进行级联反应。在这方面，将pH 7.5的50mM NH₄HCO₃缓冲液补充5mM isoprenol、30mM ATP和20mMMgCl₂。通过加入20体积％的激酶1和激酶2蛋白质产物的澄清细胞裂解物(总共40体积％)来启动反应。如上所述处理和分析反应。LC-MS定量指明IPP和/或DMAPP的成功合成

实施例5体内级联反应激酶1和激酶2，isoprenol转化为IPP

按照逻辑pCDFDuet1_激酶2_激酶1(例如SEQ ID NO 486)将在体外筛选中鉴定为命中的激酶基因重新克隆(BioCat GmbH)到市售的pCDFDuet1-质粒系统(Novagen)中。所得质粒用于转化大肠杆菌BL21-Gold(DE3)(Agilent)。将转化体的单菌落转移到含有补充有100μg/ml壮观霉素二盐酸盐(Sigma Aldrich)的4ml LB培养基的12ml反应管中，并在37℃下在200rpm的搅拌下温育过夜。

将过夜培养物用于接种100ml Neidhardt补充培养基(Clomburg，J.M.等，ProcNatl Acad Sci U S A，2019，116(26))。将含有100μg/ml壮观霉素二盐酸盐的12810装入500ml带挡板的锥形瓶中至600nm处的最终光密度(OD600)为0.1。随后，将培养物在37℃和200rpm下温育3小时，然后将温度降低至30℃，并通过加入1mM IPTG诱导基因表达。以26.9mM的终浓度加入isoprenol，并在温育0小时(在加入isoprenol前)、1、2.5、5、22和28小时后取出5ml样品。

测量样品的OD600，并通过快速过滤直接进一步处理(Castano-Cerezo，S.等，Metabolomics，2019，15，115)。简言之，将样品在减压下通过安装在1L过滤装置(Sartorius)上的直径为5cm的0.45μm聚酰胺滤膜(Sartorius)过滤。将滤饼和过滤器转移到15ml锥形管中并立即在液氮中冷冻。将过滤器储存在-80℃直至进一步处理。在这方面，将过滤器浸没在预热至70℃的pH 7.5的异丙醇和50mM NH₄HCO₃水溶液的1:1混合物中。随后将悬浮液在热混合器上在70℃和1000rpm搅拌下温育20min，然后置于冰上并超声处理3min(Branson Sonifier 250，70％，输出7)。通过在4℃下离心除去所有碎片，并将1ml所得上清液转移到新的1.5ml反应管中。使用SpeedVac真空浓缩器(Thermo Fisher，Savant，SPD131DDA)在45℃下过夜从样品中完全除去所有溶剂。将残余物溶于200μl的甲醇与50mMpH7.5的NH₄HCO₃水溶液的1:1混合物中。IP/DMAP和IPP/DMAPP通过与质谱联用的液相色谱来定量。将IP/DMAP和IPP/DMAPP浓度的报告结果标准化为样品的相应OD600。未诱导基因表达且未加入isoprenol的培养物用作阴性对照。报告的值显示三次独立测量的平均值。

实施例6LC-MS定量

体外测定

在与具有电子喷雾电离的单四极质谱仪(ISQ-EC，Thermo-Fisher)偶联的超高压液相色谱(UPLC)系统(Vanquish，Thermo-Fisher)上定量反应物。UPLC系统以离子配对色谱模式运行。其配备有肽C-18柱(Waters，Acquity Peptide BEH，孔径

粒度1.7μm，内径×长度2.1×50mm)，其在溶剂成分不变的条件下用25vol-％洗脱液A(含有10mM三丁胺和15mM乙酸的缓冲液)和75vol-％洗脱液B(乙腈)洗脱。该方法以0.5ml/min的流速运行2.5min，并将柱加热至40℃。通过质谱法检测和定量分析物。在这方面，将仪器设定为负离子化模式，碰撞诱导解离电压设定为40V，蒸发器温度为282℃，且离子传输管的温度为300℃。吹扫、护套和辅助气体压力分别设定为0.5psig、49.9psig和57psig。IP在0.6min洗脱并且其出现可以以质荷比(m/z)165跟踪，而IPP在1.3min洗脱并且其出现可以以m/z 245跟踪。定量基于通过分析IP二锂盐和IPP三铵盐(Sigma-Aldrich)的真实标准品制备的标准曲线。相对于反应中使用的相应底物的量报告反应产率。

体内测定

所有测量均在Thermo Vanquish Flex UHPLC系统上使用Acquity PREMIER BEHC18，50×2.1mm，1.7μm dp柱(Waters，Germany)进行。通过从(A)H₂O中10mM AmFo(甲酸铵)+10mM DBA(二丁胺)至(B)H₂O/ACN(1:9)中10mM AmFo+10mM DBA的多步梯度，以600μL/min的流速和45℃实现2.5μL样品的分离。梯度通过在2％B下0.5分钟等度步骤开始，然后在5.5min内增加至60％B，然后在0.5min内增加至100％B，以在100％B下1分钟步骤结束，然后在初始条件下再平衡。通过DAD(二极管阵列检测器)在200至600nm范围内记录UV光谱。在进入maXis II hr-ToF质谱仪(Bruker Daltonics，德国)前，以负模式使用Apollo ESI源，将LC流分流成大约75μL/min。在源区域中，温度设定为200℃，毛细管电压为3200V，干燥气体流量为5.0L/min，并且雾化器设定为1.0巴。为了转移所产生的离子，漏斗1RF设定为400Vpp，并且多极RF设定为350Vpp。然后，离子以110m/z的低截留和3.0eV的离子能量通过四极，在进入ToF管前前进到以步进模式操作的碰撞室中(碰撞能量＝8.0eV，预脉冲存储＝5.0μs；碰撞RF＝200-800Vpp；转移时间＝75-120ps；定时＝30-70％)。质谱以2.5Hz扫描速率在50-650m/z范围内以聚焦模式获得。定量是基于通过分析IP二锂盐和IPP三铵盐的真实标准品制备的标准曲线。

序列表

<110> 巴斯夫欧洲公司

<120> 改进的用于生产类异戊二烯的方法

<130> 202025WO01

<150> EP20175075

<151> 2020-05-15

<160> 491

<170> 根据Wipo Std 25

<210> 1

<211> 582

<212> PRT

<213> 酿酒酵母（Saccharomyces cerevisiae）

<220>

<223> CK1

<400> 1

Met Val Gln Glu Ser Arg Pro Gly Ser Val Arg Ser Tyr Ser Val Gly

1 5 10 15

Tyr Gln Ala Arg Ser Arg Ser Ser Ser Gln Arg Arg His Ser Leu Thr

20 25 30

Arg Gln Arg Ser Ser Gln Arg Leu Ile Arg Thr Ile Ser Ile Glu Ser

35 40 45

Asp Val Ser Asn Ile Thr Asp Asp Asp Asp Leu Arg Ala Val Asn Glu

50 55 60

Gly Val Ala Gly Val Gln Leu Asp Val Ser Glu Thr Ala Asn Lys Gly

65 70 75 80

Pro Arg Arg Ala Ser Ala Thr Asp Val Thr Asp Ser Leu Gly Ser Thr

85 90 95

Ser Ser Glu Tyr Ile Glu Ile Pro Phe Val Lys Glu Thr Leu Asp Ala

100 105 110

Ser Leu Pro Ser Asp Tyr Leu Lys Gln Asp Ile Leu Asn Leu Ile Gln

115 120 125

Ser Leu Lys Ile Ser Lys Trp Tyr Asn Asn Lys Lys Ile Gln Pro Val

130 135 140

Ala Gln Asp Met Asn Leu Val Lys Ile Ser Gly Ala Met Thr Asn Ala

145 150 155 160

Ile Phe Lys Val Glu Tyr Pro Lys Leu Pro Ser Leu Leu Leu Arg Ile

165 170 175

Tyr Gly Pro Asn Ile Asp Asn Ile Ile Asp Arg Glu Tyr Glu Leu Gln

180 185 190

Ile Leu Ala Arg Leu Ser Leu Lys Asn Ile Gly Pro Ser Leu Tyr Gly

195 200 205

Cys Phe Val Asn Gly Arg Phe Glu Gln Phe Leu Glu Asn Ser Lys Thr

210 215 220

Leu Thr Lys Asp Asp Ile Arg Asn Trp Lys Asn Ser Gln Arg Ile Ala

225 230 235 240

Arg Arg Met Lys Glu Leu His Val Gly Val Pro Leu Leu Ser Ser Glu

245 250 255

Arg Lys Asn Gly Ser Ala Cys Trp Gln Lys Ile Asn Gln Trp Leu Arg

260 265 270

Thr Ile Glu Lys Val Asp Gln Trp Val Gly Asp Pro Lys Asn Ile Glu

275 280 285

Asn Ser Leu Leu Cys Glu Asn Trp Ser Lys Phe Met Asp Ile Val Asp

290 295 300

Arg Tyr His Lys Trp Leu Ile Ser Gln Glu Gln Gly Ile Glu Gln Val

305 310 315 320

Asn Lys Asn Leu Ile Phe Cys His Asn Asp Ala Gln Tyr Gly Asn Leu

325 330 335

Leu Phe Thr Ala Pro Val Met Asn Thr Pro Ser Leu Tyr Thr Ala Pro

340 345 350

Ser Ser Thr Ser Leu Thr Ser Gln Ser Ser Ser Leu Phe Pro Ser Ser

355 360 365

Ser Asn Val Ile Val Asp Asp Ile Ile Asn Pro Pro Lys Gln Glu Gln

370 375 380

Ser Gln Asp Ser Lys Leu Val Val Ile Asp Phe Glu Tyr Ala Gly Ala

385 390 395 400

Asn Pro Ala Ala Tyr Asp Leu Ala Asn His Leu Ser Glu Trp Met Tyr

405 410 415

Asp Tyr Asn Asn Ala Lys Ala Pro His Gln Cys His Ala Asp Arg Tyr

420 425 430

Pro Asp Lys Glu Gln Val Leu Asn Phe Leu Tyr Ser Tyr Val Ser His

435 440 445

Leu Arg Gly Gly Ala Lys Glu Pro Ile Asp Glu Glu Val Gln Arg Leu

450 455 460

Tyr Lys Ser Ile Ile Gln Trp Arg Pro Thr Val Gln Leu Phe Trp Ser

465 470 475 480

Leu Trp Ala Ile Leu Gln Ser Gly Lys Leu Glu Lys Lys Glu Ala Ser

485 490 495

Thr Ala Ile Thr Arg Glu Glu Ile Gly Pro Asn Gly Lys Lys Tyr Ile

500 505 510

Ile Lys Thr Glu Pro Glu Ser Pro Glu Glu Asp Phe Val Glu Asn Asp

515 520 525

Asp Glu Pro Glu Ala Gly Val Ser Ile Asp Thr Phe Asp Tyr Met Ala

530 535 540

Tyr Gly Arg Asp Lys Ile Ala Val Phe Trp Gly Asp Leu Ile Gly Leu

545 550 555 560

Gly Ile Ile Thr Glu Glu Glu Cys Lys Asn Phe Ser Ser Phe Lys Phe

565 570 575

Leu Asp Thr Ser Tyr Leu

580

<210> 2

<211> 1749

<212> DNA

<213> 酿酒酵母（Saccharomyces cerevisiae）

<220>

<223> CK1 野生型

<400> 2

atggtacaag aatcacgtcc agggagtgta agaagttact cggtcggtta ccaagcaagg 60

tccagatcga gttctcaaag aagacattcg ttaacacgcc aacgttcctc gcaaagactg 120

attagaacca tcagtatcga gtctgatgtg tctaatatta ctgacgatga cgatttgaga 180

gctgtcaatg agggagtagc gggtgtgcaa ctggacgtct ctgaaaccgc aaataaggga 240

ccaagaagag catcagcaac tgatgtcaca gatagtttgg gttcgacttc gtcggaatat 300

attgagattc cctttgttaa ggaaacattg gatgcaagtt taccttcgga ttatctgaag 360

caggacatat taaatctcat tcagagtttg aagatatcca aatggtataa caacaagaaa 420

atccaaccgg tagcacaaga tatgaactta gtcaagatct ctggtgcgat gacaaacgca 480

attttcaaag ttgaataccc taagttacca tcgttgctat tgagaatata cggaccgaat 540

attgataata tcattgacag ggaatatgaa ttgcagattt tggctaggct ttcattgaaa 600

aatataggtc cttcccttta cggctgtttt gtaaacggta gatttgagca gtttctggag 660

aattctaaga ctttaacaaa agacgacatt agaaactgga agaactctca aaggattgca 720

aggagaatga aggagttaca tgtaggtgtt cctctcttga gttcagaaag gaagaacggg 780

tcggcttgtt ggcaaaagat taaccagtgg ttgcgcacga ttgagaaagt cgaccaatgg 840

gtgggggatc ctaaaaacat tgaaaactct ttattatgtg agaattggtc caagtttatg 900

gatattgtcg atagatatca caagtggctt atttctcaag aacagggtat agagcaagtc 960

aacaaaaatc ttatattctg ccataatgat gcccaatacg gcaatttact tttcactgct 1020

cctgtgatga acacaccgag cctatacact gcaccttcgt ctacatcatt gacttcccaa 1080

tcaagttcct tatttccttc gagctccaat gtcattgtag atgatataat caacccgcca 1140

aagcaggagc aaagccaaga ttccaaattg gtcgtcattg attttgaata tgcaggtgcc 1200

aatcccgccg catatgattt agcgaatcat ctttccgagt ggatgtatga ttacaacaat 1260

gctaaggccc cacatcagtg ccacgctgat agatatcccg ataaagaaca ggttttgaat 1320

ttcttatact cttatgtttc gcatctaagg ggtggtgcta aggaacccat agatgaagag 1380

gttcaaagac tctataagtc aatcattcaa tggagaccca ctgtacaact attttggtcg 1440

ctctgggcca tcctacaaag tggtaaatta gagaaaaaag aagcctccac tgccatcact 1500

agagaagaaa ttggacccaa tggaaaaaaa tatatcatca agactgaacc cgaatcccct 1560

gaagaagact ttgttgaaaa tgacgacgag cctgaagctg gcgtcagcat tgacacgttc 1620

gattatatgg cttatggtcg tgacaagatt gcggtctttt ggggcgacct cattggctta 1680

ggcataatca ccgaagaaga atgcaaaaat ttcagctctt tcaagttcct cgatactagt 1740

tatttgtaa 1749

<210> 3

<211> 1749

<212> DNA

<213> 人工序列

<220>

<223> CK1-密码子优化的

<400> 3

atggttcagg aaagtcgtcc gggcagtgtg cgtagctata gtgttggtta tcaggcccgc 60

agtcgcagca gtagtcagcg tcgtcatagc ctgacccgcc agcgcagtag ccagcgtctg 120

attcgcacca ttagtattga aagtgatgtg agcaatatca ccgatgatga tgatctgcgt 180

gccgttaatg aaggcgttgc cggcgtgcag ctggatgtta gtgaaaccgc caataaaggt 240

ccgcgccgcg ccagcgccac cgatgtgacc gatagcctgg gcagtaccag tagtgaatat 300

attgaaattc cgttcgtgaa agaaacctta gatgcaagcc tgccgagcga ttatctgaaa 360

caggatattc tgaatctgat tcagagtctg aaaattagta agtggtataa taacaagaag 420

atccagccgg tggcccagga tatgaatctg gtgaaaatta gcggcgccat gaccaatgcc 480

atcttcaaag tggaatatcc gaaactgccg agtctgctgc tgcgcatcta tggtccgaat 540

attgataata ttatcgaccg cgaatacgaa ctgcaaattc tggcacgcct gagcctgaaa 600

aatattggtc cgagcctgta tggttgcttc gttaatggtc gcttcgaaca gttcctggaa 660

aatagcaaaa ccttaaccaa agatgatatt cgcaattgga aaaatagcca gcgtattgca 720

cgtcgcatga aagaactgca tgttggcgtt ccgctgctga gtagtgaacg taaaaatggc 780

agtgcatgtt ggcagaaaat taatcagtgg ctgcgcacca ttgaaaaagt tgatcagtgg 840

gttggcgatc cgaaaaatat tgaaaatagt ctgctgtgcg aaaattggag caaattcatg 900

gatattgttg atcgctatca taaatggctg attagtcagg aacagggcat tgaacaggtt 960

aataaaaatc tgatcttctg ccataacgat gcacagtatg gtaatctgct gttcaccgcc 1020

ccggttatga ataccccgag cctgtacacc gcaccgagta gcaccagcct gaccagtcag 1080

agtagcagtc tgttcccgag cagtagtaat gtgattgtgg atgatattat caacccgccg 1140

aaacaggaac agagccagga tagtaaactg gttgttattg acttcgaata tgccggtgcc 1200

aatccggccg cctatgatct ggccaatcat ctgagcgaat ggatgtatga ttataataat 1260

gcaaaggccc cgcatcagtg ccatgcagat cgttatccgg ataaagaaca ggttctgaac 1320

ttcctgtata gttatgttag tcatctgcgt ggcggtgcca aagaaccgat tgatgaagaa 1380

gtgcagcgtc tgtataaaag tattattcag tggcgtccga ccgtgcagct gttctggagc 1440

ctgtgggcaa ttctgcaaag tggtaaactg gaaaaaaaag aagcaagtac cgcaattacc 1500

cgcgaagaaa ttggcccgaa tggtaaaaaa tatattatca aaaccgagcc ggaaagtccg 1560

gaagaagact tcgttgaaaa tgatgatgaa ccggaagcag gtgtgagtat tgataccttc 1620

gattatatgg cctatggtcg cgataaaatt gcagtgttct ggggtgatct gattggcctg 1680

ggcattatta ccgaagaaga atgtaaaaac ttcagtagct tcaaattcct ggataccagc 1740

tatctgtga 1749

<210> 4

<211> 383

<212> PRT

<213> 纹缘盔孢伞（Galerina marginata）

<220>

<223> CK2

<400> 4

Met Lys Glu Ser Trp His Tyr Lys Lys Ser Pro Phe Cys Leu Gln Leu

1 5 10 15

Leu Glu Ile Leu Arg Lys Leu His Val Arg Val Trp Ser Thr Ala Gln

20 25 30

Ile Ser Pro Glu Asp Val Ile Ile His Lys Val Ser Gly Ala Leu Thr

35 40 45

Asn Ala Val Phe Phe Val Ser Cys Pro Thr Val Pro Ser Ala Arg Thr

50 55 60

Leu Leu Leu Arg Val Tyr Gly Ser Ser Ser Gly Ser Leu Ile Ser Arg

65 70 75 80

Pro Arg Glu Leu His Thr Leu His Val Leu Ser Ser Gln Tyr Lys Ile

85 90 95

Gly Pro Arg Val Tyr Gly Thr Phe Asp Asn Gly Arg Ile Glu Glu Tyr

100 105 110

Phe Asp Ser Val Thr Leu Thr Ala Ala Asp Ile Arg Asp Pro Ile Thr

115 120 125

Ser Gln Trp Ile Gly Ala Arg Met Ala Asp Leu His Ser Val Asp Ile

130 135 140

Asp Val Val Tyr Glu Ala Gly Ser Leu Pro Leu Asn Glu Asn Arg Gly

145 150 155 160

Phe Glu Ile Ala Ala Asn Val Ser Ser Trp Leu Asp Pro Ala Glu Gln

165 170 175

Val Leu Asn Leu Pro Ala Val Ser Glu Ala Thr Ser Arg Glu Leu Asp

180 185 190

Leu Pro Arg Phe Lys Lys Glu Trp Ala Arg Tyr Leu Cys Trp Ser Leu

195 200 205

Asn Arg Pro His Ser Phe Gly Thr Arg Arg Val Phe Ala His Asn Asp

210 215 220

Ala Gln Tyr Gly Asn Leu Leu Arg Leu Lys Asp Gly Ser Glu Gly Val

225 230 235 240

Asp Glu His Arg Gln Ile Ile Val Val Asp Phe Glu Tyr Ala Ala Pro

245 250 255

Asn Pro Ala Ala Phe Asp Ile Ala Asn His Phe His Glu Trp Thr Ala

260 265 270

Asn Tyr His Cys Pro Thr Pro His Val Leu Ile Pro Ser Arg Tyr Pro

275 280 285

Thr Phe Glu Glu Arg Arg Asn Phe Tyr Thr Ser Tyr Ile Arg His Ala

290 295 300

Ala Met Leu Ala Glu Asp Pro Gly Leu Ser Asp Ala Asp Leu Asp Lys

305 310 315 320

Met Ile Thr Glu Leu Asp Arg Asp Val Leu Ile Trp Gly Ala Ala Ser

325 330 335

His Ala Gly Trp Ala Ile Trp Gly Ile Ile Gln Ala Arg Glu Asp Leu

340 345 350

Glu Ala Ala Val Thr Glu Leu Glu Phe Asp Tyr Ile Gly Tyr Ala Lys

355 360 365

Gly Arg Met Thr Ala Phe Arg Lys Asp Leu Gln Glu Phe Gly Ile

370 375 380

<210> 5

<211> 1152

<212> DNA

<213> 纹缘盔孢伞（Galerina marginata）

<220>

<223> CK2 野生型

<400> 5

atgaaggaat catggcacta taagaaatca cctttttgcc tccaacttct tgaaatctta 60

cggaagttgc acgttcgtgt gtggtctact gcacaaatct ccccagaaga cgtcataatc 120

cacaaggttt ccggagctct caccaatgct gtctttttcg tgtcatgccc aaccgtcccg 180

tccgcccgta cgctgttact acgcgtgtat ggttcttcct ccggatctct catttctcga 240

ccacgggaac tacacaccct gcacgtcctt tcgtcacagt acaagatcgg tcctcgagtt 300

tacgggactt ttgataacgg gagaattgag gagtatttcg actccgtgac cttgactgcg 360

gccgacattc gcgatccgat taccagtcaa tggattggag cacgaatggc agaccttcat 420

tctgtcgata tagacgttgt ctatgaagcc ggttcgcttc cactgaatga aaatcgtggt 480

tttgaaattg ctgccaatgt ttcttcttgg ttagatccag ccgaacaagt tctcaattta 540

cctgctgtgt ctgaagccac gtcacgagag ttggacctgc ctaggttcaa gaaagaatgg 600

gcacggtacc tatgttggtc attaaatcga ccgcattcat ttggcactag acgggtcttc 660

gctcacaatg atgctcaata cgggaattta ttgagactca aagacggcag tgagggtgtg 720

gatgagcatc gccagatcat cgtcgtcgat tttgagtacg ctgcccccaa tccagcagca 780

ttcgacattg ccaatcactt ccacgagtgg acggcaaatt atcattgccc gaccccacat 840

gtcctcatcc catcacgtta tcctacattt gaagagcgtc gcaattttta cacttcctac 900

atccgacatg cggcaatgtt ggcagaagat cctggattga gcgatgcgga cctcgacaaa 960

atgatcacag aattggatag ggatgttctt atctggggcg ccgcctcgca tgctggctgg 1020

gccatctggg gcatcatcca agcgagggaa gacttggagg cagctgtcac ggagctggag 1080

ttcgattata tcggttacgc aaaaggtcga atgacagctt tccgcaagga tttacaagaa 1140

tttggcattt aa 1152

<210> 6

<211> 1152

<212> DNA

<213> 人工序列

<220>

<223> CK2-密码子优化的

<400> 6

atgaaggaaa gttggcatta taagaagagt ccgttctgtc tgcaactgct ggaaattctg 60

cgtaaactgc atgttcgcgt gtggagcacc gcccagatta gcccggaaga tgtgattatt 120

cataaagtta gtggtgcact gaccaatgca gtgttcttcg tgagttgtcc gaccgtgccg 180

agcgcacgca ccctgttact gcgtgtgtat ggcagtagca gtggtagcct gattagtcgt 240

ccgcgtgaac tgcataccct gcatgtgctg agtagccagt ataaaattgg cccgcgcgtg 300

tatggcacct tcgataatgg ccgtattgaa gaatacttcg atagcgtgac cctgaccgca 360

gccgatattc gcgatccgat taccagccag tggattggcg cccgcatggc agatctgcat 420

agcgttgata ttgatgttgt gtatgaagca ggcagcctgc cgctgaatga aaatcgtggc 480

ttcgaaattg cagcaaatgt gagtagttgg ctggaccctg ccgaacaggt gctgaatctg 540

ccggcagtta gcgaagcaac cagtcgcgaa ctggatctgc cgcgcttcaa aaaagaatgg 600

gcccgctatc tgtgttggag cctgaatcgt ccgcatagct tcggtacccg ccgcgtgttc 660

gcccataatg atgcccagta tggtaatctg ctgcgcctga aagatggtag tgaaggtgtg 720

gatgaacatc gtcagattat tgttgtggac ttcgaatatg cagcaccgaa tccggccgca 780

ttcgatattg caaatcactt ccatgaatgg accgcaaatt atcattgtcc gaccccgcat 840

gttctgattc cgagccgtta tccgaccttc gaagaacgcc gtaacttcta taccagttat 900

attcgccatg ccgccatgct ggccgaagat ccgggtctga gcgatgccga tctggataaa 960

atgattaccg aactggatcg tgatgttctg atctggggcg cagcaagcca tgcaggctgg 1020

gcaatctggg gtattattca ggcacgcgaa gatctggaag ccgccgtgac cgaactggag 1080

ttcgattata ttggctatgc aaaaggtcgc atgaccgcat tccgtaaaga tctgcaagag 1140

ttcggtattt ga 1152

<210> 7

<211> 354

<212> PRT

<213> Piromyces finnis

<220>

<223> CK3

<400> 7

Met Ser Thr Ala Val Glu Glu Glu Tyr Phe Lys Asn Lys Ile Ala Ser

1 5 10 15

Ile Glu Lys Phe Asp Phe Thr Leu Asn Thr Glu Ser Gln Glu Thr Ile

20 25 30

Phe Glu Gly Ile Lys Ile Ile Leu Lys His Phe Leu Pro Glu Trp Asn

35 40 45

Asp Leu Lys Phe Thr Pro Gln Thr Asp Gly Ile Thr Asn Thr Leu Ile

50 55 60

Leu Val Ser Cys Pro Gln Gly Lys Val Ile Val Arg Val Phe Gly Asn

65 70 75 80

Gly Thr Glu Tyr Ile Ile Asn Arg Asn Ala Glu Gln Lys Asn Phe Ile

85 90 95

Phe Leu Ser Asp Asn Lys Leu Ala Ala Pro Ile Ile Gly Asn Phe Asn

100 105 110

Asn Gly Phe Val His Gly Tyr Val Glu Gly Ser Val Phe Ser Val Pro

115 120 125

Asp Met Ser Asp Pro Gln Lys Ser Leu Leu Val Ala Lys Lys Ile Gly

130 135 140

Lys Trp His Ser Leu Asn Phe Pro Phe Glu Lys Lys Ser Ser Val Tyr

145 150 155 160

Asp Val Ile Asn Lys Trp Ile Asp Glu Ala Pro Glu Val Phe Glu Asp

165 170 175

Lys Arg Lys Asn Glu Ile Tyr Tyr Ser Lys Asp Tyr Leu Arg Lys Glu

180 185 190

Asn Leu Arg Asn Glu Ile Asn Phe Leu Lys Glu Lys Leu Asp Glu Ile

195 200 205

Ser Ser Pro Leu Ala Phe Cys His Cys Asp Leu Leu Tyr Gly Asn Ile

210 215 220

Ile Leu His Lys Asp Glu Asn Gly Asn Asp Asp Val Thr Phe Ile Asp

225 230 235 240

Tyr Glu Tyr Gly Ser Ile Asn Pro Arg Gly Phe Asp Ile Gly Asn His

245 250 255

Phe Asn Glu Tyr Ala Gly Phe Asp Cys Asp Tyr Asn Leu Tyr Pro Ser

260 265 270

Lys Glu Phe Gln Tyr Lys Trp Leu Lys Val Tyr Leu Gln Ser Tyr Leu

275 280 285

Gly Lys Glu Asn Ile Ser Glu Lys Glu Ile Glu Asp Leu Tyr Arg Glu

290 295 300

Val Asn Lys Tyr Ala Leu Leu Ser His Tyr Tyr Trp Gly Val Trp Ala

305 310 315 320

Ile Leu Gln Ala Lys Tyr Ser Gln Ile Asp Phe Asp Tyr Ile Ser Tyr

325 330 335

Ser Ile Leu Arg Leu Asp Glu Tyr Tyr Asn Gln Lys Glu Arg Phe Leu

340 345 350

Ser Leu

<210> 8

<211> 1065

<212> DNA

<213> Piromyces finnis

<220>

<223> CK3 野生型

<400> 8

atgtcaacag ctgtcgaaga agaatatttt aaaaataaaa ttgcttctat agagaaattt 60

gattttactt taaatacaga aagtcaagaa actattttcg aaggaattaa aattatttta 120

aaacattttt tacctgaatg gaatgattta aagtttactc cacaaactga tggtattaca 180

aatacactta ttttagtatc atgtcctcaa ggaaaagtta ttgtaagagt atttggtaat 240

ggtactgaat acattattaa tagaaatgct gaacaaaaga attttatatt tttatccgat 300

aataaactcg ctgctccaat tattggaaat ttcaacaatg gctttgttca tggatatgtt 360

gaaggaagtg tattttctgt tccagacatg tcagatccac aaaagtcttt attagttgca 420

aaaaaaattg gaaaatggca tagtttaaat ttcccatttg aaaagaagag ctctgtttat 480

gatgttatta ataagtggat tgatgaagct ccagaagttt ttgaagataa aagaaagaat 540

gaaatatatt attctaagga ctatttaaga aaagaaaatt taagaaatga aatcaacttt 600

ttaaaggaaa aacttgatga aatttcatct ccattagctt tttgtcattg tgatcttctt 660

tatggaaata tcattttaca taaggatgaa aatggaaatg atgatgtaac ctttattgat 720

tatgaatatg gttcaattaa tccaagagga tttgacattg gaaatcattt taatgaatat 780

gctggctttg attgtgacta taatttatat ccatcaaaag aatttcaata taaatggtta 840

aaggtttatt tacaaagtta cttaggtaaa gaaaatatta gtgaaaagga aatagaagat 900

ttatatcgtg aagttaataa atatgcctta ttatcacatt attattgggg tgtctgggcc 960

attcttcaag caaagtactc tcaaattgat tttgattata ttagttattc tattctaagg 1020

cttgatgaat actacaatca aaaagaaaga tttttaagtc tttaa 1065

<210> 9

<211> 1065

<212> DNA

<213> 人工序列

<220>

<223> CK3-密码子优化的

<400> 9

atgagtaccg cagtggaaga agaatacttc aaaaataaaa tcgcgagcat tgaaaagttc 60

gacttcaccc tgaataccga aagtcaggaa accatcttcg aaggcattaa aattattctg 120

aagcacttcc tgccggaatg gaatgatctg aaattcaccc cgcagaccga tggtattacc 180

aataccctga ttctggttag ctgcccgcag ggtaaagtta ttgttcgtgt gttcggtaat 240

ggtaccgaat atattattaa ccgtaacgca gaacagaaaa acttcatctt cctgagtgat 300

aataagctgg ccgccccgat tattggtaac ttcaataatg gcttcgttca tggctatgtg 360

gaaggcagcg tgttcagcgt gccggatatg agtgatccgc agaaaagtct gctggtggcc 420

aaaaaaattg gcaaatggca tagcctgaac ttcccgttcg aaaaaaaaag cagcgtgtat 480

gatgtgatta ataaatggat tgacgaggca ccggaagtgt tcgaagataa acgtaaaaat 540

gaaatctact acagcaagga ttacctgcgt aaagaaaatc tgcgtaatga aattaacttc 600

ctgaaagaaa agctggatga aattagcagt ccgctggcct tctgtcattg tgatctgctg 660

tatggtaata ttattctgca taaagacgag aatggcaatg atgatgtgac cttcattgat 720

tatgaatatg gcagtattaa cccgcgtggc ttcgatattg gtaatcactt caatgaatac 780

gcaggcttcg attgtgatta taatctgtat ccgagcaaag agttccagta taaatggctg 840

aaagtgtatc tgcaaagcta tctgggcaaa gaaaatatta gcgaaaaaga aatcgaggat 900

ctgtatcgcg aagtgaataa atatgcactg ctgagccatt attattgggg tgtgtgggcc 960

attctgcaag ccaaatatag ccagattgac ttcgattata tcagctatag cattctgcgc 1020

ctggatgaat attataatca gaaagaacgc ttcctgagcc tgtga 1065

<210> 10

<211> 537

<212> PRT

<213> Babjeviella inositovora

<220>

<223> CK4

<400> 10

Met Asp Thr Leu Ala Thr Glu Lys Pro Arg Ser Arg Ser Arg Ser Met

1 5 10 15

Ser Arg Ser Arg Ser Arg Ser Asn Ile Arg Pro Val Leu Thr Pro Leu

20 25 30

Leu Ser Ser Asn Gln Val Lys Gln Val Pro Arg Arg Arg Ser His Ser

35 40 45

Arg Arg Pro Ser Leu Ser Arg Gln Ser Ser Gly Ser Val Asp Glu Val

50 55 60

Pro His Ile Lys Ala Asn Leu Asp Asn Ser Leu Pro Leu Asp Phe Met

65 70 75 80

Lys Glu Glu Ile Met Ile Ile Val Lys Ala Leu Arg Ile Lys His Trp

85 90 95

His Lys Leu Pro Glu Ser Ala Ala Ser Arg Ile Lys Val Asn Arg Ile

100 105 110

Ser Gly Ala Leu Thr Asn Ser Ile Tyr Lys Leu Asn Leu Asp Glu Cys

115 120 125

Pro Ala Leu Leu Leu Arg Val Tyr Gly Lys Asn Val Asp Glu Ile Ile

130 135 140

Asp Arg Glu Ala Glu Leu Ile Ile Leu Lys Arg Leu Ser Ser Lys Arg

145 150 155 160

Ile Gly Pro Arg Leu Leu Gly Thr Phe Thr Asn Gly Arg Phe Glu Gln

165 170 175

Phe Leu Asp Gly Phe Ile Thr Leu Asn Lys Asp Gln Leu Arg Asn Lys

180 185 190

Tyr Ile Ser Gln Met Ile Ala Lys Arg Met Lys Glu Leu His Val Asn

195 200 205

Met Glu Leu Glu Ala Lys Asp Thr His Pro Met Ser Trp Ala Leu Ile

210 215 220

Asp Lys Trp Phe Pro Leu Ala Glu Glu Val Val Lys Ser Tyr Glu Ala

225 230 235 240

Asn Pro Asp Val Ser Glu Ala Asp Phe Leu Leu Thr Asn Phe Ala Thr

245 250 255

Phe Lys Lys Asn Val Gln Ala Tyr Arg Thr Trp Leu Met Asn Lys Tyr

260 265 270

Gly Lys Ala Glu Phe Pro Arg Glu Val Leu Cys Phe Cys His Asn Asp

275 280 285

Thr Gln Tyr Gly Asn Leu Leu Leu His Ser Ser Leu Leu Glu Asp Ser

290 295 300

Lys Thr Glu Val Ala Lys Val Ile Glu Lys Met Glu Ser Leu Ser Leu

305 310 315 320

Asp Phe Asp Ser Asp Lys Leu Ala Ala Ala Ser His Ser Asn Leu Val

325 330 335

Val Ile Asp Leu Glu Tyr Ser Gly Pro Asn Cys Pro Pro Phe Glu Phe

340 345 350

Ala Asn His Phe Ser Glu Trp Met Ala Asp Tyr Leu Asp Ala Thr Asn

355 360 365

Ser His Tyr Leu Asp Glu Arg Lys Tyr Pro Thr Thr Glu Glu Gln Leu

370 375 380

Asn Phe Phe Arg Val Tyr Thr Glu Phe Ser Gly Arg Ala Thr Asp Pro

385 390 395 400

Ala Asp Ser Thr Arg Pro Asp Glu Ala Ala Thr Lys Lys Leu Phe Asn

405 410 415

Glu Thr Ile Trp Trp Arg Gly Thr Val Ser Val Tyr Trp Cys Leu Trp

420 425 430

Gly Ile Val Gln Asn Gly Pro Trp Lys Pro Thr Pro Thr Pro Glu Ala

435 440 445

Ala Thr Gly Glu Gly Phe Leu Gly Thr Tyr Lys Phe Ser Thr Glu Thr

450 455 460

Glu Glu Gly Asp Asp Gln Gly Ala Glu Val Glu Ile Thr Glu Ser Ser

465 470 475 480

Asp Asp Ala Phe Ser Tyr Ile Arg Tyr Ser Gln Gln Lys Ala Ala Met

485 490 495

Phe Tyr Gly Asp Ala Val Gln Leu Gly Ile Val Asp Arg Asp Ala Ile

500 505 510

Cys Glu Arg Tyr Leu Thr Gln Gly Glu Gly Ala Asp Glu Gly His Val

515 520 525

Lys Phe Leu Ser Val Lys Glu Leu Asp

530 535

<210> 11

<211> 1614

<212> DNA

<213> Babjeviella inositovora

<220>

<223> CK4 野生型

<400> 11

atggacacct tagctaccga gaaaccgaga tcccgctctc ggtcgatgtc ccgctctaga 60

tcacggtcca acatcagacc ggttttgacc cccctgcttt cctccaacca ggtgaaacaa 120

gtccccagac gccgttcgca ctcgagaaga ccctcgttaa gcagacagag ctcggggagc 180

gtcgatgaag tgccgcacat taaggctaac ttggacaaca gcttgccatt ggacttcatg 240

aaggaggaga tcatgatcat tgtcaaggcg ttgcgtatca agcactggca caagctcccg 300

gaatctgctg cgtcgcgcat caaggtgaac cgaatcagcg gtgccttgac caactcgatt 360

tacaagttga atcttgacga gtgtccggcg ttgctcttgc gcgtgtatgg gaagaacgtc 420

gatgagatca tcgacagaga ggcggagctt atcattttaa agaggctctc gagtaagcgg 480

attggcccgc gtctcttggg aaccttcact aatgggcggt ttgagcagtt tttggacggg 540

ttcatcacct tgaacaagga ccagctccgt aacaagtaca tctcgcagat gattgccaag 600

cgcatgaagg agttgcatgt caacatggag ttggaggcca aggacacgca tcccatgtct 660

tgggcgttga ttgacaagtg gtttccgctc gcggaggagg tagtgaaatc ttatgaagcc 720

aacccagacg tttccgaagc cgactttctc ctcacaaatt ttgccacctt taagaagaat 780

gtgcaagcgt acagaacctg gttgatgaac aagtacggca aggctgagtt tccacgggag 840

gtcttgtgct tctgccacaa cgacacccag tacggaaact tgcttttgca tagcagcttg 900

ttggaggact ccaagactga ggttgctaag gtgatcgaaa agatggaatc actttcgctt 960

gactttgatt cggataagct tgccgcagcc tcgcattcca acttggtggt cattgattta 1020

gagtactctg gccctaactg tccgcctttc gaattcgcca accatttcag cgaatggatg 1080

gccgattacc ttgatgccac taactcccac tacttggacg aaaggaagta cccaaccacc 1140

gaagagcagt tgaacttttt ccgtgtctat accgagtttt ccggccgtgc caccgatcct 1200

gccgactcca ccaggccaga tgaagcagcc acgaaaaagt tgtttaacga aaccatctgg 1260

tggaggggta ccgtttctgt ctattggtgc ttgtggggga ttgtccagaa tgggccgtgg 1320

aagcctacgc ccacgccaga ggcagccacc ggcgagggat tcctggggac ttacaagttt 1380

agtaccgaaa cggaggaagg agatgaccaa ggagccgagg tggagattac cgagtcttca 1440

gacgatgcgt tcagttatat ccgatactct caacagaagg cggccatgtt ctacggagac 1500

gctgttcagc ttgggattgt tgatagagac gcaatctgcg agagatactt gacgcaaggc 1560

gaaggggctg atgaaggaca tgttaagttc ttgtctgtca aggaattaga ctaa 1614

<210> 12

<211> 1614

<212> DNA

<213> 人工序列

<220>

<223> CK4-密码子优化的

<400> 12

atggataccc tggccaccga aaaaccgcgt agccgtagcc gcagcatgag ccgtagccgt 60

agtcgcagta atattcgccc ggttctgacc ccgctgctga gcagtaatca ggttaaacag 120

gtgccgcgcc gtcgcagcca tagccgtcgt cctagtctga gtcgtcagag tagcggtagt 180

gtggatgaag ttccgcatat taaagccaat ctggataata gtctgccgct ggacttcatg 240

aaagaagaaa ttatgattat cgtgaaggca ctgcgcatta aacattggca taaactgccg 300

gaaagcgccg caagccgtat taaagtgaat cgcattagtg gtgcactgac caatagtatc 360

tataaactga atctggatga gtgcccggcc ctgctgctgc gtgtgtatgg caaaaatgtt 420

gatgaaatta tcgaccgtga agcagaactg attattctga aacgcctgag cagtaaacgc 480

attggtccgc gtctgctggg taccttcacc aatggtcgct tcgaacagtt cctggatggc 540

ttcattaccc tgaataaaga tcagctgcgc aataaatata tcagccagat gattgccaaa 600

cgtatgaaag aactgcatgt gaatatggaa ctggaagcca aagataccca tccgatgagc 660

tgggccctga ttgataaatg gttcccgctg gccgaagaag ttgtgaaaag ctatgaagca 720

aatccggatg tgagtgaagc cgacttcctg ctgaccaact tcgccacctt caaaaaaaat 780

gttcaggcat atcgtacctg gctgatgaat aaatatggta aagcagagtt cccgcgcgaa 840

gttctgtgct tctgtcataa tgatacccag tatggcaatc tgctgctgca tagcagtctg 900

ctggaagata gcaaaaccga agtggccaaa gtgattgaaa aaatggaaag tctgagcctg 960

gacttcgata gcgataaact ggccgcagcc agccatagta atctggtggt tattgatctg 1020

gaatatagtg gcccgaattg tccgccgttc gagttcgcca atcacttcag cgaatggatg 1080

gcagattatc tggatgcaac caatagccat tatctggatg aacgtaaata tccgaccacc 1140

gaagaacagc tgaacttctt ccgcgtgtat accgagttca gtggtcgtgc caccgatccg 1200

gccgatagca cccgtccgga tgaagccgcc accaaaaaac tgttcaatga aaccatctgg 1260

tggcgcggca ccgttagtgt gtattggtgc ctgtggggca ttgttcagaa tggcccgtgg 1320

aaaccgaccc cgaccccgga agccgcaacc ggtgaaggct tcctgggtac ctataaattc 1380

agtaccgaaa ccgaagaagg cgatgatcag ggtgccgaag tggaaattac cgaaagtagt 1440

gatgatgcct tcagctatat tcgttatagc cagcagaaag ccgccatgtt ctatggtgat 1500

gccgtgcagc tgggtattgt ggatcgtgat gcaatctgtg aacgttatct gacccagggc 1560

gaaggcgcag atgaaggtca tgttaaattc ctgagtgtga aagaactgga ttga 1614

<210> 13

<211> 405

<212> PRT

<213> Kazachstania naganishii

<220>

<223> CK5

<400> 13

Met Lys Arg Leu His Val Thr Ile Pro Leu Asp Ala Pro Asp Asn Leu

1 5 10 15

Val Ser Leu Leu Thr Asp Asp Cys Gln Asn Tyr Glu Ile Val Lys Leu

20 25 30

Lys Gly Ala Leu Thr Asn Val Ile Tyr Lys Leu Ser Ile Arg Asp Ser

35 40 45

Ser Gly Thr Ser Thr Ser Tyr Leu Val Arg Ile Phe Gly Ala Lys Leu

50 55 60

Glu Ser Leu Val Asp Arg Val Glu Glu Phe Asn Asn Ile Thr Arg Val

65 70 75 80

Pro Pro Val Val Gly Tyr Val Asn Val Leu Tyr Val Phe Asp Asn Gly

85 90 95

Arg Val Glu Tyr Phe Leu Glu Gly Phe Lys Ser Val Ser Ala Lys Gln

100 105 110

Met Val Gln Gln Asn Val Tyr Arg Val Leu Ala Gln Lys Phe Lys Ala

115 120 125

Leu His Cys Leu Val Ser Ile Thr Asp Lys Glu Ile Ala His His Arg

130 135 140

Asp Gly Met Cys Trp Tyr Lys Leu Gly Gln Trp Ile Glu Ile Ile Glu

145 150 155 160

Asn Ile Asn Gly Gly Glu Trp Ile Asp Ser Arg Asp His Gln Asn Val

165 170 175

Thr Glu Ile Leu Leu Cys Arg Asp Trp Ala Thr Phe Lys Lys Thr Val

180 185 190

Leu Asn Tyr Lys Asn Trp Leu Leu Glu Glu Asp Ala Glu Ser Phe Gln

195 200 205

Gln Met Lys Phe Cys His Asn Asp Ala Gln Gln Gly Asn Ile Leu Leu

210 215 220

Asp Ser Lys Thr Lys Asp Asp Asp Ile Pro Asn Leu Asn Leu Ile Asp

225 230 235 240

Tyr Glu Tyr Ser Gly Val Asn Ala Ile Gln Phe Asp Leu Ala Asn Phe

245 250 255

Leu Thr Glu Cys Met His Asp Tyr Glu Ile Asp Glu Ser Tyr Lys Cys

260 265 270

His Gly Glu Gln Tyr Pro Ser Lys Glu Lys Val Leu Asp Phe Leu Tyr

275 280 285

His Tyr Ser Thr His Leu His His Gly Asp Ser Lys Gly Glu Ala Ser

290 295 300

Ile Val Lys Leu Tyr Asn Ser Val Leu Lys Trp Arg Ala Ala Ser Gln

305 310 315 320

Leu Phe Trp Ser Val Trp Ala Ile Leu Gln Ser Gly Gln Leu Glu Ala

325 330 335

Ala Ser Ala Lys Ile Glu Ala His Val Pro Asp Lys Gly Ser Asn Arg

340 345 350

Val Thr Ser Ser Asp Asp Pro Asn Glu Glu Val Phe Asp Tyr Met Gly

355 360 365

Phe Cys Asn Glu Lys Leu Ser Tyr Phe Trp Gly Asp Met Ile Lys Phe

370 375 380

Asn Leu Ala Ser Lys Glu Asp Cys Ile Val Ser Lys Val Arg Tyr Leu

385 390 395 400

Asp Thr Glu Phe Ile

405

<210> 14

<211> 1218

<212> DNA

<213> Kazachstania naganishii

<220>

<223> CK5 野生型

<400> 14

atgaagagat tgcatgtcac aataccgcta gatgctccag ataatctggt atcactcctg 60

actgatgatt gtcaaaatta tgaaattgtc aagctgaaag gtgcattgac taatgtcatt 120

tacaagttgt cgatccggga ttcttctggg acttctacaa gctacctagt tcggatattt 180

ggagcaaaat tggaatcgct tgttgataga gttgaagagt ttaataacat aacgagagta 240

cctccagtgg ttggatatgt aaatgtgctt tacgtttttg acaacggaag agtggaatac 300

ttcttagaag ggttcaaaag tgtgtctgct aagcaaatgg tgcagcaaaa tgtataccga 360

gttcttgctc aaaaatttaa agcgttacac tgtttggttt cgattacaga taaggaaatt 420

gctcaccatc gtgacggtat gtgttggtat aaattgggcc aatggattga gatcattgag 480

aatataaatg gaggagaatg gatagacagt agggatcacc agaacgtgac tgagattttg 540

ctatgtagag attgggctac attcaaaaag acggtactaa attataaaaa ctggcttttg 600

gaagaagatg ccgaaagttt ccagcaaatg aaattttgcc ataacgatgc tcaacagggg 660

aatatcctgt tggattcaaa aacgaaggat gatgatattc caaatcttaa tctgatcgat 720

tacgagtatt ccggggtcaa cgctatccag tttgatcttg caaatttttt gactgaatgc 780

atgcatgact atgaaattga cgaatcttat aagtgccatg gtgaacagta tccaagtaaa 840

gaaaaagttt tggacttttt ataccactac tcgacacact tgcatcacgg tgattccaag 900

ggagaagctt ctattgtcaa actgtacaac tctgttttga aatggagagc tgcatctcag 960

ttgttctggt cggtatgggc catactacag agcggtcaac tggaggcagc atcagcaaaa 1020

attgaggcgc acgtcccaga taagggaagc aatagagtga cctcctctga tgatcccaac 1080

gaagaggtgt ttgattacat ggggttctgt aatgaaaaat tgtcttactt ctggggggat 1140

atgataaaat tcaacctagc tagtaaggaa gattgcattg tttcaaaagt tagatatctg 1200

gatacagagt tcatatag 1218

<210> 15

<211> 1218

<212> DNA

<213> 人工序列

<220>

<223> CK5-密码子优化的

<400> 15

atgaagcgtc tgcatgttac cattccgctg gatgccccgg ataatctggt tagcctgctg 60

accgatgatt gtcagaatta tgaaattgtt aagctgaagg gcgccctgac caatgttatc 120

tataaactga gtattcgcga tagcagtggt accagtacca gttatctggt tcgtatcttc 180

ggcgccaaac tggaaagtct ggtggatcgt gttgaagagt tcaataatat tacccgtgtt 240

ccgccggttg tgggttatgt taatgttctg tatgtgttcg ataacggtcg cgttgaatac 300

ttcctggaag gcttcaaaag cgtgagtgca aaacagatgg tgcagcagaa tgtgtatcgc 360

gttctggccc agaaattcaa agccctgcat tgcctggtga gcattaccga taaagaaatt 420

gcacatcatc gcgatggtat gtgttggtat aaactgggcc agtggattga aattattgaa 480

aatattaacg gtggtgagtg gattgatagc cgtgatcatc agaatgtgac cgaaattctg 540

ctgtgccgtg attgggccac cttcaaaaaa accgtgctga attataaaaa ctggctgctg 600

gaagaagatg ccgaatcatt ccagcagatg aaattctgcc ataatgatgc acagcagggc 660

aatattctgc tggatagcaa aaccaaagat gatgatattc cgaatctgaa tctgattgat 720

tatgaatata gcggtgttaa tgccattcag ttcgatctgg caaacttcct gaccgaatgt 780

atgcatgatt atgaaattga tgagagttac aagtgccacg gtgaacagta tccgagtaaa 840

gaaaaagtgc tggacttcct gtatcattat agcacccatc tgcatcatgg cgatagtaaa 900

ggtgaagcca gtattgtgaa actgtataat agcgttctga aatggcgtgc agccagccag 960

ctgttctgga gcgtgtgggc aattctgcaa agcggccagc tggaagccgc aagtgccaaa 1020

attgaagccc atgttccgga taaaggtagc aatcgcgtga ccagtagtga tgatccgaat 1080

gaagaagtgt tcgattatat gggcttctgt aatgaaaaac tgagctactt ctggggtgat 1140

atgattaaat tcaatctggc cagcaaagaa gattgcattg tgagcaaagt tcgctatctg 1200

gataccgagt tcatttga 1218

<210> 16

<211> 1181

<212> PRT

<213> Umbilicaria pustulata

<220>

<223> CK6

<400> 16

Met Ser Leu His Pro Ala Ser Ser Trp Glu Ala Pro Met Met Met Leu

1 5 10 15

Lys Glu Gly Ala Leu Pro Pro His Ser Ser His Pro Ser Phe Gly His

20 25 30

Leu Ile Leu Leu Val Phe Glu Ala Val Leu Glu Val Val Cys Val Ser

35 40 45

Leu Pro Gly Tyr Ile Val Ala Arg Gln Gly Leu Phe Ser Thr Glu Met

50 55 60

Gln Lys Phe Val Ala Asn Leu Asn Val Met Leu Phe Thr Pro Cys Leu

65 70 75 80

Ile Phe Thr Lys Leu Ala Ser Gln Leu Ser Ala Glu Lys Leu Gly Glu

85 90 95

Leu Ala Val Ile Pro Val Ile Phe Ile Val Gln Thr Leu Val Ser Tyr

100 105 110

Leu Cys Ser Ile Gly Met Ser Arg Leu Leu Gly Leu Gln Lys Arg Pro

115 120 125

Arg Asn Phe Val Val Ala Met Gly Val Phe Gly Asn Ser Asn Ser Leu

130 135 140

Pro Ile Ser Leu Val Ile Ser Leu Ser Gln Thr Leu Lys Gly Leu His

145 150 155 160

Trp Asp Lys Val Pro Gly Asp Asn Asp Asp Glu Val Ala Ala Arg Gly

165 170 175

Ile Leu Tyr Leu Met Ile Phe Gln Gln Leu Gly Gln Leu Val Arg Trp

180 185 190

Ser Trp Gly Tyr His Val Leu Leu Ala Ala Pro Glu Lys Tyr Lys Val

195 200 205

Glu Asp His Tyr Thr Asp Ser Gln Leu Glu Gln Gly Gln Ser Ile Tyr

210 215 220

Arg Asp Asp Pro Asp Ser Glu Asp Glu Ala Leu Leu Arg Asn Pro Leu

225 230 235 240

Thr Glu Ser Asp Arg Asp Ser Ile Asp Val Ser Lys Asp Ser Ser Asp

245 250 255

Thr Asn Val Glu Gly Arg Asp Pro Asn Ser Ala Ser Ala Thr Gly Ser

260 265 270

Gln Thr Gly Phe Glu Ile Gly Ser Gly Arg Gln Thr Pro Val Thr His

275 280 285

Gln Gln Tyr Ala Ser Ser Val Ser Ser Arg Gln Leu Glu Asn Ala Gly

290 295 300

Pro Thr Glu Ser Glu Pro Ser Ser Gly Leu Leu Pro Thr Pro Thr Asn

305 310 315 320

Gly Asn Val Lys Pro His Ser Ser Glu Val Asp Tyr Thr Gly Ser Val

325 330 335

His Glu Met His Ser Pro Thr Ala Pro His Asp Glu His Val Pro Ala

340 345 350

Gly Leu Trp Gly Leu Pro Val Arg Ala Met Leu Ala Val Lys Arg Gly

355 360 365

Val Gln Gln Met Ser Val Thr Val Ser Thr Phe Ser Arg Ser Ile Tyr

370 375 380

Glu Thr Leu Pro Glu Ser Val Gln Ser Ile Met Met Lys Ile Tyr Met

385 390 395 400

Gly Leu Arg Arg Phe Val Leu Gly Ile Trp Glu Phe Met Asn Pro Pro

405 410 415

Leu Trp Ala Met Leu Ala Ala Ile Ile Val Ala Ser Val Pro Ser Leu

420 425 430

Gln His Leu Phe Phe Ser Glu Gly Thr Phe Ile Arg Asn Ser Val Thr

435 440 445

Arg Ala Ile Ser Gln Ser Gly Gly Val Ala Val Pro Leu Ile Leu Val

450 455 460

Val Leu Gly Ala Asn Leu Ala Arg Asn Thr Leu Pro Glu Asp Pro His

465 470 475 480

His Ser Val Glu Asp Asp Arg Ile Glu Lys Lys Leu Leu Ile Ala Ser

485 490 495

Leu Val Ser Arg Met Leu Leu Pro Ile Ile Val Met Ala Pro Leu Leu

500 505 510

Ala Val Thr Ala Lys Tyr Val Pro Val Ser Ile Leu Asp Asp Pro Ile

515 520 525

Phe Val Ile Val Cys Phe Leu Leu Thr Gly Ala Pro Ser Ala Leu Gln

530 535 540

Leu Ala Gln Ile Cys Gln Ile Asn Gly Val Tyr Met Gly Ala Met Ser

545 550 555 560

Lys Leu Leu Phe Gln Ser Tyr Val Val Trp Ile Leu Pro Ser Thr Leu

565 570 575

Ile Leu Val Met Glu Thr Asn Leu Ser Arg Arg Ala Ser Ser Ile Arg

580 585 590

Lys Leu Arg Lys Gly Ser Thr Ala Ala Gly Ser Ser Asp Thr Glu Tyr

595 600 605

His Glu Gly Asp Ala Leu Val Pro Thr Ala Glu Val Phe Leu Asp Asn

610 615 620

Ser Lys Thr Leu Ser Tyr Phe Gly Gly Thr Ala Glu Ser Glu Pro Asp

625 630 635 640

Leu Ser Asn Ser Ser Lys Arg Ala Ala Lys Glu Gly Trp Leu Ile Phe

645 650 655

Lys Asn Glu Ile Leu Arg Leu Thr His Thr Leu Arg Leu Lys Gly Trp

660 665 670

Arg Met Leu Pro Leu Glu Arg Gly Gly Asp Ile Asp Val Glu Arg Leu

675 680 685

Ser Gly Ala Leu Thr Asn Ala Val Tyr Val Val Ser Pro Pro Lys Asp

690 695 700

Leu Glu Gln Thr Pro Ser Asp Lys Asp Gly Gly Thr Ala Pro Leu Ala

705 710 715 720

Pro Lys Lys Pro Pro Pro Lys Leu Leu Leu Arg Ile Tyr Gly Pro Gln

725 730 735

Val Glu His Leu Ile Asp Arg Glu Asn Glu Leu Gln Ile Leu Arg Arg

740 745 750

Leu Ala Arg Lys Lys Ile Gly Pro Arg Leu Leu Gly Thr Phe Val Asn

755 760 765

Gly Arg Phe Glu Glu Phe Phe His Ala Arg Thr Leu Thr Ala His Asp

770 775 780

Leu Arg Val Pro Ala Thr Ser Lys Gln Ile Ala Lys Arg Met Arg Glu

785 790 795 800

Leu His Glu Gly Ile Glu Leu Leu Glu Glu Glu Arg Ala Ala Gly Pro

805 810 815

Phe Val Trp Arg Asn Trp Asp Lys Trp Val Asp Arg Cys Glu Glu Val

820 825 830

Ile Ser Trp Leu Asp Asn Gln Ile Leu Ser Gly Asn Gln Ser Ser Ala

835 840 845

Arg Thr Pro Thr Glu Met Trp Lys Gln Arg Gly Leu Ile Cys Gly Val

850 855 860

Glu Trp Ser Val Phe Arg Glu Thr Val Asn Arg Tyr Arg Ala Trp Leu

865 870 875 880

Asp Lys Gln Tyr Gly Gly Arg Asp Ala Leu Arg Gln Gln Leu Val Phe

885 890 895

Ala His Asn Asp Thr Gln Tyr Gly Asn Leu Leu Arg Leu Glu Pro Ser

900 905 910

Gly Glu Ser Pro Leu Leu Leu Pro Val Asn Glu His Lys Gln Leu Ile

915 920 925

Val Ile Asp Phe Glu Tyr Ala Ser Ala Asn Leu Pro Gly Leu Glu Phe

930 935 940

Ala Asn His Phe Thr Glu Trp Cys Tyr Asn Tyr His Asp Ala Glu Lys

945 950 955 960

Pro Tyr Ser Leu Thr Glu Ala Asn Tyr Pro Thr Lys Asp Glu Gln Arg

965 970 975

Thr Phe Leu Lys Ala Tyr Val Gln His Arg Pro Gln Phe His Ala Arg

980 985 990

Ala Ser Ala Thr Phe Ala Thr Ala Pro Gly Pro Gly Pro Ser Ser Ser

995 1000 1005

Ile Ser Ser Phe Met Leu Asp Ser Arg Ala Pro Pro Ala Gln Leu Val

1010 1015 1020

Glu Glu Glu Lys Glu Arg Asp Glu Ala Thr Glu Arg Glu Val Lys Arg

1025 1030 1035 1040

Leu Met Arg Glu Ala His Leu Trp Arg Val Ala Asn Thr Ala Gln Trp

1045 1050 1055

Val Ala Trp Gly Ile Val Gln Ala Lys Val Pro Gly Met Asp Glu Ala

1060 1065 1070

Leu Glu Asp Gln Lys Asn Pro Ser Pro Glu Ser Glu Arg Thr Ala Arg

1075 1080 1085

Arg Gly Ser Ser Thr Ser Val Thr Leu Phe Gly Ser Asp Pro Leu Asp

1090 1095 1100

Pro Asp Ile Ala Glu Asp Ile His Asn Arg Arg Pro Glu Arg Leu Asp

1105 1110 1115 1120

Ala Asp Ala Met Gly Gly Ala Thr Glu Val Pro Thr Lys Glu Glu Asp

1125 1130 1135

Thr Asp Glu Phe Asp Tyr Leu Gly Tyr Ala His Glu Arg Ala Met Phe

1140 1145 1150

Phe Trp Gly Asp Ala Leu Ser Leu Gly Leu Val Arg Lys Glu Asp Leu

1155 1160 1165

Pro Val Asp Val Leu Arg Lys Val Lys Met Val Glu Tyr

1170 1175 1180

<210> 17

<211> 3546

<212> DNA

<213> Umbilicaria pustulata

<220>

<223> CK6 野生型

<400> 17

atgtccttac atccagcatc atcatgggaa gcaccaatga tgatgctgaa ggaaggcgcg 60

ctgcctccac actcctcaca cccatccttc ggccacctca tcctactcgt gtttgaagca 120

gtgttggagg tagtatgtgt cagtcttccc ggatatatcg tggcccggca gggcttgttc 180

agtaccgaga tgcagaaatt cgttgccaat ctgaacgtca tgctcttcac accctgcctg 240

atcttcacga aactagcctc ccagttgtcg gcggaaaagc tcggagaact ggcagtcatc 300

ccagtcatct ttatagtgca gactctggta tcatacctgt gttcaatagg catgtcgagg 360

cttctgggat tacagaagcg gccacgaaac ttcgtcgttg ccatgggtgt ttttggaaac 420

tcaaactctc tcccgatctc attagtcata tctttgtcgc agactctcaa gggcctgcac 480

tgggataaag tacctggtga caacgacgac gaagtcgcag cccgaggcat tctttacctc 540

atgatcttcc aacaactggg ccaacttgtg aggtggagtt ggggttatca cgtgctacta 600

gcagcaccag agaagtacaa agtggaggat cattacacgg attctcagct cgaacaaggg 660

caaagtatat atcgggatga tccagatagt gaagacgagg ctctgcttcg caaccccctt 720

acagaaagcg accgggattc tatagacgtc agcaaggact ctagcgacac gaacgtcgag 780

ggccgcgacc caaacagtgc gagcgcaacg ggatcacaga caggcttcga gataggatcc 840

gggagacaaa ctcctgtgac gcaccagcag tatgcttcat ctgtttcgtc tcgacagctt 900

gagaacgcag gaccgacgga gtcagaacca tcatcaggac tactaccaac gcctaccaat 960

ggtaatgtaa agcctcattc tagtgaagtc gactacaccg gctctgtgca cgagatgcat 1020

agccctaccg ccccccacga cgaacatgtc ccagctggat tatggggcct accagtgcgg 1080

gcaatgctgg ccgtcaagcg gggcgttcag caaatgtcgg taacggtctc tacgttctca 1140

cgaagcatat atgagactct accagaatct gtacagagta tcatgatgaa gatctatatg 1200

ggccttcgga gattcgtcct cggcatctgg gagtttatga atcccccact gtgggccatg 1260

ctggcagcaa tcattgtcgc ctctgtcccc tccctgcagc atctattctt cagcgaaggc 1320

acgttcatca ggaattccgt gacccgagcc atctctcaga gtgggggcgt cgcggtccct 1380

ctcattctcg tcgtccttgg agccaatttg gcgaggaaca ctcttcctga agatcctcat 1440

cactcggtcg aagatgacag gatagaaaag aaacttctca ttgcttctct agttagccgg 1500

atgctcctgc cgatcatcgt gatggctccc ctattagccg tcactgccaa gtacgtgccc 1560

gtgagcatct tggatgaccc tatcttcgtc atcgtctgct tcctcctcac gggcgcgcct 1620

agcgcgctac agttggcaca aatctgccag atcaatggag tatacatggg ggctatgtcg 1680

aaactactct tccaaagcta tgttgtgtgg atcctcccat caacactcat ccttgtcatg 1740

gagactaatt tgtctcggcg ggcgtcatcg attcgaaagc tgaggaaggg ttcaacagct 1800

gccggatctt cggacacgga gtatcatgag ggcgatgccc ttgtcccgac ggccgaagtg 1860

ttcctagata actcgaagac actaagttac ttcggtggca ccgccgagtc agaaccagat 1920

ctcagcaatt cgagtaagcg cgcggccaaa gaagggtggc tgatcttcaa gaacgagata 1980

ctgcgtttga cacacacctt gaggctgaaa ggttggagga tgctaccact cgaacgtggc 2040

ggagacattg atgtggaacg gctcagtggg gcactgacaa acgcagttta cgtggtgtcg 2100

ccacccaagg atttagagca gaccccgtct gacaaagatg gcggtacggc gccgctcgca 2160

cctaagaagc caccaccgaa gcttctcctc cgtatctatg gcccccaggt ggaacatctc 2220

atcgaccggg aaaacgagct gcaaatcctc cgccgtctgg ctcgaaagaa gattggcccg 2280

cgcttactag gcacctttgt caacggtaga tttgaagagt ttttccatgc gcgcacactt 2340

accgcgcatg acttgcgtgt acccgcgact tcaaagcaga ttgcaaagcg tatgcgtgaa 2400

ttacatgagg gcattgagtt acttgaggag gaaagagcag cgggcccatt tgtctggaga 2460

aactgggata agtgggtgga caggtgtgaa gaggtcattt cctggctcga caaccagatc 2520

ctttcgggta accaatcttc cgcaagaact cccacagaga tgtggaagca gcgtggccta 2580

atctgcggtg tcgagtggtc cgtttttcga gagacggtca atcgatatcg cgcgtggctt 2640

gataaacaat atggcggcag ggatgctctc aggcaacagc tcgtgttcgc acataatgat 2700

acgcaatatg gtaacctcct ccgtctggaa cctagcggag aatccccgct cctgctaccg 2760

gtcaacgagc ataagcaatt aattgttatc gatttcgagt acgcatcggc taatcttcct 2820

ggcctggagt ttgccaacca ctttactgaa tggtgctaca actatcatga cgcagaaaag 2880

ccctattccc tcacagaagc gaactaccca acaaaggatg aacagcgcac atttttgaaa 2940

gcttacgtcc agcatcgtcc ccaattccac gcacgcgctt cggccacatt tgccacagcg 3000

ccgggtcctg gtccgtcaag ctcaatttct tctttcatgc tcgacagtcg agctccacca 3060

gctcaactag tcgaagagga aaaggagagg gacgaggcca ccgagcgaga agtaaagcga 3120

ctgatgcgtg aggcacacct gtggagggtg gccaacactg cgcaatgggt tgcgtggggc 3180

attgtacagg ccaaagtgcc cgggatggat gaagcgcttg aagaccaaaa gaacccctcc 3240

cctgaatcgg aacgtacagc aaggcgcggt agtagtactt cggtcaccct tttcggctcc 3300

gatccgctcg accccgacat tgccgaggat atccacaaca gaagaccgga aaggctggac 3360

gccgacgcca tgggtggcgc aactgaggtg cccaccaagg aagaggacac cgatgagttt 3420

gattatctgg gctatgctca tgagcgggcg atgttcttct ggggtgatgc tctctctctt 3480

gggctcgtga ggaaggagga ccttccggtg gacgttctgc ggaaggtaaa gatggttgag 3540

tattag 3546

<210> 18

<211> 3546

<212> DNA

<213> 人工序列

<220>

<223> CK6-密码子优化的

<400> 18

atgagtctgc atccggccag cagttgggaa gcaccgatga tgatgctgaa agaaggcgca 60

ctgccgccgc atagcagtca tccgagtttt ggtcatctga ttctgctggt ttttgaagca 120

gtgctggaag tggtttgtgt tagcctgccg ggttatattg ttgcccgcca gggtctgttt 180

agtaccgaaa tgcagaaatt tgttgcaaat ctgaatgtga tgctgtttac cccgtgcctg 240

atttttacca aactggccag ccagctgagc gcagaaaaac tgggcgaact ggcagtgatt 300

ccggttattt ttattgtgca gaccctggtt agctatctgt gtagcattgg tatgagtcgt 360

ctgctgggcc tgcaaaaacg cccgcgcaat tttgttgttg caatgggtgt ttttggtaat 420

agtaatagcc tgccgattag cctggttatt agtctgagtc agaccctgaa aggcctgcat 480

tgggataaag ttccgggcga taatgatgat gaagttgcag cacgtggcat tctgtatctg 540

atgatttttc agcagctggg tcagctggtt cgttggagtt ggggctatca tgttctgctg 600

gcagcaccgg aaaaatataa agtggaagat cattataccg acagccagct ggaacagggt 660

cagagcatct atcgcgatga tccggatagt gaagatgaag cactgctgcg caatccgctg 720

accgaaagcg atcgcgatag tattgatgtg agcaaagata gcagcgatac caatgttgaa 780

ggccgcgatc cgaatagcgc aagtgcaacc ggtagtcaga ccggttttga aattggcagc 840

ggtcgtcaga ccccggttac ccatcagcag tatgccagca gcgttagcag tcgtcagctg 900

gaaaatgccg gtccgaccga aagtgaaccg agtagtggcc tgctgccgac cccgaccaat 960

ggcaatgtga aaccgcatag ctcagaagtt gattataccg gtagcgtgca tgaaatgcat 1020

agtccgaccg ccccgcatga tgaacatgtg ccggcaggtc tgtggggcct gccggttcgt 1080

gcaatgctgg ccgtgaaacg tggtgtgcag cagatgagcg tgaccgtgag tacctttagc 1140

cgcagtatct atgaaaccct gccggaaagt gttcagagca ttatgatgaa aatctatatg 1200

ggtctgcgcc gctttgttct gggtatttgg gagtttatga atccgccgct gtgggcaatg 1260

ctggcagcca ttattgtggc aagtgtgccg agcctgcaac atctgttttt cagcgaaggt 1320

acctttattc gtaatagtgt tacccgcgca attagccaga gtggtggcgt tgccgttccg 1380

ctgattctgg ttgtgctggg tgccaatctg gcccgtaata ccctgccgga ggaccctcat 1440

catagcgttg aagatgatcg tattgaaaag aaactgctga ttgccagcct ggtgagccgc 1500

atgttactgc cgattattgt tatggcaccg ctgctggccg tgaccgcaaa atatgttccg 1560

gttagcattc tggatgatcc gatttttgtg attgtttgtt ttctgctgac cggcgcaccg 1620

agcgccctgc aactggcaca gatttgtcag attaatggcg tttatatggg tgccatgagc 1680

aaactgctgt ttcagagcta tgttgtgtgg attctgccga gcaccctgat tctggttatg 1740

gaaaccaatc tgagtcgtcg tgcaagcagt attcgtaaac tgcgtaaagg tagcaccgcc 1800

gcaggtagca gcgatacaga atatcatgaa ggtgacgcac tggtgccgac cgccgaagtt 1860

tttctggata atagcaaaac cctgagctat tttggtggta ccgccgaaag tgaacctgat 1920

ctgagcaata gcagtaaacg cgcagccaaa gaaggctggc tgatttttaa aaatgaaatt 1980

ctgcgcctga cccataccct gcgtctgaaa ggttggcgca tgttaccgct ggaacgcggt 2040

ggcgatattg atgttgaacg tctgagcggt gcactgacca atgccgttta tgttgtgagc 2100

ccgccgaaag atctggaaca gaccccgagc gataaagatg gcggtaccgc accgctggca 2160

ccgaaaaaac cgccgccgaa actgctgctg cgcatctatg gtccgcaggt ggaacatctg 2220

attgatcgtg aaaatgaact gcaaattctg cgtcgcctgg cacgcaaaaa gattggtccg 2280

cgtctgctgg gtacctttgt taatggccgt tttgaagaat ttttccatgc ccgtaccctg 2340

accgcccatg atctgcgcgt tccggcaacc agcaaacaga ttgcaaaacg tatgcgtgaa 2400

ctgcatgaag gcattgaact gctggaagaa gaacgtgcag ccggcccgtt tgtgtggcgc 2460

aattgggata aatgggtgga tcgttgcgaa gaagttatta gctggctgga taatcagatt 2520

ctgagcggca atcagagcag tgcccgcacc ccgaccgaaa tgtggaaaca gcgcggtctg 2580

atttgcggcg ttgaatggag cgtttttcgc gaaaccgtga atcgctatcg cgcctggctg 2640

gataaacagt atggcggccg tgatgccctg cgccagcagt tagtgtttgc acataatgat 2700

acccagtatg gtaatctgct gcgtctggaa ccgagcggtg aaagcccgct gctgctgccg 2760

gttaatgaac ataaacagct gattgtgatt gattttgaat acgcaagcgc caatctgccg 2820

ggtctggaat ttgcaaatca ttttaccgaa tggtgttata attaccatga tgcagaaaaa 2880

ccgtatagtc tgaccgaagc aaattatccg accaaagatg aacagcgtac ctttctgaaa 2940

gcatacgttc agcatcgccc gcagtttcat gcccgcgcca gcgcaacctt tgcaaccgcc 3000

cctggtccgg gcccgagcag cagcattagc agttttatgc tggatagtcg tgccccgccg 3060

gcccagctgg tggaagaaga aaaagaacgc gatgaagcaa ccgaacgtga agttaaacgt 3120

ctgatgcgcg aagcacatct gtggcgcgtt gcaaataccg cacagtgggt tgcctggggc 3180

attgttcagg ccaaagtgcc gggcatggat gaagcattag aagatcagaa aaatccgagt 3240

ccggaaagcg aacgtaccgc acgccgtggt agtagcacca gcgttaccct gtttggcagt 3300

gatccgctgg accctgatat tgcagaagat attcataatc gtcgtccgga acgtctggat 3360

gcagatgcaa tgggtggtgc aaccgaagtg ccgaccaaag aagaagatac cgatgaattt 3420

gattacctgg gttatgccca tgaacgcgcc atgtttttct ggggtgacgc attaagtctg 3480

ggtctggtgc gcaaagaaga tctgccggtt gatgttctgc gtaaagttaa aatggttgaa 3540

tattga 3546

<210> 19

<211> 534

<212> PRT

<213> 酿酒酵母（Saccharomyces cerevisiae）

<220>

<223> CK7

<400> 19

Met Tyr Thr Asn Tyr Ser Leu Thr Ser Ser Asp Ala Met Pro Arg Thr

1 5 10 15

Tyr Leu Val Gly Thr Ala Ser Pro Glu Met Ser Lys Lys Lys Arg Gln

20 25 30

Ser Ala Asn Cys Asp Lys Pro Thr Arg Arg Val Ile His Ile Ile Asp

35 40 45

Thr Asn Glu His Ser Glu Val Asp Leu Lys Asn Glu Leu Pro Ile Thr

50 55 60

Cys Thr Asn Glu Asp Gly Glu Met Thr Ser Ser Ser Trp Thr Ser Gln

65 70 75 80

Thr Ala Asn Asp Phe Leu Lys Leu Ala Tyr Val Asn Ala Lys Leu Asp

85 90 95

Pro Ser Leu Pro Ser Gln Tyr Phe Lys Gln Asp Ile Ile Asn Val Leu

100 105 110

Gln Ser Leu Glu Ile Pro Gly Trp Ser Val Pro Gly Ser Lys Glu Ser

115 120 125

Ser Leu Asn Lys Asn Leu Leu Thr Leu Thr Gln Ile Lys Gly Ala Leu

130 135 140

Thr Asn Val Ile Tyr Lys Ile Arg Tyr Pro Asn Leu Pro Pro Leu Leu

145 150 155 160

Met Arg Ile Phe Gly Asp Ser Ile Asp Ser Val Ile Asp Arg Glu Tyr

165 170 175

Glu Leu Lys Val Ile Ala Arg Leu Ser Phe Tyr Asp Leu Gly Pro Lys

180 185 190

Leu Glu Gly Phe Phe Glu Asn Gly Arg Phe Glu Lys Tyr Ile Glu Gly

195 200 205

Ser Arg Thr Ser Thr Gln Ala Asp Phe Ile Asp Arg Asp Thr Ser Ile

210 215 220

Lys Ile Ala Lys Lys Leu Lys Glu Leu His Cys Thr Val Pro Leu Thr

225 230 235 240

His Lys Glu Ile Thr Asp Gln Pro Ser Cys Trp Thr Thr Phe Asp Gln

245 250 255

Trp Ile Lys Leu Ile Asp Ser His Lys Glu Trp Val Ser Asn Asn Val

260 265 270

Asn Ile Ser Glu Asn Leu Arg Cys Ser Ser Trp Asn Phe Phe Leu Lys

275 280 285

Ser Phe Lys Asn Tyr Lys Arg Trp Leu Tyr Asn Asp Ser Ala Phe Thr

290 295 300

Ser Lys Leu Leu Arg Glu Asp Asp Lys Asp Ser Met Ile Asn Ser Gly

305 310 315 320

Leu Lys Met Val Phe Cys His Asn Asp Leu Gln His Gly Asn Leu Leu

325 330 335

Phe Lys Ser Lys Gly Lys Asp Asp Ile Ser Val Gly Asp Leu Thr Ile

340 345 350

Ile Asp Phe Glu Tyr Ala Gly Pro Asn Pro Val Val Phe Asp Leu Ser

355 360 365

Asn His Leu Asn Glu Trp Met Gln Asp Tyr Asn Asp Val Gln Ser Phe

370 375 380

Lys Ser His Ile Asp Lys Tyr Pro Lys Glu Glu Asp Ile Leu Val Phe

385 390 395 400

Ala Gln Ser Tyr Ile Asn His Met Asn Glu Asn His Val Lys Ile Ala

405 410 415

Ser Gln Glu Val Arg Ile Leu Tyr Asn Leu Ile Ile Glu Trp Arg Pro

420 425 430

Cys Thr Gln Leu Phe Trp Cys Leu Trp Ala Leu Leu Gln Ser Gly Arg

435 440 445

Leu Pro Gln Arg Pro Leu Ile Glu Gly Glu Lys Leu Met Ser Glu Lys

450 455 460

Ala Gly Leu Gly Asp Glu Thr His Leu Met Glu His Lys Asn Lys Glu

465 470 475 480

Asn Gly Lys Tyr Asp Cys Ser Glu Asp Asp Ser Phe Asn Tyr Leu Gly

485 490 495

Phe Cys Lys Glu Lys Met Ser Val Phe Trp Gly Asp Leu Ile Thr Leu

500 505 510

Gly Val Ile Asp Lys Asp Cys Pro Asp Ile Gly Lys Thr His Tyr Leu

515 520 525

Asp Thr Lys Leu Ile Phe

530

<210> 20

<211> 1605

<212> DNA

<213> 酿酒酵母（Saccharomyces cerevisiae）

<220>

<223> CK7 野生型

<400> 20

atgtacacca attattcact tacaagcagt gacgcaatgc cccgaactta cttggtcggc 60

acagcctcac cagaaatgtc taagaaaaag cgccagtctg caaattgtga caagccaacg 120

aggagggtga tccacatcat cgatactaat gagcactcag aagtcgactt gaaaaatgaa 180

ctgccaataa catgcacgaa tgaagacggt gagatgacat caagctcatg gacttcacaa 240

accgctaatg attttctcaa actggcatac gtaaacgcga aattagaccc gtctttgcca 300

tctcaatatt tcaaacaaga tatcataaat gttttacaaa gcttggagat tcctggatgg 360

tctgtgcccg gctctaaaga atcctcgttg aataagaatt tattaacttt gacacaaatc 420

aagggggccc ttacaaatgt tatttataag attcgctatc caaacttacc ccctttactg 480

atgagaattt ttggtgatag catagattct gtaattgata gagagtatga attaaaggtt 540

attgcgagat tatcatttta tgatttagga cccaaactag aagggttttt tgaaaatggc 600

agatttgaaa aatacattga gggttcgagg acatctactc aagccgactt tatagatcgg 660

gatacttcaa taaaaattgc taaaaaattg aaagagttgc attgtactgt tccattaacg 720

cataaagaaa taacggatca accgtcatgc tggacaacct ttgatcagtg gatcaaatta 780

atagactcgc ataaagagtg ggtttccaat aatgtaaata taagtgaaaa tttacgctgt 840

tcaagttgga attttttttt aaagagtttc aaaaattata agcgttggtt gtataatgat 900

tctgctttta cctcaaaatt attaagagag gatgataaag atagtatgat aaattctggg 960

ctaaaaatgg tattttgcca taacgactta cagcatggta atttactttt taaaagtaag 1020

ggtaaggatg acatctcagt gggcgattta acaattattg actttgagta cgcaggccct 1080

aaccccgttg tatttgattt atcaaatcat ttgaatgaat ggatgcaaga ctataatgat 1140

gtgcagtctt tcaagtctca tattgataag tatccaaaag aagaagatat tttagttttt 1200

gcacaaagtt atataaatca catgaatgag aaccatgtca aaattgcttc tcaagaggtt 1260

aggattcttt acaatctaat catcgaatgg aggccttgta cacaattatt ctggtgcctt 1320

tgggctcttt tgcaaagcgg aaggctacca caacgaccac tgatagaagg tgaaaaacta 1380

atgagcgaaa aggctggact aggtgatgaa acgcacctta tggagcacaa aaataaagag 1440

aatggaaaat acgattgttc tgaagatgat tcgttcaact atttaggatt ttgtaaagaa 1500

aaaatgtctg tcttttgggg cgatttaatt acattgggag ttatcgacaa agactgccca 1560

gatattggaa aaacacatta cttagacact aaacttattt tttaa 1605

<210> 21

<211> 1605

<212> DNA

<213> 人工序列

<220>

<223> CK7-密码子优化的

<400> 21

atgtacacca attacagtct gaccagtagt gatgccatgc cgcgcaccta tctggttggc 60

accgcaagtc cggaaatgag caaaaaaaaa cgtcagagcg ccaattgtga taaaccgacc 120

cgccgtgtta ttcatattat tgataccaat gagcacagtg aagtggatct gaaaaatgaa 180

ctgccgatta cctgcaccaa tgaagatggt gaaatgacca gcagtagttg gaccagccag 240

accgcaaatg acttcctgaa actggcatac gttaatgcca aactggaccc tagcctgccg 300

agtcagtact tcaaacagga tattattaac gtgctgcaaa gcctggaaat tccgggctgg 360

agcgttccgg gcagcaaaga aagcagcctg aataaaaatc tgctgaccct gacccagatt 420

aaaggtgccc tgaccaatgt tatctataaa attcgctatc cgaacctgcc gccgctgctg 480

atgcgtatct tcggtgatag tattgatagt gtgattgatc gcgaatatga actgaaagtg 540

attgcccgtc tgagcttcta tgatctgggc ccgaaactgg aaggcttctt cgaaaatggc 600

cgcttcgaaa aatatattga aggtagtcgc accagtaccc aggccgactt cattgatcgc 660

gataccagta ttaaaattgc aaaaaaactg aaggagctgc attgtaccgt tccgctgacc 720

cataaagaaa ttaccgatca gccgagctgc tggaccacct tcgatcagtg gattaaactg 780

attgatagcc ataaagaatg ggttagtaat aatgttaaca tcagtgaaaa cctgcgttgt 840

agcagttgga acttcttcct gaaatcattc aaaaattaca agcgttggct gtataatgat 900

agtgcattca ccagtaaact gctgcgcgaa gatgataaag atagcatgat taatagcggc 960

ctgaaaatgg tgttctgcca taatgatctg caacatggca atctgctgtt caaaagcaaa 1020

ggcaaagatg atattagcgt gggtgatctg accattattg acttcgaata tgccggcccg 1080

aatccggttg tgttcgatct gagtaatcat ctgaatgaat ggatgcagga ttataatgat 1140

gtgcagagct tcaaaagcca tattgataaa tatccgaagg aagaagatat tctggtgttc 1200

gcacagagct atattaatca catgaatgaa aaccacgtga aaattgccag tcaggaagtt 1260

cgtattctgt ataatctgat tatcgaatgg cgcccgtgta cccagctgtt ctggtgcctg 1320

tgggcactgc tgcaaagcgg ccgtctgccg cagcgtccgc tgattgaagg cgaaaaactg 1380

atgagtgaaa aagccggtct gggtgatgaa acacatctga tggaacataa aaataaggaa 1440

aacggcaaat acgattgtag tgaagatgat agcttcaatt atctgggctt ctgcaaagaa 1500

aaaatgagcg tgttctgggg tgatctgatt accctgggtg ttattgataa agattgtccg 1560

gatattggta aaacacatta tctggatacc aaactgatct tctga 1605

<210> 22

<211> 439

<212> PRT

<213> Diaporthe ampelina

<220>

<223> CK8

<400> 22

Met Ile His Gln Asn Gly Asp Asn Ser Pro Arg Ala Gly Ala Gly Ser

1 5 10 15

Asp Gln His Pro Pro Val Arg Phe Ile Ser Gln Ala Tyr Asp Gly Ser

20 25 30

Asp Ser Glu Asn Ser Ala Arg Gln Leu Ile Leu Ala Leu Arg Pro Glu

35 40 45

Trp Ser Ala Asp Asp Ser Asn Ile Glu Phe Val Arg Phe Thr Asp Gly

50 55 60

Ile Thr Asn Thr Leu Leu Lys Ala Val Tyr Lys Arg Pro Gly Leu Ser

65 70 75 80

Lys Asp Asp Val Asp Arg Glu Ala Ile Leu Leu Arg Ala Tyr Gly Pro

85 90 95

Gly Thr Asp Leu Ile Ile Asp Arg Ala Arg Glu Thr Gln Asn His Glu

100 105 110

Leu Leu Ser Gln His Gly Leu Ala Pro Glu Leu Leu Ala Arg Phe Asn

115 120 125

Asn Gly Met Met Tyr Arg Phe Ile Arg Gly Ser Val Thr His Pro Glu

130 135 140

Asp Leu Arg Arg Pro Glu Ile Tyr Leu Ala Val Ala Arg Arg Leu Ala

145 150 155 160

Gln Trp His Ala Thr Val Pro Cys Leu Pro Gly Lys Thr His Ile Ser

165 170 175

Asp Lys Met Asp Val Arg Cys Leu Asp Ala Leu Asn Gly Ala Ala Lys

180 185 190

Lys His Thr Thr Leu Gln Glu Ala Val Asp Ala Ala Ala Pro Gly Lys

195 200 205

Gln Ala Pro Asn Val Trp Thr Val Met Gln Lys Trp Ile Phe Ala Leu

210 215 220

Pro Thr Lys Thr Ala Ala Gln Arg Glu Arg Gln Gln Leu Leu Gln Val

225 230 235 240

Glu Leu Ser Lys Leu Val Ser Glu Leu Ser His Arg Pro Gly Leu Gly

245 250 255

Lys Asp Gly Leu Val Phe Ala His Cys Asp Leu Leu Ser Gly Asn Val

260 265 270

Ile Val Leu Pro Lys Gly Ser Asn Gln Asp Ser Gly Arg Ile Ser Asn

275 280 285

Gly Thr Ala Asp Ser Ala Gly Glu Thr Val Thr Phe Ile Asp Tyr Glu

290 295 300

Tyr Ala Val Pro Ser Pro Ala Ala Phe Asp Leu Cys Asn His Phe Ala

305 310 315 320

Glu Trp Gly Gly Phe Asp Cys Asp Tyr Asn Val Leu Pro Thr Lys Ser

325 330 335

Gln Arg Arg Glu Phe Ile Thr Glu Phe Val Arg Ser Tyr Phe Ser Leu

340 345 350

Leu Pro Gly Gln Pro Glu His Asp Glu Ala Ser Glu Ile Gln Lys Leu

355 360 365

Ala Asp Glu Val Asp Leu Tyr Arg Gly Val Pro Gly Leu Tyr Trp Gly

370 375 380

Ile Trp Ala Leu Ile Gln Ala Thr Ile Ser Asp Ile Asp Phe Asp Tyr

385 390 395 400

Ala Ser Tyr Ala Glu Thr Arg Leu Gly Glu Tyr Trp Ala Trp Lys Ala

405 410 415

Glu Val Asp Gly Ser Arg Ile Ala Glu Asp Lys Glu Leu Pro Leu Arg

420 425 430

Glu Arg Arg Trp Ala Glu Gln

435

<210> 23

<211> 1320

<212> DNA

<213> Diaporthe ampelina

<220>

<223> CK8 野生型

<400> 23

atgatacacc aaaacggcga caacagccct cgcgccggtg ccgggtctga ccagcaccct 60

ccggtccgct ttatttccca ggcctacgac ggctccgact ccgaaaactc ggcccgccag 120

ctcatcctgg ccctgcgccc ggaatggtct gcagacgact ccaacataga gtttgtgcgc 180

ttcaccgatg gcatcacaaa caccctgctc aaggccgtct acaagcgccc cggcctgtcc 240

aaggacgacg tcgaccggga ggccatcctg ctgcgtgcat acggccccgg caccgacctg 300

atcatcgacc gcgcccgtga gacacaaaac cacgagttgc tgtcacagca tggcctggca 360

ccagagcttc tggcgcggtt taacaacggc atgatgtaca ggttcatcag gggtagtgtc 420

acgcatcctg aggacctgcg gaggcccgag atatacctgg ccgtggcgag acggctggct 480

caatggcatg ccacggtgcc ctgtctcccg ggcaagacgc acatcagcga caagatggac 540

gtgcgctgtc ttgatgcgct caacggggct gcaaagaagc acacaactct acaggaggcc 600

gtagatgcag ctgcccctgg gaagcaggcc cccaacgtgt ggaccgtcat gcagaagtgg 660

atctttgccc tgcccaccaa gacggctgca cagagggagc ggcaacaact gctgcaagtc 720

gagctgtcca agttggtgtc cgagctgagc caccggccag gcctgggaaa ggacggtctg 780

gtcttcgcgc attgcgacct tctcagcgga aatgttattg tactgcccaa gggcagcaac 840

caagactctg gcagaatcag caacggcacc gcagacagtg ccggcgagac cgtgaccttt 900

atcgactatg aatacgccgt gccctctccg gcagcattcg acctgtgcaa tcactttgcc 960

gaatggggcg gtttcgactg tgattacaat gtgctgccca ccaagtccca acggcgcgag 1020

ttcataaccg agttcgtccg gtcgtacttc agcctcctcc ctgggcaacc cgagcacgac 1080

gaggcgtctg agatccagaa actggccgac gaggtcgact tgtaccgcgg agtcccggga 1140

ttgtactggg gcatttgggc gctcatccag gcgaccatct ctgacatcga cttcgactac 1200

gcatcgtacg ccgagaccag gctaggcgag tactgggctt ggaaggccga ggttgacggg 1260

agccgcattg ccgaggacaa ggagctgccg ctgcgggaac ggcggtgggc tgagcagtga 1320

<210> 24

<211> 1320

<212> DNA

<213> 人工序列

<220>

<223> CK8-密码子优化的

<400> 24

atgatccatc agaatggcga taatagcccg cgcgccggcg caggtagcga tcaacatccg 60

ccggttcgct tcattagtca ggcctatgat ggcagtgata gcgaaaatag tgcacgtcag 120

ctgattctgg cactgcgccc ggaatggagt gcagatgata gcaatattga gttcgtgcgc 180

ttcaccgatg gtattaccaa taccctgctg aaagccgtgt ataaacgccc tggtctgagc 240

aaagatgatg tggatcgtga agccattctg ctgcgtgcat acggtccggg caccgatctg 300

attattgatc gcgcccgcga aacacaaaat catgaactgc tgagtcagca tggtctggcc 360

ccggaactgc tggcacgctt caataatggc atgatgtatc gcttcattcg cggcagcgtg 420

acccatccgg aagatctgcg tcgtccggaa atctatctgg ccgtggcacg ccgtctggca 480

cagtggcacg ctaccgttcc gtgtctgccg ggtaaaacac atattagtga taaaatggac 540

gtgcgctgtc tggatgccct gaatggcgcc gcaaaaaaac ataccaccct gcaagaagcc 600

gtggatgccg ccgcaccggg caaacaggcc cctaatgtgt ggaccgtgat gcagaaatgg 660

atcttcgcac tgccgaccaa aaccgccgca cagcgtgaac gtcagcagct gctgcaagtt 720

gaactgagta aactggtgag cgaactgagc catcgtccgg gtctgggcaa agatggcctg 780

gtgttcgccc attgtgatct gctgagtggc aatgtgattg tgctgccgaa aggtagtaat 840

caggatagtg gccgcattag caatggtacc gccgatagtg caggtgaaac cgtgaccttc 900

attgattatg aatatgccgt gccgagcccg gcagcattcg atctgtgcaa tcacttcgca 960

gaatggggtg gcttcgattg tgattataat gtgctgccga ccaagagcca gcgccgcgag 1020

ttcattaccg agttcgtgcg tagctacttc agcctgctgc cgggtcagcc ggaacatgat 1080

gaagcaagtg aaattcagaa actggcagat gaagttgatc tgtatcgcgg tgtgccgggc 1140

ctgtattggg gtatctgggc actgattcag gccaccatta gcgatattga cttcgattat 1200

gccagctatg cagaaaccag actgggcgaa tattgggcct ggaaagcaga agtggatggt 1260

agtcgtattg ccgaagataa agaactgccg ctgcgcgaac gtcgttgggc cgaacagtga 1320

<210> 25

<211> 1374

<212> PRT

<213> 根腐离蠕孢（Bipolaris sorokiniana）

<220>

<223> CK9

<400> 25

Met Ser Phe Phe Ser Ala Pro Thr Ala Leu Arg Leu Arg Ser Leu Ser

1 5 10 15

Pro Ser Ser Ser Pro Phe Val Ala Leu Ala Ser Gln Ser Gln Asp Ser

20 25 30

Ile Thr Gly Thr Met Phe Thr Ser Leu Glu Asn Ala His Pro Ser His

35 40 45

Pro Asp Phe Ala Asn Leu Ala Leu Leu Val Phe Glu Ala Val Met Glu

50 55 60

Val Val Cys Val Ser Ala Pro Gly Tyr Val Val Ala Arg Met Gly Gln

65 70 75 80

Phe Asp Ala Glu Ser Gln Lys Phe Leu Ala Asn Leu Asn Thr Gln Leu

85 90 95

Phe Thr Pro Phe Phe Thr Lys Leu Ala Ser Gln Leu Thr Ala Glu Lys

100 105 110

Leu Ala Glu Leu Ala Val Ile Pro Val Ile Phe Val Val Gln Thr Leu

115 120 125

Ile Ser Tyr Ile Ala Ala Leu Ala Val Ser Arg Ile Phe Lys Phe Asn

130 135 140

Lys Arg Ala Ser Asn Phe Val Val Ala Met Ala Val Phe Gly Asn Ser

145 150 155 160

Asn Ser Leu Pro Ile Ser Leu Val Ile Ser Leu Ser Lys Thr Leu Arg

165 170 175

Gly Leu His Trp Asp Arg Ile Pro Gly Asp Asn Asp Asn Glu Val Gly

180 185 190

Ala Arg Gly Ile Leu Tyr Leu Leu Ile Phe Gln Gln Leu Gly Gln Leu

195 200 205

Val Arg Trp Thr Trp Gly Phe Asn Val Leu Leu Ala Pro Ala Ser Ala

210 215 220

Tyr Lys Asp Asp Glu Gly Arg Asn His Ala Leu Glu Ser Gly Glu Tyr

225 230 235 240

Ser Asp Asp Glu Thr Gln Arg Leu Leu Asp Asp Ser His Ser Asp Tyr

245 250 255

Glu Ser Gly Asn Val Thr Ser Tyr Ala Thr Ser Ala Asp Cys Ser Asp

260 265 270

Ser Asp Ser Asp Ser Ile Phe Asn Arg Gly Gln Ala Gln Ala Ala Ala

275 280 285

Leu Phe Ile Thr Pro Thr Asn Gly Asn Ala Thr Val Pro Gly Ala Gly

290 295 300

Asp Met Ser Gly Ser Pro Lys Gly Thr Phe Ala Asn Gly His Leu Asn

305 310 315 320

Gly Val Leu Ala Ala His Lys Lys Gln Gln Asp Thr Pro Lys Gly Ile

325 330 335

Lys Gly Val Pro Thr Arg Ala Arg Leu Ala Leu Gln Arg Ser Ala Thr

340 345 350

Ser Val Ser Val Ser Thr Thr Arg Ala Gly Asn Arg Ile Phe Asn Ser

355 360 365

Leu Pro Lys Trp Leu Gln Gly Pro Leu Ser Lys Ile Gly Ser Gly Leu

370 375 380

Ser Arg Phe Ala Lys Gly Val Trp Asp Phe Met Asn Pro Pro Leu Trp

385 390 395 400

Ala Met Leu Ile Ala Ile Phe Val Ala Ser Ile Pro Pro Leu Gln Arg

405 410 415

Leu Phe Phe Thr Pro Gly Thr Phe Ile Asn Thr Ser Val Thr Arg Ala

420 425 430

Val Asn Gln Ser Gly Gln Val Ala Val Pro Leu Ile Leu Val Val Leu

435 440 445

Gly Ala Asn Leu Ala Arg Asn Thr Leu Pro Lys Glu Asp Gln Asn Ser

450 455 460

Ile Glu Asp Pro Ser Val Glu Arg Lys Leu Val Ile Ala Ser Leu Ile

465 470 475 480

Ser Arg Met Leu Ile Pro Thr Leu Leu Met Ala Pro Met Leu Ala Leu

485 490 495

Thr Ala Lys Tyr Val Pro Val Ser Ile Leu Asp Asp Pro Ile Phe Ile

500 505 510

Ile Val Cys Phe Leu Leu Ser Gly Ala Pro Ser Ala Leu Gln Leu Ala

515 520 525

Gln Ile Cys Gln Ile Asn Asn Val Tyr Met Gly Ala Met Ser Arg Ile

530 535 540

Leu Phe Gln Ser Tyr Val Gln Thr Met Ala Thr Ser Ser Asn Trp Gln

545 550 555 560

Ala Gln Gln Pro Ala Gly Pro Gln Ser Ser Asp Ser Leu Ala Leu Ser

565 570 575

Arg Asn Asn Thr Leu Asp Asp Gly Ala Ser Pro Arg Ser Ser Lys Ala

580 585 590

Val Ser Phe Pro Asp Asp Ser Thr Ile Ser Pro Leu Ile Ile Gly Lys

595 600 605

Asn Lys Glu Leu Asp Gln Lys Asp Tyr Leu Asp Leu Asp Lys Pro Pro

610 615 620

Arg His Phe Pro Ala Ser Val Ser Lys Lys Arg Leu Ser Gly Arg Pro

625 630 635 640

Ser Tyr Glu Arg Glu Gly Ser Ser Lys Ser Gly Ala Ala Asp Ala Ser

645 650 655

Thr Ala Leu Thr Ser Leu Leu Pro Glu Gly Ser Ile Asp Ala Ser Ser

660 665 670

His Ser His Gln Ala His Glu Asn Leu Leu Lys Gln Val Gly Thr Trp

675 680 685

Leu Lys Gln Glu Arg Ser Arg Arg His Ala Arg Arg Ala Arg Arg Lys

690 695 700

Ala Ala Arg Ala Ser Thr Val Asp His Glu Ser Glu Ser Ala Ala Ala

705 710 715 720

Glu Ala Leu Glu Lys Ser Ile Ser His His Arg Ser Asp Ser Asp Ser

725 730 735

Ser His Gly Glu Asp Ala Leu Thr Gln Leu Ala Gln Ile Leu Glu Lys

740 745 750

Asn Met Thr Leu Lys Leu Ser Glu Ala Lys Lys Arg His His Leu His

755 760 765

Arg Ser Ser Ile Gly Leu Lys Arg His Ser Ala Ile Ser Leu Asp Ser

770 775 780

Asp Tyr Phe Glu Ser Val Asp Gln Leu Val Pro Ser Cys Glu Ala Thr

785 790 795 800

Leu Asp Asn Ser Lys Thr Met Ala Tyr Asn Val Asp Glu Pro Gly Ala

805 810 815

Glu Ser Asn Leu Asp Val Ala Asp Lys Glu Lys Glu Ala Trp Ser Lys

820 825 830

Phe Arg Ala Glu Ile Leu Arg Leu Thr His Thr Leu Lys Leu Lys Gly

835 840 845

Trp Arg Lys Val Pro Ser Glu Leu Ser Asn Glu Ile Ser Val Gln Arg

850 855 860

Leu Ser Gly Ala Leu Thr Asn Ala Val Tyr Val Val Ser Pro Pro Lys

865 870 875 880

Asn Leu Pro Val Pro Glu Gln Ser Glu Asp Gly Pro Pro Lys Pro Arg

885 890 895

Asn Pro Pro Pro Lys Leu Leu Leu Arg Ile Tyr Gly Pro Gln Val Glu

900 905 910

His Leu Ile Asp Arg Glu Ser Glu Leu Gln Ile Leu Thr Arg Leu Ala

915 920 925

Arg Lys Arg Ile Gly Pro Arg Leu Leu Gly Thr Phe Gly Asn Gly Arg

930 935 940

Phe Glu Glu Phe Leu His Ala Gln Pro Leu Thr Ser Lys Glu Leu Arg

945 950 955 960

Asn Pro Glu Thr Ser Val Gln Ile Ala Lys Arg Met Arg Glu Leu His

965 970 975

Glu Gly Ile Asp Leu Leu Lys Lys Glu Arg Glu Ala Gly Pro Phe Val

980 985 990

Trp Gln Asn Trp Asp Lys Trp Val Asn Arg Cys Glu His Ile Val Thr

995 1000 1005

Trp Leu Asp Gln Gln Val Arg Glu Ser Ser Gln Gly Leu Ser Arg Ala

1010 1015 1020

Ser Ser Asp Lys Trp Lys Lys Arg Gly Tyr Val Cys Gly Val Glu Trp

1025 1030 1035 1040

Pro Val Phe Lys Gln Met Ile Tyr Lys Tyr Arg Lys Trp Leu Glu Asp

1045 1050 1055

Gln Tyr Gly Gly Leu Asp Lys Ile Asn Glu Arg Met Val Phe Ala His

1060 1065 1070

Asn Asp Thr Gln Tyr Gly Asn Ile Leu Arg Met Met Pro Glu Gly Glu

1075 1080 1085

Ser Pro Leu Met Leu Pro Ala Asn Gln His Lys Gln Leu Val Val Ile

1090 1095 1100

Asp Phe Glu Tyr Ala Asn Ala Asn Leu Pro Gly Leu Glu Phe Ala Asn

1105 1110 1115 1120

His Phe Thr Glu Trp Ala Tyr Asn Tyr His Asp Ala Glu Ala Pro Trp

1125 1130 1135

Arg Cys Asn Thr Lys Tyr Tyr Pro Thr Ile Glu Glu Gln His Arg Phe

1140 1145 1150

Ile Arg Ala Tyr Leu Met His Asn Pro Ser Tyr Lys Ala Ser Gly Gly

1155 1160 1165

Tyr Thr Ser Asn Pro Ala Thr Pro His Leu Gly Pro Leu Pro Ser Ser

1170 1175 1180

Gly Ser Thr Thr Ala Leu Ala Ala Thr Ala Ala Pro Ser Ser Ile Ser

1185 1190 1195 1200

Ala Phe Met Leu Asp Ser Arg Ala Pro Pro Gly Glu Lys Tyr Gln Glu

1205 1210 1215

Gln Glu Ala Gln Tyr Glu Arg Gln Ile Glu Glu Glu Ala Arg Arg Leu

1220 1225 1230

Leu Ala Glu Thr Lys Leu Trp Arg Leu Ala Asn Ser Ala Met Trp Val

1235 1240 1245

Ala Trp Gly Ile Val Gln Ala His Ile Pro Gly Leu Pro Asp Phe Asp

1250 1255 1260

Glu Glu Ser Glu Asp Asn Lys Thr Ser Ala Asn Pro Ser Ala Glu Ala

1265 1270 1275 1280

Ala Thr Leu Asp Ser Ala Thr Ala Glu Leu Glu Ala Ala Ala Lys Ala

1285 1290 1295

Glu Gln Lys Ser Thr Gly Thr Val Ser Glu Glu Thr Ala Ala Lys Ile

1300 1305 1310

Gln Ala Gln Ala Gln Met Glu Asn Asp Ala Asp Leu Phe Lys Pro Gln

1315 1320 1325

Asp Glu Glu Glu Phe Asp Tyr Leu Gln Tyr Ala Asn Asp Arg Ala Met

1330 1335 1340

Phe Val Trp Gly Asp Ala Leu Arg Met Gly Ile Val Ser Gln Ser Glu

1345 1350 1355 1360

Leu Pro Glu Glu Phe Leu Gln Arg Ile Lys Leu Val Glu Tyr

1365 1370

<210> 26

<211> 4125

<212> DNA

<213> 根腐离蠕孢（Bipolaris sorokiniana）

<220>

<223> CK9 野生型

<400> 26

atgtccttct tctccgcgcc cacggccttg cgcctgcgct ccctctcccc ttcctcctct 60

ccctttgtcg ccctcgcctc ccagtcgcaa gactccatca ccggcaccat gttcacctcg 120

ctcgagaatg cccatccctc gcatcccgac tttgccaatt tggctctcct cgtcttcgag 180

gccgttatgg aggtcgtctg cgtgagcgct ccgggctatg ttgtcgcccg aatgggtcaa 240

ttcgacgcag agagccaaaa gtttcttgca aacctcaaca cccaattgtt tacgcctttc 300

ttcaccaagc tcgcctctca attgacggct gagaaactgg cagagcttgc agtcattccc 360

gttatttttg tcgtccagac gctcatatct tacattgccg cccttgccgt ctcacgcata 420

ttcaagttca acaaaagggc ctccaacttt gtcgtcgcca tggcagtttt tggtaactcc 480

aactcgctgc ccatctctct cgtcatctcc ctctccaaaa cactccgcgg cctgcactgg 540

gacagaatac cgggtgataa cgacaatgaa gttggtgccc gcggtatcct ctacctcctc 600

atcttccagc agctcggtca gctcgtgcgg tggacttggg gcttcaacgt gctcttggcc 660

ccagccagcg cttacaagga cgatgaggga agaaaccatg ccctcgagag tggagagtac 720

agcgatgacg agacgcagcg tctgctcgac gactcgcatt ctgactatga atctggaaat 780

gtcacaagct acgccacctc tgccgactgc agcgattcag actcggattc cattttcaac 840

cgtggtcagg cccaagcggc ggccctattc attacgccca ccaatggcaa tgcaacagtc 900

cctggagctg gcgacatgag cggaagcccc aagggcactt tcgcaaacgg acaccttaat 960

ggcgtgcttg cagctcacaa gaaacaacaa gacacaccca agggcatcaa gggcgtgccc 1020

acgcgtgctc ggctggcact gcaacgctcg gcgacttccg tatctgtctc aacgacacgc 1080

gctggcaacc gcatcttcaa cagcttgccc aagtggctcc aaggacccct gtctaaaatt 1140

ggttcaggct tgtccaggtt cgccaagggt gtttgggact ttatgaaccc tccgctctgg 1200

gccatgttga ttgccatctt cgtcgcctct attccaccgc tacaacgctt gttcttcact 1260

cctggaacat tcatcaacac gtcagttacg cgcgctgtaa atcaaagcgg acaagtggcc 1320

gtgcccctga ttctggttgt cctgggcgcc aatcttgctc gcaacacgct accaaaggag 1380

gaccaaaact caatcgagga ccccagcgta gagaggaagt tggtcattgc ctcgcttatc 1440

agtcgcatgc tcatcccaac gcttctcatg gcaccaatgc tggctctgac tgccaagtac 1500

gtgcccgtca gcatcctcga cgacccgatt ttcattattg tctgcttcct tctcagcggc 1560

gcacccagcg cgcttcaact ggcgcagatc tgccagatca acaatgtgta catgggcgcc 1620

atgtcgcgga tcctgtttca gagctacgtg cagaccatgg ccacttcttc caattggcag 1680

gcccagcagc ccgctggccc acagtcaagc gactctctag ccctctcgcg caacaacact 1740

ttggacgacg gtgcatcacc gcgctcaagc aaagccgtat cctttcccga tgacagcaca 1800

atttccccat tgatcatcgg caagaacaag gagctcgacc aaaaagacta cttagatctt 1860

gacaagcctc ccaggcactt tccagcaagt gtcagtaaaa agcgcctgtc cggccgtcct 1920

tcctatgaac gcgaggggtc atccaaatct ggagcggccg acgccagcac tgccttgacc 1980

tcgctacttc cagaaggctc aattgatgcg tcctctcata gccaccaagc ccacgagaac 2040

ctgttgaaac aggtcggcac ctggctcaag caggagcgaa gccggcgcca tgcacgaagg 2100

gcaagacgca aagctgccag agctagtacc gttgaccacg agtccgagag cgctgcagca 2160

gaggcactcg agaagtccat ctctcaccac aggagcgatt ctgactcctc ccatggcgag 2220

gatgcactca ctcaactggc acaaattctc gaaaagaaca tgaccttgaa gctttccgaa 2280

gcgaaaaaga ggcatcactt gcacaggtcg tccattggct taaagcgaca ctctgcaatt 2340

tctcttgatt cggactactt tgagtcggta gatcagcttg tccctagttg tgaagccact 2400

ttggacaatt caaagaccat ggcatacaac gtcgatgagc ctggggccga gtccaacctc 2460

gatgtagcag acaaggaaaa agaggcttgg tccaaatttc gagctgaaat ccttcgtctt 2520

actcacacgt tgaaattgaa gggatggagg aaggtgccca gtgagctgag caacgaaatc 2580

agtgtacaaa gactgagcgg tgcacttaca aacgccgttt acgtcgtctc tcctcccaag 2640

aatctaccag ttcccgaaca gagcgaagat ggtccaccaa agcccaggaa ccctccaccg 2700

aagctcctac ttcgtatcta tggtccacag gtagaacatc tgatcgaccg agagtcggaa 2760

ttacagatct tgacgcgact tgcccgcaaa cgtattggcc cacgcctgct cggtactttt 2820

ggcaatggcc gatttgaaga gtttctgcat gcccaaccac ttacttccaa ggagctacgc 2880

aacccggaaa cctcagtaca gatcgcaaag cgtatgcgag aacttcacga aggtattgat 2940

ttgctgaaga aagagcgaga ggctggcccg tttgtttggc aaaattggga caagtgggtc 3000

aatcgctgcg aacacattgt gacctggttg gatcaacagg tccgcgagag tagccagggc 3060

ctctccagag cctcttcgga caaatggaag aagcgaggat atgtgtgcgg cgtcgagtgg 3120

cccgtgttca agcaaatgat ttacaagtac cgaaagtggc tagaggatca gtatggcggt 3180

cttgataaga tcaacgagcg catggtcttt gcccataatg atacccagta tggaaatatc 3240

cttcgcatga tgccagaagg cgagtcacca ctgatgctac cggcaaacca gcacaagcag 3300

ctagtagtta ttgatttcga atacgcaaat gccaatcttc ctgggttgga atttgccaat 3360

cacttcacgg aatgggcgta caactaccac gatgcagaag ctccctggcg ttgcaacact 3420

aagtattatc caacaatcga agagcagcac cgttttatcc gggcgtactt gatgcacaac 3480

ccctcgtaca aggccagtgg cggatacacg tccaatcccg ctacaccaca ccttggaccg 3540

cttccctctt cgggtagcac aactgccctg gcagcaacag ccgccccaag cagcatctcc 3600

gcctttatgc tcgactcgcg agctcctcca ggcgaaaagt atcaagagca ggaagcccag 3660

tacgagcgac agattgaaga ggaagcgcgc cgcctcctgg cagaaaccaa actctggcgt 3720

ctcgccaact ccgccatgtg ggttgcctgg ggcatagtcc aagcacacat cccgggcctc 3780

cctgacttcg acgaggagag cgaagacaac aagacaagcg ccaacccaag cgcagaagca 3840

gcaacgctag acagcgcaac tgccgagctg gaagccgcag ctaaagcaga gcaaaagagc 3900

acggggacag tgagtgaaga aacggcggca aagatacagg cgcaggcgca gatggaaaat 3960

gatgctgacc ttttcaagcc gcaggacgag gaggaattcg attacttgca gtatgctaat 4020

gaccgggcga tgtttgtctg gggggatgcg cttaggatgg ggattgtgag tcaaagcgag 4080

ttgcccgagg agtttctgca aaggattaag cttgtggagt attga 4125

<210> 27

<211> 4125

<212> DNA

<213> 人工序列

<220>

<223> CK9-密码子优化的

<400> 27

atgagctttt tcagcgcccc gaccgccctg cgcctgagat cactgagtcc gagtagcagt 60

ccgtttgtgg cactggcaag tcagagccag gatagcatta ccggtaccat gtttaccagt 120

ctggaaaatg cacatccgag ccatccggat tttgccaatc tggccctgct ggtttttgaa 180

gccgttatgg aagttgtgtg cgttagcgca ccgggctatg ttgtggcacg tatgggtcag 240

tttgatgcag aaagtcagaa atttctggca aatctgaata cccagctgtt taccccgttt 300

ttcaccaaac tggcaagcca gctgaccgcc gaaaaactgg cagaactggc agtgattccg 360

gttatttttg tggttcagac cctgattagc tatattgcag ccctggccgt gagccgtatt 420

tttaaattca ataagcgtgc aagtaacttc gttgttgcaa tggcagtttt tggcaatagc 480

aatagtctgc cgattagcct ggttattagc ctgagtaaaa ccctgcgcgg cctgcattgg 540

gatcgcattc cgggtgacaa tgataatgaa gtgggtgcac gcggcattct gtatctgctg 600

atttttcagc agctgggcca gctggtgcgc tggacctggg gttttaatgt tctgctggcc 660

ccggcaagtg cctataaaga tgatgaaggt cgcaatcatg cactggaaag tggtgaatat 720

agtgatgatg aaacccagcg cctgctggat gatagccata gtgattatga aagcggcaat 780

gtgaccagtt atgccaccag cgccgattgc agcgatagtg atagtgatag catttttaat 840

cgcggccagg cacaggcagc agccctgttt attaccccga ccaatggtaa tgccaccgtt 900

ccgggtgcag gtgacatgag tggcagcccg aaaggtacct ttgccaatgg tcatctgaat 960

ggcgtgctgg cagcccataa aaaacagcag gataccccga aaggcattaa gggcgtgccg 1020

acccgcgcac gtctggcttt acagcgtagc gccaccagtg tgagtgtgag taccacccgc 1080

gcaggtaatc gcatttttaa tagcctgccg aaatggctgc aaggtccgct gagtaaaatt 1140

ggtagtggcc tgagtcgctt tgcaaaaggt gtttgggatt ttatgaatcc gccgctgtgg 1200

gccatgctga ttgcaatttt tgttgcaagt attccgccgc tgcaacgcct gtttttcacc 1260

cctggtacct ttattaatac cagtgtgacc cgcgccgtga atcagagcgg tcaggttgcc 1320

gtgccgctga ttctggtggt gctgggcgcc aatctggcgc gtaataccct gccgaaagaa 1380

gatcagaata gcattgaaga tccgagtgtg gaacgtaaac tggttattgc cagcctgatt 1440

agccgtatgc tgattccgac cctgctgatg gccccgatgc tggcactgac cgcaaaatat 1500

gtgccggtta gcattctgga tgatccgatt tttattattg tgtgctttct gctgagcggc 1560

gcaccgagcg ccctgcaact ggcacagatt tgtcagatta ataatgttta catgggcgca 1620

atgagtcgta ttctgtttca gagttatgtt cagacaatgg ctaccagtag caattggcag 1680

gcacagcagc cggccggccc gcagagcagc gacagcttag cactgagccg caataatacc 1740

ctggatgatg gcgcaagtcc gcgcagtagc aaagccgtta gttttccgga tgatagtacc 1800

attagtccgc tgattattgg taaaaataag gaactggatc agaaagatta cctggatctg 1860

gataaaccgc cgcgccattt tccggccagc gtgagcaaaa aacgtctgag cggtcgcccg 1920

agctatgaac gtgaaggcag cagcaaaagc ggcgcagccg atgcaagtac cgcactgacc 1980

agcctgctgc cggaaggcag cattgatgcc agtagtcata gccatcaggc ccatgaaaat 2040

ctgctgaaac aggttggtac ctggctgaaa caggaacgca gccgtcgcca tgcacgccgt 2100

gccagacgca aagccgcacg cgcttcaacc gtggatcatg aaagtgaaag tgccgcagcc 2160

gaagcactgg aaaaaagtat tagtcatcat cgtagcgata gcgatagtag tcatggtgaa 2220

gatgccctga cccagctggc ccagattctg gaaaagaata tgaccctgaa actgagtgaa 2280

gcaaaaaagc gtcatcatct gcatcgtagt agtattggcc tgaaacgcca tagtgcaatt 2340

agtctggata gcgattattt tgaaagtgtt gatcagctgg tgccgagctg cgaagcaacc 2400

ctggataata gcaaaacaat ggcttataat gtggatgaac cgggcgccga aagtaatctg 2460

gatgttgccg ataaagaaaa agaagcatgg agtaaattcc gtgccgaaat tctgcgcctg 2520

acccataccc tgaaactgaa aggctggcgt aaagtgccga gcgaactgag taatgaaatt 2580

agcgtgcagc gtctgagcgg cgcgctgacc aatgccgtgt atgtggttag cccgccgaaa 2640

aatctgccgg ttccggaaca gagtgaagat ggtccgccga aaccgcgtaa tccgccgccg 2700

aaactgctgc tgcgcatcta tggcccgcag gttgaacatc tgattgatcg tgaaagtgaa 2760

ctgcaaattc tgacccgcct ggcacgtaaa cgtattggtc cgcgtctgct gggcaccttt 2820

ggtaatggtc gttttgaaga atttctgcac gctcagccgc tgaccagcaa agaactgcgc 2880

aatccggaaa ccagcgtgca gattgcaaaa cgtatgcgtg aactgcatga aggcattgat 2940

ctgctgaaaa aagaacgcga agccggcccg tttgtttggc agaattggga taaatgggtg 3000

aatcgttgcg aacatattgt gacctggctg gatcagcagg ttcgcgaaag cagtcagggc 3060

ctgagtcgtg caagtagcga taaatggaaa aaacgtggct atgtgtgtgg cgttgaatgg 3120

ccggtgttta aacagatgat ctataaatat cgcaagtggc tggaagatca gtatggcggt 3180

ctggataaaa ttaatgaacg catggttttt gcccataatg atacccagta tggcaatatt 3240

ctgcgcatga tgccggaagg cgaaagcccg ctgatgctgc cggcaaatca gcataaacag 3300

ctggtggtta ttgattttga atatgcaaat gcaaacctgc cgggcctgga atttgccaat 3360

cattttaccg aatgggccta taattatcat gatgcagaag ccccgtggcg ttgcaatacc 3420

aaatattatc cgaccattga agaacagcat cgctttattc gcgcctatct gatgcataat 3480

ccgagctata aagccagcgg tggctatacc agcaatccgg ccaccccgca tctgggtccg 3540

ctgcctagca gcggtagtac caccgcactg gccgcaaccg ccgcacctag cagtattagc 3600

gcctttatgc tggatagccg tgcaccgccg ggtgaaaaat atcaggaaca ggaagcccag 3660

tatgaacgcc agattgaaga agaagcccgc cgtctgctgg cagaaaccaa actgtggcgt 3720

ctggccaata gtgccatgtg ggttgcctgg ggcattgtgc aggcccatat tccgggtctg 3780

ccggattttg atgaagaaag cgaagataat aagaccagcg caaatccgag cgcagaagca 3840

gcaaccctgg acagtgcaac cgcagaactg gaagccgccg ccaaagcaga acagaaaagt 3900

accggcaccg tgagtgaaga aaccgccgca aaaattcagg cacaggcgca gatggaaaat 3960

gatgccgatc tgtttaaacc gcaggatgaa gaagaatttg attatctgca atacgcaaat 4020

gatcgcgcca tgtttgtttg gggtgacgca ctgcgcatgg gtattgtgag ccagagtgaa 4080

ctgccggaag aatttttaca gcgcattaag ctggtggaat attga 4125

<210> 28

<211> 369

<212> PRT

<213> Paramicrosporidium saccamoebae

<220>

<223> CK10

<400> 28

Met Ile Phe Ser Val Leu Gln Ser Glu Asn Ala Cys Glu Val Ala Glu

1 5 10 15

Ala Val Leu Ser Leu Val Gln Ser Val Leu Gly Ile Trp Leu His Ser

20 25 30

Ser Ala Gln Asp Ile Gln Val Tyr Arg Ile Ser Ser Ala Met Thr Asn

35 40 45

Met Val Phe Ser Val Thr Leu Ser Cys Ala Gly Pro Ser Glu Glu Asp

50 55 60

Thr Glu Ser Ala Thr Trp His Pro Glu Arg Leu Leu Leu Arg Val Tyr

65 70 75 80

Gly Asn Ser Asn Trp Met Phe Gln Arg Asp Leu Glu Glu Ser Thr Ala

85 90 95

Leu Val Leu Thr Glu His Gly Ile Ile Pro Gln Trp Tyr Gly Val Phe

100 105 110

Gly Asn Gly Arg Phe Glu Asp Tyr Ile Pro Ser Thr Ser Val Ser Ala

115 120 125

Arg Glu Phe Gln Ser Pro Glu Leu Cys Ala Glu Ile Ser Lys Cys Leu

130 135 140

Gly Arg Ile His Asn Met Leu Pro Asn Val Val Glu Ala Thr Thr Trp

145 150 155 160

Glu Asn Arg Asp Tyr Met Leu Glu Arg Leu Glu Ser Trp Arg Leu Ala

165 170 175

Ala Cys Leu Ser Met Ser Asn Leu Leu Gln Arg Lys Leu Ser Ser Asp

180 185 190

His Ala Glu Ile Leu Arg Lys Ile Glu Leu Trp Asp Ala Phe Ser Pro

195 200 205

Glu Phe Ile Pro Thr Leu Arg Cys Arg Ile Ala Gln Val Asp Ser Pro

210 215 220

Val Val Phe Ala His Cys Asp Leu His His Gly Asn Val Leu Arg Phe

225 230 235 240

His Ala Lys Asp Gly Val Ile Ala Ile Asp Phe Glu Tyr Gly Met Pro

245 250 255

Thr Phe Arg Gly Phe Asp Leu Ala Asn Phe Leu Ser Glu Phe Cys Tyr

260 265 270

Asp Tyr Asn Ser Pro Thr Pro Glu Val Pro Asp Trp Ser Asn Tyr Pro

275 280 285

Ser Arg Asp Thr Ile Val Arg Ile Leu Gln Asn Tyr Leu Gly Glu Ser

290 295 300

Pro Pro Glu Asp Val Tyr Lys Ile Met Asp Glu Ile Ser Val Phe Ala

305 310 315 320

Ala Ala Val Gln Leu Phe Trp Gly His Trp Cys Leu Ile Lys Ala Val

325 330 335

Asp Met Val Asp Asp Gly Tyr Lys Gly Phe Asp Tyr Ile Thr Ser Ala

340 345 350

Phe Glu Arg Tyr Lys Arg Phe Ile Gln Leu Thr Glu Gln Leu Ala Ile

355 360 365

Val

<210> 29

<211> 1110

<212> DNA

<213> Paramicrosporidium saccamoebae

<220>

<223> CK10 野生型

<400> 29

atgattttta gtgtcctaca gtctgaaaac gcctgcgagg tcgctgaagc tgtgctctcg 60

ctcgttcaga gcgtgttggg gatttggctc cattcaagtg cccaagacat tcaagtctat 120

cgcatcagct cggcaatgac taacatggtg ttttctgtga cgctttcgtg tgccgggccc 180

tctgaggagg atacagaatc tgccacttgg catcccgaga ggctgctctt acgagtctat 240

ggaaattcaa attggatgtt tcagcgcgac ttggaagagt cgacggcgtt agtgctaacc 300

gagcacggca taattccgca atggtatggg gtgtttggaa atggccgttt cgaggactat 360

atcccgagca cttcagtgtc ggcccgagag tttcagtccc cggaactatg tgcagagatc 420

tcaaagtgtc tggggagaat tcacaacatg ctgccaaacg tcgtcgaggc cacgacgtgg 480

gagaatcggg attacatgct cgagcgctta gagtcctggc gtcttgcggc ttgtctctca 540

atgtcgaacc tcttgcaacg aaagttgagc agtgatcatg ctgaaattct aaggaagatt 600

gaactgtggg atgcattttc tcctgaattt atccccacgc ttagatgcag gattgcacaa 660

gttgactctc ccgtcgtctt tgctcattgt gatttgcacc atggcaatgt gctgaggttt 720

catgcaaaag atggggtcat tgccattgac tttgagtatg ggatgccgac attcagaggg 780

ttcgatttgg ccaatttttt gagcgagttt tgctacgact acaactcacc caccccagaa 840

gtacccgatt ggtccaacta tccatcaaga gacactattg tccggattct ccaaaactac 900

ctcggggaga gtccccctga agatgtttac aaaattatgg acgagattag tgtctttgca 960

gcagctgtgc agctgttttg ggggcattgg tgcctgatca aggctgtgga catggtcgat 1020

gatggatata aaggattcga ctatatcact tctgcatttg aacggtacaa gagatttatt 1080

cagctcaccg agcaacttgc gattgtgtaa 1110

<210> 30

<211> 1110

<212> DNA

<213> 人工序列

<220>

<223> CK10-密码子优化的

<400> 30

atgatcttca gcgtgctgca aagtgaaaat gcatgtgaag ttgccgaagc cgttctgagt 60

ctggttcaga gtgttctggg catctggctg catagcagcg cccaggatat tcaggtgtat 120

cgtattagta gcgcaatgac caatatggtg ttcagcgtga ccctgagttg tgccggcccg 180

agcgaagaag ataccgaaag cgcaacctgg catccggaac gcctgctgct gcgcgtgtat 240

ggcaatagca attggatgtt ccagcgcgat ctggaagaaa gcaccgccct ggtgctgacc 300

gaacatggta ttattccgca gtggtatggc gtgttcggta atggccgctt cgaagattat 360

attccgagca ccagcgttag tgcccgcgag ttccagagcc cggaactgtg cgcagaaatt 420

agtaaatgtc tgggtcgtat tcataatatg ctgccgaatg tggtggaagc aaccacctgg 480

gaaaatcgcg attatatgct ggaacgcctg gaaagttggc gcctggcagc atgtctgagc 540

atgagcaatc tgctgcaacg taaactgagt agtgatcatg cagaaattct gcgtaaaatt 600

gaactgtggg atgccttcag cccggagttc attccgaccc tgcgctgccg cattgcacag 660

gttgatagtc cggtggtgtt cgcacattgt gatctgcatc atggtaatgt gctgcgcttc 720

catgccaaag atggcgtgat tgcaattgac ttcgaatatg gtatgccgac cttccgtggc 780

ttcgatctgg ccaacttcct gagtgagttc tgttatgatt ataatagtcc gaccccggaa 840

gtgccggatt ggagtaatta tccgagtcgc gataccattg tgcgcattct gcaaaattat 900

ctgggcgaaa gcccgccgga agatgtgtat aaaattatgg atgaaatcag cgtgttcgcc 960

gcagcagttc agctgttctg gggtcattgg tgtctgatta aagcagttga tatggttgat 1020

gatggctata aaggcttcga ttatattacc agcgccttcg aacgctataa acgcttcatt 1080

cagctgaccg aacagctggc cattgtttga 1110

<210> 31

<211> 397

<212> PRT

<213> 链枝菌（Catenaria anguillulae）

<220>

<223> CK11

<400> 31

Met Thr Ala Pro Thr Ile Ser Val Arg Arg Ile Asp Tyr Thr Val Asp

1 5 10 15

Ser Asn Asn Pro Gln Ala Leu Asp Ser Ser Ala Arg His Leu Gly Val

20 25 30

Val Leu Gly Leu Cys Ser Glu Ala Asp Ala Gln Ala Ala Lys Val Thr

35 40 45

Arg Cys Lys Gln Gly Ile Thr Asn Lys Leu Leu Lys Val Ser Leu Pro

50 55 60

Ser Gly Asn Lys Tyr Leu Met Arg Val Tyr Gly His Gly Thr Ser Thr

65 70 75 80

Leu Ile Asp Arg Asp Ala Glu Val Arg Asn Met Ala Tyr Leu Ala Ser

85 90 95

His Gly Leu Ala Pro Pro Leu His Ala Arg Phe Asn Asn Gly Leu Val

100 105 110

Tyr Gly Phe Val Lys Gly Thr Ala Ala His Pro Asp Ala Leu Ala His

115 120 125

Pro Gln Val Trp Pro Ala Ile Ala Lys His Leu Ala Glu Trp His Ser

130 135 140

Leu Pro Leu Pro Ser Pro Ser Ser Pro Ser Asn Asp Gly Ala Gln Ala

145 150 155 160

Pro Pro Pro Ala Ser Gln Leu Phe Val Thr Leu Asp Arg Trp Leu Gly

165 170 175

Met Val Thr Gln Ala Ala Gln Ala Arg Asp Gly Pro Thr Ala Thr Gln

180 185 190

Phe Glu Gly Ile Ala Leu Ala Asp Leu Gly Ala Glu Arg Asp Arg Leu

195 200 205

Phe Ala Thr Leu Pro Ala Ser Pro Leu Thr Phe Asn His Asn Asp Leu

210 215 220

Leu Ser Gly Asn Val Ile Leu Gln His Asp Gln Ala His Ala Asp Leu

225 230 235 240

Asp Ala Ile Asp Leu Ser Gly Asp Ala Asn Glu Val Asp Pro Ser Asp

245 250 255

Thr Pro Asp Ala Leu Ala Ser Val Val Ser Ala Lys Phe Ile Asp Tyr

260 265 270

Glu Tyr Gly Ala Leu Gly Pro Ala Ala Phe Asp Val Ala Asn His Trp

275 280 285

Cys Glu Trp Ala Gly Phe Glu Cys Glu Tyr Trp Arg Tyr Pro Ala Thr

290 295 300

Glu Thr Gln Arg Ala Trp Leu Thr Thr Tyr Leu Thr Ala Leu Asn Lys

305 310 315 320

Glu Ala Lys Pro Pro Thr Val Ala Glu Val Asp Thr Trp Val Glu His

325 330 335

Val Lys Glu Tyr Thr Pro Ala Ser His Phe Phe Trp Ile Leu Trp Ala

340 345 350

Leu Val Gln Ala Thr Val Ser Asp Ile Asp Phe Asp Tyr Ala Gly Tyr

355 360 365

Ala Arg Leu Arg Trp Ser Glu Leu Lys Arg Trp Cys Glu Ala Arg Cys

370 375 380

Arg Arg Pro Ser Arg Ile Ser Ser Ser Arg Ile Arg Pro

385 390 395

<210> 32

<211> 1194

<212> DNA

<213> 链枝菌（Catenaria anguillulae）

<220>

<223> CK11 野生型

<400> 32

atgaccgcac ctaccatcag cgtccgccgc atcgactaca cagtcgactc caacaaccca 60

caggccctcg actcgtctgc ccgccacctc ggcgtcgtgc tgggcctgtg ctccgaggcc 120

gacgcccagg ccgccaaggt gacccgatgc aagcagggca tcaccaacaa gctcctcaag 180

gtgtcgctgc cctcaggcaa caagtacctt atgcgcgtct acggccacgg cacctcgacc 240

ctcattgacc gcgacgccga ggtccgaaac atggcctact tggcatccca cggcctcgcc 300

ccgccgctcc atgcacgctt caacaatggc ctcgtgtacg gctttgtcaa gggcacggcc 360

gcgcacccgg atgctctggc gcacccgcaa gtgtggccag caattgcaaa gcacttggcc 420

gaatggcact cgctgcctct gccctcgccg tcgtcgccgt caaacgatgg cgcacaggcg 480

ccgccgcctg catcgcagtt gtttgtcact ctggaccgct ggctcggtat ggtcacgcaa 540

gccgctcaag cccgcgacgg cccgacggca acgcaatttg agggcattgc cctggctgac 600

ctcggcgccg aacgtgaccg cctctttgca acgcttcctg cgtcgccgct caccttcaac 660

cacaatgacc tgctctcggg caatgtcatt ttgcaacacg accaagcgca cgccgacttg 720

gacgccattg acctgtcggg cgacgccaac gaggtggacc cttcggatac gcccgatgct 780

ttggccagtg tagtgtctgc caaattcatt gattacgagt acggcgccct tggccctgcg 840

gcgttcgatg tggccaacca ctggtgcgag tgggccgggt tcgagtgcga gtactggcgg 900

taccccgcaa cagagacgca gcgcgcgtgg ttgacgacct acttgacggc gctcaacaag 960

gaggccaagc cgcccacggt ggccgaggtc gacacatggg tggaacatgt caaggagtac 1020

acgccggcat cgcacttctt ttggattctg tgggcgctgg tgcaagccac ggtgagcgac 1080

attgattttg attatgccgg gtatgcacgg ttgaggtgga gcgagctcaa gcgctggtgc 1140

gaggccagat gccgccggcc aagccgcatc tcgtcgagtc ggattcggcc gtga 1194

<210> 33

<211> 1194

<212> DNA

<213> 人工序列

<220>

<223> CK11-密码子优化的

<400> 33

atgaccgccc cgaccattag cgtgcgccgt attgattata ccgtggatag caataatccg 60

caggcactgg atagcagcgc acgccatctg ggcgttgtgc tgggcctgtg cagtgaagca 120

gatgcacagg ccgcaaaagt gacccgctgt aaacagggta ttaccaataa actgctgaaa 180

gttagcctgc cgagcggtaa taaatatctg atgcgtgtgt atggtcatgg caccagtacc 240

ctgattgatc gtgatgccga agtgcgtaat atggcatatc tggcaagtca tggtctggca 300

ccgccgctgc acgctcgctt caataatggc ctggtgtatg gcttcgttaa aggcaccgcc 360

gcacatccgg atgccctggc acatccgcag gtgtggccgg ctattgccaa acatctggcc 420

gaatggcata gcctgccgct gccgagtccg agtagtccga gtaatgatgg cgcccaggca 480

ccgccgccgg caagccagtt attcgtgacc ctggatcgct ggctgggcat ggtgacccag 540

gcagcccagg cacgtgatgg tccgaccgca acccagttcg aaggcattgc actggcagat 600

ctgggcgccg aacgtgatcg cctgttcgca accctgccgg caagtccgct gaccttcaat 660

cataatgatc tgctgagcgg caatgtgatt ctgcaacatg atcaggcaca tgcagatctg 720

gatgcaattg atctgagtgg tgatgcaaat gaagtggacc ctagcgatac cccggatgca 780

ctggccagtg ttgttagcgc aaaattcatt gattatgaat acggtgcact gggtccggcc 840

gccttcgatg tggcaaatca ttggtgcgaa tgggccggct tcgaatgcga atattggcgt 900

tatccggcaa ccgaaacaca acgcgcatgg ctgaccacct atctgaccgc actgaataaa 960

gaagccaaac cgccgaccgt ggcagaagtg gatacctggg tggaacatgt taaagaatat 1020

accccggcca gccacttctt ctggattctg tgggcactgg ttcaggcaac cgttagtgat 1080

attgacttcg attatgcagg ctatgcacgc ctgcgttgga gcgaactgaa acgttggtgc 1140

gaagcccgtt gtcgtcgtcc gagtcgtatt agtagtagcc gtattcgtcc gtga 1194

<210> 34

<211> 369

<212> PRT

<213> 卷枝毛霉（Mucor circinelloides）

<220>

<223> CK12

<400> 34

Met Ala Ser Pro Glu Gly Glu Thr Leu Pro Ser Ile Pro Gly Cys Asp

1 5 10 15

Thr Ile Ile Asp Leu Ala Val Leu Lys Gly Asp Glu Leu Thr Asn Lys

20 25 30

Val Leu Lys Leu Ile Gln Val Leu Phe Pro Asp Tyr Ala Glu Asn Leu

35 40 45

Glu Lys Ile Glu Leu Asn Arg Val Ser Gly Ala Leu Thr Asn Ala Val

50 55 60

Phe Phe Val Asn Ala Pro Asn Lys Arg Arg Leu Leu Leu Arg Val Tyr

65 70 75 80

Gly Asn Gly Val Asp Gln Ile Ile Asp Arg Glu Asn Glu Leu Ala Trp

85 90 95

Leu Ala Arg Leu Ser Ser Leu Asn Ile Gly Pro Ser Leu Leu Gly Ile

100 105 110

Phe Gly Asn Gly Arg Phe Glu Glu Tyr Leu Pro Ser Thr Thr Leu Thr

115 120 125

His His Asp Ile Arg Asp Pro Glu Thr Ser Lys Gly Ile Ala Ala Cys

130 135 140

Ile Arg Glu Leu His Asp Ile Val Ala Val Tyr Pro Phe Ser Pro Glu

145 150 155 160

Lys Asn His Leu Glu Ile Trp Ala Asn Ile Asp Lys Trp Tyr Gln Val

165 170 175

Val Met Ser Leu Leu Pro Val Leu Tyr Lys Lys Ser Asp Gly Trp Thr

180 185 190

Gln Val Leu Thr Thr Phe Asn Leu Glu Arg Leu Thr Phe Glu Ile Glu

195 200 205

Glu Cys Lys Gln Ile Leu Glu Ala Ala Lys Ser Pro Ile Val Phe Gly

210 215 220

His Asn Asp Thr Gln Tyr Gly Asn Val Leu Lys Leu Glu Lys Thr Asn

225 230 235 240

Glu Leu Val Ile Val Asp Phe Glu Tyr Ala Gly Tyr Asn Pro Arg Gly

245 250 255

Phe Asp Ile Ala Asn His Phe Cys Glu Trp Thr Tyr Asp Tyr His Ser

260 265 270

Glu Gln Pro Ala Ser Met Asp Thr Ser Gln Tyr Pro Thr Tyr Glu Glu

275 280 285

Gln Ile Arg Phe Leu Asn Ala Tyr Leu Glu Thr Lys Ser Lys Asn Asp

290 295 300

Asn Pro Asp Ile Leu Asp Lys Ala Val Thr Ala Glu Cys Leu Gln Lys

305 310 315 320

Glu Ala Ala Met Trp Leu Met Ala Ser His Leu Ser Trp Gly Leu Trp

325 330 335

Gly Leu Ile Gln Ala Ser Gln Ser Glu Ile Asp Phe Asp Tyr Phe Leu

340 345 350

Phe Ser Thr Gln Arg Leu Asn Ala Phe Arg Glu Glu Phe Ala Lys Trp

355 360 365

Lys

<210> 35

<211> 1110

<212> DNA

<213> 卷枝毛霉（Mucor circinelloides）

<220>

<223> CK12 野生型

<400> 35

atggcatcac ccgaaggaga aacgctgcct tctattccag gctgtgatac aatcattgat 60

ctagctgtgc ttaaaggaga cgaattaaca aacaaagtgc tcaagttgat tcaagtactt 120

ttcccggatt atgctgaaaa cctcgagaaa atcgaactga atagagtgag tggtgccttg 180

acaaatgccg tcttttttgt caacgcaccc aacaagcgcc gtttattgtt gagagtatac 240

ggtaatggag tggatcagat tattgaccga gagaatgaat tagcttggct tgctcgcctc 300

tctagcttga atattggacc tagtttatta ggcatatttg gtaacggtcg atttgaggag 360

tatttgcctt ccaccacttt gacgcaccat gacattcgtg accccgagac ttccaaggga 420

attgctgctt gtattcgcga attgcacgac attgtagcag tatatccatt ctcaccagaa 480

aagaatcatt tggagatttg ggccaacatt gataaatggt atcaggttgt catgtcgttg 540

ttaccagtac tttacaaaaa gagcgatggc tggacacaag tgctgacgac ctttaatttg 600

gagcgtttga catttgaaat tgaagagtgt aaacaaatct tggaagctgc taaatcgccc 660

attgtatttg ggcataatga tacacaatat ggcaatgtgc tcaagttgga aaagacaaac 720

gaattggtga ttgttgattt cgaatacgca ggctataatc cccgtggatt tgacattgct 780

aaccactttt gtgaatggac atacgactat cactctgaac agcctgcctc aatggacaca 840

agtcaatatc ctacctacga agagcaaatc agattcctga acgcctatct cgaaaccaag 900

tctaagaacg acaatccaga cattttagac aaagcagtta cagctgaatg cttacagaaa 960

gaggctgcca tgtggctcat ggccagccat ctgtcctggg gtttgtgggg tttgatccaa 1020

gcaagtcaaa gcgagattga tttcgactac tttttgttct ctactcaacg tttgaatgct 1080

ttccgcgaag agtttgctaa atggaaatga 1110

<210> 36

<211> 1110

<212> DNA

<213> 人工序列

<220>

<223> CK12-密码子优化的

<400> 36

atggcaagcc cggaaggcga aaccttaccg agcattccgg gctgcgatac cattattgat 60

ctggcagttc tgaaaggtga tgaactgacc aataaagttc tgaaactgat tcaggttctg 120

ttcccggatt atgcagaaaa tctggaaaaa attgagctga atcgcgtgag cggcgcactg 180

accaatgccg tgttcttcgt gaatgccccg aataaacgcc gcctgctgct gcgcgtgtat 240

ggcaatggcg ttgatcagat tattgatcgc gaaaatgaac tggcctggct ggcacgcctg 300

agtagcctga atattggtcc gagtctgctg ggcatcttcg gtaatggccg cttcgaagaa 360

tatctgccga gtaccaccct gacccatcat gatattcgtg atccggaaac cagtaaaggc 420

attgccgcat gtattcgcga actgcatgat attgttgccg tgtatccgtt cagcccggaa 480

aaaaatcatc tggaaatctg ggcaaatatt gataaatggt atcaggtggt tatgagcctg 540

ctgccggtgc tgtataaaaa aagtgatggt tggacccagg tgctgaccac cttcaatctg 600

gaacgtctga ccttcgaaat tgaagaatgt aaacagattc tggaagccgc caaaagtccg 660

attgtgttcg gccataatga tacccagtat ggtaatgttc tgaaattaga aaagaccaat 720

gagctggtta ttgttgactt cgaatatgcc ggctataatc cgcgcggctt cgatattgca 780

aatcacttct gtgaatggac ctatgattat catagtgaac agccggccag catggatacc 840

agccagtatc cgacctatga agaacagatt cgcttcctga atgcctatct ggaaaccaaa 900

agtaaaaatg ataacccgga tattctggat aaagcagtta ccgcagaatg tctgcaaaaa 960

gaagcagcca tgtggctgat ggcaagccat ctgagctggg gtctgtgggg tctgattcag 1020

gcaagccaga gtgaaattga cttcgattac ttcctgttca gcacccagcg cctgaatgca 1080

ttccgcgaag agttcgcaaa atggaaatga 1110

<210> 37

<211> 262

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<220>

<223> HTK1

<400> 37

Met Gln Val Asp Leu Leu Gly Ser Ala Gln Ser Ala His Ala Leu His

1 5 10 15

Leu Phe His Gln His Ser Pro Leu Val His Cys Met Thr Asn Asp Val

20 25 30

Val Gln Thr Phe Thr Ala Asn Thr Leu Leu Ala Leu Gly Ala Ser Pro

35 40 45

Ala Met Val Ile Glu Thr Glu Glu Ala Ser Gln Phe Ala Ala Ile Ala

50 55 60

Ser Ala Leu Leu Ile Asn Val Gly Thr Leu Thr Gln Pro Arg Ala Gln

65 70 75 80

Ala Met Arg Ala Ala Val Glu Gln Ala Lys Ser Ser Gln Thr Pro Trp

85 90 95

Thr Leu Asp Pro Val Ala Val Gly Ala Leu Asp Tyr Arg Arg His Phe

100 105 110

Cys His Glu Leu Leu Ser Phe Lys Pro Ala Ala Ile Arg Gly Asn Ala

115 120 125

Ser Glu Ile Met Ala Leu Ala Gly Ile Ala Asn Gly Gly Arg Gly Val

130 135 140

Asp Thr Thr Asp Ala Ala Ala Asn Ala Ile Pro Ala Ala Gln Thr Leu

145 150 155 160

Ala Arg Glu Thr Gly Ala Ile Val Val Val Thr Gly Glu Met Asp Tyr

165 170 175

Val Thr Asp Gly His Arg Ile Ile Gly Ile His Gly Gly Asp Pro Leu

180 185 190

Met Thr Lys Val Val Gly Thr Gly Cys Ala Leu Ser Ala Val Val Ala

195 200 205

Ala Cys Cys Ala Leu Pro Gly Asp Thr Leu Glu Asn Val Ala Ser Ala

210 215 220

Cys His Trp Met Lys Gln Ala Gly Glu Arg Ala Val Ala Arg Ser Glu

225 230 235 240

Gly Pro Gly Ser Phe Val Pro His Phe Leu Asp Ala Leu Trp Gln Leu

245 250 255

Thr Gln Glu Val Gln Ala

260

<210> 38

<211> 789

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<220>

<223> HTK1 野生型

<400> 38

atgcaagtcg acctgctggg ttcagcgcaa tctgcgcacg cgttacacct ttttcaccaa 60

cattcccctc ttgtgcactg catgaccaat gatgtggtgc aaacctttac cgccaatacc 120

ttgctggcgc tcggtgcatc gccagcgatg gttatcgaaa ccgaagaggc cagtcagttt 180

gcggctatcg ccagtgcctt gttgattaac gttggcacac tgacgcagcc acgcgctcag 240

gcgatgcgtg ctgccgttga gcaagcaaaa agctctcaaa caccctggac gcttgatcca 300

gtagcggtgg gtgcgctcga ttatcgccgc catttttgtc atgaactttt atcttttaaa 360

ccggcagcga tacgtggtaa tgcttcggaa atcatggcat tagctggcat tgctaatggc 420

ggacggggag tggataccac tgacgccgca gctaacgcga tacccgctgc acaaacactg 480

gcacgggaaa ctggcgcaat cgtcgtggtc actggcgaga tggattatgt taccgatgga 540

catcgtatca ttggtattca cggtggtgat ccgttaatga ccaaagtggt aggaactggc 600

tgtgcattat cggcggttgt cgctgcctgc tgtgcgttac caggcgatac gctggaaaat 660

gtcgcatctg cctgtcactg gatgaaacaa gccggagaac gcgcagtcgc cagaagcgag 720

gggccaggca gttttgttcc acatttcctt gatgcgctct ggcaattgac gcaggaggtg 780

caggcatga 789

<210> 39

<211> 789

<212> DNA

<213> 人工序列

<220>

<223> HTK1-密码子优化的

<400> 39

atgcaggtgg atctgctggg tagcgcacag agcgcccatg ccctgcatct gttccatcag 60

catagcccgc tggttcattg tatgaccaat gatgtggtgc agaccttcac cgccaatacc 120

ctgctggcac tgggcgcaag tccggcaatg gtgattgaaa ccgaagaagc aagtcagttc 180

gccgcaattg caagcgccct gctgattaat gtgggcaccc tgacccagcc gcgcgcacaa 240

gcaatgcgcg ccgcagtgga acaggccaaa agcagtcaga ccccgtggac cctggaccct 300

gtggcagttg gtgcactgga ttatcgtcgc cacttctgtc atgaactgct gagcttcaaa 360

ccggccgcca ttcgcggcaa tgcaagtgaa attatggccc tggccggtat tgccaatggc 420

ggccgtggtg ttgataccac cgatgcagca gcaaatgcca ttccggcagc ccagaccctg 480

gcacgcgaaa ccggcgctat tgttgttgtg accggtgaaa tggattatgt gaccgatggt 540

catcgcatta ttggcattca tggtggtgat ccgctgatga ccaaagttgt tggtaccggt 600

tgtgcactga gtgccgttgt ggccgcatgt tgtgcactgc cgggcgatac cctggaaaat 660

gtggccagcg catgtcattg gatgaaacag gcaggtgaac gtgcagttgc ccgcagcgaa 720

ggccctggta gcttcgtgcc gcacttcctg gatgccctgt ggcagctgac ccaggaagtt 780

caggcctga 789

<210> 40

<211> 224

<212> PRT

<213> 地衣芽孢杆菌（Bacillus licheniformis）

<220>

<223> HTK2

<400> 40

Met Thr Arg Val Ser Glu Glu Ala Met Lys Asp Leu Leu Ser Val Tyr

1 5 10 15

Phe Ile Met Gly Ser Asn Asn Thr Ala Gly Asp Pro Leu Thr Val Ile

20 25 30

Glu Lys Ala Leu Lys Gly Gly Ala Thr Leu Phe Gln Phe Arg Glu Lys

35 40 45

Gly Glu Gly Ala Leu Lys Ala Gly Asp Gln Thr Ala Phe Ala Arg Gln

50 55 60

Val Gln Ala Leu Cys Lys Gln Phe Asn Val Pro Phe Ile Ile Asn Asp

65 70 75 80

Asp Val Glu Leu Ala Leu Glu Leu Asp Ala Asp Gly Val His Ile Gly

85 90 95

Gln Asp Asp Asp Lys Ala Ala Asp Val Arg Ala Arg Ile Gly Asp Lys

100 105 110

Ile Leu Gly Val Ser Ala His Thr Leu Glu Glu Val Leu Lys Ala Glu

115 120 125

Lys Asp Gly Ala Asp Tyr Ile Gly Ala Gly Pro Val Tyr Pro Thr Glu

130 135 140

Thr Lys Arg Asp Thr Lys Ala Val Gln Gly Val Ser Leu Ile Gln Glu

145 150 155 160

Ile Arg Arg Gln Gly Ile Gly Ile Pro Val Val Gly Ile Gly Gly Ile

165 170 175

Thr Val Glu Asn Cys Val Pro Val Ile Glu Ala Gly Ala Asp Gly Ile

180 185 190

Ser Val Ile Ser Ala Ile Ser Lys Ala Ala Asp Pro Lys Gln Ala Ala

195 200 205

Glu Ala Phe Ser Glu Lys Val Gln Ala Thr Lys Gln Ser Ala His Ser

210 215 220

<210> 41

<211> 675

<212> DNA

<213> 地衣芽孢杆菌（Bacillus licheniformis）

<220>

<223> HTK2 野生型

<400> 41

atgacgcgag tctcagaaga agcaatgaaa gatctgttgt cggtctattt tattatgggg 60

tcaaacaata ccgcagggga tcctttaact gttattgaaa aagctttaaa aggcggtgcg 120

accctttttc aattccgcga aaaaggcgag ggtgcgttga aagccggaga tcaaacggcg 180

tttgcccgac aggtgcaggc gctgtgcaaa cagttcaatg taccgtttat tatcaacgat 240

gatgtagaac tcgcgcttga acttgacgca gatggcgtgc atatcggcca ggatgatgat 300

aaggccgcag acgtcagagc gagaatcggg gacaaaatcc tcggcgtttc cgcgcataca 360

cttgaagaag tcttaaaggc ggaaaaggat ggagcggatt acatcggtgc ggggcctgtt 420

taccctactg aaacaaagcg ggatacaaaa gctgtgcagg gcgtctcgct cattcaagag 480

atccgcaggc agggaattgg cattcctgtg gtcggaatcg gcgggatcac ggtcgaaaac 540

tgcgtccccg tcatcgaggc cggggcggac ggcatcagtg tcatcagcgc catcagcaaa 600

gccgccgatc caaagcaggc cgccgaggcg tttagcgaga aagtccaagc taccaaacaa 660

agcgcacatt cctaa 675

<210> 42

<211> 675

<212> DNA

<213> 人工序列

<220>

<223> HTK2-密码子优化的

<400> 42

atgacccgtg tgagcgaaga agcaatgaaa gatctgctga gcgtgtactt cattatgggc 60

agtaataata ccgcaggcga tccgctgacc gttattgaaa aagcactgaa aggcggtgcc 120

accctgttcc agttccgtga aaaaggtgaa ggcgccctga aagcaggcga tcagaccgca 180

ttcgcacgtc aggtgcaggc actgtgtaaa cagttcaatg ttccgttcat tattaacgat 240

gatgttgaac tggcactgga actggatgcc gatggtgttc atattggtca ggatgatgat 300

aaagccgccg atgtgcgcgc ccgtattggt gataaaattc tgggtgtgag cgcacatacc 360

ctggaagaag tgctgaaagc cgaaaaagat ggcgcagatt atattggtgc cggcccggtg 420

tatccgaccg aaaccaaacg cgataccaaa gccgtgcagg gtgttagtct gattcaggaa 480

attcgtcgtc agggcattgg cattccggtg gtgggtattg gtggcattac cgttgaaaat 540

tgtgtgccgg tgattgaagc cggtgcagat ggcattagtg ttattagcgc cattagcaaa 600

gcagcagatc cgaaacaggc cgcagaagca ttcagcgaaa aagttcaggc aaccaaacag 660

agcgcccata gctga 675

<210> 43

<211> 275

<212> PRT

<213> Clostridium algidicarnis

<220>

<223> HTK3

<400> 43

Met Asn Tyr Ile Asp Lys Ser Ile Asp Leu Ile Arg Leu Thr Lys Glu

1 5 10 15

Lys Asn Pro Leu Val Asp Phe Ala Val Asn Tyr Val Thr Ala Asn Asp

20 25 30

Ser Thr Ser Val Thr Ser Tyr Ile Gly Gly Ser Pro Val Met Thr Asp

35 40 45

Asp Ser Ile Asp Ala Ala Asp Val Val Glu Tyr Gly Asn Val Asp Ala

50 55 60

Leu Ile Phe Asn Ile Gly Thr Ile Thr Glu Lys Gln Tyr His Ser Met

65 70 75 80

Met Glu Ala Gly Lys Arg Ala Thr Glu Arg Gly Ile Pro Ile Val Ile

85 90 95

Asp Pro Val Ala Thr Ser Ile Thr Pro Phe Arg Thr Met Ile Ile Gln

100 105 110

Arg Met Leu Asp Glu Leu Asn Val Ser Val Ile Lys Gly Asn Leu Gly

115 120 125

Glu Ile Lys Ala Cys Leu Gly Leu Lys Thr Asn Ser Lys Gly Val Asp

130 135 140

Ser Asn Glu Asn Pro Glu Gly Ala Glu Glu Phe Cys Ile Lys Leu Ala

145 150 155 160

Arg Lys Arg Asn Leu Val Val Ala Met Thr Gly Pro Lys Asp Ile Ile

165 170 175

Thr Asp Gly Glu Arg Ile Val Val Ile Glu Asn Gly Thr Asp Arg Leu

180 185 190

Pro Lys Val Ile Gly Thr Gly Cys Ile Leu Gly Ala Met Val Ala Thr

195 200 205

Tyr Cys Gly Ala Thr Asn Asp Tyr Val Leu Ala Ala Ser Thr Ala Ile

210 215 220

Met Leu Met Gly Val Ala Gly Glu Leu Ala Ser Glu Ile Thr Lys Glu

225 230 235 240

Asp Glu Gly His Tyr Lys Phe Lys Val Asn Leu Ile Asp Val Leu Ser

245 250 255

Thr Ile Val Asp Asn Glu Asp Lys Ile Lys Ala Lys Ala Asn Met Lys

260 265 270

Ile Ile Lys

275

<210> 44

<211> 828

<212> DNA

<213> Clostridium algidicarnis

<220>

<223> HTK3 野生型

<400> 44

atgaactata tagataaatc aatagaccta attagactta caaaggagaa aaaccctctt 60

gtggattttg cggtaaacta tgttactgca aatgattcta ctagtgtaac ctcttacatt 120

ggaggtagcc ctgtgatgac agatgattct atagatgctg cggatgttgt ggaatacggt 180

aatgtagatg cattaatatt taacatagga actataacag aaaagcagta tcactctatg 240

atggaagctg gtaaaagggc tactgaaaga ggaattccta tagtaataga ccctgtagca 300

actagtatta caccttttag aactatgatt atccaaagaa tgcttgatga acttaatgtt 360

tctgtaataa agggaaacct tggggaaatt aaagcttgcc ttggtcttaa gacaaactca 420

aaaggtgttg attctaatga aaaccctgag ggtgcagaag aattctgcat taaacttgca 480

agaaaaagaa acttagtagt tgcaatgact ggtccaaagg atataataac ggacggtgaa 540

agaatagttg ttattgaaaa tggtacggac aggcttccaa aggttatagg aactggctgt 600

attctaggtg ctatggttgc tacctattgt ggtgctacta atgattacgt attagcagct 660

tctacagcta taatgcttat gggagtagct ggtgagcttg caagtgaaat tacaaaggaa 720

gatgaaggac actataagtt taaagttaat ttaatagatg tattatctac tatagtggac 780

aatgaagata aaataaaagc caaggctaac atgaaaatta ttaaatag 828

<210> 45

<211> 828

<212> DNA

<213> 人工序列

<220>

<223> HTK3-密码子优化的

<400> 45

atgaactaca tcgataagag cattgatctg attcgcctga ccaaagaaaa aaatccgctg 60

gtggacttcg cagtgaatta tgtgaccgca aatgatagta ccagtgtgac cagttatatt 120

ggcggtagcc cggttatgac cgatgatagt attgatgccg cagatgtggt ggaatatggc 180

aatgttgatg cactgatctt caatattggt accattaccg aaaaacagta tcatagcatg 240

atggaagcag gcaaacgtgc aaccgaacgt ggtattccga ttgttattga tccggtggca 300

accagcatta ccccgttccg taccatgatt attcagcgta tgctggatga actgaatgtt 360

agcgttatta aaggcaatct gggcgaaatt aaagcatgtc tgggcctgaa aaccaatagc 420

aaaggcgttg atagtaatga aaatccggaa ggtgcagaag agttctgtat taaactggca 480

cgtaaacgta atctggtggt ggcaatgacc ggtccgaaag atattattac cgatggtgaa 540

cgcattgtgg tgattgaaaa tggcaccgat cgtctgccga aagtgattgg taccggctgc 600

attctgggtg caatggtggc cacctattgc ggtgcaacca atgattatgt gctggccgcc 660

agtaccgcca ttatgctgat gggtgttgcc ggtgaactgg ccagtgaaat taccaaagaa 720

gatgaaggtc attataagtt caaggtgaat ctgattgatg ttctgagcac cattgttgat 780

aatgaagata aaatcaaggc caaagcaaat atgaaaatca ttaagtga 828

<210> 46

<211> 279

<212> PRT

<213> 气球菌属（Aerococcus sp.）

<220>

<223> HTK4

<400> 46

Met Ser Lys Lys Ile Ser Leu Pro Phe Ala Lys Tyr Ser Gln Gln Val

1 5 10 15

Lys Glu Lys Ala Pro Leu Ile Gln Val Leu Asn Asn Tyr Val Thr Ile

20 25 30

His Asp Val Ala Asn Val Ile Leu Ala Ser Gly Gly Arg Pro Val Met

35 40 45

Thr Asp Asn Leu Pro Asn Ser Gln Asp Val Val Lys Thr Ala Asp Leu

50 55 60

Leu Leu Leu Asn Ala Ala Ser Pro Arg Pro Asn Gln Glu Leu Leu Asp

65 70 75 80

Leu Ala Thr Thr Ala Lys Asn Asp His His Pro Val Val Leu Asp Pro

85 90 95

Val Gly Val Ser Ala Met Pro Ser Lys Leu Lys Leu Cys Gln Asp Leu

100 105 110

Ile Asp Gln Gly Leu Val Thr Ala Val Lys Gly Asn Ala Ser Glu Ile

115 120 125

Arg Ser Leu Leu Phe Glu Lys Ser Gln Gly Ser Gly Val Asp Leu Gly

130 135 140

Pro Gly Asp Glu Val Thr Leu Ala Asn Leu Ala Asp Phe Ala Pro Asp

145 150 155 160

Phe Lys Ala Tyr Ala Gln Glu Lys Arg Ile Ile Leu Ala Met Ser Gly

165 170 175

Pro Ile Asp Leu Val Thr Asp Gly Lys Arg Leu Ala Val Ile Glu Asn

180 185 190

Gly His Pro Trp Met Ala Ser Tyr Thr Gly Ser Gly Cys Gln Leu Ser

195 200 205

Gly Val Leu Ala Ser Phe Leu Ala Gly Asn Pro Asp Glu Asp Pro Phe

210 215 220

Tyr Leu Ala Thr Ala Ala Val Ile Ser Tyr Gly Val Ala Gly Glu Ile

225 230 235 240

Ala Ala Gln Val Leu Gln Pro Tyr Glu Gly Asn Ala Thr Tyr Ser Asn

245 250 255

Arg Val Ile Asp Gln Val Phe Leu Leu Glu Ala Lys Glu Leu Glu Arg

260 265 270

Arg Ala Lys Tyr Asp Ile Gln

275

<210> 47

<211> 840

<212> DNA

<213> 气球菌属（Aerococcus sp.）

<220>

<223> HTK4 野生型

<400> 47

atgtctaaaa aaataagcct tccctttgcg aaatatagtc agcaggtcaa ggagaaagcc 60

ccgctgatcc aagtcttaaa taattatgtc accatacatg atgtggccaa tgtgattttg 120

gccagtggcg ggcgtcccgt gatgaccgat aacttaccta atagtcagga tgtagtcaag 180

acagctgacc ttttgctatt gaatgccgct agtcccagac ctaatcagga attgttggac 240

ctcgccacca cagcgaaaaa tgatcaccat cccgtggtct tagacccagt gggggtttca 300

gcgatgccgt ctaaattaaa gctctgtcaa gatctgattg accaggggtt agtgacagcg 360

gtgaagggga atgcttcgga aattcgaagt ctcctttttg aaaaaagcca aggatctggg 420

gtcgacctgg gtcctggaga cgaggtaacc ttagccaacc tggctgattt tgctccggac 480

tttaaagctt atgcccaaga aaaaagaatt atcctagcca tgtcgggtcc gattgactta 540

gtgacagacg gcaagcggct ggcagtcatt gaaaatggcc acccctggat ggcttcctat 600

acggggtcag gttgccagtt aagcggcgtc ctagctagct ttttagccgg taatccggat 660

gaggatcctt tttacctagc tacagcagcc gtgattagct atggggtggc gggagaaatt 720

gctgcccaag tcctccagcc ttatgagggc aatgccactt attccaaccg ggtgattgac 780

caggttttct tattagaggc caaagaatta gaaaggagag ccaagtatga cattcaataa 840

<210> 48

<211> 840

<212> DNA

<213> 人工序列

<220>

<223> HTK4-密码子优化的

<400> 48

atgagtaaga agatcagcct gccgttcgcc aaatatagcc agcaggttaa agaaaaagcc 60

ccgctgattc aggtgctgaa taattatgtg accattcatg atgtggcaaa tgttattctg 120

gccagcggtg gccgtccggt gatgaccgat aatctgccga atagtcagga tgtggttaaa 180

accgcagatc tgctgctgct gaatgccgca agtccgcgcc cgaatcagga actgctggat 240

ctggcaacca ccgcaaaaaa tgatcatcat ccggttgttc tggaccctgt tggcgttagt 300

gcaatgccga gtaaactgaa actgtgccag gatctgattg atcagggtct ggtgaccgcc 360

gttaaaggta atgcaagcga aattcgtagc ctgctgttcg aaaaaagtca gggcagcggt 420

gttgatctgg gtccgggtga tgaagtgacc ctggccaatc tggcagactt cgcaccggac 480

ttcaaagcct atgcacagga aaaacgtatt attctggcca tgagcggtcc gattgatctg 540

gtgaccgatg gtaaacgtct ggccgttatt gaaaatggcc atccgtggat ggcaagctat 600

accggtagtg gttgccagct gagcggcgtt ctggcatcat tcctggcagg taatccggat 660

gaagatccgt tctatctggc aaccgccgca gttattagtt atggtgtggc aggtgaaatt 720

gcagcacagg ttctgcaacc gtatgaaggt aatgcaacct atagcaatcg cgttattgat 780

caggtgttcc tgctggaagc caaagaactg gaacgccgtg ccaaatatga tattcagtga 840

<210> 49

<211> 280

<212> PRT

<213> 干酪乳杆菌（Lactobacillus casei）

<220>

<223> HTK5

<400> 49

Met Ser Lys Val Ile Thr Asp Val Phe Tyr Thr Ala Phe Lys Thr Ala

1 5 10 15

Leu Pro Leu Thr Ser Ser Pro Leu Val Gln Cys Ile Thr Asn Glu Ile

20 25 30

Thr Val Glu Ser Met Ala Asn Ala Leu Leu Tyr Ile Asp Ala Lys Pro

35 40 45

Val Met Ala Asp Asp Gln Arg Glu Phe Pro Glu Phe Phe Ala Gln Ser

50 55 60

Asp Ala Leu Leu Leu Asn Leu Gly His Ile Ser Glu Val Arg Gln Gln

65 70 75 80

Asn Leu Leu Ala Ala Gly Lys Phe Ala Gln Ala Thr Asn Gln Pro Thr

85 90 95

Val Ile Asp Leu Val Gly Val Ser Ala Thr Gln Leu Arg Tyr Asp Leu

100 105 110

Gly His Gln Leu Leu Ala Asn His Pro Asn Val Val Lys Gly Asn Ile

115 120 125

Ser Glu Met Arg Arg Phe Ala Asp Leu Lys Ser Thr Gly Arg Gly Val

130 135 140

Asp Gly Ser Gln Leu Asp Gln Ser Ala Thr Ala Leu Gly Glu Leu Ala

145 150 155 160

Ala Ser Leu Gln Gln Leu Thr Gln Ala Phe Pro Thr Thr Thr Phe Leu

165 170 175

Ala Thr Gly Lys Ile Asp Leu Val Val Ser Ala Lys Gly Thr Trp Tyr

180 185 190

Leu Lys Asn Gly Val Pro Gln Leu Asp Arg Phe Thr Gly Thr Gly Asp

195 200 205

Ile Val Gly Ala Leu Ile Ala Ala Leu Leu Gly Thr Gly Leu Asp Asn

210 215 220

Asp Ala Ala Val Val Val Ala Val Ser Tyr Phe Asn Cys Cys Gly Glu

225 230 235 240

Val Ala Ala Ala Gln Asn Arg Thr Gly Gly Leu Ala Ala Phe Arg Glu

245 250 255

Gly Thr Leu Asn Gln Leu Ser Leu Leu Ala Ala Thr Ala Asp Trp Leu

260 265 270

Gln Met Val Lys Gly Glu Ala Leu

275 280

<210> 50

<211> 843

<212> DNA

<213> 干酪乳杆菌（Lactobacillus casei）

<220>

<223> HTK5 野生型

<400> 50

atgtcaaaag taatcactga cgttttttac accgcgttca aaaccgccct gccattaaca 60

tcatccccac tggtgcaatg cattaccaac gaaataaccg tcgaatccat ggctaatgca 120

ttgctttaca ttgatgcgaa gccggtcatg gctgatgatc agcgcgagtt cccggaattc 180

tttgctcaaa gtgatgcgtt gctgttgaat cttggacaca tttccgaagt gcgccagcag 240

aatctattag ccgctggcaa gtttgcgcag gccaccaacc agccaacggt gattgatttg 300

gtcggcgttt ctgccaccca gttgcgctat gacttaggcc atcaattgtt agccaatcat 360

ccgaacgtgg tcaaaggtaa catttctgaa atgcgtcgat tcgctgatct aaaaagcaca 420

ggccgcggcg ttgatggaag ccagttagat caaagtgcga ccgccttggg agaactagcc 480

gcgagcttgc agcagctgac ccaagcgttt cccaccacta ccttcttggc aaccggcaag 540

attgatctcg ttgtgagtgc gaaggggact tggtatttga aaaatggggt gccgcagctg 600

gatcgtttca ccgggactgg tgacattgtc ggtgccttga ttgccgcgct gttggggaca 660

ggtttggaca acgacgcagc agtcgtcgtg gctgtgagtt acttcaactg ctgtggcgaa 720

gtagcagctg cgcagaatcg aaccggcgga ctggcggcat ttcgcgaagg taccttgaat 780

caactttcct tactggccgc caccgctgac tggcttcaaa tggtgaaagg ggaagcgtta 840

tga 843

<210> 51

<211> 843

<212> DNA

<213> 人工序列

<220>

<223> HTK5-密码子优化的

<400> 51

atgagcaaag ttatcaccga tgtgttctat accgccttca aaaccgccct gccgctgacc 60

agtagtccgc tggttcagtg tattaccaat gaaattaccg ttgaaagcat ggccaatgcc 120

ctgctgtata ttgatgccaa accggttatg gcagatgatc agcgcgagtt cccggagttc 180

ttcgcccaga gcgatgcact gctgctgaat ctgggccata ttagtgaagt gcgccagcag 240

aatctgctgg cagcaggtaa attcgcccag gcaaccaatc agccgaccgt gattgatctg 300

gtgggtgtta gtgcaaccca gctgcgttat gatctgggcc atcagctgct ggcaaatcat 360

ccgaatgtgg tgaaaggtaa tattagtgaa atgcgccgct tcgccgatct gaaaagtacc 420

ggtcgcggtg tggatggtag ccagctggat cagagtgcaa ccgcactggg cgaactggcc 480

gccagcctgc aacagctgac ccaggcattc ccgaccacca ccttcctggc aaccggtaaa 540

attgatctgg ttgtgagcgc aaaaggcacc tggtatctga aaaatggtgt tccgcagctg 600

gatcgcttca ccggcaccgg tgatattgtg ggtgccctga ttgccgcact gctgggtacc 660

ggcctggata atgatgcagc cgttgtggtg gcagtgagtt acttcaattg ctgtggtgaa 720

gttgcagccg cacagaatcg caccggcggt ctggcagcct tccgcgaagg taccctgaat 780

cagctgagtc tgctggcagc caccgccgat tggctgcaaa tggttaaagg tgaagcactg 840

tga 843

<210> 52

<211> 262

<212> PRT

<213> 鲍氏志贺氏菌（Shigella boydii）

<220>

<223> HTK6

<400> 52

Met Gln Val Asp Leu Leu Ser Ser Ala Gln Ser Ala His Thr Leu His

1 5 10 15

Leu Phe His Gln His Ser Pro Leu Val His Cys Met Thr Asn Asp Val

20 25 30

Val Gln Thr Phe Thr Ala Asn Thr Leu Leu Ala Leu Gly Ala Ser Pro

35 40 45

Ala Met Val Ile Glu Thr Glu Glu Ala Ser Gln Phe Ala Ala Ile Ala

50 55 60

Ser Ala Leu Leu Ile Asn Val Gly Thr Leu Thr Gln Pro Arg Ala Gln

65 70 75 80

Ala Met Arg Ala Ala Val Glu Gln Ala Lys Ser Ser Gln Thr Pro Trp

85 90 95

Thr Leu Asp Pro Val Ala Val Gly Ala Leu Asp Tyr Arg Arg Arg Phe

100 105 110

Cys Leu Glu Leu Leu Ser His Lys Pro Thr Ala Ile Arg Gly Asn Ala

115 120 125

Ser Glu Ile Met Ala Leu Ala Gly Val Ala Asn Gly Gly Arg Gly Val

130 135 140

Asp Thr Thr Asp Ala Ala Ala Asn Ala Ile Pro Ala Ala Gln Thr Leu

145 150 155 160

Ala Arg Glu Thr Gly Ala Ile Val Val Val Thr Gly Glu Val Asp Tyr

165 170 175

Val Thr Asp Gly His Arg Ile Val Gly Ile His Gly Gly Asp Pro Leu

180 185 190

Met Thr Lys Val Val Gly Thr Gly Cys Ala Leu Ser Ala Val Val Ala

195 200 205

Ala Cys Cys Ala Leu Pro Gly Asp Met Leu Glu Asn Val Ala Ser Ala

210 215 220

Cys His Trp Met Lys Gln Ala Gly Glu Arg Ala Val Ala Arg Ser Glu

225 230 235 240

Gly Pro Gly Ser Phe Val Pro His Phe Leu Asp Ala Leu Trp Gln Leu

245 250 255

Thr Gln Glu Val Gln Ala

260

<210> 53

<211> 789

<212> DNA

<213> 鲍氏志贺氏菌（Shigella boydii）

<220>

<223> HTK6 野生型

<400> 53

atgcaagtcg acctgctgag ttccgcgcaa tctgcgcaca cgttacacct ttttcaccaa 60

cattcccctc ttgtgcactg catgaccaac gatgtggtgc aaacctttac tgccaatacc 120

ttgctggcgc tcggtgcatc gccagcgatg gttatcgaaa ccgaagaggc cagtcagttt 180

gcggctattg ctagtgcgtt gctgattaac gttggcacgc tgacgcagcc acgcgcacag 240

gcgatgcgtg ccgccgttga gcaagcaaaa agctctcaaa ccccctggac gcttgatcct 300

gtagcggtgg gtgcactcga ttatcgccgc cgtttttgtc tggaacttct gtctcataag 360

ccaaccgcca tacgtggtaa tgcttcggaa atcatggcat tagctggcgt tgctaatggt 420

ggacggggag tggataccac tgacgccgca gctaacgcaa tacccgctgc acaaacactg 480

gcacgggaaa ctggcgcaat cgtcgtggtc acaggcgagg tggattatgt taccgatggg 540

catcgtatcg ttggcattca cggtggcgat ccgctaatga ctaaagtggt aggaactggc 600

tgtgcattat cggcggttgt tgctgcctgt tgtgcgttac caggcgatat gctggaaaat 660

gtcgcatctg cctgtcactg gatgaaacaa gccggagagc gcgcagtcgc cagaagcgag 720

gggccaggca gttttgttcc acatttcctt gatgcgctct ggcaattgac gcaggaggtg 780

caggcatga 789

<210> 54

<211> 789

<212> DNA

<213> 人工序列

<220>

<223> HTK6-密码子优化的

<400> 54

atgcaggttg atctgctgag cagtgcacag agcgcccata ccctgcatct gttccatcag 60

catagcccgc tggtgcattg tatgaccaat gatgttgttc agaccttcac cgcaaatacc 120

ctgctggccc tgggcgcaag tccggcaatg gtgattgaaa ccgaagaagc aagtcagttc 180

gccgccattg caagcgccct gctgattaat gttggtaccc tgacccagcc gcgcgcccag 240

gcaatgcgtg cagcagtgga acaggcaaaa agcagtcaga ccccgtggac cctggaccct 300

gttgccgtgg gtgcactgga ttatcgtcgc cgcttctgtc tggaactgct gagtcataaa 360

ccgaccgcaa ttcgtggtaa tgccagcgaa attatggccc tggccggcgt ggcaaatggc 420

ggtcgtggcg ttgataccac cgatgccgca gccaatgcca ttccggcagc acagaccctg 480

gcccgcgaaa ccggtgcaat tgtggttgtt accggtgaag tggattatgt gaccgatggc 540

catcgtattg ttggtattca tggcggtgat ccgctgatga ccaaagtggt gggtaccggt 600

tgcgcactga gtgccgtggt ggccgcatgt tgtgccctgc cgggtgatat gctggaaaat 660

gtggcaagcg cctgccattg gatgaaacag gcaggcgaac gcgccgtggc acgtagtgaa 720

ggtccgggta gcttcgttcc gcacttcctg gatgcactgt ggcagctgac ccaggaagtt 780

caggcctga 789

<210> 55

<211> 209

<212> PRT

<213> 多形拟杆菌（Bacteroides thetaiotaomicron）

<220>

<223> HTK7

<400> 55

Met Val Ser Leu Gln Phe Ile Thr His Gln Thr Asp Arg Tyr Thr Tyr

1 5 10 15

Phe Glu Ser Ala Leu Met Ala Leu Glu Gly Gly Cys Lys Trp Ile Gln

20 25 30

Leu Arg Met Lys Glu Ala Pro Cys Glu Glu Val Glu Ala Val Ala Leu

35 40 45

Gln Leu Lys Pro Leu Cys Lys Glu Lys Glu Ala Ile Leu Leu Leu Asp

50 55 60

Asp His Val Glu Leu Ala Lys Lys Leu Glu Val Asp Gly Val His Leu

65 70 75 80

Gly Lys Lys Asp Met Pro Ile Asp Gln Ala Arg Gln Leu Leu Gly Glu

85 90 95

Ala Phe Ile Ile Gly Gly Thr Ala Asn Thr Phe Glu Asp Val Val Gln

100 105 110

His Tyr Arg Ala Gly Ala Asp Tyr Leu Gly Ile Gly Pro Phe Arg Phe

115 120 125

Thr Thr Thr Lys Lys Asn Leu Ser Pro Val Leu Gly Leu Glu Gly Tyr

130 135 140

Thr Ala Ile Leu Ser Gln Met Lys Glu Ala Asn Ile Glu Leu Pro Val

145 150 155 160

Val Ala Ile Gly Gly Ile Thr Arg Glu Asp Ile Pro Ala Ile Leu Glu

165 170 175

Thr Gly Val Asn Gly Ile Ala Leu Ser Gly Thr Ile Leu Arg Ala Glu

180 185 190

Asp Pro Ala Ala Glu Thr Arg Lys Ile Leu Asn Met Lys Arg Ile Ile

195 200 205

Lys

<210> 56

<211> 630

<212> DNA

<213> 多形拟杆菌（Bacteroides thetaiotaomicron）

<220>

<223> HTK7 野生型

<400> 56

atggtcagtc tacaatttat cacccaccag accgatcggt atacttattt cgaatcggca 60

ctcatggcac ttgaaggagg atgtaagtgg attcagctac gcatgaagga agctccgtgt 120

gaagaggtgg aagctgttgc cctccaacta aagccgctct gcaaagaaaa agaagcgatc 180

ttacttctgg atgaccacgt cgaacttgcc aaaaagctgg aagtggacgg agtgcatctg 240

ggcaaaaaag acatgccgat agatcaggca cgacaattac ttggagaagc atttattatc 300

ggaggtacgg caaatacatt cgaagatgtc gtacagcact accgtgccgg agcggattac 360

ctcggcatcg gtcctttccg gtttaccact acaaagaaaa acctgagtcc tgtactggga 420

ctggaaggtt ataccgctat tttatctcag atgaaggaag cgaatatcga acttccggta 480

gtagccatcg gaggaatcac ccgtgaggat atacccgcca tactcgaaac cggagtgaac 540

ggaatcgcgc tttcaggaac gattcttcgg gcggaggatc cggcagcgga aacacgaaag 600

attttgaaca tgaaacgtat aatcaaataa 630

<210> 57

<211> 630

<212> DNA

<213> 人工序列

<220>

<223> HTK7-密码子优化的

<400> 57

atggttagcc tgcaattcat tacccatcag accgatcgtt atacctactt cgaaagcgcc 60

ctgatggcac tggaaggtgg ttgtaaatgg attcagctgc gtatgaaaga agccccgtgt 120

gaagaagtgg aagccgttgc cctgcaactg aaaccgctgt gtaaagaaaa agaagcaatt 180

ctgctgctgg atgatcatgt tgaactggca aaaaaactgg aagttgatgg cgtgcatctg 240

ggcaaaaaag atatgccgat tgatcaggca cgccagctgc tgggcgaagc cttcattatt 300

ggtggtaccg ccaatacctt cgaagatgtt gtgcagcatt atcgcgcagg tgccgattat 360

ctgggtattg gcccgttccg cttcaccacc accaaaaaaa atctgagtcc ggttctgggt 420

ctggaaggct ataccgccat tctgagtcag atgaaagaag cgaatattga actgccggtg 480

gtggcaattg gtggcattac ccgcgaagat attccggcaa ttctggaaac cggcgtgaat 540

ggcattgcac tgagtggtac cattctgcgc gccgaagatc cggcagccga aaccagaaaa 600

attctgaata tgaaacgcat tatcaagtga 630

<210> 58

<211> 351

<212> PRT

<213> 原绿球藻（Prochlorococcus marinus）

<220>

<223> HTK8

<400> 58

Met Lys Asn Pro Asn Ile Ile Gln Pro Glu Asp Leu Arg Ile Ser Gln

1 5 10 15

Ile Ile Asp Ala Asn Leu Asp Arg Ala Arg Glu Gly Leu Arg Val Leu

20 25 30

Glu Asp Trp Ala Arg Phe Gly Leu Gly Asn Glu Asp Phe Val Ile Arg

35 40 45

Ile Lys Asn Phe Arg Gln Ile Leu Gly Lys Asn His Leu Glu Ile Tyr

50 55 60

Lys Leu Ser Arg Asn His Ile Glu Asp Gln Cys Lys Gly Leu Ser His

65 70 75 80

Val Glu Gln Ile Asn Arg Asn Ser Ser Ser Lys Ile Ile Ser Ser Asn

85 90 95

Ser Ala Arg Val Gln Glu Ala Leu Arg Val Ile Glu Glu Phe Ser Arg

100 105 110

Ile His Asn Ser Lys Leu Ser Lys Ile Ala Ser Glu Ile Arg Tyr Glu

115 120 125

Ile Tyr Thr Leu Glu Ile Glu Ile Leu Asn Phe Asn Thr Arg Lys Arg

130 135 140

Ala Gln Ser Ile Ile Ser Lys Asn Asn Leu Tyr Ser Ile Thr Asp Pro

145 150 155 160

Arg Glu Asn Leu Leu Glu Ile Ile Glu Lys Ile Leu Leu Gly Gly Val

165 170 175

Lys Ile Ile Gln His Arg Phe Lys Glu Gly Asn Asp Lys Asp His Leu

180 185 190

Lys Glu Ala Ile Glu Ile Asn Lys Leu Cys Lys Lys Tyr Asn Ser Leu

195 200 205

Phe Ile Val Asn Asn Arg Leu Asp Ile Ala Leu Ala Ser Lys Ala Asp

210 215 220

Gly Val His Leu Gly Gln Asp Asp Leu Asp Ile Lys Thr Val Arg Lys

225 230 235 240

Leu Leu Gly Ala Ser Lys Ile Ile Gly Val Ser Ala Asn Asn Ser Thr

245 250 255

Asp Ile Asn Lys Ala Val Lys Asp Gly Cys Asp Tyr Ile Gly Val Gly

260 265 270

Pro Val Phe Pro Thr Leu Thr Lys Lys Asn Lys Glu Pro Leu Gly Glu

275 280 285

Glu Lys Ile Lys Ala Leu Thr Lys Glu Leu Asn Ile Pro Cys Phe Ala

290 295 300

Ile Gly Gly Ile Asn Lys Leu Asn Ile Ser Ser Leu Lys Asn His Gly

305 310 315 320

Ile Ser Lys Val Ala Ile Val Ser Gly Leu Leu Asn Ser Glu Asp Pro

325 330 335

Lys Asp Glu Ala Met Ile Ile Ile Lys Glu Leu Ser His Glu Asn

340 345 350

<210> 59

<211> 1056

<212> DNA

<213> 原绿球藻（Prochlorococcus marinus）

<220>

<223> HTK8 野生型

<400> 59

atgaaaaacc caaacataat tcaacctgaa gatttacgaa tatctcaaat tattgacgct 60

aatttagata gagcaagaga aggtctaagg gttttggagg actgggccag atttggcttg 120

ggtaatgaag attttgttat aagaataaaa aacttccgac aaatattagg taaaaatcat 180

ttagaaattt ataaattatc aagaaaccat attgaagatc aatgcaaagg gttatctcat 240

gtcgaacaaa tcaacaggaa tagttcctct aaaataataa gttctaattc tgcaagagtt 300

caagaagcgc ttcgagttat tgaagaattt tcaaggattc ataatagtaa actttctaaa 360

atagcttccg agattagata tgaaatttac actttagaaa ttgaaatatt aaatttcaat 420

actcgtaaga gagcacaatc aataattagt aaaaacaatt tatattcgat aacagaccca 480

agagaaaact tattagaaat aattgaaaaa atattattag gaggggtaaa aataattcag 540

catcgattta aagaaggtaa tgataaagac catctcaaag aggcaattga aataaataaa 600

ttatgtaaga aatataattc tttgttcatc gttaataaca gattagatat agcattggca 660

tcaaaggcag atggtgttca tcttggtcaa gacgacctcg atataaaaac agtaagaaaa 720

ttacttggtg cctcaaaaat cattggagtt tcagccaaca attcaactga catcaataag 780

gctgtaaaag atggatgcga ttacattgga gtcgggccag tttttccaac tttgacaaag 840

aaaaataaag aacctctcgg tgaagagaaa attaaggcct taacaaaaga actaaatatt 900

ccttgttttg caataggagg aattaataaa ttaaatatct cttctctaaa aaatcatgga 960

attagtaagg ttgcaatagt ttctgggctg ctaaattcag aagatccaaa agatgaagct 1020

atgattatca taaaagaatt atcccatgaa aattag 1056

<210> 60

<211> 1056

<212> DNA

<213> 人工序列

<220>

<223> HTK8-密码子优化的

<400> 60

atgaagaacc cgaatattat ccagccggaa gatctgcgca ttagtcagat tattgatgca 60

aatctggatc gtgcccgtga aggcctgcgt gtgctggaag attgggcccg cttcggtctg 120

ggcaatgaag acttcgttat tcgcattaaa aacttccgcc agattctggg taaaaatcat 180

ctggaaatct ataaactgag ccgcaatcat attgaagatc agtgtaaagg cctgagtcat 240

gttgaacaga ttaatcgtaa tagcagcagt aaaattatca gcagtaatag cgcacgtgtg 300

caggaagcac tgcgtgtgat tgaagagttc agccgcattc ataatagcaa actgagcaaa 360

attgcaagcg aaattcgtta tgaaatctat accctggaaa ttgaaatcct gaacttcaat 420

acccgcaaac gcgcccagag cattattagc aaaaataatc tgtacagcat caccgatccg 480

cgtgaaaatc tgctggaaat tattgaaaaa atcctgctgg gtggtgtgaa aattattcag 540

catcgcttca aagaaggtaa tgataaagat catctgaagg aagcaattga aattaataag 600

ctgtgcaaaa agtacaacag tctgttcatt gttaacaatc gcctggatat tgccctggca 660

agcaaagccg atggcgttca tctgggccag gatgatctgg atattaaaac cgttcgtaaa 720

ctgctgggtg ccagtaaaat tattggtgtt agtgcaaata acagcaccga tattaataaa 780

gcagttaaag atggttgcga ttatattggc gtgggtccgg tgttcccgac cctgaccaaa 840

aaaaataaag aaccgctggg cgaagaaaaa attaaagccc tgaccaaaga actgaatatt 900

ccgtgcttcg caattggcgg cattaataaa ctgaatatta gcagtctgaa gaaccacggt 960

attagcaaag ttgccattgt tagcggcctg ctgaatagtg aagatccgaa agatgaagcc 1020

atgattatta ttaaagagct gagccatgaa aactga 1056

<210> 61

<211> 462

<212> PRT

<213> 嗜胨菌属（Peptoniphilus sp.）

<220>

<223> HTK9

<400> 61

Met Lys Ile Lys Cys Asn Leu Arg Lys Leu Arg Asp Lys Ala Pro Leu

1 5 10 15

Val His Ile Ile Ser Asn Gly Val Thr Arg Gly Arg Val Ala Asp Phe

20 25 30

Val Leu Ser Thr Gly Ala Ser Pro Met Met Ala Glu Tyr Ser Lys Glu

35 40 45

Val Ser Glu Ile Thr Lys Lys Ala Ser Ala Leu Val Leu Asn Met Gly

50 55 60

Met Leu Asn Glu Asp Lys Ile Glu Ala Ile Lys Ile Ala Gly Lys Thr

65 70 75 80

Ala Lys Glu Asn Asn Ile Pro Thr Val Leu Asp Pro Val Gly Val Ala

85 90 95

Ser Ser Lys Ile Arg Arg Asp Leu Ala Glu Tyr Leu Leu Asp Asn Phe

100 105 110

Lys Phe Asn Val Ile Arg Gly Asn Phe Asn Glu Ile Asn Tyr Leu Val

115 120 125

Gly Gly Gln Ala Phe Ala Gly Ile Asp Ser Arg Asp Lys Asn Leu Ser

130 135 140

Glu Glu Asp Phe Lys Glu Leu Ala Val Lys Met Asn Glu Lys Ser Gly

145 150 155 160

Ala Thr Val Val Val Ser Gly Lys Tyr Glu Val Ile Ala Asn Ser His

165 170 175

Met Leu Ile Ser Ile Pro Gly Gly His Asp Asp Phe Arg Lys Ile Ser

180 185 190

Gly Leu Gly Asp Met Glu Ser Ala Met Ile Gly Ser Leu Leu Ala Thr

195 200 205

Pro Met Ser Asn Leu Lys Ala Cys Ala Ile Ser Ala Ile Phe Leu Arg

210 215 220

Gln Leu Ala Arg Glu Val Ile Val Asp Gly Ser Ile Lys Ala Gln Asp

225 230 235 240

Ile Ile Ser Lys Val Gln Lys Leu Glu Glu Ile Ser Gly Glu Ile Glu

245 250 255

Ile Leu Ser Pro Ser Tyr Lys Phe Lys Lys Pro Ser Leu Tyr Gly Ile

260 265 270

Ser Asp Gly Asn Asp Leu Met Lys Ile Lys Asn Ala Thr Arg Ala Gly

275 280 285

Met Lys Ile Tyr Gln Leu Arg Asp Lys Thr Ser Glu Glu Ala Leu Leu

290 295 300

Gly Glu Lys Ile Leu Lys Ile Lys Lys Glu Ile Glu Glu Asp Cys Leu

305 310 315 320

Phe Ile Leu Asn Asp Asn Leu Lys Leu Ala Lys Glu Tyr Lys Thr Ser

325 330 335

Leu His Leu Gly Gln Asp Asp Glu Glu Ile Ser Leu Ala Arg Arg Ile

340 345 350

Leu Gly Arg Asp Pro Ile Ile Gly Ala Thr Ala Lys Thr Pro Glu Leu

355 360 365

Ala Ile Glu Ala Glu Asn Met Gly Ala Ser Tyr Leu Gly Ser Gly Ala

370 375 380

Phe Phe Glu Thr Glu Thr Lys Arg Asp Ala Ser Met Ile Asn Leu Glu

385 390 395 400

Ile Tyr Glu Glu Ile Arg Asp Ser Ile Leu Ile Pro Ala Phe Pro Ile

405 410 415

Gly Gly Ile Asn Leu Glu Asn Leu Asp Leu Phe Lys Gly Val Glu Ile

420 425 430

Pro Gly Leu Cys Met Ser Ser Gly Ile Phe Ser Leu Glu Glu Asn Glu

435 440 445

Val Glu Lys Asn Val Arg Glu Ile Ile Lys Lys Leu Gly Asp

450 455 460

<210> 62

<211> 1389

<212> DNA

<213> 嗜胨菌属（Peptoniphilus sp.）

<220>

<223> HTK9 野生型

<400> 62

atgaaaatta aatgcaattt aagaaaacta agggacaagg ctcccttggt acatattatt 60

tccaatggag ttaccagggg aagggtagct gactttgtcc tctctacagg tgcgagtcca 120

atgatggcag agtattcaaa agaagtatct gaaatcacaa aaaaagcttc agccctagtt 180

ttaaatatgg gaatgttaaa tgaagataaa attgaagcaa ttaaaattgc agggaaaaca 240

gcaaaagaaa ataatattcc cactgttctt gatcctgttg gtgttgcttc tagcaagata 300

agaagagatt tagcagaata tcttcttgat aattttaagt tcaatgtcat taggggaaat 360

tttaatgaaa tcaattattt ggttgggggt caagcctttg ctggcataga ttcaagagac 420

aaaaatttat cggaagagga ctttaaagaa cttgcagtga agatgaatga aaaaagtgga 480

gcaactgtag ttgtaagtgg caagtatgaa gtaattgcta actctcacat gcttatttct 540

atacctggtg gtcatgatga ttttagaaaa ataagtgggc ttggggatat ggaatcagcg 600

atgataggct cacttttggc gacacctatg tcaaacctaa aggcttgtgc catttcggca 660

atatttttaa gacagcttgc aagagaagta atagttgatg gaagtataaa ggctcaagac 720

ataataagta aagttcaaaa gcttgaggaa ataagtggag aaattgaaat tttatcgcca 780

agctataaat ttaaaaagcc aagtttatat ggaatttctg atggtaatga tttgatgaaa 840

ataaaaaatg ccacaagagc tgggatgaaa atttaccagc taagagataa gacatcagag 900

gaagctttgc ttggagaaaa aattttaaag ataaaaaagg aaattgaaga agattgtctc 960

ttcatcttaa acgataattt aaaacttgca aaagaatata agacatccct tcacctggga 1020

caagatgatg aagagatttc tcttgcaaga agaattctgg gtagagaccc aataattgga 1080

gcaactgcaa aaactcctga gcttgccata gaagcagaaa atatgggagc atcctacctt 1140

ggttccggtg ccttttttga aacggaaact aagagggatg catcaatgat taatctagaa 1200

atttacgagg aaataagaga tagcatttta ataccagcct tcccaatagg tggtataaat 1260

ttggagaacc tagacttgtt taagggggta gagatacctg gcctttgtat gtctagtgga 1320

attttttccc ttgaagagaa tgaagtggag aaaaatgtaa gagaaataat aaaaaagtta 1380

ggtgattaa 1389

<210> 63

<211> 1389

<212> DNA

<213> 人工序列

<220>

<223> HTK9-密码子优化的

<400> 63

atgaagatca agtgcaatct gcgtaaactg cgtgataaag ccccgctggt tcatattatt 60

agtaatggcg ttacccgtgg tcgcgtggca gacttcgtgc tgagtaccgg tgcaagcccg 120

atgatggcag aatatagtaa agaagtgagt gaaattacca agaaagcaag cgccctggtt 180

ctgaatatgg gtatgctgaa tgaagataaa atcgaagcca ttaaaatcgc aggcaaaacc 240

gccaaagaaa ataatattcc gaccgttctg gaccctgttg gcgttgcaag cagcaaaatt 300

cgtcgtgatc tggccgaata tctgctggat aacttcaaat tcaatgttat tcgcggcaac 360

ttcaatgaaa ttaattatct ggtgggtggt caggcattcg ccggtattga tagccgcgat 420

aaaaatctga gtgaagaaga cttcaaagaa ctggccgtga aaatgaatga aaaaagcggt 480

gccaccgttg ttgttagtgg taaatatgaa gttatcgcaa atagccacat gctgattagt 540

attccgggcg gtcatgatga cttccgcaaa attagtggtc tgggcgatat ggaaagtgca 600

atgattggca gtctgctggc aaccccgatg agcaatctga aagcatgtgc aattagcgca 660

atcttcctgc gtcagctggc acgcgaagtg attgttgatg gtagtattaa agcccaggat 720

attattagta aggttcagaa actggaagaa attagcggtg aaattgaaat tctgagcccg 780

agctataaat tcaaaaaacc gagcctgtat ggcattagtg atggcaatga tctgatgaaa 840

attaaaaacg ccacccgtgc aggtatgaaa atctatcagc tgcgtgataa gaccagtgaa 900

gaagcactgc tgggcgaaaa aattctgaaa attaaaaagg agatcgagga agattgcctg 960

ttcattctga atgataatct gaaactggcc aaagaatata aaaccagtct gcatctgggc 1020

caggatgatg aagaaattag tctggcacgc cgtattctgg gccgcgatcc gattattggc 1080

gcaaccgcaa aaacacctga actggcaatt gaagcagaaa atatgggcgc cagctatctg 1140

ggcagcggtg cattcttcga aaccgaaacc aaacgtgatg ccagcatgat taatctggaa 1200

atctatgaag aaatccgtga tagcattctg attccggcct tcccgattgg tggtattaat 1260

ctggagaatc tggatctgtt caaaggtgtg gaaattccgg gcctgtgtat gagtagtggt 1320

atcttcagcc tggaagaaaa tgaagtggaa aaaaatgtgc gcgaaattat taaaaagctg 1380

ggtgattga 1389

<210> 64

<211> 298

<212> PRT

<213> Clostridium gasigenes

<220>

<223> HTK10

<400> 64

Met Lys Ile Ser Ile Glu Ala Leu Thr Glu Val Leu Asn Leu Gln Lys

1 5 10 15

Glu Lys Gln Pro Leu Ile His Cys Ile Ser Ser Met Val Thr Met Asn

20 25 30

Asp Leu Ala Gln Gly Ile Leu Ser Tyr Asn Gly Lys Pro Ile Met Ala

35 40 45

Pro Gly Ile Asp Glu Val Gly Glu Ile Thr Ala Ser Ala Asn Ala Leu

50 55 60

Leu Ile Asn Leu Gly Thr Leu Asp Ser Ser Arg Val Glu Ala Met Glu

65 70 75 80

Lys Ser Ile Arg Ile Ala Ser Lys Lys Asn Lys Pro Ile Val Leu Asp

85 90 95

Ala Ile Gly Val Asp Ile Ser Phe Phe Arg Arg Glu Ile Ala Leu Val

100 105 110

Phe Leu Thr Arg Tyr Lys Ile Asp Val Ile Lys Gly Asn Val Ser Glu

115 120 125

Ile Lys Ala Leu Leu Glu Lys Lys Pro Lys Lys Asn Lys Glu His Lys

130 135 140

Glu Ile Ile Glu Ser Lys Glu Gln Asn Arg Asn Asn Glu Asn Glu Glu

145 150 155 160

Phe Val Lys Asn Thr Ile Lys Asp Asp Tyr Glu Ile Arg Glu Gln Met

165 170 175

Arg Glu Phe Ser Lys Lys Tyr Lys Ser Ile Leu Ile Ala Thr Gly Asn

180 185 190

Glu Asp Tyr Ile Thr Asp Gly Phe Ser Glu Phe Phe Ile Asn Asn Gly

195 200 205

Asn Asn Glu Phe Asp Arg Val Val Gly Val Asp Ser Leu Leu Gly Gly

210 215 220

Leu Ile Ser Val Gly Val Ala Val Ala Arg Thr Asn Ala Glu Lys Val

225 230 235 240

Gln Ala Val Leu Ile Ala Ile Met Thr Met Gly Val Ser Lys Glu Leu

245 250 255

Ala Tyr Glu Lys Met Asp Lys Lys Gln Gly Leu Ile Ser Leu Lys Asn

260 265 270

Ser Leu Ile Asp Glu Ile Ser Leu Ile Asn Asn Lys Lys Leu Glu Ala

275 280 285

Met Gly Lys Ile Ser Tyr Ile Phe Lys Arg

290 295

<210> 65

<211> 897

<212> DNA

<213> Clostridium gasigenes

<220>

<223> HTK10 野生型

<400> 65

atgaaaataa gtatagaggc attgactgaa gttctaaatt tacagaagga aaagcaacct 60

cttatacatt gtatttcaag tatggttact atgaatgatt tagcacaggg aattttaagt 120

tataatggga aaccaattat ggcacctggc attgatgaag taggagaaat aacagctagc 180

gctaatgcgt tactaattaa tcttggaaca ttagatagta gtagggttga ggctatggag 240

aaatctatta gaatagcttc aaaaaaaaat aaacctatag ttttagatgc tataggagtt 300

gatatttctt tttttaggag agaaatagct ttggtgttct taaccagata taaaatagat 360

gttataaagg gcaatgtatc agaaattaaa gcattactag agaaaaagcc taagaaaaat 420

aaagaacaca aagaaattat agaatctaaa gaacaaaata gaaataatga aaatgaagaa 480

tttgttaaaa atactataaa agatgattat gaaattagag aacaaatgag agagttttct 540

aaaaaatata aaagcatatt aatagcaaca ggaaatgaag attatataac tgatggattt 600

agtgagtttt ttattaataa tggaaataat gaatttgata gagtagttgg agtggatagt 660

ttattaggtg ggttaatttc agtgggggtg gcagtagcca gaacaaatgc agaaaaagta 720

caagccgtgc taattgcaat aatgactatg ggtgtaagca aagaactagc ttatgaaaag 780

atggacaaaa aacagggact aatatcttta aaaaactctt taatagatga aatttccctt 840

ataaataata aaaaattaga agctatgggg aaaatatcat atatatttaa aaggtag 897

<210> 66

<211> 897

<212> DNA

<213> 人工序列

<220>

<223> HTK10-密码子优化的

<400> 66

atgaagatca gtatcgaagc cctgaccgaa gttctgaatc tgcaaaaaga aaaacagccg 60

ctgattcatt gcattagcag catggttacc atgaatgatc tggcccaggg tattctgagt 120

tataatggca aaccgattat ggcccctggt attgatgaag ttggcgaaat taccgcaagc 180

gccaatgccc tgctgattaa tctgggcacc ctggatagta gtcgtgttga agcaatggaa 240

aaaagtattc gtattgcaag caaaaagaac aaaccgattg ttctggatgc aattggcgtg 300

gatattagct tcttccgtcg tgaaattgcc ctggtgttcc tgacccgcta taaaattgat 360

gtgattaaag gtaacgtgag cgaaattaaa gcactgctgg aaaaaaaacc gaaaaaaaat 420

aaggagcaca aggaaattat cgaaagtaaa gaacagaacc gtaataatga aaacgaagag 480

ttcgttaaaa acaccattaa agatgattac gagatccgtg aacagatgcg tgagttcagt 540

aaaaaatata aaagcatcct gatcgcaacc ggtaatgaag attatattac cgatggcttc 600

agtgagttct tcattaataa tggtaacaac gagttcgatc gtgttgttgg tgtggatagt 660

ctgctgggtg gcctgattag tgtgggcgtg gcagttgcac gtaccaatgc agaaaaagtg 720

caggcagtgc tgattgcaat tatgacaatg ggtgtgagta aagaactggc ctatgaaaaa 780

atggataaaa aacagggtct gattagtctg aaaaatagtc tgattgatga gattagcctg 840

attaataata agaagctgga agcaatgggc aaaattagct atatcttcaa acgttga 897

<210> 67

<211> 264

<212> PRT

<213> Thermanaerovibrio acidaminovorans

<220>

<223> HTK11

<400> 67

Met Arg Val Ser His Leu Ala Ser Glu Val Ala Arg Leu Ser Pro Leu

1 5 10 15

Val Tyr His Val Thr Asn Trp Val Ser Gly Pro Leu Ser Ala Arg Val

20 25 30

Cys Tyr Ala Leu Gly Gly Arg Ala Leu Met Thr Thr His Pro Glu Glu

35 40 45

Ala Leu Glu Ala Ala Arg Met Ser Gln Ala Leu Leu Leu Asn Leu Gly

50 55 60

Thr Pro Thr Glu Asp Arg Val Val Ser Ile Arg Arg Ala Leu Asp Gly

65 70 75 80

Ala Gly Asp Arg Pro Ala Leu Leu Asp Pro Val Gly Val Gly Ser Phe

85 90 95

Pro Gly Arg Leu Asp Leu Ala Met Glu Ile Leu Ser Arg Gly Ile Ser

100 105 110

Ile Leu Lys Gly Asn Gly Ala Glu Ile Ser Ala Leu Leu Gly Glu Gly

115 120 125

Lys Gly Gln Arg Gly Val Asp Ser Asp Leu Pro Gly Pro Pro Leu Gly

130 135 140

Val Arg Arg Leu Ala Glu Asp His Arg Cys Cys Ala Val Met Thr Gly

145 150 155 160

Glu Glu Asp His Val Ala Leu Gly Val Ser Trp Gly Leu Val Arg Leu

165 170 175

Arg Gly Arg Glu Val Arg Gly Ala Val Pro Val Pro Gly Leu Gly Cys

180 185 190

Ala Leu Gly Ser Ala Met Ala Cys Ala Leu Gly Val Gly Ala Asp Pro

195 200 205

Phe Ser Ala Ala Leu Trp Gly Cys Ala Leu Phe Lys Gly Ala Leu Arg

210 215 220

Arg Ala Leu Gly Ala Cys Cys Gly Pro Gly Ser Leu Val Glu Ala Leu

225 230 235 240

Ile Asp Gln Leu His Arg Ala Arg Thr Gly Glu Leu Asp Gly Glu Asn

245 250 255

Val Glu Val Ile Arg Ala Asp Gly

260

<210> 68

<211> 795

<212> DNA

<213> Thermanaerovibrio acidaminovorans

<220>

<223> HTK11 野生型

<400> 68

ttgagggtct cccacctggc atcggaggtg gcccggctat cccctctggt ctatcacgtc 60

accaactggg tgtcgggccc cctcagcgcc cgggtctgtt acgccctggg gggcagggcg 120

ctgatgacca cccatccgga ggaggccctg gaggcggccc ggatgtccca ggcgctgctg 180

ctcaacctgg ggacccccac ggaggaccgg gtcgtgtcca tccggcgggc tctggacggg 240

gcgggggatc ggccggcgct gttggatccg gtgggggtcg ggtccttccc tgggcgcctg 300

gacctggcta tggagatcct ctcccggggg atctcgatcc tcaaggggaa cggggcggag 360

atctccgccc tgcttgggga ggggaaggga cagcgggggg tggactcgga cctgccggga 420

ccgccccttg gggtccggag gctggcggag gaccaccggt gttgcgcggt catgaccggg 480

gaggaggacc acgtggccct aggggtgagc tgggggctgg tgaggctccg ggggagggag 540

gttcgagggg cggtgccggt gcccgggctt ggatgcgccc tgggtagcgc catggcctgc 600

gccctggggg tgggggcgga ccccttctcc gccgccctgt ggggctgcgc cctcttcaag 660

ggggccctcc ggagggccct tggggcctgc tgtggccccg gcagcctggt ggaggccctc 720

atagaccagc tacaccgggc caggaccggg gagctggatg gggagaacgt ggaggtgatc 780

cgggcagatg gatga 795

<210> 69

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> HTK11-密码子优化的

<400> 69

atgcgtgtga gtcatctggc cagtgaagtg gcacgtctga gcccgctggt gtatcatgtg 60

accaattggg tgagcggtcc gctgagcgcc cgcgtgtgtt atgccctggg tggccgcgca 120

ctgatgacca cccatccgga agaagcactg gaagcagcac gtatgagcca ggcactgctg 180

ctgaatctgg gtaccccgac cgaagatcgc gtggtgagta ttcgtcgtgc cctggatggt 240

gcaggtgatc gtccggcact gctggaccct gttggcgttg gtagcttccc tggtcgtctg 300

gatctggcaa tggaaattct gagtcgtggc attagtattc tgaaaggtaa tggcgccgaa 360

attagcgcac tgctgggtga aggtaaaggc cagcgtggcg ttgatagtga tctgccgggt 420

ccgccgctgg gcgtgagaag actggcagaa gatcatcgtt gctgcgccgt gatgaccggc 480

gaagaagatc atgttgcact gggcgtgagc tggggtctgg ttcgtctgcg tggtcgtgaa 540

gttcgtggtg cagttccggt tccgggcctg ggctgtgcac tgggtagtgc aatggcttgt 600

gcactgggcg ttggtgccga tccgttcagc gcagccctgt ggggttgtgc actgttcaaa 660

ggcgccctgc gccgtgccct gggtgcttgc tgtggccctg gtagcctggt ggaagccctg 720

attgatcagc tgcatcgcgc acgtaccggt gaactggatg gcgaaaatgt ggaagtgatt 780

cgtgccgatg gctga 795

<210> 70

<211> 223

<212> PRT

<213> Dictyoglomus turgidum

<220>

<223> HTK12

<400> 70

Met Asn Lys Lys Glu Lys Leu Glu Leu Leu Lys Asp Phe Asn Leu Tyr

1 5 10 15

Cys Leu Thr Cys Glu Glu Tyr Ser Ile Gly Arg Lys Asn Ile Asp Val

20 25 30

Val Arg Glu Ile Leu Glu Ala Gly Val Lys Ile Ile Gln Tyr Arg Glu

35 40 45

Lys Lys Lys Pro Met Arg Glu Lys Tyr His Glu Val Val Lys Ile Arg

50 55 60

Asp Leu Thr Ala Lys Tyr Asn Ala Leu Leu Ile Val Asn Asp His Leu

65 70 75 80

Asp Leu Thr Lys Ile Val Glu Ala Asp Gly Val His Ile Gly Gln Glu

85 90 95

Asp Tyr Pro Ile Glu Val Ala Lys Glu Phe Leu Gly Glu Asn Phe Ile

100 105 110

Ile Gly Leu Thr Thr His Thr Lys Glu Gln Val Met Glu Ala Leu Arg

115 120 125

Lys Gly Ala Asp Tyr Ile Gly Leu Gly Pro Ile Phe Pro Ser Tyr Thr

130 135 140

Lys Glu Lys Pro His Pro Pro Ile Gly Ile Glu Ile Leu Asp Trp Ala

145 150 155 160

Ile Lys Asn Ile Ser Ile Pro Val Val Ala Ile Gly Gly Ile Lys Glu

165 170 175

Ser Asn Ile His Glu Ile Leu Asn Leu Gly Ala Lys Cys Ile Ala Met

180 185 190

Val Thr Glu Ile Val Ser Ser Pro Asn Ile Tyr Glu Lys Thr Arg Lys

195 200 205

Ile Ile His Ile Leu Glu Gly Tyr Lys Asn Gly Lys Tyr Ile Ala

210 215 220

<210> 71

<211> 672

<212> DNA

<213> Dictyoglomus turgidum

<220>

<223> HTK12 野生型

<400> 71

atgaataaaa aagaaaaatt agagctatta aaagatttca atctatactg cctaacctgt 60

gaagaatatt ccataggaag gaagaatatt gatgtggtaa gagaaattct tgaagcaggg 120

gtaaagatta tacaataccg agaaaagaaa aaacctatga gagaaaaata tcatgaagtc 180

gtaaaaataa gagatttaac tgctaagtat aatgctttac ttatagtaaa tgatcaccta 240

gatcttacaa aaatagttga agcagatggg gtacatattg gacaagaaga ttatcctata 300

gaggttgcta aagagttctt aggggaaaac ttcattatag gtctcactac tcatacaaag 360

gaacaagtta tggaggcatt acgaaaagga gctgattata ttggacttgg acctatattt 420

ccaagttata caaaagaaaa acctcaccca ccaatcggaa tagagattct tgattgggct 480

atcaagaata tcagtattcc cgttgttgcc attgggggta taaaagaatc caatatccat 540

gagatactaa atctgggagc caaatgtata gctatggtga ctgagattgt ttcttctcca 600

aatatttatg agaaaacgag aaaaatcatc cacatattgg agggatataa aaatggaaaa 660

tacattgctt ga 672

<210> 72

<211> 672

<212> DNA

<213> 人工序列

<220>

<223> HTK12-密码子优化的

<400> 72

atgaacaaga aggaaaagct ggaactgctg aaagacttca atctgtattg tctgacctgt 60

gaagaatata gtattggccg taaaaatatc gatgttgtgc gcgaaattct ggaagcaggc 120

gtgaaaatta ttcagtatcg tgaaaaaaag aagccgatgc gcgaaaaata tcatgaagtt 180

gtgaaaattc gcgatctgac cgcaaaatat aatgcactgc tgattgtgaa tgatcatctg 240

gatctgacca aaattgttga agccgatggc gtgcatattg gtcaggaaga ttatccgatt 300

gaagtggcaa aagagttcct gggcgaaaac ttcattattg gtctgaccac ccataccaaa 360

gaacaggtga tggaagccct gcgtaaaggc gcagattata ttggcctggg tccgatcttc 420

ccgagttata ccaaagaaaa accgcatccg ccgattggca ttgaaattct ggattgggca 480

attaaaaaca ttagcattcc ggttgtggca attggtggta ttaaagaaag caatattcac 540

gaaatcctga atctgggtgc aaaatgtatt gcaatggtta ccgaaattgt gagtagtccg 600

aatatctatg aaaaaaccag aaaaatcatc cacatcctgg aaggctataa aaatggcaaa 660

tatattgcct ga 672

<210> 73

<211> 565

<212> PRT

<213> 黑曲霉（Aspergillus niger）

<220>

<223> IP1

<400> 73

Met Ser Ser Tyr Gly Gly Gly Gly Gly Tyr Gln Arg Asp Ser Tyr Arg

1 5 10 15

Ser Arg Asn Gly Gly Gly Gly Gly Gly Tyr Gly Asn Gly Asn Gly Tyr

20 25 30

Ser Asn Gly Gly Gly Tyr Gly Gly Gly Gly Gly Gly Gly Gly Tyr Gly

35 40 45

Gly Gly Gly Tyr Gly Gly Gly Gly Tyr Gly Gly Gly Gly Tyr Gly Gly

50 55 60

Arg Gly Gly Gly Ala Gly Gly Ala Gly Gly Asp Arg Met Ser Asn Leu

65 70 75 80

Gly Ala Gly Leu Lys Lys Gln Glu Trp Asp Leu Asp Ser Leu Pro Lys

85 90 95

Phe Glu Lys Ser Phe Tyr Lys Glu His Ala Asp Val Ala Glu Arg Ser

100 105 110

Gln Arg Asp Val Asp Glu Phe Arg Lys Lys His Glu Met Ala Val Gln

115 120 125

Gly Arg Asn Val Pro Arg Pro Val Glu Thr Phe Asp Glu Ala Gly Phe

130 135 140

Pro Gln Tyr Val Leu Ser Glu Val Lys Ala Gln Gly Phe Asp Arg Pro

145 150 155 160

Thr Ala Ile Gln Ser Gln Gly Trp Pro Met Ala Leu Ser Gly Arg Asp

165 170 175

Val Val Gly Ile Ala Glu Thr Gly Ser Gly Lys Thr Leu Thr Tyr Cys

180 185 190

Leu Pro Ala Ile Val His Ile Asn Ala Gln Pro Leu Leu Ala Pro Gly

195 200 205

Asp Gly Pro Ile Val Leu Ile Leu Ala Pro Thr Arg Glu Leu Ala Val

210 215 220

Gln Ile Gln Ala Glu Ile Ser Lys Phe Gly Lys Ser Ser Arg Ile Arg

225 230 235 240

Asn Thr Cys Val Tyr Gly Gly Val Pro Lys Gly Pro Gln Ile Arg Asp

245 250 255

Leu Ser Arg Gly Val Glu Val Cys Ile Ala Thr Pro Gly Arg Leu Ile

260 265 270

Asp Met Leu Glu Ala Gly Arg Thr Asn Leu Arg Arg Val Thr Tyr Leu

275 280 285

Val Leu Asp Glu Ala Asp Arg Met Leu Asp Met Gly Phe Glu Pro Gln

290 295 300

Ile Arg Lys Ile Ile Ser Gln Ile Arg Pro Asp Arg Gln Thr Cys Met

305 310 315 320

Trp Ser Ala Thr Trp Pro Lys Glu Val Arg Gln Leu Ala Ser Asp Phe

325 330 335

Leu Asn Asp Tyr Ile Gln Val Asn Ile Gly Ser Met Asp Leu Ser Ala

340 345 350

Asn His Arg Ile Thr Gln Ile Val Glu Val Val Ser Asp Phe Glu Lys

355 360 365

Arg Asp Lys Met Ile Lys His Leu Glu Lys Ile Met Glu Asn Arg Ala

370 375 380

Asn Lys Cys Leu Ile Phe Thr Gly Thr Lys Arg Ile Ala Asp Glu Ile

385 390 395 400

Thr Arg Phe Leu Arg Gln Asp Gly Trp Pro Ala Leu Ser Ile His Gly

405 410 415

Asp Lys Gln Gln Gln Glu Arg Asp Trp Val Leu Asn Glu Phe Lys Thr

420 425 430

Gly Lys Ser Pro Ile Met Val Ala Thr Asp Val Ala Ser Arg Gly Ile

435 440 445

Asp Val Arg Asp Ile Thr His Val Leu Asn Tyr Asp Tyr Pro Asn Asn

450 455 460

Ser Glu Asp Tyr Val His Arg Ile Gly Arg Thr Gly Arg Ala Gly Ala

465 470 475 480

Lys Gly Thr Ala Ile Thr Phe Phe Thr Thr Asp Asn Ser Lys Gln Ala

485 490 495

Arg Asp Leu Val Thr Ile Leu Thr Glu Ala Lys Gln Gln Ile Asp Pro

500 505 510

Arg Leu Ala Glu Met Val Arg Tyr Ser Gly Gly Gly Gly His Gly His

515 520 525

Gly Gly Tyr Gly Arg Trp Gly Gly Arg Gly Gly Gly Arg Gly Gly Gly

530 535 540

Arg Gly Arg Gly Asn His Phe Thr Ala Ser Asn Ala Ala Pro Leu Gly

545 550 555 560

Gly Asn Arg Arg Trp

565

<210> 74

<211> 1698

<212> DNA

<213> 黑曲霉（Aspergillus niger）

<220>

<223> IP1 野生型

<400> 74

atgtcttcct acggcggcgg cggcggctac cagcgcgact cctaccgctc cagaaacggt 60

ggcggcggcg gcggctacgg taacggtaac ggttactcca acggcggagg ctacggtggt 120

ggtggtggtg gtggtggtta cggcggtggt ggctatggcg gcggcggcta cggcggcggc 180

ggctatggtg gcagaggtgg tggtgccggc ggtgctggcg gagaccgcat gtccaacctg 240

ggcgccggtc tgaagaagca ggaatgggat cttgactccc tgcccaagtt cgagaagtcc 300

ttctacaagg aacacgccga tgtcgccgag cgctctcagc gtgatgttga cgagttccgt 360

aagaagcacg agatggctgt tcagggaaga aacgtccctc gccctgtcga gaccttcgac 420

gaggccggtt tccctcaata cgttctcagc gaggtcaagg cccagggctt cgaccgccct 480

accgctattc agtctcaggg ttggcccatg gccctctctg gtcgcgacgt tgtcggtatc 540

gctgagacgg gttccggaaa gaccctgacc tactgtcttc ctgccattgt tcacatcaac 600

gcccagcccc tcctcgcccc cggtgacggc cccattgtcc ttatcctcgc ccccacccgt 660

gaattggccg ttcagattca agccgaaatc tccaagttcg gaaagtcttc ccgtatccgc 720

aacacctgtg tctacggtgg tgtccccaag ggtcctcaga tccgtgacct gagccgtggt 780

gtggaagtct gcattgcgac tcccggtcgt ctgattgaca tgctcgaggc tggtcgcacc 840

aaccttcgtc gtgtcaccta cctcgttctg gatgaggccg atcgcatgct ggacatgggt 900

ttcgagcccc agatccgcaa gatcatctcc cagattcgcc ctgaccgtca gacctgcatg 960

tggtccgcta catggcccaa ggaggtccgt cagcttgcgt ctgacttcct caacgactac 1020

atccaggtta acattggttc catggatctg tcggccaacc accgtatcac tcagatcgtc 1080

gaggtcgtct cggacttcga gaagcgcgac aagatgatca agcacctcga gaagatcatg 1140

gagaaccgtg ccaacaagtg ccttatcttc accggcacca agcgcatcgc tgacgaaatc 1200

actcgcttcc tccgccagga cggatggccg gcactttcta ttcacggtga taagcaacag 1260

caagaaagag attgggtctt gaacgagttc aagacgggca agagcccaat catggtggct 1320

actgatgtgg cttcccgtgg tatcgatgtg cgcgacatca cacacgttct caactatgac 1380

taccccaaca actcggagga ctacgttcac cgtattggta gaactggtcg tgccggtgct 1440

aagggtaccg ccatcacctt ctttaccact gacaactcca agcaggctcg tgacttggtc 1500

accattctca ctgaggccaa gcagcagatt gacccccgtc tcgccgagat ggtccgctac 1560

agtggcggcg gtggtcatgg ccacggtggc tatggccgct ggggtggccg tggtggtggc 1620

cgtggtggtg gccgtggccg cggcaaccac ttcactgctt ccaatgctgc tcctcttggt 1680

ggcaaccgtc gctggtaa 1698

<210> 75

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> IP1-密码子优化的

<400> 75

atgagtagtt acggtggcgg tggcggttat cagcgcgata gttatcgtag ccgcaatggc 60

ggcggtggcg gcggttatgg taatggcaat ggttatagta atggcggtgg ctatggtggt 120

ggcggtggtg gcggcggata tggtggtggt ggttatggcg gtggcggata tggcggcggt 180

ggttatggtg gccgtggcgg tggcgccggt ggtgcaggtg gtgatcgcat gagcaatctg 240

ggcgccggcc tgaaaaaaca ggaatgggat ctggatagcc tgccgaaatt cgaaaaatca 300

ttctataaag agcacgcaga tgttgccgaa cgtagtcagc gcgatgttga tgagttccgc 360

aaaaaacatg aaatggcagt tcagggccgt aatgtgccgc gcccggtgga aaccttcgat 420

gaagcaggct tcccgcagta tgttctgagc gaagtgaaag cacagggctt cgatcgtccg 480

accgccattc agagtcaggg ttggccgatg gccctgagtg gccgcgatgt tgtgggcatt 540

gcagaaaccg gtagtggcaa aaccttaacc tattgtctgc cggcaattgt gcatattaat 600

gcacagccgc tgctggcacc gggtgatggt ccgattgttc tgattctggc cccgacccgt 660

gaactggccg ttcagattca ggccgaaatt agcaaattcg gcaaaagcag ccgtattcgc 720

aatacctgcg tgtatggtgg tgttccgaaa ggtccgcaga ttcgcgatct gagtcgtggt 780

gtggaagtgt gtattgcaac ccctggtcgc ctgattgata tgctggaagc aggccgcacc 840

aatctgcgtc gcgttaccta tctggttctg gatgaagccg atcgtatgct ggatatgggc 900

ttcgaaccgc agattcgtaa aattattagt cagattcgtc cggatcgtca gacctgcatg 960

tggagcgcaa cctggccgaa agaagtgcgt cagctggcaa gtgacttcct gaatgattat 1020

attcaggtga atatcggtag tatggatctg agcgcaaatc atcgcattac ccagattgtg 1080

gaagttgtta gcgacttcga aaaacgcgat aaaatgatta aacacctgga aaaaatcatg 1140

gaaaaccgtg caaataaatg cctgatcttc accggtacca aacgcattgc cgatgaaatt 1200

acccgcttcc tgcgtcagga tggttggccg gccctgagta ttcatggtga taaacagcag 1260

caggaacgtg attgggtgct gaatgagttc aaaaccggca aaagtccgat tatggttgcc 1320

accgatgttg caagtcgcgg tattgatgtg cgcgatatta cccatgtgct gaattatgat 1380

tatccgaata atagtgagga ctatgttcat cgtattggtc gcaccggccg tgccggcgca 1440

aaaggtaccg ccattacctt cttcaccacc gataatagca aacaggcccg cgatctggtt 1500

accattctga ccgaagcaaa acagcagatt gatccgcgtc tggccgaaat ggttcgctat 1560

agcggcggcg gtggacatgg ccacggtggt tatggacgct ggggtggccg tggtggcggc 1620

cgtggtggtg gtagaggtcg cggtaatcac ttcaccgcaa gtaatgcagc cccgctgggt 1680

ggtaatcgtc gttggtga 1698

<210> 76

<211> 266

<212> PRT

<213> 绿色产色链霉菌（Streptomyces viridochromogenes）

<220>

<223> IP2

<400> 76

Met Thr Pro Asp Phe Leu Ala Ile Lys Val Gly Gly Ser Leu Phe Ser

1 5 10 15

Arg Lys Asp Glu Pro Gly Ser Leu Asp Asp Asp Ala Val Thr Arg Phe

20 25 30

Ala Arg Asn Phe Ala Arg Leu Ala Glu Thr Tyr Arg Gly Arg Met Val

35 40 45

Leu Ile Ser Gly Gly Gly Ala Phe Gly His Gly Ala Ile Arg Asp His

50 55 60

Asp Ser Thr His Ala Phe Ser Leu Ala Gly Leu Thr Glu Ala Thr Phe

65 70 75 80

Glu Val Lys Lys Arg Trp Ala Glu Lys Leu Arg Gly Ile Gly Val Asp

85 90 95

Ala Phe Pro Leu Gln Leu Ala Ala Met Cys Thr Leu Arg Asn Gly Ile

100 105 110

Pro Gln Leu Arg Ser Glu Val Leu Arg Asp Val Leu Asp His Gly Ala

115 120 125

Leu Pro Val Leu Ala Gly Asp Ala Leu Phe Asp Glu His Gly Lys Leu

130 135 140

Trp Ala Phe Ser Ser Asp Arg Val Pro Glu Val Leu Leu Pro Met Val

145 150 155 160

Glu Gly Arg Leu Arg Val Val Thr Leu Thr Asp Val Asp Gly Ile Val

165 170 175

Thr Asp Gly Ala Gly Gly Asp Thr Ile Leu Pro Glu Val Asp Ala Arg

180 185 190

Ser Pro Glu Gln Ala Tyr Ala Ala Leu Trp Gly Ser Ser Glu Trp Asp

195 200 205

Ala Thr Gly Ala Met His Thr Lys Leu Asp Ala Leu Val Thr Cys Ala

210 215 220

Arg Arg Gly Ala Glu Cys Phe Ile Met Arg Gly Asp Pro Gly Ser Asp

225 230 235 240

Leu Glu Phe Leu Thr Ala Pro Phe Ser Ser Trp Pro Ala His Val Arg

245 250 255

Ser Thr Arg Ile Thr Thr Thr Ala Ser Ala

260 265

<210> 77

<211> 801

<212> DNA

<213> 绿色产色链霉菌（Streptomyces viridochromogenes）

<220>

<223> IP2 野生型

<400> 77

atgacgcccg atttcttggc catcaaggtt ggcggcagcc tgttctcccg caaggacgaa 60

cccggcagcc tggacgacga cgcggtgacg cgcttcgcca ggaacttcgc ccggctcgcc 120

gagacctacc ggggccggat ggttctcatc agcggcggcg gcgccttcgg ccacggggcc 180

atccgtgacc acgacagcac gcacgcgttc tccctcgccg gcctgaccga ggccaccttc 240

gaggtgaaga agcggtgggc cgagaagctc cgcgggatcg gcgtggacgc cttcccgctc 300

cagctggcgg ccatgtgcac gctccgcaac ggcataccgc agctccggtc cgaggtcctc 360

cgggacgtcc tcgaccacgg cgcgctgccc gtcctcgccg gcgacgccct gttcgacgag 420

cacggaaagc tgtgggcgtt ctccagcgac cgcgtccccg aggtcctcct gcccatggtc 480

gaggggcgcc tccgggtcgt caccctgacc gacgtcgacg gcatcgtgac cgacggcgcc 540

ggcggcgaca cgatcctgcc cgaggtcgac gcccggtccc ccgagcaggc gtacgccgcg 600

ctctggggca gcagcgaatg ggacgccacc ggcgccatgc acaccaagct cgacgcactg 660

gtcacctgcg cccgccgcgg tgccgagtgc ttcatcatgc ggggcgaccc cggcagcgac 720

ctggagttcc tgaccgcccc cttctcctcc tggccggcgc acgtgcggtc caccaggatc 780

accacgactg cttctgcgta a 801

<210> 78

<211> 801

<212> DNA

<213> 人工序列

<220>

<223> IP2-密码子优化的

<400> 78

atgaccccgg acttcctggc cattaaagtg ggtggtagtc tgttcagccg caaagatgaa 60

ccgggcagcc tggatgatga tgcagtgacc cgcttcgccc gtaacttcgc acgtctggcc 120

gaaacctatc gcggccgtat ggtgctgatt agtggtggtg gtgccttcgg tcatggtgca 180

attcgtgatc atgatagcac ccatgccttc agtctggcag gtctgaccga agcaaccttc 240

gaagtgaaaa aacgctgggc agaaaaactg cgcggtattg gcgtggatgc attcccgctg 300

caactggccg caatgtgcac cctgcgtaat ggtattccgc agctgcgtag cgaagtgctg 360

cgtgatgttc tggatcatgg cgcactgccg gttctggcag gcgatgccct gttcgatgaa 420

catggtaaac tgtgggcatt cagcagcgat cgcgttccgg aagttctgct gccgatggtt 480

gaaggtcgtc tgcgtgtggt gaccctgacc gatgttgatg gtattgtgac cgatggcgcc 540

ggcggtgata ccattctgcc ggaagttgat gcacgcagtc cggaacaggc atacgctgcc 600

ctgtggggta gtagcgaatg ggatgcaacc ggtgcaatgc ataccaaact ggatgcactg 660

gtgacctgtg cacgccgtgg cgcagaatgc ttcattatgc gtggtgatcc gggcagtgat 720

ctggagttcc tgaccgcacc gttcagcagc tggccggccc atgtgcgtag tacccgcatt 780

accaccaccg caagtgcctg a 801

<210> 79

<211> 276

<212> PRT

<213> 边山假交替单胞菌（Pseudoalteromonas byunsanensis）

<220>

<223> IP3

<400> 79

Met Val Thr Ser Ala Asp Leu Leu Ile Val Lys Val Gly Gly Ser Leu

1 5 10 15

Phe Ser Asp Lys Met Thr Asp Arg Gln Leu Asp Glu Gln Ala Leu Gln

20 25 30

Thr Tyr Ala Gln Leu Met Ala Ser Leu Tyr Arg Asn Ala Pro Gly His

35 40 45

Val Ile Met Ile Ser Gly Gly Gly Ser Tyr Gly His His Ala Val Arg

50 55 60

Cys Ile Asp Glu Ser Asp Glu Leu Ser Leu Leu Ser Leu Gly Met Ile

65 70 75 80

Asn Phe Glu Leu Lys Cys Val Trp His Glu Gln Leu Lys Arg Cys Gly

85 90 95

Ile Lys Ser Tyr Pro Leu His Leu Ala Ser Met Thr Ser Cys Val Asn

100 105 110

Arg Glu Asn Phe Asp Ser Ser Ala Lys Phe Val Asn Lys Leu Leu Tyr

115 120 125

Ala Lys Tyr Leu Pro Leu Val Thr Gly Asp Ala Leu Leu Asn Glu Gln

130 135 140

Gly Val Leu Glu Val Val Gly Ser Asp Tyr Val Ala Gly Ala Phe Lys

145 150 155 160

Asp Leu Glu Phe Asn Lys Ile Arg Ile Val Ile Met Thr Asp Val Pro

165 170 175

Gly Val Leu Gln Lys Ser Ala Thr Gly Gln Phe Glu Thr Ile Lys Glu

180 185 190

Ile Asp Gln Phe Asn Asp Pro Ala Gln Trp Leu Trp Glu Thr Pro Glu

195 200 205

Gly Asp Thr Ser Gly Ala Met Gln Gly Lys Ile Ala Ala Leu Leu Lys

210 215 220

Gln Ala Lys Trp Gly Ala Glu Cys Phe Ile Val Glu Gly Gln Ala Cys

225 230 235 240

Leu Lys Asn Pro Arg Trp Leu Phe Glu Glu His Ser Asp Trp Pro Glu

245 250 255

Glu Phe Lys Ser Thr Gln Ile Ile Trp Arg Glu Asn Asn Ala Lys Asp

260 265 270

Thr Glu Gly Tyr

275

<210> 80

<211> 831

<212> DNA

<213> 边山假交替单胞菌（Pseudoalteromonas byunsanensis）

<220>

<223> IP3 野生型

<400> 80

atggtgacca gcgctgattt attaattgta aaagtgggtg gtagtctttt ttctgacaaa 60

atgactgaca gacaactgga tgaacaagcc ctgcaaacat atgcgcaatt gatggcctct 120

ttgtatcgca atgcaccggg tcacgtgatt atgataagcg gtggcggctc ttatggacac 180

catgctgtgc gctgtataga tgaaagtgat gagctgtcgc tactatcttt aggcatgatt 240

aactttgagc ttaagtgcgt gtggcatgaa caattaaaac gctgtgggat taagtcttac 300

cctttgcatt tagcttctat gacatcctgt gtgaatagag aaaactttga ctcatccgca 360

aagtttgtca ataagttgtt gtatgcaaag tacttgcccc tagttacagg agatgcattg 420

cttaatgaac aaggggtgtt agaagttgtg ggcagcgatt atgtggctgg cgcctttaaa 480

gaccttgagt ttaacaaaat aagaatcgtg atcatgaccg atgtaccggg tgtgctgcaa 540

aagagtgcta ctggtcaatt tgaaacgatt aaagaaatag accagtttaa tgacccagct 600

cagtggctat gggagacacc agaaggggac acatcaggtg ctatgcaagg caaaattgca 660

gccttactta agcaagccaa atggggcgct gagtgcttta tcgtagaagg acaagcatgt 720

ttgaaaaacc cccgatggtt atttgaagaa cactccgatt ggcctgaaga gtttaagagc 780

acacaaatta tttggcgaga gaataacgca aaagacacag aaggatatta a 831

<210> 81

<211> 831

<212> DNA

<213> 人工序列

<220>

<223> IP3-密码子优化的

<400> 81

atggttacca gtgccgatct gctgattgtg aaagtgggcg gtagcctgtt cagtgataaa 60

atgaccgatc gtcagctgga tgaacaggcc ctgcaaacct atgcacagct gatggcaagc 120

ctgtatcgca atgcccctgg tcatgtgatt atgattagcg gcggtggcag ctatggccat 180

catgccgttc gttgcattga tgaaagtgat gaactgagcc tgctgagtct gggcatgatt 240

aacttcgaac tgaaatgtgt gtggcatgaa cagctgaaac gttgtggtat taaaagttat 300

ccgctgcatc tggccagcat gaccagctgc gtgaatcgtg aaaacttcga tagtagcgca 360

aaattcgtga ataaactgct gtatgccaaa tatctgccgc tggttaccgg tgatgccctg 420

ctgaatgaac agggcgttct ggaagttgtg ggcagtgatt atgtggcagg tgccttcaaa 480

gatctggagt tcaataaaat tcgcattgtt attatgaccg acgttccggg tgtgctgcaa 540

aaaagtgcaa ccggtcagtt cgaaaccatt aaagaaattg atcagttcaa cgatccggcc 600

cagtggctgt gggaaacacc tgaaggcgat accagcggcg caatgcaggg taaaattgca 660

gccctgctga aacaggccaa atggggcgcc gaatgcttca ttgttgaagg tcaggcatgt 720

ctgaaaaatc cgcgttggct gttcgaagaa catagcgatt ggccggaaga gttcaaaagt 780

acccagatta tctggcgcga aaataatgca aaagataccg aaggctattg a 831

<210> 82

<211> 248

<212> PRT

<213> 沃氏产卤菌（Haloferax volcanii）

<220>

<223> IP4

<400> 82

Met Ser Leu Val Val Leu Lys Leu Gly Gly Ser Val Val Thr Asp Lys

1 5 10 15

Asp Glu Pro Glu Thr Val Asp Glu Ala Gly Leu Ala Ala Ala Ala Asp

20 25 30

Ala Val Ala Pro Leu Ala Glu Ser Arg Arg Val Val Val Val His Gly

35 40 45

Gly Gly Ser Phe Gly His His His Ala Ala Glu His Gly Val Ser Ser

50 55 60

Glu Ser Gly Ser His Asp Ala Arg Gly Val Arg Ala Ile His Asp Ala

65 70 75 80

Met Lys Arg Leu Asn Asp Ala Val Leu Asp Ala Leu Glu Glu Arg Gly

85 90 95

Val Ala Ala Leu Pro Val His Pro Leu Ser Ala Gly Ala Arg Glu Ala

100 105 110

Asp Gly Ser Leu Ser Leu Pro Leu Ala Ala Thr Glu Thr Met Leu Asp

115 120 125

Glu Gly Phe Val Pro Val Leu His Gly Asp Val Ile Ser His Ala Gly

130 135 140

Lys Gly Ala Thr Ile Val Ser Gly Asp Asp Leu Val Val Ser Leu Ala

145 150 155 160

Ser Gly Leu Gly Ala Asp Arg Val Gly Leu Cys Ser Thr Val Pro Gly

165 170 175

Val Leu Asp Ala Asp Gly Asp Val Ile Pro Glu Ile Thr Ala Phe Ala

180 185 190

Asp Ala Ala Asp Ala Leu Gly Gly Ser Asp Ser Thr Asp Val Thr Gly

195 200 205

Gly Met Ala Ala Lys Val Arg Lys Leu Leu Ala Leu Gly Ala Pro Ala

210 215 220

His Val Phe Gly Pro Glu Gly Leu Ser Ala Phe Val Ala Gly Glu Ser

225 230 235 240

Pro Gly Thr Val Ile Arg Gly Glu

245

<210> 83

<211> 747

<212> DNA

<213> 沃氏产卤菌（Haloferax volcanii）

<220>

<223> IP4 野生型

<400> 83

gtgagcctcg tcgtcctcaa actcggcggg agcgtcgtca ccgacaagga cgaaccggag 60

acggtcgacg aggcgggact ggcggccgcc gcggacgcgg ttgcgcccct cgctgaatcg 120

cgccgcgtcg tcgtcgtcca cggcggcggg agcttcggcc accaccacgc cgccgaacac 180

ggcgtctcct cggagtccgg gagccacgac gcccgcggcg tgcgcgccat ccacgacgcg 240

atgaagcgcc tcaacgacgc cgtcctcgac gccctcgaag agcgcggcgt cgcggccctg 300

ccggtccacc cgctttcggc cggcgcgcgc gaggccgacg gctcgctgtc gcttccgctc 360

gcggcgaccg agacgatgct cgacgagggc ttcgtcccgg tcctccacgg agatgtcatc 420

tcgcacgcgg gcaagggcgc gaccatcgtc agcggcgacg acctcgtggt gtcgctcgcg 480

tcggggctcg gcgcggaccg cgtcggcctc tgttcgaccg tccccggcgt gctcgacgcc 540

gacggcgacg tgattcccga gattacggcg ttcgcggacg cggccgacgc gctcggcggg 600

tctgactcca ccgacgtgac cggcgggatg gccgcgaagg tgcgaaaact gctcgcgctc 660

ggcgcgccgg cgcacgtctt cggccccgag ggactgtcgg cgttcgtcgc cggcgagtcg 720

ccgggaaccg tcatccgcgg agagtag 747

<210> 84

<211> 747

<212> DNA

<213> 人工序列

<220>

<223> IP4-密码子优化的

<400> 84

atgagtctgg tggtgctgaa actgggcggc agtgtggtga ccgataaaga tgaaccggaa 60

accgtggatg aagccggcct ggcagcagcc gcagatgcag ttgcaccgct ggccgaaagc 120

cgccgtgttg tggtggttca tggcggcggc agcttcggtc atcatcatgc cgccgaacat 180

ggtgtgagca gtgaaagcgg tagtcatgat gcccgtggcg tgcgcgccat tcatgatgca 240

atgaaacgcc tgaatgatgc cgtgctggat gcactggaag aacgcggtgt tgccgcactg 300

ccggttcatc cgctgagtgc cggcgcccgt gaagccgatg gtagcctgag cctgccgctg 360

gcagcaaccg aaaccatgct ggatgaaggc ttcgttccgg ttctgcatgg tgatgtgatt 420

agccatgcag gtaaaggtgc caccattgtg agtggcgatg atctggtggt tagcctggcc 480

agtggtctgg gcgcagatcg tgtgggtctg tgtagtaccg tgccgggtgt gctggatgcg 540

gatggcgatg tgattccgga aattaccgcc ttcgcagatg ccgcagatgc cctgggcggt 600

agtgatagca ccgatgtgac cggtggcatg gcagcaaaag ttcgcaaact gctggccctg 660

ggcgccccgg cacatgtgtt cggtccggaa ggcctgagcg ccttcgtggc aggcgaaagc 720

cctggtaccg ttattcgcgg cgaatga 747

<210> 85

<211> 266

<212> PRT

<213> 热自养甲烷热杆菌（Methanothermobacter thermautotrophicus）

<220>

<223> IP5

<400> 85

Met Ile Ile Leu Lys Leu Gly Gly Ser Val Ile Thr Arg Lys Asp Ser

1 5 10 15

Glu Glu Pro Ala Ile Asp Arg Asp Asn Leu Glu Arg Ile Ala Ser Glu

20 25 30

Ile Gly Asn Ala Ser Pro Ser Ser Leu Met Ile Val His Gly Ala Gly

35 40 45

Ser Phe Gly His Pro Phe Ala Gly Glu Tyr Arg Ile Gly Ser Glu Ile

50 55 60

Glu Asn Glu Glu Asp Leu Arg Arg Arg Arg Phe Gly Phe Ala Leu Thr

65 70 75 80

Gln Asn Trp Val Lys Lys Leu Asn Ser His Val Cys Asp Ala Leu Leu

85 90 95

Ala Glu Gly Ile Pro Ala Val Ser Met Gln Pro Ser Ala Phe Ile Arg

100 105 110

Ala His Ala Gly Arg Ile Ser His Ala Asp Ile Ser Leu Ile Arg Ser

115 120 125

Tyr Leu Glu Glu Gly Met Val Pro Val Val Tyr Gly Asp Val Val Leu

130 135 140

Asp Ser Asp Arg Arg Leu Lys Phe Ser Val Ile Ser Gly Asp Gln Leu

145 150 155 160

Ile Asn His Phe Ser Leu Arg Leu Met Pro Glu Arg Val Ile Leu Gly

165 170 175

Thr Asp Val Asp Gly Val Tyr Thr Arg Asn Pro Lys Lys His Pro Asp

180 185 190

Ala Arg Leu Leu Asp Val Ile Gly Ser Leu Asp Asp Leu Glu Ser Leu

195 200 205

Asp Gly Thr Leu Asn Thr Asp Val Thr Gly Gly Met Val Gly Lys Ile

210 215 220

Arg Glu Leu Leu Leu Leu Ala Glu Lys Gly Val Glu Ser Glu Ile Ile

225 230 235 240

Asn Ala Ala Val Pro Gly Asn Ile Glu Arg Ala Leu Leu Gly Glu Glu

245 250 255

Val Arg Gly Thr Arg Ile Thr Gly Lys His

260 265

<210> 86

<211> 801

<212> DNA

<213> 热自养甲烷热杆菌（Methanothermobacter thermautotrophicus）

<220>

<223> IP5 野生型

<400> 86

atgatcattc tcaagcttgg tggaagtgta attaccagga aggactctga ggaacctgca 60

atagacaggg ataaccttga aaggatagcc tcagagatag ggaacgcttc gccatcatca 120

ttgatgatag tgcacggcgc agggtccttt ggccacccat ttgcaggtga gtacaggata 180

ggctcggaga tagagaatga ggaggacctc aggcgccgga ggtttggatt tgcactgacc 240

cagaactggg ttaaaaagct taacagccat gtatgcgacg cactccttgc tgagggaatt 300

ccagcagttt caatgcagcc atcagctttc ataagggccc atgctggccg cataagccac 360

gcggatatct cactgatcag atcctacctt gaggagggta tggtaccggt ggtctacggt 420

gacgttgtac ttgactcaga caggaggttg aaattttctg tcatatcagg agaccagctg 480

ataaaccact tctccctgag gctgatgccg gagagggtca tactcgggac agatgtggac 540

ggggtataca ccaggaaccc taagaagcac cccgatgcaa ggctccttga tgttatagga 600

tcactcgatg accttgaatc ccttgacggg acacttaaca ctgatgtgac gggtggaatg 660

gtcggtaaga taagggaact ccttctgctt gcagagaagg gtgtggaatc tgaaataatt 720

aatgctgcag tgcccggaaa tattgagagg gccctcctgg gagaggaggt acggggcaca 780

agaatcacag ggaaacattg a 801

<210> 87

<211> 801

<212> DNA

<213> 人工序列

<220>

<223> IP5-密码子优化的

<400> 87

atgatcatcc tgaaactggg cggtagcgtg attacccgca aagatagcga agaaccggca 60

attgatcgtg ataatctgga acgtattgca agcgaaattg gtaatgcaag cccgagtagc 120

ctgatgattg tgcatggtgc cggtagcttc ggtcatccgt tcgccggtga atatcgcatt 180

ggcagcgaaa ttgaaaatga agaagatctg cgccgtcgcc gcttcggctt cgccttaacc 240

cagaattggg tgaaaaaact gaatagccat gtgtgtgatg cactgctggc agaaggtatt 300

ccggccgtta gtatgcagcc gagtgccttc attcgcgccc atgcaggtcg cattagccat 360

gccgatatta gcctgattcg tagctatctg gaagaaggca tggttccggt ggtgtatggt 420

gatgtggttc tggatagcga tcgtcgcctg aaattcagcg tgattagcgg tgatcagctg 480

attaatcact tcagcctgcg cctgatgccg gaacgcgtta ttctgggtac cgatgtggat 540

ggcgtgtata cccgcaatcc gaaaaaacat ccggatgccc gtctgctgga tgttattggt 600

agtctggatg atctggaaag tctggatggc accctgaata ccgatgttac cggtggcatg 660

gtgggcaaaa ttcgtgaact gctgctgctg gcagagaaag gtgttgaaag cgaaattatt 720

aatgccgcag tgccgggtaa tattgaacgc gccctgctgg gtgaagaagt gcgtggcacc 780

cgcattaccg gtaaacattg a 801

<210> 88

<211> 260

<212> PRT

<213> 詹氏甲烷球菌（Methanocaldococcus jannaschii）

<220>

<223> IP6

<400> 88

Met Leu Thr Ile Leu Lys Leu Gly Gly Ser Ile Leu Ser Asp Lys Asn

1 5 10 15

Val Pro Tyr Ser Ile Lys Trp Asp Asn Leu Glu Arg Ile Ala Met Glu

20 25 30

Ile Lys Asn Ala Leu Asp Tyr Tyr Lys Asn Gln Asn Lys Glu Ile Lys

35 40 45

Leu Ile Leu Val His Gly Gly Gly Ala Phe Gly His Pro Val Ala Lys

50 55 60

Lys Tyr Leu Lys Ile Glu Asp Gly Lys Lys Ile Phe Ile Asn Met Glu

65 70 75 80

Lys Gly Phe Trp Glu Ile Gln Arg Ala Met Arg Arg Phe Asn Asn Ile

85 90 95

Ile Ile Asp Thr Leu Gln Ser Tyr Asp Ile Pro Ala Val Ser Ile Gln

100 105 110

Pro Ser Ser Phe Val Val Phe Gly Asp Lys Leu Ile Phe Asp Thr Ser

115 120 125

Ala Ile Lys Glu Met Leu Lys Arg Asn Leu Val Pro Val Ile His Gly

130 135 140

Asp Ile Val Ile Asp Asp Lys Asn Gly Tyr Arg Ile Ile Ser Gly Asp

145 150 155 160

Asp Ile Val Pro Tyr Leu Ala Asn Glu Leu Lys Ala Asp Leu Ile Leu

165 170 175

Tyr Ala Thr Asp Val Asp Gly Val Leu Ile Asp Asn Lys Pro Ile Lys

180 185 190

Arg Ile Asp Lys Asn Asn Ile Tyr Lys Ile Leu Asn Tyr Leu Ser Gly

195 200 205

Ser Asn Ser Ile Asp Val Thr Gly Gly Met Lys Tyr Lys Ile Asp Met

210 215 220

Ile Arg Lys Asn Lys Cys Arg Gly Phe Val Phe Asn Gly Asn Lys Ala

225 230 235 240

Asn Asn Ile Tyr Lys Ala Leu Leu Gly Glu Val Glu Gly Thr Glu Ile

245 250 255

Asp Phe Ser Glu

260

<210> 89

<211> 783

<212> DNA

<213> 詹氏甲烷球菌（Methanocaldococcus jannaschii）

<220>

<223> IP6 野生型

<400> 89

atgctaacca tattaaaatt aggagggagt attttatcag ataaaaatgt tccatactca 60

ataaaatggg acaacttgga gagaatagca atggagataa aaaacgcctt ggattattat 120

aaaaaccaaa ataaagagat aaaattaata ctcgtccatg gaggaggagc ttttggtcat 180

ccagtagcta aaaaatactt aaaaattgaa gatggcaaaa aaatatttat aaacatggag 240

aaaggatttt gggaaattca aagagcaatg agaagattta acaacatcat tatagacact 300

ctacagagct atgacatccc agctgtttct atacaaccat cttcgtttgt cgtttttggg 360

gataagttaa tttttgatac ctctgctata aaagagatgc ttaaaaggaa tttagttcca 420

gttattcatg gagatattgt aattgatgat aaaaacggct atagaataat ttctggagat 480

gacatagttc catatttggc aaatgaatta aaagctgatt taattctcta tgctacagat 540

gttgatggtg ttttaataga taataagcca ataaagagga ttgataaaaa taatatctat 600

aaaattttga attatttaag tggttctaat agtatagatg ttactggtgg aatgaagtat 660

aagatagaca tgattaggaa aaataagtgt agaggttttg tatttaatgg aaataaagct 720

aataatatat acaaagcttt attgggggag gttgaaggaa cagaaattga tttttcagaa 780

taa 783

<210> 90

<211> 783

<212> DNA

<213> 人工序列

<220>

<223> IP6-密码子优化的

<400> 90

atgctgacca ttctgaaact gggtggtagc attctgagtg ataaaaatgt gccgtatagt 60

attaagtggg ataatctgga acgcattgca atggaaatta aaaatgcact ggattattac 120

aagaaccaga ataaagaaat caagctgatt ctggtgcatg gtggtggtgc cttcggccat 180

ccggttgcaa aaaaatatct gaaaattgaa gacggtaaga agatcttcat taatatggaa 240

aagggcttct gggaaattca gcgtgccatg cgtcgcttca ataatattat tattgacacc 300

ctgcaaagct atgatattcc ggccgtgagt attcagccga gtagcttcgt ggtgttcggc 360

gataaactga tcttcgatac cagtgccatt aaagaaatgc tgaaacgtaa tctggtgccg 420

gtgattcatg gcgatattgt gattgatgat aaaaatggtt accgtattat cagtggtgat 480

gatattgttc cgtatctggc caatgaactg aaagccgatc tgattctgta tgcaaccgat 540

gttgatggcg tgctgattga taataaaccg attaaacgca ttgacaaaaa caatatctat 600

aagatcctga actacctgag tggtagcaat agtattgatg tgaccggtgg tatgaaatat 660

aaaattgata tgatccgcaa gaacaagtgt cgcggcttcg tgttcaatgg caataaagca 720

aataatatct acaaggccct gctgggcgaa gttgaaggca ccgaaattga cttcagtgaa 780

tga 783

<210> 91

<211> 290

<212> PRT

<213> Streptomyces regensis

<220>

<223> IP7

<400> 91

Met Thr Gly Pro Gly Thr Arg Ala Gly Glu Pro Gly Leu Leu Val Leu

1 5 10 15

Lys Val Gly Gly Ser Leu Leu Ser Asp Lys Arg His Thr Gly Glu Thr

20 25 30

Asp Tyr Thr Ala Ile Asp Asp Tyr Ala Gly Leu Leu Ala Asp Leu Val

35 40 45

Ala Ala Phe Pro Gly Arg Val Val Leu Val Thr Gly Gly Gly Ala Leu

50 55 60

Cys His Pro Val Gly Leu Arg Ile Lys Ala Ala Lys Asp Asp Pro Tyr

65 70 75 80

Ala Ala Val Ala Leu Thr Glu Pro Ala Phe Arg Met Arg Trp Ala Trp

85 90 95

Thr Thr Arg Leu Arg Ala Lys Gly Val Arg Ala Val Pro Leu Gln Ala

100 105 110

Thr Ser Leu Leu Glu Glu Arg Pro Asp Gly Thr Arg Ala Cys His Thr

115 120 125

Ala Val Val Gly Arg Leu Leu Ala Gln Gly Ala Leu Pro Val Leu Ser

130 135 140

Ser Asp Cys Tyr Leu Thr Ala Glu Gly Thr Leu Arg Ile Leu Ser Ser

145 150 155 160

Asp Asp Val Pro Ala Val Leu Leu Asp Leu Gly Leu Gly Pro Val Arg

165 170 175

Val Val Ala Leu Thr Asp Val Asp Gly Ile His Thr Gly Gly Pro Gly

180 185 190

Ser Pro Val Leu Ala His Leu Asp Pro Asp Asp Leu Ala Ala Ala Arg

195 200 205

Ala Leu Phe Trp Thr Asp Ala Trp Asp Ala Thr Gly Ala Met Glu Gly

210 215 220

Lys Val Glu Ala Leu Ala Asp Ser Ala Arg Arg Gly Ala Glu Cys Val

225 230 235 240

Ile Thr Arg Gly Asp Arg Thr Ala Ala Asp Leu Arg His Leu Phe Ala

245 250 255

Pro Leu Pro Asp Trp Pro Arg Asn Ala Pro Arg Thr Leu Ile Ser Arg

260 265 270

Arg Ala Pro Thr Asp Ser Ala Leu Ser Pro Ala Leu Ser Leu Glu Asn

275 280 285

Ala Pro

290

<210> 92

<211> 873

<212> DNA

<213> Streptomyces regensis

<220>

<223> IP7 野生型

<400> 92

gtgaccggcc ccggcacgcg ggccggtgag ccggggctgc tcgtcctgaa ggtcggcggc 60

agcctcctct ccgacaagcg gcacaccggc gagaccgact acacggcgat cgacgactac 120

gccgggctgc tcgcggacct ggtcgccgcc ttccccggcc gggtggtcct ggtgaccggg 180

ggcggagcgc tctgccaccc ggtcggactg cggatcaaag cggccaagga cgacccctac 240

gccgccgtcg ccctgaccga acccgcgttc cggatgcgct gggcgtggac gacccggctg 300

cgcgccaagg gcgtgcgggc cgtcccgctc caggcgacct ccctgctcga ggagcgcccc 360

gacggcaccc gggcctgcca caccgcggtc gtcggccgac tgctcgccca gggcgcgctg 420

cccgtgctgt ccagcgactg ctacctcacc gccgagggca ccctgcgcat cctcagcagc 480

gacgacgtgc ccgccgtcct gctggacctg ggcctcggcc cggtccgggt ggtggccctc 540

accgatgtcg acggcatcca caccgggggc cccggctccc cggtgctcgc ccacctcgat 600

cccgacgacc tggccgccgc acgcgccctg ttctggacgg acgcatggga tgccaccggt 660

gccatggagg gcaaggtcga ggcgctggcc gactccgccc ggcgcggcgc cgagtgcgtc 720

atcacccgcg gcgaccgcac ggcggccgac ctcaggcacc tgttcgcccc gctgccggac 780

tggccgcgaa acgccccgcg cacgctgatc tcgcggcgcg ccccgaccga cagcgccctc 840

tcacccgccc tctccctgga gaacgcccca tga 873

<210> 93

<211> 873

<212> DNA

<213> 人工序列

<220>

<223> IP7-密码子优化的

<400> 93

atgaccggtc cgggcacccg tgcaggcgaa cctggtctgc tggtgctgaa agtgggtggt 60

agcctgctga gtgataaacg ccataccggc gaaaccgatt ataccgcaat tgatgattat 120

gcaggtctgc tggcagatct ggttgccgca ttccctggtc gtgtggttct ggttaccggt 180

ggcggcgcac tgtgccatcc ggtgggtctg cgtattaaag ccgcaaaaga tgatccgtat 240

gcagcagtgg cactgaccga accggccttc cgcatgagat gggcctggac cacccgcctg 300

cgtgcaaaag gcgtgcgcgc cgttccgctg caagccacaa gtctgctgga agaacgcccg 360

gatggtaccc gtgcatgtca taccgcagtt gttggtcgcc tgctggccca gggcgcctta 420

cctgtgctga gcagcgattg ctatctgacc gcagaaggta ccctgcgtat tctgagtagc 480

gatgatgtgc cggccgtgct gctggatctg ggcctgggtc cggttcgcgt ggtggcactg 540

acagatgttg atggcattca taccggcggt ccgggcagcc cggttctggc acatctggac 600

cctgatgatc tggccgccgc ccgcgctctg ttctggacag atgcctggga tgcaaccggc 660

gcaatggaag gtaaagtgga agccctggcc gatagcgccc gtcgcggtgc agaatgcgtt 720

attacccgtg gtgatcgcac cgcagccgat ctgcgtcatc tgttcgcacc gctgccggat 780

tggccgcgca atgcccctcg taccctgatt agccgccgcg ccccgaccga tagtgcctta 840

tctccggccc tgagtctgga aaatgcaccg tga 873

<210> 94

<211> 299

<212> PRT

<213> 球孢囊菌属（Sphaerisporangium sp.）

<220>

<223> IP8

<400> 94

Met Glu Ala Met Gly Leu Ser Ser Pro Ala Val Asp Arg Thr Trp Arg

1 5 10 15

Ser Thr Gln Arg Ala Arg Glu Ser Ser Ala Ser Asp Arg Val Leu Ala

20 25 30

Val Lys Ile Gly Gly Ser Leu Phe Ser Asp Lys Ser Val Ala Gly Ser

35 40 45

Leu Asp Lys Gly Arg Ile Ala Arg Phe Ala Arg Val Ile Ser Ser Leu

50 55 60

His Glu Arg Phe Pro Gly Gln Val Val Leu Ile Thr Gly Gly Gly Ala

65 70 75 80

Ile Gly His Gly Ala Leu Arg Gly Ile Asp Pro Ala Asp Pro Phe Ala

85 90 95

Ala Ile Gly Leu Thr Lys Ala Leu Ala Asp Val Arg Trp Ala Trp Thr

100 105 110

Gln Ala Leu Val Gly Leu Gly Val Arg Ala Phe Pro Leu Gln Leu Gly

115 120 125

Ala Met Ala Thr Leu Asp Asp Asp Leu Ser Phe Arg Val Arg Ala Asp

130 135 140

Ile Val Glu Arg Val Leu Ala Ser Gly Ala Leu Pro Ile Leu Ser Gly

145 150 155 160

Asp Ser Val Leu Asp Ala Asn Gly Asn Leu His Gly Leu Ser Ser Asp

165 170 175

Arg Val Pro Glu Phe Leu Val Arg Ala Leu Gln Thr Pro Leu Arg Val

180 185 190

Ala Ser Phe Thr Asp Val Pro Gly Ile Val Leu Gly Gly Pro Gly Gly

195 200 205

Lys Glu Thr Leu Arg Tyr Val Asp Pro Met Thr Pro Gln Ala Ala Tyr

210 215 220

Glu Ala Leu Trp Thr Asn Ser Glu Trp Asp Thr Thr Gly Gly Phe Lys

225 230 235 240

Thr Lys Val Asp Ala Leu Ile Arg Cys Ala Ala Glu Gly Ala Glu Cys

245 250 255

Phe Ile Leu Glu Gly Val Ala Gln Asp Ser Glu Trp Ala Tyr Leu Leu

260 265 270

Ser Pro Tyr Ser Gly Trp Ser Asn Lys Leu His Cys Thr Arg Ile Ala

275 280 285

Arg Ser Pro Ala Ala Ala Val Ser Thr Ala Glu

290 295

<210> 95

<211> 900

<212> DNA

<213> 球孢囊菌属（Sphaerisporangium sp.）

<220>

<223> IP8 野生型

<400> 95

ttggaggcga tggggttgag tagtccggct gtcgatagaa catggcgctc cacgcagcgc 60

gcccgtgaga gctcggcgtc agatcgcgtg cttgcggtga agatcggtgg cagtcttttc 120

tctgataaga gtgtcgccgg cagcttggat aaaggtcgta ttgctaggtt cgctcgagtg 180

atctccagcc ttcatgagcg ttttcccggc caggtcgtcc ttatcacagg aggcggtgcc 240

atcgggcacg gcgcactacg aggaatcgat ccggcagacc ccttcgccgc aatcggcttg 300

accaaggcgc tcgcggacgt ccggtgggca tggacgcaag ctttggtagg tctcggggta 360

agggcgtttc cgctccagct tggcgcgatg gcgacattgg atgacgatct gtcgttccgc 420

gtgagggccg atatcgtcga gcgggtcctg gcgagcggcg cgcttccgat cctatcgggc 480

gacagcgtct tggacgccaa tggaaacctg cacggcctgt cgagtgaccg cgtaccagaa 540

ttccttgtac gtgccttgca gacacccctg cgggtcgcga gcttcactga tgtcccgggc 600

attgtgctgg gaggaccggg cggaaaggaa acgctccgct acgtggaccc catgaccccc 660

caggcagcct atgaagcact gtggaccaac agtgaatggg acaccacagg gggcttcaag 720

accaaggtgg acgcgctcat tcgatgtgca gcggagggcg cggagtgctt cattcttgag 780

ggagttgcgc aagactccga gtgggcatat ctgctctcac cgtacagcgg gtggtccaac 840

aagctccact gtacccggat cgcgcgctct ccggccgcag cagtcagcac cgccgagtag 900

<210> 96

<211> 900

<212> DNA

<213> 人工序列

<220>

<223> IP8-密码子优化的

<400> 96

atggaagcaa tgggtctgag cagtccggcc gtggatcgta cctggcgcag tacccagcgt 60

gcacgcgaaa gcagcgccag cgatcgtgtg ctggcagtta aaattggtgg cagtctgttc 120

agcgataaaa gcgttgcagg tagcctggat aaaggccgta ttgcacgctt cgcccgtgtt 180

attagtagcc tgcatgaacg cttccctggt caggtggtgc tgattaccgg tggcggtgcc 240

attggtcatg gcgcactgcg tggcattgat ccggcagatc cgttcgcagc aattggcctg 300

accaaagcac tggcagatgt gcgttgggcc tggacccagg cactggttgg cctgggtgtt 360

cgtgcattcc cgctgcaact gggcgcaatg gctaccctgg atgatgatct gagcttccgt 420

gttcgcgcag atattgttga acgtgttctg gcaagtggcg cactgccgat tctgagcggc 480

gatagcgtgc tggatgcaaa tggtaatctg catggcctga gcagtgatcg tgttccggag 540

ttcctggttc gcgcactgca aacacctctg cgcgttgcca gcttcaccga tgtgccgggc 600

attgtgctgg gtggtccggg cggtaaagaa accttacgtt atgtggaccc tatgaccccg 660

caggccgcct atgaagcact gtggaccaat agtgaatggg ataccaccgg tggcttcaaa 720

accaaagttg atgccctgat tcgctgtgcc gcagaaggtg ccgaatgctt cattctggaa 780

ggtgttgccc aggatagtga atgggcctat ctgctgagtc cgtatagcgg ctggagtaat 840

aaactgcatt gcacccgcat tgcccgcagc ccggccgcag cagttagcac agccgaatga 900

<210> 97

<211> 269

<212> PRT

<213> 异壁放线菌（Actinoalloteichus sp.）

<220>

<223> IP9

<400> 97

Met Val Asp Asp Val Val Asp Leu Leu Val Val Lys Val Gly Gly Ser

1 5 10 15

Leu Val Ser Glu Lys Ala Arg Arg Asp His Leu Asp His Asp Ala Leu

20 25 30

Ala Gly Tyr Ala Ala Gln Ile Ala Asp Leu His Ala Ala Ala Pro Gly

35 40 45

Arg Val Val Leu Val Val Gly Gly Gly Ser Ile Gly His Gly Ala Val

50 55 60

Arg His Leu Asp Ala Asp Asp Pro Leu Ala Pro Leu Pro Leu Thr Arg

65 70 75 80

Ala Thr Phe Asp Val Lys Trp Ser Trp Val Arg Ala Leu Arg Asp Leu

85 90 95

Gly Ser Arg Cys Phe Pro Val Gln Val Ala Ala Ile Cys Val Leu Gly

100 105 110

Pro Arg Gly Pro Glu Val Ser Phe Gly Thr Val Arg Arg Leu Leu Asp

115 120 125

His Gly Ile Leu Pro Val Leu Ala Gly Asp Ser Val Leu Cys Ala Asp

130 135 140

Gly Ala Leu Arg Val Phe Gly Ser Asp His Val Pro Ala Val Ala Val

145 150 155 160

Arg Gly Thr Pro Gly Arg Thr Arg Val Ala Val Leu Thr Asp Val Pro

165 170 175

Gly Val Leu Ala Gly Gly Pro Gly Ser Gln Glu Val Ile Pro Glu Ile

180 185 190

Thr Pro Gly Ser Ser Ala Glu Ala Phe Arg Arg Ile Trp Pro Ala Ala

195 200 205

Ala His Asp Thr Ser Gly Ser Met Gly Gly Lys Leu Thr Ala Leu Leu

210 215 220

Asp His Ala Arg Asp Gly Ala Glu Cys Phe Val Leu Arg Gly Asp Pro

225 230 235 240

Thr Ala Pro Asp Leu Arg Phe Leu Leu Glu Gly Arg Gly Arg Trp Pro

245 250 255

Asp Val Pro His Thr Arg Ile Val Ala Asp Thr Thr Gly

260 265

<210> 98

<211> 810

<212> DNA

<213> 异壁放线菌（Actinoalloteichus sp.）

<220>

<223> IP9 野生型

<400> 98

gtggtggatg acgtggtcga cctgctggtg gtgaaggtgg gcgggagcct ggtctcggag 60

aaggcccggc gcgaccacct ggaccacgac gccctggcgg ggtacgcggc gcagatcgcg 120

gacctgcacg ccgccgcccc cgggcgcgtg gtcctcgtcg tgggcggcgg atccatcggg 180

cacggggccg tgcggcacct cgacgccgac gaccccctcg ccccgttgcc cctcacccgt 240

gcgaccttcg acgtcaagtg gtcgtgggtg cgggcgttgc gggacctcgg ctcgcggtgc 300

ttccccgtcc aggtcgccgc catctgcgtg ctcggccccc gggggccgga ggtcagcttc 360

gggaccgtgc gacgcctgct cgaccacggc atcctcccgg tgctggccgg tgacagcgtg 420

ctctgcgccg acggtgcgct gcgggtgttc ggcagcgacc acgtcccggc cgtggccgtg 480

cgtggcacgc cgggtcggac gcgggtcgcc gtgctcaccg acgtcccggg agtgctggct 540

ggcggtcccg gcagccagga ggtgatcccg gagatcacgc cggggtcctc ggccgaggcg 600

ttccggcgga tctggccggc ggcggcgcac gacaccagcg gatcgatggg gggcaagctg 660

acggcgctcc tcgaccacgc ccgcgacggc gccgagtgct tcgtgcttcg aggcgatccg 720

acggcgccgg acctgcggtt cctgctcgaa gggcgcggca ggtggcccga cgtgccgcac 780

acccggatcg tcgccgacac caccggttga 810

<210> 99

<211> 810

<212> DNA

<213> 人工序列

<220>

<223> IP9-密码子优化的

<400> 99

atggtggatg atgttgttga tctgctggtg gttaaagtgg gtggtagtct ggttagtgaa 60

aaagcacgcc gtgatcatct ggatcatgat gccctggcag gttatgccgc acagattgcc 120

gatctgcacg ctgccgcccc tggtcgtgtg gtgctggtgg ttggcggcgg tagcattggt 180

catggcgcag tgcgtcatct ggatgcagat gatccgctgg caccgctgcc gctgacccgt 240

gcaaccttcg atgttaaatg gagttgggtg cgcgcactgc gcgatctggg cagccgttgc 300

ttcccggttc aggttgcagc catctgtgtg ctgggtccgc gcggtccgga agttagcttc 360

ggcaccgtgc gtcgtctgct ggatcatggt attctgccgg tgctggcagg tgatagcgtt 420

ctgtgtgcag atggcgcact gcgcgtgttc ggcagcgatc atgtgccggc cgttgcagtg 480

cgtggtaccc ctggtcgcac ccgtgttgca gtgctgaccg atgtgccggg tgttctggcc 540

ggtggtccgg gtagccagga agtgattccg gaaattaccc ctggtagtag cgccgaagcc 600

ttccgccgta tctggccggc cgccgcacat gataccagcg gtagtatggg tggcaaactg 660

accgcactgc tggatcacgc ccgtgatggc gccgaatgct tcgttctgcg tggcgatccg 720

accgccccgg atctgcgctt cctgctggaa ggtcgcggcc gttggccgga tgtgccgcat 780

acccgtattg tggccgatac caccggctga 810

<210> 100

<211> 302

<212> PRT

<213> Bifiguratus adelaidae

<220>

<223> IP10

<400> 100

Met Thr Phe Glu Leu Cys Leu Val Lys Val Gly Gly Ala Ala Leu Thr

1 5 10 15

Asp Lys Ser Arg Pro Ser Thr Leu Ala Asp Pro Lys Ile Leu Thr Thr

20 25 30

Ile Ala Ser Gln Leu Gly Thr Ala Phe Ser Thr Phe Ser Gly Thr Arg

35 40 45

Lys Arg Leu Val Ile Val His Gly Val Gly Ser Phe Gly His Pro Gln

50 55 60

Ala Lys Lys Tyr Asn Leu Ser Ser Gly Tyr Asp Met Glu Asn Ala Ser

65 70 75 80

Glu Asp Glu Lys Glu Tyr Lys Val Asp Gly Val Val Glu Thr Arg Gln

85 90 95

Ser Val Met Thr Leu His Gln Lys Val Cys Asp Leu Phe Ile Ala Gln

100 105 110

Gly Ile Pro Ala Ile Ser Met Ser Pro Phe His Tyr Val Arg Thr Leu

115 120 125

His Thr Pro Lys Ser Thr Lys Pro Asp Ala Tyr Ile Arg Leu Val Glu

130 135 140

Ala Val Asp Arg Ala Leu Thr Leu Gly Tyr Val Pro Val Leu His Gly

145 150 155 160

Asp Ala Val Leu Asp Asp Ala Gln Gly Cys Ala Ile Leu Ser Gly Asp

165 170 175

Val Val Ile Arg Glu Leu Ala Arg Gly Leu Arg Ala Gly Pro Ser Pro

180 185 190

Lys Tyr Ser Leu His Asn Cys Thr Phe Leu Thr Asp Val Asn Gly Val

195 200 205

Phe Asp Arg Asp Pro Lys Leu Thr Met Asp Glu Pro Pro His Leu Ile

210 215 220

Gln Ser Ile Lys Ile Ser Lys Tyr Gln Val Glu Arg Met Val Asn His

225 230 235 240

Ser Ser Ser Ile Asp Val Thr Gly Ala Met Thr Gly Lys Leu Gln Cys

245 250 255

Ala Met Asn Ile Val Lys Asp Ala Leu Glu Ala Gly Ile Glu Pro Ile

260 265 270

Gly Gln Val Ile Ile Cys Arg Ala Ala Ser Ala Asp Ala Met His Val

275 280 285

Leu Cys Gly Gln Glu Ala Asp Asn Arg Thr Val Val Glu Pro

290 295 300

<210> 101

<211> 909

<212> DNA

<213> Bifiguratus adelaidae

<220>

<223> IP10 野生型

<400> 101

atgacctttg agctgtgcct tgtgaaggtg ggaggtgccg cgttgacgga caaaagcagg 60

ccgtcaacgt tggccgaccc caaaatactc accaccatag catcacaact cggcacagca 120

ttctcgacct ttagtggaac gcgcaaacga ctcgtcatag ttcacggtgt gggctcgttt 180

ggtcacccgc aagctaaaaa gtacaatctc tccagtggat atgatatgga gaatgcctcc 240

gaggacgaga aagagtacaa ggtagacgga gttgtggaga cgcggcagtc tgtcatgaca 300

ttgcatcaaa aggtatgcga tctattcatt gctcagggca ttccagcaat cagtatgtcg 360

ccttttcatt atgtgcgaac cctgcatacc cctaagtcga caaagccaga cgcgtatata 420

cgattggtgg aggcggttga ccgagcattg acgctcggat atgtgccagt gttgcacggc 480

gatgcagtcc tcgatgatgc gcaaggttgc gccatcctca gtggcgatgt ggtgatccgg 540

gagcttgccc gtgggctacg cgctggacca tcacctaaat acagtcttca caattgtaca 600

ttcttaacgg atgtgaacgg tgtctttgac cgcgatccaa agttaactat ggatgaacca 660

ccgcatctga tccagagcat caagatcagc aaataccaag tagagaggat ggtgaatcat 720

tcatcttcca tcgatgtcac tggtgccatg acgggaaagc ttcaatgcgc aatgaacatt 780

gtcaaagatg cgcttgaggc cggtattgag cctatagggc aagtcattat atgtagagca 840

gcgtctgcgg acgccatgca tgtgctttgt ggtcaagagg ctgacaatag gaccgtcgtt 900

gagccttaa 909

<210> 102

<211> 909

<212> DNA

<213> 人工序列

<220>

<223> IP10-密码子优化的

<400> 102

atgaccttcg aactgtgtct ggtgaaagtt ggtggtgcag cactgaccga taaaagtcgt 60

ccgagtaccc tggcagatcc gaaaattctg accaccattg caagccagct gggcaccgca 120

ttcagtacct tcagcggcac ccgcaaacgt ctggtgattg ttcatggtgt tggcagcttc 180

ggtcatccgc aggccaaaaa atataatctg agcagtggct atgatatgga aaatgccagt 240

gaagatgaaa aagaatataa ggttgacggc gtggtggaaa ccagacagag cgttatgacc 300

ctgcatcaga aagtgtgcga tctgttcatt gcccagggta ttccggccat tagcatgagt 360

ccgttccatt atgttcgtac cctgcatacc ccgaaaagta ccaaaccgga tgcctatatt 420

cgcctggttg aagccgtgga tcgcgccctg accctgggct atgttccggt gctgcatggc 480

gatgcagtgc tggatgatgc acagggctgt gcaattctga gcggcgatgt tgttattcgt 540

gaactggccc gtggcctgcg tgccggtcct agtcctaaat atagtctgca taattgtacc 600

ttcctgaccg atgtgaatgg cgtgttcgat cgtgatccga aactgacaat ggatgaaccg 660

ccgcatctga ttcagagcat taaaattagc aaataccagg tggaacgcat ggtgaatcat 720

agtagcagta ttgatgttac cggtgccatg accggtaaac tgcaatgcgc catgaatatt 780

gtgaaagatg ccctggaagc aggcattgaa ccgattggtc aggtgattat ctgtcgtgca 840

gcaagcgccg atgccatgca tgttctgtgt ggtcaggaag ccgataatcg caccgtggtg 900

gaaccgtga 909

<210> 103

<211> 245

<212> PRT

<213> 嗜酸热原体（Thermoplasma acidophilum）

<220>

<223> IP11

<400> 103

Met Met Ile Leu Lys Ile Gly Gly Ser Val Ile Thr Asp Lys Ser Ala

1 5 10 15

Tyr Arg Thr Ala Arg Thr Tyr Ala Ile Arg Ser Ile Val Lys Val Leu

20 25 30

Ser Gly Ile Glu Asp Leu Val Cys Val Val His Gly Gly Gly Ser Phe

35 40 45

Gly His Ile Lys Ala Met Glu Phe Gly Leu Pro Gly Pro Lys Asn Pro

50 55 60

Arg Ser Ser Ile Gly Tyr Ser Ile Val His Arg Asp Met Glu Asn Leu

65 70 75 80

Asp Leu Met Val Ile Asp Ala Met Ile Glu Met Gly Met Arg Pro Ile

85 90 95

Ser Val Pro Ile Ser Ala Leu Arg Tyr Asp Gly Arg Phe Asp Tyr Thr

100 105 110

Pro Leu Ile Arg Tyr Ile Asp Ala Gly Phe Val Pro Val Ser Tyr Gly

115 120 125

Asp Val Tyr Ile Lys Asp Glu His Ser Tyr Gly Ile Tyr Ser Gly Asp

130 135 140

Asp Ile Met Ala Asp Met Ala Glu Leu Leu Lys Pro Asp Val Ala Val

145 150 155 160

Phe Leu Thr Asp Val Asp Gly Ile Tyr Ser Lys Asp Pro Lys Arg Asn

165 170 175

Pro Asp Ala Val Leu Leu Arg Asp Ile Asp Thr Asn Ile Thr Phe Asp

180 185 190

Arg Val Gln Asn Asp Val Thr Gly Gly Ile Gly Lys Lys Phe Glu Ser

195 200 205

Met Val Lys Met Lys Ser Ser Val Lys Asn Gly Val Tyr Leu Ile Asn

210 215 220

Gly Asn His Pro Glu Arg Ile Gly Asp Ile Gly Lys Glu Ser Phe Ile

225 230 235 240

Gly Thr Val Ile Arg

245

<210> 104

<211> 738

<212> DNA

<213> 嗜酸热原体（Thermoplasma acidophilum）

<220>

<223> IP11 野生型

<400> 104

atgatgatac tgaagatagg cggaagcgtg atcaccgata aatccgctta ccggactgcc 60

aggacgtacg ccataaggag catagttaag gttctatccg gaatcgagga tctggtgtgc 120

gtggttcacg gcggcggttc cttcggccat ataaaggcga tggaatttgg actgccaggc 180

ccaaagaacc caagatccag cattggatac agcatagttc acagagacat ggagaatctt 240

gatctcatgg tcatcgatgc aatgatagag atgggcatgc gaccgatatc cgtgccaata 300

agcgccctgc gctatgacgg ccgcttcgat tacacccctc ttatcaggta catagatgct 360

ggttttgttc ctgtatcata cggtgacgta tatataaagg atgaacattc atatggtata 420

tactctggag acgacataat ggccgacatg gcagaactgc tgaaaccaga tgtagctgta 480

ttccttaccg atgttgatgg catctacagc aaggatccga agagaaatcc tgatgcggtg 540

cttctcaggg atatagatac aaatatcacc ttcgatcggg tgcagaacga tgttaccggc 600

ggtataggga agaagttcga atccatggtg aagatgaaga gcagcgtgaa aaacggagtt 660

tacctgatca acgggaacca tccagagagg atcggagaca ttggaaagga atcattcata 720

ggtacggtga taagatga 738

<210> 105

<211> 738

<212> DNA

<213> 人工序列

<220>

<223> IP11-密码子优化的

<400> 105

atgatgatcc tgaaaatcgg cggtagcgtg attaccgata aaagcgccta tcgtaccgcc 60

cgtacctatg ccattcgtag tattgttaaa gttctgagtg gcattgaaga tctggtgtgt 120

gttgttcatg gtggtggcag cttcggtcat attaaagcaa tggagttcgg cctgccgggt 180

ccgaaaaatc cgcgtagtag cattggctat agtattgttc atcgtgatat ggaaaacctg 240

gatctgatgg tgattgatgc catgattgaa atgggcatga gaccgattag tgtgccgatt 300

agtgccctgc gttatgatgg tcgcttcgat tataccccgc tgattcgcta tattgatgcc 360

ggcttcgtgc cggtgagtta tggtgatgtg tatattaaag atgagcatag ctatggtatc 420

tatagcggtg atgatattat ggccgatatg gccgaactgc tgaaaccgga tgttgccgtg 480

ttcctgaccg atgttgatgg tatctattca aaagatccga aacgtaatcc ggatgccgtg 540

ctgctgcgcg atattgatac caatattacc ttcgatcgtg tgcagaatga tgtgaccggt 600

ggtattggta aaaaattcga aagtatggtt aagatgaaga gtagcgttaa aaatggtgtg 660

tatctgatta atggtaacca tccggaacgt attggcgata ttggcaaaga atcattcatt 720

ggtaccgtga ttcgctga 738

<210> 106

<211> 270

<212> PRT

<213> 藻渣膨胀芽孢杆菌（Tumebacillus algifaecis）

<220>

<223> IP12

<400> 106

Met Asn Val Val Lys Ile Gly Gly Ser Leu Leu Thr Asp Lys Asp Gly

1 5 10 15

Tyr Cys Ala Pro Asn Gln Glu Met Val Arg Gln Tyr Ala Arg Thr Ile

20 25 30

Ala Lys Glu Trp Glu Arg Leu Arg Gly Asn Leu Ile Leu Ile Val Gly

35 40 45

Gly Gly Ser Tyr Gly Asn Ala Val Pro Val Arg Tyr His Leu Lys Asp

50 55 60

Ala Ser Leu Pro Trp Lys Asp Thr Asp Leu Ser Met Met Thr Val Lys

65 70 75 80

Met Phe Glu Trp Leu Ser Leu Val Thr Gln Ile Phe Arg Glu Glu Gly

85 90 95

Val Pro Cys Tyr Pro Phe Gln Thr Ser Gly Tyr Val Val Thr Lys Asn

100 105 110

Lys Arg Pro Gln Arg Phe Phe Val Glu Pro Val Glu His Val Leu Ser

115 120 125

Met Gly Val Leu Pro Val Phe Ser Gly Asp Leu Val Phe Asp Glu Glu

130 135 140

Gln Gln Phe Ile Ile Phe Ser Ser Asp Asn Leu Pro Glu Leu Phe Val

145 150 155 160

Glu Arg Met Ser Leu Arg Arg Met Val Met Leu Thr Asp Val Glu Gly

165 170 175

Val Met Gln Ile Gly Thr Asp Gly Gln Gln Thr Val Ile Pro Glu Val

180 185 190

Thr Arg Ala Asn Phe Gln Glu Val Leu Arg Cys Ala Gly Pro Ser Gln

195 200 205

Lys Pro Asp Ile Thr Gly Gly Met Lys Asn Lys Leu Glu Ala Leu Leu

210 215 220

Arg Leu Ala Glu Gln Gly Val Glu Gly Val Ile Thr Ser Gly Arg Lys

225 230 235 240

Ala Glu Ala Leu Leu Pro Ala Leu Phe Glu Pro Glu Pro Val Gly Thr

245 250 255

Met Ile Arg Pro Trp Ala Gln Glu Asn Arg Gly Gly Leu Leu

260 265 270

<210> 107

<211> 813

<212> DNA

<213> 藻渣膨胀芽孢杆菌（Tumebacillus algifaecis）

<220>

<223> IP12 野生型

<400> 107

atgaatgtag tcaagattgg agggagtttg ctgaccgata aggacggcta ctgtgcgccg 60

aatcaggaga tggtgcggca gtatgcgcgc acgatcgcca aggagtggga gcggctgcgt 120

ggcaacttga tcctgatcgt cggcggaggc tcgtatggga atgcagtgcc ggttcgctat 180

cacttgaagg atgcttccct gccgtggaaa gatacggacc tgtcgatgat gacggtgaag 240

atgtttgagt ggttgtcgct ggtgacccag atttttcggg aagagggagt gccttgctat 300

ccgttccaga ccagcgggta tgtggtgacg aaaaacaaac ggccccagcg tttttttgtg 360

gagccggtgg agcacgtgct gtcgatgggg gtgctgcccg ttttctcggg cgacctggtc 420

tttgatgagg agcagcagtt tatcattttt tcgagtgata atttgcccga gttgtttgtc 480

gagcggatgt ctctccggcg gatggtgatg ctgaccgatg ttgagggagt gatgcaaatc 540

ggaacggatg ggcagcagac ggtgattcct gaagtgacgc gtgcaaattt tcaggaggtg 600

ctgcgctgtg cggggccttc gcaaaagccg gatatcacag gcggaatgaa aaataagctg 660

gaagctctgt tgcgcttggc ggagcaggga gtggaaggtg tgatcaccag cggaaggaag 720

gcggaggcat tgctgccagc gttgtttgag cccgagcctg taggcacgat gattcggcct 780

tgggcacaag agaatagagg gggattgctg tag 813

<210> 108

<211> 813

<212> DNA

<213> 人工序列

<220>

<223> IP12-密码子优化的

<400> 108

atgaacgtgg tgaaaattgg tggcagcctg ctgaccgata aagatggcta ttgcgcaccg 60

aatcaggaaa tggttcgcca gtatgcccgc accattgcaa aagaatggga acgtctgcgt 120

ggtaatctga ttctgattgt tggcggtggc agctatggca atgcagttcc ggttcgctat 180

catctgaaag atgccagcct gccgtggaaa gataccgatc tgagcatgat gaccgttaaa 240

atgttcgaat ggctgagtct ggttacccag atcttccgtg aagaaggtgt gccgtgttat 300

ccgttccaga ccagcggtta tgtggtgacc aaaaataaac gtccgcagcg cttcttcgtt 360

gaaccggtgg aacatgtgct gagtatgggt gtgctgccgg tgttcagcgg tgatctggtg 420

ttcgatgaag aacagcagtt cattatcttc agtagcgata atctgccgga actgttcgtg 480

gaacgcatga gcctgcgtcg tatggttatg ctgaccgatg ttgaaggtgt tatgcagatt 540

ggcaccgatg gccagcagac cgtgattccg gaagtgaccc gcgcaaactt ccaggaagtg 600

ctgcgctgcg ccggtccgag tcagaaaccg gatattaccg gtggcatgaa aaataaactg 660

gaagccctgc tgcgcctggc agaacagggt gttgaaggtg tgattaccag cggtcgcaaa 720

gccgaagcac tgctgccggc cctgttcgaa ccggaaccgg tgggcaccat gattcgcccg 780

tgggcccagg aaaatcgtgg tggtctgctg tga 813

<210> 109

<211> 5365

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 109

cgatcaccac aattcagcaa attgtgaaca tcatcacgtt catctttccc tggttgccaa 60

tggcccattt tcctgtcagt aacgagaagg tcgcgaattc aggcgctttt tagactggtc 120

gtaatgaaca attcttaaga aggagatata catatgcaga caagaaaaat cgtccgggca 180

gccgccgtac aggccgcctc tcccaactac gatctggcaa cgggtgttga taaaaccatt 240

gagctggctc gtcaggcccg cgatgagggc tgtgacctga tcgtgtttgg tgaaacctgg 300

ctgcccggat atcccttcca cgtctggctg ggcgcaccgg cctggtcgct gaaatacagt 360

gcccgctact atgccaactc gctctcgctg gacagtgcag agtttcaacg cattgcccag 420

gccgcacgga ccttgggtat tttcatcgca ctgggttata gcgagcgcag cggcggcagc 480

ctttacctgg gccaatgcct gatcgacgac aagggcgaga tgctgtggtc gcgtcgcaaa 540

ctcaaaccca cgcatgtaga gcgcaccgta tttggtgaag gttatgcccg tgatctgatt 600

gtgtccgaca cagaactggg acgcgtcggt gctctatgct gctgggagca tttgtcgccc 660

ttgagcaagt acgcgctgta ctcccagcat gaagccattc acattgctgc ctggccgtcg 720

ttttcgctat acagcgaaca ggcccacgcc ctcagtgcca aggtgaacat ggctgcctcg 780

caaatctatt cggttgaagg ccagtgcttt accatcgccg ccagcagtgt ggtcacccaa 840

gagacgctag acatgctgga agtgggtgaa cacaacgccc ccttgctgaa agtgggcggc 900

ggcagttcca tgatttttgc gccggacgga cgcacactgg ctccctacct gcctcacgat 960

gccgagggct tgatcattgc cgatctgaat atggaggaga ttgccttcgc caaagcgatc 1020

aatgaccccg taggccacta ttccaaaccc gaggccaccc gtctggtgct ggacttgggg 1080

caccgagacc ccatgactcg ggtgcactcc aaaagcgtga ccagggaaga ggctcccgag 1140

caaggtgtgc aaagcaagat tgcctcagtc gctatcagcc atccacagga ctcggacaca 1200

ctgctagtgc aagagccgtc cttgaggatc cgtcgacctg cagccaagct tggctgtttt 1260

ggcggatgag agaagatttt cagcctgata cagattaaat cagaacgcag aagcggtctg 1320

ataaaacaga atttgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac 1380

tcagaagtga aacgccgtag cgccgatggt agtgtggggt ctccccatgc gagagtaggg 1440

aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 1500

ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgggag cggatttgaa 1560

cgttgcgaag caacggcccg gagggtggcg ggcaggacgc ccgccataaa ctgccaggca 1620

tcaaattaag cagaaggcca tcctgacgga tggccttttt gcgtttctac aaactctttt 1680

gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa 1740

tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta 1800

ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag 1860

taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca 1920

gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta 1980

aagttctgct atgtggcgcg gtattatccc gtgttgacgc cgggcaagag caactcggtc 2040

gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc 2100

ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca 2160

ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc 2220

acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca 2280

taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac 2340

tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg 2400

cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg 2460

ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg 2520

gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac 2580

gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc 2640

aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct 2700

aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc 2760

actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 2820

gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 2880

atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 2940

atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 3000

ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 3060

gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 3120

cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 3180

tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 3240

cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 3300

ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 3360

gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 3420

tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 3480

ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 3540

gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 3600

atctgtgcgg tatttcacac cgcatatatg gtgcactctc agtacaatct gctctgatgc 3660

cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat ggctgcgccc 3720

cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct 3780

tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca 3840

ccgaaacgcg cgaggcagct gcggtaaagc tcatcagcgt ggtcgtgaag cgattcacag 3900

atgtctgcct gttcatccgc gtccagctcg ttgagtttct ccagaagcgt taatgtctgg 3960

cttctgataa agcgggccat gttaagggcg gttttttcct gtttggtcac tgatgcctcc 4020

gtgtaagggg gatttctgtt catgggggta atgataccga tgaaacgaga gaggatgctc 4080

acgatacggg ttactgatga tgaacatgcc cggttactgg aacgttgtga gggtaaacaa 4140

ctggcggtat ggatgcggcg ggaccagaga aaaatcactc agggtcaatg ccagcgcttc 4200

gttaatacag atgtaggtgt tccacagggt agccagcagc atcctgcgat gcagatccgg 4260

aacataatgg tgcagggcgc tgacttccgc gtttccagac tttacgaaac acggaaaccg 4320

aagaccattc atgttgttgc tcaggtcgca gacgttttgc agcagcagtc gcttcacgtt 4380

cgctcgcgta tcggtgattc attctgctaa ccagtaaggc aaccccgcca gcctagccgg 4440

gtcctcaacg acaggagcac gatcatgcgc acccgtggcc aggacccaac gctgcccgag 4500

atgcgccgcg tgcggctgct ggagatggcg gacgcgatgg atatgttctg ccaagggttg 4560

gtttgcgcat tcacagttct ccgcaagaat tgattggctc caattcttgg agtggtgaat 4620

ccgttagcga ggtgccgccg gcttccattc aggtcgaggt ggcccggctc catgcaccgc 4680

gacgcaacgc ggggaggcag acaaggtata gggcggcgcc tacaatccat gccaacccgt 4740

tccatgtgct cgccgaggcg gcataaatcg ccgtgacgat cagcggtcca atgatcgaag 4800

ttaggctggt aagagccgcg agcgatcctt gaagctgtcc ctgatggtcg tcatctacct 4860

gcctggacag catggcctgc aacgcgggca tcccgatgcc gccggaagcg agaagaatca 4920

taatggggaa ggccatccag cctcgcgtcg cgaacgccag caagacgtag cccagcgcgt 4980

cggccgccat gccggcgata atggcctgct tctcgccgaa acgtttggtg gcgggaccag 5040

tgacgaaggc ttgagcgagg gcgtgcaaga ttccgaatac cgcaagcgac aggccgatca 5100

tcgtcgcgct ccagcgaaag cggtcctcgc cgaaaatgac ccagagcgct gccggcacct 5160

gtcctacgag ttgcatgata aagaagacag tcataagtgc ggcgacgata gtcatgcccc 5220

gcgcccaccg gaaggagctg actgggttga aggctctcaa gggcatcggt cgacgctctc 5280

ccttatgcga ctcctgcatt aggaagcagc ccagtagtag gttgaggccg ttgagcaccg 5340

ccgccgcaag gaatggtgca tgcat 5365

<210> 110

<211> 5016

<212> DNA

<213> 人工序列

<220>

<223> pDHE165中的质粒 IPK11

<400> 110

catatgatga tcctgaaaat cggcggtagc gtgattaccg ataaaagcgc ctatcgtacc 60

gcccgtacct atgccattcg tagtattgtt aaagttctga gtggcattga agatctggtg 120

tgtgttgttc atggtggtgg cagcttcggt catattaaag caatggagtt cggcctgccg 180

ggtccgaaaa atccgcgtag tagcattggc tatagtattg ttcatcgtga tatggaaaac 240

ctggatctga tggtgattga tgccatgatt gaaatgggca tgagaccgat tagtgtgccg 300

attagtgccc tgcgttatga tggtcgcttc gattataccc cgctgattcg ctatattgat 360

gccggcttcg tgccggtgag ttatggtgat gtgtatatta aagatgagca tagctatggt 420

atctatagcg gtgatgatat tatggccgat atggccgaac tgctgaaacc ggatgttgcc 480

gtgttcctga ccgatgttga tggtatctat tcaaaagatc cgaaacgtaa tccggatgcc 540

gtgctgctgc gcgatattga taccaatatt accttcgatc gtgtgcagaa tgatgtgacc 600

ggtggtattg gtaaaaaatt cgaaagtatg gttaagatga agagtagcgt taaaaatggt 660

gtgtatctga ttaatggtaa ccatccggaa cgtattggcg atattggcaa agaatcattc 720

attggtaccg tgattcgctg actgaaagct tggctgtttt ggcggatgag agaagatttt 780

cagcctgata cagattaaat cagaacgcag aagcggtctg ataaaacaga atttgcctgg 840

cggcagtagc gcggtggtcc cacctgaccc catgccgaac tcagaagtga aacgccgtag 900

cgccgatggt agtgtggggt ctccccatgc gagagtaggg aactgccagg catcaaataa 960

aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaacg 1020

ctctcctgag taggacaaat ccgccgggag cggatttgaa cgttgcgaag caacggcccg 1080

gagggtggcg ggcaggacgc ccgccataaa ctgccaggca tcaaattaag cagaaggcca 1140

tcctgacgga tggccttttt gcgtttctac aaactctttt gtttattttt ctaaatacat 1200

tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 1260

ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 1320

gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 1380

tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 1440

ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 1500

tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 1560

atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 1620

gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 1680

caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 1740

ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 1800

ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 1860

ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 1920

ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 1980

gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 2040

ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 2100

taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 2160

agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 2220

atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 2280

aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 2340

caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 2400

ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 2460

cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 2520

tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 2580

gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 2640

ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 2700

gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 2760

caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 2820

ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 2880

tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 2940

ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 3000

agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 3060

aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc 3120

gcatatatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac 3180

actccgctat cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct 3240

gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 3300

tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg 3360

cggtaaagct catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg 3420

tccagctcgt tgagtttctc cagaagcgtt aatgtctggc ttctgataaa gcgggccatg 3480

ttaagggcgg ttttttcctg tttggtcact tgatgcctcc gtgtaagggg gaatttctgt 3540

tcatgggggt aatgataccg atgaaacgag agaggatgct cacgatacgg gttactgatg 3600

atgaacatgc ccggttactg gaacgttgtg agggtaaaca actggcggta tggatgcggc 3660

gggaccagag aaaaatcact cagggtcaat gccagcgctt cgttaataca gatgtaggtg 3720

ttccacaggg tagccagcag catcctgcga tgcagatccg gaacataatg gtgcagggcg 3780

ctgacttccg cgtttccaga ctttacgaaa cacggaaacc gaagaccatt catgttgttg 3840

ctcaggtcgc agacgttttg cagcagcagt cgcttcacgt tcgctcgcgt atcggtgatt 3900

cattctgcta accagtaagg caaccccgcc agcctagccg ggtcctcaac gacaggagca 3960

cgatcatgcg cacccgtggc caggacccaa cgctgcccga gatgcgccgc gtgcggctgc 4020

tggagatggc ggacgcgatg gatatgttct gccaagggtt ggtttgcgca ttcacagttc 4080

tccgcaagaa ttgattggct ccaattcttg gagtggtgaa tccgttagcg aggtgccgcc 4140

ggcttccatt caggtcgagg tggcccggct ccatgcaccg cgacgcaacg cggggaggca 4200

gacaaggtat agggcggcgc ctacaatcca tgccaacccg ttccatgtgc tcgccgaggc 4260

ggcataaatc gccgtgacga tcagcggtcc agtgatcgaa gttaggctgg taagagccgc 4320

gagcgatcct tgaagctgtc cctgatggtc gtcatctacc tgcctggaca gcatggcctg 4380

caacgcgggc atcccgatgc cgccggaagc gagaagaatc ataatgggga aggccatcca 4440

gcctcgcgtc gcgaacgcca gcaagacgta gcccagcgcg tcggccgcca tgccggcgat 4500

aatggcctgc ttctcgccga aacgtttggt ggcgggacca gtgacgaagg cttgagcgag 4560

ggcgtgcaag attccgaata ccgcaagcga caggccgatc atcgtcgcgc tccagcgaaa 4620

gcggtcctcg ccgaaaatga cccagagcgc tgccggcacc tgtcctacga gttgcatgat 4680

aaagaagaca gtcataagtg cggcgacgat agtcatgccc cgcgcccacc ggaaggagct 4740

gactgggttg aaggctctca agggcatcgg tcgacgctct cccttatgcg actcctgcat 4800

taggaagcag cccagtagta ggttgaggcc gttgagcacc gccgccgcaa ggaatggtgc 4860

atgcatcgat caccacaatt cagcaaattg tgaacatcat cacgttcatc tttccctggt 4920

tgccaatggc ccattttcct gtcagtaacg agaaggtcgc gaattcaggc gctttttaga 4980

ctggtcgtaa tgaacaattc ttaagaagga gatata 5016

<210> 111

<211> 273

<212> PRT

<213> Streptomyces silvensis

<400> 111

Met Ser Gly Pro Ala Gly Asp Gly Leu Ile Ala Thr Ile Arg Glu Arg

1 5 10 15

Arg Pro Leu Val His Met Ile Thr Asn Leu Val Ser Met Ala Ala Cys

20 25 30

Ala Gln Thr Val Lys Ser Leu Gly Ala Ala Thr Ile Phe Ala His Ala

35 40 45

Ala Glu Glu Ala Ala Glu Ile Ala Gly Thr Ala Asp Ala Val Val Leu

50 55 60

Asn Val Gly Thr Ser Val Pro Gly Met Asp Arg Thr Ala Val Gln Val

65 70 75 80

Ala Glu Ala Cys Ala Ala Arg Ser Ile Pro Val Val Leu Asp Pro Leu

85 90 95

Gly Ser Gly Ala Ser Arg Phe Arg Ser His Leu Ala Arg Ala Leu Leu

100 105 110

Asp Thr Gly Ala Val Arg Met Val Ser Gly Asn Val Ala Glu Leu Ala

115 120 125

Asp Leu Cys Gly Val Pro Ser Val Ile Arg Gly Ala Asp Ala Val Ser

130 135 140

Ala Thr Ala Pro Ala Asp Glu Val Cys Met Lys Leu Ala Glu Ser Ala

145 150 155 160

Gln Val Ile Ala Ala Val Ser Gly Arg Thr Asp Tyr Val Gly Asp Gly

165 170 175

Arg Gln Leu Ala Ala Ile Thr Asn Gly His Pro Val Met Gly Gln Val

180 185 190

Val Gly Thr Gly Ser Ala Arg Ser Ala Val Leu Gly Ala Phe Ala Ala

195 200 205

Val Ala Gly Ala Asp Met Phe Thr Ala Thr Val Thr Gly Val Cys Ala

210 215 220

Tyr Gly Ile Ala Gly Glu Leu Ala Ala Ala Thr Gly Arg Gly Pro Gly

225 230 235 240

Tyr Leu Leu Pro Glu Val Cys Asn Gln Leu Ser Val Met Asp Asp Glu

245 250 255

Met Val Ala Thr Arg Ser Arg Val Thr Thr Ser Ala Pro Arg Asp Pro

260 265 270

Ser

<210> 112

<211> 822

<212> DNA

<213> Streptomyces silvensis

<400> 112

atgagcgggc cggcaggtga cgggctgatc gccacgatcc gcgagcgccg cccgctcgta 60

cacatgatca ccaatctggt gtcgatggct gcctgtgcgc agaccgtgaa gtcgctgggc 120

gccgcgacca tcttcgcgca cgcggccgag gaggcggcgg agatcgccgg gacggcggac 180

gccgtggtgc tcaacgtcgg gacctccgtg ccggggatgg accggaccgc ggtacaggtc 240

gccgaggcct gtgcggcacg gtcgatcccc gtcgtcctcg acccgttggg atccggggcc 300

agccggttcc gctcgcacct cgccagggcg ctgctcgaca ccggagccgt ccgcatggtg 360

tccggcaatg tcgccgagct ggcggacctg tgtggtgtcc cgtcggtgat acgtggcgcc 420

gacgccgtca gcgccaccgc accagcggac gaggtgtgca tgaagctggc ggagtccgcc 480

caggtcatcg ccgccgtctc cggccgcacc gactacgtgg gcgacggacg gcagctggcc 540

gcgatcacca acggacatcc ggtcatggga caggtggtcg gcaccggcag cgcacggtcc 600

gcggtgctcg gcgccttcgc ggccgtcgca ggtgcggaca tgttcaccgc gacggtcacc 660

ggggtctgcg cctacggcat cgccggtgag ctggcggcgg ccaccggcag gggacccggc 720

tatctcctgc ccgaggtctg caatcagctg tccgtcatgg atgacgagat ggtcgcgacc 780

cggtcgcggg tcaccacgtc cgcccccagg gatccctcgt ga 822

<210> 113

<211> 832

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 113

atgagcggtc cggccggtga tggtctgatt gcaaccattc gcgaacgtcg tccgctggtt 60

cacatgatta ccaatctggt tagtatggca gcctgcgccc agaccgttaa aagtctgggc 120

gcagcaacca tcttcgccca tgcagcagaa gaagccgcag aaattgccgg taccgcagat 180

gccgttgttc tgaatgtggg caccagtgtg ccgggcatgg atcgcaccgc cgtgcaggtg 240

gcagaagcct gcgcagcacg tagcattccg gtggttctgg accctctggg tagtggtgca 300

agccgcttcc gtagtcatct ggcccgtgca ctgctggata ccggcgcagt gcgcatggtg 360

agtggtaatg ttgcagaact ggccgatctg tgtggtgtgc cgagcgttat tcgcggtgca 420

gatgcagtga gtgccaccgc accggcagat gaagtgtgca tgaaactggc agaaagcgca 480

caggtgattg ccgccgttag tggtcgtacc gattatgttg gtgatggtcg tcagctggcc 540

gccattacca atggccatcc ggttatgggt caggttgttg gcaccggtag cgcacgtagc 600

gccgttctgg gtgccttcgc cgcagtggcc ggcgcagata tgttcaccgc caccgtgacc 660

ggcgtgtgtg catacggtat tgccggtgaa ctggccgcag caaccggtcg tggtccgggt 720

tatctgctgc cggaagtgtg caatcagctg agcgtgatgg atgatgaaat ggttgccacc 780

cgtagccgtg ttaccaccag cgcaccgcgt gatccgagtt gactgaaagc tt 832

<210> 114

<211> 277

<212> PRT

<213> Halarchaeum acidiphilum

<400> 114

Met Thr Thr Asp Phe Thr Val Ala Glu Ser Leu Glu Arg Ile Ala Ala

1 5 10 15

Glu Gln Pro Leu Ile Asn Cys Val Thr Asn Ala Val Thr Val Asn Asp

20 25 30

Val Ala Asn Val Thr Leu His Trp Gly Gly Leu Pro Val Met Ser Asp

35 40 45

Asp Ala Arg Glu Val Gly Asp Met Val Ala Gly Ala Gln Gly Cys Leu

50 55 60

Leu Asn Met Gly Thr Val Ser Glu Ala Gly Glu Glu Ala Met Leu Thr

65 70 75 80

Ala Gly Asn Ala Ala Asn Asp His Gly Val Pro Leu Val Val Asp Pro

85 90 95

Val Gly Val Gly Ala Thr Pro Thr Arg Asp Arg Val Ala Glu Ala Leu

100 105 110

Val Thr Asp Leu Asp Pro Thr Ile Val Lys Gly Asn Tyr Gly Glu Ile

115 120 125

Thr Ala Leu Ala Gly Ala Asp Ala Glu Val Arg Gly Val Glu Ser Val

130 135 140

Gly Asp Tyr Ala Asp Val Ala Glu Thr Ala Val Ala Leu Ala Arg Asp

145 150 155 160

Thr Gly Ala Val Val Val Ala Ser Gly Glu Thr Asp Val Val Ala Ser

165 170 175

Ala Asp Ala Ala Tyr Glu Val Glu Asn Gly Asp Ala Met Leu Gly Thr

180 185 190

Val Val Gly Thr Gly Cys Met Leu Gly Val Thr Leu Ala Val Phe Ala

195 200 205

Ala Ala Leu Asp Asp Ala Glu Thr Ala Ala Leu Ala Gly Thr Leu Ala

210 215 220

Phe Gly Val Ala Gly Glu Ala Ala Ala Lys Gly Asp Phe Gly Asp Tyr

225 230 235 240

Ala Gly Pro Ala Ser Tyr Arg Val Ala Phe Leu Asp Ala Val Ala Gly

245 250 255

Leu Asp Gly Val Glu Val Glu His Pro Asp Pro Asp Ala Arg Ile Thr

260 265 270

Arg Val Leu Asp Ala

275

<210> 115

<211> 834

<212> DNA

<213> Halarchaeum acidiphilum

<400> 115

atgaccaccg acttcaccgt cgccgagagc ctcgaacgca tcgccgccga acagccgctc 60

atcaactgcg tgacgaacgc cgtcaccgtc aacgacgtcg cgaacgtcac cctccactgg 120

ggcggtctcc ccgtgatgtc cgacgacgcc cgcgaagtcg gcgacatggt cgcgggcgcg 180

cagggctgtc tcctcaacat gggcaccgtg agcgaggccg gcgaggaagc gatgctgacg 240

gccggcaacg ccgcgaacga ccacggcgtc ccgctcgtcg tcgatcccgt cggcgtcggc 300

gcgacgccga cccgcgatcg cgtcgccgaa gccctcgtca ccgacctcga tccgacgatc 360

gtgaagggga actacggcga gataacggcg ctcgcgggcg cggatgcaga ggttcgcggc 420

gtcgagtccg tcggcgacta cgcggacgtc gcggagacgg ccgtcgcgct cgcccgcgac 480

accggcgccg tcgtcgtcgc gtcgggtgag acggacgtcg tcgcgagcgc cgatgcggcc 540

tacgaggtcg agaacggcga cgcgatgctc ggaacggtcg tcgggacggg ctgtatgctc 600

ggcgtgacgc tcgccgtgtt cgccgcggcg ctcgacgacg cggagacggc cgcgctcgcc 660

ggcacgctcg cgttcggcgt cgcgggcgag gccgccgcga agggcgactt cggcgactac 720

gcagggccgg cgagctaccg cgtcgcgttc ctcgacgccg tcgccggact cgacggggtc 780

gaggtcgagc accccgatcc cgacgcgcgg atcacgcgcg tcctcgacgc gtag 834

<210> 116

<211> 844

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 116

atgaccaccg acttcaccgt ggccgaaagc ctggaacgca ttgcagccga acagccgctg 60

attaattgtg ttaccaatgc cgttaccgtt aatgatgttg caaatgtgac cctgcattgg 120

ggtggtctgc cggtgatgag cgatgatgca cgtgaagttg gcgatatggt tgccggcgcc 180

cagggttgtc tgctgaatat gggcaccgtt agtgaagcag gcgaagaagc catgctgacc 240

gccggcaatg cagccaatga tcatggtgtg ccgctggtgg tggaccctgt gggtgttggc 300

gccaccccga cccgtgatcg tgtggcagaa gcactggtta ccgatctgga ccctaccatt 360

gtgaaaggta attatggcga aattaccgcc ctggccggtg ccgatgcaga agttcgtggc 420

gtggaaagcg ttggtgatta tgccgatgtg gccgaaaccg ccgttgccct ggcccgtgat 480

accggcgcag tggttgtggc aagcggtgaa accgatgtgg tggcaagtgc cgatgccgca 540

tacgaagtgg aaaatggtga tgccatgctg ggcaccgttg ttggtaccgg ttgtatgctg 600

ggtgtgaccc tggcagtgtt cgcagcagcc ctggatgatg ccgaaaccgc agcactggca 660

ggtaccctgg cattcggtgt ggcaggcgaa gccgcagcca aaggtgactt cggcgattat 720

gccggcccgg ccagctatcg tgttgccttc ctggatgcag ttgccggcct ggatggtgtt 780

gaagttgaac atccggaccc tgatgcccgt attacccgtg tgctggatgc atgactgaaa 840

gctt 844

<210> 117

<211> 258

<212> PRT

<213> Legionella rubrilucens

<400> 117

Met Leu Tyr Gln Leu Asp Thr Arg Leu Lys Arg Leu Arg Ala Glu Lys

1 5 10 15

Pro Leu Val Leu Cys Leu Thr Asn Ala Val Thr Met Asn Phe Val Ala

20 25 30

Asn Ser Leu Leu Ala Leu Gly Ala Ala Pro Ile Met Ser Gln Ala Asp

35 40 45

Asp Glu Leu Glu Ala Leu Ile Thr Ile Ser Arg Ala Leu Tyr Val Asn

50 55 60

Ile Gly Thr Leu Asp Arg Gln Phe Ile Glu Arg Ile Asp Lys Ala Cys

65 70 75 80

Arg Leu Ala Ala Ile His Gln Lys Pro Ile Ile Leu Asp Pro Val Gly

85 90 95

Ala Gly Ala Ser Gln Ile Arg Thr Leu Thr Ala Arg Gln Leu Ser Pro

100 105 110

Gln Ala Ala Ile Ile Arg Gly Asn Ala Ser Glu Ile Ile Ala Leu Thr

115 120 125

Ala Asp Lys Gly Ile Ser Lys Gly Val Glu Thr Leu His Pro Val Glu

130 135 140

Ala Ala Leu Thr Ala Ala Leu Thr Leu Ser Gln Gln Thr Ser Ala Ile

145 150 155 160

Val Val Val Ser Gly Pro Val Asp Phe Ile Thr Asp Gly Arg Gln Cys

165 170 175

Cys His Leu Ser Tyr Gly Ser Pro Leu Met Pro Leu Val Thr Gly Met

180 185 190

Gly Cys Ala Leu Thr Ala Ile Ile Ala Ala Phe Ala Ala Met Glu Thr

195 200 205

Pro Phe Tyr Glu Ala Ala Ala Ala Gly Thr Ala Tyr Val Gly Leu Cys

210 215 220

Gly Gln Ser Ala His Arg Ser Ala Ser Gly Pro Ala Ser Phe Gln Ser

225 230 235 240

Ala Phe Ile Asp Ala Leu Tyr Gln Met Pro Phe Glu Glu Leu Asp Asp

245 250 255

Ala Leu

<210> 118

<211> 777

<212> DNA

<213> Legionella rubrilucens

<400> 118

atgctttatc aactggatac ccggcttaag cgcttgcgcg cggagaagcc tttggtgctc 60

tgtttaacga atgcagtgac catgaacttc gtagccaaca gcctgctggc gctgggggct 120

gcaccgatca tgtcacaggc agatgacgag cttgaggcac tgattaccat atcacgggct 180

ctctatgtca atattggtac cttggacaga cagtttattg agcggattga caaggcttgc 240

cgccttgccg ccattcacca gaaacccatc atactcgatc ccgtgggggc gggagccagt 300

caaatcagga cgttgacagc ccggcaactt tcaccccaag ccgccattat tcgcggtaac 360

gccagtgaaa ttattgcttt gacggcagat aaaggcatca gcaagggagt ggaaacgctt 420

catccggtgg aggcggcatt gactgctgca ttgactctat cacagcagac atcggcgatt 480

gtcgttgtca gcggccccgt ggattttatt acggatggcc gccaatgttg ccatttgtcc 540

tatggttcgc cgctgatgcc tttggtcacg ggaatggggt gtgccctgac cgccatcatt 600

gcggcctttg ccgcgatgga aacgcctttt tatgaagccg ccgctgcggg tacagcctat 660

gtcgggctat gcggccagtc agctcatcgt tcagccagtg gtccggccag ctttcagagc 720

gcgttcattg atgcccttta tcaaatgcca tttgaggagc tggatgatgc gctataa 777

<210> 119

<211> 787

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 119

atgctgtatc agctggatac ccgtctgaaa cgtctgcgtg cagaaaaacc gctggttctg 60

tgtctgacca atgccgtgac catgaacttc gttgcaaata gtctgctggc actgggtgcc 120

gccccgatta tgagccaggc cgatgatgaa ctggaagccc tgattaccat tagccgcgca 180

ctgtatgtta atattggtac cctggatcgc cagttcattg aacgcattga taaagcatgc 240

cgtctggcag ccattcatca gaaaccgatt attctggacc ctgtgggtgc aggcgccagc 300

cagattcgca ccctgaccgc acgtcagctg agtccgcagg ccgccattat tcgcggcaat 360

gcaagcgaaa ttattgcact gaccgccgat aaaggcatta gcaaaggcgt ggaaacctta 420

catccggtgg aagcagcact gaccgcagca ctgacactga gccagcagac cagcgcaatt 480

gttgttgtta gtggcccggt tgacttcatt accgatggtc gccagtgctg tcatctgagc 540

tatggtagcc cgctgatgcc gctggtgacc ggcatgggct gcgccttaac cgcaattatt 600

gccgcattcg ccgcaatgga aacaccgttc tatgaagcag cagcagcagg taccgcatac 660

gttggtctgt gcggtcagag tgcccatcgc agcgccagtg gcccggctag cttccagagt 720

gccttcattg atgccctgta tcagatgccg ttcgaagaac tggatgatgc actgtgactg 780

aaagctt 787

<210> 120

<211> 273

<212> PRT

<213> 肠膜明串珠菌（Leuconostoc mesenteroides）

<400> 120

Met Lys Asn Glu Leu Ile Lys Ile Lys Ser Ile Leu Pro Leu Gln Lys

1 5 10 15

Ala Pro Leu Val His Cys Ile Thr Asn Asp Ile Thr Leu Glu Thr Val

20 25 30

Ala Asn Thr Ile Leu Tyr Leu Gly Gly Lys Pro Ile Met Ser Ser Asp

35 40 45

Thr Arg Glu Phe Ser Ser Leu Phe Gln Ser Thr Asp Ala Leu Leu Leu

50 55 60

Asn Met Gly Arg Leu Asn Glu Ser His Glu Gln Ser Leu Ser Gln Ala

65 70 75 80

Ser Ser Leu Ala Asp Met Thr Lys Lys Pro Thr Val Val Asp Leu Val

85 90 95

Gly Tyr Gly Ile Thr Asn Glu Arg Thr Lys Leu Gly Met Ala Met Ala

100 105 110

Arg Asn His Pro Thr Val Ile Lys Gly Asn Thr Ser Glu Ile Arg Arg

115 120 125

Phe Val Gly Leu Pro Ser Leu Ala Lys Gly Ile Asp Gly Ala Ser Ser

130 135 140

Asp Gln His Asp Gln Ala Leu Lys Asp Leu Ile Leu Ser Leu Lys Gln

145 150 155 160

Ile Thr Thr Glu Tyr Ala Asp Thr Val Phe Val Ala Thr Gly Lys Lys

165 170 175

Asp Val Ile Val Gln Asn Asp Lys His Leu Ile Leu Ser Asn Gly Val

180 185 190

Asp Glu Leu Asp Lys Phe Val Gly Thr Gly Asp Met Val Gly Ala Ile

195 200 205

Ile Thr Thr Leu Leu Ala Val Gly Glu Asp Pro Trp Val Ala Ser Gln

210 215 220

Phe Ala Ile Ser Tyr Leu Asn Val Ala Ala Glu Lys Ala Leu Ser Leu

225 230 235 240

Thr Asn Gly Met Glu Asn Phe Arg Arg Glu Val Leu Asn Gln Ile Asp

245 250 255

Leu Leu Gly Arg Asn Gln Gln Trp Ala Thr Lys Ile Lys Tyr Ser Asn

260 265 270

Phe

<210> 121

<211> 822

<212> DNA

<213> 肠膜明串珠菌（Leuconostoc mesenteroides）

<400> 121

atgaaaaatg aattaataaa aattaaatca attttacctt tgcaaaaggc accgttagta 60

cattgcataa ccaatgatat tacgttagaa acggtggcta atactatatt gtatcttggt 120

ggtaaaccta tcatgagtag tgatacccgt gaattttcgt cattatttca gtcaacagat 180

gctctactac taaacatggg ccgacttaat gagtcacacg aacaaagtct cagtcaagct 240

agctctttag cagatatgac taaaaaaccg actgttgtgg atctggtagg ctatggtatt 300

actaatgaac gaacaaagtt aggaatggct atggcgcgta atcatccaac agttatcaaa 360

ggaaatactt cagaaatcag aagatttgtc ggcttaccat ctttagcaaa aggtattgat 420

ggtgctagct ctgatcagca tgatcaggcg ttaaaagatc tcattttgtc tttgaaacaa 480

ataacaactg agtatgccga tactgtgttt gtggcaacag ggaaaaagga tgtcattgtt 540

caaaatgata aacaccttat tttgagcaat ggcgtcgatg aattggataa gtttgttggg 600

acaggagaca tggttggcgc aattataact acacttctcg cggtcggtga agatccgtgg 660

gttgctagtc aatttgcaat tagctacctc aatgtagctg ctgaaaaagc attgtcatta 720

acaaacggca tggaaaactt tagacgagaa gttcttaacc aaattgattt gctagggaga 780

aatcaacagt gggcaacgaa aattaagtat tcgaattttt ga 822

<210> 122

<211> 832

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 122

atgaagaacg aactgattaa gatcaagagt attctgccgc tgcaaaaagc cccgctggtt 60

cattgcatta ccaatgatat taccctggaa accgttgcca ataccattct gtatctgggt 120

ggtaaaccga ttatgagtag tgatacccgt gagttcagta gtctgttcca gagcaccgat 180

gcactgctgc tgaatatggg ccgtctgaat gaaagtcatg aacagagcct gagccaggca 240

agcagcctgg ccgatatgac caaaaaaccg accgttgtgg atctggttgg ttatggtatt 300

accaatgaac gtaccaaact gggtatggca atggcacgca atcatccgac cgtgattaaa 360

ggtaatacca gcgaaattcg tcgcttcgtg ggcctgccga gtctggccaa aggtattgat 420

ggtgccagta gtgatcagca tgatcaggca ctgaaagact taattctgag tctgaaacag 480

attaccaccg aatatgcaga taccgtgttc gttgcaaccg gtaaaaaaga tgtgattgtg 540

cagaatgata agcatctgat tctgagtaat ggcgtggatg aactggataa attcgtgggt 600

accggtgata tggttggcgc aattattacc accctgctgg cagtgggtga agatccgtgg 660

gtggccagcc agttcgccat tagctatctg aatgtggcag cagaaaaagc cctgagcctg 720

accaatggta tggaaaactt ccgtcgtgaa gttctgaatc agattgatct gctgggccgc 780

aatcagcagt gggcaaccaa aattaaatat agcaacttct gactgaaagc tt 832

<210> 123

<211> 252

<212> PRT

<213> Leptospira species

<400> 123

Met Ile Thr Asn Asn Pro Leu Ile Leu Asn Ile Thr Asn Gln Val Thr

1 5 10 15

Thr His Phe Ile Ala Ser Ser Leu Ile Ala Leu Gly Ala Ser Pro Val

20 25 30

Met Ser Asp Asp Pro Ser Asp Ala Tyr Asp Leu Val Asp Ile Thr Asn

35 40 45

Gly Ile Cys Leu Asn Ile Gly Thr Ile Ser Ser His Gln Met Asp Ile

50 55 60

Met Arg Asn Val Leu Ser Asn Pro Lys Ala Lys Asn Ile Val Leu Asp

65 70 75 80

Pro Val Gly Ala Gly Ala Ser Ser Ile Arg Ser Ser Ser Cys Lys Glu

85 90 95

Ile Leu Glu Ser Gly Lys Ile Asp Leu Ile Arg Gly Asn Ala Ser Glu

100 105 110

Ile Ser Ser Ile Ala Gly Leu Ser Ser Thr Thr Arg Gly Val Asp Ser

115 120 125

Thr Met Glu Thr Lys Ser Val Glu Ile Thr Ala Asp Lys Leu Ala Lys

130 135 140

Asp Arg Ser Cys Ile Val Val Val Ser Gly Glu Val Asp Tyr Ile Thr

145 150 155 160

Asn Gly Thr Asp Lys Tyr Arg Val Asn Asn Gly Ala Ser Ile Met Ala

165 170 175

Lys Ile Thr Gly Thr Gly Cys Val Leu Ser Ser Tyr Leu Ala Ala Val

180 185 190

Leu Ala Ser Gly Asn Lys Ser Ile Glu Ser Ile Ala Phe Ala Val Ala

195 200 205

Tyr Tyr Gly Val Leu Gly Glu Lys Ala Ala Leu Asp Asn Thr Gly Leu

210 215 220

Gly Asn Tyr Arg Glu Arg Phe Leu Asp Ala Met Ser Thr Ile His Phe

225 230 235 240

Asp Ser Val Lys Pro Ser Leu Arg Ile Ser Lys Leu

245 250

<210> 124

<211> 759

<212> DNA

<213> Leptospira species

<400> 124

atgataacca ataatcctct catattaaat ataaccaacc aggtgactac gcattttatt 60

gcgagttctt tgattgcatt aggcgcttca ccagtaatgt cagatgatcc cagcgatgct 120

tacgatcttg ttgacattac aaatggtatt tgtttaaata taggaacaat atcatctcac 180

caaatggata taatgcgaaa tgttctttct aaccctaagg caaagaatat tgttttagac 240

cctgttggtg cgggagcaag cagtattcga tcttcatcat gtaaagaaat tctagaatca 300

ggtaaaatcg atttaattcg aggaaatgct tctgagattt ctagtatcgc tggcttatct 360

tccacaacca gaggagtaga ctcaacaatg gaaactaaat ctgtggaaat aacagccgat 420

aaattagcga aagatcgtag ttgtatagtg gttgtaagcg gggaggttga ttatattaca 480

aatggcaccg ataagtatcg agttaacaat ggagcctcga ttatggcaaa gattacagga 540

acaggctgcg ttctctcctc ttatctagct gcagttttag cttctggaaa taaatcaatt 600

gaaagcattg ctttcgcagt cgcatactat ggagtattag gtgagaaagc tgcattagac 660

aacacaggct taggaaatta tagagaaaga ttcttagacg ctatgagtac aatccatttt 720

gattctgtga aaccttcatt aaggatttca aaactatga 759

<210> 125

<211> 769

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 125

atgatcacca ataacccgct gattctgaat attaccaatc aggttaccac ccacttcatt 60

gccagtagtc tgattgccct gggcgccagt ccggtgatga gcgatgatcc gagtgatgca 120

tacgatctgg tggatattac caatggtatc tgtctgaata ttggcaccat tagtagccat 180

cagatggata ttatgcgtaa tgtgctgagc aatccgaaag caaaaaatat tgtgctggac 240

cctgtgggtg caggtgccag tagcattcgt agtagtagct gcaaagaaat tctggaaagt 300

ggcaaaattg atctgattcg cggtaatgca agcgaaatta gtagcattgc aggcctgagc 360

agcaccaccc gcggtgtgga tagcaccatg gaaaccaaaa gcgttgaaat taccgcagat 420

aaactggcaa aagatcgtag ctgtattgtg gtggttagtg gcgaagtgga ttatattacc 480

aatggcaccg ataaatatcg cgtgaataat ggcgcaagta ttatggccaa aattaccggt 540

accggctgcg ttctgagtag ttatctggca gccgtgctgg caagcggcaa taaaagcatt 600

gaaagtattg cattcgccgt tgcatattat ggcgttctgg gcgaaaaagc agcactggat 660

aataccggtc tgggtaatta tcgtgaacgc ttcctggatg ccatgagtac cattcacttc 720

gatagtgtga aaccgagtct gcgcattagt aaactgtgac tgaaagctt 769

<210> 126

<211> 277

<212> PRT

<213> Johnsonella ignava

<400> 126

Met Ile Phe Asn Glu Lys Lys Glu Ile Tyr Gly Val Asp Ile Lys Gly

1 5 10 15

Phe Tyr Val Lys Ile Ala Lys Lys Asn Pro Gly Ile His Cys Ile Thr

20 25 30

Asn Ile Val Ser Ala Asn Asp Cys Ala Asn Ile Leu Leu Ala Met Gly

35 40 45

Ala Ser Pro Val Met Ala Gln His Val Leu Asp Ala Gly Glu Ile Ser

50 55 60

Gly Gly Cys Asp Ala Leu Val Cys Asn Phe Gly Ala Thr Gly Ala Tyr

65 70 75 80

Asp Ala Met Tyr Glu Ala Ala Lys Ser Ala Ala Leu Leu Lys His Pro

85 90 95

Ile Val Ala Asp Pro Val Gly Val Gly Ala Ser Ala Tyr Arg Arg Ser

100 105 110

Cys Phe Leu Asp Phe Ile Ser Lys Phe Lys Val Ser Cys Ile Arg Gly

115 120 125

Asn Ile Ser Glu Ile Arg Ala Leu His Glu Lys Arg Pro Thr Ala Arg

130 135 140

Gly Val Asp Val Ser Glu Tyr Glu Leu Lys Asn Asn Ser Gly Asp Glu

145 150 155 160

Ser Val Leu Phe Lys Asn Ala Glu Trp Ile Arg Glu Phe Ser Leu Lys

165 170 175

Val Asn Cys Ile Val Val Cys Ser Gly Glu Thr Asp Ile Val Thr Asp

180 185 190

Gly Lys Asn Thr Val Phe Val Thr Asp Gly Cys Ile Leu Met Ser Arg

195 200 205

Val Ser Ala Thr Gly Cys Met Ala Ser Ala Val Thr Ala Ala Phe Leu

210 215 220

Ser Val Glu Asn Ser Phe Ile Ser Ala Ala Ala Ser Ile Ser Phe Met

225 230 235 240

Gly Arg Cys Gly Glu Tyr Ala Leu Lys His Leu Glu Arg Gly Thr Ser

245 250 255

Gly Ile Gly Ser Gly Ser Phe Arg Val Gly Leu Ile Asp Ala Ala Gly

260 265 270

Leu Ile Phe Asn Glu

275

<210> 127

<211> 834

<212> DNA

<213> Johnsonella ignava

<400> 127

atgatattta atgagaaaaa agaaatatat ggggttgata taaagggatt ttatgtaaaa 60

attgcgaaaa aaaatcccgg tatacattgt ataacaaata tagtcagtgc aaatgactgt 120

gctaatatac tgcttgctat gggggcatca cctgttatgg cacagcatgt acttgatgcg 180

ggagagataa gtggaggctg tgatgctctt gtatgtaatt tcggtgctac aggagcttat 240

gatgcgatgt atgaggctgc aaaaagtgca gccttactta agcatccaat agtggcagat 300

cccgtaggag tgggagcttc ggcttacaga agaagctgct ttcttgattt tataagtaaa 360

tttaaggttt catgtataag gggaaacata tcggaaatac gggcattgca tgaaaaacgt 420

ccgactgcaa ggggagttga tgtatctgaa tatgagctta aaaataattc aggtgatgag 480

tcagtacttt ttaaaaatgc cgaatggata agggaatttt cattaaaggt gaattgtatt 540

gtagtatgtt caggcgaaac tgatatagta actgacggga aaaataccgt ttttgtaact 600

gacggctgta ttcttatgtc aagagtaagt gctacgggct gtatggcatc tgcggttacg 660

gcggcttttt taagtgtgga aaatagtttt atttcagctg cggcatctat atcttttatg 720

ggaagatgcg gagaatatgc tcttaagcat ttagagagag ggacttcagg catagggagc 780

ggcagtttca gagtaggact gattgatgcg gcaggactta tatttaatga gtag 834

<210> 128

<211> 844

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 128

atgatcttca acgaaaagaa ggaaatctat ggtgttgata ttaagggctt ctatgttaaa 60

atcgccaaaa aaaatccggg cattcattgc attaccaata ttgttagtgc caatgattgc 120

gcaaatattc tgctggccat gggtgcaagc ccggtgatgg cccagcatgt tctggatgcc 180

ggtgaaatta gcggcggttg tgatgccctg gtgtgtaact tcggtgcaac cggtgcctat 240

gatgccatgt atgaagcagc aaaaagtgca gccctgctga aacatccgat tgtggccgat 300

ccggtgggtg tgggtgccag tgcatatcgt cgtagttgct tcctggactt cattagcaaa 360

ttcaaagtga gttgtatccg tggtaatatt agtgaaattc gtgcactgca tgaaaaacgt 420

ccgaccgcac gcggtgtgga tgttagcgaa tatgaactga aaaataacag cggcgatgaa 480

agcgtgctgt tcaaaaatgc cgaatggatt cgtgagttca gtctgaaagt gaattgtatt 540

gttgtgtgta gcggcgaaac cgatattgtg accgatggta aaaataccgt gttcgtgacc 600

gatggctgca ttctgatgag tcgcgttagt gccaccggtt gcatggccag cgccgtgacc 660

gccgcattcc tgagcgttga aaatagcttc attagtgccg ccgccagcat tagcttcatg 720

ggccgctgcg gtgaatatgc cctgaaacat ctggaacgtg gtaccagtgg tattggtagc 780

ggcagcttcc gcgtgggtct gattgatgcc gccggtctga tcttcaatga atgactgaaa 840

gctt 844

<210> 129

<211> 272

<212> PRT

<213> 节瘤偶蹄形菌（Dichelobacter nodosus）

<400> 129

Met Thr Glu Ser Leu Glu Met Gly Lys Ser Ile Asp Phe Asn Val Gln

1 5 10 15

Thr Phe Asp Phe Lys Ser Ala Gln Phe Tyr Leu Asp Arg Ala Tyr Ala

20 25 30

Asn Ala Pro Phe Ile His Cys Leu Thr Asn Asn Thr Thr Lys Phe Phe

35 40 45

Val Ala Asn Ala Leu Leu Ala Ile Gly Ala Lys Pro Ala Met Val Glu

50 55 60

Ser Trp Gln Glu Val Val Glu Phe Ser Gln Arg Ala Ala Asn Val Val

65 70 75 80

Met Asn Leu Asp Ser Leu Thr Asp Glu Arg Leu Arg Ser Leu Ser Met

85 90 95

Ser Ala Gln Val Ala His Asp His Gly Lys Trp Trp Val Phe Asp Pro

100 105 110

Ala Ala Val Ser Asp Ile Leu Ser Tyr Arg Ser Gly Phe Ala Arg Glu

115 120 125

Leu Leu Arg Tyr Tyr Pro Arg Val Ile Arg Gly Asn Ala Ser Glu Ile

130 135 140

Ser Tyr Leu Asn Asp Thr Tyr Gly Arg Arg Ser Phe Glu Asn Val Met

145 150 155 160

Ser Ser Ser Glu Ala Ile Glu Ala Ala Val Lys Leu Ala Ile His Gln

165 170 175

Arg Ala Val Val Val Val Thr Gly Glu Ile Asp Tyr Val Thr Asp Gly

180 185 190

Glu Thr Ile Leu Ala Val Arg Gly Gly His Pro Phe Leu Gly Arg Val

195 200 205

Cys Gly Thr Gly Cys Val Leu Ser Ala Met Ile Ala Ser Thr Val Leu

210 215 220

Cys Gly Asp Val Leu Tyr Gly Ala Ala Ser Ala Cys Ala Leu Met Lys

225 230 235 240

Arg Ala Gly Glu Arg Ala Gly Leu Thr Thr Ser Gly Leu Gly Ser Phe

245 250 255

Tyr Val Ala Leu Leu Asp Asn Leu Thr Phe Pro Met Arg Tyr Gln Asp

260 265 270

<210> 130

<211> 819

<212> DNA

<213> 节瘤偶蹄形菌（Dichelobacter nodosus）

<400> 130

atgacggaat cattggaaat gggtaaaagt attgatttta atgtgcaaac ttttgatttt 60

aaatcggcac aattttatct cgatcgggct tatgcaaatg cgccgtttat tcattgttta 120

acgaataata cgactaaatt ttttgtggca aatgcattgt tggcaattgg cgcgaaaccg 180

gcaatggtgg aatcgtggca ggaagtcgtt gaattttctc aacgtgcggc aaatgtggtg 240

atgaatttgg attcgttaac cgatgagcgg ttgcgttctt tatcgatgag tgcgcaagta 300

gcgcatgatc acggcaaatg gtgggttttt gatccggcag cggtcagcga tattttgtct 360

taccgcagcg gttttgcgcg cgaattattg cgttattatc cgcgggtgat tcgtggcaat 420

gcctcggaaa tttcttattt gaatgatacg tacggacgcc gtagttttga aaatgtgatg 480

agttcttcgg aagcaattga agcggcagtg aaattagcca ttcatcaacg tgcggttgtc 540

gtcgttacgg gagaaattga ttatgtgacc gacggcgaga cgattttagc agtgcgcggc 600

ggacaccctt ttttagggcg cgtttgcggc acgggttgcg ttttatcggc gatgattgcg 660

tcaacggtat tatgtggtga cgttttgtat ggcgcggctt ctgcgtgcgc tttgatgaaa 720

cgcgccggtg aacgggcggg tttaacgact tcgggattag gcagttttta tgttgcgtta 780

ttggataatt taacgtttcc aatgcgttat caagattaa 819

<210> 131

<211> 829

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 131

atgaccgaaa gcctggaaat gggcaaaagt attgacttca atgttcagac cttcgacttc 60

aaaagtgccc agttctatct ggatcgtgcc tatgcaaatg ccccgttcat tcattgtctg 120

accaataata ccaccaaatt cttcgtggca aatgcactgc tggcaattgg tgcaaaaccg 180

gcaatggtgg aaagctggca ggaagtggtt gagttcagcc agcgcgccgc caatgttgtt 240

atgaatctgg atagtctgac cgatgaacgt ctgcgtagtc tgagtatgag tgcacaggtg 300

gcacatgatc atggcaaatg gtgggtgttc gatccggccg cagtgagtga tattctgagc 360

tatcgtagtg gcttcgcccg cgaactgctg cgctattatc cgcgtgttat tcgtggtaat 420

gccagtgaaa ttagttatct gaatgatacc tacggtcgcc gcagcttcga aaatgtgatg 480

agcagcagtg aagccattga agcagccgtg aaactggcca ttcatcagcg tgccgtggtt 540

gttgtgaccg gcgaaattga ttatgtgacc gatggtgaaa ccattctggc cgtgcgtggt 600

ggtcatccgt tcctgggccg cgtgtgtggt accggctgcg tgctgagtgc aatgattgcc 660

agtaccgttc tgtgtggtga tgtgctgtat ggtgccgcaa gtgcctgcgc actgatgaaa 720

cgcgcaggcg aacgcgccgg tctgaccaca agcggtctgg gtagcttcta tgttgccctg 780

ctggataatc tgaccttccc gatgcgctat caggattgac tgaaagctt 829

<210> 132

<211> 284

<212> PRT

<213> 丁酸弧菌属（Butyrivibrio species）

<400> 132

Met Ser Glu Leu Ile His Cys Ile Thr Asn Pro Ile Ser Met Met Gln

1 5 10 15

Cys Ala Asn Ala Ile Leu Ala Leu Gly Ala Lys Pro Ile Met Ala Glu

20 25 30

His Pro Leu Glu Val Met Glu Ile Thr Glu Ser Ala Ser Ala Leu Val

35 40 45

Ile Asn Leu Gly Asn Ile Ser Asp Thr Arg Met Glu Ser Met Glu Ile

50 55 60

Ser Phe Glu Thr Ala Leu Lys Lys Asn Ile Pro Val Val Ile Asp Ala

65 70 75 80

Val Gly Val Ala Cys Ser Lys Leu Arg Arg Asp Phe Val Met Arg Leu

85 90 95

Leu Lys Met Arg Ser Lys Lys Thr Glu Leu Ser Leu Arg Glu Lys Gly

100 105 110

Ile Leu Leu Leu Lys Gly Asn Tyr Ser Glu Ile Lys Ala Ile Phe Asp

115 120 125

Glu Ser Tyr Arg Gly Val Gly Val Asp Ala Asp Glu Ser Leu Gly Ala

130 135 140

Ser Glu Ile Ala Asp Ile Val Arg Val Leu Ala Leu Asn Leu Gly Val

145 150 155 160

Ile Val Leu Ala Ser Gly Glu Lys Asp Ile Val Ser Asp Val Ser Arg

165 170 175

Thr Phe Phe Ile Ser Asn Gly Asn Pro Ile Met Gly Val Ile Thr Gly

180 185 190

Thr Gly Cys Met Leu Gly Ala Ile Cys Gly Val Phe Leu Ala Arg Asp

195 200 205

Ala Ser Ile Glu Ala Val Leu Arg Ala Ala Gly Phe Phe Gly Ile Ala

210 215 220

Gly Glu Ile Ala Tyr Glu Arg Ala Glu Ala Val Thr Glu Arg Leu Thr

225 230 235 240

Asn Gly Lys Ala Ser Glu Ser Met Val Gly Ser Gly Ser Phe Leu Val

245 250 255

Glu Leu Leu Asn Ala Ile Ser Met Ile Asp Glu Glu Thr Val Lys Ser

260 265 270

Leu Leu Arg Cys Ala Glu Glu Lys His Ser Ser Asn

275 280

<210> 133

<211> 855

<212> DNA

<213> 丁酸弧菌属（Butyrivibrio species）

<400> 133

atgtctgagc taattcactg tataacaaat ccaatatcta tgatgcaatg cgcaaatgca 60

attttagcac ttggcgcgaa gccgataatg gctgagcatc cgttggaagt catggagatc 120

actgagagcg cttctgctct tgtaattaat ctgggtaata tatcggacac cagaatggag 180

tcgatggaga tatcttttga aactgctctg aagaaaaata taccggttgt gatagatgcg 240

gtgggcgtag cctgctccaa gcttcgcagg gatttcgtga tgaggcttct aaagatgagg 300

tcgaagaaaa cggaattgtc tttgagggaa aaggggatcc ttttacttaa gggaaactac 360

tccgagatta aggcgatttt tgatgagtcc tacaggggag ttggcgtcga tgccgacgaa 420

agtctgggag cttcagagat agctgatatt gtaagagtgc tggctttgaa tctgggagtg 480

atcgtgctcg ccagcggtga gaaggatatc gtatcagatg taagtcgtac attttttata 540

agtaatggga atccgataat gggggtgatt acgggaacgg gatgcatgct aggggctata 600

tgcggcgtgt ttctggcaag ggatgcgagc atagaagctg tcctccgcgc agccggattt 660

ttcgggattg ctggagaaat tgcatatgag agagcggaag cagttacgga gaggcttaca 720

aatggcaaag catctgaaag catggttgga agcggaagtt ttcttgttga acttttaaat 780

gcaatttcaa tgatcgatga agaaactgta aaaagtttgc ttagatgcgc tgaagaaaaa 840

cattcatcta actga 855

<210> 134

<211> 865

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 134

atgagcgaac tgattcattg tattaccaat ccgattagta tgatgcagtg tgcaaatgca 60

attctggcac tgggcgcaaa accgattatg gcagaacatc cgctggaagt gatggaaatt 120

accgaaagcg caagtgcact ggtgattaat ctgggcaata ttagtgatac ccgcatggaa 180

agtatggaaa ttagcttcga aaccgccctg aaaaaaaata ttccggtggt tattgatgcc 240

gtgggcgtgg cctgctctaa actgcgtcgc gacttcgtta tgcgcctgct gaaaatgcgt 300

agcaaaaaaa ccgaactgag cctgcgcgaa aaaggcattc tgctgctgaa aggtaattat 360

agcgaaatta aagcaatctt cgacgaaagt tatcgtggtg ttggcgtgga tgcagatgaa 420

agcctgggtg caagcgaaat tgccgatatt gtgcgtgtgc tggcactgaa tctgggcgtg 480

attgtgctgg ccagtggtga aaaagatatt gtgagcgatg tgagtcgtac cttcttcatt 540

agcaatggta atccgattat gggtgttatt accggcaccg gctgtatgct gggcgcaatc 600

tgtggcgtgt tcctggcacg cgatgccagt attgaagccg ttctgcgcgc agcaggcttc 660

ttcggcattg ccggcgaaat tgcctatgaa cgtgcagaag ccgttaccga acgtctgacc 720

aatggcaaag ccagtgaaag catggtgggc agcggcagct tcctggtgga actgctgaat 780

gcaattagca tgattgatga agaaaccgtt aaaagtctgc tgcgttgtgc cgaagaaaaa 840

catagtagca attgactgaa agctt 865

<210> 135

<211> 260

<212> PRT

<213> Agrilactobacillus composti

<400> 135

Met Gln Leu Asp Leu Leu Asn Gln Leu Arg Ala Gln Val Pro Leu Val

1 5 10 15

Val Asn Tyr Ala Asn Tyr Val Thr Pro Asn Phe Val Ala Asn Gly Leu

20 25 30

Asn Ala Leu Gly Ala Ser Pro Ile Met Thr Ser Glu Val Asp Glu Ala

35 40 45

Asp Asp Leu Val Lys Ile Thr Asn Thr Val Val Ile Asn Leu Gly Thr

50 55 60

Ile Asn His Tyr Glu Thr Asp Leu Val Trp Gln Leu Cys Thr Ser Ala

65 70 75 80

Val Lys Tyr His Lys Pro Ile Val Leu Asp Pro Val Ala Val Gly Ala

85 90 95

Thr Ala Tyr Arg Leu Asp Ile Ala Gln Lys Leu Leu Gln Asp Phe Pro

100 105 110

Ile Ala Val Ile Arg Gly Asn Val Gly Glu Ile Ala Ala Leu Ala Gln

115 120 125

Val Asp Trp Ala Thr Lys Gly Ile Asp Ala Gly Thr Gly Asp Ala Asp

130 135 140

Pro Ala Ala Ile Ala Lys Ala Cys Ala Thr Arg Tyr His Asn Val Val

145 150 155 160

Ala Leu Ser Gly Ile Thr Asp Tyr Ile Thr Asp Gly Gln Gln Leu Phe

165 170 175

Lys Val Gly Asn Gln Thr Pro Leu Leu Pro Leu Thr Val Gly Ser Gly

180 185 190

Asp Leu Leu Ser Ser Ile Ile Gly Ala Phe Val Gly Ile Thr Asp Asn

195 200 205

Tyr Tyr Glu Ala Ala Gln Val Gly Cys Ala Val Leu Ala Cys Thr Gly

210 215 220

Glu Ile Ala Ala Gln Pro Leu His Ser His Glu Gly Gly Thr Phe Ala

225 230 235 240

Ala Arg Leu Leu Asp Lys Leu Thr Ile Val Asp Lys Glu Asp Ile Leu

245 250 255

Glu Ile Leu Lys

260

<210> 136

<211> 783

<212> DNA

<213> Agrilactobacillus composti

<400> 136

atgcaattag atttattgaa tcagctccgt gcccaagtcc cactggtggt caactacgcc 60

aattatgtca cccccaactt tgtggctaac ggtttgaacg ccttgggggc ctcgcccatt 120

atgacgtccg aagtcgatga agccgatgac ttggttaaaa tcaccaatac agttgtcatc 180

aacttgggga ccatcaacca ttatgaaacg gacttagttt ggcagctttg caccagtgcc 240

gtgaaatatc acaagcccat cgtgttagat cccgttgccg tgggggcaac ggcctatcgt 300

ttagatatcg cccaaaaatt actgcaagat ttcccgattg ccgttatccg gggcaatgtg 360

ggtgaaattg cggctttagc ccaggtggat tgggccacta aaggtattga cgctgggacc 420

ggggatgcgg atccggccgc tattgccaag gcttgtgcca cccgttatca caatgtggtg 480

gccttaagtg gtattaccga ttacatcacg gatggccagc agcttttcaa agtgggcaac 540

caaaccccac tgctcccctt gaccgtgggt tctggggact tattatccag catcatcggg 600

gcttttgtgg gcattactga caattactac gaagctgccc aggtgggctg tgctgtacta 660

gcttgtaccg gtgaaattgc cgcccaaccg ctacattccc acgagggtgg tacctttgcc 720

gcccgattat tggacaaatt gaccatcgtt gacaaagaag atattctcga aattttgaaa 780

tag 783

<210> 137

<211> 793

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 137

atgcagctgg atctgctgaa tcagctgcgt gcacaggttc cgctggtggt taattatgcc 60

aattatgtga ccccgaactt cgttgcaaat ggcctgaatg ccctgggtgc aagcccgatt 120

atgaccagtg aagtggatga agcagatgat ctggtgaaaa ttaccaatac cgttgttatt 180

aacctgggca ccattaatca ttatgaaacc gatctggtgt ggcagctgtg taccagtgca 240

gttaaatatc ataaaccgat tgtgctggac cctgttgccg tgggcgccac cgcatatcgt 300

ctggatattg cacagaaact gctgcaagac ttcccgattg ccgtgattcg tggcaatgtt 360

ggcgaaattg cagcactggc acaggtggat tgggccacca aaggtattga tgccggcacc 420

ggtgatgcag atccggcagc aattgcaaaa gcatgcgcaa cccgttatca taatgttgtt 480

gcactgagtg gtattaccga ttatattacc gatggtcagc agctgttcaa agttggcaat 540

cagaccccgc tgctgccgct gaccgttggc agcggtgatc tgctgagtag cattattggt 600

gccttcgtgg gcattaccga taattattat gaagcagcac aggttggctg tgcagttctg 660

gcctgcaccg gcgaaattgc ggcccagccg ctgcatagtc atgaaggtgg taccttcgca 720

gcccgcctgc tggataaact gaccattgtt gataaagaag atatcctgga aatcctgaaa 780

tgactgaaag ctt 793

<210> 138

<211> 276

<212> PRT

<213> 瘤胃解蛋白质菌（Proteiniclasticum ruminis）

<400> 138

Met Asn Leu Arg Asn His Val Glu Lys Leu Tyr Ala Gln Lys Phe Glu

1 5 10 15

Glu Lys Tyr Pro Leu Val Cys Phe Leu Thr Asn Tyr Val Thr Val Leu

20 25 30

Asp Leu Val Asp Met Cys Ile His Ser Gly Gly Ser Pro Val Leu Thr

35 40 45

Asp Glu Ile Ser Glu Ala His Glu Met Val Glu Tyr Ser Lys Ser Gln

50 55 60

Ala Val Val Met Asn Phe Gly Thr Ile Asn Arg Glu Tyr Leu Asp Ile

65 70 75 80

Met Thr Leu Thr Gly Lys Thr Ala Asn Arg Val His Val Pro Val Ile

85 90 95

Leu Asp Pro Ala Ala Ile Thr Ala Ser Ser Phe Arg Lys Tyr Ala Ile

100 105 110

Glu His Leu Leu Lys Glu Val Lys Val Asp Ile Leu Lys Gly Asn Leu

115 120 125

Gly Glu Ile Lys Phe Ile Leu Gly Tyr Glu Thr Lys Asn Lys Gly Ile

130 135 140

Asp Ser Phe Glu Asp Glu Asn Gly Ala Glu Lys Tyr Cys Ile Glu Leu

145 150 155 160

Ala Glu Lys Leu Gly Ala Val Val Val Met Thr Gly Lys Thr Asp Ile

165 170 175

Ile Thr Asp Gly Lys Arg Met Ala Lys Val Ser Asn Gly Asp Ala Lys

180 185 190

Leu Lys Lys Ile Cys Gly Ala Gly Ser Ser Val Ala Ala Ile Met Ala

195 200 205

Thr Tyr Ser Gly Leu Thr Lys Asp Tyr Phe Leu Ser Ala Thr Val Gly

210 215 220

Cys Ala Val Met Gly Val Ala Ser Glu Met Ala Glu Glu Arg Met Lys

225 230 235 240

Glu Arg Glu Gly Ile Arg Thr Phe Lys Thr Tyr Val His Asp Ala Val

245 250 255

Ser Met Met Glu Thr Lys Glu Leu Met Asn Arg Leu Asn Leu Val Glu

260 265 270

Val Glu Leu Asp

275

<210> 139

<211> 831

<212> DNA

<213> 瘤胃解蛋白质菌（Proteiniclasticum ruminis）

<400> 139

atgaatctga gaaatcatgt agagaagctc tacgcacaga aattcgagga gaaatatcct 60

ctggtctgct ttctgaccaa ttatgtgacc gtactggatt tggtggatat gtgcattcat 120

tccggaggtt caccggtgct gacggatgaa atctcggaag ctcatgaaat ggtggagtat 180

tccaagtccc aagcggtggt catgaacttt ggcaccatca acagggagta tctggacatt 240

atgacgttga caggaaaaac tgccaataga gttcatgtgc ctgtaattct ggatcctgca 300

gccatcaccg cttcttcttt cagaaagtat gccattgagc atcttctgaa agaggtgaag 360

gtggatattc tcaaagggaa ccttggtgaa atcaagttta ttttaggata tgaaacaaaa 420

aacaagggca tcgactcttt tgaggatgaa aatggagccg agaagtactg catcgagctt 480

gcagaaaagc tgggcgcggt ggtggtgatg acagggaaaa cagatatcat caccgatgga 540

aagagaatgg ccaaagtatc caatggagat gccaaactga agaaaatctg cggagctgga 600

tcttctgtgg ctgccatcat ggcgacctat tcaggtctca caaaggacta cttcttaagt 660

gctactgttg ggtgcgctgt catgggcgta gcctctgaga tggcagaaga aagaatgaag 720

gaaagagaag gcatccgcac gttcaagacc tatgtacatg atgcggtttc tatgatggaa 780

acgaaggagc tcatgaacag gctgaacctt gtggaagttg agttagatta g 831

<210> 140

<211> 841

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 140

atgaacctgc gtaatcatgt tgaaaaactg tatgcacaga aattcgaaga aaaatatccg 60

ctggtgtgct tcctgaccaa ttatgtgacc gtgctggatc tggtggatat gtgtattcat 120

agcggcggta gtccggtgct gaccgatgaa attagcgaag cccatgaaat ggttgaatat 180

agcaaaagcc aggcagtggt gatgaacttc ggtaccatta atcgtgaata tctggatatt 240

atgaccctga ccggtaaaac cgccaatcgt gttcatgttc cggtgattct ggaccctgcc 300

gccattaccg ccagcagctt ccgtaaatat gcaattgaac atctgctgaa agaagtgaaa 360

gttgatattc tgaaaggcaa tctgggcgaa attaaattca ttctgggtta tgaaaccaag 420

aataaaggca ttgatagctt cgaagatgaa aatggcgccg aaaaatattg cattgaactg 480

gccgaaaaac tgggtgcagt ggtggttatg accggcaaaa ccgatattat taccgatggt 540

aaacgtatgg caaaagttag caatggtgat gcaaaactga aaaaaatctg tggcgcaggt 600

agtagcgtgg ccgcaattat ggcaacctat agcggtctga ccaaagatta cttcctgagc 660

gccaccgtgg gctgcgcagt tatgggcgtg gcaagcgaaa tggccgaaga acgtatgaaa 720

gaacgcgaag gcattcgtac cttcaaaacc tatgtgcatg atgcagttag catgatggaa 780

accaaagaac tgatgaatcg cctgaatctg gtggaagtgg aactggattg actgaaagct 840

t 841

<210> 141

<211> 277

<212> PRT

<213> Oxobacter pfennigii

<400> 141

Met Gly Asn Lys Val Leu Ile Asp Ile Leu Lys Cys Tyr Asn Glu Arg

1 5 10 15

Glu Asn Lys Thr Pro Leu Val His Phe Ile Thr Asn Phe Val Thr Met

20 25 30

Asn Asp Val Ala Asn Ala Cys Leu Tyr Met Gly Gly Lys Pro Val Met

35 40 45

Ala His Trp Glu Gln Glu Ile Asn Glu Ile Thr Ser Ala Ala His Ser

50 55 60

Leu Val Leu Asn Leu Gly Thr Pro Asp Glu Ala Arg Ile Asp Ala Ile

65 70 75 80

Lys Lys Ala Ala Arg Ile Ala Glu Ala Lys Asp Ile Pro Val Ile Leu

85 90 95

Asp Pro Val Gly Ile His Val Phe Ser Val Arg Leu Asp Leu Ala Arg

100 105 110

Tyr Leu Leu Glu Asn Arg Gln Val Asn Val Leu Lys Gly Asn Tyr Ser

115 120 125

Glu Val Met Ala Phe Leu Asn Met Lys Ser Asn Phe Ile Gly Ile Asp

130 135 140

Ser Leu Glu Glu Gly Phe Lys Arg Asp Val Ile Glu Lys Ile Lys Glu

145 150 155 160

Phe Ser Glu Ile Asn Lys Leu Tyr Ile Val Ile Thr Gly Lys Glu Asp

165 170 175

Tyr Val Phe Tyr Lys Asp Asn Ala Val Arg Ile Thr Asn Gly Thr Pro

180 185 190

Leu Leu Ser Lys Ile Thr Gly Ser Gly Cys Ile Leu Ser Ala Ile Leu

195 200 205

Gly Thr Leu Cys Ala Lys Gly Asn Lys Lys Asp Ile Phe Ser Leu Cys

210 215 220

Val Met Gly Thr Leu Ile Asn Ser Ile Ala Gly Glu Lys Ala Gln Asp

225 230 235 240

Lys Ile Lys Lys Ser His Glu Gly Phe His Thr Phe Lys Asn Tyr Tyr

245 250 255

Leu Asp Glu Leu Ser Leu Val Asn Asp Asp Asp Ile Leu Ser Arg Gly

260 265 270

Arg Val Phe Tyr Val

275

<210> 142

<211> 834

<212> DNA

<213> Oxobacter pfennigii

<400> 142

atggggaata aggttctgat tgatatttta aaatgctata atgaaagaga aaacaaaact 60

cccctggttc attttataac taattttgta accatgaatg atgtcgccaa tgcctgcctg 120

tatatggggg gaaagcccgt aatggcacac tgggagcagg agattaatga aataacttca 180

gctgctcatt ctctggtttt aaatttaggc acacctgatg aagcaaggat tgatgctatt 240

aaaaaagcag ccaggattgc agaggctaag gatattcctg taattttaga ccctgtagga 300

atacacgttt tttctgtaag attggacctt gcaagatatc ttttggagaa caggcaagtg 360

aatgtattaa agggaaacta ttcggaagtt atggcttttt taaatatgaa aagcaatttt 420

ataggcatag attcccttga agaaggcttt aaaagagatg tcattgaaaa aataaaagag 480

ttctcagaga ttaataaatt gtatatagtt attaccggta aagaagatta tgttttttat 540

aaggacaacg ctgtaagaat aactaacggc actccccttc tttccaaaat aacaggttcc 600

ggctgtattt taagcgccat cctcggcacc ctttgtgcaa aaggcaataa aaaagatatt 660

ttttcattat gtgttatggg cactcttatt aactccatag ccggtgaaaa agcgcaggat 720

aaaattaaaa aatcacatga gggatttcat acctttaaaa attattactt ggatgagctc 780

tctcttgtga atgatgatga tattttaagc agagggagag ttttttatgt ctag 834

<210> 143

<211> 844

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 143

atgggtaata aggttctgat tgatatcctg aaatgttata acgaacgtga aaataagacc 60

ccgctggttc acttcattac caacttcgtt accatgaatg atgtggccaa tgcatgtctg 120

tatatgggcg gtaaaccggt tatggcccat tgggaacagg aaattaatga aattaccagc 180

gcagcacata gcctggttct gaatctgggt accccggatg aagcacgtat tgatgcaatt 240

aaaaaagcag cccgtattgc cgaagccaaa gatattccgg tgattctgga ccctgtgggt 300

attcatgtgt tcagcgtgcg cctggatctg gcccgttatc tgctggaaaa tcgtcaggtg 360

aatgttctga aaggtaatta tagcgaagtg atggcattcc tgaatatgaa aagcaacttc 420

attggtattg acagtctgga agaaggcttc aaacgtgatg ttattgaaaa aattaaggag 480

ttcagcgaaa tcaataagct gtatattgtt atcaccggca aagaagatta tgtgttctat 540

aaagataacg cagttcgtat taccaatggc accccgctgc tgagcaaaat taccggcagc 600

ggttgtattc tgagtgcaat tctgggcacc ctgtgtgcaa aaggtaataa aaaagatatc 660

ttcagcctgt gtgttatggg caccctgatt aatagcattg ccggcgaaaa agcacaggat 720

aaaattaaaa aaagccacga aggcttccat accttcaaaa attattatct ggacgaactg 780

agcctggtta atgatgatga tattctgagc cgcggtcgtg tgttctatgt ttgactgaaa 840

gctt 844

<210> 144

<211> 270

<212> PRT

<213> 游动微菌属（Planomicrobium species）

<400> 144

Met Ile Ser Lys Ile Arg Ser Glu Asn Pro Ile Ile His Cys Ile Thr

1 5 10 15

Asn His Val Val Ser Asn Phe Gln Ala Asn Gly Leu Leu Ala Ile Gly

20 25 30

Ala Ser Pro Ile Met Gly Glu Ala Gln Glu Glu Val Glu Glu Leu Val

35 40 45

Ala Ile Ser Arg Ala Leu Ser Leu Asn Ile Gly Thr Leu Asn Lys Glu

50 55 60

Thr Leu His Ser Met Leu Leu Ala Gly Lys Arg Ala Asn Lys Glu Lys

65 70 75 80

Ile Pro Val Ile Leu Asp Pro Val Gly Ala Gly Ala Thr Ala Phe Arg

85 90 95

Lys Asp Ala Ile Gln Lys Ile Leu Thr Asp Ile Asp Val Ser Val Leu

100 105 110

Arg Cys Asn Ala Gly Glu Leu Ala Ala Ile Gly Gly Val Arg Trp Ala

115 120 125

Ser Lys Gly Val Asp Ala Gly Glu Gly Asn Val Asp Leu Glu Glu Leu

130 135 140

Ala Thr Arg Val Ala Ile Glu Tyr Ser Leu Val Val Ala Val Thr Gly

145 150 155 160

Glu Thr Asp Ile Val Ala Asp Gly Ser Arg Val Glu Lys Ile Thr Gly

165 170 175

Gly Asp Arg Met Met Ser Ser Val Thr Gly Met Gly Cys Leu Leu Ser

180 185 190

Ala Val Thr Ala Ala Phe Met Ala Val Ser Pro Asp Asn Pro Thr Ala

195 200 205

Ala Ala Ile Glu Ala Leu Lys Phe Tyr Gly Thr Ala Gly Glu Lys Ala

210 215 220

Ala Ala Val Ser Glu Gly Pro Gly Ser Phe Arg Asp Thr Phe Leu Asp

225 230 235 240

Val Leu Phe Gly Met Glu Ile Glu Glu Thr Gly Phe Asp Phe Glu Lys

245 250 255

Gly Glu Gly Val Asp Val Leu Trp Gln Arg Ser Ser Arg Tyr

260 265 270

<210> 145

<211> 813

<212> DNA

<213> 游动微菌属（Planomicrobium species）

<400> 145

atgatcagta aaatccgcag tgaaaatcca atcatccatt gcatcaccaa tcacgtcgtg 60

tcgaattttc aagcgaacgg gctgctggca atcggtgctt cgcccatcat gggcgaagca 120

caagaagaag tggaagaact ggtcgccatt tcgcgcgcct tgtcattgaa tatcggaacg 180

ttgaataaag aaacgcttca tagcatgctg ctcgccggta aacgggcgaa taaggaaaaa 240

attccggtga tcctggatcc agtgggagca ggcgcgaccg cttttcggaa agatgccata 300

cagaagattt taacggatat cgatgtcagt gtgctgcgct gcaacgcggg tgaactggcg 360

gcaatcggcg gagtgagatg ggcctctaaa ggcgtcgatg ccggtgaagg caatgtcgac 420

ttggaggaac tggcaactcg agtagcaata gaatacagct tggtggtggc agtgacaggc 480

gagaccgata tcgtggccga cggttcgcgg gtggaaaaga ttacgggcgg cgaccggatg 540

atgagttcag tgaccggcat gggctgtctg ctcagcgctg tgacagccgc tttcatggca 600

gtaagtccgg acaatccaac agctgcggca atcgaagctc tcaaatttta cgggacggcc 660

ggtgaaaagg cagcggcagt ttcagaagga cccggcagtt tccgcgacac attcctggat 720

gttttattcg gcatggagat cgaggaaacc ggcttcgact ttgaaaaagg ggaaggggtg 780

gatgtactgt ggcagcgatc aagcaggtat tga 813

<210> 146

<211> 823

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 146

atgatcagca aaatccgcag cgaaaatccg attattcatt gtattaccaa ccatgtggtt 60

agcaacttcc aggccaatgg tctgctggcc attggtgcca gcccgattat gggcgaagcc 120

caggaagaag tggaagaact ggtggccatt agccgcgccc tgagcctgaa tattggcacc 180

ctgaataaag aaaccttaca tagtatgctg ctggccggta aacgcgcaaa taaagaaaaa 240

attccggtga ttctggaccc tgtgggtgca ggcgcaaccg cattccgcaa agatgccatt 300

cagaaaattc tgaccgatat tgatgttagc gtgctgcgct gtaatgccgg tgaactggcc 360

gcaattggtg gcgttcgttg ggcaagtaaa ggtgttgatg caggcgaagg taatgttgat 420

ctggaagaac tggccacccg cgttgcaatt gaatatagtc tggttgtggc cgttaccggc 480

gaaaccgata ttgttgcaga tggcagccgt gtggaaaaaa ttaccggcgg tgatcgcatg 540

atgagtagtg ttaccggcat gggctgcctg ctgagtgcag ttaccgccgc attcatggcc 600

gtgagtccgg ataatccgac cgccgcagca attgaagccc tgaaattcta tggtaccgcc 660

ggtgaaaaag ccgccgcagt gagcgaaggc ccgggcagct tccgtgatac cttcctggat 720

gtgctgttcg gcatggaaat tgaagaaacc ggcttcgact tcgaaaaagg cgaaggtgtg 780

gatgtgctgt ggcagcgcag cagccgttat tgactgaaag ctt 823

<210> 147

<211> 259

<212> PRT

<213> 毛螺科菌（Lachnospiraceae bacterium）

<400> 147

Met Gln Glu Glu Leu Ile Glu Gln Ile Arg Val Asn Arg Pro Leu Val

1 5 10 15

His Cys Ile Thr Asn Gln Val Thr Val Asn Tyr Val Val Asn Met Leu

20 25 30

Leu Gly Leu Gly Ala Arg Ala Glu Gly Thr Asp Ala Pro Glu Glu Ala

35 40 45

Ala Glu Ile Ala Gly Arg Ser Gln Ala Leu Met Leu Asn Val Gly Ala

50 55 60

Pro Thr Glu Ser Leu Ala Asn Ser Met Ile Glu Ala Gly Arg Arg Ala

65 70 75 80

Asn Glu Met Gly Val Pro Val Val Leu Asp Pro Asp Gly Val Gly Lys

85 90 95

Ser Ser Phe Arg Leu Glu Ile Val Asn Glu Ile Leu Asn Ser Val Tyr

100 105 110

Val Thr Cys Ile Arg Gly Thr Ala Thr Asp Leu Ala Ala Leu Asn Gly

115 120 125

Trp Glu Leu Glu Glu Asn Ala Thr Leu Ser Leu Asp Asp Leu Gln Ile

130 135 140

Ile Ala Asp Lys Tyr Asn Val Cys Val Val Met Thr Gly Gln Glu Asp

145 150 155 160

Leu Val Val Tyr His Ala Ser Gln Ala Arg Ile Ser Asn Asn Ile Pro

165 170 175

Phe Met Lys Arg Val Ala Gly Ser Gly Ala Ala Leu Thr Ala Val Ile

180 185 190

Ala Ala Phe Leu Ala Val Gly Gly Val Glu Asn Ile Phe Asp Ser Val

195 200 205

Val Thr Ala Val Ala Ala Phe Asp Val Ala Gly Gln Lys Ser Glu Ala

210 215 220

Lys Asn Ala Tyr Val Gly Thr Ala Ser Phe Ala Glu Gly Val Ile Asp

225 230 235 240

Ser Leu Ser Ile Leu Gln Ala Ser Glu Leu Arg Thr Glu Ala Lys Ile

245 250 255

Glu Glu Arg

<210> 148

<211> 780

<212> DNA

<213> 毛螺科菌（Lachnospiraceae bacterium）

<400> 148

atgcaggaag aacttattga gcaaattcgc gtaaatagac cacttgtaca ttgtattaca 60

aatcaggtta cagttaacta tgttgtgaac atgcttctcg ggcttggcgc tcgtgctgaa 120

ggtacagacg caccggaaga agctgctgag atcgcaggca gaagccaggc tcttatgctt 180

aatgtaggtg cacccacaga gtcgcttgca aattctatga tagaagcagg acgacgcgca 240

aatgaaatgg gtgttccggt tgtactcgat cctgatggag taggaaagtc aagcttcaga 300

cttgagattg taaacgagat acttaacagt gtatatgtta catgcatacg tggtacagcg 360

actgatcttg ctgcattaaa cggctgggaa cttgaagaaa atgcaacact ttccttggat 420

gatcttcaga ttattgccga taaatataat gtatgtgtgg tcatgacagg tcaggaagat 480

ctggttgttt accatgctag tcaggcacgt ataagcaata atataccttt tatgaagaga 540

gttgccggaa gcggcgcagc actcacagcg gtcatcgctg cattcctggc tgttggcgga 600

gttgagaata tatttgattc tgtcgttaca gctgttgcag catttgatgt tgctggacag 660

aagtcagaag caaagaacgc ttacgtcggt acagcatcat ttgctgaggg cgttattgat 720

agtctgagca ttcttcaggc ctctgaactt agaacagaag caaagataga ggaacgttaa 780

<210> 149

<211> 790

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 149

atgcaggaag aactgattga acagattcgt gtgaatcgtc cgctggttca ttgtattacc 60

aatcaggtta ccgtgaatta tgtggtgaat atgctgctgg gcctgggtgc ccgcgcagaa 120

ggtaccgatg caccggaaga agccgccgaa attgccggtc gtagccaggc actgatgctg 180

aatgttggtg ccccgaccga aagcctggca aatagcatga ttgaagcagg ccgccgcgcc 240

aatgaaatgg gtgttccggt ggtgctggac cctgatggcg tgggcaaaag cagcttccgc 300

ctggaaattg tgaatgaaat tctgaatagt gtgtacgtga cctgtattcg tggcaccgcc 360

accgatctgg cagcactgaa tggttgggaa ctggaagaaa atgcaaccct gagcctggat 420

gatctgcaaa ttattgccga taaatataac gtgtgcgtgg tgatgaccgg ccaggaagac 480

ttagtggtgt atcatgccag ccaggcccgt attagcaata atattccgtt catgaaacgc 540

gttgcaggta gtggtgcagc cctgaccgcc gttattgcag ccttcctggc agtgggcggt 600

gtggaaaata tcttcgatag cgtggtgacc gcagttgcag cattcgatgt ggccggtcag 660

aaaagtgaag caaaaaatgc ctatgtgggc accgcatcat tcgccgaagg tgtgattgat 720

agcctgagca ttctgcaagc cagcgaactg cgtaccgaag caaaaattga agaacgttga 780

ctgaaagctt 790

<210> 150

<211> 283

<212> PRT

<213> Globicatella sulfidifaciens

<400> 150

Met His Glu Gln Met Thr Phe Tyr Leu Asn Gln Ile Val Glu Gln Asn

1 5 10 15

Pro Leu Ile Asn Cys Leu Thr Asn Lys Val Thr Thr Asn Phe Gln Ala

20 25 30

Asn Ala Leu Leu Ala Ile Gly Ala Ser Pro Ile Met Thr Asp Glu Pro

35 40 45

Asp Ala Ser Pro Leu Val Ser Ala Gln Ser Gln Ala Ile Val Ile Asn

50 55 60

Ile Gly Ser Pro Phe Asn Gln Asp Lys Met Glu Ala Ile Glu Leu Ser

65 70 75 80

Ile Lys Ala Ala Ile Asp Lys Gln Ile Pro Val Ile Ile Asp Pro Val

85 90 95

Gly Val Ala Ala Leu Ser Asn Arg Leu Ala Tyr Ile Glu His Leu Leu

100 105 110

Ser Glu Tyr Glu Ile Ala Ala Val Cys Gly Asn Tyr Ser Glu Ile Ala

115 120 125

Ala Leu Ala Gly Ala Lys Ser Asn Gly Lys Gly Val Asp Gly Gly His

130 135 140

Pro Glu Gly Glu Met Thr Asp His Leu Leu Lys Val Ala Asn Leu Tyr

145 150 155 160

Gln Thr Val Val Val Ala Thr Gly Lys Thr Asp Tyr Ile Ala Asn Gln

165 170 175

Thr Ala Val Tyr Ala His Gln Tyr Gly Asp Ala Leu Leu Gly Tyr Val

180 185 190

Thr Gly Thr Gly Cys Val Ala Thr Thr Ile Val Ala Ala Phe Ile Ser

195 200 205

Gln Ala Pro Thr Pro Ala Asp Tyr Leu Thr Ala Ala Thr Leu Ala Thr

210 215 220

Gly Phe Tyr Ala Trp Cys Gly Gly Arg Ala Val Gln Leu Thr Thr Gly

225 230 235 240

Pro Gly Asp Leu Pro Ile His Leu Leu Asn Gln Leu Tyr Glu His Ser

245 250 255

Val Lys Ala Asn Asn Lys Lys Thr Ser Asp Lys Glu Leu Thr Asn Leu

260 265 270

Thr Ile Thr Gln Glu Arg Met Ser Ser Asn Asp

275 280

<210> 151

<211> 852

<212> DNA

<213> Globicatella sulfidifaciens

<400> 151

atgcatgagc aaatgacgtt ttatctcaat caaatcgtcg aacaaaaccc tttaatcaat 60

tgtttaacta ataaagtgac caccaatttc caggccaatg ccctattagc cattggtgct 120

tcaccgatta tgaccgatga accggatgct agtcctttag tatcggcaca atctcaagcg 180

attgtcatta atatcggttc cccatttaat caagataaaa tggaggcgat tgagctttcc 240

ataaaagcgg ccattgacaa acaaattccg gtcatcatcg atccggtcgg agtagcggca 300

ctttccaatc gtcttgctta tattgaacat ttactaagcg aatacgagat cgcggctgtt 360

tgcggtaatt attccgaaat tgctgcctta gctggagcga aaagtaatgg taaaggtgtg 420

gatggtggtc atcctgaagg tgaaatgacc gatcatttac taaaagtagc caacctttat 480

caaacagtgg tggtggccac tggcaaaact gattatatcg ctaatcaaac tgctgtctat 540

gcccatcaat atggcgacgc tttactcggt tatgtgaccg gcaccggctg tgtcgcgacg 600

accatcgtcg ctgcttttat cagtcaagcg cctacgccag ctgactattt aacggctgcc 660

actttagcga ccggatttta tgcttggtgt ggaggccggg cagttcaatt gactaccgga 720

cctggtgatt taccaattca tttattaaac caattatatg aacactcagt caaagcaaat 780

aataaaaaaa catctgataa agaattaaca aacttaacaa ttacacaaga aaggatgtca 840

agcaatgact aa 852

<210> 152

<211> 862

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 152

atgcatgaac agatgacctt ctatctgaat cagattgtgg aacagaatcc gctgattaat 60

tgcctgacca ataaagttac caccaacttc caggccaatg ccctgctggc aattggtgcc 120

agcccgatta tgaccgatga accggatgcc agtccgctgg tgagtgccca gagtcaggcc 180

attgttatta atattggcag tccgttcaat caggataaaa tggaagcaat tgaactgagt 240

attaaggcag ccattgataa acagattccg gtgattattg atccggtggg tgtggcagca 300

ctgagtaatc gtctggcata tattgaacat ctgctgagcg aatatgaaat tgcagcagtg 360

tgcggcaatt atagcgaaat tgccgccctg gcaggtgcca aaagtaatgg taaaggtgtt 420

gatggtggcc atccggaagg cgaaatgacc gatcatctgc tgaaagtggc aaatctgtat 480

cagaccgttg tggttgcaac cggcaaaacc gattatattg caaatcagac cgcagtgtat 540

gcccatcagt atggcgatgc cctgctgggc tatgttaccg gtaccggttg cgtggccacc 600

accattgttg cagcattcat tagtcaggcc ccgaccccgg ccgattatct gaccgccgca 660

accctggcca ccggcttcta tgcctggtgc ggcggccgtg cagttcagct gaccaccggt 720

ccgggcgatc tgccgattca tctgctgaat cagctgtatg aacatagcgt taaagcaaat 780

aataagaaga ccagtgataa ggaactgacc aatctgacca ttacccagga acgtatgagc 840

agtaatgatt gactgaaagc tt 862

<210> 153

<211> 279

<212> PRT

<213> 脲气球菌(Aerococcus urinae）

<400> 153

Met Ser Lys Lys Thr Ser Ile Pro Phe Ala Lys Tyr Ser Gln Gln Val

1 5 10 15

Lys Ala Lys Ala Pro Leu Ile Gln Val Leu Asn Asn Tyr Val Thr Ile

20 25 30

His Asp Val Ala Asn Val Ile Leu Ala Ser Gly Gly Arg Pro Val Met

35 40 45

Thr Asp Lys Leu Pro Asn Ser Gln Asp Val Val Lys Ser Ala Asp Leu

50 55 60

Leu Leu Leu Asn Ala Ala Ser Pro Arg Pro Asn Gln Glu Leu Leu Asp

65 70 75 80

Leu Ala Thr Thr Ala Lys Asn Asp His His Pro Val Val Leu Asp Pro

85 90 95

Val Gly Val Ser Ala Met Pro Ser Lys Leu Lys Leu Cys Gln Asp Leu

100 105 110

Ile Asp Arg Gly Leu Val Thr Ala Val Lys Gly Asn Ala Ser Glu Ile

115 120 125

Arg Ser Leu Leu Phe Glu Lys Ser Gln Gly Ser Gly Val Asp Leu Gly

130 135 140

Pro Gly Asp Glu Val Thr Leu Ala Asn Leu Ala Asp Phe Ala Pro Asp

145 150 155 160

Phe Lys Ala Tyr Ala Gln Glu Lys Glu Ile Ile Leu Ala Met Ser Gly

165 170 175

Pro Ile Asp Leu Val Thr Asp Gly Glu Arg Leu Ala Ile Ile Lys Asn

180 185 190

Gly His Pro Trp Met Ala Ser Tyr Thr Gly Ser Gly Cys Gln Leu Ser

195 200 205

Gly Val Leu Ala Ser Phe Leu Ala Gly Asn Pro Asp Glu Asp Pro Phe

210 215 220

Tyr Leu Ala Thr Ala Ala Met Ile Ser Tyr Gly Val Ala Gly Glu Ile

225 230 235 240

Ala Ala Gln Val Leu Gln Pro Tyr Glu Gly Asn Ala Thr Tyr Ser Asn

245 250 255

Arg Val Ile Asp Gln Val Ser Leu Leu Glu Ala Lys Glu Leu Glu Arg

260 265 270

Arg Ala Lys Tyr Asp Ile Gln

275

<210> 154

<211> 840

<212> DNA

<213> 脲气球菌(Aerococcus urinae）

<400> 154

atgtctaaaa aaacaagcat tccctttgcg aaatatagtc agcaggtcaa ggccaaggcc 60

ccgctgatcc aagtcttaaa taattatgtc accatccatg atgtggccaa tgtgattttg 120

gccagtggcg ggcgtcccgt gatgaccgat aaattaccta atagccagga tgtggtcaag 180

tcggctgacc ttttgctcct aaatgctgct agccccagac ctaatcagga attgttggac 240

ctcgccacca cagcaaaaaa tgaccaccat cccgtggtct tagacccagt gggggtttca 300

gctatgccgt ctaaattaaa gctctgtcag gatctgattg accggggtct agtgacggcg 360

gtgaagggga atgcttcgga aattcgtagc ctcctctttg aaaaaagcca aggatctggg 420

gtcgacctgg gtcctggaga cgaggtgacc ttagctaatt tggctgattt tgctccggac 480

tttaaagctt atgcccaaga aaaagagatt atcctagcca tgtcaggtcc gattgactta 540

gtgactgacg gcgaacggct ggcaatcatt aaaaatggtc acccctggat ggcctcctat 600

acgggatcag gttgccagtt aagcggcgtc ctagctagct ttttagccgg taatccggat 660

gaggatcctt tttacctagc tacagcagcc atgattagct atggggtggc gggagaaatc 720

gctgctcaag tgctccagcc ctatgagggt aatgccactt attccaaccg ggtgattgac 780

caggtctcct tattagaggc caaagaatta gaaaggagag ccaagtatga cattcaataa 840

<210> 155

<211> 850

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 155

atgagtaaga agaccagcat tccgttcgcc aaatatagtc agcaggtgaa agccaaagcc 60

ccgctgattc aggtgctgaa taattatgtt accattcatg atgtggcaaa tgtgattctg 120

gcaagcggtg gtcgtccggt tatgaccgat aaactgccga atagccagga tgttgtgaaa 180

agtgcagact tactgctgct gaatgcagca agcccgcgtc cgaatcagga actgctggat 240

ctggccacca ccgccaaaaa tgatcatcat ccggtggtgc tggaccctgt tggcgtgagc 300

gccatgccga gcaaactgaa actgtgtcag gatctgattg atcgtggcct ggttaccgcc 360

gttaaaggta atgcaagtga aattcgcagc ctgctgttcg aaaaaagtca gggtagcggc 420

gttgatctgg gcccgggtga tgaagttacc ctggccaatc tggccgactt cgcaccggac 480

ttcaaagcct atgcccagga aaaagaaatt attctggcaa tgagcggccc gattgatctg 540

gttaccgatg gtgaacgtct ggccattatt aaaaatggtc atccgtggat ggcaagttat 600

accggcagtg gttgtcagct gagtggtgtg ctggccagct tcctggccgg caatccggat 660

gaagatccgt tctatctggc caccgcagca atgattagct atggcgttgc aggcgaaatt 720

gccgcccagg tgctgcaacc gtatgaaggt aatgccacct atagcaatcg tgtgattgat 780

caggtgagtc tgctggaagc caaagaactg gaacgccgtg caaaatatga tattcagtga 840

ctgaaagctt 850

<210> 156

<211> 273

<212> PRT

<213> 卵形布劳特氏菌(Blautia obeum）

<400> 156

Met Ser Leu Asn Asn Ile Glu Glu Ile Ser Phe Cys Ile His Gln Asp

1 5 10 15

Ala Pro Lys Ile His Cys Leu Thr Asn Pro Val Thr Met Gln Asp Val

20 25 30

Ala Asn Leu Leu Leu Ala Ala Gly Gly Ser Ala Val Met Gly Gln Asp

35 40 45

Glu Gln Glu Val Glu Glu Ile Thr Ser Phe Cys His Gly Ala Leu Leu

50 55 60

Asn Thr Gly Val Pro Asp Ile Ala Lys Ile Gln Ala Cys Ile Leu Ala

65 70 75 80

Gly Gln Lys Ala Asn Ala Leu Asp His Pro Val Val Leu Asp Pro Val

85 90 95

Gly Ala Gly Ala Ser Thr Phe Arg Arg Lys Glu Leu Gln Lys Leu Leu

100 105 110

Gln Ala Val His Pro Thr Ala Val Arg Cys Asn Gln Glu Glu Ala Val

115 120 125

Val Leu Cys Ser Leu Leu Ser Asp Thr Asp Ser Pro Glu Lys His Gly

130 135 140

Gly Val Glu Ser Ser Leu Gln Met Ala Glu Arg Asp Val Cys Leu Ile

145 150 155 160

Ala Gly Gln Ala Ala Ser Leu Leu Asn Cys Thr Val Leu Ile Thr Gly

165 170 175

Arg Glu Asp Val Val Ser Asp Gly Lys Gln Thr Gln Ile Leu Thr Gly

180 185 190

Gly Asp Ser Arg Ile Arg Arg Ile Thr Gly Gly Gly Cys Met Leu Ser

195 200 205

Ala Leu Cys Thr Leu Phe Leu Cys Thr Asp Thr Ser Ala Phe Asp Ala

210 215 220

Val Arg Ala Ala Gly Ala Leu Trp Arg Glu Thr Ala Leu Glu Ala Gly

225 230 235 240

Arg Arg Thr Asp Ala Glu Lys Ser Gly Ile Gly Ser Phe His Val His

245 250 255

Leu Phe Asp Val Leu Glu Glu Lys Leu Met Tyr Thr Ser Lys His Lys

260 265 270

Phe

<210> 157

<211> 822

<212> DNA

<213> 卵形布劳特氏菌(Blautia obeum）

<400> 157

atgtcactta ataatataga agaaatttct ttctgcattc accaggatgc tcccaagatt 60

cattgtctca ctaatccggt aaccatgcag gatgttgcca atctactgct tgcagccggc 120

ggaagtgccg taatgggaca ggatgaacag gaagtcgaag aaatcacttc tttctgtcat 180

ggagcccttc tgaataccgg agtaccggac attgccaaaa tacaggcctg catccttgcc 240

ggacagaagg caaatgccct tgaccacccg gtcgtcctgg atccggtcgg cgccggtgcc 300

agcacatttc gaagaaaaga gctgcaaaaa cttcttcaag ccgttcatcc gactgctgtt 360

cgctgtaatc aggaagaagc cgttgttcta tgttctcttc tttcagatac cgacagtccc 420

gagaaacacg gcggtgtaga aagttccctg cagatggcgg aacgtgatgt ctgtctgatt 480

gcagggcagg cggcatctct tctcaactgc acagttctga tcacgggcag agaggatgtg 540

gtatctgatg gaaagcagac acagattctg accggcggtg actccaggat tcgacgaatc 600

accggtggcg gatgtatgct ttctgcactc tgcacattat ttctgtgtac ggacacttct 660

gcatttgatg cggtccgtgc cgccggagca ctctggcgtg aaactgccct tgaagcaggc 720

agacgaacag acgcagaaaa atccggtatt ggaagttttc atgtacatct ttttgatgta 780

ctggaagaga aattaatgta cacctcgaaa cataaattct ga 822

<210> 158

<211> 832

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 158

atgagtctga ataacatcga agaaatcagc ttctgtattc atcaggatgc accgaaaatt 60

cattgcctga ccaatccggt gaccatgcag gatgtggcaa atctgctgct ggcagccggt 120

ggtagtgcag ttatgggtca ggatgaacag gaagtggaag aaattaccag cttctgccat 180

ggcgccctgc tgaataccgg tgtgccggat attgccaaaa ttcaggcatg cattctggca 240

ggccagaaag caaatgccct ggatcatccg gtggttctgg accctgtggg cgccggtgcc 300

agcacattcc gccgtaaaga actgcaaaaa ctgctgcaag ccgtgcatcc gaccgcagtt 360

cgttgcaatc aggaagaagc agttgttctg tgtagcctgc tgagtgatac cgatagcccg 420

gaaaaacatg gtggcgttga aagcagtctg caaatggcag aacgcgatgt gtgtctgatt 480

gccggtcagg ccgccagtct gctgaattgt accgtgctga ttaccggtcg cgaagatgtg 540

gttagtgatg gcaaacagac ccagattctg accggcggtg atagtcgtat tcgccgcatt 600

accggcggcg gttgcatgct gagcgcactg tgcaccctgt tcctgtgcac cgataccagt 660

gcattcgatg ccgtgcgtgc cgccggtgca ctgtggagag aaaccgccct ggaagccggt 720

cgccgtaccg atgccgaaaa aagcggcatt ggcagcttcc atgtgcatct gttcgatgtt 780

ctggaagaaa aactgatgta taccagcaaa cataaattct gactgaaagc tt 832

<210> 159

<211> 281

<212> PRT

<213> 红串红球菌（Rhodococcus erythropolis）

<400> 159

Met Ser Asp Thr Val Ser Val Glu Thr Val Ala Ser Ala Ile Asp Ala

1 5 10 15

Leu Arg Asp Gln Val Pro Leu Val Gln Ser Leu Thr Asn Ile Val Ser

20 25 30

Ala Asn Phe Leu Thr Asn Val Leu Leu Ala Ala Gly Ala Ser Asn Ala

35 40 45

His Ile Asp Asn Val His Glu Ala Gly Gly Phe Ala Ala Val Ala Gly

50 55 60

Gly Val Leu Val Asn Leu Gly Thr Pro Asp Asp Gly Thr Ala Glu Ala

65 70 75 80

Phe Leu Ile Ser Ala Glu Ala Ala Arg Thr Ala Gly Thr Pro Trp Val

85 90 95

Leu Asp Pro Val Gly Val Gly Gly Leu Pro Trp Arg Ser Gly Ile Ala

100 105 110

Val Asp Leu Leu Arg Phe His Pro Ser Ala Ile Arg Gly Asn Ala Ser

115 120 125

Glu Ile Ile Ala Leu Ala Gly Leu Gly Gly Asp Thr Arg Gly Val Asp

130 135 140

Ser Ala Ser Asp Ser Ala Asp Ala Val Pro Ala Ala Leu Ser Leu Leu

145 150 155 160

Thr His Ala Asp Ala Val Ser Ala Ser Gly Pro Val Asp Tyr Ile Val

165 170 175

Gly Arg Asp Gly Gly Gly Asp Val Arg Gly Ile Arg Val Ser Gly Gly

180 185 190

Ser Ala Leu Leu Pro Arg Val Thr Ser Thr Gly Cys Ser Leu Gly Gly

195 200 205

Leu Val Ala Ala Tyr Leu Ala Val Thr Pro Thr Ala Leu Asp Gly Leu

210 215 220

Val Ala Ala His Thr His Val Ala Val Ala Ser Glu Ile Ala Glu Glu

225 230 235 240

Asn Ala Ser Gly Pro Gly Ser Phe Ala Val Ala Tyr Leu Asp Ala Leu

245 250 255

Tyr Thr Val Asn Ala Asp Thr Ile Arg Ser Arg Ala Arg Ile Glu Ser

260 265 270

Phe Asp Leu Pro Ala Gly Val Gln Asn

275 280

<210> 160

<211> 846

<212> DNA

<213> 红串红球菌（Rhodococcus erythropolis）

<400> 160

atgtctgaca ctgtctctgt cgaaaccgtc gcgtcggcga tcgacgcact ccgcgatcag 60

gtaccgctcg tccagtcgct gacgaacatc gtttcggcga acttcttgac caatgttctg 120

ctcgctgccg gcgcaagcaa cgctcacatc gacaacgttc atgaagcggg tgggttcgct 180

gccgtcgccg ggggagtgct cgtcaacctc ggaacgccgg acgacgggac agccgaagcc 240

ttcctgattt ccgcagaagc ggcccgaact gccggtacgc catgggtttt ggatccagtc 300

ggtgtcggcg gactaccctg gcggagcggt atcgctgtgg atctgctgcg ctttcacccc 360

agcgccatcc gcgggaacgc atcggagatc atcgctctgg ccggactcgg gggtgacacc 420

cgcggcgtcg acagtgcctc cgactccgcc gacgcagtgc ccgccgctct gtcactcctg 480

acgcatgcgg atgccgtgtc ggcatcaggc ccggtcgact acatcgtcgg ccgcgatggt 540

ggcggcgacg ttcggggcat ccgagtctcc ggtggcagcg ctctgttgcc gcgcgtgacc 600

agtaccggtt gctctctggg aggcctggtc gctgcctacc tcgccgttac gccgaccgcg 660

ctggacggat tggttgccgc gcatacgcac gttgccgtgg catcggagat cgccgaggaa 720

aatgcctcag gtcctggttc tttcgcggtc gcgtacctcg acgcgctcta caccgtgaat 780

gcggacacca tccgctcacg tgcccgaatc gaatcgttcg acctgccggc tggagtgcag 840

aactga 846

<210> 161

<211> 856

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 161

atgagcgata ccgtgagtgt tgaaaccgtg gccagtgcaa ttgatgcact gcgcgatcag 60

gttccgctgg ttcagagtct gaccaatatt gttagtgcaa acttcctgac caatgttctg 120

ctggccgccg gcgcaagtaa tgcccatatt gataatgttc atgaagcagg cggcttcgca 180

gcagttgcag gtggcgttct ggtgaatctg ggcaccccgg atgatggtac cgcagaagcc 240

ttcctgatta gcgccgaagc cgcacgtacc gcaggcaccc cttgggtgct ggaccctgtt 300

ggtgttggcg gtctgccgtg gcgtagtggt attgccgtgg atctgctgcg cttccatccg 360

agtgccattc gtggtaatgc aagcgaaatt attgccctgg caggtctggg cggcgatacc 420

cgtggtgtgg atagtgccag tgatagcgca gatgccgttc cggccgccct gagtctgctg 480

acccatgcag atgccgtgag cgccagcggt ccggtggatt atattgtggg ccgtgatggt 540

ggtggtgatg tgcgcggcat tcgcgtgagc ggtggcagtg cactgctgcc gcgcgttacc 600

agtaccggct gtagcctggg tggcctggtt gccgcatatc tggccgtgac cccgaccgcc 660

ctggatggtc tggtggccgc acatacccat gtggccgttg caagtgaaat tgccgaagaa 720

aatgcaagtg gcccgggcag cttcgccgtg gcttatctgg atgccctgta taccgttaat 780

gcagatacca ttcgcagccg cgcccgcatt gaatcattcg atctgccggc aggcgtgcag 840

aattgactga aagctt 856

<210> 162

<211> 274

<212> PRT

<213> 互养菌目细菌（Synergistales bacterium）

<400> 162

Met Ile Arg Pro Ala Asp Pro Gly Lys Val Trp Glu Ser Ile Arg Lys

1 5 10 15

Lys Arg Pro Leu Val Tyr Gln Leu Thr Asn Thr Val Ala Ala Ser Phe

20 25 30

Gln Ala Glu Val Thr Ala Ala Ala Gly Ala Ala Val Val Met Ser Ser

35 40 45

His Pro Gly Glu Ala Arg Val Ile Ala Ser Gly Ala Asp Ala Leu Leu

50 55 60

Leu Asn Thr Gly Thr Pro Gly Gly Thr Ser Gln Glu Ala Phe Ile Glu

65 70 75 80

Ala Leu Gly Gly Leu Arg Lys Gly Lys Pro Cys Leu Leu Asp Ala Val

85 90 95

Gly Tyr Gly Leu Thr Pro Phe Arg Thr Gly Trp Ile Asn Ser Leu Leu

100 105 110

Glu Gly Gly Arg Val Thr Ala Val Lys Gly Asn Ala Ala Glu Met Ala

115 120 125

Arg Leu Gly Gly Gly Ser Gly Ser Met Lys Gly Val Glu Ser Ser Arg

130 135 140

Ala His Gly Val Glu Lys Ala Leu Lys Glu Ile Thr Lys Ser Glu Thr

145 150 155 160

Ala Pro Val Val Ala Val Ala Thr Gly Lys Val Asp Lys Ile Ala Cys

165 170 175

Gly Gly Ser Leu Trp Lys Val Arg Gly Gly Ala Gly Leu Leu Pro Gln

180 185 190

Val Pro Ala Ser Gly Cys Ala Leu Gly Ser Val Met Ala Ala Cys Met

195 200 205

Ala Val Thr Asp Pro Leu Ser Ala Ala Thr Ala Ala Leu Leu Ala Phe

210 215 220

Arg Met Ala Ala Glu Arg Ala Pro Gly Ala Ala Gly Pro Ala Ser Trp

225 230 235 240

Arg Asn Ala Phe Val Asp Ala Leu Ala Ala Leu Glu Pro Glu Lys Leu

245 250 255

Ser Ser Gly Met Lys Glu Arg Val Glu Gly Pro Phe Pro Leu Glu Val

260 265 270

Leu Pro

<210> 163

<211> 825

<212> DNA

<213> 互养菌目细菌（Synergistales bacterium）

<400> 163

atgatccgcc cggccgatcc gggaaaagtc tgggagagta tcagaaaaaa acgtccgttg 60

gtctatcagc ttaccaatac agtggccgca tcctttcagg ccgaggtgac cgccgccgcg 120

ggcgccgctg tggtcatgtc gtcccacccc ggggaagccc gggtgatcgc gtccggggcg 180

gatgctctcc ttttgaacac gggaacgccc ggggggacct ctcaggaggc tttcattgaa 240

gctttaggcg gattgcggaa ggggaagccc tgtctgctgg atgccgtggg gtacggtctc 300

acccccttcc ggacgggctg gatcaattca ctcctggaag gtggccgagt cacagccgtt 360

aagggaaacg cggctgaaat ggcacgcctc ggcggcggat cgggttccat gaaaggcgtg 420

gagagttccc gagcccacgg ggtggaaaag gccctgaaag agataacgaa aagcgaaacg 480

gcacccgttg tggccgttgc gacaggaaag gtcgacaaaa tagcctgtgg cgggtcgctt 540

tggaaagtcc ggggaggggc ggggttgctt ccgcaagttc cggcaagcgg ctgtgccctt 600

gggagcgtca tggcggcctg catggccgtg acagaccccc tttcggccgc caccgcggcc 660

cttctggcct tccggatggc ggctgagcgg gcacccggcg ctgcagggcc ggcttcctgg 720

agaaacgcct ttgtcgacgc ccttgccgcc ctggagcctg aaaagctttc cagcggcatg 780

aaagaacgtg tggagggccc gttccctctg gaggttttgc catga 825

<210> 164

<211> 835

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 164

atgatccgcc cggcagatcc gggcaaagtg tgggaaagta ttcgcaaaaa acgtccgctg 60

gtgtatcagc tgaccaatac cgttgcagcc agcttccagg cagaagttac cgcagccgca 120

ggtgcagccg tggtgatgag cagtcatccg ggtgaagccc gcgtgattgc cagcggtgca 180

gatgccctgc tgctgaatac cggtaccccg ggcggcacca gtcaggaagc attcattgaa 240

gcactgggtg gtctgcgcaa aggcaaaccg tgtctgctgg atgcagtggg ctatggtctg 300

accccgttcc gtaccggctg gattaatagt ctgctggaag gtggccgcgt taccgcagtg 360

aaaggcaatg ccgcagaaat ggcacgtctg ggcggtggta gtggcagcat gaaaggtgtg 420

gaaagcagtc gcgcacatgg tgttgaaaaa gcactgaaag aaattaccaa aagcgaaacc 480

gccccggttg tggcagtggc caccggtaaa gttgataaaa ttgcatgtgg cggtagtctg 540

tggaaagttc gcggtggcgc aggtctgctg ccgcaggttc cggctagtgg ctgtgcactg 600

ggtagtgtta tggccgcatg tatggccgtg accgatccgc tgagcgccgc cacagcagcc 660

ctgttagcct tccgtatggc agccgaacgt gccccgggtg cagcaggtcc tgccagttgg 720

cgtaatgcct tcgtggatgc cctggccgcc ctggaaccgg aaaaactgag tagcggcatg 780

aaagaacgtg ttgaaggccc gttcccgctg gaagttctgc cgtgactgaa agctt 835

<210> 165

<211> 299

<212> PRT

<213> Pelagibaculum spongiae

<400> 165

Met Leu Val Lys Gln Glu Leu Lys Val Glu Met Glu Ile Arg Arg Gly

1 5 10 15

Ala Met Ser Thr Val Ser Thr Ser Pro Gln Gln Ser Phe Glu Ser Pro

20 25 30

Val Glu Gln Gln Leu Ser Glu Leu Leu Ile Ala Val Arg Thr Lys Lys

35 40 45

Pro Leu Val His Asn Ile Thr Asn Tyr Leu Ala Met Asn Ile Ser Ala

50 55 60

Asn Ala Leu Leu Ala Leu Gly Ala Ser Pro Ile Met Ala His Ser Arg

65 70 75 80

Glu Glu Ala Ser Glu Leu Cys Arg Ile Ser Gln Ala Leu Val Ile Asn

85 90 95

Ile Arg Thr Leu Ser Ser Gly Trp Ala Glu Ala Met Val Asp Thr Ala

100 105 110

Met Thr Ala Arg Ala His Asn Ile Pro Trp Val Leu Asp Pro Asp Gly

115 120 125

Ala Asp Ile Ser Ser Tyr Arg Met Asp Thr Cys Gln Glu Leu Ala Gly

130 135 140

Leu Ser Pro Lys Val Ile Arg Gly Asn Leu Lys Glu Ile Ala Ala Leu

145 150 155 160

Cys Ala Asp Cys Glu Pro Glu Leu Thr Pro Ala Gln Met Ala Lys Ala

165 170 175

Asp Leu Asp Gln Leu Leu Pro Ala Ile Leu Ser Cys Ala Ser Arg Arg

180 185 190

Ser Ser Val Leu Cys Ile Ser Gly Leu Thr Asp Asn Ile His Leu Val

195 200 205

Thr Asp Gly Glu Arg Val Leu Lys Val Ala Asn Gly Asp Ala Leu Ser

210 215 220

Ser Gln Val Ala Ala Met Gly Cys Thr Ala Ser Ala Leu Val Gly Ala

225 230 235 240

Phe Leu Thr Val Thr Asp Asp Ala Trp Leu Ala Thr Ala Ala Ala Ile

245 250 255

Ala Leu Leu Gly Val Ala Cys Glu Leu Ala Ala Ser Gln Ala Lys Gly

260 265 270

Pro Gly Ser Phe Gln Ala Glu Leu Met Asp Gln Leu Tyr Leu Ile Gln

275 280 285

Ser Asp Gln Leu Ala Ala Arg Leu Arg Leu Leu

290 295

<210> 166

<211> 900

<212> DNA

<213> Pelagibaculum spongiae

<400> 166

ttgcttgtaa agcaagaatt aaaagtagaa atggagatcc ggaggggcgc tatgtcgaca 60

gtttctactt caccgcagca atcatttgaa tcgccggttg agcagcagtt atcggaattg 120

ttaattgctg tgagaacaaa aaagccattg gttcataata ttaccaacta tttggcgatg 180

aatatttctg ctaatgcact gttggcattg ggtgctagcc cgattatggc gcatagccgt 240

gaagaagctt cggagctttg ccgaatttcc caagcgttag tcatcaacat tcgaaccctg 300

tcttcaggtt gggccgaagc gatggttgat actgccatga ccgctcgagc gcataatatt 360

ccctgggtat tagatcctga tggtgcagat atcagtagct atcggatgga cacttgccaa 420

gagttagcag gactttctcc taaggtaatt cgtggcaacc tgaaagaaat tgctgcactt 480

tgtgctgact gcgagcctga attaacgcca gcgcaaatgg ctaaggccga tcttgatcag 540

ctattacccg caatattatc ttgtgccagt cgtcgttcca gcgtgctttg cattagtggc 600

cttactgata atattcattt ggtcactgat ggtgaacgag tgttgaaagt tgccaatggt 660

gatgcgcttt caagccaagt tgcggcgatg ggatgtaccg ccagtgcatt ggtaggtgct 720

ttcctaacgg tcaccgatga cgcatggtta gcgactgcag cggcaattgc cttgctcgga 780

gttgcctgtg agttggctgc cagtcaggca aaagggccgg gtagttttca agctgagtta 840

atggatcaat tgtatctaat tcagtcagac caattagccg cgcgtttgcg gctgttgtaa 900

<210> 167

<211> 910

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 167

atgctggtga aacaggaact gaaagtggaa atggaaattc gtcgcggtgc aatgagcacc 60

gttagtacca gcccgcagca gagcttcgaa agcccggttg aacagcagct gagcgaactg 120

ctgattgccg ttcgtaccaa aaaaccgctg gttcataata ttaccaatta tctggcaatg 180

aacatcagcg caaatgccct gctggccctg ggcgcaagtc cgattatggc acatagtcgt 240

gaagaagcca gtgaactgtg tcgcattagt caggcactgg tgattaatat tcgcaccctg 300

agcagtggtt gggcagaagc catggtggat accgccatga ccgcccgcgc ccataatatt 360

ccgtgggtgc tggaccctga tggcgcagat attagcagct atcgcatgga tacctgccag 420

gaactggccg gcctgagccc gaaagttatt cgtggcaatc tgaaagaaat tgcagcactg 480

tgtgccgatt gtgaaccgga actgaccccg gcccagatgg ccaaagccga tctggatcag 540

ctgctgccgg caattctgag ctgcgccagc cgtcgtagca gtgtgctgtg tattagtggt 600

ctgaccgata atattcatct ggtgaccgat ggtgaacgtg tgctgaaagt ggccaatggt 660

gatgcactga gcagtcaggt ggccgcaatg ggttgtaccg ccagcgcact ggtgggtgcc 720

ttcctgaccg ttaccgatga tgcctggctg gcaaccgcag cagcaattgc actgctgggt 780

gtggcctgcg aactggccgc aagccaggca aaaggcccgg gcagcttcca ggccgaactg 840

atggatcagc tgtatctgat tcagagtgat cagctggccg cccgcctgcg tctgctgtga 900

ctgaaagctt 910

<210> 168

<211> 261

<212> PRT

<213> 厚壁菌属（Firmicutes bacterium）

<400> 168

Met Ile Lys Asp Ile Ile Gln Asn Val Tyr Ser Lys Arg Pro Leu Val

1 5 10 15

His Asn Ile Thr Asn Tyr Val Ala Ala Thr Asp Cys Ala Asn Ile Thr

20 25 30

Leu Thr Ile Gly Ala Ser Pro Ile Met Ala Asp Glu Pro Lys Glu Val

35 40 45

Gly Glu Val Thr Gln Ile Ala Asp Gly Leu Val Leu Asn Cys Gly Thr

50 55 60

Ile Ser Glu Ser Arg Leu Asn Ala Met Leu Ile Ser Gly Lys Thr Ala

65 70 75 80

Lys Ser Arg Glu Ile Pro Ile Val Leu Asp Pro Val Gly Val Gly Ile

85 90 95

Ser Lys Phe Arg Thr Ile Ala Val His Lys Ile Ile Thr Glu Val Lys

100 105 110

Pro Asp Ile Ile Arg Leu Asn Ala Ser Glu Leu Lys Ser Ile Cys Leu

115 120 125

Asn Ile Lys Asn Met Ser Gly Val Asp Ala Val Asn Ile Asp Ser Phe

130 135 140

Asp Asp Thr Val Glu Leu Ala Lys Asn Leu Ser Leu Lys Thr Asn Ala

145 150 155 160

Ile Ile Gly Val Ser Gly Ile Ser Asp Ile Val Thr Asp Gly Lys Asn

165 170 175

Thr Ala Val Ile Ser Gly Gly His Ala Met Met Lys Lys Ile Thr Gly

180 185 190

Ser Gly Cys Met Leu Ser Ser Val Ile Gly Ala Phe Ala Ala Ala Asn

195 200 205

Pro Asn Asn Leu Phe Tyr Ala Leu Ser Val Ala Phe Gly Leu Tyr Ala

210 215 220

Ser Cys Gly Arg Asn Ala Tyr Lys Glu Asn Ile Gly Ile Ala Thr Tyr

225 230 235 240

Lys Asn Asn Phe Phe Asp Glu Met Thr Asn Pro Asp Leu Glu Gly Ile

245 250 255

Glu Ile Glu Tyr Arg

260

<210> 169

<211> 786

<212> DNA

<213> 厚壁菌属（Firmicutes bacterium）

<400> 169

atgataaaag acattataca aaatgtttat tcaaaacgtc cgcttgttca taacataacc 60

aactacgttg ccgcaacgga ttgtgcaaat ataacattga caattggtgc gtcaccaatt 120

atggctgatg agcctaagga agtcggtgaa gtaacacaaa ttgccgacgg acttgtttta 180

aactgcggaa caatttccga aagtcgatta aacgctatgc ttatatccgg taaaacagca 240

aagtcaagag aaatacctat cgttcttgac ccagtcggag taggcatttc caaattcaga 300

acaattgccg ttcataaaat aattacggaa gtaaaacccg atattataag acttaatgca 360

tcggaactta aaagcatttg tcttaacatt aaaaatatgt cgggtgtgga cgccgttaat 420

attgacagtt ttgacgatac tgttgagctt gcaaaaaatc tttcgcttaa gaccaacgcg 480

attataggtg taagcggtat atcggatatt gttacagacg gcaaaaatac cgccgttatt 540

tcaggcggac acgcaatgat gaaaaaaatt acaggctccg gctgtatgct ttcatctgtt 600

atcggtgcat ttgccgccgc aaatccgaat aatctttttt atgcgctatc tgttgcattc 660

ggtttatatg caagttgcgg aagaaacgca tacaaagaaa atataggtat cgcaacatat 720

aaaaacaact tttttgatga aatgacaaat cctgatttgg aggggattga aattgaatat 780

agataa 786

<210> 170

<211> 796

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 170

atgatcaagg atatcatcca gaatgtgtat agtaaacgcc cgctggttca taatattacc 60

aattatgtgg ccgccaccga ttgtgccaat attaccctga ccattggtgc aagtccgatt 120

atggcagatg aaccgaaaga agtgggcgaa gttacccaga ttgccgatgg cctggttctg 180

aattgcggta ccattagtga aagccgtctg aatgccatgc tgattagcgg caaaaccgca 240

aaaagtcgtg aaattccgat tgtgctggac cctgttggcg ttggcattag taaattccgt 300

accattgcag tgcataaaat tattaccgaa gttaaaccgg atatcattcg tctgaatgcg 360

agtgaactga aaagtatctg tctgaatatt aagaacatga gtggtgttga tgcagttaat 420

attgatagct tcgatgatac cgttgaactg gccaaaaatc tgagtctgaa aaccaatgca 480

attattggcg ttagcggcat tagtgatatt gttaccgatg gcaaaaatac cgcagtgatt 540

agtggtggcc atgccatgat gaaaaaaatt accggcagcg gttgcatgct gagcagcgtt 600

attggtgcat tcgccgcagc caatccgaat aatctgttct atgccctgag cgtggcattc 660

ggtctgtatg ccagctgtgg tcgtaatgcc tataaagaaa atattggtat cgccacctat 720

aaaaataact tcttcgatga aatgaccaac ccggatctgg aaggcattga aattgaatat 780

cgctgactga aagctt 796

<210> 171

<211> 263

<212> PRT

<213> Euryarchaeota archaeon

<400> 171

Met Pro Arg His Gly Ala Ala Val Asn Leu Val Lys Trp Gly Gly Ser

1 5 10 15

Leu Ile Thr Asp Lys Ala Ala Ala Lys Pro Thr Pro Gln Arg Glu Arg

20 25 30

Ile Thr Ala Leu Ala Ala Ala Leu Ala Ala Asn Asp Ala Pro Ala Val

35 40 45

Leu Val His Gly Ala Gly Ser Phe Gly His Pro Leu Ala Lys Arg Phe

50 55 60

Gly Leu Ala Gln Gly Ser Asp Gly Ser Pro Glu Gln Ala Ala Ala Val

65 70 75 80

Ala Arg Thr Arg Gln Gln Val Arg Thr Leu Asn Ala Leu Val Cys Glu

85 90 95

Ala Leu Ala Thr Ala Gly Leu Glu Pro Val Pro Ile Leu Pro Ser Gln

100 105 110

Ala Leu Arg Thr Ala Gly Pro Gln Asn Ile Val Asp Phe Pro Ala Ser

115 120 125

Ser Phe Glu Ala Ala Leu Glu Ala Gly Arg Ile Pro Val Thr Cys Gly

130 135 140

Asp Val Thr Asp Asp Asp Ser Gln Gly Ile Ala Ile Leu Ser Gly Asp

145 150 155 160

Thr Leu Met Leu Ala Leu Ala Arg Ala Leu Arg Pro Gln Arg Ala Leu

165 170 175

Phe Val Ile Asn His Ser Gly Val Met Asp Arg Asp Pro Ala Glu Pro

180 185 190

Gly Ala Lys Leu Ile Ala His Leu Asn Gly Asp Ala Arg Thr Glu Met

195 200 205

Arg Ala Gln Arg Met Asp Val Pro Gly Ala Asp Val Thr Gly Gly Met

210 215 220

Trp Gly Lys Leu Glu Ala Ala Ala Ala Ile Ala Arg Glu Cys Glu Cys

225 230 235 240

Arg Ile Ile Gly Ala Gly Gly Phe Ala Ala Ala Leu Thr Gly Asp Pro

245 250 255

Ala Gly Thr Leu Val Leu Pro

260

<210> 172

<211> 792

<212> DNA

<213> Euryarchaeota archaeon

<220>

<221> misc_feature

<222> (80)..(80)

<223> n means a or g or c or t

<220>

<221> misc_feature

<222> (171)..(171)

<223> n means a or g or c or t

<220>

<221> misc_feature

<222> (252)..(252)

<223> n means a or g or c or t

<220>

<221> misc_feature

<222> (518)..(518)

<223> n means a or g or c or t

<400> 172

ctgccccgcc atggagctgc cgtgaacctc gtcaagtggg gcggctcgct catcaccgac 60

aaggcggccg cgaagccgan gccacaacgc gagcgcatca cggcgctggc tgcggcgctc 120

gccgccaacg acgcgccggc ggtgctggtg cacggcgccg gttctttcgg ncacccgctc 180

gcaaagcggt tcgggctggc gcagggaagc gacggctcac ccgagcaggc ggcggcggtc 240

gcgcggacgc gncagcaggt gcgcacgctc aacgcgctgg tttgcgaagc gctcgccacg 300

gcgggactgg aacctgttcc aatcctgccg tcgcaggcgc tgcgcaccgc tggcccgcaa 360

aacatcgttg atttccccgc gagcagcttc gaggcggcgc tggaggcggg ccgtatccca 420

gtcacctgcg gcgacgtcac cgacgacgat tcacagggca tcgccatttt gagcggcgat 480

acgctgatgc tcgcgctggc gcgcgcgctg cgaccgcngc gcgcgttgtt cgtcatcaac 540

cactcaggag ttatggatcg cgacccggcc gagccgggcg cgaaactgat cgcgcatctc 600

aacggggacg cccgcacgga gatgcgcgcg cagcggatgg atgtgccggg cgccgacgtc 660

acaggcggga tgtggggcaa gctcgaggcg gcggccgcca tcgcccgcga atgcgagtgc 720

cgcatcatcg gcgcgggcgg cttcgcagca gcactcacag gcgacccagc tgggacgctg 780

gtgctgccgt ga 792

<210> 173

<211> 802

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 173

atgccgcgtc atggtgccgc agttaatctg gttaaatggg gtggtagcct gattaccgat 60

aaagccgccg ccaaaccgac cccgcagcgc gagagaatta ccgccctggc agcagccctg 120

gcagccaatg atgcaccggc cgtgctggtt catggcgcag gcagcttcgg tcatccgctg 180

gccaaacgct tcggtctggc ccagggcagt gatggcagtc cggaacaggc agcagccgtt 240

gcccgtaccc gtcagcaggt tcgcaccctg aatgcactgg tgtgtgaagc cctggcaacc 300

gccggtctgg aaccggttcc gattctgccg agtcaggcac tgcgcaccgc aggccctcag 360

aatattgttg acttcccggc cagcagcttc gaagccgcac tggaagccgg ccgcattccg 420

gtgacctgtg gcgatgtgac cgatgatgat agtcagggca ttgccattct gagcggtgat 480

accctgatgc tggcactggc acgcgcactg cgtccgcagc gtgctctgtt cgttattaat 540

catagcggtg tgatggatcg cgatccggca gaaccgggtg ccaaactgat tgcacatctg 600

aatggcgatg cccgtaccga aatgcgtgcc cagcgtatgg atgttccggg tgccgatgtt 660

accggtggta tgtggggcaa actggaagcc gccgccgcaa ttgcccgcga atgcgaatgt 720

cgcattattg gcgccggtgg cttcgcagcc gcactgacag gtgatccggc cggtaccctg 780

gtgctgccgt gactgaaagc tt 802

<210> 174

<211> 251

<212> PRT

<213> 小甲烷粒菌（Methanocorpusculum parvum）

<400> 174

Met Asn Glu Pro Val Ile Ile Lys Leu Gly Gly Ser Ile Val Thr Lys

1 5 10 15

Lys Ser Glu Asp Gly Val Val Asp Ser Ala Lys Ile Lys Leu Leu Ala

20 25 30

Glu Gln Ile Ala Pro Phe Ala Gly Lys Phe Pro Leu Ile Ile Val His

35 40 45

Gly Ala Gly Ser Cys Gly His Pro Glu Ala Lys Ala Tyr Asp Ile Pro

50 55 60

Gly Gly Val Thr Lys Ala Asn Ala Ala Gly Ile Phe Val Thr His Thr

65 70 75 80

Ala Val Ser Arg Leu Asn Arg Ser Val Val Ala Ser Leu Arg Glu Ala

85 90 95

Gly Met Glu Ala Val Ser Leu His Pro Phe Gly Cys Cys Leu Ala Glu

100 105 110

Asn Gly Arg Leu Val Ser Ala Gly Val Ser Gln Ile Lys Glu Met Leu

115 120 125

Ser Leu Ser Leu Ile Pro Val Leu His Gly Asp Val Val Met Asp Thr

130 135 140

Lys Arg Gly Ala Cys Ile Ile Ser Gly Asp Gln Ile Val Pro Tyr Leu

145 150 155 160

Ala Val Lys Leu Gly Ala Lys Arg Val Gly Ile Ala Thr Asp Val Gly

165 170 175

Gly Val Leu Glu Asn Gly Glu Val Ile Pro Glu Ile Asn Arg Lys Asn

180 185 190

Val Gly Glu Ile Asp Leu Gly Gly Ser Ser Ser Thr Asp Ile Thr Gly

195 200 205

Gly Met Arg Gly Lys Ile Asp Glu Leu Leu Leu Leu Ala Asp Glu Gly

210 215 220

Ile Asp Ser His Ile Phe Ala Ala Asn Arg Val Ala Asp Phe Leu Leu

225 230 235 240

Gly Lys Asn Tyr Gly Gly Thr Leu Val Arg Lys

245 250

<210> 175

<211> 756

<212> DNA

<213> 小甲烷粒菌（Methanocorpusculum parvum）

<400> 175

atgaatgaac cagtcattat caaactcggc ggaagcatcg ttacgaaaaa atccgaagac 60

ggggtcgtcg attcggcaaa gatcaaactc cttgccgagc agatcgcacc gtttgccgga 120

aaattccccc tcatcatcgt gcacggggca ggttcctgcg ggcatcccga ggcaaaagcc 180

tatgatatcc cgggcggcgt gacgaaagca aacgccgcag gtatttttgt aacgcacacg 240

gcagtgtccc ggctcaaccg ctcggtcgta gcctcgcttc gtgaagccgg catggaagcc 300

gtctcgcttc atccgttcgg ctgctgtctt gcggagaacg gccgccttgt ctcggcaggt 360

gtttcgcaga tcaaagagat gctttcccta agtctcatcc cggtcctgca cggggatgtg 420

gtcatggaca caaaacgcgg cgcctgtatt atctccggcg atcagatcgt cccctacctt 480

gccgtcaaac tcggcgcaaa acgcgttggg atcgcgaccg atgtcggggg cgttcttgaa 540

aacggtgaag tcatcccgga gatcaaccgg aaaaacgtcg gtgagatcga tctcggcggc 600

tcttcgagca ccgacataac cggcggcatg cgtggaaaga tcgatgaact tctccttctc 660

gccgatgaag ggatcgactc gcacattttc gccgcgaacc gtgtggcgga tttcctcttg 720

ggaaaaaatt acggcgggac actggtaaga aaatga 756

<210> 176

<211> 766

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 176

atgaacgaac cggttattat taagctgggt ggcagcattg ttaccaaaaa aagtgaagat 60

ggtgttgttg atagtgcaaa aattaaactg ctggccgaac agattgcacc gttcgccggt 120

aaattcccgc tgattattgt gcatggcgcc ggtagttgtg gccatccgga agccaaagca 180

tacgatattc cgggtggtgt taccaaagca aatgcagccg gtatcttcgt gacccatacc 240

gcagtgagtc gcctgaatcg cagcgttgtt gccagtctgc gtgaagcagg tatggaagca 300

gttagtctgc atccgttcgg ttgttgtctg gcagaaaatg gccgtctggt tagtgcaggt 360

gttagccaga ttaaagaaat gctgagtctg agcctgattc cggtgctgca tggtgatgtg 420

gtgatggata ccaaacgtgg tgcctgtatt attagtggtg atcagattgt gccgtatctg 480

gccgttaaac tgggcgcaaa acgcgttggc attgccaccg atgtgggtgg cgtgctggaa 540

aatggtgaag tgattccgga aattaatcgc aaaaatgtgg gcgaaattga tctgggcggc 600

agcagcagca ccgatattac cggcggcatg cgcggcaaaa ttgatgaact gctgctgctg 660

gcagatgaag gcattgatag ccatatcttc gcagcaaatc gcgtggcaga cttcctgctg 720

ggcaaaaatt atggtggtac cctggtgcgt aaatgactga aagctt 766

<210> 177

<211> 267

<212> PRT

<213> Ardenticatena maritima

<400> 177

Met Asn Cys Ile Phe Val Lys Leu Gly Gly Ser Leu Leu Thr Asp Lys

1 5 10 15

Thr Ala Arg Tyr Ala Ala Arg His Asp Val Leu Ala Arg Leu Ala Arg

20 25 30

Glu Ile Ala Ala Ala Arg His Ala Asn Pro Asp Leu Ala Leu Val Leu

35 40 45

Ala His Gly Ser Gly Ser Tyr Gly His Val Ala Ala Arg Glu Thr Gly

50 55 60

Tyr Asp Arg Glu Arg Gly His Arg Asp Val Leu Ala Tyr Ala Arg Val

65 70 75 80

Ala Ala Ala Ala Ala Thr Leu Asn Ser Leu Val Arg Ala Ala Leu Leu

85 90 95

Ala Cys Asp Ile Pro Ala Val Ser Leu Pro Pro Ser Ala Ser Ala Leu

100 105 110

Val Glu Gly Gly Arg Leu Val Arg Met Ala Trp Asp Pro Phe Ala Arg

115 120 125

Ile Leu Ala Trp Gly Gly Val Pro Leu Thr Tyr Gly Asp Val Ala Leu

130 135 140

Thr Glu Thr Gly Gly Thr Ile Val Ser Thr Glu Thr Val Leu Leu Ala

145 150 155 160

Leu Ala Glu Gln Leu Pro Pro Thr Arg Leu Leu Leu Leu Thr Asp Val

165 170 175

Pro Gly Val Phe Ala His Pro Pro Thr Gly Asp Thr Thr Pro Pro Leu

180 185 190

Leu Glu Arg Ile Thr Pro Ala Thr Trp Pro Glu Gln Arg Ala Gly Val

195 200 205

Gln Gly Ala Arg Gly Thr Asp Val Thr Gly Gly Met Val Arg Lys Val

210 215 220

Glu Gln Met Leu Ala Leu Val Glu Arg Leu Pro Gln Val Glu Val Ile

225 230 235 240

Ile Ala Ser Gly Arg Thr Pro Gly Leu Leu Gln Arg Ala Leu Leu Gly

245 250 255

Glu Asp Val Pro Gly Thr Arg Ile Val Arg Ala

260 265

<210> 178

<211> 804

<212> DNA

<213> Ardenticatena maritima

<400> 178

atgaattgca tcttcgtcaa acttgggggc tcgctcctga ccgacaaaac cgcccgctac 60

gccgcccgcc atgacgtctt ggcgcggctg gcgcgtgaaa tcgccgcggc gcgccacgcc 120

aaccccgacc tggcgctggt gctcgcccat ggcagcggct cttacgggca tgtcgccgcg 180

cgcgaaacag gctacgaccg cgagcggggg catcgcgatg tgctggcgta tgcacgggtt 240

gccgccgccg ccgcgacgct caacagcctg gtgcgggcgg cgttgctggc gtgcgatatt 300

cccgccgtct cgttgccgcc ttcggcgtcg gcgctggtgg aaggggggcg gctggtgcgc 360

atggcgtggg accccttcgc ccgcattctg gcgtgggggg gcgtcccgct cacctatggc 420

gatgtggcgc tgacggagac gggcggcacc atcgtttcca ccgaaaccgt attgctggcg 480

ctcgccgagc agttgccgcc gacgcgcctg ctcctgctga ctgacgtgcc cggcgttttt 540

gcgcatcccc ccacgggcga cacgacgccc cctctgctgg aacgcattac gcccgccacc 600

tggcccgaac agcgcgccgg tgtgcagggc gcccgcggca ccgacgtgac ggggggcatg 660

gtgcgcaagg tggagcagat gttggcgctg gtggaacgct tgccgcaggt ggaagtcatc 720

atcgcgtccg ggcggacgcc cggcctgttg cagcgggcgt tgctggggga agatgtgccc 780

ggcacgcgca tcgtgcgggc gtga 804

<210> 179

<211> 814

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 179

atgaactgta tcttcgtgaa actgggcggc agcctgctga ccgataaaac cgcacgttat 60

gcagcccgtc atgatgttct ggcacgtctg gcccgtgaaa ttgccgcagc acgtcatgca 120

aatccggatc tggccctggt tctggcccat ggtagtggca gttatggtca tgttgccgcc 180

cgtgaaaccg gctatgatcg tgaacgtggc catcgcgatg tgctggccta tgcccgtgtt 240

gcagccgccg cagcaaccct gaatagtctg gtgcgtgccg cactgctggc ctgtgatatt 300

ccggcagtga gcctgccgcc gagcgcatca gcactggttg aaggcggtcg cctggtgcgt 360

atggcatggg acccgttcgc acgcattctg gcatggggcg gcgttccgct gacctatggt 420

gatgtggccc tgaccgaaac cggtggcacc attgtgagta ccgaaaccgt gctgctggca 480

ctggcagaac agctgccgcc gacccgcctg ctgctgttaa ccgatgtgcc gggcgtgttc 540

gcacatccgc cgaccggtga taccaccccg ccgttactgg aacgcattac cccggcaacc 600

tggccggaac agcgcgcagg tgtgcagggt gcccgtggta ccgatgttac cggtggtatg 660

gtgcgtaaag ttgaacagat gctggccctg gtggaacgtc tgccgcaggt tgaagttatt 720

attgcaagcg gtcgcacccc gggcctgctg caacgtgcac tgctgggtga agatgtgccg 780

ggtacccgta ttgttcgcgc ctgactgaaa gctt 814

<210> 180

<211> 242

<212> PRT

<213> Thermoplasmatales archaeon

<400> 180

Met Ile Ala Ile Lys Leu Gly Gly Ser Phe Ile Thr Asp Lys Ser Lys

1 5 10 15

Tyr Arg Thr Phe Arg Lys Tyr Glu Thr Glu Arg Ala Leu Lys Gly Ile

20 25 30

Ile Lys Phe Gly Glu Pro Phe Val Leu Val His Gly Ala Gly Ser Phe

35 40 45

Gly His Ile Leu Cys Lys Gln Ser Gly Phe Pro Gly Thr Tyr Lys Gly

50 55 60

Lys Glu Ser Gln Leu Ser Arg Val Lys Tyr Asp Thr Cys Ser Leu Asn

65 70 75 80

Ser Met Ile Thr Glu Ile Leu Leu Asp Leu Gly Met Ala Pro Met Ser

85 90 95

Phe Ser Pro Phe His Leu Arg Arg Lys Asp Thr Phe Asp Tyr Ser Ser

100 105 110

Val Leu Arg Ser Val Glu Gly Gly Phe Leu Pro Val Met Tyr Gly Asp

115 120 125

Ile Tyr Ile Asp Gly Asn Asp Val Lys Ile Tyr Ser Gly Asp Ser Ile

130 135 140

Met Phe Asp Ile Cys Asn Leu Leu Asn Pro Thr Asp Ala Ile Phe Met

145 150 155 160

Gly Asp Val Asp Gly Ile Phe Asp Arg Asp Pro Lys Ile Tyr Pro Glu

165 170 175

Ser Lys Leu Leu Lys Thr Val Lys Lys Gln Gln Asp Phe Asn Thr Ile

180 185 190

Leu Asn Asp Val Thr Gly Gly Met Gly Gly Lys Tyr Ile Ala Met Lys

195 200 205

Lys Ile Ala Ser Leu Gly Ile Arg Thr Ser Met Met Asn Gly Leu Tyr

210 215 220

Pro Glu Arg Leu Ser Asp Leu His Asn Asp Asn Phe Tyr Gly Ser Val

225 230 235 240

Ile Glu

<210> 181

<211> 729

<212> DNA

<213> Thermoplasmatales archaeon

<400> 181

atgatcgcaa taaagcttgg aggaagtttc ataacagata agtcaaaata tagaactttc 60

aggaagtatg aaacggaacg ggcattaaag ggaataataa aatttggcga accatttgtt 120

ctggtacacg gagccggttc ctttggtcac atattatgca agcagagtgg tttccccggt 180

acttataaag gtaaagaatc tcaactttcc agagttaagt atgatacatg ctctctgaat 240

agcatgataa cagaaatcct tcttgatctg ggtatggctc caatgagctt ttcacctttt 300

catctaagga ggaaggatac ctttgattac tcatctgttc tcaggtctgt ggaaggaggt 360

ttccttcctg taatgtatgg cgatatttac attgacggga atgatgttaa gatctattcc 420

ggtgacagca taatgtttga tatttgtaac ctgttgaatc ctacagatgc aattttcatg 480

ggtgacgttg acggaatatt cgacagggat ccaaagatat atcctgaaag caaactcctg 540

aagacagtga aaaagcagca ggattttaac accatattga atgatgtaac cggcggcatg 600

ggtggaaagt acatagccat gaagaaaatt gcatcacttg gaataagaac ctccatgatg 660

aacggtttat atccggaaag gcttagtgat cttcataacg ataactttta tggttcggtg 720

attgaatga 729

<210> 182

<211> 739

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 182

atgatcgcaa ttaagctggg cggcagcttc attaccgata aaagtaaata tcgcaccttc 60

cgtaaatatg aaaccgaacg cgccctgaaa ggcattatta aattcggtga accgttcgtg 120

ctggtgcatg gtgccggtag cttcggccat attctgtgta aacagagtgg cttcccgggt 180

acctataaag gcaaagaaag tcagctgagt cgcgtgaaat atgatacctg tagcctgaat 240

agtatgatta ccgaaattct gctggatctg ggcatggccc cgatgagctt cagtccgttc 300

catctgcgcc gtaaagatac cttcgattat agcagtgtgc tgcgcagtgt tgaaggcggc 360

ttcctgccgg ttatgtatgg cgatatctat attgatggca atgatgttaa gatatatagc 420

ggtgatagca ttatgttcga tatctgtaat ctgctgaatc cgaccgatgc aatcttcatg 480

ggcgatgttg atggtatctt cgatcgtgat ccgaaaatct atccggaaag taaactgctg 540

aaaaccgtga aaaaacagca ggacttcaat accattctga atgatgtgac cggtggtatg 600

ggcggtaaat atattgccat gaaaaaaatt gcgagcctgg gtattcgcac cagtatgatg 660

aatggtctgt atccggaacg cctgagcgat ctgcataatg ataacttcta tggcagcgtt 720

attgaatgac tgaaagctt 739

<210> 183

<211> 282

<212> PRT

<213> Aciduliprofundum boonei

<400> 183

Met Ala Trp Ser Thr Tyr Gly Ile Ser Gly Val Leu Ala Ile Val Arg

1 5 10 15

Asp Arg Met Gly Leu Ser Val Ile Lys Leu Gly Gly Ser Leu Leu Thr

20 25 30

Asp Lys Ser Lys Pro Tyr Thr Met Arg Lys Glu Lys Phe Arg Glu Ile

35 40 45

Ala Arg Glu Leu Lys Glu Ser Met Asp Glu Met Ile Ile Val His Gly

50 55 60

Val Gly Ser Tyr Gly His Pro Pro Val Lys Glu Tyr Lys Leu Tyr Arg

65 70 75 80

Gly Tyr Thr Gly Lys Glu Asn Leu Leu Asn Leu Ala Lys Thr Gln Ser

85 90 95

Ile Val Phe Glu Leu Arg Leu Glu Phe Val Arg Ala Leu Gln Glu Glu

100 105 110

Gly Ile Asn Ala Met Ile Phe Leu Pro Ser Ser Gln Ile Val Ala Glu

115 120 125

Gly Met Lys Ile Lys Lys Ile Cys Ile Glu Pro Ile Lys Arg Phe Leu

130 135 140

Glu Met Gly Met Thr Pro Val Phe Gly Gly Asp Ile Val Val Asp Thr

145 150 155 160

Lys Met Gly Tyr Ser Val Cys Ser Gly Asp Leu Ile Ala Ala His Leu

165 170 175

Ala Ser Glu Leu Asn Ala Glu Arg Leu Ile Phe Ala Thr Asp Val Asp

180 185 190

Gly Ile Tyr Thr Lys Asp Pro Lys Lys Asp Lys Asn Ala Lys Leu Leu

195 200 205

Lys Glu Ile Asn Leu Glu Asn Met Asp Glu Leu Ala Lys Leu Thr Gly

210 215 220

Ser Ala Phe Thr Asp Val Thr Ser Gly Met Tyr Gly Lys Ile Glu Thr

225 230 235 240

Ile Arg Lys Tyr Lys Asn Asp Leu Lys Asn Thr Glu Ile Val Ile Leu

245 250 255

Ser Met Leu Lys Glu Gly Asn Leu Lys Ala Tyr Met Arg Asn Met Lys

260 265 270

Asp Ala Lys Tyr Thr Lys Ile Lys Ile Lys

275 280

<210> 184

<211> 849

<212> DNA

<213> Aciduliprofundum boonei

<400> 184

atggcctgga gtacatacgg tatttcaggc gttctggcaa ttgtgaggga tagaatggga 60

ttgagtgtaa taaaattggg tggctcgctg ctcacagata aatcgaagcc ttacacaatg 120

aggaaagaaa aatttagaga aattgctaga gagttgaaag agagtatgga tgagatgata 180

atagttcatg gtgtgggctc ttatggacac ccgcctgtta aggagtacaa actttacagg 240

ggttatacag gaaaggagaa tcttttaaat ttagcaaaga cgcagagcat agtgtttgaa 300

ttgcgtttgg aatttgttag agctttacag gaagagggaa taaatgccat gattttcctg 360

ccgagtagcc agatagttgc agaaggaatg aagataaaaa agatttgtat tgaaccaata 420

aagagatttt tagagatggg aatgactcca gtgtttggtg gagacattgt ggttgatact 480

aagatgggtt attcagtttg ttcgggagat cttattgcag cacatcttgc ctctgagcta 540

aatgctgaga gattgatttt tgcaacagat gtggacggaa tttatacaaa ggacccgaaa 600

aaagataaaa atgcaaaatt gctgaaagaa ataaatctag aaaatatgga tgaattggct 660

aaattaacgg gttctgcttt cactgatgtg acctcaggta tgtacggcaa aatagagacc 720

attagaaaat acaagaatga tttaaagaat acagaaatag tcattctttc tatgttaaaa 780

gagggcaatt taaaagcata tatgagaaat atgaaggatg caaaatacac caaaataaaa 840

ataaagtaa 849

<210> 185

<211> 859

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 185

atggcatgga gtacctatgg tattagtggt gttctggcca ttgttcgcga tcgcatgggt 60

ctgagtgtta ttaaactggg tggtagcctg ctgaccgata aaagtaaacc gtataccatg 120

cgcaaagaaa aattccgtga aattgcccgt gaactgaaag aaagtatgga tgaaatgatt 180

atcgtgcatg gtgttggtag ttatggtcat ccgccggtga aagaatataa actgtatcgt 240

ggctataccg gtaaagaaaa tctgctgaat ctggcaaaaa cacaaagcat tgtgttcgaa 300

ctgcgcctgg agttcgttcg tgcactgcaa gaagaaggta ttaatgcaat gatcttcctg 360

ccgagtagcc agattgttgc cgaaggcatg aaaattaaaa aaatctgtat cgagccgatc 420

aaacgcttcc tggaaatggg catgaccccg gtgttcggtg gtgatattgt tgtggatacc 480

aaaatgggtt atagtgtgtg tagtggtgat ctgattgcag cacatctggc aagtgaactg 540

aatgccgaac gcctgatctt cgccaccgat gttgatggta tctataccaa agatccgaaa 600

aaagataaga acgcaaaact gctgaaagaa attaatctgg aaaacatgga tgagctggcc 660

aaactgaccg gtagcgcctt caccgatgtg accagcggta tgtatggcaa aattgaaacc 720

attcgtaaat acaaaaacga cctgaaaaac accgaaattg ttattctgag catgctgaaa 780

gaaggtaatc tgaaagcata tatgcgtaat atgaaggatg caaaatacac caaaatcaaa 840

atcaagtgac tgaaagctt 859

<210> 186

<211> 252

<212> PRT

<213> Methanohalarchaeum thermophilum

<400> 186

Met Lys Ile Ile Lys Ile Gly Gly Ser Leu Ile Thr Asp Lys Asp Ser

1 5 10 15

Tyr Lys Thr Pro Asp Thr His Glu Ile Asn Arg Ile Ala Arg Glu Ile

20 25 30

Ser Lys Gly Ile Asn Ser Asp Arg Leu Ile Leu Ile His Gly Ala Gly

35 40 45

Ser Phe Gly His Pro Leu Val Lys Lys Phe Lys Leu Asn Lys Lys Ser

50 55 60

Thr Asn Lys Asp Leu Phe Ser Ile Leu Lys Val Gln Asp Ser Val Arg

65 70 75 80

Glu Leu Asn Arg Leu Phe Lys Asp Ser Leu Asn Lys Glu Lys Ile Pro

85 90 95

Ala Tyr Thr Ile His Pro Ser Ser Ile Thr Arg Thr Glu Asn Gly Glu

100 105 110

Ile Ile Asp Leu Glu Leu Asn Thr Ile Arg Gln Ala Leu Lys Glu Gly

115 120 125

Tyr Ile Pro Leu Leu Tyr Gly Asp Met Val Leu Asp Thr Lys Asn Arg

130 135 140

Ala Ser Val Leu Ser Gly Asp Arg Leu Val Ser Phe Leu Ala Gln Glu

145 150 155 160

Leu Lys Pro Asn Lys Val Gly Met Ala Thr Thr Thr Pro Val Leu Asp

165 170 175

Lys Asn Asn Gln Lys Ile Asp Leu Ile Thr Gln Thr Asp Leu Glu Asn

180 185 190

Ile Gly Glu Ser Asn Ser Thr Asp Val Thr Gly Gly Met Leu Asn Lys

195 200 205

Val Asn Glu Leu Leu Lys Thr Arg Ala Lys Ser Tyr Ile Phe Asn Ala

210 215 220

Lys Lys Arg Lys Ala Leu Glu Lys Phe Ile Lys Gly Lys Asn Ile Gly

225 230 235 240

Thr Glu Val Glu Tyr Asp Asp Lys Gly Lys Lys Thr

245 250

<210> 187

<211> 759

<212> DNA

<213> Methanohalarchaeum thermophilum

<400> 187

atgaaaataa ttaaaatcgg tggaagctta ataacagata aggacagtta taaaacccca 60

gatacccacg agataaatcg tatagcaaga gagataagta agggaatcaa ctcagatcga 120

ttaatactaa ttcatggagc tgggtccttc ggacacccat tagtcaagaa atttaaatta 180

aataaaaaat caacaaacaa ggatttattt tctattctaa aggtacaaga ttcagttagg 240

gaattaaata ggttatttaa ggactcttta aataaagaaa aaataccagc ttacacgatt 300

catccttcat caattacaag aacggaaaat ggagagataa tagatctaga attaaataca 360

ataagacaag cactcaagga gggctatata cctctcctgt atggtgacat ggttttagat 420

accaaaaata gagcaagtgt attatctggt gatcgattag tttccttctt agctcaggaa 480

cttaaaccaa ataaagttgg tatggctaca actactcccg tattagataa aaacaatcaa 540

aagatcgatt taatcaccca aaccgattta gaaaatatag gagaatctaa ttcaactgat 600

gtcacgggag gaatgttaaa caaagtaaat gagcttttaa aaacccgagc caaatcatat 660

atcttcaatg ctaaaaaaag aaaagcactt gaaaaattca taaaaggcaa aaacattggg 720

acagaggtcg aatatgacga taaaggaaag aaaacttga 759

<210> 188

<211> 769

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 188

atgaagatca tcaagatcgg cggcagtctg attaccgata aagatagcta taaaacacct 60

gatacccatg aaattaaccg cattgcacgt gaaattagta aaggtattaa cagcgatcgc 120

ctgattctga ttcatggcgc aggtagcttc ggccatccgc tggttaaaaa attcaaactg 180

aataaaaaga gcaccaacaa agacttattc agcattctga aagttcagga tagcgttcgc 240

gaactgaatc gcctgttcaa agatagcctg aataaagaaa aaatcccggc atataccatt 300

catccgagca gtattacccg taccgaaaat ggtgaaatta ttgatctgga actgaatacc 360

attcgccagg ccctgaaaga aggttatatt ccgctgctgt atggcgatat ggtgctggat 420

accaaaaatc gcgcaagtgt tctgagtggt gatcgtctgg tgagcttcct ggcacaggaa 480

ctgaaaccga ataaagttgg catggcaacc accaccccgg tgctggataa aaataatcag 540

aaaattgacc tgatcaccca gaccgatctg gaaaatattg gcgaaagcaa tagcaccgat 600

gttaccggtg gcatgctgaa taaagttaat gaactgctga aaaccagagc aaaaagctat 660

atcttcaatg caaaaaagcg caaagcactg gaaaaattca ttaaaggtaa gaatatcggc 720

accgaagttg aatatgatga taaaggtaaa aagacctgac tgaaagctt 769

<210> 189

<211> 243

<212> PRT

<213> Acidiplasma cupricumulans

<400> 189

Met Ile Ile Leu Lys Leu Gly Gly Ser Ile Ile Thr Asp Lys Lys Thr

1 5 10 15

Tyr Arg Lys Phe Glu Glu Asp Arg Thr Arg Lys Ile Ile Ala Glu Ile

20 25 30

Ser Lys Ile Lys Asp Lys Phe Ile Ile Ile His Gly Gly Gly Ser Phe

35 40 45

Gly His Ile Met Ala Lys Glu Tyr Asn Ile Pro Gly Arg Leu Asn Lys

50 55 60

Arg Ser Leu Tyr Tyr Met Ser Leu Ile His Tyr Asp Met Ser Asp Leu

65 70 75 80

Asn Met Arg Val Ser Lys Ile Leu Ser Glu Tyr Gly Met Gly Asn Ile

85 90 95

Pro Val Pro Pro Ser Thr Tyr Ile Tyr Gly Lys Lys Lys Asn Tyr Asp

100 105 110

Ile Phe Arg Tyr Tyr Val Lys Asn Asn Ile Met Pro Val Ser Tyr Gly

115 120 125

Asp Val Tyr Ile Lys Asn Arg Asn Tyr Ile Gly Ile Tyr Ser Gly Asp

130 135 140

Asp Ile Ile Tyr Asp Leu Ser Arg Ile Phe Met Pro Glu Lys Val Ile

145 150 155 160

Phe Phe Ser Asp Val Asp Gly Ile Phe Asp Lys Asn Pro Lys Ile His

165 170 175

Lys Asp Ala Lys Leu Leu Lys Thr Val Asn Lys Asp Phe Asn Phe Glu

180 185 190

Asn Asp Ser Ile Asp Val Thr Gly Gly Ile Ile Asn Lys Tyr Asn Ser

195 200 205

Met Val Lys Ile Ser Lys Leu Gly Ile Lys Val Tyr Leu Ile Asn Gly

210 215 220

Leu Tyr Pro Glu Arg Ile Lys Asp Ile Gly Lys Asp Asn Phe Tyr Gly

225 230 235 240

Thr Val Val

<210> 190

<211> 732

<212> DNA

<213> Acidiplasma cupricumulans

<400> 190

atgataatat taaagcttgg tggcagtata attacagaca aaaaaacata cagaaaattt 60

gaggaggata ggacaagaaa aattattgct gaaatatcga aaattaaaga taaatttatt 120

attatacatg gaggcggatc ttttggccac ataatggcca aggaatataa cataccgggc 180

aggcttaata aaaggtcatt atattacatg agccttatac attatgatat gtcagatctc 240

aatatgaggg tttcaaaaat tctttcagag tacggcatgg gaaatatacc ggtgccacca 300

tcaacatata tttatggcaa aaaaaagaat tatgacatct ttaggtatta tgtaaaaaat 360

aatattatgc ctgtgagtta tggagatgtt tacataaaaa atagaaatta cattggcata 420

tattctggag atgatataat ttatgatcta tcaagaatat tcatgccgga aaaggttata 480

ttttttagtg atgttgatgg tatatttgat aaaaatccaa aaatacataa ggatgcaaaa 540

ctgctaaaaa cagtgaataa agattttaat tttgaaaatg attcaataga tgttactggt 600

ggaattatta ataagtacaa ttcaatggtt aaaatttcaa aacttggcat aaaagtttat 660

ttaataaatg gattatatcc agagagaata aaagatatag gaaaagataa tttttatgga 720

acggtggtat aa 732

<210> 191

<211> 742

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 191

atgatcatcc tgaaactggg tggtagtatt attaccgata aaaaaaccta ccgtaagttc 60

gaagaagatc gtacccgtaa aattattgcc gaaattagta aaatcaagga caaattcatc 120

atcatccatg gtggcggcag cttcggccat attatggcaa aagaatataa tatcccgggc 180

cgcctgaata aacgcagtct gtattatatg agcctgattc attatgatat gagcgatctg 240

aatatgcgtg tgagcaaaat tctgagtgaa tatggtatgg gtaatattcc ggttccgccg 300

agtacctata tctatggtaa aaaaaaaaac tacgacatct tccgttacta tgttaaaaat 360

aacatcatgc cggttagtta tggcgatgtg tatattaaaa accgcaatta tatcggcatc 420

tatagtggtg atgatattat ctatgacctg agtcgtatct tcatgccgga aaaagtgatc 480

ttcttcagcg atgttgatgg tatcttcgat aaaaatccga aaattcataa ggacgccaaa 540

ctgctgaaaa ccgttaataa agacttcaac ttcgaaaatg acagcattga tgtgaccggc 600

ggtattatta ataaatataa tagcatggtg aagatcagca aactgggcat taaagtgtat 660

ctgattaatg gtctgtaccc ggaacgtatt aaagatattg gcaaagataa cttctacggt 720

accgtggtgt gactgaaagc tt 742

<210> 192

<211> 244

<212> PRT

<213> Aciduliprofundum species

<400> 192

Met Leu Leu Val Lys Met Gly Gly Ser Val Ile Thr Asp Lys Arg Val

1 5 10 15

Tyr Arg Arg Phe Arg Glu Asp Val Met Glu Arg Ile Val Lys Tyr Leu

20 25 30

Pro Lys Glu Asp Leu Ile Ile Val His Gly Gly Gly Ser Phe Gly His

35 40 45

Pro Leu Ala Lys Lys Tyr Gly Ile Thr Glu Gly Phe Ser Glu Glu Lys

50 55 60

Thr Met Gly Phe Ala Glu Ile Gly Arg Asp Met Glu Asp Leu Asn Leu

65 70 75 80

Arg Ile Ile Glu Ile Leu Ile Glu Asn Asp Ile Pro Ala Val Ser Ile

85 90 95

Ala Pro His Ser Phe His Ile Phe Gly Glu Glu Met Asp Leu His Ile

100 105 110

Phe Glu Arg Phe Leu Ser Leu Gly Leu Val Pro Val Thr Tyr Gly Asp

115 120 125

Ile Ile Leu Asp Ser Ser Gln Gly Ile Asn Ile Cys Ser Gly Asp Tyr

130 135 140

Leu Met Leu Gln Leu Ala Arg Glu Phe Arg Pro Glu Lys Val Ile Phe

145 150 155 160

Leu Thr Asp Val Asp Gly Ile Tyr Asp Arg Asp Pro Ser Glu Gln Gly

165 170 175

Ala Glu Leu Ile Glu Val Leu Arg Arg Asp Ser Lys Val Glu Thr Ile

180 185 190

Ile Lys Val Asp Asp Val Thr Gly Gly Val Ala Tyr Lys Ile Ser Ile

195 200 205

Met Arg Lys Ile Ala Arg Tyr Ser Arg Val Tyr Val Leu Asn Gly Phe

210 215 220

His Pro Glu Arg Ile Glu Asn Val Leu Asn Asp Glu Asp Phe Val Gly

225 230 235 240

Thr Val Val Glu

<210> 193

<211> 735

<212> DNA

<213> Aciduliprofundum species

<400> 193

atgctcctgg tgaagatggg gggaagcgtg ataacagata agagggttta cagaaggttc 60

cgggaagatg tgatggagag gatagtcaaa tatcttccaa aggaggattt gataattgtg 120

catggtggag gttcctttgg tcatcctctg gcaaagaaat acgggataac ggagggattc 180

tcagaggaaa agaccatggg atttgcagag ataggaaggg atatggagga tcttaatctg 240

aggatcatag aaattttgat agagaatgac attcctgccg tatccattgc gccccattcc 300

ttccatattt tcggagagga aatggatctc cacatatttg agagattcct ctctctgggt 360

ttggtgcccg ttacctacgg ggatataatc cttgattctt cgcagggtat aaacatatgc 420

tctggagatt acctgatgct tcaacttgcc agagaattca ggcccgagaa ggttatattc 480

ctcacagatg tggacggcat atacgatagg gatccctcag aacagggagc agaactcata 540

gaggtgctga ggagggatag caaggtagag acgatcataa aggtggatga tgttactgga 600

ggggttgcct acaaaatatc catcatgagg aaaattgcga ggtacagcag ggtatatgtg 660

cttaatggat ttcatcccga gaggatagag aatgttttaa atgatgaaga ttttgtaggg 720

acggtggtgg aatga 735

<210> 194

<211> 745

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 194

atgctgctgg ttaaaatggg cggtagcgtt attaccgata aacgcgtgta tcgtcgcttc 60

cgcgaagatg ttatggaacg tattgttaaa tacctgccga aagaagactt aattattgtt 120

catggtggcg gtagcttcgg ccatccgctg gcaaaaaaat atggtattac cgaaggcttc 180

agcgaagaaa aaaccatggg cttcgcagaa attggccgtg atatggaaga cttaaatctg 240

cgtattattg aaatcctgat cgaaaatgat atcccggcag tgagtattgc cccgcatagc 300

ttccatatct tcggcgaaga aatggatctg catatcttcg aacgcttcct gagcctgggc 360

ctggttccgg ttacctatgg tgatattatt ctggatagta gccagggtat taatatctgt 420

agcggcgatt atctgatgct gcaactggcc cgtgagttcc gcccggaaaa agtgatcttc 480

ctgaccgatg tggatggcat ctatgatcgc gatccgagtg aacagggcgc cgaactgatt 540

gaagttctgc gtcgtgatag caaagttgaa accattatta aagtggatga cgttaccggt 600

ggtgtggcat ataaaattag cattatgcgc aaaatcgccc gttatagccg tgtgtatgtt 660

ctgaatggct tccatccgga acgtattgaa aatgttctga atgatgaaga cttcgtgggt 720

accgttgttg aatgactgaa agctt 745

<210> 195

<211> 268

<212> PRT

<213> Euryarchaeota archaeon

<400> 195

Met Gly Ser Glu Met Gly Leu Arg Val Ala Ile Lys Leu Gly Gly Gly

1 5 10 15

Leu Ile Thr Asp Lys Gly Ser Met Lys Lys Phe Asp Gln Lys Ala Val

20 25 30

Glu Lys Val Val Asp Ser Leu Ser Ser Val Ser Glu Leu Gly Ala Ser

35 40 45

Ile Val Leu Val His Gly Ala Gly Ser Phe Gly His Leu Leu Ala Lys

50 55 60

Lys Trp Gly Ile Ala Asn Gly Phe Asn Ile Gln Leu Glu Lys Glu Gln

65 70 75 80

Leu Glu Ala Val Arg Glu Ile Arg Ser Asp Met Arg Glu Leu Asn Ala

85 90 95

Leu Ile Ile Gly Lys Met Glu Glu Arg Gly Leu Glu Cys Ile Gly Tyr

100 105 110

Pro Pro Ser Asp Trp Ala Arg Gly Thr Gly Ala Leu Phe Thr Gly Asp

115 120 125

Val Ser Ile Phe Glu Arg Gly Ser Arg Gln Pro Ile Pro Val Thr Phe

130 135 140

Gly Asp Val Val Asp Thr Glu Asp Glu Ser Arg Phe Gly Ile Leu Ser

145 150 155 160

Gly Asp Asp Leu Met Leu Arg Leu Ser Thr Glu Leu Glu Val Thr His

165 170 175

Ser Ile Phe Leu Ile Gly Asp Ser Glu Gly Val Leu Thr Gly Pro Pro

180 185 190

Ala Glu Arg Asp Ser Glu Leu Ile Thr His Leu Gly Ser Glu Thr Lys

195 200 205

Ile Lys Gly Glu His Asp Ala Glu Ile Asp Val Thr Gly Gly Ile Gly

210 215 220

Leu Lys Ile Glu Arg Ala Leu Glu Ile Ala Lys Val Val Asp Glu Val

225 230 235 240

Trp Ile Ile Asp Gly Arg Glu Pro Asp Arg Val Leu Glu Leu Leu Thr

245 250 255

Ser Gly Glu Thr Thr Gly Thr Lys Ile Leu Asn Gly

260 265

<210> 196

<211> 807

<212> DNA

<213> Euryarchaeota archaeon

<400> 196

ttggggtcgg aaatgggact cagggtagca ataaaattag gagggggcct aattactgac 60

aagggttcta tgaagaaatt cgaccaaaag gccgttgaaa aggttgtgga ctcgctaagt 120

tctgtttctg aattgggggc ttcaatcgtg ctggttcacg gagctggctc ttttggacat 180

ctgctggcaa agaaatgggg gattgctaat ggattcaata ttcaactgga gaaggagcag 240

ttggaagcag taagagaaat tcgttcagat atgagggaat taaatgccct gatcatagga 300

aagatggaag aaagaggttt ggaatgcatt ggctatcccc cctctgattg ggccaggggc 360

actggagcac tttttactgg ggatgtttca atattcgaaa ggggtagtag acagccaatt 420

cctgtaacat ttggtgatgt tgttgatact gaggacgagt ctaggtttgg tatattgtca 480

ggagacgatt tgatgctacg tttgtctact gaattagaag tcacgcatag catttttctc 540

attggggatt ctgagggagt tttgactggc cctccagcag aaagagattc tgaattgatt 600

acgcatttag gatctgaaac caaaattaag ggggagcatg atgcagaaat cgatgttact 660

ggggggattg gattgaaaat agaaagggct ctcgagattg caaaggtagt ggatgaagtg 720

tggataattg acggtagaga accagataga gttcttgaat tattgacatc cggggaaact 780

acagggacta agattctgaa cggttga 807

<210> 197

<211> 817

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 197

atgggcagtg aaatgggcct gcgtgttgcc attaaactgg gtggcggcct gattaccgat 60

aaaggcagta tgaaaaaatt cgatcagaaa gccgttgaaa aagttgtgga tagcctgagc 120

agcgttagcg aactgggtgc aagcattgtt ctggtgcatg gtgcaggcag cttcggccat 180

ctgctggcaa aaaaatgggg tattgcaaat ggcttcaata ttcagctgga aaaagaacag 240

ctggaagccg tgcgcgaaat tcgcagcgat atgcgcgaac tgaatgccct gattattggt 300

aaaatggaag aacgcggtct ggaatgcatt ggttatccgc cgagcgattg ggcccgtggt 360

accggtgcac tgttcaccgg tgatgtgagc atcttcgaac gtggcagccg tcagccgatt 420

ccggtgacct tcggtgatgt tgtggatacc gaagatgaaa gccgcttcgg cattctgagc 480

ggtgatgatc tgatgctgcg tctgagtacc gaactggaag tgacccatag catcttcctg 540

attggcgata gcgaaggtgt tctgaccggc ccgccggcag aacgtgatag cgaactgatt 600

acccatctgg gcagtgaaac caaaattaaa ggcgaacatg atgccgaaat tgatgtgacc 660

ggtggcattg gtctgaaaat tgaacgtgca ctggaaattg caaaagttgt tgatgaagtg 720

tggattattg atggtcgtga accggatcgc gtgctggaac tgctgaccag cggcgaaacc 780

accggtacca aaattctgaa tggctgactg aaagctt 817

<210> 198

<211> 260

<212> PRT

<213> Nitrososphaera evergladensis

<400> 198

Met Gln Lys Leu Ala Leu Val Lys Leu Gly Gly Ser Val Ile Thr Phe

1 5 10 15

Lys Asp Lys Ala Leu Thr Ala Asn Thr Gly Ala Ile Asp Gly Ile Ser

20 25 30

Gly Ala Leu Val Gln Leu Asp Met Pro Val Ile Val Val His Gly Gly

35 40 45

Gly Ser Phe Gly His His Trp Ser Val Gln Tyr Asp Met His Thr Lys

50 55 60

Pro Ala Pro Tyr Asp Pro His Gly Val Ala Val Val His Glu Ser Met

65 70 75 80

Ile Ala Leu Asn Gln Ile Ile Val Asn Ser Met Ile Lys Ala Gly Ala

85 90 95

Asn Pro Tyr Ala Val Ala Pro Cys Met Phe Thr Thr Gly His Lys Ala

100 105 110

Ile Ala Ala Lys Val Arg Gln Leu Tyr Glu Met Ala Lys Ala Asn Asn

115 120 125

Val Ile Pro Val Thr Phe Gly Asp Val Val His Met Gly Gly Arg Lys

130 135 140

Tyr Ser Ile Leu Ser Gly Asp Ala Leu Met Ser Ile Ile Ala Lys Val

145 150 155 160

Leu Lys Pro Ser Arg Val Ile Phe Ala Thr Asn Val Asp Gly Ile Tyr

165 170 175

Arg Asp Met Lys Thr Arg Glu Leu Val Gln Glu Leu Lys Ser Ala Arg

180 185 190

Arg Asn Gly Asp Pro Val Glu Phe Ser Lys Thr Ala Gly Ala Asp Val

195 200 205

Thr Gly Gly Met Gln Arg Lys Val Arg Glu Ala Phe Lys Ile Ala Ser

210 215 220

Met Gly Met Asp Val Val Leu Val Asn Gly Leu Tyr Pro Glu Arg Ile

225 230 235 240

Val Gln Ala Ala His Gly Glu Val Gln Thr Gly Thr Val Val Val Lys

245 250 255

Lys Gly Arg Lys

260

<210> 199

<211> 783

<212> DNA

<213> Nitrososphaera evergladensis

<400> 199

atgcagaaac ttgcacttgt caagctggga ggctctgtca tcaccttcaa ggacaaggca 60

cttacagcaa acactggcgc aatagatggc atatccggcg cacttgtaca gcttgacatg 120

cctgtcattg ttgtccacgg cggggggtct tttggccacc actggtctgt gcagtacgac 180

atgcacacca agcctgcgcc ctacgacccg cacggagtgg ccgtggtgca cgaatcgatg 240

attgcgttaa accagataat cgtaaattcc atgataaagg caggcgcaaa cccgtacgcc 300

gttgcaccct gcatgttcac gacgggccat aaagcgattg cagcaaaggt aaggcagctg 360

tacgaaatgg ccaaggcaaa caacgtaatc cctgtcacgt ttggcgacgt ggtccacatg 420

ggcggccgga aatactctat tctttccggc gacgcgctga tgtccatcat cgcaaaggtg 480

ctaaagccgt caagggtcat atttgccacc aacgtcgacg gcatttaccg ggacatgaag 540

acgagggaac tcgtacagga gctaaagtcg gcaaggcgga atggtgatcc cgtggagttc 600

tcaaagacgg ccggcgccga cgtgacgggc ggcatgcagc gcaaggtaag ggaagcattt 660

aagattgcat ctatgggtat ggatgtcgtg ctggtaaatg ggctttatcc tgagcgcata 720

gtccaggcgg cgcacggcga ggttcaaaca ggcaccgtag tagtaaagaa ggggaggaaa 780

taa 783

<210> 200

<211> 793

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 200

atgcagaaac tggccctggt gaaactgggt ggtagcgtta ttaccttcaa agataaagcc 60

ctgaccgcca ataccggtgc aattgatggt attagcggtg cactggtgca gctggatatg 120

ccggttattg tggtgcatgg tggtggcagc ttcggtcatc attggagcgt gcagtatgat 180

atgcatacca aaccggcccc gtatgatccg catggtgtgg ccgttgtgca tgaaagcatg 240

attgcactga atcagattat tgtgaatagc atgattaagg caggtgccaa tccgtatgca 300

gttgccccgt gtatgttcac caccggtcat aaagccattg cagccaaagt tcgccagctg 360

tatgaaatgg ccaaagcaaa taatgttatc ccggttacct tcggcgatgt ggtgcacatg 420

ggtggtcgta aatatagcat tctgagtggt gatgcactga tgagcattat tgcaaaagtg 480

ctgaaaccga gtcgcgttat cttcgcaacc aatgttgatg gtatctatcg cgatatgaaa 540

accagagaac tggttcagga actgaaaagc gcccgtcgta atggtgatcc ggtggagttc 600

agtaaaaccg ccggtgccga tgttaccggc ggcatgcagc gcaaagtgcg cgaagccttc 660

aaaattgcca gcatgggtat ggatgtggtg ctggtgaatg gtctgtatcc ggaacgcatt 720

gtgcaggccg cccatggtga agttcagacc ggtaccgtgg tggtgaaaaa aggtcgtaaa 780

tgactgaaag ctt 793

<210> 201

<211> 256

<212> PRT

<213> 织里甲烷咸菌（Methanosalsum zhilinae）

<400> 201

Met Ser Gln His Lys Asn Ile Thr Ile Leu Lys Ile Gly Gly Ser Val

1 5 10 15

Ile Thr Asp Lys Ser Ser Asp Ile Gly Lys Val Gln Ile Glu Glu Ile

20 25 30

Glu Arg Ile Cys Gln Glu Ile Ser Gly Tyr Ser Asn Asp Leu Ile Ile

35 40 45

Val His Gly Ala Gly Ser Tyr Gly His Pro Leu Ala Lys Lys Tyr Asp

50 55 60

Leu Asp Asn Ile Pro Asp Pro Lys Gly Ala Ile Ile Thr His Ser Ser

65 70 75 80

Val Lys Ser Leu Asn Glu Ile Met Val Ser Ser Leu Gln Lys Ala Gly

85 90 95

Ile Asp Ala Val Ser Val His Pro Leu Asn Asn Thr Val Ser Asn Asp

100 105 110

Gly Arg Ile Ser Asp Met Phe Leu Ser Asn Ile His Ile Met Leu Glu

115 120 125

Asn Gly Leu Val Pro Val Ile His Gly Asp Val Val Met Asp Ile Thr

130 135 140

Asn Thr Phe Ser Val Ile Ser Gly Asp Gln Ile Val Ser Tyr Leu Ala

145 150 155 160

Asn Lys Leu Lys Ala Ser Arg Val Gly Ile Gly Ser Ile Glu Asp Gly

165 170 175

Val Met Asp Asn Lys Gly Lys Thr Leu Thr Lys Ile Thr Ser Ser Asn

180 185 190

Phe Lys Glu Ile Glu Lys Phe Leu Gly Val Ser Lys Asn Thr Asp Val

195 200 205

Thr Gly Gly Met Leu Gly Lys Val Asn Glu Leu Leu Gln Leu Cys Glu

210 215 220

Ile Thr Gly Ala Thr Ser Tyr Ile Phe Asn Ala Lys Lys Pro Asn Asn

225 230 235 240

Ile Ser Tyr Phe Leu Ser Gly His Asn Ile Gly Thr Ala Ile Lys Lys

245 250 255

<210> 202

<211> 771

<212> DNA

<213> 织里甲烷咸菌（Methanosalsum zhilinae）

<400> 202

atgagtcaac ataaaaacat tacaattctg aaaataggtg gaagtgtaat tactgataag 60

agttctgata ttgggaaggt tcaaatcgaa gaaatcgaac gtatatgtca ggaaatatct 120

ggatatagca atgatcttat aattgtccat ggtgccggct cctatggtca cccccttgca 180

aaaaaatatg atctggacaa tattccagac ccaaaaggtg caattataac acatagttct 240

gtaaaatcgt taaatgagat tatggtaagc tcacttcaaa aagctggaat cgatgcagtt 300

tctgtccatc cgttaaataa cacagtctca aatgatggac gaatttctga catgttttta 360

tccaatatcc atatcatgct ggagaacggt ttagtcccgg tgatacatgg tgatgtggta 420

atggacataa caaatacttt ttctgttatt tccggggatc aaattgtttc gtatcttgca 480

aataaactga aagcttcccg ggttggaatt ggaagtattg aagatggggt tatggacaat 540

aaaggaaaaa ctcttaccaa aatcaccagt tccaatttta aagaaataga aaaatttcta 600

ggcgtatcca aaaatactga tgtcaccggt ggtatgcttg gaaaagttaa tgaactactt 660

cagctttgtg aaataaccgg tgccacttcc tacattttca atgcgaaaaa accaaataac 720

atttcgtatt ttttaagtgg acataacata ggaactgcaa taaaaaaata g 771

<210> 203

<211> 781

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 203

atgagccagc ataaaaatat caccattctg aaaatcggcg gcagcgttat taccgataaa 60

agcagcgata ttggtaaagt tcagattgaa gaaatcgaac gcatctgtca ggaaattagt 120

ggctatagta atgatctgat tatcgttcat ggcgccggta gttatggcca tccgctggcc 180

aaaaaatatg atctggataa tattccggac ccgaaaggtg caattattac ccatagcagt 240

gtgaaaagcc tgaatgaaat tatggttagt agcctgcaaa aagcaggcat tgatgcagtt 300

agtgtgcatc cgctgaataa taccgtgagt aatgatggtc gcattagtga tatgttcctg 360

agtaatattc acattatgct ggaaaatggc ctggtgccgg ttattcatgg cgatgttgtg 420

atggatatta ccaatacctt cagcgtgatt agcggtgatc agattgtgag ctatctggca 480

aataaactga aagcaagtcg tgttggcatt ggcagtattg aagatggcgt gatggataat 540

aaaggcaaaa ccttaaccaa aatcaccagt agcaacttca aagaaattga aaaattcctg 600

ggtgttagca aaaataccga tgtgaccggc ggtatgctgg gcaaagttaa tgaactgctg 660

caactgtgtg aaattaccgg tgccaccagc tatatcttca atgccaaaaa accgaataac 720

attagttact tcctgagtgg tcataatatt ggtaccgcca ttaaaaaatg actgaaagct 780

t 781

<210> 204

<211> 260

<212> PRT

<213> Euryarchaeota archaeon

<400> 204

Met Leu Leu Val Lys Phe Gly Gly Ser Val Ile Thr Val Lys Ser Lys

1 5 10 15

Tyr Arg Thr Leu Arg Gly Ala Asp Leu Ser Arg Leu Ala Arg Glu Leu

20 25 30

Ala Ala Ala His Asp Pro Glu Ala Gly Thr Val Leu Val His Gly Ala

35 40 45

Gly Ser Tyr Gly His Ile Leu Ala Ala Lys His Arg Leu Lys Glu Gly

50 55 60

Phe Arg Asp Asp Ala Gln Leu Thr Ala Val Ala Gln Val Gln Arg Asp

65 70 75 80

Val Arg Ala Leu Asp Leu Lys Val Leu Asp Ala Leu Leu Arg Ala Arg

85 90 95

Leu Arg Pro Ile Ala Ile Pro Pro Gly Thr Asp Ala Val Val Asp Lys

100 105 110

Asp Gly Arg Phe His Leu Asp Thr Ala Pro Phe Glu Asp Tyr Arg Met

115 120 125

Arg Gly Phe Leu Pro Val Ser Phe Gly Asp Val Val Arg Asp Glu Gly

130 135 140

Arg Leu Phe Thr Ile Ala Ser Gly Asp Asp Val Val Leu Glu Leu Ala

145 150 155 160

Arg Phe Tyr Arg Pro Glu Arg Val Leu Phe Val Ala Asp Val Asp Gly

165 170 175

Val Phe Thr Ala Asp Pro Lys Arg Asp Arg Ala Ala Thr Leu Leu Asp

180 185 190

Val Val Asp Gly Pro Ala Leu Glu Arg Ile Ala Phe Ser Asp Ala Ala

195 200 205

Gly Arg Asp Val Thr Gly Gly Leu Arg Ala Lys Leu Glu Arg Met Arg

210 215 220

Glu Ile Ala Gly Val Ala Lys Asp Val Arg Ile Ile Asn Gly Leu Ala

225 230 235 240

Lys Gly Arg Leu Glu Arg Ala Ala Lys Gly Gly Asp Val Pro Gly Thr

245 250 255

Arg Val Val Ala

260

<210> 205

<211> 783

<212> DNA

<213> Euryarchaeota archaeon

<400> 205

atgcttctcg tgaagttcgg cggctccgtg atcacggtga agtcgaagta ccgcaccctg 60

cggggggcgg acctctcccg cctcgcgcgg gagctcgcgg cggcccacga cccggaggcg 120

ggaacggtcc tcgtccacgg cgcgggctcg tacggccaca tcctcgcggc gaagcaccgc 180

ctgaaggagg gcttccgcga cgacgcccag ctcaccgcgg tcgcgcaggt ccagcgggac 240

gtgcgggccc tcgacctcaa ggtcctcgac gcgctcttgc gggcccgcct ccgcccgatc 300

gcgatccccc cgggcacgga cgcggtcgtc gacaaggacg gccgcttcca cctcgacacc 360

gcgcccttcg aggactaccg gatgcggggg ttcctccccg tctccttcgg ggacgtcgtg 420

cgggacgagg ggcggctctt cacgatcgcc tccggggacg acgtcgtcct cgagctcgcg 480

aggttctacc gcccggagcg ggtcctcttc gtcgcggacg tggacggcgt gttcacggcg 540

gacccgaagc gggaccgggc cgcgaccctc ctcgacgtcg tcgacggtcc cgccctcgag 600

cggatcgcgt tctcggacgc ggcggggagg gacgtgacgg gggggctgcg cgccaagctc 660

gagaggatgc gggagatcgc gggggtcgcg aaggacgtgc ggatcatcaa cggcctcgcg 720

aagggccgcc tcgagagggc ggcgaagggc ggggacgtgc cgggcacgcg ggtggtggcg 780

tag 783

<210> 206

<211> 793

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 206

atgctgctgg tgaaattcgg tggtagtgtt attaccgtga aaagcaaata tcgtaccctg 60

cgtggcgccg atctgagccg cctggcacgt gaactggcag cagcccatga tccggaagca 120

ggtaccgttc tggttcatgg tgcaggtagc tatggtcata ttctggcagc aaaacatcgt 180

ctgaaagaag gcttccgtga tgatgcacag ctgaccgcag tggcccaggt tcagcgtgat 240

gtgcgcgccc tggatctgaa agtgctggat gccctgctgc gtgcccgtct gcgtccgatt 300

gccattccgc cgggtaccga tgcagtggtt gataaagatg gtcgcttcca tctggatacc 360

gccccgttcg aagattatcg tatgcgtggc ttcctgccgg ttagcttcgg cgatgttgtg 420

cgtgatgaag gtcgcctgtt caccattgcc agcggcgatg atgttgtgct ggaactggca 480

cgcttctatc gtccggaacg cgtgctgttc gttgcagatg ttgatggcgt gttcaccgca 540

gatccgaaac gtgatcgtgc cgcaaccctg ctggatgtgg ttgatggtcc ggccctggaa 600

cgtattgcct tcagtgatgc agcaggccgc gatgttaccg gcggtctgcg tgccaaactg 660

gaacgcatgc gtgaaattgc cggtgtggcc aaagatgtgc gtattattaa tggcctggca 720

aaaggccgtc tggaacgtgc agccaaaggc ggtgatgtgc cgggcacccg cgtggttgca 780

tgactgaaag ctt 793

<210> 207

<211> 264

<212> PRT

<213> Archaeoglobus sulfaticallidus

<400> 207

Met Arg Asp Asp Glu Ile Ile Ile Leu Lys Ile Gly Gly Ser Ile Ile

1 5 10 15

Thr Asp Lys Ser Lys Gly Ser Phe Glu Lys Ala Lys Phe Asp Val Ile

20 25 30

Glu Arg Ile Ser Arg Glu Ile Ser Gln Phe Leu Met Glu Asn Arg Lys

35 40 45

Lys Ile Ile Leu Val His Gly Ala Gly Ser Phe Gly His Pro His Val

50 55 60

Glu Lys Tyr Asn Leu Lys Glu Lys Lys Glu Leu Arg Gly Val Leu Thr

65 70 75 80

Thr His Phe Ala Cys Lys Arg Leu Asn Ser Ile Val Cys Asp Lys Leu

85 90 95

Leu Glu Asn Gly Val His Ala Leu Gly Ile His Pro Leu Thr Ser Phe

100 105 110

Phe Leu Asp Glu Lys Leu Asn Ile Asn Ile Asp Leu Phe Leu Asp Met

115 120 125

Leu Thr Glu Asp Ile Ile Pro Val Thr His Gly Asp Met Ile Tyr Asn

130 135 140

Arg Lys Arg Lys Phe Phe Glu Val Leu Ser Gly Asp Ser Ile Ile Ser

145 150 155 160

Ala Leu Met Gly Glu Leu Ser Asp Arg Lys Leu Arg Val Gly Leu Ala

165 170 175

Thr Asp Val Asp Gly Val Ile Tyr Asp Gly Arg Val Val Lys Glu Ile

180 185 190

Asn Ala Asp Asn Phe Glu Glu Val Leu Ser Ala Ile Asp Lys Ser Ala

195 200 205

Met Asp Ala Glu Arg Lys Ser Asp Val Thr Gly Gly Met Lys Gly Lys

210 215 220

Ile Gly Ala Leu Phe Arg Ser Ile His Gly Ser Glu Val Arg Ile Phe

225 230 235 240

Asn Gly Ala Ile Glu Gly Asn Ile Ile Lys Phe Leu Lys Gly Glu Ala

245 250 255

Leu Gly Thr Leu Ile Arg Gly Lys

260

<210> 208

<211> 795

<212> DNA

<213> Archaeoglobus sulfaticallidus

<400> 208

ttgagggatg atgagataat tatactcaag atcggtggat cgatcataac ggataaatca 60

aaggggagct tcgagaaagc aaaattcgat gtgatagaga ggatttccag ggaaatcagc 120

cagtttttga tggagaacag gaaaaagatt atactggtcc atggagcagg ttctttcggg 180

catccgcatg tcgagaaata caacctgaaa gagaagaaag agttgagagg agttttaaca 240

actcattttg cctgcaagag actgaactcg attgtatgcg ataaactttt agagaatgga 300

gttcatgctc tgggaatcca tcccttaacg agctttttct tggatgaaaa gctgaacatc 360

aacatcgatc tctttctgga tatgctgaca gaggacataa ttcctgttac tcatggcgac 420

atgatctaca acagaaagcg aaagttcttc gaggttcttt caggagattc aataatctcc 480

gccttgatgg gagagctttc tgacagaaag ctgagagttg gattagcaac tgatgtcgat 540

ggagtgattt atgatggcag ggttgttaag gaaatcaacg cagataactt tgaagaggtt 600

ttatccgcaa tagacaaatc tgcaatggat gcagagagaa aatcggatgt taccggtgga 660

atgaagggaa agatcggagc cctgttcaga tccattcatg gttctgaggt gaggatattc 720

aatggagcga ttgagggaaa cattattaag tttctgaaag gtgaggcatt aggcacactt 780

atcaggggga aatga 795

<210> 209

<211> 805

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 209

atgcgtgatg atgaaattat catcctgaaa attggtggta gtattattac cgataagagc 60

aaaggcagct tcgaaaaagc caaattcgat gtgattgaac gtattagccg cgaaattagt 120

cagttcctga tggaaaatcg caaaaaaatt atcctggttc atggtgcagg tagcttcggc 180

catccgcatg ttgaaaaata taatctgaaa gaaaagaagg agctgcgtgg cgttctgacc 240

acccacttcg cctgtaaacg cctgaatagc attgtgtgtg ataaactgct ggaaaatggt 300

gttcatgccc tgggcattca tccgctgacc agcttcttcc tggatgaaaa actgaatatt 360

aacatcgatc tgttcctgga tatgctgacc gaagatatta ttccggtgac ccatggtgat 420

atgatctata atcgcaaacg taaattcttc gaagtgctga gcggtgatag cattattagc 480

gcactgatgg gtgaactgag cgatcgtaaa ctgcgcgtgg gcctggcaac cgatgtggat 540

ggtgtgatct atgatggtcg cgtggtgaaa gaaattaatg cagataactt cgaagaggtt 600

ctgagtgcca ttgataaaag cgccatggat gcagaacgta aaagtgatgt gaccggtggc 660

atgaaaggta aaattggcgc cctgttccgt agtattcatg gcagtgaagt tcgcatcttc 720

aatggtgcca ttgaaggcaa tattattaaa ttcctgaagg gtgaagccct gggtaccctg 780

attcgcggca aatgactgaa agctt 805

<210> 210

<211> 242

<212> PRT

<213> Thermoplasmatales archaeon

<400> 210

Met Asp Ile Ile Lys Ile Gly Gly Ser Leu Leu Thr Asp Lys Thr Val

1 5 10 15

Tyr Arg Lys Phe Tyr Gln Lys Lys Thr Ser Thr Ile Ile Gln Arg Leu

20 25 30

Ser Arg Leu Glu Ser Phe Ile Leu Val His Gly Gly Gly Ser Phe Gly

35 40 45

His Tyr Ile Ser Glu Lys Tyr Gly Leu Pro Gly Glu Val Ser Glu Glu

50 55 60

Arg Ile Lys Ala Ala Ala Ile Val Lys Tyr Asp Met Ala Asp Leu Asn

65 70 75 80

Gln Arg Ile Val Lys Met Leu Asn Asn Met Gly Arg Pro Ala Ile Gly

85 90 95

Ile Ser Pro Phe Phe Leu Asp Arg Asn Asn Ser Phe Asn Tyr Asp Leu

100 105 110

Val Lys Lys Val Leu Glu Met Asn Phe Ile Pro Val Leu Tyr Gly Asp

115 120 125

Val Tyr Leu Arg Asn His Glu Ile Gly Ile Leu Ser Gly Asp His Ile

130 135 140

Met Val Ser Leu Ala Glu Met Phe Lys Pro Glu Arg Ala Ile Phe Leu

145 150 155 160

Ser Asp Val Asp Gly Val Phe Asp Met Asp Pro Lys Lys Tyr Arg Asn

165 170 175

Ala Ala Met Ile Arg Lys Tyr Ser Lys Glu Ile Val Asn Phe Gly Ala

180 185 190

Ile Ser Asn Asp Val Thr Gly Gly Met Glu Leu Lys Phe Arg Ser Met

195 200 205

Ile Asn Cys Lys Lys Ala Gly Val Lys Thr Tyr Leu Leu Asn Gly Asn

210 215 220

Phe Pro Glu Arg Ile Glu Asn Ile Asp Lys Glu Asp Phe Val Gly Thr

225 230 235 240

Glu Phe

<210> 211

<211> 729

<212> DNA

<213> Thermoplasmatales archaeon

<400> 211

atggatataa tcaagatcgg tggtagcctg cttacagaca agacagtata caggaagttt 60

taccagaaaa aaacatcaac catcatccag agactctcaa gattggaaag tttcatactt 120

gttcatgggg gaggttcctt cggtcattac atcagtgaaa aatacggttt gccgggggag 180

gtatcagagg agagaataaa ggctgcagcc atagtcaaat atgatatggc tgatctgaac 240

cagaggatag tgaaaatgct taacaacatg ggaagacctg caattggcat ctcaccattt 300

ttccttgata gaaataactc attcaattac gatctggtga agaaggtact ggaaatgaat 360

ttcattcctg tactttatgg ggatgtgtat ttaaggaatc atgaaattgg aatcctgtca 420

ggagatcata ttatggtttc acttgctgaa atgttcaaac ctgagagggc aatcttcctc 480

agtgatgttg atggtgtttt tgacatggat ccaaagaaat acagaaatgc agcaatgatc 540

aggaagtatt caaaggaaat agtgaatttt ggtgccatat ccaatgatgt tactggtggc 600

atggaactca agttcagatc aatgataaac tgcaaaaaag caggtgttaa aacatattta 660

ctcaacggga attttccaga aagaattgaa aatatagata aagaagattt tgtggggact 720

gaattttaa 729

<210> 212

<211> 739

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 212

atggatatca tcaagatcgg tggtagtctg ctgaccgata aaaccgtgta tcgcaaattc 60

tatcagaaaa aaaccagcac cattattcag cgcctgagtc gcctggaatc attcattctg 120

gttcatggcg gcggtagctt cggccattat attagtgaaa aatatggtct gccgggtgaa 180

gtgagcgaag aacgtattaa agcagcagcc attgttaaat atgatatggc agacttaaac 240

cagcgtattg ttaaaatgct gaataatatg ggccgcccgg ccattggcat tagcccgttc 300

ttcctggatc gcaataatag cttcaattat gatctggtta agaaggttct ggaaatgaac 360

ttcattccgg ttctgtatgg cgatgtgtat ctgcgtaatc atgaaattgg cattctgagc 420

ggtgatcata ttatggtgag cctggcagaa atgttcaaac cggaacgcgc aatcttcctg 480

agcgatgttg atggcgtgtt cgatatggac cctaaaaaat atcgtaatgc agcaatgatt 540

cgtaaatata gcaaagaaat cgtgaacttc ggtgcaatta gcaatgatgt gaccggcggc 600

atggaactga aattccgcag tatgattaat tgcaaaaagg ccggtgttaa aacctatctg 660

ctgaatggta acttcccgga acgtattgaa aatattgata aagaagactt cgtgggtacc 720

gagttctgac tgaaagctt 739

<210> 213

<211> 264

<212> PRT

<213> Thermoplasmatales archaeon

<400> 213

Met Arg Lys Arg Val Leu Val Glu Gly Leu Ile Phe Tyr Ile His Val

1 5 10 15

Thr Ile Arg Pro Met Met Gln Leu Val Lys Leu Gly Gly Ser Val Ile

20 25 30

Thr Val Lys Ser Arg Tyr Arg Tyr Phe Leu Gln Gln Thr Thr Arg Lys

35 40 45

Ile Val His Glu Leu Lys Lys Ile Asp Asp Glu Ile Ile Leu Val His

50 55 60

Gly Gly Gly Ser Phe Gly His Ile Lys Ala Ser Glu Tyr Gln Leu Ser

65 70 75 80

Gly Ser Pro Ala Ser Ser Ser Arg Ser Gly Ile Ser Ile Val His Arg

85 90 95

Asp Met Met Glu Leu Asp Gln Arg Ile Ile Gly Val Met Leu Ser Glu

100 105 110

Ser Met Pro Gly Ile Gly Met Ala Pro Ser Ser Phe Pro Asp Pro Phe

115 120 125

Ile Pro Pro Phe Glu Leu Ile Glu Ser Tyr Met Lys Ala Gly Leu Phe

130 135 140

Pro Val Thr Phe Gly Asp Val Tyr Ile Arg Asn Gly Asn Ser Gly Ile

145 150 155 160

Val Ser Gly Asp Asp Leu Met Leu Ala Leu Ala Leu His Phe Lys Pro

165 170 175

Thr Arg Val Met Phe Leu Ser Asp Val Asp Gly Ile Phe Asp Arg Asn

180 185 190

Pro Lys Thr His Pro Asp Ala Glu Leu Arg Lys Glu Val Lys Gly Asn

195 200 205

Glu Ala Phe Glu Leu Asn Arg Glu Asp Val Thr Gly Gly Met Gly Lys

210 215 220

Lys Leu Gly Ile Met Lys Lys Ile Ala Glu Thr Gly Thr Thr Val Tyr

225 230 235 240

Leu Leu Asn Gly Arg His Pro Glu Arg Ile Trp Asn Met Gly Thr Arg

245 250 255

Asp Phe Ile Gly Thr Val Ile His

260

<210> 214

<211> 795

<212> DNA

<213> Thermoplasmatales archaeon

<400> 214

atgaggaaga gagtcttggt tgagggtctt atattttata tccatgtaac aattcgccca 60

atgatgcagc tggtaaaact cggagggagc gtcataaccg tcaaatcaag atatcgttat 120

tttctccagc agacaacaag aaaaattgtg cacgaactta aaaaaattga tgacgaaata 180

attcttgttc acgggggcgg atcattcggt cacataaagg ccagcgaata ccagttgagc 240

ggaagcccgg catcctcatc acgtagtgga atttcaatag tgcacaggga tatgatggaa 300

cttgatcaga ggattattgg tgtgatgcta tccgaaagca tgccaggcat tggaatggcc 360

ccctcatctt ttccggaccc tttcattccc cccttcgagc tgattgaatc ctacatgaag 420

gcagggctgt ttccggtgac ctttggtgat gtatatatcc ggaatgggaa ttcaggtatt 480

gtatccggtg acgacctgat gctcgccctt gcgcttcatt tcaagccaac aagagtgatg 540

ttcctgagcg atgttgacgg aatattcgac agaaatccaa agactcaccc agatgccgaa 600

ctcaggaaag aggtgaaggg aaatgaggcg tttgagctga acagagagga cgtgacaggc 660

ggaatgggta aaaaattggg aataatgaag aagatagcag aaactggaac aactgtatac 720

ctcctcaacg ggaggcatcc ggagaggatc tggaatatgg ggacgcggga tttcatcggt 780

acggtgatac attga 795

<210> 215

<211> 805

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 215

atgcgcaaac gcgtgctggt ggaaggtctg atcttctata ttcatgttac cattcgtccg 60

atgatgcagc tggttaaact gggcggtagt gttattaccg tgaaaagtcg ttatcgttac 120

ttcctgcaac agaccacccg caaaattgtg catgaactga aaaaaattga cgatgaaatc 180

atcctggttc atggcggtgg tagcttcggc catattaaag ccagcgaata tcagctgagc 240

ggcagcccgg ccagcagctc acgtagtggc attagcattg tgcatcgcga tatgatggaa 300

ctggatcagc gtattattgg tgtgatgctg agcgaaagta tgccgggtat tggcatggcc 360

ccgagcagct tcccggaccc gttcattccg ccgttcgaac tgattgaaag ctatatgaaa 420

gcaggtctgt tcccggttac cttcggcgat gtgtatattc gtaatggtaa tagcggtatt 480

gtgagcggcg atgatctgat gctggccctg gcactgcact tcaaaccgac ccgcgtgatg 540

ttcctgagtg atgttgatgg tatcttcgat cgtaatccga aaacacatcc ggatgcagaa 600

ctgcgcaaag aagttaaagg taatgaagcc ttcgaactga atcgcgaaga tgtgaccggt 660

ggcatgggta aaaaactggg cattatgaaa aaaatcgccg aaaccggcac caccgtgtat 720

ctgctgaatg gccgtcatcc ggaacgtatc tggaatatgg gcacccgcga cttcattggc 780

accgttattc attgactgaa agctt 805

<210> 216

<211> 259

<212> PRT

<213> Archaeoglobales archaeon

<400> 216

Met Asp Thr Leu Ile Ile Lys Leu Gly Gly Ser Ala Ile Thr Asn Lys

1 5 10 15

Glu Arg Arg Tyr Glu Val Arg Arg Lys Val Val Glu Arg Ile Ala Lys

20 25 30

Glu Val Lys Ile Leu Ile Lys Asn Tyr Lys Leu Val Leu Val His Gly

35 40 45

Gly Gly Ser Phe Gly His Pro Thr Ala Lys Glu Tyr Asn Ile His Leu

50 55 60

Gly Tyr Phe Ser Asn His Gln Leu Ile Gly Tyr Ser Lys Val Arg Tyr

65 70 75 80

Phe Met Thr Gln Leu Asn Gln Ile Ile Leu Glu Tyr Phe Ile Lys Ser

85 90 95

Gly Val Pro Ala Val Thr Leu His Thr Ser Asn Ile Leu Lys Ala Asn

100 105 110

Asp Gly Lys Ile Ser Ser Phe Asn Ile Gly Leu Leu Ile Glu Tyr Thr

115 120 125

Lys Met Gly Phe Thr Pro Val Val Tyr Gly Asp Ala Val Leu Asp Glu

130 135 140

Lys Arg Gly Phe Ser Ile Ile Ser Gly Asp Gln Ile Val Ser Tyr Leu

145 150 155 160

Ala Ile Arg Leu Lys Pro Ile Lys Val Ile Leu Gly Thr Asp Val Asp

165 170 175

Gly Ile Tyr Thr Gly Asn Pro Lys Lys Asp Ser Asn Ala Lys Leu Val

180 185 190

Lys Thr Leu Lys Ile Ser Lys Leu Ile Thr Ile Lys Ala Asp Lys Pro

195 200 205

Met Ile Asp Val Thr Gly Gly Ile Val Ala Lys Ile Asp Glu Met Arg

210 215 220

Lys Val Val Lys Ala Gly Ile Pro Val Ile Ile Gly Asn Ile Val Ser

225 230 235 240

Gly Asn Leu Ile Asp Leu Val Glu Glu Lys Thr Pro Lys Tyr Thr Lys

245 250 255

Ile Ile Met

<210> 217

<211> 780

<212> DNA

<213> Archaeoglobales archaeon

<400> 217

atggatacgt taataattaa gcttggcgga tcggctataa caaataaaga aagaagatac 60

gaagttagac gtaaggtcgt tgaaagaata gcaaaggaag ttaaaatcct tatcaaaaac 120

tacaaattag tattggtgca tggaggaggg agtttcggtc acccaacggc taaagaatac 180

aacatacacc taggatattt ttctaatcat cagcttattg gctatagcaa ggtaagatat 240

ttcatgacgc agcttaatca gataattcta gaatatttta taaaatctgg agttcctgca 300

gttacattgc atacttcgaa tatacttaag gcaaatgatg gaaaaatatc aagttttaac 360

atagggcttt taatagagta tacgaagatg ggatttacgc cggtagttta tggagacgct 420

gttttagacg aaaaaagagg attcagcata atttctggag atcagatagt ttcttatcta 480

gctataagat tgaagccaat taaggtcatt ttaggaacag atgtggatgg catatacacg 540

ggtaatccca aaaaagattc aaatgcaaaa ctcgtcaaaa cattaaaaat atccaagctt 600

ataactataa aagctgataa gccaatgatc gatgtaactg gtggaatagt agcaaaaata 660

gatgaaatga gaaaagttgt aaaagctgga ataccggtta taatcgggaa catcgtttca 720

ggaaacttga ttgatcttgt tgaagagaaa acacctaaat atacgaaaat cataatgtaa 780

<210> 218

<211> 790

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 218

atggataccc tgattattaa gctgggcggt agcgcaatta ccaataaaga acgtcgttat 60

gaagttcgtc gcaaagttgt tgaacgcatt gcaaaagaag tgaaaattct gattaagaac 120

tacaagctgg tgctggttca tggcggtggt agcttcggcc atccgaccgc aaaagaatat 180

aatattcatc tgggctactt cagcaatcat cagctgattg gctatagtaa agttcgctac 240

ttcatgaccc agctgaatca gattattctg gaatacttca ttaagagcgg tgtgccggca 300

gtgaccctgc ataccagcaa tattctgaaa gccaatgatg gtaaaatcag tagcttcaat 360

atcggcctgc tgattgaata taccaaaatg ggcttcaccc cggttgtgta tggcgatgcc 420

gttctggatg aaaaacgcgg cttcagcatt attagtggcg atcagattgt gagctatctg 480

gccattcgtc tgaaaccgat taaagttatt ctgggcaccg atgttgatgg tatctatacc 540

ggtaatccga aaaaagatag taatgcaaaa ctggttaaga ccctgaaaat tagcaaactg 600

attaccatta aggccgataa accgatgatt gatgtgaccg gtggcattgt ggccaaaatt 660

gatgaaatgc gtaaagtggt taaggccggt attccggtga ttattggtaa tattgtgagt 720

ggtaatctga ttgatctggt ggaagaaaaa acacctaaat ataccaaaat catcatgtga 780

ctgaaagctt 790

<210> 219

<211> 238

<212> PRT

<213> 火棒菌属（Pyrobaculum species）

<400> 219

Met Phe Ile Val Lys Phe Gly Gly Ser Ala Ile Thr Asp Lys Thr Lys

1 5 10 15

Pro Tyr Thr Phe Leu Arg Gly Arg Ile Ala Gln Ala Ala Pro Ala Leu

20 25 30

Arg Gly Arg Arg Ala Val Leu Ile His Gly Ala Gly Ser Phe Ala His

35 40 45

Pro His Val Lys Ala Phe Gly Leu Thr Pro Thr Gly Ile Ala Leu Thr

50 55 60

Lys Ala Thr Leu Arg Arg Leu Thr Ala Leu Val Ala Glu Glu Leu Leu

65 70 75 80

Glu Ala Gly Leu Pro Ala Met Pro Val Glu Pro Ser Asp Val Phe Trp

85 90 95

Gly Arg Ser Leu Val Arg Arg Glu Val Ile Thr His Ala Leu Glu Arg

100 105 110

Gly Leu Tyr Pro Leu Leu His Gly Asp Ile Val Pro Ser Asp Glu Gly

115 120 125

Tyr Val Val Val Ser Gly Asp Asp Ile Ala Val Glu Leu Ala Arg Leu

130 135 140

Tyr Lys Pro Ser Ala Val Ile Phe Leu Met Asn Val Asp Gly Ile Tyr

145 150 155 160

Thr Ala Ser Pro Gly Ser Pro Asn Ala Glu Lys Ile Arg Arg Leu Lys

165 170 175

Ser Asn Val Tyr Leu Glu Gly Thr Ala Gly Val Asp Val Thr Gly Gly

180 185 190

Ile Arg Lys Lys Val Glu Ala Gly Leu Ala Ile Ala Ala Leu Gly Thr

195 200 205

Pro Val Phe Tyr Cys Ser Ile Ser Asp Arg Glu Ser Leu Glu Ile Ile

210 215 220

Ala Arg Gly Gly Ala Pro Glu Asn Cys Thr Ser Val Glu Pro

225 230 235

<210> 220

<211> 717

<212> DNA

<213> 火棒菌属（Pyrobaculum species）

<400> 220

atgtttatcg tgaaattcgg cggctccgcc atcaccgaca agacgaagcc ctacaccttc 60

ctccgggggc ggatcgcgca agccgcgccg gcgctccgcg ggaggagggc cgtcttaatc 120

cacggcgcgg gctccttcgc acacccccac gtcaaggcct tcggactgac gccaaccggc 180

atagccctga ccaaggccac gttgaggcgc ctcacagccc tagtggccga ggagctacta 240

gaggctggcc tgccggccat gccggtggaa cccagcgacg tgttctgggg cagatcgctg 300

gtccggcgtg aggtcatcac acatgcgctg gagagggggc tgtaccccct cctccacggc 360

gacatagtcc cctccgacga gggctacgtg gtggtcagcg gcgacgacat cgcggttgag 420

ctcgccaggc tctacaagcc cagcgccgtg atcttcctca tgaacgtaga cggcatctac 480

acggcgtctc ccggaagccc caacgccgaa aaaataagaa ggctaaaaag taacgtatat 540

ttagagggga ccgccggtgt agacgtcacg gggggtataa ggaagaaggt ggaggctgga 600

ttggccatag cggctctggg aacccccgtg ttctactgtt caatatctga cagagaatcc 660

ctcgagataa tcgcaagagg cggagcccca gagaactgca cctctgtgga gccctag 717

<210> 221

<211> 727

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 221

atgttcatcg ttaagttcgg tggcagtgca attaccgata aaaccaaacc gtataccttc 60

ctgcgcggcc gtattgcaca ggccgcccct gcactgcgtg gtcgtcgtgc agttctgatt 120

catggcgcag gtagcttcgc ccatccgcat gtgaaagcat tcggcctgac cccgaccggt 180

attgccctga ccaaagcaac cctgcgtcgc ctgaccgccc tggttgccga agaactgctg 240

gaagccggcc tgccggccat gcctgtggaa cctagtgatg tgttctgggg tcgcagcctg 300

gtgcgccgcg aagtgattac ccatgccctg gaacgcggcc tgtatccgct gctgcatggt 360

gatattgttc cgagtgatga aggctatgtt gttgttagcg gcgatgatat tgcagtggaa 420

ctggcacgtc tgtataaacc gagtgcagtg atcttcctga tgaatgtgga tggtatctat 480

accgcaagtc cgggtagccc gaatgccgaa aaaattcgtc gtctgaaaag taatgtgtat 540

ctggaaggca ccgccggcgt ggatgtgacc ggcggtattc gtaaaaaagt ggaagccggc 600

ttagcaattg cagcactggg taccccggtg ttctattgta gtattagcga tcgtgaaagc 660

ctggaaatta ttgcacgtgg cggtgccccg gaaaattgta ccagtgtgga accgtgactg 720

aaagctt 727

<210> 222

<211> 249

<212> PRT

<213> 甲烷丝菌属（Methanosaeta species）

<400> 222

Met Lys Val Leu Lys Ile Gly Gly Ser Ile Leu Thr Asp Lys Arg Arg

1 5 10 15

Ile Gly Ala Ala Arg Leu Gly Glu Ile Gln Arg Val Ala Asp Glu Ile

20 25 30

Ala Val Asn Pro Glu Asp Leu Val Leu Val His Gly Ala Gly Ser Phe

35 40 45

Gly His Ile Pro Ala Arg Arg Tyr Gly Leu Pro Glu Asn Phe Asn Pro

50 55 60

Glu Gly Leu Arg Ala Thr His Ser Ser Val Val Lys Leu Asn Asp Leu

65 70 75 80

Val Ile Asp Ala Leu Cys Lys Ala Gly Val Phe Ala Met Pro Val His

85 90 95

Pro Phe Ser Cys Val Leu Leu Arg Asp Gly Arg Ile Asp Ser Phe Ala

100 105 110

Leu Lys Pro Ile Glu Glu Met Val Arg Asp Gly Leu Leu Pro Val Leu

115 120 125

His Gly Asp Val Ala Met Asp Ala Thr Arg Lys Ala Gly Ile Val Ser

130 135 140

Gly Asp Gln Ile Val Thr Tyr Val Ala Arg Ala Leu Gln Ala Glu Val

145 150 155 160

Val Ala Val Gly Cys Asn Val Asp Gly Val Leu Phe Ser Gly Glu Pro

165 170 175

Leu Arg Glu Leu Thr Arg Lys Asp Leu Pro Ser Ile Glu Gly Ala Leu

180 185 190

Gly Gly Ser Ala Gly Val Asp Val Thr Gly Gly Met Arg Gly Lys Leu

195 200 205

Leu Glu Met Leu Asp Leu Ala Asp Ala Gly Ile Met Ser Val Ile Phe

210 215 220

Asn Ala Gly Thr Glu Gly Asn Val Leu Arg Ala Leu Arg Gly Glu Pro

225 230 235 240

Ile Gly Thr Met Val Arg Arg Pro Asn

245

<210> 223

<211> 750

<212> DNA

<213> 甲烷丝菌属（Methanosaeta species）

<400> 223

atgaaggttc tgaagatcgg cggaagtatt ctgacggaca agagaaggat cggcgccgct 60

cgtctcgggg agattcagcg cgttgccgac gagatcgccg tcaatcctga ggatctggtg 120

ctggtccacg gcgcaggttc ctttgggcac atccctgcaa gaagatatgg acttccagag 180

aacttcaacc cagagggact cagggcgact catagctcag tggtcaagct caacgacctt 240

gtcatagacg ctctatgcaa agccggcgtc ttcgcgatgc cagtccatcc attctcctgc 300

gttctcctaa gagacggcag gatagacagc tttgccttga agcccatcga ggagatggtc 360

cgcgacggac tgcttcctgt tttgcatggc gatgtggcca tggatgcgac gcgaaaggct 420

ggaatcgtct ccggagatca gattgtgacg tacgttgcca gggccctgca ggcggaggtc 480

gtggctgtgg gatgtaacgt tgacggcgtg ctattctccg gagagccgct gagggagctg 540

acccgcaagg atctgccttc gatcgagggg gctcttggag ggagcgctgg ggtcgatgtg 600

accggcggca tgcgtggaaa actgctggag atgctggatc ttgccgatgc cggaataatg 660

tcagtgatct tcaatgcagg cactgaaggc aacgttctgc gggcactgcg tggcgagccc 720

attggcacaa tggtgcggag gccgaattga 750

<210> 224

<211> 760

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 224

atgaaggttc tgaaaatcgg cggcagtatt ctgaccgata aacgtcgtat tggtgccgcc 60

cgcctgggtg aaattcagcg tgtggccgat gaaattgcag ttaatccgga agacttagtg 120

ctggtgcatg gtgcaggtag cttcggtcat attccggcac gccgttatgg tctgccggaa 180

aacttcaatc cggaaggcct gcgcgccacc catagcagtg ttgtgaaact gaatgatctg 240

gtgattgatg ccctgtgtaa agcaggtgtg ttcgccatgc cggttcatcc gttcagctgt 300

gttctgctgc gtgatggccg tattgatagc ttcgcactga aaccgattga agaaatggtg 360

cgtgatggcc tgctgccggt tctgcatggt gatgttgcaa tggatgcaac ccgtaaagca 420

ggtattgtta gcggcgatca gattgttacc tatgtggcac gcgcactgca agcagaagtg 480

gtggcagtgg gctgtaatgt tgatggcgtt ctgttcagtg gtgaaccgct gcgcgaactg 540

acccgcaaag acttaccgag tattgaaggc gcactgggtg gcagcgcagg tgtggatgtt 600

accggtggta tgcgtggcaa actgctggaa atgctggatc tggcagatgc aggtattatg 660

agtgttatct tcaatgcagg taccgaaggc aatgttctgc gtgccctgcg tggcgaaccg 720

attggcacca tggtgcgtcg tccgaattga ctgaaagctt 760

<210> 225

<211> 261

<212> PRT

<213> 嗜热产甲烷球菌（Methanococcus aeolicus）

<400> 225

Met Leu Ala Ile Leu Lys Leu Gly Gly Ser Ile Leu Cys Asp Lys Asn

1 5 10 15

Thr Pro Phe Ser Val Lys Thr Asp Asp Leu Lys Arg Met Ser Leu Glu

20 25 30

Ile Lys Lys Ala Ile Glu Tyr Tyr Lys Asn Lys Gly Glu Ile Leu Asn

35 40 45

Leu Ile Ile Val His Gly Gly Gly Ser Phe Gly His Pro Val Ala Lys

50 55 60

Lys Tyr Ile Lys Thr Asn Glu Asn Gly Glu Lys Val Phe Phe Asn Met

65 70 75 80

Glu Lys Gly Phe Trp Asp Ile Gln Asn Ala Met Arg Lys Phe Asn Asn

85 90 95

Ile Val Ile Glu Glu Leu His Gln Gln Glu Val Pro Ala Val Ser Ile

100 105 110

Gln Pro Ser Ser Phe Ile Leu Phe Asp Glu Lys Gly Glu Leu His Phe

115 120 125

Asp Thr Tyr Ala Ile Glu Gly Met Leu Lys Arg Asn Leu Ile Pro Val

130 135 140

Ile His Gly Asp Ile Val Leu Lys Gly Glu Asn Asn Tyr Lys Ile Phe

145 150 155 160

Ser Gly Asp His Ala Leu Pro Tyr Leu Ser Lys Lys Leu Asn Pro Asp

165 170 175

Leu Ser Leu His Ala Ser Asp Val Asp Gly Val Tyr Asp Leu Asp Lys

180 185 190

Lys Thr Ile Lys Lys Ile Asn Ser Asp Asn Ile Asn Asp Val Leu Lys

195 200 205

Cys Leu Lys Pro Ser Asn Lys Gln Asp Ile Thr Gly Gly Met Tyr Leu

210 215 220

Lys Val Met Glu Cys Tyr Asn Leu Gly Ile Lys Thr Ile Ile Phe Asn

225 230 235 240

Gly Ser Lys Lys Asp Asn Ile Tyr Lys Ser Leu Ile Gly Glu Val Asn

245 250 255

Gly Thr Lys Ile Asn

260

<210> 226

<211> 786

<212> DNA

<213> 嗜热产甲烷球菌（Methanococcus aeolicus）

<400> 226

atgttggcca ttttaaaact tggagggagc atattatgcg ataaaaatac tcctttttca 60

gtaaaaacag atgatttaaa aagaatgtcc ttagagataa aaaaggcaat tgaatattat 120

aaaaataaag gagagatatt aaatttaata atcgttcatg gcggcggttc atttggacat 180

cctgttgcaa aaaaatacat taaaacaaat gaaaatggag aaaaagtatt ttttaacatg 240

gaaaaaggat tttgggatat tcaaaatgcc atgcgaaaat ttaataatat tgttattgag 300

gagctccatc aacaagaagt ccctgctgta tcaattcaac cttcttcatt tatattattt 360

gatgagaagg gggagctcca ctttgatacc tatgcaatag aaggaatgtt aaaaagaaat 420

ttaattcctg ttatacacgg cgatattgtg ttgaagggag aaaataacta taaaatattt 480

tccggggacc atgccctacc atatttatca aaaaaattaa atcctgattt aagcctacat 540

gcctccgatg tagatggcgt ttatgatttg gataaaaaaa caataaaaaa aattaattca 600

gataatataa acgatgtttt aaaatgttta aaaccatcaa ataaacagga cattacaggg 660

gggatgtatt taaaagtaat ggaatgttat aatttaggca taaaaaccat aatatttaat 720

ggtagtaaaa aagataatat atataagtca ttaattggag aggttaatgg aactaaaatt 780

aattaa 786

<210> 227

<211> 796

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 227

atgctggcca ttctgaaact gggtggtagc attctgtgtg ataaaaatac cccgttcagc 60

gttaaaaccg atgatctgaa acgcatgagt ctggaaatta aaaaagcaat tgagtactac 120

aagaacaagg gtgaaattct gaatctgatt attgtgcatg gcggcggcag cttcggtcat 180

ccggtggcta aaaaatatat taaaaccaat gagaacggtg agaaagtgtt cttcaatatg 240

gaaaaaggct tctgggatat tcagaatgca atgcgtaaat tcaataacat tgtgattgag 300

gaactgcatc agcaggaagt tccggcagtt agtattcagc cgagtagctt cattctgttc 360

gatgaaaaag gcgaactgca cttcgatacc tatgccattg aaggcatgct gaaacgcaat 420

ctgattccgg tgattcatgg cgatattgtt ctgaaaggtg aaaataatta caagatattc 480

agcggtgatc atgcactgcc gtatctgagc aaaaaactga atccggatct gagcctgcat 540

gccagcgatg ttgatggtgt gtatgatctg gataaaaaaa ccattaagaa gatcaacagc 600

gataatatta acgatgtgct gaaatgtctg aaaccgagta ataaacagga tattaccggt 660

ggcatgtatc tgaaagttat ggaatgctat aacctgggca ttaaaaccat tatcttcaat 720

ggtagcaaga aagataacat ctataagagc ctgattggcg aagtgaatgg taccaaaatt 780

aattgactga aagctt 796

<210> 228

<211> 281

<212> PRT

<213> Heimdallarchaeota archaeon

<400> 228

Met Asn Ser Asp Glu Leu Cys Leu Ile Lys Leu Gly Gly Ala Ala Ile

1 5 10 15

Thr Asp Lys Thr Lys Asp Tyr Thr Met Arg Pro Glu Ile Ile Ser Ser

20 25 30

Val Leu Asn Glu Ile Ser Tyr Ser Asp Lys Lys Ala Ile Ile Ile His

35 40 45

Gly Ala Gly Ser Phe Ala His Asn Ile Ala Lys Glu Tyr Lys Leu Val

50 55 60

His Gly Leu Asp Ser Ala Val Ala Arg Asp Leu Gln Tyr Arg Gly Val

65 70 75 80

Ser Ile Thr Arg Arg Ser Leu Leu Asn Leu His Thr Ala Val Leu Asp

85 90 95

Ser Ala Leu Glu Ala Asn Leu Leu Pro Phe Ser Phe Pro Val Ser Ala

100 105 110

Ile Phe Val Ser Asp Gly Glu Gln Gln Leu Tyr Ser Lys Tyr Leu Asp

115 120 125

Gly Val Val Glu Ala Leu Asp Lys Gly Phe Thr Pro Ile Leu Tyr Gly

130 135 140

Asp Ile Ser Phe Asp Ile Lys Thr His Phe Arg Val Ile Ser Gly Asp

145 150 155 160

Arg Ile Leu Arg Val Leu Val Lys His Leu Lys Gly Leu Lys His Lys

165 170 175

Asp Asn Ser Leu Tyr Phe Asn Asn Ile Lys Val Phe Phe Gly Ser Asn

180 185 190

Val Asp Gly Leu Tyr Asp Lys Asp Pro Lys Asn Glu Asp Ala Lys Leu

195 200 205

Ile Asp Tyr Ile Thr Asn Asn Gln Ile Ala Glu Leu Ile Glu Thr Ala

210 215 220

Gly Glu Ser Ala Gly Thr Asp Val Thr Gly Gly Met Lys Gly Lys Leu

225 230 235 240

Met Glu Ile Lys Gln Ile Ser Asp Leu Gly Ser Glu Val Gln Ile Met

245 250 255

Asn Ile Met Glu Glu Asp Arg Met Tyr His Ala Leu Val Asn Glu Pro

260 265 270

Asp Ile Arg Thr Val Ile Thr Pro Asn

275 280

<210> 229

<211> 846

<212> DNA

<213> Heimdallarchaeota archaeon

<400> 229

atgaatagcg acgaattgtg tctgatcaaa cttggtggtg cagctatcac cgataaaacc 60

aaggattaca ccatgagacc agaaattatt tctagtgtct taaacgaaat tagttatagt 120

gacaaaaaag cgatcattat ccatggagca gggtcatttg ctcataatat agcaaaagaa 180

tataagctag ttcacggact tgattccgca gttgctcgag atttacaata tagaggcgtt 240

agcattacgc gtagatcatt attgaattta cataccgctg ttttggactc tgctttggag 300

gctaatcttc tcccattctc ttttcctgtg tcagcaattt ttgtttcaga cggagaacaa 360

caattgtatt cgaaatattt ggatggagta gttgaagcac tggataaagg ttttacaccc 420

attctttatg gggatatttc atttgacatt aaaactcatt tcagagtgat ttctggtgat 480

cgaatcctcc gagtcttggt taaacatcta aaagggttaa aacataaaga taatagcttg 540

tatttcaata atattaaagt attttttgga tctaatgttg atggattata tgataaagat 600

cctaaaaatg aggatgcaaa actaattgat tacattacaa ataaccaaat tgctgaatta 660

attgagactg ctggagaaag tgcaggaact gatgttactg ggggaatgaa aggtaaacta 720

atggaaatta aacaaattag tgatttgggg tctgaagtac aaataatgaa tattatggaa 780

gaagacagaa tgtatcatgc ccttgtaaat gaacctgata tcagaaccgt aattactccg 840

aattag 846

<210> 230

<211> 856

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 230

atgaacagtg atgaactgtg cctgattaaa ctgggtggtg cagccattac cgataaaacc 60

aaagattata ccatgcgccc ggaaattatt agcagtgttc tgaatgaaat cagttatagt 120

gataagaagg caattatcat ccatggtgcc ggtagcttcg cccataatat tgccaaagaa 180

tataaactgg tgcatggtct ggatagcgca gttgcacgcg atctgcaata tcgcggcgtg 240

agtattaccc gtcgcagcct gctgaatctg cataccgccg tgctggatag tgcactggaa 300

gccaatctgc tgccgttcag cttcccggtt agtgccatct tcgttagcga tggtgaacag 360

cagctgtata gcaaatatct ggatggcgtg gttgaagccc tggataaagg cttcaccccg 420

attctgtatg gcgatattag cttcgatatt aaaacacact tccgcgttat tagtggcgat 480

cgcattctgc gtgtgctggt taaacatctg aaaggtctga aacataaaga taatagtctg 540

tacttcaaca acatcaaagt gttcttcggt agtaatgttg atggtctgta tgataaagat 600

ccgaaaaatg aagatgccaa actgattgat tacattacca ataatcagat cgcagaactg 660

attgaaaccg caggtgaaag cgcaggtacc gatgttaccg gtggcatgaa aggtaaactg 720

atggaaatta aacagatcag cgatctgggt agcgaagttc agattatgaa tattatggaa 780

gaggatcgta tgtatcatgc actggttaat gaaccggata ttcgtaccgt gattaccccg 840

aattgactga aagctt 856

<210> 231

<211> 276

<212> PRT

<213> Uryarchaeota archaeon

<400> 231

Met Thr Leu Tyr Leu Phe Asp Asp Leu Ser Ile Ser Thr Lys Arg Ile

1 5 10 15

Met Ser Lys Glu Lys Ile Leu Leu Lys Phe Gly Gly Ser Leu Ile Thr

20 25 30

Glu Lys Met Ser Asp Thr Pro Lys Ile Asn Thr Ile Asn Leu Asp Arg

35 40 45

Ile Gly Lys Val Leu Asn Asn Lys Glu Tyr Asp Ile Ile Val Val His

50 55 60

Gly Ala Gly Ser Phe Gly His Pro Ile Ala Gln Lys Phe Asn Leu Ile

65 70 75 80

Asp Gly Leu Asn Glu Ser Pro Glu Gln Lys Lys Ser Ile Ala Glu Ile

85 90 95

Arg Glu Gln Met Glu Lys Leu Asn His Val Leu Cys Ser Ile Ile Glu

100 105 110

Lys Asn Gly Met Lys Thr Lys Ser Val Ile Pro Ser Lys Thr Met Ile

115 120 125

Thr Lys Gly Ala Arg Asn Ile Ala Lys Phe Pro Thr Glu Ile Phe Asp

130 135 140

Lys Cys Ile Glu Glu Gly Asn Ile Pro Ile Thr Phe Gly Asp Ala Thr

145 150 155 160

Asp Asp Glu Leu Gln Gly Ile Asn Ile Leu Ser Gly Asp Val Ile Met

165 170 175

Met Glu Leu Ala Arg Ile Tyr Lys Pro Ala Phe Ser Val Phe Val Met

180 185 190

Asp Leu Pro Gly Val Met Asp Gly Asp Pro Lys Ser Lys Asp Ser Lys

195 200 205

Val Ile Pro Arg Val Asp Ala Lys Ile Ile Arg Glu Leu Lys Glu Lys

210 215 220

Thr Phe Ser Asn Gly Asn Thr Asp Val Thr Gly Gly Leu Ile Gly Lys

225 230 235 240

Leu Glu Cys Ala Leu Glu Ile Ala Gln His Ser Gln Cys Trp Ile Thr

245 250 255

Asn Leu Asp Ser Leu Glu Met Val Leu Thr Gly Asn Pro Arg Gly Ser

260 265 270

Glu Val Val Leu

275

<210> 232

<211> 831

<212> DNA

<213> Uryarchaeota archaeon

<400> 232

atgacactct acctttttga cgacttatct atatctacaa agagaatcat gtctaaagaa 60

aaaattcttt taaaatttgg gggatcttta attaccgaaa aaatgagtga cacaccaaag 120

attaatacca taaatttaga cagaattgga aaagttttga ataacaaaga atatgatatt 180

attgtggtcc atggagccgg atcattcgga catccaattg ctcaaaaatt taatctaatt 240

gatggattaa acgaaagtcc agagcaaaaa aaatctattg ctgagataag agaacaaatg 300

gaaaaattaa atcatgtttt atgtagtatt attgaaaaaa atggaatgaa aactaaatct 360

gttatcccct ctaaaactat gatcactaag ggtgcccgaa atatcgctaa attccctact 420

gaaatatttg ataagtgtat tgaagaaggt aatataccca ttacatttgg tgatgctaca 480

gatgatgaat tacaaggaat taatatacta agtggtgatg ttataatgat ggaattagca 540

cgaatataca aacctgcttt ctcagtattt gtaatggatc tgcctggagt aatggatggc 600

gatccaaaat ctaaggatag taaagttatt cctagagttg acgcaaaaat cattagagaa 660

ttgaaagaaa aaacatttag caatggaaac acggatgtta ccggtggatt aattggaaaa 720

ttggaatgtg cactcgaaat agctcagcac agccaatgtt ggataactaa tttagactcc 780

ttggagatgg tattaactgg taatccaaga ggaagtgagg ttgttttatg a 831

<210> 233

<211> 841

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 233

atgaccctgt atctgttcga tgatctgagc attagtacca aacgcattat gagcaaagaa 60

aaaattctgc tgaagttcgg cggcagcctg attaccgaaa aaatgagtga taccccgaaa 120

attaatacca ttaatctgga tcgtatcggt aaagtgctga ataataaaga atacgatatc 180

atcgtggtgc atggtgcagg tagcttcggc catccgattg cccagaaatt caatctgatt 240

gatggcctga atgaaagccc ggaacagaaa aaaagtattg ccgaaattcg cgaacagatg 300

gaaaaactga atcatgttct gtgcagtatt attgaaaaga atggcatgaa aaccaagagc 360

gttattccga gcaaaaccat gattaccaaa ggcgcacgta atattgccaa attcccgacc 420

gaaatcttcg ataaatgtat tgaagaaggc aatatcccga ttaccttcgg tgatgcaacc 480

gatgatgaac tgcaaggtat taatattctg agtggtgatg ttattatgat ggaactggca 540

cgcatctata aaccggcctt cagcgtgttc gtgatggatc tgccgggtgt gatggatggc 600

gatccgaaaa gtaaagatag taaagttatc ccgcgtgtgg atgcaaaaat tattcgtgaa 660

ctgaaagaaa agaccttcag taatggtaat accgatgtta ccggtggcct gattggtaaa 720

ctggaatgtg ccctggaaat tgcccagcat agtcagtgtt ggattaccaa tctggatagt 780

ctggaaatgg tgctgaccgg caatccgcgc ggtagtgaag ttgtgctgtg actgaaagct 840

t 841

<210> 234

<211> 289

<212> PRT

<213> Archaeon species

<400> 234

Met Arg Lys Ser Asn Ile Asn Lys Lys Glu Ile Lys Glu Ile Pro Ile

1 5 10 15

Asn Asn Lys Lys Asn Ile Gly Leu Ser Asp Leu Val Val Ile Lys Phe

20 25 30

Gly Gly Ser Ser Ile Thr Lys Lys Ala Asp Asn Gln Phe Glu Met Asn

35 40 45

Tyr Glu Val Leu Asn Gln Ser Ala Glu Glu Leu Tyr Arg Ala Ile Lys

50 55 60

Lys Thr Lys Tyr Lys Val Ala Leu Ile Cys Gly Val Gly Pro Phe Gly

65 70 75 80

His Thr Asn Val Lys Lys Leu Asn Leu Asn Asp Gly Ile Lys Thr Arg

85 90 95

Glu Gln Glu Glu Gly Thr Gln Lys Thr Ile Val Asp Cys Asn Phe Val

100 105 110

Ala Gln Glu Thr Ser Thr Ala Leu Glu Lys Phe Gly Leu Lys Thr Lys

115 120 125

Ile Ile Pro Gly Tyr Leu Val Cys Lys Gln Asp Asn Arg Lys Ala Ile

130 135 140

Ser Phe Asp Thr Lys Glu Tyr Val Lys Ala Ile His Gly Gly Phe Ile

145 150 155 160

Pro Ile Thr Thr Gly Thr Met Val Lys Asp Lys Thr Leu Lys Trp Ser

165 170 175

Val Met Ser Gly Asp Thr Ala Val Ala Glu Leu Cys Lys Gln Leu Arg

180 185 190

Pro Arg Lys Val Ile Met Gly Thr Asp Val Asp Gly Ile Tyr Thr Ala

195 200 205

Asp Pro Lys Val Asn Pro Lys Ala Lys Leu Ile Glu Ser Ile Thr Lys

210 215 220

Glu Asn Val Pro Lys Ile Leu Glu Met Val Gly Glu Ser Asn Ser Val

225 230 235 240

Asp Val Thr Gly Gly Met Lys Gly Lys Leu Glu Lys Leu Ala Leu Thr

245 250 255

Leu Asn Gly Val Pro Gly Glu Ile Phe Asn Leu Phe Thr Lys Gly Asn

260 265 270

Leu Glu Lys Ala Phe Ile Gly Glu Glu Ile Lys Asp Thr Lys Ile Arg

275 280 285

Leu

<210> 235

<211> 870

<212> DNA

<213> Archaeon species

<400> 235

atgcgtaaat ctaatattaa caaaaaagaa ataaaagaaa ttcctattaa taataaaaaa 60

aatattgggt tgagtgattt agtagtaata aaatttgggg gttcttcaat aactaaaaaa 120

gcggataatc aatttgaaat gaattacgaa gtgctaaatc aatcagcaga agaactttat 180

agagcaataa aaaaaacaaa atataaagtt gcacttattt gtggggtagg cccatttgga 240

catactaatg taaaaaaact taatctaaat gatgggataa aaacaagaga acaagaagaa 300

ggaacacaaa aaacaattgt tgattgtaat tttgttgcac aagaaacttc tactgctcta 360

gaaaaattcg gactcaaaac aaaaataatt ccagggtatt tagtatgcaa gcaagacaat 420

agaaaagcaa tttcatttga tactaaagaa tatgtgaaag caattcatgg aggatttatt 480

ccgataacca ctgggacaat ggttaaagac aaaactttga aatggagtgt aatgagtgga 540

gacacagcag tagcagaact ctgcaaacaa ttaaggccaa gaaaagtaat aatggggact 600

gatgtggatg gaatttatac tgcggaccca aaagttaatc caaaagcaaa attaattgaa 660

agtattacaa aagaaaatgt tccaaaaatt ttggagatgg tgggagaatc aaattcagtt 720

gatgtaactg ggggaatgaa aggaaaatta gaaaaactag ccctaacact aaatggagtg 780

cctggagaga tatttaattt attcacaaaa ggaaatttag aaaaagcatt tattggagaa 840

gaaataaaag acacaaaaat aagattataa 870

<210> 236

<211> 880

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 236

atgcgtaaaa gcaatatcaa caagaaggaa attaaggaaa tcccgattaa taacaagaag 60

aatatcggcc tgagcgatct ggtggtgatt aaattcggtg gcagtagcat taccaaaaaa 120

gccgataatc agttcgaaat gaattatgaa gtgctgaatc agagtgccga agaactgtat 180

cgcgcaatta aaaaaaccaa atataaggtt gcgctgatct gtggcgttgg cccgttcggt 240

cataccaatg ttaaaaaact gaatctgaac gatggcatta aaaccagaga acaggaagaa 300

ggcacccaga aaaccattgt tgattgcaac ttcgttgcac aggaaaccag caccgcactg 360

gaaaaattcg gtctgaaaac caaaattatc ccgggttatc tggtgtgtaa acaggataat 420

cgtaaagcaa ttagcttcga taccaaagaa tatgtgaaag ccattcatgg cggcttcatt 480

ccgattacca ccggtaccat ggtgaaagat aaaaccttaa aatggagtgt gatgagtggc 540

gataccgcag tggcagaact gtgtaaacag ctgcgtccgc gcaaagtgat tatgggtacc 600

gatgttgatg gtatctatac cgcagatccg aaagtgaatc cgaaagccaa actgattgaa 660

agtattacca aagaaaacgt tccgaaaatt ctggaaatgg ttggcgaaag taatagtgtg 720

gatgtgaccg gtggtatgaa aggcaaactg gaaaaactgg cactgaccct gaatggtgtt 780

ccgggcgaaa tcttcaatct gttcaccaaa ggcaatctgg aaaaagcatt cattggtgaa 840

gaaattaagg ataccaaaat ccgtctgtga ctgaaagctt 880

<210> 237

<211> 268

<212> PRT

<213> Thorarchaeota archaeon

<400> 237

Met Ile Gln Leu Lys His Leu Thr Ile Val Lys Leu Gly Gly Ser Val

1 5 10 15

Ile Thr His Lys Asp Ser Thr Pro Pro Lys Val Asn Glu Ala Asn Leu

20 25 30

Ser Arg Ile Ala Asn Glu Leu Lys Val His Thr Arg Gly Glu Leu Ile

35 40 45

Ile Ile Leu Gly Gly Gly Ala His Gly His Gln Ala Ala His Ser His

50 55 60

Gly Phe Ala Asp Pro Thr Ser Pro Lys Glu Leu Leu Val Lys Gly Ile

65 70 75 80

Pro Pro Ile Arg His Asn Met Ser Ala Leu Ala Ser Ser Val Glu Thr

85 90 95

Ser Leu Ser Glu Glu Gly Ile Pro Ala Ile Val Ile Pro Pro Phe Val

100 105 110

Ser Val Thr Leu Arg Asn Gly Leu Ile His Asp Tyr Pro Thr Asn Ile

115 120 125

Ile Arg Lys Ser Leu Asp Asn Gly Leu Val Val Ile Thr His Gly Asp

130 135 140

Val Cys Phe Asp Glu Glu Asn Ile Val Ser Ile Leu Ser Gly Asp Thr

145 150 155 160

Ile Ala Val Tyr Leu Ala Lys Glu Leu Asp Ala Lys Thr Ile Leu Ile

165 170 175

Gly Thr Asp Val Asp Gly Val Leu Asp Asp Asn Pro Lys Thr Asn Pro

180 185 190

Ser Ala Lys His Ile Pro Val Ile Asn Gln Glu Asn Lys Asp Thr Ile

195 200 205

Leu Ser Lys Thr Gly Pro Ser Thr Asn Thr Asp Val Thr Gly Gly Met

210 215 220

Ser Lys Lys Val Thr Glu Leu Leu Glu Ile Ser Arg Gln Asn Arg Glu

225 230 235 240

Ile Ile Ile Phe Asn Leu Thr Val Pro Asp Arg Leu Lys Phe Leu Leu

245 250 255

Gln Asn Lys Thr Thr Ile Cys Thr Arg Ile Gln Ser

260 265

<210> 238

<211> 807

<212> DNA

<213> Thorarchaeota archaeon

<400> 238

gtgatacaat tgaaacacct cacaattgtg aaactaggcg ggtcagtgat aacacacaaa 60

gactcgactc ctcctaaagt caatgaggca aacttgtccc gaattgccaa cgaactaaaa 120

gtacatacta gaggtgaact aatcattatt cttggcggcg gagctcacgg tcaccaagcc 180

gcccattcac atggctttgc tgatcctaca agtcccaaag agcttcttgt aaaaggaatt 240

ccaccaatac ggcataatat gtccgcactt gcatcctctg ttgaaacaag tctaagcgaa 300

gaaggaatcc ctgcaatcgt cattcctccc tttgtgtctg taacactaag aaatggtttg 360

atacatgatt atccaaccaa cataattaga aagtcattgg acaatgggct tgttgtaata 420

acccatggag atgtttgttt tgatgaagaa aacattgtgt ctattctcag tggggataca 480

attgcagttt accttgcaaa agagctagat gcaaaaacca tactcattgg aaccgatgtt 540

gacggagtct tagacgataa tccaaaaaca aacccatcag ccaaacacat acctgtaata 600

aatcaagaaa acaaggacac cattctatcc aaaacaggac cttcgaccaa taccgatgta 660

acaggcggca tgtcgaaaaa agtgaccgag cttctcgaaa tttctagaca gaacagagag 720

attatcatct tcaacctcac agttcccgat cgtcttaagt ttctattaca aaataaaaca 780

accatctgca caagaattca gtcataa 807

<210> 239

<211> 817

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 239

atgatccagc tgaaacatct gaccattgtt aaactgggcg gcagcgtgat tacccataaa 60

gatagcaccc cgccgaaagt gaatgaagca aatctgagtc gcattgccaa tgaactgaaa 120

gttcataccc gcggcgaact gattattatt ctgggcggtg gcgcccatgg ccatcaggct 180

gctcatagtc atggcttcgc cgatccgacc agcccgaaag aactgctggt gaaaggcatt 240

ccgccgattc gtcataatat gagtgcactg gcaagcagcg tggaaaccag cctgagcgaa 300

gaaggcattc cggccattgt tattccgccg ttcgtgagtg ttaccctgcg caatggtctg 360

attcatgatt atccgaccaa tattattcgt aaaagtctgg ataacggcct ggtggttatt 420

acccatggtg atgtgtgctt cgatgaagaa aatattgtta gtatcctgag cggtgatacc 480

attgcagtgt atctggcaaa agaactggat gccaaaacca ttctgattgg taccgatgtg 540

gatggtgttc tggatgataa tccgaaaacc aatccgagcg ccaaacatat tccggtgatt 600

aatcaggaaa ataaagatac catcctgagt aaaaccggcc cgagcaccaa taccgatgtg 660

accggtggta tgagtaaaaa agttaccgaa ctgctggaaa ttagccgcca gaatcgtgaa 720

attattatct tcaatctgac cgttccggat cgcctgaaat tcctgctgca aaataaaacc 780

accatctgta cccgtattca gagttgactg aaagctt 817

<210> 240

<211> 324

<212> PRT

<213> 热丁香色链霉菌（Streptomyces thermolilacinus）

<400> 240

Met Thr Ala Asp Val Ser Ala Ala Pro Arg Thr Ala Pro Gly Ala Ala

1 5 10 15

Pro Ala Thr Ala Ala Ala Gly Glu Pro Gly Leu Leu Val Leu Lys Val

20 25 30

Gly Gly Ser Leu Leu Ser Asp Lys Arg His Ser Gly Glu Thr Asp His

35 40 45

Ala Thr Ile Asp Ala Tyr Ala Ser Gln Val Ala Glu Leu Val Thr Ala

50 55 60

His Pro Gly Arg Ile Val Leu Val Thr Gly Gly Gly Ala Leu Cys His

65 70 75 80

Pro Val Gly Leu Arg Ile Lys Ala Ala Lys Asp Asp Pro Tyr Ala Ala

85 90 95

Val Ala Leu Thr Glu Pro Ala Phe Arg Met Arg Trp Ala Trp Thr Thr

100 105 110

Ala Leu Arg Ala His Gly Val Arg Ala Val Pro Leu Gln Thr Thr Ser

115 120 125

Met Leu Asn Glu Leu Ala Asp Gly Thr Thr Val Thr Glu Thr Gly Val

130 135 140

Val Ser Arg Leu Leu Ala Glu Gly Ala Leu Pro Val Leu Ser Ser Asp

145 150 155 160

Cys Val Val Thr Ala Thr Gly Thr Leu Arg Ile Leu Ser Ser Asp Asp

165 170 175

Val Pro Gly Val Val Leu Asp Ala Ala Val Ala Pro Gly Pro Val Arg

180 185 190

Val Val Ala Leu Thr Asp Val Ala Gly Ile His Leu Ala Arg Asp Pro

195 200 205

Asp Ser Pro Val Leu Pro His Leu Asp Pro Asp Asp Leu Gly Ala Val

210 215 220

Arg Arg Leu Phe Trp Asp Asp Ala Trp Asp Ala Thr Gly Ala Met Glu

225 230 235 240

Gly Lys Val Glu Ala Leu Ala Ala His Ala Arg Arg Gly Ala Glu Cys

245 250 255

Val Ile Thr Arg Gly Asp His Arg Pro Gly Gly Leu Arg His Leu Phe

260 265 270

Ala Pro Leu Asp Ala Trp Pro Gly Asp Val Pro Arg Thr Leu Ile Ser

275 280 285

Arg Arg Thr Pro Ala Gly Pro Ala Ala Val Thr Ala Gly Pro Thr Asp

290 295 300

Pro Ala Ala Thr Pro Ala Thr Val Thr Thr Ala Ala Gln Pro Pro Gln

305 310 315 320

Glu Asp Pro Thr

<210> 241

<211> 975

<212> DNA

<213> 热丁香色链霉菌（Streptomyces thermolilacinus）

<400> 241

gtgaccgccg acgtgtccgc ggcgccccgc accgcaccgg gcgccgcgcc cgcgacggcg 60

gcggccgggg agccggggct gctcgtcctc aaggtcggcg gcagcctcct ctccgacaag 120

cggcacagcg gggagaccga ccacgcgacc atcgacgcct acgcgtccca ggtcgccgag 180

ctggtcaccg cgcaccccgg ccggatcgtc ctggtcaccg ggggcggcgc gctgtgccac 240

ccggtcggcc tgcggatcaa ggccgccaag gacgacccgt acgcggcagt cgccctcacc 300

gaaccggcct tccgcatgcg ctgggcgtgg accaccgcgc tgcgcgccca cggggtgcgg 360

gccgtgccgc tccagaccac gtcgatgctg aacgagctgg ccgacggcac caccgtcacc 420

gagaccggtg tggtgtcccg gctcctcgcc gagggcgcgc tgccggtgct gtccagcgac 480

tgcgtggtca ccgccaccgg caccctgcgc atcctcagca gcgacgacgt ccccggtgtg 540

gtgctggacg ccgccgtggc gccggggccc gtccgggtcg tggccctcac cgacgtggcc 600

ggcatccacc tcgcccggga cccggacagc cccgtgctgc cgcacctcga ccccgacgac 660

ctcggggccg tacggcggct gttctgggac gacgcgtggg acgccaccgg ggccatggag 720

ggcaaggtcg aggcgctcgc cgcgcacgcc cgccgcggcg ccgagtgcgt catcacccgc 780

ggcgaccacc ggccgggcgg gctgcgccac ctgttcgccc cgctcgacgc ctggcccggc 840

gacgtccccc gcacgctgat cagccgccgt acccccgccg ggcccgcagc cgtcaccgcg 900

ggcccgacgg acccggccgc cacccccgcc accgtcacca ccgccgccca accgccccag 960

gaggacccga catga 975

<210> 242

<211> 985

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 242

atgaccgccg atgtgagcgc cgcaccgcgt accgcaccgg gtgcagcacc tgctaccgcc 60

gcagcaggcg aaccgggtct gctggtgctg aaagtgggtg gcagtctgct gagtgataaa 120

cgtcatagcg gtgaaaccga tcatgccacc attgatgcat acgctagtca ggtggccgaa 180

ctggtgaccg cacatccggg tcgtattgtg ctggttaccg gtggtggtgc cctgtgccat 240

ccggtgggtc tgcgcattaa agcagccaaa gatgatccgt atgcagcagt tgccctgacc 300

gaaccggcat tccgtatgcg ttgggcatgg accaccgcac tgcgtgccca tggtgttcgc 360

gccgtgccgc tgcaaaccac cagcatgctg aatgaactgg cagatggtac caccgtgacc 420

gaaaccggcg ttgtgagtcg cctgctggca gaaggtgcac tgccggttct gagcagcgat 480

tgcgttgtta ccgcaaccgg caccctgcgc attctgagca gcgacgatgt gccgggcgtg 540

gtgctggatg cagccgtggc tccgggtccg gttcgtgtgg tggccctgac cgatgttgcc 600

ggcattcatc tggcacgcga tccggatagt ccggttctgc cgcatctgga ccctgatgat 660

ctgggtgccg ttcgtcgcct gttctgggat gatgcctggg atgccaccgg cgcaatggaa 720

ggcaaagttg aagcactggc agcacatgca cgtcgcggtg cagaatgtgt gattacccgt 780

ggtgatcatc gcccgggtgg cctgcgccat ctgttcgctc cgctggatgc ctggccgggt 840

gatgtgccgc gtaccctgat tagccgtcgt accccggccg gcccggctgc cgttaccgca 900

ggtcctaccg atccggcagc caccccggca accgttacca ccgccgctca gccgccgcag 960

gaagatccga cctgactgaa agctt 985

<210> 243

<211> 166

<212> PRT

<213> 马铃薯（Solanum tuberosum）

<400> 243

Met Thr Glu Ala Asp Ile Ser Met Val Ile Lys Ala Ile Asp Ala Gly

1 5 10 15

Phe Ile Pro Val Leu His Gly Asp Ala Val Leu Asp Thr Leu Gln Glu

20 25 30

Cys Thr Ile Leu Ser Gly Asp Met Ile Ile Arg His Leu Ala Ala Glu

35 40 45

Leu Lys Pro Glu Phe Val Val Phe Leu Thr Asp Val Leu Gly Val Tyr

50 55 60

Asp Arg Pro Pro Val Glu Pro Gly Ala Val Leu Ile Arg Glu Ile Ala

65 70 75 80

Val Arg Glu Asp Gly Ser Trp Ser Val Val Lys Pro Lys Leu Glu Asp

85 90 95

Thr Ser Lys Pro Val Glu Phe Thr Val Ala Ala His Asp Thr Thr Gly

100 105 110

Gly Met Val Thr Lys Ile Thr Glu Ala Ala Met Ile Ala Lys Leu Gly

115 120 125

Ile Asp Val Tyr Ile Thr Lys Ala Gly Thr Asp His Ser Val Lys Ala

130 135 140

Leu Ser Gly Phe Leu Lys Gly Gly Ile Pro Asp Asp Trp Leu Gly Thr

145 150 155 160

Ala Ile Arg Tyr Met Ser

165

<210> 244

<211> 501

<212> DNA

<213> 马铃薯（Solanum tuberosum）

<400> 244

atgacggagg ctgacatttc catggtcatt aaagctattg atgctggttt tatacctgtt 60

ctgcatggag atgcagttct ggatacatta caggagtgca ctattctgag tggagacatg 120

ataatacgtc atttagcagc tgaactaaag ccagagtttg ttgtttttct tacagatgtt 180

cttggtgtat atgatcgtcc accagtagaa cctggcgctg tacttatccg ggaaatagct 240

gtacgtgaag atggaagctg gtcggtagtg aaacctaaac tagaagatac aagcaagcct 300

gttgaattca cggtagctgc acatgataca actggtggga tggtaacaaa aataacagaa 360

gctgccatga ttgcgaagct tgggattgat gtctacataa ctaaggcagg aacagaccat 420

tcagtgaaag cccttagtgg attcttgaag ggtggcatac ctgatgactg gctcggaaca 480

gccattcgtt acatgagctg a 501

<210> 245

<211> 511

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 245

atgaccgaag cagatattag tatggtgatt aaagccattg atgccggctt cattccggtt 60

ctgcatggcg atgccgtgct ggataccctg caagaatgca ccattctgag cggtgatatg 120

attattcgcc atctggccgc cgaactgaaa ccggagttcg ttgtgttcct gaccgatgtg 180

ctgggcgtgt atgatcgccc gccggttgaa ccgggcgccg ttcttattcg cgaaattgcc 240

gtgcgcgaag atggtagctg gagtgttgtt aaaccgaaac tggaagatac cagtaaaccg 300

gtggagttca ccgtggcagc ccatgatacc accggcggta tggtgaccaa aattaccgaa 360

gccgcaatga ttgccaaact gggcattgat gtgtatatta ccaaagcagg caccgatcat 420

agtgttaaag cactgagcgg cttcctgaaa ggtggtattc cggatgattg gctgggcacc 480

gcaattcgct atatgagttg actgaaagct t 511

<210> 246

<211> 252

<212> PRT

<213> Euryarchaeota archaeon

<400> 246

Met Lys Val Leu Lys Ile Gly Gly Ser Val Leu Thr Glu Lys His Thr

1 5 10 15

Glu Glu Lys Lys Val Arg Met Glu Val Leu Asp Arg Ile Ala Ser Glu

20 25 30

Ile Ala Pro Arg Ala Asp Gly Leu Ile Leu Val His Gly Ala Gly Ser

35 40 45

Phe Gly His Pro Glu Ala Ile Arg His Gly Val Gly Arg Arg Phe Ser

50 55 60

Thr Glu Gly Val Leu Lys Thr His Gln Ser Val Cys Leu Leu Asn Arg

65 70 75 80

Ile Val Val Ser Ala Leu Val Arg Gly Gly Val Pro Ala Val Pro Val

85 90 95

Ser Pro Leu Gly Cys Ala Ile Ala Asp Gly Gly Arg Leu Val Ser Met

100 105 110

Glu Met Thr Pro Ile Leu His Met Val Glu Arg Gly Leu Val Pro Val

115 120 125

Leu His Gly Asp Val Val Met Asp Arg Thr Leu Gly Ala Ala Val Val

130 135 140

Ser Gly Asp Ala Leu Val Ala His Ile Ala Lys Gly Leu Gly Ala His

145 150 155 160

His Val Gly Met Gly Thr Ser Ala Gln Gly Val Leu Asp Ala His Gly

165 170 175

Arg Thr Ile Pro Glu Val Thr Glu His Asn Ile Glu Gln Val Arg Gln

180 185 190

Trp Val Arg Pro Ser Gly Gly Gly Asp Ala Thr Gly Gly Met Val Gly

195 200 205

Lys Val Glu Glu Leu Trp Arg Leu Ala Gly Glu Gly Ile Glu Ser Trp

210 215 220

Val Phe Ser Ala Leu Asp Glu Gly Ala Val Ala Ala Phe Leu Asp Gly

225 230 235 240

His Pro Val Gly Thr Arg Val Arg Asn Val Glu Leu

245 250

<210> 247

<211> 759

<212> DNA

<213> Euryarchaeota archaeon

<400> 247

gtgaaggtgc tgaagatagg cggaagcgtg ctcacagaga agcacacaga ggaaaagaag 60

gtaaggatgg aggtgctcga ccgcattgct tctgagattg ccccacgggc agatgggctg 120

atactggtgc acggagctgg ctcattcggg catcccgagg cgataaggca cggggtgggc 180

aggaggttca gcaccgaggg tgtgctaaag acccaccaga gcgtgtgcct tctcaacagg 240

atagtggtga gcgcactcgt gagagggggc gtgcccgccg tcccggtgtc cccactgggc 300

tgtgccatcg cagatggcgg aaggctcgta tccatggaga tgacgcccat actccacatg 360

gtggagcgtg gactcgtgcc tgtgctgcac ggcgatgtgg tgatggatcg cacccttgga 420

gcggcagtgg tgtctggaga cgcgctcgtg gcgcacatcg caaagggact gggtgcgcac 480

cacgtgggca tgggcacgag tgcacagggg gtgctggatg cccatggacg caccattccg 540

gaagtaacgg agcacaacat cgagcaggtt agacaatggg tgcgtccctc tggaggcggg 600

gatgccactg gaggaatggt cggaaaggtg gaggagctgt ggaggctggc gggcgagggc 660

atagagtcgt gggtgttcag cgccctcgat gagggggcgg tggcggcgtt tctagatggg 720

catccagtgg gcacgagggt gagaaatgtt gaactatga 759

<210> 248

<211> 769

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 248

atgaaggttc tgaaaatcgg tggcagcgtt ctgaccgaaa aacataccga agaaaaaaaa 60

gtgcgcatgg aagttctgga tcgcattgcc agtgaaattg ccccgcgtgc cgatggcctg 120

attctggtgc atggtgcagg tagcttcggt catccggaag ccattcgcca tggtgtgggt 180

cgtcgcttca gcaccgaagg tgtgctgaaa acacatcaga gcgtgtgtct gctgaatcgt 240

attgttgtga gcgcactggt gcgcggtggc gtgcctgccg ttcctgtgag tccgctgggt 300

tgtgcaattg cagatggtgg ccgcctggtt agcatggaaa tgaccccgat tctgcacatg 360

gttgaacgcg gtctggtgcc ggtgctgcat ggtgatgtgg ttatggatcg taccctgggc 420

gcagcagttg tgagcggcga tgccctggtg gcacatattg caaaaggcct gggtgcccat 480

catgttggca tgggcaccag tgcccagggc gtgctggatg cccatggtcg taccattccg 540

gaagtgaccg aacataatat tgaacaggtg cgccagtggg ttcgtccgag tggtggcggc 600

gatgcaaccg gtggcatggt gggtaaagtg gaagaactgt ggcgtctggc aggtgaaggt 660

attgaaagtt gggtgttcag tgcactggat gaaggcgcag ttgcagcctt cctggatggc 720

catccggtgg gcacccgtgt gcgcaatgtt gaactgtgac tgaaagctt 769

<210> 249

<211> 263

<212> PRT

<213> Archaeon species

<400> 249

Met Asn Pro Leu Ile Val Lys Leu Gly Gly Ser Val Ile Thr Asp Lys

1 5 10 15

Ala Lys Glu Phe Ser Met Lys Arg Gly Glu Ile Glu Arg Leu Ala Lys

20 25 30

Glu Leu Thr Ser Val Asp Gly Pro Leu Val Val Val His Gly Gly Gly

35 40 45

Ser Phe Gly His Pro Leu Ala Ser Glu Tyr Glu Ile Asp Ser Gly Tyr

50 55 60

Lys Asp Asp Leu Gln Leu Met Gly Phe Thr Leu Thr His His Ala Met

65 70 75 80

Gln Lys Leu Asn Phe Glu Val Val Asp Ser Leu His Gly Ala Asn Leu

85 90 95

Leu Ala Val Ser Ile Gln Pro Ser Ala Cys Thr Ile Val Arg Asn Gly

100 105 110

Arg Ile Ile Ser Ile Glu Leu Glu Pro Leu Arg Lys Leu Leu Asp Leu

115 120 125

Gly Phe Val Pro Val Leu His Gly Asp Ser Val Pro Asp Leu Asp Lys

130 135 140

Gly Met Ser Ile Leu Ser Gly Asp Gln Leu Val Val Phe Leu Ala Arg

145 150 155 160

Glu Leu Lys Ala Asp Ser Val Ile Leu Gly Val Asp Thr Asp Gly Val

165 170 175

Cys Thr Gly Asp Pro Lys Gln Gly Glu Lys Val Glu Leu Ile Pro Lys

180 185 190

Ile Thr Pro Lys Ser Trp Pro Arg Ile Ala Asp Ser Leu Thr Pro Ser

195 200 205

Pro Val Phe Asp Val Thr Gly Gly Met Arg Arg Lys Val Glu Glu Leu

210 215 220

Met Lys Leu Pro Glu Ile Gly Ile Glu Ala Gln Ile Val Asn Ala Ser

225 230 235 240

Lys Pro Lys Ile Leu Glu Lys Ala Ile Asn Gly Asp Lys Ser Leu Gly

245 250 255

Thr Arg Ile Val Glu Gly Ser

260

<210> 250

<211> 792

<212> DNA

<213> Archaeon species

<400> 250

atgaatcctt tgattgtaaa acttggcgga agcgtgataa cggataaggc caaggaattt 60

tcaatgaaac ggggggaaat tgaacgtctt gcaaaggagt tgacctcggt tgatggccca 120

cttgtggtgg ttcatggtgg gggttcgttt ggtcaccccc tcgcctctga atacgaaatt 180

gattcaggat ataaagatga ccttcagctt atgggcttca ccttgaccca ccatgcgatg 240

cagaagctca acttcgaggt ggtagattct ctgcatgggg ccaatctgct agcagtctcg 300

attcaaccat cagcatgcac gatcgttagg aacgggagaa ttatttccat agagcttgaa 360

cctcttcgta agttactgga tttgggcttt gttcccgtat tgcatggcga tagcgttccg 420

gatctcgata agggcatgag tatactgtcc ggcgatcagc ttgtcgtttt tttggcccga 480

gaattaaaag cagatagtgt gatacttgga gttgacacgg atggggtttg tacgggcgat 540

cctaagcaag gcgagaaggt agaactcata ccaaagataa cgcccaaaag ctggccaaga 600

atcgctgact ccctcacgcc atctcccgtt tttgacgtta ccggggggat gagaaggaag 660

gtcgaagagt taatgaaatt acccgaaata ggtatcgagg cacagatagt aaatgcatct 720

aagcctaaaa tccttgaaaa agcaatcaac ggcgataaaa gcttgggaac aaggatagtt 780

gagggtagct aa 792

<210> 251

<211> 802

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 251

atgaacccgc tgattgttaa actgggcggc agtgttatta ccgataaagc aaaagagttc 60

agtatgaaac gcggcgaaat tgaacgtctg gccaaagaac tgaccagcgt tgatggtccg 120

ctggttgtgg ttcatggcgg tggtagcttc ggtcatccgc tggccagtga atatgaaatt 180

gatagcggct ataaagatga tctgcaactg atgggcttca ccctgaccca tcatgcaatg 240

cagaaactga acttcgaagt tgttgatagt ctgcatggtg caaatctgct ggcagtgagt 300

attcagccga gtgcatgtac cattgttcgc aatggtcgca ttattagtat tgaactggaa 360

ccgctgcgta aactgctgga tctgggcttc gtgccggtgc tgcatggtga tagcgttccg 420

gatctggata aaggcatgag cattctgagt ggcgatcagc tggttgtgtt cctggcacgt 480

gaactgaaag cagatagcgt tattctgggt gtggataccg atggtgtgtg caccggcgat 540

ccgaaacagg gtgaaaaagt tgaactgatt ccgaaaatta ccccgaaaag ctggccgcgt 600

attgccgata gcctgacccc gagtccggtg ttcgatgtta ccggtggcat gcgtcgtaaa 660

gttgaagaac tgatgaaact gccggaaatt ggtattgaag cacagattgt gaatgccagt 720

aaaccgaaaa ttctggaaaa agccattaat ggcgataaaa gcctgggcac ccgtattgtg 780

gaaggtagtt gactgaaagc tt 802

<210> 252

<211> 260

<212> PRT

<213> Nethanofastidiosum methylthiophilus

<400> 252

Met Ile Ile Ile Lys Ala Gly Gly Ser Ala Ile Thr Lys Lys Ser Glu

1 5 10 15

Asp Phe Thr Pro Asn Met Glu Val Ile Ser Asn Leu Ala Gln Glu Ile

20 25 30

Lys Glu Ala Gly Arg Val Ser Ile Leu Val His Gly Ala Gly Ser Tyr

35 40 45

Gly His Pro Ile Ala Lys Lys Tyr Ser Leu Gly Lys Gly Tyr Phe Asp

50 55 60

Asp Tyr Gln Leu Lys Gly Phe Ser Glu Thr Arg Ala Ser Val Ser Glu

65 70 75 80

Leu Asp Ser Ile Val Leu Lys Ser Leu Met Lys Asn Gly Leu Thr Pro

85 90 95

Val Lys Ile Gly Thr Phe Ser Asn Phe Ile Thr Ser Asn Gly Arg Ile

100 105 110

Val Glu Phe His Lys Glu Pro Leu Leu Arg Ala Ile Glu Leu Gly Leu

115 120 125

Leu Pro Val Phe Thr Gly Asp Leu Val Phe Asp Arg Thr Arg Val Phe

130 135 140

Ser Ile Leu Ser Gly Asp Gln Ile Val Ser Tyr Leu Ser Arg Leu Leu

145 150 155 160

Lys Pro Ser Arg Val Val Phe Gly Thr Asp Val Asp Gly Ile Tyr Thr

165 170 175

Gly Asp Pro Lys Lys Glu Asn Val Lys Leu Ile Asp Thr Val Thr Glu

180 185 190

Glu Asn Ile Lys Glu Val Phe Lys Phe Ala Lys Asp Thr Gly Asp Ala

195 200 205

Ser Gly Gly Met Glu Gly Lys Leu Ser Glu Ile Leu Pro Ile Phe Asp

210 215 220

Met Gly Ile Glu Ile Asp Val Ile Asn Leu Thr Lys Lys Gly Asn Leu

225 230 235 240

Ala Glu Thr Leu Arg Gly Asn Val Lys Gly Thr Val Ile Lys Lys Lys

245 250 255

Asn Ile Ser Lys

260

<210> 253

<211> 783

<212> DNA

<213> Methanofastidiosum methylthiophilus

<400> 253

atgattatta taaaagcagg cggttcggca attacaaaaa aaagcgaaga ttttacccca 60

aatatggaag taatttctaa tcttgctcaa gagatcaaag aggcaggaag agtatccatc 120

cttgttcatg gtgctggatc ttatgggcac ccgattgcaa agaaatattc tctagggaaa 180

ggttattttg atgattacca acttaaagga ttttctgaaa caagagccag tgttagtgaa 240

cttgacagca tagttctaaa atctcttatg aaaaatggac taactcctgt taaaataggc 300

actttttcaa attttatcac atctaatggt agaattgttg aattccataa agaacctcta 360

ctaagagcta ttgaacttgg gctattacct gtgtttactg gcgatttagt ctttgataga 420

actagagttt tctcaatatt atcgggagat caaatagtct catatctatc aagattgtta 480

aaaccttcaa gagttgtatt tgggactgat gtcgatggca tatatacagg agatccaaag 540

aaagaaaatg tcaagttgat tgatacagtt acagaagaaa atattaaaga agtatttaag 600

tttgcgaaag atactggaga cgcttctggc ggtatggaag gtaaactatc tgagatatta 660

cccatatttg atatgggtat tgagatagat gttattaatt taactaaaaa aggtaattta 720

gctgaaacac ttaggggaaa tgtaaaagga actgtaataa aaaagaagaa tatctcaaaa 780

taa 783

<210> 254

<211> 793

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 254

atgatcatca tcaaggccgg cggtagtgcc attaccaaaa aaagtgaaga cttcaccccg 60

aatatggaag tgattagtaa tctggcacag gaaattaaag aagcaggccg cgttagtatt 120

ctggtgcatg gtgccggcag ttatggccat ccgattgcaa aaaaatatag cctgggcaaa 180

ggctacttcg atgattatca gctgaaaggc ttcagtgaaa ccagagcaag cgtgagcgaa 240

ctggatagta ttgttctgaa aagcctgatg aaaaatggcc tgaccccggt taaaattggc 300

accttcagca acttcattac cagcaatggt cgcattgttg agttccataa agaaccgctg 360

ctgcgtgcaa ttgaactggg cctgctgccg gtgttcaccg gcgatctggt gttcgatcgc 420

acccgtgtgt tcagcattct gagcggtgat cagattgtta gttatctgag tcgtctgctg 480

aaaccgagtc gtgttgtgtt cggtaccgat gttgatggca tctataccgg cgatccgaaa 540

aaagaaaatg ttaaactgat cgataccgtg accgaagaaa atattaaaga agtgttcaag 600

ttcgcaaagg ataccggtga tgcaagtggc ggcatggaag gtaaactgag cgaaattctg 660

ccgatcttcg atatgggtat tgaaattgat gtgattaacc tgaccaaaaa aggtaatctg 720

gccgaaacct tacgtggtaa tgttaaaggt accgttatta aaaagaagaa catcagtaag 780

tgactgaaag ctt 793

<210> 255

<211> 255

<212> PRT

<213> Syntrophoarchaeum butanivorans

<400> 255

Met Gly Lys Gly Leu Thr Ile Leu Lys Ile Gly Gly Ser Val Ile Thr

1 5 10 15

Cys Lys Asn Asp Glu Lys Arg Leu Arg Glu Asp Thr Ile Asn Gln Val

20 25 30

Val Arg Glu Ile Ala Asp Ala Arg Thr Asp His Leu Ile Leu Val His

35 40 45

Gly Ala Gly Ser Phe Gly His Pro Gln Ala Ala Lys His Ser Glu Phe

50 55 60

Gly Glu Asp Leu Val Lys Asn Ala Phe Ala Val Phe Asp Ile Asn Thr

65 70 75 80

Thr Val Met Glu Leu Asn Thr Ile Leu Val Ser Ser Met Ile Ser Gln

85 90 95

Gly Leu Pro Ala Val Ala Leu His Pro Met Asn Phe Thr Ile Leu Glu

100 105 110

Asp Gly Arg Ile Tyr Ser Met Met Thr Thr Gln Ile Glu Glu Met Leu

115 120 125

Asp Lys Gly Phe Val Pro Val Leu His Gly Asp Ile Val Phe Asp Arg

130 135 140

Lys Lys Gly Tyr Ala Ile Leu Ser Gly Asp Gln Ile Val Thr Tyr Leu

145 150 155 160

Ala Arg Asp Leu Gln Ala Gln Arg Val Gly Leu Gly Val Asp Val Asp

165 170 175

Gly Val Ile Gly Ser Asp Gly Ser Val Met Glu Val Ile Thr Pro Gln

180 185 190

Asn Val Asp Glu Ile Ile Phe Asp Lys Gly Ala Asp Leu Asp Val Thr

195 200 205

Gly Ala Met Glu Gly Lys Val Arg Glu Leu Leu Glu Leu Ala Ser Tyr

210 215 220

Gly Ile Ser Ser Cys Ile Phe Asn Gly Thr Lys Lys Gly Tyr Ile Arg

225 230 235 240

Arg Trp Leu Lys Gly Glu Lys Ile Pro Ser Thr Ile Ile Ser Glu

245 250 255

<210> 256

<211> 768

<212> DNA

<213> Syntrophoarchaeum butanivorans

<400> 256

atggggaagg gtctgacgat tctcaagatc ggaggaagtg tgattacctg taagaacgat 60

gaaaagcggc tcagagagga taccatcaat caggttgtga gagagatcgc agatgccagg 120

accgatcatc taattctcgt gcatggtgca ggctcgttcg gtcacccaca ggctgcaaag 180

cactcagagt tcggggagga tctggtaaaa aatgcgtttg cagtctttga tataaatacg 240

accgtgatgg agcttaacac catcctcgtc tcaagtatga tctcacaggg tcttcctgcg 300

gttgcgcttc acccgatgaa cttcacaatc cttgaggacg ggaggattta ctcgatgatg 360

actactcaga tcgaggagat gcttgataag ggtttcgtcc cggttctgca tggtgatatt 420

gttttcgatc gtaagaaggg gtatgccatc ctctcagggg atcagatcgt gacatatctt 480

gcgagagatc ttcaggcaca gagggtaggg cttggagtcg atgttgatgg ggtcatcggg 540

agtgatggga gtgttatgga ggtcatcaca ccgcagaatg tggatgagat aatcttcgac 600

aagggggcag atcttgatgt taccggggca atggagggaa aggtcagaga gcttcttgag 660

cttgcctcgt atggaataag ctcgtgtatc ttcaatggga caaagaaagg ctacatcaga 720

cgatggctta aaggggagaa gataccatcc acaatcatat cagagtag 768

<210> 257

<211> 778

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 257

atgggtaaag gcctgaccat tctgaaaatt ggcggtagcg tgattacctg taaaaatgat 60

gaaaaacgcc tgcgtgaaga taccattaat caggttgtgc gcgaaattgc agatgcccgc 120

accgatcatc tgattctggt gcatggcgca ggcagcttcg gtcatccgca ggcagcaaaa 180

catagcgagt tcggtgaaga cttagttaaa aatgcattcg ccgtgttcga tattaatacc 240

accgtgatgg aactgaatac cattctggtg agtagcatga ttagccaggg cctgccggca 300

gtggccctgc atcctatgaa cttcaccatt ctggaagatg gccgtatcta tagtatgatg 360

accacccaga ttgaagaaat gctggataaa ggcttcgtgc cggttctgca tggtgatatt 420

gtgttcgatc gcaaaaaagg ctatgcaatt ctgagcggcg atcagattgt tacctatctg 480

gcccgtgatc tgcaagccca gcgtgttggt ctgggcgtgg atgttgatgg tgttattggt 540

agcgatggca gtgtgatgga agtgattacc ccgcagaatg tggatgaaat tatcttcgat 600

aaaggcgcag acttagatgt taccggtgcc atggaaggta aagtgcgtga actgctggaa 660

ctggccagtt atggtattag cagttgcatc ttcaatggca ccaaaaaagg ttatattcgt 720

cgttggctga aaggtgaaaa aattccgagt accattatta gtgaatgact gaaagctt 778

<210> 258

<211> 254

<212> PRT

<213> Euryarchaeota archaeon

<400> 258

Met Met Leu Ile Lys Leu Gly Gly Ser Ala Ile Thr Asp Lys Ser Lys

1 5 10 15

Pro Leu Thr Ser Arg Ala Gly Asp Ile Lys Arg Leu Ala Met Glu Ile

20 25 30

Ala Gly Ala Glu Gly Thr Lys Met Ile Val His Gly Gly Gly Ser Phe

35 40 45

Gly His Ile Lys Ala Ala Glu Phe Lys Leu Asn Glu Gly Phe Val Asp

50 55 60

Asp Ser Gln Arg Glu Gly Ile Cys Leu Val Gln Lys Asp Met Arg Lys

65 70 75 80

Leu Asn Ala Ile Val Val Asp Ala Phe Arg Glu Ala Gly Val Pro Val

85 90 95

Ala Ser Val Pro Ala Gly Ala Ile Thr Leu Phe Asp Asn Gly Gln Met

100 105 110

Val Lys Phe Pro Ser Glu Val Phe Ile His Tyr Val Lys Leu Gly Ile

115 120 125

Val Pro Ile Thr Phe Gly Asp Val Val Val Asp Arg Ala Arg Gly Ile

130 135 140

Ser Ile Cys Ser Gly Asp Asp Ile Met Leu Gln Leu Ala Lys Asp Thr

145 150 155 160

Asp Ala Val Lys Cys Val Phe Val Thr Ser Val Asp Gly Ile Phe Glu

165 170 175

Ser Tyr Pro Pro Gly Lys Asp Glu Glu Pro Leu Ser Glu Val Gly Pro

180 185 190

Asp Thr Val Ile Arg Phe Ser Ser Glu Asp Val Asp Val Thr Gly Ser

195 200 205

Met Lys Arg Lys Leu Asp Leu Met Ile Glu Met Ala Ser Ser Gly Lys

210 215 220

Glu Val Ala Val Val Asn Gly Leu Val Pro Asp Arg Leu Thr Asp Ala

225 230 235 240

Leu Lys Gly Asn Asp Phe Ile Gly Thr Arg Val Lys Gly Asp

245 250

<210> 259

<211> 765

<212> DNA

<213> Euryarchaeota archaeon

<400> 259

atgatgctca tcaagctggg tggcagcgcc atcacagata aatccaagcc cctgacctca 60

cgtgccgggg acatcaagag gctggcgatg gagatcgccg gcgccgaggg tacaaagatg 120

atcgtgcacg gcgggggctc cttcggccac atcaaggctg ccgagttcaa gctcaacgag 180

ggctttgtcg acgacagcca gagagagggc atctgcctag tccagaagga tatgcgcaag 240

ttgaacgcca tcgtcgtcga tgcattcagg gaggcgggtg tccccgtggc atccgtcccg 300

gccggggcca taacgctctt cgacaacggc caaatggtta aattcccctc cgaggtcttt 360

atccattacg tgaagctggg catcgttccg attaccttcg gcgacgttgt cgtcgacagg 420

gctaggggca tatcgatatg ctcgggagac gacataatgc tccagcttgc caaggatacc 480

gatgctgtaa aatgcgtgtt cgtgacctcg gtggacggca tcttcgaatc ctatccccca 540

gggaaggacg aggagcctct cagcgaggtc ggtccggaca ccgtcatcag gttcagtagc 600

gaggacgtgg acgtgacggg cagcatgaag cgcaaactcg acctgatgat cgagatggcc 660

tcgtcaggta aggaggtggc cgtcgtgaac ggtcttgtgc ctgacagatt gaccgatgca 720

ttgaagggta atgacttcat tggcacccgg gtgaagggtg attga 765

<210> 260

<211> 775

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 260

atgatgctga ttaagctggg cggtagcgca attaccgata aaagtaaacc gctgaccagt 60

cgcgcaggcg atattaaacg cctggccatg gaaattgcag gcgccgaagg caccaaaatg 120

attgtgcatg gtggtggcag cttcggtcat attaaagcag cagagttcaa actgaatgaa 180

ggcttcgtgg atgatagtca gcgcgaaggc atctgtctgg tgcagaaaga tatgcgtaaa 240

ctgaatgcca ttgtggtgga tgccttccgc gaagcaggcg tgccggttgc cagcgtgccg 300

gcaggtgcta ttaccctgtt cgataatggt cagatggtta aattcccgag tgaagtgttc 360

attcattatg ttaaactggg tattgtgccg attaccttcg gtgatgtggt ggttgatcgt 420

gcccgtggca ttagcatctg tagcggtgat gatattatgc tgcaactggc aaaagatacc 480

gatgccgtta aatgcgtgtt cgttaccagt gtggatggta tcttcgaaag ctatccgccg 540

ggcaaagatg aagaaccgct gagtgaagtg ggcccggata ccgtgattcg cttcagtagc 600

gaagatgtgg atgttaccgg tagtatgaaa cgtaaactgg atctgatgat tgaaatggca 660

agcagtggca aagaagttgc cgtggttaat ggcctggttc cggatcgcct gaccgatgca 720

ctgaaaggta atgacttcat tggcacccgc gttaaaggtg attgactgaa agctt 775

<210> 261

<211> 239

<212> PRT

<213> 深处古生球菌（Archaeoglobus profundus）

<400> 261

Met Ile Val Val Lys Ile Gly Gly Ser Ala Ile Thr Asp Lys Lys Gly

1 5 10 15

Phe Lys Ile Val Lys Ile Asp Ser Ile Glu Arg Val Ala Lys Asp Ile

20 25 30

Ala Glu Val Arg Pro Arg Lys Leu Ile Leu Val His Gly Val Gly Ser

35 40 45

Phe Gly His Pro Phe Val Val Lys Tyr Arg Leu Lys Glu Glu Lys Asn

50 55 60

Leu Glu Gly Val Val Arg Ala His Met Ser Cys Lys Glu Leu Asn Ala

65 70 75 80

Met Ile Cys Glu Ala Met Leu Met Tyr Gly Leu Lys Pro Phe Pro Val

85 90 95

His Pro Leu Leu Thr Phe Lys Leu Arg Gly Gly Lys Ile Thr Phe Asp

100 105 110

Ile Asp Ile Phe Glu Lys Ala Leu Glu Glu Gly Phe Ile Pro Val Thr

115 120 125

His Gly Asp Met Val Tyr Asp Val Glu Asp Arg Phe Phe Lys Val Leu

130 135 140

Ser Gly Asp Asp Ile Thr Leu Lys Leu Ala Lys Ala Phe Lys Ala Glu

145 150 155 160

Lys Ile Gly Phe Ala Thr Asp Val Glu Gly Val Tyr Val Asp Gly Lys

165 170 175

Leu Ala Asp Val Val Thr Trp Lys Asp Leu Asp Lys Ile Gly Phe Ser

180 185 190

Lys Gly Val Asp Val Thr Gly Gly Met Arg Ser Lys Val Glu Lys Ile

195 200 205

Leu Arg Ser Gly Val Asn Ala Arg Ile Phe Ser Ile Ser Lys Phe Lys

210 215 220

Gly Phe Leu Ser Cys Glu Glu Val Gly Thr Leu Val Lys Ser Asp

225 230 235

<210> 262

<211> 720

<212> DNA

<213> 深处古生球菌（Archaeoglobus profundus）

<400> 262

atgatagtag tcaagattgg tggatctgca ataacagata agaaggggtt caaaatagtt 60

aagatcgatt ctatagagag agttgctaaa gatattgccg aagtaagacc cagaaaactt 120

attcttgttc acggtgtggg ttcctttggt cacccctttg tagttaagta caggcttaag 180

gaggagaaaa acttggaggg tgttgttaga gcgcatatgt catgcaagga gctgaacgct 240

atgatttgtg aggctatgct catgtatggc ttgaaacctt ttccagttca tccccttcta 300

acgttcaaac ttcgtggggg caagataaca tttgacatcg acatcttcga aaaggcactt 360

gaggaaggat tcatacccgt aactcatggg gacatggtct acgatgtgga ggacagattt 420

ttcaaggttc tttccggcga tgacataacg ctgaagcttg ccaaggcttt taaggctgaa 480

aagattggtt ttgctactga tgttgaagga gtttacgttg acgggaaatt agctgatgtg 540

gtgacttgga aagatttgga caagattgga ttctccaaag gagttgatgt gaccggtggg 600

atgagaagca aggtcgagaa gattttgagg agcggtgtga atgctagaat ttttagcatt 660

tcaaagttta aggggtttct aagctgtgaa gaagtaggaa cgctcgttaa atctgactga 720

<210> 263

<211> 730

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 263

atgatcgtgg tgaaaattgg tggcagcgcc attaccgata aaaaaggctt caaaattgtg 60

aaaatcgaca gcattgaacg cgttgcaaaa gatattgcag aagttcgtcc gcgtaaactg 120

attctggttc atggtgtggg tagcttcggc catccgttcg tggttaaata tcgtctgaaa 180

gaagaaaaaa acctggaagg tgttgtgcgc gcacacatga gttgcaaaga actgaatgca 240

atgatctgtg aagccatgct gatgtatggc ctgaaaccgt tcccggttca tccgctgctg 300

accttcaaac tgcgcggtgg caaaattacc ttcgatattg atatcttcga gaaagcactg 360

gaagaaggct tcattccggt gacccatggt gatatggtgt atgatgtgga agatcgcttc 420

ttcaaagtgc tgagtggcga tgatattacc ctgaaactgg ccaaagcctt caaagcagaa 480

aaaattggct tcgccaccga tgtggaaggc gtgtatgtgg atggcaaact ggccgatgtt 540

gtgacctgga aagacttaga taaaattggc ttcagcaaag gcgttgatgt taccggtggc 600

atgcgcagca aagtggaaaa aattctgcgt agcggcgtta atgcacgtat cttcagtatt 660

agcaaattca aaggcttcct gagctgtgaa gaagttggca ccctggtgaa aagtgattga 720

ctgaaagctt 730

<210> 264

<211> 253

<212> PRT

<213> Halopenitus malekzadehii

<400> 264

Met Thr Gly Glu Thr Val Val Cys Lys Leu Gly Gly Ser Val Ile Thr

1 5 10 15

Glu Lys Asp Arg Ser Glu Thr Leu Asp Ala Pro Ala Leu Asp Ala Ala

20 25 30

Cys Asp Ala Ile Ala Gly Val Leu Ala Asp Asp Ala Ile Asp Arg Leu

35 40 45

Val Val Val His Gly Gly Gly Ser Phe Gly His His His Ala Ser Ala

50 55 60

His Gly Met Thr Thr Thr Ala Gly Thr His Asn Val Asp Ala Val Met

65 70 75 80

Asp Val His Gly Ala Met Thr Thr Leu Asn Arg Phe Val Leu Asp Arg

85 90 95

Leu His Glu Arg Asn Val Pro Ala Leu Pro Val His Pro Leu Ser Val

100 105 110

Gly Ala Arg Thr Gly Gly Pro Asp Gly Glu Leu Thr Leu Pro Ser Glu

115 120 125

Pro Ala Ala Thr Leu Leu Ala Glu Gly Phe Val Pro Val Leu His Gly

130 135 140

Asp Gly Val Ala Thr Ala Ser Glu Gly Val Thr Val Ile Ser Gly Asp

145 150 155 160

Glu Leu Val Val Glu Leu Ala Ala Asp Ile Asp Ala Asp Arg Val Gly

165 170 175

Leu Cys Ser Thr Val Pro Gly Val Leu Asp Gly Asp Gly Asp Val Val

180 185 190

Pro Arg Ile Asp Ala Phe Glu Asp Val Ala Asp Leu Leu Gly Ala Ser

195 200 205

Glu Ser Thr Asp Val Ser Gly Gly Met Ala Ala Lys Val Glu Glu Leu

210 215 220

Leu Gly Leu Gly Ser Pro Ala Phe Ile Phe Gly Pro Asp Asp Leu Glu

225 230 235 240

Gly Phe Leu Arg Gly Asp Ser Pro Gly Thr Arg Ile Gly

245 250

<210> 265

<211> 762

<212> DNA

<213> Halopenitus malekzadehii

<400> 265

atgacgggtg agacggtcgt ctgcaagctc ggcggcagcg tgatcaccga gaaggatcgg 60

tccgagacgc tcgatgcgcc cgcgctcgat gctgcctgcg acgcgatcgc cggggtgctg 120

gcggacgacg ccatcgaccg actcgtcgtc gttcacggtg gcgggagctt cggccaccat 180

cacgccagcg cacacgggat gaccacgacc gcggggaccc ataacgtcga cgccgtgatg 240

gacgttcacg gcgcgatgac gacgctcaac cggttcgtcc tcgaccggct gcacgaacgg 300

aacgttccgg cgcttccagt ccacccgcta tcggtcggcg cacggacggg cgggccggac 360

ggggagctga cgctgccgtc ggagcccgcc gcgacgctgc ttgcggaggg gtttgttccg 420

gtgttacacg gtgacggggt cgccaccgcg agcgagggcg tgacggtgat ctcgggcgac 480

gaactggtcg tcgagctggc tgccgacatc gatgcggacc gggtcggcct ctgttcgacg 540

gttcccggcg tcctcgacgg cgacggtgac gtggttcccc ggatcgacgc cttcgaagac 600

gtcgccgacc tgctcggcgc gagcgagtcg acggacgtct cgggcgggat ggcggcgaag 660

gtcgaggagc tgctcgggct cggatcgccg gcgttcatct tcggcccgga cgacctcgag 720

ggatttctgc gaggcgactc gcccgggacg cggatcgggt ag 762

<210> 266

<211> 772

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 266

atgaccggcg aaaccgttgt gtgtaaactg ggcggtagcg ttattaccga aaaagatcgc 60

agtgaaacct tagatgcccc ggccctggat gccgcatgtg atgcaattgc aggtgtgctg 120

gcagatgatg ccattgatcg tctggtggtg gttcatggcg gtggtagctt cggccatcat 180

catgcaagcg cacatggcat gaccaccacc gcaggtaccc ataatgttga tgccgttatg 240

gatgtgcatg gtgcaatgac caccctgaat cgcttcgttc tggatcgtct gcatgaacgt 300

aatgttccgg ccctgccggt gcatccgctg agcgttggtg cacgtaccgg cggtccggat 360

ggtgaactga ccctgccgag tgaaccggcc gccaccctgc tggcagaagg cttcgttccg 420

gtgctgcatg gcgatggtgt tgcaaccgca agcgaaggcg tgaccgttat tagcggcgat 480

gaactggttg tggaactggc cgccgatatt gatgccgatc gtgttggtct gtgtagtacc 540

gttccgggtg ttctggatgg tgatggtgat gtggtgccgc gtattgatgc cttcgaagat 600

gttgcagact tactgggtgc cagtgaaagc accgatgtta gtggtggcat ggcagccaaa 660

gtggaagaac tgctgggcct gggtagtccg gccttcatct tcggtccgga tgatctggaa 720

ggcttcctgc gcggcgatag cccgggcaca cgcattggtt gactgaaagc tt 772

<210> 267

<211> 247

<212> PRT

<213> Methanosarcinales archaeon

<400> 267

Met Lys Ser Ile Leu Leu Lys Ile Gly Gly Ser Val Leu Thr Asp Lys

1 5 10 15

Glu Arg Glu Cys Thr Leu Arg Glu Ser Glu Ile Glu Arg Ile Ala Gly

20 25 30

Glu Ile Lys Gly Ala Arg Ala Ser Val Val Ile Val His Gly Ala Gly

35 40 45

Ser Phe Gly His Pro Gln Ala Arg Glu His Asn Leu Gly Glu Asp Pro

50 55 60

Thr Thr Arg Gly Leu Ile Glu Thr His Arg Ala Val Met Lys Leu Asn

65 70 75 80

Asn Ala Phe Ile Glu Ala Leu Asn Arg Ala Asp Val Asp Ala Ile Gly

85 90 95

Val His Pro Leu Asp Phe Ile Met Val Glu Glu Arg Arg Val Thr His

100 105 110

Leu Asp Cys Arg Val Leu Glu Ser Met Ile Glu Phe Gly Leu Thr Pro

115 120 125

Val Leu His Gly Asp Val Val Ile Asp Ser Lys Arg Gly Ala Ser Val

130 135 140

Ile Ser Gly Asp Gln Ile Leu Arg Glu Leu Gly Ile Arg Leu Asp Val

145 150 155 160

Ser Met Val Gly Ala Gly Thr Asn Val Asp Gly Val Phe Asp Glu Thr

165 170 175

Gly Arg Thr Ile Pro Lys Leu Asn Arg Ile Pro Gln Gln Ile His Pro

180 185 190

Ser Val Ile Glu Asp Val Thr Gly Glu Met Lys Gly Lys Val Lys Glu

195 200 205

Leu Ile Glu Leu Ala Glu Asn Gly Val Glu Ser Val Ile Phe Asn Ala

210 215 220

Ser Met Lys Arg Lys Val Tyr Asp Phe Leu Arg Gly Lys Asp Val Gly

225 230 235 240

Gly Thr Gln Ile Thr Leu Gln

245

<210> 268

<211> 744

<212> DNA

<213> Methanosarcinales archaeon

<400> 268

gtgaagtcta tcctattgaa gatcggtgga agcgtgctga ccgataagga gcgtgagtgc 60

acgcttcgag aatctgagat tgagcggatt gcaggcgaaa ttaaaggtgc cagagccagt 120

gttgtgatcg ttcacggtgc tggctcgttc ggacacccac aggcaagaga gcacaacctc 180

ggggaagatc cgacaacgag gggtttgatt gagacgcaca gagcggtcat gaagctgaac 240

aacgccttca tcgaggctct caaccgagca gacgtcgatg caatcggcgt acacccactt 300

gacttcataa tggttgaaga gaggcgtgtt acacaccttg attgcagggt tcttgagagc 360

atgatcgagt tcgggctcac accagttctc cacggagatg ttgttataga ctcgaagagg 420

ggtgcatctg tgatctcagg agaccagatc ctaagagagc ttggaattag actggatgtc 480

tcaatggtcg gcgccgggac caacgttgat ggcgtgttcg acgaaacggg cagaacgatt 540

ccgaagttga atcggatccc tcagcagata cacccctcag ttatagagga tgtgacaggc 600

gagatgaaag gaaaagtaaa agaactcata gaacttgcag aaaacggcgt agaatctgtt 660

atattcaacg catccatgaa gaggaaggtt tacgattttc tcagaggaaa agatgttggc 720

ggaacacaga taactctaca gtaa 744

<210> 269

<211> 754

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 269

atgaagagca ttctgctgaa aattggcggt agcgtgctga ccgataaaga acgtgaatgc 60

accctgcgtg aaagcgaaat tgaacgcatt gcaggcgaaa ttaaaggtgc acgcgccagc 120

gttgtgattg ttcatggcgc cggcagcttc ggccatccgc aggcacgtga acataatctg 180

ggtgaagatc cgaccacccg tggtctgatt gaaacacatc gtgcagtgat gaaactgaat 240

aatgccttca ttgaagcact gaatcgcgca gatgttgatg caattggtgt tcatccgctg 300

gacttcatta tggttgaaga acgccgcgtg acccatctgg attgtcgcgt tctggaaagc 360

atgattgagt tcggcctgac cccggttctg catggtgatg ttgtgattga tagtaaacgt 420

ggtgccagcg tgattagtgg cgatcagatt ctgcgcgaac tgggcattcg cctggatgtg 480

agcatggttg gtgcaggtac caatgttgat ggcgtgttcg atgaaaccgg ccgcaccatt 540

ccgaaactga atcgtattcc gcagcagatt catccgagtg ttattgaaga tgttaccggc 600

gaaatgaaag gtaaagtgaa agaactgatt gaactggcag aaaatggtgt tgaaagtgtg 660

atcttcaatg caagtatgaa acgcaaagtg tatgacttcc tgcgtggtaa agatgtgggc 720

ggcacccaga ttaccctgca atgactgaaa gctt 754

<210> 270

<211> 248

<212> PRT

<213> Euryarchaeota archaeon

<400> 270

Met Met Leu Val Lys Leu Gly Gly Ser Val Ile Thr Asp Lys Ser Lys

1 5 10 15

Lys Tyr Val Phe Arg Glu Lys Thr Val Arg Arg Leu Ala Glu Glu Ile

20 25 30

Lys Asn Ser Gly Glu Lys Val Ile Val Val His Gly Ala Gly Ser Phe

35 40 45

Gly His Ile Leu Ala Lys Lys Tyr Arg Leu Asp Lys Gly Leu Ile His

50 55 60

Asp Arg Gln Val Lys Gly Val Ala Val Val Gln Arg Asp Val Lys Asn

65 70 75 80

Leu Asn Leu Lys Val Val Asn Cys Leu Ile Gly Ala Gly Met Asn Pro

85 90 95

Val Ser Ile Pro Pro Ser Ser Val Ala Glu Cys Arg Asn Lys Lys Ile

100 105 110

Glu Lys Ile Asn Leu Asp Val Phe Lys Lys Tyr Leu Asn Leu Gly Leu

115 120 125

Thr Pro Val Thr Phe Gly Asp Val Ala Leu Asp Arg Lys Leu Ser Phe

130 135 140

Cys Ile Val Ser Gly Asp Leu Leu Met Leu Glu Leu Ala Arg Val Phe

145 150 155 160

Lys Pro Lys Lys Ser Ile Phe Val Ser Asp Val Asp Gly Val Tyr Ile

165 170 175

Asn Gly Lys Met Val Glu Lys Val Asp Arg Lys Ile Ile Gln Asn Leu

180 185 190

Glu Arg Lys Lys Thr Lys Ile Ser Asp Val Thr Gly Ser Met Tyr Glu

195 200 205

Lys Val Lys Ile Ala Leu Lys Met Ser Glu Phe Thr Lys Thr Val Ile

210 215 220

Ile Asn Gly Asn Val Lys Gly Arg Leu Gly Asp Thr Leu Lys Gly Lys

225 230 235 240

Lys Val Val Gly Thr Val Val Gly

245

<210> 271

<211> 747

<212> DNA

<213> Euryarchaeota archaeon

<400> 271

atgatgcttg ttaaacttgg cggctctgtt ataacagaca aatcaaaaaa atatgttttc 60

agagaaaaaa ctgtgagaag actggcagag gagataaaaa actcaggtga aaaggttatt 120

gttgttcacg gtgctggctc ttttgggcac atacttgcaa aaaaatacag gctggataaa 180

ggcctcattc atgataggca ggttaagggt gttgctgttg ttcaaagaga tgtgaagaat 240

ttgaatctaa aggttgttaa ctgcctgata ggtgcaggta tgaaccctgt ttctatccct 300

ccatcatctg tcgctgaatg cagaaacaaa aagattgaaa aaataaatct tgatgttttc 360

aaaaaatatc ttaaccttgg tttgacacct gtcacgttcg gtgatgtcgc gcttgacagg 420

aaactcagtt tctgcatagt ctcaggtgat ttactcatgc ttgaacttgc cagagtgttt 480

aaaccaaaaa aatctatttt tgtttctgat gttgacggtg tttacataaa tgggaagatg 540

gtggaaaagg ttgacagaaa aattattcag aatctggaaa gaaaaaaaac aaaaatttct 600

gatgttacag gctcaatgta tgaaaaggta aaaatagcat taaaaatgtc agaatttaca 660

aaaacagtaa taatcaatgg aaacgttaaa ggcagattag gggatacatt aaagggaaaa 720

aaggttgttg gtacggtggt aggatga 747

<210> 272

<211> 757

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 272

atgatgctgg ttaaactggg cggtagtgtt attaccgata aaagcaaaaa atacgtgttc 60

cgtgaaaaaa ccgttcgtcg tctggccgaa gaaattaaaa atagtggtga aaaagtgatc 120

gtggtgcatg gtgcaggcag cttcggccat attctggcca aaaaatatcg cctggataaa 180

ggcctgattc atgatcgtca ggtgaaaggt gtggcagttg tgcagcgcga tgttaaaaat 240

ctgaatctga aagttgtgaa ctgcctgatt ggcgcaggca tgaatccggt tagtattccg 300

ccgagcagtg tggcagaatg ccgcaataaa aaaattgaaa aaatcaacct ggacgtgttc 360

aaaaaatatc tgaatctggg cctgaccccg gttaccttcg gcgatgtggc cctggatcgt 420

aaactgagct tctgcattgt gagcggtgat ctgctgatgc tggaactggc ccgcgtgttc 480

aaaccgaaaa aaagcatctt cgtgagtgat gttgatggtg tgtatattaa tggcaaaatg 540

gtggaaaaag tggatcgcaa aattattcag aatctggaac gtaaaaagac caaaattagc 600

gatgtgaccg gcagtatgta tgaaaaagtt aaaattgccc tgaagatgag cgagttcacc 660

aaaaccgtta ttattaatgg caatgtgaag ggccgcctgg gcgataccct gaaaggtaaa 720

aaagtggttg gtaccgttgt gggctgactg aaagctt 757

<210> 273

<211> 251

<212> PRT

<213> 炽热甲烷嗜热菌（Methanothermus fervidus）

<400> 273

Met Ile Ile Ile Lys Ile Gly Gly Ser Val Ile Thr Asp Lys Asn Ser

1 5 10 15

Lys Tyr Pro Lys Leu Asn Lys Lys Asn Leu Lys Arg Val Cys Lys Glu

20 25 30

Ile Cys Glu Val Met Pro Phe Pro Leu Ile Leu Val His Gly Ala Gly

35 40 45

Ser Phe Gly His Pro Ile Val Lys Lys Tyr Asp Ile Ile Ala Asn Pro

50 55 60

Asn Lys Lys Gly Phe Cys Ile Val His Tyr Trp Val Lys Lys Leu Asn

65 70 75 80

Leu Tyr Val Cys Arg Tyr Leu Leu Lys Tyr Gly Met Asp Val Val Ser

85 90 95

Ile Gln Pro Ser Ser Cys Ile Ile Ala Ser Asp Gly Phe Ile Asp Tyr

100 105 110

Phe Asn Val Lys Ile Ile Glu Arg Tyr Leu Glu Lys Glu Ile Val Pro

115 120 125

Val Leu Tyr Gly Asp Ile Val Leu Asp Lys Ser Leu Glu Phe Ser Val

130 135 140

Ile Ser Gly Asp Gln Ile Val Arg Tyr Leu Gly Glu Lys Met Lys Ala

145 150 155 160

Asn Lys Ile Ile Leu Ala Thr Asp Val Asp Gly Val Tyr Asp Lys Asp

165 170 175

Pro Lys Lys His Lys Asp Ala Lys Leu Ile Lys Arg Ile Lys Pro Glu

180 185 190

Asp Lys Ile Lys Leu Lys Asp Phe Lys Glu Asp Val Thr Gly Gly Met

195 200 205

Ala Gly Lys Val Ser Glu Leu Leu Lys Leu Ala Glu Lys Gly Val Lys

210 215 220

Ser Glu Ile Val Asn Ala Lys Lys Lys Asn Arg Leu Lys Lys Leu Leu

225 230 235 240

Leu Gly Lys Arg Val Arg Arg Thr Ile Ile Gly

245 250

<210> 274

<211> 756

<212> DNA

<213> 炽热甲烷嗜热菌（Methanothermus fervidus）

<400> 274

atgattatta ttaagatagg tggtagtgtt atcactgata aaaattcaaa atatcctaaa 60

ttaaataaaa aaaatttgaa aagggtttgt aaggaaattt gtgaagttat gcccttccct 120

ttaattttgg tacatggggc aggatcattt ggccatccaa tcgtaaaaaa atatgatatt 180

attgctaatc ccaataaaaa aggtttttgt attgtccact attgggtaaa aaagttaaat 240

ctttatgttt gtaggtatct acttaaatat ggtatggatg tagtatccat acaaccttct 300

tcatgtatta tagcatctga tgggtttata gattatttta atgtaaaaat tattgagcga 360

tatttagaaa aagaaatcgt tcctgtgtta tatggggata tagtattaga taaatcatta 420

gagttttctg ttatttctgg agatcaaatt gtaagatatt taggagaaaa aatgaaagct 480

aataaaatta tattggctac agatgttgat ggtgtatatg ataaggatcc aaaaaaacat 540

aaagatgcaa aattaataaa aaggataaaa cctgaagata aaatcaaatt aaaagatttt 600

aaagaagacg taacaggagg tatggcaggc aaagtttcag aacttttaaa attagcagaa 660

aaaggtgtaa aatctgagat tgtaaatgca aaaaagaaaa acagattgaa aaaattacta 720

cttgggaaaa gagtccgtag aacaataata ggttaa 756

<210> 275

<211> 766

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 275

atgatcatca tcaagatcgg tggtagcgtt attaccgata aaaatagtaa atacccgaag 60

ctgaataaga aaaatctgaa acgcgtgtgt aaagaaatct gtgaagtgat gccgttcccg 120

ctgattctgg tgcatggcgc aggcagcttc ggccatccga ttgtgaaaaa atatgatatt 180

atcgccaacc cgaataaaaa aggcttctgt attgttcatt actgggtgaa aaaactgaat 240

ctgtatgtgt gtcgttatct gctgaaatat ggtatggatg tggtgagtat tcagccgagc 300

agctgtatta ttgcaagcga tggcttcatt gattacttca atgtgaaaat tatcgagcgc 360

tatctggaaa aagaaattgt tccggtgctg tatggtgata ttgtgctgga taaaagcctg 420

gagttcagtg ttattagtgg cgatcagatt gttcgttatc tgggtgaaaa gatgaaagca 480

aataaaatta tcctggccac cgatgttgat ggcgtgtatg ataaagatcc gaaaaaacat 540

aaggacgcaa aactgattaa gcgcattaaa ccggaagata aaattaaact gaaggacttc 600

aaggaagatg ttaccggtgg catggcaggt aaagttagcg aactgctgaa actggcagaa 660

aaaggtgtga aaagcgaaat tgtgaatgca aaaaaaaaga accgcctgaa aaaactgctg 720

ctgggtaaac gcgtgcgtcg caccattatt ggttgactga aagctt 766

<210> 276

<211> 270

<212> PRT

<213> 藻渣膨胀芽孢杆菌（Tumebacillus algifaecis）

<400> 276

Met Asn Val Val Lys Ile Gly Gly Ser Leu Leu Thr Asp Lys Asp Gly

1 5 10 15

Tyr Cys Ala Pro Asn Gln Glu Met Val Arg Gln Tyr Ala Arg Thr Ile

20 25 30

Ala Lys Glu Trp Glu Arg Leu Arg Gly Asn Leu Ile Leu Ile Val Gly

35 40 45

Gly Gly Ser Tyr Gly Asn Ala Val Pro Val Arg Tyr His Leu Lys Asp

50 55 60

Ala Ser Leu Pro Trp Lys Asp Thr Asp Leu Ser Met Met Thr Val Lys

65 70 75 80

Met Phe Glu Trp Leu Ser Leu Val Thr Gln Ile Phe Arg Glu Glu Gly

85 90 95

Val Pro Cys Tyr Pro Phe Gln Thr Ser Gly Tyr Val Val Thr Lys Asn

100 105 110

Lys Arg Pro Gln Arg Phe Phe Val Glu Pro Val Glu His Val Leu Ser

115 120 125

Met Gly Val Leu Pro Val Phe Ser Gly Asp Leu Val Phe Asp Glu Glu

130 135 140

Gln Gln Phe Ile Ile Phe Ser Ser Asp Asn Leu Pro Glu Leu Phe Val

145 150 155 160

Glu Arg Met Ser Leu Arg Arg Met Val Met Leu Thr Asp Val Glu Gly

165 170 175

Val Met Gln Ile Gly Thr Asp Gly Gln Gln Thr Val Ile Pro Glu Val

180 185 190

Thr Arg Ala Asn Phe Gln Glu Val Leu Arg Cys Ala Gly Pro Ser Gln

195 200 205

Lys Pro Asp Ile Thr Gly Gly Met Lys Asn Lys Leu Glu Ala Leu Leu

210 215 220

Arg Leu Ala Glu Gln Gly Val Glu Gly Val Ile Thr Ser Gly Arg Lys

225 230 235 240

Ala Glu Ala Leu Leu Pro Ala Leu Phe Glu Pro Glu Pro Val Gly Thr

245 250 255

Met Ile Arg Pro Trp Ala Gln Glu Asn Arg Gly Gly Leu Leu

260 265 270

<210> 277

<211> 813

<212> DNA

<213> 藻渣膨胀芽孢杆菌（Tumebacillus algifaecis）

<400> 277

atgaatgtag tcaagattgg agggagtttg ctgaccgata aggacggcta ctgtgcgccg 60

aatcaggaga tggtgcggca gtatgcgcgc acgatcgcca aggagtggga gcggctgcgt 120

ggcaacttga tcctgatcgt cggcggaggc tcgtatggga atgcagtgcc ggttcgctat 180

cacttgaagg atgcttccct gccgtggaaa gatacggacc tgtcgatgat gacggtgaag 240

atgtttgagt ggttgtcgct ggtgacccag atttttcggg aagagggagt gccttgctat 300

ccgttccaga ccagcgggta tgtggtgacg aaaaacaaac ggccccagcg tttttttgtg 360

gagccggtgg agcacgtgct gtcgatgggg gtgctgcccg ttttctcggg cgacctggtc 420

tttgatgagg agcagcagtt tatcattttt tcgagtgata atttgcccga gttgtttgtc 480

gagcggatgt ctctccggcg gatggtgatg ctgaccgatg ttgagggagt gatgcaaatc 540

ggaacggatg ggcagcagac ggtgattcct gaagtgacgc gtgcaaattt tcaggaggtg 600

ctgcgctgtg cggggccttc gcaaaagccg gatatcacag gcggaatgaa aaataagctg 660

gaagctctgt tgcgcttggc ggagcaggga gtggaaggtg tgatcaccag cggaaggaag 720

gcggaggcat tgctgccagc gttgtttgag cccgagcctg taggcacgat gattcggcct 780

tgggcacaag agaatagagg gggattgctg tag 813

<210> 278

<211> 823

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 278

atgaacgttg ttaagatcgg cggcagtctg ctgaccgata aagatggcta ttgtgccccg 60

aatcaggaaa tggtgcgtca gtatgcccgc accattgcaa aagaatggga acgcctgcgt 120

ggtaatctga ttctgattgt tggcggcggc agctatggta atgcagttcc ggttcgctat 180

catctgaaag atgccagtct gccgtggaaa gataccgatc tgagcatgat gaccgtgaaa 240

atgttcgaat ggctgagtct ggttacccag atattccgcg aagaaggcgt tccgtgttat 300

ccgttccaga ccagcggcta tgtggtgacc aaaaataaac gcccgcagcg cttcttcgtt 360

gaaccggtgg aacatgtgct gagtatgggt gttctgccgg tgttcagtgg tgatctggtg 420

ttcgatgaag aacagcagtt cattatcttc agtagcgata atctgccgga actgttcgtg 480

gaacgcatga gtctgcgccg tatggtgatg ctgaccgatg tggaaggtgt gatgcagatt 540

ggtaccgatg gccagcagac cgttattccg gaagttaccc gtgccaactt ccaggaagtt 600

ctgcgttgtg ccggcccgag tcagaaaccg gatattaccg gtggcatgaa aaataaactg 660

gaagccctgc tgcgcctggc agaacagggt gttgaaggtg ttattaccag tggtcgtaaa 720

gcagaagccc tgttaccggc actgttcgaa ccggaaccgg tgggtaccat gattcgtccg 780

tgggcccagg aaaatcgtgg cggcctgctg tgactgaaag ctt 823

<210> 279

<211> 259

<212> PRT

<213> 产甲烷古菌（methanogenic archaeon）

<400> 279

Met Ile Leu Ile Lys Phe Gly Gly Ser Val Ile Thr Asp Lys Ala Glu

1 5 10 15

Tyr Arg Lys Phe Asn Lys Glu Thr Val Ala Arg Leu Ala Asp Glu Ile

20 25 30

Lys Arg Ser Gly Gln Glu Val Ile Ile Val His Gly Ala Gly Ser Phe

35 40 45

Gly His Val Val Ser Lys Gln Tyr Asn Leu Gln Lys Gly Tyr Glu Asn

50 55 60

Asp Ser Gln Ile Pro Ala Met Ala Arg Val Met Cys Asp Thr Arg Glu

65 70 75 80

Leu Ser Ser Met Val Val Glu Glu Leu Leu Ala Lys Asn Ile Pro Ala

85 90 95

Val Ser Val Pro Ile Gly Ser Cys Phe Val Ala Asp Gly Gly Lys Leu

100 105 110

Val Val Asp Asn Glu Glu Pro Leu Arg Arg Leu Thr Asp Leu Gly Ile

115 120 125

Met Pro Val Met Phe Gly Asp Val Ile Thr Asp Arg Lys Thr Arg Phe

130 135 140

Cys Ile Val Ser Gly Asp Gln Val Met Glu Leu Leu Cys Trp Met Tyr

145 150 155 160

Asn Pro Glu Lys Val Val Phe Val Ser Asp Ile Asp Gly Leu Tyr Asp

165 170 175

Arg Asn Pro Lys Thr Asp Lys Ala Ala Arg Met Ile Gly Thr Val Thr

180 185 190

Lys Glu Lys Met Ala Ser Ile Ala Thr Asp Ser Asn Val Asp Asp Val

195 200 205

Thr Gly Gly Val Arg Asn Lys Met Glu Ala Met Leu Arg Met Thr Asp

210 215 220

Gly Ser Arg Lys Cys Tyr Leu Val Asn Gly Asn Ala Pro Asn Arg Leu

225 230 235 240

Tyr Ser Leu Leu Lys Gly Glu Thr Val Thr Cys Thr Ile Ala Lys Gly

245 250 255

Gly Leu Glu

<210> 280

<211> 780

<212> DNA

<213> 产甲烷古菌（methanogenic archaeon）

<400> 280

atgatactca taaaattcgg cggaagcgta attaccgaca aggccgagta tcgcaaattc 60

aacaaggaga ccgtcgccag actggctgac gaaatcaaac gctccggaca ggaggtcatc 120

atcgtccacg gagcaggttc tttcggacac gtggtctcca aacaatacaa ccttcagaag 180

ggttacgaga acgattccca gattcccgcc atggcaaggg tcatgtgcga caccagggaa 240

ctcagctcca tggtcgtgga ggaactcctc gccaagaata tccccgccgt atcggtgccc 300

atcggatcct gtttcgtcgc ggacggaggc aaactggtgg tcgacaacga ggagcccctc 360

aggaggctca ccgacctcgg gatcatgcct gtcatgttcg gagatgtgat taccgacagg 420

aagacccgtt tctgcatagt ttctggcgac caggttatgg agctcctgtg ctggatgtac 480

aatcccgaga aagtcgtgtt cgtatcggac atcgacggac tctacgaccg caaccccaag 540

acagacaagg ccgcacgcat gatcggcacc gtcaccaagg agaagatggc gagtatcgcc 600

accgattcca acgtggatga cgtcacaggt ggggtgcgca acaagatgga ggccatgctc 660

cgcatgaccg acggcagcag gaaatgctac ctggtcaacg gcaacgcccc caaccgcctg 720

tactcgctgc tgaagggcga gacagtcaca tgcacaatcg caaaaggagg cctggaatga 780

<210> 281

<211> 790

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 281

atgatcctga ttaagttcgg cggcagtgtt attaccgata aagcagaata tcgcaaattc 60

aataaggaaa ccgttgcccg cctggcagat gaaattaaac gcagcggcca ggaagtgatt 120

attgttcatg gtgccggtag cttcggccat gttgtgagta aacagtataa tctgcaaaaa 180

ggctatgaaa atgacagcca gattccggcc atggcacgcg tgatgtgtga tacccgtgaa 240

ctgagtagta tggttgttga agaactgctg gcaaaaaata ttccggcagt gagcgtgccg 300

attggcagct gcttcgttgc agatggtggt aaactggttg tggataatga agaaccgctg 360

cgtcgtctga ccgatctggg tattatgccg gtgatgttcg gcgatgtgat taccgatcgc 420

aaaaccagat tctgtattgt gagtggcgat caggtgatgg aactgctgtg ctggatgtat 480

aatccggaaa aagtggtgtt cgttagcgat attgatggtc tgtatgatcg caatccgaaa 540

accgataaag ccgcccgtat gattggtacc gtgaccaaag aaaaaatggc cagcattgcc 600

accgatagta atgtggatga tgttaccggt ggcgtgcgta ataaaatgga agcaatgctg 660

cgtatgaccg atggtagtcg caaatgctat ctggttaatg gtaatgcacc gaatcgcctg 720

tatagtctgc tgaaaggcga aaccgttacc tgtaccattg caaaaggcgg cctggaatga 780

ctgaaagctt 790

<210> 282

<211> 260

<212> PRT

<213> Thermoplasmatales archaeon

<400> 282

Met Phe Ile Ile Lys Leu Gly Gly Ser Val Ile Thr Asp Lys Ser Lys

1 5 10 15

Glu Asn Phe Tyr Lys Gln Val Ile Val Asp Asn Leu Val Lys Ala Ile

20 25 30

Lys Lys Ala Asn Lys Lys Thr Ile Ile Ile His Gly Ala Gly Ser Phe

35 40 45

Gly His Ile Ile Ala Asp Lys Tyr Lys Leu Asn Asp Gly Tyr Asn Ser

50 55 60

Asp Asp Gln Leu Leu Gly Phe Ser Leu Thr His Gly Met Val Gln Lys

65 70 75 80

Leu Ser Ser Leu Val Leu Glu Ser Phe His Lys Asn Gly Ile Pro Ala

85 90 95

Val Ala Val Pro Pro His Ser Asn Leu Ile Leu Asn Asn His Thr Pro

100 105 110

Leu Ser Phe Asp Tyr Lys Ile Phe Lys Glu Tyr Ile Asp Met Asn Phe

115 120 125

Thr Pro Ile Thr Phe Gly Asp Val Val Ile Asp Lys Lys Leu Gly Phe

130 135 140

Ser Ile Cys Ser Gly Asp Leu Leu Met Leu Leu Leu Ala Lys Asn Leu

145 150 155 160

Lys Pro Glu Lys Thr Ile Phe Val Ile Asp Glu Asp Gly Leu Tyr Thr

165 170 175

Ser Asn Pro Lys Lys Asp Asn Asn Ala Glu Leu Ile Glu Ser Ala Thr

180 185 190

Lys Glu Gln Leu Asn Lys Tyr Val Thr Ser Met Asp Lys His Ala Asp

195 200 205

Val Thr Gly Gly Met Gln Gly Lys Ile Glu Thr Ile Lys Lys Ile Ala

210 215 220

Asp Ile Gly Ile Asp Thr Ile Leu Leu Asn Gly Asn Lys Pro Asp Arg

225 230 235 240

Leu Phe Lys Val Leu Asn Gly Glu Lys Thr Lys Ser Thr Ile Ile Thr

245 250 255

Gly Gly Tyr Lys

260

<210> 283

<211> 783

<212> DNA

<213> Thermoplasmatales archaeon

<400> 283

atgtttatta tcaaacttgg cggtagtgta attacagata aatcaaagga aaatttctac 60

aaacaggtaa ttgttgataa tctagtaaag gctattaaaa aggcaaacaa aaaaacaata 120

attattcatg gggcaggttc ttttgggcat attattgcag ataaatacaa attaaatgat 180

ggttataatt cagatgatca actgcttggt ttttctctta ctcatggtat ggtacaaaaa 240

ttaagcagtt tggtcttgga atcttttcat aaaaatggga tacctgctgt tgctgttcct 300

cctcactcta atttaatatt aaacaatcat actcctttaa gctttgatta taaaattttc 360

aaagaatata ttgatatgaa ctttactcca ataacttttg gagatgttgt aattgataaa 420

aaattgggtt tttcaatttg ttcaggcgat cttttaatgc tcctacttgc aaaaaatctc 480

aaacctgaaa agacaatctt tgtaattgat gaggatggcc tttatacctc taatccaaaa 540

aaagataata atgcagaact aatagaatct gcaacaaaag aacaattaaa taaatatgtt 600

acctcaatgg acaagcatgc agatgtaact ggaggaatgc aaggaaaaat tgaaacaatt 660

aaaaaaattg cagatattgg tattgataca atcctgctaa atggtaataa acctgataga 720

ttattcaagg tcttaaatgg agaaaaaaca aaatcaacaa taatcactgg aggatataaa 780

tga 783

<210> 284

<211> 793

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 284

atgttcatca tcaagctggg cggcagcgtt attaccgata aaagtaaaga aaacttctac 60

aagcaggtga ttgtggataa tctggttaaa gccattaaaa aagccaataa aaagaccatt 120

atcatccatg gtgccggtag cttcggtcat attattgccg ataaatataa gctgaacgat 180

ggctataata gtgatgatca gctgctgggc ttcagcctga cccatggtat ggttcagaaa 240

ctgagtagtc tggttctgga atcattccat aaaaatggca ttccggcagt tgccgttccg 300

ccgcatagta atctgattct gaataatcat accccgctga gcttcgatta taaaatcttc 360

aaagaataca tcgacatgaa cttcaccccg attaccttcg gcgatgttgt tattgataaa 420

aaactgggct tcagtatctg tagcggtgat ctgctgatgc tgctgctggc aaaaaatctg 480

aaaccggaaa aaaccatctt cgtgattgat gaagatggtc tgtataccag caatccgaaa 540

aaagataata acgccgaact gattgaaagc gcaaccaaag aacagctgaa taaatatgtg 600

accagcatgg ataaacatgc cgatgtgacc ggtggtatgc agggtaaaat tgaaaccatt 660

aaaaagatcg cagacattgg tattgatacc attctgctga atggtaataa accggatcgc 720

ctgttcaaag tgctgaatgg cgaaaaaacc aaaagtacca ttattaccgg cggttataaa 780

tgactgaaag ctt 793

<210> 285

<211> 247

<212> PRT

<213> Thermoplasmatales archaeon

<400> 285

Met Val Ile Val Leu Lys Leu Gly Gly Ser Ile Ile Thr Glu Lys Asp

1 5 10 15

Ser Tyr Arg Lys Ile Asn Glu Asp Ala Ile Val Lys Leu Phe Asp Val

20 25 30

Leu Ser Lys Ser Arg Glu Lys Met Val Leu Ile His Gly Ala Gly Ser

35 40 45

Phe Gly His Ile Leu Ala Leu Lys His Gly Leu Glu Lys Pro Gly Pro

50 55 60

Ser Lys Gly Arg Glu Ala Ser Ile Ser Arg Val Met Ser Asp Val Leu

65 70 75 80

Ala Leu Asp Ser Ala Ile Val Asp Lys Leu Asn Glu Lys Gly Val Arg

85 90 95

Gly Val Ala Val Pro Pro His Ala Ile Tyr His Gly Ser Leu Pro Asp

100 105 110

Phe Lys Ile Val Glu Thr Leu Leu Ala Asn Gly Phe Ile Pro Val Leu

115 120 125

Tyr Gly Asp Ile Ile Val Tyr Arg Gly Lys Tyr Arg Ile Ile Ser Gly

130 135 140

Asp Glu Ile Ala Leu Asp Leu Ser Arg Arg Phe Arg Pro Arg Ser Val

145 150 155 160

Val Phe Val Thr Asp Val Asp Gly Leu Tyr Asp Ser Asp Pro Lys Val

165 170 175

Asn Lys Arg Ala Lys Phe Ile Pro Lys Ile Arg Ala Ser Glu Ile Glu

180 185 190

Val Ile Asp Thr Lys Arg Asp Ala Thr Gly Ser Met Ala Gly Lys Met

195 200 205

Glu Arg Ile Lys Lys Ile Val His Tyr Thr Gly Arg Val Ile Ile Ile

210 215 220

Asn Gly Lys Arg Pro Asp Arg Leu Ser Asp Ser Leu Glu Gly Lys Glu

225 230 235 240

Thr Lys Ser Thr Val Ile Thr

245

<210> 286

<211> 744

<212> DNA

<213> Thermoplasmatales archaeon

<400> 286

atggtgattg ttttaaaact cggtggaagc atcataactg aaaaagacag ttacaggaag 60

atcaacgaag acgccatagt aaaattgttt gatgttctct ctaaaagcag ggagaaaatg 120

gtgctcatcc acggtgcggg atccttcggc cacatacttg cactcaaaca tggtcttgaa 180

aaacctggac catcaaaggg gagggaggca tcgatctcaa gggttatgag tgacgtcctt 240

gcactcgatt ctgcaatcgt agataagctc aacgagaagg gtgtcagagg agtggcagta 300

ccaccacacg caatctacca tgggagtttg cccgatttca agatagttga aacgctcctg 360

gccaacggat tcattcctgt gctttacgga gacataattg tctatagggg aaaatacagg 420

ataatctcag gggacgagat agctctggat ttatcaagaa ggttcaggcc aaggtcagtt 480

gtctttgtca ctgacgtcga cggactttat gattccgacc cgaaggtcaa caagagggct 540

aaatttatcc caaagatcag ggcaagtgag atcgaagtga tagacactaa aagagatgct 600

actggttcca tggcggggaa gatggaaaga attaagaaaa tagtacacta tacaggcaga 660

gtgataataa tcaacggaaa gagacctgac aggcttagtg attccctgga ggggaaggag 720

acgaagtcca cggtgatcac atga 744

<210> 287

<211> 754

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 287

atggttatcg ttctgaaact gggcggtagc attattaccg aaaaagatag ttatcgcaag 60

attaatgagg atgccattgt gaaactgttc gatgtgctga gcaaaagtcg tgaaaaaatg 120

gtgctgattc atggcgcagg tagcttcggt catattctgg ccctgaaaca tggtctggaa 180

aaaccgggcc cgagtaaagg tcgtgaagca agtattagtc gtgttatgag cgatgtgctg 240

gcactggata gcgcaattgt ggataaactg aatgaaaaag gcgttcgtgg cgttgccgtg 300

ccgccgcatg ccatctatca tggtagcctg ccggacttca aaattgttga aaccttactg 360

gcaaatggct tcattccggt tctgtatggc gatattattg tgtatcgtgg caaatatcgt 420

attattagcg gcgatgaaat tgcactggat ctgagtcgcc gcttccgccc gcgtagtgtg 480

gtgttcgtta ccgatgtgga tggtctgtat gatagtgatc cgaaagtgaa taaacgtgcc 540

aaattcattc cgaaaattcg cgccagcgaa attgaagtga ttgataccaa acgtgatgca 600

accggtagta tggccggtaa aatggaacgt attaaaaaaa ttgtgcacta caccggccgc 660

gtgattatta ttaatggtaa acgcccggat cgcctgagcg atagcctgga aggtaaagaa 720

accaaaagta ccgtgattac ctgactgaaa gctt 754

<210> 288

<211> 270

<212> PRT

<213> Odinarchaeota archaeon

<400> 288

Met Asn Asn Lys Leu Thr Ile Ile Lys Leu Gly Gly Ser Val Ile Thr

1 5 10 15

Asp Lys Ser Val Pro Phe Ser Ile Asp Glu Lys Val Ile Lys Asn Ile

20 25 30

Ile Ser Glu Met Glu Gln Ile Lys Lys Glu Lys Thr Ile Ile Val His

35 40 45

Gly Gly Gly Ala Phe Gly His Pro Ile Ala Lys Lys Tyr Met Leu Ala

50 55 60

Thr Gly Leu Lys Val Lys Glu Gln Ile Arg Gly Val Ile Glu Thr Ser

65 70 75 80

Gln Ala Met Leu Thr Leu Asn Lys Ile Ile Leu Asp Met Phe Ile Gln

85 90 95

Ala Asp Tyr Pro Val Ile Ser Phe Ser Pro His Asp Ile Phe Ile Thr

100 105 110

Lys His Gly Arg Ile Tyr Lys Thr Phe Leu Asn Ser Leu Lys Asn Val

115 120 125

Leu Glu Ile Gly Phe Ile Pro Val Leu Phe Gly Asp Val Val Tyr Asp

130 135 140

Thr Ala Gln Gly Val Ala Ile Leu Ser Gly Asp Gln Ile Ile Ser Tyr

145 150 155 160

Leu Ser Ile Lys Leu Lys Ala Ser Lys Val Ile Leu Gly Thr Asp Ile

165 170 175

Asn Gly Ile Tyr Ser Ser Asp Pro Lys Ile Asn Pro Gly Ala Gln Leu

180 185 190

Ile Pro Glu Val Thr Pro Asp Asn Tyr Arg Arg Ile Leu Lys Ile Leu

195 200 205

Lys Ser Asn Thr Lys Asn Ser Leu Asp Val Thr Gly Gly Met Tyr Gly

210 215 220

Lys Val Arg Glu Leu Ile Lys Val Ala Lys His Gly Ile Asp Ile Tyr

225 230 235 240

Ile Leu Asn Ala Arg Thr Pro Gly Asn Ile Ser Lys Ile Leu Asn Asn

245 250 255

Ser Glu Ile Asn Cys Thr Gln Phe Lys Asn Trp Arg Lys Gln

260 265 270

<210> 289

<211> 813

<212> DNA

<213> Odinarchaeota archaeon

<400> 289

ttgaataata aattaactat aattaaactc ggcggaagtg tgatcacaga taaaagtgtc 60

ccgttctcaa tagatgagaa agtgattaag aatattatca gtgaaatgga gcagattaaa 120

aaagaaaaaa cgattatagt tcacggcggc ggagcgttcg ggcaccctat cgccaaaaaa 180

tacatgctag caacaggtct taaagttaaa gagcagataa gaggcgtaat cgaaacaagt 240

caagcgatgc ttacactgaa taaaatcata ctcgatatgt ttattcaagc agattacccg 300

gttatctctt tcagcccaca tgatattttc atcactaaac acggtagaat atataaaaca 360

tttcttaatt ctctaaaaaa tgttttagaa ataggcttca tacctgtttt attcggcgac 420

gttgtatatg atacagccca aggtgttgcg atactttcag gggaccagat tataagctat 480

ttatcaatca agcttaaagc tagtaaggtg attctcggaa cagatataaa tggaatatac 540

tcaagcgatc ctaaaataaa ccccggcgcg cagttaatcc cagaagtaac tcctgataac 600

tatcgcagga ttctaaaaat tttaaagtca aacactaaaa acagtttaga tgtcacaggt 660

ggaatgtacg gtaaggttag agagctgata aaggtcgcta aacatggaat agacatatat 720

attttgaacg ctagaacacc aggtaatatt agtaaaatat taaataactc tgaaattaat 780

tgtacacaat tcaaaaactg gcgtaaacag taa 813

<210> 290

<211> 823

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 290

atgaacaaca agctgaccat tattaagctg ggcggcagcg ttattaccga taaaagcgtg 60

ccgttcagca ttgatgaaaa agttattaaa aacatcatca gcgagatgga acagattaaa 120

aaagaaaaaa ccatcatcgt gcacggcggt ggcgcattcg gtcatccgat tgcaaaaaaa 180

tatatgctgg caaccggcct gaaagtgaaa gaacagattc gtggcgttat tgaaaccagt 240

caggccatgc tgaccctgaa taaaattatt ctggatatgt tcatccaggc cgattatccg 300

gttattagct tcagcccgca tgatatcttc attaccaaac atggccgtat ctataaaacc 360

ttcctgaata gcctgaaaaa tgttctggaa attggcttca ttccggttct gttcggcgat 420

gttgtgtatg ataccgcaca gggtgttgcc attctgagcg gtgatcagat tattagctat 480

ctgagcatta aactgaaggc aagtaaagtt attctgggca ccgatattaa tggcatctat 540

agcagcgatc cgaaaattaa tccgggtgcc cagctgattc cggaagtgac cccggataat 600

tatcgccgca ttctgaaaat tctgaaaagt aataccaaga acagcctgga tgtgaccggc 660

ggcatgtatg gtaaagttcg tgaactgatt aaagttgcaa aacatggtat tgatatctac 720

attctgaacg cccgtacccc gggcaatatt agcaaaattc tgaataatag cgagatcaat 780

tgcacccagt tcaaaaattg gcgcaaacag tgactgaaag ctt 823

<210> 291

<211> 137

<212> PRT

<213> 福氏志贺菌（Shigella flexneri）

<400> 291

Met Pro Met Asp Leu Arg Asp Asn Lys Gln Ser Gln Lys Lys Trp Lys

1 5 10 15

Asn Arg Thr Leu Thr Ser Ser Leu Glu Phe Ala Leu Thr Gly Ile Phe

20 25 30

Thr Ala Phe Lys Glu Glu Arg Asn Met Lys Lys His Ala Val Ser Ala

35 40 45

Leu Leu Ala Val Ile Ala Gly Leu Val Phe Lys Val Ser Val Ile Glu

50 55 60

Trp Leu Phe Leu Leu Leu Ser Ile Phe Leu Val Ile Thr Phe Glu Ile

65 70 75 80

Val Asn Ser Ala Ile Glu Asn Val Val Asp Leu Ala Ser Asp Tyr His

85 90 95

Phe Ser Met Leu Ala Lys Asn Ala Lys Asp Met Ala Ala Gly Ala Val

100 105 110

Leu Val Ile Ser Gly Phe Ala Ala Leu Thr Gly Leu Ile Ile Phe Leu

115 120 125

Leu Lys Ile Trp Phe Leu Leu Phe His

130 135

<210> 292

<211> 414

<212> DNA

<213> 福氏志贺菌（Shigella flexneri）

<400> 292

atgcctatgg acttaagaga taataagcaa agccaaaaga aatggaaaaa tagaacttta 60

acttccagcc ttgaattcgc tttaacgggg atttttacgg cttttaaaga agagcgtaat 120

atgaaaaaac atgcagtgtc agctctttta gctgtcattg ctggtttggt ttttaaagta 180

tcagtcattg agtggctttt tcttttatta agtatttttt tggttattac ctttgaaatt 240

gtcaattcgg ctattgaaaa tgtggttgat ttggccagtg actatcattt ttccatgttg 300

gctaaaaatg ctaaggatat ggctgcagga gctgttcttg tcatttcagg ttttgctgcc 360

ttgacaggct tgattatttt tttattaaaa atttggtttt tgctttttca ttaa 414

<210> 293

<211> 424

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 293

atgccgatgg atctgcgtga taataaacag agtcagaaaa aatggaagaa ccgcaccctg 60

accagtagcc tggagttcgc cctgaccggt atcttcaccg cattcaaaga agaacgcaat 120

atgaaaaaac acgcagttag tgcactgctg gcagtgattg caggtctggt gttcaaagtt 180

agcgttattg aatggctgtt cctgctgctg agcatcttcc tggttattac cttcgaaatt 240

gttaatagcg ccattgaaaa tgtggtggat ctggcaagtg attatcactt cagcatgctg 300

gcaaaaaatg ccaaagatat ggcagccggc gcagttctgg ttattagtgg cttcgcagcc 360

ctgaccggcc tgattatctt cctgctgaaa atctggttcc tgctgttcca ttgactgaaa 420

gctt 424

<210> 294

<211> 123

<212> PRT

<213> Roizmanbacteria bacterium

<400> 294

Met Ile Arg Gly His Arg Ile Ser Ile Arg His Ala Ile Asp Gly Ile

1 5 10 15

Ile Trp Ala Val Arg Thr Gln Pro Asn Tyr Arg Ile His Phe Thr Leu

20 25 30

Ser Ile Leu Ser Leu Val Gly Gly Leu Ile Phe Lys Ile Ser Tyr Glu

35 40 45

Glu Phe Leu Ala Ile Tyr Val Leu Ile Phe Val Gly Leu Ala Ile Glu

50 55 60

Thr Val Asn Thr Ser Leu Glu Lys Thr Ser Asp Ala Ile Thr Arg Glu

65 70 75 80

Tyr Asn His Asp Ile Lys Thr Ala Lys Asp Val Ala Ala Gly Ala Met

85 90 95

Leu Phe Phe Ala Ile Gly Ala Leu Ala Val Ala Cys Ala Ile Phe Ile

100 105 110

Pro Lys Ile Trp Leu Leu Phe Ile Asn Ala Ser

115 120

<210> 295

<211> 372

<212> DNA

<213> Roizmanbacteria bacterium

<400> 295

atgattcgtg gacacagaat ttctattaga catgcaattg acggcataat ctgggccgtt 60

cggacacagc ctaactatcg gattcatttt actttatcaa ttctgtctct ggttggtggc 120

ctgattttca aaatttccta tgaagaattt ttagcaatct acgtcctgat ttttgtgggg 180

ctggcaattg agacagtcaa tacttcactt gagaaaactt cagacgccat cacccgtgaa 240

tacaatcacg atatcaaaac cgccaaagat gtggcggccg gagcaatgct tttttttgcg 300

attggtgctt tggccgtggc ctgcgcgatc tttatcccca aaatatggct gttatttatt 360

aacgcgtctt aa 372

<210> 296

<211> 382

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 296

atgatccgtg gtcatcgtat tagcattcgc catgcaattg atggcattat ctgggcagtg 60

cgtacccagc cgaattatcg cattcacttc accctgagca ttctgagcct ggttggtggc 120

ctgatcttca aaattagtta tgaagagttc ctggccatct atgttctgat cttcgtgggc 180

ctggcaattg aaaccgtgaa taccagtctg gaaaaaacca gcgatgccat tacccgtgaa 240

tataatcatg atattaagac cgcaaaggat gttgccgcag gtgccatgct gttcttcgcc 300

attggcgccc tggcagttgc atgcgccatc ttcattccga aaatctggct gctgttcatt 360

aatgcaagct gactgaaagc tt 382

<210> 297

<211> 127

<212> PRT

<213> 拟杆菌属（Bacteroidales bacterium）

<400> 297

Met Glu Ser Gly Asn Arg Leu Gly Leu His Ser Arg Tyr Gln Ser Ile

1 5 10 15

Arg Phe Ala Val Asn Gly Ile Lys Thr Leu Phe Arg Glu Glu Lys Asn

20 25 30

Ala Val Ile Gln Leu Leu Ile Phe Ala Met Val Ile Ile Ala Gly Phe

35 40 45

Phe Ser Arg Leu Ser Asp Thr Glu Trp Ile Leu Ile Thr Thr Val Ser

50 55 60

Met Phe Val Phe Ala Cys Glu Cys Phe Asn Thr Ala Leu Glu Asp Leu

65 70 75 80

Ser Asp Phe Val Thr Gly Glu Lys Asn Glu Lys Ile Arg Lys Ile Lys

85 90 95

Asp Leu Ala Ala Gly Gly Val Leu Ile Ser Ala Leu Gly Ala Ala Ile

100 105 110

Thr Gly Met Ile Ile Phe Phe Pro Arg Phe Leu Asp Leu Phe Asn

115 120 125

<210> 298

<211> 384

<212> DNA

<213> 拟杆菌属（Bacteroidales bacterium）

<400> 298

atggaatccg gtaacaggtt gggtttgcat agccggtatc agagtatcag gtttgctgta 60

aatggcataa aaactctctt cagagaagag aaaaatgcgg taattcagtt gctgattttt 120

gctatggtaa tcatagcggg atttttttcc agactgtcag atacagaatg gattttaata 180

acaacagtaa gtatgtttgt atttgcttgt gaatgtttta atactgcact ggaagatctt 240

tctgatttcg tgaccggaga aaagaatgaa aagatcagga agatcaagga cctggcagcg 300

ggtggagtcc tgatctcagc tttaggtgct gctattacag gtatgataat tttttttcca 360

cgatttttag acctgtttaa ttga 384

<210> 299

<211> 394

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 299

atggaaagtg gtaatcgtct gggtctgcat agtcgttatc agagtattcg cttcgcagtt 60

aatggtatta aaaccttatt ccgtgaagaa aaaaacgccg ttattcagct gctgatcttc 120

gcaatggtta ttattgcagg cttcttcagt cgcctgagcg ataccgaatg gattctgatt 180

accaccgtga gcatgttcgt gttcgcatgt gaatgcttca ataccgccct ggaagactta 240

agcgacttcg tgaccggtga aaaaaatgaa aaaattcgta agatcaagga cctggcagcc 300

ggtggtgtgc tgattagcgc cctgggtgca gccattaccg gcatgattat cttcttcccg 360

cgcttcctgg atctgttcaa ttgactgaaa gctt 394

<210> 300

<211> 168

<212> PRT

<213> Methylomirabilis oxyfera

<400> 300

Met Glu Gly Ser Ser His Pro Phe Arg Cys Ala Leu Lys Gly Val Glu

1 5 10 15

Asp Ala Ile Ser Thr Gln Arg His Leu Arg Ala His Ile Val Val Ala

20 25 30

Gly Phe Val Ala Leu Phe Gly Leu Leu Leu Glu Leu Pro His Val Asp

35 40 45

Leu Val Leu Leu Leu Met Ala Ile Ala Leu Val Ile Ile Thr Glu Leu

50 55 60

Leu Asn Thr Ala Val Glu Leu Thr Val Asp Leu Val Ser Pro Thr Phe

65 70 75 80

His Pro Ile Ala Gly Arg Ala Lys Asp Ile Ala Ala Gly Ala Val Leu

85 90 95

Ile Ala Ala Leu Val Ala Ala Thr Val Gly Ile Ile Val Leu Ala Pro

100 105 110

Pro Leu Phe Gly Ala Leu Thr Thr Arg Pro Leu Ser Ala Lys Ser Ala

115 120 125

Leu Leu Val Ala Thr Thr Leu Gly Leu Val Gly Ser Ile Ile Ala Ala

130 135 140

Leu Leu Pro Arg Ser Ser Ser Ser Lys Arg Asp Gln Leu Leu Thr Val

145 150 155 160

Ser Lys Lys Leu Asn Thr Asp His

165

<210> 301

<211> 507

<212> DNA

<213> Methylomirabilis oxyfera

<400> 301

gtggaaggct cgtcacatcc gtttcgctgt gcgttgaaag gggtcgaaga cgcgatctcc 60

acacaacgcc acctgcgcgc tcacatcgtc gtggccgggt tcgtcgcgct gttcgggctg 120

ttgctggagt tgccgcatgt cgatctggtg ctgctgctca tggccattgc gcttgttatc 180

atcacagaac tgctgaatac tgcagtggag ttgaccgtgg atcttgtatc gccgaccttt 240

cacccgatcg ccggacgggc aaaggacatt gccgccggcg cggtgctgat cgccgcgttg 300

gttgcggcta ccgtcggtat tatcgtactt gcgccccctt tgttcggcgc gctcaccaca 360

cgtccgcttt cagcgaagtc agctctgctg gtggcgacca ccctcgggct ggtcggaagc 420

attattgctg cactcttgcc acgttcttcc agctcgaagc gcgaccagct tttaactgtc 480

agcaagaagt tgaatactga ccactga 507

<210> 302

<211> 517

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 302

atggaaggca gcagccatcc gttccgttgt gccctgaaag gcgttgaaga tgcaattagc 60

acccagcgtc atctgcgcgc ccatattgtt gttgccggct tcgtggccct gttcggcctg 120

ctgctggaac tgccgcatgt ggatctggtt ctgctgctga tggcaattgc cctggttatt 180

attaccgaac tgctgaatac cgcagttgaa ctgaccgtgg atctggtgag cccgaccttc 240

catccgattg ccggtcgcgc aaaagatatt gccgccggcg ccgtgctgat tgcagcactg 300

gtggccgcca ccgttggtat tattgtgctg gcaccgccgc tgttcggtgc actgaccacc 360

cgcccgctga gtgccaaaag tgcactgctg gttgcaacca ccctgggcct ggttggcagt 420

attattgcag cattactgcc gcgtagcagc agtagcaaac gtgatcagct gctgaccgtt 480

agtaaaaaac tgaataccga tcattgactg aaagctt 517

<210> 303

<211> 132

<212> PRT

<213> Eremococcus coleocola

<400> 303

Met Asp Leu Lys Asp Arg Lys Asp Leu Asn Pro Phe Lys Arg Trp Leu

1 5 10 15

Leu Ser Cys Gly Phe Ala Leu Glu Gly Leu Arg Phe Thr Trp Lys Gly

20 25 30

Glu Pro Asn Phe Lys Ile His Ile Ser Ile Leu Ile Leu Val Thr Ile

35 40 45

Ala Gly Phe Phe Phe Gly Ile Ala Arg Trp Glu Trp Val Thr Leu Leu

50 55 60

Ile Cys Phe Ala Phe Ile Leu Thr Leu Glu Leu Ile Asn Thr Ala Leu

65 70 75 80

Glu Thr Leu Val Asn Trp Ile Ala Asp Lys Gln Trp His Pro Leu Ala

85 90 95

Lys Ile Thr Lys Asp Val Ala Ala Gly Ala Val Leu Val Gly Ala Ile

100 105 110

Ile Val Ala Gly Ile Gly Leu Ile Ile Phe Val Pro Tyr Ile Trp Gln

115 120 125

Tyr Phe Leu Gly

130

<210> 304

<211> 399

<212> DNA

<213> Eremococcus coleocola

<400> 304

atggacttga aagatagaaa agatttaaat ccctttaaac ggtggctact ttcctgtggc 60

tttgccctag agggattacg ctttacttgg aaaggtgagc ccaattttaa gattcatatt 120

tccattttga ttcttgtaac gattgctggg tttttctttg ggattgcccg ctgggaatgg 180

gtgactcttt taatttgttt tgcctttatt ttgaccttag agttaatcaa taccgcctta 240

gaaactctcg taaactggat agctgataaa cagtggcacc ctttggctaa gattaccaag 300

gatgtggcag ctggagctgt cttagtgggt gctattattg ttgcggggat tggtttgatt 360

atttttgtgc catatatctg gcaatatttt ctaggttag 399

<210> 305

<211> 409

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 305

atggatctga aagatcgtaa agacttaaat ccgttcaaac gctggctgct gagctgcggc 60

ttcgcactgg aaggtctgcg cttcacctgg aaaggcgaac cgaacttcaa aattcatatt 120

agtatcctga tcctggttac cattgccggc ttcttcttcg gcattgcccg ctgggaatgg 180

gtgaccctgc tgatctgctt cgccttcatt ctgaccctgg aactgattaa taccgcactg 240

gaaaccttag tgaattggat tgcagataaa cagtggcatc cgctggcaaa aattaccaaa 300

gatgtggccg caggtgccgt tctggttggt gccattattg tggcaggtat tggcctgatt 360

atcttcgttc cgtatatctg gcagtacttc ctgggttgac tgaaagctt 409

<210> 306

<211> 128

<212> PRT

<213> 厚壁菌属（Firmicutes bacterium）

<400> 306

Met Leu Ser Arg Thr Lys Lys Arg Arg Lys Phe Lys Asp Ser Phe Lys

1 5 10 15

Asn Cys Ile Asp Gly Leu Arg Phe Ile Asn Ile Asn Glu Asp Asn Phe

20 25 30

Lys Arg Glu Ile Leu Leu Gly Ile Ile Thr Leu Val Leu Ser Tyr Leu

35 40 45

Leu Lys Ile Asp Lys Ile Glu Phe Ile Ile Ile Ile Ile Val Ile Gly

50 55 60

Leu Val Leu Val Ser Glu Ile Ile Asn Thr Ala Ile Glu Arg Leu Val

65 70 75 80

Asp Leu Val Ser Pro Lys Tyr Asn Lys Leu Ala Gly Glu Val Lys Asp

85 90 95

Ile Ala Ala Ser Ser Val Leu Leu Met Cys Ile Phe Ser Leu Val Val

100 105 110

Gly Val Ile Ile Phe Val Pro Lys Ile Ile Asn Leu Leu Gly Gly Phe

115 120 125

<210> 307

<211> 387

<212> DNA

<213> 厚壁菌属（Firmicutes bacterium）

<400> 307

atgctttcac gaactaagaa aagacggaag tttaaagata gttttaagaa ttgtatagat 60

ggcttaagat ttattaatat taatgaagat aattttaaaa gagaaatact tttaggtatt 120

ataactttag ttttatcgta tcttcttaag atagataaaa tagaatttat aatcataatt 180

atagtaattg gactagtatt agtaagtgaa ataattaata cagcaataga aagattagtt 240

gatcttgtta gtccaaaata taataagtta gcaggagaag taaaagatat agcagcttct 300

tctgtccttc ttatgtgtat cttttcttta gtagtaggag taataatatt tgtaccaaaa 360

ataattaatt tactaggagg attttaa 387

<210> 308

<211> 397

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 308

atgctgagtc gtaccaaaaa acgtcgcaaa ttcaaagata gcttcaaaaa ttgtatcgac 60

ggcctgcgct tcattaatat taatgaagat aacttcaagc gtgagattct gctgggtatt 120

attaccctgg tgctgagcta tctgctgaaa attgataaaa ttgagttcat catcatcatc 180

attgtgattg gcctggtgct ggtgagcgaa attattaata ccgcaattga acgtctggtg 240

gatctggtta gcccgaaata taataaactg gccggcgaag ttaaagatat tgccgccagc 300

agcgtgctgc tgatgtgcat cttcagcctg gtggtgggcg tgattatctt cgtgccgaaa 360

attattaatc tgctgggtgg cttctgactg aaagctt 397

<210> 309

<211> 156

<212> PRT

<213> Raphidiopsis brookii

<400> 309

Met Phe Pro Lys Ser Ser Ile Pro Pro Thr Pro Pro Lys Arg Leu Pro

1 5 10 15

Lys Ile Val Ser Ser Glu Arg Glu Phe Ser Trp Gln Ile Ala Ser Asn

20 25 30

Leu Leu Ala Ser Phe Lys Tyr Ala Trp Ala Gly Ile Ser Tyr Gly Phe

35 40 45

Gln Thr Gln Arg Asn Phe Arg Ile His Val Ala Ala Cys Ala Phe Val

50 55 60

Ile Gly Leu Ser Ile Phe Leu His Leu Lys Pro Val Glu Ile Ala Ile

65 70 75 80

Ile Ser Ile Thr Ser Gly Leu Val Leu Thr Leu Glu Leu Val Asn Thr

85 90 95

Ala Ile Glu Ser Leu Val Asp Leu Thr Val Lys Gln Thr Tyr His Glu

100 105 110

Leu Ala Lys Val Ala Lys Asp Cys Ala Ala Gly Ala Val Leu Val Ser

115 120 125

Ala Met Val Ser Leu Ile Val Ala Thr Thr Leu Leu Leu Pro Pro Leu

130 135 140

Leu Arg Leu Ile Thr Thr Thr Phe Leu Leu Glu Trp

145 150 155

<210> 310

<211> 471

<212> DNA

<213> Raphidiopsis brookii

<400> 310

atgttcccta agagttcaat accaccaaca ccaccaaagc gtttaccaaa aattgtatct 60

tcggaaaggg aattttcttg gcaaatagct tctaacttac ttgccagctt taaatacgct 120

tgggctggta tcagttatgg ttttcagacc cagcgtaact ttaggattca tgtagctgct 180

tgtgcttttg tgattggttt gagtattttt ctgcatctta aaccagtaga aatagccata 240

attagcatta caagtggttt agttttaaca ttggagttag ttaatacagc cattgagtct 300

ctggtggatt taactgttaa gcagacctat catgaattgg cgaaagtggc caaagactgt 360

gctgctggtg ctgtgcttgt ctcagcaatg gtatcactaa tagtagcaac tacactatta 420

cttcctcctt tactacgttt aatcacaact acattcttat tagaatggta g 471

<210> 311

<211> 481

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 311

atgttcccga aaagtagcat tccgccgacc ccgccgaaac gtctgccgaa aattgtgagt 60

agcgaacgtg agttcagttg gcagattgca agcaatctgc tggcatcatt caaatatgcc 120

tgggccggca ttagctatgg cttccagacc cagcgtaact tccgtattca tgtggccgca 180

tgcgcattcg ttattggtct gagtatcttc ctgcatctga aaccggttga aattgcaatt 240

attagcatta ccagcggtct ggttctgacc ctggaactgg ttaataccgc aattgaaagc 300

ctggtggatc tgaccgtgaa acagacctat catgaactgg caaaagttgc caaagattgt 360

gcagcaggtg cagtgctggt tagtgccatg gttagtctga ttgttgcaac caccctgctg 420

ctgccgccgc tgctgcgtct gattaccacc accttcctgc tggaatggtg actgaaagct 480

t 481

<210> 312

<211> 128

<212> PRT

<213> Bacterium species

<400> 312

Met Glu Thr Val Arg Lys Phe Leu Met Gly Phe Val Tyr Ala Trp His

1 5 10 15

Gly Ile Lys Arg Ala Leu Ser Gln Arg Asn Met Lys Phe His Ala Phe

20 25 30

Val Ala Ala Met Val Val Leu Phe Gly Phe Phe Leu Gln Ile Ser Phe

35 40 45

Val Glu Trp Val Val Val Ile Val Leu Ile Ala Leu Val Phe Ala Ala

50 55 60

Glu Met Phe Asn Thr Ala Ile Glu Asn Glu Ala Asn Thr Met Arg Asp

65 70 75 80

Lys Leu Gly Ala Pro Tyr Ser Leu Met Gly Ala Pro Lys Asp Leu Ala

85 90 95

Ala Gly Ala Val Leu Val Leu Ala Ile Ala Ala Ala Ile Ile Gly Leu

100 105 110

Ala Ile Phe Leu Pro Lys Leu Trp Val Leu Phe Gln Glu Ile Thr Met

115 120 125

<210> 313

<211> 387

<212> DNA

<213> Bacterium species

<400> 313

atggagactg taagaaagtt tttaatgggt tttgtatacg cctggcatgg aataaaacgg 60

gctttaagtc agcgaaatat gaagtttcac gcttttgttg cggcgatggt ggttcttttt 120

ggctttttcc ttcaaatatc atttgtggaa tgggttgtgg tcatagtttt gattgcccta 180

gtttttgctg ccgaaatgtt taacaccgcg attgaaaacg aggccaatac tatgcgcgat 240

aagcttggcg cgccgtactc gttgatgggt gcccctaaag acttagctgc cggtgcggtt 300

ttagttttag caattgccgc tgcaataatt ggccttgcga tttttctgcc caaactttgg 360

gttctttttc aagaaatcac aatgtag 387

<210> 314

<211> 397

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 314

atggaaaccg tgcgtaaatt cctgatgggc ttcgtgtatg catggcatgg cattaaacgt 60

gccctgagcc agcgtaatat gaaattccat gccttcgttg cagcaatggt ggtgctgttc 120

ggcttcttcc tgcaaattag cttcgttgaa tgggttgtgg tgattgtgct gattgccctg 180

gtgttcgccg ccgaaatgtt caataccgcc attgaaaatg aagccaatac catgcgtgat 240

aaactgggcg ccccgtatag cctgatgggt gccccgaaag acttagcagc aggcgcagtt 300

ctggttctgg ccattgcagc agccattatt ggcctggcca tcttcctgcc gaaactgtgg 360

gttctgttcc aggaaattac catgtgactg aaagctt 397

<210> 315

<211> 120

<212> PRT

<213> 腐败螺旋菌（Saprospirales bacterium）

<400> 315

Met Lys Lys Trp Asp Phe Ile Gly Leu Arg Phe Ala Leu Ser Gly Leu

1 5 10 15

Phe Ile Leu Leu Gln Gln Arg Asn Phe Arg Ile Glu Ala Leu Val Ala

20 25 30

Leu Leu Ala Ile Val Leu Gly Phe Tyr Leu Gln Ile Asn Ala Gln Ala

35 40 45

Trp Leu Trp Ile Ser Leu Ala Ile Thr Leu Val Leu Val Gly Glu Ala

50 55 60

Ile Asn Thr Ala Ile Glu Leu Thr Leu Asp Arg Ile Gly Arg Asp Phe

65 70 75 80

His Pro Thr Thr Lys Arg Ala Lys Asp Ile Ala Ala Gly Ala Val Val

85 90 95

Leu Cys Cys Leu His Ala Ala Ile Ile Gly Phe Val Val Phe Gly Pro

100 105 110

Lys Leu Trp Ala Leu Leu Phe Ala

115 120

<210> 316

<211> 363

<212> DNA

<213> 腐败螺旋菌（Saprospirales bacterium）

<400> 316

atgaaaaaat gggactttat cggcctccga tttgccctta gtggcctttt tattctttta 60

caacagcgaa actttcgcat tgaagcactg gttgcacttc ttgcaattgt tttggggttt 120

tatcttcaaa ttaacgcgca ggcctggcta tggattagcc ttgccattac tctcgttctt 180

gtaggagaag ccatcaatac cgctattgag ttaaccttag atagaatagg aagggatttc 240

catccgacaa caaaacgagc taaagacatt gccgcaggag cagttgtttt atgttgtctc 300

catgctgcta ttattggatt tgtagtcttt ggccctaagc tttgggcatt gctctttgca 360

taa 363

<210> 317

<211> 373

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 317

atgaagaagt gggacttcat tggtctgcgc ttcgcactga gtggtctgtt cattctgctg 60

caacagcgca acttccgtat tgaagcactg gtggccctgc tggccattgt tctgggcttc 120

tatctgcaaa ttaatgccca ggcctggctg tggattagcc tggccattac cctggtgctg 180

gttggtgaag ccattaatac cgcaattgaa ctgaccctgg atcgtattgg tcgcgacttc 240

catccgacca ccaaacgcgc caaagatatt gcagcaggcg cagtggtgct gtgctgtctg 300

catgcagcaa ttattggctt cgttgtgttc ggtccgaaac tgtgggccct gctgttcgca 360

tgactgaaag ctt 373

<210> 318

<211> 114

<212> PRT

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<400> 318

Met Lys Arg Phe Lys Tyr Ala Leu Asp Gly Leu Lys Ile Leu Ile Gln

1 5 10 15

Lys Asp Tyr Lys Phe Leu Leu His Val Phe Ala Met Ile Val Ala Ile

20 25 30

Val Phe Gly Leu Val Leu Asn Ile Asn Arg Ile Glu Trp Ile Phe Ile

35 40 45

Leu Ile Ala Ile Ala Leu Val Leu Thr Val Glu Ala Leu Asn Thr Ala

50 55 60

Ile Glu Tyr Val Val Asp Leu Val Thr Val Glu Tyr His Asp Leu Ala

65 70 75 80

Lys Tyr Ala Lys Asp Ile Ala Ala Phe Ser Val Leu Ile Val Ser Ile

85 90 95

Leu Ala Phe Ile Ile Gly Leu Ile Val Phe Leu Pro His Phe Ile Ala

100 105 110

Leu Phe

<210> 319

<211> 345

<212> DNA

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<400> 319

atgaaaaggt ttaaatatgc acttgatggg ctgaaaatct taattcaaaa agactataaa 60

tttcttttac atgtgtttgc aatgattgtt gctattgtct ttggtctcgt actaaatatt 120

aatcggattg agtggatatt tatactcatt gctattgcat tagttctcac tgttgaagct 180

ttaaacactg ctattgaata tgttgtcgat ttagtgaccg ttgaatatca tgatttagct 240

aaatacgcta aagatattgc ggcttttagt gtacttatag tttcaatatt agcatttatt 300

ataggtttaa tagtattttt accacatttt atagcgttat tttag 345

<210> 320

<211> 355

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 320

atgaagcgct tcaaatatgc cctggatggc ctgaaaattc tgattcagaa agattataag 60

ttcctgctgc atgtgttcgc aatgattgtt gcaattgtgt tcggcctggt gctgaatatt 120

aatcgcattg aatggatctt catcctgatt gccattgccc tggttctgac cgtggaagcc 180

ctgaataccg caattgaata tgtggttgat ctggttaccg ttgaatatca tgatctggcc 240

aaatatgcaa aagatattgc cgcattcagc gttctgattg ttagcattct ggccttcatt 300

attggcctga ttgtgttcct gccgcacttc attgcactgt tctgactgaa agctt 355

<210> 321

<211> 117

<212> PRT

<213> 鞘脂杆菌（Sphingobacteriaceae bacterium）

<400> 321

Met Gly Tyr Phe Lys Asn Arg Ile Asn Ala Phe Gly Tyr Ala Phe Ser

1 5 10 15

Gly Ile Tyr Gln Ala Phe Arg Gln Glu Thr His Leu Lys Ile His Ala

20 25 30

Val Ile Ala Leu Leu Val Ile Gly Leu Ala Ala Phe Phe Glu Val Cys

35 40 45

Asn Glu His Trp Ile Leu Leu Leu Leu Ala Ile Thr Leu Val Ile Ala

50 55 60

Leu Glu Met Leu Asn Ser Ala Val Glu Lys Leu Cys Asn Ile Ile Lys

65 70 75 80

Pro Glu Leu Asp Pro Arg Ile Lys Tyr Ile Lys Asp Val Ser Ala Gly

85 90 95

Ala Val Leu Ile Val Cys Leu Phe Ala Val Ala Ala Gly Ile Ile Val

100 105 110

Phe Ser His Tyr Phe

115

<210> 322

<211> 354

<212> DNA

<213> 鞘脂杆菌（Sphingobacteriaceae bacterium）

<400> 322

atgggctact ttaagaatag aataaatgct tttggctacg cattttcagg catttaccaa 60

gcttttcggc aggaaacgca tcttaagata catgccgtaa ttgccctttt agtgatcgga 120

ctcgctgctt tttttgaagt ctgtaacgaa cattggatcc tactactttt agctatcaca 180

ttggtgattg ccctagagat gctaaattca gccgttgaga agctctgcaa tattattaag 240

cctgaacttg atccaagaat taaatatatt aaagacgttt ctgccggcgc ggttcttata 300

gtttgtttgt ttgctgttgc tgccggaata attgtttttt cacattattt ttga 354

<210> 323

<211> 364

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 323

atgggttact tcaaaaaccg tattaacgcc ttcggctatg ccttcagtgg tatctatcag 60

gcattccgcc aggaaacaca tctgaaaatt catgcagtga ttgccctgct ggttattggc 120

ctggccgcat tcttcgaagt gtgcaatgaa cattggattc tgctgctgct ggccattacc 180

ctggttattg cactggaaat gctgaatagt gcagttgaaa aactgtgtaa tatcattaag 240

ccggaactgg accctcgtat taaatatatt aaagatgtga gcgcaggcgc agtgctgatt 300

gtgtgtctgt tcgccgtggc cgcaggtatt attgtgttca gtcattactt ctgactgaaa 360

gctt 364

<210> 324

<211> 248

<212> PRT

<213> 梭菌属（Clostridium species）

<400> 324

Met Lys Glu Lys Lys Lys Glu Ser Lys Glu Ile Thr Asn His Asn Phe

1 5 10 15

Ile Asp Ala Trp Lys Asn Ala Phe Asn Gly Ile Ile Tyr Ala Thr Thr

20 25 30

Thr Gln Lys Asn Ile Gln Lys Gln Leu Ile Ile Ala Val Ile Val Val

35 40 45

Ile Val Ser Leu Phe Phe Asn Leu Asn Arg Ala Glu Phe Leu Cys Phe

50 55 60

Leu Phe Thr Ile Val Leu Ile Ile Phe Ala Glu Met Val Asn Thr Ala

65 70 75 80

Ile Glu Thr Val Val Asp Leu Tyr Val Asp Val Tyr His Pro Lys Ala

85 90 95

Lys Ile Ala Lys Asp Val Ala Ala Gly Gly Val Val Ile Thr Thr Ile

100 105 110

Asn Ala Ile Ile Val Ala Tyr Phe Leu Phe Phe Asp Lys Ile Ala Asp

115 120 125

Ile Gly Leu Thr Phe Leu Lys Asn Val Thr Thr Asn Pro Met His Leu

130 135 140

Ala Phe Ser Ile Met Ile Ile Ala Ile Ile Ala Val Leu Ala Leu Ile

145 150 155 160

Ala Tyr Ala Lys Thr Asn Lys His Lys Gly Leu Asn Lys Lys Met Val

165 170 175

Pro Ser Gly His Ala Thr Ile Gly Phe Ala Ala Asn Thr Leu Ile Trp

180 185 190

Leu Leu Thr Asp Asn Ile Val Ile Leu Met Leu Ser Leu Leu Thr Ala

195 200 205

Ile Leu Leu Ala Glu Ser Arg Ile Ala Ala Lys Glu His Thr Leu Ser

210 215 220

Glu Ile Ile Phe Ser Gly Cys Phe Ala Thr Ile Leu Val Leu Ile Leu

225 230 235 240

Tyr Gly Ile Ala Met Ala Ile Val

245

<210> 325

<211> 747

<212> DNA

<213> 梭菌属（Clostridium species）

<400> 325

atgaaagaaa aaaagaagga aagcaaagaa ataacaaacc acaattttat agatgcgtgg 60

aaaaatgcat ttaatggaat aatatatgca acaacaactc aaaaaaacat acaaaaacaa 120

ttaattattg cagtaattgt tgttattgtt agcttgtttt ttaatttgaa tcgtgctgaa 180

tttctatgct ttctattcac aattgttcta ataatatttg ctgaaatggt taatacagca 240

atagaaacag ttgttgattt atatgttgat gtatatcatc caaaagctaa aatagcaaaa 300

gatgttgcag caggaggagt agtaattaca acaataaatg caataattgt ggcatatttc 360

ttattttttg ataaaattgc ggatatagga ctaacatttt tgaaaaatgt aacaacaaat 420

cctatgcatt tagctttttc tattatgatt attgctataa ttgcagtttt agcattaatt 480

gcttatgcaa aaacaaacaa acataaagga ttaaacaaaa aaatggttcc aagtggtcat 540

gcaactattg gctttgcagc taatactctt atatggcttt taactgataa tatagttatt 600

ttaatgttgt cattattaac tgcaatttta ttagcagaaa gtagaatagc agcaaaagaa 660

catacattgt cagaaataat atttagtggt tgttttgcaa caatattagt attaatatta 720

tatggaattg caatggcaat agtttaa 747

<210> 326

<211> 757

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 326

atgaaggaaa agaagaagga aagcaaagaa attaccaatc ataacttcat cgacgcctgg 60

aaaaatgcat tcaatggcat tatctatgcc accaccaccc agaaaaatat tcagaaacag 120

ctgattatcg ccgttattgt ggttattgtg agtctgttct tcaatctgaa tcgcgcagag 180

ttcctgtgct tcctgttcac cattgtgctg attatcttcg cagaaatggt taataccgca 240

attgaaaccg ttgttgatct gtatgtggat gtgtatcatc cgaaagccaa aattgccaaa 300

gatgttgcag caggtggcgt tgttattacc accattaatg ccattattgt tgcctacttc 360

ctgttcttcg ataaaattgc agatattggt ctgaccttcc tgaaaaatgt gaccaccaat 420

ccgatgcatc tggccttcag cattatgatt attgcaatta ttgcggtgct ggccctgatt 480

gcctatgcaa aaaccaataa acataagggc ctgaataaaa aaatggttcc gagtggccat 540

gccaccattg gcttcgcagc aaataccctg atctggctgc tgaccgataa tattgtgatt 600

ctgatgctga gcctgctgac cgcaattctg ctggccgaaa gtcgtattgc agccaaagaa 660

cataccctga gcgaaattat cttcagcggc tgcttcgcca ccattctggt tctgattctg 720

tatggcattg caatggccat tgtgtgactg aaagctt 757

<210> 327

<211> 295

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 327

Met Thr Asn Ala Ala Thr Ser Ser Gly Leu Thr Val Ser Val Arg His

1 5 10 15

Pro Ala Ala Gly Leu Ala Arg Arg Asn Leu Leu Gly Val Ser Arg Thr

20 25 30

Asn Pro Gly Leu Arg Gly Gly Arg Ala Asn Pro Trp Asn Leu Asn Arg

35 40 45

Ile Ile Pro Ala Glu Glu Ser Met Glu Val Leu Ala Ser Ser Thr Val

50 55 60

Leu Ala Gly Cys Ala Gln Val Ile Asp Arg Leu Arg Ala Asp Pro Pro

65 70 75 80

Ala Val His Ala Ile Thr Ser Pro Val Ala Ala Glu Arg Thr Ala Asn

85 90 95

Thr Leu Leu Ala Leu Gly Ile Arg Pro Ser Leu Thr Val Asn Pro Asp

100 105 110

Glu Val Ala Ala Phe Val Ala Val Ser Asp Ala Leu Leu Val Asn Leu

115 120 125

Gly Met Leu Asp Pro Val Arg Glu Ala Ala Ile Asp Arg Ala Val Ala

130 135 140

Glu Ala Ala Arg Gln Ala Arg Pro Trp Val Leu Asp Pro Val Phe Ala

145 150 155 160

Glu Val Ser Pro Ala Arg Ala Ala Leu Thr Arg Ala Leu Leu Ala Arg

165 170 175

Gly Pro Ala Ala Leu Lys Ala Asn Ala Gln Glu Ala Gly Leu Ala Ala

180 185 190

Asp Ala Pro Ile Thr Thr Val Ala Ile Val Thr Gly Ala Glu Asp Arg

195 200 205

Leu Arg Leu Gly Ala Arg Asn Ile Gly Ile Ala Asn Gly His Pro Leu

210 215 220

Ala Ala Ser Val Thr Ala Met Gly Cys Ala Leu Gly Ala Leu Val Ala

225 230 235 240

Ala Cys Leu Cys Arg Ala Asp Asp Pro Leu Arg Leu Ser Pro Thr Ala

245 250 255

Ser Pro Pro Asn Arg Arg Gln Pro Glu Gln Ala Ala Ala Glu Ser Glu

260 265 270

Gly Pro Gly Ser Phe Ala Val Ala Phe Tyr Asp Cys Pro Ala Ile Asp

275 280 285

Arg Gly Glu Thr Ile Val Lys

290 295

<210> 328

<400> 328

000

<210> 329

<211> 894

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 329

atgaccaatg ccgccaccag cagcggtctg accgttagcg tgcgtcatcc ggccgcaggt 60

ctggcacgtc gtaatctgct gggcgttagt cgtaccaatc cgggtctgcg cggtggtcgt 120

gcaaatccgt ggaatctgaa tcgcattatt ccggcagaag aaagtatgga agttctggca 180

agcagcaccg tgctggcagg ctgcgcacag gtgattgatc gtctgcgtgc agatccgccg 240

gccgtgcatg caattaccag cccggttgcc gcagaacgca ccgccaatac cctgctggcc 300

ctgggtattc gtccgagtct gaccgtgaat ccggatgaag ttgcagcctt cgttgccgtg 360

agcgatgccc tgctggttaa tctgggtatg ctggaccctg ttcgcgaagc agccattgat 420

cgtgccgtgg ccgaagcagc ccgccaggca agaccgtggg ttctggaccc tgtgttcgca 480

gaagttagtc cggcccgtgc cgccctgacc cgtgcattac tggcacgcgg tccggcagca 540

ctgaaagcca atgcccagga agccggcctg gccgcagatg ctccgattac caccgttgca 600

attgttaccg gcgccgaaga tcgtctgcgc ctgggtgccc gtaatattgg tattgcaaat 660

ggtcatccgc tggcagcaag cgttaccgca atgggttgtg cactgggcgc cctggttgcc 720

gcatgtctgt gtcgcgccga tgatccgctg cgcctgagtc cgaccgccag ccctcctaat 780

cgccgccagc cggaacaggc cgccgcagag tcagaaggcc cgggtagctt cgccgttgcc 840

ttctatgatt gtccggccat tgatcgcggc gaaaccattg ttaaataagg atcc 894

<210> 330

<211> 227

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 330

Met Asp Ala Val Arg Arg Arg Leu Ser Arg Ser Arg Arg Arg Ala Gln

1 5 10 15

Pro Ala Gly Met Gly Arg His Ala Ala Ala Leu Arg Gln Ala Ala Gly

20 25 30

Gly Ala Arg Pro Arg Pro Leu Arg Pro Leu Arg Arg Leu His Gly Arg

35 40 45

Gly Gly Ala Asp Pro Ala Gly Ala Gly Gly Arg Gly Asp Arg Gly Gly

50 55 60

Thr Ala Val Ser Asp Ser Asp Gly Met Ile Met Ser Asp Ser Ala Leu

65 70 75 80

Asp Thr Ala Ala Gly Leu Leu Glu Arg Leu Arg Thr Arg Arg Pro Arg

85 90 95

Val His Cys Leu Met Asn Thr Val Val Gln Lys Leu Val Ala Asp Gly

100 105 110

Leu Ser Ala Leu Gly Ala Ile Pro Ser Met Thr Ser Ser Arg Glu Glu

115 120 125

Val Ala Ala Phe Val Arg Lys Ala Asp Ala Leu Cys Val Asn Leu Gly

130 135 140

Thr Leu Asp Ala Ala Arg Arg Glu Ala Ile Asn Leu Ala Leu Glu Ala

145 150 155 160

Ala Ser Glu Ala Gly Arg Pro Trp Ala Leu Asp Pro Ala His Cys Asp

165 170 175

Tyr Ser Pro Pro Arg Ala Ala Phe Ala Gln Glu Leu Leu Ala Arg Gly

180 185 190

Pro Ala Val Leu Arg Ala Asn Pro Ala Glu His Val Leu Leu Ala Val

195 200 205

Pro Ala Asp Ile Val Gly Val Val Thr Val Leu Asp Arg Asp Arg Ala

210 215 220

Leu Pro Lys

225

<210> 331

<400> 331

000

<210> 332

<211> 690

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 332

atggatgcag tgcgccgtcg tctgagccgc agtcgccgtc gtgcacagcc ggctggtatg 60

ggccgccatg cagccgctct gcgccaggca gcaggtggtg cacgtccgcg tccgctgcgt 120

cctctgcgtc gtctgcatgg tcgtggcggt gccgatccgg caggtgcagg tggtcgcggt 180

gatcgtggtg gtaccgccgt gagcgatagt gatggcatga ttatgagtga tagcgcactg 240

gataccgccg caggtctgct ggaacgtctg cgtacccgcc gcccgcgtgt tcattgcctg 300

atgaataccg ttgtgcagaa actggttgca gatggtctga gcgcactggg tgcaattccg 360

agtatgacca gcagccgtga agaagtggca gcattcgttc gcaaagcaga tgcactgtgc 420

gtgaatctgg gcaccctgga tgccgcacgt cgtgaagcaa ttaatctggc cctggaagca 480

gcaagtgaag caggccgtcc gtgggcactg gaccctgctc attgcgatta tagcccgccg 540

cgcgccgcct tcgcacagga gttactggca cgtggcccgg ccgttctgcg cgcaaatccg 600

gctgaacatg tgctgctggc agtgccggcc gatattgtgg gcgttgttac cgtgctggat 660

cgcgatcgtg ccctgccgaa ataaggatcc 690

<210> 333

<211> 288

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 333

Met Ser Gln Pro Phe Asp Val Leu Arg Ala Trp Arg Ile Leu Gln Arg

1 5 10 15

Val Arg Glu Gln Asn Pro Leu Ile His Cys Val Thr Asn Gln Val Val

20 25 30

Met Asn Phe Thr Ala Asn Val Leu Tyr Ala Val Gly Ala Ser Pro Leu

35 40 45

Met Ser Gln Ala Pro Glu Glu Ala Asp Glu Leu Ala Lys Ala Arg Ala

50 55 60

Asn Leu Leu Val Asn Ile Gly Thr Leu Thr Arg Ala Trp Leu Val Asp

65 70 75 80

Val Arg Glu Val Val Arg Ala Glu Gln Ser Leu Gly Arg Gly Arg Pro

85 90 95

Arg Ala Val Leu Asp Pro Val Gly Ala Gly Phe Thr His Phe Arg Thr

100 105 110

Glu Ala Ala His Glu Leu Leu Lys Thr Gly Val Phe Gly Thr Leu Arg

115 120 125

Ala Asn Ala Phe Glu Val Met Lys Leu Ala Gly Val Ala Ala Arg Gly

130 135 140

Gln Gly Val Asp Ser Asn Glu Ser Ser Leu Glu Ala Ala Gly Ala Ala

145 150 155 160

Gly Gln Leu Ala Arg Lys Tyr Gly Ile Val Val Ala Val Ser Gly Val

165 170 175

Val Asp Tyr Val Thr Asp Gly Arg Arg Glu Ile Trp Leu Arg Thr Gly

180 185 190

His Pro Leu Leu Thr Arg Val Thr Gly Thr Gly Cys Ala Leu Asn Ala

195 200 205

Val Ile Ala Ala Ala Thr Ala Val Asp Asp Asp Pro Leu Asp Ala Ala

210 215 220

Ala Ala Ala Leu Ala Ile Phe Gly Thr Ala Ala Leu Lys Ala Ala Arg

225 230 235 240

Asn Pro Glu Gly Glu Pro Gly Pro Gly Ser Phe Ala Ala Gly Phe Leu

245 250 255

Asp Glu Leu Ala Arg Leu Glu His Ser Asp Leu Glu Ala Phe Trp Gln

260 265 270

Val Glu Gln Thr Ser Ser Ser Ser Pro Asp Pro Met Glu Ser Ala Arg

275 280 285

<210> 334

<400> 334

000

<210> 335

<211> 873

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 335

atgagtcagc cgttcgatgt gctgcgcgcc tggcgcattc tgcaacgtgt tcgtgaacag 60

aatccgctga ttcattgtgt gaccaatcag gttgtgatga acttcaccgc caatgtgctg 120

tatgccgttg gtgcaagtcc gctgatgagc caggcaccgg aagaagccga tgaactggcc 180

aaagcacgtg ccaatctgct ggttaatatt ggtaccctga cccgtgcctg gctggtggat 240

gttcgtgaag ttgttcgcgc cgaacagagt ctgggccgtg gccgtccgcg tgctgtgtta 300

gatccggtgg gtgccggctt cacccacttc cgtaccgaag ccgcccatga actgctgaaa 360

accggcgtgt tcggcaccct gcgtgccaat gcattcgaag tgatgaaact ggccggtgtt 420

gccgcccgcg gtcagggtgt tgatagcaat gaaagcagcc tggaagccgc cggtgcagca 480

ggtcagctgg cacgtaaata tggcattgtt gttgccgtta gcggtgtggt tgattatgtt 540

accgatggtc gtcgcgaaat ctggctgcgc accggccatc cgctgctgac ccgtgtgacc 600

ggtaccggtt gcgcactgaa tgcagtgatt gcagcagcaa ccgcagtgga tgatgatccg 660

ctggatgcag cagccgccgc actggcaatc ttcggcaccg cagcactgaa agcagcccgt 720

aatccggaag gtgaaccggg cccgggcagc ttcgcagctg gcttcctgga tgaactggca 780

cgtctggaac atagtgatct ggaagcattc tggcaggttg aacagaccag cagtagtagc 840

ccggacccta tggaaagtgc ccgctaagga tcc 873

<210> 336

<211> 223

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 336

Met Phe Phe Lys Gln Lys Thr Ala Tyr Glu Ile Ser Leu Arg Leu Val

1 5 10 15

Gly Ser Glu Met Cys Ile Arg Asp Ser Leu Thr Pro Ala Ala Leu Asp

20 25 30

Ala Met Arg Leu Ala Gly Arg Glu Ala Asn Arg Cys Gly Val Pro Val

35 40 45

Val Leu Asp Pro Val Gly Ala Gly Ala Thr Pro Tyr Arg Thr Glu Ala

50 55 60

Ala Arg Gln Leu Leu Glu Asp Ile Asn Val Ala Ile Val Arg Gly Asn

65 70 75 80

Ser Gly Glu Val Ala Ala Ile Ile Gly Gln Gln Ala Val Val Arg Gly

85 90 95

Val Glu Ser Leu Glu Thr Ala Leu Pro Ala Ala Glu Leu Gly Ala Gln

100 105 110

Ala Ala Gln Gln Leu Gly Val Val Val Ala Leu Thr Gly Ala Arg Asp

115 120 125

Ile Ile Ser Asp Gly Ser Val Ser Leu Ala Val Asp His Gly Ser Pro

130 135 140

Trp Leu Lys Thr Ile Asp Gln Pro Thr Gln Pro Arg Lys Ala Ala Val

145 150 155 160

Ala Cys Phe Ala Ala Val Ala Pro Ser Ser Leu Gln Ala Ala Ala Ala

165 170 175

Ala Leu Ala Ala Tyr Gly Leu Ala Ala Glu Leu Ala His Lys Pro Gln

180 185 190

Ile His Gly Pro Ala Ser Phe Lys Val Ala Leu Leu Asp Ala Val Tyr

195 200 205

Gly Leu Thr Ala Glu Thr Leu Gln Arg Ala Lys Val Ser Val Leu

210 215 220

<210> 337

<400> 337

000

<210> 338

<211> 678

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 338

atgttcttca agcagaaaac cgcatacgaa attagtctgc gcctggttgg tagcgaaatg 60

tgtattcgtg atagtctgac cccggcagca ctggatgcaa tgcgtctggc cggtcgtgaa 120

gccaatcgtt gtggtgttcc ggtggtgctg gaccctgttg gcgccggtgc aaccccgtat 180

cgtaccgaag cagcacgcca gctgctggaa gatattaatg tggcaattgt tcgtggtaat 240

agtggtgaag tggcagcaat tattggccag caggccgtgg tgcgtggtgt tgaaagtctg 300

gaaaccgccc tgccggccgc agaactgggt gctcaggccg ctcagcagct gggcgttgtt 360

gttgccctga ccggtgcacg tgatattatt agcgatggca gcgttagcct ggccgttgat 420

catggtagtc cgtggctgaa aaccattgat cagccgaccc agccgcgcaa agcagcagtt 480

gcctgcttcg ccgcagtggc cccgagtagc ctgcaagcag ccgccgctgc cctggcagct 540

tatggtctgg ccgcagaatt agcacataaa ccgcagattc atggcccggc cagcttcaaa 600

gtggccctgc tggatgcagt gtatggtctg accgccgaaa ccttacagcg cgccaaagtt 660

agcgttctgt aaggatcc 678

<210> 339

<211> 234

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 339

Met Glu Ala Pro Phe Glu Pro Glu Pro Asp His Ala Gly Val Gly Ser

1 5 10 15

Leu Gln Gly Val Val Leu Pro Leu Pro Ser Ala Ser Ser Arg Arg Ala

20 25 30

Glu Gly Glu Met Gln Asp Pro Gly Leu Tyr Leu Gln Arg Met Cys Glu

35 40 45

Ala Ala Pro Leu Val Gln Asn Ile Thr Asn Phe Val Ala Met Thr Ile

50 55 60

Met Ala Asn Val Leu Leu Ala Val Gly Ala Ser Pro Ala Met Val His

65 70 75 80

Ala Arg Glu Glu Ala Ala Glu Phe Ala Gly Leu Ala Gln Ala Leu Thr

85 90 95

Val Asn Ile Gly Thr Pro Asp Pro Ala Trp Ala Asp Ala Met Ala Glu

100 105 110

Ala Ala Ala Val Ile Lys Ala Ala Gly Arg Pro Trp Val Leu Asp Pro

115 120 125

Val Gly Val Gly Ala Thr Arg Phe Arg Gln Glu Ile Ala Ala Arg Leu

130 135 140

Leu Asp Leu Gly Pro Ser Val Ile Arg Gly Asn Ala Ser Glu Ile Leu

145 150 155 160

Ala Leu Ala Gly Leu Gly Gly Thr Gly Arg Gly Ala Asp Ala Ala Asp

165 170 175

Ser Val Ala Ala Val Ser Tyr Thr His Leu Thr Leu Pro Thr Thr Arg

180 185 190

Gly Ala Val Val Ala Ala Ser Gly Ala Val Asp Phe Val Thr Asp Gly

195 200 205

Ser Arg Ala Phe Arg Val Ala Asn Gly His Pro Pro Val Tyr Tyr Thr

210 215 220

His Leu Arg Ala His Glu Thr Lys Thr Ala

225 230

<210> 340

<400> 340

000

<210> 341

<211> 711

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 341

atggaagccc cgttcgaacc ggaaccggat catgcaggtg tgggcagtct gcaaggcgtg 60

gttctgccgc tgccgagtgc cagtagccgc cgtgctgaag gtgaaatgca ggaccctggt 120

ctgtatctgc aacgcatgtg tgaagccgca ccgctggttc agaatattac caacttcgtg 180

gccatgacca ttatggcaaa tgttctgctg gccgttggtg ccagcccggc catggttcat 240

gcccgcgaag aagcagcaga gttcgccggt ctggcccagg ccctgaccgt gaatattggc 300

accccggacc ctgcatgggc cgatgcaatg gccgaagcag cagcagtgat taaagcagcc 360

ggtcgtccgt gggttctgga ccctgtgggt gtgggtgcaa cccgcttccg tcaggaaatt 420

gcagcccgtc tgctggatct gggtccgagt gtgattcgcg gtaatgccag tgaaattctg 480

gcactggccg gcctgggcgg caccggtcgt ggtgcagatg cagccgatag tgtggcagcc 540

gttagctata cccatctgac cctgccgacc acccgcggcg ctgttgttgc cgctagtggt 600

gccgttgact tcgtgaccga tggtagccgt gcattccgtg tggccaatgg tcatccgccg 660

gtgtattata cccatcttcg tgcccatgaa accaaaaccg cataaggatc c 711

<210> 342

<211> 271

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 342

Met Gly Leu Ser Gly Ser Ser Asn Arg Pro Ser Pro Ser Arg Arg Gln

1 5 10 15

Cys Pro Gly Ile Met Thr Arg Gly Gly Thr Val Thr Asp His Asp Asp

20 25 30

Arg Ser Arg Leu Ala Arg Asp Thr Thr Arg Val Leu Ala Arg Leu Arg

35 40 45

Ala Glu Arg Pro Arg Val His Cys Leu Thr Asn Lys Arg Gln Met Gln

50 55 60

Leu Thr Ala Asn Leu Leu Leu Ala Ala Gly Ala Val Pro Ser Met Thr

65 70 75 80

Met Asp Ala Arg Glu Met Pro Ala Phe Val Glu Thr Ser Arg Ala Leu

85 90 95

Leu Val Asn Leu Gly Met Leu Asp Pro Trp Arg Glu Ala Ala Ile Pro

100 105 110

Val Ala Ile Glu Ala Ala His Gly Leu Gly Arg Pro Trp Val Leu Asp

115 120 125

Pro Val Lys Val Asp Arg Ala Pro Gly Arg Arg Ala Phe Ala Ser Ser

130 135 140

Leu Leu Glu Arg Gly Pro Ala Val Leu Arg Cys Asn Ala Ala Glu Ala

145 150 155 160

Glu Met Leu Glu Pro Gly Pro Gly Ile Val Thr Ala Val Thr Gly Ala

165 170 175

Ala Asp Arg Ile Ser Gly Gly Gly Arg Glu Ile Gly Leu Gly Gly Gly

180 185 190

Thr Ala Leu Met Asp Arg Val Thr Ala Met Gly Cys Ala Ala Ser Ala

195 200 205

Leu Val Ala Ala Cys Leu Ala Val Glu Pro Asp Pro Phe Leu Ala Thr

210 215 220

Val Ser Gly Leu Leu Val Met Lys Val Ala Gly Ala Ile Ala Ala Glu

225 230 235 240

Ser Ala Ala Gly Pro Gly Ser Phe Val Pro Leu Phe Leu Asp Ala Val

245 250 255

His Gly Leu Asp Ala Ala Thr Leu Gln Arg Arg Ala Glu Leu Ala

260 265 270

<210> 343

<400> 343

000

<210> 344

<211> 822

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 344

atgggcctga gtggcagcag caatcgcccg agtccgagtc gccgccagtg ccctggtatt 60

atgacccgtg gcggtaccgt taccgatcat gatgatcgca gtcgcctggc acgcgatacc 120

acccgtgtgc tggcacgtct gcgtgccgaa cgtccgcgcg ttcattgtct gaccaataaa 180

cgtcagatgc agctgaccgc caatctgctg ctggccgcag gtgccgtgcc gtcaatgacc 240

atggatgcac gtgaaatgcc ggccttcgtt gaaaccagtc gcgcactgct ggttaatctg 300

ggtatgctgg acccttggcg tgaagccgca attccggttg ccattgaagc cgcacatggt 360

ctgggtcgtc cgtgggttct ggaccctgtt aaagtggatc gtgccccggg ccgtcgtgcc 420

ttcgcttcaa gtctgctgga acgcggcccg gccgtgctga gatgcaatgc agccgaagca 480

gaaatgctgg aaccgggccc gggcattgtt accgcagtta ccggtgccgc agatcgtatt 540

agtggtggtg gccgcgaaat tggtctgggc ggtggtaccg ccctgatgga tcgcgtgacc 600

gcaatgggct gcgccgcaag tgccctggtg gcagcttgtc tggcagtgga accggacccg 660

ttcctggcca ccgttagcgg cctgctggtg atgaaagttg caggcgcaat tgccgcagaa 720

agcgcagccg gtccgggtag cttcgttccg ctgttcctgg atgcagtgca tggcctggat 780

gcagcaaccc tgcaacgtcg tgccgaactg gcataaggat cc 822

<210> 345

<211> 264

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 345

Met Lys Ala Ala Glu Ala Ile Trp Gln Ser Leu Ser Ala Val Arg Ala

1 5 10 15

Glu Ala Pro Leu Val His Asn Ile Thr Asn Phe Val Val Met Asn Pro

20 25 30

Thr Ala Ser Lys Ala Leu Ala Val Gly Ala Ser Pro Val Met Val His

35 40 45

Ala Ala Glu Glu Val Glu Gln Met Thr Ala Met Ala Arg Ala Leu Val

50 55 60

Val Asn Leu Gly Thr Leu Ser Pro Pro Trp Ala Thr Ala Met Arg Leu

65 70 75 80

Ala Val Ala Arg Ala Gly Thr Ala Gly Thr Pro Trp Val Leu Asp Pro

85 90 95

Val Gly Val Gly Ala Leu Ala Trp Arg Thr Gly Ile Ala Ala Glu Leu

100 105 110

Ile Arg Gln Gln Pro Ala Ala Val Arg Gly Asn Gly Ser Glu Ile Leu

115 120 125

Ala Leu Ala Gly Ala Ala Gly Ala Ala Gly Lys Gly Val Asp Ser Arg

130 135 140

His Asp Ser Ala Ala Ala Val Asp Ile Ala Arg Gly Leu Ala Arg Ala

145 150 155 160

Thr Gly Ala Val Val Ala Ile Thr Gly Arg Val Asp Tyr Val Thr Asp

165 170 175

Gly Glu Arg Gln Val Ala Ile Ala Asn Gly His Pro Leu Met Ala Arg

180 185 190

Val Thr Gly Leu Gly Cys Thr Ala Thr Ala Leu Val Gly Ala Phe Cys

195 200 205

Ala Val Glu Ala Asp Arg Leu Ala Ala Thr Ala His Ala Pro Ala Met

210 215 220

Pro Ser Thr Ala Arg Ala Trp Ala Ala Glu Arg Ala Ala Gly Pro Gly

225 230 235 240

Ser Leu Gln Val Gly Leu Leu Asp Ala Leu Tyr Thr Leu Asp Leu Asp

245 250 255

Thr Ile Arg Gln Arg Glu Arg Ile

260

<210> 346

<400> 346

000

<210> 347

<211> 801

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 347

atgaaggcag cagaagccat ctggcagagt ctgagcgccg ttcgtgccga agccccgctg 60

gttcataata ttaccaactt cgtggttatg aatccgaccg ccagcaaagc actggcagtg 120

ggtgccagtc cggtgatggt tcatgccgca gaagaagtgg aacagatgac cgcaatggca 180

cgtgcactgg ttgttaatct gggcaccctg agcccgccgt gggccaccgc aatgcgtctg 240

gctgtggcac gtgcaggcac cgccggtacc ccttgggttc tggaccctgt gggtgtgggt 300

gcactggcat ggcgtaccgg tattgcagca gaactgattc gccagcagcc ggcagcagtg 360

cgtggtaatg gtagcgaaat tctggccctg gcaggcgccg caggcgcagc aggtaaaggt 420

gtggatagtc gtcatgatag cgcagcagcc gttgatattg cccgcggtct ggcacgcgcc 480

accggtgcag ttgttgccat taccggccgc gtggattatg ttaccgatgg cgaacgccag 540

gttgcaattg caaatggtca tccgctgatg gcccgcgtta ccggtctggg ctgcaccgct 600

accgcactgg ttggtgcatt ctgtgcagtt gaagcagatc gcctggcagc caccgcccat 660

gcaccggcaa tgccgagcac cgcccgcgca tgggctgctg aacgcgcagc aggtccgggc 720

agtctgcaag ttggtctgct ggatgcactg tataccctgg atctggatac cattcgccag 780

cgcgaacgca tttaaggatc c 801

<210> 348

<211> 268

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 348

Met Gln Glu Pro Thr Ala Pro Leu Arg Gln Phe Val Ser Pro Ala Glu

1 5 10 15

Leu Val Ser Ala Ala Ala Ala Val Leu Ala Arg Val Arg Ala Lys Ser

20 25 30

Pro Arg Val His Cys Ile Thr Asn Ser Val Ala Glu Asn Phe Thr Ala

35 40 45

Asn Val Leu Leu Ala Leu Gly Ala Val Pro Ser Met Thr Leu Ser Pro

50 55 60

Ile Glu Ile Gly Ala Phe Val Gly Arg Ala Asp Ala Leu Leu Val Asn

65 70 75 80

Leu Gly Thr Phe Gly Arg Glu Arg Arg Glu Ala Thr Ser Ile Ala Val

85 90 95

Asp Thr Ala Val Gln Gly Gly Leu Pro Trp Val Leu Asp Pro Val Phe

100 105 110

Val Asp Arg Ala Pro Pro Arg Ala Thr Tyr Ala Gln Asp Leu Leu Phe

115 120 125

Met Gly Pro Thr Ala Met Arg Leu Asn Ala Ala Glu Phe Ala Ala Leu

130 135 140

Ala Gly Ala Gly Asp Glu Leu Asp Asp Val Arg Gly Tyr Ala Arg Glu

145 150 155 160

Arg Gly Ile Ala Ile Gly Leu Ser Gly Ala Arg Asp Leu Ile Ala Asp

165 170 175

Gly Arg Arg Ala Ala Ser Ile Ala Asn Gly Asp Ala Met Met Ala Arg

180 185 190

Ile Thr Ala Met Gly Cys Ala Ala Ser Ala Met Val Gly Ala Cys Leu

195 200 205

Ala Val Glu Lys Asp Ala Phe Val Ala Thr Ala Ala Ala Leu Leu Ile

210 215 220

Val Gly Val Ala Gly Glu Met Ala Ala Glu Thr Ala Arg Gly Pro Gly

225 230 235 240

Ser Phe Ala Val Ala Ile Leu Asp Ala Leu Tyr Ser Ile Asp Gly Asp

245 250 255

Ala Leu Ala Ala Arg Ala Arg Ile Ser Leu His Glu

260 265

<210> 349

<211> 804

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 349

atgcaggaac cgacagcccc attgcgccag ttcgtatcgc ccgcggagct tgtctccgcg 60

gcggccgccg tgctcgcgcg ggtgcgcgcg aaatcgcccc gtgtccactg catcaccaat 120

tcggtggcgg agaatttcac cgccaatgtg ctgctggcgc tgggcgccgt tccctccatg 180

actttgtcgc ccatcgagat cggggccttt gtgggccgtg ccgatgcgct gctggtcaat 240

ctcggtacct tcggccgcga gcggcgcgag gcgacgtcga tcgcggtcga tacggcggtg 300

cagggcgggc tgccttgggt tctcgatccg gtctttgtcg accgcgcacc gccgcgcgcg 360

acctacgccc aggatctgtt gtttatgggc ccgacggcga tgcggctcaa cgcggccgag 420

tttgccgcgc tggccggcgc cggcgatgag ctcgacgatg tgcgcggcta cgcacgcgag 480

cgcggcatcg cgatcggcct gtcgggcgcg cgcgacctga tcgcggacgg ccgccgcgcc 540

gcgtcgatcg ccaatggcga tgcgatgatg gcgcggatca cggcgatggg ctgcgccgcc 600

tcggcgatgg tcggcgcctg cctcgcggtc gagaaggacg ccttcgtcgc caccgcagcg 660

gcgctgctga tcgtcggcgt tgccggcgag atggcggcgg aaaccgcgcg cggccccggc 720

agcttcgcgg tggcgatcct cgatgcgctc tattccatcg acggcgacgc gctcgcggcg 780

cgggcccgca tttccctgca cgag 804

<210> 350

<211> 813

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 350

atgcaggaac cgaccgcccc gctgcgtcag ttcgttagcc cggccgaact ggttagcgcc 60

gcagccgctg tgctggcccg tgttcgtgcc aaaagcccgc gcgttcattg tattaccaat 120

agcgtggccg aaaacttcac cgcaaatgtg ctgctggccc tgggtgccgt tccgagtatg 180

accctgagcc cgattgaaat tggtgccttc gttggtcgtg ccgatgcact gctggttaat 240

ctgggcacct tcggtcgtga acgccgcgaa gcaaccagta ttgcagtgga taccgccgtg 300

cagggtggcc tgccgtgggt tctggaccct gtgttcgttg atcgtgcccc gccgcgcgca 360

acctatgccc aagacttact gttcatgggt ccgaccgcca tgcgcctgaa tgccgcagag 420

ttcgcagccc tggccggcgc aggtgatgaa ctggatgatg tgcgcggtta tgcccgcgaa 480

cgtggcattg caattggtct gagcggtgca cgcgatctga ttgccgatgg tcgtcgtgca 540

gccagcattg ccaatggcga tgcaatgatg gcacgtatta ccgccatggg ctgcgccgcc 600

agcgccatgg ttggcgcatg tctggccgtt gaaaaagatg ccttcgttgc caccgcagca 660

gccctgctga ttgttggtgt tgccggcgaa atggccgcag aaaccgcacg cggtccgggc 720

agcttcgcag tggcaattct ggatgcactg tatagcattg atggcgatgc cctggcagcc 780

cgtgcccgta ttagtctgca tgaataagga tcc 813

<210> 351

<211> 269

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 351

Met Ile Asp Ala Lys Ser Leu Ala Ala Asp Leu Ala Ala Ile Arg Glu

1 5 10 15

Lys Asn Pro Leu Val Leu Ser Val Thr Asn Asn Val Val Thr Asn Thr

20 25 30

Thr Ala Asn Ala Leu Leu Ala Leu Gly Ala Ser Pro Ala Met Ser His

35 40 45

Ala Gln Glu Glu Met Glu Glu Leu Pro Ala Phe Ala Gly Ala Ile Val

50 55 60

Leu Asn Ile Gly Thr Pro Ala Arg Glu Tyr Val Glu Ala Met Ile Arg

65 70 75 80

Ala Ala Ala Thr Ala Ser Arg Leu Asn Ile Pro Ile Ile Leu Asp Pro

85 90 95

Val Ala Ala Gly Val Thr Arg His Arg Asn Arg Val Leu Lys Asn Leu

100 105 110

Leu Asp Asp Phe Pro Met Ala Ile Ile Arg Gly Asn Ala Ser Glu Ile

115 120 125

Met Ala Leu Ala Gly Glu Ala Ala Thr Ala Lys Gly Ala Asp Ser Ala

130 135 140

His Gly Ser Ser Glu Ala Val Asp Ala Ala Met Arg Leu Ala Arg Glu

145 150 155 160

Arg Lys Thr Val Val Cys Val Ser Gly Glu Gln Asp Gln Ile Thr Asp

165 170 175

Gly Ala Arg Leu Ile Arg Val Ser Gly Gly His Val Met Met Thr Lys

180 185 190

Val Thr Gly Leu Gly Cys Thr Ala Ser Ala Val Ala Gly Ala Tyr Ala

195 200 205

Ala Val Asn Arg Asp Tyr Leu Ala Ala Ala Ala His Ala Ala Ala Thr

210 215 220

Met Lys Ile Ala Gly Glu Leu Ala Ala Asp Ile Ser Ala Gly Pro Gly

225 230 235 240

Ser Leu Gln Leu His Phe Tyr Asp Ala Leu Tyr Ala Leu Thr Pro Glu

245 250 255

Thr Ile Ala Ala Arg Leu Arg Leu Glu Glu Val Val Ser

260 265

<210> 352

<400> 352

000

<210> 353

<211> 816

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 353

atgatcgatg ccaaaagtct ggcagcagac ttagcagcca ttcgtgaaaa aaatccgctg 60

gttctgagcg tgaccaataa tgtggtgacc aataccaccg caaatgcact gctggcactg 120

ggtgccagtc cggcaatgag ccatgcccag gaagaaatgg aagaactgcc ggcattcgcc 180

ggcgcaattg tgctgaatat tggcaccccg gcccgtgaat atgttgaagc catgattcgt 240

gcagccgcaa ccgcaagccg cctgaatatt ccgattattc tggaccctgt ggcagcaggc 300

gttacccgcc atcgtaatcg tgttctgaaa aatctgctgg atgacttccc gatggccatt 360

attcgtggca atgccagcga aattatggcc ctggcaggtg aagcagccac cgccaaaggt 420

gccgatagtg cacatggtag tagtgaagcc gttgatgccg ccatgcgcct ggcacgtgaa 480

cgcaaaaccg tggtgtgcgt gagcggtgaa caggatcaga ttaccgatgg cgcacgcctg 540

attcgtgtga gtggcggcca tgttatgatg accaaagtta ccggtctggg ttgtaccgca 600

agcgcagttg caggtgcata cgctgccgtt aatcgtgatt atctggcagc agccgcacat 660

gccgcagcaa ccatgaaaat tgcaggtgaa ctggccgcag atattagcgc aggcccgggc 720

agtctgcaac tgcacttcta tgatgccctg tatgcactga ccccggaaac cattgcagcc 780

cgtctgcgtc tggaagaagt ggtgagctaa ggatcc 816

<210> 354

<211> 198

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 354

Met Ser Ala Ile Arg Glu Arg Arg Pro Leu Val His Asn Ile Thr Asn

1 5 10 15

Phe Val Val Met Asn Asn Ser Ala Asn Ala Leu Leu Ala Leu Gly Ala

20 25 30

Ser Pro Ala Met Val His Ser Ser Asp Glu Val Glu Asp Phe Val Ala

35 40 45

Leu Ser Gln Ala Leu Val Val Asn Ile Gly Thr Leu Tyr Ser Glu Gln

50 55 60

Ile Ala Ala Gly Lys Leu Ala Ala Ile Arg Ala Lys Ala Ala Gly Ile

65 70 75 80

Pro Trp Val Phe Asp Pro Val Gly Ala Gly Ala Thr Pro Tyr Arg Gln

85 90 95

Ala Ala Ala Val Ala Leu Ala Arg Leu Gly Pro Ser Ala Ile Arg Gly

100 105 110

Asn Gly Ser Glu Ile Leu Ala Leu Ala Gln Gln Ala Arg Ala Gly Gln

115 120 125

Gly Val Asp Ser Leu His Gly Ser Glu Ala Ala Leu Asp Ala Ala Arg

130 135 140

Lys Leu Ala Glu Asp Ser Ser Ala Ala Ile Ala Ile Thr Gly Glu Val

145 150 155 160

Asp Tyr Val Thr Asp Gly Arg Arg Val Val Glu Ile His Asn Gly His

165 170 175

Ala Leu Met Thr Arg Val Thr Gly Leu Gly Cys Ser Ala Thr Ala Ile

180 185 190

Ile Gly Ala Phe Leu Ala

195

<210> 355

<400> 355

000

<210> 356

<211> 603

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 356

atgagcgcca ttcgtgaacg ccgtccgctg gtgcataata ttaccaactt cgtggttatg 60

aataacagtg caaatgccct gctggcactg ggcgcaagtc cggcaatggt tcatagcagc 120

gatgaagtgg aagacttcgt tgcactgagc caggcactgg tggtgaatat tggtaccctg 180

tatagcgaac agattgccgc aggcaaactg gcagcaattc gcgcaaaagc cgcaggtatt 240

ccgtgggtgt tcgatccggt tggtgccggt gcaaccccgt atcgccaggc cgcagccgtg 300

gctctggccc gtcttggtcc gagtgccatt cgtggcaatg gtagtgaaat tctggcactg 360

gcccagcagg cccgtgcagg tcagggtgtg gatagcctgc atggcagtga agcagccctg 420

gatgccgcac gcaaactggc cgaagatagc agtgccgcca ttgcaattac cggcgaagtg 480

gattatgtta ccgatggtcg tcgtgttgtt gaaattcata atggccatgc actgatgacc 540

cgtgtgaccg gcctgggttg tagcgccacc gccattattg gcgccttcct ggcctaagga 600

tcc 603

<210> 357

<211> 264

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 357

Met Ala Leu His Ala Val Ala Gln Glu Tyr Arg Gln Gln Ser Pro Leu

1 5 10 15

Val Phe Cys Leu Thr Asn Thr Val Val Ala Asn Phe Thr Ala Asn Ala

20 25 30

Leu Leu Ala Ser Gly Ala Ser Pro Ala Met Thr Asp Leu Pro Gly Glu

35 40 45

Ala Gly Pro Phe Ala Lys Ala Ala Ser Ala Val Leu Val Asn Leu Gly

50 55 60

Thr Pro Ser Thr Glu Gln Leu Ala Ala Met Glu Glu Ala Val Gln Ser

65 70 75 80

Ala Ser Ala Ala Gly Thr Pro Trp Ile Leu Asp Pro Val Ala Val Gly

85 90 95

Ala Leu Pro Val Arg Thr Asp Phe Ala Arg Arg Ile Ala Arg Gln Arg

100 105 110

Pro Ala Leu Ile Arg Gly Asn Ala Ser Glu Ile Leu Ala Leu Ala Gly

115 120 125

Arg Gln Ser Ala Ser Arg Gly Val Asp Ala Leu Asp Asp Val Ser Ala

130 135 140

Ala Leu Ala Ala Gly Arg Glu Leu Ala Glu Arg His Asp Cys Val Val

145 150 155 160

Ala Ile Ser Gly Gln Ser Asp Ala Ile Ile Asp Ala Thr Arg Thr Val

165 170 175

Leu Val His Thr Asn Gly Ile Gly Leu Thr Arg Ile Thr Gly Gly Gly

180 185 190

Cys Ala Leu Gly Ala Phe Cys Ala Gly Met Ile Ala Val His Asp Asp

195 200 205

Pro Phe Glu Ala Ala Ile Ala Ala His Gly Phe Tyr Gly Leu Ala Ala

210 215 220

Glu Lys Ala Leu Glu Asn Ser Thr Gly Pro Gly Ser Phe Ala Val Ala

225 230 235 240

Phe Ile Asp Ala Leu Ser Ala Thr Asp Pro Glu Glu Leu Lys Thr Leu

245 250 255

Lys His Glu Glu Leu Asn His Ala

260

<210> 358

<211> 792

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 358

atggctttgc atgcagttgc ccaagaatac cggcaacaat cacctttggt tttctgcctg 60

accaacaccg tcgtagcaaa tttcaccgcc aatgccctgc tggcatccgg cgcgtccccg 120

gccatgacgg atctgcccgg agaggccggc cccttcgcaa aggcggcttc cgccgtcttg 180

gtgaatctgg gaactccgag caccgagcag ctggccgcca tggaagaagc cgtgcaatcg 240

gcgagcgcag caggcacccc atggatcctt gatccggtgg cggtcggcgc cctgccggtg 300

cgcacggatt tcgcgcggcg cattgcccgg caacgcccgg ccctgattcg cggcaacgcc 360

tcggaaatcc tggccctggc cggacggcaa tcggcttcac gcggtgtaga tgccttggat 420

gacgtctctg ccgccttggc ggctggacgc gagctggccg agcggcatga ctgcgtggtg 480

gccatttccg gccagtccga tgccatcatc gatgccacgc ggacggtcct ggtgcacacc 540

aacggaatcg gcttgacgcg gatcaccggc ggcggttgcg cgttgggcgc gttctgcgcc 600

ggcatgattg cggtccacga tgacccgttc gaggccgcca tcgcggccca cggcttctac 660

gggctggccg ctgaaaaggc cctggagaac agcacaggtc cgggcagctt cgccgtcgca 720

ttcattgatg cgctgtccgc aaccgatcca gaagaactta agactttgaa gcacgaggaa 780

ctgaaccatg ca 792

<210> 359

<211> 801

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 359

atggccctgc atgcagtggc acaggaatat cgtcagcaga gcccgctggt gttctgtctg 60

accaataccg tggttgccaa cttcaccgca aatgccctgc tggcaagcgg tgcaagtccg 120

gccatgaccg atctgccggg cgaagcaggc ccgttcgcaa aagccgccag cgcagtgctg 180

gttaatctgg gcaccccgag caccgaacag ctggccgcta tggaagaagc cgtgcagagc 240

gccagcgccg caggtacacc gtggattctg gaccctgttg ccgtgggcgc cctgcctgtg 300

cgtaccgact tcgcacgtcg tattgcacgc cagcgtccgg ccctgattcg cggtaatgca 360

agcgaaattc tggcactggc cggtcgccag agcgccagtc gtggtgtgga tgccctggat 420

gatgtgagtg cagcactggc agcaggtcgt gaactggccg aacgtcatga ttgcgttgtt 480

gcaattagtg gtcagagcga tgcaattatt gatgcaaccc gtaccgttct ggtgcatacc 540

aatggcattg gtctgacccg tattaccggc ggtggttgtg cactgggtgc attctgtgcc 600

ggtatgattg cagtgcatga tgatccgttc gaagccgcaa ttgcagccca tggcttctat 660

ggtctggcag cagaaaaagc cctggaaaat agtaccggcc cgggtagctt cgccgttgca 720

ttcattgatg cactgagcgc caccgatccg gaagaactga aaaccttaaa acatgaagaa 780

ctgaatcacg cataaggatc c 801

<210> 360

<211> 256

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 360

Met Gln Ala Arg Asp Asp Asp Val Arg Ser Ala Ala Ala Glu Val Leu

1 5 10 15

Glu Arg Leu Arg Ala Arg Arg Pro Arg Val His Cys Ile Thr Asn Ala

20 25 30

Val Ala Gln Ala Phe Thr Ala Asn Leu Leu Leu Ala Val Gly Ala Val

35 40 45

Pro Ser Met Thr Ile Ser Pro Glu Glu Val Gly Asp Phe Val Ala Arg

50 55 60

Ala Asp Ala Leu Leu Val Asn Leu Gly Thr Leu Glu Lys Ser Arg Arg

65 70 75 80

Ala Ala Ile Gly Ile Ala Val Asp Thr Ala Asn Gly Glu His Val Pro

85 90 95

Trp Leu Val Asp Pro Val Phe Val Asp Arg Ser Pro Leu Arg Ala Ser

100 105 110

Phe Ala Gln Ala Leu Ile Leu Leu Arg Pro His Ala Val Arg Leu Asn

115 120 125

Gly Asp Glu Phe Ala Ala Leu Ala Gly Ala Glu Gly Ala Thr Glu Ala

130 135 140

Val Ser His Phe Ala Arg Asp Asn Arg Thr Val Ile Ala Leu Thr Gly

145 150 155 160

Glu Ile Asp Thr Val Gly Asp Gly Lys Arg Met Ala Arg Val Ala Asn

165 170 175

Gly His Pro Trp Met Gly Lys Ile Thr Ala Met Gly Cys Ala Gly Ala

180 185 190

Ala Leu Ala Ala Ala Cys Leu Ala Val Glu Ser Glu Pro Trp Leu Ala

195 200 205

Val Ala Ala Gly Gln Ile Ile Val Gly Val Ala Gly Glu Val Ala Ala

210 215 220

Glu Gln Ala Arg Gly Pro Gly Ser Leu Ala Val Ala Ile Leu Asp Thr

225 230 235 240

Leu Asn Ser Leu Asp Arg Ala Thr Leu Met Ala Arg Ala Lys Val Thr

245 250 255

<210> 361

<211> 768

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 361

atgcaagcgc gtgacgatga tgtcagaagc gcggctgccg aagtcctcga acggttgcgg 60

gcgcggcgcc ctcgggtcca ctgcatcacg aatgcggtcg cgcaggcctt tacggcaaat 120

cttctgcttg ccgttggcgc ggttccatcg atgaccattt cgccggaaga ggtcggcgat 180

ttcgtcgcgc gtgccgatgc gctgctcgtc aatctcggca cgctggaaaa gtcgcggcgt 240

gccgcgatcg gaatcgctgt ggacactgca aacggggagc atgttccgtg gctggtcgat 300

ccggtgttcg ttgaccgctc gccattacgc gccagtttcg cgcaggccct gatcctgttg 360

cggccgcatg cggtgcggct gaacggcgac gaattcgctg cgctcgctgg agccgaaggc 420

gcgactgaag cggtctcgca tttcgcccgc gacaaccgaa cggtgatcgc gctcaccgga 480

gagatcgata ccgtcggcga tggcaagcgg atggcgcggg ttgcaaacgg ccacccctgg 540

atgggcaaga tcacggcaat gggctgcgcc ggcgcggcgt tggcggcggc ctgtcttgcg 600

gtagagagtg agccgtggct ggcggtcgcc gccggccaga ttatcgtcgg tgtcgccggc 660

gaggtggcgg ccgagcaggc gcgcggcccg ggcagtctcg cggtggcgat cctggatacg 720

ttgaacagcc tcgaccgggc gacgctgatg gcgcgggcga aggtgacg 768

<210> 362

<211> 777

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 362

atgcaggcac gtgatgatga tgttcgtagt gcagccgccg aagttctgga acgtctgcgt 60

gcacgtcgtc cgcgcgttca ttgcattacc aatgccgttg cccaggcctt caccgccaat 120

ctgctgctgg cagttggtgc cgtgccgagc atgaccatta gcccggaaga agtgggtgac 180

ttcgttgccc gcgccgatgc actgctggtt aatctgggta ccctggaaaa aagtcgtcgc 240

gccgccattg gtattgcagt tgataccgcc aatggtgaac atgttccgtg gctggttgat 300

ccggtgttcg tggatcgcag tccgctgcgc gccagcttcg cccaagcact gattctgctg 360

cgcccgcatg cagtgcgcct gaatggtgat gagttcgccg cactggccgg cgcagaaggc 420

gcaacagaag ccgttagtca cttcgcccgt gataatcgta ccgttattgc cctgaccggc 480

gaaattgata ccgtgggtga tggtaaacgc atggcacgtg ttgcaaatgg ccatccgtgg 540

atgggcaaaa ttaccgccat gggctgtgca ggtgcagccc tggccgcagc ttgcctggca 600

gtggaaagcg aaccgtggct ggcagtggca gccggccaga ttattgtggg cgtggccggc 660

gaagttgcag cagaacaggc ccgcggtccg ggcagtctgg ctgttgcaat tctggatacc 720

ctgaatagcc tggatcgcgc caccctgatg gcacgcgcca aagtgaccta aggatcc 777

<210> 363

<211> 239

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 363

Met Glu Glu Glu Glu Glu Ala Gly Ala Ser Leu Met Thr Phe Pro Ser

1 5 10 15

Ser Ala Ser Pro Ser Ser Ser Ser Ser Arg Pro Ala Gly Pro Ser Glu

20 25 30

Val Ser Gly Ala Asp Leu Leu His Glu Arg His Leu Gly Ala Gln Arg

35 40 45

Leu Glu Arg Val Gln Cys Leu Thr Asn Ile Val Val Ala Gly Trp Ser

50 55 60

Ala Asn Val Leu Leu Ala Ala Gly Ala Ala Pro Ala Met Val Asp Asn

65 70 75 80

Pro Arg Glu Ala Gly Val Leu Gly Gly Val Ala Gly Gly Val Leu Val

85 90 95

Asn Leu Gly Thr Pro Tyr Glu Glu Thr Val Lys Ala Met Tyr Ala Ala

100 105 110

Ala Arg Ala Ala Arg Ala Gly Arg Arg Pro Trp Val Leu Asp Pro Val

115 120 125

Ala Ala Gly Ala Leu Pro Trp Arg Thr Glu His Ala Val Ala Leu Leu

130 135 140

Asp Glu Gln Pro Thr Val Val Arg Gly Asn Ala Ser Glu Val Leu Ala

145 150 155 160

Pro Gly Glu Gly Glu Gly Gly Lys Gly Val Asp Ser Thr Asp Ser Pro

165 170 175

Glu Ser Val Leu Glu Ala Ala Gln Gly Leu Ala Glu Arg Leu Gly Cys

180 185 190

Val Val Ala Val Ser Gly Ala Val Asp His Val Thr Asp Gly Arg Arg

195 200 205

Leu Val Arg Val His Asn Gly His Glu Trp Leu Thr Lys Val Thr Gly

210 215 220

Val Gly Cys Ser Leu Gly Ala Leu Val Ala Gly Tyr Ala Ala Val

225 230 235

<210> 364

<400> 364

000

<210> 365

<211> 726

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 365

atggaagaag aagaagaggc cggtgcaagt ctgatgacct tcccgagtag tgccagtccg 60

agtagtagca gcagccgtcc ggcaggtccg agtgaagtga gtggcgcaga cttactgcat 120

gaacgtcatc tgggtgcaca gcgtctggaa cgtgtgcagt gcctgaccaa tattgttgtt 180

gcaggctgga gcgccaatgt gctgctggcc gcaggtgcag caccggcaat ggttgataat 240

ccgcgtgaag caggtgtgct gggtggtgtg gccggtggtg tgctggttaa tctgggtacc 300

ccgtatgaag aaaccgtgaa agccatgtat gccgccgcac gtgccgcccg tgccggtcgt 360

cgtccttggg ttctggaccc tgttgccgca ggcgcactgc cgtggcgtac cgaacatgca 420

gtggcactgc tggatgaaca gccgaccgtt gttcgtggca atgcaagcga agtgctggcc 480

ccgggcgaag gcgaaggcgg taaaggtgtg gatagtaccg atagtccgga aagtgttctg 540

gaagcagccc agggtctggc cgaacgcctg ggttgtgtgg ttgcagttag cggtgccgtg 600

gatcatgtta ccgatggccg ccgtctggtt cgcgttcata atggtcatga atggctgacc 660

aaagttaccg gcgttggttg tagcctgggc gcactggttg ccggttatgc agccgtgtaa 720

ggatcc 726

<210> 366

<211> 296

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 366

Met Arg Cys Pro Pro Ser Ala Asp Pro Leu Arg Pro Leu Pro Trp Arg

1 5 10 15

Thr Thr Thr Met His Ala Asn Pro Ile Asp Ala Ala Ala Leu Trp Ala

20 25 30

Asp Leu Gln Ala Val Arg Arg Gln Ala Pro Leu Val His Asn Ile Thr

35 40 45

Asn Phe Val Val Met Asn Tyr Ser Ala Asn Ala Leu Leu Ala Val Gly

50 55 60

Ala Ser Pro Val Met Ala His Ala Lys Glu Glu Val Arg Asp Met Val

65 70 75 80

Gly Ile Ala Gln Ala Leu Val Leu Asn Ile Gly Thr Leu Gln Pro Glu

85 90 95

Trp Met Glu Ala Met Gln Leu Ala Leu Ala Ala Ala Arg Ala Arg Gly

100 105 110

Val Pro Val Val Leu Asp Pro Val Gly Ala Gly Ala Thr Pro Tyr Arg

115 120 125

Asn Thr Ala Ile Ala Glu Leu Leu Arg Cys Gly Ala Pro Ser Val Val

130 135 140

Arg Gly Asn Ala Ser Glu Val Met Ser Val Ala Gly Leu Ser Ala Ala

145 150 155 160

Thr Arg Gly Val Asp Ser Ala Ala Ala Ser Gly Glu Ala Leu Asp Ala

165 170 175

Ala Arg Ala Leu Ala Arg Gly Leu Gln Ala Thr Val Cys Ile Ser Gly

180 185 190

Ala Asp Asp His Val Val Asp Ala Gly Ala Arg Trp Ala Thr Leu Ser

195 200 205

Asn Gly His Pro Trp Met Thr Arg Val Thr Gly Val Gly Cys Ser Ala

210 215 220

Ser Ala Leu Val Gly Ala Phe Cys Ala Val Gln Pro Asp Arg Trp Arg

225 230 235 240

Ala Thr Val Ala Ala Met Ala Val Leu Gly Val Ala Gly Glu Met Ala

245 250 255

Ala Glu Arg Thr Gln Ala Ala Gly Gly Ser Val Gly Arg Leu Gln Ile

260 265 270

Glu Leu Leu Asp Gly Leu Gln Leu Leu Asp Glu Pro Ser Phe Ala Ala

275 280 285

Arg Leu Lys Leu Arg Thr His Asp

290 295

<210> 367

<211> 888

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 367

atgcgctgcc caccgtcggc cgacccgctg cgcccactgc cgtggaggac gacgacgatg 60

cacgcgaacc ccatcgacgc tgcagccctg tgggccgatc tgcaagccgt gcgccggcaa 120

gcgccgctgg tgcacaacat caccaacttc gtggtcatga actacagcgc caatgcgctg 180

ctggccgtgg gcgcgtcgcc ggtgatggcg cacgccaagg aagaagtgcg cgacatggtc 240

ggcatcgcgc aggcgctggt gctgaacatc ggcacgctgc agcccgagtg gatggaagcg 300

atgcagctgg cgctggccgc cgcccgcgcg cgcggcgtgc cggtggtgct ggacccggtg 360

ggtgccggcg ccacgcccta ccgcaatacc gccatcgccg agctgttgcg atgcggcgcg 420

cccagcgtgg tgcgcggcaa cgcctcggag gtgatgagcg tggccggact gagcgcagcg 480

acccgcggcg tcgacagcgc cgccgcgtcg ggcgaggcgc tcgatgcagc gcgtgcgctg 540

gcgcgcggcc tgcaagccac cgtgtgcatc agcggcgccg acgaccacgt ggtcgatgcc 600

ggcgctcgct gggccacgct gtccaacggc cacccgtgga tgacccgcgt caccggcgtg 660

ggctgctcgg ccagtgcgct ggtcggtgcc ttctgtgcgg tgcagccgga ccgctggcgc 720

gccaccgttg cggccatggc cgtgctgggt gtcgccggcg agatggcggc cgagcgcacc 780

caggccgccg gcggcagtgt cggccggctg cagatcgagc tgctcgacgg gctgcagctg 840

ctcgacgaac ccagcttcgc cgcgcggctg aagctgcgca cccatgac 888

<210> 368

<211> 897

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 368

atgcgttgtc cgccgagcgc agatccgctg cgccctcttc cgtggcgtac caccaccatg 60

catgccaatc cgattgatgc agcagccctg tgggccgatc tgcaagcagt tcgccgccag 120

gcaccgctgg tgcataatat taccaacttc gttgttatga actacagtgc aaatgcactg 180

ctggccgttg gcgccagtcc ggttatggca catgccaaag aagaagttcg cgatatggtt 240

ggcattgcac aggccctggt gctgaatatt ggtaccctgc aaccggaatg gatggaagca 300

atgcagctgg cactggccgc cgcccgtgct agaggtgttc cggttgttct ggaccctgtg 360

ggcgccggtg ccacccctta tcgtaatacc gcaattgccg aactgctgcg ctgtggtgcc 420

ccgagtgtgg ttcgcggcaa tgcaagcgaa gttatgagtg tggcaggtct gagtgcagca 480

acccgtggtg ttgatagtgc cgcagcaagc ggcgaagccc tggatgcagc ccgtgcactg 540

gcacgtggcc tgcaagcaac cgtgtgtatt agcggcgcag atgatcatgt ggtggatgca 600

ggtgcccgct gggccaccct gagtaatggt catccgtgga tgacccgtgt taccggcgtg 660

ggttgcagtg caagcgcact ggttggtgca ttctgtgcag ttcagccgga tcgctggcgc 720

gccaccgtgg cagcaatggc agttctgggc gtggcaggcg aaatggcagc cgaacgcacc 780

caggccgccg gtggtagtgt gggtcgtctg caaattgaac tgctggatgg tctgcaactg 840

ctggatgaac cgagcttcgc cgcccgtctg aaactgcgta cccatgatta aggatcc 897

<210> 369

<211> 225

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 369

Met Gly Thr Leu Thr Pro Ala Ala Leu Asp Ala Met Arg Leu Ala Gly

1 5 10 15

Arg Glu Ala Asn Arg Cys Gly Val Pro Val Val Leu Asp Pro Val Gly

20 25 30

Ala Gly Ala Thr Pro Tyr Arg Thr Glu Ala Ala Arg Gln Leu Leu Glu

35 40 45

Asp Ile Asn Val Ala Ile Val Arg Gly Asn Ser Gly Glu Val Ala Ala

50 55 60

Ile Ile Gly Gln Gln Ala Val Val Arg Gly Val Glu Ser Leu Glu Thr

65 70 75 80

Ala Leu Pro Ala Ala Glu Leu Gly Ala Gln Ala Ala Gln Gln Leu Gly

85 90 95

Val Val Val Ala Leu Thr Gly Ala Arg Asp Ile Ile Ser Asp Gly Ser

100 105 110

Val Ser Leu Ala Val Asp His Gly Ser Pro Trp Leu Lys Thr Ile Thr

115 120 125

Gly Ser Gly Cys Met Ala Ser Ala Ala Val Ala Cys Phe Ala Ala Val

130 135 140

Ala Pro Ser Ser Leu Gln Ala Ala Ala Ala Ala Leu Ala Ala Tyr Gly

145 150 155 160

Leu Ala Ala Glu Leu Ala His Lys Pro Gln Ile His Gly Pro Ala Ser

165 170 175

Phe Lys Val Ala Leu Leu Asp Ala Val Tyr Gly Leu Thr Ala Glu Thr

180 185 190

Leu Gln Arg Ala Lys Ala Val Ser Tyr Thr His Leu Thr Leu Pro Glu

195 200 205

Thr Lys Thr Asp Leu Val Phe Arg Leu Leu Leu Glu Lys Lys Lys Leu

210 215 220

Thr

225

<210> 370

<400> 370

000

<210> 371

<211> 684

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 371

atgggtaccc tgaccccggc agcactggat gccatgcgcc tggccggtcg tgaagcaaat 60

cgttgtggtg tgccggtggt gctggaccct gtgggtgcag gcgcaacccc gtatcgcacc 120

gaagcagccc gccagctgct ggaagatatt aatgttgcca ttgtgcgtgg caatagcggt 180

gaagtggcag caattattgg ccagcaggca gttgttcgtg gtgtggaaag cctggaaacc 240

gccctgccgg cagccgaact gggtgctcag gccgcacagc agctgggcgt ggtggtggct 300

ctgaccggcg ctcgtgatat tattagtgat ggtagtgtta gcctggcagt ggatcatggt 360

agtccgtggc tgaaaaccat taccggtagc ggctgtatgg ccagcgcagc cgttgcctgc 420

ttcgccgcag tggcccctag tagcctgcaa gcagccgcag ccgcactggc cgcatacggt 480

ctggcagccg aattagcaca taaaccgcag attcatggtc cggccagctt caaagttgcc 540

ctgctggatg ccgtgtatgg cctgaccgca gaaaccttac agcgtgccaa agcagttagc 600

tatacccatc tgaccctgcc ggaaaccaaa accgatctgg tgttccgcct gctgctggaa 660

aaaaaaaaac tgacctaagg atcc 684

<210> 372

<211> 193

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 372

Met Ile Asp Glu Ile Glu Lys Ser Leu Tyr Phe Leu Arg Lys Lys Lys

1 5 10 15

Pro Ile Val Leu Cys Leu Thr Asn Phe Val Thr Met Glu Phe Val Ala

20 25 30

Asn Ser Leu Leu Ser Leu Gly Ala Ala Pro Ile Thr Ser Val Ser Glu

35 40 45

Glu Glu Leu Ala Glu Leu Val Gln Ile Ala Ser Ser Val Tyr Ile Asn

50 55 60

Ile Gly Thr Leu Asp Asp Lys Phe Ile Asn Leu Thr Lys Lys Ala Ile

65 70 75 80

Glu Leu Ala Gln Glu Phe Asp Lys Pro Ile Ile Leu Asp Pro Val Gly

85 90 95

Ala Gly Ala Thr Lys Val Arg Thr Gln Thr Ala Lys Tyr Ile Leu Pro

100 105 110

Phe Ser Ser Ile Ile Arg Gly Asn Ala Ser Glu Ile Ile Ala Leu Gly

115 120 125

Gln Asn Ala Gln Leu Thr Tyr Gly Val Glu Thr Ser Asn Thr Thr Asp

130 135 140

Glu Ala Glu Glu Ile Ala Thr Arg Ile Ala Leu Glu Asn Asn Thr Thr

145 150 155 160

Ile Ile Thr Ser Gly Pro Val Asp Tyr Ile Thr Asn Gly Asn His Ser

165 170 175

Val Gln Val Pro Phe Gly Ser Ser Leu Met Gln Leu Val Thr Gly Met

180 185 190

Gly

<210> 373

<400> 373

000

<210> 374

<211> 588

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 374

atgatcgatg aaatcgaaaa gagtctgtac ttcctgcgca aaaaaaaacc gattgttctg 60

tgcctgacca acttcgtgac catggagttc gtggccaata gcctgctgag cctgggtgcc 120

gcaccgatta ccagtgtgag tgaagaagaa ctggcagaac tggtgcagat tgcaagtagt 180

gtgtatatta atatcggcac cctggatgat aaattcatta atctgaccaa aaaggccatt 240

gaactggccc aggagttcga taaaccgatt attctggacc ctgttggtgc cggtgcaacc 300

aaagtgcgta cccagaccgc aaaatatatt ctgccgttca gtagcattat tcgcggcaat 360

gcaagtgaaa ttattgcact gggccagaat gcacagctga cctatggtgt tgaaaccagt 420

aataccaccg atgaagcaga agaaattgca acccgtattg ccctggaaaa taataccacc 480

attattacca gcggcccggt tgattatatt accaatggca atcatagtgt tcaggttccg 540

ttcggcagca gcctgatgca gctggttacc ggcatgggtt aaggatcc 588

<210> 375

<211> 265

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 375

Met Ile Leu Asp Ala Ala Glu Val Leu Glu Arg Val Arg Arg Asp Lys

1 5 10 15

Pro Leu Val His His Leu Thr Asn Leu Val Thr Ile Tyr Asp Cys Ala

20 25 30

Asn Ile Val Lys Val Phe Gly Ala Ser Pro Val Met Ala His Ala Arg

35 40 45

Glu Glu Val Ala Asp Met Ala Lys Ile Ala Ser Ala Leu Val Leu Asn

50 55 60

Ile Gly Thr Leu Thr Thr Glu Phe Val Gln Ala Met Leu Ile Ala Gly

65 70 75 80

Lys Ser Ala Asn Glu Lys Gly Ile Pro Val Val Phe Asp Val Cys Gly

85 90 95

Ala Gly Ala Thr Lys Phe Arg Asp Asp Lys Cys Leu Glu Ile Leu Asp

100 105 110

Ala Val Asp Ile Ser Ile Ile Lys Gly Asn Ser Ser Glu Val Ala Arg

115 120 125

Ile Ala Gly Glu Asp Val Lys Thr Arg Gly Val Asp Ala Ala Asp Ile

130 135 140

Glu Ala Asn Leu Leu Glu Val Ala Gly Ser Leu Ala Glu Lys Arg Glu

145 150 155 160

Cys Thr Val Val Ile Thr Gly Lys Asp Asp Ile Val Ala Asp Arg Lys

165 170 175

Arg Ala Val Trp Val His Asn Gly His Pro Met Met Ala Asn Val Val

180 185 190

Gly Thr Gly Cys Met Ala Ala Ser Val Ile Gly Ala Phe Ala Ala Val

195 200 205

Glu Lys Asp Gln Leu Ala Ala Ser Val Ser Gly Leu Val Cys Tyr Glu

210 215 220

Val Ala Ala Glu Val Ala Ala Leu Val Ser Ala Gly Pro Gly Ser Phe

225 230 235 240

Lys Glu Asn Leu Tyr Asp Ala Val Tyr Asn Leu Asp Ser Gly Thr Ile

245 250 255

Arg Ser Met Gln Lys Ile Glu Phe Glu

260 265

<210> 376

<400> 376

000

<210> 377

<211> 804

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 377

atgatcctgg atgcagcaga agtgctggaa cgtgttcgcc gtgataaacc gctggtgcat 60

catctgacca atctggttac catctatgat tgtgccaata ttgttaaagt gttcggcgca 120

agcccggtga tggcacatgc acgcgaagaa gtggccgata tggcaaaaat tgccagtgca 180

ctggtgctga atattggtac cctgaccacc gagttcgttc aggccatgct gattgccggc 240

aaaagtgcaa atgaaaaagg cattccggtt gtgttcgatg tgtgtggtgc cggtgccacc 300

aaattccgtg atgataaatg cctggaaatt ctggatgccg tggatattag cattattaaa 360

ggtaatagca gcgaagtggc ccgtattgcc ggtgaagatg tgaaaaccag aggtgtggat 420

gccgccgata ttgaagcaaa tctgctggaa gtggcaggca gcctggcaga aaaacgcgaa 480

tgtaccgttg ttattaccgg caaagatgat attgttgcag atcgtaaacg cgccgtgtgg 540

gttcataatg gccatccgat gatggcaaat gtggttggca ccggttgtat ggcagcaagc 600

gtgattggcg cattcgccgc agttgaaaaa gatcagctgg cagccagcgt gagcggcctg 660

gtgtgttatg aagttgccgc cgaagttgca gccctggtta gcgccggccc gggttcattc 720

aaagaaaatc tgtatgatgc cgtgtataat ctggatagtg gcaccattcg cagcatgcag 780

aaaattgagt tcgaataagg atcc 804

<210> 378

<211> 272

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 378

Met Asp Ala Gln Thr Ala Ala Gln His Leu Ser Lys Val Arg Asp Gln

1 5 10 15

Asn Pro Leu Val His Ser Ile Thr Asn Asn Val Val Thr Asn Phe Thr

20 25 30

Ala Asn Gly Leu Leu Ala Leu Gly Ala Ser Pro Val Met Ala Tyr Ala

35 40 45

Ile Glu Glu Ala Ala Asp Met Ala Lys Ile Ala Gly Ala Leu Val Leu

50 55 60

Asn Ile Gly Thr Leu Ser Ser Ala Ser Val Glu Ala Met Ile Ala Ala

65 70 75 80

Gly Lys Ser Ala Asn Glu Asn Gly Val Pro Val Ile Phe Asp Pro Val

85 90 95

Gly Ala Gly Ala Thr Pro Phe Arg Thr Ala Ser Ala Arg Lys Ile Ile

100 105 110

Gln Glu Val Arg Leu Ser Val Ile Arg Gly Asn Ala Ala Glu Ile Ala

115 120 125

Asn Ile Ala Gly Ala Pro Asp Trp Lys Ile Lys Gly Val Asp Ala Gly

130 135 140

Glu Ala Gly Gly Asp Val Val Gln Leu Ala Lys Thr Ala Ala Ser Arg

145 150 155 160

Met Lys Thr Val Ile Ala Ile Thr Gly Lys Thr Asp Val Ile Ser Asp

165 170 175

Gly Thr Asp Thr Tyr Ala Val His Asn Gly Asp Lys Leu Leu Thr Lys

180 185 190

Val Thr Gly Ala Gly Cys Leu Leu Thr Ser Val Ile Gly Ala Phe Cys

195 200 205

Ala Ala Glu Lys Asp Val Leu Gln Ala Ala Val Ser Ala Val Ser Val

210 215 220

Tyr Gly Ser Ala Ala Gln Leu Ala Ala Leu Asp Thr Ser His Lys Gly

225 230 235 240

Pro Gly Ser Phe Gln Ile Glu Leu Leu Asn Lys Leu Ala Ser Ile Ser

245 250 255

Glu Gln Glu Ala Ala Glu Leu Ala Ala Ile Glu Arg Val Thr Glu Lys

260 265 270

<210> 379

<211> 816

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 379

atggacgcac aaaccgcagc tcaacacttg agtaaagtgc gggatcaaaa cccgctcgtt 60

cacagtatca ccaataatgt cgtcacgaac ttcaccgcta acggactgct cgcgctcggc 120

gcatcgcccg ttatggctta tgcaattgag gaggccgccg acatggcgaa aatcgcagga 180

gcgctcgtcc tgaatatagg caccctcagt tcggcgtcgg ttgaagctat gatcgcagcc 240

ggaaaatcgg ccaatgaaaa cggtgttccg gtcatttttg atccggtagg cgccggcgcc 300

acgccgtttc ggacggcatc agcccgcaag atcatacagg aggtccgctt gtccgtcatt 360

cgcggaaatg ccgcggaaat cgccaatatt gccggcgccc ctgattggaa gataaaaggc 420

gtggatgcgg gggaagccgg aggagatgtg gttcagctcg ctaagacggc tgcaagcagg 480

atgaagacgg tcattgcgat taccggaaaa accgacgtca tctcggacgg caccgacaca 540

tacgccgtac ataacggtga taaactgctg acgaaggtga cgggggcggg atgcctgctg 600

acgtctgtaa tcggagcctt ctgcgcagcg gagaaggacg ttctgcaagc ggccgtttca 660

gccgtttctg tatacggaag cgccgctcag cttgccgctc tggacacctc ccataagggg 720

ccgggcagct tccagattga gcttttaaac aagctggcaa gcatctcaga acaagaagcg 780

gccgagcttg ctgcaattga aagggtgaca gaaaaa 816

<210> 380

<211> 819

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 380

atggatgcac agaccgccgc ccagcatctg agtaaagtgc gtgatcagaa tccgctggtt 60

catagcatta ccaataatgt tgtgaccaac ttcaccgcca atggcctgct ggcactgggt 120

gcaagtccgg tgatggccta tgccattgaa gaagccgccg atatggcaaa aattgccggt 180

gccctggtgc tgaatattgg taccctgagc agcgccagtg ttgaagccat gattgccgca 240

ggcaaaagcg caaatgaaaa tggcgttccg gttatcttcg atccggtggg cgcaggtgca 300

accccgttcc gtaccgcaag tgcccgtaaa attattcagg aagttcgtct gagcgtgatt 360

cgtggcaatg ccgcagaaat tgcaaatatt gccggcgcac cggattggaa aattaaaggt 420

gtggatgcag gtgaagcagg cggtgatgtg gtgcagctgg ccaaaaccgc agccagccgt 480

atgaaaaccg tgattgccat taccggtaaa accgatgtta ttagtgatgg caccgatacc 540

tatgccgttc ataatggcga taaactgctg accaaagtga ccggtgccgg ttgcctgctg 600

accagcgtta ttggtgcatt ctgcgccgca gaaaaagatg ttctgcaagc agccgttagc 660

gcagtgagcg tgtatggtag cgcagcacag ctggccgcac tggataccag tcataaaggc 720

ccgggcagct tccagattga actgctgaat aaactggcca gcattagtga acaggaagca 780

gccgaactgg cagcaattga acgtgttacc gaaaaataa 819

<210> 381

<211> 249

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 381

Met His Gly Asn Glu Ile Gly Asp Val Ser Met Asp Ile Ala Ala Asn

1 5 10 15

Ala Leu Leu Ala Leu Gly Ala Ser Pro Ala Met Ile His Ala Pro Glu

20 25 30

Glu Thr Asp Glu Phe Thr Ala Met Ala Asp Ala Leu Val Ile Asn Val

35 40 45

Gly Thr Leu Ser Ala Gln Ala Ala Gln Gly Met Glu Arg Ala Ala Ala

50 55 60

Ala Ala Arg Leu His Gly Lys Pro Trp Leu Leu Asp Pro Val Ala Ala

65 70 75 80

Gly Leu Leu Thr Phe Arg Asp Asp Thr Ile Arg Lys Leu Leu Arg His

85 90 95

Arg Pro Ser Leu Ile Arg Gly Asn Ala Ser Glu Ile Met Ala Val Ala

100 105 110

Arg Ile Ala Gly Leu Thr Gln Asp Ala Ala Ala Pro Arg Gly Val Asp

115 120 125

Asn Arg His Gln Ala Ser Asp Ala Glu Ala Leu Ala Val Lys Leu Ala

130 135 140

Arg His Cys Phe Cys Ala Val Val Ala Thr Gly Ala Val Asp Val Val

145 150 155 160

Ser Asp Gly Glu Thr Thr Val Arg Ile Ala Asn Gly Ser Pro Leu Ala

165 170 175

Pro Arg Val Thr Ala Leu Gly Cys Ser Met Ser Ser Val Met Gly Ala

180 185 190

Tyr Leu Ala Leu Thr Gly Pro Phe Glu Ala Ala Leu Ala Thr Thr Ile

195 200 205

Leu Tyr Gly Val Ala Gly Asp Ile Ala Ala Glu Gly Ala Arg Gly Pro

210 215 220

Ala Ser Phe Arg Thr Ala Phe Leu Asp Thr Leu Tyr Ser Ile Ala Arg

225 230 235 240

Ser Glu Leu Ala Arg Arg Val Arg Ser

245

<210> 382

<400> 382

000

<210> 383

<211> 750

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 383

atgcatggca atgaaattgg cgatgttagt atggatattg cagccaatgc actgctggca 60

ctgggtgcca gtccggccat gattcatgcc ccggaagaaa ccgatgagtt caccgccatg 120

gccgatgcac tggttattaa tgttggcacc ctgagcgccc aggcagccca gggtatggaa 180

cgcgcagcag ccgccgcacg cctgcatggt aaaccgtggc tgctggaccc tgttgcagca 240

ggcctgctga ccttccgcga tgataccatt cgtaaactgc tgcgccatcg cccgagcctg 300

attcgcggta atgcaagtga aattatggca gttgcacgca ttgccggcct gacccaggat 360

gcagcagccc ctcgcggtgt ggataatcgt catcaggcaa gtgatgccga agccctggcc 420

gtgaaactgg cacgtcattg cttctgtgca gttgtggcca ccggcgccgt tgatgttgtt 480

agtgatggtg aaaccaccgt gcgcattgca aatggtagtc cgctggcccc gcgtgttacc 540

gcactgggtt gtagtatgag tagcgttatg ggtgcctatc tggccctgac cggcccgttc 600

gaagccgctc tggcaaccac cattctgtat ggtgtggccg gcgatattgc cgcagaaggc 660

gcccgtggcc cggcatcatt ccgcacagca ttcctggata ccctgtatag cattgcccgt 720

agtgaactgg cacgccgtgt tcgtagttaa 750

<210> 384

<211> 221

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 384

Met Ile Arg Asp Ser Asp Glu Ala Gly Val Phe Ala Pro Val Ala Ser

1 5 10 15

Ala Val Leu Ile Asn Leu Gly Thr Leu Gly Gly Arg Gln Pro Glu Ala

20 25 30

Met Arg Glu Ala Ala Arg Ala Ala Arg Leu Ala Gly Thr Pro Trp Val

35 40 45

Leu Asp Pro Val Ala Val Gly Ala Leu Pro Val Arg Thr Ala Leu Ala

50 55 60

Ala Glu Leu Leu Ser Ala Arg Pro Thr Ile Val Arg Gly Asn Ala Ser

65 70 75 80

Glu Ile Ala Ala Val Ala Gly Ala Gly Ala Ala Gly Arg Gly Val Asp

85 90 95

Ala Thr Gln Thr Val Asp Ala Ala Ala Ala Pro Ala Val Glu Leu Ala

100 105 110

Thr Arg Leu Asp Ala Val Val Ala Val Ser Gly Pro Val Asp Leu Val

115 120 125

Thr Asp Gly Arg Thr Arg Ile Arg Val Ala Gly Gly His Glu Leu Leu

130 135 140

Thr Arg Val Thr Gly Ala Gly Cys Ala Leu Gly Ala Val Leu Gly Ala

145 150 155 160

Phe Ala Ala Val Ala Asp Asp Pro Leu Thr Ala Ala Val Ala Ala His

165 170 175

Cys Val Tyr Ala Val Ala Ala Glu Asp Ala Ala Ala Gly Ser Pro Gly

180 185 190

Pro Gly Ser Phe Ala Val Ala Leu Leu Asp Ser Leu Ala Ala Val Ser

195 200 205

Ala Asp Asp Val Ala Ala Arg Ala Arg Leu Glu Val Val

210 215 220

<210> 385

<400> 385

000

<210> 386

<211> 666

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 386

atgatccgtg atagtgatga agccggcgtg ttcgcaccgg ttgcaagcgc agttctgatt 60

aatctgggta ccctgggtgg ccgccagccg gaagctatgc gtgaagcagc acgcgccgcc 120

cgtctggcag gtacaccttg ggttctggac cctgtggcag ttggtgccct gccggttcgc 180

accgcactgg cagctgaact gctgagcgcc cgtccgacca ttgtgcgtgg taatgcaagt 240

gaaattgcag ccgtggcagg cgcaggtgcc gcaggtagag gtgttgatgc cacccagacc 300

gttgatgcag cagccgcccc ggccgttgaa ctggctaccc gtctggatgc cgttgtggca 360

gttagtggtc cggttgatct ggtgaccgat ggtcgcaccc gtattcgcgt ggcaggtggc 420

catgaactgc tgacccgcgt taccggcgcc ggctgtgcac tgggtgccgt tctgggtgcc 480

ttcgcagcag ttgccgatga tccgctgacc gccgccgttg ccgcacattg cgtgtatgcc 540

gtggcagccg aagatgccgc cgccggtagt ccgggtccgg gtagcttcgc cgttgcactg 600

ctggatagtc tggcagccgt tagcgccgat gatgttgcag cccgcgcacg tctggaagtt 660

gtttaa 666

<210> 387

<211> 205

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 387

Met Pro Thr Pro Ser Val Leu Phe Thr Arg Met Arg Asp Thr Ala Pro

1 5 10 15

Leu Val Gln Cys Ile Thr Asn Tyr Val Ala Met Asn Val Ala Ala Asn

20 25 30

Val Leu Leu Ala Ala Gly Ala Ser Pro Ala Met Val His Ala Glu Glu

35 40 45

Glu Ala Gly Glu Phe Ala Ala Leu Ala Gly Ala Leu Thr Val Asn Ile

50 55 60

Gly Thr Leu Ser Pro Ala Trp Ile Gly Gly Met Lys Ala Ala Val Gly

65 70 75 80

Gly Ala Ala Ser Ser Gly Arg Pro Trp Val Leu Asp Pro Val Ala His

85 90 95

Phe Ala Thr Gly Leu Arg Arg Gln Ala Val Ala Glu Leu Leu Glu Leu

100 105 110

Arg Pro Thr Ile Ile Arg Gly Asn Ala Ser Glu Ile Ile Ala Leu Ala

115 120 125

Gly Gln Ala Thr Ala Gly Lys Gly Val Asp Ser Gly Asp Ser Val Ala

130 135 140

Ala Ala Glu Ala Ala Ala Arg Ser Leu Ala Ala Lys His Ala Cys Thr

145 150 155 160

Ile Ala Val Thr Gly Pro Val Asp Phe Val Thr Asp Gly Ala Arg Ser

165 170 175

Ala Arg Ile Glu Gly Gly Ser Pro Leu Met Pro Leu Val Thr Ala Thr

180 185 190

Gly Cys Ala Leu Thr Ala Leu Val Gly Ala Phe Ala Ala

195 200 205

<210> 388

<211> 615

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 388

atgccgacac cttcggtgct tttcacgcgg atgcgcgaca ccgccccgct ggtgcagtgc 60

atcaccaact acgtggcgat gaatgtcgcc gccaatgtgc tgctggctgc cggggcgtcg 120

cccgccatgg tgcatgccga ggaggaggcg ggcgagttcg cagccctcgc cggcgcgctg 180

accgtcaata tcggcacgct gtcgccggcc tggatcggcg gcatgaaggc ggcggtcggg 240

ggcgcggcat cctccggccg gccatgggtg ctcgatccgg tcgcgcattt cgcgaccggc 300

ctgcgccggc aggcggtcgc ggagctgctg gaactgcgcc cgacgatcat ccgcggcaac 360

gcctccgaga tcatcgccct cgccggtcag gccaccgccg gcaagggggt cgattccggc 420

gacagcgtcg ccgccgccga agccgccgcc cgcagccttg ccgccaagca tgcctgcacc 480

atcgcggtga ccggcccggt cgatttcgtc accgatggcg cccggtccgc ccggatcgag 540

ggcggctcgc ccctgatgcc gctggtgacc gccaccggct gcgccctgac cgcgctggtc 600

ggcgccttcg ccgcc 615

<210> 389

<211> 618

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 389

atgccgaccc cgagcgtgct gttcacccgc atgcgcgata ccgccccgct ggttcagtgt 60

attaccaatt atgtggcaat gaatgtggcc gcaaatgtgc tgctggcagc cggcgcaagc 120

ccggcaatgg ttcatgcaga agaagaagca ggtgagttcg ccgcactggc cggtgccctg 180

accgttaata ttggcaccct gagcccggca tggattggcg gcatgaaagc cgcagttggc 240

ggtgcagcaa gcagcggccg cccttgggtt ctggaccctg ttgcacactt cgccaccggt 300

ctgcgccgcc aggcagtggc agaactgctg gaactgcgtc cgaccattat tcgcggcaat 360

gccagtgaaa ttattgccct ggccggccag gccaccgcag gtaaaggcgt tgatagtggt 420

gatagtgtgg cagcagccga agcagcagcc cgcagcctgg cagcaaaaca tgcctgtacc 480

attgcagtga ccggtccggt tgacttcgtg accgatggcg cacgtagcgc ccgcattgaa 540

ggcggcagcc cgctgatgcc gctggttacc gcaaccggct gtgccctgac cgcactggtg 600

ggtgcattcg cagcataa 618

<210> 390

<211> 283

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 390

Met Arg Glu Val Pro Arg Gly Arg Arg Pro Leu His Ala Ala Gly Gly

1 5 10 15

Arg Glu Met Ser Pro Ala Thr Leu Leu Ala Ala Leu Arg Ala Glu Pro

20 25 30

Pro Leu Val Gln Cys Ile Thr Asn Tyr Val Ala Met Asn Ile Ala Ala

35 40 45

Asn Val Met Leu Ala Ala Gly Ala Ser Pro Ala Met Val Ser Asp Ala

50 55 60

Glu Glu Ala Glu Glu Phe Ala Gly Ile Ala Gly Ala Leu Thr Val Asn

65 70 75 80

Ile Gly Thr Leu Ser Ala Pro Phe Val Glu Gly Met Arg Ala Ala Ile

85 90 95

Arg Gly Ala Gln Arg Ala Gly Arg Pro Trp Val Leu Asp Pro Val Ala

100 105 110

Cys Gln Ala Thr Thr Tyr Arg Arg Arg Val Ser Ala Glu Leu Val Ala

115 120 125

Leu Arg Pro Thr Ile Ile Arg Gly Asn Ala Ser Glu Val Leu Ser Leu

130 135 140

Ala Gly Glu Ala Ser Arg Gly Gln Gly Val Asp Gly Arg Asp Ser Val

145 150 155 160

Ala Ala Ala Glu Asp Gly Ala Arg Arg Leu Ala Gln Ala Ser Gly Ala

165 170 175

Val Val Ala Val Thr Gly Glu Val Asp Phe Val Thr Asp Gly Arg Arg

180 185 190

Gly Ala Arg Ile Glu Gly Gly Ser Pro Trp Met Pro Leu Asn Thr Ala

195 200 205

Leu Gly Cys Ser Leu Thr Cys Leu Cys Gly Ala Tyr Ala Ala Val Gly

210 215 220

Glu Asp Ala Phe Asp Ala Ala Val Ala Ala Leu Ala His Phe Ala Val

225 230 235 240

Ala Gly Arg Trp Ala His Glu Gly Ala Glu Gly Pro Gly Ser Phe Ala

245 250 255

Pro Arg Phe Leu Asp Ala Leu Arg Ala Val Thr Pro Arg Ala Leu Glu

260 265 270

Ala Glu Ala Val Ile Arg Gly Ala Glu Val Val

275 280

<210> 391

<400> 391

000

<210> 392

<211> 852

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 392

atgcgcgaag tgccgcgtgg tcgccgccct cttcatgccg caggtggtcg cgaaatgagc 60

ccggcaaccc tgctggcagc cctgcgtgca gaaccgccgc tggtgcagtg tattaccaat 120

tatgtggcaa tgaatatcgc agcaaatgtg atgctggcag caggtgcaag tccggcaatg 180

gtgagcgatg ccgaagaagc cgaagagttc gcaggtattg ccggcgccct gaccgttaat 240

attggtaccc tgagtgcacc gttcgtggaa ggtatgcgtg cagccattcg cggcgcacag 300

cgcgcaggtc gtccgtgggt tctggaccct gttgcatgtc aggccaccac ctatcgccgc 360

cgtgttagcg ccgaactggt tgccctgcgc ccgaccatta ttcgcggtaa tgccagtgaa 420

gttctgagtc tggcaggcga agcaagccgc ggccagggtg tggatggccg tgatagcgtg 480

gccgcagccg aagatggtgc acgccgcctg gcacaggcca gcggtgcagt tgttgcagtt 540

accggtgaag ttgacttcgt gaccgatggt cgtcgcggtg cccgcattga aggcggcagt 600

ccgtggatgc cgctgaatac cgcactgggc tgctctctga cctgtctgtg cggtgcctat 660

gcagcagttg gtgaagatgc cttcgatgca gcagtggcag ccctggcaca cttcgcagtg 720

gccggtcgct gggcacatga aggtgcagaa ggcccgggca gcttcgcccc tcgcttctta 780

gatgcactgc gtgccgtgac cccgcgtgcc ttagaagcag aagccgtgat tcgtggcgca 840

gaagttgtgt aa 852

<210> 393

<211> 261

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 393

Met Gln Glu Pro Leu Lys Lys Ile Lys Glu Thr Arg Pro Leu Ile His

1 5 10 15

His Ile Thr Asn Trp Val Thr Ile Tyr Asp Cys Ala Asn Ile Thr Arg

20 25 30

Thr Phe Gly Ala Leu Pro Val Met Ala His Ala Pro Glu Glu Cys Ala

35 40 45

Asp Met Thr Arg Ile Ser Ser Ala Leu Val Leu Asn Ile Gly Thr Leu

50 55 60

Thr Asn Glu Leu Ile Asp Ala Met Ile Leu Ser Ala Lys Ala Ala Asn

65 70 75 80

Glu Asn Lys Ile Pro Val Val Leu Asp Ala Val Gly Val Gly Ala Thr

85 90 95

Lys Phe Arg Asp Tyr Met Ala Ser Lys Ile Ile Asp Ser Val His Val

100 105 110

Asp Ile Ile Lys Gly Asn Tyr Ser Glu Ile Ala Lys Leu Ala Gly Glu

115 120 125

Lys Ala Gln Thr Lys Gly Val Glu Ala Thr Ser Ile Asn Ala Asp Pro

130 135 140

Arg Gln Ile Ala Arg Glu Leu Ala Ile Ser Lys Ser Cys Thr Ile Val

145 150 155 160

Met Thr Gly Lys Glu Asp Ile Ile Ser Asn Gly Lys Lys Ile Phe Val

165 170 175

Val Arg Asn Gly His Glu Leu Met Gly Ser Ile Val Gly Thr Gly Cys

180 185 190

Met Ala Ala Ser Val Ile Gly Ser Phe Ala Ala Val Asn Thr Asp His

195 200 205

Cys Asp Ala Ala Lys Asp Ala Leu Cys Tyr Phe Gly Ile Ala Gly Glu

210 215 220

Leu Ala Ala Glu Ile Ser Arg Gly Pro Gly Ser Phe Lys Val Asn Leu

225 230 235 240

Tyr Asp Glu Thr Phe Asp Leu Ser Asp Glu Arg Ala Glu Lys Met Met

245 250 255

Asn Phe Glu Glu Tyr

260

<210> 394

<211> 783

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 394

atgcaggaac ctctaaaaaa aataaaggaa acaagaccac tgatacacca tatcacaaat 60

tgggttacta tatatgattg cgcgaatatt acacgcacct ttggtgctct tcctgtaatg 120

gcccatgcac cagaggaatg cgcggatatg acacgcattt catctgctct tgtgcttaac 180

ataggcaccc tgacaaatga gctgatcgat gcgatgatac tttctgcgaa agccgcgaac 240

gagaataaga tacctgtcgt actcgatgca gttggcgtgg gcgctacgaa gttcagagat 300

tacatggcct caaagatcat cgattcagtt catgtcgata tcatcaaagg gaactattcc 360

gagatagcaa aacttgcagg cgaaaaagct cagacaaaag gtgtcgaggc aacttctatc 420

aacgctgatc ccagacagat agcaagagaa cttgcaatat ctaagtcctg cactatagtc 480

atgacgggaa aagaggacat aatcagcaat ggtaaaaaga tattcgttgt caggaacgga 540

catgagctaa tggggtccat tgtaggaaca ggatgcatgg ccgcttcagt tataggatct 600

ttcgctgctg tcaatacaga ccattgtgat gctgcaaaag atgctctctg ttattttggg 660

atagcaggag aacttgcagc tgagatatcg cgtggtcctg ggagcttcaa ggtaaattta 720

tatgacgaaa catttgatct ttctgatgaa agggcagaaa agatgatgaa cttcgaagag 780

tac 783

<210> 395

<211> 786

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 395

atgcaggaac cgctgaaaaa aattaaagaa accagaccgc tgattcatca tattaccaat 60

tgggtgacca tctatgattg cgccaatatt acccgcacct tcggtgccct gccggttatg 120

gcccatgccc cggaagaatg tgcagatatg acccgcatta gcagcgcact ggttctgaat 180

attggcaccc tgaccaatga actgattgat gcaatgattc tgagtgccaa agccgccaat 240

gaaaataaaa ttccggtggt tctggatgcc gttggcgttg gcgccaccaa attccgtgat 300

tatatggcaa gcaaaattat tgatagcgtt catgtggata tcattaaagg caattatagt 360

gaaatcgcaa agctggccgg cgaaaaagcc cagaccaaag gcgtggaagc caccagcatt 420

aatgccgatc cgcgccagat tgcccgcgaa ctggcaatta gtaaaagttg taccattgtg 480

atgaccggta aagaagatat tattagtaac ggcaaaaaga tattcgtggt tcgcaatggt 540

catgaactga tgggtagcat tgttggcacc ggttgtatgg ccgcaagtgt tattggtagc 600

ttcgccgcag ttaataccga tcattgcgat gccgccaaag atgcactgtg ctacttcggc 660

attgcaggcg aactggcagc agaaattagt cgtggcccgg gtagcttcaa agttaatctg 720

tatgatgaaa ccttcgatct gagcgatgaa cgcgccgaaa aaatgatgaa cttcgaagaa 780

tattaa 786

<210> 396

<211> 215

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 396

Met Asn Asp Thr Ala Asn Leu Thr Leu His Leu Gly Ala Leu Pro Val

1 5 10 15

Met Ala Gln Ala Ala Glu Glu Val Ala Ala Met Thr Arg Thr Ala Asp

20 25 30

Ala Leu Leu Leu Asn Met Gly Thr Leu Thr Pro Ala Ala Leu Asp Ala

35 40 45

Met Arg Leu Ala Gly Arg Glu Ala Asn Arg Cys Gly Val Pro Val Val

50 55 60

Leu Asp Pro Val Gly Ala Gly Ala Thr Pro Tyr Arg Thr Glu Ala Ala

65 70 75 80

Arg Gln Leu Leu Glu Asp Ile Asn Val Ala Ile Val Arg Gly Asn Ser

85 90 95

Gly Glu Val Ala Ala Ile Ile Gly Gln Gln Ala Val Val Arg Gly Val

100 105 110

Glu Ser Leu Glu Thr Ala Leu Pro Ala Ala Glu Leu Gly Ala Gln Ala

115 120 125

Ala Gln Gln Leu Gly Val Val Val Ala Leu Thr Gly Ala Arg Asp Ile

130 135 140

Ile Ser Asp Gly Ser Val Ser Leu Ala Val Asp His Gly Ser Pro Trp

145 150 155 160

Leu Lys Thr Ile Thr Gly Ser Gly Cys Met Ala Ser Ala Ala Val Ala

165 170 175

Cys Phe Ala Ala Val Ala Pro Ser Ser Leu Gln Ala Ala Ala Ala Ala

180 185 190

Leu Ala Ala Tyr Gly Leu Ala Ala Glu Leu Ala His Lys Pro Gln Ile

195 200 205

His Gly Pro Ala Ser Phe Lys

210 215

<210> 397

<211> 645

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 397

atgaacgaca cggcgaacct tacgctgcat ttgggcgctc tgcctgttat ggcccaggcc 60

gctgaggagg ttgccgctat gacccgcacc gccgatgcgc tgctcttaaa catgggtacc 120

ctgacgccag cggcgctaga cgccatgcgc cttgccgggc gagaagccaa tagatgcggc 180

gttcctgtgg tactagaccc tgtgggcgct ggcgcaacgc cttaccgtac ggaggcagcg 240

cggcagcttt tagaagacat caacgttgct attgtgcgtg ggaattccgg agaagtcgcc 300

gccatcattg gacagcaagc cgtggtgcgc ggcgtggaaa gccttgagac tgcgctgcct 360

gccgcggagc tcggggcgca ggcggcgcag cagctaggtg tggttgtggc cctaacaggt 420

gcgcgcgaca tcatcagcga cggcagcgta agcctagcgg tggaccacgg ctcgccttgg 480

ctcaagacga tcacgggcag cggttgcatg gcaagcgctg cggtcgcttg ttttgcggcg 540

gtagcaccta gctctttgca ggcggccgcg gcggcgcttg cagcttatgg gctagcggct 600

gagctagccc ataagccgca aattcacggg ccagcgtcgt ttaag 645

<210> 398

<211> 648

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 398

atgaacgata ccgcaaatct gaccctgcat ctgggcgcac tgccggtgat ggcacaggca 60

gcagaagaag tggccgccat gacccgtacc gcagatgccc tgctgctgaa tatgggtacc 120

ctgaccccgg ccgcactgga tgccatgcgc ctggcaggtc gtgaagccaa tcgttgcggt 180

gttccggtgg tgctggaccc tgtgggtgcc ggtgcaaccc cgtatcgtac cgaagcagca 240

cgccagctgc tggaagatat taatgttgcc attgttcgtg gtaatagcgg tgaagttgcc 300

gccattattg gtcagcaggc agtggttcgc ggcgtggaaa gcctggaaac cgccctgccg 360

gcagcagaac tgggtgcaca ggcagcccag cagctgggcg tggttgttgc cctgaccggt 420

gcccgcgata ttattagtga tggcagcgtt agcctggccg ttgatcatgg tagcccgtgg 480

ctgaaaacca ttaccggtag cggttgtatg gccagcgccg ccgtggcatg cttcgcagct 540

gttgccccga gcagtctgca agcagccgcc gcagcactgg cagcctatgg tctggcagca 600

gaattagcac ataaaccgca gattcatggc ccggcatcat tcaaataa 648

<210> 399

<211> 203

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 399

Met Ala Ala Gly Met Ala Pro Ala Met Val Asp Asn Pro His Glu Ala

1 5 10 15

Gly Asp Phe Ala Arg Val Ala Ser Gly Val Leu Val His Leu Gly Pro

20 25 30

Pro Gln Asp His Pro Val Ala Ala Met Lys Ala Ala Val Arg Ala Ala

35 40 45

Asp Glu Ala Gly Thr Pro Trp Val Leu Asp Pro Val Ala Ala Gly Gly

50 55 60

Leu Arg Trp Arg Thr Arg Val Ala Leu Glu Leu Leu Asp Ile Ser Arg

65 70 75 80

Pro Ala Ile Ile Arg Gly Asn Ala Ser Glu Ile Ala Gly Leu Ala Gly

85 90 95

Gly Ala Gly Gly Arg Gly Val Asp Ser Thr Thr Ser Pro Glu Glu Val

100 105 110

Leu Asp Leu Ala Arg Ala Leu Ala Gln Arg His Arg Cys Ala Val Ala

115 120 125

Val Ser Gly Pro Val Asp His Phe Val Asp Ala Glu Arg Val Val Thr

130 135 140

Leu Ala Asn Gly His Arg Trp Leu Thr Arg Ile Thr Gly Val Gly Cys

145 150 155 160

Ser Leu Gly Ala Leu Met Ala Gly Phe Ala Gly Val Thr Glu Asp Pro

165 170 175

Leu Val Ala Ala Ala Gly Ala Thr Ala Val Ile Thr Val Ala Ala Asp

180 185 190

Gln Ala Ala Gly Thr Thr Gly Leu Gly Gly Phe

195 200

<210> 400

<400> 400

000

<210> 401

<211> 612

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 401

atggccgcag gcatggcccc tgcaatggtg gataatccgc atgaagcagg tgacttcgcc 60

cgtgttgcaa gcggtgttct ggttcatctg ggcccgccgc aggatcatcc ggttgcagca 120

atgaaagcag cagtgcgtgc cgcagatgaa gccggtaccc cgtgggttct ggaccctgtg 180

gccgcaggtg gtctgcgctg gcgtacccgt gtggccctgg aactgctgga tattagccgc 240

ccggcaatta ttcgtggcaa tgcaagcgaa attgccggcc tggcaggtgg tgcaggcggc 300

cgtggtgttg atagtaccac cagtccggaa gaagtgctgg atctggcccg cgcactggca 360

cagcgtcatc gttgcgcagt tgcagttagc ggtccggttg atcacttcgt tgatgccgaa 420

cgcgttgtta ccctggccaa tggtcatcgc tggctgaccc gtattaccgg cgtgggttgc 480

agcctgggtg ccctgatggc aggcttcgca ggtgtgaccg aagatccgct ggttgcagca 540

gcaggcgcaa ccgcagttat taccgtggcc gcagatcagg cagcaggtac caccggcctg 600

ggtggcttct aa 612

<210> 402

<211> 299

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 402

Met Ser Ala Leu Arg Lys Ile Val Ala Lys Val Gly Thr Asn Val Leu

1 5 10 15

Ala Arg Glu Asp Gly Leu Leu Asp Ile Thr Ser Ile Ser His Leu Val

20 25 30

Asp Gln Ile Ala Ala Leu Lys Ala Gln Gly Val Glu Val Ile Leu Val

35 40 45

Ser Ser Gly Ala Val Gly Ala Gly Arg Ser Leu Phe Pro Val Pro Glu

50 55 60

Gly Ala Asn Lys Val Val Arg Arg Gln Val Leu Ser Ala Ile Gly Gln

65 70 75 80

Val Arg Leu Met Glu Ile Tyr Arg Gln Leu Phe Ala Asn His Gly Leu

85 90 95

Phe Cys Ala Gln Val Leu Ala Thr Lys Ala Asp Phe Gln Gly Lys Thr

100 105 110

His Tyr Thr Asn Met Lys Ser Cys Phe Gln Ala Leu Leu Arg Asp Lys

115 120 125

Val Val Pro Val Val Asn Glu Asn Asp Val Val Ser Val Asn Glu Leu

130 135 140

Met Phe Thr Asp Asn Asp Glu Leu Ala Gly Leu Val Ala Ala Met Thr

145 150 155 160

Asn Ala Gln Ala Leu Ile Ile Leu Ser Ser Val Asp Gly Val Leu Ser

165 170 175

Gly Pro Pro Gly Glu Pro Gly Ser Glu Val Ile Pro Glu Ile Asp Pro

180 185 190

Glu Asp Lys Gln Trp Leu Lys Leu Ile Leu Pro Ser Lys Ser Ser Phe

195 200 205

Gly Arg Gly Gly Met His Thr Lys Phe Arg Ile Ala Gln Lys Ala Ala

210 215 220

Lys Ala Gly Ile Thr Thr Tyr Ile Ala Asn Gly Arg Arg Pro Asn Ile

225 230 235 240

Leu Leu Asp Ile Leu Lys Gly Gln Phe Thr Gly Thr Arg Phe Pro Ala

245 250 255

Thr Gly Arg Leu Ser Asn Leu Lys Lys Arg Leu Ala Tyr Gly Glu Pro

260 265 270

Glu Ser Lys Ala Ser Val His Ile Asn Arg Gly Ala Glu Ala Ala Leu

275 280 285

Cys Ser Pro Asp Gln Ile Ser Ser Leu Leu Pro

290 295

<210> 403

<400> 403

000

<210> 404

<211> 906

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 404

atgagcgcac tgcgcaaaat tgtggccaaa gtgggcacca atgtgctggc acgcgaagat 60

ggcctgctgg atattaccag cattagtcat ctggttgatc agattgccgc actgaaagcc 120

cagggtgttg aagtgattct ggtgagcagt ggcgcagttg gtgccggtcg tagtctgttc 180

ccggttccgg aaggtgcaaa taaagttgtg cgtcgtcagg ttctgagtgc cattggtcag 240

gtgcgcctga tggaaatcta tcgccagctg ttcgccaatc atggtctgtt ctgcgcccag 300

gttctggcaa ccaaagcaga cttccagggt aaaacacatt ataccaatat gaaaagctgc 360

ttccaggcac tgctgcgtga taaagttgtt ccggtggtga atgaaaatga tgtggtgagc 420

gtgaatgaac tgatgttcac cgataatgat gaactggccg gcctggtggc cgccatgacc 480

aatgcccagg cactgattat tctgagcagt gttgatggcg ttctgagcgg cccgccgggt 540

gaacctggta gtgaagttat tccggaaatt gatccggaag ataaacagtg gctgaaactg 600

attctgccga gcaaaagtag cttcggccgc ggcggtatgc ataccaaatt ccgtattgcc 660

cagaaagccg ccaaagccgg cattaccacc tatattgcaa atggccgtcg tccgaatatt 720

ctgctggata tcctgaaagg ccagttcacc ggtacccgct tcccggcaac cggccgtctg 780

agtaatctga aaaaacgtct ggcatacggt gaaccggaaa gtaaagcaag cgttcatatt 840

aatcgcggcg cagaagccgc cctgtgcagt cctgatcaga ttagcagcct gctgccgtaa 900

ggatcc 906

<210> 405

<211> 218

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 405

Met Arg Gly Leu Gly Asp Val Tyr Lys Arg Gln Asn Ser Arg Ser Ile

1 5 10 15

Leu Leu Ser Glu Leu Ile Leu Leu Lys Leu Gly Gly Ser Val Ile Thr

20 25 30

Asp Lys Thr Arg Pro Phe Thr Ala Arg Thr Asp Val Ile Gln Arg Leu

35 40 45

Ala Gln Glu Ile Lys Ser Ala Leu Ala Glu Arg Gly Asp Asp Leu Arg

50 55 60

Leu Ile Ile Gly His Gly Ser Gly Ser Phe Gly His Glu Val Ala Asp

65 70 75 80

Lys Tyr Gln Thr His Lys Gly Gly Thr Ser Ala Glu Ser Trp Leu Gly

85 90 95

Phe Ala Glu Val Ala His Val Ala Ala Thr Leu Asn His Leu Val Val

100 105 110

Asn Ala Leu Arg Glu Val Gly Val Pro Ala Met Arg Phe Gln Pro Ser

115 120 125

Ala Ser Thr Arg Thr Arg Gly Glu Gln Leu Met Tyr Phe Glu Thr Phe

130 135 140

Pro Leu Lys Glu Ala Leu Ser His Gly Leu Val Pro Val Val Tyr Gly

145 150 155 160

Asp Val Ser Val Asp Ala Ala Gln Gly Met Ser Ile Val Ser Thr Glu

165 170 175

Leu Leu Phe Asp Asn Leu Ala Arg Glu Leu Ser Pro Ser Arg Ile Val

180 185 190

Leu Ala Gly Arg Val Asp Gly Val Tyr Glu Ala Asp Pro Asn Leu Asn

195 200 205

Pro Leu Ser Leu Ile His Ile Ser Glu Pro

210 215

<210> 406

<400> 406

000

<210> 407

<211> 663

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 407

atgcgcggtc tgggtgatgt gtataaacgt cagaatagcc gcagcattct gctgagtgaa 60

ctgattctgc tgaaactggg cggtagcgtt attaccgata aaaccagacc gttcaccgca 120

cgcaccgatg ttattcagcg tctggcacag gaaattaaaa gcgccctggc agaacgtggc 180

gatgatctgc gtctgattat tggccatggt agtggcagct tcggtcatga agttgcagat 240

aaatatcaga cccataaagg tggtaccagt gcagaaagtt ggctgggctt cgccgaagtg 300

gcacatgttg cagcaaccct gaatcatctg gttgtgaatg cactgcgtga agtgggcgtg 360

ccggccatgc gcttccagcc tagtgcaagc acccgtaccc gtggtgaaca gctgatgtac 420

ttcgaaacct tcccgctgaa agaagccctg agtcatggtc tggttccggt tgtgtatggc 480

gatgttagcg tggatgccgc ccagggcatg agtattgtga gcaccgaact gctgttcgat 540

aatctggcac gtgaactgag cccgagccgt attgttctgg caggccgtgt ggatggcgtg 600

tatgaagcag atccgaatct gaatccgctg agtctgattc atattagcga accgtaagga 660

tcc 663

<210> 408

<211> 239

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 408

Met Ala Gly Gly His Ile His His Leu Ala Lys Lys Tyr Asn Leu Thr

1 5 10 15

Thr Ser Cys Ala Glu Asn Pro Gly Lys Leu Ala Gln Ala Leu Asp Val

20 25 30

Gln Lys Thr Thr Lys Arg Leu Ser Asp Asp Ile Val Ala Leu Ala Gly

35 40 45

Lys Thr Asn Phe Ser Leu Ser Gln Ile Pro Thr Cys Lys Ile Val Thr

50 55 60

Asn Lys Asp Gly Lys Phe Leu Asn Ile Ala Thr Asp Gly Ile Gln Lys

65 70 75 80

Thr Leu Ala Thr Ala Gly Val Pro Val Leu Tyr Gly Asp Met Val Pro

85 90 95

Asp Glu Thr Phe Gly Leu Ser Ile Cys Ser Gly Asp Thr Leu Ile Thr

100 105 110

Glu Glu Ala Pro Leu Ile Gly Ala Thr Arg Val Ile Tyr Val Ser Asp

115 120 125

Ile Asp Gly Ile Tyr Thr Gly Asp Pro Tyr Gln Asn Glu Asp Ala Glu

130 135 140

Leu Ile Glu Lys Ile Ser Val Ala Glu Leu Ser Asn Asn His Ile Ser

145 150 155 160

Ile Gly Asn Ser His Asn Ile Asp Val Thr Gly Gly Leu Lys Asn Lys

165 170 175

Leu Glu Pro Val Ala Lys Leu Phe Leu Ser Thr Pro Ser Leu Thr Lys

180 185 190

Ile Glu Ile Cys Asn Gly Leu Lys Pro His Ile Leu Ser Ala Val Leu

195 200 205

Arg Gly Gln Ala Val Pro His Thr Ala Gly Ser Gln Pro Pro Gln Leu

210 215 220

Val Ile Arg Thr Thr Leu Met Ser Pro Val Val Leu Lys Ile Asn

225 230 235

<210> 409

<400> 409

000

<210> 410

<211> 726

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 410

atggccggtg gccatattca tcatctggca aaaaaatata acctgaccac cagctgtgcc 60

gaaaatccgg gtaaactggc ccaggccctg gatgttcaga aaaccaccaa acgtctgagc 120

gatgatattg tggcactggc cggtaaaacc aacttcagtc tgagtcagat tccgacctgc 180

aaaattgtga ccaataaaga tggtaaattc ctgaatatcg ccaccgatgg tattcagaaa 240

accttagcca ccgcaggcgt tccggtgctg tatggtgata tggttccgga tgaaaccttc 300

ggcctgagta tctgtagtgg tgataccctg attaccgaag aagccccgct gattggcgcc 360

acccgtgtta tctatgtgag tgatattgat ggtatctata ccggtgatcc gtatcagaat 420

gaagatgcag aactgattga aaaaatcagc gtggcagaac tgagtaataa tcatattagc 480

attggcaata gccataatat tgatgttacc ggcggcctga aaaataaact ggaaccggtg 540

gccaaactgt tcctgagtac cccgagcctg accaaaattg aaatctgtaa tggcctgaaa 600

ccgcatattc tgagcgccgt tctgcgtggc caggccgtgc ctcataccgc aggcagccag 660

ccgccgcagc tggttattcg caccaccctg atgagtccgg tggtgctgaa aattaattaa 720

ggatcc 726

<210> 411

<211> 370

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 411

Met Met Leu Gly Asn Ala Lys Arg Ile Val Ile Lys Val Gly Ser Ser

1 5 10 15

Leu Leu Ile Asp Ala Glu Asn Gln Leu Arg Gly Asn Phe Leu Ala Gln

20 25 30

Ile Ala Glu Ser Ile Ala Ala Leu Ile Ser Glu Gly Lys Gln Val Ile

35 40 45

Val Val Thr Ser Gly Ala Val Ala Leu Gly Arg Pro Ser Leu Gly Tyr

50 55 60

Gly Ala Arg Thr Leu Thr Leu Glu Glu Lys Gln Ala Ala Ala Ala Cys

65 70 75 80

Gly Gln Ile Thr Leu Phe Ser Met Trp Asp Lys Ala Phe Ser Ala Phe

85 90 95

Gln Leu Arg Pro Ala Gln Ile Leu Leu Thr Ala Asp Asp Ser Ile His

100 105 110

Arg Arg Arg Tyr Leu Asn Ala Lys Asn Thr Leu Asp Thr Leu Leu Glu

115 120 125

Asn Lys Ser Val Ile Pro Val Ile Asn Glu Asn Asp Thr Val Ala Thr

130 135 140

Ala Glu Leu Arg Phe Gly Asp Asn Asp Arg Leu Ala Ala Arg Val Ala

145 150 155 160

Gln Met Ala Glu Ala Asp Leu Leu Ile Ile Phe Ser Asp Ile Asp Gly

165 170 175

Leu Tyr Ser Glu Asn Pro Asn His Asn Pro Asp Ala Arg Phe Ile Asp

180 185 190

Glu Val Thr Glu Ile Thr Pro Glu Ile Glu Lys Met Ala Gly Gly Ala

195 200 205

Ala Ser Ser Val Ser Ser Gly Gly Met Val Thr Lys Ile Ala Ala Ala

210 215 220

Lys Ile Ala Thr Ala Ser Gly Cys His Val Ile Ile Ala Lys Gly Leu

225 230 235 240

Gly Glu His Pro Leu Arg Ala Leu Ile Gln Gly Gly Lys His Thr His

245 250 255

Phe Met Ala Lys Gly Thr Pro Arg Thr Ala Arg Lys Glu Trp Ile Ala

260 265 270

Gly Ser Leu His Ala Thr Gly Glu Ile Trp Val Asp Ala Gly Ala Val

275 280 285

Lys Ala Leu Gln Ser Gly Lys Ser Leu Leu Pro Ala Gly Val Thr Leu

290 295 300

Val Ile Gly Ser Phe Asp Arg Gly Asp Ala Val Asn Ile Ile Asp Ala

305 310 315 320

Ala Thr Thr Lys Val Ile Gly Lys Gly Leu Ile Ala Tyr Ala Ala Glu

325 330 335

Asp Ala Ala Arg Ile Ala Gly Lys Lys Ser Gln Glu Ile Glu Gln Ile

340 345 350

Leu Gly Phe Lys Arg Arg Asp Val Leu Ile His Arg Asp Asp Met Val

355 360 365

Leu Glu

370

<210> 412

<211> 1110

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 412

atgatgttag gcaacgcaaa acgcattgtt atcaaagttg gctcatcgct cttgattgac 60

gcggaaaacc agctgcgcgg caattttctg gcgcagatag cagaaagcat tgccgccctc 120

atcagcgaag gcaagcaggt gattgtggtg acatccggtg cggtggcgct tggccgccct 180

tcgttgggat atggcgcacg tacgcttacg ctcgaagaaa aacaggcggc cgctgcctgc 240

gggcagatca cgctattttc catgtgggat aaagcgttct ccgcgtttca gcttagacct 300

gcgcagatat tgcttacggc cgatgacagc atccatcgcc gccggtatct gaatgcaaaa 360

aatacactcg atacattgct tgaaaacaaa tccgtcatcc ccgttatcaa tgaaaatgac 420

acagtggcga cggcagaatt acgcttcggt gataatgacc ggctggctgc gcgcgtcgcg 480

caaatggcgg aagcggatct gctgattatt ttctcggata ttgatgggtt atactcagaa 540

aatcctaacc ataatcctga tgcccgcttt attgacgaag taaccgaaat cacacctgaa 600

atcgaaaaaa tggcaggcgg tgcggcatcc agcgtgtcat ccggcggaat ggtgacgaaa 660

attgctgcag ctaaaatcgc aactgcttct ggctgccatg tgattattgc aaaaggtctt 720

ggagagcatc ccctgcgtgc acttatacaa ggcggcaaac atacgcattt catggccaag 780

ggaacaccac gcacagcgcg caaggaatgg atcgcagggt cgctgcatgc aacgggtgaa 840

atttgggtcg atgcaggtgc agtaaaagca ttacaatcag gtaaaagttt gttgcctgca 900

ggcgtaacgc tggtcatagg aagttttgat cgtggagatg ctgtaaatat tattgatgca 960

gcaaccacca aagtgatcgg caaaggctta atcgcttatg cagcggaaga tgctgcgcgt 1020

attgccggca aaaaaagcca ggaaattgaa cagattcttg gttttaaacg tcgtgatgtg 1080

ctcattcacc gcgacgatat ggtactggaa 1110

<210> 413

<211> 1119

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 413

atgatgctgg gtaatgcaaa acgtattgtg attaaagtgg gtagcagcct gctgattgat 60

gccgaaaatc agctgcgcgg caacttcctg gcacagattg cagaaagtat tgccgcactg 120

attagcgaag gcaaacaggt tattgttgtt accagtggtg ccgtggcact gggtcgcccg 180

agcttaggtt atggcgcacg caccctgacc ctggaagaaa aacaggccgc agcagcatgt 240

ggccagatta ccctgttcag tatgtgggat aaagccttca gcgccttcca gctgcgcccg 300

gctcagattc tgctgaccgc agatgatagc attcatcgtc gccgttatct gaatgcaaaa 360

aataccctgg ataccctgct ggaaaataaa agtgttattc cggtgattaa cgaaaatgat 420

accgttgcaa ccgccgaact gcgcttcggt gataatgatc gtctggccgc ccgtgtggca 480

cagatggcag aagccgatct gctgattatc ttcagtgata ttgatggtct gtatagtgaa 540

aatccgaatc ataatccgga tgcccgcttc attgatgaag tgaccgaaat taccccggaa 600

attgaaaaaa tggccggtgg tgccgcaagc agtgttagta gcggtggtat ggttaccaaa 660

attgccgccg ccaaaattgc caccgccagt ggttgccatg ttattattgc aaaaggtctg 720

ggtgaacatc cgctgcgcgc actgattcag ggcggcaaac atacccactt catggccaaa 780

ggtaccccgc gcaccgcacg taaagaatgg attgcaggca gtctgcatgc aaccggtgaa 840

atctgggttg atgccggcgc agttaaagcc ctgcaaagcg gtaaaagtct gctgccggcc 900

ggcgttaccc tggttattgg tagcttcgat cgtggcgatg ccgtgaatat tattgatgca 960

gcaaccacca aagtgattgg taaaggtctg attgcctatg cagccgaaga tgccgcccgt 1020

attgccggta aaaaaagcca ggaaattgaa cagattctgg gcttcaaacg ccgtgatgtg 1080

ctgattcatc gcgatgatat ggttctggaa taaggatcc 1119

<210> 414

<211> 237

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 414

Met Ser Ser Leu Thr Ser Glu Ala Asp Gly Gln Leu Asp Pro Asn Arg

1 5 10 15

Ile Gln Ala Leu Val Asp Thr Leu Ala Ala Ala Arg Ser Ala Gly Arg

20 25 30

Glu Ile Val Leu Leu Gly Asp Val Tyr Lys Arg Gln Gly Ile Gly Pro

35 40 45

Leu Gly Leu Ser Arg Arg Pro Asn Asp Leu Pro Thr Gln Gln Ala Ala

50 55 60

Ala Ser Val Gly Gln Gly Leu Leu Val Ala His Tyr Thr Arg Arg Phe

65 70 75 80

His Glu Tyr Gly Trp Pro Val Gly Gln Val Leu Leu Thr Val Asp Asp

85 90 95

Val Thr Arg Gln Gln His Tyr Arg Asn Ala Tyr Arg Thr Phe Glu Lys

100 105 110

Leu Leu Gln Leu Gly Val Ile Pro Ile Val Asn Glu Asn Asp Thr Val

115 120 125

Ala Thr His Glu Ile Arg Phe Gly Asp Asn Asp Arg Leu Ala Ala Leu

130 135 140

Val Ala Gln Leu Val His Ala Asp Ala Leu Phe Leu Phe Ser Asp Val

145 150 155 160

Asp Ala Leu Tyr Thr Asp His Pro Ser Thr Pro Asp Ala Arg Arg Ile

165 170 175

Ala Leu Val Asn Ser Ser Ala Asp Leu Leu Gly Val Asp Thr Ser Arg

180 185 190

Thr Gly Ser Arg Val Gly Thr Gly Gly Met Thr Thr Lys Ile Gln Ala

195 200 205

Ala Gly Ile Ala Thr Ser Ala Gly Val Pro Val Arg Val Ala Ala Ala

210 215 220

Ala Asn Ala Ser Ala Ala Pro Ala Gly Gly Ala Val Ala

225 230 235

<210> 415

<400> 415

000

<210> 416

<211> 720

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 416

atgagcagtc tgaccagtga agccgatggt cagctggacc ctaatcgtat tcaggccctg 60

gtggataccc tggcagcagc acgcagcgcc ggtcgtgaaa ttgtgctgct gggtgatgtg 120

tataaacgcc agggtattgg tccgctgggc ctgagccgcc gtccgaatga tctgccgacc 180

cagcaggccg cagcaagtgt tggtcagggc ctgctggttg cacattatac ccgccgcttc 240

catgaatatg gctggccggt tggtcaggtt ctgctgaccg tggatgatgt tacccgccag 300

cagcattatc gtaatgcata tcgcaccttc gaaaaactgc tgcaactggg tgttattccg 360

attgtgaatg aaaatgatac cgtggcaacc catgaaattc gcttcggtga taatgatcgc 420

ctggccgcac tggttgcaca gctggttcat gcagatgcac tgttcctgtt cagcgatgtg 480

gatgccctgt ataccgatca tccgagcacc ccggatgcac gccgcattgc cctggtgaat 540

agcagcgcag acttactggg tgttgatacc agccgtaccg gtagccgcgt tggtaccggt 600

ggcatgacca ccaaaattca ggcagcaggc attgccacca gcgcaggtgt gccggttcgc 660

gttgcagccg cagccaatgc aagtgccgcc ccggctggtg gtgcagttgc ataaggatcc 720

<210> 417

<211> 299

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 417

Met Asp Gly Ile Arg Asp Gln Ser Ser Ser Arg Gly Gly Trp Arg Cys

1 5 10 15

Met Thr Asn Pro Ala Leu Thr Asp Asp Ala Pro Val Val Phe Leu Lys

20 25 30

Leu Gly Gly Ser Leu Ile Thr Asp Lys Thr Arg Pro Glu Thr Asp Arg

35 40 45

Pro Asp Ile Leu Ser Arg Leu Ala Gly Glu Leu Ala Gln Ala Arg Ala

50 55 60

Arg Ala Pro Arg Ile Arg Leu Leu Leu Gly His Gly Ser Gly Ser Phe

65 70 75 80

Gly His Ala Ala Ala Ala Arg His Gly Thr Arg Ala Gly Val Ala Gly

85 90 95

Pro Ala Gly Trp Leu Gly Phe Ala Glu Val Ala Asp Ala Ala Ala Arg

100 105 110

Leu Asn Arg Val Val Ala Ala Gln Met Leu Ala Ala Gly Leu Pro Lys

115 120 125

Arg Gln Val Gln Pro Ser Ala Gly Ala Leu Cys Arg Asp Gly Ser Leu

130 135 140

Thr Ala Trp Gln Ile Asp Ala Val Glu Gly Ala Leu Ala Arg Gly Leu

145 150 155 160

Ile Pro Leu Val Tyr Gly Asp Ala Val Leu Asp Thr Val Arg Gly Gly

165 170 175

Thr Ile Ala Ser Thr Glu Glu Leu Phe Gly Trp Leu Thr Pro Arg Leu

180 185 190

Gln Pro Val Arg Ile Val Leu Ala Gly Val Val Asp Gly Val Tyr Asp

195 200 205

Ala Asp Pro Leu Ser Asn Pro Arg Ala Ala Arg Ile Gly Glu Ile Thr

210 215 220

Pro Ala Thr Leu Pro Ser Leu Ala Arg Gln Leu Gly Gly Ser His Gly

225 230 235 240

Val Asp Val Thr Gly Gly Met Leu Ser Lys Val Thr Glu Met Cys Arg

245 250 255

Leu Val Ala Ala His Pro Arg Thr Glu Val Trp Leu Val Ser Gly Gln

260 265 270

Arg Ala Gly Ala Val Leu Gln Ala Leu Leu Gly Glu Asp Ala Gly Gly

275 280 285

Thr Arg Ile Ala Ala Glu Gly Lys Gly Ser Leu

290 295

<210> 418

<400> 418

000

<210> 419

<211> 906

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 419

atggatggta ttcgtgatca gagtagcagt cgcggtggtt ggcgctgcat gaccaatccg 60

gccctgaccg atgatgcccc ggttgtgttc ctgaaactgg gcggtagtct gattaccgat 120

aaaaccagac cggaaaccga tcgtccggat attctgagtc gtctggcagg cgaactggcc 180

caggcacgtg cacgcgcacc gagaattaga ctgctgctgg gtcatggtag cggtagcttc 240

ggtcatgcag ccgcagcacg ccatggtacc cgtgccggtg tggccggtcc ggcaggttgg 300

ttaggcttcg cagaagtggc agatgccgcc gcccgcctga atcgtgttgt tgcagcacag 360

atgctggcag caggcctgcc gaaacgtcag gttcagccga gtgccggtgc cctgtgtcgt 420

gatggtagcc tgaccgcctg gcagattgat gccgtggaag gcgcactggc acgcggtctg 480

attccgctgg tgtatggcga tgccgtgctg gataccgttc gcggcggcac cattgcaagt 540

accgaagaac tgttcggctg gctgaccccg cgcctgcaac cggttcgcat tgttctggcc 600

ggtgttgtgg atggcgtgta tgatgccgat ccgctgagta atccgcgtgc cgcacgcatt 660

ggtgaaatta ccccggccac cctgccgagc ctggcaagac agctgggcgg ttcacatggc 720

gttgatgtga ccggtggcat gctgagcaaa gttaccgaaa tgtgtcgtct ggttgcagca 780

catccgcgta ccgaagtgtg gctggttagc ggccagcgtg ccggtgccgt tctgcaagca 840

ctgctgggtg aagatgccgg tggcacccgt attgcagcag aaggtaaagg cagcctgtaa 900

ggatcc 906

<210> 420

<211> 534

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 420

Met Ser Asp Val Tyr Lys Arg Gln Pro Glu Leu Arg His Arg Arg His

1 5 10 15

Pro Gly Pro Asp Arg Gly Gly Leu Gly Gly Gly Gly Ala Gly Arg Pro

20 25 30

Leu Pro Arg Pro Tyr Arg Ala Leu Arg His Ala Asp Pro Pro Arg Arg

35 40 45

Arg His Gly Arg Ala Ser Arg Arg Gly Leu Ala Asp Gly Ala Arg Arg

50 55 60

Ala Arg Gly Leu Trp Pro Arg Ala Gly Gly Glu Ala Arg Asp Pro Leu

65 70 75 80

Pro Gln Gln Asp Arg Arg Pro Asp Pro Gly Gly Asp Arg Gly Ala Gln

85 90 95

Ala Pro Ala Arg Gly Gly Phe Gly Arg Ala Arg Ala Leu His Leu Gly

100 105 110

Arg Gly Glu Gly Gly Ala Gly Gly Gly Ala Ala Arg Gly Ala Gly Ser

115 120 125

Cys Arg Arg Pro Ala Cys Gly Arg Gly Gly Gly Arg Gly Ser Ala Ser

130 135 140

Glu Val Tyr Lys Ser Gln Ala Leu Leu Ala Arg Arg Arg Val Thr Ile

145 150 155 160

Lys Ile Gly Ser Ala Leu Leu Val Asp Gly Glu Gly Arg Ile Arg Arg

165 170 175

Ala Trp Leu Asp Gly Leu Ala Ala Asp Ile Gly Glu Leu Ala Arg Arg

180 185 190

Gly Ser Arg Val Ile Val Val Thr Ser Gly Ala Ile Ala Leu Gly Arg

195 200 205

Arg Ala Leu Gly Leu Pro Gln Arg Ala Leu Arg Leu Glu Glu Lys Gln

210 215 220

Ala Ala Ala Ala Ala Gly Gln Ile Leu Leu Ala Gly Ala Trp Ala Glu

225 230 235 240

Ser Leu Ala Gly His Gly Leu Ile Ala Ala Gln Leu Leu Val Thr Leu

245 250 255

Gly Asp Thr Glu Gly Arg Arg Arg Tyr Leu Asn Ala Arg Ala Thr Ile

260 265 270

Glu Thr Leu Leu Lys Leu Gly Ala Val Pro Val Val Asn Glu Asn Asp

275 280 285

Thr Val Ala Thr Thr Glu Ile Arg Tyr Gly Asp Asn Asp Arg Leu Ser

290 295 300

Ala Arg Val Ala Val Met Ser Gly Ala Glu Thr Leu Val Leu Leu Ser

305 310 315 320

Asp Val Asp Gly Leu Tyr Thr Ala Asp Pro Gly Arg Asp Pro Ala Ala

325 330 335

Arg His Ile Pro Glu Val Gly Ala Ile Thr Ala Glu Ile Glu Ala Met

340 345 350

Ala Thr Gly Ser Gly Ser Ala Val Gly Thr Gly Gly Met Ala Ser Lys

355 360 365

Leu Val Ala Ala Thr Ile Ala Thr Gln Ser Gly Cys Ala Val Leu Leu

370 375 380

Thr Ser Gly Lys Pro Asp Arg Pro Leu Glu Ala Leu Arg Ser Gly Ala

385 390 395 400

Arg Cys Thr Val Phe Ala Ala Arg Ser Thr Pro Arg Arg Ala Arg Lys

405 410 415

His Trp Leu Ala Ala Thr Leu Lys Pro Ala Gly Arg Leu Thr Val Asp

420 425 430

Asp Gly Ala Leu Ala Ala Leu Arg Arg Gly Ser Ser Leu Leu Pro Ala

435 440 445

Gly Val Ala Ala Val Glu Gly Arg Phe Glu Arg Gly Asp Ala Val Leu

450 455 460

Val Gln Asn Leu Gln Gly Thr Val Val Ala Lys Gly Leu Val Ala Tyr

465 470 475 480

Asp Ala Ala Asp Ala Glu Arg Leu Arg Gly Arg Arg Thr Ala Asp Ile

485 490 495

Glu Ala Leu Leu Gly Tyr Arg Gly Arg Asp Glu Met Ile His Arg Asp

500 505 510

Asp Leu Val Leu Val Gln Ala Pro Gly Glu Pro Ala Gly Glu Ala Ala

515 520 525

Val Gly Ala Gly Ala Pro

530

<210> 421

<400> 421

000

<210> 422

<211> 1611

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 422

atgagcgatg tgtataaacg tcagccggaa ctgcgccatc gtcgccatcc gggtccggat 60

cgcggtggtc tgggcggtgg tggtgccggt cgtcctctgc ctcgccctta tcgtgcactg 120

cgtcatgccg atccgccgcg ccgtcgtcat ggtcgtgcct cacgccgtgg tctggcagat 180

ggcgcacgtc gcgcccgtgg tctgtggcct cgtgcaggtg gcgaagcccg cgatccgctg 240

cctcagcagg atcgccgtcc ggaccctggc ggtgatcgcg gtgctcaggc ccctgctcgc 300

ggtggcttcg gtcgtgcacg cgcactgcat ctgggccgcg gtgaaggtgg cgccggtggt 360

ggtgctgccc gtggtgcagg tagctgtcgt cgcccggcat gcggccgtgg tggtggtaga 420

ggtagtgcaa gtgaagtgta taaaagtcag gcactgctgg cacgccgtcg cgttaccatt 480

aaaattggta gcgcactgct ggtggatggt gaaggtcgta ttcgccgcgc atggctggat 540

ggcctggcag cagatattgg tgaactggcc cgtcgtggca gccgtgttat tgtggttacc 600

agtggcgcaa ttgccctggg ccgccgtgcc ttaggcctgc ctcagcgtgc actgcgcctg 660

gaagaaaaac aggccgcagc agcagccggc cagattctgc tggccggcgc atgggccgaa 720

agtctggccg gtcatggcct gattgcagcc cagctgctgg tgaccctggg cgataccgaa 780

ggccgtcgtc gttatctgaa tgcacgcgca accattgaaa ccttactgaa actgggtgca 840

gtgccggttg tgaatgaaaa tgataccgtg gccaccaccg aaattcgcta tggtgataat 900

gatcgcctga gtgcacgcgt tgccgttatg agcggtgccg aaaccttagt gctgctgagc 960

gatgtggatg gcctgtatac cgccgatccg ggtcgtgatc cggcagcccg tcatattccg 1020

gaagttggtg ccattaccgc agaaattgaa gccatggcca ccggtagtgg tagcgccgtt 1080

ggtaccggtg gtatggccag taaactggtt gccgccacca ttgccaccca gagcggctgt 1140

gcagtgctgc tgaccagcgg taaaccggat cgcccgctgg aagccctgcg tagtggcgca 1200

cgttgtaccg tgttcgccgc acgtagcacc ccgcgccgtg ctagaaaaca ttggctggca 1260

gccaccctga aaccggccgg ccgtctgacc gtggatgatg gcgccctggc agcactgcgt 1320

cgcggttcaa gtctgctgcc ggcaggcgtg gcagccgttg aaggtcgctt cgaacgcggc 1380

gatgcagtgc tggtgcagaa tctgcaaggc accgttgttg ccaaaggtct ggtggcatac 1440

gatgccgccg atgccgaacg tctgcgcggt cgtcgtaccg ccgatattga agcactgctg 1500

ggttatcgcg gtcgcgatga aatgattcat cgcgatgatc tggttctggt tcaggcaccg 1560

ggcgaaccgg ccggtgaagc agcagtgggc gccggtgcac cgtaaggatc c 1611

<210> 423

<211> 267

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 423

Met Ala Asp Arg Lys Ile Ile Glu Ser Thr Leu Ala Arg Thr Asn Leu

1 5 10 15

Thr Asp His Asp Leu Ala Asn Val Ala Tyr Ser Pro Thr Ala Val Met

20 25 30

Pro Asp Val Arg Val Val Lys Ile Gly Gly Gln Ser Val Met Asp Arg

35 40 45

Gly Arg Ala Ala Leu Phe Pro Ile Leu Asp Glu Leu Val Ala Ala Arg

50 55 60

Lys Glu Gly Ile Ala Val Val Val Leu Val Gly Gly Gly Thr Arg Ala

65 70 75 80

Arg His Ile Tyr Ser Ile Ala Ser Glu Leu Glu Met Pro Val Gly Val

85 90 95

Met Ala Thr Leu Gly Lys Tyr Ile Pro Met Gln Asn Ala Arg Met Val

100 105 110

Gln Met Leu Leu Ala Lys His Gly Gly Leu Tyr Ile Leu Pro Asp Asp

115 120 125

Phe Glu Lys Leu Pro Leu Tyr Leu Gln Leu Gly Cys Leu Pro Val Met

130 135 140

Ser Gly Met Pro Pro Phe Gly Tyr Trp Glu Lys Arg Glu Glu Gly Ser

145 150 155 160

Arg Ile Pro Pro His Arg Thr Asp Ala Gly Val Phe Leu Ser Ala Glu

165 170 175

Phe Leu Gly Ala Arg Arg Ala Ile Phe Ile Lys Asp Glu Asp Gly Leu

180 185 190

Tyr Glu Asp Asp Pro Lys Lys Asn Pro Ala Ala Lys His Ile Pro Arg

195 200 205

Ile Thr Ala Lys Glu Leu Glu Ala Arg Gly Leu Pro Asp Leu Val Val

210 215 220

Glu Arg Val Val Val Glu Tyr Leu Pro Arg Ala Arg Trp Cys Lys Gln

225 230 235 240

Leu Gln Ile Val Asn Gly Leu Lys Lys Gly Gln Val Leu Ala Ala Leu

245 250 255

Lys Gly Glu Asp Val Gly Thr Ile Ile Ser Ala

260 265

<210> 424

<400> 424

000

<210> 425

<211> 804

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 425

atggccgatc gtaaaattat tgaaagcacc ctggcacgca ccaatctgac cgatcatgat 60

ctggccaatg tggcatatag tccgaccgca gttatgccgg atgttcgcgt ggttaaaatt 120

ggcggtcaga gcgttatgga tcgtggccgt gccgccctgt tcccgattct ggatgaactg 180

gttgccgccc gcaaagaagg tattgccgtg gttgtgctgg tgggtggtgg cacccgtgcc 240

cgtcatatct atagcattgc aagtgaactg gaaatgccgg tgggtgtgat ggccaccctg 300

ggcaaatata ttccgatgca gaatgcacgc atggttcaga tgctgctggc aaaacatggc 360

ggtctgtata ttctgccgga tgacttcgaa aaactgccgc tgtatctgca actgggctgc 420

ctgccggtta tgagtggtat gccgccgttc ggttattggg aaaaacgcga agaaggcagt 480

cgcattccgc cgcatcgcac cgatgcaggt gtgttcctga gtgccgagtt cctgggcgca 540

cgccgcgcaa tcttcattaa agatgaagat ggtctgtatg aagatgatcc gaaaaaaaat 600

ccggccgcaa aacatattcc gcgcattacc gcaaaagaac tggaagcacg tggtctgccg 660

gatctggttg ttgaacgcgt tgtggttgaa tatctgccgc gcgcacgctg gtgtaaacag 720

ctgcaaattg tgaatggtct gaaaaaaggc caggttctgg cagccctgaa aggtgaagat 780

gttggtacca ttattagcgc ctaa 804

<210> 426

<211> 263

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 426

Met Ser Asp Leu Thr Phe Leu Lys Leu Gly Gly Ser Leu Leu Thr Asp

1 5 10 15

Lys Pro Glu Arg Glu Ala Leu Arg Ala Asp Val Leu Ala Arg Leu Thr

20 25 30

Asn Glu Ile Ala Ala Ala Arg Tyr Ala Arg Pro Asp Met Lys Leu Val

35 40 45

Met Gly His Gly Ser Gly Ser Phe Gly His Thr Ala Ala Ala Arg His

50 55 60

Gly Thr Arg Ser Gly Val Ser Gly Pro Glu Gln Trp Arg Gly Phe Ala

65 70 75 80

Glu Val Ser Asp Ala Ala Ala Arg Leu Asn Arg Ala Val Ile Ala Ala

85 90 95

Leu Leu Ser Ala Gly Val Pro Ala Val Gly Leu Pro Pro Ser Ala Ser

100 105 110

Ala Val Val Thr Asp Gly Val Ile Gln Ala Met Ala Thr Ala Pro Ile

115 120 125

Arg Ala Ala Leu Glu Ala Gly Leu Leu Pro Val Val Phe Gly Asp Val

130 135 140

Ala Phe Asp Thr Val Arg Gly Gly Thr Ile Val Ser Thr Glu Glu Val

145 150 155 160

Met Asp Tyr Leu Ala Leu Pro Met Arg Pro Ala Arg Leu Leu Leu Ala

165 170 175

Gly Glu Thr Ala Gly Val Leu Asp Thr Thr Gly Gln Val Val Pro His

180 185 190

Ile Ser Pro Ala Asn Tyr Glu Thr Ile Arg Pro Ala Leu Gly Gly Ser

195 200 205

Arg Gly Ala Asp Val Thr Gly Gly Met Ser Ser Lys Val Ser Ala Met

210 215 220

Leu Asp Leu Ala Ala Lys Ile Pro Gly Leu Thr Ile His Ile Phe Ser

225 230 235 240

Gly Leu Glu Pro Gly Leu Leu Glu Gln Leu Leu Ile Ser Pro Ser Leu

245 250 255

Ser Ser Gly Thr Arg Ile Gly

260

<210> 427

<400> 427

000

<210> 428

<211> 792

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 428

atgagcgatc tgaccttcct gaaactgggc ggtagcctgc tgaccgataa accggaacgt 60

gaagcactgc gcgcagatgt tctggcccgt ctgaccaatg aaattgcagc agcacgttat 120

gcacgtccgg atatgaaact ggttatgggt catggcagcg gtagcttcgg tcataccgca 180

gccgcccgcc atggtacccg tagcggtgtg agcggtccgg aacagtggcg tggcttcgca 240

gaagtgagcg atgccgccgc acgtctgaat cgcgccgtta ttgcagccct gctgagtgcc 300

ggcgttccgg ctgttggcct gccgcctagt gccagcgcag tggttaccga tggtgttatt 360

caggcaatgg ccaccgcccc gattcgtgcc gcactggaag ccggtctgct gccggtggtg 420

ttcggcgatg ttgccttcga taccgtgcgt ggcggtacca ttgtgagcac cgaagaagtg 480

atggattatc tggccctgcc gatgcgcccg gcccgtctgt tactggcagg cgaaaccgca 540

ggcgtgctgg ataccaccgg tcaggttgtg ccgcatatta gcccggcaaa ttatgaaacc 600

attcgcccgg ccctgggcgg cagtcgtggt gcagatgtta ccggcggtat gagtagcaaa 660

gtgagcgcaa tgctggatct ggcagccaaa attccgggtc tgaccattca tatcttcagc 720

ggcctggaac cgggcctgct ggaacagctg ctgattagcc cgagtctgag cagcggtacc 780

cgtattggct aa 792

<210> 429

<211> 182

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 429

Met Glu Ile Arg Gly Thr Leu Glu Glu Asn Pro Asp Ile Arg Leu Ile

1 5 10 15

Ile Ile His Gly Ala Gly Ala Gly Gly His Gln Leu Ala Lys Lys Tyr

20 25 30

Arg Leu Thr Glu Asn Leu Gly Asn Asp Pro Glu Arg Trp Thr Gly Ala

35 40 45

Phe Leu Thr Arg Gln Ala Asn Gln Leu Leu Asn Leu Glu Leu Phe Lys

50 55 60

Ile Phe Ser Lys Ala Asn Leu Arg Val Val Pro Ile His Thr Ala Ser

65 70 75 80

Ile Ile Thr Gln Arg Gln Lys Glu Ile Ala Ser Cys Ser Phe Glu Ser

85 90 95

Ile Asn Gln Thr Leu Ala His Asn Cys Ile Pro Leu Leu Tyr Gly Glu

100 105 110

Leu Val Phe Asp Glu Thr Leu Gly Met Ser Ile Leu Ser Gly Asp Thr

115 120 125

Ser Ala Phe Ile Leu Ala Glu Lys Tyr Gln Ala Glu Arg Val Leu Phe

130 135 140

Ala Ser Asp Ile Asp Gly Ile Phe Asn Lys Asp Pro His Lys Asn Lys

145 150 155 160

Asp Ala Lys Leu Ile Gln Val Thr Thr Leu Lys Glu Leu Leu Glu Asn

165 170 175

Lys Asn Val Ser Leu Ser

180

<210> 430

<211> 546

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 430

atggaaatac gcggcactct cgaagagaat cccgatatac gtctcattat aattcacggt 60

gccggtgccg gcgggcatca gcttgccaag aaatatcgcc tcacggaaaa cctcgggaat 120

gatcccgagc gatggaccgg cgcctttctc accagacaag ccaatcagtt actcaatctc 180

gaattgttca agatattctc aaaagcaaac cttcgagtcg ttccaattca cactgcatcc 240

attattactc aacgacagaa agaaatagcg tcttgttctt tcgaatccat caatcagacg 300

ctcgcacaca attgcattcc acttctctat ggcgaacttg tgttcgacga gacacttggc 360

atgtccatac tctccggaga caccagcgct ttcatcttgg cagaaaaata tcaagctgaa 420

cgggttttgt ttgcatcaga catagacggc atcttcaaca aagaccccca caaaaacaaa 480

gacgcaaaac tcatacaagt tactacactc aaagagttgc tggaaaacaa aaacgtctca 540

ctttcc 546

<210> 431

<211> 549

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 431

atggaaatcc gtggtaccct ggaagaaaat ccggatattc gcctgattat tattcatggc 60

gcaggcgcag gtggtcatca gctggccaaa aaatatcgcc tgaccgaaaa tctgggtaat 120

gatccggaac gctggaccgg cgcattcctg acccgtcagg caaatcagct gctgaatctg 180

gaactgttca aaatcttcag taaagcaaat ctgcgtgtgg ttccgattca taccgcaagc 240

attattaccc agcgtcagaa agaaattgcc agctgctcat tcgaaagtat taatcagacc 300

ctggcacata attgcattcc gctgctgtat ggcgaactgg tgttcgatga aaccttaggc 360

atgagtattc tgagcggcga taccagtgcc ttcattctgg cagaaaaata tcaggcagaa 420

cgtgttctgt tcgcaagcga tattgatggc atcttcaata aagatccgca taaaaataag 480

gacgcaaaac tgattcaggt taccaccctg aaagaactgc tggaaaataa aaatgtgagt 540

ctgagctaa 549

<210> 432

<211> 241

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 432

Met Ser Glu Arg Leu Lys Asn Ser Lys Arg Ile Val Ile Lys Ala Gly

1 5 10 15

Thr Ser Ile Leu Thr Gly Lys Asp Gly Arg Phe Ser Pro Ala His Leu

20 25 30

Ala Arg Leu Cys Asp Gln Ile Leu Ala Leu Val Asn Lys Lys Lys Glu

35 40 45

Val Val Leu Val Ser Ser Gly Ala Ile Gly Leu Gly Met Glu Val Thr

50 55 60

Ser Phe Lys Lys Arg Pro Lys Lys Met Ala Gln Leu Gln Ala Cys Ala

65 70 75 80

Ala Ile Gly Gln Gly Lys Leu Met His Ala Tyr Glu Gln Phe Phe Ser

85 90 95

Lys Arg Gly Ile His Thr Ala Gln Ile Leu Leu Thr Arg Asp Gly Leu

100 105 110

Glu Asp Arg Glu Arg Phe Leu Arg Ala Ser Gly Ala Val Ala Glu Ile

115 120 125

Leu Lys Met Lys Val Leu Pro Ile Val Asn Glu Asn Asp Thr Val Ser

130 135 140

Thr Glu Glu Ile Ala Phe Gly Asp Asn Asp Arg Leu Ser Val His Val

145 150 155 160

Ser His Leu Val Asp Ala Asp Leu Leu Ile Leu Leu Ser Asp Val Asp

165 170 175

Gly Phe Tyr Leu Asn Asp Gly Ser Arg Ile Arg Leu Val Ser Ser Ile

180 185 190

Arg Glu Ile Arg Glu Glu Leu Val Lys His Val Lys Asp Ser Arg Lys

195 200 205

Glu Lys Thr Val Gly Gly Met Ser Ala Lys Leu Lys Ala Ala Thr Thr

210 215 220

Ala Met Asn Leu Gly Ile Pro Met Leu Ile Val Asn Gly His Glu Pro

225 230 235 240

Gly

<210> 433

<400> 433

000

<210> 434

<211> 726

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 434

atgagcgaac gcctgaaaaa tagcaaacgt attgttatta aggccggcac cagcattctg 60

accggcaaag atggtcgctt cagtccggcc catctggccc gtctgtgtga tcagattctg 120

gcactggtta ataaaaaaaa agaggtggtt ctggtgagta gtggcgcaat tggtctgggc 180

atggaagtga ccagcttcaa aaaacgtccg aaaaaaatgg cacagctgca agcctgcgcc 240

gccattggtc agggcaaact gatgcatgca tacgaacagt tcttcagtaa acgtggtatt 300

cataccgcac agattctgct gacccgtgat ggtctggaag atcgtgaacg cttcctgcgt 360

gcaagcggtg ccgtggcaga aattctgaaa atgaaagttc tgccgattgt gaatgaaaat 420

gataccgtta gcaccgaaga aattgccttc ggcgataatg atcgcctgag cgtgcatgtg 480

agtcatctgg ttgatgccga tctgctgatt ctgctgagtg atgtggatgg cttctatctg 540

aatgatggca gtcgtattcg cctggttagc agcattcgcg aaattcgtga agaactggtt 600

aaacatgtta aagatagccg caaagaaaaa accgtgggtg gtatgagtgc aaaactgaaa 660

gccgcaacca ccgcaatgaa tctgggcatt ccgatgctga ttgttaatgg tcatgaaccg 720

ggctaa 726

<210> 435

<211> 289

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 435

Met Lys Thr Leu Leu Trp Leu Asn Arg Ala Met Lys Glu Leu Val Leu

1 5 10 15

Leu Lys Leu Gly Gly Ser Leu Ile Thr Asp Lys Thr Gln Pro Phe Thr

20 25 30

Pro Arg Leu Asp Val Met Asp Asp Leu Ala Leu Gln Ile Lys Thr Ala

35 40 45

Leu Gln Ile Arg Val Asp Leu Gln Leu Val Leu Gly His Gly Ser Gly

50 55 60

Ser Phe Gly His Val Pro Ala Ser Glu Tyr Arg Thr Arg Asp Gly Leu

65 70 75 80

Pro Pro Arg Ala Thr Pro Leu Ala His Arg Glu Arg Asp Ala Thr Glu

85 90 95

Glu Asn Tyr Trp Arg Gly Phe Ala Glu Val Trp Tyr Gln Ala Ser Ala

100 105 110

Leu Asn Arg Phe Val Met Glu Ala Leu His Arg Ala Asp Val Pro Ser

115 120 125

Ile Ala Leu Ser Pro Ala Ala Ser Val Ile Ala Ser Asn Gly Gln Val

130 135 140

Ser Val Trp Glu Thr Thr Pro Leu Arg Met Ala Leu Ser Ala Gly Ile

145 150 155 160

Val Pro Val Val Tyr Gly Asp Val Val Cys Asp Glu Val Arg Gly Gly

165 170 175

Thr Ile Leu Ser Thr Glu Asp Leu Phe Ser His Leu Thr Arg Ala Leu

180 185 190

Asn Pro Asp Arg Ile Leu Leu Ala Gly Leu Glu Ala Ala Val Trp Glu

195 200 205

Asp Phe Pro Thr Arg Thr Lys Lys Ile Glu Arg Ile Thr Pro Ala Ser

210 215 220

Phe Arg Glu Val Ser Ser Gly Val Gly Lys Ala Ala Gly Ala Asp Val

225 230 235 240

Thr Gly Gly Met Glu Ser Lys Val Arg Gln Met Leu Glu Leu Val Gln

245 250 255

Lys Val Pro Gly Leu Thr Ile Gln Val Phe Ser Gly Glu Glu Pro Gly

260 265 270

Asn Leu Val Arg Ala Leu Gly Gly Glu Thr Leu Gly Thr Leu Ile Thr

275 280 285

Ala

<210> 436

<400> 436

000

<210> 437

<211> 876

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 437

atgaagaccc tgctgtggct gaatcgtgca atgaaagaac tggtgctgct gaaactgggt 60

ggcagcctga ttaccgataa aacacaaccg ttcaccccgc gtctggatgt gatggatgat 120

ctggcactgc aaattaaaac cgcactgcaa atccgtgtgg atctgcaact ggttctgggc 180

catggcagtg gcagcttcgg tcatgtgccg gcaagcgaat atcgtacccg tgatggtctg 240

ccgccgcgcg caacccctct ggcacatcgt gaacgcgatg caaccgaaga aaattattgg 300

cgtggcttcg ccgaagtgtg gtatcaggca agcgcactga atcgcttcgt gatggaagca 360

ctgcatcgcg ccgatgttcc gagcattgcc ctgagtccgg ccgcaagcgt tattgcaagc 420

aatggtcagg tgagcgtgtg ggaaaccacc ccgctgcgta tggcactgag cgcaggtatt 480

gttccggttg tgtatggcga tgttgtgtgt gatgaagttc gcggtggtac cattctgagc 540

accgaagact tattcagcca tctgacccgt gcactgaatc cggatcgcat tctgctggcc 600

ggtctggaag cagcagtgtg ggaagacttc ccgacccgta ccaaaaaaat tgaacgtatt 660

accccggcca gcttccgcga agtgagcagt ggcgttggca aagccgcagg tgcagatgtt 720

accggtggta tggaaagtaa agtgcgccag atgctggaac tggtgcagaa agtgccgggc 780

ctgaccattc aggtgttcag tggcgaagaa ccgggtaatc tggtgcgcgc actgggcggc 840

gaaaccttag gcaccctgat taccgcctaa ggatcc 876

<210> 438

<211> 295

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 438

Met Glu Asp Ile Ala Asp Leu Phe Lys Ser Gly Arg Glu Val Leu Ile

1 5 10 15

Val Ser Ser Gly Ala Val Gly Leu Gly Val Lys Glu Leu Ala Leu Asp

20 25 30

Lys Arg Pro Ala Asp Leu Pro Thr Thr Gln Ala Cys Ala Ala Val Gly

35 40 45

Gln Gly Ile Leu Gln Ser Met Tyr Ala Asp Ala Phe Lys Arg Leu Gly

50 55 60

Val Lys Thr Ala Gln Val Leu Leu Cys Glu Glu Asp Phe Thr Asn Arg

65 70 75 80

Lys Lys Tyr Leu Asn Leu Arg Ser Thr Ile Ala Arg Leu Leu Glu Leu

85 90 95

Gly Val Ile Pro Ile Ile Asn Glu Asn Asp Thr Val Ser Thr Ser Glu

100 105 110

Ile Glu Ser Ser Ala Thr Ala Ser Gly Arg Lys Val Asn Phe Gly Asp

115 120 125

Asn Asp Lys Leu Ser Ala Leu Val Ala Ser Lys Val Asp Ala Asp Met

130 135 140

Leu Leu Ile Leu Thr Asp Val Asn Gly Leu Tyr Ser Asp Asp Pro Asn

145 150 155 160

Thr Cys Pro Asp Ala Glu Leu Ile Asp Thr Val Ala Asp Leu Ala Pro

165 170 175

Tyr Gln Ile Pro Lys Thr Glu Lys Lys Val Asn Gly Lys Lys Gly Ala

180 185 190

His Gln Gly Gly Arg Gly Gly Ile Arg Ser Lys Leu Glu Ala Ala Ala

195 200 205

Val Val Thr Gln Ser Gly Leu Pro Cys Val Ile Ala Gly Gly Arg Asn

210 215 220

His Lys Val Ile Glu Arg Leu Phe Asn Gly Glu Ser Leu Gly Thr Ile

225 230 235 240

Phe Leu Pro Gly Ala Ala Met Ala Gly Lys Ser Arg Trp Ile Ala Phe

245 250 255

Ala Thr Thr Ile Asn Gly Ser Val Thr Val Asn Gln Gly Ala Arg Asp

260 265 270

Ala Leu Val Lys Lys Lys Ala Ser Leu Leu Pro Ala Gly Ile Val Lys

275 280 285

Val Asp Gly Ser Phe Ala Arg

290 295

<210> 439

<400> 439

000

<210> 440

<211> 894

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 440

atggaagata tcgccgatct gttcaaaagt ggccgtgaag ttctgattgt gagtagtggc 60

gcagttggtc tgggcgttaa agaactggcc ctggataaac gtccggcaga cttaccgacc 120

acccaggcct gcgcagcagt gggtcagggt attctgcaaa gcatgtatgc cgatgcattc 180

aaacgtctgg gtgtgaaaac cgcccaggtt ctgctgtgtg aagaagactt caccaatcgt 240

aaaaaatatc tgaatctgcg cagcaccatt gcacgtctgc tggaactggg tgttattccg 300

attattaatg aaaatgacac cgtgagcacc agcgaaattg aaagtagcgc aaccgcaagt 360

ggccgcaaag ttaacttcgg cgataatgat aaactgagtg cactggtggc aagtaaagtt 420

gatgcagata tgctgctgat tctgaccgat gttaatggcc tgtatagtga tgatccgaat 480

acctgtccgg atgccgaact gattgatacc gttgccgatc tggccccgta tcagattccg 540

aaaaccgaaa aaaaagtgaa tggtaaaaag ggcgcccatc agggcggccg cggtggtatt 600

cgcagcaaac tggaagcagc agcagttgtg acccagagcg gcctgccgtg cgtgattgcc 660

ggtggccgta atcataaagt gattgaacgt ctgttcaatg gtgaaagcct gggcaccatc 720

ttcctgccgg gcgcagcaat ggccggcaaa agccgttgga ttgcattcgc caccaccatt 780

aatggtagtg ttaccgtgaa tcagggcgca cgcgatgccc tggttaaaaa aaaagcaagc 840

ctgctgccgg ccggcattgt gaaagttgat ggcagcttcg cccgctaagg atcc 894

<210> 441

<211> 227

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 441

Met Glu Asp Lys Ile Val Ile Ser Leu Gly Gly Ser Leu Ile Val Pro

1 5 10 15

Glu Glu Ile Asp Val Glu Phe Leu Lys Ser Phe Lys Glu Leu Ile Ile

20 25 30

Gly Glu Ile Ala Lys Gly Lys Lys Phe Ile Leu Ile Thr Gly Gly Gly

35 40 45

Arg Val Cys Arg Lys Tyr Gln Asn Val Ala Lys Asp Ile Ser Asn Pro

50 55 60

Asn His Glu Asp Leu Asp Trp Ile Gly Ile Ala Ser Leu Lys Leu Asn

65 70 75 80

Ala Glu Leu Leu Arg Val Ile Phe Lys Asp His Ala Tyr Asn Arg Val

85 90 95

Val Glu Asn Leu Ser Leu Pro Phe Pro Phe Glu Asp Ser Ile Val Ile

100 105 110

Gly Ser Ala Tyr Glu Pro Gly His Ser Thr Asp Tyr Asp Ala Val Leu

115 120 125

Gly Ala Gln Ser Ile Gly Ala Lys Thr Ile Ile Asn Leu Ser Asn Thr

130 135 140

Asp Tyr Val Tyr Asp Ser Asp Pro Lys Thr Asn Pro Asp Ala Lys Lys

145 150 155 160

Ile Glu Thr Ile Thr Trp Asp Glu Tyr Gln Lys Ile Ile Pro Ala Glu

165 170 175

Trp His Pro Gly Leu Ser Thr Pro Phe Asp Pro Thr Ala Ser Val Leu

180 185 190

Ala Lys Gln Glu Gly Ile Thr Val Ile Ser Met Asn Gly Lys Pro Ile

195 200 205

Ser Asn Leu Ala Asn Cys Leu Asn Gly Glu Asn Phe Ile Gly Thr Thr

210 215 220

Ile Lys Pro

225

<210> 442

<211> 681

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 442

atggaagaca aaatagtaat ttccctaggg ggttcattaa tagtgccaga agagattgat 60

gttgagtttc taaagtcttt taaagaattg attattgggg aaattgctaa aggcaagaaa 120

tttattttaa taactggagg tggtagagtt tgcagaaagt atcagaatgt tgctaaggat 180

atttctaatc caaaccatga agatctggat tggataggta ttgcatcttt aaaattaaac 240

gcagaacttt tgcgagttat ttttaaagac catgcttata atagagttgt tgagaattta 300

tcgctacctt ttccctttga agattcaata gtgattggat ctgcttatga accaggacac 360

agtactgatt atgatgccgt acttggggct caaagtattg gagcgaaaac tataattaat 420

ttatctaata ctgattacgt atatgattct gaccctaaga ctaatcctga tgctaaaaaa 480

atagaaacta taacctggga cgaatatcaa aagattattc ccgcagagtg gcaccccgga 540

cttagcactc catttgatcc cactgcgtct gttttagcca aacaggaagg cattacagtg 600

attagtatga acggtaaacc aatttccaat ttagctaatt gtttaaatgg agaaaatttc 660

atcggcacaa ccattaaacc a 681

<210> 443

<211> 690

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 443

atggaagata agatcgttat cagtctgggt ggtagtctga ttgtgccgga agaaattgat 60

gtggagttcc tgaaatcatt caaagaactg attatcggtg aaattgccaa aggcaaaaaa 120

ttcattctga ttaccggcgg tggtcgcgtg tgtcgtaaat atcagaatgt tgcaaaagat 180

atcagcaatc cgaatcatga agacttagat tggattggca ttgcaagcct gaaactgaat 240

gccgaactgc tgcgcgtgat cttcaaagat catgcctata atcgtgtggt tgaaaatctg 300

agcctgccgt tcccgttcga agatagtatt gtgattggca gtgcatacga accgggccat 360

agtaccgatt atgatgccgt tctgggcgca cagagtattg gtgccaaaac cattattaat 420

ctgagtaata ccgactatgt gtatgatagc gatccgaaaa ccaatccgga tgccaaaaaa 480

attgaaacca ttacctggga tgaatatcag aaaattatcc cggccgaatg gcatccgggc 540

ctgagcaccc cgttcgatcc gaccgccagt gtgctggcaa aacaggaagg cattaccgtg 600

attagcatga atggtaaacc gattagtaat ctggcaaatt gcctgaatgg tgaaaacttc 660

attggtacca ccattaaacc gtaaggatcc 690

<210> 444

<211> 368

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 444

Met Thr Asp Ser Pro Arg Lys Arg Ile Val Val Lys Val Gly Ser Ala

1 5 10 15

Leu Ile Ala Pro His Lys Gln Gly Cys Ser Ser His Tyr Leu Leu Gly

20 25 30

Ile Ala Gln Phe Ile Thr Tyr Cys Arg Val Gln Gly Ile Gln Val Val

35 40 45

Leu Val Ser Ser Gly Ser Val Ala Ala Gly Trp His His Phe Glu Gly

50 55 60

Gln Ala Gln Pro Ser Val Thr Val Lys Lys Ala Met Ala Ala Ala Gly

65 70 75 80

Gln Ala Asp Met Met Ala Thr Trp Asn Lys Leu Phe Asp Phe Pro Thr

85 90 95

Ala Gln Leu Leu Leu Thr His Gly Asp Leu Arg Asn Arg Glu Arg Tyr

100 105 110

Ile Ser Ile Arg Asp Thr Ile Phe Ser Leu Leu Glu His Gly Leu Met

115 120 125

Pro Ile Ile Asn Glu Asn Asp Ala Val Thr Ala Asp Lys Leu Lys Val

130 135 140

Gly Asp Asn Asp Asn Leu Ser Ala Met Val Ala Ala Ala Ala Asp Ala

145 150 155 160

Asp Thr Leu Val Ile Cys Ser Asp Val Asp Gly Leu Tyr Asp Gln Asn

165 170 175

Pro His Glu His Pro Asn Ala Lys Leu Ile Lys Gln Val Thr Glu Ile

180 185 190

Asn Ala Asp Ile Tyr Ala Met Ala Gly Gly Ala Ser Ser Asp Val Gly

195 200 205

Thr Gly Gly Met Arg Thr Lys Ile Gln Ala Ala Glu Lys Ala Ile Ser

210 215 220

His Gly Ile Glu Thr Phe Ile Ile Asn Gly Phe Asn Ala Asp Ser Phe

225 230 235 240

Ser Gln Leu Leu Lys Gly Gln Asn Pro Gly Thr Leu Phe Thr Pro Tyr

245 250 255

Glu Lys Pro Met Gln Glu His Leu His Trp Met Thr His Thr Ser Gln

260 265 270

Ala Gln Gly Glu Val Ile Val Glu Asp Asp Phe Asp Leu Ala Leu Asp

275 280 285

Gln His Ser Glu Gln Leu Thr Ser Asp Asp Val Val Glu Val Lys Gly

290 295 300

Asp Phe Ser Val Gly Asp Thr Ile Leu Val Arg Lys Gly Asp Gly Thr

305 310 315 320

Lys Leu Ala Lys Ala Lys Ser Asn Tyr Ser Ser Cys Leu Leu Ser Phe

325 330 335

Ile Thr Glu Gln Asp Asp Gln Ala Phe Ala Ser Glu Phe Gln Gln Lys

340 345 350

Thr Gly Pro Ile Ile Ser Asp Lys Asn Ile Ala Ile Leu Lys Ser Ile

355 360 365

<210> 445

<211> 1104

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 445

atgacagact ctccccgtaa acgtattgtc gtcaaagtgg ggagcgcctt aatcgcgccc 60

cacaagcaag gttgcagtag ccattatctc ttgggtatcg cgcagtttat tacttactgc 120

cgtgtccaag gtatccaagt ggtactggtt tcatccggct cggttgccgc tggttggcat 180

cattttgagg gccaagctca gcccagtgtc acagtgaaaa aggccatggc ggccgcgggg 240

caggcggata tgatggcgac gtggaataag ctatttgatt ttcccaccgc ccaactgctg 300

ctgacccatg gcgacttacg taatcgcgag cgttatatca gtattcgaga caccattttt 360

agcctgctcg aacacggttt aatgccgatc atcaatgaga atgatgccgt taccgccgac 420

aaacttaagg ttggcgataa cgataatctc tcggccatgg tggcggctgc ggccgatgcc 480

gacaccttag tgatttgctc ggatgtggat ggactctatg atcaaaatcc ccacgaacat 540

cccaatgcca agttgataaa gcaagtcact gaaatcaatg ccgatatcta tgcgatggcg 600

ggaggcgcca gcagcgatgt tggtacagga ggcatgcgca ctaagatcca agccgccgaa 660

aaagccatct ctcacggcat tgagaccttt attatcaatg gctttaatgc cgactccttt 720

agccaactgc taaaggggca aaatccgggc accctcttta ccccctacga aaaaccgatg 780

caggagcatt tgcattggat gacccacacc tcgcaggcgc agggcgaagt gatcgtcgag 840

gatgattttg acctcgcact cgatcagcac agcgagcaat taaccagcga tgatgtggtt 900

gaagtcaaag gggatttctc agtgggcgat accattctgg tgcgtaaagg cgatggcact 960

aagttggcga aagccaaatc taactacagc agttgcctac tgagttttat taccgagcag 1020

gatgatcagg cgtttgccag tgaattccag caaaaaaccg gccccatcat ttccgataag 1080

aatatcgcca ttcttaaatc catt 1104

<210> 446

<211> 1113

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 446

atgaccgata gtccgcgtaa acgtattgtg gtgaaagttg gtagtgccct gattgccccg 60

cataaacagg gctgtagtag tcattatctg ctgggcattg cccagttcat tacctattgt 120

cgtgttcagg gtattcaggt ggttctggtg agtagtggta gcgttgccgc cggttggcat 180

cacttcgaag gccaggccca gccgagcgtt accgttaaaa aagccatggc agccgcaggt 240

caggccgata tgatggccac ctggaataaa ctgttcgact tcccgaccgc ccagctgctg 300

ctgacccatg gtgatctgcg taatcgtgaa cgctatatta gtattcgtga taccatcttc 360

agtctgctgg aacatggtct gatgccgatt attaatgaaa atgatgcagt gaccgcagat 420

aaactgaaag tgggcgataa tgataatctg agtgcaatgg tggccgccgc agccgatgca 480

gataccctgg tgatctgtag cgatgtggat ggcctgtatg atcagaatcc gcatgaacat 540

ccgaatgcca aactgattaa acaggtgacc gaaattaatg cagatatcta tgcaatggcc 600

ggtggcgcca gtagtgatgt gggcaccggt ggcatgcgta ccaaaattca ggccgcagaa 660

aaagccatta gtcatggtat tgaaaccttc attatcaatg gcttcaatgc agatagcttc 720

agccagctgc tgaaaggtca gaatccgggt accctgttca ccccgtatga aaaaccgatg 780

caggaacatc tgcattggat gacccatacc agtcaggccc agggtgaagt gattgttgaa 840

gatgacttcg atctggccct ggatcagcat agtgaacagc tgaccagcga tgatgttgtt 900

gaagttaaag gcgacttcag cgttggcgat accattctgg tgcgcaaagg tgatggcacc 960

aaactggcca aagccaaaag caattatagt agctgcctgc tgagcttcat taccgaacag 1020

gatgatcagg cattcgccag tgagttccag cagaaaaccg gcccgattat tagcgataaa 1080

aatattgcca ttctgaagag catttaagga tcc 1113

<210> 447

<211> 265

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 447

Met Ile Pro Leu Thr Leu Ile Lys Leu Gly Gly Ser Ile Val Thr Asp

1 5 10 15

Lys Ala Lys His Glu His Tyr Arg Gly Gln His Val Arg Glu Val Ala

20 25 30

Lys Leu Leu Ser Thr Tyr Phe Thr Gln Arg Asn Glu Ala Cys Leu Ile

35 40 45

Gly His Gly Gln Gly Ser Phe Gly His Pro Ala Val Lys Lys Asn Gln

50 55 60

Gln His Phe Ser Asp Arg Ser His Phe Ala Pro Gln Ala Met Ala Glu

65 70 75 80

Met Leu Arg Val Val Thr His Leu His Glu Arg Ile Leu Asp Asp Leu

85 90 95

Val Arg Glu Arg Val Pro Ala Ile Ser Phe Arg Phe Ser Gln Gln Tyr

100 105 110

Val Val Asp Gly Ala Ala Glu Ala Arg Val Asp Leu Thr Leu Leu Glu

115 120 125

Ala Leu Leu Asp Leu Arg Met Val Pro Val Thr Thr Gly Asp Ile Leu

130 135 140

Val Asp Thr Glu Val Gly Asn Arg Val Leu Ser Thr Glu Lys Ile Phe

145 150 155 160

Met Ala Leu Ile Arg Ala Leu Gln His Ser Asp Lys Tyr Arg Val Glu

165 170 175

Arg Val Ala Tyr Val Thr Gln Val Ala Gly Val Leu Asp Lys Ala Gly

180 185 190

Lys Val Ile Glu Arg Ile Gly Ala Asp Glu Glu Val Asp Gln Ser Trp

195 200 205

Phe Phe Ala Gln Ala Asp Gln Ala Asp Val Thr Gly Ala Met Lys His

210 215 220

Lys Val Glu Ala Ala Gln Ala Val Ala Gln Leu Gly Ile Pro Val Ala

225 230 235 240

Ile Leu Ser Ala Asn Asp Pro Lys Asn Leu Asp Arg Tyr Leu Arg Asn

245 250 255

Gln Ala Trp Ile Gly Thr Arg Ile Ala

260 265

<210> 448

<211> 795

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 448

atgattcctc ttaccttgat caagcttggt ggctcaatag tgaccgacaa agcgaagcac 60

gagcactatc gcggtcagca tgttcgagag gtagccaaac tattgtcaac atattttacc 120

cagcgaaatg aggcatgttt gattgggcat ggccagggta gttttggtca cccagcggtg 180

aaaaaaaacc agcagcattt ttctgatcga tctcacttcg ctccgcaagc gatggcagag 240

atgttgcgag tggtcaccca cttgcacgaa cgtattttgg atgacttagt ccgtgaacga 300

gtgcccgcaa ttagtttccg atttagccag cagtacgtgg tggatggcgc agctgaggct 360

cgggtcgact tgaccctcct cgaagcattg ctcgatttgc gcatggtgcc cgtaacgacg 420

ggtgatattt tggttgatac cgaggttggt aatcgggtgc tttcgaccga aaaaattttt 480

atggcgttga ttcgagcatt gcagcattca gacaagtacc gagtcgagcg agtagcgtat 540

gtgacacaag tagcaggagt gcttgacaaa gcaggcaagg ttatcgaacg gattggcgct 600

gatgaggaag tggatcaatc atggttcttt gctcaagctg accaggccga tgtgaccgga 660

gcgatgaaac ataaggttga ggcggcgcaa gcagtggctc aattaggtat tcccgtagca 720

attttgtctg ccaatgaccc caaaaatctt gatcgatatt tacgcaatca agcttggatc 780

ggtacacgaa tagcg 795

<210> 449

<211> 804

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 449

atgatcccgc tgaccctgat taaactgggc ggcagtattg tgaccgataa agcaaaacat 60

gaacattatc gcggccagca tgtgcgtgaa gtggcaaaac tgctgagcac ctacttcacc 120

cagcgtaatg aagcatgtct gattggccat ggccagggca gcttcggtca tccggccgtg 180

aaaaaaaatc agcagcactt cagtgatcgc agtcacttcg ccccgcaggc aatggccgaa 240

atgctgcgcg ttgttaccca tctgcatgaa cgtattctgg atgatctggt tcgcgaacgc 300

gtgccggcaa ttagcttccg cttcagtcag cagtatgtgg ttgatggtgc cgccgaagcc 360

cgcgtggatc tgaccctgct ggaagcactg ctggatctgc gtatggtgcc ggttaccacc 420

ggtgatattc tggtggatac cgaagttggc aatcgcgttc tgagtaccga aaaaatcttc 480

atggcactga ttcgcgccct gcaacatagt gataaatatc gtgtggaacg cgttgcctat 540

gtgacccagg tggccggtgt tctggataaa gccggtaaag ttattgaacg tattggcgca 600

gatgaagaag tggatcagag ttggttcttc gcacaggccg atcaggcaga tgtgaccggc 660

gcaatgaaac ataaagtgga agccgcacag gcagtggcac agctgggtat tccggtggcc 720

attctgagtg ccaatgatcc gaaaaatctg gatcgttatc tgcgcaatca ggcctggatt 780

ggtacccgta ttgcataagg atcc 804

<210> 450

<211> 276

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 450

Met Gly Ala Gly Gly His Gln Asn Asn Ala Asp Arg Thr Glu Lys Tyr

1 5 10 15

Ala Ala Thr Thr Ala Asn Lys Ala Lys Val Thr Thr Pro Ala Arg Ile

20 25 30

Ser Ile Thr Arg Leu Tyr Pro Val Thr Phe Leu Gln Leu Cys Val Lys

35 40 45

Thr Cys Thr Met Thr Lys Glu Leu Val Leu Leu Lys Leu Gly Gly Ser

50 55 60

Leu Ile Thr Asp Lys Asp Ile Pro Tyr Thr Pro Arg Leu Asp Lys Leu

65 70 75 80

Lys Glu Leu Ala Leu Glu Ile Lys Thr Val Leu Asp Ser Asn Pro Glu

85 90 95

Leu Leu Leu Ile Leu Gly His Gly Ser Gly Ser Phe Gly His Val Ala

100 105 110

Ala Lys Lys His Gly Thr Arg Asp Gly Val Gln Thr Pro Glu Gln Trp

115 120 125

Lys Gly Phe Ala Glu Val Arg Phe Gln Ala Ala Glu Leu Asn Pro Phe

130 135 140

Val Met Glu Ser Leu Phe Asn Ala Gly Val Pro Ala Ile Ser Phe Pro

145 150 155 160

Pro Ser Ser Ser Met Val Ser Asp Asp Arg Lys Val Ile His His Asn

165 170 175

Ile Leu Ala Ile Arg Lys Ala Leu Asn Val His Leu Leu Pro Val Val

180 185 190

Tyr Gly Asp Val Ala Phe Asp Glu Lys Arg Gly Gly Thr Ile Leu Ser

195 200 205

Thr Glu Asp Val Phe Thr Phe Leu Val Asp Gln Phe Ser Pro Ser Arg

210 215 220

Ile Leu Leu Ala Gly Ile Glu Ala Gly Val Trp Ala Asp Phe Pro Ala

225 230 235 240

Arg Thr Lys Leu Val Lys Gln Ile Gln Leu Ser Asp Tyr Glu Lys Met

245 250 255

Arg Thr Ser Ile Gly Gly Ser Ala Ser Thr Asp Val Thr Gly Gly Met

260 265 270

Lys Ala Lys Val

275

<210> 451

<400> 451

000

<210> 452

<211> 837

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 452

atgggcgctg gtggtcatca gaataatgcc gatcgtaccg aaaaatatgc agccaccacc 60

gccaataaag ccaaagtgac caccccggcc cgcattagta ttacccgtct gtatccggtt 120

accttcctgc aactgtgcgt taaaacctgt accatgacca aagaactggt gctgctgaaa 180

ctgggtggca gcctgattac cgataaagat attccgtata ccccgcgcct ggataaactg 240

aaagaactgg ccctggaaat taaaaccgtt ctggatagca atccggaact gctgctgatt 300

ctgggtcatg gcagtggcag cttcggtcat gtggcagcca aaaaacatgg tacccgcgat 360

ggtgttcaga ccccggaaca gtggaaaggc ttcgccgaag tgcgcttcca ggcagcagaa 420

ctgaatccgt tcgttatgga aagtctgttc aatgccggtg ttccggcaat tagcttcccg 480

ccgagcagca gcatggttag tgatgatcgc aaagttattc atcataatat cctggcaatc 540

cgtaaagcac tgaatgtgca tctgctgccg gtggtgtatg gcgatgttgc cttcgatgaa 600

aaacgtggcg gtaccattct gagcaccgaa gatgtgttca ccttcctggt tgatcagttc 660

agcccgagcc gtattctgct ggcaggcatt gaagccggcg tgtgggccga cttcccggca 720

agaaccaaac tggttaaaca gattcagctg agcgattatg aaaaaatgcg taccagcatt 780

ggcggcagcg caagtaccga tgttaccggc ggtatgaaag caaaagtgta aggatcc 837

<210> 453

<211> 205

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 453

Met Ala Ala Lys Gln Tyr Gln Thr Ile Ala Gly Val His Thr Arg Glu

1 5 10 15

Gln Trp Arg Gly Phe Ala Glu Val Ala Thr Val Ala Ser Glu Leu Asn

20 25 30

Tyr Leu Val Ala Arg Glu Phe Ser Ala Ala Gly Val Pro Val Trp Arg

35 40 45

Leu Gln Pro Ser Ala Ser Ala Ile Ser Arg Asp Gly Val Leu Val Ser

50 55 60

Leu Ala Leu Glu Ser Pro Arg Gln Gly Leu Glu Asn Gly Leu Val Pro

65 70 75 80

Leu Val Tyr Gly Asn Val Ala Leu Asp Glu Val Arg Gly Gly Thr Ile

85 90 95

Ile Ser Thr Glu Thr Ile Phe Phe Tyr Met Ala Lys His Leu Pro Val

100 105 110

Asn Arg Ile Leu Leu Leu Gly Glu Val Glu Gly Val Met Asp Ser Ala

115 120 125

Gly Gln Val Ile Pro Ser Ile Thr Pro Ala Lys Phe Ala Ala Ile Gln

130 135 140

Gln Tyr Leu Gly Gly Ser Ala Gly Thr Asp Val Thr Gly Gly Met Val

145 150 155 160

Thr Lys Val Gln Asp Met Leu Thr Leu Ala Lys Gln Val Ser Gly Leu

165 170 175

Thr Ile Arg Ile Met Asp Gly Arg Gln Pro Gly Leu Leu Phe Glu Thr

180 185 190

Leu Leu Gly Lys Val Glu Pro Gly Thr Leu Ile Ser Gly

195 200 205

<210> 454

<400> 454

000

<210> 455

<211> 624

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 455

atggcagcaa aacagtatca gaccattgcc ggtgtgcata cccgtgaaca gtggcgtggc 60

ttcgcagaag tggccaccgt tgcaagtgaa ctgaattatc tggttgcacg cgagttcagt 120

gccgcaggtg tgccggtgtg gcgcctgcaa ccgagtgcca gcgcaattag ccgtgatggc 180

gtgctggtta gtctggcact ggaaagtccg cgtcagggcc tggaaaatgg tctggtgccg 240

ctggtgtatg gtaatgttgc cctggatgaa gttcgtggcg gcaccattat tagcaccgaa 300

accatcttct tctatatggc caaacatctg ccggttaatc gcattctgct gctgggcgaa 360

gttgaaggcg tgatggatag tgcaggccag gttattccga gtattacccc ggccaaattc 420

gccgcaattc agcagtatct gggcggtagt gccggcaccg atgttaccgg cggcatggtt 480

accaaagtgc aggatatgct gaccctggca aaacaggtta gcggtctgac cattcgtatt 540

atggatggcc gtcagccggg tctgctgttc gaaaccttac tgggcaaagt tgaaccgggt 600

accctgatta gtggctaagg atcc 624

<210> 456

<211> 208

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 456

Met Thr Ile Ala Lys Gln Cys Ala Glu Ile Ala Gln Met Gly Val Gln

1 5 10 15

Leu Ala Ile Val Val Gly Gly Gly Asn Phe Ile Arg Gly Ala Thr Phe

20 25 30

Ala Glu Asp Gly His Ile Pro Arg Ala Thr Ala Asp Tyr Met Gly Met

35 40 45

Leu Ala Thr Val Ile Asn Ala Val Ala Leu Gln Glu Thr Met Glu Lys

50 55 60

Phe Gly Gln Pro Thr Arg Val Leu Ser Ala Ile Ser Val Tyr Ser Val

65 70 75 80

Cys Glu Pro Phe Ile Arg Arg Arg Ala Val Arg His Leu Glu Lys Gly

85 90 95

Arg Ala Ile Ile Leu Ala Ala Gly Thr Gly Asn Pro Phe Phe Thr Thr

100 105 110

Asp Thr Cys Ala Ala Leu Arg Ala Thr Glu Ile Ala Ala Asp Val Leu

115 120 125

Leu Lys Ala Thr Lys Val Asp Gly Ile Tyr Asp Lys Asp Pro Lys Lys

130 135 140

His Pro Asp Thr Lys Leu Phe Asn Ser Ile Ser Tyr Asp Gln Val His

145 150 155 160

Asn Asp Lys Leu Arg Val Met Asp Leu Thr Ala Ile Thr Leu Cys Met

165 170 175

Glu Arg Lys Leu Pro Leu Val Val Phe Asn Met Lys Lys Pro Gly Asn

180 185 190

Ile Ala Arg Val Val Leu Gly Glu Asn Val Gly Thr Lys Ile Gln Pro

195 200 205

<210> 457

<400> 457

000

<210> 458

<211> 633

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 458

atgaccattg caaaacagtg tgcagaaatt gcacagatgg gcgttcagct ggcaattgtt 60

gttggcggtg gtaacttcat tcgtggcgcc accttcgccg aagatggtca tattccgcgt 120

gcaaccgcag attatatggg tatgctggca accgtgatta atgccgtggc cctgcaagaa 180

accatggaaa aattcggcca gccgacccgc gttctgagcg ccattagtgt gtatagcgtg 240

tgcgaaccgt tcattcgccg tcgcgcagtg cgtcatctgg aaaaaggtcg tgccattatt 300

ctggccgccg gtaccggcaa tccgttcttc accaccgata cctgcgcagc actgcgcgcc 360

accgaaattg ccgccgatgt tctgctgaaa gccaccaaag tggatggcat ctatgataaa 420

gatccgaaaa aacatccgga taccaaactg ttcaatagca ttagctatga tcaggttcat 480

aatgataagc tgcgtgtgat ggatctgacc gcaattaccc tgtgtatgga acgtaaactg 540

ccgctggttg tgttcaatat gaaaaaaccg ggtaatattg cacgcgttgt gctgggcgaa 600

aatgttggta ccaaaattca gccgtaagga tcc 633

<210> 459

<211> 218

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 459

Met Ala Asp Ile Ser Ile Gly Pro Met Ser Glu Lys Ile Asp Lys Leu

1 5 10 15

Ala Ser Ser Phe Gln Val Lys Ser Lys Thr Val Leu Lys Lys Ser Glu

20 25 30

Leu Trp Val Val Lys Ala Gly Ser Gln Met Val Ile Asp Gly Gly Pro

35 40 45

Met Leu Ile Arg Ser Trp Met Ser Gln Val Ser Glu Leu Ala Arg Gln

50 55 60

Asn His Val Gln Val Ile Trp Val Thr Ser Gly Ala Ile Ala Ser Ala

65 70 75 80

Arg Lys Arg Thr Gly Lys Val Pro Lys Leu Leu Arg Glu Lys Gln Ala

85 90 95

Leu Ser Ala Ile Gly Gln Pro His Leu Ile Asn His Tyr Leu Val Ala

100 105 110

Leu Gln Glu Asn Asp Val Ser Gly Ala Gln Ile Leu Leu Thr Ala Glu

115 120 125

Asp Leu Arg Ser Gln Ala Arg Arg Thr Tyr Leu Gln Gln Thr Leu Lys

130 135 140

Thr Leu Leu Glu Trp Asn Phe Leu Pro Ile Leu Asn Glu Asn Asp Ala

145 150 155 160

Val Ala Thr Glu Glu Ile Gln Phe Gly Asp Asn Asp Arg Leu Ala Ala

165 170 175

Leu Val Ala Ile His Met Lys Ala Lys Arg Leu Val Leu Leu Thr Asp

180 185 190

Val Asp Gly Leu Tyr Asp Arg Asp Pro Lys Thr Asp Ala Ser Ala Lys

195 200 205

Leu Val Ser Glu Leu Ser Gly Ile Pro Ser

210 215

<210> 460

<400> 460

000

<210> 461

<211> 663

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 461

atggccgata ttagtattgg tccgatgagc gaaaaaattg ataaactggc aagtagcttc 60

caggtgaaaa gcaaaaccgt tctgaaaaaa agtgaactgt gggttgttaa agcaggcagc 120

cagatggtga ttgatggtgg tccgatgctg attcgtagct ggatgagtca ggtgagcgaa 180

ctggcacgtc agaatcatgt gcaggttatc tgggtgacca gtggcgcaat tgcaagcgca 240

cgcaaacgta ccggcaaagt tccgaaactg ctgcgtgaaa aacaggccct gagtgcaatt 300

ggtcagccgc atctgattaa tcattatctg gtggcactgc aagaaaatga tgttagcggt 360

gcacagattc tgctgaccgc agaagactta cgtagccagg cccgtcgcac ctatctgcaa 420

cagaccctga aaaccttact ggaatggaac ttcctgccga ttctgaatga aaatgatgcc 480

gtggcaaccg aagaaattca gttcggtgat aatgatcgcc tggccgcact ggttgccatt 540

cacatgaaag caaaacgtct ggtgctgctg accgatgtgg atggtctgta tgatcgtgat 600

ccgaaaaccg atgccagcgc caaactggtg agcgaattaa gtggtattcc gagttaagga 660

tcc 663

<210> 462

<211> 191

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 462

Met Pro Pro Val Ser Leu Pro Ala Pro Gln Ser Tyr Ala Tyr Thr Gly

1 5 10 15

Leu Thr Lys Tyr Leu Ser Arg Phe Ser Ile Ser Asn His Tyr Thr Ile

20 25 30

Ala Met Asn Thr Ser Thr Met Thr Thr Lys Asn Val Thr Met Ile Lys

35 40 45

Leu Gly Gly Ser Val Ile Thr Asp Lys Asn Val Lys Asp Val Phe Arg

50 55 60

Arg Glu Val Leu Ile Ser Leu Ile Asn Asp Ile Lys Lys Phe Arg Glu

65 70 75 80

Glu Asn Pro Asp Gln Leu Leu Ile Ile Gly His Gly Gln Gly Ser Phe

85 90 95

Ala His Phe Pro Ala Lys Lys Tyr Arg Thr Met Glu Gly Phe Ile Asn

100 105 110

Glu Tyr Ser Arg Tyr Gly Met Ala Val Thr Gln Phe Thr Val Gly Asn

115 120 125

Leu His Gln Leu Val Leu Glu Glu Met Leu Gly His Glu Leu Pro Val

130 135 140

Val Ser Phe Arg Val Asn Ser Ala Ala Val Ala Lys Lys Ser Lys Met

145 150 155 160

Ser Tyr Leu Ala Gly Glu Val Leu Gly Glu Tyr Leu Asn Gln Gly Leu

165 170 175

Leu Pro Val Thr Cys Gly Asp Val Leu Val Asp Ser Glu Arg Gly

180 185 190

<210> 463

<211> 573

<212> DNA

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 463

atgccgccgg tttcgctccc tgccccgcag tcatatgcat atacgggttt gacaaaatac 60

ttgagtagat ttagcattag caaccattat actatagcga tgaacacttc tactatgacc 120

acaaaaaatg tcacaatgat taaactgggc ggatcggtaa ttacagataa aaatgttaag 180

gatgttttcc gccgggaagt tttaataagt cttattaatg atatcaagaa gttcagggag 240

gaaaatccgg accaactgct gataatcggg catggtcagg gcagttttgc tcattttccg 300

gcaaagaaat atcgcaccat ggaagggttt atcaatgagt atagccgcta tgggatggcg 360

gtgacacaat ttacggtcgg aaatctgcat cagctagttt tggaggagat gctagggcat 420

gaactaccgg tcgtcagctt cagggtcaat agtgcggctg tggcaaaaaa atccaaaatg 480

tcatatttgg caggagaagt tttaggcgaa tatttaaatc aagggctact tccagtaacc 540

tgcggcgatg ttttagttga ttcggaaaga ggc 573

<210> 464

<211> 582

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 464

atgccgcctg tgagcctgcc ggcaccgcag agttatgcat ataccggcct gaccaaatat 60

ctgagtcgct tcagtattag caatcattat accattgcaa tgaacaccag taccatgacc 120

accaaaaatg ttaccatgat taaactgggc ggtagcgtta ttaccgataa aaatgtgaaa 180

gatgtgttcc gtcgcgaagt gctgattagc ctgattaatg atattaaaaa gttccgtgag 240

gagaatccgg atcagctgct gattattggc catggtcagg gcagcttcgc ccacttcccg 300

gccaaaaaat atcgtaccat ggaaggcttc attaatgaat atagtcgcta tggtatggcc 360

gtgacccagt tcaccgtggg taatctgcat cagctggtgc tggaagaaat gctgggccat 420

gaactgccgg ttgtgagctt ccgtgtgaat agcgccgccg ttgcaaaaaa aagtaaaatg 480

agctatctgg caggtgaagt tctgggcgaa tatctgaatc agggtctgct gccggtgacc 540

tgcggcgatg ttctggttga tagtgaacgc ggctaaggat cc 582

<210> 465

<211> 193

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 465

Met Asn Arg Ile Val Val Gly Glu Met Leu Lys Gln Asn Ile Pro Ala

1 5 10 15

Val Thr Gln Gln Ser Ala Ser Leu Phe Ser Leu Ala Asn Arg Asp Ala

20 25 30

Lys Pro Asp Ile Ser Leu Lys Ile Val Gln Ser Leu Leu Gly Gly Gly

35 40 45

Phe Val Pro Val Val Tyr Gly Asp Val Leu Phe Thr Gln Asp Gly Asn

50 55 60

Phe Thr Ile Tyr Ser Thr Glu Lys Val Leu Asn Asn Leu Ala Leu Ala

65 70 75 80

Leu Arg Glu Ser Gly Glu Thr Ile Gly Lys Val Ile His Cys Gly Glu

85 90 95

Thr Asp Gly Phe Leu Lys Asp Gly Gln Val Val Ser Ile Ile Thr Pro

100 105 110

Glu Thr His Gln Glu Met Leu Ala Ser Met Asp Lys Ala Lys Gly Phe

115 120 125

Asp Val Thr Gly Gly Met Glu His Lys Val Glu Met Ala Leu Asn Leu

130 135 140

Ala His Asp Gly Ile Asp Ser Phe Ile Val Gly Asn Asn His Gly Gly

145 150 155 160

Asn Leu Tyr Arg Thr Ile Val Gly Lys Glu Tyr Ile Gly Thr Arg Ile

165 170 175

His Trp Leu His Lys Cys Leu Thr Ile Met Arg Cys Met Cys Asp Arg

180 185 190

Ile

<210> 466

<400> 466

000

<210> 467

<211> 588

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 467

atgaaccgta ttgttgttgg cgaaatgctg aaacagaata ttccggccgt tacccagcag 60

agcgcaagtc tgttcagtct ggccaatcgt gatgcaaaac cggatattag cctgaaaatt 120

gtgcagagtc tgctgggtgg cggcttcgtg ccggtggtgt atggtgatgt gctgttcacc 180

caggatggca acttcaccat ctatagtacc gaaaaagttc tgaataacct ggccctggca 240

ctgcgtgaaa gcggcgaaac cattggcaaa gttattcatt gtggtgaaac cgatggcttc 300

ctgaaagatg gtcaggtggt tagcattatt accccggaaa cacatcagga aatgctggca 360

agtatggata aagccaaagg cttcgatgtg accggtggta tggaacataa agttgaaatg 420

gccctgaatc tggcacatga tggtattgat agcttcattg tgggtaataa tcatggcggc 480

aatctgtatc gcaccattgt gggtaaagaa tatattggta cccgtattca ttggctgcat 540

aaatgtctga ccattatgcg ttgcatgtgc gatcgtattt aaggatcc 588

<210> 468

<211> 289

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 468

Met Ala Leu Ile Val Met Lys Phe Gly Gly Thr Ser Val Ala Asp Val

1 5 10 15

Glu Lys Ile Glu Asn Ala Ala Asp Lys Val Val Lys Glu Val Glu Arg

20 25 30

Gly His Lys Val Ala Val Val Val Ser Ala Met Ser Gly Val Pro Asn

35 40 45

Gln Leu Val Gly Tyr Cys Ser Glu Ile Ser Ser Leu His Asp Val Arg

50 55 60

Glu Tyr Asp Thr Val Val Ala Ser Gly Glu Gln Val Thr Ala Gly Leu

65 70 75 80

Met Ala Met Ala Leu Gln Lys Arg Gly Val Thr Ala Arg Ser Trp Leu

85 90 95

Gly Trp Gln Ile Pro Ile Lys Thr Asn Ser Ile His Gly Lys Ala Arg

100 105 110

Ile Glu Glu Ile Glu Thr Lys Glu Leu His Lys Arg Leu Asp Ala Gly

115 120 125

Glu Val Leu Val Val Pro Gly Phe Gln Gly Val Thr Lys Asn Lys Arg

130 135 140

Ile Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Ser Ala Val Ala Leu

145 150 155 160

Ala Ala Ala Leu Lys Ala Asp Arg Cys Asp Ile Tyr Thr Asp Val Lys

165 170 175

Gly Val Tyr Thr Ala Asp Pro Arg Ile Val Pro Lys Ala Lys Met Ile

180 185 190

Pro Lys Ile Ser Tyr Glu Glu Met Leu Glu Leu Ala Ser Leu Gly Ser

195 200 205

Lys Val Leu Gln Thr Arg Ser Val Glu Met Gly Ala Lys Ser Gly Val

210 215 220

Pro Ile Gln Val Leu Ser Thr Phe Glu Pro Tyr Leu Gly Ser Asp Leu

225 230 235 240

Lys Gly Thr Leu Val Thr Lys Glu Glu Asn Ile Val Glu Gln Glu Ile

245 250 255

Val Ser Gly Ile Ala His Asn Lys Asp Glu Ala Lys Val Thr Val Val

260 265 270

Gly Val Glu Asp Lys Pro Gly Ile Ala Ala Ser Leu Phe Glu Pro Leu

275 280 285

Ala

<210> 469

<400> 469

000

<210> 470

<211> 876

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 470

atggccctga ttgttatgaa attcggtggt accagcgtgg cagatgttga aaaaattgaa 60

aatgcagccg ataaagttgt taaagaagtt gaacgcggtc ataaagttgc agtggtggtg 120

agcgcaatga gtggcgttcc gaatcagctg gttggctatt gcagcgaaat tagcagtctg 180

catgatgttc gtgaatatga taccgttgtt gccagtggcg aacaggtgac cgcaggtctg 240

atggcaatgg ccctgcaaaa acgcggtgtg accgcacgca gttggctggg ttggcagatt 300

ccgattaaaa ccaatagcat tcatggtaaa gcacgcattg aagaaattga aaccaaagaa 360

ctgcataaac gtctggatgc cggcgaagtg ctggttgttc cgggcttcca gggtgtgacc 420

aaaaataaac gtattaccac cctgggtcgt ggtggcagtg ataccagcgc agttgcactg 480

gcagcagcac tgaaagcaga tcgttgtgat atctataccg atgttaaagg tgtgtatacc 540

gcagatccgc gtattgtgcc gaaagcaaaa atgattccga aaattagcta cgaagaaatg 600

ctggaactgg ccagcctggg tagcaaagtt ctgcaaacca gaagcgttga aatgggcgca 660

aaaagcggcg tgccgattca ggtgctgagt accttcgaac cgtatctggg tagcgatctg 720

aaaggtaccc tggttaccaa agaagaaaat attgttgaac aggaaatcgt tagcggtatt 780

gcccataata aagatgaagc caaagtgacc gttgttggcg ttgaagataa accgggtatt 840

gcagccagtc tgttcgaacc gctggcataa ggatcc 876

<210> 471

<211> 222

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 471

Met Ser Ser Arg Gly Leu Gly Asp Val Tyr Lys Arg Gln Leu Lys Leu

1 5 10 15

Gly Ala Met Pro Ile Ile Asn Glu Asn Asp Ser Val Thr Thr Asn Glu

20 25 30

Ile Arg Phe Gly Asp Asn Asp Ser Leu Ser Ala Trp Val Ala His Leu

35 40 45

Met Gly Ala Asp Ala Leu Ile Leu Leu Thr Asp Val Asp Gly Leu Phe

50 55 60

Asp Ser Asp Pro Arg Phe Asn Lys His Ala Lys Val Ile Lys Asp Val

65 70 75 80

His Asn Ile Ala Asp Val Lys His Leu Ala Gly His Ala Gly Thr Gln

85 90 95

Arg Gly Thr Gly Gly Met Val Thr Lys Leu Arg Ala Ala Glu Leu Ala

100 105 110

Thr Val Ala Gly Thr Glu Thr Leu Ile Ile Gly Gly Gly Gly Pro Gly

115 120 125

Leu Glu Ala Leu Ala Lys Gly Glu Ile Arg Gly Thr Arg Phe Tyr Ala

130 135 140

Lys Thr Ser Pro Ser Ala Arg Lys Ser Trp Leu Ala Gln Leu Pro Leu

145 150 155 160

Arg Gly Ser Ile Glu Ile Asp Ala Gly Ala Ala Lys Ala Leu Ser Arg

165 170 175

Gly Asn Ser Leu Leu Pro Lys Gly Ile Thr Val Ile Asp Gly His Phe

180 185 190

Asp Phe Gly Asp Ala Val Ala Val Thr His Asn Gly Ala Cys Val Ala

195 200 205

Arg Gly Leu Ser Asn Tyr Pro Ser Ala Ala Leu Lys Lys Ile

210 215 220

<210> 472

<400> 472

000

<210> 473

<211> 675

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 473

atgagtagtc gcggcctggg cgatgtgtat aaacgccagc tgaaactggg cgccatgccg 60

attattaatg aaaatgatag cgttaccacc aatgaaattc gcttcggtga taatgatagc 120

ctgagcgcat gggttgccca tctgatgggt gccgatgcac tgattctgct gaccgatgtt 180

gatggtctgt tcgatagcga tccgcgcttc aataaacatg ccaaagttat taaagacgtg 240

cataatattg ccgatgttaa acatctggca ggtcatgccg gcacccagcg tggcaccggt 300

ggtatggtta ccaaactgcg tgccgcagaa ctggcaaccg tggccggtac cgaaacctta 360

attattggcg gcggcggccc gggtctggaa gcattagcaa aaggcgaaat tcgcggcacc 420

cgcttctatg caaaaaccag cccgagcgcc cgtaaaagct ggctggcaca gctgccgctg 480

cgtggcagca ttgaaattga tgccggcgca gccaaagcac tgagtcgtgg taatagcctg 540

ctgccgaaag gcattaccgt gattgatggc cacttcgact tcggtgatgc agttgcagtg 600

acccataatg gtgcatgcgt tgcacgcggc ctgagcaatt atccgagcgc cgccctgaaa 660

aaaatttaag gatcc 675

<210> 474

<211> 331

<212> PRT

<213> 未知的

<220>

<223> 获自宏基因组(Metagenome)测序

<400> 474

Met Ser Leu Pro Asn Ala Gly His Ala Arg Arg Ile Val Val Lys Leu

1 5 10 15

Gly Thr Gly Val Leu Thr Ser Gly Ile Gly Gln Leu Asp Thr Asp Arg

20 25 30

Ile Gly Ser Ile Ala Arg Gly Ile Ala Ser Leu Arg Gln Arg Gly Thr

35 40 45

Glu Val Ile Val Val Ser Ser Gly Ala Val Gly Leu Gly Met Gly Ala

50 55 60

Leu Lys Leu Gln Lys Lys Pro Lys Asp Val Ser Lys Lys Gln Ala Cys

65 70 75 80

Ala Ala Ile Gly Gln Ser Arg Leu Met Gln Thr Trp Gln Asn Ala Phe

85 90 95

Ser Pro Leu Asn Leu Thr Val Ala Gln Val Leu Leu Thr His Glu Asp

100 105 110

Leu Arg Ser Arg Thr Arg Tyr Leu Gly Val Lys Glu Cys Leu Gln Gln

115 120 125

Leu Ile Ala Tyr Gly Thr Ile Pro Ile Ile Asn Glu Asn Asp Thr Val

130 135 140

Ser Ala Ala Glu Ile Lys Phe Gly Asp Asn Asp Thr Leu Ser Ala Met

145 150 155 160

Val Ala Ser Leu Thr Glu Ala Thr His Leu Ala Ile Leu Ser Thr Ala

165 170 175

Pro Gly Leu Ile Asp Met Lys Gly Thr Gly Gln Ile Ile Pro Val Val

180 185 190

Glu Arg Ile Thr Pro Glu Ile Glu Ala Met Ala Gly Gly Thr Thr Ser

195 200 205

Glu Thr Ala Thr Gly Gly Met Ile Ser Lys Ile Ser Ala Ala Arg Leu

210 215 220

Ala Thr Gln Ala Gly Cys Gly Val Phe Ile Ala Ser Gly Ala Glu Pro

225 230 235 240

Asp Ile Leu Asn Lys Leu Leu Ser Gly Thr Gly Pro Gly Thr Phe Phe

245 250 255

Val Pro Ser Gly Leu Pro Leu Glu Ala Lys Lys Arg Trp Leu Ala Tyr

260 265 270

Phe Gln Arg Pro Ser Gly Thr Leu Leu Val Asn Thr Cys Ala Val Pro

275 280 285

Val Leu Arg Asp Gln Gly Arg Ser Leu Leu Ala Val Gly Val Thr Gly

290 295 300

Ala Lys Gly Gln Phe Gln Ser Gly Asp Ile Val Asn Ile Ala Ala Pro

305 310 315 320

Asp Gly Thr Ile Phe Ala Arg Gly Lys Thr Ala

325 330

<210> 475

<400> 475

000

<210> 476

<211> 1002

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 476

atgagtctgc cgaatgccgg ccatgcacgc cgtattgtgg tgaaactggg caccggtgtt 60

ctgaccagcg gtattggtca gctggatacc gatcgcattg gcagcattgc ccgcggtatt 120

gcaagtctgc gtcagcgcgg caccgaagtt attgtggtta gcagtggtgc cgtgggtctg 180

ggtatgggcg cactgaaact gcaaaaaaaa ccgaaagatg ttagtaaaaa gcaggcatgc 240

gcagccattg gccagagccg tctgatgcag acctggcaga atgcattcag cccgctgaat 300

ctgaccgttg cccaggttct gctgacccat gaagacttac gcagccgcac ccgctatctg 360

ggtgttaaag aatgcctgca acagctgatt gcctatggca ccattccgat tattaatgaa 420

aatgataccg tgagtgcagc cgaaattaaa ttcggcgata atgataccct gagtgccatg 480

gttgccagcc tgaccgaagc cacccatctg gccattctga gcaccgcccc gggcctgatt 540

gatatgaaag gtaccggtca gattattccg gtggtggaac gtattacccc ggaaattgaa 600

gccatggccg gtggcaccac cagcgaaacc gcaaccggcg gcatgattag caaaattagc 660

gccgcacgtc tggcaaccca ggccggttgc ggcgtgttca ttgccagtgg cgccgaaccg 720

gatattctga ataaactgct gagcggcacc ggtccgggca ccttcttcgt gccgagtggc 780

ctgccgctgg aagccaaaaa acgttggctg gcatacttcc agcgtccgag tggcaccctg 840

ctggtgaata cctgtgcagt tccggttctg cgtgatcagg gtcgcagcct gctggcagtg 900

ggtgttaccg gcgccaaagg ccagttccag agcggtgata ttgtgaatat tgcagccccg 960

gatggtacca tcttcgcccg tggcaaaacc gcctaaggat cc 1002

<210> 477

<211> 257

<212> PRT

<213> Methanococcus vannielii

<400> 477

Met Phe Ala Ile Leu Lys Leu Gly Gly Ser Ile Leu Cys Asp Lys Asn

1 5 10 15

Val Pro Tyr Ser Ile Asn Trp Glu Asn Leu Gln Asn Ile Gly Ile Glu

20 25 30

Ile Lys Glu Ala Leu Glu Tyr Tyr Arg Lys Glu Glu Ile Asn Leu Lys

35 40 45

Leu Ile Ile Val His Gly Gly Gly Ser Phe Gly His Pro Val Ala Lys

50 55 60

Lys Tyr Leu Lys Asn Gly Lys Phe Val Asp Met Gly Lys Gly Tyr Trp

65 70 75 80

Glu Ile Gln Lys Ala Met Arg Lys Phe Asn Asn Ile Val Ile Asp Glu

85 90 95

Leu Gln Asn Phe Glu Ile Pro Val Val Ser Ile Gln Pro Ser Ser Phe

100 105 110

Ile Thr Phe Asp Lys Asp Leu Asn Leu Arg Phe Asp Thr Asn Ala Ile

115 120 125

Glu Lys Met Leu Glu Lys Asp Leu Ile Pro Val Ile His Gly Asp Ile

130 135 140

Val Ile Asp Glu Arg Glu Asn Asn Phe Lys Ile Phe Ser Gly Asp His

145 150 155 160

Ala Leu Pro His Leu Ser Lys Lys Leu Asn Pro Asp Leu Ser Leu His

165 170 175

Ala Ser Asp Val Asp Gly Val Trp Asp Thr Lys Phe Lys Val Ile Glu

180 185 190

Lys Ile Asp Ser Ser Asn Ile Asn Lys Val Leu Glu Ser Leu Lys Pro

195 200 205

Ser Asn Lys Glu Asp Val Thr Gly Gly Met His Leu Lys Val Met Glu

210 215 220

Cys Tyr Asn Leu Gly Val Lys Thr Ile Ile Phe Asn Gly Ser Lys Lys

225 230 235 240

Arg Asn Ile Tyr Asn Ala Leu Leu Lys Asn Val Lys Gly Thr Ser Ile

245 250 255

Asn

<210> 478

<211> 774

<212> DNA

<213> Methanococcus vannielii

<400> 478

atgtttgcaa ttttaaaact tggcggaagt atcctttgcg ataaaaatgt tccatattca 60

attaattggg aaaatttaca gaatattgga atcgaaataa aagaagccct tgaatattac 120

agaaaagaag aaataaacct aaaattaatt attgttcacg gaggaggctc ttttggccat 180

cctgttgcta aaaaatattt aaaaaatgga aaatttgtag atatgggcaa aggatactgg 240

gaaattcaaa aagcaatgag aaaattcaac aatatcgtaa ttgatgaact acaaaatttt 300

gaaattccgg tagtttcaat acagccctcc tcatttatca cttttgacaa agatttaaac 360

ttacgttttg acacaaatgc tattgaaaag atgcttgaaa aagatttaat tcccgtaatt 420

cacggggata ttgtaattga tgaaagggaa aataatttca agatattttc tggagaccat 480

gcactccccc acctttcaaa aaaactaaat cctgatctga gtcttcatgc atccgacgtt 540

gatggtgtat gggatactaa atttaaggta attgaaaaaa tagattcatc aaatattaat 600

aaagtgctag aatcgttaaa accttcaaac aaagaagatg taaccggagg aatgcactta 660

aaagtaatgg aatgttataa tttaggcgtt aaaaccataa tttttaatgg aagtaaaaaa 720

agaaatatat ataatgccct tttaaaaaat gtaaaaggaa cttcaataaa ttaa 774

<210> 479

<211> 780

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 479

atgttcgcca ttctgaaact gggcggcagt attctgtgcg ataaaaatgt gccgtatagc 60

attaattggg aaaatctgca aaacattggc attgaaatta aggaagcact ggaatattac 120

cgcaaagaag aaattaatct gaagctgatt atcgtgcatg gcggcggtag cttcggccat 180

ccggtggcaa aaaaatatct gaaaaatggt aagttcgtgg atatgggcaa aggctattgg 240

gaaattcaga aagcaatgcg caaattcaat aatattgtga ttgacgaact gcaaaacttc 300

gaaattccgg ttgtgagtat tcagccgagt agcttcatta ccttcgataa agacttaaat 360

ctgcgcttcg ataccaatgc cattgaaaaa atgctggaaa aagacttaat cccggtgatt 420

catggcgata ttgtgattga tgaacgtgaa aataacttca aaatcttcag tggcgatcat 480

gcactgccgc atctgagtaa aaaactgaat ccggatctga gcctgcatgc aagcgatgtg 540

gatggtgtgt gggataccaa attcaaagtg attgaaaaaa tcgacagcag taatattaac 600

aaggtgctgg aaagcctgaa accgagtaat aaagaagatg tgaccggtgg tatgcatctg 660

aaagttatgg aatgttataa cctgggcgtg aaaaccatta tcttcaatgg cagcaaaaaa 720

cgcaatatct ataatgccct gctgaaaaat gtgaaaggta ccagcattaa ttaaaagctt 780

<210> 480

<211> 257

<212> PRT

<213> Methanococcoides burtonii

<400> 480

Met Asn Ser Asn Asn Gly Ile Thr Ile Leu Lys Ile Gly Gly Ser Val

1 5 10 15

Ile Thr Asp Lys Arg Ser Glu Asp Gly Leu Ala Trp Glu Glu Glu Ile

20 25 30

Val Arg Ile Ala Arg Glu Ile Ser Gly Phe Glu Gly Lys Leu Ile Ile

35 40 45

Val His Gly Ala Gly Ser Tyr Gly His Pro Gln Ala Lys Arg Tyr Ala

50 55 60

Leu Thr Glu Gly Phe His Ala Glu Gly Ala Val Val Thr His Asn Ala

65 70 75 80

Val Lys Ala Leu Asn Arg Ile Val Val Gly Ile Leu Asn Asp Glu Gly

85 90 95

Val Asn Ala Ile Ser Val His Pro Met Cys Cys Thr Val Ala Lys Asn

100 105 110

Gly Arg Ile Ser Asp Met Tyr Leu Gly Ser Ile Arg Leu Met Leu Glu

115 120 125

Lys Gly Leu Val Pro Val Leu His Gly Asp Val Val Met Asp Glu Val

130 135 140

Lys Gly Val Ser Ile Ile Ser Gly Asp Gln Val Ile Pro Tyr Leu Ala

145 150 155 160

Thr Gln Leu Lys Ala Ser Arg Ile Gly Val Gly Ser Ala Ala Asp Gly

165 170 175

Val Phe Asp Asp Lys Gly Val Thr Ile Pro Val Ile Thr Ser Met Asn

180 185 190

Phe Asp Glu Ile Lys Ala Tyr Ile Gly Gly Ser Ala Gly Thr Asp Val

195 200 205

Thr Gly Gly Met Leu Gly Lys Val Leu Glu Met Leu Glu Leu Gly Lys

210 215 220

Thr Ser Ser Ile Thr Ser Tyr Ile Phe Asn Ala Thr Val Val Gly Ser

225 230 235 240

Val Ser Ser Phe Leu Asn Gly Glu Asn Ile Gly Thr Ala Ile Lys Asp

245 250 255

Ser

<210> 481

<211> 774

<212> DNA

<213> Methanococcoides burtonii

<400> 481

gtgaactcaa ataacgggat aactatattg aagataggcg gcagcgtaat taccgataag 60

agatcggaag acgggcttgc ctgggaagaa gagatagtcc ggatagctcg tgaaatatcc 120

ggttttgaag gtaaacttat cattgtgcat ggtgcaggtt cctacggtca ccctcaggca 180

aaaagatatg ctcttacgga aggcttccat gcagaagggg ctgttgtcac tcacaatgca 240

gtaaaggcat tgaaccgtat cgtagttgga attctcaatg atgaaggtgt gaatgcgata 300

tcagtacatc caatgtgttg cacggtcgca aagaacggtc gcatctcgga catgtatctt 360

ggaagtatca ggttgatgct tgagaaaggg cttgttccgg tattacatgg tgatgttgta 420

atggatgagg taaaaggcgt atccatcatc tccggtgatc aggtgatacc ctatcttgca 480

acacagttga aggcttccag aattggagtt gggagtgcag cagatggtgt gttcgatgat 540

aagggcgtaa ccattccagt gatcacttct atgaatttcg atgagataaa ggcatatatc 600

ggtggctcgg caggaactga tgtgaccggt ggaatgctcg ggaaagtgct tgaaatgctg 660

gaacttggca aaacatcaag tataacctcc tatatattca atgcaactgt agtgggaagc 720

gtgtcgagtt ttctaaatgg tgagaacatc ggtaccgcaa taaaagattc ataa 774

<210> 482

<211> 780

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 482

atgaacagta acaacggtat taccattctg aaaattggtg gtagcgttat taccgataaa 60

cgtagcgaag atggtctggc atgggaagaa gaaattgtgc gtattgcacg cgaaattagt 120

ggcttcgaag gcaaactgat tattgtgcat ggtgccggta gttatggtca tccgcaggcc 180

aaacgttatg ccctgaccga aggcttccat gcagaaggtg ccgtggttac ccataatgca 240

gttaaagcac tgaatcgcat tgttgttggc attctgaatg atgaaggtgt taatgcaatt 300

agcgtgcatc cgatgtgttg caccgttgcc aaaaatggtc gtattagcga tatgtatctg 360

ggtagcattc gtctgatgct ggaaaaaggc ctggtgccgg ttctgcatgg tgatgtggtg 420

atggatgaag ttaaaggcgt tagcattatt agcggtgatc aggtgattcc gtatctggcc 480

acccagctga aagcaagtcg tattggtgtg ggcagtgcag cagatggtgt gttcgatgat 540

aaaggcgtta ccattccggt tattaccagc atgaacttcg atgaaattaa agcatatatc 600

ggtggtagcg caggcaccga tgtgaccggt ggtatgctgg gtaaagtgct ggaaatgctg 660

gaactgggca aaaccagcag cattaccagc tatatcttca atgccaccgt tgtgggcagc 720

gtgagtagct tcctgaatgg cgaaaatatt ggtaccgcaa ttaaagatag ttaaaagctt 780

<210> 483

<211> 258

<212> PRT

<213> 丁达尔甲烷叶菌（Methanolobus tindarius）

<400> 483

Met Asp Asn Asn Asn Ile Thr Ile Leu Lys Ile Gly Gly Ser Val Ile

1 5 10 15

Thr Asp Lys Ser Ala Asp Asp Gly Thr Ala Arg Leu Ser Glu Ile Glu

20 25 30

Arg Ile Ala Ala Glu Ile Ser Gly Phe Glu Gly Lys Leu Ile Ile Val

35 40 45

His Gly Ala Gly Ser Phe Gly His Pro Gln Val Lys Arg Phe Gly Leu

50 55 60

Thr Gly Lys Phe Asp His Glu Gly Ser Ile Ile Thr His Met Ser Val

65 70 75 80

Arg Lys Leu Asn Thr Met Val Val Glu Thr Leu Asn Ser Ala Gly Ile

85 90 95

Asn Ala Leu Pro Val His Pro Met Ala Cys Ala Ile Ser Ser Asn Ser

100 105 110

Arg Ile Lys Ser Met Phe Arg Glu Gln Ile Glu Glu Met Leu Ala Asn

115 120 125

Gly Phe Val Pro Val Leu His Gly Asp Met Val Met Asp Thr Asp Leu

130 135 140

Gly Thr Ser Val Leu Ser Gly Asp Gln Ile Val Pro Tyr Leu Ala Ile

145 150 155 160

Gln Met Lys Ala Ser Arg Ile Gly Ile Gly Ser Ala Glu Glu Gly Val

165 170 175

Leu Asp Asp Lys Gly Gly Val Ile Pro Leu Ile Asn Asn Glu Asn Phe

180 185 190

Asp Glu Ile Lys Ala Tyr Leu Ser Gly Ser Ala Asn Thr Asp Val Thr

195 200 205

Gly Gly Met Leu Gly Lys Val Leu Glu Leu Leu Glu Leu Ser Glu Gln

210 215 220

Ser Asn Ser Thr Ser Tyr Ile Phe Asn Ala Gly Asn Thr Gly Asn Ile

225 230 235 240

Ser Asp Phe Leu Ser Gly Lys Asn Ile Gly Thr Ala Ile Gly Ala Gly

245 250 255

Thr Ile

<210> 484

<211> 777

<212> DNA

<213> 丁达尔甲烷叶菌（Methanolobus tindarius）

<400> 484

atggataaca ataatattac tatcctgaag ataggcggta gtgtcatcac agataaaagt 60

gctgatgatg gtactgcaag attaagtgaa atagaaagaa tagcagctga gatctcaggt 120

tttgaaggaa aacttatcat tgtacatggt gcaggatcat tcggacatcc gcaggtcaaa 180

cgtttcggac ttaccggtaa atttgaccac gaaggttcca taattacaca catgtcagta 240

aggaaactca acacaatggt tgttgaaacc ttaaactctg caggaattaa cgcattgcca 300

gtacatccta tggcatgtgc aatatcaagc aacagccgca taaagagtat gttccgtgaa 360

caaatagagg aaatgcttgc taatggattt gtacccgttc ttcatggcga catggtaatg 420

gacaccgacc ttgggacttc ggtcctgtcc ggtgatcaga ttgttccgta tcttgcaata 480

cagatgaaag catcaagaat cggaattgga agtgcggaag aaggtgtgct tgatgacaaa 540

ggaggagtaa tacccctaat caacaacgaa aattttgatg aaattaaggc atatctcagt 600

ggttctgcta acaccgatgt taccggcgga atgctgggaa aagtacttga gcttttagaa 660

ctaagtgagc agtcaaacag cacttcttat atatttaatg caggcaatac aggaaacata 720

tcagatttcc tcagtggtaa gaatattggt accgcaatag gagccgggac tatataa 777

<210> 485

<211> 783

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 485

atggataaca acaacatcac cattctgaaa attggcggca gtgttattac cgataaaagc 60

gcagatgatg gtaccgcacg cctgagtgaa attgaacgca ttgcagcaga aattagtggc 120

ttcgaaggta aactgattat tgtgcatggc gcaggcagct tcggccatcc gcaggtgaaa 180

cgcttcggcc tgaccggcaa attcgatcat gaaggtagta ttattaccca catgagcgtt 240

cgtaaactga ataccatggt ggtggaaacc ttaaatagtg caggtattaa tgccctgccg 300

gttcatccga tggcctgtgc aattagtagt aatagtcgta ttaagagcat gttccgcgaa 360

cagattgaag aaatgctggc aaatggcttc gttccggttc tgcatggtga tatggtgatg 420

gataccgatc tgggtaccag cgttctgagt ggtgatcaga ttgtgccgta tctggccatt 480

cagatgaaag caagtcgcat tggcattggt agcgcagaag aaggcgtgct ggatgataaa 540

ggcggcgtga ttccgctgat taataatgaa aacttcgatg aaatcaaggc ctatctgagc 600

ggcagtgcca ataccgatgt taccggtggc atgctgggca aagttctgga actgctggaa 660

ctgagtgaac agagtaatag caccagctat atcttcaatg caggtaatac cggtaatatt 720

agcgacttcc tgagcggtaa aaatattggt accgcaattg gcgccggcac catttaaaag 780

ctt 783

<210> 486

<211> 332

<212> PRT

<213> 拟南芥（Arabidopsis thaliana）

<400> 486

Met Glu Leu Asn Ile Ser Glu Ser Arg Ser Arg Ser Ile Arg Cys Ile

1 5 10 15

Val Lys Leu Gly Gly Ala Ala Ile Thr Cys Lys Asn Glu Leu Glu Lys

20 25 30

Ile His Asp Glu Asn Leu Glu Val Val Ala Cys Gln Leu Arg Gln Ala

35 40 45

Met Leu Glu Gly Ser Ala Pro Ser Lys Val Ile Gly Met Asp Trp Ser

50 55 60

Lys Arg Pro Gly Ser Ser Glu Ile Ser Cys Asp Val Asp Asp Ile Gly

65 70 75 80

Asp Gln Lys Ser Ser Glu Phe Ser Lys Phe Val Val Val His Gly Ala

85 90 95

Gly Ser Phe Gly His Phe Gln Ala Ser Arg Ser Gly Val His Lys Gly

100 105 110

Gly Leu Glu Lys Pro Ile Val Lys Ala Gly Phe Val Ala Thr Arg Ile

115 120 125

Ser Val Thr Asn Leu Asn Leu Glu Ile Val Arg Ala Leu Ala Arg Glu

130 135 140

Gly Ile Pro Thr Ile Gly Met Ser Pro Phe Ser Cys Gly Trp Ser Thr

145 150 155 160

Ser Lys Arg Asp Val Ala Ser Ala Asp Leu Ala Thr Val Ala Lys Thr

165 170 175

Ile Asp Ser Gly Phe Val Pro Val Leu His Gly Asp Ala Val Leu Asp

180 185 190

Asn Ile Leu Gly Cys Thr Ile Leu Ser Gly Asp Val Ile Ile Arg His

195 200 205

Leu Ala Asp His Leu Lys Pro Glu Tyr Val Val Phe Leu Thr Asp Val

210 215 220

Leu Gly Val Tyr Asp Arg Pro Pro Ser Pro Ser Glu Pro Asp Ala Val

225 230 235 240

Leu Leu Lys Glu Ile Ala Val Gly Glu Asp Gly Ser Trp Lys Val Val

245 250 255

Asn Pro Leu Leu Glu His Thr Asp Lys Lys Val Asp Tyr Ser Val Ala

260 265 270

Ala His Asp Thr Thr Gly Gly Met Glu Thr Lys Ile Ser Glu Ala Ala

275 280 285

Met Ile Ala Lys Leu Gly Val Asp Val Tyr Ile Val Lys Ala Ala Thr

290 295 300

Thr His Ser Gln Arg Ala Leu Asn Gly Asp Leu Arg Asp Ser Val Pro

305 310 315 320

Glu Asp Trp Leu Gly Thr Ile Ile Arg Phe Ser Lys

325 330

<210> 487

<211> 2520

<212> DNA

<213> 拟南芥（Arabidopsis thaliana）

<400> 487

aaaaaaagag agaatctttc cggtgaatgg gaaatggcaa gaagaaggat acgagtacga 60

tgaagttgag ttagagcggg agagagagac ataccgttga ccactaaaga cgagagcttt 120

agagagagac gcaacaatgg agctgaatat ttccgagagt cgaagcagat caattcgttg 180

cattgtgaaa cttggtttgt cttttgatcc ctattaaaat acttgctgga tcgattctta 240

gatcgcattt tagttgttct gtcttatggg tttgattctg atttgactat tgaataccga 300

agatgaggaa agactttaaa gatctgtctt ttattcattt cccatcaatt ttacctgtct 360

agactttgta acagcagaat gtctaaatga tttgatagga ggtgcggcaa ttacttgcaa 420

aaacgagctg gagaagattc acgatgaaaa tctggaggtc gtggcgtgtc agttacgtca 480

agctatgttg gagggttcag ctccaagcaa ggttattggc atggattgga gcaagagacc 540

tggaagctct gagatttctt gtgatgtgga tgacataggg gatcaaaagt cttctgagtt 600

tagtaaattt gttgtggttc atggcgctgg ttagttggag attgattctt atctgcttaa 660

atcttataat gaaggatcaa aatacatttt tgatttagct cttacagatc attgacctgc 720

ttgtgttagt tgagctgtta tttagttttt gggtttctta tgtgttgttc tgatttttgt 780

cattaggttc ctttgggcac tttcaggcca gtagatctgg ggttcacaaa ggaggacttg 840

agaaacctat tgtcaaagct ggtttcgttg ctactcgtat atctgtgaga ctgttagcta 900

aatctgatgc tcttacgtaa gatagtcttg agctgttctg atagtctaca acttcttttt 960

gcaggtgaca aatcttaatc ttgaaattgt acgagcacta gcccgaggta tctcttaagc 1020

ttattctctt ttcctactct ggctaagagg aaaagatgaa ttttgaagct aaacattatg 1080

atctcttgca gagggcattc ctacgatagg catgtctcca ttttcatgtg gttggtcaac 1140

ctccaaaaga gatgtaagag ctaactgaac ttcttaacat atttcctgat ctgaagcatg 1200

tgggtttaga tttcaatgag actgcttttt gcattaggtg gcttctgcag atctagcaac 1260

cgtagctaaa accatagact caggatttgt ccctgtaagt tttgatccca ccagtgaaat 1320

taggtagatg tttaccaaag tctcttgact gtaatttgga cagtaatttt tgtcatggcc 1380

aggttctcca tggagatgca gtgctggaca atatactggt aatatgctct ccagagatac 1440

caaatagcta tctagattct tgtccgttta gaatttgaac agttgaaaat cttgtcctga 1500

acagggctgc accatattga gtggtgatgt tatcatccgt catcttgcag atcatttgaa 1560

gccagaatat gttgtctttc tcgtatccta ttcatagtat aaaccggaaa tttaatttgt 1620

gttctctctc cctctttcct atatattctt tgttatctga gtaactcttt acaaagacag 1680

atgtactagg tgtctacgat cgaccacctt caccttcaga gcccgacgct gtgctcttga 1740

aagagatcgg ttagtttcaa actttactgt ttgttttttt tatatctttt ccagacttgg 1800

cctgatacta acagttcatg cagctgttgg agaagatgga agctggaagg ttgtgaatcc 1860

actgttggag cacacagaca agaaaggtaa acgaaagaac caatgttgta aaactatgca 1920

atacaataag tctgagggat ttgttaaaag ttcaaacctc tctgattttt ggaatcaaac 1980

agttgactac tctgttgcgg cgcacgatac aaccggtgga atggaaacga agatatcaga 2040

agctgctatg attgcaaaac ttggagtcga tgtctacatt gtgaaggtag attatagaca 2100

acttttgcct ttaaccaact aaatatctta gataaagatg gagcttttaa ccgccatcat 2160

gctctttttt tcaatctcct caaacaggct gcgacaactc attcacagag agcactaaac 2220

ggtgatttga gagatagtgt tcctgaagat tggcttggta ctatcatcag attctcaaag 2280

tagaataatc tcctgacaaa tacactaatt ccagttcctc aacaaaggaa agcattgacc 2340

ttttcttgct attactgttt taccagactt tgtgcaagga atacaaaatc gtgtaatgtc 2400

aaaaccagtt aaaatgtcga atactatcgc agcctgtgta actctatgtt tccacaagta 2460

ttcaatcaca tatcttacac tgttattgtt aaataaaatg tatatgtcac tcttgaatcg 2520

<210> 488

<211> 1009

<212> DNA

<213> 人工序列

<220>

<223>-密码子优化的序列

<400> 488

atggaactga atatcagcga aagccgtagt cgtagcattc gttgtattgt taaactgggt 60

ggtgcagcaa ttacctgtaa aaatgaactg gaaaaaatcc atgacgaaaa tctggaagtt 120

gttgcatgtc agctgcgcca ggccatgctg gaaggtagcg ccccgagtaa agttattggt 180

atggattgga gtaaacgccc gggcagtagt gaaattagtt gtgatgttga tgatatcggc 240

gatcagaaaa gcagtgaatt ttcaaaattc gtggtggttc atggcgcagg tagctttggc 300

cattttcagg caagtcgtag tggtgttcat aaaggtggcc tggaaaaacc gattgttaaa 360

gccggctttg ttgccacccg cattagcgtt accaatctga atctggaaat tgttcgtgcc 420

ctggcacgtg aaggcattcc gaccattggc atgagcccgt ttagctgtgg ctggagtacc 480

agcaaacgtg atgttgccag cgccgatctg gcaaccgtgg caaaaaccat tgatagtggt 540

tttgtgccgg tgctgcatgg cgatgccgtt ctggataata ttctgggctg taccattctg 600

agcggcgatg ttattattcg tcatctggcc gatcatctga aaccggaata tgttgttttt 660

ctgaccgatg ttctgggtgt ttatgatcgc ccgccgagtc cgagcgaacc ggatgctgtt 720

ctgctgaaag aaattgccgt gggtgaagat ggcagttgga aagttgttaa tccgctgctg 780

gaacataccg ataaaaaagt ggattatagt gtggccgcac atgataccac cggtggtatg 840

gaaaccaaaa ttagtgaagc cgccatgatt gccaaactgg gcgttgatgt gtatattgtt 900

aaagcagcca ccacccatag ccagcgtgca ctgaatggcg atctgcgtga tagtgtgccg 960

gaagattggc tgggtaccat tattcgcttt agcaaatgac tgaaagctt 1009

<210> 489

<400> 489

000

<210> 490

<400> 490

000

<210> 491

<211> 5275

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 491

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atgctgacca ttctgaaact gggtggtagc attctgagtg ataaaaatgt 120

gccgtatagt attaagtggg ataatctgga acgcattgca atggaaatta aaaatgcact 180

ggattattac aagaaccaga ataaagaaat caagctgatt ctggtgcatg gtggtggtgc 240

cttcggccat ccggttgcaa aaaaatatct gaaaattgaa gacggtaaga agatcttcat 300

taatatggaa aagggcttct gggaaattca gcgtgccatg cgtcgcttca ataatattat 360

tattgacacc ctgcaaagct atgatattcc ggccgtgagt attcagccga gtagcttcgt 420

ggtgttcggc gataaactga tcttcgatac cagtgccatt aaagaaatgc tgaaacgtaa 480

tctggtgccg gtgattcatg gcgatattgt gattgatgat aaaaatggtt accgtattat 540

cagtggtgat gatattgttc cgtatctggc caatgaactg aaagccgatc tgattctgta 600

tgcaaccgat gttgatggcg tgctgattga taataaaccg attaaacgca ttgacaaaaa 660

caatatctat aagatcctga actacctgag tggtagcaat agtattgatg tgaccggtgg 720

tatgaaatat aaaattgata tgatccgcaa gaacaagtgt cgcggcttcg tgttcaatgg 780

caataaagca aataatatct acaaggccct gctgggcgaa gttgaaggca ccgaaattga 840

cttcagtgaa tgagcggccg cataatgctt aagtcgaaca gaaagtaatc gtattgtaca 900

cggccgcata atcgaaatta atacgactca ctatagggga attgtgagcg gataacaatt 960

ccccatctta gtatattagt taagtataag aaggagatat acatatgagc aaagttatca 1020

ccgatgtgtt ctataccgcc ttcaaaaccg ccctgccgct gaccagtagt ccgctggttc 1080

agtgtattac caatgaaatt accgttgaaa gcatggccaa tgccctgctg tatattgatg 1140

ccaaaccggt tatggcagat gatcagcgcg agttcccgga gttcttcgcc cagagcgatg 1200

cactgctgct gaatctgggc catattagtg aagtgcgcca gcagaatctg ctggcagcag 1260

gtaaattcgc ccaggcaacc aatcagccga ccgtgattga tctggtgggt gttagtgcaa 1320

cccagctgcg ttatgatctg ggccatcagc tgctggcaaa tcatccgaat gtggtgaaag 1380

gtaatattag tgaaatgcgc cgcttcgccg atctgaaaag taccggtcgc ggtgtggatg 1440

gtagccagct ggatcagagt gcaaccgcac tgggcgaact ggccgccagc ctgcaacagc 1500

tgacccaggc attcccgacc accaccttcc tggcaaccgg taaaattgat ctggttgtga 1560

gcgcaaaagg cacctggtat ctgaaaaatg gtgttccgca gctggatcgc ttcaccggca 1620

ccggtgatat tgtgggtgcc ctgattgccg cactgctggg taccggcctg gataatgatg 1680

cagccgttgt ggtggcagtg agttacttca attgctgtgg tgaagttgca gccgcacaga 1740

atcgcaccgg cggtctggca gccttccgcg aaggtaccct gaatcagctg agtctgctgg 1800

cagccaccgc cgattggctg caaatggtta aaggtgaagc actgtgactc gagtctggta 1860

aagaaaccgc tgctgcgaaa tttgaacgcc agcacatgga ctcgtctact agcgcagctt 1920

aattaaccta ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta 1980

aacgggtctt gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac acggtcacac 2040

tgcttccggt agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac 2100

cctgccctga accgacgacc gggtcatcgt ggccggatct tgcggcccct cggcttgaac 2160

gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg tagtggacaa 2220

attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttcttgtcca agataagcct 2280

gtctagcttc aagtatgacg ggctgatact gggccggcag gcgctccatt gcccagtcgg 2340

cagcgacatc cttcggcgcg attttgccgg ttactgcgct gtaccaaatg cgggacaacg 2400

taagcactac atttcgctca tcgccagccc agtcgggcgg cgagttccat agcgttaagg 2460

tttcatttag cgcctcaaat agatcctgtt caggaaccgg atcaaagagt tcctccgccg 2520

ctggacctac caaggcaacg ctatgttctc ttgcttttgt cagcaagata gccagatcaa 2580

tgtcgatcgt ggctggctcg aagatacctg caagaatgtc attgcgctgc cattctccaa 2640

attgcagttc gcgcttagct ggataacgcc acggaatgat gtcgtcgtgc acaacaatgg 2700

tgacttctac agcgcggaga atctcgctct ctccagggga agccgaagtt tccaaaaggt 2760

cgttgatcaa agctcgccgc gttgtttcat caagccttac ggtcaccgta accagcaaat 2820

caatatcact gtgtggcttc aggccgccat ccactgcgga gccgtacaaa tgtacggcca 2880

gcaacgtcgg ttcgagatgg cgctcgatga cgccaactac ctctgatagt tgagtcgata 2940

cttcggcgat caccgcttcc ctcatactct tcctttttca atattattga agcatttatc 3000

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 3060

ctagctcact cggtcgctac gctccgggcg tgagactgcg gcgggcgctg cggacacata 3120

caaagttacc cacagattcc gtggataagc aggggactaa catgtgaggc aaaacagcag 3180

ggccgcgccg gtggcgtttt tccataggct ccgccctcct gccagagttc acataaacag 3240

acgcttttcc ggtgcatctg tgggagccgt gaggctcaac catgaatctg acagtacggg 3300

cgaaacccga caggacttaa agatccccac cgtttccggc gggtcgctcc ctcttgcgct 3360

ctcctgttcc gaccctgccg tttaccggat acctgttccg cctttctccc ttacgggaag 3420

tgtggcgctt tctcatagct cacacactgg tatctcggct cggtgtaggt cgttcgctcc 3480

aagctgggct gtaagcaaga actccccgtt cagcccgact gctgcgcctt atccggtaac 3540

tgttcacttg agtccaaccc ggaaaagcac ggtaaaacgc cactggcagc agccattggt 3600

aactgggagt tcgcagagga tttgtttagc taaacacgcg gttgctcttg aagtgtgcgc 3660

caaagtccgg ctacactgga aggacagatt tggttgctgt gctctgcgaa agccagttac 3720

cacggttaag cagttcccca actgacttaa ccttcgatca aaccacctcc ccaggtggtt 3780

ttttcgttta cagggcaaaa gattacgcgc agaaaaaaag gatctcaaga agatcctttg 3840

atcttttcta ctgaaccgct ctagatttca gtgcaattta tctcttcaaa tgtagcacct 3900

gaagtcagcc ccatacgata taagttgtaa ttctcatgtt agtcatgccc cgcgcccacc 3960

ggaaggagct gactgggttg aaggctctca agggcatcgg tcgagatccc ggtgcctaat 4020

gagtgagcta acttacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 4080

tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 4140

ggcgccaggg tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc 4200

gcctggccct gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa 4260

tcctgtttga tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat 4320

cccactaccg agatgtccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg 4380

cccagcgcca tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc 4440

atttgcatgg tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc 4500

ggctgaattt gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag 4560

acagaactta atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc 4620

tccacgccca gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg 4680

tcagagacat caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca 4740

tcctggtcat ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg 4800

tgcaccgccg ctttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg 4860

gcacccagtt gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg 4920

gccagactgg aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc 4980

acgcggttgg gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc 5040

gcagaaacgt ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca 5100

tactctgcga catcgtataa cgttactggt ttcacattca ccaccctgaa ttgactctct 5160

tccgggcgct atcatgccat accgcgaaag gttttgcgcc attcgatggt gtccgggatc 5220

tcgacgctct cccttatgcg actcctgcat taggaaatta atacgactca ctata 5275

Claims

1.一种分离的激酶1，其能够在包含水、激酶1和isoprenol和/或prenol的水性介质中催化从isoprenol和/或prenol至异戊烯磷酸和/或二甲基烯丙基磷酸或其盐的反应，其中在温育后，至少10％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

2.权利要求1的分离的激酶1，其中在温育后，至少20％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

3.权利要求1或2的分离的激酶1，其包含选自以下的序列：

4.一种分离的激酶1，其包含选自以下的序列：

5.一种生产异戊烯磷酸和/或二甲基烯丙基磷酸或其盐的方法，包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1和prenol和/或isoprenol，

ii.温育水性介质，和

其中一种或多种激酶1能够催化在包含水、激酶1和prenol和/或isoprenol的水性介质中从prenol和/或isoprenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应，其中在温育后，至少10％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或磷酸二甲烯丙酯或其盐。

6.权利要求5的方法，其中在温育后，至少20％的isoprenol和/或prenol转化为异戊烯磷酸或其盐和/或二甲基烯丙基磷酸或其盐。

7.权利要求5或6的方法，其中激酶1包含选自以下的序列：

8.一种生产异戊烯磷酸和/或二甲基烯丙基磷酸或其盐的方法，包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1和isoprenol和/或prenol，

ii.温育水性介质，和

其中一种或多种激酶1包含选自以下的序列：

9.一种包含激酶1的重组构建体，其中激酶1包含编码选自以下的氨基酸分子的序列：

10.权利要求9的重组构建体，其中激酶1功能性地连接异源启动子。

11.一种重组载体，其包含权利要求9或10的重组构建体。

12.一种重组微生物，其包含权利要求9或10的重组构建体或权利要求11的重组载体。

13.权利要求12所述的重组微生物，其中微生物是玫瑰红红球菌(Rhodococcusrhodochrous)、气球菌属(Aerococcus sp.)、曲霉属(Aspergillus sp.)、短小芽孢杆菌(Bacillus pumilus)、枯草芽孢杆菌(Bacillus subtilis)、多形拟杆菌(Bacteroidesthetaiotaomicron)、Clostridium algidicarnis、高效棒状杆菌(Corynebacteriumefficiens)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、大肠杆菌(Escherichiacoli)、沃氏产卤菌(Haloferax volcanii)、干酪乳杆菌(Lactobacillus casei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、热自养甲烷热杆菌(Methanothermobacterthermautotrophicus)、嗜热毁丝霉(Myceliophthora thermophila)、巴斯德毕赤酵母(Pichia pastoris)、产黄假单胞菌(Pseudomonas synxantha)、固氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵形假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、嗜酸假单胞菌(Pseudomonas acidovolans)、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonas testosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、筑波拟酵母(Pseudozyma tsukubaensis)、真养罗氏菌(Ralstonia eutropha)、浑球红细菌(Rhodobacter sphaeroides)、浑浊红球菌(Rhodococcus opacus)、酿酒酵母(Saccharomyces cerevisiae)、鲍氏志贺氏菌(Shigella boydii)、草木樨中华根瘤菌(Sinorhizobium meliloti)、抗生链霉菌(Streptomyces antibioticus)、阿维链霉菌(Streptomyces avermitilis)、可可链霉菌(Streptomyces cacaoi)、天蓝色链霉菌(Streptomyces coelicolor)、黄链霉菌(Streptomyces flavelus)、浅灰链霉菌(Streptomyces griseolus)、淡紫灰链霉菌(Streptomyces lavendulae)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、绿色产色链霉菌(Streptomyces viridochromogenes)、嗜酸热原体(Thermoplasma acidophilum)、需钠弧菌(Vibrio natrigens)或解脂耶氏酵母(Yarrowia lipolytica)。

14.一种包含水、激酶1、异戊烯磷酸和/或二甲基烯丙基磷酸的组合物，其中激酶1包含选自以下的序列：

15.一种生产异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法，包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1、一种或多种激酶2和prenol和/或isoprenol，

ii.温育水性介质，和

其中一种或多种激酶2能够催化在包含水、激酶2和异戊烯磷酸和/或二甲基烯丙基磷酸的水性介质中从异戊烯磷酸和/或二甲基烯丙基磷酸到异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的反应，其中在温育后至少10％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

16.权利要求15的方法，其中在温育后，至少20％的isoprenol和/或prenol转化为异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

17.权利要求15或16的方法，其中激酶1包含选自以下的序列：

18.权利要求17的方法，其中激酶2包含选自以下的序列：

19.一种用于生产异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法，包括以下步骤：

i.提供水性介质，其包含水、一种或多种激酶1、一种或多种激酶2和isoprenol和/或prenol，

ii.温育水性介质，和

iii.任选从反应混合物中分离异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐，其中所述一种或多种激酶1选自

20.权利要求19的方法，其中激酶2包含选自以下的序列：

21.一种重组构建体，其包含激酶1和激酶2，其中激酶1包含编码选自以下的氨基酸分子的序列：

其中如b.、c.、d.和e中限定的氨基酸分子催化水性介质中从isoprenol和/或prenol到异戊烯磷酸和/或二甲基烯丙基磷酸的反应，并且其中激酶2包含编码选自以下的氨基酸分子的序列：

22.权利要求21的重组构建体，其中激酶1和所述激酶2各自功能性地连接异源启动子。

23.一种重组载体，其包含权利要求21或22的重组构建体。

24.一种重组微生物，其包含权利要求21或22的重组构建体或权利要求23的重组载体。

25.权利要求24的重组微生物，其中微生物是玫瑰红红球菌(Rhodococcusrhodochrous)、气球菌属(Aerococcus sp.)、曲霉属(Aspergillus sp.)、短小芽孢杆菌(Bacillus pumilus)、枯草芽孢杆菌(Bacillus subtilis)、多形拟杆菌(Bacteroidesthetaiotaomicron)、Clostridium algidicarnis、高效棒状杆菌(Corynebacteriumefficiens)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、大肠杆菌(Escherichiacoli)、沃氏产卤菌(Haloferax volcanii)、干酪乳杆菌(Lactobacillus casei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、热自养甲烷热杆菌(Methanothermobacterthermautotrophicus)、嗜热毁丝霉(Myceliophthora thermophila)、巴斯德毕赤酵母(Pichia pastoris)、产黄假单胞菌(Pseudomonas synxantha)、固氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonas jluorescens)、卵形假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonas stutzeri)、嗜酸假单胞菌(Pseudomonas acidovolans)、霉味假单胞菌(Pseudomonas mucidolens)、睾丸酮假单胞菌(Pseudomonas testosteroni)、铜绿假单胞菌(Pseudomonas aeruginosa)、筑波拟酵母(Pseudozyma tsukubaensis)、真养罗氏菌(Ralstonia eutropha)、浑球红细菌(Rhodobacter sphaeroides)、浑浊红球菌(Rhodococcus opacus)、酿酒酵母(Saccharomyces cerevisiae)、鲍氏志贺氏菌(Shigella boydii)、草木樨中华根瘤菌(Sinorhizobium meliloti)、抗生链霉菌(Streptomyces antibioticus)、阿维链霉菌(Streptomyces avermitilis)、可可链霉菌(Streptomyces cacaoi)、天蓝色链霉菌(Streptomyces coelicolor)、黄链霉菌(Streptomyces flavelus)、浅灰链霉菌(Streptomyces griseolus)、淡紫灰链霉菌(Streptomyces lavendulae)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、绿色产色链霉菌(Streptomyces viridochromogenes)、嗜酸热原体(Thermoplasma acidophilum)、需钠弧菌(Vibrio natrigens)或解脂耶氏酵母(Yarrowia lipolytica)。

26.一种组合物，其包含水、一种或多种激酶1、一种或多种激酶2、isoprenol和/或prenol，其中激酶1选自以下：

27.权利要求26的组合物，其中激酶2选自以下：

28.一种重组微生物，其包含引入的、增加的或增强的一种或多种激酶1、一种或多种激酶2和任选地一种或多种能够产生一种或多种类异戊二烯的途径的活性和/或表达，

其中一种或多种激酶1能够催化从prenol和/或isoprenol至异戊烯磷酸和/或二甲基烯丙基磷酸的反应，并且

其中一种或多种激酶2能够催化从异戊烯磷酸和/或二甲基烯丙基磷酸至异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的反应，和

其中激酶1包含选自以下的序列：

e.由与在严格条件下互补于SEQ ID NO:44、45、47、48、50、51、53、54、124、127、136、139、145、151、154、325、358、379、394、125、128、137、140、146、152、155、326、353、359、377、380、392或395的至少250个碱基的片段杂交的核酸分子编码的氨基酸分子，或其功能性片段，并且

29.权利要求28的组合物，其中激酶2包含选自以下的序列：

j.由与在严格条件下互补于SEQ ID NO:77、78、86、87、89、90、104、105、139、172、175、178、181、184、190、193、196、199、202、205、208、211、217、220、223、226、229、232、235、238、241、247、250、253、256、259、262、271、274、280、283、289、430、448、484、140、173、176、179、182、185、191、194、197、200、203、206、209、212、218、221、224、227、230、233、236、239、242、248、251、254、257、260、263、272、275、281、284、290、428、431、437、449或485的至少250个碱基的片段杂交的核酸分子编码的氨基酸分子，或其功能性片段，并且

30.一种发酵生产一种或多种类异戊二烯或其盐或异戊烯焦磷酸和/或二甲基烯丙基焦磷酸或其盐的方法，包括以下步骤：

i.提供权利要求28或29的重组微生物，

31.一种组合物，其包含一种或多种根据权利要求28或29的重组微生物。

32.权利要求31的组合物，其进一步包含prenol和/或isoprenol、介质和碳源。

33.一种生产权利要求28或29的重组微生物的方法，包括以下步骤：

34.权利要求28或29的微生物或权利要求33的方法，其中微生物选自玫瑰红红球菌(Rhodococcus rhodochrous)、气球菌属(Aerococcus sp.)、曲霉属(Aspergillus sp.)、短小芽孢杆菌(Bacillus pumilus)、枯草芽孢杆菌(Bacillus subtilis)、多形拟杆菌(Bacteroides thetaiotaomicron)、Clostridium algidicarnis、高效棒状杆菌(Corynebacterium efficiens)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、大肠杆菌(Escherichia coli)、沃氏产卤菌(Haloferax volcanii)、干酪乳杆菌(Lactobacilluscasei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、热自养甲烷热杆菌(Methanothermobacter thermautotrophicus)、嗜热毁丝霉(Myceliophthorathermophila)、巴斯德毕赤酵母(Pichia pastoris)、产黄假单胞菌(Pseudomonassynxantha)、固氮假单胞菌(Pseudomonas azotoformans)、荧光假单胞菌(Pseudomonasjluorescens)、卵形假单胞菌(Pseudomonas ovalis)、施氏假单胞菌(Pseudomonasstutzeri)、嗜酸假单胞菌(Pseudomonas acidovolans)、霉味假单胞菌(Pseudomonasmucidolens)、睾丸酮假单胞菌(Pseudomonas testosteroni)、铜绿假单胞菌(Pseudomonasaeruginosa)、筑波拟酵母(Pseudozyma tsukubaensis)、真养罗氏菌(Ralstoniaeutropha)、浑球红细菌(Rhodobacter sphaeroides)、浑浊红球菌(Rhodococcus opacus)、酿酒酵母(Saccharomyces cerevisiae)、鲍氏志贺氏菌(Shigella boydii)、草木樨中华根瘤菌(Sinorhizobium meliloti)、抗生链霉菌(Streptomyces antibioticus)、阿维链霉菌(Streptomyces avermitilis)、可可链霉菌(Streptomyces cacaoi)、天蓝色链霉菌(Streptomyces coelicolor)、黄链霉菌(Streptomyces flavelus)、浅灰链霉菌(Streptomyces griseolus)、淡紫灰链霉菌(Streptomyces lavendulae)、浅青紫链霉菌(Streptomyces lividans)、橄榄色链霉菌(Streptomyces olivaceus)、田无链霉菌(Streptomyces tanashiensis)、弗吉尼亚链霉菌(Streptomyces virginiae)、绿色产色链霉菌(Streptomyces viridochromogenes)、嗜酸热原体(Thermoplasma acidophilum)、需钠弧菌(Vibrio natrigens)或解脂耶氏酵母(Yarrowia lipolytica)。

35.一种重组表达构建体，其包含

其中至少一个功能性地连接激酶1或激酶2的启动子与激酶1或激酶2是异源的，其中激酶1包含编码选自以下的氨基酸分子的序列：

36.权利要求35的重组表达构建体，其中激酶2包含选自以下的序列：

37.一种重组载体，其包含权利要求35或36的重组表达构建体。

38.一种重组微生物，其包含权利要求35或36的重组表达构建体或权利要求37的重组载体。

39.一种培养权利要求28、29或38的重组微生物或使其生长的方法，包括用一种或多种所述重组微生物接种介质，并在包含prenol和/或isoprenol的介质中培养所述重组微生物或使其生长。

40.根据权利要求28、29或38的重组微生物或根据权利要求31或32的组合物用于将prenol和/或isoprenol全细胞生物转化为一种或多种类异戊二烯或其盐或异戊烯焦磷酸或其盐和/或二甲基烯丙基焦磷酸或其盐的用途。

41.一种将prenol和/或isoprenol全细胞生物转化为一种或多种类异戊二烯或其盐或异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的方法，包括以下步骤：

I)在包含isoprenol和/或prenol、适于生长所述重组微生物的介质和碳源的发酵罐中生长根据权利要求28、29或38的重组微生物，和

II)从I)中获得的发酵液中收集一种或多种类异戊二烯或其盐或其异戊烯焦磷酸和/或二甲基烯丙基焦磷酸。

42.一种将prenol和/或isoprenol全细胞生物转化为一种或多种类异戊二烯或其盐或异戊烯焦磷酸和/或二甲基烯丙基焦磷酸的方法，包括以下步骤：

i)使根据权利要求28、29或38的重组微生物在发酵罐中生长，所述发酵罐包含适于所述重组微生物生长的介质和碳源，和

ii)从发酵罐中收集重组微生物，和

iii)通过补充isoprenol/prenol在水性介质中进行全细胞生物转化，和

iv)从iii)中获得的水性介质收集一种或多种类异戊二烯或其盐或IPP和/或DMAPP。